/
Author: Пизо Ш. Заманский М.
Tags: алгебра анализ математика математический анализ естественные науки
Year: 1971
Text
Ш. ПИЗО, М. ЗАМАНСКИИ
КУРС МАТЕМАТИКИ
АЛГЕБРА И АНАЛИЗ
Перевод с французского
Е. И. СТЕЧКИНОй
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1971
Кг
517.2
П 32
УДК 512.8+517
COLLECTION UNIVERSITAIRE DE MATHEMATIQUES
CHARLES PISOT
PROFESSEUR
A LA FACULTE
DES SCIENCES
DE PARIS
MARC ZAMANSKY
DOYEN
DE LA FACULTE
DES SCIENCES
DE PARIS
MATHEMATIQUES
GENERALES
ALGEBRE — ANALYSE
Nouveau tirage
Dunod Paris 1966
ДЛ Пизо, М. 3анапский
КУРС МАТЕМАТИКИ
Алгебра и анализ
Мм 1971 г. 656 стр. с илл.
Редакторы В. В. Арестов и Я. Е. Морозова
Корректоры О. А. Сигал, А Л. И патова
Техн. редактор И. Ш. Аксельроб
Сдано в набор 3/Ш 1971 г. Подписано к печати 8/IX 1971 г. Бумага бОХЭО1/!*
Физ. печ. л. 41. Условн. печ. л. 41. Уч.-изд. л.-41,07. Тираж 48500 экз. Цена книги 1 р. 65 к.
Заказ № 1010.
Издательство «Наука»
Главная редакция физико-математической литературы
Москва, В-71, Ленинский проспект, 15.
Ордена Трудового Красного Знамени Ленинградская типография № 2 имени Ebj
Соколовой Главполиграфпрома Комитета по печати при Совете Министров СССР»
Измайловский проспект, 29*
Евгении
2-2-3
15-71
ОГЛАВЛЕНИЕ
Предисловие 9
Советы читателям И
КНИГА I. ОБЩИЕ ПОНЯТИЯ 15
Глава I. Множества 15
I. Логика и логические символы 15
II. Операции над множествами 17
Глава II. Функции, отображения. ,..♦..♦ 21
§ 1. Функции (21). § 2. Взаимно однозначные отображения;
мощность (24). § 3. Перестановки конечного множества (25). § 4. Сложная
функция (27).
Глава III. Бинарные отношения 27
I. Отношение порядка . 28
II. Отношение эквивалентности 29
III. Законы композиции 31
§ 1. Определения (31). § 2. Изоморфизм (34).
КНИГА II. АЛГЕБРА 35
Глава I. Натуральные числа 35
§ 1. Определения (35). § 2. Операции (36). § 3. Счетные
множества (37). § 4. Последовательности (38).
Глава II. Расширение понятия целого числа: относительные числа;
рациональные числа 39
I. Симметризация-закона композиции 39
II. Целые относительные числа -42
III. Рациональные числа 45
§ 1. Определения, операции (45). § 2. Отношение порядка (47).
§ 3. Абсолютное значение (48).
Глава III. Законы композиции . 49
I. Внутренние законы 49
§ 1. Группы (49). § 2. Кольца (50). § 3. Тела (51).
II. Внешние законы 53
§ 1. Векторное пространство (53). § 2. Норма в векторном
пространстве (54).
Ш. Примеры 55
§ 1. Функции (55). § 2. Последовательности (58).
1*
4
ОГЛАВЛЕНИЕ
Глава IV. Многочлены 60
I. Векторное пространство — кольцо мнсгочлсчпв 61
§ 1. Векторное пространство многочленов (61). § 2. Кольцо
многочленов (63).
II. Деление по убывающим степеням 64
§ 1. Результат деления (64). § 2. Наибольший общий делитель двух
многочленов (66).
III. Деление по возрастающим степеням 71
IV. Дифференцирование многочленов, формула Тейлора 74
§ 1. Дифференцирование (74). § 2. Формула Тейлэра (75). § 3.
Формула бинома и биномиальные коэффициенты (77).
V. Нули многочленов 79
VI. Многочлены от нескольких переменных 82
Глава V. Комплексные числа 84
I. Алгебраическое расширение 84
II. Комплексные числа 86
§ 1. Определения, операции (86). § 2. Нули многочленов из С [х] (93).
Глава VI. Рациональные дроби 98
Глава VII. Векторные пространства 104
I. Определения и основные свойства 105
§ 1. Определения (105). § 2. Примеры векторных пространств (103).
II. Линейная независимость, базисы 108
§ 1. Определения (108). § 2. Изоморфизм между /г-мерныи
пространством и Кп (ПО). § 3. Базисы (111). § 4. Факторпространство (113).
III. Линейные отображения 115
§ 1. Определения (115). § 2. Взаимно однозначные отображения,
ядро (116). § 3. Ранг линейного отображения (117). § 4. Композиция
отображений (118).
IV. Линейные формы, сопряженное пространство 119
§ 1. Определения (119). § 2. Ранг линейного отображения (120).
V. Билинейные и полилинейные формы 121
§ 1. Билинейные формы (121). §2. Свойства билинейных форм (123).
§ 3. Полилинейные формы (124).
VI. Линейные уравнения 125
§ 1. Общая теория (125). § 2. Однородные уравнения (126). § 3. Метод
последовательных исключений (127).
VII. Аффинные пространства, выпуклые множества 129
§ 1. Линейное аффинное многообразие, аффинные
преобразования (129). § 2. Барицентр (133). § 3. Выпуклые множества (135).
Глава VIII. Матрицы 137
I. Общие свойства 137
II. Алгебраические операции над матрицами 140
§ 1. Векторное пространство матриц (140). § 2. Произведение двух
матриц (141).
III. Квадратные матрицы 143
§ 1. Определения (143). § 2. Обратимые матрицы (144). § 3.
Преобразованная матрица (146). § 4. Транспонированная матрица (147).
§ 5. Комплексно сопряженная матрица (148).
Глава IX. Определители 149
I. Объем параллелотопов в Rn 149
§ 1. Параллелотопы (149).
II. Определители • • • *56
ОГЛАВЛЕНИЕ 5
§ 1. Определение (156). § 2. Свойства определителей (160). § 3.
Применение определителей для нахождения ранга системы векторов (165).
III. Определители и линейные уравнения 167
§ 1. Система Крамера (167). § 2. Общий случай (170).
Глава X. Евклидово пространство 172
I. Внутреннее произведение 172
II. Конечномерные евклидовы пространства 177
§ 1. Ортонормированный базис (177). § 2. Изометрия с
пространством Rn (179). § 3. Билинейные формы (180). § 4. Квадратичные
формы (182). § 5. Ортогональные преобразования (183).
Глава XI. Приведение матриц 186
I. Приведение произвольной матрицы 186
§1. Собственные значения, собственные весторы (186). § 2.
Случай, когда »все собственные значения различны (183). § 3. Общий
случай (190).
II. Приведение симметрической действительной матрицы при помощи
ортогональной матрицы. Приведение квадратичной формы .... 192
КНИГА III. АНАЛИЗ 201
Глава I. Действительные числа 201
I. Топологическое исследование множества Q 202
§ 1. Последовательности рациональных чисел, сходящиеся к
рациональному числу (202). § 2. Интервалы в Q (206). § 3. Сходящаяся
двойная последовательность рациональных чисел (207). § 4.
Последовательность Коши (208). § 5. Операции с последовательностяхми Коши
и свойства последовательностей Коши (210).
II. Построение поля R действительных чисел. Топология в # .... 213
§ 1. Отношение эквивалентности во множестве последовательностей
Коши рациональных чисел (213). § 2. Поле R (214). § 3. Интервалы
действительных чисел; сходящиеся последовательности,
последовательности Коши (218). § 4. Два основных свойства множества R (222).
Глава II. Числовая прямая 224
§ 1. Определения, относящиеся к точечным множествам: мажоранты,
миноранты, точка прикосновения, точка накопления (224). § 2.
Основные теоремы (229). § 3. Верхние и нижние грани (232). § 4. Теоремы
о пределах (234).
Глава III. Отображение R в R; действительные функции одного
действительного переменного 237
I. Общие сведения о числовых функциях 237
§ 1. Определения (237). § 2. Верхний и нижний пределы
последовательности (240). § 3. Пределы в точке (243).
II. Непрерывные действительные функции одного действительного
переменного 247
§ {.Определение непрерывности. Первые свойства непрерывных
функций (247). § 2. Две основные теоремы о непрерывных функциях на
интервале (251). § 3. Равномерная непрерывность (253).
III. Монотонные функции 254
§ 1. Монотонные функции (254). § 2. Непрерывные монотонные
функции. Расширенная прямая (258).
IV. Ступенчатые функции 265
§ 1. Определение й свойства ступенчатой функции на интервале
[а, Ь] (266). § 2. Операции со ступенчатыми функциями (268).
6 ОГЛАВЛЕНИЕ
V. Равномерная сходимость 269
§ 1. Определение равномерной сходимости последовательности
числовых функций (269). § 2. Равномерная сходимость последовательности
ступенчатых функций. Ярусные функции (271). § 3. Примеры
ярусных функций: непрерывные функции, монотонные функции (280).
VI. Дифференцируемые функции 282
§ 1. Определения (282). § 2. Общие свойства (285). § 3. Теорема
Ролля и ее приложения (289) § 4. Выпуклые функции (294). § 5.
Периодические функции (297). § 6. Формула Тейлора (300).
VII. Показательная функция 303
§ 1. Постановка вопроса (304). § 2. Изучение функции х->хп при
натуральном п (305). § 3. Определение и свойства выражения
ar(re=Q) (306). § 4. Функции х -> ах (312). § 5. Функции loga*
и ха (315). § 6. Дифференцирование показательной функции. Число в (317).
Глава IV. Интегрирование действительных функций одного
действительного переменного 321
I. Интегралы от ступенчатых функций на интервале [а, Ь] 323
§ 1. Определение интеграла (323). § 2. Свойства интеграла от
ступенчатых функций (325). § 3. Свойства, относящиеся к интервалу
интегрирования (330).
II. Интегралы от ярусных функций на интервале [а, Ь] 331
§ 1. Определение (331). § 2. Свойства интеграла от ярусных
функций (333). § 3. Свойство, относящееся к интервалу
интегрирования (335). § 4. Интегрирование последовательности ярусных
функций (336). § 5. Интеграл Римана (337).
III. Интегралы и примитивные непрерывных функций 339
§ I. Первая формула о среднем значении (339). § 2. Примитивные
и интегралы непрерывных функций (340). § 3. Интеграл от сложных
функций (замена переменного) (342). § 4. Интегрирование по
частям (344). § 5. Интегрирование и дифференцирование
последовательности действительных функций (347).
IV. Функции, определяемые посредством интегралов 349
§ 1. Определение (349). § 2. Непрерывность (351). § 3.
Дифференцирование (353). § 4. Интегрирование (354).
Глава V. Метрическое пространство Rn 356
§ 1. Общее понятие расстояния (357). § 2. Понятие нормы в
векторном пространстве над R (359). § 3. Нормы в Rn (361). § 4. Понятие
предела в Rn (365). § 5. Шары и брусы в Rn (367). § 6.
Топологические свойства пространства Rn (369).
Глава VI. Вектор-функции одного действительного переменного;
отображения R в Rp . 373
I. Вектор-функции 373
§ 1. Определения и общие замечания (373). § 2. Непрерывные
вектор-функции (375). § 3. Дифференцируемые вектор-функции (378).
§ 4. Формула Тейлора (381). § 5. Интегрирование
вектор-функций (381). § 6. Примитивные непрерывных вектор-функций (382).
II. Непрерывные дуги, спрямляемые дуги 38$
§ 1. Ломаные линии в Rp (384). § 2. Спрямляемые жордановы
дуги (388). § 3. Аналитические условия спрямляемости дуги (391).
§ 4. Замена параметра (396). § 5. Топология на спрямляемой жорда-
новой дуге (400).
ОГЛАВЛЕНИЕ
7
Глава VII. Действительные функции многих действительных
переменных: отображения Rp в R и понятия об отображениях Rp в Rq 401
I. Непрерывность, частные производные отображения Rp в R . . . . 401
§ 1. Точечные множества в R2 (401). § 2. Непрерывные
отображения пространства Rp в R (404). § 3. Равномерная сходимость.
Ступенчатые функции (406). § 4. Частные производные (408).
II. Дифференцируемые отображения пространства Rp в R.
Дифференциалы . . . • .' 411
§ 1. Определение дифференцируемых функций (411). § 2. Операции
над дифференцируемыми функциями (414). § 3. Дифференциалы (418).
§ 4. Формула Тейлора (423).
III. Отображения пространства Rp в Rq. Понятие о комплексных
функциях одного комплексного переменного. Определение
функции ег 425
§ 1. Отображения Rp в Rq (425). § 2. Поле С комплексных чисел
и пространство R2 (426). § 3. Комплексные функции одного
действительного переменного (429). § 4. Комплексные функции одного
комплексного переменного (431). § 5. Показательная функция z->ez (436).
§ 6. Теорема Даламбера (445).
Глава VIII. Криволинейные интегралы 448
§ 1. Криволинейный интеграл (448). § 2. Интегрирование
дифференциалов (453).
Глава IX. Двойные интегралы в . 457
I. Определение, свойства, вычисление двойных интегралов 457
§ 1. Мера (457). § 2. Двойной интеграл от ступенчатой функции (459).
§ 3. Двойной интеграл от непрерывной функции (461). § 4.
Расширение меры (463). § 5. Вычисление двойного интеграла (464).
§ 6. Примеры (468).
II. Двойные и криволинейные интегралы 469
§ 1. Формула Римана (469). § 2. Вычисление площадей (472). § 3.
Замена переменных в двойном интеграле (473). § 4. Инвариантность
меры относительно движения (480). § 5. Применение к вычислению
объемов (481).
III. Тройные интегралы 483
КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ 487
Глава I. Локальное исследование числовых функций 487
§ I. Сравнение функций. Символы Ландау (489). § 2. Сравнение
последовательностей (494). § 3. Эталоны сравнения (495). § 4.
Асимптотические разложения (496). § 5. Основные разложения.
Свойства (497). § 6. Обобщения. Различные замечания (501).
Глава II. Интегрирование на некомпактном интервале 505
§ 1. Определения, сходимость, абсолютная сходимость (505). § 2.
Алгебраические свойства (511). § 3. Замена переменного (512). § 4.
Интегрирование по частям (514). § 5. Признаки сходимости (515).
Глава III. Ряды 520
I. Числовые ряды 520
§ 1. Определения и общие свойства (520). § 2. Ряды с
действительными неотрицательными членами (525). § 3. Абсолютно
сходящиеся ряды (533). § 4. Условно сходящиеся ряды с действительными
членами (536). § 5. Бесконечные произведения (540). § 6.
Представление действительных чисел в системе счисления с основанием а (541).
8
ОГЛАВЛЕНИЕ
II. Ряды функций 547
§ 1. Общие рассмотрения (547). § 2. Степенные ряды (550). § 3.
Тригонометрические ряды (554).
III. Представление функций рядами 556
§ 1. Ряды Тейлора (556). § 2. Ряды Фурье (560).
Глава IV. Основные элементарные функции 565
I. Действительные функции действительного переменного 565
§ 1. Перечень результатов (565). § 2. Перечень свойств функций ах,
logax, xa (566). § 3. Действительные гиперболические функции (568).
§ 4. Действительные тригонометрические функции (573). § 5. График
действительной функции действительного переменного (578).
II. Комплексные функции одного комплексного переменного .... 581
III. Вектор-функции: отображения R в R2 585
Глава V. Вычисление интегралов 587
I. Приближенное вычисление интегралов 588
II. Вычисление интегралов при помощи примитивных 593
Глава VI. Дифференциальные уравнения 606
I. Дифференциальные уравнения первого порядка 607
§ 1. Уравнения с разделяющимися переменными (607). § 2. Линейные
уравнения (614). § 3. Общие рассмотрения (621).
II. Уравнения второго порядка 629
§ 1. Специальные типы (629). § 2. Линейные уравнения без правой
части с постоянными коэффициентами (635). § 3. Линейное
уравнение с правой частью (638). § 4. Линейные уравнения с правой
частью с постоянными коэффициентами (641).
III. Системы дифференциальных уравнении 645
§ 1. Общие рассмотрения (645). § 2. Линейные системы с
постоянными коэффициентами (646).
Предметный указатель 654
ПРЕДИСЛОВИЕ
Курс общей математики не может быть трудом
оригинальным. В нем читатель найдет много страниц, уже отлично
разработанных. Причина этого, несомненно, кроется в природе
подобного курса, ибо он предназначается молодым людям,
завершившим свое школьное образование и приступающим к
серьезному изучению наук; он осуществляет первый контакт с этими
новыми знаниями, которые позволят за несколько лет усвоить
новые теоретические понятия и методы, владение которыми
ведет к научному творчеству. Стало быть, он должен быть связан
с математической программой средней школы, нести в себе
новые научные сведения, а также служить для подготовки к
дальнейшему обучению.
Настоящий курс общей математики содержит изложение
двух фундаментальных дисциплин — алгебры и анализа, со
следующим распределением материала.
Курс разделен на четыре книги.
Книга I, весьма краткая, содержит несколько логических
концепций, элементарных понятий, относящихся к множествам
(объединение, пересечение, произведение), а также основные
математические понятия, вытекающие естественным образом из
общих понятий и из логических концепций, а именно: понятие
функции, или отображения, понятие бинарного отношения,
эквивалентности, порядка, понятие закона композиции. Простые
примеры предназначены к тому, чтобы показать читателю, до
какой степени близки ему столь абстрактные на первый взгляд
понятия.
Книга II отводится для алгебры. Наиболее важная ее часть,
вокруг которой построена эта книга, посвящена линейной
алгебре, играющей важную роль в преподавании математики.
Поэтому мы на протяжении всего курса пользуемся любым
случаем, чтобы подчеркнуть наличие векторного пространства,
линейного отображения, линейной или билинейной формы. Из
фундаментальных понятий векторного пространства и
линейного отображения одного векторного пространства в другое
проистекают понятия линейного уравнения, матриц, определителей,
10
ПРЕДИСЛОВИЕ
полилинейных форм. Отдельно рассматриваются квадратичные
формы и их применение к матрицам. В двух последующих
Книгах читателю постоянно будут встречаться примеры,
иллюстрирующие материал Книги II. Ее содержание сводится, тем
самым, к небольшому кругу понятий аналитической геометрии,,
требуемых программой, а именно эти геометрические понятия
выступают как непосредственное приложение Книги ГЦили как
перенесение результатов этой самой Книги на язык геометрии*
считающийся почему-то более понятным, чем тот, которым мы
пользуемся.
Книга III посвящена анализу. Она фактически построена
вокруг двух понятий — .понятия последовательности Коши и
понятия равномерной сходимости. Эти два понятия позволяют,,
в частности, излагать теорию интегрирования для ступенчатых
функций и их равномерных пределов — ярусных функций.
В Книге IV мы собрали главы, относящиеся к понятиям,
которые мы считаем либо техническими (методы интегрирования^
асимптотические разложения), либо носящими технический
характер на уровне курса общей математики (ряды,
дифференциальные уравнения).
СОВЕТЫ ЧИТАТЕЛЯМ
Для изучения математики необходимо понимать, что
составляет предмет этой науки и какова ее цель. Хотя принятое нами
разделение и несколько искусственно, тем не менее
соответствует реальному положению вещей.
Читателям известно, что математика дает нам тот
инструмент, без которого не обходится в работе ни один активно
работающий интеллигентный человек. Студенты в большинстве
своем пополнят ряды не творцов математики, но тех, кто ее
применяет. Однако очевидно, что любой инструмент
используется с тем большей выгодой и точностью, чем лучше известна
его природа, т. е. пределы его применимости, совокупность
объектов или фактов, к которым он может быть применен, и, если
возможно, способ его построения. Но, кроме того, требуемое
при изучении математики умственное напряжение включает в
себя логическую формацию, которую труднее усмотреть в
других видах деятельности, и эта логическая формация имеет своим
следствием научную честность, а значит, и честность вообще.
Сформулированные здесь два аспекта необходимы при любом
научном творчестве, более того, в любой научной работе, не
исключая и работ прикладного характера. Эти краткие общие
соображения служат основой тех советов, которые следуют ниже.
Необходимо длительное индивидуальное размышление, и тем
более длительное, чем более общие концепции или более
мощные методы рассматриваются. Так, изучение таблицы
умножения не требует особого обдумывания и принадлежит к
начальным сведениям. Далее, для понимания того, что сложение и
умножение чисел не представляют в действительности
математически никакой разницы, необходимо размышление. И уже
длительное размышление требуется для того, чтобы стало
близким понятие тела. Точно так же понятие предела числовой
последовательности кажется интуитивно достаточно ясным. Более
же точное его знание и различные его формулировки
нуждаются уже в индивидуальном обдумывании. Но еще больше
его требуется для того, чтобы постичь важность понятия
последовательности Коши. Это индивидуальное размышление,
12 СОВЕТЫ ЧИТАТЕЛЯМ
которое может устным или письменным курсом только
стимулироваться, не более, является необходимым фактором
продвижения в процессе изучения. Преподаватель в этой области
почти безоружен, ибо как бы он ни был изобретателен в
формулировании своих мыслей, он никогда не будет уверен, что эти
формулировки вызывают в умах слушателей или читателей те
же самые концепции, из которых он исходил.
Итак, важно, чтобы студенты знали, что прежде всего им
необходимо думать. Размышление должно охватывать понятия,
которые им будут встречаться, логическую структуру
рассуждения, суть формулировки, распространение области
выполнимости теоремы или формулы. В этом мыслительном усилии,
а значит, и в понимании студенту помогут беседы, построение
примеров, а также контрпримеров (которые составляют важный
элемент обучения), попытка найти истоки новых понятий среди
тех знаний, которые накоплены с детства.
Но одного умственного усилия в математике недостаточно,
ибо математический факт предназначен к тому, чтобы
порождать новые факты или служить орудием точности для другой
отрасли науки. Значит, нельзя пренебрегать этой технической
стороной знания и математической подготовки, тем, что
составляет навык в решении задач.
Математические задачи образуют в совокупности
непрерывную цепь вопросов и ответов, от простого правила до задач
с элементами творчества. Например, из области правил укажем
элементарный счет, устный счет, правила перемножения матриц,
решение линейных уравнений, тригонометрические формулы,
простейшие формулы дифференцирования, таблицу примитивных
для функций, называемых элементарными. Знание этих правил
необходимо при всяком общении с математикой. Другие знания
и правила имеют более тонкую природу и почти всегда
требуют, чтобы учитывались условия, при которых они были
получены. Примером тому в анализе служат теорема Ролля,
формула Тейлора, формула о среднем, признаки сходимости рядов
и т. д. Они используются часто, но условия применимости
достаточно строги; неосмотрительное применение формулы о
среднем может привести к абсурду, а признаки сходимости, рядов
чаще всего бывают условиями достаточными, но не
необходимыми. Наконец, весьма общие теоремы, касающиеся основ,
требуют очень разборчивого обращения.
В области чисто практических правил студент должен
проделать упражнения, которые, если они многочисленны, позволят
ему довольно скоро перейти к более теоретическим задачам,
где его работа будет уже носить характер оригинальный. Он
должен уметь почти механически перемножать матрицы,
решать линейные уравнения, не путаться в формулах дифферен-
СОВЕТЫ ЧИТАТЕЛЯМ
13
цирования, иметь очень хорошую практику элементарного
алгебраического счета. Далее, он должен добиться того, чтобы
без затруднений написать формулу Тейлора для предложенной
ему функции, выраженной посредством элементарных, и уметь
быстро сориентироваться в том, какой метод надлежит
применить для вычисления интеграла, для исследования сходимости
ряда. Наконец, он должен помнить, что теоретические
упражнения (такие, как упражнения на пределы функций, на
интегрирование на некомпактном интервале) могут потребовать много
времени и серьезного размышления.
Как решать упражнения? •
Если они даны с решениями, то сначала надо думать над
задачей, не заглядывая в решение. Затем, после достаточно
длительной задержки с ответом на вопросы задачи, надо
обратиться к решению, по прочтении которого следует попытаться
самому восстановить доказательство, из которого
непосредственно получается решение. Если же задачи даются без
решений, то, по крайней мере в упражнениях достаточно
технического характера, надо стараться применять два способа
доказательства или вычисления, с тем, чтобы получить двумя
различными путями один и тот же результат. В упражнениях совсем
технических необходимо всякое вычисление повторять. И во
всех случаях под рукой должен находиться курс, к которому
следует обращаться тем чаще, чем более новым является
вопрос.
Как изучать курс математики?
Практика упражнений при методах, которые мы только что
рекомендовали, постепенно приводит к знанию ходовых формул
и правил, затем к оценке этих правил, немного позже к
пониманию определений, соглашений или теорем, мотивирующих
происхождение этих правил и формул. В математике мало что
заучивается наизусть; все, что познается таким способом, в
действительности является следствием длительной практики. Что
же касается основных понятий и теорем, то знание их по
отдельности не может быть обособлено. Так, нужно, чтобы
понятие векторного пространства формировалось постепенно в умах
студентов из знакомства с многочисленными векторными
пространствами, как то: R может рассматриваться как векторное
пространство над R, множество непрерывных функций на
интервале есть векторное пространство при условии точных
соглашений, значение интеграла есть значение линейной формы
и т. д. Понятие непрерывности будет постепенно приводить
к накоплению новых понятий и теорем и будет почти
автоматически вызывать в уме различные виды непрерывных
функций, затем общее понятие, и, наконец, исходное понятие
предела. Такой путь приводит студента к самостоятельному
14 СОВЕТЫ ЧИТАТЕЛЯМ
воспроизведению логической цепи курса, как бы создавая
впечатление творческого процесса.
Чтение книги по математике не обязательно должно
производиться по порядку расположения материала; можно начать
с изучения анализа, обращаясь по мере надобности к
алгебраическим разделам. Некоторые понятия могут быть усвоены лишь
после неоднократного прочтения и многих часов обдумывания.
Но это естественное явление и никоим образом не должно
никого обескураживать. Постоянное же умственное усилие при
решении задач и теоретическом размышлении медленно, но с
постепенным нарастанием ведет на путь синтетический, который и
является целью всякого формирования интеллекта.
Звездочки, помещенные перед главой, разделом, параграфом
или пунктом параграфа, указывают, что фигурирующие здесь
понятия и результаты должны быть известны, но не
обязательно с доказательствами.
Алфавитный указатель в конце содержит специальные
термины и номер страницы (или номера страниц), где этот термин
определяется.
КНИГА I
ОБЩИЕ ПОНЯТИЯ
ГЛАВА I
МНОЖЕСТВА
I. ЛОГИКА И ЛОГИЧЕСКИЕ СИМВОЛЫ
Математическое понятие множества элементов принимается
в качестве интуитивного.
Элемент множества. Множество состоит из элементов; будем
говорить, что элемент а принадлежит множеству Е, и
записывать а&Е.
Подмножество, или часть. Множество F, все элементы
которого принадлежат некоторому множеству Е, называется
подмножеством, или частью множества Е; будем записывать F czEf
говоря, что F содержится в Е.
Используется также обозначение Ezd F, которое читается
так: Е содержит F. Часть какого-либо множества определяется,
вообще говоря, как множество элементов из Е,
характеризующееся некоторым свойством. Однако может оказаться, что ни
один элемент множества не обладает указанным свойством, и
тогда, чтобы можно было и в этом случае считать, что свойство
определяет некое подмножество в Е, условились называть
такую особенность пустым подмножеством, или, упрощенно,
пустым множеством; оно будет обозначаться символом 0. По
определению, 0с£ для любого множества Е.
Каково бы ни было множество Е, всегда Е с Е.
Если F czE и G a F, то G аЕ; это свойство выражает тот
факт, что отношение включения транзитивно.1 i
Импликация. Будем говорить, что предложение Р
имплицирует, или влечет, а также имеет следствием предложение Q,
если Q справедливо всякий раз, как справедливо Р, и будем
записывать Р ^Q. Если, в свою очередь, 0 влечет Р, то
предложения Р и Q называются эквивалентными; это записывается
P€$Q- Тогда в любом рассуждении одно из этих двух
предложений можно заменять другим. Если Р4Ф 0, то будем говорить,
что Q есть необходимое и достаточное условие для того, чтобы
имело место Р. Иногда также символ =ф вместо влечет читается
как такой, что.
16
КНИГА I. ОБЩИЕ ПОНЯТИЯ
Равенство. Равенство изображается символом = и имеет в
математике многообразный смысл.
1° Равенство выражает тождество] х = у означает, что х и у
не различаются. Так, пишут 1 = 1.
2° Равенство может быть лишь условным; такой смысл
имеет равенство между двумя частями уравнения.. Если
записано ах = 6, то это равенство имеет место только тогда, когда х
принимает конкретное значение.
3° Знак = может служить для определения нового символа.
В выражении «положим y = f(x)» знак = определяет новый
символ у по определенным ранее символам х и /. Можно
заметить, что обозначения 1° и 2° представляют собой частный
случай обозначения 3°. Так, тождество х = у является также
определением у, если известно х, а равенство ах = b определяет
элементы ху для которых равенство справедливо.
4° Часто знак = используют для того, чтобы выразить
изоморфизм между двумя множествами. Так, будем записывать
п/1 = /г, поскольку между множеством Z целых п и множеством
дробей вида п/1 существует изоморфизм относительно операции
умножения.
5° Наконец, иногда символ = используется как символ
эквивалентности (гл. III, разд. II) вместо символа ~. Так, вместо
более корректной записи 4/6 ~ 6/9 употребляется запись
4/6 = 6/9. Это применение символа = тесно связано с 4°.
Кванторы. Иногда бывает удобно представить некоторые
словесные выражения посредством символа; так, принято
обозначать через V выражение: каково бы ни было, а через Э
выражение: существует. Эти символы называются кванторами и
присуши только математике, но не формальной логике.
Отрицание. Когда какое-то свойство не выполняется, будем
говорить, что имеет место отрицание этого свойства, и
представлять этот факт символом данного свойства, пересеченным
чертой. Так, утверждение, что элемент Ь не принадлежит
множеству £, записывается: b фЕ. Если G есть множество, которое
содержит элементы, не принадлежащие £, то G не является
частью множества Е, что записывается G фЕ, или еще, Е не
содержит G, что записывается Еф G. Если какое-то
предложение не влечет некоторое другое, то будем писать 9~>- Если же
два предложения не эквивалентны, то будем писать #|ф.
Отрицание равенства при любом его толковании обозначается Ф и
читается «отлично от».
Конъюнкция, дизъюнкция. Конъюнкция и, обозначаемая
символом &, используется в своем обычном смысле: а и Ь,
означающем а и b одновременно. Напротив, выражение «а или Ь»
может иметь в нашем случае двоякое значение; оно может
означать: или а, или 6, когда одно из событий исключает другое;
I
/
ГЛ. I. МНОЖЕСТВА 17
оно может также означать: или а, или й, или и то и другое. Мы
будем брать всюду то из двух значений слова «или», которое
дает отрицание для и, т. е. второе из указанных выше
употребляющихся значений.
Высказывание может быть записано при помощи
логических символов. Так. высказывание «утверждение, что
множество F есть часть множества £, означает, что все элементы из F
являются элементами из Е» записывается посредством
логических символов:
Часто, чтобы установить отрицание некоторого предложения,
бывает удобнее пользоваться символической формой, чем
языковой. Знаки с, е, =, и, (не следующие непосредственно за
квантором) заменяются соответственно на gt, ф, ф9или; V
заменяется на 3 без изменения символа, к которому применяется
квантор; заключение заменяется его отрицанием. Так,
отрицание высказывания, составляющего содержание предыдущего
примера, записывается:
Fc£E&{3a<=F^a&E)\
словесно же оно гласит: «утверждение, что множество F не есть
часть множества Е, равносильно следующему: существует
такой элемент а из /*, что а не принадлежит Е».
II. ОПЕРАЦИИ НАД МНОЖЕСТВАМИ
Пересечение. Пусть имеются два множества Е и F.
Множество всех элементов, принадлежащих одновременно Е и F,
составляет новое множество, которое записывается Е Л F и
называется пересечением Е и F (рис. 1).
Очевидно, Е Л Е = Е; вообще, если Н а £, то Н [) Е = Н.
Может оказаться, что Е и F не имеют ни одного общего
элемента; тогда будем говорить, что Е и F не пересекаются, или
что их пересечение пусто, и записывать Е Л F = 0.
Из определения вытекает: Е Л F = F Г) £, т. е. операция Г)
коммутативна.
Рассмотрим три множества £, F, G. Пересечение Е Л F есть
множество общих элементов множеств Е и F, и значит, (Е Л F) Л G
есть множество общих элементов множеств Е и F,
принадлежащих также G, т. е. множество элементов, принадлежащих
одновременно трем множествам £, F и С; поэтому (Е Г) F) Л G =
= £ П (Z7 Л G); это свойство называется ассоциативностью.
Вообще, пусть имеется совокупность множеств Е\.
Пересечение всех Ef будет обозначаться f\Et\ это множество всех
18 КНИГА I. ОБЩИЕ ПОНЯТИЯ
элементов, принадлежащих сразу всем множествам Е{
совокупности. Множества Е{ можно переставлять или же заменять
несколько множеств их пересечением и притом даже тогда, когда
*> б)
Рис. 1.
совокупность содержит бесконечное число множеств. (В
дальнейшем мы придадим более точный смысл обозначению Е с
индексом и)
Объединение. Пусть имеются два множества Е и F.
Множество элементов, принадлежащих Е или F, т. е. принадлежащих
или £, или F, или Е и F одновременно, называется
объединением Е и F и обозначается Е [) F. Очевидно, Е U Е = Е, и
вообще, если Н czE, то H\J Е = Е (рис. 2).
о) б)
Рис. 2.
Имеем Е U F = F U Е, т. е. операция коммутативна.
Пусть G— третье множество; (Е \j F) \J G есть множество
элементов, принадлежащих Е, или F, или G, причем слово
или означает, что элемент может принадлежать одновременно и
двум, и трем множествам. Следовательно, ассоциативность тоже
имеет место: (Е U F) U G = Е U (F U G).
В общем случае объединение совокупности множеств Ei
будет обозначаться (J Е{\ оно представляет собой множество эле-
ГЛ. I. МНОЖЕСТВА
19
-ментов, принадлежащих хотя бы одному из множеств Eit Это
множество не зависит от порядка множеств Е{, и несколько
множеств Ег могут заменяться их объединением.
Дополнение. Пусть имеется множество Е, и пусть F есть
часть множества Е (т. е. F czE). Множество элементов из Е,
не принадлежащих F, составляет новое множество,
называемое дополнением множества F относительно Е и обозначаемое
CF (рис. 3). Стало быть, имеем
Е
a<==CF&as=E и a&F.
Е
Пример. Дополнением множества четных чисел
относительно множества Z целых чисел является множество нечетных
чисел.
Имеем F\)(CF\ = E и Ff[
'(?')■
0.
Когда ясно, относительно какого множества Е берется до-
лолнение, его значок опускают и пишут С/\
Рис. 3.
Разбиение множества. Мы только что разбивали множество
'Е на две непересекающиеся части F и OF, объединение
которых составляет Е. Вообще, предположим, что Е разбито на
конечное или бесконечное число попарно не пересекающихся
частей Е{, объединение которых составляет Е; тогда будем
говорить, что множества Е\ образуют разбиение множества Е.
Следовательно, E = \jEi и Eif)Ej=*0, если i Ф\ш Таким образом,
i
F и CF образуют разбиение множества Е.
Е
Пример. Пусть N есть множество натуральных чисел,
a Ni — множество натуральных чисел, разложение которых на
простые множители содержит i простых чисел, не обязательно
отличных друг от друга (так, М3 = 2-2-2, 2-2-3, 2-3-3,
2-3-5, ,,.); тогда получаем N = \jNt и N{ f] Nj = 0, если
20
КНИГА I. ОБЩИЕ ПОНЯТИЯ
/=£/. Следовательно, (бесконечное) множество таких Л^
составляет разбиение множества N.
Различные операции над множествами могут
комбинироваться друг с другом, и таким способом могут быть получены
новые предложения. Например (Е Г) F) U G = (Е U G) П (F U G).
Рассмотренные вопросы и свойства относятся к так
называемой алгебре множеств, которая имеет многочисленные
приложения (и даже в области экспериментальных наук), но здесь мы
не будем ее развивать.
Произведение множеств. Пусть имеются два множества А и
В, и пусть а <= A, b ^ В. Рассмотрим упорядоченную пару (a, b)t
причем пары (а, Ь) и (Ь, а) считаются различными, даже если
А = В, Совокупность всевозможных упорядоченных пар (а; Ь)
составляет новое множество, называемое произведением А на В
и обозначаемое А X В (рис. 4). Элементы а и Ь называются
компонентами, или координатами пары (а. Ь).
ГЛ. II. ФУНКЦИИ, ОТОБРАЖЕНИЯ
21
Когда множество В тождественно множеству А, то А X А
представляет собой множество упорядоченных пар (а, а'), где
G6/4 иа'еА Так, если N есть множество натуральных чисел,
N X Л/ есть множество пар натуральных чисел, например
множество дробей plq\ различие между числителем и знаменателем
иллюстрирует смысл выражения «упорядоченная пара».
Если В ф А, то А X В Ф В X А\ говорят, что это
произведение не коммутативно.
Вообще, пусть имеется совокупность множеств Ап, не
обязательно различных; будем называть произведением и обозначать
через Ц Ап множество упорядоченных систем (аи ..., ап, ...) >.
п
где n-й элемент ап принадлежит множеству Ап. Позже мы
увидим, что числовая последовательность есть элемент
произведения бесконечного числа множеств, равных множеству
действительных чисел.
ГЛАВА II
ФУНКЦИИ, ОТОБРАЖЕНИЯ
§ 1. Функции
Пусть имеется множество Е, называемое областью
определения. И пусть имеется множество F, называемое областью
значений.
Соответствие, которое каждому элементу х^Е относит
некоторый элемент у eF, называется отображением Е в F.
Элемент хе£ называется переменным, или аргументом-,
элемент у е F называется значением, или образом.
Отображение называют также функцией, обозначают обычно
буквой / и записывают y = f(x). Употребляется также запись
x-+f(x), которая читается: элементу х соответствует f(x). Еще
говорят, что f есть функция переменного х со значениями в F,
или что у есть образ элемента х при отображении f (или
посредством f).
Иногда пишут x-*fx, и тогда переменное называется
индексом. Это обозначение будет часто использоваться в том
случае, когда область определения Е является множеством N
натуральных чисел.
Необходимо четко различать переменное х, которое является
элементом множества Е, значение f(x) функции, которое
является элементом множества F, и операцию /, которая
«22 КНИГА I. ОБЩИЕ ПОНЯТИЯ
f(X)
представляет собой категорию, отличную от двух предыдущих*
Так, пусть// = хъ\ можно задать переменному х значение 2;тогда
соответствующее значение у будет равно 8; функция же / есть
операция «возведения в куб».
Образ подмножества. Пусть Gcz E есть часть множества Е\
множество элементов из F, являющихся образами по крайней
мере одного элемента из G при отображении /, обозначается
/(G); это множество есть часть множества F.
Пример. Если / есть отображение множества R
действительных чисел в /?, определяемое как х—>х2, и если G есть
множество тех х, которые удовлетворяют условию —1 < х < 2, то
/(G) есть множество тех
у, которые
удовлетворяют условию 0 ^ у < 4
(рис. 5, а).
В частности, если в
качестве подмножества G
множества Е взять все
множество, то /(£) будет
множеством элементов из
F, являющихся образами
по крайней мере одного
элемента из Е. Получим
снова f(E)czF. В случае,
когда /(£) = F, т.е.
когда всякий элемент из F
служит образом хотя бы
одного элемента из Е, будем говорить, что отображение /
множества Е во множество F есть отображение Е на F (рис. 5, б).
Пример. Если £, равно как и F, есть множество R
действительных чисел, то отображение х—»x3 есть отображение R
на R, поскольку любое действительное число является кубом
некоторого действительного числа. Напротив, если Е = F = Z,
где Z— множество целых чисел, то отображение x-*xz
множества Z в Z уже не будет отображением Z на Z, так как целое
число может и не быть кубом целого числа.
Сужение отображения. Пусть имеется отображение. /
множества Е во множество F, и пусть G cz E есть подмножество из Е.
Тогда отображение / всякому элементу из G ставит в
соответствие некоторый элемент из F; стало быть, оно определяет
отображение G в F, которое называют сужением / на G; когда это
не вызывает путаницы, его снова обозначают символом /.
Пример. Отображение х —»#3, определенное для х е Z,
есть сужение на Z отображения х—>х3 множества R на /?.
Тождественное отображение. Если £' = £, то / определяет
•отображение Е в (или на) себя.
Отображение
а)
в...
Рис.
5.
Отображение на.
б)
ГЛ. II. ФУНКЦИИ. ОТОБРАЖЕНИЯ
2$
E*F
Е х
ч-/ Грасрин функции f
Рис. 6.
В частности, отображение, которое всякому элементу х^Е
ставит в соответствие тот же самый элемент х, есть
отображение Е на £, называемое тождественным отображением.
График отображения. Пусть f есть отображение множества Е
во множество F. Множество пар (х, /(#))> где х е £, есть
подмножество произведения Е X F и
называется графиком функции f
(рис. 6).
Пример. Множество пар (х, xz)
произведения R2 = R X R
составляет график функции «возведения в
куб». Он изображается
геометрически точками «кривой» у = хг.
Последовательность. Возьмем в
качестве Е множество N
натуральных чисел, а в качестве F —
произвольное множество; отображение f
множества N во множество F
называется последовательностью
элементов из F. Таким образом,
последовательность / связывает каждое натуральное число п с
некоторым элементом из F, который обычно обозначают /п, а не
f(n). Последовательность/ будет часто обозначаться f = (fuh, •.»
..., /п, ...), или
сокращенно / = (fn). Здесь символы
fn являются элементами из
F (образами чисел из N при
отображении /).
Прообраз. Пусть / есть-
отображение пространства
Е в пространство F\
элементу х е Е при отображении
~j f соответствует
единственный элемент у е F, в то
время как элемент у из F
может быть образом
нескольких элементов из Е
(рис. 7).
Примеры.. Значение —6 служит для функции х3 — 7х
образом значений —3, 1 и 2. Рассмотрим еще функцию — целую
часть от #, т. е. ближайшее целое число, не превосходящее xi
тогда целое п будет образом бесконечного множества
значений х, 2l именно п^.х < п[+ 1.
Множество элементов х е £, имеющих в качестве образа-
при отображении f один и тот же элемент у е F, называется
прообразом элемента у и обозначается f~l(y)- Заметим, что if
Г'(у)
Прообраз
Рис. 7.
^24 КНИГА I. ОБЩИЕ ПОНЯТИЯ
есть элемент из F (а не из Е); при этом если множество f~l(y)
содержит более одного элемента, то f~l не является
отображением в определенном выше смысле.
В общем случае, если Н есть часть множества F, через f""1 (Я)
будет обозначаться множество элементов из Е, образ которых
при отображении f принадлежит подмножеству Н,
§ 2. Взаимно однозначные отображения; мощность
Особенно важен частный случай, когда элемент из F имеет
единственный прообраз в Е. Здесь операция f_1 является
отображением F в Е; ее называют обратной функцией, или обратным
отображением к f.
Пример. Функция у -> ]Л/ служит обратным
отображением для х —► х3; она тоже отображает множество R
действительных чисел на себя.
Если отображение f есть отображение Е на F и если обрат-
ное отображение /~1 существует, то оно является отображением
F на Е, Действительно, всякий элемент #<=£ имеет образом
некоторый элемент y = f(x) ef, а всякий элемент y^F имеет
образом некоторый элемент x = f-](y). В этом случае говорят,
что f есть взаимно однозначное отображение Е на F.
Мощность. Если для множеств Е и F существует хотя бы
одно взаимно однозначное отображение Е на F, то говорят, что
Е и F имеют одинаковую мощность.
Пример. Пусть Е — множество действительных чисел х,
0<sCjc < 1, и пусть F — множество Е X Е, т. е. множество пар
(у, z), где у и z — действительные числа, 0^*/<1, О-^z < 1.
(Геометрически Е изображается как отрезок, a F — как
квадрат.) Пусть, далее, х есть произвольный элемент из Е\
запишем его десятичное разложение: х = 0, а\а2 ... ап ..., где ап —
целое число, 0 ^Сап^,9, и условимся, что если х есть конечная
десятичная дробь, то все ап, начиная с некоторого номера, равны
нулю. Элементу х ставим в соответствие числа у и z с
десятичным разложением у = 0, a\aza$ ... и z = 0, а2а^а6 ... Функция /,
которая путем этой операции элементу х ставит в соответствие
лару (у> z),имеет обратную функцию, и значит, Е и Е' X Е имеют
«одинаковую мощность.
Понятие мощности служит обобщением обычного понятия
счета. Действительно, счет состоит в установлении взаимно
однозначного соответствия между множеством объектов и некоторым
конечным множеством последовательных целых чисел, начиная
с единицы.
Бесконечное множество. Понятие мощности позволяет
придать точный смысл понятию множества, имеющего бесконечное
число элементов. Такое множество будет определено при по-
ГЛ. II. ФУНКЦИИ, ОТОБРАЖЕНИЯ 25
мощи следующего свойства: существует хотя бы одно
подмножество, отличное от всего множества и имеющее с ним
одинаковую мощность. Так, пусть N есть множество натуральных чисел;
множество четных чисел составляет часть множества /V,
отличную от N. Но соответствие м->2п взаимно однозначно; стало
быть, эти два множества имеют одинаковую мощность, и
значит, N бесконечно. Точно так же множество пар (*/, z), где у
и z — действительные числа, 0^#<1, 0-<z<l, имеет, как
мы видели, ту же мощность, что и множество действительных я,
О^х < 1; но последнее есть множество пар (я, 0), которое
является частью первого множества Е и отлично от него.
Следовательно, множество Е бесконечно. При таком определении
бесконечного множества конечное множество не бесконечно, ибо не.
содержит никакой части, отличной от целого множества и
имеющей с ним одинаковую мощность. Мы не будем здесь развивать,
следствий понятия мощности; они будут изучаться в
дальнейших курсах. Однако в главе, посвященной натуральным числам
(Книга II, гл. I), будет дано очень важное понятие счетного
множества, т. е. множества, имеющего мощность множества N
натуральных чисел.
§ 3. Перестановки конечного множества
Перестановка. Всякое взаимно однозначное отображение
множества Е на себя называется перестановкой множества £..
Так, отображение г —*2г, которое каждому рациональному г
ставит в соответствие 2г, есть перестановка множества Q
рациональных чисел. Тождественное отображение всегда есть
перестановка.
Перестановки конечного множества. Пусть Е — конечное
множество из п элементов. Обозначим через Рп число его
перестановок. Р\ = 1, ибо если Е состоит из единственного элемента,
то единственным взаимно однозначным отображением Е на Е:
является тождественное отображение. ,
Допустим теперь, что Е содержит п элементов аи а2, ..., ап..
Обозначим через f перестановку множества £, при которой
а\e f (at)> * = *»• • • > п- Возьмем индекс fe, для которого f(an) = afe,.
и рассмотрим такое отображение g, что g(ai) = a/ii если I < ky
и g(^/) = ^/+i> если &<^/-<п—1. Это отображение будет
перестановкой множества Ef из п— 1 элементов аь ..., an_i.
Обратно, пусть h есть перестановка множества Е\ при
которой h(a^ = a" для i = 1, ..., п—1; отсюда получим
перестановку / множества £, если выберем произвольно индекс /?,.
1 ^ k ^ п, и положим f{ai) = a'[ для i<k, f(ak)=any
f (aj) = a/—i Для l>k- Ясно, что перестановка g множества Е\
26
КНИГА I. ОБЩИЕ ПОНЯТИЯ
полученная предыдущим способом из f, совпадает с h. Но
существует п различных возможностей для выбора k, и значит,
всякой перестановке множества Е' соответствует п различных
перестановок множества Е\ если же две перестановки h\ и h2
множества Е' отличны друг от друга, то каждая перестановка f\
множества £, соответствующая hu отлична от каждой
перестановки f2 множества Е, соответствующей h2j ибо в противном
случае, исключив ап, мы получили бы одну и ту же перестановку
множества Е'. Следовательно, Рп = пРп-Х. Точно так же имеем
Рп-Х = (п— \)Рп-2, стало быть, Рп = п(п— 1)Рп-2, и так
последовательно получаем формулу
Рп = п(п— 1) ...2-Рх = Ь2- ....п.
Произведение п последовательных натуральных чисел, начиная
с единицы, обозначается л! = 1 • 2 • ...•пи читается как «п
факториал». Условились считать 0! = 1. Таким образом, Рп = п\
Четность перестановки. Перестановка / множества Е из п
элементов аи .,., ап определяется посредством отображения
а\ = f (ai)> * в *» " "» п» но а* есть один из элементов аь ..., ап,
и значит, а\ = ат , где mb т2, ..., тп — значения некоторой
перестановки множества 1, 2, ..., п первых п натуральных чисел.
Если в перестановке ти т2, ..., тп найдется такая пара
(ти trij), что / > f, a т$ < mh то будем говорить, что эта пара
образует инверсию. Пусть / есть общее число инверсий
перестановки. Если / четно, то будем называть перестановку четной;
■если же / нечетно, то перестановка называется нечетной. Под
четностью перестановки / множества Е понимается четность
перестановки ти т2, ..., тп.
J Теорема. Если переменить местами два элемента
перестановки, то ее четность изменится.
Сначала предположим, что меняются местами два соседних
элемента. Итак, пусть / есть перестановка множества аи ..., аП9
определенная посредством отображения а\ =f(^), и пусть g
^сть перестановка, определенная посредством отображения
g(a^ = a'v если i<k или i>k+l, g(ak) = a'k+l, g(ak+l)=*a'k.
Пусть теперь а\ = ат; / соответствует перестановка
(ти ..., mft_b ^a, mh+u rnk+2j ..., тп), a g— перестановка
(ти ..., mh-u mk+u mh, mk+2, ..., mn).
Пара (nii, Щ) в обоих случаях одинаково образует или не
образует инверсию, если i < k, a / > i произвольно и если
j > k + 1, a i < / произвольно. Единственная пара, природа
которой меняется, есть (mky mk+\)y которая переходит в (m^+i, mk),
и следовательно, общее число инверсий изменяется на единицу,
^ значит, меняется и четность.
ГЛ. III. БИНАРНЫЕ ОТНОШЕНИЯ
2Г
Одна замена элементов а{ и а$ в перестановке может быть
сведена к 2\i — /| — 1 заменам соседних элементов, и стало
быть, поскольку это число нечетно, четность перестановки
меняется. Так как перестановка (аи ..., ап) является четной, то
четность перестановки (а[, ..., а'п) будет та же, что и четность
числа замен, которые необходимо осуществить, лтобы свести,
вторую перестановку к первой.
§ 4. Сложная функция
Операции над функциями. Пусть / есть отображение множе*
ства Е на множество F, a g — отображение множества F во
множество G. И пусть х е Е\ тогда у = f(x) e F, и можно
рассматривать элемент z = g(y), который принадлежит G. Таким
образом, каждому х^Е соответствует z = g[f(x)] из G, и тем
самым определено отображение множества £ в (?, называемое
сложной функцией, или композицией отображения f на g и
обозначаемое gof (внимание: здесь читается справа налево, а не
слева направо, ибо g.of есть g\f{x)]).
Ясно, что gof, вообще говоря, отличается от f~ogy причем
последний символ может не иметь смысла, поскольку f есть
отображение Е на F, a g — отображение F в G. Следовательно^
операция о в общем случае не коммутативна.
Напротив, она ассоциативна: если h есть отображение G в Нг
то Л о (g of) = (hog) of. Действительно, пусть f (x) = у, g(y) == г>
h(z)=w; тогда (gof) (x) = g(y) = z и [h о (g of)](x) = h(z) = w\
точно так же [(h og) of](x) = (hog) (y) = h(z) = w.
Если / есть взаимно однозначное отображение Е на F, то /-1
есть отображение F на £, a/""1 of есть тождественное
отображение множества £. Точно так же f°f~l есть тождественное
отображение множества F. Пусть снова / есть взаимно
однозначное отображение Е на F, a g — взаимно однозначное
отображение F на G; тогда gof есть взаимно однозначное
отображение Е на G, и (g° f)""1 — f*"1 о g~\
ГЛАВА III
БИНАРНЫЕ ОТНОШЕНИЯ
Мы интуитивно понимаем, что действительные числа могут
быть расположены в порядке возрастания их величины, т. е.
если заданы два действительных числа, то можно сказать,
будет одно из них больше другого или нет. Рассматривая точки
28 КНИГА I. ОБЩИЕ ПОНЯТИЯ
плоскости, можно снова сказать относительно двух заданных
точек, будет одна из них лежать дальше другой от некоторой
точки 0 или нет. Можно также сказать, будут две точки лежать
на одной заданной полупрямой или нет. Во всех этих примерах
между двумя элементами вводится бинарное отношение.
Определение. Пусть имеется множество Е; будем говорить,
что в Е определено бинарное отношение, если задано
подмножество 9t произведения Е X Е.
Если пара (а, Ь), где а^Е, Ь&Е, принадлежит 91, то
говорят, что а и b связаны отношением 91, или что для а и Ъ
выполняется отношение 91. В дальнейшем часто вместо
записи (а, Ь)<~9£аЕхЕ будет использоваться более
простой символ.
Рассмотрим подмножество D из Е X Е, составленное из всех
пар равных между собой элементов, т. е. пар (a, a); D
называется диагональю множества Е X Е. Тогда (а, 6)е D^a = b;
следовательно, отношение, определяемое множеством Д есть
равенство (тождество).
Отношение 91 называется рефлексивным, если D а 91, т. е.
если всякая пара (а, а) ^91. Так, равенство рефлексивно.
Отношение 91 называется симметричным, если
(a, b)<=9lt=$(by а)*=Я.
Отношение 91 называется антисимметричным, если
(а, Ь)<=Я&(Ь, a)<z=:9l^a = b.
Отношение 91 называется транзитивным, если
(а, b)&0t&(b, c)<=9l=$>(at c)s=9l.
Пример. Пусть N есть множество натуральных чисел, и
пусть 91 есть подмножество тех пар (а, Ь) этих чисел, у
которых хотя бы одно число равно единице или у которых
наибольший общий делитель (н. о. д.) отличен от единицы. Это
отношение рефлексивно, так как, если а ф 1, то пара (а, а) имеет
н. о. д. а; оно симметрично, но не транзитивно, ибо (4,6) е 52,
(6,9) €= 91, но (4,9) ф Я.
Симметричность и транзитивность, вообще говоря, не влекут
рефлексивность, поскольку не всегда с любым элементом ag E
можно связать такой элемент b e E, что (a, b) e 91. Если же
это имеет место, то {а, Ь) е 91, (Ь, а) е5?=Ф (а, а) е 91,
откуда следует рефлексивность.
I. ОТНОШЕНИЕ ПОРЯДКА
Определение. Бинарное отношение Q называется
отношением порядка во множестве Е, если подмножество Q из Е X Е
рефлексивно, транзитивно и антисимметрично.
ГЛ. III. БИНАРНЫЕ ОТНОШЕНИЯ 29
Если пара (а, Ь) принадлежит й, то симметричная пара
(Ь, а) принадлежит Q лишь в том случае, если а = Ъ. Будем
говорить, что отношение Q упорядочивает Е, что Q есть отношение
порядка в Я, что Е упорядочено посредством Q.
Примеры, приведенные во введении к этой главе,
представляют собой отношения порядка; (a, t)eQ расшифровывается
как «а больше й», или «а дальше от начала, чем Ь». Часто
вместо записи (a,i)eQ будет использоваться обозначение a Kb
(или обозначение а>й).
При этом обозначении характеристические свойства
записываются следующим образом:
Рефлексивность: а К а.
Транзитивность: аКЬ&ЬКс=фаКс.
Антисимметричность: аКЬ&ЬКа=$Ь = а.
В общем случае отношение порядка во множестве не
позволяет упорядочить все пары. Однако если для любых а и b из Е
всегда (a, J)eQ или (b, a) e Q, то будем говорить, что Е
линейно упорядочено посредством Q. Так, действительные числа
линейно упорядочены, отношением a Kb. Напротив, точки
плоскости упорядочены, но не линейно упорядочены отношением,
указанным во введении. Натуральные числа также линейно
упорядочены отношением a Kb.
II. ОТНОШЕНИЕ ЭКВИВАЛЕНТНОСТИ
Определение. Бинарное отношение 91 во множестве Е
называется отношением эквивалентности в £, если подмножество 3t
из Е х Е рефлексивно, симметрично и транзитивно.
Вообще, чтобы записать, что а <= Е и йе£ связаны
отношением й, пишут а ~ b или а = b (mod Si); это последнее
обозначение читается так: «а равно b по модулю 9Ь.
Говорят, что а и b эквивалентны (подразумевается, что по Ж).
Тогда характеристические свойства записываются следующим
образом.
Рефлексивность: а ~ а.
Симметричность: а ~ b ФФ b ~ а.
Транзитивность: а~Ь&Ь~с=Фа~с.
Пример. Пусть N есть множество натуральных чисел;
будем говорить, что а ~ 6, если b — а имеет фиксированный
целый делитель т. Легко видеть, что все три свойства
эквивалентности выполняются.
Классы эквивалентности. Фундаментальное и важное
свойство отношения эквивалентности в Е состоит в том, что оно
позволяет установить разбиение множества Е на части,
называемые классами эквивалентности.
30 КНИГА Г. ОБЩИЕ ПОНЯТИЯ
Определения. Пусть Е есть множество, в котором определена
отношение эквивалентности. Классом эквивалентности называют
всякое подмножество А множества Е, образованное элементами
из Е, эквивалентными некоторому заданному элементу а.
Фактормножеством множества Е по рассматриваемому отно*
шению эквивалентности называется множество всех классов
эквивалентности.
Любые два элемента из Л в силу транзитивности
эквивалентны. Пусть b есть элемент из Е, не принадлежащий А, а В
есть множество всех элементов, эквивалентных Ь. Множества А
и В не пересекаются; действительно, если бы существовал
элемент с, с^А и се 5, то мы имели бы а ~ с (ибо с <= А) и
b ~ с (ибо се В); но a~c&c~b=^a~b, вопреки
предположению, что b <ф. А. Перебирая таким способом все элементы
из £, составляем разбиение Е на классы эквивалентности.
Рассмотрим отношение эквивалентности между а и й,
определенное следующим образом: а — Ъ имеет делителем
некоторое целое т. Получим столько классов эквивалентности, сколько
имеется натуральных чисел, не кратных т, т. е. в точности т, и
это будут классы
(1, 1+т, 1+2т, ...), (2, 2 + т, 2 +2т, ...)> (т, 2т, 3/п, ...).
Класс эквивалентности определяется при помощи любого
элемента из этого класса. Такой элемент называется
представителем класса.
Понятия класса эквивалентности и фактормножества
относятся к фундаментальным понятиям математики. Они
встречаются в самом начале ее изучения. Так, понятие направления
прямой есть в действительности понятие класса эквивалентности,
образованного множеством прямых, параллельных между собой.
Тогда каждая из этих прямых служит «представителем»
направления, а направление есть класс эквивалентности. Множество
всех направлений составляет фактормножество множества всех
прямых по отношению параллельности. В этом курсе будет
много примеров такого рода. Укажем, в частности, пример, к
которому мы вскоре вернемся: рациональные числа. Между
дробями устанавливается отношение эквивалентности: «p/q ~ р lq'»
означает, что pq' = qp'. Соответствующий класс эквивалентности
будет называться «рациональным числом». Тогда множество
положительных рациональных чисел будет фактормножеством
множества N X N по предыдущему отношению эквивалентности.
В этом примере, как и в других случаях, что будет нами каждый
раз уточняться, вводится замена символа ~ символом =,
который, стало быть, вовсе не означает здесь логического
тождества.
ГЛ. III. БИНАРНЫЕ ОТНОШЕНИЯ 31
III ЗАКОНЫ КОМПОЗИЦИИ
§ 1. Определения
В алгебре изучаются правила вычислений, самые простые из
которых — сложение и умножение. Эти операции -связывают
с парой чисел третье число, называемое суммой или
произведением. Ниже дается общее определение законов композиции на
множестве Е.
Внутренний закон композиции на множестве Е есть
отображение произведения Е X Е в Е.
Пример. «Геометрическая сумма двух векторов».
Пусть имеются два множества Е и F\ внешний закон
композиции на Е есть отображение Е X F в £.
Пример. «Произведение вектора на действительное число».
Если ае£, JgF, a / есть отображение Е X F в Я, то
f(a, b) есть элемент из £, являющийся значением функции f
для (а, Ь) е Е X F. Стало быть, закон композиции представлен
функциональным символом /, и если с — результат, полученный
после применения / к (а, й), то мы должны записать с = /(а, Ь)
или }(а, Ь) = с. Однако, как мы увидим, часто принимаются
иные обозначения.
В изучении законов композиции участвуют понятия, которые
будут нам встречаться в каждом конкретном случае. Дадим
здесь их систематический обзор.
Обозначение. Для записи закона композиции вместо
функционального символа, как, например, f(a, b) = с, употребляют
некоторый специальный знак, а именно: + для сложения,
а + b = с, знак • для умножения, а-b = с, обозначение аъ = с
для степени и т.д. Для того чтобы иметь возможность изучать
общие свойства, присущие всем этим законам, мы будем
пользоваться единым символом Т и будем писать aj b = с, что
словесно выражает: а в композиции с b дает с.
Коммутативность. Внутренний закон Т называется
коммутативным, если aj b =b J а, каковы бы ни были а и b из Е.
Так, сложение и умножение целых чисел коммутативны,
а степень аь — нет (23 = 8, З2 = 9).
Ассоциативность. Внутренний закон называется
ассоциативным^ если, каковы бы ни были а, й, с из Я, всегда (а Т Ь) Тс =
= ctT(bjc).
Здесь важно соблюдать порядок элементов. Сложение и
умножение ассоциативны, а степень —нет (пример: (22)3 = 64 но
2(2)-256).
Если закон композиции ассоциативен и коммутативен, то,
как нетрудно показать, в выражении вида ах Т а2 Т - -. Т я*
можно переставить любые два элемента и заменить несколько
32
КНИГА I. ОБЩИЕ ПОНЯТИЯ
элементов на элемент, полученный путем применения этого
закона к исходным элементам.
Если ассоциативный и коммутативный закон обозначается
п
знаком +, то полагают 2 а* = <*i + а2 + ••• + йп; если же закон
п
обозначен знаком •, то пишут Ца^ = а1-а2- ... • ап. Индекс I
называется операторным индексом. Он может быть заменен лю-
п п п п п
бой другой буквой. Так, 2 at = 2 ah = 2 ал; П я* =* П «л =
t = l /i=l fc=l i«l Л=1
п
-Па».
Регулярный элемент. Элемент а^Е называется регулярным
относительно некоторого внутреннего закона композиции Т>
если каковы бы ни были х и у из Е, равенства ат х==:а Т У и
х у а = г/ Т а влекут х = у. В этом случае говорят, что можно
сократить на а.
Если внутренний закон не коммутативен, то следует
различать левый регулярный элемент а, т. е. такой, что а у х = а Т У=Ф
=£, х = у, и правый регулярный элемент а, т. е. такой, что
хТя^Тя^я^У- Следовательно, выражение «а регулярно
относительно Т» будет означать, что а регулярно как справа,
так и слева.
Примеры. Имеем ах = аУ =Ф х = у, если а — целое и а =£ О
или 1, и напротив, Iх = 1*> не влечет х = у, и значит, 0 и 1 не
будут регулярными слева. Точно так же ха = уа влечет х = уу
кроме а = О, и значит, 0 не будет регулярным справа.
Для умножения регулярным является всякое число, кроме О,
ибо 0*л: = 0»у не влечет х = у.
Для сложения любое число регулярно.
Нейтральный элемент. Если существует такой элемент es£,
что е Т х = х, каково бы ни было х е Я, то е называется левым
нейтральным элементом. Точно так же е' е £ называется
правым нейтральным элементом, если х Т е' = х, каково бы ни
было х е £.
В случае внутреннего закона элемент е называется
нейтральным, если, каково бы ни было х^ Е, ey*33*!"6 — *-
Если нейтральный (т. е. одновременно правый нейтральный
и левый нейтральный) элемент е существует, то он будет
единственным. Ибо если бы нашелся другой элемент е', то мы
имели бы е' Т у = у Т ef = у при любом у е Е. Тогда, взяв
в х Т е = х в качестве л: элемент е', получим е' Т е — е\ Взяв
же в е/ Т у = у в качестве (/ элемент е, получим также
& -у е -- е. Следовательно, е = е\
ГЛ. III. БИНАРНЫЕ ОТНОШЕНИЯ
33
Так, 0 есть нейтральный элемент сложения, а 1 —
нейтральный элемент умножения. Операция возведения в степень не
имеет левого нейтрального элемента, поскольку ех = х
невозможно ни при каком х\ напротив, хе = х при любом х дает
е = 1, и значит, 1 есть правый нейтральный элемент. А так как
нет левого нейтрального элемента, то операция возведения в
степень не имеет нейтрального элемента. Для закона
композиции отображений f °g нейтральным элементом служит
тождественное отображение.
Симметричные элементы. Пусть J есть внутренний закон
композиции на £, обладающий нейтральным элементом е. Гово- ~
рят, что элемент а из Е симметричен элементу а из £, если
а Т а = е.
Примеры. Если а есть действительное число, то —а
симметрично ему относительно сложения. Если же, кроме того,
а Ф О, то 1/а симметрично а относительно умножения.
Если е — нейтральный элемент, то его симметричным
элементом служит он сам, так как е Т е = е.
Если закон Т коммутативен и а имеет симметричный
элемент а, то а Т а = а Т а. Следовательно, а Т а = е. Стало
быть, а тоже является элементом, симметричным к а, что
записывается а = а.
Если закон Т ассоциативен, но не обязательно
коммутативен, а элемент а регулярен и обладает симметричным
элементом а, то (а Т а) Т а = я Т (а Т а) = я Т е= а. Но мы имеем
также е т я = а, так как е — нейтральный элемент.
Следовательно, (aj а)т a = ej а. А поскольку элемент а регулярен, то
а "г а = е. Значит, если закон Т ассоциативен и элемент а
регулярен, то а Т я = е влечет а т я = е.
Пусть закон Т ассоциативен и элемент а регулярен; тогда,
если а обладает симметричным элементом а, то этот элемент
будет единственным. Ибо если бы нашелся еще один такой
элемент а\ мы имели бы а' т я = е; а поскольку а регулярно,
то в силу предыдущего результата имеем а Т а! = е. Отсюда
(а Т я) Т а' = в Т а' = а', а т (а Т а') = а', aje = a'; a = а'.
Дистрибутивность. Если на множестве Е определены два
закона композиции, обозначаемые J и _L, то знакон J будет
называться дистрибутивным относительно закона -L, если для
любых а, 6, с имеет место
а J (Ы с) = (а т Ь) -L (а т с).
Так, умножение чисел дистрибутивно относительно
сложения, так как а* (Ь + с) = а* Ь + а* с, но сложение не
дистрибутивно относительно умножения, поскольку равенство
а + be = (a + b) (a + с) не является справедливым для
всех a, fe, с.
2 Ш. Пизо, М. Заманский
34 КНИГА I. ОБЩИЕ ПОНЯТИЯ
Операции объединения и пересечения множеств также
являются законами композиции, и, как легко показать, для
любых Л, В, С
А{)(В\}С)-{А(\В)\}(А(\С), A\)(B[\C) = (A[)B)(){A[)C)i
следовательно, каждый из этих законов дистрибутивен
относительно другого.
§ 2. Изоморфизм
Определение. Пусть имеются два различных или
совпадающих множества Е и F, и пусть Е наделено внутренним
законом Т» я F — внутренним законом J_. Изоморфизмом множества
Е на F называется такое взаимно однозначное отображение f
множества Е на F, что
f(ajb)-f(a)±f(b)9
каковы бы ни были а и b из Е\ говорят, что Е и F изоморфны
относительно законов Ти1.
Примеры. 1. Е — множество Z целых чисел, закон Т
есть сложение; F — множество чисел вида 2П (где ле2),
а закон -L—умножение. Отображение f: n-*2n есть
изоморфизм, поскольку п + п->2п+п'= 2п • 2п\ т. е. f (п + п') =
= f(n) -f(n'), и отображение взаимно однозначно, поскольку
2Р = 2* влечет /? = </.
2. Пусть Е — множество положительных действительных
чисел, а закон Т есть умножение; пусть далее F — множество
всех действительных чисел, а закон JL есть сложение.
Отображение х—► lnx, т.е. f(x) =ln#, есть изоморфизм, так как
1п(х»у) = In х + In у, и, кроме того, это отображение взаимно
однозначно, так как In и = In v влечет и = v. (Ср. Книга III,
гл. III, разд. VII.)
Изоморфизм позволяет заменить операцию а Т Ъ во
множестве Е следующими операциями: образуем элементы а' =
= f(#) и b' = ){b) множества F, а в F применим к ним
операцию ±, т. е. образуем элемент ar L У = с'\ наконец, получим
аТ b = f-l(c'). Этот процесс представляет интерес в том
случае, когда операция 1 в F более проста, чем операция Т
в £. Так поступают, заменяя при помощи логарифмов
умножение сложением.
Когда имеется изоморфизм между двумя множествами,
каждое из которых наделено одним или несколькими
внутренними законами, соответствующими друг другу при этом
изоморфизме, эти множества часто отождествляются, т. е. для
обозначения их элементов и символов внутренних законов,
соответствующих друг другу при изоморфизме, используются
одни и те же символы. В £том курсе будут встречаться
многочисленные примеры таких отождествлений.
КНИГА II
АЛГЕБРА
ГЛАВА I
НАТУРАЛЬНЫЕ ЧИСЛА
§ 1. Определения
Исходя из аксиом теории множеств, можно построить
множество N, обладающее следующими свойствами:
Г N есть бесконечное линейно упорядоченное множество.
2° Любая часть множества N имеет наименьший элемент.
3° Всякая часть множества N, имеющая наибольший
элемент, конечна.
Такое множество называется множеством натуральных
чисел. (Напомним, что понятия конечного и бесконечного
множеств могут быть заимствованы из теории множеств (Книга I,
гл. II, § 2).) Мы довольствуемся здесь указанием этого пути
подхода к натуральным числам, основанного на теории
множеств, и ограничимся допущением существования такого
множества N.
Согласно свойству 2° само множество N имеет наименьший
элемент. Если исключить этот элемент, останется множество,
снова обладающее свойствами Г, 2° и 3°. Вообще можно
исключить последовательно конечное число наименьших
элементов; полученные множества будут снова множествами N.
Стало быть, существует много видов этого множества N, и можно
условиться всегда обращаться к одному из них, а именно к
тому, элементы которого обозначаются последовательно
обычными символами 1, 2, 3, 4, ...
Пусть а есть некоторый элемент из N. Множество элементов
из JV, строго больших, чем а, составляет часть множества N\
в силу свойства 2° это подмножество имеет наименьший
элемент, которой мы обозначим через а+ и назовем натуральным
числом, следующим за а. Обратно, пусть Ь есть элемент из N\
множество элементов из N, меньших или равных Ь, конечно
в силу свойства 3°; отсюда следует, что подмножество из N,
полученное после исключения Ъ из вышеуказанного множества,
конечно либо пусто; если оно конечно, то в нем имеется
наибольший элемент, поскольку оно линейно упорядочено; если
2*
36 КНИГА II. АЛГЕБРА
этот наибольший элемент есть а, то а+ = Ь. Стало быть,
всякий элемент из N, за исключением наименьшего,
обозначаемого обычным символом 1, есть натуральное число, следующее за
некоторым элементом из N; будем говорить, что а
предшествует й, если а+ = й.
Рассуждение по индукции. Наиболее важный метод изучения
множества N есть рассуждение по индукции, которое состоит
в следующем.
Допустим, что установлены такие два предложения:
Г Из того, что предложение Р допускается верным для
какого-нибудь натурального а, следует его справедливость для
натурального числа, следующего за а.
2° Существует хотя бы одно й, для которого предложение Р
выполняется.
Тогда из этих двух предложений вытекает, что Р
справедливо для любого натурального числа, большего или равного
й. В самом деле, рассмотрим множество натуральных чисел,
превышающих й, для которых Р не выполняется; это
множество составляет часть множества N, и значит, имеет
наименьший элемент с, причем с > й, ибо для й предложение
справедливо. Пусть с' есть число, предшествующее с\ тогда с' > й, и
для с' предложение Р справедливо; следовательно, в силу
предложения Г Р должно выполняться и для с, и мы
приходим к противоречию; значит, с не существует. Стало быть, Р
верно для любого натурального числа из N, большего или
равного й. В частности, если й есть наименьшее натуральное
число из N, т. е. й = 1, то предложение Р справедливо для
любого натурального числа из N.
§ 2. Операции
1° Сложение. Обозначим символом 1 наименьший элемент из
N. Положим, по определению, а + 1 = а+; если Ъ есть какой-
нибудь элемент из N, отличный от 1 и й~ — ему
предшествующий, то а + й=(а + й-)+. Га/с, по индукции определяется
внутренний закон композиции, называемый сложением. Заметим,
что этот выбор фиксирует в N первый элемент 1, и его отныне
уже нельзя отбрасывать. Мы не станем задерживаться на
доказательстве следующих предложений, которые устанавливаются по
индукции просто, но с длинными подробностями. Имеем
а + Ь = Ь + а (коммутативность),
a + (b + с) = (а + Ь) + с (ассоциативность).
Таким образом, в сумме любого количества натуральных
чисел можно два числа менять местами или несколько чисел
заменять их суммой.
ГЛ. I. НАТУРАЛЬНЫЕ ЧИСЛА
37
Всякое натуральное число регулярно относительно
сложения: а + х = а + у влечет х = у. Напротив, нейтральный
элемент относительно сложения не существует.
2° Умножение. Положим а • 1 = а; если Ь есть натуральное
число, отличное от 1, и Ь'— ему предшествующее, то полагаем
а • Ь = (а • Ь^) + а. Так, по индукции определяется новый
внутренний закон композиции, называемый умножением. Как и для
сложения, без труда устанавливаются следующие предложе-
а . ь = 6 • а {коммутативность),
а . ф . с) = (а • &) • с (ассоциативность).
Таким образом, в произведении любого количества
натуральных чисел можно менять местами два числа, а также
заменять несколько чисел их произведением.
Всякое натуральное число регулярно относительно умно-
жения: а»х = а*у влечет х = у.
Целое число 1 есть нейтральный элемент, так как хЛ ~
= 1-х = х, каково бы ни было натуральное х. Единственный
элемент, обладающий симметричным, есть 1.
И наконец, умножение дистрибутивно относительно
сложения; имеем
а(Ь + с) = аЪ + ас.
Это свойство является характеристическим свойством
умножения; часто умножением называют (не обязательно
коммутативный) закон, дистрибутивный относительно некоторого
Другого закона, который уже коммутативен (например, скалярное
произведение двух векторов, векторное произведение).
§ 3. Счетные множества
Определение. С понятием множества N натуральных чисел
связано понятие счетного множества. Множество Е
называется счетным, если оно имеет ту же мощность, что и
множество N.
Это означает, что существует взаимно однозначное
отображение f множества N на Е, т. е. любому n^N можно
поставить в соответствие один и только один такой элемент а е Е,
что a = f(n), tt = f~1(a). Обычно элемент из Е,
соответствующий п, обозначается через an, а п называется индексом. Стало
быть, счетное множество есть множество, все элементы
которого могут быть наделены натуральными индексами. Заметим,
однако, что обратное неверно; множество элементов
последовательности может не быть счетным, а быть конечным, Так,
38
КНИГА И. АЛГЕБРА
последовательность (см. § 4), определенная посредством хп = Г
при любом п, образует множество, состоящее из единственного*
элемента 1, а значит, это множество конечно и тем самым не
может быть множеством той же мощности, что и N.
Пример счетного множества. Множество N' чет-
ных чисел счетно; действительно, отображение п —* 2п есть
взаимно однозначное отображение N на N'.
Теорема. Произведение конечного числа конечных или
счетных множеств составляет конечное или счетное множество.
Пусть Еи ..., Ek — счетные множества; и пусть алп, где
h = 1, ..., k, n^ N, — элементы из Еп\ элемент из Е\ X
ХЕ2 X ... X Eh есть система (а1й1, а2„2, ..., aknk).
Рассмотрим системы, для которых сумма rt\ + п2 + ... + п^ равна
некоторому заданному натуральному пг\ число этих систем
конечно, и значит, их можно перенумеровать. Задавая m
последовательно значения k, k+l, k + 2, ..., снабдим каждую систему
одним номером; обратно, каждому натуральному числу таким
путем поставлена в соответствие одна и только одна система,,
имеющая это число своим номером. Стало быть, существует
взаимно однозначное отображение множества Е\ х Е2Х ...
... X Ek на N или на конечное подмножество из N. В
частности, N X N счетно; отсюда следует, что множество дробей,
счетно.
§ 4. Последовательности
Определение (См. Книга 1, гл. II, § 1). Отображение
множества N во множестве Е называется последовательностью
элементов из Е.
Отображение может не быть однозначным; один и тот же
элемент из Е может служить образом многих различных чисел
из N. Будем снова обозначать последовательность при помощи:
натуральных индексов Хи х2, ..., я*, ..., причем элементы
последовательности не обязательно различны. Число различных
элементов последовательности конечно или счетно. Будем
говорить, что две последовательности (хи х2} ... хп, ...) и
(Уи Уг> • • • > Уп> • •.) равны, если хп = уп при любом п. (Здесь
равенство является тождеством.)
Определение двойной последовательности. Отображение
множества N X N в Е называется двойной
последовательностью.
Такая последовательность будет обозначаться при помощи'
двух индексов; aVi4 будет элементом из £, соответствующие
паре (р, q) из N X N. Число различных элементов двойной
последовательности снова конечно или счетно. Равенство двух
двойных последовательностей вновь означает их совпадение.*
ГЛ. II. РАСШИРЕНИЕ ПОНЯТИЯ ЦЕЛОГО ЧИСЛА
39
ТЛАВА II
РАСШИРЕНИЕ ПОНЯТИЯ ЦЕЛОГО ЧИСЛА:
ОТНОСИТЕЛЬНЫЕ ЧИСЛА; РАЦИОНАЛЬНЫЕ ЧИСЛА
1. СИММЕТРИЗАЦИЯ ЗАКОНА КОМПОЗИЦИИ
Мы определили во множестве N натуральных чисел два
внутренних ассоциативных и коммутативных закона, при
которых всякий элемент регулярен. Однако операции «обращения»
не всегда возможны; так, не всегда существует такое
натуральное х, что а + х = Ь\ это равенство возможно, лишь если
Ь > а, и невозможно, если b •< а.
Попытаемся, исходя из N, построить новое множество Z,
в котором можно было бы определить внутренний закон,
позволяющий получать «обращение» сложения и такое, чтобы N
было изоморфно некоторой части множества Z, что позволит
«отождествить» N с этой частью. Чтобы охарактеризовать
суть процесса, будем истолковывать операцию сложения как
сложение грузов, значение веса которых будет задаваться
натуральными числами. Положив на одну чашу весов груз в а
граммов и груз в b граммов, а на другую чашу груз в с
граммов, получим равновесие, если a+fe = c. Чтобы уравновесить
некоторый неизвестный груз х, помещают этот груз на одну из
чаш и отыскивают известный груз, который надо положить на
другую; пусть а = х. Но можно также положить некоторый
дополнительный груз т, и мы снова получим равновесие
4х + m = х + m. Таким образом, наравне с парой (а, 0) пара
{(а + т, т) позволяет уравновесить груз х. Стало быть, мы
приводим к процессу выбора пар {а, а') = Л, т. е. к рассмотрению
множества N X N и установлению отношения эквивалентности
{av ai) ^ ^i ~ (a2> a2J — А>> когда обе пары уравновешивают
один и тот же груз, т. е. когда ах + а'2 = а2 + а[. Если возможно
«вычитание», то это условие записывается а'2 — а2~а[ — а{\ но
как раз потому, что вычитание не всегда возможно, в то время
как сложение возможно всегда, мы и будем прибегать только
к сложению.
Симметризация множества, обладающего ассоциативным и
коммутативным законом, при котором все элементы регулярны»
Теперь мы покажем, что описанная операция возможна в
самой общей форме и применима к любому множеству Е,
наделенному законом композиции, обозначаемым через Т,
ассоциативным, коммутативным и таким, при котором все элементы
регулярны (в предыдущем случае £ = JV, а Т есть +).
Рассмотрим множество Е X Е\ элемент Л этого множества
^сть пара (a, a'), где as£ и а' ^Е. Будем говорить, что две
40 КНИГА II. АЛГЕБРА
пары Ах = (ах, а'х) и А2 = (а2, а2) эквивалентны, если axja2 =
= а2 т я[. Покажем, что тем самым определено отношение экви«
валентности.
1° Рефлексивность. Л ~ А\ действительно, если Л = (а, а'),
то aj a' = aj а'.
2° Симметричность. Если Ах = {ах, а'х) и А2 = (а2, а2)
эквивалентны, т. е. а{Т а2=--а2Т а[> то мы имеем также Л2 ~ Лр
поскольку а2 у ^i = ^! Т а2.
3° Транзитивность. Пусть Л3 = (а3, я£). Если Ах~ А2 и Л2~ Л3,
то ajT^^^T^i и а2т «з^^Т^- Отсюда (ajjflQ Т(я2Тя£) =
= Кт«;)т(«3т4
Коммутативность и ассоциативность позволяют менять
порядок операций, так что ах т aj Т #2 Т я2 в аз Т я{ Т я2 Т а2-
А так как элемент [а2 т я2) регулярен, то окончательно получаем
а, Т Дзв аз Т Др т. е. Л! ~ Л3.
Введя таким путем в Е X Е отношение эквивалентности,
рассмотрим классы эквивалентности*). Множество классов
эквивалентности образует новое множество & —
фактормножество множества Е X Е по отношению эквивалентности.
В этом множестве & мы определим закон композиции,
обозначаемый нами предварительно через J-.
Пусть a = cMt« cl A2(Al~A2), p - cl Bx = c\B2{Bl~B2),
a €= S, pe^.
Полагаем, по определению, a J_ P = cl б1э где G{ = (a{ т &i,
a\ T Ь{). ^тот класс не зависит от представителя, выбранного
как в а, так и в р. Действительно, возьмем в а элемент
А2~ Ах и положим G2 = (a2 J bx, a2j b'x). Поскольку ax т а'2 —
= a2 т aP то a2 т я2 T bx T b( = a2 J Q>\ T &! T b\, что благодаря
ассоциативности и коммутативности записывается в виде
[ах т Ьх)-у(а2 т 6Q = (а2 т bx} j(a[ Tb\), означаЮ1Цем
эквивалентность пар Gb G2.
Таким образом, с классами аир можно связать некоторый
класс, обозначаемый a 1 р, т. е. определить внутренний закон
композиции на фактормножестве произведения Е X Е по ~.
Этот закон, очевидно, коммутативен, поскольку Gx = (ах Т Ь{,
а\ т bty — (b{ T ^p 6j Т я')* Он ассоциативен, так как, если у =
= clCi, где С, = (ср с{), то
(а 1 р) 1 y = cl [(ax Tbx)Tcl9 (a\Tb\)j с\] =
« cl [а, Т (6, Т *,), ai Т (Ь[ Т сО] = « 1 (р 1 y).
*) Класс пары Л = (а, а') будет обозначаться символом cl Л.
ГЛ. II. РАСШИРЕНИЕ ПОНЯТИЯ ЦЕЛОГО ЧИСЛА 41
Всякий элемент регулярен относительно этого закона; в
самом деле, пусть I = cl(*. х?) и г) = cl(#, */'), и пусть а 1 I ~
= а 1 Ti* это значит, что c\(ajxt a' J x') = cl(a Т У, а Т у'),
или еще: {aj х)т (а' Т »') = (а' Т *') Т (а Т */)> а следователь-
н0? ХТ у* = х*Т у, откуда (*, а:') - (f/, */'), и I - ц.
' Докажем, что закон _L обладает нейтральным элементом и
что для каждого элемента существует симметричный элемент.
Действительно, найдем такое £ = cl(z, г'), что а ± С = а
при любом а. Следовательно, должно быть {а Т г, а' Т z') ~
~ (а, а') при любых а ее £ н а' е £, и значит, (а Т г) Т а" =
= аТ(а/Т2/), откуда z = г'. Обратно, все пары (г, г) из
двух равных элементов эквивалентны между собой и их
класс £ обладает свойствами нейтрального элемента. Пусть
теперь а = с1(а, а'); найдем такое a = cl(a, а'), что а±а«£,
и стало быть, (а т«» а' ТаОе£ или flT^fl'T/. Это
соотношение будет выполнено, если взять а = а' и а7 = а, а
значит, a = cl(a', a), и этот класс является единственным ^Кни-
га I, гл. III, стр. 33).
Изоморфизм. Покажем, что множество &
(фактормножество множества ЕхЕ по ~), наделенное законом X,
содержит некоторое подмножество Е\ которое изоморфно
множеству Е, наделенному законом Т. В самом деле, пусть Ег есть
множество классов, определенных посредством пары (аТ х> а),
где ае£ и х е Е. Если положить £=cl(aTx, а), то |
является элементом множества ЙГ, и множество всех £ составляет
Е'. Каждому | поставим в соответствие х. Это соответствие
определяет отображение f множества £' в Е\ при этом я = /(£).
Пусть т] = cl(fe Т у, 6) —другой элемент из Е\ у = f{v\). Но
£J_r] = cl(aT*T& ТУ, ajb) = c\({aTb)T{xT у), (aj6)) =
= cl (с т {х Т f/), с), где с = а Т Ь. Следовательно, | J. ri e £', и
в силу определения f имеем д: Т У = f (ъ -L ч) = f (Е) Т (л)- Это
отображение множества £' на £, очевидно, взаимно однозначно
и переводит | JL т) в f(E)T/(r]). Таким образом, отображение
f есть изоморфизм.
Отныне мы будем отождествлять множество Е с этим
подмножеством Е' фактормножества <8 множества Е X Е по ~
и будем обозначать закон _1_, определенный на <S, при помощи
прежнего символа Т (вместо употребляемого нами -L);
будем говорить, что мы продолжили закон J на
фактормножество.
Заметим, что в S операция обращения Т уже всегда
возможна, т. е. если а и у суть два заданных класса, то всегда
найдется такой класс р, что a T р = у. Действительно,
должно выполняться а Т (« Т Р)="5 Т У, откуда (aT«)TP = &TY,
а так как ата=:£ есть нейтральный элемент, то р=»
■* а т Y-
42
КНИГА II. АЛГЕБРА
В частности, если операция обращения возможна для
некоторого элемента х е Е, то она остается возможной и во
множестве <§Г, и результатом будет соответствующий класс при
изоморфизме.
Построенное таким путем множество называется симметри-
зованным из множества Е, наделенного законом Т.
Оно обладает следующими свойствами:
1° Имеется закон композиции,
2° Этот закон ассоциативен.
3° Существует нейтральный элемент.
4° Каждый элемент обладает симметричным.
Всякое множество, обладающее этими четырьмя
свойствами, называется группой; если закон коммутативен, то группа
называется коммутативной, или абелевой. Так,
фактормножество & есть коммутативная группа относительно операции Т..
II. ЦЕЛЫЕ ОТНОСИТЕЛЬНЫЕ ЧИСЛА
Применим результат, полученный в разделе I, к операции
сложения во множестве N натуральных чисел.* Множеством^
симметризованным из N относительно сложения, будет
коммутативная группа, образованная классами эквивалентности пар
натуральных чисел, где (а\, а'\)~(а2, а*), если ai + а£ = а 4-а';
элементы этой группы называются целыми относительными
числами; множество этих чисел часто обозначается через Z.
Нейтральный элемент £ обозначается символом 0, а
симметричный к а элемент а обозначается через (— а) и называется:
противоположным к а. Тогда вычитание возможно в Z без
ограничения: если заданы а и y и требуется найти такое р,
что a + p = Y> T0 P = Y + u = Y + (-""a); это записывается еще
в виде y — a-
Отношение порядка. Часть множества Z, изоморфная Nr
состоит из классов пар вида (а + х, а), где aeJ\f, и этот класс
соответствует элементу a;gJV; следовательно, эти классы
образованы парами вида {а, а'), где a>af. Говорят также, что
класс a=cl(a, a'), где а>а', строго положителен, и пишут
сс>0.
Установим теперь между двумя элементами из Z следующее-
отношение: ос>р4Фос — |i>0 или а — р = 0.
Это есть отношение порядка. Действительно, оно обладает
следующими свойствами.
Рефлексивность. Имеем a^a, ибо a — a = 0.
Транзитивность. a 4^ р и р -< y ^ Р — a ^ Afp, у — ре Af0*
где No рзначает объединение ча£ти множества Z, изоморфной,
N, и нейтрального элемента 0. В результате сложения имеем
;<P-a) + (Y-P)-P+(-a)+Y+(-P); н0 Р + (~Р) = °*
ГЛ. II. РАСШИРЕНИЕ ПОНЯТИЯ ЦЕЛОГО ЧИСЛА
43
-и значит, (р - а) + (Y — Р) e Y + (- «) = Y - а. А поскольку
сумма двух элементов из N0 принадлежит N0, то y — a^N0, и
значит, ос < Y- о/^о л/
Антисимметричность. а < Р и р <. а фф р — аб!У0 и
.a^pEJV0; но а —р+(р —а) =0, и значит, р —а
симметрично а — Р- Если {и, v) — некоторая пара из класса р — а,
то (v,и) есть пара из класса а—р. Принадлежность (a,u)eJV0,
означает, что и ^ v, а (v, и)^ N0 эквивалентно тому, что v ^ и\
«следовательно, u = v, а — р = р — ос = 0, и а = р.
Множество Z линейно упорядочено этим отношением
порядка. Пусть а ^ Z и PeZ. Если неравенство а > р не имеет
места, т. е. для некоторой пары (и, v) из класса а — р не
выполняется условие и > v, то должно иметь место неравенство
v > и, и класс р — а, определяемый парой (v, и), принадлежит
множеству N, а значит, р > а. Это доказательство показывает
также, что имеется разбиение Z на подмножество, изоморфное
N, на подмножество, составленное из всех элементов,
противоположных элементам этого подмножества, скажем, — i\f, и на
элемент 0.
Введенное таким путем отношение порядка согласуется со
сложением, т. е. если а ^ р, то, каково бы ни было у е Z,
имеет место отношение а + у ^ р + у-
И наконец, отметим, что Z — счетное множество.
Расширение на Z умножения в N. Множество N наделено
еще одним законом композиции — умножением. Заранее не
очевидно, что этот закон может быть связно продолжен на Z.
Для того чтобы это было так, необходимо, чтобы искомое
умножение совпадало с умножением в N для элементов части,
изоморфной N, т. е. если а = а' + х, Ъ = Ь' + у и с = с' + ху,
то cl-(a, a') -cl (b,bf) = cl (с, с'). Выразим с и с' как
функции от а, а', Ь, Ь\ Имеем ab' = а'Ь' + Ь'х\ Ъа' = а'Ь' + а'у и,
наконец, ab = (а' + *) (Ь' + у) = а'6' + б'* + а'у + ху;
отсюда, прибавляя а'6' и принимая во внимание два первых
равенства, получаем ab + а'Ь' = ab' + а'Ь + ху. Таким образом,
следует брать с = ab + а'Ь' и с = aft' + а'6. Яга/с,
произведение а*р, где а = cl (а, а'), a p = cl (b,bf), определяется как
класс пары (ab + a'b', ab' + а'й). Это определение не зависит от
представителя, выбранного в классе а, так как если (а\, а'\) е
€а и (а2, а^еа, то (аф + а'ф'; axb' + a\b)~(a2b + а!ф', a2b'+
+ a2b), или аф + а'ф' + аф'Ь'+ a2b = axbf + a\b + a2b + a'2b', т. е.
{al + a'2)b+(a'i + a2)b' = {ai + a'2)b/+ (a'i + a2)b; но а{ +а'2 = а2 +а[.
Свойства. Определенное так умножение коммутативно, что
очевидным образом следует из его определения.
Оно ассоциативно, ибо если y — cl (с» с')» то (ccP)y =
= c\[(ab + а'Ь')с +(ab' + а'Ь)с', (ab + а'Ь')с' + (ab' + а'Ь)с] =»
-a(pY).
44
КНИГА II. АЛГЕБРА
Найдем регулярные элементы. Пусть ар = ау; тогда в
предыдущих обозначениях должно выполняться равенство
ab + а'Ь' + ас'+ а'с = ab' + а'Ь + ас + а'с', или а{Ь + с') ч-
+ а'(6' + с) = а(6' + с) + а'(& + С). Если р =£ у, то b + с'Ф
Ф Ь' + с\ допустим, что b + с' > V + с\ тогда а[{Ь + с')—
— (Ь' + с)] = а'[(Ь + с') — (Ь' + с)], и значит, а = а', а а = 0.
Следовательно, все элементы множества Z, кроме 0,
регулярны относительно умножения, и 0 • а = 0 при любом а.
Нейтральный элемент. Найдем такой элемент seZ, чтобы
ос-8 = а при любом aeZ. Пусть (и, и') есть некоторая пара
из класса е; тогда должно выполняться аи + aV + а' =
= а*/ + а'а + а. Возьмем, в частности, a > 0, и значит, а > а'.
Тогда можно написать и (а — а') = (и! + 1) (а — а7); стало
быть, и = и' + I, и е = с1(и' + 1, и') отождествляется с
натуральным числом 1. Без труда убеждаемся в том, что для е
справедливо также осе = а, когда a ■< 0.
Симметричные элементы. Найдем, если оно существует,
такое а, что аа = е; очевидно, а Ф 0. Если (а, а!) есть
некоторая пара класса а, то должно выполняться равенство
аа + а!а = аа! + аа' + 1. Допустим сначала, что а > а'\ тогда
можно написать а(а — а')—а'{а — а') = 1, или (а— а') X
X (а — а')=1, а значит, a — а' = 1 и а — а'=1, и стало
быть, единственный возможный элемент а есть a = 1 с a = 1,
Если же а<а\ то точно так же имеем а (а! — а) —a (a'— а) =
= 1, или (а7 —а) (а' — а)=1, а следовательно, а' — а=1 и
а' — а=1, и значит, единственный возможный элемент есть
—1 и его симметричный есть —1.
Правило знаков. Рассмотрим произведение (—а) на р.
Имеем —а = cl (а', а), и значит, (—а) -р = cl {a'b + ab',
а'Ь' + ab) = (—ар); стало быть, произведение (—а) на р
есть класс, противоположный ар.
Таким образом, произведение (—а) (—р) равно классу,
противоположному а-(—Р), т. е. классу (,—аР), и следовательно,
равно классу ар.
Дистрибутивность умножения относительно сложения. Имеем
а(Р + у) — cl[a(ft+ с) + а'(Ь' + с'), а(Ь' + с') + а'{Ь + с)] =
= d(ab + а'Ь') + {ас +a'c')t {ab' + a'b) + {ас' +а'с)] = ар + ау.
Заметим еще, что в Z умножение не согласуется с
отношением порядка, так как, если a ^ р, то ay ^ Py не может
выполняться при всех y е 2, ибо это означало бы ay — Ру ^ 0, т. е.
(а — р) -у1^ 0, что возможно лишь для у> 0.
Во множестве Z можно производить сложение, равно как
и вычитание, любых двух элементов. Кроме того, любые два
элемента можно перемножать (но, вообще говоря, нельзя
произвольные два элемента делить друг на друга). Множество Z
представляет собой первый пример кольца.
ГЛ. II. РАСШИРЕНИЕ ПОНЯТИЯ ЦЕЛОГО ЧИСЛА 45
111. РАЦИОНАЛЬНЫЕ ЧИСЛА
§ 1. Определения, операции
Во множестве Z обратная к умножению операция деления
не всегда возможна. Поэтому мы расширим Z при помощи
процесса симметризации, примененного теперь уже к умножению.
Однако не все элементы в Z регулярны; исключим не
регулярный элемент 0 и обозначим через Z' полученное новое
множество, т. е. множество всех целых относительных чисел,
кроме 0. Тогда умножение будет ассоциативным и
коммутативным законом композиции на Z', все элементы которого
регулярны. Построим множество, симметризованное из Z' относи-,
тельно умножения. Рассмотрим множество Z' X Z', т. е. пары
{а,а'), где a^Z' и a'<^Z'. Такая пара называется дробью и
записывается обычно как а\а', где а есть числитель, а а' —
знаменатель. (Заметим, что пока предполагается а ф 0 и
а' Ф0.) Установим теперь отношение эквивалентности: а\/а\~
~а2/а2 означает, что а\а2 = а2а'\.
Класс эквивалентности
a = cl(ai/ai, a2/a2i ...)
называется рациональным числом.
Если р = cl (6i/fri, 62/62, ...), то произведение сф определяется
посредством
aP = cl(a161/aibb ...).
Множество классов эквивалентности составляет
фактормножество произведения Z' X Z' по этому отношению
эквивалентности и обозначается Q'.
Если х е Z', то в Q' множество классов вида g =
= cl (ах/а, ...) образует множество, изоморфное Z'
относительно умножения, причем £ отождествляется с х.
Нейтральный элемент умножения в Q' есть класс (а/а, ...),
и значит, следуя только что принятому соглашению, мы
отождествляем его с элементом 1 из Z'.
Всякий элемент а из Q' имеет симметричный, обозначав-
мый 1/а и называемый обратным относительно умножения.
Если а = cl (а/а', ...), то 1/а = cl (а'/а, ...).
Несократимая дробъ. Рассмотрим рациональное число
a = cl(ai/ai, a2la'2, ...);
к пусть йх есть н. о. д. для ах и а\\ тогда а,« dxay a\ = d{a\
и целые числа а и а' взаимно просты. Получаем ai/a'i~a/a\
так как. аха* = dxaa! = а\а. Следовательно, а/а' есть
представитель класса а. Пусть а2/а2 есть произвольный представитель
46
КНИГА II. АЛГЕБРА
класса а; тогда а2/л2~я/я', т. е. а2а' = а'2а. Но а взаимно
просто с а7 и является делителем а2а\ поэтому служит
делителем а2, т. е. a2 = d2a, и стало быть, также a2 = d2a'.
Следовательно, все дроби класса а имеют вид da/da', где а и а' взаимно
просты, a d есть какое-то целое число из Z'.
Дробь а/а' есть особый представитель класса а и
называется несократимой дробью класса. Эта несократимая дробь
будет единственна, если уточнить, что выбирается а' > 0. Если
рациональное число принадлежит подмножеству, изоморфному
Z', скажем, х е Z, то несократимая дробь класса элемента х
есть х/1, его знаменатель равен 1, и наоборот.
Расширение сложения. Мы хотим распространить на
Q' сложение, определенное в Z'. Для этого запишем а =
= а'х, b = b'y m с = с'(х + у)\ тогда должно выполняться
cl (а/а\ ...)+. cl (Ь/Ь\...) = cl (с/с',...).
Выразим сие' как функции от а, а', Ь> Ь'. Получим ab' =
= а'Ь'х, а'Ь = а'&'у и, сложив, придем к равенству ab' + а'Ь =
= а'Ь'(х + у). Таким образом, надо бр'ать с = ab' + а'Ь, с' =
- а'Ь'.
Определим теперь сложение для а = cl (а/а', ...) и р =
= cl (b/b', ...) следующим образом:
, 0 . (ab' + a'b \
Это определение не зависит от представителя, выбранного
в классе а, так как если а\/а\ и a2/#2 принадлежат классу а,
то (аф'+ а'ф)а'2Ь'= (a2b' + a'2b)a\b', ибо а\а2 = а2а!\.
Свойства. Определенное так сложение коммутативно, что
очевидно из определения.
Оно ассоциативно, ибо если у = cl (с/с', ...), то
(a + p) + Y = cl[^ jfcp , .. .J = а + 0 + Y).
Нейтральный элемент. Найдем такое t,=c\(z/z', ...), что-*
бы a + t = а при любом а; должно выполняться
az' + a'z a
a'z' ~ d *
и значит, (az' + a'z)af = aa'z', откуда a'z = 0. Таким образом,
в Q' не существует надлежащего класса. Любые две дроби
О/z'i и 0/22, У которых Zi Ф 0, ZгФ 0, эквивалентны в смысле
отношения эквивалентности между дробями, поскольку 0 • z2 =
= 0 • 2i. Стало быть, множество дробей вида О/z' с z' Ф 0
составляет класс £, и a + £ = а; т. е. £ есть нейтральный класс
относительно сложения; он может быть отождествлен с числом
ГЛ. II. РАСШИРЕНИЕ ПОНЯТИЯ ЦЕЛОГО ЧИСЛА 47
О из Z. Множество Q', к которому добавлен этот класс О, бу-
дет обозначаться через Q.
Легко видеть, что всякий элемент из Q регулярен
относительно сложения и что в Q сложение и вычитание двух
элементов всегда возможны.
Умножение двух элементов из Q определяется по тому же
правилу, что и в Q'; при этом а-0 = 0.
Элемент 0 не регулярен относительно умножения; 0 не имеет
обратного.
Умножение в Q дистрибутивно относительно сложения.
Действительно, если
а = с1(а/а', ...), P = cl (b/b', ...), Y = cl (с/с', ...),
то
/о , \ х[а(Ьс' + сЬ') I
Но дррби — представители эквивалентны, так как а(Ьс'+
+ cb')a'b'a'c' = a'b'cf{aba'c' + aca'b'), и значит, a(p + у) =
= aP + ay-
Итак, во множестве Q можно производить сложение,
вычитание, а также умножение любых двух элементов. Деление
тоже возможно, кроме деления на нуль. Такое множество
представляет собой первый пример поля. Q называется полем
рациональных чисел, а его элементы — рациональными числами.
§ 2. Отношение порядка
Отношение порядка. Отношение порядка во множестве Z
может быть распространено на Q. Действительно, пусть
имеется некоторый элемент х из Z; как элемент из Q, х является
классом дроби а'х/а\ т. е. дроби а/а' са = а'х. Тогда, если
х > 0, то а и а' имеют одинаковые знаки, и аа' > 0; если х < 0,
то а и а' имеют разные знаки, и аа' < 0; наконец, если х = 0,
то аа' = 0, так как а = 0.
Вообще мы будем полагать сс>0, если a = cl (a/a', ...) и
если aa'^0. Это отношение не зависит от выбора
представителя, так как если ai/a{~a2/a2, то aia2 = a2ai, и значит, после
умножения на а\а2 получим также аха\ • а2а'2 = а\а'* > 0; стало
быть, а\а\ и а2а'2 имеют одинаковые знаки.
Мы будем считать а>р, если р = cl (&/&', ...) и если
а — р > 0.
Рефлексивность. Имеем а^а, так как a — a = 0.
48
КНИГА И. АЛГЕБРА
Транзитивность. Если а >- р и P^y» т0 а — Р > О и
Р — Y ^ 0; сумма же двух рациональных чисел £ = cl (х/х', ...)
и т) = cl (#/#', ...), где g > 0 и г] > 0, дает
1 + ч,«(Ы±М1, ...).
Но хх'>0 и у/ > 0, откуда (хг/ + г/х') х'*/' = хх'//' + уу'х' > 0;
поэтому g + ц >- 0. Из этого вытекает, что а — Р + Р — Y = а —
— у > 0, и, значит, а > у-
Антисимметричность. Если а^р и Р ^ ос, то £ = а — Р^О,
и обратно, (—|) = р — а ^ 0. Но если I = cl (х/х', ... ), то
(—I) = cl (—х'/х, ...), и значит, хх' > 0 и (—х) • х' = —хх' > 0,
а стало быть, хх' = 0 и % = 0, т. е. а = р.
Множество Q линейно упорядочено этим отношением
порядка, так как если а и р — два произвольных рациональных
числа, то, обозначив s = a — p = cl(x/x', ...) и допустив хх'>0,
получаем, что ^ 0 и а ^ р, а допустив, что хх' < 0, получаем,
что (—х) • х' >0 и (—I) > 0, а значит, р > а.
Отношение порядка согласуется со сложением', имеем
а>рФ^а + у>Р + У
при любом у €= Q» поскольку а + у —(Р + V) = а — Р-
Напротив, с умножением оно не согласуется.
§ 3. Абсолютное значение
Абсолютное значение в Q. Пусть а есть некоторый элемент
из Q. Мы только что показали, что либо а > 0, либо а = 0, либо
а < 0; из этих трех возможных случаев имеет место только
один. Теперь мы определим отображение ос —>|ос| множества Q
на элементы >0 из Q следующим образом. Положим |ос| = ос,
если а ^ 0, и |а| = —а, если а < 0; функция \а\ называется
абсолютным значением элемента ос. Очевидно, |а| = |—а|.
Абсолютное значение обладает следующими тремя
свойствами: каковы бы ни были элементы aEQ, PeQ, всегда
1° |a| >0, и |а| =04фа = 0.
3° |а + рК|а| + |р|
Для доказательства 3 заметим, что всегда ос-<>|ос|; в
самом деле, если ос^>0, то это неравенство записывается a-^a
и следует из рефлексивности; если а < 0, то неравенство
записывается а ^—а, т. е. —а — ос^>0, значит, —2а X), что
очевидно. Заменив ее на —ос, получаем при любом а неравенство
— а-<|ос|, или еще —|ос|-<ос. Рассмотрим теперь два
неравенства — |a|<a< |af и — |Р|<р< |р|. В силу
транзитивности имеем — |а| + р<сс+р<|ос| +р и, наконец, — |а| —
— |Р| <— |а| + р<а + р< |а| + Р <|а| + |Р|.
гл. ш. законы композиции 49
Если а+р>0, то а + р=|а + р| и, значит, |ос + р|<
^ | а I + IPI. Если же а + р<0, то а + р = —|а+р|, и тогда
а|-|р|<-|ос + р|, откуда |а + р|<|а| + |р|.
Неравенство 3°, называемое неравенством треугольника,
может быть записано иначе, в чем возникнет необходимость при
рассмотрении комплексных чисел.
Для любых а и р из Q справедливо неравенство | (а— р) +
+ р| <\а— р| + |Р|, т. е. |а —р|> |а| —|р|. Заменим а
на р, а р на а; получим |р — а| > |р| — |а|. Но |р — а| =
= |а — р|. А ||а| —|р|| равно либо |а| —|р|, либо |р| —
— |а|; значит, всегда можно написать
|а-р|>И«|-|Р1|.
Обратно, последнее неравенство эквивалентно неравенству
треугольника. Действительно, по предположению, для любых р
и y из Q им^м \у — Pl^Hvl-lPlI» и следовательно,
|у— Р| ^ \у\ — |Р|. Положим y = а + Р> последнее
неравенство принимает вид |oc|>|y| —|Р|» или еще: |а| + |р|>
^ М.т. е. |а + р| < |а| + |р|.
ГЛАВА III
ЗАКОНЫ КОМПОЗИЦИИ !
При построении рациональных чисел мы имели дело с
множествами, наделенными различными законами композиции.
Здесь мы выделим основные структуры, которые возникают и
которые входят во все разделы математики. Прежде всего
начнем с понятия, требующего только одного внутреннего закона,
а именно понятия группы. Исторически оно тоже появилось
первым, в фундаментальной работе Э. Галуа, пришедшего
к этому понятию в связи со своими исследованиями о решении
алгебраических уравнений. Затем мы перейдем к изучению
понятий, связанных с двумя законами композиции.
I. ВНУТРЕННИЕ ЗАКОНЫ
§ 1. Группы
Группа. Говорят, что множество £, наделенное внутренним
законом т, есть группа, если закон у обладает следующими
тремя свойствами:
1° Закон ассоциативен.
2° Имеется нейтральный элемент.
3° Всякий элемент имеет симметричный^
50 КНИГА II. АЛГЕБРА
Замечание. Не требуется, чтобы закон Т был
коммутативным; если закон коммутативен, то группа называется
коммутативной, или абелевой.
Примеры. Сложение превращает Z в коммутативную
группу. Умножение превращает Q' (рациональные числа без нуля)
в коммутативную группу.
Вращения вокруг некоторой точки в плоской геометрии
составляют коммутативную группу.
Вращения вокруг некоторой точки в пространственной
геометрии составляют некоммутативную группу, так как
существенно, в каком порядке производятся операции.
В плоской геометрии множество всех вращений не
составляет группу, так как произведение двух вращений может
оказаться переносом. Напротив, множество вращений и переносов
составляет группу.
Множество операций возведения в степень не составляет
группу, так как они не ассоциативны.
Множество четных чисел из Z' (Z без 0) не составляет
мультипликативной группы. Свойство Г выполняется, но 2° и
оо
о —нет.
Подгруппа. Часть группы, которая сама является группой
относительно того же закона, называется подгруппой. Так,
множество четных чисел из Z есть коммутативная подгруппа
группы Z относительно сложения. Множество переносов есть
коммутативная подгруппа некоммутативной группы, состоящей из
всех вращений и переносов.
Подгруппа всегда содержит нейтральный элемент группы.
В коммутативной группе закон композиции часто
обозначают знаком + . Так, «геометрическое сложение» свободных
векторов превращает множество этих векторов в коммутативную
группу.
§ 2. Кольца
Кольцо. Кольцом называют коммутативную группу Ау
обладающую вторым внутренним законом композиции, который
ассоциативен и дистрибутивен относительно первого.
Если второй закон коммутативен, то кольцо называется
коммутативным.
Множество Z есть коммутативное кольцо: закон группы —■
сложение, а второй закон — умножение. Мы увидим, что
квадратные матрицы из п строк и п столбцов образуют
некоммутативное кольцо.
Подкольцом называют всякую часть кольца А, которая снова
является кольцом относительно тех же законов. Так, множество
четных чисел из Z есть подкольцо кольца Z.
ГЛ. III. ЗАКОНЫ КОМПОЗИЦИИ
51
Кольцо А, будучи группой по отношению к первому закону,
обязательно содержит нейтральный элемент группы, т. е.
элемент 0, если группа записывается аддитивно. И напротив, оно
не обязано содержать нейтральный элемент второго закона. Так,
множество четных чисел не содержит нейтральный элемент 1
умножения. Если кольцо А содержит нейтральный элемент
второго закона, то оно называется унитарным. (Если второй закон
имеет мультипликативное обозначение, то нейтральный элемент
называется также единичным элементом.)
Если второй закон паре элементов а, Ь, отличных от
нейтрального элемента 0 группы, ставит в соответствие этот
нейтральный элемент 0, то будем говорить, что эти два элемента а,
Ь суть делители нуля (в аддитивной записи для первого закона
и мультипликативной для второго это имеет вид ah = 0, а ф О,
ЬФО).
Кольцо квадратных матриц содержит делители нуля.
Кольцо без делителей нуля называется кольцом целостности.
Идеал» Рассмотрим подгруппу I коммутативного кольца А,
обладающую тем свойством, что результат применения к эле*
менту из I и любому элементу из А второго закона есть элемент
из /; тогда I есть подкольцо кольца А, называемое идеалом.
Если в кольце А первый закон обозначается + (и
превращает множество А в группу), а второй закон обозначается •, то
идеал / есть множество таких элементов х, что для любых ае/1,
xg/ имеет место л;-а е / и для произвольных х е /, je/
выполняется х + у ^ I и х — j/e/.
Пример. Множество четных чисел 2р есть идеал в Z,
рассматриваемом как аддитивная группа с умножением в качестве
второго закона. В самом деле, произведение четного числа 2р
на любое целое число п из Z будет снова четным числом 2пр.
Понятие идеала, как мы увидим, будет полезным при
изучении делимости многочленов.
§ 3. Тела
Тело. Кольцо К, обладающее тем свойством, что множество
элементов из К, лишенное нейтрального элемента первого
закона, составляет группу относительно второго закона,
называется телом.
Если второй закон тоже коммутативен, то тело называется
коммутативным телом, или полем.
Всякое подмножество /С* тела К, которое в свою очередь
является телом, называется подтелом тела К, а К есть надтело
тела К*.
Пример. Множество Q рациональных чисел есть поле. То
же самое можно сказать о множестве R действительных чисел
52
КНИГА II. АЛГЕБРА
и о множестве С комплексных чисел. Здесь Q есть подполе /?,
г R — подполе С.
* Тело характеристики р. Рассмотрим множество Z целых
относительных чисел и возьмем целое т > 2. Введем отношение:
ах ~ а2€$С1\ — а2 есть нуль или делится на т. Легко видеть,
что это есть отношение эквивалентности. Пусть а = cl (аь а2,...)«
Число классов эквивалентности конечно и равно т\ можно
выбрать в классе а такой представитель а, что О^Са^т— 1.
Пусть теперь а = с1(аь а2, ...)> Р = с1(йь й2, ...)• Положим
а + р = cl (ui + fei, ...), а • р = cl (aifei, ...). Очевидно, что эти
операции зависят лишь от классов а и р, а отнюдь не от
конкретно выбранных представителей. Эти операции ассоциативны
и коммутативны, а умножение дистрибутивно относительно
сложения. Нейтральным элементом сложения является класс 0 --=
= cl(0, m,...), и всякий класс а имеет противоположный: — а =*
= с1(—аь —a2t~...). Умножение имеет в качестве
нейтрального элемента класс 1 = cl(l, m + 1, ...). Стало быть,
множество классов есть унитарное кольцо.
Если m — не простое, скажем, m = q-ry то для у = c\(q,...),
р = cl (г, ...) имеем у • р = cl (m,...) = 0 и y ^ 0, р Ф 0. Значит,
имеются делители нуля. Если же т = р — простое, то ясно, что
если ос-р = 0, то а\Ъ\ делится на р, и следовательно, по крайней
мере одно из чисел аи Ь\ делится на р; значит, а или р должно
быть нулем. В этом случае кольцо будет кольцом целостности.
Покажем, что это тело. Пусть а = cl(a, ...), где а Ф 0, и
значит, а ф 0 не делится на р. Рассмотрим р — 1 целых чисел
а, 2а, ..., (р— 1)а; разделим эти числа на р и обозначим
через г и г2у ..., Ау-i полученные остатки. Ни один из остатков не
может равняться нулю, поскольку р взаимно просто со всеми
р—рассматриваемыми целыми числами; следовательно, 1 ■<
•*Crh^Cp— 1 для А = 1, ...,р— 1. С другой стороны, если
h ф k, то rh Ф rk. Действительно, если бы rh = rki то ha =
= Р<?л + Oi, &а = P?ft + rh, и значит, если /г > /г, то (Л — 6) а =
= Р(Ян — Qk), что невозможно, так как l<^ft —£<1р — 2, и
ft — & взаимно просто с р. Таким образом, р— 1 различных
чисел г/г, заключенных между 1 и р— 1, принимают все значения
от 1 до р— 1; в частности, существует такое целое Ь, 1 -^ Ъ •<
^Ср— 1, что гъ = 1; следовательно, Ъа = pqb + 1, а если р =
= cl(fe, ...), то ар = с1(ай, ...) = cl(l, ...) = 1. Итак, всякий
элемент а ф 0 обладает обратным 1/ос = р относительно
умножения. Следовательно, построенное множество является телом.
Это тело обладает замечательным свойством иметь лишь
конечное число р элементов. Вычисляя сумму р членов, равных 1,
получаем 1 + 1 + ... +1 = 0. Тело, обладающее этой
особенностью, называется телом характеристики р. Если можно
прибавлять единицу произвольное число раз, не получая 0, то тело
гл. ш. законы композиции
5£
с таким свойством называется телом характеристики 0; только
с телами характеристики 0 мы будем встречаться в
дальнейшем; к ним, среди других, принадлежат Q, R и С.
Абсолютное значение. Абсолютным значением в теле К
называется отображение ос—*|а| множества К во множество
Недействительных чисел *> 0, обладающее следующими
свойствами: , ,
1° |а|>0и |а|=0ффа = 0.
3° |а + Р1<|а| + |р|.
Тело, в котором определено абсолютное значение, называется
нормированным, а число |а| называется абсолютным значением
элемента aei(.
Примеры. 1. Если К = Q или R, то обычное абсолютное
значение удовлетворяет этим условиям.
2. В Q можно определить абсолютные значения и другим
способом. В самом деле, пусть р — некоторое фиксированное
простое число. Если а — отличное от нуля рациональное число,
а а\а! — его несократимый представитель, то можно написать
а\а! = ршЪ\Ъ', где m e Z и ни 6, ни Ь' не делятся на р. Тогда
положим |а|р = р~ш и |01р = 0. Условия 1°, 2° и 3° легко
проверяются, а неравенство 3 даже заменяется более сильным
неравенством |а + р|р <; тах(|а|Р, |р|р), где тах(|а|Р, |р|р)
означает наибольшее из чисел |а|р, |р|р. Строгое неравенства
может иметь место лишь при условии |а|р = |р|р-
11. ВНЕШНИЕ ЗАКОНЫ
Может оказаться, что на множестве £, наделенном
внутренним законом коммутативной группы, определен также при
помощи некоторого другого множества F, внешний закон
композиции. Наиболее важным множеством такого типа и
единственным, которое мы будем здесь изучать, является векторное
пространство.
§ 1. Векторное пространство
Векторное пространство над телом К. Пусть имеется
множество Е, наделенное законом коммутативной группы,
обозначаемым + ; при этом если х, у, z — любые элементы из Е, о —
нейтральный элемент, то
1° х + (у + z) = (х + у) + г (ассоциативность),
2° х + о = о + х = х (нейтральный элемент).
3° х + (—х) = о (симметричный элемент).
4° х + у = у + х (коммутативность).
Пусть, с другой стороны, имеется тело К, все элементы
которого обозначаются греческими буквами. Предположим, что*
54
КНИГА II. АЛГЕБРА
на Е определен внешний закон, г. е. паре (А,, х), где XgK,
ug£, соответствует элемент из £, обозначаемый Xxt причем
этот внешний закон обладает следующими свойствами:
5° К(х + у) = Кх + Ju/ (дистрибутивность).
6° (А, + jx)# = Кх + (jijc (дистрибутивность).
7° Х((ллг) = (Х,|л)лг (ассоциативность).
8° ел; = л:, где е — единичный элемент из /С.
Тогда будем называть Е векторным пространством над
телом /С
Примеры. 1. Множество свободных векторов образует
векторное пространство, когда внутренний закон есть
геометрическое сложение, а внешний закон — умножение на скаляр, причем
здесь тело К — это вообще поле R действительных чисел.
2. Множество решений линейного однородного
дифференциального уравнения является векторным пространством, где
внутренний закон есть обычное сложение функций, а внешний
закон — умножение на комплексное число; здесь К—поле С
комплексных чисел.
3. Множество многочленов составляет векторное
пространство, причем внутренний закон есть обычное сложение, а
внешний закон — умножение на константу из тела К
коэффициентов.
4. Если взять Е = К, то ясно, что всякое тело есть векторное
пространство над собой с внутренним законом — сложением и
с «внешним законом» — умножением.
Векторное подпространство. Пусть Е есть векторное
пространство над телом К. Всякое подмножество Е' из £,
наделенное двумя законами пространства Е и составляющее векторное
пространство над телом /С, называется векторным
подпространством пространства Е.
Свойства, вытекающие из определения. Пусть О
есть нейтральный элемент тела К относительно сложения в /С.
Из 6° следует (0 + \i)x = 0-х + \к-х\ значит, \кх = О-* + \к • х,
и 0• х = о есть нейтральный элемент группы Е при любом хе£.
Точно так же из 5° выводим %(х + о) = Х*х + А*о, откуда
о = *к*о при любом X е К.
§ 2. Норма в векторном пространстве
Норма в векторном пространстве. Понятие абсолютного зна*
чения может быть обобщено на векторное пространство над
нормированным телом К. Нормой в Е называется отображение
х-*\\х\\ пространства Е в /?+ (множество действительных
чисел > 0), удовлетворяющее следующим условиям:
Г ||х||>0,и||*|| =0^х = 0.
2° HUH = |А,|-11*11 для любых *е£.
гл. ш. законы композиции
55
3° II* + У\\ ^ 11*И + IIУII Для любых х,уе=Е.
Число 11*11 называется нормой элемента х.
Заметим, что если Е = К, то мы снова приходим к
определению абсолютного значения в К.
Примеры. 1. В векторном пространстве свободных
векторов длина вектора является нормой; неравенство 3°,
называемое неравенством треугольника, выражает тот факт, что в
треугольнике длина стороны меньше или равна сумме длин двух
других сторон.
2. Если рассматривать непрерывные функции на замкнутом
интервале, то можно доказать, что максимум абсолютного
значения есть норма в векторном пространстве, где внутренний
закон есть сложение функций, а внешний закон есть умножение на
действительное число (ср. книга III, гл. III).
Более подробно мы будем изучать векторные пространства
в гл. VII и X.
III. ПРИМЕРЫ
§ 1. ФУНКЦИИ
Напомним, что функция есть отображение множества,
называемого областью определения (которая будет здесь
обозначаться через А) в другое множество, называемое областью
значений (оно будет обозначаться через £). Мы уже определили
законы композиции на множестве функций, когда определяли
сложную функцию (книга 1, гл. II, § 4). Теперь мы хотим
определить другие законы композиции в соответствии с природой
множества Е.
Векторное пространство функций. Предположим, что область
значений Е есть векторное пространство над телом К, причем
область определения А может быть какой угодно.
Множество функций, или отображений А в Е будем
обозначать через &".
Тогда функция f e У всякому элементу |еЛ ставит в
соответствие элемент f(l) векторного пространства Е.
Г Внутренний закон. Пусть f и g — две функции из #~;
всякому £еЛ соответствует f{l)^E и g(£)e£. Рассмотрим
отображение, которое каждому g e А ставит в соответствие
элемент f{l)+ g{l) векторного пространства Е. Тем самым мы
определим отображение множества А в Е, т. е. некоторый
элемент из #". Это отображение обозначается f + g; образ в Е
элемента £ e А есть (f + g) (%) = f(t) + g (|).
Таким образом, в У определен внутренний закон
композиции-, двум элементам f и g из ?Г он ставит в соответствие
элемент из #~, обозначаемый через (/ + g).
об
КНИГА II. АЛГЕБРА
Он является законом коммутативной группы. Действительно,
так как Е — векторное пространство, то для любого | е Л и
любых fe=ST, gEf, h^ST имеем: /(g) + g(g) = g(g) + /(g),
и значит, f +_g = g + f\
/(g) + fe(E) + h(l)] = [/(g) + 8(1)] + h(l),
и значит, /;+; (g + h) = (/ + g) + А. Обозначим через о
отображение множества А в £, которое всякому ^еЛ ставит в
соответствие нейтральный элемент сложения о пространства Е, т. е.
такое, что o(g) = о при любом g e Л. Тогда
/(g) +о(Б) = /(g) + o = /(g),
и значит, / + о = /; отображение о есть нейтральный элемент
закона сложения в #\ Пусть g* есть отображение, которое
каждому ge-Д ставит в соответствие элемент — /(g) е £, т. е.
g(5)=— /(g) при любых g€=A Тогда /(g) + g(g) = о, и
следовательно, / + g = о. Положим g = (—/); каждый элемент
,f ^ @~ имеет симметричный элемент (—/) относительно
сложения в дг.
Следовательно, определенное так сложение в &~ обладает
всеми свойствами закона коммутативной группы.
2° Внешний закон. Пусть /еУ и ^еК; всякому g e Л
соответствует /(g) е £. Рассмотрим теперь отображение, которое
каждому ge^4 ставит в соответствие элемент X/(g) векторного
пространства Е; это есть отображение множества А в £, и
стало быть, является элементом множества У всех отображений.
Обозначим его через Я/. Определенная так операция на $Г
представляет собой внешний закон на ^"; он ставит в
соответствие паре (Я, /), где Я е /С, / е #~, элемент Я/ из #".
Множество этих двух законов, внутреннего и внешнего,
превращает $Г в векторное пространство над телом К.
Действительно, так как Е есть векторное пространство, то для любого
g е А и любых /ef.jEf, X <= /С, ix e /С имеем
МШ + *й)]-я/(8) + а*(б),
и значит, Я(/ + #) = Я/ + Я#;
(Л + |*)/(Б)-Л/(Б) + ^/в)р
и значит, (Я + jx) / = Я/ + \if;
tttf№ = (bv)f(l),
и значит, Я(\if) = (Я|л) /;
e/(g) = /(g),
л значит, е/ = /, где е есть нейтральный элемент (е=1)
умножения в /С.
ГЛ. III. ЗАКОНЫ КОМПОЗИЦИИ
57"
Кольцо функций. Предположим теперь, что множество
значений Е есть кольцо, а область определения А произвольна.
Обозначим снова буквой Г множество функций, являющихся
отображением множества А в Е. Будем записывать закон
коммутативной группы множества Е при помощи символа -К
а второй закон, дистрибутивный относительно первого, будем:
записывать как мультипликативный (последний закон может
не быть коммутативным).
Пусть f и g — два элемента из $Г\ определим, как и выше,,
функцию (/ + g) как отображение, которое каждому ^еЛ
ставит в соответствие элемент f(l) + #(£) кольца Е. Тогда
множество ЗГ превращается в коммутативную группу
относительно этого закона композиции, записываемого аддитивно.
Нейтральный элемент о есть отображение, которое всякому
I e E ставит в соответствие нейтральный элемент первого
закона кольца Е.
Теперь рассмотрим отображение, которое каждому ^еА
ставит в соответствие f (!)•§(!) из Е; это есть элемент
множества Г; обозначим его через f >g (сохраняя порядок функций).
Эта операция есть второй внутренний закон композиции в ^\
Вообще говоря, f-g ф g-f.
Множество этих двух законов превращает $Г в кольцо.
Действительно, так как Е есть кольцо, то для любого |е£и любых
\^Т, gE^, her имеем f(6)-fe(6)-ft(6)] = [/(6)-*(6)]-Л(БК
и значит, f-(g-h) = {f-g) -ft; точно так же f(£) -[g(g) + ft(g)] =
«/(Б)-*Ф+/(6)-М6), и значит, f(* + ft)=fe + fft; [f(l) +
+ g($)]-h(t)=f(t)-h(t)+g(t)-h(t)y и значит, (f + g)h =
= f"A + g-h\ порядок членов должен быть всюду сохранен.
Если Е есть коммутативное кольцо, то Г тоже будет
коммутативным кольцом, поскольку для любого ^еЛ и любых f е Г
и geE&~ имеем f(l)-g(l) = g(£) -f(E). и значит, f-g = g-f. Для
такого коммутативного кольца два закона дистрибутивности
сводятся к одному.
Если Е есть унитарное кольцо, то £ содержит нейтральные
элемент а относительно второго закона, т. е. для всех х е Е
выполняется и-х = х-и = х. Обозначим через v отображение А
в Е, которое каждому ^еЛ ставит в соответствие не
зависящий от | элемент и в Е, т. е. v(\) = и (v есть постоянная
функция на А). Тогда для любых f & &~ и ^еЛ имеем y(£).f(|) =
= "-/(1) =/(&)•" = f (6) •*(£) = Ш, и, стало быть, и • f = / . t; =
= f для всех f^r. Следовательно, кольцо Г унитарно,
причем функция v e @~ есть нейтральный элемент второго закона,
т. е. единичный элемент.
Замечание. Даже если кольцо Е не имеет делителей
нуля, то для кольца ST это, вообще говоря, не так. Пусть,
например, А' есть подмножество из Л, а А" есть дополнение Лл
58
КНИГА И. АЛГЕБРА
относительно Л (т. е. A' U Л" = Л и Л' Г) А" = 0). Пусть f—
такой элемент из &*, что /!(g/) = о для любого £' еЛ', и
/(g") *£ о, если J" e Л", где о означает нейтральный элемент
сложения в Е. Пусть далее g есть такой элемент из ёГ, что
g(l') Фо, если Е'е4', и g ({■"') = о для любого £"еЛ". Обе
функции f и g отличны от функции o&lST—нейтрального
элемента сложения в ёГ. Но f(l)g(Q = о для любого gs Л, так
как если g е Л7, то f (|) = о, а если | ge Л", то g(g) = о, и
следовательно, f-g = o в #". Стало быть, кольцо Ф имеет
делители нуля. Для того чтобы вГ не имело делителей нуля,
необходимо, чтобы не существовало таких функций, как предыдущие
функции fug; это обстоятельство может иметь место, если
вместо 8Г взять лишь некоторое подкольцо кольца ST; мы
увидим (гл. IV, разд. I, § 2), что многочлены представляют
пример такого подкольца.
Частный случай числовых функций. Если множество
значений Е есть поле R действительных чисел или поле С
комплексных чисел, то Е есть кольцо. Тогда предыдущие рассмотрения
показывают, как можно определить сумму и произведение двух
числовых функций, и доказывают, что множество ЗГ этих
функций составляет коммутативное кольцо. Так будет и для
подмножеств из ЗГ9 образованных множеством ступенчатых функций,
ярусных функций, непрерывных функций, когда Л есть
надлежащим образр^ выбранное подмножество из R,
соответственно из Rn (см. Книга III, гл. III).
§ 2. Последовательности
Напомним определение последовательности, уже дававшееся
в книге II, гл. I, § 4.
Определение последовательности. Если задано множество Е,
то последовательностью в Е называется отображение
множества N натуральных чисел в Е.
Двойная последовательность. Если задано множество Е, то
двойной последовательностью в Е называется отображение про-
изведения N X N в £.
Будем обозначать элементы из N через п, р, q, ...
Последовательность х есть отображение множества N в Е, и
следовательно, образ элемента п е N в Е должен быть
обозначен через х(п). Однако в случае последовательностей это
обозначение используется редко; обычно образ элемента п
обозначается символом хп и п называется индексом. Точно так же,
если у есть двойная последовательность, то образ элемента
(р, q) &N X N в Е обозначается символом yPlя, где р и q снова
называются индексами.
Это обозначение нуждается в некоторых пояснениях.
гл. ш. законы композиции
59
Г Когда говорят «задать последовательность элементов из
Е»у то это означает, что нужно задать отображение множества
N в Е. Будем обозначать последовательность через (хп), а
также будем говорить, что имеется последовательность хих2, ...
..., хп, ... или (#ь*2> ..., хп, ...)• Не следует путать
выражение «последовательность (хп)», или «последовательность Х\ух2,...
..., хп, ...», с выражением «множество значений
последовательности {Хп)>>.
2° Иногда говорят: «обозначим через X последовательность
(хп)»у и записывают X = (хп) или X = (хи х2, ..., #п, ...). Эта
запись, удобная в некоторых случаях, не отвечает принятым
соглашениям, поскольку последовательность X должна
записываться как {Хп),
Определение. Элемент хп из Е называется членом с
индексом п последовательности х. Иногда также его называют
членом ранга п*).
3° Вместо «последовательности» говорят еще
«последовательность элементов из £», с тем чтобы уточнить, что речь идет
об отображении множества N в Е. Этот способ выражения
удобен в том случае, когда имеются два множества значений, Е
и F; тогда можно будет сказать: «рассмотрим
последовательность элементов из £ и последовательность элементов из F».
Это еще упрощают, говоря: «последовательность из £».
4° Две последовательности (хп) и (уп) из Е равны, если
хп = Уп при всех п ^ N.
Не следует смешивать равенство двух последовательностей
и равенство множеств значений этих последовательностей. Так,
рассмотрим последовательность (хп), определенную посредством
Х2р = 0, #2p+i = 1, т. е. хп = 0, если п четно, и хп = 1, если п
нечетно, и последовательность (уп), определенную как у2р = 1,
#2p+i = 0- Эти последовательности представляют собой
отображения множества N в Е — N\ множество значений этих двух
последовательностей одно и то же; оно состоит из двух элементов,
О и 1; сами же последовательности (хп) и (уп) не равны.
5° Если на Е определено сложение, то суммой
последовательностей (хп) и (уп)^Е называют последовательность (хп +
+ уп). Это определение является перенесением определения
/ + g из § 1. Последовательность (хп + Уп) есть
последовательность, которая каждому п е N ставит в соответствие
элемент хп + Уп из Е. Будем говорить также, что сумма двух
последовательностей образуется путем их почленного сложения.
6° Если на Е определено умножение на элементы тела К
(внешний закон), то будем называть для Х<=К
последовательностью %(хп) последовательность (Ххп) из Е.
*] В русской терминологии также: «я-й член».
,£0 КНИГА И. АЛГЕБРА
Если Е есть векторное пространство над телом /С, то
последовательности из Е тоже образуют векторное пространство
над К.
7° Если на Е определено умножение (внутренний закон), то
произведением двух последовательностей (хп), (уп) называется
последовательность (хпуп).
Если Е есть кольцо, то последовательности из Е тоже
образуют кольцо.
8° Среди последовательностей, являющихся отображением
.N в Е, имеются постоянные последовательности, которые всем
п <= N ставят в соответствие один и тот же элемент a ^N.
Такая последовательность обозначается (а). Так, если Е
содержит множество целых чисел, то последовательность (0)
определяется как хп = 0 при всех я, а последовательность (I)
определяется как хп = 1 при любых п.
9° Двойная последовательность обозначается (хр, q).
10° Для большей ясности и точности используется также
следующее обозначение:
\Хп)п <= N» \XP> q\py q) s N X N»
'С тем, чтобы указать, что переменное есть элемент из N или из
N X N. В особенности это обозначение применяется в
следующем случае.
11° Пусть (хп) есть последовательность элементов
множества Е. Далее пусть пи есть возрастающая последовательность
чисел из N, т. е. такое отображение k-+nk множества N в N,
что k<k' влечет nk<nk,- Последовательность (уъ) элементов
из Е, определенная как yk = Xnk для любого k^Nt называется
подпоследовательностью последовательности (хп). Ее
обозначают {хп^ или, для большего уточнения, [хп^
Пример. Каждому feeiV поставим в соответствие nk = 2k\
тогда последовательность (м&) есть последовательность четных
чисел; {x2k)k<=N есть подпоследовательность
последовательности (хп) для четных значений п.
(x2k-\)k<=N есть подпоследовательность
последовательности (хп) для нечетных значений п.
(x2k)k^N есть подпоследовательность последовательности хп
для пу являющихся целой степенью числа 2.
ГЛАВА IV
МНОГОЧЛЕНЫ
В этой главе будут главным образом изучаться
алгебраические свойства многочленов без учета того, что многочлен
является также функцией. Иными словами, прежде всего будут
ГЛ. IV. МНОГОЧЛЕНЫ
61
изучены операции сложения, умножения и формального
дифференцирования.
Многочлен от одного переменного над кольцом
целостности А. Пусть А есть унитарное кольцо целостности, т. е. кольцо
без делителей 0, имеющее единичный элемент (нейтральный
элемент умножения). В дальнейшем в качестве А мы будем
брать либо поле комплексных чисел С, либо поле
действительных чисел R, либо поле рациональных чисел Q. (Однако при
изучении многочленов от многих переменных появится случай,
когда А есть кольцо многочленов.)
Рассмотрим такую последовательность элементов из Л, что,
начиная с некоторого индекса, все элементы
последовательности равны элементу 0 из Л, где 0 означает нейтральный
элемент сложения в Л. Таким образом, имеем последовательность
а = (а0, аь ..., а„, 0, 0, ...), где а*<=Л.
Такая последовательность называется многочленом от
одного переменного над А.
Наибольший индекс п> при котором ап ф О, называется
степенью многочлена а и обозначается deg a.
Элементы а* называются коэффициентами многочлена;
коэффициент ао называется свободным членом.
Если все коэффициенты равны нулю, то соответствующий
многочлен обозначается 0, и, по соглашению, он не имеет
степени^ Иногда условливаются приписывать ему символическую
степень, обозначаемую —оо, причем этот символ, по
соглашению, удовлетворяет неравенству —оо < п при любом целом п.
I. ВЕКТОРНОЕ ПРОСТРАНСТВО —КОЛЬЦО МНОГОЧЛЕНОВ
§ 1. Векторное пространство многочленов
Пусть имеются два иногочлена
а = (а0, ..., а„, 0, 0, ...) и & = (Ро, ..., рт, 0, 0, ...).
Будем полагать а = Ъ, если эти последовательности
тождественны, т. е. если п = m (одинаковая степень) и ос* = р^ для
i = 0, 1, .. г, п.
Сложение. Определим на множестве многочленов
внутреннюю операцию с аддитивной записью, положив
a + fc-(a0 + p0, c^+fr, ...).
Ясно, что эта операция ассоциативна и коммутативна.
Имеется нейтральный элемент, а именно многочлен,
обозначаемый О = (0, 0, .,.)> все коэффициенты которого нули.
62
КНИГА II. АЛГЕБРА
Наконец всякий многочлен обладает симметричным, или про-
тивоположным, обозначаемым
-а = (-а0, ..., -а„, 0, 0, ...);
это многочлен, все коэффициенты которого противоположны
коэффициентам многочлена а.
Следовательно, наделенное этим законом множество много-
членов составляет коммутативную группу.
Заметим, что степень многочлена а + Ь равна наибольшей
из двух степеней, если эти степени не равны; если же они
равны, то может случиться, что степень окажется меньше, и стало
быть, всегда имеем
deg(a + 6)<!max(dega, degb).
Степень многочлена 0 не определена; степень многочлена — а
та же, что и степень а.
Умножение на элемент из Л. Пусть АеЛ; положим
Ха = (Яосо, Яссь • • • > Аосп, 0, 0, ...);
Ха есть многочлен, все коэффициенты которого суть
произведения элемента X на коэффициенты многочлена а.
Очевидно, что если А е Л и }i e Л, то
Х{а + Ь) = Ха + ХЬ,
(А + ц.) а = Ха + \ia,
X (\ха) = (X\i) a,
1 • а = а.
Если X Ф О, то ясно, что deg(Xa) = deg a.
В случае, когда А есть тело К, эти операции превращают
множество многочленов в векторное пространство над телом К
коэффициентов.
Рассмотрим многочлены ип = (0, ..., 0, 1, 0, 0, ...), все
коэффициенты которых — нули, кроме коэффициента с индексом п,
имеющего значение 1, т. е. единичного элемента из Л; очевидно,
ип имеет степень п. Тогда всякий многочлен а = (cto, «ь ...
..., сеп, 0, 0, ...) единственным образом записывается в виде
а = а0и0 + «i^i + ... + апип.
В случае, когда Л есть тело К, будем говорить, что и0, щ,. ...
..., ип, ... составляют базис векторного пространства
многочленов. Число элементов базиса бесконечно; в этом случае
говорят, что векторное пространство бесконечномерно.
Принятое обозначение. По причинам, которые станут ясны
в дальнейшем, вместо ип пишут символ хп. Важно заметить, что
пока х ничего не представляет, а хп есть символ, в котором
нельзя отделять п от х, т. е. п играет роль индекса, Наконец, по
соглашению, пишут и0 = х° = 1,
ГЛ. IV. МНОГОЧЛЕНЫ
63
Так приходим к обычной записи
а = аэ + щх + ... + апхп.
Множество многочленов над кольцом А обозначается А [х]у
а х называется неизвестным или переменным, причем
последний термин в особенности употребляется для того случая,
когда многочлен рассматривается как функция.
§ 2. Кольцо многочленов
Умножение многочленов. Мы введем на множестве много-*
членов второй закон композиции, ассоциативный и
дистрибутивный относительно сложения многочленов, В силу
дистрибутивности достаточно определить его для многочленов вида сцх*,
а* е А. Для ос* €5 Л, fa е А положим (а(х1) (Р/*') = а/Р/л;'+/.
Иными словами, мы перемножаем переменные, как если бы их
индексы были показателями степеней. Если а = ао + ai# + ...
... + апхпу Ь = ро + pi* + ... + Pm#m, то в силу
дистрибутивности,
«.&=-• а0р0 + (а0р! + ajPo) л: + ... +
+ (а0р, + а1р,_1+ ... +aJh)x*+ ... +a„pm*»+»
Эта операция коммутативна и дистрибутивна относительно
сложения. При помощи довольно длинного, но несложного
вычисления убеждаемся в том, что она ассоциативна.
Отметим следующее важное свойство:
deg (a • b) = deg a + deg6.
Оно остается верным, если 6=0, при соглашении, что —оо =
= п + (—оо) при любом целом п.
Множество А [х] есть коммутативное кольцо. Многочлен и =»
= ло + Ц\х + • • • + i\ixl есть нейтральный элемент относительно
умножения, если и*а = а для любого многочлена а. В частности,
ДОЛЖНО ВЫПОЛНЯТЬСЯ UXn = Хп, И ЗНаЧИТ, ЦоХп + Ц^Х71*1 + . . .
... + r\ixn+l = xn, что дает нам r)o=l, iii = 0, лг = 0, ...
..., -ф = 0. Таким образом, и = х° = 1; это дает право
отождествить многочлен х0 с числом 1. Стало быть, кольцо А [х]
унитарно. С другой стороны, многочлен х может быть отождествлен
с переменным в том смысле, что многочлен, представленный
символом х\ является (также в смысле только что
определенного умножения) f-й степенью многочлена х.
Исследуем, будет ли кольцо А [х] иметь делители нуля. Пусть
а и Ь — два многочлена из А [х] с а Ф 0; следовательно, в а
найдется хотя бы один коэффициент ал ф 0; допустим, что h —
наименьший индекс, обладающий этим свойством; отсюда
вытекает, что если имеютсй целые t, 0 ^ I < Л, то ос* = 0. Если
64
КНИГА II. АЛГЕБРА
коэффициенты многочлена Ъ обозначены Ро, Pi, ..., то равенство
аЪ = О дает ос^Ро = 0, ah&\ + oc^+iPo = 0, ... Так как 'ah Ф 0, то
последовательно выводим, что р0 = 0, Pi = 0, ... и, стало быть,
6=0. Таким образом, кольцо А [х] есть кольцо целостности.
Следствие. Равенство аЬ = ас при аФО влечет Ь = с.
Действительно, равенство ab = ас записывается также в виде
а(Ь — с) = 0; но а Ф 0; значит, 6 — с = 0, и й = с. Таким
образом, всякий многочлен а Ф 0 регулярен относительно умно-
оюения.
II. ДЕЛЕНИЕ ПО УБЫВАЮЩИМ СТЕПЕНЯМ
В этом разделе мы будем предполагать, что А есть поле К,
где К — либо С, либо /?, либо Q.
§ 1. Результат деления
Если заданы два многочлена а и Ь, то не всегда может
найтись такой многочлен q, что а = bq. Если же-q существует, то
будем говорить, что а делится на b или что b делит а, а также
что многочлен а кратен Ь. Так, многочлен 0 кратен любому
многочлену.
Для того чтобы многочлен а делился на Ь, необходимо,
чтобы а принадлежал множеству I многочленов, кратных Ъ, т. е.
множеству многочленов вида cb, где с — произвольный
многочлен. Легко убедиться в том, что / есть подкольцо кольца К [х]\
более того, / есть идеал этого кольца, поскольку произведение
многочлена, кратного й, на любой многочлен снова кратно Ъ.
Степень всякого ненулевого многочлена из / больше или
равна степени Ъ и, значит, b среди ненулевых многочленов из /
имеет наименьшую возможную степень. Если степень а строго
меньше степени й, то а не может делиться на й, кроме случая
а = 0. Поэтому предположим, что deg a > deg b. Теперь мы
выделим из а многочлены, кратные й, так, чтобы в результате
получались многочлены из / меньшей степени: если ag/, to мы
придем к многочлену нулевой степени, а это и будет означать,
что а делится на Ь. Для того чтобы явно выписать степени,
запишем многочлены в порядке убывания индексов:
а = апхп + ап-1хп~1 + ... +а0, ап ф 0,
*«ftn*m + Pm-i*w-1+ ••• +ft>. Pm^O и n>m.
Многочлен xn~m-b = $mxn + $m-{xn-] + ...'+ p0#n-m
принадлежит /, а его степень равна степени п многочлена а.
Рассмотрим теперь многочлен an_i = а — yn-mxn-mb, где
уп-т = ocn/Pm. Именно здесь используется тот факт, что кольцо
коэффициентов должно быть полем для обеспечения существо-
ГЛ. IV. МНОГОЧЛЕНЫ 65
вания Yn-m, лишь только рт ф 0. Если а е /, то ап-\ ^ Л причем
коэффициент при хп в ап-\ равен ап — Yn-iPm = 0. Стало быть,
degan-~i<itt—1. Повторяя аналогичную операцию с
многочленом ап_ь получаем постепенно последовательность
соотношений:
a~-yn-mxn-mb=an-u degan-{^n-U
ап-х - уп-т-ххп~т-1Ь = fln-21 deg аЛ_2 < л - 2,
ат — y0x°b = f» deg г ^ т — L
Заметим, что если среди этих соотношений встретится случай
deg a* < i— 1, то в соотношении щ — уг-ш х1~тЬ = аг_1 мы
возьмем Yt-m = 0, так что а{ = аг_ь Наконец, неравенство degr<<
•< т — 1 не исключает того, что г является многочленом 0.
Сложив все написанные равенства, получим
a-(Y„-m*n~m + Y*-m-i*rt~m~1+ ••• +Vo)b=r.
Таким образом, каковы бы ни были многочлены а и й,
найдется такой многочлен q и такой многочлен г, что а = bq + г,
где deg г < deg й (при соглашении, что deg0 = —оо строго
меньше любой степени).
Мы только что доказали, что если deg a ^ deg b, то
многочлен
q = yn-mxn~m+ ••• +Yo
имеет степень п — т\ действительно, Yn-m = an/Pm Ф 0.
Если deg a < deg b, то равенство
а = bq + г9 где deg r < deg 6,
удовлетворяется, если взять q = 0, и значит, г = а.
Это соотношение называется результатом деления по
убывающим степеням.
Единственность. Итак, для любых многочленов а и J из
К[х] найдется по крайней мере одна пара таких многочленов q
и г, что а = bq + r, deg r < deg b. Покажем, что эта пара
единственна. Допустим, что имеет место также равенство a = bq* + r*y
degr*<deg&. В результате вычитания получим b(q* — q) =
= г — г*у и значит, deg b + deg(q* — q) — deg (г — г*). Но
deg (r — г*) < deg 6, и следовательно, deg(#* — q) < 0; един-
* ственная степень, удовлетворяющая предыдущему неравенству,
есть —оо; значит, q* — q = 0, и стало быть, также г — г* = 0.
Таким образом, можно сформулировать следующую теорему.
Теорема. Пусть имеются два многочлена а и b из кольца
К[х\, существуют такие единственные многочлены q и г, что
а = bq +. r, deg r < deg b.
3 Ш. Пизо, М. Заманский
66 КНИГА И. АЛГЕБРА
q называется частным, а г — остатком от деления а на Ъ по
убывающим степеням.
' В частности, если а делится на й, то существует такой
многочлен с, что а = be, но это соотношение есть вышеуказанный
результат деления: а = bq + г, где q = с, а г = 0; действительно,
степень г = 0, будучи равной —оо, меньше степени Ь. А в силу
единственности применение алгоритма деления по убывающим
степеням дает нам q = с и г = 0. Следовательно:
Для того чтобы многочлен а делился на многочлен Ь,
необходимо и достаточно, чтобы остаток от деления а на b по
убывающим степеням был равен нулю.
Практическое вычисление. Расположение операций такое же,
как при делении целых чисел, причем многочлены
записываются в порядке убывания степеней переменного.
Пример.
а = 5л:6 +1
у4х*Ь = 5х6+ 10*5 + 5*4
а5=- 10л;5-5л;4 (+1)
Ъх*Ь = - Юл;5 - 20л;4 - Юл:3
а4=15л:4+10л:3 (+1)
у2л:2& = 15л:4 + 30л:3+15л:2
а3=-20л:3-15л:2 (+1)
yxxb =-- - 20х3 - 40л:2 - 20л:
а2 = 25л;2 + 20л: + 1
УоЬ = 25л:2 + 50л: + 25
а, = г= -30л--24
л:2 + 2л; + 1 =Ъ
5л:4-Юл:3 + 15л;2-20л;+ 25
Y-4*4 + Y3*3 + Y2*2 + Yi* + Yo
В принципе числа (+1), взятые в скобки, должны были бы
быть приписаны, но ясно, что их можно не принимать во
внимание, пока многочлен \гХ{Ь не будет содержать член той же
степени. Здесь имеем а = 5xQ + 1, b = x2 + 2х + 1 и а = bq + г,
где q = 5х4 — 10*3 + 15х2 — 20* + 25, г = — 30* — 24. С другой
стороны, deg # = 4, deg r = 1 и deg r < deg b = 2.
§ 2. Наибольший общий делитель двух многочленов
Идеалы многочленов. Мы покажем теперь, что всякий идеал
многочленов от одного переменного состоит из кратных одного-
единственного многочлена. Такой идеал называется главным.
В самом деле, пусть имеется идеал /, и пусть бе/, b ф 0,
причем степень многочлена b — наименьшая возможная из всех
ГЛ. IV. МНОГОЧЛЕНЫ
67
степеней многочленов из / (Ь не предполагается единственным).
Возьмем произвольный многочлен ag/ и разделим а на Ь\
в результате получим представление а = bq + г, откуда г =
= а-6?; но ае/, fte/, следовательно, bq e / и a — bq =
= л <= /. Но deg r < deg й; единственный же многочлен из /,
степень которого удовлетворяет этому неравенству, есть 0; стало
быть, г = 0 и а ^ bq. Таким образом, всякий многочлен из /
кратен Ь. Если Ь\^1 и deg&i = deg&, то равенство b\ = bqx
влечет deg qx = 0; следовательно, любой многочлен из /,
имеющий ту же степень, что и Ь, имеет вид Kb, К е К, и X ф 0.
Н. о. д. двух многочленов. Пусть а и b — два фиксированных
многочлена. Найдем их общие делители. Многочлены степени 0,
т. е. постоянные, всегда являются общими делителями. Всякий
общий делитель многочленов а и b делит также va + wb для
любых многочленов v u w. Но множество многочленов va + wb,
где а и b фиксированы, a v и w произвольны, образует,
очевидно, идеал; следовательно, этот идеал является главным, т.е.
существует такой многочлен d, определенный с точностью до
постоянного множителя, что любой многочлен va + wb кратен d.
В частности:
Г d = va + wb для некоторых многочленов v и w.
2° Имеют место равенства а = axd и b — b\d, поскольку для
v = 1, w = 0 и для v = 0, w = 1 многочлены 1-а + 0-& и 0*а +
+ 1*6 принадлежит идеалу.
Согласно 1° всякий общий делитель многочленов а и b делит
d, а согласно 2° всякий делитель многочлена d делит а и 6;
стало быть, множество общих делителей многочленов а и b
совпадает с множеством делителей многочлена d\ в частности, сам
многочлен d есть общий делитель наибольшей степенщ d
называется наибольшим общим делителем (н. о. д.) многочленов а и Ь.
Заметим, что 1° и 2° справедливы и в том случае, когда поле
коэффициентов исходных многочленов есть подполе поля /С;
следовательно, н. о. д. двух многочленов является многочленом
над тем же полем коэффициентов, что и многочлены а, 6. Таким
образом, если коэффициенты многочленов а и b рациональны,
то н. о. д. многочленов а и b имеет рациональные коэффициенты,
и то же самое, если рассматривать а и b как многочлены с
коэффициентами в поле R действительных чисел или в поле С
комплексных чисел. Свойства Г и 2° показывают также, что если d
есть н. о. д. многочленов а и Ь, то н. о. д. многочленов ас и be
есть dc для любого многочлена с.
Взаимно простые многочлены. Два многочлена а и b
называются взаимно простыми, если их н. о. д. имеет степень 0 (т. е.
является ненулевой постоянной).
Теорема Евклида. Если а делит произведение Ьсу и
если а и b взаимно просты, то а делит с.
3*
68
КНИГА II. АЛГЕБРА
В самом деле, н. о. д. многочленов а и Ъ есть ненулевая
постоянная X, и значит, н. о. д. многочленов ас и be есть Хс. Но а
делит ас и по условию делит be, а следовательно, делит их
н. о. д., который равен Хс, и стало быть, а делит с.
Неприводимый многочлен. Многочлен р называется простым,
или неприводимым, если он не имеет других делителей, кроме
самого себя и ненулевых постоянных.
Возьмем теперь произвольный многочлен а и н. о. д. d
многочленов аир; так как р неприводим, то d равен или р, или
постоянной; в первом случае а делится на р, а во втором а
взаимно прост с р. Таким образом, любой многочлен либо делится
на р, либо взаимно прост с ним.
Необходимо заметить, что в противоположность тому, что
имеет место для н. о. д. двух многочленов, понятие
неприводимости многочлена существенным образом зависит от поля
коэффициентов К; так, многочлен х2 — 4 не является неприводимым
в поле Q рациональных чисел, поскольку он делится на х — 2
и на х + 2; многочлен х2 — 2 неприводим в Q, но не в R, ибо он
делится на х- V2 и на х+ ]/2; многочлен х2 + 1 неприводим
в R, а значит, и в Q, но не в С, так как он делится на х + i и на
х — L Если многочлен неприводим в некотором поле, то он не-
приводим и в любом его подполе.
Заметим еще, что многочлен степени 1 неприводим для
любого поля /С, поскольку всякий его делитель есть либо
постоянная, либо сам многочлен.
Теорема Евклида дала возможность построить теорию
однозначного разбиения любого многочлена на неприводимые
многочлены; но мы не будем останавливаться на этом алгебраическом
вопросе.
Нахождение н. о. д.: алгоритм Евклида. Пусть a, b — два
многочлена и deg a > deg b; разделим а на b по убывающим
степеням:
a = bq0 + r0, deg r0 < deg й.
Затем разделим Ъ на г0,
Ь=г$х + гь degr^degro.
Разделим снова г0 на Г\\ получим остаток г2, степень
которого меньше степени гь Затем разделим Г\ на /*2 и т.д.; степени
последовательных остатков строго убывают; следовательно,
наступит момент, когда некоторый остаток rn_i будет делиться на
остаток гп, и стало быть, получим
rn-2 = rn-xqn-rn, degrn<degrn_If rn^=rnqn+l.
Всякий общий, делитель многочленов а и b делит г0, и
значит, в силу второго соотношения он делит Г\ и т. д. и, наконец,
ГЛ. IV. МНОГОЧЛЕНЫ
69
делит гп\ обратно, всякий делитель остатка гп делит гп_ь а
значит, гп_2 и т. д., и следовательно, делит Ь и а; таким образом,
гп есть н. о. д. многочлен а и Ь.
Этот метод нахождения н. о. д. носит название алгоритма
Евклида, где слово «алгоритм» означает процесс вычисления.
Теорема и тождество Безу. Пусть а и Ъ — два многочлена
из К [х], и пусть d — их н. о. д. Найдутся такие два многочлена
v и w из К [х], что va + wb = d\ при этом
deg v < deg b — deg d\ deg w < deg a — deg d.
Эти многочлены v и w единственны.
Частный случай. Если а и b — два взаимно простых
многочлена из К [х], то существуют единственные многочлены v
и w из К[х], обладающие тем свойством, что va + wb = 1,
причем deg v < deg b, deg w < deg a.
Общий случай. Последовательность равенств алгоритма
Евклида может быть записана в виде
r0 = v0a + wQb, где v0 = 1, w0 = - q0,
и следовательно, deg v0 = 0, deg wQ = deg a — deg b.
Принимая во внимание это соотношение, можем на
основании равенства b = r0q{ + r{ записать
г1 = о1а+ш16, где v{ = - qu wl=^q0qx + q0ql + l.
Имеем
degi^-degft-degro,
deg хя>\ = deg a — deg b + deg b — deg r0 = deg a — deg r0.
Теперь допустим, что для каждого индекса h < k получено
равенство rh = vha + до^б, в котором deg vh = deg b — deg гл_ь
degt^fc = deg a — deg гл_ь Тогда соотношение /v_2 = ^-i?fe + rh
дает нам rfe = i>ft_2a + «Jft-2& — (f/t-ia + wh-\b)qk, а значит, rfe =
= i>fea + wkb, где uft = —qkVk-\ + vk-2, wk = —qkwk-i + wh-2.
Имеем deg(^yft_i) = deg rft_2 — deg rfe_! + deg b — deg rft_2 =
= deg & — deg r^; следовательно, deg(qhvk-i) > deg uft_2 =
= deg b — deg rk_z, и мы получаем deg vk = deg b — deg rfe_i.
Точно так же доказывается, что degt^fe = dega — degrfe_b
Таким образом, полученные формулы справедливы при
любом k. Для практических вычислений полезно заметить, что они
остаются верными, если положить a_i = О, W-\ = 1, a_2 = 1,
W-2 = 0. В частности, они будут верны для н. о. д. d = гп, и
значит, найдутся такие два многочлена v — vn и w = wn, что d =
= va + wb, где к тому же deg v = deg b — deg rn_i < deg Ь —
— deg d, deg до = deg a — deg rn-\ < deg a — deg d.
Единственность. Мы уже знаем, что d выражается в виде
* va + wb. Покажем, что условие, наложенное на степени много-
70
КНИГА II. АЛГЕБРА
членов v и w, влечет единственность этих многочленов.
Действительно, предположим, что выполняется также равенство d =
= v*a + w*b, в котором deg v* < deg b — deg d, deg w* <
<dega — degd. Вычитая, получаем (v — v*)a = (w* — w)b.
Разделим а и b на d\ пусть a = dau b = db\\ тогда ai и b\
взаимно просты и deg a\ = deg a — deg d, deg 6i = deg b — deg d.
Разделив на d, придем к равенству (v — v*)a\ = (w*— w)b\, из
которого следует, что а\ делит (w* — w)b\\ но а\ взаимно
просто с Ь\, и значит, по теореме Евклида а\ делит w* — w.
Следовательно, w* — w = а^ь Имеем далее deg(to* — w) < deg a —
— degd; с другой стороны, deg(a^i) = degai + deg^i =
= deg a — deg b + deg qx. Таким образом* deg q\ < 0, т. е. <7i = 0;
следовательно, w* — w = 0 и у — и* = 0.
To же самое доказательство позволяет убедиться в том, что
если d представлен в виде d = v*a + w*b без ограничений на
степени v* и w*9 то многочлены у*, ю* выражаются через у, ку
по формулам
v* = у + c&i, ш* = до — саь
где с — произвольный многочлен.
Пример. Пусть а = х5 + хА + хг + х2 + х + 1, й = хА — 1.
Последовательным делением получаем
<70 = * + 1, г0 = л:3 + х2 + 2х + 2,
(?2 = ~ X — 1, Г2 = ЗХ + 3,
<7з= -yfr- 0, ^з = 0.
Следовательно, н. о. д. d есть многочлен г2, или еще, с
точностью до числового множителя, d = х + 1. Для нахождения
многочленов v и до тождества Безу воспользуемся
рекуррентными формулами vk = —qkVk-\ + vk-2, u>k = —qkWk-\ + wk-2,
начиная с k = —2; имеем
k
-2
-1
0
1
2
-<7*
-(*+D
-(x-l)
x+l
Vk
1
0
1
-(x-l)
-x2 + 2
X3
wk
0-
1
-(x+l)
X2
+ X2 - X - 1
Таким образом, d = 3(x + 1) = (—x2 + 2) a + (#3 + *2 —
—x—1)6 и 2- deg (— *2 + 2) <deg6 —degd = 4—1 =3,
3 = deg(*3 + *2 — a;— 1) < dega— degd = 5— 1 =4.
ГЛ. IV. МНОГОЧЛЕНЫ
71
III. ДЕЛЕНИЕ ПО ВОЗРАСТАЮЩИМ СТЕПЕНЯМ
Пусть а = осо + а\Х +'...+ апхп Ф О есть многочлен над
кольцом А\ предположим, что А > 0 есть наименьший индекс,
при котором an Ф 0 (следовательно, аи = 0, если k < К); этот
индекс обозначается через v (а) = ft. Для любого многочлена,
=£0, следующие свойства очевидны:
1° и(а)>0
2° а(а-6) = а(а) + у(й)
3° i>(a + fc)>min(a(a), v (6)); a(a + 6)>min(a(a), о (6))
возможно в том случае, когда у (а) = v(b).
v(0) не определено.
Эти три свойства напоминают свойства абсолютного
значения; в самом деле, пусть 0 < до < 1 — произвольное
действительное число; рассмотрим функцию ф(а) = wvW\ получим:
1° ф(а)>0, если афО.
2° ф(а.й) = ф(фф(6).
3° ф (а + Ь) < max (ф (а), ф (Ь)) < ф (а) + ф (6).
Если к тому же принять, что ф(0) = 0, т.е. (ср. Книга III,
гл. II) v(0) — +оо, то ф(а) и будет абсолютным значением во
множестве многочленов А [х]. Условимся считать v(0) = +oo,
причем этот символ удовлетворяет соотношениям +сх> + п =
= +оои +оо>п при любом целом п.
Имеем v (хп) = п для м = 0, 1,...
Пусть многочлен а таков, что v (а) = Л, т. е. а = а^ +
+ ал+1*л+1 + ... + апхп с анФО. Можно написать а = xh*b, где
Ь = а^ + аь+1* + ... + <xnxn~'h и а(й) = 0. Следовательно, если
у (а) = h Ф 0, то можно всегда разделить а на многочлен xh9 и
частное будет многочленом с v (а) = 0.
Отныне в этом разделе мы будем предполагать, что кольцо А
есть поле /С, где К есть С, R или Q.
Деление по возрастающим степеням. Будем снова
исследовать, делится ли многочлен а на многочлен Ь. Должно
выполняться равенство а = bq, и значит, v (a) = v(b) + v(q) > v(b).
Если v(b) = ft =£ 0, то b = xhb*, где v(b*) = 0. Но так как
v(a)^v(b) = ft, то будет выполняться также а = xh- а*, и
следовательно, поскольку а = bq, то а* = b*q. Таким образом,
многочлен q может быть получен при делении а* на многочлен 6*
с v (Ь*) = 0. Значит, при изучении деления а на b можно
ограничиться многочленами b с v(b) = 0.
Если многочлен а делится на Ь, то он принадлежит идеалу /
многочленов, кратных Ь. Будем пытаться выделить из а
многочлены, кратные Ь, методом получения многочленов из / со все
большей величиной v, чтобы получить, наконец, v = Н-оо, т. е,
многочлен 0.
72
КНИГА И. АЛГЕБРА
Для того чтобы явно выделить v (а) и v(b), запишем
многочлены в порядке возрастания индексов: а = а0 + а{х + ... + апхп,
&=Po + Pi* + ••• +Рт-Л где Ро=^0, так что и(й) = 0.
После этого рассмотрим многочлен rl = a — y0b, где Yo^ao/Po-
Число yo существует, так как коэффициенты многочленов
принадлежат полю /С, а р0 Ф 0. При этом может оказаться, что
Yo = 0; для этого необходимо и достаточно, чтобы ао = 0.
Если ag/, то Ti e/. Свободный член многочлена /ч равен
ао — уоро = 0. Следовательно, v(ri)^? 1. Повторяя эту операцию
с многочленом ги получаем постепенно последовательность
соотношений
ri-ViXb = r2, y(r2)>2,
rk- Ук^Ь = rk+u v(rk+l)> й + 1.
Действительно, предположим, что получено г{ с v(r{) > i\
тогда Ti = ргхг' + рг-нхг+1 + ..., причем рг может равняться нулю,
еСЛИ V(r{) > I. ЕСЛИ ПОЛОЖИТЬ Yt = Рг/Ро, ТО КОЭффиЦИеНТ При Х{
в г г — yiX*b будет равен рг — уф{ = 0; следовательно, у(гж) ^
<^,/-hl. Складывая все записанные равенства, получаем
a-(Yo + Yi*+ •.. +УкХк)Ь-гш.
Таким образом, для любых двух многочленов а и b с и(й) ==0
и любого индекса k *> 0 найдется такой многочлен qu степени не
больше k и такой многочлен rft+i, что
a = bqk + r*+1 и v(г*+1)> £ + 1 > deg^
(имеет,силу соглашение, по которому v(0) = +oo больше
любого целого числа). Написанное равенство называется
результатом деления по возрастающим степеням.
Единственность. Мы только что установили для любых
многочленов а и b из К[х] с v(b) = 0 и любого целого k^0
существование хотя бы одной пары таких многочленов qk и
rk+u что a*=bqk + rk+x и vta+i)>/z+ 1 >deg^. Покажем, что
для заданного k эта пара единственна. Допустим, что
выполняется также равенство яяв6<7^+.г^+1, v(r*k+\)^k + I >degq*k.
Вычтя два последних равенства одно из другого, получим
ь {Я\ - 4k) e r*+i - г*+р а следовательно, и (b) + v {q\ - qk) =
*= о(гл+1 — r*+i)- Ho v(b)^0t и значит, v(ql~qk)>k+l.
Однако deg (q*k — qk") ^ ky и стало быть, все коэффициенты
многочлена q\ — qk равны нулю и ^—^ = 0, а значит, также и
rk+l — r*k+x = 0. Таким образом, можно сформулировать
следующую теорему.
ГЛ. IV. МНОГОЧЛЕНЫ
73
Теорема. Пусть имеются два многочлена а и b из кольца
К [х], причем v(b) для многочлена Ь равно нулю. Для любого
целого k существуют единственные многочлены q^ и rfe+1 такие,
что a = bqk + rk+l и v (rfe+1)>& + 1 > degqk.
Многочлен qk называется частным, a rk+i — остатком от
деления а на b по возрастающим степеням. В частности, если а
делится на Ь, то найдется такой многочлен с, что а = be и
deg с = deg a— degfe; это равенство есть результат деления
для любого k, удовлетворяющего неравенству k^dega — deg 6
с qh = с и rft+1 = 0. Действительно, v(rk+l) =v(0) = + оо >
> k + 1 > deg qk — deg a — deg b. А поскольку имеет место
единственность, то применение алгоритма деления по
возрастающим степеням дает ft = cn rk+x = 0. Следовательно:
Для того чтобы многочлен а делился на многочлен b с v(b) =
= 0, необходимо и достаточно, чтобы хотя бы для одного
целого k > deg a — deg b остаток rfe+1 от деления а на b no
возрастающим степеням равнялся нулю.
Если а не делится на Ь, то операция может продолжаться
до какого угодно значения k\ именно в этом заключено
существенное различие с делением по убывающим степеням, которое
всегда заканчивается.
Практическое вычисление. Рперации располагаются, как
и при делении целых чисел, причем многочлены записываются
по возрастающим степеням переменного.
Пример.
а-1
yQb=l+2x + x2
г ^ = — 2х — х2
ytxb — — 2х — 4х2 — 2хъ
г2 = 3х2 + 2х3
у2х2Ь = Ъх2 4 6х3 + Зх4
Гз= _4x3-3x4
Y3jc36= -4х3-8л:4-4л:5
(+5х6)
(+ Ъх6)
(+5х«)
(+ 5л:б)
г4 = 5х4 + 4х5 + 5х6
yix*b = 5x4+10x5 + 5x6
гь = — 6л:5
1+ 2х + х2 =Ь
1 - 2х + Зх2 - 4*3 + 5л;4
Yo + Yi* + Y2*2 + Y3*3 + Y**4
74
КНИГА II. АЛГЕБРА
Таким образом, здесь а = 1 + 5*6, Ъ = 1 + 2х +~ х2 и а =
= й^4 + ^5, где ^4 = 1 — 2х + Зх2 — 4л:3 + 5л:4, г5 = — 6х5. С
другой стороны, deg#4 = 4 и v(r5) = 5 = (deg^4) + 1. Заметим, что
это деление приводит к результату, совершенно отличному от
результата деления тех же многочленов с и J по убывающим
степеням (разд. II, § 1).
IV. ДИФФЕРЕНЦИРОВАНИЕ МНОГОЧЛЕНОВ,
ФОРМУЛА ТЕЙЛОРА
§ 1. Дифференцирование
В этом параграфе мы введем дифференцирование
многочленов способом чисто алгебраическим, не прибегая к понятию
предела. Рассматривается кольцо А [х] многочленов от одного
переменного над кольцом целостности А.
Определение производного многочлена. Пусть имеется
многочлен а = осо + а\Х + ... + апхп. Положим, по определению,
а' = а{ + 2а2х+ ... + папхп~1 = а'0 + а[х + ... + а/п_1хп-\
a'. = (i+l)ai+l для / = 0, 1, ..., п— 1.
Многочлен а! называется производным многочленом от а.
Если а = О или если а = ао имеет степень 0, то а' = 0. В
остальных случаях dega' = (dega)— 1.
Свойства дифференцирования. Если а е А[х], Ъ е А[х],
Х^А, то {%a)f = Xaf и (а + Ь)' = а? + Ь'. В случае, когда А
есть тело /С, отображение, которое каждому а е К[х] ставит в
соответствие а' е Щх], есть линейное отображение векторного
пространства К[х] в себя (гл. VII, разд. III).
Вернемся к общему случаю, когда А есть кольцо
целостности. Благодаря двум записанным выше свойствам достаточно
знать производные многочлены от хп. Имеем (хп)' = пхп~х для
п>\ и (*°)' = (1)'~0.
Производная произведения. Рассмотрим сначала
произведение х{ • хК Имеем для i + / > 1
(*' • х*У = (х1+1у = (i + /) х'+^К
Таким образом, если />1, />1, то можно написать (**•**)' =
= ix*-1 • я* + /^-1. ** = (**) '*' + (хЗ) 'х\ Если же i - 0, то
(а:0 • **)' = /хЫ = (jc°) V + (jtf) 'я0. Если, наконец, i = / = 0, то
(дО.дО)' = (1)' = о = (x0)'x° + (х0)'*0- Стало быть, формула
(**•**)' = (**)'•#+ (#')'• *'" справедлива для любых />0, />Q,
ГЛ. IV. МНОГОЧЛЕНЫ
75
Пусть теперь а = а0 + ахх + ... + апхп> Ь = р0 + Pi# + ... + $тх"
п / т \
Имеем а • 6 = 2 (2 а*Р/(*' • *') , и следовательно,
*=о \/-о /
п / т у
(а ■ Ь)' = 2 2 «tf, [(**)' • *' + (*')' ■ х1]
*=о \/-o
2(М'
[So, (а:')']) + |0(«^[|0 Р/ (*')'])>
т. е. (а*Ь)' = а'6 + й'а. Эта формула справедлива и в том
случае, когда b имеет степень 0, ибо если 6 = р0е Л, то Ь' = 0 и
(Роя)'= Роя' + 0-а = р0я', т. е. пришли к тому, что уже было
сформулировано выше.
Применим эту формулу для вычисления (ak)'. Индукцией
по k покажем, что {акУ = kak~la'. Если принять, а0 = ТГто для
k = 1 формула справедлива. Допустим, что она верна для
некоторого k>\\ тогда (ak+1)' = {ah-a)f = (kak~-xa')a + ak*a' =
= (& + \)aka'\ значит, она верна для k + 1, а следовательно, и
для любого целого &> 1.
Заметим, что формулу дифференцирования для #n можно
вновь получить, рассматривая хп как n-ю степень
многочлена х.
Повторное дифференцирование. Мы будем полагать
а"=(а')'\ а" будет называться вторым производным
многочленом от а; вообще положим а<л) = (аС1-1))' и назовем Ф\ h-м
производным многочленом от а, или производным многочленом
порядка ft, для любого целого А]>1. Иногда принимают а$) = а
(производный многочлен порядка 0).
Пусть имеется многочлен а = осо + а\Х + ... + апхп
степени п. Тогда aW есть многочлен степени п — ft, и в частности,
а№) = 0 для всех ft > п. Положим а№ = ад? о + ад, \Х + ...
... + ад, п_лхп-\ Тогда коэффициенты ад, * при х* задаются
формулой ад,* = (j + ft)(j + ft— l)...(t + 1)а*+л для t'=0, 1, ...
..., п — ft. В частности, свободный член равен ад, 0 = ft (я — 1) •...
... • 1 • ад = /*!ад.
§ 2. Формула Тейлора
Полиномиальная функция. Пусть а = cto + а\Х + ... + ап*п
есть многочлен над кольцом А. Если | есть некоторый элемент
из Л, то %{ определяется как произведение i множителей,
равных £, а значит, ^еЛ, и элемент а(£) = ао + ai| + ... +an£n
принадлежит кольцу Л. Тогда многочлен а определяет
отображение А в А, которое каждому £^Л ставит в соответствие
76 КНИГА II. АЛГЕБРА
д(^)еЛ. Это отображение называется полиномиальной
функцией а или иногда, если это не ведет к недоразумениям, просто
многочленом а.
Операции. Пусть а = а0 + оы* + ... + апхп, Ъ = р0 +
+ Pi* + ... + pm*m, — два произвольных многочлена из Л[д:]; и
пусть К — какой угодно элемент из Л. Тогда для любого £<=Л
(Ха) {%) = Аа0 + Ао^ + ... + Ып%п = Я • а (g),
(« + й)(|) = (а0 + р0) + (а1 + р1)| + (а2 + р2)|2+ ... =а(|) + *(6),
^(D^aoPb+taoPi+a^H- ...
... +(a0Pi + a1pl_I+ ... +а,р0)^+ ... +anpm^+^ =
-(^^(Дрд^^^^ш;
впрочем, это есть иллюстрация закона умножения многочленов.
Эти законы композиции являются законами, которые мы
определили ранее для функций (гл. III, разд. III, § 1).
Формула Тейлора. На протяжении этого параграфа мы
будем предполагать, что кольцо А является полем К, где К есть
поле С, R или Q.
Пусть а = а0 + агх + ... + апхп есть многочлен из К [х]
степени п, и значит, ап Ф 0. Мы получили формулу
a{h)s=aht0 + ahtix+ ... + ahfn-hxn-h,
где ал, £==(/+ 1)(/ + 2) ...(/ + h) al+h для /=*0, 1, ..., п-h и
h\
мы можем записать многочлен а в виде
п
ahf0 = h\ah. Стало быть, аЛ = -~—. Но аА, 0 = а(/г) (0), и значит,
а(0) + ^+...+^,--2^'
при соглашениях а<°> =1 и 0! = 1.
Зга формула носит название формулы Маклорена. Она
позволяет воспроизвести многочлен по значениям а^(0)
последовательных производных а№ для числа 0 из /С.
Теперь мы аналогичным образом получим формулу, в
которой вместо 0 берется произвольное значение А&/(. Итак,
пусть X есть некоторое фиксированное число из К. Положим
р% = х — Я. Таким образом, рх будет многочленом степени 1,
а Л.(Я) = 0. Разделим а на /?х по убывающим степеням; тогда
частное ап-\ будет иметь степень п— 1, а остаток — степень <10;
следовательно, остаток есть постоянная, которая может
равняться нулю. Мы запишем: а = р\ап-\ + ро> где Ро^/С Про-
ГЛ. IV. МНОГОЧЛЕНЫ
77
делав то же самое с ап-\ и продолжив далее, получим
последовательность равенств
ап = ркап-{ + Ро, Ро е= /С, deg (ап-х) = п - 1,
ап-, = /ъая-2 + Pi, Pi s #> deg (fl/1-2) = /г - 2,
«1 = Рх«о + Рп-ь Pn-i^tf, dega0 = 0,
do = P/i» Pn &' #•
Умножая соотношения at = Pxa«—1 ~*"Pn-f на $Г* для '~
= 0, 1, ..., n—1, а затем складывая, получаем
я = Ро + РЛ + Р2Р1+ ••• + РЛ- (0
Но дифференцирование рк = х — Х дает р^=1, и значит,
/pH-iy=:(/+ 1)р[, откуда Л-кратным дифференцированием
находим (р!+л)(Л)—С4-А)(/ + Л — 1)...(/+1)р{ для / = 0, 1, ... при
соглашении, что р°к=1. Заметив еще, что (р[)(Л) = 0, если /<А,
получаем aW = Aipfc + ... +(/+ 1)(/ + 2) ... {i +h)$i+hp{+ ...
... + (я — А-}- 1) ... п$пр1~к. А так как ря(Я) = 0, то отсюда
выводим а^(Я) = Л!рл, а следовательно, рл = —£| •
Итак, получили следующую формулу, называемую
формулой Тейлора:
при соглашении, что (х — Я)°= 1. Эта формула показывает, что
выражение (1) для а единственно при фиксированном К, ибо
можно единственным образом восстановить многочлен а по
значениям а^ЦХ) последовательных производных многочлена а
для числа % из /С.
§ 3. Формула бинома и биномиальные коэффициенты
Формула бинома. Рассмотрим многочлен а = (1 + x)n = p1v
Он имеет степень л, и, согласно предыдущему, a^h) = [pn^h) =
= п{п- 1) ... (n-h + 1)р!17л. А так как p_i(0) = 1,то а<л>(0) =
= я (я — 1 )...(я — Л + 1). Тогда, по формуле Маклорена,
п
jU h\
л=о
/1 , ¥\п _ V п(п-1) ...(n-h+\)
{i-г X) — /j г: л:
78
КНИГА II. АЛГЕБРА
Положим
rh — п(п—1) ... (n-h+l)
это число называют коэффициентом бинома. Его записывают
также в виде С% = ( ? )•
Формула
(\+х)п = С°п + С1пх+ ... +Сппхп= ЪснпхН
называется формулой бинома.
Свойства биномиальных коэффициентов. Перемножив между
собой п множителей, равных 1 + х, видим, что коэффициенты
бинома являются целыми положительными числами. Имеем
,о0 1 г>\ т-т r>h Я (я — 1) ... (я — А + 1)
Сп=1 и Сп = п. Помножив в.Сд=~ '—^ '-
числитель и знаменатель на (п — А)!, получим
°л~ А! (я-A)! #
h
Эта формула позволяет записывать Сп при помощи одних
факториалов. Кроме того, она делает очевидной симметрию:
C^Cnn"h. Исходя из равенства (I + х)п = (1 + х)п~1 (I + х), т. е.
из равенства
1+С1пХ+ ... +Chnxh + ... +хп-
= (1 + ... + ChnZ\xh-1 + Chn^xh + ... + xn~l) (1 + х),
получаем, приравняв коэффициенты при хн,
сЬ = С%1\ + С%-1 для 1<й<я-1
и
СО /~*0 ____ -t on _^ г>п—\ 1
п — ^я—I — А» ^л — <-»я— 1 — 1-
После этого, записав коэффициенты бинома в виде
треугольной таблицы и условившись, что Со™ 1, получим
1
1 1
1 С\ 1
i ... Ся-1 Сп-1 ... 1
1 С\ 1
ГЛ. IV. МНОГОЧЛЕНЫ
79
Каждый член является суммой двух целых чисел,
расположенных над ним слева и справа. Эта таблица называется
треугольником Паскаля. Она позволяет быстро находить
коэффициенты Сп для п не слишком больших. Что же касается
достаточно больших значений п, то здесь лучше будет формула
rh _ п(п- 1) ... (n-h+ 1)
Cn~ h\ •
принадлежащая Ньютону. Не следует забывать, что , Сп —
целое число, и выписанную дробь можно сократить на множители
знаменателя. Взяв многочлен а=(\+х)п для значения 1,
получим а(1) = 2п, откуда будет следовать формула бинома
2Ч = С°п + Схп + ... + С«. А так как С* > О при любом А, то
Снп<2п для я>1.
V. НУЛИ МНОГОЧЛЕНОВ
В этом разделе мы будем предполагать, что кольцо А
является полем /С, где К есть поле С, R или Q, и будем
рассматривать многочлены из К[х].
Определение. Число р = К называют нулем многочлена а,
если а(р)=0. Говорят еще, что р есть корень уравнения а(£)=0,
но мы в этом разделе будем избегать употребления термина
корень.
Теорема 1. Для того чтобы р было нулем многочлена а,
необходимо и достаточно, чтобы многочлен а делился на
многочлен х — р = рр.
Действительно, разделим а на рр по убывающим степеням;
поскольку рр имеет степень 1, то остаток имеет степень ^0,
а значит, является постоянной а, которая может равняться
нулю, и мы имеем а = pQa\ + а. Возьмем а(р). Так как
Рр(р) = 0> то я(р)ва. Следовательно, если р есть нуль
многочлена а, то а (р) = 0; стало быть, а « 0, и а делится на рр.
Обратно, если а делится на рр, то а = 0, а тогда а(р) =
= рр(р)а1(р) = 0.
Кратность нуля. Пусть р есть нуль многочлена а; тогда,
если рр = х — р, то а = р9а\. Может оказаться, что а\ в свою
очередь имеет р в качестве нуля, и тогда ах = рра2, а а = р£а2.
Кратностью нуля р будем называть наибольший целый
показатель А, для которого а = p^ah = (х — p)hahj причем ан уже не
имеет р в качестве нуля, т. е. ^(р) Ф0. Если А = 1, то р
называют простым нулем; если А = 2, то р называют двойным нулем.
Пусть рь ..., pfe — различные нули многочлена а, и пусть
Ар ..., Afe — их кратности. Значит, а = р£» 6 = р^с. Многочлен pPi
имеет степень 1 и потому неприводим для любого поля К}
80 КНИГА II. АЛГЕБРА
а следовательно, взаимно прост с рр2, если р2=^=рг Стало быть, рн*
и р*2г тоже взаимно просты. Но р** делит произведение р^Ь, и,
следовательно, по теореме Евклида, /?£ делит Ь, и мы имеем
b = p^b*9 а значит, a^p^pffl*. Продолжая это рассуждение
последовательно для всех многочленов р* получаем окончательно
а = рЬрЬ ... pJft4 = U-Pi)'"U-P2)h! ... {x-pkPq,
и эта форма записи делает очевидным тот факт, что р* является
нулем многочлена а и что его кратность равна ft*.
Пусть п есть степень многочлена а; последнее выражение
для а показывает, что п = dega = h{ + h2 + ...+, hk + cleg q,
откуда h\ + h2 + ... + hk ^ cleg a = п. Из этого, в частности,
следует, что многочлен степени п не может иметь более чем п
различных нулей. Если их имеется ровно, я, то все они простые.
Этот результат можно выразить еще в такой форме: много-
член степени не выше п, принимающий значение 0 для более
чем п различных значений, всегда является многочленом 0.
Вышеуказанная форма позволяет записать многочлен,
обращающийся в нуль для п различных значений рь ..., рп.
Действительно, он имеет вид а = (я — pi) (я — р2).. .(л: — pn)q,
где q — какой-то многочлен. Если а имеет степень п, то q
должен иметь степень 0; следовательно, q является отличной от
нуля постоянной.
Связь между нулем и производной. Пусть р есть нуль
порядка h > 1 многочлена а; тогда а = (л: — p)hah = pfah,
причем ан(р)ф0. Дифференцируя это равенство, получаем
а « h (х - p)h"lah + (* - p)V* «(* - р)л_16,
где Ь = hah + (х — р)a'h. Имеем 6(р) = Нан(р)ф0. Отсюда следует:
Если р есть нуль порядка h^\ многочлена а, то р есть
нуль порядка h— 1 производного многочлена а'. Применяя этот
результат к последовательным производным многочлена а,
получаем следующее утверждение.
Теорема 2. Для того чтобы р было нулем порядка h> 1
многочлена а, необходимо и достаточно, чтобы р было нулем
многочленов а!, а"\ ..., a<h-{\ но не многочлена а<*>,
Мы только что видели, что если р есть нуль порядка Л, то
я'(р) = я"(р) = - • ■ = а(Л-4)(р) = 0, а<Л>(р) Ф 0. Теперь, обратно,
допустим, что эти соотношения выполняются. Тогда формула
Тейлора дает
.-^е-оГ+.-.+^с.-РЛ
ГЛ. IV. МНОГОЧЛЕНЫ 81
т. е. а = (л:-р)лс, где
a{h) (P)
Следовательно, с(р) = —-г*—=т^=0, и значит, р есть нуль
многочлена а, кратности h.
Заметим, что если а(р) = а'(р) = ... = а^-^р) = 0, то мы
можем лишь утверждать, что р является нулем многочлена а,
кратности не менее А.
Интерполяционный многочлен Лагранжа. Часто приходится
отыскивать многочлен, принимающий заранее заданные
значения для заданных чисел. Более точно, пусть даны п различных
чисел |i, ..., £„ из К и соответствующие значения г|ь ..., цп.
Требуется найти такой многочлен аеЩ чтобы a(i\) =
= т|ь •••» fl(gn) = Tin. Для этого мы введем такие
многочлены аг-, что ciidj) = 0 для / = 1, ..., /г, но / =£ *'. Мы уже видели,
п
что для этого достаточно взять а* = П(л: — |/); очевидно, а\
будет иметь степень п— 1. Имеем
/**
Положим fltdO —Я{. Тогда многочлен ^ = -3*-^ будет
обладать тем свойством, что &f(6j) = 0, если / тМ, а МЫ — Л<-
Стало быть, многочлен
а = &! + 62+ • • • +Ьп
является искомым: bfe) = щ для f = 1, ..., п.
Этот многочлен имеет степень не более п — \ и называется
интерполяционным многочленом Лагранжа.
Пусть а есть другой многочлен, обладающий тем свойством,
что a(li) = r\i для £=1, ...,я. Тогда многочлен с = а — b
удовлетворяет равенству c(li) = 0 для 1=1,..., я.
Следовательно, он делится на многочлен
Р = П(*-Ы
или равняется нулю. Таким образом,
c = pq = (x-ll)...(x~$n)qi
где q есть какой-то многочлен (который может также быть
нулем). Стало быть, а = Ъ + pq. Но поскольку степень
82
КНИГА II. АЛГЕБРА
многочлена р равна п, то отсюда следует, что единственный
многочлен степени <Сп—1, принимающий заданные значения
Ль г|2, ..., 1)п б /I заданных точках |ь ..., |п, есть
интерполяционный многочлен Лагранжа.
VI. МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ
Многочлены от двух переменных над унитарным кольцом
целостности Л. Рассмотрим двойную последовательность
элементов из А, т. е. отображение N X N в А, или еще:
последовательность элементов ац из Л с двумя индексами,
обладающую тем свойством, что все а%^ начиная с некоторых
значений i и /, равны нулю (лишь конечное число ац отлично от
нуля).
Будем говорить, что а = (ао,о, ..., осп,?п, 0, 0, ...) есть
многочлен от двух переменных над А. Наибольший из первых
индексов i, для которых <xi} j Ф 0, называется степенью многочлена
по первому переменному, а наибольший из вторых индексов j,
для которых ai, j Ф О, называется степенью по второму
переменному; и, наконец, наибольшее из значений i + j, для которых
a*, j ф О, называется степенью по совокупности двух
переменных; обычно, если нет дополнительных уточнений, имеется в виду
именно эта степень.
Числа aifj называются коэффициентами многочлена.
Векторное пространство. Пусть а есть многочлен с
коэффициентами a.i,j, b — другой многочлен с коэффициентами Pi, j.
Положим а + b = с, где с имеет коэффициенты y*, j = ос;, i + Рг, j.
Далее, для ^еЛ положим Ха = с, где с имеет коэффициенты
yt, j = ЯоСг, j. Многочлен 0 есть тот многочлен, все коэффициенты
которого равны нулю; он не имеет степени.
Если А есть тело К, то предыдущие свойства определяют
векторное пространство. Это векторное пространство имеет
в качестве базиса многочлены и^, все коэффициенты которых
нули, кроме коэффициента с индексами i, /, равного 1. Эти
многочлены существуют также и тогда, когда А не является
телом, поскольку А, будучи унитарным кольцом, содержит
элемент 1. Любой многочлен а записывается в виде
и это представление единственно.
Общепринятое обозначение. Вместо щ, j пишут символ x{xf2,
причем это выражение имеет своим назначением лишь
уточнение индексов i и /. Полагаем *?*£ = лф x[xl*= х\ и х\х^ 1.
Таким образом, можем написать
# = 2 ai, ixlxr
ГЛ. IV. МНОГОЧЛЕНЫ
83
Тогда множество многочленов от двух переменных над А
записывается в виде A[x\,X2]\ X\ и х2 называются переменными.
Умножение. Пусть а = 2 «*, /*i*2 и Ъ = 2 Р*. /*i*2 — два
многочлена из ^[лгьЛГг]. Произведение а*Ь есть многочлен,
полученный в результате почленного умножения; именно:
«*, /*М ' Pp. **f*f = <**. А. ,*{+'*J+*.
т. е. точно так же, как если бы речь шла о произведении чисел.
Это записывается
й • Ь = 2 / 2 «л, *Рр, <А xlxi.
U+p-f I
Ясно, что эта операция дистрибутивна относительно
сложения и коммутативна. Без труда убеждаемся также в ее
ассоциативности.
Многочлен х{ может быть отождествлен с первым
переменным, а многочлен х2— со вторым переменным в том смысле,
что многочлен, представленный символом х\х^, является
произведением 1-й степени многочлена Х\ на /-ю степень
многочлена х2 в смысле только что определенного умножения.
Таким образом, множество многочленов составляет кольцо-,
оно унитарно, причем нейтральным элементом умножения
служит многочлен и0о — 1. Это есть кольцо целостности, и всякий
многочлен аФО регулярен относительно умножения.
Заметим, что если А есть тело К, то идеалы не будут
непременно главными в кольце К[х\,х2]\ в этом состоит
существенное различие с кольцом многочленов от одного
переменного.
Соотношения между А[хи х2] и А[х{\ или А[х2]. Возьмем все
коэффициенты atj, где i фиксировано, а / меняется. Можно
рассматривать эту последовательность как многочлен от
одного переменного, скажем, х2\ тогда
flrKc 4V •••> Чт> °> •••)ва*.0+ ai,l*2+ ••• +«,fm*2l-
Теперь возьмем кольцо А2 = А[х2]\ это кольцо целостности
многочленов аг-; образуем кольцо многочленов от одного
переменного, обозначаемого. хи с коэффициентами из Л[лг2], т. е.
многочленов вида а0 + а{хх+ ... + anxf; легко видеть, что эти
многочлены изоморфны многочленам А[х\, х2]. Следовательно,
отождествляя, получаем А[хи х2] = А2[х{\. Точно так же получим
А[х\, х2] = А\[х2], где Л1 = A[a:i] есть кольцо целостности
многочленов от одного переменного Х\.
Сказанное выше легко обобщается на любое, но только
конечное число переменных. Таким образом, А[х\, ..., хп] есть
84
КНИГА II. АЛГЕБРА
кольцо многочленов от п переменных, и A[xiy ..., хп] =
= А\[х2, ..., хп], где ^i=^[xi]. Элемент из А[хи ..-, хп]
записывается как 2<*f £ ^J1» •••> *„rt> где ^i1» *••> *«* есть сим"
вол, эквивалентный и,
ГЛАВА V
КОМПЛЕКСНЫЕ ЧИСЛА
I. Алгебраическое расширение
Многочлены, о которых будет идти речь в этом параграфе,
это многочлены от одного переменного над телом К. Мы
видели, что понятие неприводимого многочлена зависит от тела
К коэффициентов. Пусть р есть многочлен степени i>2 с
коэффициентами из /С, неприводимый в К[х]. Мы построим надтело
тела /С, в котором р будет иметь нуль, а значит, уже не будет
неприводимым. Ясно, что степень многочлена р должна быть не
менее 2, так как любой многочлен первой степени из К[х]
имеет нуль в К.
Отношение эквивалентности. Пусть р есть многочлен
степени ^ 2, неприводимый в К[х], а Р — идеал, образованный
многочленами, кратными р. Пусть а^ и а2— два многочлена из
К [х]. Будем говорить, что а\ ~ а2, если ау — а2 является нулем
или делится на р, т, е. если а\ — я2 е Р-
Итак, если а — многочлен из К ЭД, то все эквивалентные
многочлены имеют вид а + ри где pi е Р, т. е. где pi = 0 или
Pi делится на р.
Это отношение есть отношение эквивалентности;
действительно:
1° а4 ~ аи ибо ai — а^ = 0.
2° ai ~ ЯгФ^яг ~ о>и ибо если а4 — а2 = р\, то а2 — а4 =
= -Pi es P.
3° ai ~ a2 и a2 ~ a3 =# ai ~ a3, ибо если a4 — a2 = /?! и
a2 — а.ч = p2t то «l - a3 = pi + p2 e A
Пусть теперь a = cl(a, ...), p = с1(й, ...). Множество К* этих
классов является факторпространством пространства К[х] по
введенному отношению эквивалентности.
Определим два внутренних закона посредством формул
а + р = cl (а + Ь, ...); а • р = cl (а • 6, .. .)•
Эти определения зависят только от классов а и р, но не от
выбираемых представителей. Действительно, любой элемент из
ГЛ. V. КОМПЛЕКСНЫЕ ЧИСЛА
85
а имеет вид а + ри рх е Р, а любой элемент из р имеет вид
Ъ + рг, pi <= Р. Тогда
(a + p{) + (b + p2) = (a + b) + (Pl + p2) и рх + р2^Р.
{а + рх) (Ь + р2) = ab + (рф + р2а + рхр2) и рф + р2а + рхр2 = Р.
Мы покажем, что множество К*, наделенное указанными
законами, есть тело, для которого К является подтелом.
Очевидно, введенные законы ассоциативны, коммутативны и
умножение дистрибутивно относительно сложения.
Идеал Р тоже составляет класс, и это будет нейтральный
класс сложения, обозначаемый через 0. Всякий класс а имеет
противоположный класс (—а) =с1(—а, ...). Класс 1—с1(л;0 =
= 1, ...) является нейтральным классом умножения.
Таким образом, фактормножество множества К[х] по
отношению эквивалентности «а^ ~ а2£ф сц — ^2 кратно многочлену
р» есть унитарное кольцо.
Будем искать делители нуля. Если оф = 0, то ab e Р. Тогда,
если а Ф 0, то аф Р, и значит, а взаимно просто с р\ но р
делит ab, и стало быть, делит Ъ, т. е. b <= Р, или р = 0.
Следовательно, делители нуля не существуют, рассматриваемое кольцо
есть кольцо целостности.
Всякий элемент афО регулярен относительно умножения,
ибо если ар = av, то а(р — у) = 0, и значит, р — у = 0.
Покажем, что это кольцо является телом. Достаточно
установить, что любому элементу а можно поставить в соответствие
р= 1/сс так, чтобы ар = 1. Но если афО, то ясно, что афР,
и значит, а взаимно просто с р. Стало быть, по тождеству Безу
(гл. IV, разд. II, § 2) найдутся такие два многочлена b и v из
К[х], что ab + pv = 1, так как 1 есть н. о. д. аир. Пусть
Р = с1(й, ...); тогда ар = 1.
Любой класс эквивалентности может быть определен
посредством многочлена, и притом только одного, со степенью,
строго меньшей степени многочлена р.
Действительно, если а — многочлен из класса а, то,
разделив а на р, получим в остатке многочлен, степень которого
меньше степени многочлена р, и который принадлежит классу а.
С другой стороны, этот многочлен будет единственным, ибо
если аА е а и а2 е а, то разность а^ — а2 е Р, т. е. либо равна
нулю, либо делится на р, а значит, имеет степень, больше или
равную степени многочлена р. Следовательно, если многочлен
р имеет степень k, то любой класс а может быть представлен
единственным способом в виде системы k чисел из /С, а именно
k коэффициентов (некоторые из них могут равняться нулю)
многочлена степени ^k— 1 из класса а.
Тело К* есть надтело тела К. В самом деле, рассмотрим
классы из /С*, представитель которых есть многочлен нулевой степени,
86
КНИГА И. АЛГЕБРА
допустим а = (а0, О, О, ...), Ь = (р0, О, О, ...). Имеем а + b =
= (ао + Ро, О, О, ...) и ab = (ао, Ро, О, О, ...). Следовательно,
существует изоморфизм относительно сложения и умножения
между многочленами степени 0, а значит и их классами в /С*,
и между элементами из К[х], состоящими из единственного
коэффициента— свободного члена. Отождествим эти элементы;
среди них имеются класс 0 и класс 1. Множество этих
элементов является подтелом тела /(*, изоморфным /С.
В К*[х] многочлен р имеет нуль. Рассмотрим кольцо
многочленов К*[х] над телом /С. Предположим, что
р = щ + щх + ... + (okxkf где шА е К для h = О, . .., k.
Поскольку К является подтелом тела /С*, то можно считать сол
элементами из /С*, а р — многочленом из К* [х]. Пусть р =
= cl(x, ...)*); тогда р е/С*. Имеем ph = c\(xh, .. .)= с1(ил,...)
И 1 = с1(*°, . . .). ПОЭТОМУ С1((0о + 0)1* + . . . + (dkXk) =(Оо +
+ coip + ... +cofepft = cl(p, ...)=0; таким образом, р(р)=0,
где р е /С*. Точно так же, если а = а0 + ai# +....+. cCfe-iA^-1
есть многочлен степени 4^k— 1 из класса а, то
cla = cl (а0 + а!л:+ ... +ak-\Xk~l) =
-=a0 + aip+ ... + ak-xpfc-l*=a(p)
Итак, всякий элемент из К* записывается единственным
способом в виде а (р), где многочлен а е К [х] имеет степень
*Ck — 1, а р есть особый элемент из К*— нуль многочлена р.
II. КОМПЛЕКСНЫЕ ЧИСЛА
§ 1. Определения, операции
Пусть К = R — поле действительных чисел. Многочлен
х2 + 1 неприводим в /?, ибо он не может быть разбит на
произведение двух многочленов первой степени с действительными
коэффициентами. Мы построим поле С, содержащее R в
качестве подполя и такое, в котором х2 + 1 разбивается на
произведение двух многочленов степени 1. Для этого можно было бы
воспользоваться результатами первого раздела и построить
такое расширение поля /?, в котором х2 + 1 имеет нуль. Элемент
этого расширения будет представлен многочленом степени 1 из
своего класса, т. е. двумя коэффициентами этого многочлена.
Однако изложение теории будет проведено независимо от
первого раздела.
Определение комплексных чисел. Комплексным числом
называется упорядоченная пара z = (g, ц) двух действительных
*) То есть класс, определяемый многочленом щ — (0, 1,0,...).
/ ГЛ. V. КОМПЛЕКСНЫЕ ЧИСЛА
87
чисел l^Rur\^R. z является элементом множества R2 =
= RXR.
Определим два внутренних закона — сложение и
умножение — при помощи следующих правил.
Пусть г = (g, г\) и г' = (g', ц'); положим, по определению,
г + г' = & + 1'9г\ + лО, гг' - (gg' - tm', gr]' + g't)).
Замечания. 1. Это именно те правила, которые вытекают
из результатов первого раздела; и действительно, сумма
многочленов g + г\х и g' + tj'a; равна (g + g') + (r\ + г\')х\ их
произведение равно gg' + (grj' + g'r|)x + т]Т)'д:2, и значит, остаток от
деления этого многочлена на х2 + 1 равен (gg' — т)т]') +
+ (6т)' + Б'т))*.
2. Комплексные числа иногда называют мнимыми.
3. Для того чтобы «г = zf, необходимо и достаточно, чтобы
g = Г и Л = т)7.
Из предыдущих определений путем простых выкладок
получается, что сложение и умножение ассоциативны и
коммутативны и что умножение дистрибутивно относительно сложения.
Множество комплексных чисел вида (g, 0) изоморфно
относительно сложения и умножения соответствующим числам g
из R. Действительно, (g, 0) + (g', 0) = (g + g', 0) и (g, 0) (g', 0) =
= (gg', 0). Действительное число g и комплексное число (g, 0)
отождествляются, т. е. обозначаются одним и тем же
символом g. Положим еще i= (0, 1); это будет нуль многочлена
дг2 + 1; в самом деле, по принятому соглашению i2 = (—1,0) = —1.
Имеем i'*(t), 0) = (0, 1) (т), 0) = (0, т}). Поэтому любое
комплексное число может быть записано в виде
2 = (g,4)-(6.0) + (OfTO-g + /(4,0)-g + ^
где g и г\ — действительные числа, i2 = —1.
Число g называется действительной, а г\ — мнимой частью
числа г. Часто записывают g = Re z, x\ = Im z.
Следовательно, при всяком действии сложения и умножения
можно заменять комплексные числа z суммой g + iy\ и
производить операции как с действительными числами; достаточно
заменять i2 на —1 всякий раз, как I будет появляться со
степенью, не меньшей 2.
Множество комплексных чисел составляет коммутативную
группу относительно сложения. Действительно, нейтральным
элементом служит (0, 0), и его мы, в соответствии с
предыдущими соглашениями, обозначим через нуль. Каждое
комплексное число z = (g, ц) имеет противоположное, которое мы
обозначим —z\ это есть число (—g, — г\), или еще: —z = —g — trj;
имеем z + (—z) = 0,
88
КНИГА II. АЛГЕБРА
Комплексно сопряженное. Поскольку (—i)2 = —1, то число
—i обладает свойством числа i, а именно, его квадрат равен —1.
Комплексно сопряженным с числом z = g + ix\ называется
комплексное число г = \ — щ.
Отображение z-+z есть взаимно однозначное отображение
множества комплексных чисел на себя, т. е. перестановка этого
множества (ср. Книга I), так как если г = I + h), zf = £' + ir\'y
то условие г = z' влечет \ = £' и г\ = г\\ и стало быть, z = z\
Пусть z = I + ir\ н z' = I' + ir{\ имеем
(г + z') = (6 + 60 - / (ti + т)0 - 2 + 2'.
Точно так же^
**' = (W - т') -1Ы + Б'л) = г • г'-
Итак, отображение z-+z есть изоморфизм относительно
сложения и умножения.
. Имеют место также следующие свойства:
i° z + г = 2g; следовательно, сумма комплексного числа
с его сопряженным всегда есть действительное число.
2° z-z = I2 + ri2; следовательно, произведение комплексного
числа на его сопряженное снова есть действительное число.
Более того, z-z есть действительное число ^>0.
Поле С. Мы покажем, что множество комплексных чисел
образует поле, которое обозначается через С.
Сложение и умножение превращают множество
комплексных чисел в коммутативное кольцо.
Это есть кольцо целостности; в самом деле, если z • z' = 0,
то и zz'-z? = 0, т. е. (zz) (z'z7) « 0 или (I2 + r\2) (£'2 + г\'2) = 0.
Отсюда следует, что если г Ф 0, то I2 + г\2 ф 0, значит, |'2 Ь
+ г/2 = 0, и стало быть, г' = 0.
Кольцо унитарно, так как при отыскании такого
комплексного числа w = и + iv, что гдо = г при любом г, мы получаем
\и + г|^ = |, gu + r|W = 0 для любых \ и г). Отсюда, взяв г| = 0,
| = 1, выводим, что и = 1, "v = 0, и следовательно, до = а + ш =
= 1. Это число 1 является нейтральным элементом умножения.
Всякое комплексное число z Ф 0 обладает симметричным
относительно умножения. В самом деле, если это симметричное
число, скажем, z' = £' + ix\', существует, то должно
выполняться z'z = 1; отсюда, умножив на z, получаем Izz' = z й z' =
|2 + Т|2 * g2+T12 ■
Обратно, найденное число г' удовлетворяет соотношению
zz' = 1.
Итак, множество комплексных чисел составляет поле.
Замечание. Приведенные доказательства не нужны, если
пользоваться результатами первого раздела, где в общем виде
доказывается, что алгебраическое расширение является телом.
ГЛ. V. КОМПЛЕКСНЫЕ ЧИСЛА
89
Модуль. Покажем, что С есть нормированное тело (поле),
т. е. в С может быть определено абсолютное значение (гл. III,
разд. I, § 3). Пусть z = | + щ, z' = g' + ir\' — два комплексных
числа. Ясно, что zz = £2 + ti2 ^ 0, а гг =» 0 влечет z = 0.
Модулем z называется и обозначается через \z\ отображение z—> \z\
множества С во множество неотрицательных чисел из R,
определяемое как z
Модуль является абсолютным значением; действительно:
1° \z\ ^ 0, а |z| = 0 влечет 2 = 0. _
2° \zz'\ = |г| • \г'\. В самом деле, \zz'\2 = zz'(zz') =
= zz'zz' = (zz) (г'Г) = |z2
3° |z + z'| < |?| + |z'
И2.
. Для доказательства неравенства 3
рассмотрим равенство zz'(zz') = zz(z'z'). Оно записывается
в виде (&' + г|Г|02 + (Гл - 1л')2 = (I2 + Ч2) it'2 + л''2)- Это pa-
венство справедливо при любых действительных g, т|, £', т|'.
Следовательно, для любых гиг' имеем неравенство |£|' + цц'\ ^
^ 1гМг/|» причем равенство может иметь место только в том
случае, когда 1'ц — %г\' = 0. Имеем далее \z + z'|2= (z + z') X
X (z + z') = zz + z'z' + zz' + z'z, а так как zj' + iz' =
= 2(gg/ + titi7), то по предыдущему неравенству \zz + zzr\ ^
<2|z||z'|, откуда |z + z'|2< |z|2 + |z'|2 + 2|z| |ат^| = (|z| +
+ |z'|)2, что и составляет неравенство 3°. Можно даже
уточнить, что равенство |z + z'| = \z\ + \z'\ может достигаться
лишь в том случае, когда 1'ц — \х{ = 0, и стало быть, zz' =
= W + цц' есть действительное число К; более того, Я^>0,
поскольку должно выполняться zz! + zz' = 2\z\ \z'\ = 2X. Значит,
равенство в 3° достигается, если:
1° z' ф 0, a z - \iz\ где \х = Xlz'z' ^ 0.
2° z' = 0, a z произвольно.
Введение модуля позволяет сразу записать действительную
и мнимую части для частного двух комплексных чисел z = | +
+ ir\ и z' — I' + й|' =£ 0. В самом деле,
у *'*' Г2 + л'2 Г2 + -л'2 *
Подгруппа чисел с модулем единица. Пусть гфО —
комплексное число. Положим u = z/\z\. По свойству 2°,
определяющему модуль комплексного числа, комплексное число и
таково, что \и\ = 1.
Множество всех комплексных чисел с модулем, равным
единице, образует группу относительно умножения.
Действительно, если и и v таковы, что |и| = |о| = 1, той
\uv\ = 1; с другой стороны, 11| = 1 есть нейтральный элемент
умножения; наконец, если |и| = 1, то \и\ = 1 и ий ~ |*/|2= 1,
а значит, й есть симметричный элемент для и.
90
КНИГА П. АЛГЕБРА
Итак, эта группа является коммутативной подгруппой
группы ненулевых комплексных чисел относительно умножения.
Аргумент. В анализе (книга III, гл. VII, разд. III)
доказывается, что функция и = eie устанавливает изоморфизм между
мультипликативной группой комплексных чисел и с модулем 1
и аддитивной группой действительных чисел 9 по модулю 2я,.
т. е. с фактормножеством поля действительных чисел R по
отношению эквивалентности «9i ~ 9г ФФ 9i — §% равно нулю или
является целым кратным 2я». Если v = ei(?, то uv = е*(0+ф).
Действительное число 9, определенное с точностью до
целого кратного 2я, называется аргументом числа и.
Имеем и = eiQ = cos 9 + i sin 9; обратно, всякое
комплексное число вида cos 9 + f sin в имеет модуль 1, а аргумент 9.
Формула Муавра. Применив формулу uv = е*(0+<р) к случаю,
когда v = ип~1, получим по индукции для любого целого п ^ 1
равенство ип = е{пв, т. е. следующую формулу, называемую
формулой Муавра:
(cos 9 + / sin 9)л = cos n9 +1 sin n9.
Так как и = 1/и, то ir1 = и, т. е. (cos 9 + t sin 9)~* =» cos 9 —
— i sin 9. Стало быть, формула Муавра справедлива также для
любого целого отрицательного п\ она справедлива и для п = 0,
если условиться, что (cos 9 + i sin 9)° = 1.
Итак, формула Муавра справедлива для любого целого п из
кольца Z относительных целых чисел.
Формула Муавра, развернутая при помощи формулы
бинома (гл. IV, разд. IV, § 3), позволяет сразу выразить cosn9 и
sin n9 как функции от cos 9 и sin 9. Действительно,
cos /г9 = cos*9 - С2п cos*"2 9 sin2 9 + с£ cos*~4 9 sin4 9 -
sin nB = Cn cos""19 sin 9 - C\ cosn~3 9 sin39 + C„ cos"~5 9 sin59
Аргумент произвольного комплексного числа. Пусть гФО —
произвольное комплексное число; положим 2/|z|=cos9 +
+ I sin 9; тогда можно написать z = \z\ (cos 9 + i sin 9).
Определенный с точностью до целого кратного 2я, аргумент
9 комплексного числа z/\z\ с модулем единица называется
аргументом числа z и обозначается argz. Для г = 0 условлено,
что в качестве аргумента может быть взято любое
действительное число; тогда формула г = |z|(cos9 + t sin 6) справедлива
и для z = 0.
Особенно показательно использование модуля и аргумента
при умножении. Действительно, пусть г = \z\ (cos 9 + i sin 9) и
z = \z'\ (cos 9' + tsine'); имеем: zz' = \z\ |z'|[cos(e + 9') +
,+ *sin(9 + 9')]; таким образом, \zz'\ = \z\\zr\ и arg(£2') =
*= arg z + arg z\
ГЛ. V. КОМПЛЕКСНЫЕ ЧИСЛА
91
Вообще говоря, практически выгоднее вместо обозначения
cos 9 + / sin 9 пользоваться обозначением eiQ; тогда лучше
видны все свойства. Так, (cos 9 + i sin 9)"1 = cos 9 — /sin 9
записывается как (е*9)-1 = e~iQ.
Действительное число характеризуется условием sin 9 = 0;
если это число действительно и положительно, то cos 9 = 1, и
значит, 9 = 2kn с целым k\ если же это число действительно и
отрицательно, то cos 9 = —1, и значит, 9 = я + 2fen, где вновь
k — целое. Вообще arg(—г) = arg(—1) + argz = argz+я.
Геометрическая интерпретация. Предыдущие результаты
допускают очень простую геометрическую интерпретацию;
однако следует воздержаться от
мысли, что эта интерпретация была
бы достаточна для
доказательства свойств комплексных чисел до
строгого построения геометрии на
основе ее аксиом, а это будет
проделано лишь в последующих
курсах.
Пусть 0|, Ог\ — две
прямоугольные оси (рис. 8) с единичными
векторами OU на Og и OV на Ог\
одинаковой длины 1. Представим
комплексное число г = g + щ точкой М
с координатами | и г\; точка М
называется аффиксом числа г.
Действительные числа характеризуются условием г| = 0;
следовательно, их аффиксы лежат на Og, и обратно. Ось 0\ называется
действительной осью. Точки оси Ог\ являются аффиксами
комплексных чисел вида ir\; ось Ог\ называется мнимой осью. Вся
плоскость в целом называется комплексной плоскостью.
Если М есть аффикс числа z, то ясно, что М симметрична
с М относительно действительной оси Og. Модуль \z\
представлен длиной ОМ отрезка ОМ.
Пусть М' есть аффикс числа z' = g' + ir\'\ тогда аффиксом
S числа z + г' будет служить конец вектора ОМ + ОМ' = OS
с началом в О. __>
Аргумент числа z есть угол 9 оси Og с вектором ОМ,
измеряемый в радианах с точностью до целого кратного 2я.
Пусть Р есть аффикс числа zz'. Имеем ОР = ОМ • ОМ\ и
значит, ОР/ОМ' = OM/OQ. С другой стороны, угол оси 01 с ОР
равен 9 + 9'; но угол оси Og с ОМ' равен 9'; поэтому угол
прямой ОМ' с ОР равен 9; тогда треугольники OQM и ОМ'Р
подобны, откуда и вытекает построение Р. Эта геометрическая
92
КНИГА П. АЛГЕБРА
интерпретация позволяет использовать комплексные числа для
решения многих задач плоской геометрии.
Отметим, в частности, что аффиксом числа z — zf будет
такая точка ЛГ, что ОМ" = ОМ- ОМ' = ОМ -f М/0 = МЧ\4;
следовательно, \z — z'\ пред ставимо в виде расстояния между
аффиксами М и М' чисел z и z'.
Наконец, неравенство | z + z' | < | z \ + \ z' | выражает, что
в треугольнике OMS длина стороны 05 меньше или равна
сумме длин сторон ОМ и MS. Это и является причиной
названия «неравенство треугольника», данного этому неравенству.
Замечательные тождества. Ясно, что действия с суммами
и произведениями, справедливые для действительных чисел,
будут справедливы и для комплексных чисел. Укажем, в
частности, равенства
(z + z'f - z2 + 2zz' + z'\ (z + z') (z - z') = z2 - z'\
справедливые для любых комплексных чисел z и z'.
Сумма геометрической прогрессии. Положим
s = z + rz + r2z + ... +rn~lz, (*)
где z и г — комплексные числа; г, как и в действительном
случае, называется знаменателем прогрессии.
Г Если г = 1, то s = nz.
2° Если гФ1, то, умножив (*) на г и вычтя 5 из
полученного произведения rs, получим
(г— l)s = zrn — z, откуда s = z _. .
Приложение. Рассмотрим сумму а = 1 + cos 9 + ...
... + cos (n—1)0, которая представляет собой действительную
часть суммы s = 1 + eiB + ... + еХп~Щ. Следовательно,
1) если eiQ = 1, т. е. если 9 = 2kn, k — целое, то s = n, а
значит, и а = п\
2) если е*е Ф 1, т. е. если 0=£2&я, k — целое, то s = -
e*-l
Для выделения из 5 действительной части а можно
помножить числитель и знаменатель в 5 на комплексно сопряженное
к знаменателю число e~ie— 1. Можно также поступить
следующим образом: помножив числитель и знаменатель в 5 на e~iQ/2,
получить
- еК"~Ое_е-'Т [cos (п - 1)б - cosi] + / [sin (д - 1)б + sin 1]
в 2-е 2 2tsmJ
ГЛ. V. КОМПЛЕКСНЫЕ ЧИСЛА
93
откуда
«j°(»-4)e | {
о . в + 2 ■
2sinT
§ 2. Нули многочлена из С[х]
Г Квадратный корень. Пусть имеется многочлен х2 — а, где
а — комплексное число; нуль z этого многочлена удовлетворяет
равенству z2 = а\ запишем г=*Уа или г = а1'2 и назовем z
квадратным корнем из а.__(В противоположность соглашению,
принятому в /?, символ |/а или а1/з означает любое число из С,
квадрат которого равен а.)
Если а = 0 и если 22 = а =0, то всегда z = 0, и значит,
0 имеет в С только один квадратный корень —число 0.
Теперь_предположим, что аф&и найдем модуль и аргумент
числа У а. Поскольку г2 = а, то должно одновременно
выполняться |г|2 = \а\ и 2arg£ = arga. Стало быть, |г| = ]/|а|
(здесь У\ а | означает положительный квадратный корень из
действительного числа \а\) и arg£ = yarga. Но arga
определен с точностью до 2£я, 6 — целое, и поэтому аргумент числа
г может принимать два и только два значения, определенных
с точностью до 2&я, а именно argz = у arg a + 2kn и arg z —
= ^ arg a + я + 2kn. Таким образом, а имеет в С ровно два
различных квадратных корня; и если один из них г, то другим будет
—z. Если_а действительно и положительно, то arg а = 0 + 2£я;
значит, У убудет действительным, и квадратными корнями будут
У а и —}/а. Если а действительно и отрицательно, то arga =
= я + 2&я, и значит, У а имеет аргумент я/2 + 2£я или Зя/2 +
+ 2&я. Но cos 9 + i sin 9 равно i, если 9 = я/2, и —i, если 9 = Зя.
Следовательно, два квадратных корня из а будут равны i У — а
и — г)/ —а, где У — а есть число действительное.
Для случая квадратного корня предыдущие результаты
могут быть установлены без использования понятия аргумента,
что позволяет ввести его с помощью этих результатов.
В самом деле, пусть z = g -f щ таково, что z2 = а = a + ф.
Отсюда выводим I2 — ту2 = а и 2^ = р. Возведя оба равенства
в квадрат и сложив, получим равенство (I2 + г\2)2 = а2 + р2,
которое выражает также, что |z[4 = [aj2. Следовательно,
94
КНИГА II. АЛГЕБРА
I2 + г\2 = У а2 + Р2, так как |2 + rf ^ 0. С другой стороны, |2 —
— rf = а, откуда
„2_ У^ТУ + а 2_ /^TF-g
6- 2 и Л- 2 •
Правые части неотрицательны, поскольку а ^ У а2 + р2. Отсюда
получаем
где 8= +1 или —1 и е' = +1 или —1. Однако имеются всего
две возможности, ибо соотношение 2|r| = p указывает, что ее'
имеет знак числа р. Если р = 0, то У а2 + р2 = | а |, и тогда одно
из чисел I или к\ равно нулю. Таким образом, есть всего два
случая с двумя возможными системами £, т), и если одна из них
6, т|, то другая —g, —т). Без труда убеждаемся в том, что эти
две системы таковы, что (| + it])2 = я; тем самым получены
два квадратных корня, которые взаимно сопряжены; если а ф 0,
то они различны.
2° Многочлен 2-й степени. Пусть имеется многочлен
ах2 + Ьх + с, где а, 6, с — комплексные числа, и а#0. Нуль z
этого многочлена удовлетворяет равенству az2 + bz + с = 0. Так
2+ _j -J-C— — =«0,
т. е. (г + 2^-) = —4^2— • Стало быть, все сводится к задаче
об отыскании квадратных корней, решенной в п. Г. Таким
образом,
JlJL— т /б2 ~ 4ас __ е /б2 - Аас
г~^2а^гУ 4а2 ~~ 2^ >
где 8= + 1 или — 1. Итак, можно сформулировать следующий
результат.
Пусть задан многочлен ах2 + Ь'х + с, афО. Если Ь2 — Аас Ф 0,
то он имеет два различных нуля, выражаемые формулой
-b±Vb2-4ac
у == 1 •
* 2а
если Ь2 — Аас = 0, то имеется всего один нуль z = — -5—; этот
нуль двойной, так как тогда
ах2 + Ъх + с = а (х + у-) = а {х — z)2.
Заметим, что формула решения та же, что и в
действительном случае, но всякий многочлен 2-й степени из кольца С[х]
всегда имеет в С два нуля, различных или нет. В частности.
ГЛ. V. КОМПЛЕКСНЫЕ ЧИСЛА %
если я, Ь, с действительны, то эти нули обладают следующими
свойствами:
если Ь2 — 4ас > 0, то имеются два различных действительных
нуля;
если Ъ2 — 4ас = 0, то имеется один двойной действительный
нуль;
если Ь2 — \ас < О, то имеются два взаимно комплексно
сопряженных нуля, не являющихся действительными.
3° Корни л-й степени. Пусть имеется многочлен хп — а, где
а — комплексное число, а п > 2 — целое. Нуль z этого много-
п
члена удовлетворяет равенству zn = а\ запишем г—у а, или,
лучше, z = а1/*1, и назовем корнем п-й степени из а любое число
из С, п-я степень которого равна а.
Таким образом, имеем |;г|п= \а\ и п argz = arga. Следо-
вательно, | z \ = у\ а \ = \ а \/п и arg z = ~ arg а. (Определение
|а|*/"см. Книга III, гл. III.)
Если а = 0и если zn = а = 0, то непременно z = 0, и значит,
О имеет в С только один корень n-й степени, а именно 0.
Теперь допустим, что а ф 0. Имеется п различных
возможных значений arg z с точностью до целого кратного 2я,
1 2k
а именно arg2 = — argaH я, где k — 0, 1, ..., п—1. Ясно,
что аффиксы этих чисел z лежат на окружности с центром О
и радиусом \а\х1п и представляет собой вершины правильного
п-угольника.
Корни из единицы. Рассмотрим частный случай, когда
а = 1; тогда |1| = 1, arg 1 = 0, и значит, корни я-й степени из
2k
единицы имеют модуль 1, а аргумент —я, k = 0, 1, ..., п— 1;
2k 2k
стало быть, это будут числа гц = cos— я + / sin — я = е2Ш1п,
k = 0, 1, ..., п — 1. Положим z = Z\ = e2jtiln; тогда zk = zk, и
корни из единицы равны 1, г, «г2, ..., г"-1.
Несколько свойств корней из единицы. Пусть h есть
произвольное целое число; вычислим сумму sh = z% + z\+ ... +z%_{
ft-x степеней корней n-й степени из единицы.
1° Предположим, что h ^ 0; тогда при г — г^ имеем Sh —
== 1 + zh + z2h + ... + 2<n~1)'1. Эта сумма является
геометрической прогрессией со знаменателем zh = e2h7titn. Случай zh = 1
возможен тогда и только тогда, когда h кратно я, т. е. h = п*пг.
Здесь Sh = п. Если же h не кратно я, то zh Ф 1, и значит, sh =
ZrtA-l
= zh_x ; но гп/1 = Х^П)Л = 1, поскольку zw = 1, и стало быть,
5Л = 0.
96
КНИГА П. АЛГЕБРА
2° Предположим, что h < 0; так как 1/2 = г, то sh = $_л, и
мы можем применить результат, полученный в Г, ибо —h > 0.
Окончательно имеем
J 0, если h не является целым кратным п,
h \ /г, если /г является целым кратным п или /г = 0.
4° Произвольный многочлен из С[дс]. В анализе доказывается
(Книга III, гл. VII, разд. III) следующая теорема.
Теорема Даламбера. Всякий многочлен из С[х] степени
больше или равной единице, имеет в С по крайней мере один нуль.
Эта теорема означает, что многочлен с комплексными
коэффициентами, отличными от постоянной, всегда имеет хотя бы
один комплексный нуль. Обозначим теперь через а некоторый
многочлен из С[х] степени п>1; он имеет нуль pi e С, и
значит, а = (а: — pi)ab dega\=n—1. Но ai e ф]; следовательно,,
ах имеет по крайней мере один нуль р2 (не обязательно
отличный от pi), т. е. а\ = (а: — рг)я2, deg а2 = п — 2. Последовательно
получаем ап-Х = (х — pn)an, degan=0, и значит, ап = К е С,
причем ХфО. Таким образом, а = k(x — pi) (я — р2) ... (х — рп),
Итак, всякий многочлен из С[х] имеет в точности п нулей,
если считать каждый нуль столько раз, какова его кратность.
Иными словами, в С[х] неприводимы только многочлены
первой степени.
Рассмотрим теперь некоторый многочлен из R{x); поскольку
R есть подполе поля С, то он будет также многочленом из С[х],
а значит, будет иметь в С (не обязательно различные) п
корней.
Пусть а е R[x], а = ао + шх + ... + апхп и- р есть
комплексный нуль многочлена; через р, будем обозначать
число, комплексно сопряженное с р. Имеем a(p) = ao + aip + ...
... +anpn = 0. Но ao, ai, ..., an действительны, и поэтому
число, комплексно сопряженное с я(р), равно
а(р) = а0 + а!р + ... + a„pn = а(р) = 0 = 0.
Стало быть, р тоже является нулем для а. Так как
последовательные производные а', а", ..., а^ принадлежат R[x], то в
случае, если р есть нуль порядка h многочлена а, будет
выполняться а (р) = а' (р) = ... = аС1-1) (р) = 0, а<л> (р) Ф 0. Переходя
^ к сопряженным, получаем a(p) = а'(р) = ... = а<л_1)(р) = 0 = 0
и а^(р)Ф0, поскольку комплексно сопряженное числа,
отличного от нуля, не равно нулю. Таким образом, р есть нуль
многочлена а той же кратности, что и р. Значит, нули могут
быть попарно сгруппированы. Если р комплексно, то
(* — р) (* — Р) = х2 — (р + р)* + РР <= #М- Поэтому в R[x] не-
ГЛ. V. КОМПЛЕКСНЫЕ ЧИСЛА
97
приводимыми многочленами будут только многочлены первой
степени и многочлены второй степени, не имеющие
действительных нулей.
Пример. Рассмотрим многочлен хп— 1. Мы показали, что
в С этот многочлен имеет п различных нулей Zh = zk, где
z = zx = cos — + /sin — =»e2nijn и* = 0,1, ..., n~l.
Следовательно, xn—1—(x — z0) (z — Z\)...(x — zn_i), и все нули
простые. Но хп— 1 является многочленом из R[x], и значит, его нули
попарно сопряжены. Действительно, г = 1/2, и стало быть,
zh = Z"h = zn~h = zn-k, так как zn = 1. Действительный нуль
появляется, когда Zk = 2ft, т. е. когда Zh = zn-h- Это равенство
возможно, с одной стороны, при k = О, ибо г0 e zn = zn = 1, а с
другой стороны, при k *= п — &, т. е. 2k = п. Последний случай
может иметь место лишь для четного п, скажем, п = 2т\ тогда
zm — действительное: zm = e2imni2m = еы = —1. Для значений
k Ф О и k Ф /г/2 имеем
(а: - zk) (х - г*)« х2 - (zk -zk)x + zkzk = х2-2х cos Щ^ + 1.
Таким образом, получаем следующее утверждение: если п
(ft-0/2
нечетно, то л:^ — 1 = (л: — 1) |J (x2— 2#cos-^~- + l); если п
(и-2)/2
четно, то д:Л — 1 = (д: — 1)(*+1) JJ (*2- 2*cos^~ + l).
Соотношения между коэффициентами и нулями. Пусть
теперь многочлен а е С[х] имеет вид
а = а0 + а]х+ ... + апхп, ап Ф 0.
Выделяя как различные, так и одинаковые нули, получаем
апхп + ап^хп-1 + ... + а0 = Х(х-~р1)(х-р2) ... (х-рп).
Развернем правое произведение:
ал = А,
ал^!=-Я(р1 + р2+ ... Ч-ряН-Ао^,
ал-2 = A (PiP2 + ... + prt-jp„) = Аа2,
а0 = (-1)лЯр1Р2 ...рй = (-1)яЛая.
Величины <тй = 2р^р£2 • •• Р*А> где q/лша 2
распространяется на все различные системы из k различных целых чисел
(i\, *2> ...» ik), взятых среди целых 1, 2, ..., /г, называются
4 Ш. Пизо, М. Заманский
98 КНИГА II. АЛГЕБРА
элементарными симметрическими функциями чисел рь ..., рп.
Очевидно, аА = (-1)А-^Ч
Для п (не обязательно различных) чисел рь ..., рп из С
многочлен
а = хп-о1пп"1 + ... +(-l)hohxn-h+ ... Ч-(—1Г<тп
имеет нули рь ..., рп. Обратно, нули рь ..., рп и
коэффициенты ал многочлена а = апхп + ... + осо связаны
соотношениями ал = (-1)А^^_#
Следовательно, решение системы уравнений
**-(-!)* ^^ А-1. 2, ..., п,
а.
«
где неизвестными являются pi, ..., рп представляет собой
задачу, эквивалентную задаче об отыскании нулей многочлена
апхп+ ... +а0,
т. е. решению уравнения
апхп + ... + а0 = 0.
ГЛАВА VI
РАЦИОНАЛЬНЫЕ ДРОБИ
Мы видели (гл. IV, § 2), что кольцо А[х] многочленов от
одного переменного есть кольцо целостности, и всякий элемент,
Ф 0, регулярен относительно умножения. В случае, когда А
есть тело /С, это кольцо может, без 0, быть симметризовано
относительно умножения (гл. II, § 1). Тогда полученное множество
будет телом, называемым телом {полем) рациональных дробей
от одного переменного.
Определение рациональных дробей. Будем рассматривать
пары многочленов (а\,Ь\), каждый из которых отличен от 0,
и будем считать {аи b{) ~ (а2> b2), если аф2 = a2b\. Тем самым
определено отношение эквивалентности. Будем обозначать пары
(ai,b\) через ai/fei; ах называется числителем,
Ь\—знаменателем, ai/bi — рациональной дробью.
Пусть а — класс эквивалентности; имеем а = с\(а\/Ьи ...)«
Если р = cl(u{/vu ...), то полагаем
а+р.с1(п±^,...),
<*-*Ш- -У-
ГЛ. VI. РАЦИОНАЛЬНЫЕ ДРОБИ
99
эти операции ассоциативны и коммутативны, а умножение
дистрибутивно относительно сложения. Введя класс О, состоящий
из дробей, у которых числитель есть нуль (а знаменатель
всегда =£0), получим нейтральный элемент сложения. Наконец,
классы дробей, у которых знаменатель есть многочлен а:0 = 1,
образуют кольцо, изоморфное исходному кольцу многочленов;
оно отождествляется с этим кольцом.
Несократимая дробь. Пусть d есть н. о. д. многочленов а\ и Ь\
(как уже было замечено, d не зависит от тела /С); тогда ax = da,
b\ = db, причем а и b взаимно просты. Но a/b ~ ах/Ьх, и значит,
в каждом классе имеется представитель а/b, где а и b взаимно
просты. Дробь а/b называется несократимым представителем
класса. Она единственна с точностью до множителя из /С, ибо
если бы a/b ~ a*/b* и а*, Ь* были взаимно просты, то мы имели
бы ab* = Ьа*. Следовательно, а делит Ьа*; оно взаимно просто
с Ь, т. е. делит а*. Точно так же показывается, что а* делит а,
и стало быть, а* — Ка, Ае К. Отсюда также вытекает, что
Ь* = ХЬ. Любая дробь класса дроби а/b имеет вид ас\Ьс\
действительно, если ajbi ~ alb, то аф = ab^\ а делит аф и
взаимно просто с Ь, следовательно, а делит аи и fli = ас, откуда
b\ = be.
Разложение произвольной рациональной дроби на
простейшие. Пусть а/b — несократимый представитель некоторого
класса рациональных дробей. Разделим а на & по убывающим
степеням; получим а = bq + г, deg г < deg b\ значит, у = q 4- -£-,
и это разложение единственно. При этом дробь rib несократима,
иначе г и b имели бы общий делитель, который был бы также
делителем а.
Теперь предположим, что b = bxb2, где Ь\ и Ь2 взаимно
просты. Идеал vbx + wb2, где v и w — произвольные многочлены,
порожден постоянной; стало быть, этот идеал содержит все
многочлены, и поэтому найдутся такие щ и и2, что и2Ьх + ихЬ2 = г.
При этом многочлены их и и2 не единственны. Разделим U\ на
Ъ\\ получим щ = biCi + rx, degn < deg^i. Многочлены гх и b\
взаимно просты, так как их общий делитель делил бы щ, а
значит г, и b = b{b2; но тогда дробь r/b не была бы несократимой.
Отсюда, в частности, вытекает, что гх Ф 0. Разделим и2 на Ь2;
тогда и2 = b2c2 + r2, deg r2 < deg Ъ2. Точно тем же способом
показывается, что т2 и Ь2 взаимно просты, а значит, и г2Ф0.
Таким образом,
г = и2Ь! + щЬ2 = b xb2 (сх + с2) + r2b j + rxb2.
Но
deg г < deg b = degbx + deg Ьъ
deg (r2b i) = deg 6 j + deg r2< deg bx -f deg Ьъ
deg (rxb2) = deg rx + deg b2 < deg bx + deg й2.
4*
100 КНИГА И. АЛГЕБРА
Следовательно,
deg Ьф2(с{ + с2) < degЪх + deg62.
Это неравенство возможно лишь при С\ + с2 = 0, и тогда
г = тф\ + гф2у где deg r{ < deg Ьх и deg r2 < deg Ь2.
Определенные так многочлены тх и г2 единственны.
Действительно, если бы имело место также представление г = г*2Ь{ + г*62,
где degr*<deg6t и degr*<deg&2, то после вычитания мы
получили бы (г* — г2)6Х == (гх — г*) 62. Но Ьх и Ъ2 взаимно просты,
и поэтому Ь{ делит гх — г*. Сравнение степеней показывает,
что это влечет гх — г* = 0; точно так же г*2 — г2 = 0.
Следовательно, имеет место разложение
г rt . г2
6 6, -г 62'
degri<deg6i, degr2<deg&2, и это разложение единственно.
Вообще, пусть b *= bxb2.. .Ьн есть разложение многочлена b
на попарно простые многочлены, тогда
а г. rh
где deg г* < degb\b £= 1, ..., ft. Это разложение единственно
для заданного разложения bi ... &&. Многочлен q называется
целой частью дроби а/b и отличен от 0 только при deg a > deg b.
Случай многочленов над полем комплексных чисел* Если
тело коэффициентов есть поле С, то любой многочлен b может
k
быть разложен в произведение Ц (л: — рл)т/*, где рА — различные
комплексные числа, а тА^1 —целые. Тогда многочлены
(* — 9hTh и (X — Pj)mj взаимно просты для h ф /, и (х — рА)тл
имеет степень тА. Следовательно, ^
Teflf + (*-Pl)«i + '" +(^~р,Г^
где
degrA<mA для А=1, ..., /г,
это разложение единственно.
Числа pi, ..., рй называются полюсами рациональной дроби
a\b\ mh называется порядком кратности полюса р^. Стало быть,
полюсы дроби являются нулями знаменателя b с той же
кратностью.
'Сейчас мы проведем дальнейшее разложение дроби вида
г/ (х — р)т, где deg г < т.
ГЛ. VI. РАЦИОНАЛЬНЫЕ ДРОБИ 101
Формула Тейлора, примененная к многочлену г, дает нам
r-r(p)+^L(x-P)+ ... +-£=?#-(*- рГ\
т. е.
г==Ят + Ят_1и-р)+ ... +Л1(^-р)я|"1,
где
г(т-/) (р)
Л/~ <т-/)! "
Имеем Ят ^= 0, так как г взаимно просто с (* — р)т, и,
значит, не делится на х — р, т. е. г(р)=^=0. Таким образом,
получаем
(х-рГ =Т=У+ (*-р)2 + ••• + (х-1)т » где хтФ^-
Это разложение тоже единственно, поскольку оно
выводится на основании единственности формулы Тейлора.
Итак, получаем разложение
где
Ял,тл^0, й«1, ..., т.
Это разложение называется разложением рациональной дроби
на простейшие. Оно единственно.
Вычисление коэффициентов Xh,j в разложении. Вычисление
целой части q производится путем деления а на Ь по
убывающим степеням. Обозначим через р какой-нибудь из полюсов рл,
и пусть m — его кратность. Положим
Ь " q + (х ~ p)m + с f
где до/с есть сумма рациональных дробей, соответствующих
полюсам рл, отличным от р. Тогда deg г < m, deg до < deg с,
й = (д: — р)тс, а также а = а* + (х — p)m(cq + до). Но г =*
= Ят + %т-\(х — р) + ... 4-Л.1 (а:— р)ш~К Если рассматривать
многочлен рр = х — р как новое переменное у, то
a = cr + ym (cq + до),
г = Ьт + К-1У+ ... +*1jT-1. J (I)
С другой стороны, по формуле Тейлора, сами многочлены а и с
тоже могут рассматриваться как многочлены от переменного у\
102 КНИГА II. АЛГЕБРА
действительно, если s — степень a, a n — степень 6, то
/ v , а' (Р) , , Д(5) (Р) s
а = а(р) + —^-у+ ... + s, у ,
Тогда два равенства (1) будут результатом деления по
возрастающим степеням а на с, производимого вплоть до появления
в остатке многочлена от у степени !> т. Полученное частное
степени т — 1 будет иметь вид
,m-l
Многочлен с определяется равенством 6 = (х — р)тс. Но
развернув Ъ по формуле Тейлора, получим
ft(p)-6'(PH ... -*<"-%) ~0, 6(А)(р)=*0,
так как р есть нуль кратности т многочлена Ь. Таким образом*
(т+1)! * т ••• т л! У
* L m! ^ (т+1)! *^ "•• ^ п\ У У
ъ Ь^(9) ит , »<"+%) ж-и 6<*>(р) ,
0 "" т! * ^ (т+1)! » 1" • • • f л! У
Следовательно,
6<">(р) 6<^»(р) +Ь<я)(р) д,т
с т! ^ (т+1)! J/т . . . -г л| у
Поскольку при делении а на с ищется частное степени,
меньшей т, то можно отбросить в а и в с все члены, содержащие у
в степени ft^/пи осуществлять деление полученных таким путем
многочленов; в промежуточных операциях при делении можно
также отбрасывать каждый член, содержащий ук при k ^ т.
В частном случае, когда р есть простой полюс, получаем
а = afo) — ate)
Al с(р)-ИрГ
В случае полюса кратности m > 2, вообще говоря,
представляет интерес использование метода деления по возрастающим
степеням.
Однако можно заметить, что всегда
\ _ д (р) _ m- a (р)
Лт с(р) ~ *<»>(р)-
ГЛ. VI. РАЦИОНАЛЬНЫЕ ДРОБИ
103
Поскольку имеет место единственность разложения, то
равенство
*М=аМ 1 У f *»-' 1 Ч'2 1 I Vm* )
6(Y) flf(V, + gU-PikT(Y-pib)» + ■•• ^-p.pj'
в котором y есть какое-то число из С, отличное от полюсов
pi, ..., pft, представляет собой линейное уравнение для чисел
Хп, j и коэффициентов многочлена q. Такой метод нахождения
этих величин называется методом неопределенных
коэффициентов.
Наконец, если а и b — многочлены из R [х], т. е. многочлены
с действительными коэффициентами, то переход к комплексно
сопряженному при разложении не должен в силу
единственности его изменять. Стало быть, числа Хн,з, соответствующие двум
комплексно сопряженным полюсам, сами будут комплексно
сопряженными. Отсюда следует также, что величины Kh, j,
соответствующие действительному полюсу, действительны.
Пример: а=х7 + 2х6 + х* — 6х4 + 9х3 + х, й= (х— 1) (х2+1)3.
Многочлены а и b имеют действительные коэффициенты.
Полюсы для а/Ь будут нулями для Ь. Таким образом, р\ = i и
р2 = —i — тройные полюсы, а рз = 1 — простой полюс.
Подставляя a(pt) = a(f) = —8 —8t, a(p2) = а(—i) = a(i) = — 8 + 8t\
я(рз)= я(1)= 8, убеждаемся в том, что а взаимно просто с й,
так как эти три числа ф 0, и значит, а не может иметь ни одного
общего делителя с Ь, ибо неприводимыми делителями в С[х] для
Ъ будут я—1, х — i, х + и Поскольку многочлены а и b имеют
одинаковую степень 7, то существует ненулевая целая часть q,
получаемая при делении а на b по убывающим степеням. Стало
быть, имеем a = bq + r, где q = \ и г = 3х6 — 2хъ — Зд:4 + 6а:3+За:2+ 1.
Так как комплексные полюсы попарно сопряжены, то получаем
следующее разложение:
Для вычисления Ль Аг, аз мы с помощью формулы Тейлора
запишем многочлены г и b в виде многочленов от (л; — i) = у.
Получим
r-r(o+^(x-o+4i2-<x-')8+ •••=
= -(8 + 8/) + (-28 + 36/)# + (66 + 38/)у2 + ...,
-i,»[(8 + 8rt + (12-20f)s + (-18-60;/'+....]-Л.
104
КНИГА II. АЛГПБРЛ
Кратность полюса pi = i равна т = 3, и поэтому бесполезно
записывать в г и в с члены, содержащие у в степени, большей 2.
Разделим г на с по возрастающим степеням:
-(8+8/) + (-28 + 360 у + (66 + 38/) у2 + ...
(8+8/) + (12 - 20/)у + (-18 - 6/)у2 + ...
(-16 + 16/) у+ (48 + 32/)У + ...
(16 - 160 У + (- 40 - 24/) у2+ ...
(8 + 8i)y2+...
(8+8/)+(12-20/)г/ +
+ (-18-6/)«/2+...
- 1 + 2и/ + у2 + ...
Поскольку наименьшая степень остатка <>3, то полученное
частное —1 + 2iy + у2 дает М = 1, Я2 = 2i, Я,3 = — 1. Для
нахождения [х, соответствующего простому полюсу рз = 1, имеем
Ь = (а:— 1)с*, где с* = (х2 + I)3. Следовательно,
|х = а (1)/с* (1) = г (1)/с* (1) = 8/8=1.
В итоге получаем разложение
£L=1 ,1,2/ 11,2/ ji_ i_
ГЛАВА VII
ВЕКТОРНЫЕ ПРОСТРАНСТВА
Понятие векторного пространства уже вводилось в гл. III,
разд. III, § 1. Это понятие является в современной математике
одним из наиболее важных. В настоящее время в математике
«линейные» операции — почти единственные, которые поддаются
достаточно глубокому изучению. Название пространства
«векторное» проистекает из того, что это понятие было вначале
выделено при изучении свободных векторов, которые представляют
собой первый пример векторного пространства с внутренним
законом геометрического сложения и внешним законом
умножения на число. Но вскоре оказалось, что многие другие
математические множества могут рассматриваться как векторные
пространства, например, решения линейных однородных
дифференциальных уравнений, множества многочленов над некоторым
полем, множество непрерывных функций на интервале.
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА
105
1. ОПРЕДЕЛЕНИЯ И ОСНОВНЫЕ СВОЙСТВА
§ 1. Определения
Определение. Множество Е называется векторным
пространством над полем /С, если оно наделено (см. гл. III, разд. III,
§1):
1° Внутренним законом коммутативной группы с аддитивной
записью, так что для любых #е£, уе£, 2б£
х + (у + г) = (х + у) + г, (1)
х + у = у + х. (2)
Существует такой элемент ое£, что
х + о = х (нейтральный элемент). (3)
Существует такой элемент (—х) е £, что
х + (—х) = о (обратный элемент). (4)
2° Внешним законом, таким, что для любых х е £, у е Е>
X <= К, \х е К
Х(х + у) = Хх + Ху; (5)
{X + \i) х = Хх + \хх; (6)
X (\ix) = (X\l) х; (7)
гх = Ху (8)
где е есгб единичный элемент из /(, т. е. нейтральный элемент
умножения в /С
Мы будем элементы из Е обозначать строчными латинскими
буквами, а элементы поля К—строчными греческими.
Нейтральный элемент сложения в К будет обозначаться 0, а
нейтральный элемент е умножения в К будет обозначаться 1. Иногда
может оказаться удобным обозначать элементы из Е буквами со
стрелками вверху или же строчными жирными: ж, чтобы
подчеркнуть их аналогию с векторами в элементарном смысле.
Следствия из определения. Согласно (6) для \х — 0 при
любых ^еК и Х(=Е имеем (X + 0)х = Хх = Хх + 0-х. Значит,
0-х = о для любого х^Е. Если —X противоположно X в К, то
в силу (6) [X + (—Х)]х = Хх + (—Х)х = о-х = о.
Следовательно, (—•X)# = — (Хх), каковы бы ни были Х^К и х<=Е\ в
частности, (—1)jc = —х. Согласно (5) для у = о при любых Яе/(
йхе£ имеем Я(х + о) = А,* = Хх + Хо. Значит, Хо = о для
любого X е /С.
Обратно, допустим, что для некоторого 1е/( и некоторого
х е £ выполняется соотношение Хх = о; тогда либо Я = 0 и
равенство справедливо, либо ХфО и тогда X имеет в /С обратный
106
КНИГА II. АЛГЕБРА
элемент jn = 1/Я, и \х{Хх) = \х-о = о; но ц(Ял:) = (цЯ)л: = 1 х =
= #, и значит, х = о. Таким образом, соотношение Хх = о влечет
Я = О или х = о.
Рассмотрим теперь равенство Яд: = fix, где Я е /С, jn e /С,
хе£ Если а: = о, то оно выполняется при любых Яиц,. Если же
х Фо, то, прибавив к обеим частям равенства выражение —\хх>
противоположное \хх, получим Хх + (—\i)x = \хх + (—\хх) = оу
и значит, [Я + (—\i)]x = о. Поскольку х Ф о, то Я + (—\х) = О,
откуда, прибавляя к обеим частям ц, находим Я + (—\х) + \х =
= jii, т. е. Я = |ы. Итак, всякий элемент хф о из Е регулярен
относительно внешнего закона.
Точно так же рассмотрим равенство Хх = Ху, где Я е /(, а: е
е £, у &Е. Если Я = О, то оно выполняется для любых хну.
Если же Я ф О, то Я* + (—Ху) = о. Но (—Ху) = (—Я) у =
= (—1-Х)у = [Я(—\)]у = Х(—у), и следовательно, Я* + (—Я#) =
= Я [* + (—у)] = о. Так как Я =£ 0, то а: + (—у) = о, откуда,
прибавляя к обеим частям у, получаем х + (—у) + у = у, т. е.
х = у.
Итак, всякий элемент X Ф 0 из К регулярен относительно
внешнего закона.
§ 2. Примеры -векторных пространств
1° Свободные векторы евклидовой геометрии образуют
векторное пространство, внутренним законом которого является
геометрическое сложение х + у, нулевым вектором — вектор а
(направление которого произвольно), а вектором, противошь
ложным ху служит —х. Здесь К есть поле действительных чисел.
Вектор Хх имеет то же направление, что и х, и при единичном
векторе х его конец имеет абсциссу Я.
2° Любое поле К является векторным пространством над сз-
мим собой со сложением в качестве внутреннего закона и
умножением в качестве внешнего (Е = К).
3° Произведение двух векторных пространств над одним и
тем же полем /С Пусть Е\ и Е2 — два векторных пространства
над /С; рассмотрим произведение Е\ X Е2, превратим его в
векторное пространство над /С Элементы из Е\ будем наделять
индексом 1, а элементы из Е2 — индексом 2.
Внутренний закон. Положим (хи х2) + (уи У2) =
= (х\ + уи х2 + у2). Этот внутренний закон композиции
ассоциативен и коммутативен; он имеет нейтральный элемент
(оь о2), где 0\ — нейтральный элемент из Еи а о2 — из Е2;
каждый элемент (x{fx2) имеет противополажный элемент
(—х\,—х2).
Внешний закон. Пусть Я — произвольный элемент из /С
Положим Х(хих2) — (ХхиХх2). Тогда для любых ЯеУС и це^
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА % 107
имеем
Х[(ХЬ Х2) + (уи У2)] = Ь{х1+уи *2 + #2) = ГМ*1 + J/l), ЦХ2 + У2)] =
= (Ххи Хх2) + (Хуь Ху2) = Х(хи х2) + Х(уь у2);
<Л + \х)(хь х2) = [(X + \х) хи (Х + \х)х2] = (Ххи кх2) + (\ххи \ix2) =
= Х\Х[, х2) + \i(xi, x2)
Х[\х(хи х2)] = Х(\ххи \xx2) = (X\ixu Xiix2) = (X\x){xu х2)\
1 • (хи х2) = (1 . хи 1 • х2) = (хь х2).
Таким образом, Е\ X Е2 есть векторное пространство над /С.
Предыдущие результаты .можно обобщить на произведение
любого» конечного числа п векторных пространств Ей ..., Еп
над одним и тем же полем К. Пусть х\, Ух^.Е\ и пусть
(хи ..., Хп) + (уи ..., Уп) = (Х1+Уи -,., *п + #п),
M*i> •••> *п) = (Яа:ь ..., Ххп) для любого Хе/С.
Тогда £iX ... Х^п есть векторное пространство над К.
Наиболее важным является частный случай, когда Е\ = ..,
... = Еп = /С, где К = R или К = С. Эго векторное
пространство обозначается Rn или Сп; его элементами являются системы
из я чисел (1и • •, In), где g< e /? (соответственно |t- e С).
Легко видеть, что R3 изоморфно векторному пространству
свободных векторов трехмерного пространства с компонентами
(Si» 62, Ы-
Векторное подпространство. Пусть имеется векторное
пространство Е над полем К, и пусть F есть подмножество Е, которое
с законами, индуцированными из Е, само составляет векторное
пространство над К; тогда F называется векторным
подпространством пространства Е или линейным многообразием в Е.
Пример. Rm есть подпространство пространства Rn для
любого m < п\ достаточно взять элементы (|ь ..., |ш, 0, ..., 0),
у которых п — m последних компонент равны нулю.
Подпространство, порожденное элементами хи ..., хп из Е.
Рассмотрим множество F элементов у е £ вида у — Х\Х\ + ...
... +ХпхП1 где Хи •♦., Хп — произвольные числа из К. Тогда F
будет векторным подпространством пространства Е, причем не
исключено совпадение его с Е; F называется векторным
подпространством, порожденным элементами хи ..., хп или линейным
многообразием, порожденным элементами Х\, ..., хп.
Действительно, пусть z = 1x1*1 + ... + \хпхп, где |хь - - -, Ии —
произвольные числа из К. Имеем
у + 2 = (Я1 + И'1)л:1+ ... +(Xn + \in)xn€=F;
0 = 0-*!+ ... +0-A;nGf;
108
КНИГА II. АЛГЕБРА
С другой стороны, для любого ХеК имеем
Ьу = (Мг)хг+ ... + (XXn)xns=F.
Следовательно, F есть векторное пространство.
В определении F нет необходимости требовать, чтобы элемент
(/eF имел единственное представление в виде Х\Х\ + ... + Хпхп;
достаточно только его существования. Мы увидим, что для
одного и того же элемента у е F может существовать бесконечное
множество таких представлений.
4° Пересечение двух векторных пространств над одним и тем
же полем К есть снова векторное пространство. Пусть Е и F —
два векторных пространства над /С; рассмотрим Е Л F. Если х е
e£HF, to^e£h^eF, а значит, Хх е Е; Хх е F для любого
Я е /С, и поэтому Яд: е £ П Z7. Далее, если ^EfflfHj/EErif,
то^ + уЕЙи^ + г/Е/7, а значит, х + у ^ Е [) F. Этот
результат можно распространить на любое множество векторных
пространств над одним и тем же полем К
Заметим, что объединение двух векторных пространств,
вообще говоря, не является векторным пространством.
II. ЛИНЕЙНАЯ НЕЗАВИСИМОСТЬ, БАЗИСЫ
§ 1. Определения
Линейная независимость. Пусть имеется векторное
пространство Е над полем /С. Элементы хи ..., xh из Е, где k конечно,
называются линейно независимыми, если соотношение
Ххх{ + ... + ккхк = о,
где
Xi^K, ..., Хк^ К,
влечет Х\ = 0, ..., Xk = 0.
Элементы Х\, ..., xk из Е называются линейно зависимыми,
если в К найдется хотя бы одна совокупность Х\, ..., Хи таких
элементов, не все из которых равны нулю, что
Х\ХХ -г ... "г XfoXfc = о.
Говорят также, что один из элементов хи i = 1. ..., k,
является линейно независимым {или линейно зависимым) от
других, если совокупность Х\, ..., xk линейно независима (или
зависима) .
Один элемент х е Е линейно независим, если х Ф 0, и
напротив, элемент ое£ линейно зависим.
Если среди элементов хи ..., xh имеются h линейно
зависимых элементов xi, ..., Хп, где h ^ k, то вся совокупность хи ...
..», ^ тоже линейно зависима; действительно, существуют такие
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА 109
|Аь • • •» Ил» не все равные нулю, что \x\Xi +...,+ \xhxh = о, и
стало быть, найдутся числа Ль ..., А*, не все равные нулю, для
которых
A»i#i + ..., + ЛдХд + Л^+1^л+1 + • • • + Я^л^ = о;
достаточно взять Я* = щ для i = 1, ..., h и Л,- = 0, если / =
= /* + 1, ....ft.
Следовательно, ес/ш б совокупности х\, ..., хь, имеется эле-
мент о, то совокупность Х\, ..., Хъ, линейно зависима; это
эквивалентно утверждению, что если совокупность линейно независима,
то каждый элемент Фо.
Точно так же, если в некоторой совокупности имеются два
пропорциональных элемента, например х2 = \xxi с каким-нибудь
(I е /С, то совокупность линейно зависима, ибо таковой является
частичная совокупность х\, х2; действительно, \хх{ + (—1)х2 =
= ои —1 ф 0 (может оказаться, что \х = 0).
Базис, размерность. Пусть £ — векторное пространство;
предположим, что существует конечное число п таких линейно
независимых элементов ей ..., еп, что всякий элемент х из Е
линейно зависит от еи ..., еп. Тогда будем говорить, что
совокупность е\, ..., еп образует базис пространства Е и что Е имеет
конечную размерность п\ будем писать п = dim£.
Мы уже заметили, что существуют векторные пространства,
не имеющие конечной размерности; говорят, что они имеют
бесконечную размерность; в таких векторных пространствах
имеются сколь угодно большие совокупности линейно
независимых векторов. Так, векторное пространство К[х] многочленов над
полем К бесконечномерно, поскольку всякая совокупность
многочленов х\ в которой все показатели i различны, линейно
независима (гл. IV, разд. I, § 1).
Пусть х есть элемент из Е\ так как он линейно зависит от
е\, ..., еп, то в К найдутся такие числа Я, Яь ..., Яп, не все
равные нулю, что Хх + К\е\ +... + Хпеп = о. При этом Я ф 0, ибо
в противном случае было бы К\е\ + ... + Кпеп = о, где не все
Яь ..., Яп равны нулю, и тогда е\, ..., еп были бы линейно
зависимы. Так как К есть поле, то существует 1Д g К. После
умножения на —1/Я получаем
х = Ъ\е\ + ••• +Е«ея, где h=-XilXs=K, /=1, ..., /г.
Таким образом, векторное пространство Е порождено
базисом е\, ..., еп.
Более того, представление любого элемента единственно, ибо
если бы, кроме того, былод: = ^е1+ ... +£^л>то после
вычитания мы получили бы о = (gj — 1[) ех + ... + (£и — ££) еп\ значит,
в силу линейной независимости ей ..., еп, имели бы % — \t = 0,
т- е- l'i=li Для /== Ь •••> п-
по
КНИГА II. АЛГЕБРА
§ 2. Изоморфизм между n-мерным пространством и Кп
Пусть Е — векторное пространство конечной размерности п
над полем К. Рассмотрим векторное пространство Кп = К X
X К X ... X К, являющееся произведением п векторных
пространств К над полем К Поставим в соответствие элементу х =
= gi^i + Ье2 + ... + 1пеп из Е элемент (gi, ..., gn) = x из
Кп. Пусть далее у е Е, причем у = r\\ei + ... + цпеп. Поставим
в соответствие элементу у е Е элемент (r|i, ..., г|п) = у из Кп-
Так как х + у - (gi + r|i)ei + ... + (£n + Tin)en, то ясно, что
элементу я + (/ соответствует элемент я +i/ из Кл; а так как
Кх = Х1\е{ + ... + A,gnen, то элементу Хх соответствует элемент
Кх из /С", причем операции в Кп определяются, как и выше
(разд. I, §2, п. 3°).
Векторное пространство Е конечной размерности п над К
изоморфно Кп\ изоморфизм между Е и Кп зависит от
выбранного в Е базиса.
Образами векторов базиса еи •.., еп будут ег= (бн, ..., бпг),
где бг-j = 0, если i ф /, и в« = 1; величины 6{j называются
символами Кронекера. Так,
^ = (1, 0, ..., 0); е2 = (0, 1, ..., 0); ...; гя = (0, 0, ..., 1).
Из предыдущего также вытекает, что для того, чтобы
элементы хи ..., xk из Е были линейно независимы, необходимо и
достаточно, чтобы этим свойством обладали элементы х\, ..., xk
из Кп, соответствующие им при вышеуказанном изоморфизме.
Таким образом, изучение элементов из Е можно свести к
изучению элементов из Кп'.
В частности, еь ..., ёп есть базис пространства Кп,
называемый каноническим.
Мы используем ассоциированное пространство Кп для
доказательства следующего предложения.
Теорема. В n-мерном векторном пространстве Е
совокупность, состоящая более чем из п элементов, всегда линейно
зависима.
Мы будем доказывать эту теорему индукцией по
размерности п.
Г При п = 1 теорема верна. В самом деле, тогда Е имеет
базис, состоящий из единственного элемента е, и значит, всякий
элемент х из Е имеет вид х = %е, для g <= /С. Пусть теперь х' =
= 1'е\ если I = 0, то х = о, и совокупность х, х' линейно
зависима; если же \ ф 0, то %х + Их' = о, где Я = g'/S, X' = — 1 =£ 0,
й совокупность а:, а:' снова линейно зависима.
2° Допустим, что теорема верна для любого векторного
пространства размерности, не превосходящей п—1. Рассмотрим
тогда п + 1 векторов х0, хи ..., хп пространства Е\ они выра*
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА Ш
жаются при помощи базиса е\, ..., еп пространства Е в виде
*issaluet+ ••• +Ъщея> *-0, 1, ..., п.
Поставим в соответствие элементу Х\ элемент х% =
= (1п> • • •, 1т) пространства Кп.
а) Допустим сначала, что |п* = 0 для всех / = 1, ..., п\ рас-»
смотрим элемент jcj = (|u, ..., in_u) из Kn_1. Поскольку век*
торное пространство К71'1 имеет размерность п— 1, то п
элементов^ для i = 1, ..., п линейно зависимы; стало быть, найдутся
такие числа Яь ..., Яп из /С, не все равные нулю, что Кхх[ +
+ ... + Хпх'п = б', где о' = (0, ..., 0) есть нейтральный элемент
сложения в /С71"1. Следовательно, tagji + ... knljn = о для
/ = 1, ..., п — 1. Но Ini = 0 для i = 1, ..., п\ поэтому
предыдущее соотношение верно и для / = п\ иными словами, при тех
же Яь ..., Яп выполняется соотношение %\х\ + ... + Хп%п = о
в Кп; значит, в силу изоморфизма между Кп и Е имеем
Х\Х\ + ... + КпХп — о в £. Итак, векторы х\, ..., хП9 а следовав
тельно, и векторы *0, Х\, . • •, хп линейно зависимы в Е.
б) Теперь предположим, что |по Ф 0, и рассмотрим элементы
У1 = х1—ъхо Для / — 1 л. Имеем ^ = rii^i + ..,
... + Tlni^n, причем r\ni = |я£ - -р- £>tt0 = 0. Поэтому все сводится
к случаю а) с у* вместо л;*; следовательно, уи ..., f/n линейно
зависимы, т. е. найдутся такие Яь ..., Яп, не все равные нулю,
что Xif/i + ... + ЯпУп = о, т. е. Я0л:о + К\Х\ + ... + Ял = °>
где Я0= - т—(^i£ni + • • •" + КЪпп)- А поскольку не все Яь • • • > kn
fertO
равны нулю, то то же самое можно сказать и про Яо, Яь ..., Яп;
значит, элементы х0, Х\, ..., хп линейно зависимы в Е.
Итак, в n-мерном векторном пространстве Е нельзя выбрать
более чем п линейно независимых элементов.
В частности, если Ё имеет базис, отличный от ей ..., еп, то
последний будет иметь п' элементов, причем п! sg: п. Точно так
же в Е может существовать не более чем п' линейно
независимых элементов, а значит, п^п!, и следовательно, п = п'.
Если Е имеет несколько базисов, то эти базисы содержат
одинаковое число элементов, и число это равно размерности Е\
следовательно, размерность пространства Е не зависит от
выбора базиса.
§ 3. Базисы
Построение базиса. Пусть имеется м-мерное векторное
пространство Е\ в нем существует хотя бы один базис еи ..., еп
из п элементов. Выберем в Е произвольный элемент а\ Ф о„
112
КНИГА И. АЛГЕБРА
Если Е не содержит элементов, линейно независимых от аь
то любой элемент х s E имеет вид х = £а4, и а4 составляет базис
пространства £, которое, стало быть, имеет размерность 1.
Допустим, что размерность п > 1. Обозначим через а^ элемент
из £, линейно независимый от а\. Предположим, что таким
путем постепенно получены линейно независимые элементы
#ь 02, • • > Ял- Если h < п, то Е содержит элементы, линейно
независимые от аь ..., ал, иначе для любого элемента х^Е
существовали бы такие Я, Яь ..., Ял, не все равные нулю, что
Я* + %iai + ... +XhO>h = о. Здесь Я ф О, ибо в противном случае
аь ..., ал были бы линейно зависимы; следовательно, х —
= £i«i + ... + |лЯл, где 1{ = — Яг-/Я, I = 1, ..., /г, и аь ..., ал
будет базисом для Е, содержащим h < n элементов, что
невозможно. Стало быть, найдется такое ал+i ^ Е, что аь ..., ал, a*+i
линейно независимы. Этим способом можно получить п линейно
независимых элементов; они составляют базис пространства Е.
Таким образом, всегда существует бесконечное множество
различных базисов пространства Е. Тем самым доказана
также следующая
Теорема о неполном базисе. Если h<n элементов
линейно независимы в £, то их всегда можно дополнить п — h
другими элементами из Е, так, чтобы полученное множество п
элементов составляло базис пространства Е.
Векторные подпространства. Пусть F есть векторное
подпространство пространства Е конечной размерности п. Пусть
далее А есть максимальное число линейно независимых элементов
из F\ число h существует, и при этом h^n. Пусть /ь ..., fh —
система h линейно независимых элементов из F, и пусть / —
произвольный элемент из F; тогда элементы /, fu ..., fh линейно
зависимы, т. е. существуют такие Я, Яь ..., Ял, не все равные
нулю, что Я/ + Я1/1 + ... + Khfh = о; но Я ф О, иначе /ь ..., fh
были бы линейно зависимы. Следовательно, / = Yi/ + • • • + Y^/л,
где у* = —Яг/Я, i = 1, ..., h. С другой стороны, это
представление элемента / единственно, ибо если бы имелось f = y'lfl+ ...
... +y/hfhfTto в результате вычитания мы пришли бык равенству
(Yi"Yi)/i+ ••• + (Ул — YA)fл = о,которое в силу линейной
независимости элементов /ь ..., /л влечет y^ — Y^ = 0» т. е. Y* —Y*
для i — 1, ..., Л. Таким образом, f\,...yfh есть базис
пространства F, и любое векторное подпространство конечномерного
векторного пространства само конечномерно.
С другой стороны, если h = п, то F = Е; если h < n, то
можно, дополнив fu .. •, fh элементами gh+\, ..., gn, получить базис
пространства Е.
Векторное подпространство G, порожденное элементами
gh+u>***gn> называется дополнительным подпространством к /\
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА ИЗ
Итак, всякий элемент х&Е, имеющий вид
*eYifi+ ••• +yhfh + Vh+Jh+\+ •-. +Yn/n.
может быть единственным способом представлен в форме
x = f + g, где fe=F, ge=G-r
при этом F [) G сводится к единственному элементу о. Говорят,
что Е есть прямая сумма F и G.
Ясно, что если dim F « А, то dim G = п — h = dim E — dim F.
Замечание. Дополнительное к F векторное
подпространство G зависит от выбора базиса в F и от элементов из £,
выбираемых для дополнения базиса пространства Е.
§ 4. Факторпространство
Факторпространство. Пусть Е есть векторное пространство,
не обязательно конечной размерности, над полем К, и пусть F
есть векторное подпространство пространства Е. Можно
определить в Е отношение: х ~ хгу если х — /eF. Оно является
отношением эквивалентности. В самом деле,
х ~ х, ибо х — x = o^F;
х ~ х' =т> х' ~ х, ибо х' — х = — (а: — х') е F;
х ~ х' и xf ~ х" =#> х ~ х", ибо (х — х') + (х' — х") s /\
Будем через я обозначать класс эквивалентности элемента х\
при этом всякий элемент из х будет иметь вид х + f, где / —
какой-нибудь элемент из /\
Пусть х = cl (а:, ...), i/ = cl (у, ...); положим Хх =
= с1 (Хх, ...), гдеЯ€=К, их + у = cl(* + у, ...).
Эти определения не зависят от представителей, выбранных
в классах, а зависят только от классов; действительно,
X {х + /) = Хх + Xf ~ Хх,
x + f' + y + f" = x + y + f' + f" = x + y + f~x + yt
f'^F, pes F, fe=F.
Сложение ассоциативно и коммутативно, оно имеет
нейтральный элемент o=cl(o, ...) = F, и каждый класс х имеет
противоположный —х = cl (—х, ...).
Имеем также
х(х + д) = с\{х(х + у), ...)=*мс + хд,
(X + н<) х = cl ((X + \i) х, ...) = Хх + \ix,
X {\хх) = cl (X (\хх), ...) = (X\i) x,
ех = с\(ех, .. .) = *
114
КНИГА II. АЛГЕБРА
для любых xE^j/G^lE^iJie^e есть нейтральный (еди*
ничный) элемент относительно умножения в /С
Итак, множество классов составляет векторное
пространство Н над К, называемое векторным факторпространством
пространства Е по F; его обозначают Н = E/F.
Случай конечномерного Е. Предположим, что пространство Е
имеет конечную размерность п\ тогда его подпространство F
тоже имеет конечную размерность h^n. Пусть /ь ..., /л —
базис пространства F\ если п> h, то дополним его элементами
gk+u • • • > gn До базиса пространства Е. Для любого х ^ Е
имеется единственное представление
*msiif\ + ... + 6a/a + Ia+i£a+i + ... +lngn-
Пусть также
*,-6{/,+ .-- +l'hfh + lUi8k+i+ •■■ +Ъ'пёп-
Тогда
х ~ х Ф?ЕА+1 =!A+i> • • •» %п~%п*
Рассмотрим дополнительное к F векторное пространство О;
элемент g из G запишется в виде
g = lh+\gh+l+ .. • +1п8п-
Таким образом, все элементы х^Е, принадлежащие одному
и тому же классу эквивалентности х, соответствуют одному и
тому же элементу g из G; поэтому между G и Н имеется
взаимно однозначное соответствие.
Пусть
*-*KelA+lffA+l+ ••• +lngn>
y-*v = Ла+iSa+i + .. • + 4ngn>
тогда
Хх-ъ-Хи и х + у-+и + и.
Следовательно, это соответствие есть изоморфизм.
Итак, можно отождествить факторпространство Н = E/F
с дополнительным к F подпространством G.
В частности, имеем
dim Н = dim E/F = dim G = n — h = dim E — dim F;
можно также сказать, что Е есть прямая сумма F и E/F.
Если h = п, то факторпространство Я сводится к
единственному элементу о.
Пример. Пусть Е — векторное пространство /?3 элементов
% = (Ёь S2i £з)> и пусть F есть его векторное подпространство,
элементы f = (|, 0, 0) которого имеют последние две компоненты
нули (ось Oli). Подпространство F имеет в качестве базиса век-
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА
115
тор ё\ = (1,0,0). Можно получить базис пространства R3,
дополнив ё\ еще двумя векторами. Возьмем, например, ё2 — (0,1,0)
и ёз = (0,0,1); эти векторы порождают векторное
подпространство G, все элементы которого g = (0, tj, £) имеют первую
компоненту нуль (плоскость 0|2|з). Тогда любой элемент х = (gi, g2, Ъ)
из R3 записывается единственным способом в форме х = f + g,
где f e= F, g g= G; действительно, f = (gb 0,0); g= (0, |2, h) •
Однако для дополнения ё\ до базиса пространства /?3 можно
вместо ё2 и ё3 взять и другие элементы. Например, й= (1,—1,0)
и v =(1,0, — 1); тогда для любого х = (gi, £2, Ы s #3 имеем
хМ^ + Ь + У^-^й-^-Г' + Г»
где
/'И^ + ^ + Ы^/7 и r--E2S-b8sG'.
G' есть векторное пространство, порожденное элементами и и v
(т. е. плоскость Ь + £2 + £з = 0).
Оба пространства G и G' являются дополнительными к F.
Следовательно, они изоморфны E/F. Элемент из E/F есть класс Ж,
где х' ~ х, если xf — Jef; значит, класс есть прямая,
параллельная 0\\\ эти прямые образуют векторное пространство,
изоморфное G и G'. Операции над прямыми можно определить,
исходя из их пересечений с плоскостями G или G'.
III. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ
§ 1. Определения
Определение 1. Пусть имеются два не обязательно
различных векторных пространства Е и F над одним и тем же
полем К. Линейным отображением пространства Е в F называется
отображение f пространства Е в F, обладающее следующими
свойствами:
f(xl + x2) = f{Xi) + f(x2) для любых ^g£, х2^Е.
f (kx) = Я/ (а:) для любых х е £, Я е /С.
Определение 2. Если F = К, то значение отображения есть
число из К\ в этом случае говорят, что f есть линейная форма.
Так, ортогональная проекция вектора на плоскость есть
линейное отображение пространства /?3 в R2. Точно так же, если х
есть непрерывная функция на замкнутом интервале [а, р], то
интеграл | х {t) dt = / (я) есть линейная форма на векторном
а
пространстве функций, непрерывных на замкнутом интервале
la, p].
Il(j КНИГА II. АЛГЕБРА
Следствия из определения. Если взять х2 = о, Xi = ху
го ясно, что f(x + о) = f(x) + f(o), и значит, f(o) = o.
Необходимо, однако, отметить, что о в f(o) является нейтральным
элементом в Е; стало быть, он, вообще говоря, отличен от элемента о
в правой части, представляющего собой нейтральный элемент в F.
Рассмотрим множество f(E), т. е. множество элементов из/7,
которые служат при отображении / образами по крайней мере
одного элемента х^Е. Пусть у\ и у2— два элемента из f(E);
следовательно, существуют такие Х\ е£ и Х2^Е, что f(x\) = уи
f(x2) = y2. Тогда у\ + у2 = /(*i) + /Ч*2)= f(x\ + х2), и значит,
ух + y2&f(E). Точно так же Ху\ = %f(x\)=* f(kx\), и стало быть,
%Ух е/(Я). Итак, f(E) есть векторное пространство, являющееся
векторным подпространством пространства F, а отображение f
есть отображение Е на f(E). (Однако оно может и не быть
взаимно однозначным.)
Пример. Пусть х = (|ь %2) —элемент из R2; поставим ему
в соответствие элемент у =* (г|ь г|2, Цг) из R3 по формулам
v\i = h + £2, i = 1, 2, 3. Это есть линейное отображение R2 в /?3;
но образ пространства R2 занимает не все R3, а только
«диагональ» в R3, т. е. элементы из R3, имеющие три равных коорди-
динаты; эта диагональ составляет одномерное векторное
пространство.
Если элементы Х\, ..., хп линейно зависимы в Е, то в К
существуют такие Яь ..., Ап, не все равные нулю, что
fax} + ... + %пХп «= о; но тогда f{X\Xx + .. .+ХпХп) = W(*i) +• •.
+ ... +%nf(xn) = о. Итак, элементы f(xi), ..., /(д:п) из f(E)
тоже линейно зависимы. Обратное, вообще говоря, неверно.
Таким образом, размерность пространства f(E) не
превосходит размерности Е (включая случай, когда размерность Е
бесконечна, при соглашении, что всякая конечная размерность
меньше бесконечной).
§ 2. Взаимно однозначные отображения, ядро
Взаимно однозначное линейное отображение. Рассмотрим
множество /_1(°) из £> т- е- множество элементов xg£, для
которых f(x)=o, где о означает нейтральный элемент
сложения в F. Множество f~l(o) называется ядром линейного
отображения f.
Ядро есть векторное подпространство пространства Е.
Действительно, если XiG/^fo) и x2&f-{(o), то f{xx) = f(x2) = о;
следовательно, f(x\+x2) = o и, значит, Х\ + х2 е /-1 (о); точно
так же, если Яе=7С, то /(X#i) = о и, значит, toi ef-4(o).
Теорема. Если пространство Е конечномерно, то для того,
чтобы линейное отображение f пространства Е в F = f(E) было
взаимно однозначно, необходимо и достаточно, чтобы ядро
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА ИГ
f"1 (о) отображения f сводилось к единственному элементу ое£;.
тогда обратное отображение f~l будет линейным отображением.
F наЕ
В самом деле, если f(x) = f(x'), то f(x — x') = о; стало быть,
х — х' е f~l(o). Следовательно, если f~l(o) сводится к
единственному элементу о, то х = х'.
Пусть у\ и У2 — два элемента из F==f(E), и пусть хх е /_1(f/i)>-
x2<^f~l(ffe)- Согласно предыдущему, если /_1(о) = о, то *j
и #2 единственны. Но во всех случаях у\ + У2 = f(x\) + /(^2) =
= f(Xi + x2), значит, х{ + x2^f^(yi + у2)\ и ?u/i = V(xi) =
= f (A*i), следовательно, Х*4 е /"^(^/i)-
Поэтому если /~"1(о) = о, то Г"1 есть линейное
отображение F на £; f и /~* устанавливают изоморфизм между Е и F.
Для f"*1 (о) =£ о предыдущее доказательство показывает, что*
если F' есть векторное подпространство пространства F, то
множество £' = /_1 (F') из £ есть векторное подпространство
пространства Е.
§ 3. Ранг линейного отображения
Случай векторного пространства Е конечной размерности я.
Пусть еи ..., еп — базис пространства Е и f — линейное
отображение Е в F. Любой элемент х е Е представим в виде
х = gi<?i + ... + gnen, и значит, /(а:) = gi/(ei) + ... +lnf{en).
Таким образом, векторное пространство f(E) порождается-
векторами /(ei), ..., f(en)\ образ каждого элемента х^Е
известен (т. е. известно линейное отображение /), если известны
элементы f(ei), ..., f(en) из F.
Обратно, пусть заданы п элементов си •.., сп из F;
поставим в соответствие элементу х = %\С\ + ... + \п^п элемент
У = Ъ°\ + ... + InCn из F. Непосредственно видно, что тем
самым определено линейное отображение пространства Е в F\.
следовательно, все линейные отображения одного
конечномерного векторного пространства в другое представимы в этом
виде.
Ранг линейного отображения. Рангом линейного
отображения f называется (конечная или бесконечная) размерность
векторного пространства f(E). Если Е имеет конечную
размерность п, то, поскольку ранг г не может превосходить п, находим,,
что г конечно иг4п.
Пусть G есть факторпространство ЕЦ~~1(о)\ между О и f(E)
имеется взаимно однозначное соответствие.
Действительно, если у=* f(x) = f(x')^f(E), то х — x'<^f-x(o)r
и значит, х и х' принадлежат одному и тому же классу эквмва-
113
КНИГА II. АЛГЕБРА
лентности, который является элементом пространства G.
Обратно, если х и х' принадлежат одному и тому же классу
эквивалентности из G, то, по определению эквивалентности, х — х' е
е /-1 (о); поэтому f(x — x') = о и f(x)= f (х').
Это взаимно однозначное соответствие является линейным
отображением, а следовательно, изоморфизмом, ибо если
il\ = /(*i), У2 = f(x2), то, с одной стороны, у\+у2 = f(*i + х2),
и значит, у\ + у2 соответствует классу эквивалентности суммы
х\ + х2\ а с другой стороны, Xyi = f(kx\), и значит, Ху\
соответствует классу эквивалентности произведения Хх\.
Таким образом, г = dim / (Е) = dim G = dim E — dim /-1 (о),
и значит, г = п — dim f~l (о).
Итак, для того чтобы f было взаимно однозначным
отображением Е на F, необходимо и достаточно, чтобы dim /_1 (о) = О,
т. е. г = п, или чтобы dim f(E) = dim E = п.
А если е\, -. •, еп есть базис пространства Е, то, как
известно, f(E) порождается элементами f{ex), ..., f(en)\
следовательно, г есть максимальное число линейно независимых
векторов }(ег), ..., f(en).
§ 4. Композиция отображений
Композиция отображений. Пусть Е, F, G— векторные
пространства над одним и тем же полем /С, и пустц / есть линейное
отображение векторного пространства Е в векторное
пространство jF, a g— линейное отображение F в векторное
пространство G; тогда каждому х'е£ соответствует у = f(x)^F;
положим z = g(y)^ G. Соответствие, которое элементу х <= Е
относит элемент z^G, есть композиция отображений gof (см.
Книга I, гл. II, § 4).
Отображение gof является линейным отображением;
действительно, gof(Хх) = g[f(hx)] = g[Xf(x)] = Xg[f(x)] = %gof(x) и
g°f(x + y)= gif(x + У)] = g[f(x) + f(y)] = g[f(x)] + g[f(y)] =
= g °f(x)+ g °f(y)- Это отображение называется линейной
композицией отображения / на g.
Пример. Пусть Е — векторное пространство R2 элементов
Ж = (£ьЫ- Пусть далее / — линейное отображение Е в £,
определенное посредством у = (гц, т)2) = /(Ж), где тц = agi + Р£2,
r\2 = y5i + б^2, и пусть g — линейное отображение Е в
^определенное посредством г = (£ь £2) = £(!/)> гДе £i = a'*li + P'ri2,
£2 = y'1!! + 6rr|2. Тогда отображение goj^ пространства £ в Е
определяется посредством z= g[f(x)] и £1 = a"£i + р"|г, Ь = y"£i +
+ 6"Ь, где а" = аа' + Yp', р" = Ра'+ бр', у'7 = «y' + Y^',
■б" = Py' + 66'.
Можно заметить, что отображение f.og пространства Е в Е
определяется посредством z = /[#(£)], и £4 =* a'"gi + р'"|2>
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА
119'
U = Ч"% + 6"Ъ, где а'" = аа' + pY', р'" - ар' + рб', у'" =
= уа' + 6y', y'" = YP' + 66'-
Этот пример показывает, что, вообще говоря, gofфfog.
IV. ЛИНЕЙНЫЕ ФОРМЫ, СОПРЯЖЕННОЕ ПРОСТРАНСТВО
§ 1. Определения
Линейные формы, сопряженность. Пусть Е— векторное
пространство над полем К. Напомним, что линейная форма на Е
есть линейное отображение ф пространства Е в поле К, которое
рассматривается как векторное пространство над собой. Таким
образом, каждому х^Е при отображении ф соответствует
элемент ф(д:)е/С, и ф(Кх) = Кср(а:), ф(д:1 + х2) = ц(х\) + у(х2) для
любых х, Х\, х2*из Е и К из К.
Пус'гь теперь ф — линейная форма на £, а К— число из К\
отображение х—><р(Кх) является линейной формой ф^;
действительно, ф(Яд:)е К и q>x(\xx)= q>(K\ix) = \мр(Хх) = \мр%(х) для
любого \х еК\ точно также, если ^е£ и ^2^£, то уь(х\ + х2) =
= ф(Я(*1 + лг2))= q>(Kxi) + ф(Ял;2) = Ф^(^1> + Фь(*2). Эту
линейную форму мы будем вместо ц% обозначать Яф.
Точно так же пусть ф! и ф2 — две линейные формы на Е\
отображение х^к$\(х)+у2(х) тоже является линейной
формой ф. Действительно, <§(х) = ф1 (л:) + ф2(л;)е К\ с другой
стороны, ф (Ял:) = ф1 (Кх) + ф2 (Кх) = Яф1 (х) + Яф2 (л:) = Kty (x) для
ЛЮбЫХ Х^Е, К&К И ^ (Х\ + Х2) = ф] (Х\ + Х2) + ф2(Х1 + Х2) =
= Ф1 (^i) + ф1(*г) + фг(*1) + Ф2(а:2) = t|)(*i) + $(х2) для любых
Х\ е Еу х2 е Е. Эту линейную форму будем вместо ф
обозначать ф1 + ф2-
Следовательно, два предыдущих соглашения позволяют все
линейные формы на Е объединить в векторное пространство над
полем К.
Определение. Множество линейных форм на Е составляет
векторное пространство, называемое сопряженным к Е и
обозначение Е*.
Нейтральной формой является та, которая всякому х^Е
ставит в соответствие элемент 0 из /С, т. е. i(x) = О при любом
Случай конечномерного пространства. Пусть Е имеет конеч--
ную размерность п, и пусть ей ..., еп — базис в Е. Тогда
любое х записывается в виде х = 1\е\ + ... +1пеп. Число Ih^K
зависит от х е Е\ рассмотрим отображение щ пространства Е
в /С, определенное соотношением ф^ (я) = |л. Функция фЛ есть
линейная форма на £. В самом деле, щ(Кх) = Я£л = Кщ(х)\
кроме того, если Xi = gii^i + ... + |nien, *2 = Si2^i + ... + \ntfn+
то фЛ(д:1 +.x2) = Im + Ы = Фл(*0 + Фл(*г).
Ц20 КНИГА II. АЛГЕБРА
Линейные формы <рь ,.., фп являются, по определению,
элементами сопряженного пространства Е*. Они линейно
независимы, ибо если бы Я1Ф1 + л. + Лпфп = £, где не все Ль
..., Кп — нули, то для любого х&Е имели бы liq>i(x) + ...
.. • +Kq>n(x) = £(*) = 0. Возьмем а: = eh\ тогда ф<(ел) = 8*л, т. е.
Фг(^л) =0, если f ^А, и ф<(ел) = 1, если i = А. Получаем
Л1Ф1 (вл) +...+ Япфп(ел) = 0, или для любого А имеем Льфл(ел) =
=Лл = 0; а так как Л может принимать значения 1, ..., п, то
этот результат противоречит тому, что не все Ль ..., Лп равны
нулю.
Пусть теперь ф есть произвольная линейная форма на Е.
Тогда, если х = £i0i + ...+ lnen, то ф(#) = gi9(*i)+...+ Ъпу{еп)\
но |/1 = фл(л:), и если мы положим |1л = ф(вл), то получим
•<р(*)=|А1ф1(*)+ ••• + И<пфп(*)> т. е. ф = р,1ф1 + ... + цпфп, где
\ih = /(, а фл s £*.
Теорема. Всякая линейная форма ф££* является линей-
мой комбинацией с коэффициентами из К линейно независимых
форм фь ..., фп; последние составляют базис пространства Е*\
Е* конечномерно и имеет ту же размерность п, что и Е.
§ 2. Ранг линейного отображения.
Ранг линейного отображения. Пусть имеются два
векторных пространства над одним и тем же полем /С, скажем, т-мер-
ное пространство Е и я-мерное пространство F. И пусть f есть
линейное отображение Е в F ранга г.
Допустим, что &ь • •, Ьп — базис в F. Тогда для любого
х^Е имеем f(x) =r\\bi + ... + цпЬп-
Отображение фь определенное соотношением г]г=фг(л;),
является линейной формой на Е (§ 1). Но f(x) = f{x')9 если
х — /g/_1(o), и обратно; следовательно, фг- принимает одно
и то же значение для всех элементов х, принадлежащих одному
классу эквивалентности х относительно /-1(°) (разд. II, § 4).
Таким образом, можно положить т]* = ф*(я), и тогда ф* будет
линейной формой на факторпространстве G = E/f~l (о); иными
словами, (pi принадлежит пространству G*, сопряженному к G.
Мы видели (§ 3), что г = dim G, и по теореме предыдущего
параграфа dim G = dim G*.
Следовательно, векторное подпространство, порожденное
в Е* линейными формами фг, имеет размерность k ^ г.
Пусть е\, ...,ет — базис в Е. Так как f(E) имеет
размерность г, то среди элементов f(e\), ..., f(em) можно выбрать г
линейно независимых; допустим, что это будут gl=f(e{), ...
• ••> gr = f(er). Тогда дополним gu ..., gr элементами gv+i, ..,
..., gn из F так, чтобы элементы gu • • •, gn составляли базис
лространства F (теорема о неполном базисе). Тогда для любого
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА
12Г
хе£ будет выполняться f(x) = tyi(x)gi + ....+ tyr(x)gr\
функции tyh снова будут линейными формами на £. Они линейно
независимы, ибо если бы оказалось, что X\ty\ + ... + Ягфг = £, где
£—нулевая линейная форма, т. е. £(#) = () при любом х^Еу
то для х = eh мы имели бы kity\(eh) +... + %r^r{^h) = 0. Но
f(eh)=gh, если ft=l, ...,r, и значит, г|?л(еЛ) =='6^ для
ft = 1, ..., г. Стало быть, А,л = 0 для h = 1, ..., г, что
доказывает линейную независимость фд.
Имеем 6* = yng\ + ... + Yingn для i = 1, ..., я.
Следовательно,
/M = <Pi(*)&i+ •-. +фЛ(^)&« —[УнФ1<^)+ ••• + УшФл W] fiTi + • --
Так как gu ..., gn составляют базис и f(x) = i|?i (Ar)g'i + ...
.. • +tyr(x)gr, то единственность этого разложения показывает,,
что $h(x)=*yih$\(x)+...+упнЪп(х), h = 1, ..., г, т. е. грЛ =
= YifcqH + • - • + Yn/i<Pn-
Таким образом, фь ..., фг принадлежат пространству,
порожденному фь ..., фп, а поскольку они линейно независимы^
то указанное пространство имеет размерность _^>г. Итак,
доказана
Теорема. Ранг г линейного отображения f пространства Е
в F является также размерностью векторного пространства,
порожденного линейными формами фЬ ..., фп в пространстве £*„
сопряоюенном к £.
Пусть е[, ..., е'п—произвольный базис пространства £;
тогда для любого х е Е имеем
*-&!*;+ ... +imC f(*H6i/(*9+ ••• +UK)-
Но /(^/)=:=Pi/6i+ ••• +Рп/*я'/в1» •••» W следовательно, /(*) =
== -П1&1 + . . . +Лп6п, ГДе Ц\ = Pilll + . . . + Pimgm, l = 1, . . . , П.
Поскольку r|i изоморфны формам фг-, то элементы (р<ь ..., pim)
векторного пространства /Cw порождают векторное
подпространство размерности г.
V. БИЛИНЕЙНЫЕ И ПОЛИЛИНЕЙНЫЕ ФОРМЫ
§ 1. Билинейные формы
Пусть имеются два не обязательно различных векторных
пространства Е и F над одним и тем же полем К.
Определение. Билинейной формой на Е X F называется
такое отображение произведения Е X F в поле /С, сужение
которого на Е и на F представляет собой линейную форму.
Это определение означает, что если xg£, J/ e F, то
отображение (х, у) -> ф (х, у) е К будет билинейной формой в том
122
КНИГА II. АЛГЕБРА
•случае, если
ф(Ь:, y) = Aq>(*i, у), ф(*, \*>у) = т{х, у),
<Р (хх + хъ у) = ф (х{, у) + ф (*2, у), Ф (я, Ух + у2) = Ф (a:, f/i) + Ф (х, у2)
при любых х, Хх, х2 из £, у, #ь #2 из Т7 и Я, |i из /С.
Примеры. 1. Пусть «ф есть линейная форма на Е, а % —
линейная форма на F; и пусть х^Е, y^F. Тогда (я, у) есть
элемент векторного пространства Е X F. Отображение ф,
определимое как (х, у)—>^(х)%(у), является билинейной формой;
действительно,
Ф (А*, г/) = ф {Хх) % (у) = Я1|) (*) % (у) = Яф (х, у),
Ф (*i + х2, у) = Ц (хх + х2)-% (у) = fo (*,) + ф (х2)] % (у) =
= Ф (*i) X (f/) + Ф (*2) X (У) = Ф (*i, У) + Ф (х2, У)-
Точно так же проверяются эти свойства относительно F.
Вообще, если фь ..., ф* — линейные формы на £, а хь • • •
• • •» Xfe — линейные формы на F, то отображение ф, которое
элементу (х,у)^ Е X F ставит в соответствие элемент ф (а:, у) =
= tyi(x)%\(y) + ... +tyk(x)%k(y) из К, есть билинейная форма.
2. Пусть Е — векторное пространство непрерывных
функций х на замкнутом интервале [а, р]. Пусть далее х е Е и
у е £; отображение /
Э
(*, y)-+I(x, y)= j х (/) у (О Л
а
есть билинейная форма на Я X Е.
Определение. Билинейная форма ф на Е X Е называется
симметрической, если ф(#, у) = ф(#, #) (Элл все* х^Е, у^Е.
Симметрические билинейные формы построить легко: в
самом деле, пусть \р(х,у) есть произвольная билинейная форма
на Е X Е\ тогда отображение ф, определенное посредством
(х, у) -* г|) (х, у) + «ф (у, х), будет симметрической билинейной
формой.
Пример. Скалярное произведение двух свободных
векторов из R3 есть симметрическая билинейная форма на R3 X R*-
Определение. Билинейная форма ф на Е X Е называется
знакопеременной, если ф(х, у) = —ф(#, х) для всех х^Е, у^Е.
Для такой формы имеем ф(д:, х) = —ф(#, х) = 0.
Если ty(x, у) есть произвольная билинейная форма на ЕхЕ,
то отображение ф, которое элементу (я, у) из Е X Е ставит в
соответствие ф(#, у) = ty(x,y) —ty(y,x) из К, будет, очевидно,
знакопеременной билинейной формой.
Пример. Векторное произведение двух свободных векторов
выражается знакопеременной билинейной формой на R2 X R2
cK = R.
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА 12а
Если поле К есть поле С комплексных чисел, то иногда
рассматривается такое отображение г|э элементов (х, у) на С, чта
ty(x, у) является линейной формой на £, а ф(л;, у) — линейной
формой на F, где ф(#, у) является линейной формой, комплексно
сопряженной с \р(х, у). Такое отображение называется полутора-
линейной формой на Е X F. В этом случае ty(Xx, у) = К$(х, у)у
но ф(*Ду)= Ц(х, у).
Пример. Пусть х, у — комплекснозначные функции
действительного переменного t, непрерывные на замкнутом
интервале [а, р]. Отображение /, определенное как
Э
(*, у) -> / (х, у) = J х (t) y(t) dt,
a
есть полуторалинейная форма. (Ср. Книга III, гл. IV.)
§ 2. Свойства билинейных форм
Мы ограничимся случаем, когда Е и F имеют конечную раз-
мерность. Допустим, что Е имеет конечную размерность п, а
F — конечную размерность т. И пусть eit ..., еп — базис
пространства £■,&!,..., Ьт—базис пространства F. Тогда для
любых хе£, j/gF имеют место представления
* = £iei+ ••• + 61А1. y = Y\\bi+ ... +ч)тЬт'
Если ф — билинейная форма на Е X F, то
п / т \
<р(*. у) = S 2 Sm/Ф to, */)) •
Следовательно, значения формы ф(д:, у) в /С будут известны
для любой пары (а:, у), лишь только станут известны пт чисел
ф(^, bj) из К, и значит, ф полностью определяется числами
q>ta, ftj).
Обратно, поскольку £* есть линейная форма на £, a t^j —
линейная форма на F, то отображение (x,y)-*liK\j есть
билинейная форма на £ X F\ более того, всякое отображение ф, которое
паре (х, у) из Е X F ставит в соответствие элемент из К
п / т \
ф(*> у)= 2 2 <х,Д,т|/) »
где aij — произвольные фиксированные числа из К, есть
билинейная форма па Е X F.
324 КНИГА II. АЛГЕБРА
п / т \
Следовательно, сумма ^iSa*/!^/] определяет общую би-
*=i\/«1 /
линейную форму на Е X F при фиксированных базисах в Е
ив/7.
Симметрическая билинейная форма на Е X Е будет
характеризоваться условиями a,ij = ал при любых i Ф /.
Знакопеременная билинейная форма на Е X Е будет
характеризоваться условиями ац = —ал, если i ф /, и ац = 0.
Если К — поле комплексных чисел С, то всякая полуторали-
нейная форма на Сп записывается в виде
п / m \
§ 3. Полилинейные формы
Понятие билинейной формы легко обобщается следующим
образом.
Определение. Пусть имеются не обязательно различные
векторные пространства Еи ..., Еп над одним и тем же полем К\
полилинейной формой порядка п на Ех X Ег X ... X Еп
называется такое отображение векторного пространства —
произведения Е\Х Е2Х ... X Еп в поле /С, сужения которого на
пространства Ef для / = 1, ..., п являются линейными формами.
Пусть Xi е Е{; отображение (хи ..., хп)-*ц>(хи ..., хп)^ К
будет, таким образом, полилинейной формой, если, каково бы
ни было i,
<p(#i, ..., Xi~i, Xxif Xi+b ..., xn)~X(p(xit ..., xn),
Определение. Полилинейная форма на Еп называется
симметрической, если ф(хь ..., хп)=*у(хт19 ..., хтп) для любых
перестановок п%и ...» wn целых чисел 1, ..., м.
Определение. Полилинейная форма на Еп называется
знакопеременной, если она меняет знак при перемене местами двух
элементов.
Такая форма будет обращаться в нуль для любой точки
(хи ..., *п) из Еп, у которой Xi =» Xj при i ф /. Обратно, послед-
лее свойство является достаточным для того, чтобы форма была
знакопеременной; действительно, для любых xiy х&, ..., х„еЯ
имеем
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА 125
так как первые элементы равны. Отсюда выводим
<p(*i, *и *з» •••> Хп) + Ч>(Х\> хъ *з> •-.» хп) +
+ Ф (#2> Х\9 Х3, • - •» #Л) + Ф (^2> #2> *3> • • • i Хп) = 0.
Первый и последний члены равны нулю, ибо первые элементы
в ф равны; поэтому
ф(*1, Х2, Х3, ..., *«)==- ф(*2. Хь Х3, ..., Хп).
Это доказательство можно повторить для пары элементов
с любыми индексами.
Мы не будем останавливаться на теории полилинейных
форм. Но в теории определителей мы встретимся с важным
примером этих форм.
VI. ЛИНЕЙНЫЕ УРАВНЕНИЯ
§ 1. Общая теория
Линейной системой п уравнений с m неизвестными
называется система равенств
a/ii£i + • • • + алт£т — Р«; J
(1)
величины ацу Рь суть заданные числа из поля /С, а числа gi, ...
..., |w из К, называемые неизвестными, требуется вычислить.
Если множество чисел fcbjfe» •••» Ёт» таково, что при подстановке
их в систему все уравнения удовлетворяются одновременно, то
это множество называется решением системы.
Систему (1) легко можно истолковать в терминах
векторных пространств. Действительно, возьмем векторное
пространство Кп и положим
a, «(an, ..., ад1), ..., ат = (а1ш ..., апгп), Ь=*ф{, ..., р„);
эти величины являются элементами из Кп. Тогда система имеет
те же решения, что и следующее равенство между элементами
из Кп:
*!*!+ ••• +lmam = b, (2)
т. е. b должно выражаться в виде линейной комбинации
элементов а\, ..., am. Решение системы сводится к нахождению всех
множеств (|ь ..., gm), позволяющих записать Ь в форме (2).
1° Система Крамера. Допустим сначала, что пг = п и что
элементы аи ..., ап из Кп линейно независимы-, в этом случае
(1) называется системой Крамера.
126
КНИГА II. АЛГЕБРА
Поскольку элементы аи •.., сгп линейно независимы, то они
составляют базис пространства Кп; следовательно, всякий
элемент b представляется, и притом единственным способом,
в форме (2).
Таким образом, система Крамера всегда имеет решение, и
притом единственное.
2° Общий случай. Ясно, что для того, чтобы (2) имело по
крайней мере одно решение, Ь должно принадлежать
векторному подпространству Я пространства Кп, порожденному
элементами аи ..., ат. Допустим, что среди элементов аь ..., ат
максимальное число линейно независимых элементов будет
г ^ т, и пусть ai, ..., аг — эти г линейно независимых
элементов; они составляют базис подпространства Я. Неизвестные
|ь • • • > 1г называются главными неизвестными, а неизвестные
•gr+i, ..., lm, если они существуют, называются
вспомогательными неизвестными.
а) Если Ь линейно независимо от аь ..., аг, то b фН, и
система (1) не имеет решения.
б) Если^б линейно зависимо от аи ... ,#г, то бе Я, а
поскольку элементы ar+i, ..., am также принадлежат Я, то и
любой элемент вида V = b — Ir+i^r+i — ... — lmdm s Я, каковы
бы ни были значения, задаваемые вспомогательным
неизвестным. Тогда соотношение (2) записывается в виде 1\а{ + ...
... + Irdr = b\ Для заданного Ъг имеется решение (|ь ..., \г),
и притом только одно, ибо аи ..., аг есть базис в Я.
Резюмируем:
а) Если b линейно независимо от аи ..., аг, то система не
имеет решения.
б) Если b линейно зависимо от аи ..., аг, то система всегда
имеет по крайней мере одно решение; она имеет бесконечное
множество решений, если существуют вспомогательные
неизвестные, причем последним можно задавать значения произвольно.
§ 2. Однородные уравнения
Определение. Говорят, что система (1) однородна, если
Pi =■ ... = рп — 0, т. е. если b = о в (2) (предыдущий
параграф).
В этом случае b = о всегда линейно зависит от аи ..., аг, и
значит, всегда имеется по крайней мере одно решение; впрочем,
это решение очевидно; именно, gi = ... = gm = 0. Исследуем,
будет ли однородная система обладать другими решениями,
кроме решения £i = ... = |m = 0. Согласно предыдущим
результатам для этого необходимо и достаточно, чтобы ах, ..., От
были линейно зависимы; действительно, в этом случае
существуют вспомогательные неизвестные, которым можно задавать
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА 127
ненулевые значения. В частности, это будет так, если т> п,
т. е. если число неизвестных превышает число уравнений.
Определение. Однородной системой, соответствующей оби{ей
системе (1), называется система, полученная заменой pi, ..., рп
на 0. Таким образом, (2) заменяется на g4ai + ... + \mam = о.
Рассмотрим случай m = п.
Альтернативная теорема. Если однородная
система, соответствующая (1), не имеет иного решения, кроме
решения |i= ... = In = 0, то аи ..., ап линейно независимы, и
значит, (1) есть система Крамера и поэтому имеет единственное
решение при любых [Ji, ..., рп.
Если однородная система, соответствующая (1), имеет
другие решения, кроме решения: gt = ... = gn = 0, то аи ..., ап
линейно зависимы и существуют такие значения рь ..., рп, при
которых система (\) не имеет ни одного решения.
Эта теорема часто используется для того, чтобы выяснить,
является ли данная система системой Крамера.
§ 3. Метод последовательных исключений
Практическое решение линейных уравнение. Метод
последовательных исключений. Предположим сначала, что ап\ = ... =
== ctnm = 0, т. е. что последние компоненты у аи ..., ат равны
нулю. Тогда, если рп Ф 0, то система несовместна; если же рп =
= 0, то система имеет те же решения, что и система п— 1
уравнений с т неизвестными; в этом случае говорят, что две
системы равносильны.
Теперь предположим, что по крайней мере одно из чисел
am, ..., ocnm отлично от нуля, например апт Ф 0. Сведем все
к предыдущему случаю. Действительно, образуем элементы
a^ = a*~"Sram ДЛЯ й==1»--->™-1 и b' = b--^am.
Ясно, что последние компоненты элементов а\, ..., a'm_v Ьг
равны нулю. Рассмотрим систему \[a\ + ... + Vm-\a'm-\ = b\ Онаг
равносильна системе п— 1 уравнений с/п~1 неизвестными.
Допустим, что известно ее решение, скажем, (£{, ..., Vm-.\)\ тогда
т. е.
где
128
КНИГА II. АЛГЕБРА
Следовательно, |,=|р ..., |m = |^ есть решение
первоначальной системы.
Обратно, если (6i, ..., £m) является решением для системы
fcitfi + ... +lmbm = b, то, исходя из последнего уравнения,
имеем
\т = "J^~~ Фп "" a*l6l —•••"• anm-l6m-l)>
и (|ь ..., |т-!) есть решение системы
Таким образом, система |ia4 + ... + 6тат = Ь из п
уравнений с т неизвестными равносильна совокупности системы
1ха[+ ... +6т_1а|я_1ш:*/ из я—1 уравнений cm—1
неизвестными и соотношения
lm = "7| (Pft~~artl£l~" ••• "~" anm-l6m-l)'
Короче говоря, процесс заключается в том, чтобы при аПт Ф
ФО выразить |т из последнего уравнения системы (1) как
функцию от gi, ..., gm_i и подставить в предыдущие уравнения,
после чего получится система из п—1 уравнений cm—1
неизвестными. Этот метод называется методом последовательных
исключений; он является единственным практическим методом
для решения систем с числовыми коэффициентами.
Продолжая этот процесс, приходим либо к противоречию, и
тогда система не имеет решения, либо к единственному
уравнению, которое тогда сразу решается.
С практической точки зрения процесс сводится к умножению
последнего уравнения на — -^- и сложению его с k-u уравне-
апт
нием последовательно для k = 1, ..., п— 1; кроме того, сохра-
нияется соотношение
Пример. Пусть имеется система
2&1-& + Е4-4,
4£,-2£2 + £з + 14 = 7,
661-362 + 263-64 = 8,
861-462 + 363-64-И-
Здесь aw = —1=£0. Умножим последнее уравнение
последовательно на 1,1, —1 и сложим с тремя первыми; получим
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА
129
равносильную систему
Ю|1-5|2+3|з=15,
12|,-6|2 + 4|3=18, с 14-81,-4^ + 363+11.
-2&1 + £2- g3=-3
В системе 3 уравнений с 3 неизвестными имеем азз = — 1 Ф 0;
умножив последнее уравнение последовательно на 3 и на 4
и прибавив к двум первым, получим равносильную систему
4^-262 = 6, .
с £з = -2^ + 12 + 3.
4i!-2g2 = 6
В системе двух уравнений с двумя неизвестными имеем
022= —2=^0; умножив второе уравнение на —1 и прибавив
к первому, получим равносильную систему
0.£i = 0 с |2-2|,-3.
Ясно, что |, произвольно, а
h -2g,-3,
Ез 2Б, + 62+3 2gI + (2£1-3) + 3-0>
Б4 = 8Б,-462 + ЗБз-И-8Б,-4(2Б,-3) + 3.0-11-1.
Следовательно, |, — вспомогательное неизвестное, и система
имеет бесконечно много решений (|,, 2gi — 3, 0, 1).
VII. АФФИННЫЕ ПРОСТРАНСТВА, ВЫПУКЛЫЕ МНОЖЕСТВА
§ 1. Линейное аффинное многообразие, аффинные
преобразования
В этом параграфе мы обобщим обычные геометрические
понятия прямой и плоскости.
Перенос в векторном пространстве. Пусть имеется векторное
пространство Е над полем К; пусть а есть фиксированный
элемент из Е. Вместо термина элемент мы будем употреблять
также термин точка из Е.
Отображение пространства Е в Еу ставящее в соответствие
каждому xg£ точку уе£, заданную равенством у = х + а,
называется параллельным переносом; при этом а называется
вектором переноса.
Это отображение является взаимно однозначным отображе*
нием пространства Е на себя, но при аФо оно не будет
линейным отображением; действительно, образ элемента Кх не
совпадает с Ху, а образ элемента Xt + x2 не совпадает с z/i + r/2*
б Ш. Пизо, М. Заманский
130
КНИГА И. АЛГЕБРА
Переносы образуют коммутативную группу. В самом деле,
пусть Ъ — другой вектор переноса. Этот перенос элементу у =
= х + а ставит в соответствие элемент г = у + 6; тогда z = х +
+ а + Ь9 и значит, от а: к г переходим при помощи переноса
а + Ь. Нейтральный перенос соответствует вектору переноса о,
т. е. тождественному преобразованию пространства Е\ перенос
при помощи вектора —а есть перенос, противоположный
переносу при помощи вектора а.
Линейное аффинное многообразие. Пусть V — векторное
подпространство пространства Е и а есть фиксированный
элемент из Е. Множество точек пространства Е, полученное из V
переносом на а, называется линейным аффинным
многообразием и обозначается через Ка.
Очевидно, всякая точка х из Va имеет вид х *= v + а, где
Заметим, что, за исключением случая а е Vy Va не будет
векторным пространством.
Напротив, если х и х* — точки из Va, то х = v + а, х' = v' +
+ а, где v е V, v' е V, и значит, х — х' = v — y'e V.
Следовательно, две точки х, х* е Va принадлежат одному и тому же
элементу векторного факторпространства E/V (гл. VII, разд. II,
§ 4), являющегося множеством классов эквивалентности по
отношению эквивалентности: х ~ #'ФФ х — х'еУ, Иными
словами, Va е E/V.
Пусть Va есть линейное аффинное многообразие и пусть
а' — произвольная точка из Va. Любая точка x^Va может быть
записана как х = а + v, где ogV, Но можно также записать
х = а' + (а — a')+v; а поскольку а и а7 принадлежат Va, то
fl-fl'E^, и х = а' + v\ где v' = (а — а') + и е V. Таким
образом, каждое ^е^ принадлежит Va*\ точно так же
показывается, что каждое xf e Var принадлежит Va. Стало быть, Va =
- VV.
Следовательно, будем считать, что подмножество W
векторного пространства Е является линейным аффинным
многообразием, если для любого элемента a^W множество всех х — а,
где хе117, есть векторное подпространство V пространства Е.
Записывается W = а + V.
Размерностью линейного аффинного многообразия Va
называется размерность векторного пространства V (эта
размерность может быть бесконечной).
Множество W называется аффинным подмногообразием
многообразия Va, если W есть линейное аффинное
многообразие и если W d Va.
Параллельные аффинные многообразия. Два линейных
аффинных многообразия Va и Vb> полученные из одного и того же
векторного пространства V, называются параллельными.
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА 131
Ясно, что Va = Уь или VaOVb — 0 в зависимости от того,
будет ли Ь — а е V или Ь — а ф V. В частности, Va параллельно
V= V0.
Понятие параллельности есть отношение эквивалентности;
это отношение рефлексивно, так как Va параллельно Va,
симметрично и, наконец, транзитивно, ибо если Va параллельно Уь
и Уь параллельно Vc> то Va и Vc получены из одного и того же
векторного подпространства V, а значит, параллельны.
Соответствующий класс эквивалентности называется
направлением многообразия.
В качестве представителя направления всегда имеем
аффинное многообразие Vo, т. е. векторное подпространство V,
охарактеризованное как аффинное многообразие, содержащее точку о.
Заметим, что два параллельных многообразия имеют
одинаковую размерность.
Параллельность в широком смысле. Будем еще говорить, что
два линейных аффинных многообразия Va и Wb параллельны
(в широком смысле), если одно из них параллельно некоторому
линейному подмногообразию другого.
Пересечения линейных аффинных многообразий. Пусть Wi—
линейные аффинные многообразия в одном и том же векторном
пространстве Е. И пусть W = f\Wt есть пересечение всех Wt.
i
Если W ф 0, то найдется хотя бы одна точка а, общая всем Wu
но тогда можно написать W< = а + V*, где V* есть векторные
подпространства пространства £. Возьмем К = (^У4;У есть
i
векторное подпространство пространства Е (гл. VII, разд.1,§2);
всякий элемент w^W будет иметь вид w = а + v, где
vezV-flVt.
i
Обратно, любая точка w = а + v, где ugI/, принадлежит
№ = fj WV Таким образом, W = f\Wi есть линейное аффин-
i - i
ное многообразие.
Пересечение всех линейных аффинных многообразий,
содержащих какое-то подмножество Р пространства Е, является
минимальным линейным аффинным многообразием, содержащим
Р\ это многообразие называется линейным аффинным
многообразием, порожденным множеством Р.
Рассмотрим теперь линейное аффинное многообразие,
порожденное двумя различными точками а0 и ах из Е.
Параллельное многообразие V, содержащее о, содержит точку ai — аоФо,
и значит, его размерность ^1. Тогда линейное аффинное
многообразие D, состоящее из точек ao + k(a\ — a<>), где % есть
произвольное число из К, имеет размерность 1; оно содержит
5*
132
КНИГА II. АЛГЕБРА
точки а0 и а\\ следовательно, это есть минимальное линейное
аффинное многообразие, порожденное точками а$ и а\.
Это линейное аффинное многообразие D называется прямой,
проходящей через а0 и ah
Таким образом, через две различные точки в Е проходит
одна и только одна прямая.
Вообще, рассмотрим k + 1 точек а0, аи .. ., аь из Е,
различных или нет. Пусть W есть линейное аффинное многообразие,
порожденное этими точками, а V—векторное пространство,
параллельное W, проходящее через точку 0. Это векторное
пространство V содержит k точек at — а0, ..., ak — а0;
следовательно, оно содержит векторное пространство V, порожденное k
элементами #i — а0, ..., ак — ао.
Тогда линейное аффинное многообразие а0 + V содержит
k + 1 точек а0, аи ..., аь, и ясно, что это есть минимальное
линейное аффинное многообразие, которое их содержит. Стало
быть, V = V, a W = а0 + V. Размерность г многообразия W
равна размерности пространства V, поэтому г ^ k.
Определение. Говорят^ что k + 1 точек аффинно независимы,
если линейное аффинное многообразие, порожденное этими
точками, имеет размерность k.
Для того чтобы k + 1 точек а0, aif ..., аи были аффинно
независимы, необходимо и достаточно, чтобы k векторов
ai — Яо, ..., &h — Яо были линейно независимы в Е. .
Аффинное преобразование. Отображение пространства Е
в Е, которое каждому х^Е ставит в соответствие у = g(x) e E
по формуле y = g(x) =f(x) + b, где f — линейное отображение
Е в Е, а Ъ — некоторый элемент из Е, называется аффинным
преобразованием.
Если Ь Ф о, то g не будет линейным отображением. Если же
b = о, то g = f есть линейное отображение, и всякое линейное
отображение пространства Е в Е является аффинным
преобразованием, у которого вектор b равен нулю.
Примеры. 1. Проекция есть аффинное преобразование.
2. Параллельный перенос является аффинным
преобразованием, причем роль линейного отображения / выполняет
тождественное отображение f(x) =« х.
3. Преобразование х-+у, определенное посредством у — с =
= Х(х— с), где с—фиксированная точка из Е, а X —
фиксированное число из К, называется гомотетией с центром с и
коэффициентом гомотетии Я. Это аффинное преобразование, причем
f{x) = кх, a b = с(1 —Я).
Свойства. Аффинное преобразование переводит линейное
аффинное многообразие в линейное аффинное многообразие.
Действительно, пусть W есть линейное аффинное многообразие;
имеем W «= V'+ а, где V—векторное пространство.
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА
133
Справедливы равенства W = g(W) = f(W) + b и f(W) =
= f(V + a) =/(K) +f(a); поэтому W' = g(W)=f(V) +.b\
где b' = f(a) + b. Но /(К) получено линейным отображением
из векторного пространства; следовательно; само является
векторным пространством V\ и при этом dim V ^ dim V. Значит
W = V + Ь', и стало быть, W есть линейное аффинное
многообразие, размерность которого не может превышать
размерности W.
Преобразование, обратное к аффинному, независимо от того
будет оно функцией или нет, также переводит^ линейное
аффинное многообразие в линейное аффинное многообразие.
В самом деле, если у = g(x) .= f(x) + b, то x&f-^y — b).
Но если у е W = V + а, то х ш f~l (V + а — Ь).
Пусть Хо — фиксированный элемент из f~l{V + a — b)\ тогда
f(x)^V + a — &, f(x0) s V + a — b, и значит, f(x — x0)&V и
x — XQ^f"l(V) = W'; таким образом, W есть векторное
подпространство (гл. VII, разд. III, § 2). Следовательно, xsF+
+ x0i и стало быть, х принадлежит линейному аффинному
многообразию.
§ 2. Барицентр
Определение. Пусть Е — векторное пространство над
полем /С, и пусть а\ ..., аи — точки из Е. Каждому аи i = 1, ..., ft,
поставим в соответствие число \ii & Ку называемое массой
точки а*. Барицентром точек аи . ., я&, снабженных массами
|xi, ..., |ife, называется любая точка т, удовлетворяющая
равенству
11^+ ... +|i*a*-(|ii+ .-• +|in)mf (l)
|ii(fli-m)+ ... +Vk(ak-tn) = o.
Г Если |Xi + |i2 + ... + и* Ф 0, то соотношение (1) дает
ца.+ ... +м,
m=« ! 1 , , * у
1*1+ •■•+!**
а следовательно, точка m существует и единственна.
2° Если jjti + ... + \ik = 0, и если jmai + ... + [xkak Ф о, то
ни одна точка из Е не будет барицентром.
Если щ + ... + \ik ■= 0 и inai + ... + jxfeafe = о, то любая
точка из Е является барицентром. В этом случае предположим
\ih Ф 0; тогда
-№kmBV>i<*i+ ••• +H*-ia*-iJ
134 КНИГА II. АЛГЕБРА
но так как \х\ + .. * + \ik = 0, то мы имеем также — \xh = \х\ + , **
fe,. + (ift_i, и значит,
\1{а{+ ... +^-1^-1 = ^1+ ••• +И*-1)яъ
причем
\ix+ ... +^_1^=0.
Следовательно, каждая точка а\, снабженная ненулевой
массой, служит барицентром других точек. Обратное доказывается
обратным рассуждением.
Теорема 1. При нахождении барицентра можно заменять
любое число точек их частичным барицентром, снабженным
суммой масс рассматриваемых точек.
Действительно, пусть m — барицентр точек а\, ..., а&,
снабженных массами \к\, ..., \ih. Следовательно,
\х{ах+ ... +1А*а* = 0х1+ ... +\xk)m. (1)
Пусть mf есть (предполагаемый существующим) барицентр
точек а\, ..., а&, снабженных массами |ц, ..., \ih, и пусть \i' =
e |ii + .. • + Ил- Тогда
\ххах+ ... + \xhah^{\xx + ••• + \*>h)m' = \i'm'\
отсюда, подставляя в (1), получаем
\i/mf + \xh+lah^l+ ... + ^^==№' + ^+1 + ••• +^)т,
что и доказывает теорему.
Теорема 2. Всякое аффинное преобразование переводит
барицентр k точек, снабженных массами \х\, ..., \ih, в барицентр
преобразованных точек, снабженных теми же массами.
В самом деле, пусть g (x) = f(x) +b — аффинное
преобразование, причем / — линейное отображение. Выполняются
равенства
a/i==8(ai)==:f{ai) + b> ' = !,.••, k.
Следовательно,
рха[+ ... +^=ji1/(a1)+ ••• +Hf{ak) + {Vi+ •■• +»**)*-
= f((|ii+ ... +\ik)fn) + (Vi+ ••• +^)& =
= (|i!+ ... +\ik)[f(tn) + b] = (\il+ ... +\ik)m'f
где mf = f(m) + b. Стало быть, m' есть образ барицентра m
точек аь ..., ak и служит также барицентром преобразованных
точек а[, ..., a'k.
ГЛ. VII. ВЕКТОРНЫЕ ПРОСТРАНСТВА ' 135
§ 3. Выпуклые множества
Отрезок. Замкнутым отрезком векторного пространства Е
над полем К называется множество барицентров х = **lfll ^a2
точек а4 и а2, снабженных массами \а ^ О, \хг^ 0, \ц + \i2Ф 0.
Точки а\ и а2 называются концами отрезка.
Линейное аффинное пространство, порожденное точками а\
и а2, т. е. прямая D, проходящая через точки а\ и а2, называется
носителем отрезка.
Всякая точка отрезка принадлежит его носителю;
действительно, отрезок является также множеством тех х из Е, для
которых выполняется х = а\а\ + а2а2, где
ctj^O, а2^0, ^+ 02=1, т. е. x = (l — а2)#1 + а2а2
или
x = ai + a2(a2 — а,), где 0^а2^1.
Это выражение показывает, что отрезок принадлежит
прямой D как линейному аффинному многообразию, порожденному
точками а\ и а2. При этом в D существуют точки, не входящие
в отрезок.
Если а2 = а\, то отрезок сводится к точке аь
Согласно § 1 аффинное преобразование переводит барицентр
в барицентр; следовательно, оно переводит отрезок в отрезок.
Множество G точек из Е называется выпуклым множеством,
если, каковы бы ни были а\ <= G и а2^ G, все точки замкнутого
отрезка, определенного точками а\ и а2, принадлежат G.
Пример. Линейное аффинное многообразие является
выпуклым множеством.
Свойства. Г. Поскольку аффинное преобразование g
пространства Е переводит замкнутый отрезок в замкнутый отрезок,
то оно переводит всякое выпуклое множество из Е в выпуклое
множество из Е.
2°. Обратно, пусть g есть аффинное преобразование
пространства Е и G' = g~l(G) — прообраз выпуклого множества G.
Если а[ <= G' и а£ е G', то
a\~g{a\)^G и a2 = g(a'2)<=G.
Пусть теперь х' — точка замкнутого отрезка, определенного
точками а\ и а2; тогда х = g(x') принадлежит замкнутому
отрезку, определенному точками ах и а2, а значит, и G, ибо G
выпукло. Следовательно, х' принадлежит прообразу Gr множества
G, и поэтому прообраз G' выпуклого множества G будет
выпуклым.
3°. Пусть G\ и G2 — два выпуклых множества из Е; тогда
Gi П G2 выпукло, ибо если а4 е Gi Г) G2 и а2 е Gi П G2, то
136
КНИГА II. АЛГЕБРА
каждая точка отрезка, определенного точками ai и а2,
принадлежит Gi и G2, а значит, и Gi Г) G2.
Эта теорема верна для пересечения любого числа выпуклых
множеств. Для объединения она неверна.
4°. Пусть Е\ и Е2 — два векторных пространства над одним
и тем же полем /С, и пусть Е — векторное пространство —
произведение Е\ X Е2. Пусть далее G\ — непустое множество из Еи
G2—непустое множество из Е2. Для того чтобы произведение
G = G\ X G2 было выпуклым множеством в Е, необходимо и
достаточно, чтобы Gi было выпукло в Е\, a G2— в Е2,
Действительно, пусть f{ — линейное отображение,
являющееся проекцией £ в £i, а /2 — проекцией Е в Е2\ тогда G\ =
= /i(G), G2 = /2(G). Так как f\ и f2 — линейные отображения,
то в случае, если G выпукло, отсюда следует, что таковыми
будут G\ и G2. Обратно, если G\ и G2 выпуклы, то Gj = /j-1 (Gt) и
G'2 = f2l(G2) будут выпуклыми множествами в £, а значит,
таковым будет и G = G\ f] G2.
Теорема остается справедливой для произведения любого
числа векторных пространств.
Выпуклая оболочка. Пусть m — барицентр точек аи ..., ak,
снабженных массами |ii > 0, ..., ^ > 0 с jjti + ... + \ik Ф 0.
Всякое выпуклое множество G, содержащее точки аи а2, ...
..., ^, содержит барицентр m этих точек, каковы бы ни были
k
массы \xh > 0, лишь бы 2 Ил > 0-
Л-1
В самом деле, для k = 2 предложение верно, ибо тогда
оно совпадает с определением выпуклого множества. Допустим,
что оно верно для k— 1 точек; тогда барицентр т' точек аи ...
..., ак-и снабженных массами \х\, ..., \ib-u принадлежит G.
Но m есть барицентр точки т', снабженной массой ^ + ...
... + ц,л_1 !>0, и точки ^, снабженной массой \ки ^ 0;
следовательно, m ^ G.
Пусть Р — произвольное множество из Е\ выпуклой
оболочкой множества Р называется наименьшее выпуклое множество,
содержащее Р.
Выпуклая оболочка представляет собой множество G всех
барицентров точек множества Р, снабженных положительными
массами.
Действительно, с одной стороны, всякое выпуклое множество,
содержащее Р, содержит множество G барицентров точек
множества Р; с другой стороны, G есть выпуклое множество, так
как если m и т' — две точки из G, то они служат барицентрами;
один — точек ^и ..., aft из Р, а другой — точек a'v ..., a'h из Р.
Тогда каждая точка замкнутого отрезка, определенного посреди
ГЛ. VIII. МАТРИЦЫ
137
ством т и т\ является барицентром точек т и т', снабженных
положительными массами, и значит, является барицентром
точек а*,, ..., ak, a'v ..., ah из Р, снабженных положительными
массами, а следовательно, принадлежит G.
ГЛАВА VIII
МАТРИЦЫ
Мы уже изучали в гл. VII, разд. III линейные отображения
одного векторного пространства в другое. Исследуем эти
отображения более подробно для случая, когда оба векторных
пространства имеют конечную размерность.
1. ОБЩИЕ СВОЙСТВА
Пусть в векторном пространстве Е размерности т выбран
базис е\, ..., ету а в векторном пространстве F размерности п —
базис Ьи .-•> Ьп. Предположим, что Е и F — векторные
пространства над одним и тем же полем /С.
Пусть далее / есть линейное отображение Е в F\ оно
переводит х^Е в j = /Wef. Разложив векторы х и у по
базисам, получим
х = 1\*1+ ••• +Ътет> У-ЛА+ ••• +ЧпЬп
if = f(*)-6if(*i)+ ••• +lmf{em).
Так как элемент /(е,) gF, to при помощи базиса b\, ,s., bn
его можно представить в виде
f{ej) = aubx + ... +anfbnt /«l, ..., т.
Следовательно,
т п t m \
У = 2 У (ej) = 2 2 *uli) Ьи
или покоординатно
(О
Обратно, если рассматривать отображение х &Е-*у ^ F,
определенное формулами (1), где ац— фиксированные числа из
138
КНИГА II. АЛГЕБРА
К, lj — компоненты вектора х относительно базиса
пространства £, a r|i — компоненты вектора у относительно базиса про*
странства F, то легко видеть, что это отображение будет
линейным отображением Е в F. Стало быть, оно задано, если известна
прямоугольная таблица коэффициентов сс^, записываемая
следующим образом:
(а11 • • • alm \
)=(«</)■
Такая таблица называется матрицей, а числа а^ называются
ее элементами) все они принадлежат одному полю К.
Множество элементов, имеющих одинаковые первые
индексы, называется строкой, а множество элементов, имеющих
одинаковые вторые индексы, называется столбцом. Так, ац есть
элемент t-й строки и /-го столбца.
Будем говорить, что матрица А представляет линейное
отображение f пространства Е в F, или ассоциирована с
отображением f.
Таким образом, со всяким линейным отображением f про-*
странства Е ъ F можно ассоциировать матрицу, которая его
полностью характеризует; однако следует все же заметить, что для
заданного линейного отображения f его матрица зависит от
базисов пространств Е и F и изменяется с их изменением. Мы
будем изучать эту зависимость в разд. III, § 3.
Примеры. Г Пусть имеется линейное отображение f
пространства Е в Е, переводящее любое х е Е в у = Кх, где Я е К
задано. Если взять один и тот же базис для х и для у, то
Ц\в Ъ&и % = *£2| • • • > Чж = klm>
следовательно, f представляется следующей матрицей, состоя*
щей из m строк и m столбцов:
/Я 0 ... 0\
\о о... я/
аа = Я, ац = О, если / Ф j.
2° Точно так же пусть еи ..., ет—базис в Е, и пусть
х е Е— произвольный элемент х = gi^i + ... + \шет.
Отображение, ставящее в соответствие х^Е элемент у = £ie4
из Е, линейно; это есть проекция. Его матрица относительно
ГЛ. VIII. МАТРИЦЫ 139
рассматриваемого базиса будет иметь вид
/1 0 ... О
| 0 0 ... О
\0 0 ... О
«ц = 1, <хг/ = 0, если / + /^3.
Регулярная матрица. Если линейное отображение с
матрицей А есть отображение Е на F, то говорят, что А регулярна;
в противном случае А называется сингулярной.
Рассмотрим элемент (|ь ..., lm) = х векторного
пространства Кт и элемент (tji, ..., г\п) = у векторного пространства Кп\
формулы (1) могут быть также истолкованы как линейное
отображение х->у пространства Кт в Кп\ легко видеть, что это
отображение изоморфно линейному отображению Е в F,
имеющему матрицу А,
Пусть uj = (ccij, ..., anj) есть элемент из /С", называемый
также вектор-столбцом; тогда формулы (1) записываются в
следующей эквивалентной форме:
y-*liux+ ... +lmam. (2)
Следовательно, матрицу можно рассматривать независимо
от пространств Е и F, которыми мы пользовались при введении
матриц.
Определение. Матрица А над полем К, состоящая из п строк
и m столбцов, есть прямоугольная таблица элементов а^-е/С,
где i = 1, ..., п\ / = 1, ..., m.
Такая матрица А может представлять линейное отображение
пространства К в Knf обозначаемое через у = Л(£), где хё
^ Кт, а у е Кп, и определяемое по формулам (1).
Для того чтобы матрица А была регулярна, необходимо и
достаточно, чтобы элементы у пробегали все пространство Кп\
иначе говоря, векторное пространство, порожденное вектор-
столбцами й\, ..., йщ, должно совпадать с пространством /СЛ,
т. е. иметь размерность п.
Следовательно, для того чтобы матрица А была регулярна,
необходимо и достаточно, чтобы ранг системы вектор-столбцов
аи ..., аш был равен п (гл. VII, разд. III, § 3). В этом случае
непременно m > я.
Ранг матрицы. Ранг г системы вектор-столбцов называется
рангом матрицы.
Векторы (а<ь .. •, am) из Кт называются вектор-строками.
Ранг г матрицы является также рангом вектор-строк из К"1*
140 КНИГА II. АЛГЕБРА
Действительно, мы видели (гл. VII, разд. III, § 4), что ранг
линейного отображения совпадает с размерностью векторного
пространства, порожденного линейными формами г\и • • •, Цп>
определяемыми правыми частями (1).
II. АЛГЕБРАИЧЕСКИЕ ОПЕРАЦИИ НАД МАТРИЦАМИ
§ 1. Векторное пространство матриц
Пусть имеются две матрицы
/«11 ••• aim\ /Ри ••• Plm\
А=[ и В=
\ап1 ... апт/ \рл1 ... рлт/
над одним и тем же полем К, каждая из которых содержит п
строк и т столбцов.
Равенство. Для того чтобы А =В, необходимо и достаточно,
чтобы для любого х е Кт
А(х) = В(х).
Действительно, это очевидно, если А = 5. Обратно, если
А {%) = В (х) для любого х е /Ст, то возьмем х = ёj =
= (6д, ..., 6jm) — вектор из канонического базиса
пространства /Ст. Тогда 0Ctl6jl + ... + OLimbjm = Ptl6ji + . . . + pimSjm ДЛЯ
i = 1, ..., n, т. е. а*, = рг> Но это верно для / = 1, ..., m, и
значит, А = 5.
Сложение матриц. Отображение, ставящее в соответствие
каждому х из Кт элемент
А{Х) + В{х)
из Кп, линейно; стало быть, оно может быть представлено
матрицей С над /С, называемой суммой матриц А и В и
обозначаемой С = А + В.
Взяв в качестве х элемент ej, видим, что элементы y{j из С
имеют вид
Y//= <**/ +в/, /=1, ...» я; /= 1, ..., т.
Подчеркиваем, что сложение определено только в том
случае, если А и В имеют одинаковое число строк и одинаковое
число столбцов.
Сложение ассоциативно и коммутативно, поскольку.это имеет
место для сложения ац + &j в К\ имеется нейтральный
элемент— нулевая матрица, обозначаемая 0, у которой все
элементы нули, и каждая матрица А из элементов ац имеет
противоположную, обозначаемую —Л, у которой все элементы суть
—а,ц. Имеем 0(х) =ogT, каково бы ни было жеГ, и
А-А){Х) =-(Л(*)).
ГЛ. VIII. МАТРИЦЫ
141
Умножение на число из К. Пусть Я е К; отображение,
которое каждому х^К ставит в соответствие элемент ЯЛ(Ж) из Кп9
линейно; стало быть, оно представлено матрицей, обозначаемой
ЯЛ и называемой произведением матрицы А на Я.
Взяв в качестве х элемент ej, видим, что если элементами
матрицы А являются числа ац, то элементами матрицы ЯЛ
являются числа Яаг> Таким образом, Л и ЯЛ имеют одинаковое
число строк и одинаковое число столбцов. Имеем
Я (Л + В) = ЯЛ + KB, ибо Я (а£ / + &у) = Kati + Щ,
(Я + \i) А = ЯЛ + \хЛ, ибо (Я + \х) а.ц в Хац + \kaih
K(\iA) = (X\i)A, ибо Я {\ши) - (Яц) aih
вА = А, ибо 8a;/*=at/, 8=lei(,
каковы бы ни были матрицы Л и В из п строк и m столбцов и
каковы бы ни были Я е /С, jx e К.
Таким образом, множество матриц, состоящих из п строк и
m столбцов, образует векторное пространство над К.
Обозначим через 1ц матрицу из п строк и m столбцов, у
которой все элементы нули, кроме элемента i-й строки и /-го
столбца, равного е = 1; т. е. положим
ГО ... О ... 01
'*/-
1 .
о .
Тогда любая матрица Л = (a*j) из п строк и m столбцов
имеет вид
п / m \
и это представление единственно. Таким образом, матрицы 1ц
составляют базис векторного пространства матриц из п строй
и m столбцов, и значит, это векторное пространство имеет
конечную размерность, равную произведению тп.
§ 2. Произведение двух матриц
Произведение двух матриц. Матрица Л из р строк и т
столбцов представляет линейное отображение пространства Кт в Кр
Пусть имеется линейное отображение пространства Кр в Кп\
оно представлено матрицей В из п строк и р столбцов.
Следовательно, если х е К , то у = Л (х) е Кр. Теперь возьмем z =
= 5(у)е/Сп; отображение x-*z пространства Кт в Кп есть
142
КНИГА II. АЛГЕБРА
линейная композиция Во А отображений А и В\ стало быть, оно
представлено некоторой матрицей С = (у<,-) из п страк и т
столбцов. Матрица С называется произведением слева матрицы
А на В и обозначается С = В*А или ВА.
Важно заметить, что произведение В*А определено только
тогда, когда число строк в А равно числу столбцов в В\ значит,
в общем случае, из того, что ВА определено, для АВ это не
следует. Однако в случае матриц, имеющих равное число строк и
столбцов, можно определить как АВ, так и В А, но эти
произведения, вообще говоря, представляют собой различные матрицы.
Пусть х = (£ь •••> Бт). У = (Ль •!», Цр), z = (Еь •-., Сп)<
Тогда
Лр = ар\Ь + • • • + U>pmlm> In в P*l*ll + • • • + РярЛр'»
таким образом, получаем
ClePn(ailEl+ ••• +«lmlm)+ ••• + P*p(«pl£l + ••• +«pm&m) =
= Villi + • • • + Y*m£m,
где
p
Yi/ = Pi A/ + Pi2«2/ + ... + PfpCtp/ = S P^aft/. (1)
Свойства умножения. Умножение есть операция
ассоциативная, поскольку оно является композицией отображений (см.
Книга I, гл. II, § 4).
Как мы уже видели, умножение, вообще говоря, не
коммутативно.
Умножение дистрибутивно относительно сложения
матриц. В самом деле, пусть А и А' — любые две матрицы с р
строками и m столбцами, а В — матрица из п строк и р
столбцов; положим С — В(А + А'). Если х есть произвольный
элемент из Кт> то
С (*) = В [(А + А') (*)] = В [А (х) + А' (х)] =
= В [ А (х)] + В [А' (*)] = В А (х) + ВА' (*).
А так как это соотношение имеет место для любых х <= Кт>
то С = В (А + А') = В А + Я4'. Аналогично показывается, что
если ВиВ' — две произвольные матрицы из п строк и р
столбцов и А есть матрица из р строк и m столбцов, то (В + В')Л =
= ВА + В'Л. Эти свойства получаются также сразу из
формулы (1), выражающей элементы матрицы-произведения.
ГЛ. VIII. МАТРИЦЫ
143
Замечание. Пусть х = (£ь ..., \т) — некоторый элемент
из Кт\ рассмотрим матрицу X, состоящую из т строк и одного
столбца:
х =
\\п
Пусть А = (ац) — некоторая матрица из п строк и т
столбцов; тогда произведение У = АХ будет матрицей У из п строк
и одного столбца,
У =
Л1
1%
где
% = anll+ ••• + <*imlm ДЛЯ /=1, ...,/«
следовательно, с элементом у из Кп ассоциируется матрица из
п строк и одного столбца.
Ясно, что соответствие х -> X есть изоморфизм, ибо ЯЖ -> КХ
пх + $'->Х + Х'.
III. КВАДРАТНЫЕ МАТРИЦЫ
§ 1. Определения
Матрица, у которой число строк равно числу столбцов,
называется квадратной; одинаковое число п строк и столбцов
называется порядком матрицы. Множество элементов ац
называется главной диагональю. Квадратные матрицы определяют
линейные отображения Кп в себя. Линейные отображения f
пространства Е в £, которые в данном случае представлены
квадратными матрицами, называются также линейными
операторами в Е.
Сумма и произведение двух матриц n-го порядка всегда
определены и результатом будут матрицы порядка п.
В силу сформулированных ранее свойств (разд. II)
множество квадратных матриц одинакового порядка п над одним и
тем же полем К является кольцом, но, вообще говоря, не
коммутативным.
Выясним, будет ли это кольцо унитарным, т. е. существует ли
нейтральный элемент I относительно умножения. Для него
должно выполняться равенство IA « AI == Л, какова бы ни была
матрица А порядка пг
144 КНИГА И. АЛГЕБРА
Пусть Bij — элементы матрицы /, а ац — элементы матрицы
Л; соотношение IA = Л выражается записью Bna\j + *.. +
+. Binttnj = &ih i = 1» • • •, п. Поскольку а»,- — произвольные
числа, то Zih = 0, если к Ф i, и е^ = 1, если k = i, т. е. eih = 6<л, где
bik — символ Кронекера. Таким образом,
Г 0 ... (Г
Элементы матрицы I суть нули, кроме элементов главной
диагонали, которые равны 1.
Без труда убеждаемся в том, что и AI = Д.
Итак, / есть единичная матрица кольца; стало быть, кольцо
унитарно.
Имеем 1(х) = х для любых х^Кп\ обратно, пусть / есть
такая матрица, что J(x) = х для любых х из Кп\ тогда / = /,
в чем убеждаемся, взяв в качестве х векторы е\ (i = 1,..., п)
канонического базиса пространства Кп.
Заметим, что если нуль есть нейтральная матрица
относительно сложения, т. е. матрица, все элементы которой нули, то
ОЛ «я АО = О для любой матрицы Л. Это кольцо может иметь
делители нуля, поскольку, например, 1ц1кь = 0, если i Ф h или
если / ф k (разд. II, § 1).
Квадратные регулярные матрицы. Квадратная матрица А
регулярна (разд. I), если отображение х->А(х) порожденное
линейным отображением пространства Е в F, определяющим
матрицу Л, есть отображение пространства Кп на Кп.
§ 2. Обратимые матрицы
Мы видели (гл. VII, разд. III, § 3), что для того, чтобы А
была регулярна, необходимо и достаточно, чтобы г = л, т. е.
чтобы векторное подпространство пространства Кп, порожденное
вектор-столбцами аи ..., ап матрицы Л, имело размерность п,
или еще: чтобы а, ..., ап были линейно независимы. В этом
случае матрица Л имеет ранг п и векторы аи • •, ап составляют
базис пространства Кп\ следовательно, отображение х-+А(х)
взаимно однозначно. Поэтому существует обратное
отображение, которое тоже является линейным отображением
пространства Кп на Кп (гл. VII, разд. III, § 3). Квадратная матрица
порядка п, представляющая это отображение, называется
обратной матрицей для матрицы А и обозначается символом Л"1;
матрица Л"1 является симметричным элементом относительно
умножения (Книга I, гл. III, разд. III, § 1).
ГЛ. VIII. МАТРИЦЫ
145
Если А~х существует, то говорят, что матрица А обратима.
Обратно, если А — обратимая матрица, то отображение х-+А (х)
взаимно однозначно, и значит, А регулярна.
Таким образом, понятия обратимости и регулярности матриц
тождественны.
Имеем АА'Х (х) = х, поэтому ЛД"1 = /; точно так же
А'1А = I. Сама матрица / регулярна; ее вектор-столбцами
будут ёи • • > £п\ они линейно независимы, поскольку образуют
канонический базис пространства /С\
Пусть А и В — две обратимые матрицы; в силу
ассоциативности
ABB'1 А = А (ВВ-1) А-1 - AIА~1 « (AI) А'1 - АА~Х = /.
Следовательно, (АВ) (В~1А~1) = /, а значит, произведение двух
обратимых матриц есть матрица обратимая и (АВ)"1 = В"1 А'1,
Всякая обратимая матрица А является регулярным
элементом относительно умножения матриц (Книга I, гл. III, разд. III
Действительно, если А обратима и если ВА = О, то после
умножения справа на 4"1 получаем ВАА'1 = ОЛ'1 = 0, и стало
быть, BI = В = 0. Следовательно, если В А = С А, то в силу
дистрибутивности (В — С) А = 0, поэтому В — С = 0, и В = С.
Точно так же показывается, что^ АВ = АС влечет В = С.
Обратно, всякая матрица, регулярная относительно
умножения, обратима.
Действительно, это предложение равносильно следующему:
если матрица В необратима, то она не регулярна относительно
умножения. Итак, допустим, что В необратима. Размерность г
векторного пространства W, порожденного вектор-столбцами
Ъи • • • > £п матрицы В, т. е. ранг г матрицы В, будет < п. Пусть
fii, ..., йг — базис этого векторного пространства; дополним его
векторами иг+и • • •, йп так чтобы йи йг, -.., йп составляли
базис пространства Кп.
Теперь возьмем в Кп произвольный элемент х = 1\й\ + ... +
+ 1пйп\ отображение £->(0, ..., 0, gr+i,, ..., gn) линейно;
следовательно, оно представлено некоторой матрицей С.
Утверждается, что С ф 0, ибо если х = йп Ф о, то С(ип) = ёп Ф д.
С другой стороны, если у е W, то у = r\iu\ + ... 4- i\rury и
значит, С (у) = о. Следовательно, для любого х е Кп имеем
у = В(х) <= W и С (у) = о; стало быть, для любого х ^ Кп имеем
СВ(^) = о, т. е. СВ = 0, тогда как С Ф 0; таким образом, В не
регулярна относительно умножения.
Этот результат оправдывает употребление для обратимых
матриц термина регулярная матрица.
146
КНИГА II. АЛГЕБРА
§ 3. Преобразованная матрица
Замена базиса; преобразованная матрица. Мы видели, что
линейное отображение f m-мерного пространства Е в п-мерное
пространство F может быть представлено матрицей А из п строк
и т столбцов. Эта матрица зависит от выбора базиса в Е и в F9
Изучим влияние на матрицу замены базиса в £ и в f, Пусть
*ь • • • 9 *т — первоначальный базис в Е\ а е\у ..., егт — новый.
Будет выполняться e/f = xuel+ ... + tm/em для /=1, ..., т.
Рассмотрим квадратную матрицу порядка т
Так как пространство, порожденное элементами e'fy есть Ef
а значит, имеет размерность т, то вектор-строки в Т
независимы, и стало быть, Т имеет ранг т, и следовательно Т регулярна.
Точно так же пусть Ьи ..., Ьп — первоначальный базис в F,
a b'u ..., b'n — новый. Имеем Ь^ = аиЬ{+ ... +anibn для /=*
= 1, ..., п.
Матрица
/<7„ ... Oln\
sOm ... апп 1
S
тоже регулярна.
Пусть теперь х — произвольный элемент из Е. Имеем
х = 1хех+ ... +lmem = l\e[+ ... +Ъ'те'т; выразив е] через et
И 7\ ПОЛУЧИМ g/ = T/i^( + . . . + Timl'm, j = 1, . . ., Ш. ВекТОрЫ
x==(|i, ..., lm) и #' = (gi, ..., £m) принадлежат пространству
/Cm, и при этом х^Г^О- Точно так же, если у — элемент
из F, то у = !],&,+ ... +% = tii6i+ ... +цпЬп. Положим
£ = (Ль ..., г\п)^Кп и £' = №> •-., <)еГ; тогда y = S(y').
Линейное отображение / пространства Е в F переводит х в
у = /(#); это записывается при помощи матрицы А следующим
образом: у=А(х)\ в новых базисах запись приобретает вид
у' н= В(х'), где 5 есть некоторая матрица из п строк и т
столбцов. Но y = S(r), значит, g' = S-*(y) и Г = S-'H(*)] ~
«» S^f^IT (#')]}; поскольку это равенство имеет место для
любых Г €= /Ст, то
5 = 5_1ЛГ. (1)
Ясно, что А и В, представляющие одно и то же линейное
отображение /, одновременно регулярны или нет.
ГЛ. VIII. МАТРИЦЫ 147
Если F = £, причем первоначальные, а также новые базисы
в пространствах Е и F совпадают, то А и S = Т будут
квадратными матрицами одного порядка. Тогда получим В = Т~ХАТ\
В называется матрицей, преобразованной из А посредством Т\
матрицы В и А называются подобными.
Формула (1) может быть также истолкована следующим
образом: пусть матрица А представляет линейное отображение
у = А {х) пространства Кт вГ,ж£ Кт, у е Кп. И пусть Г —
обратимая квадратная матрица порядка т\ она представляет
взаимно однозначное линейное отображение х = Т(х')
пространства Кт на себя. Точно так же пусть S — обратимая
квадратная матрица порядка п, представляющая взаимно однозначное
отображение у = S(y') пространства Кп на себя. Отображение
Кт в Кп, которое каждому х' из Кт ставит в соответствие у\
является линейным отображением, а его матрица В задается при
помощи соотношений
у' - В ОО = S-1 (у) - S-1 А (х) = S~l AT (*'),
и значит, В = S~XAT\ это есть формула (1).
Теперь предположим, что речь идет о квадратных матрицах
и что S = Т. Тогда Т~ЧТ = /; иными словами, матрица,
преобразованная из единичной, сама является единичной. Имеем
также
Г""1 {А{ + А2) Т = Г"1 А{Г + Г"1 А2Т;
Т-{{%А)Т = %{Т~ХАТ\
Г"! (А{А2) Т - (Т-{А{Т) {Т~{А2Т\
и если А обратима, то
т-{(а-{)т = (т-1ат)~{.
Итак, соответствие между матрицей и преобразованной из
нее посредством фиксированной обратимой матрицы Т есть
изоморфизм. Этот результат является также очевидным следствием
того факта, что матрица и ее преобразованная представляют
одно и то же линейное отображение.
§ 4. Транспонированная матрица
Транспонированная квадратная матрица. Говорят, что
матрица ХА элементов ац транспонирована по отношению к
квадратной матрице А элементов ац> если а*/ = ац для i = 1, ..., п,
/ = 1, ..., п.
Элементы матрицы 1А симметричны элементам матрицы А
относительно главной диагонали. Операция, переводящая
148
КНИГА II. АЯГЕБРА
квадратную матрицу в ее транспонированную, называется
транспонированием.
Поскольку ранг матрицы служит размерностью векторного
пространства, порожденного вектор-столбцами, а также вектор-*
ного пространства, порожденного вектор-строками (гл. VII,
разд. IV, § 2), то ясно, что Л и ХА имеют одинаковый ранг.
В частности, А и ХА одновременно обратимы или необратимы.
Очевидно, ЦКА) = VA, *(А + В) = 'Л + 'В, Ч = /.
Имеем также
\ВА)=**А*В.
Действительно, пусть а^ — элементы матрицы Л, a f$ij —
элементы матрицы В; элементы уц произведения ВА задаются
формулами уц = Piiaij + ... + jJinOCnj, где i, / = 1, ..., п. Пусть
а^.— элементы из 'Л, a (J^ — элементы из гВ\ тогда элементы
y'tJ из f(BA) будут равны
но, с другой стороны, это элементы произведения гА*В.
Если А обратима, то '(Л-1) = ('Л)-1; действительно, из
Л_1Л = / в результате транспонирования получаем *(Л-М) =
= *А*(А~1) = '/ = /, и значит, Ч^"1) обратна к 'Л; операции
обращения и транспонирования перестановочны.
Транспонирование снова является изоморфизмом во
множестве квадратных матриц порядка п, но этот изоморфизм
отображает левое умножение на правое.
И, наконец, если Т обратима, то
Хт-1АТ) = *Т*А'(Т-Х);
стало быть, матрица^ транспонированная к преобразованной из
Л посредством Г, есть матрица, преобразованная из ХА
посредством ЦТ~1),
Определение. Квадратная матрица А элементов ац
называется симметрической, если А = *Л. В этом случае ац =* а^.
Пример. / — симметрическая матрица, ибо / = '/.
§ 5. Комплексно сопряженная матрица
Матрица, комплексно сопряженная с квадратной матрицей
над С. Допустим, что поле К является полем С комплексных
чисел.
Пусть имеется квадратная матрица А элементов оы) е С;
комплексно сопряженной с А называется матрица, состоящая из
элементов ctij, комплексно сопряженных с элементами матрицы
Л; она обозначается символом А. Ясно, что ранги матриц А и А
ГЛ. IX. ОПРЕДЕЛИТЕЛИ
i4£
одинаковы, а значит, А и А одновременно обратимы или
необратимы. Имеем (Ы) = Я-Л; (А + В) = А + В, 7 = /, (ЯЛ) = В-Л;
если Л обратима, то (Л""1) = (Л)""1.
Следовательно, соответствие А-+А снова есть изоморфизм
кольца матриц; он отображает левое умножение
(соответственно правое) на левое умножение (соответственно правое).
Имеем также
('Л)-'(Л).
Если Т обратима, то
(Т~1АТ) = {ГГ1 AT,
т. е. матрица, комплексно сопряженная с преобразованной из А
посредством Г, есть ма2рица, преобразованная из комплексно
сопряженной матрицы А посредством комплексно сопряженной
матрицы Т.
Определение. Квадратная матрица А элементов ац е С
называется действительной, если А = А.
В этом случае элементы ац удовлетворяют равенству aij = ail9
а значит, действительны, и А является матрицей над полем R
действительных чисел.
Г Л А В А IX
ОПРЕДЕЛИТЕЛИ
1. ОБЪЕМ ПАРАЛЛЕЛОТОПОВ В Rn
§ 1. Параллелотопы
Будем рассматривать пространство Rn как векторное
пространство над полем R действительных чисел. Распространим на
Rn понятие параллелограмма из R2 и параллелепипеда из R3,
Пусть имеется п (не обязательно линейно независимых)
векторов а\, ... 9 ап из Rn\ множество Р точек х == 6iai + ... + 6nan>
где 0 ^ 9i < 1, ..., 0 ^ 9П < 1, называется параллелотопом.
В более общем случае будем называть параллелотопом всякое
множество точек из Rn, которое получается из предыдущего
параллелотопа произвольным переносом. Таким образом,
множество точек х' вида х' = Bi^i + ... + 0nan + b, где 0 ^ в* < 1 для
i = 1, ..., п, Ь — любой вектор из Rn, снова есть параллелотоп.
Обозначим через Р и назовем замкнутым параллелотопом
множество точек х вида х = b + Gi^i + ... + 6nfln, где 0 ^ 0* ^ i
j 50 КНИГА И. АЛГЕБРА
для i = 1, ..., /^, a fli, ..., аПу Ь — произвольные векторы из Rn\
это множество не зависит от порядка точек аь а2, ..., ап.
Примеры. 1. Пусть *< = (6г1, ..., 6in) — векторы базиса
пространства Rn\ параллелотоп, построенный на eiy ..., еп, а
также любой параллелотоп, полученный из этого параллелотопа
переносом, называется единичным кубом.
х = {h> ..., In) принадлежит единичному кубу, если 0 ^
^ %г < 1 ДЛЯ I = 1, .,., П.
2. Множество точек х' вида х' = Ь' + Хха[ + ... + Хпа'п, где
У, а{, ..., arn^ Rn и где af <Я^<рг для /= 1, ..., п, а,е /?,
ft <= /?, есть параллелотоп. Действительно, л/ = Ь + 0^ + ...
... +0лал, где О<0,<1, ^-(p^-a^aj, /=1, ..., п, и & = &'+
-l-a^H- ... + ала£.
Всякая точка х замкнутого параллелотопа b + Q{a{-{' ...
... + 0лал, 0^0^ 1, принадлежит незамкнутому
параллелотопу, состоящему из точек
* = 6' + X1ai+ ... +Хпап с а^<Я/<1 для /=1, ...,п,
где аг- = 0 или 1 (в случае а* = 1 соответствующий вектор а\
исключается) и Ъ' = Ь + а\а\ + ... + алЯп.
Итак, замкнутый параллелотоп является объединением
конечного числа незамкнутых параллелотопов.
Аффинное преобразование переводит параллелотоп в
параллелотоп.
В самом деле, пусть Р есть параллелотоп, описываемый
точками
*=»6 + 81а1+ ... +9яая с О<0*<1, /=1, ...,/г.
Аффинное преобразование g переводит х в х' = g(x) = f(x) +a,
где f есть линейное отображение. Следовательно,
S = fib + Qial + ... + Qnan) + a = f(b) + a + elf{al) + ... + Qj(an);
я значит, хг описывает параллелотоп Р', определенный
векторами f(a\), ..., f{an) и переносом f(b) + а. Точно так же
показывается, что g(P) — Р\
. Рассмотрим, в частности, преобразование, которое точке
у = (0ь ..., 0П) из Rn ставит в соответствие точку #=6 + Q\a\ +
+ .... + QnCtn- Это аффинное преобразование; оно переводит
замкнутый единичный куб из Rn в замкнутый параллелотоп Р.
Замкнутый единичный куб можно представить в виде
произведения Unf где U — замкнутый отрезок 0-^0^1 из R,
являющийся выпуклым множеством. Следовательно, Un выпукло в R п
(гл. VII, разд. VII, § 3). Но аффинное преобразование переводит
выпуклое множество в выпуклое, и стало быть, всякий замкнутый
параллелотоп является выпуклым множеством.
ГЛ. IX. ОПРЕДЕЛИТЕЛИ 151
Объем параллелотопа. Мы намереваемся распространить на
параллелотопы из Rn понятие площади параллелограмма из R2
или объема параллелепипеда из Rz, применяя слово объем для
любой размерности п. Прежде всего заметим, что в R2 и в /?а
площадь и объем являются мерой (см. Книга III, гл. IV). Но
эта мера имеет к тому же характеристическое свойство — быть
инвариантной относительно любого переноса.
Предположим, что каждому параллелотопу Р в Rn можно
приписать число <о(Р), обладающее свойствами меры*), т. е.
1° о>(Р)>0, ю(0) = О.
2° Л<=/>2=Ф©(Р1)<а)(Р2).
3° ЛПР2=0#о>(Я1иР2) = ©(Л) + ©(Р2).
Здесь Pi и Р2 — параллелотопы в /?п. Кроме того,
предположим, что если параллелотоп Р' получен из Р посредством
переноса, то
4° со(Р,)-со(Р).
Параллелотоп, определенный как
*=s& + 61a1+ ... + 6яая, О<0*<1 для i«l, ...,/г,
будем обозначать Р(Ь\ а\, 02, ..., Яп). Его объем, согласно 4°,
не зависит от Ъ и будет обозначаться a>(ai, a2, .*4, an). Он не
зависит также от порядка векторов а\, ..., ап.
а) Для любого X е R имеем
<й{Хаи а2у ..., ап) = \Х\<й(аи а2, .♦., aj.
Пусть вначале векторы а\, ..., ап линейно независимы и р —
натуральное число. Тогда Р(Ь\ рай а2у ..., ап) есть объединение
параллелотопов P(b + kav% ab а2, ..., an), где Л принимает
последовательно значения О, I, ..., р— 1. Эти параллелотопы не
имеют попарно общих точек; они все получаются из
Р = P{b\ a\, a2, .,., ап) путем переноса, и, значит, в силу 3° и 4*
®(раи а2, ..., a„)«p©(ab а2, ..., ап).
Следовательно, если q — натуральное число, то
<й{аь а2, ..., aj = <7<*>(yai> а2> • ••> я*)»
и, стало быть,
*) Функция (о, строго говоря, должна быть задана по крайней мере на
всевозможных объединениях конечного числа непересекающихся
параллелотопов.
152
КНИГА II. АЛГЕБРА
Из этого результата вытекает, что если векторы аь ,.., ап
линейно зависимы, то со(аь , ,., ап) = 0.
Действительно, без ограничения общности, можно считать,
что векторы aif ..., ah линейно независимы, а векторы ah+u • •.
..., ап через них линейно выражаются, т. е.
k
а/=2и*/Я*> j = k + l9 ..., п.
Тогда для любой точки х^Р(Ь;а\, . •., Яп) имеем
п к / п \
* = & + 2м, = * + 2 9,+ 2 a,/6, a,.
Следовательно, параллелотоп Р = Р(Ь; аи ..., an) принадлежит
некоторому параллелотопу Р(Ь'\ а[, ..., а£, 0, ..., 0), у
которого векторы а\, ..., а\ линейно независимы. Дополним их до
линейно независимой системы а[, ..., а'п в Рп и при любом
натуральном q положим Pq = P\b\ a'v ..., a'n_v — л Л. По*
скольку имеют место включения
<Z>aPaP(b\ a'v ..., a'h% 0, ..., 0)aPqt
то в силу Г и 2° получаем
6<0(P)<|<o(a;, aj, ..., <),
откуда (о(Р) = 0. В частности, любой параллелотоп Я', получен*
ный из Р = Р(Ь\ «г, а% ..., an) приравниванием к нулю k из п
векторов аь ^2, ..., #n, имеет нулевой объем. Но замкнутый
параллелотоп Р является объединением Р и конечного числа
параллелотопов типа Р'. Следовательно, замкнутый параллелотоп
Р имеет обрьем, и этот объем равен объему параллелотопа Р.
Продолжим доказательство предложения а). Имеем
<о(уаь а2, •••> an)==p(u(jau аъ ..., a„)--J-a>(aIf a2, ..., art)
для любой дроби p/q, где р ^ 1, q ^ 1. Теперь рассмотрим
замкнутый параллелотоп Р(й; — ab а2, ..., an), представляющий
собой множество точек х вида а: = 6 — 6iai + 02a2 + • • • + ®пап с
О ^ Вг ^ 1, i = 1, v.., п. Можно также написать х = Ь — а\ +
+ (1_— 9i)ai + 02a2 + ... + enan; а поскольку 0 < 1 — 9i < 1,
то P(b;—aha2, ..., ап) = P(b — а{\ аи а2, ..., an), откуда
(о(—аиа2, ..., an) =»(o(ai,a2, ..., an). Объединяя все эти ре«
зультаты, получаем
(o(pab a2, ..., art) = |p|©(alf a2, ..., a„)
4?ля любого рационального числа р.
ГЛ. IX. ОПРЕДЕЛИТЕЛИ 153
Наконец, пусть Я =5^0-любое действительное число.
Найдутся последовательности (р^) и (р£), стремящиеся к Я и такие,
ЧТО IPm|<I^K|P*l ПРИ ВСбХ ^ _
Тогда замкнутый параллелотоп Рф; Каи а2, . ■., ап) содержит
Р(Ь: р>,, а2, ..., ап) и содержится в Р(Ь\ р*с„ а2, .... ап)
при любом т. Из 2° выводим теперь, что
(о(Яа„ а2, .... а„) = |Я|©(а1, а2, .... а„). :
Это верно и при Я = 0 или а,, ..., ап линейно зависимых.
Доказанное тем самым свойство а) справедливо для
каждого из векторов а\,..., а„, и значит, вообще
©(Я,а„ %2а2, ..., Я„я„) = |Я, ... Я„\&{аъ а2, .... а„).
б) Покажем теперь, что для любого Я е #
а (а„ а2 + Яа„ а3, • • • > ап) =«»(аь й2> «з ««)•
Если векторы а, а„ линейно зависимы, то это
равенство очевидно; поэтому будем считать, что они линейно
независимы. Сначала рассмотрим случай Я>0. Пусть P = F(t>; аь.
аг*-Я.а,
Рис. 9.
а2 + Хаи аз, ..., ап) есть множество точек х = Ь + М,+
+ е2(а2 + Яа,) + взаз+ ••• +М„, где 0<в,< 1 для г = L •••• я
(рис. 9); имеем также х = Ъ + (9, + Я82) «i + вг^г + «з^з + • • • -г »»"«.
Возьмем некоторое целое q>% и рассмотрим параллелотоп ^„,
образованный точками л; = & + (в, + Яг12)а1 + г12а2+езазН-... + 0„а„_
где 0<е;<1 для/-1, 3, .... пи-^<т12<|-» р-делое.
Параллелотоп Р является объединением параллелотопов^,
Р2, ..., Рф не имеющих попарно общих точек. Пусть РР =
= Р(Ь'; а\, а'2, а3, ..., ап)- замкнутый параллелотоп, у
которого Ъ'-ь + х^щ+^а- а\ = (\-\)а{, а'2=\а2. Значит'
154
КНИГА II. АЛГЕБРА
параллелотоп Рр есть множество таких точек х'у что х' — Ь' +
+ е;а; + е^ + е^з+ ... +ех. wo<e;<i для/«1,..., л;
имеем также
у = 6 + [^+е;(1-^)]а1 + (^-+|-)а2+0^з+ ... + e;v
Таким образом, xf = b+ r\\al + r^a2 + ... + ^ая, где г\\ = к— +
+ e;(l-~), т£ = -^- + -^, ii; = e;, 6 = 3, ..., /г. Очевидно,
J^<nJ<£ и п1-*ч£-е;(1 -у)+(1 -едА. Так как 9>л,
то 1-т->0; кРоме Т0Г0» 1 — %^®> и значит, т|[ — Ят^>0.
С другой стороны, 8j<1, 1 — 02<1, и стало быть, л{ —A/ri2<
X X
^ 1 1—= 1. Следовательно, точка
" ч
x, = b + [(4[-te$ + toQal + rfa+ ... +лХ
принадлежит замкнутому параллелотопу PPt и поэтому PpczP'p.
Объем параллелотопа Р'Ру согласно а), равен (l )—(й(аи
Щ, • ••, ял)- Применяя этот результат для /?=1, . .^, q9
получаем, что Р содержит объединение параллелотопов Р[, ..., Р'д,
т. е. Р содержит множество, имеющее объем
q.vo\Pp= (l -™)ю(а„ a2, ..., a„).
Пусть аналогично P'£ = P(b"; a[', а%, a3, ..., ал), где 6" =
^b + X—^^ + ^—а^ а'{ = \\ +j)av а" = \а* Тогда
замкнутый параллелотоп Рр будет представлять собой множество
точек
где 0<GJ<1 для /=1, ..., п. Точку *" можно записать
также в виде
^ = 6 + [я^1 + ег(1+А)]а1+(^1+-^)а2 + е-аз+...
... +ex = &+ii;'a1+ri24+ ... +<а„,
где r,;' = A^i + e;'(l+y); tf-£=!+-£.; tf-efw**-
= 3, ..., л. Снова имеем р"~ ^т^' <I-j. Кроме того, величина
ГЛ. IX. ОПРЕДЕЛИТЕЛИ 15S
8, + Ят£ = Я Е-д^-+в1 + Ц 7 совпаДает с величиной л? = ^ Р-у~+
+ 9"П + —- ], если выбрать Q" так, чтобы выполнялось равен-
Я ( Я \
ство 0, + 82' — = 8" (1 + — 1, что возможно, поскольку 0 ^ 8j +
+ 8" —<1+ — . Таким образом, Рр содержится в F'p\ но F?
имеет объем
Следовательно, Рр содержится в объединении параллелотопов
Р"у ..., Pq, общий объем которых равен величине
(l + ^))<й(а1, аъ ..., ап).
Стало быть, имеют место неравенства
(l—Jafab «2, •-., ап)^<ь(аи а2+Хаь ..., ал)<
А так как эти неравенства справедливы для любого целога
q > X, то (о(аь а2 + Хаи ..., ап) = <o(ai,a2, ..., ап). Теперь
допустим, что Я< 0, и положим X' = —Я; тогда X' > 0; помимо
того, положим а'х = — а,. Тогда
©(ар а2 + Яар ..., ал) = 0(—а(, а2 + Я'а[, ..., ал) =
-со(а;, а2 + к'а'{9 ..., ая) = ю(а{, а2, ..., ап) = <*(а{, а2, ..., ая)-
Итак, предложение б) доказано. Ясно, что вместо векторов
й\ и а,2 можно было бы взять любые два вектора из ai, ..., an.
Предложения а) и б) позволяют находить объем любого па-
раллелотопа, если добавлено следующее условие:
5° Единичный.куб в Rn имеет объем 1.
В самом деле, пусть Р = Р(Ь; аь ..., ап), а аи, а2*, ..., ani —
компоненты вектора at для /=1, ..., /г. Если один из
векторов at равен нулю, то объем параллелотопа Р равен нулю.
aw
Допустим, что ахФо и ап =й0. Заменим а/ на a! — — ax = att
для / = 2, ..., п и положим «1 = ^. Если а\ имеет компоненты
au» a2*» • • •» ая*> то» очевидно, &j7 = 0 для / = 2, ..., п. В силу б),
Р(Ь\ а[9 ..., ай) и Р(Ь; а,, ..., ал) имеют одинаковый объем.
j56 КНИГА II. АЛГЕБРА
Если а'2 = о, то объем равен нулю; если же а2Фо> то предпо-
ложим, что о!22Ф§> и возьмем а^ = а^ —j^— а^ для /5=1, 3,
4, ..., п, а" = а'т Пусть а"., ..., а£. — компоненты вектора а".
Имеем
а^.==0 для / = 2, ...,/г; а[\=апФ0;
a"k = 0 для k = 1, 3, ..., п; а'22 = а'22ф 0.
Так постепенно приходим либо к параллелотопу нулевого
объема, либо к параллелотопу, векторы которого пропорциональны
единичным векторам eit •.., еп в Rn, т. е. к параллелотопу вида
Р(Ь\ %\е\, ..., %пеп). Но этот параллелотоп имеет объем
|Я, ... Ял|со(еь ..., еп)ЧМ* • ■ ■ К I-
Объем есть отображение пространства (/?*)" во множество
7?+ чисел > 0 из R. Однако это отображение не будет линейным,
ибо
<й{и{, аъ ..., ап) = |Я|(д(а1, а2, ..., ап).
Это отображение позволяет ввести абсолютное значение, но оно
будет не очень удобно для вычислений. Мы обобщим понятие4
объема так, чтобы это затруднение было устранено.
II. ОПРЕДЕЛИТЕЛИ
§ 1. Определение
Теперь мы будем действовать уже не в векторном
пространстве Г,ав Сл, элементы а которого, или векторы, представляют
собой системы п комплексных чисел: а = (cti, ..., ctn), где
ai s С, ..., On e С. Зададимся целью определить такое
отображение D пространства (Сп)п, но не в R, а в С, которое любой
системе п векторов а\, ..., ап из Сп ставит в соответствие
комплексное число D(a\, ..., an), обладающее следующими
свойствами:
D{Xau ..., an) = XD(au ..., ап) для ЯеС, (1)
D(au a2 + Xa{, ..., an)**D(au a2, ..., ап) для Л<зС, (2)
D(eu ..., еп)=1, (3)
& аналогичными свойствами, если в (I) и (2) умножать на X не
щ, а любой другой вектор.
Если такое отображение существует, то нет уверенности
в том, что оно не зависит от порядка векторов ai, ..., ап\ более
того, мы убедимся в обратном. Поэтому порядок векторов не
ГЛ. IX. ОПРЕДЕЛИТЕЛИ 157
должен нарушаться. Если найдется отображение D с такими
свойствами, то для векторов из Rn функция \D(au ..., ап)\
будет, очевидно, обладать свойствами объема со(аь ..., ап)\ стало
быть,
сй(аь ..., an) = \D(a{, ..., ап)\.
Теперь мы попытаемся построить отображение Д
обладающее свойствами (1) и (2). ,
1° Начнем с доказательства того, что (1) и (2) влекут за
собой тот факт, что D есть линейное отображение.
В самом деле, если в (1) положить Я = О, то£>(о, а2,...', ап) = 0,
Вообще, если векторы аь а2, ..., ап линейно зависимы, то
D(a\t а2, ..., ап) = 0. В самом деле, в этом случае найдутся
такие Хь А,2, ..., Яп, не все равные нулю, что %\а\ + %2а2 + ... +
+ Кап = 0. Пусть Xi ф 0; тогда а\ + %!2а2 + ... + In^n = 0, где
Я/==у-, и поэтому
Z)(aI, а2, ..., an) = D(al + X'2a2+ ... + Ллай> я2> ■••■ 0 = 0-
Теперь покажем, что всякий раз, как Х\ + х2 + х3 = о,
D(xu a2, ..., art) + Z>(*2, я2, ..., an) + D(x3f a2) ..., tfrt) = 0.
Это предложение очевидно, если все три системы (*ь а2,..., ап),
(#2, а2, ..., ап), (#з, а2, ..., ип) линейно зависимы, ибо тогда
значение каждого D равно нулю. Допустим, что векторы
Хз, а2, ..., ап линейно независимы; тогда они образуют базис
в Ся. Следовательно,
*i в £1*3 + hfih + . -. + £ A, h s С,
*2 = ЛХ-^З + Л2^2 + - • - + ЧпЯп> 4i^C, i = 1, . . ., П.
Так как Х\ + х2 + х3 = о, то gi + t)i + 1 в 0. Имеем далее
D(xlt аъ ..., aft) = D (*, - £2а2 - ... -grtart, а2» ••"•. я*) =
= В(Ъгх3, аъ ..., fl„Hgi^Wi «2» •••> fl«)
и
£>(л;2, a2, ..., an)=*D{x2~4\2a2~ ... — тьая, a2, ..., а„) =
= D(ti1a:3, а2, ..., ая) = r\{D(х3, аъ ..., ая).
Стало быть,
£(*i, а2,,.., an) + D(x2, аъ ..., ая) + /)(*3, а2, ..., ая)«
Таким образом,
£>(Ял;, а2, ..., an) = XD(x, а2, ..., ад)
и
Z>(*i + *2> «2» ...,-ая)=»0(*1, а2, .. r, an) +D(x2, аъ ..., ая)..
158
КНИГА II. АЛГЕБРА
Итак, сужение отображения D(aba2, ..., ап) на векторное
пространство Сп векторов а\ при помощи соответствия
(яьЯг, ..., о>п)-+а,и т. е. отображение ai->D(ab a2, ..., an),
есть линейная форма. То же самое будет иметь место для
сужений на векторные пространства Сп векторов а^ ..., ап. Следом
вательно, из (1) и (2) вытекает, что D(au ..., ап) есть
полилинейная форма на (Сп)п (см. гл. VII, разд. V, § 3).
С другой стороны, если а\ = а;- для / ф i, то система ai,... ,an
линейно зависима, и значит, D(au ..., ап) = 0. Отсюда следует
(гл. VII, разд. V, § 3), что D(au ..., ап) есть знакопеременная
полилинейная форма; т. е. если переставить два вектора, то
число D(ai, ..., ап) изменит знак.
2° Явное выражение для D(au ..., ап). Пусть Ь\, ..., Ьп —
какой-нибудь базис в Сп\ тогда а$ = y\jb\ + ... + ynjbn для
/ = 1, ..., n, Yij ^ С. Так как D{a\, ..., an)—полилинейная
форма, то
Д (а,, . . ., ап) = 2 # (Ym,, An,» • • • > Ym^, /i&mft)>
где сумма распространяется на все системы (ть ..., тп), в /со-
торых числа т* принимают, независимо друг от друга, значения
1, 2,..., п. Имеем
D (Ym,, Фтх> • • • > Ym„, я*т„) = Ym,. 1 • • • Утп, пР (bmi> • • •» Ьт^\
но если два индекса т{ и т;- равны при i Ф /, то система bm 9
-••> bmrt линейно зависима* и D{bm^ ..., &mJ = 0. Стало быть,
достаточно распространить суммирование лишь на системы
индексов (ть ..., тп), у которых все т* различны, т. е. когда
(pml9 ..., &mj составляет перестановку множества (6Ь ..., &п)„
Но от перестановки (6mi, ..., 6mJ можно перейти к
перестановке (Ьи ..., Ьп), сделав число замен, равное четности
перестановки (&mj, ..., bmn) (Книга I, гл. II, § 3). Следовательно,
^(Ympl&m,» •••> Vmn,nbtnn) =
~г(пги ..., mn)ymv i ... Vmn,nD(bu •••» *я)>
где e(mb ..., тл)= + 1, если перестановка (6mj, ..., 6mJ»
а значит и перестановка (mlf ..., /nft), четная, и е(/пь ..., т„) =
= — 1 в противном случае. Итак,
D(au ..., an) = D(bu ..., 6п)2е(/П!, ..., mJVm,, i ... Vm„, »>
где суммирование распространяется на все п\ перестановок
(mi, ?. e, mn) из (1, 2,,,., я). В частности, если взять в качестве
ГЛ. IX ОПРЕДЕЛИТЕЛИ
159
базиса ей *?»*, епу то а;- = а\}в\ + .., + ап^п, / = 1, **.» я-
Стало быть,
D(au ..., ад) = £>(еь ..., ert)2e(mlf ..., mn)amv , ... ат/гД.
Но в силу (3) имеем Z)(ei, ..., еп) = 1, и значит,
D(alf ,.., ая) = 2в(т„ ..., m„)ami,, ...aW||tll. (4)
Если Л — квадратная матрица, у которой а* являются
вектор-столбцами, т. е.
ап ••• ат
то пишут
D(au ..., an) = D(A) =
о,п\ •. ♦ а,пп
= %е(ти ..., mn)amvl ... аЖ|1, я,
и это число называют определителем матрицы А.
Из предыдущего доказательства видно, что если существует
число D(au ..., Яп), обладающее свойствами (1), (2) и (3), то
это число всегда записывается в форме (4), а значит, оно
единственно.
Нам остается показать, что выражение (4) полностью
удовлетворяет свойствам (1), (2) и (3).
Легко видеть, что 2е(га,, ..., тп)ащ, j... amnt n есть
полилинейная форма относительно аи ..., aw. Значит, (1)
удовлетворяется.
С другой стороны, если переставить два вектора, то четность
всех перестановок (ти ..., пгп) изменится, и стало быть,
D(a\, ..., ап) изменит знак, т. е. полилинейная форма знако-
переменна, и значит, она равна нулю, если равны два вектора
(гл. VII, разд. V, § 3). Следовательно,
D(au a2 + Xal9 ..., an) = D(au аъ ..., an) + XD{au аь ..., ап).
Последняя величина равна нулю, и значит, свойство (2)
удовлетворяется.
Наконец,
D{eb ..., еп) = %е(пц, ..., mn)6mUl ... дтп, п.
ICO КНИГА II. АЛГЕБРА
Но 6ij — О, если i Ф /; стало быть, единственным ненулевым
членом будет тот, у которого тх = 1, ..., тп = п. Но е(1, ..., п) =
= +1, следовательно, D(e\, ..., еп) =. 1, и (3) также
удовлетворяется.
Таким образом, мы доказали существование единственного
отображения, обладающего свойствами (1), (2) и (3). В
частности, в Rn будет иметь место
(*{аи ..., an) = \D(au ..., аа)\.
Ориентация. Параллелотоп Р(Ь;аи ..., ап) в Rn будет
называться прямо направленным, если D(au ..., ап) > 0, и
обратно направленным, если.В{а\, ..., ап) < 0.
Перестановка двух векторов системы а\, ..., ап меняет
ориентацию параллелотопа.
§ 2„ Свойства определителей
1° Перемножение двух определителей. Возьмем снова
формулу (§ 1, 2°)
D{ait ..., an) = D(bl9 ..., bn)%*(ml9 ..., тп)утуХ ... ymn,n9
где bi9 ...9bn образуют базис в С". Сумма Se(mlf ..., тп)Х
X Ymj. 1 ••• Утп, п может рассматриваться как определитель
D(cl9 ..., сп)9 где Cf имеют в качестве компонент числа
Yi./i •••> Y«. / Для /в1» •••> л. Следовательно,
D(al9 ..., a^-D^j, .... bn)D{ci9 ..., cn). (5)
Поскольку yij являются коэффициентами в выражении векторов
а* через элементы базиса Ьи ..., Ьп, то векторы Cj могут быть
любыми. Напротив, Ь\ ..., Ьп линейно независимы. Но если
Ь\, ..., Ьп линейно зависимы и если а$ = yu&i + ... + ynjbn для
/ = 1, ..., я, то а\ принадлежат векторному подпространству
размерности строго меньшей п, порожденному fei, ..., 6П;
следовательно, аь ..., ап линейно зависимы. Стало быть, формула
(5) снова верна; таким образом, она справедлива для любых
определителей D(b\, .. •, Ьп) и D (си -.., сп).
Пусть Л, В, С — матрицы, имеющие вектор-столбцами
соответственно (аь ..., an), (6ь ..., Ьп), (с и ..., сп). Так как
dj = yij6i + ... + ynjbn, то i-я компонента ocij вектора а,- будет
задаваться формулой
a// = foiYi/+ •■■ +P/iiVn/.
где Pij, ..., pnj — компоненты вектора 6j, / = 1, ..,, пь
ГЛ. IX. ОПРЕДЕЛИТЕЛИ 161
Эта формула — та же, что и для элементов произведения ВС
матрицы С на матрицу В слева (гл. VIII, разд. II, § 2). Отсюда
следует, что
D(BC) = D(B).D(C).
Замечания. I. Даже если ВС Ф СВ, то тем не менее
D (СВ) = D(C).D(B) = D (ВС).
2. Если Я— комплексное число и если Л есть матрица с
вектор-столбцами а\9 ..., ап, то вектор-столбцами матрицы АЛ
будут Хаи ... г кап, и значит,
£(АЛ) = ГЛ.
Следствие. Теорема о перемножении определителей
позволяет нам доказать следующие предложения.
1. Для того, чтобы п векторов а\, ..., ап из Сп были линейно
независимы, необходимо и достаточно, чтобы D(au ..., ап) ФО.
Мы уже видели, что если аи ..., ап линейно зависимы, то
D(a\, ..., an) = 0. Если же а\, ..., ап линейно независимы, то
обозначим через Л матрицу, имеющую а\, ..., ап
вектор-столбцами. Тогда Л обратима (гл. VIII, разд. III, § 2), и значит,
существует такая матрица Л-1, что АА~Х = /, где / — единичная
матрица. Следовательно, D(I) = 1 = D(A) • D(A"X), и стало
быть, D(А) ФО. "Г
2. Если В преобразована из А посредством обратимой
матрицы Т, то В = Т~ХАТ, и значит,
D(B) = D (Г-1) D (A) D(T) = D (A).
2° Перемена строк и столбцов. Покажем, что D(*A) = D(A),
где *А — матрица, транспонированная к Л. Действительно, если
а^ —элементы из 'Л, то
0('А)-%е(тр ..,, mn)afmvl ...<^n.
Но о/ц = ац, и следовательно,
D(iA) = %s(mly ..., mn)aUmi ... а„,тд =
==S8(m1, ..., тп)аНр1 ... щп%п.
Но если произвести замены так, чтобы перейти от перестановки
(Аь ..., hn) к (1, ..., я), то те же замены сведут перестановку
(1, ..., п) к (ти ..., тп). Следовательно, перестановка (hu ...
..., hn) имеет ту же четность, что и перестановка (ти ..., тп),
и значит, е(mi, ..., тп) = e(Ai, ..., hn). Таким образом,
П('А) = %е(!ги ..., hn)ahv , ... аЛ|р я « Я (Л).
5 Ш. Пизо, М. ЗаманскиЙ
162
КНИГА II. АЛГЕБРА
Этим свойством уточняется уже доказанное свойство, что Л
и *А имеют одинаковый ранг (гл. VIII, разд. III, § 4). В
частности, перемена двух строк меняет знак D(A) на обратный.
3° Разложение определителя по элементам столбца.
Рассмотрим определитель 0(аи ..., ап). Имеем а\ = <хие\ + ,..
... + ап\еп\ значит,
D(au а2, ..., an) = anD(eu а2, ..., ап) + ...
• • • + о<п\Е> {рп> а2> • • • > ап).
При такой записи ясно виден тот факт, что D(a\, ..., ап) есть
линейная форма от а\. Положим Ац — D(ejt а2, .,., ап) для
/ = 1,..., п\ тогда
D(au аъ ..., ая)8=Л11а11 + Л12021+ ... + А[пап{.
Рассмотрим, в частности, Ац « D(e\, <h> ..., Яп). Имеем
Ап = S е (пгь тъ ..., тя) dWl, xamv 2 ... aW||f я.
Но 6tj = 0, если i Ф /; стало быть, достаточно взять слагаемые
с гп\ = 1, и тогда
Ли = 2е(1, т2, ..., тп)атг2 ... aW||f я.
Перестановка (т2, . .*, ягп) уже не может содержать 1, и зна-<
чит, является перестановкой целых чисел 2, ..., п. А поскольку
число 1 меньше т\ для i = 2,..., п, то перестановка (1, т2,..., ягп)
имеет ту же четность, что и перестановка (яг2, ..., mn).
Следовательно, е(1,т2, ..., тп) = е(т2, ..., тп), и стало быть,
Ап = 2е(яг2, ..., mrt)oWr 2 ... aW||f я.
Это показывает, что Лц есть определитель из п— 1 строк и п— 1
столбцов; он получается из D(au а>2> ..., ап) в результате
исключения 1-й строки и 1-го столбца.
Обозначим теперь через D^ определитель из п — 1 строк и
п — 1 столбцов, полученный в результате исключения из
D(a\, ..., ап) i-й строки и j-го столбца; D^ называется минором
элемента ац. Так, Лц = Dn. Взяв а;- = а\$е\ + .». + anjen,
получим (как было выше для / = 1)
D {аи ..., ап) = Апаи + ... + Л /яая/.
Говорят, что произведено разложение определителя D {аи ..., ап)
по элементам j-го столбца.
Путем / — 1 замен можно свести (аи ..., cij, ..., ап) к
(cij, #i, ..., an), а путем i— 1 замен — поместить i-ю строку на
место первой, не изменив порядка других. Тогда элемент ац
ГЛ. IX. ОПРЕДЕЛИТЕЛИ
163
станет элементом с индексами 1,1 нового определителя, который
будет равен
(_1)|->+'-»/>(а11 ...t an) = (-l)i+iD(au ..., а„).
Минор с индексом (1,1) этого определителя равен Ъц\
следовательно,
a,ij в разложении
Aji называется коэффициентом при
D(au ..., dn) no элементам j-го столбца.
Замечание. Обращаем внимание на тот факт, что порядок
индексов у А^ обратен порядку индексов элемента аг>
коэффициентом которого служит А^; основание для этого соглашения
выявится позже.
Так как Z)(M) = D(.4), то можно также разложить D (А)
А'иап +
+ А
nlain'
по элементам строки. Получим D(A)>
Коэффициент А'п при aif снова будет равен ( — l)i+f Dip значит,
A'h*=*Aju и стало быть, разложение по строке имеет вид
D(A) = AHan+ ... +Aniain.
Итак, вычисление определителя из п строк и п столбцов
сводится к вычислению п определителей из п — 1 строк и п — 1
столбцов.
Примеры. 1. Предположим м= 1; тогда существует
единственная перестановка элемента — тождественное отображение,
которое является четной перестановкой, и мы имеем |ац| = осц.
Здесь две черты, расположенные по обе стороны от ац,
означают, что |ац| есть определитель, а не абсолютное значение.
2. Для вычисления
ац с&12
«21 Ct22
можно применить разложение по элементам первого столбца.
Коэффициентами будут числа Ли = £)ц = ct22 и Ах2 =
в- (__i)i+2£)21 =—а12) а значение определителя будет равно
an<X22 — «2iai2.
3. Пусть теперь
«И «12 «13
Д = I СС21 СС22 «23
«31 «32 «33
6»
164
КНИГА П. АЛГЕБРА
A, = (-l)1+1
Л12 = (-1)1+2
Л13 = (-1)
1+3
— «22«33 ~~ «32«23>
= — (а12а3з — «з2«1з)>
: «12«23 """" «22«13*
разложим его по элементам первого столбца. Коэффициенты
имеют вид
«22 «23
«32 а33
«12 «13
«32 «33
«12 «13
«22 «23
Таким образом,
Л = Апап + Л12а21 + А{3а31 =
= ац«22«33 + «21«32«13 + «31«12«23 ~~ «11«32«23 ~~ «21«12«33 ~" «31«22«13*
Можно запомнить это выражение, заметив, что произведения
со знаком плюс
представлены на квадратной
таблице элементами главной
диагонали и вершинами
двух треугольников со
стороной, параллельной
этой диагонали.
Произведения со знаком минус
представлены
элементами второй диагонали и
вершинами двух треугольников со стороной, ей параллельной
(рис. 10).
Этот прием называется правилом Саррюса.
Соотношения между коэффициентами А^. Рассмотрим сумму
Апаи + Л/2а2/ + ... + Airflni для / Ф /.
Эта сумма является разложением по i-щ столбцу
определителя D(a\, ..., ап), в котором вектор аг- равен вектору а^, и
значит, эта сумма равна нулю. Следовательно,
Anaii + Attfhi+ ••• +AinanJ=*6uD(al9 ..., ап)
для любых i и /.
Пусть А — матрица элементов аг-;-, и D = D(A) Ф 0; тогда А
обратима. Кроме того,
Знак +
Знак-
Рис. 10.
All n I Ai2 n ,
+ *?.ап, = 6И.
Отсюда вытекает, что матрица элементов A^ID такова, что ее
произведение на А будет матрицей элементов 6г\?, т. е. единичной
матрицей /, и стало быть, матрица элементов A^jD есть мат-
ГЛ. IX. ОПРЕДЕЛИТЕЛИ
165
рица А~1. Это и является основанием для того соглашения об
обращении индексов, которое было принято выше.
Обозначим через В матрицу элементов Ац\ тогда В • А =
= £>(Л)«/, и следовательно, взяв определители этих матриц,
получим
D(B)-D(A) = (D(A))a.
Если О(А)ф0, то отсюда вытекает соотношение D(B) =
= [/)(Л)]П_1, которое может быть также выведено из того, что А
обратима и D(A~l)= l/D(A), ибо А -Л""1 = /. Если D(A)= О, то
D(B) = 0; действительно, если Л = 0, то все ее миноры равны
нулю, значит, и В = 0; если же D(A) = 0 при Л =£0, а О(В)Ф0,
то В должна быть обратимой, стало быть, регулярной
относительно умножения, и тогда В -А — D(A)I = 0, что давало бы
Л = 0, чего не может быть. Таким образом, соотношение
/)(Б) = Р(Л)Г'
справедливо как для D(A) = 0, так и для D(A)= 0.
§ 3. Применение определителей для нахождения ранга
системы векторов
Ранг системы векторов. Пусть в векторном пространстве Сп
имеется система k векторов а\, . •., о>ъ Мы уже видели (гл. VII,
разд. III, § 3), что если k = л, то ранг г системы аь ..., ап
будет меньше или равен точно п в зависимости от того, будет ли
D(au ..., ctn) равно нулю или отлично от нуля. Мы обобщим
этот результат с тем, чтобы указать процесс, позволяющий
находить точное значение ранга г при помощи определителей.
Сначала докажем предварительное предложение.
Рассмотрим матрицу с вектор-столбцами а\9 ..., а^ Будем говорить, что
определитель из h строк и h столбцов выделен из матрицы, если
он получен в результате исключения строк и столбцов этой
матрицы так, чтобы осталось только h строк и h столбцов, и берется
значение определителя матрицы из оставшихся h строк и h
столбцов. Так, минор есть определитель, выделенный из
матрицы, соответствующей исходному определителю. Пусть
теперь г векторов аи ..., аг таковы, что существует хотя бы один
отличный от нуля определитель из г строк и г столбцов,
выделенный из матрицы с вектор-столбцами аь ..., аг. Можно
допустить, что оставшийся после исключения последних п — г строк
определитель не равен нулю. Если л; —элемент из Сп с
компонентами (gi, ..., |п), то через х? = f(x) обозначим элемент из
Сг с компонентами (|ь ..., gr). Пусть s — некоторый фиксиро*
ванный индекс, г + l^s^n и х" = g(x) есть элемент из Сг+1
с компонентами (£ь •.., £г. £$)• Отображения / и g являются
166 КНИГА II. АЛГЕБРА
линейными отображениями пространства Сп в С и С'4"1
(проекции). Пусть далее (оси, ..., ап%) —компоненты вектора а* для
i = 1, ..., г, и пусть Ь есть заданный вектор вС"с
компонентами (рь ...» Рп)" Рассмотрим а\:==f(al)y ..., a'r*=f(a^\ так как
£>(а(, ..., aj)^0, то of flj линейно независимы в С. На
отображение / линейно, и поэтому а\, ..., ат тоже линейно
независимы в Сп. Векторы aj, ...» a^ образуют базис пространства
Сг, и значит, 6' = /(&)~Л1а{ + ... +Хга'г. Возьмем a"=g{a^, ...
• • •> аг^ё{^ Ь"=£(£)и рассмотрим определите ль D(a", .. .,a",.
ft'7) из г+1 строк и г+1 столбцов. Он равен
определителю D(a", ..., a", 6/r — Я^^ — ... —Xra"). Последний столбец
этого определителя состоит из элементов О, О,..., О,.
ps — A,iasi — ... — ЯгОСвг. Поэтому, разложив этот определитель па
элементам последнего столбца, получим
/>«,.... <, &")-(Р.-я,Л1- ... -vg^K О-
Если п — г определителей D(a"9 ..., а", 6") все равны нулю
для значений s = г + 1, ..., s = п, то ps — taasi —... — Krasr =
= 0 для 5 = г + 1, ..., п, так как D (а[, ..., а'г) ф 0. Но мы
имеем также рг- — ?uati —... — Ягос*г = 0 для i = l, ..., г,
поскольку Ъ' — XjaJ + ... + Xra'r. Следовательно, Ь = A,iai + ...
... + Kar, т. е. Ъ принадлежит векторному пространству,
порожденному векторами а\, ..., ar.
Обратно, если Ъ принадлежит этому векторному
пространству, то найдутся такие числа К\, *.., Яг, что 6 = %\а\ + ...
... + Лгаг, и тогда
£>«, ..., <, b") = D(a% ..., <, ft"- Vf- ••• - V") = 0-
Определители D(a", ..., а", б'7) называются
характеристическими определителями. Они получены путем «окаймления»
выделенных из матрицы ненулевых определителей D (а[, ..., ап
справа — компонентами вектора Ь того же индекса и снизу —
строкой, образованной s-ми компонентами векторов аи ..., ar, ft.
Существует п — г характеристических определителей, и
значит, их не будет вовсе в случае п = г.
Наше предварительное предложение гласит:
Для того чтобы вектор b принадлежал векторному
пространству, порожденному векторами аи ..., аг, необходимо и
достаточно, чтобы п — г характеристических определителей были
равны нулю.
Если г = п, то любой вектор Ь принадлежит порожденному
векторному пространству, поскольку в этом случае векторы
йи..., ап составляют базис пространства С\
ГЛ. IX. ОПРЕДЕЛИТЕЛИ 167
Теперь рассмотрим k векторов аь ..., ак из Сп и обозначим
через г наибольшее возможное число из них, для которых
отличен от нуля определитель из г строк и г столбцов, выделенный
из матрицы с вектор-столбцами а\, •.., ak. Пусть (ан, »*%, аПг) —
компоненты вектора аг- для i = 1, ..., k, и пусть
|ап ... а1г|
• • =5^0.
хг1 ... аГГ I
Тогда векторы аь ..., аг линейно независимы, а
характеристические определители, образованные векторами Ь = ан для h =
= г + 1, ..., k и имеющие г + 1 строк и столбцов, равны нулю,
и значит, ah принадлежат векторному пространству,
порожденному ai, ..., От для А = г + 1, ..., k. Таким образом, ранг
множества векторов есть наибольшее число г векторов, обладающих
тем свойством, что существует хотя бы один отличный от нуля
определитель из г строк и г столбцов, выделенный из матрицы,
вектор-столбцами которой являются рассматриваемые векторы.
Можно заметить, что эта формулировка допускает взаимную
замену вектор-столбцов и вектор-строк, поскольку было
доказано, что при такой замене ранг системы не изменится (гл. VII,
разд. IV, §2).
III. ОПРЕДЕЛИТЕЛИ И ЛИНЕЙНЫЕ УРАВНЕНИЯ
Рассмотрим следующую линейную систему:
artlEl + ■• - • + Ct«mSm — Ря>
(1)
где числа ац для I = 1, ..., п, j = 1, ..., /пи рг* для i = 1, ..., п
принадлежат полю R действительных чисел или полю С
комплексных чисел. Запишем также эту систему в эквивалентной
форме
1ха{+ ... +lmam = b, (2)
где aj есть вектор из Rn или Сп с компонентами a\j, ..., ocnj, а
b — вектор с компонентами Рь #в,, рп.
§ 1. Система Крамера
Пусть m = n и векторы аь . ¥i, an линейно независимы.
Тогда D(u\, •.. > Яп) Ф 0. В этом случае система (2) имеет, и
притом единственное, решение gb ,.., gn, ибо а\, .л1, ап есть базис
168 КНИГА II. АЛГЕБРА
векторного пространства Rn или Сп. Рассмотрим определитель
D(au ..., а/-!, Ъ, a/+i, ..., ап).
Его можно записать в виде
D{au ..., а/_,, 6 — gia! — ... —gy^a/-! —g/+ia/+i— ...
... — £лал, a/+i, ..., ап),
а также, принимая во внимание (2), в эиде
D(au ..., a/-!, I/a/, а/+ь ..,, an) = g/D(ab ..., an).
Но D(ab ..., ап) Ф 0, и значит,
Д^,.... a/-!, 6. дж»-... fln)
Иными словами, значение неизвестного |,- получается как
частное двух определителей, в котором знаменателем служит
определитель D(a\, ..., an) = 0 из коэффициентов ац при
неизвестных, а числитель получен из него заменой вектор-столбца а$
вектором b из правой части.
Разложив определитель числителя по элементам /-го
столбца, получим также
Anh+ ... +Airfin
fe/ D(a, an) •
Эти формулы могут быть выведены и из теоремы
существования решения системы Крамера, ибо благодаря свойствам
коэффициентов Aji убеждаемся, что вычисленные таким путем
величины |j- составляют решение системы (1).
Применение к вычислению некоторых определителей. Вообще
говоря, предыдущие формулы неудобны для численного
решения линейной системы; лучше пользоваться методом последовав
тельных исключений, описанным в гл. VII, разд. VI, § 3. Однако
они полезны для теоретического исследования уравнений.
Наоборот, часто бывает выгодно решать систему линейных
уравнений для вычисления определителей.
Принцип таков. Рассмотрим систему уравнений
ha}+ ... +lnan = en,
где еп — вектор с компонентами (0, 0, ..., 0, 1). Имеем
t — D(ai an-i> en) _ Ann
*n D(ax an) D(a„ .... an) '
Но коэффициент Апп равен минору Dnn элемента апп, т. е.
Ann = D(a\, .... <_,).
ГЛ. IX. ОПРЕДЕЛИТЕЛИ 169
где а\ для I = 1, ..., п— 1 есть вектор из Rn~l или С1""1, полу^
ченный из а\ исключением последней компоненты.
Следовательно,
|я/)(а„ .... an)-D(a\ <_,).
В некоторых случаях £п находится непосредственно, и
предыдущее соотношение позволяет образовать рекуррентное
соотношение для вычисления D(a\y ..., ап).
Пример. Определитель Вандермонда. Определителем Ван-
дермонда называется определитель D(au ..., ап)у где atj = %[~~х
для i=l, ..., я, / = 1, ..., п\ здесь Ц~{ означают (/—1)-ю
степень числа Я*. В этом случае система 1\а\ + ... + £пап = еп
имеет вид
6,+ 6^,+ ... +Wl^09
S1 + 6A-1 + ••• +6»^:j-of
61 + 6Л+ ••• +^Г1 = 1-
Допустим сначала, что все числа Яь ..., Яп попарно различны.
Первые п—1 уравнений означают, что многочлен х = gi +
+ Я|г + ... + ЯЛ_1|П от переменного Я степени п — 1 имеет нули
Яь А,2, • • • ♦ ^п-ь Значит, если через рр обозначен многочлен
Я —р (см. гл. IV, разд. V), то * = \ipKi р^ ... р\п_х> где jui —
постоянная. Но Рр(Яп) = Яп— р; поэтому последнее уравнение
дает
*(Яп) — 1 = |i (Яп — ^1) ... (Яп — Яп-1).
Отсюда получаем значение \х и, таким образом,
РкУк ••• Рх f (Л — Xi) (А,-Л2) ... (Я — ЛЛ-!)
(ЯЛ~ Я^ ... (ЯЛ — A.n-i) (Лп — Ях) (Яп — Я2) ... (ЯЛ~- Я/i-i)
Неизвестное £п служит коэффициентом при члене самой
высокой степени, т. е.
Обозначим определитель Вандермонда через ДП(Я1, ..., Яп);
ясно, что Апп — тоже определитель Вандермонда, а именно:
Апп = Дп-1(^ь «ж., Яп-i), и все Яь in, Яп попарно различны.
Имеем
= (ЯЛ — ЯО ... (ЯЛ — Яя-i) Л (Я1, ..., ЯЛ-.!).
170
КНИГА .II. АЛГЕБРА
А так как Ai(Xi) = 1, постепенно приходим к формуле
ДпОЧ, .... Я»)« П (Л|-Л/).
Эта формула верна и в том случае, когда два числа Х{ и А,>
при 1Ф\ равны. Действительно, тогда произведение в правой
части равно нулю; а с другой стороны, определитель Дп(^ь ...
..., %п) имеет две одинаковые строки, и потому тоже равен
нулю.
§ 2. Общий случай
Пусть г—ранг матрицы А, имеющей в качестве вектор*
столбцов вь , с,, ат. И пусть
<хц ... а1г J
D(a'l9 ..., а;)-
Ф0.
| аг1 ... аг
Для того чтобы система (2) имела решение, необходимо и
достаточно, чтобы вектор Ь принадлежал векторному
пространству, порожденному векторами а\, ..., аг (оно уже содержит
векторы аг+и ..., ат). Благодаря результатам разд. II, § 2 эта
утверждение можно сформулировать следующим образом.
Для того чтобы линейная система (1) имела решение,
необходимо и достаточно, чтобы все п — г характеристических
определителей
\ап ... а1г Pj|
£>«, ..., <, &") =
"Л
«si
И/т
«5Г
для s = г + 1, ..., я обращались в нуль.
Неизвестные |г+ь ...» Im являются вспомогательными; им
можно придавать любые значения, и все сводится к решению
следующей системы Крамера относительно неизвестных
ёь • • •» £?•:
6^+ ... +6Xe*,-6r+lar+l- ••' -6тС
т. е.
an6i+ ••• + «irir = Pi — «lr+i^r+i —
' alrt&n
Итак, достаточно решить г уравнений из системы (1); осталь*
ные п — г будут автоматически удовлетворяться уже найден*
ными неизвестными.
ГЛ. IX. ОПРЕДЕЛИТЕЛИ
171
Пример. Пусть имеется система
-Yb + Ka-*,
ylx - о£з = Ру
-P£i + a£2 = v.
При а = р = y = 0 эта система несовместна, если хотя бы
одно из чисел Я, \х или v отлично от нуля. Если же Я = \х = v =
= 0, то любая система |ь |2> £з является решением. Теперь пред-
лоложим, что y Ф 0. Тогда матрица
Л =
имеет ранг 2. Действительно, *А = —Л; значит, D(fA) = D(—А) =
= (—1)з£(Л) =—/)(Л); но Я(Л) =£>(<Л), откуда £(Л)=0.
(Впрочем, это легко проверить и непосредственными
вычислениями.) С другой стороны, минор элемента агз равен
10 -y|
Iy о|
Существует всего один характеристический определитель
0 -y A.I
_*,2
Y2=^0.
Y
0
а
= y (аЯ + p[i + yv).
А поскольку уф 0, то если аХ + $\i + yv Ф 0, система не имеет
решения. Если же аЯ + $\i + yv = 0, то система имеет решения;
вспомогательному неизвестному £3 можно задавать
произвольное значение, затем решается система
-\>|2 = Я-Р6з,
Yli = \х + а|3;
получаем
... №з-я
Y
„ _ а|3 + у
Si"" у »
12
Третье уравнение удовлетворяется при любом |з, поскольку
в силу того, что —р|л — аЯ = yv-
172 КНИГА II. АЛГЕБРА
Пример однородной системы. Рассмотрим однородную
систему п уравнений с п + 1 неизвестными £0, . *., £п*
anolo + <*>n\l\+ ••• +«лл1« = 0-
Предположим, что матрица А коэффициентов <хц имеет ранг п;
тогда существует ненулевой определитель из п строк и п
столбцов, выделенный из матрицы. Обозначим через Ajo
произведение числа (—IV на определитель матрицы, полученной в
результате вычеркивания из А столбца элементов, имеющих второй
индекс /. Если матрицу А дополнить сверху еще одной
строкой произвольных элементов осоо, ..., аоп, то Ajq будут
коэффициентами в разложении новой матрицы по элементам первой
строки. Можно считать, что Лоо Ф 0; тогда go — вспомогательное
неизвестное, и ему можно задать любое значение, хотя бы
£о = Л0ор, где р произвольно. Теперь достаточно решить систему
Крамера
Unh + • • • + ainln — -" «юРЛю»
Определитель из коэффициентов этой системы есть Лоо, и мы
получаем
|ап . Р^ооаю • а\п
£*e"ZT
*п\
/-1,.
П.
— рЛооал0 . ап
Вынося множителем рЛ0о и переставляя i-й столбец на место
первого, получаем & = рЛг0. Таким образом, эта формула
справедлива для i в= 0, 1, ..., п при любом р.
ГЛАВА X
ЕВКЛИДОВО ПРОСТРАНСТВО
I. ВНУТРЕННЕЕ ПРОИЗВЕДЕНИЕ
Мы уже определили в гл. III, разд. II, § 2 понятие нормы
в векторном пространстве.
Пусть Е — векторное пространство над нормированным
полем К\ норма есть отображение х-+ ||х|| пространства Е во мно-
ГЛ. X. ЕВКЛИДОВО ПРОСТРАНСТВО
17а
жество R+ неотрицательных действительных чисел, обладающее
следующими свойствами:
1° ||*||>0 и ||*|| = 00* = о.
2° II Л* || НА, |||* || Для Я е= К и любого *<=£.
3° Ik + ylKIUH + llf/ll для любых *, j/g£.
В частном случае пространства Е = Rn, рассматриваемого
как векторное пространство над полем действительных чисел R>
наделенным своим обычным абсолютным значением, можно
определить несколько норм.
Пусть * = (|ь ..., In) — элемент из Rn с компонентами
h> • -. > In. Тогда каждая из формул
n*iiHtii+ ... +\in\>
||*||= max \lt\
(ср. Книга III, гл. V) определяет норму. Нетрудно убедиться в
том, что свойства 1°, 2° и 3° нормы выполняются. С каждой из
этих норм может быть также связано расстояние.
В настоящей главе мы изучим одЯу специальную норму,
являющуюся обобщением геометрического расстояния в
пространстве 2 или 3 измерений. Для этого вернемся к изучению
билинейных форм.
Квадратичная форма. Пусть Е — векторное пространство
над полем /С, а ф — билинейная форма на Е X Е. Квадратичной
формой со, полученной из ф (или соответствующей ф, а также
порожденной ф), называется отображение пространства Е в К>
которое каждому * е Е ставит в соответствие со (*) = ф (*, *)
из К-
Имеем, следовательно,
0 (Я*) =■ ф (Я*, Я*) = Я2ф (*, *) = Я2со (*) для Я е К, х е Е
и
<о(* + у) = ф(* + #, х + у) = у(х, х) + у(у, х) + у(х9 у) + <р(у, у)**
= со (*) + 0 (у) + ф (*, у) + Ф (у, *) для * s E, уе=Е.
Первое соотношение формулируется следующим образом: о
есть однородная форма 2-й степени (значит, линейная форма
есть однородная форма 1-й степени).
Квадратичная форма со может порождаться несколькими
билинейными формами; действительно, если ф не является
симметрической (гл. VII, разд. V, § 1), то ф(*, у) Фц{у, *), но в то же
время обе билинейные формы порождают одну и ту же
квадратичную форму, ибо в обоих случаях оэ(*) = ф(*, *).
174 КНИГА II. АЛГЕБРА
Если задана какая-нибудь билинейная форма <р, то всегда
найдется симметрическая билинейная форма, порождающая ту
же квадратичную форму, что и q>; действительно, билинейная
форма ytcpt*;, y) + q>(y, х)] является симметрической и
порожденная ею квадратичная форма совпадает с формой,
порожденной ф.
Отныне билинейная симметрическая форма будет
обозначаться буквой %.
Пусть со (х) = х (х, х); тогда со(л; + (/)=» со (х) + <о (у) + 2% (х, у);
следовательно, зная со, можно восстановить порождающую ее
симметрическую билинейную форму % по формуле
%(*> У) = у[б) {х + у) - 0 (х) - 0 (у)].
Определение. Эта билинейная симметрическая форма
называется формой, полярной к со.
Пусть Я — некоторое число из /С; отображение, которое
каждому х^Е ставит в соответствие Хы(х)^К, есть квадратичная
форма; обозначим ее через Ясо; если % есть форма, полярная к <о,
то полярной к Яш будет Я%.
Пусть теперь coi и сог — две квадратичные формы на Е, а эо
и %2 — их полярные формы. Отображение, которое каждому
х^Е ставит в соответствие coi (л:) + (й2(х)^К, есть
квадратичная форма на Е\ обозначим ее через o)i + 0)2; полярная к ней
форма есть xi -К Х2-
Итак, квадратичные формы на Е образуют векторное
пространство над К
Полярные формы квадратичных форм на Е тоже образуют
векторное пространство над /С
Эти два пространства изоморфны.
Определенная квадратичная форма. Если о — нейтральный
элемент сложения в Е, то <о(о) =0; действительно, со(Ял;) =
= Я2(о(д:), что при Я = 0 дает со(о)=0. Может случиться, что
о — не единственный элемент в Е, для которого ы(х) = 0. В
частном случае, когда о)(л;)=0 влечет х = о, т. е. когда со
обращается в нуль лишь для х = о, говорят, что со есть определенная
квадратичная форма.
Рассмотрим теперь случай, в котором Е есть векторное
пространство над R, а со есть отображение Е в поле R. Пусть g e R
произвольно; для любых двух элементов хФоиуФо из Е
будет выполняться
со (х - \у) - % (х - \у, х-1у) = <* (х) - 21%(х, у) + £20 (у).
Полученное выражение представляет собой трехчлен 2-й
степени от £. Если xg£ не имеет вида Ху, то элемент х — %у ни-
ГЛ. X. ЕВКЛИДОВО ПРОСТРАНСТВО
175
когда не будет равен о, значит, трехчлен не обращается в нуль,
поэтому (о(х) и (о (у) имеют одинаковые знаки. Результат
остается верным и для х = Ху, ибо в этом случае трехчлен
обращается в нуль лишь для £ = X, а стало быть, имеет двойной
корень.
Итак, если со— действительная определенная квадратичная
форма на действительном векторном пространстве, то для
любого х Ф О число со(л') имеет постоянный знак; если это знак +,
то говорят, что со— положительно определенная, а если —, то
говорят, что со — отрицательно определенная.
Если со — отрицательно определенная форма, то —со тоже
квадратичная форма, и притом положительно определенная.
Неравенство Шварца. Пусть Е— векторное пространство
над R и со (положительно или отрицательно) определенная
квадратичная форма. Предыдущий результат показывает, что если
х Ф о, у Ф о, то дискриминант рассматриваемого трехчлена
отрицателен или равен нулю; вычислив его и записав, что он <<0,
получим неравенство Шварца:
[%(х,у))2<<*(х)<й{у).
В случае, когда достигается равенство, трехчлен имеет один
двойной корень; следовательно, существует такое X, что
со (а: — Ху) = 0, т. е. х = Ху, так как со предполагается
определенной и потому обращается в нуль, только если х — Ху = о.
Неравенство справедливо и для х = о или у = о, ибо тогда
%(о,у) = 0 и со(о) = 0.
Внутреннее произведение, норма. Пусть Е— векторное про-
странство над R; допустим, что на Е существует положительно
определенная квадратичная форма со. Соответствующая
симметрическая билинейная форма % называется внутренним
произведением или скалярным произведением *) на Е. Значение в R
формы %(х,у) обозначается х*у или {х,у). Оно удовлетворяет
неравенству Шварца. Имеем
х • у = у • х (коммутативность),
{Хх) .у = Х{х-у)
х-{У1 + У2) = Х'У\ + х-У2 (дистрибутивность).
Со всяким внутренним произведением можно связать норму,
положив
|| х || м У (а (х) = Ух • х. ~
Действительно, || х \\ > О и || х || = 0=Ф со(х) = 0; поэтому
X = О.
*) В русских изданиях принято название «скалярное произведение» и
обозначение (х, у).
176 ' КНИГА II. АЛГЕБРА
С другой стороны,
|| Хх || = V~<*Vw) = УШ(х) = I Я | Vtojx) = \Х 11| х ||.
Наконец, || х + у ||2 = со (л: + у) = со (х) + со (у) + 2х • у =
= II л:21| + || у ||2 + 2л: • у. Но по неравенству Шварца (х*у)2 -<
< со (л:) со (у); следовательно, | х • # |< У® (х) со (у) = || х || • || у ||,
и стало быть,
!U + f/ll2<IUII2 + Ш2 + 2||х || • II У II - (llxll + llf/II)2.
Отсюда получаем неравенство треугольника
\\х + у\\<\\х\\ + \\у\\.
Замечание. Найдем, при каком условии || х + у \\ =
^= II х \\ + || у ||. Если а: или у равно о, равенство очевидно.
Допустим, что у Ф о. Равенство выполняется лишь в том случае, если
х • у = V® (х) со (у) > О,
и значит, трехчлен со (# — Ъ,у) = со (х) — 2%х • у + £2со (#) имеет
двойной корень:
6-я-||*1И10||;
следовательно, х = Ху, где Я>0. Обратное очевидно. Итак,
равенство || х + у || = || х || + || у || достигается в том и только том
случае, если существует такое X > О, что х = Ху.
Углы. Пусть х и у — два ненулевых вектора из Е\ число
х • у/11 а: || • || у || в силу неравенства Шварца принадлежит
замкнутому отрезку [—1, +1]. Следовательно, существует такой угол 9,
0<9<я (гл. V, разд. II, § 1), что
cos6-*-y/||*||-||jM|.
Этот угол называется углом между векторами х, у. Угол
не зависит от порядка векторов х и у. Если заменить х на Хх,
то значение величины cos 9 умножится на VIM» т. е. на 1, если
X > 0, и на —1, если Я<0. Таким образом, угол между х и у
не изменится, если заменить х на Хх с Х> 0 и перейдет в свой
дополнительный я — 9, если заменить х на Хх с X < 0. Если
у = Хх, то снова видим, что cos 9 = 1, а значит, 9 = 0, если X > 0,
и cos9 = —1, а значит, 9 = я, если КО.
Ортогональные векторы. Если х и у — два вектора из Е,
угол между которыми равен я/2, то говорят, что х и у
ортогональны.
В этом случае cos 9 = 0, т. е. х *у = 0; таким образом, уело*
вне Х'у = 0 определяет два ортогональных вектора. Если даже
один из векторов равен нулю, говорят, что х и у ортогональны,
ГЛ. X. ЕВКЛИДОВО ПРОСТРАНСТВО
177
всякий раз, как х >у = 0. В частности, вектор о ортогонален
любому вектору из Е. Если х и у ортогональны, то х • у = 0 и
II* + у\\2 = (х + У) • (х + у) = IMI2 + ||у||2. Этот результат
называется теоремой Пифагора.
II. КОНЕЧНОМЕРНЫЕ ЕВКЛИДОВЫ ПРОСТРАНСТВА
В этом разделе будут обобщены обычные геометрические
понятия расстояния и угла.
§ 1. Ортонормированный базис
Предположим, что Е есть векторное пространство конечной
размерности над полем действительных чисел R и что на Е
определено внутреннее произведение, а стало быть, и норма.
Мы покажем, что в любом векторном подпространстве
размерности г^Сп пространства Е можно найти базис, состоящий
из таких г элементов щ, «2, •..» ttr, что каждый элемент этого
базиса имеет норму, равную единице, и любые два различных
элемента из этого базиса ортогональны. Иными словами, если
б*, j есть символ Кронекера, то существует такой базис щ, ..., иг>
что щ • щ = бг, j для всех i, j = 1, 2, ..., г. Такой базис
называется ортонормированным.
Вначале докажем следующую предварительную лемму.
Всякая система отличных от нуля попарно ортогональных
векторов хи . • •, Хи линейно независима.
Действительно, составим выражение К\Х\ + ... + %kXh = о;
умножив его скалярно на хи получим
Я, {хх- xt)+ ... + Ki (xr Xt)+ ... + Xk (xk • x{) = xt • о = 0.
Значит Xi || Xi II2 = 0; а так как x\ Ф о, то Яг = 0. Поскольку это
верно для i = 1, ..., kt то векторы Хи ..., Хь, независимы.
Теперь докажем по индукции существование ортонормиро-
ванного базиса. Пусть F — подпространство размерности 1 в Е\
тогда F обладает базисом, состоящим из единственного элемента
е\ ф о, и любой вектор из F имеет вид х = %ех, где Я е R
произвольно. Так как е\ Фо, то можно положить Щ—-г.—«геи тогда
II ^i II
и\ = 0, Huill = 1, и и\ тоже служит базисом в F. Таким образом,
подпространство F размерности 1 имеет ортонормированный
базис. Теперь допустим, что rj>2 и что все подпространства
размерности k < г имеют ортонормированный базис. Рассмотрим
подпространство F размерности г и возьмем в F
подпространство размерности г—1; последнее, по предположению, имеет
ортонормированный базис и\, ..., иг-\. Его размерность равна
г — 1 < г, и поэтому в F найдется хотя бы один вектор х, не
принадлежащий этому подпространству. Образуем вектор
178
КНИГА II. АЛГЕБРА
v = х + %\UX + ... + )vr-iur-i и попытаемся указать такие
Яь ..., V-1, чтобы v был ортогонален каждому из векторов
щ, ..., иг-\. Имеем 0 = v-щ — х-щ + Х{Щ-щ для i = 1, ...
..., г— 1. А поскольку || щ || = 1, то щ • щ = 1, и мы получаем
для %i значение: —x-U{. При этих значениях чисел к{ вектор v
ортогонален каждому из векторов и\, ..., иг~\. При этом v 4= о,
иначе х, вопреки предположению, принадлежал бы
подпространству в F, порожденному векторами ии •. •, Щ-\.
Положим иг = и/|| и ||, тогда || иг || = 1, и система и\, • • > «г
ортонормирована; следовательно, U\f ..., иг линейно
независимы; но F имеет размерность г; поэтому векторы образуют в F
ортонормированный базис. Отсюда вытекает
Теорема. Если Е есть векторное пространство над R и на
нем определено внутреннее произведение, то само Е и любое его
подпространство имеют ортонормированный базис.
Использованный нами метод доказательства называется
процессом ортогонализации Шмидта.
Из этой теоремы следует, что само пространство Е имеет хотя
бы один ортонормированный базис щ, . •., tin. При п !> 2 таких
базисов бесконечно много, ибо подпространство F размерности
г < п можно выбирать произвольно.
Ортогональные подпространства. Пусть Е есть ^-мерное
векторное пространство над R, наделенное внутренним произвел
дением. И пусть F — его подпространство размерности г < п. Со«
гласно только что доказанному F имеет ортонормированный
базис иь ..., ит. Процесс индукции позволяет дополнить этот базис
до ортанормированного базиса ti\, ..., иГу иг+ь ..., ип
пространства Е. Подпространство G, порожденное элементами иг+ь . %,
..., ип имеет размерность п — г.
Всякий элемент у, ортогональный любому элементу х е F,
принадлежит G.
Действительно, пусть
* = ii"i+ ••• +lrUr и у = г\{щ+ ... +цпип\
тогда в силу дистрибутивности внутреннего произведения имеем
*• у^ЗбЛ/Иг ^/ = 0, где 1=1, ..., г и /== 1, ..., п.
Следовательно, |гЛг = 0 для I = 1, ..., г; а так как |4 могут быть
любыми, то r\i = 0 для i = 1, ..., г; значит, у е G.
Стало быть, G зависит только от F и не зависит от выбора
конкретного ортонормированного базиса в Е и в F.
В пространстве Е подпространство G называется
ортогональным к подпространству F.
G является дополнительным к F подпространством.
Пересечение F П G сводится к единственному элементу о, и всякий
элемент z е Е представляется единственным образом в форме г =
« х + у с x^F и yeG,
гл. х. евклидово пространство 179
§ 2. Изометрия с пространством Rn
Явное выражение внутреннего произведения. Пусть Е —
векторное пространство конечной размерности п над полем R,
наделенное внутренним произведением. И пусть ии ..., ип — ор-
тонормированный базис в Е\ тогда имеем для х е Е и у е Е
x*-biux+ ... +Ъпип%
y = *\\Ui + ... + %"*•
Отнесем элементу х^Е элемент % = (§i, ..., ?п) из Rn, a
элементу у еЕ — элемент у= (тц, ..., цп) из Rn. Мы знаем
(см. гл. VII, разд. II, § 2), что тем самым определен изоморфизм
между Е и Rn. Имеем
где суммирование производится независимо по i = 1, ..,, п и
по / = I, ..., п. Но Ui • Uj = 6ij, и значит,
*-y = 6i4i+ ••• +l/i%.
Легко видеть, что отображение х произведения Rn X Rn в /?,
которое паре (х,у) ставит в соответствие %{х, у)~Х'у =
= h*\i +"... + 1пГ\п, есть симметрическая билинейная форма.
Соответствующая квадратичная форма со определяется
посредством формулы
<d(x) = %(x, x)HUII2 = l?+ ... + Ц.
Это есть положительно определенная квадратичная форма.
Будем снова обозначать ее через х-у или (%,у), а через ||*|| =
= Vl2\ + • • • + In — соответствующую норму в Rn.
Векторное пространство Rn, наделенное предыдущим
внутренним произведением, называется n-мерным евклидовым
пространством.
Так определенный изоморфизм между Е и Rn сохраняет
внутреннее произведение, ибо х*у = х>у\ следовательно, он
сохраняет ортогональность и норму. Такой изоморфизм
называется изометрией.
В частности, ортонормированному базису U\f *.. > ип
пространства Еп соответствует канонический базис ёи ***, ёп
пространства Rn\ стало быть, последний тоже ортонормирован.
Впрочем, в этом легко убедиться и непосредственно.
Заметим еще, что х^щ = х*г\ = \и т. е. компонентами
элемента х из Rn являются внутренние произведения х*ёи 5*«
ь л • > X Сп*.
180 КНИГА II. АЛГЕБРА
§ 3. Билинейные формы
Выражение общей билинейной формы. Вернемся к изучению
билинейной формы на Е X Е, где Е есть конечномерное
векторное пространство над R; это изучение было начато в гл. VII,
разд. V, § 2.
Пусть ей .. -, еп — какой-нибудь базис пространства Е\
тогда для хе£ и у е£ имеем- - -
* = Ii*i+ ••• +1пел*
Любая (не обязательно симметрическая) билинейная форма
определяет отображение произведения Е X Е в /?, а число из #>
соответствующее (я, у), имеет вид
2(2^^/), (1)
где <Xij — число, соответствующее паре (eiy ej). Но (1)
определяет также отображение пары (Ж, у) ^ Rn X Rn в /?, где Ж =
= (|ь ..., 6п) иу = (т|ь ••«» Лп).
Это отображение является билинейной формой <р; обозначим
его значение на паре (Ж, у) через <р(я, #).
Таким образом, всякой билинейной форме на Е X Е ставится
в соответствие билинейная форма на изоморфном векторном
пространстве Rn X Rn, принимающая для двух соответственных
пар из Е X Е и Rn X Rn одно и то же значение ф(Ж, у) в R.
Обратно, если ац — произвольные числа из R, то выражение
(1) является билинейной формой на Rn X Rn* Следовательно,
все билинейные формы на Rn X Rn имеют вид (1). Теперь
определим на Rn внутреннее произведение
X ■ У = llTJi + . . . + 1пГ\п,
т. е. будем рассматривать Rn как евклидово пространство.
Имеем
<Р (*. У) -1, ( 2 «,/Л/] + • • • +1„ (II «„/Л/] = l.rtf + • • • + IX,
/г
где tjJ = S ai/Tly Обозначим через Л следующую квадратную
матрицу из п строк и п столбцов:
Чп
гл. х. евклидово пространство 18f
а через |/' —вектор с компонентами (ц'{, ..., т)^) из Rn. Тогда
9' = М9).
Стало быть, значение формы ср(х, у) может быть
представлено при помощи внутреннего произведения
Ф % у) = х • А (у).
Обратно, если А есть произвольная квадратная матрица из я
строк и п столбцов, то всякое внутреннее произведение х-А(у)
будет билинейной формой на Rn X Rn.
\ Билинейную форму (1) можно записать и в таком виде:
ф(*. £) = 4i (2 6/««) + ••• +Цп(^1ЬЩп)==%1[+ ... + \1'п>
где Ej = Sa«/Ii.
Обозначим через х вектор из Rn с компонентами (gj, ..., ££);
тогда Ж' = *Л(£), где 'Л есть матрица, транспонированная к А
(симметричная с А относительно ее главной диагонали)
(гл. VIII, разд. III, §4).
Итак, мы получили следующий важный результат.
Любая билинейная форма на Rn X Rn определяется форму-
лами
ф(*. у) = х-А(у) = 'А(х)-у,
где А — квадратная матрица порядка п.
Частный случай. Внутреннее произведение получается, когда:
А есть единичная матрица; значит,
х- у = х-1(у) = 1(х)-у.
Ниже следуют результаты, уточняющие связи между
билинейными формами и матрицами.
Докажем следующую лемму.
' Для того чтобы заданный вектор у' был преобразованным из
заданного вектора у при помощи матрицы Л, необходимо и
достаточно, чтобы для любого вектора х выполнялось равенство
х- А(у) = х- у'.
В самом деле, если у' = А (у), равенство очевидно. Обратно,
допустим, что х-А(у) = Х'р' при любом х. Возьмем х = ё\ =
= (бгь ..-, бгп), т. е. Ж—вектор канонического базиса в Rn.
Тогда ё{ • А (у) будет f-й компонентой для А (у), а е\ • у' — 1-й
компонентой для у'. Поэтому все компоненты у А (у) и у' соот«
ветственно равны, т. е. у' = А (у).
Отсюда получаем следующую теорему.
182 КНИГА И. АЛГЕБРА
Теорема. Для того чтобы билинейная форма % на Rn X Rn
была симметрической, необходимо и достаточно, чтобы матри- \
ца Л, соответствующая форме х> была симметрической. I
Действительно, для любых х и у должно выполняться уело- :?
вие х(%>у) ~Х(Р>*)> т. е. х- А(у) = у • А (£). Но £.Д(2)=» f
='Л (!/)•£, и значит, х*А{у) =хгА(д) для любого х. По пре- j
дыдущей лемме А (у) = 'Л ($). А поскольку это равенство имеет
место для любого у, то А « *Л, и стало быть, матрица Л будет
симметрической. Обратное очевидно.
Линейное преобразование. Пусть Т — квадратная матрица и
х = Т(х')> у = Т(у'). Отображение <р, которое паре (х',у')
ставит в соответствие число ф(£, у) = <р[Т($ ), Т(у')\ есть
билинейная форма; ей соответствует такая матрица В, что <р(#, у) =
= хг • В (у'). Найдем эту матрицу В. Имеем
Ф(*. # = *• л(у) = г(^).(Лг)(л=а;'- (^лг)(^)=^.5(г).
А поскольку это справедливо для любого х'у то
*ТАТ(у') = В(у')
для любого у'у а следовательно, В = *ТАТ.
В частном случае, когда А — симметрическая матрица,
А = 'Л, билинейная форма ф — симметрическая; матрица В
будет также симметрической.
Действительно,
*В = * {'ТАТ) - гТ*АТ = 'ТА Т = В.
§ 4. Квадратичные формы I
Пусть х есть симметрическая билинейная форма на Rn X Rn,
определенная симметрической матрицей Л. Мы отнесем ей
квадратичную форму со на евклидовом пространстве Rn, положив
о)(Ж) = х(я>£) для любого xGjR". Тогда со (я) = х*А(х). Обрат*
но, если известно со, то, как мы знаем, симметрическую
билинейную форму х или форму, полярную к со, находят по формуле
%(*> #-"2[ю(* + #-ю(*)-а>(9)] = * • А(у) = у-А(х). |
Отсюда следует, что если В—такая симметрическая матрица, J
что квадратичная форма, соответствующая В, т. е. определен- (
ная формулой Х'В(х), равна со, то такими же будут и поляр- I
ные формы; стало быть, В = Л.
Вид квадратичной формы для евклидова пространства R\
Так как Л — симметрическая матрица, то элементы ац из Л
удовлетворяют равенству ац = щ\ (гл. VIII, разд. III, § 4). По-
ГЛ. X. ЕВКЛИДОВО ПРОСТРАНСТВО 183
этому, если 2 имеет компоненты gi, ..., |п, то
со (*) = | (£ о„|Д,) - | а|(6« + 2 Д аг/|Дг
Формой, полярной к g*f будет g^, а полярной к gjgj при
}Ф1 будет
. j К6< + ъ) (li + %) - 6£/ - ад/] = 4 №л/ + БМ
откуда для формы %, полярной к о, имеем
л п / п \
%(*, У) = И «н5м + 2 a,/ (g,4/ + Б/П«) eS S а//6*Л/) •
Квадратичная форма, соответствующая единичной матрице /,
равна If + ... +|^ = ||J?IP; ее полярная форма есть giT|i+....
.. - + 1пЦп = %'У-
§ 5. Ортогональные преобразования
Рассмотрим Rn как евклидово пространство (§ 2), т. е.
пространство с внутренним произведением
ГДе ^ и У — элементы из /?п, и стало быть, с нормой ||2|| =*
-/!?+ ... +Б5-
Найдем все линейные отображения f пространства Rn в Rn,
обладающие тем свойством, что расстояние между образами
/(2) и f(y) двух произвольных элементов 2 и у равно
расстоянию между самими элементами. А так как расстояние между
/(2) и f(y) в силу линейности / равно ||/(2) — f(y)\\ =■
= 11/(2 — у) II, то для этого необходимо и достаточно, чтобы
11/(2)11 = 11211 Для любого 2 €=ЯП.
Будем говорить, что / сохраняет норму или что / есть изо-
метрия (§ 2).
Пусть / есть линейное отображение Rn в Rn> сохраняющее
норму, и пусть Jg/4(o) есть элемент из Rn9 переходящий в о
при отображении /. Так как норма сохраняется и ||2|| = 0 в том
и только том случае, если 2 = о, то ||2|| = II/(2) || = ||о|| = 0, а
значит, X = О.
Следовательно, /~*(о) сводится к единственному элементу о,
и (гл. VII, разд. III, § 2) / есть взаимно однозначное линейное
отображение Rn на Rn. Отсюда следует
Теорема. Всякое линейное отображение евклидова
пространства Rn в евклидово пространство Rn, сохраняющее норму,
представимо обратимой квадратной матрицей порядка п.
Ш КНИГА П. АЛГЕБРА
Пусть теперь х' =*S(x). Для любого x^Rn должно
выполняться ||£'ИН1Ж|| или, в силу равенства ||£||2 = х*х, х'-х' =
= х>х, откуда Х'Х = S(x)'S(x)= x-tSSix). Но матрица *SS
симметрична (даже если S таковой не является), так как
t(tsS)= fS«<(*S)= fSS. Таким образом, х*х есть квадратичная
форма, отвечающая симметрической матрице /; отсюда следует,
что
S'S = I, или S = S~.
Обратно, если S—такая матрица, что 'S*S = /, то S
обратима и *S = S-1; рассуждение, обратное предыдущему,
показывает, что если х' = S(x), то ||Ж'Ц = И#П для любых x^Rn.
Определение. Квадратная матрица S, для которой fSS = /,
называется ортогональной.
Единичная матрица / удовлетворяет условию 41 = / и,
значит, является ортогональной.
Всякая ортогональная матрица порядка п определяет
линейное отображение пространства Rn в Rn, сохраняющее
внутреннее произведение, а стало быть, и норму. Оно переводит
евклидово пространство Rn в себя.
Действительно, пусть х' = S(x), уг = S(y)\ тогда
x'.y'-SW.SW-x.'SSW-x.lW-x-y.
Следовательно, оно сохраняет также угол между двумя
векторами.
Вид ортогональной матрицы. Пусть
/<*П ... Ощ \
\ ап\ • • • &пп /
— ортогональная матрица. Условие ^-5 = / можно записать
в виде равенств
ОцОи+ ... +onianf = 6Ut
Стало быть, если uj есть /-й вектор-столбец в S с компонентами
o\j, .«., (Tnj, то предыдущие соотношения означают, что щ^й^ =
== 6ii, т. е. йь • • • у ип — ортонормированный базис в Rn.
Обратное утверждение доказывается в обратном порядке. Так как
tSS = /, то *S = S-\ а значит, SS~l = "S^S) = /.
Следовательно, если S — ортогональная матрица, то транспонированная к ней
тоже ортогональна.
Таким образом, для того чтобы матрица была
ортогональной, необходимо и достаточно, чтобы либо ее столбцы^ либо
строки образовывали ортонормированный базис в Rn.
ГЛ. X. ЕВКЛИДОВО ПРОСТРАНСТВО 185
Определитель ортогональной матрицы. Имеем fSS = /;
значит, если D(S) — определитель матрицы S, то, в силу равенства.
D(S) = Z)(<S), [D(S)]2= 1, и D(S)= +1 или —1.
Возможны оба значения. Действительно, взяв в качестве
вектор-столбцов в S канонический ортонормированный базис
ё\, ..., ёп, получим S = / и D(I)= + 1. Если же мы возьмем
ортонормированный базис ё\9 • • •» ёп-и —ёп> то отвечающая
ему ортогональная матрица S' будет иметь определитель
D(S')=— 1.
Замечание. Пусть Р есть параллелотоп Р(В, аи..., ап}
(гл. IX, разд. I, § 1), имеющий объем ©(5Ь ..., ап) =
— \D(au ..., ап)\. Пусть далее S — ортогональная матрица к
5'-S(5), a\^S(ax)9...9 u'n-S(an).
Преобразование S, будучи линейным, переводит
параллелотоп Р в параллелотоп P' = S(P)> где P' = P(5'; а'и ..., а'пу
Объем параллелотопа Р' равен
ш(й;, ..., a% = \D(a'l9 ..., a;)| = |D(S).Z)(ap ..., ae)|-
==0(a!, ..., ая).
Следовательно, ортогональные преобразования сохраняют
объем параллелотопа.
Если D(S)= +1, то они сохраняют, и ориентацию; если же
D(S) = —1, то ориентация меняется.
Ортогональная группа. Ортогональные матрицы образуют
группу относительно умножения.
В самом деле, пусть S\ и S2— две ортогональные матрицы,.
т. е. «SiSi = / и <S2S2 = /. Тогда
'{SJJ (SxSd = WSJ (S^) - (<S2S2) = /;
следовательно, матрица SiS2 тоже ортогональна. С другой
стороны, единичная матрица / ортогональна, и если S
ортогональна, то ортогональна и S-*1, ибо S~l = fS, а 'S ортогональна
вместе с S.
При п >• 3 эта группа не коммутативна.
Поскольку Z)(SiS2)-D(Si) -D{S2) и /)(/)= +1, то
ортогональные матрицы, у которых £(S)= +1, образуют подгруппу
предыдущей группы. Если So—такая фиксированная
ортогональная матрица, что £>(So)=— 1, то всякая ортогональная
матрица S', для которой D(S')=—1, представима в форме-
5' = SSo, где S — ортогональная матрица, имеющая D (S) =-
*= +.1. Действительно, имеем
5 = 5,(S0"' и D(S) = D(S')-^ = +l.
№6 КНИГА II. АЛГЕБРА
Линейные отображения евклидова пространства Rn на Rn9
представимые при помощи ортогональных матриц, образуют
группу, изоморфную предыдущей', эта группа называется
ортогональной.
Подгруппа, состоящая из ортогональных матриц S, у
которых D(S)= +1, называется группой вращений вокруг начала
Она сохраняет нормы, углы, объемы и ориентацию
параллелотопов.
ГЛАВА XI
ПРИВЕДЕНИЕ МАТРИЦ
I. ПРИВЕДЕНИЕ ПРОИЗВОЛЬНОЙ МАТРИЦЫ
§ 1. Собственные значения, собственные векторы
Пусть Е есть векторное пространство конечной
размерности п над полем Л". И пусть / есть линейное отображение про-,
странства Е в Е. При помощи обьЬшого изоморфизма
пространств Е и Кп приходим к линейному отображению Кп в Кп
Это отображение определяет квадратную матрицу из п строк
и п столбцов, зависящую от выбранного в Е базиса. Мы видели
(гл. VIII, разд. III, § 3), что если отображение / представлено
матрицей А относительно некоторого базиса пространства Е,
и матрицей В относительно другого базиса пространства Е, то
найдется такая обратимая матрица Т, что В = Т~1АТ. Обратно,
если Т — обратимая матрица, то матрица В = T~l AT
представляет отображение / относительно базиса, векторы которого
получаются как образы при отображении с матрицей Т~{
векторов базиса, относительно которого А представляет f. Более
точно, пусть е\, ..., еп — базис в Е, используемый для
представления f посредством А, и пусть х является элементом
пространства Е, причем
х=*Ъхех+ ... +1пеп, х = (Ъи .... Ы^Кп;
тогда
ys=sf(x)ssr\lel+ ... +г\пеп> 0 е (Ль •••> Чп)^Кп,
и у = А (х).
Теперь пусть е\, ..., ё'п — другой базис в Е, обладающий
тем свойством, что
е) = хиех+ ... +%п1еп> /=1, ..., я,
ГЛ. XI. ПРИВЕДЕНИЕ МАТРИЦ 187
где
\ хп1 ... %пп
и, относительно этого базиса,
*-£# + ... + £<, *' = &> •••> ^)е**>
y = f{x) = 4\e\+ ... +лХ, Г = К, ••-, lOeJCi
тогда i/' = B(£'), где В = Г-МГ/
Попытаемся найти в В такой конкретный базис,
относительно которого связанная с f матрица имела бы наиболее простую
форму.
Собственные векторы, собственные значения. Мы уже
заметили (гл. IX, 2-й разд. II, § 2), что равенство В = Т~гАТ влечет
равенство определителей: D(B)=D(A). С другой стороны,
/ = Т~ЧТ\ следовательно, для любого р е К имеем
B-pI = T-l{A-pI)T,
и значит, определитель D(A — р/) зависит только от линейного
отображения f и не зависит от выбора конкретного базиса в Е.
Если
/аи ... а1п
\ап\ • • • апп
ТО
л-р/ =
и D(A — р/) = (—1)прп+... + D(A) есть многочлен от р
степени, в точности равной п.
Определение. Многочлен D(A — pi) называется
характеристическим многочленом отображения f.
Его коэффициенты зависят только от линейного
отображения / и не зависят от выбора базиса в Е. То же самое будет
относиться к нулям этого многочлена и к их кратности.
Определение. Собственными значениями или
характеристическими числами отображения f называются нули
характеристического многочлена D(A — pi).
188
КНИГА II. АЛГЕБРА
Если К есть подполе поля С комплексных чисел, то по
теореме Даламбера имеется точно п нулей, принадлежащих С;
если считать каждый нуль столько раз, какова его кратность.
Отныне мы будем предполагать, что К есть поле С или что К есть
подполе поля С, например, поле R действительных чисел.
Пусть pi есть собственное значение, а значит, такое
действительное или комплексное число, что D(A — pi/) = 0. Тогда
матрица А — pi/ необратима (гл. VIII, разд. III, § 2), и существует
по крайней мере один такой ненулевой вектор й\ е Сп, что
(Л — pi/) (их) = о, т. е. А(й\)=р\п\. Обратно если существует
такой ненулевой вектор wi е Сга, что A(ui)= pi(#i), то
рассуждением, обратным к проведенному, убеждаемся, что pi есть
собственное значение.
Вектор й\ называется собственным вектрром матрицы,
принадлежащим собственному значению рь если А(й\)= р\й\
с й\Ф д.
Если и\ есть вектор из £, отвечающий вектору й\ <= Сл, то
f{u\) = pi^i, что показывает, что щ и pi зависят только от /.
Вектор щ называется собственным вектором линейного
отображения f.
Собственные векторы, принадлежащие одному собственному
значению рь и вектор о образуют векторное подпространство
пространства Е, имеющее размерность по меньшей мере
единица.
Действительно, для любого АеС имеем f(l,Wi)=pi(ki),
и если и\ — еще один собственный вектор, принадлежащий рьто
/ («1 + ыОв Pi (ai
+последовательно, если их + и\ Ф о, то и, V и[ тоже является
собственным вектором, принадлежащим рь
Заметим еще, что характеристический многочлен, имея
степень п, имеет по крайней мере один нуль, и стало быть:
Всякое линейное отображение имеет хотя бы один
собственный вектор.
§ 2. Случай, когда все собственные значения различны
Допустим, что все собственные значения различны;
обозначим их через рь ..., рп. Все они служат простыми нулями
характеристического многочлена.
Пусть щ — собственные векторы, принадлежащие
соответственно собственным значениям р* для i = 1, ..., п.
Теорема. Собственные векторы Ui, ,,t] un линейно
независимы.
ГЛ. XI. ПРИВЕДЕНИЕ МАТРИЦ 189
В самом деле, предположим, что выполняется соотношение
%iU\ + ... + knUn = о, Яг е С, i = 1, ..., п. Имеем
f(K\Ui + ... + Кип) = Uf(ux) + ... + Kf(un) = f (о) = о.
Так как векторы щ собственные, т. е. f (щ) = р{ии то
tapi^i + ... + XnQnUn = о. Повторяя эту операцию h — 2 раз,
получим кгркиг+ ... +KPnun==z°> Л==0> 1» •••> л—1.
После этого рассмотрим следующий многочлен от р:
Pi (р) = П (Р ~" Р/)> гДе произведение берется по всем значениям
/ = 1, ..., п кроме j = i\ так, например,
Л (р) = (Р ~ р2) (р ~ Рз) . •. (Р - Р„)-
Имеем Л(р) =Pn""! + con-2Pn""2+ ... +со0; положим еще con_i = l;
тогда Pi(pj) = О, если j ф i, / = 1, ,.., п\ Р<(р<) ¥=0. Составим
сумму
я—1
0= 2«>Л(я,1р»и|+ ... + у>Х) =
* Я^ Ы ^ + ... + ХпРь (р J ия - ХЬРЬ (р,) а,.
А так как Р{(р{)ф0 и и^фо, то необходимо, чтобы Яг = 0.
Это будет выполняться для любого индекса 1=1, ..., я;
следовательно, u\, ..., */п линейно независимы.
Приведение к диагональной форме. Собственные векторы
Иь • • •» "п, будучи линейно независимы, образуют базис
пространства Е. Пусть х = £iWi + ... + InUn есть произвольный
вектор из Е, а z = (£ь . ••> £п)— соответствующий вектор в Сп.
Имеем
/ (х) = U (щ) +...+£„/ («я)« PiCitt! + ... + ря£яия.
Соответствующим в.ектором в Сп будет вектор (pi£i, ..., рп^п)\
стало быть, он получается из z при помощи матрицы
/Pi 0 ... 0 \
и J о р2 ... о
\о "о ,'!pj
Матрица такого вида называется диагональной.
. Таким образом, если в качестве базиса в Е берутся
собственные векторы ии .. •, Un, то отображение пространства Сп
в Сп, соответствующее отображению /, задается диагональной
матрицей U. Если же £i, . •., еп — произвольный базис в Еь
190 КНИГА И. АЛГЕБРА
то Uj = tij^i + ... + Tnj£n для / = 1, ..., я. Положим
"Гц ... ХХп
Г=1
Пусть А — матрица, представляющая отображение /, когда
в качестве базиса в Е взяты ей ..., еп\ тогда U = Г-МГ.
Следовательно, существует такая обратимая матрица 7\ что
матрица, преобразованная из А посредством 7\ будет диагональной
матрицей I/. Матрица U не единственна, ибо можно изменять
порядок векторов и\, ..., ип; однако если существует
диагональная матрица
'А,, 0 ... О
О Х2 ... О
v =
,0 0 ... Xnt
преобразованная из Л, то D(V — р/)= D(A — р/), т. е.
(—1г(р — Xi).. .(р — Яп)==(—l)n(p — pi)...(p — pn); стало
быть, числа Хи ..., Яп являются, с точностью до порядка,
собственными значениями, а У есть одна из матриц вида U.
Заметим, что векторное подпространство собственных
векторов, принадлежащих одному собственному значению, имеет
размерность, равную единице. Действительно, если щ и v\ — два
собственных вектора, принадлежащих собственному значению pi,
то оба они принадлежат векторному подпространству,
являющемуся дополнением п—1-мерного векторного пространства,
порожденного векторами иг, ..., ип, а значит, векторному
подпространству размерности единица. Следовательно, v\ = kU\>
К^С (при этом КФО).
§ 3. Общий случай
Если не все собственные значения различны, то не всегда
можно найти диагональную матрицу, представляющую линейное
отображение. Однако, как мы покажем, можно найти матрицу,
выявляющую собственные значения и имеющую форму, удобную
для вычислений. Мы будем всегда рассматривать n-мерное
векторное пространство Е над полем комплексных чисел С и
линейное отображение / пространства Е в £.
Пусть W\, ..., Wn — некоторый базис в £, и пусть Af —
такая матрица, что если
x = hw\+ ... +lnWn и y = f{x) = 4iwi+ ... +r\nwn,
ГЛ. XI. ПРИВЕДЕНИЕ МАТРИЦ
191
Ни
0
0
0
0
М-12 •
Ц22 • •
0 ..
0 ..
0 ..
• 1*1*-!
• Ц2А-1
• ЦА-1А-1
. 0
. 0
UlA ••
Ц2А • •
Ш-МА • •
МтгА • •
Ц/lA • •
• Uln
• Ц2»
• И*й-1л
• Р*«
• Шл
то соответствующие векторы х = (gi, ..., %п) иу= (ци ... Лп)
в Сп получаются один из другого при помощи этой матрицы по
формуле у=М(х). Обозначим через \щ элемент £-й строки и
/-го столбца матрицы М. Предположим, что мы выбрали базис
«>ь .-., wn так, чтобы \iij = 0 для i>]\ j<h при некотором
фиксированном Л>2 (h^n). Тогда матрица Л! будет иметь
вид
Af«
Теперь рассмотрим векторное подпространство £',
порожденное векторами wh> ..., юп. Элемент xf^Er имеет
образом при отображении f элемент f (x'), который можно разбить
на у" + у\ где у' е Е\ а */" <= £", дополнительному к £'
векторному подпространству, порожденному, векторами wu ..., доЛ_1,
Отображение пространства £' в Е\ ставящее каждому вектору
х' е £' в соответствие вектор у' <= £' (сужение / на Е'),
есть линейное отображение, которое мы обозначим через g.
Заменим в Е' базис Wh> ..., о>п базисом w'h, ..., о£, в котором
w'h есть собственный вектор отображения g. Пусть
относительно базиса wv ..., wh_v w'h, ..., ^преобразование f
представлено матрицей М\ состоящей из элементов \i'ir Тогда \л\. = \iif
для / < А, а значит, в частности, ^ = 0, если / < h и * > /.
Кроме того, g-(^) = p^, поэтому / (Ч) = Р>а + ^л» гДе w'h^E">
и стало быть, [д^А = 0, если / > h. Таким образом, матрица ЛГ
имеет ту же форму, что и М, но с заменой h на h + 1.
Установив этот результат, напомним, что всякое линейное
отображение имеет хотя бы один собственный вектор. Пусть
V\ — собственный вектор отображения fy а Е\ — векторное
подпространство пространства £, дополняющее подпространство,
порожденное вектором V\. Линейное отображение f\
пространства Е\ в Еи являющееся сужением f на Еи также имеет хотя
бы один собственный вектор v2. Допустим, что таким путем мы
получаем векторы v\, ..., f/i-i; обозначим через Ен-\ векторное
подпространство, дополняющее подпространство, порожденное
векторами vu ...» ^л-i- Сужение на Еп-\ отображения f есть
линейное отображение fh-\ пространства £\_i в Eh-{. В
качестве vh возьмем собственный вектор отображения fh-\. Задавая
числу h последовательно значения 3, ..., п, получим базис
192 КНИГА П. АЛГЕБРА
t»i, ..., vn пространства Е. Установленный выше результат
показывает, что относительно этого базиса линейное отображение f
представимо при помощи матрицы V, имеющей следующую
форму:
и _ I 0 022 . . . Щп \
Элементы anj с i > j, эт. е. элементы, лежащие ниже главной
диагонали, равны нулю. Такая матрица называется треугольной.
В этом случае характеристический многочлен имеет вид
D(V-pI)-X-l)*(p-4i)(p-<^-.s(P-**dl
следовательно, элементы соц главной диагонали являются
собственными значениями р*, причем каждое повторяется столько
раз, какова его кратность.
Этот результат можно выразить еще следующим образом.
Если А — квадратная матрица с произвольными
комплексными элементами, то всегда найдется такая обратимая
матрица Г, что матрица V = Т~ЛАТ имеет треугольную форму.
П. ПРИВЕДЕНИЕ СИММЕТРИЧЕСКОЙ ДЕЙСТВИТЕЛЬНОЙ МАТРИЦЫ
ПРИ ПОМОЩИ ОРТОГОНАЛЬНОЙ МАТРИЦЫ. ПРИВЕДЕНИЕ
КВАДРАТИЧНОЙ ФОРМЫ
В этом разделе мы будем предполагать, что Е есть
векторное пространство конечной размерности п над полем R и что
оно наделено внутренним произведением. Кроме того, допустим,
что на Е X Е определена симметрическая билинейная форма %:
5С(*> У) = %(У> х), где х<=Е, уе=Е,
и пусть со (л:) = %(х,х)—соответствующая квадратичная форма.
Тогда относительно каждого базиса в Е форме % соответствует
симметрическая матрица Л.
Мы покажем, что в Е всегда найдется такой ортонормиро-
ванный базис, что соответствующая матрица А будет
диагональной. Иными словами, если А соответствует форме %
относительно произвольного ортонормированного базиса в Е, то
существует такая ортогональная матрица S, что S-MS диаго-
нальна.
Пусть имеется ортонормированный базис еи ,.., еп
пространства Е и пусть
x = he{+ ... +Ъпеп, * = (£ii •••> ln)<^Rn,
У = № + ... + y\nem У = Oil, • • •> Цп) е Rn.
ГЛ. XI. ПРИВЕДЕНИЕ МАТРИЦ
193
Тогда для внутреннего произведения имеем х*у = х-у =
= giT|i + • • • + 1пГ\п- Отображение, которое элементу (х> у) из
Rn X Rn ставит в соответствие число %(хуу)^ /?, есть
билинейная форма х на Rn X Rn\ при этом %(х, у) = %(х, у) = х-А(у) =
= ^«Л(Ж), где Л — симметрическая действительная матрица.
Точно так же отображение, которое элементу x^Rn ставит
в соответствие число со (я) = х (*> х) из R, есть квадратичная
форма <5 на Rn, й (я) = со (х) = х • Л (Ж).
Будем считать, что матрица Л, оставаясь действительной,
представляет собой частный случай матрицы с комплексными
коэффициентами. Пусть pi и рг— два собственных значения Л,
а значит, два нуля многочлена D(A — р/) = 0, Si и и% —
принадлежащие им собственные векторы. Имеем
X («1, Й2) = Й! • Л (Й2) = р2Й! • Й2 =* Й2 • А {йг) = Pitt! • Й2,
и стало быть, (pi — p2)tti*W2 = 0. Допустим, что pi не является
действительным числом; тогда некоторые компоненты о\, . •.> an
собственного вектора щ могут быть комплексными. В этом
случае в качестве р2 возьмем рь комплексно сопряженное с pi.
Вектор U2 с компонентами дь ..., <тп, сопряженными
компонентам вектора й\> будет собственным вектором матрицы Л,
принадлежащим собственному значению р2 = рь В самом деле, Л
действительна, поэтому, если <4(#i)=piSi, то, переходя к
комплексно сопряженным, получим Л(Й2) = р1Й2- Отсюда следует,
что
(Pi - Pi) Щ • й2 = (р! - рО (а^ + ... + апдп) -
-(Pl"Pl)(|CFiP+ ... +|OTj2H0.
Поскольку pi не является действительным, то pi—pi^O;
значит, из предыдущего равенства будет вытекать, что а\ = .. <
... = аг = 0, т. е. й\ = о, что противоречит определению
собственного вектора.
Следовательно, все нули характеристического многочлена
симметрической действительной матрицы А действительны: все
принадлежащие им собственные векторы могут быть выбраны
действительными.
В дальнейшем мы ограничимся действительным векторным
пространством Rn.
Соотношение (pi — рг) й\ • й% = 0 приводит еще к одному
результату. В самом деле, если й\ — какой-нибудь собственный
вектор, принадлежащий собственному значению pi, а й2— какой-
нибудь собственный вектор, принадлежащий собственному
значению р2, и pi ф р2, то й\ • йг = 0. Следовательно, мы можем
заключить:
Векторное подпространство, порожденное собственными
векторами, принадлежащими одному собственному значению^
7 Ш. Пизо, М. Заманский
194
КНИГА И. АЛГЕБРА
ортогонально векторному подпространству, порожденному
собственными векторами, принадлежащими другому собственному
значению, отличному от первого.
Пусть, в частности, все п собственных значений рь ..., рп
различны. Каждому собственному значению рг- можно отнести
собственный вектор щ с 1!^||= 1. Действительно, если Ю{Фо
есть собственный вектор, то щ = 14/II14II тоже будет
собственным вектором, и || иг-1| = 1. С другой стороны, р{Фрз, если *=£/,
поэтому щ ортогонально щ, и стало быть, щ, ..., ип образуют
ортонормированный базис пространства Е. Это частный случай
теоремы, которую мы предполагаем доказать.
Общий случай. Пусть еи ... , еп — ортонормированный
базис в Е и пусть
* = Si*i+ ..♦ +£***, * = (Si> ...» У^/Л
Билинейной форме х на Е X Е соответствует такая
симметрическая матрица А, что %(х, у) = х*А(у). Рассмотрим линейное
отображение, определенное в Rn при помощи матрицы Л, т. е.
отображение, которое элементу xg/?" ставит в соответствие
элемент Ж' = Л(Ж). Определим отображение / пространства Е
в Е, положив f(x) = xf для элементов х, х' пространства Е,
соответствующих векторам х, х' из Rn. Тогда имеем %{х,у) =
= х'*у для любого у^Е; поэтому отображение / не зависит
от ортонормированного базиса в Е. Если у = ей тох' - е( = 1'.=
= % (*» et), откуда
xf = %(x, ех)ех +'... + %(х, еп)еп,
и значит, отображение f линейно. Докажем индукцией по числу
измерений, что имеет место следующая
Теорема. Пусть F есть r-мерное подпространство
пространства Е. Предположим, что определенное выше линейное
отображение f переводит F в себя; тогда F обладает по крайней
мере одним ортонормированным базисом, состоящим из
собственных векторов отображения f.
Для г = 1 теорема верна. Действительно, если F одномерно,
то возьмем произвольный вектор v\ Фо из F; он составляет
базис пространства F. Имеем f(v\)^F, и значит, f(v\)= p^; это
показывает, что V\ — собственный вектор отображения /. Тогда
вектор U\ = t>i/||iMI образует искомый базис в F.
Допустим теперь, что г>2 и что для векторных
подпространств размерности, строго меньшей г, теорема верна. Пусть
F есть r-мерное векторное подпространство, переводящееся
отображением / в себя, и vi, ..., vr — ортонормированный базис
в F. Тогда любое x&F представимо в виде х = l\V\ + ... +lrvr.
Положим х = (£ь ..., lr)^Rr. Пусть xf = f(x) — образ элемен-
ГЛ. XI. ПРИВЕДЕНИЕ МАТРИЦ 195
та х при отображении f; тогда x'<=F, и x/ = l[vl + ... +l'rvr,
*'-(6{, .... tyeslT.
Отображению f пространства F в F соответствует линейное
отображение пространства Rr в Rr, которое вектору x^Rr
ставит в соответствие вектор х' е/?г; оно определяется при
помощи такой квадратной матрицы В из г строк и столбцов, что
2' = В(Я).
Матрица В — симметрическая. В самом деле, пусть xeF
nysf; тогда
X (У > *) - У • / (*) = У ' *' - 0 ■ *' = У • в (*)>
и, таким образом, х определяет билинейную форму х на RrXRr,
соответствующую матрице В. А поскольку % является
симметрической, то такой же будет и % а стало быть, и матрица В
будет симметрической.
Обозначим через йг с компонентами огь ..., ог и с
|*,|-Vo?+ ... +о?-1
собственный вектор матрицы 5. Тогда В(йг) = ргиг. Вектор
ыг = a\V\ + ... + arvr "лежит в F, и /(иг) = ргмг; следовательно,
иг есть собственный вектор отображения /, а рг — собственное
значение. Кроме того, |^rj2 = <rf+ ... + <т| = 1. Итак, F
содержит хотя бы один собственный вектор иг отображения /.
Теперь обозначим через G векторное подпространство
пространства F, ортогональное к иг\ оно имеет размерность г—1.
Подпространство G состоит из тех и только тех элементов ^eF,
для которых х • ит = 0. Поэтому, если х <= G и х' = f(x), то
иг • f (x) = % (ип х) = % (ху ur) = x-f {ur) = х . ргиг = рг (х • щ) = 0;
следовательно, иг-х'*=*0 и *'eG. Таким образом, /
переводит G в себя. А так как G имеет размерность г—1, то для G
теорема верна, т. е. G обладает ортонормированным базисом
ии ..., Ur-u все векторы которого суть собственные векторы
отображения /. Но вектор иг ортогонален любому вектору из G
и, в частности, векторам ии ..., Ur-u а поскольку \\иг\\=* 1, то
векторы Hi, ..., иг образуютортонормированныйбазис
пространства F, состоящий только из собственных векторов
отображения f. Итак, теорема доказана.
Следствие. Векторное пространство Б обладает
ортонормированным базисом, все векторы которого являются
собственными векторами отображения f.
Это есть предыдущая теорема для г = п.
Возьмем эти собственные векторы ии ..., ип в качестве
базиса пространства Е, и пусть х = giWi + ,., + %пип — элемент из
7*
196 КНИГА II. АЛГЕБРА
Е, а г = (£i, *.., £п) — соответствующий элемент из Rn. Тогда
*'-f(*) = Cif(«i) + ... +EJ(Wii)-bCiPiMi+ •.. +Е»Рп^я.
Следовательно, элемент z'e/?", соответствующий элементу л/,
имеет в качестве компонент pi£i, ..., pn£n- Линейное
отображение пространства Rn в Rn, соответствующее отображению /
и относящее вектору z вектор z', определяется диагональной
матрицей
/Pi 0 ... О \
uJ° .pv:\° L
\о о ...Рл/
Таким образом, если Л есть симметрическая матрица,
определяющая линейное отображение пространства Rn в себя,
соответствующее отображению /, когда в качестве базиса
пространства Е берется произвольная ортонормированная система,
то найдется хотя бы одна такая ортогональная матрица S, что
U = S-^4S. Отсюда следует, что рь рг, ..., рп — собственные
значения отображения f, причем каждое повторяется столько
раз, какова его кратность. Следовательно, вопреки общему
случаю, симметрическую матрицу всегда можно привести к
диагональной матрице, оставаясь при этом в кольце матриц с
действительными элементами.
Пусть рг- — собственное значение, являющееся нулем
порядка nii характеристического многочлена. Тогда рг повторяется
в U точно Ш( раз, т. е. имеется Ш\ соответственных попарно
ортогональных собственных векторов. Следовательно, векторное
подпространство Ft, порожденное всеми собственными
векторами, отвечающими рг-, имеет размерность dt^> m*. Но два
векторных подпространства F\ и Fjf соответствующие двум
различным собственным значениям рг- и pj, ортогональны; стало быть,
Fi П Fj сводится к единственному элементу о. Значит, если
просуммировать числа du соответствующие всем различным
собственным значениям, то получим 2 di *C п. С другой стороны,
2/Яг = я; так как dt>mT-, то 2 di^n. Отсюда следует, что
S^i = я> а значит, di = m*.
Итак, векторное подпространство, порожденное всеми
собственными векторами, принадлежащими одному и тому же
собственному значению, имеет размерность, равную кратности этого
собственного значения.
Приведение квадратичной формы. Применим предыдущие
результаты к изучению квадратичных форм на евклидовом
пространстве Rn. Пусть со — квадратичная форма на Rn,
определенная при помощи симметрической действительной матрицы А
ГЛ. XI. ПРИВЕДЕНИЕ МАТРИЦ 197
формулой ы{х)= х-А(х)у где х = (|ь ..., |п)е/Л Пусть
далее ей •••> еп — произвольный ортонормированный базис в Rn>
в котором ej = (tij, ..., tnj), / = 1, ..., п. Тогда, если х «
= r^i +....+ г\пепу и у = (тц , tin), то # = Г(*/), где
/*п
Вектор-столбцами матрицы Т являются векторы е$, /=1, ..., п\
значит, Т ортогональна. Обратно, каждой ортогональной
матрице Т можно отнести ортонормированный базис пространства
Rnf составленный из вектор-столбцов этой матрицы. Имеем
а(х)-х-А(х) = Т(у)-АТ(у)-у-'ТАТ(у)=у.В(у)9
где В = *ТАТ. Но так как Т ортогональна, то гТ = Г"1; значит,
В = Т~ХАТ, т. е.: В преобразована из А посредством матрицы Г.
Кроме того, сразу же убеждаемся в том, что В — тоже
симметрическая, ибо
*В = '(Т~1АТ) - \'ТАТ) - *Т*АпТ - *ТАТ - Я,
поскольку *Л = Л.
Мы видели, что Rn обладает хотя бы одним ортонормирован-
ным базисом ии ..., ипу составленным из собственных
векторов матрицы Л; пусть А(щ)= рщ, / = 1, ..., п. Собственные
значения р*, как различные, так и совпадающие, действительны
и служат нулями многочлена D(A — pi) = 0. Если х = ^щ + ...
... +Z>nUn и г = (£i, ..., £п), то x=*S(z), где S —
ортогональная матрица. Имеем &(х) = z • U(z), где U = S~MS.
Пусть *'-tfa + ... +СХ» *'e(Cf. «... К); если х' = А(х)9
то х' = ^ Л (и,) + ... + Ь|Л (ид). Поэтому а:' = р&хи{ + ... + ря£яая;
значит,
/р, 0 ... 0
и J о р2... о
\0 О рп
есть диагональная матрица, и
ъ{х) = х - х' ~z - U {*) = рх£х+ ... + ря#.
Относительно базиса щ9 ..., ип квадратичная форма имеет
только члены с квадратами; говорят, что она приведена к
каноническому виду.
т1п
198
КНИГА II. АЛГЕБРА
Пример. Пусть квадратичная форма <о на /?3 определена
равенством
ш(х) = 2^3 + 2Ui + 4ih-х-А(х),
где * = (£i, |2. 1з) и
Характеристический многочлен матрицы А имеет вид
-р 1 1
1 -р 1
1 1 -pi
D (А - р/) ■
= (1+р)2(2-р).
Следовательно, собственными значениями являются числа
pi =2, Р2 = рз = —1; pi — простое, а р2 — двойное. Найдем
такой собственный вектор щ, чтобы А (щ) = piWi = 2щ. Пусть
0ц, <Т2ь аз1 — компоненты вектора щ. Должны выполняться
равенства
Ог21 + <*31=2(У11,
ОГи + (Уз1 = 2(У21,
^11+^21=203!,
т. е.
— 2an + a2i +- a3i = О,
*п-2021 + 0з1 = О,
0ц + 021-2031 = О.
Эта однородная система имеет ненулевое решение, ибо ее
определитель равен D(A— pi/) = 0; из двух первых уравнений
имеем 0ц = К 0*i = К ог\ = К где Я — произвольное действи-
' Hi ■"
1
, 021 :
тельное число. Чтобы получить ||ui|| = 1, достаточно взять
ап + ali + ali=ЗЯ2 = 1, откуда К - у= и
Так как р2 = —1—двойной нуль, то при нахождении
собственного вектора щ мы должны получить двумерное векторное
ГЛ. XI. ПРИВЕДЕНИЕ МАТРИЦ
19д
подпространство. Пусть и2 = ((У12, 022, #з2)> тогда
А {и2) *= — и2,
откуда
#22 + 0Г32=г — #12»
#12 + #32 = — #22»
#12 + #22 = — #32*>
однородная система сводится к единственному уравнению
#12 + #22 + #32 ^ О»
Это уравнение показывает, что и2 есть произвольный вектор,
ортогональный щ. Это можно было предвидеть, поскольку
векторное подпространство, порожденное собственными векторами,
принадлежащими рг = —1, имеет размерность 2, и значит,
является векторным подпространством, ортогональным к щ.
Следовательно, в качестве и2 можно взять любой вектор этого
подпространства с lk2||= 1. Пусть, например, оЪ2 = 0; тогда 0\2 =
= —022, и <т?2 + о\2 = 1; значит, сг,2 = — а™ =
'22
и2
-(■
V~2' 71
,о).
}П'
т. е.
Наконец, если иъ = (сти, #23, #зз), то кроме того, должно
выполняться и2 • щ = 0, и стало быть,
#13 + #23 + #33 = 0»
V~2
#13*
V2
=f #23 - 0.
Отсюда находим а2з = #1з и сг3з — — (#13 + #23) ^ — 2ог13. При этом
0i3 + а23 + аззв О + ! + 4) #1зя !> откуда сг13 = -f=t» и
следовательно,
w3:
AW /V ~Т?)'
Таким образом, ортогональная матрица с вектор-столбцами
Иь ^2, ^з имеет вид
1
1
1
1
7Т
1
7f
/1
о
1
1
ГЪ
2
/6
200 КНИГА II. АЛГЕБРА
Если лг = Si«i + ?2"2 + €з"з и 2 = (£„ $2, £з). то * = .$(£), т. е,
l2=:?TSl~?TS2+76'гз,
J* £_
ы 1/"з ы }/~б
Заменяя |ь |2, |3 посредством этих выражений в исходной
квадратичной форме со (я), получаем
р!Й + р2Й + РэЙ —2Й —Й —й-
Таким образом, со приведена к каноническому виду.
КНИГА III
АНАЛИЗ
ГЛАВА I
ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА
Введение
Исходя из множества N натуральных чисел,, мы построили
множество Z относительных целых чисел (Книга II, гл. II,
разд. И). Распространение на Z двух законов — сложения и
умножения— превращает Z в кольцо. Далее, исходя из Z, мы
построили множество Q рациональных чисел (Книга II, гл. II,
разд. III). Построение Z делает всегда возможным вычитание,
чего не было в случае N. Но деление в Z не всегда возможно.
Построение множества Q делает возможным деление (кроме
деления на нуль). Каждая из этих операций заключалась в том,
что мы «погружали» исходное множество в более широкое
множество так, чтобы на него распространялись исходные
алгебраические законы.
В этой главе будет произведено погружение Q в более
широкое множество У?, для которого Q будет подмножеством;
алгебраические законы — сложение и умножение в /?, в
применении к элементам из Q, снова дадут первоначально введенные
законы, превращающие Q в поле.
В предыдущих построениях новые элементы получались
в результате рассмотрения пар элементов исходного множества
и установления отношения эквивалентности. Для построения
действительных чисел используется множество Q рациональных
чисел.
Идея состоит в определении действительного числа как
предела счетной последовательности рациональных чисел, но при
этом совершенно ясно, что нельзя придать смысл выражению
«последовательность гп рациональных чисел стремится к
действительному числу х, когда п становится бесконечным» до того,
как определено х.
Для метода сечений за основу берется понятие порядка в Q.
Существование отношения порядка влечет понятие предела, или
(по принятой теперь терминологии) топологии. Это утверждение
вытекает из рассуждений, выходящих за рамки курса Общей
202
КНИГА III. АНАЛИЗ
математики* Метод, которым мы пользуемся, берет начало с
определения в Q топологии, т. е. с придания смысла выражению
«последовательность рациональных чисел, сходящаяся к
рациональному числу». Затем среди последовательностей
рациональных чисел, не принадлежащих к категории сходящихся,
рассматриваются последовательности, называемые
последовательностями Коши, которые и будут определять действительные числа.
Простые соглашения для последовательностей позволят ввести
во множестве R действительных чисел законы сложения и
умножения. Кроме того, нетрудно будет получить отношение
порядка и топологию, т. е. понятие сходящейся
последовательности действительных чисел. Q будет рассматриваться как часть
R, и алгебраические законы, отношение порядка, топология,
определенные для /^, при сужении их на элементы из Q, окажутся
алгебраическими законами, отношением порядка и топологией,
определенными первоначально для Q.
I. ТОПОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ МНОЖЕСТВА Q
§ 1. Последовательности рациональных чисел, сходящиеся
к рациональному числу
Напомним (Книга II, гл. III, разд. III, § 2), что
последовательностью элементов множества Е называется отображение
множества N в Е, т. е. функция, у которой переменное есть
пеЛ/, а значение — элемент из £. Значение, принимаемое этой
функцией для значения п переменного, обозначается через хп.
Таким образом, последовательность рациональных чисел есть
функция от п, принимающая рациональные значения, которые
обозначаются через гп. Для самой последовательности мы
будем пользоваться записью (гп), более удобной, чем
Примеры рациональных
последовательностей.
1. Каково бы ни было п, гп = 1.
2. Если п = 2р (четное положительное число), г2р = 1; если
п = 2р + 1 (нечетное положительное число), r2p+i = 0.
3. Гп « 1/я.
В первом примере последовательность (гп) принимает
только одно значение, во втором — два различных значения, а в
третьем принимает бесконечно много йопарно различных значений.
4. гп = Рп/Юп, где рп — целое число, состоящее из п девяток,
т. е. ri = 9/10, тг = 99/100 и т. д.
Определения. Говорят, что последовательность (гп)
рациональных чисел сходится к нулю, когда п стремится к
бесконечности, если для всякого рационального положительного числа в
можно найти такое целое р, что \ гп \ < е для любого п > р.
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА
203
Говорят, что последовательность (гп) рациональных чисел
сходится к рациональному числу г0, когда п стремится к
бесконечности, если последовательность (гп — г0) сходится к нулю.
Соответственно записывают:
lim rn = 0; lim rn = г0; или гп -> /у,
Л->оо И->оо Л->оо
Го называется пределом последовательности (гп).
Употребляются также следующие равносильные выражения:
гп стремится к г0, когда п стремится к бесконечности; иногда
сокращенно говорят: гп стремится к г0 или просто: гп сходится.
Если последовательность (гп) не является сходящейся, то
она называется расходящейся.
Выражение «последовательность (гп) сходится в Q»
означает: существует рациональное г0, к которому гп стремится,
когда п стремится к бесконечности.
Ниже следуют различные комментарии к этому
фундаментальному понятию и эквивалентные определения.
Г Сначала мы определяем сходимость к нулю, а затем
сходимость к г0, рассматривая последовательность, общий член
которой равен гп — г0. Это связано с тем, что Q является
аддитивной группой, и можно, образно выражаясь, утверждать, что
все происходящее в окрестности нуля может быть посредством
сдвига перенесено в окрестность любого рационального числа г0.
2° В определении сходимости рациональное е задается
произвольно, а целое р зависит от е. Однако можно заменить р на
целое число р'^-р (ибо выражение «можно найти целое р»
в определении требует существования по крайней мере одного
такого р, но не требует, чтобы р было единственным).
Часто для большей ясности мы вместо р будем писать р(е),
чтобы подчеркнуть, что р зависит от е.
3° Рациональное е задается произвольно, т. е. условия,
требуемые в определении сходимости, должны быть выполнены для
любого е > 0.
Однако замети^ что если задана последовательность (ew)
рациональных чисел, стремящихся к нулю, когда m стремится
к бесконечности, то для того, чтобы утверждать, что гп
стремится к го, достаточно, чтобы для любого ет можно было найти
такое р(ет), записываемое, например, рш, что n>pm влечет
\гп — ^о| < ет.
Это ведет к тому, что если заданы две последовательности
(гп)> (гп) и если lrJ^K|> a гп стремится к нулю, то гп
тоже стремится к нулю.
4° Если (гп) сходится к г0, то последовательность (\гп\)
сходится к |г0|, так как по свойствам абсолютного значения
1|гя|-|ГоИ<|гл-г0|,
204
КНИГА III. АНАЛИЗ
и тогда достаточно применить замечание, приведенное в конце
предыдущего пункта.
5° Понятие сходящейся последовательности неотделимо от
предела этой последовательности; если рассматривать только
рациональные числа, то этот предел должен быть рациональным.
Факт сходимости последовательности зависит от множества;
так, если во множестве R действительных чисел
последовательность рациональных чисел стремится к У"2
(действительному, но не рациональному числу), то эта
последовательность сходится в R и не сходится в Q. Поэтому в некоторых
случаях придается смысл выражению «последовательность
элементов некоторого множества, сходящаяся к элементу,
принадлежащему другому множеству».
6° Выражение «для любого е>0 существует такое р(е), что
для всякого п > р(в) выполняется неравенство \гп — г0\ <е»,
логически эквивалентно выражению «для любого е > 0
неравенство \гп — го|^е выполняется не более чем для конечного
числа значений п»; или «для любого е >0 имеем \гп — г0|<е,
кроме, быть может, конечного числа значений /г»,.
В принятой символике это будет записываться следующим
образом:
Ve>0, 3/?&Vn>p=#>|r„-r0|<e.
Отрицание этого выражения, которое определяет не
сходящуюся последовательность, гласит: «существует такое е > 0, что
\r<n — fol.^e для бесконечного множества значений я»; оно
записывается в виде
3е>0, Vp&3tt>p=#|r„-r0|>e.
Тогда можно сказать, что гп сходится к г0, если для любого
положительного рационального е выполняется неравенство
\гп — Л)|<е для всех гп, кроме, быть может, конечного числа
из них.
Или еще: гп сходится к г0, если, каково бы ни было
рациональное е > 0, \гп — г0|^е разве лишь для конечного числа
значений п. Действительно, число индексов, для которых
\гп — го| ^ е, конечно; если р-—наибольший из этих индексов,
то для п > р + 1 имеем | гп — г0 \ < е.
7° Следующее предложение существенно, и мы будем с ним
встречаться в самых общих случаях.
Если последовательность (гп) рациональных чисел сходится
в Q, то ее предел г0 единственный.
В самом деле, допустим, что последовательность (г„) схо-
I f I
дится в Q к т^Ф г0. Возьмем е = ° 3 . Так как (гп) сходится
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 205
к г0, то \гп — г0\<г для любого п*^р. А так как (rj сходится
к г'0, то J rrt — Tq | <е для любого п^р\ Пусть Р — наибольшее
из р и р'\ тогда для любого л^Р одновременно |г„ —г0|<е
«I'n-'ol^ Н°
ko-^ol-ko-^+^-^Kko-^l+kii-^i
и, значит, |г0 — r'Q|<е + е = 2е. А поскольку е = ' ° 3 0| , то
получаем Зе^2е, чего не может быть.
8° Пусть (rnk) — подпоследовательность последовательности
(гп) (Книга II, гл. III, 3-й разд. III, § 2). Если (гп) сходится к г0,
то за вычетом конечного числа значений п имеем \гп — г0|<е.
Следовательно, исключая конечное число значений из (/г&),
имеем \гпк — го|<е.
Таким образом, подпоследовательность (rnfe) сходящейся
последовательности (гп) сходится и имеет тот же предел.
Однако обратное неверно. Так, последовательность (гп),
определенная как г2р = 0, r2p+i = I, не будет сходиться, ибо
последовательность (г2р) с четными индексами сходится к нулю,
и если бы (гп) сходилась, то ее предел был бы равен нулю; но
имеется бесконечно много членов из (гп), для которых
|/\г|>1/2, а именно, все члены г2р+\ с нечетными номерами.
(См. конец замечания 6°.)
9° Неравенство \гп — г0|<е равносильно двойному
неравенству
- е < гп - г0 < е,
или
г0-в<гя<г0 + е.
Это замечание приводит нас к введению интервалов.
10° Если последовательность (гп) сходится, то \гп — г0|<е,
кроме конечного числа индексов. Следовательно, если взять два
члена rp, rq этой последовательности, то в силу того, что
\гР - гя | = \гр - г о + г о - г q\ < \гр - г о | +1 г0 - г Д
имеем
\rp-rg\<2et
исключая конечное число значений р к q.
Иными словами, каково бы ни было рациональное число е>0
(или 2е в предыдущем неравенстве, что безразлично, поскольку
8 произвольно), существует такое целое Р, что если р^-Р
и q^ P, то \rv — rq\<e.
Это условие необходимо для сходимости в Q, но не
достаточно. Это приводит к понятию последовательности Коши,
206 КНИГА III. АНАЛИЗ
§ 2. Интервалы в Q
Множество Q всех рациональных чисел называется также
рациональной прямой, а сами рациональные числа — ее
точками.
Пусть а, Ь — два рациональных числа. Если a Kb, то
говорят, что а лежит слева от Ь, или что Ь лежит справа от а.
Открытым интервалом *) с концами a, b называется
множество таких рациональных чисел г, что а <г <Ь. Его называют
также множеством чисел или точек, заключенных между а и Ь.
Этот открытый интервал обозначается символом ]а, Ь[. Если
а = Ь, то этот интервал не содержит точек; в этом случаехгово-
рят, что он пуст.
Замкнутым интервалом*) называют и обозначают через
[а, Ь] множество таких рациональных чисел г, что a^r^b.
Если а = Ь, то этот интервал содержит всего одну точку. Стало
быть, точка считается замкнутым интервалом.
Рассматриваются также интервалы ]а, Ь], замкнутые справа,
открытые слева и [а, Ь[, замкнутые слева, открытые справа,
определяемые соответственно условиями a<r<Cb, аО<6.
Концы a, b открытого интервала ]а, Ь[ не принадлежат
интервалу. Концы же замкнутого интервала, наоборот, ему
принадлежат. Непустой открытый интервал никогда не сводится
к точке.
Так как a, b рациональны, то а ^ тоже рационально;
точка -^Ц— называется серединой интервала. Середина интервала
]г0 — е, го + е[, где г0, е рациональны, есть г0.
Говорят, что рациональное число г принадлежит открытому
интервалу ]а, Ь[ (соответственно замкнутому интервалу [а, Ь]),
если a<r<b (соответственно a ^r Kb). Говорят также, что
рассматриваемый интервал содержит точку г.
Теперь, с введением понятия интервала, определение
последовательности (гп) рациональных чисел, сходящейся к
рациональному числу Го, может быть сформулировано следующим
образом: (гп) сходится к г0, если любой открытый интервал
]г0 — е, г0 + е[, имеющий серединой точку г0, содержит все члены
последовательности, кроме, быть может, конечного числа
из них.
*) В русской терминологии принято открытый интервал называть просто
интервалом и обозначать (а, Ь)> замкнутый интервал — отрезком (с тем же
обозначением [a, b])f a остальные интервалы — полуоткрытыми и обозначать
(а,Ь],[а,Ь).
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 207
Но любой открытый интервал ]а, 6[, содержащий го,
содержит и некоторый открытый интервал ]г0 — е, г0 + е[ с серединой
Го (достаточно взять в качестве е наименьшее из чисел г0 — а,
b — г0); заметим также, что любой открытый интервал
]/-0 — е, г0 + е[ с серединой г0 может рассматриваться как
интервал, принадлежащий открытому интервалу ]а, 6[, содержащему
точку г0. Отсюда еще одна формулировка.
(гп) сходится к г0, если любой открытый интервал,
содержащий г0, содержит все гпу кроме конечного их числа.
Наконец, подчеркнем необходимость рассмотрения именно
открытых интервалов, ибо если бы рассматривались замкнутые
интервалы (что привело бы в первоначальном определении
к записи \гп — г0|<е вместо \гп — г0|<е), то определение
должно было бы быть справедливым для любого интервала,
а из этого при е = 0 вытекало бы, что \гп — г0| = 0, исключая
конечное число индексов; поэтому мы были бы обязаны
рассматривать только те последовательности (гп), которые
принимают лишь конечное число значений.
Последнее из приведенных определений сходящейся
последовательности является наиболее важным. Мы столкнемся с ним
не только в применении к действительным числам, но и в
применении к более общим понятиям предела,
непрерывности.
§ 3. Сходящаяся двойная последовательность
рациональных чисел
Двойная последовательность рациональных чисел есть
отображение множества N X N в Q, т. е. функция, у которой
переменным служит упорядоченная пара (р, q) цельГх чисел, а
значением — рациональное число, обозначаемое символом rPtq
(Книга II, гл. III, разд. III, § 2). Можно, имея простую
последовательность (гп), построить двойную пocлeдoвateльhocfь,
положив, например, для любой пары (/?, q) целых чисел, rPt q «=
= rp — rq. А имея двойную последовательность, можно построить
бесконечно много простых последовательностей, рассматривай
индексы р и q как функции друг друга. Если, например,
rv, q = Р + <7> то» взяв те гр, д» Для которых р принимает все
целые значения, a q = р + I, получим простую последовательность
(2р+ 1). Зафиксировав, скажем, р и заставив меняться q,
получим простую последовательность, обозначаемую (rPf q)q<sx.
Говорят, что двойная последовательность (rPfq) сходится
к нулю, когда р и q стремятся к бесконечности, если для
любого положительного рационального е можно указать такое
целое Р, что для любой пары (р, q), в которой одновременно
q^P, р > Я, выполняется неравенство \rPt q| < s.
208
КНИГА III. АНАЛИЗ
Говорят, что двойная последовательность (rPf q) сходится
к рациональному числу г0, когда р и q стремятся к
бесконечности, если последовательность (rP} q — r0) сходится к нулю.
Пишут
lim rPt q « r0, lim rPt q = r0 или rPt q -* r0.
p, q->oo p->oo p->oo
Замечание. В противоположность простой
последовательности (rn), определение двойной последовательности (rp,q) не
влечет, что \rP,q\<s для всех пар, кроме конечного их числа.
Так, т-+-г сходится к нулю, но если е< 1, то —t~-r>e для
р=1 и любого q&N.
§ 4. Последовательность Кош и
Пусть (гп)~ последовательность рациональных чисел. Мы
видели (§ 1, п. 10°), что если (гп) сходится, то, начиная с
некоторого значения Я, \гр— rq\<e для любых р, q>P. Иными
словами (§ 3), двойная последовательность, определенная как
гр, я = гр — гяу сходится к нулю (подразумевается, когда р и q
стремятся к бесконечности). Следовательно, для того чтобы по-
следовательность (гп) сходилась в Q, необходимо, чтобы
двойная последовательность (rp — rq) сходилась к нулю.
Но это условие не является достаточным, как показывает
следующий пример. В учебных курсах (см. также Книга IV,
гл. II) доказывается, что не существует рационального числа,
квадрат которого равен 2, и что для любого целого п можно
найти такое целое рп, что
(#)'<2<(^i)!.
Тогда
п Р% ^(Pn+{? Pi __ 2Рп+1
102л ^ \02п \02п " 102" •
Имеем р2<2- 102п<4. 102л, откуда рп<2- 10", и
2рп+1 ^ 4-10*-И _ 4 . 1_
102Л ^ 102Л "*" 10* "* \02п '
Но, каково бы ни было /г^1, всегда 10">/г, это доказывается
по индукции. Отсюда заключаем, что (pjl0n)2 имеет предел 2,
когда п стремится к бесконечности. Положим хп=*рп/10п. Имеем
lim*2 =2. Если бы существовало такое a;eQ, что \\тхп*=х9
П->оо rt-*oo
то вследствие равенства х2 — х2п = {х — хп) (х + хл) мы имели бы
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 209
lim я* = л;2. Тогда х2 было бы равно 2, что невозможно. Но так
как последовательность (xty сходится," то lim | х2р — x2q | = 0, и
Л->оо
в силу равенства х2--х2=(хп—ха) (х а+ха) имеем lim \xp—xa\=Q.
р ч \ р ч; \ и ч/ р^ q_>00 f ч
Последовательность (хп) не сходится в Q, но является
последовательностью Коши.
Наконец, заметим, что последовательность (гп),
определенная как Г2Р = 0, г2р-и = 1, не удовлетворяет условию
lim |rp-rj = 0, ибо r2p+1-r2p-l.
р, fl->oo
Итак, среди всех возможных рациональных последователь*
ностей различаются:
1) последовательности (гп), сходящиеся в Q (значит, такие,
что lim kp-r^ 1 = 0);
р, <7->°°
2) последовательности (гп), для которых lim \rp — rJ = 0;
сюда входят все сходящиеся в Q последовательности, но и не
только они;
3) последовательности (гп), для которых \rp — rq\ не
стремится к нулю и которые, следовательно, расходятся; но сюда
относятся не все расходящиеся последовательности.
Условие lim I rp — /^ | = 0, наложенное на последователь-
Р, <7->оо
ность, является менее жестким, чем условие сходимости. Это
условие приводит к определению последовательности Коши.
В дальнейшем будет доказано, что условие lim | rp — rq | = 0
Р. <7->°°
для действительных чисел является необходимым и достаточным
для того, чтобы последовательность действительных чисел
сходилась.
Условие lim \rp — rq\ = Q называется условием Коши.
Р, <7->°°
Определение последовательности Коши рациональных чисел.
Говорят, что последовательность (гп) рациональных чисел есть
последовательность Коши, если она удовлетворяет условию
Коши:
lim | гр — г^ | — 0.
р, <7->оо
Важное замечание. В § 1, п. 8° говорилось, что если
последовательность (гп) сходится к г0, то любая ее
подпоследовательность тоже сходится к г0, но обратное неверно.
Однако обратное утверждение справедливо, если
последовательность (гп) есть последовательность Коши. Действительно,
предположим, что (гп) есть последовательность Коши и что
подпоследовательность (rnk) сходится к нулю.Тогда для р>Р(е)
210
КНИГА III. АНАЛИЗ
и q > Р(е) при достаточно большом Р(е) имеем
\rp-rq\<e,
и значит, для р>Р(г) и nk>P(e) имеем j/> — гПк\<г. Но
(^) сходится к нулю, поэтому | Гпк | < е, кроме конечного числа tik.
Из неравенств
\гр-гПк\<в> \гпк\<ъ
получаем неравенство
|г,|<2е,
справедливое для всех р, исключая конечное число значений.
Стало быть, последовательность (гп) стремится к нулю. Итак,
справедлива
Теорема 1. Если из последовательности Коши (гп) можно
выделить сходящуюся подпоследовательность, то сама
последовательность (гп) сходится.
Точно так же выводится
Теорема 2. Если (гп) есть последовательность Коши, то
найдется такое рациональное число М > 0, что \гп\^М для
любого п. Если последовательность (гп) не стремится к нулю, то
найдется такое строго положительное ш, что для всех п, кроме,
быть может, конечного числа, выполняется только одно из
следующих двух неравенств: rn < —m или гп > т; отсюда \rn\>m.
В самом деле, для е > 0 найдется такое п0, что для р ^ п0,
q ^ п0 имеем | гр — rq \ < е, и значит, если п ^ п0, то | гп — rtt01 < е,
т. е. | гп К I гщ\ + е. Тогда для любого п имеем | гп | ^ М, где
М — наибольшее из чисел | т\ |, | г21, ..., I гЛо-11, I гщ IH- е.
Если (гп) не стремится к нулю, то существует такое г > 0,
что для бесконечного множества значений п выполняется |гп|>
> г. Возьмем е = г/2; тогда найдется такое щ ^ л0, что
]/-„, |>2е = г; но для р>я0, q^n0 имеем |гр — rj<e; значит,
для любого п^п0 получаем | гп — гП] Ке, т. е. гП1 — г<гп<гПх Л е.
Так как |гЙ1|>2в, то числа гПх — е и гл, + е имеют одинаковые
знаки, т. е. либо оба положительны, либо оба отрицательны.
Если rrtl>0, то, положив rni — e = m>s, получим при любом
п> п0 неравенство гп> т. Если гПх <0, то, полагая гП1 + е = — т,
получаем т>е, и для любого п^п0 имеем гп< — пг.
§ 5. Операции с последовательностями Коши
и свойства последовательностей Коши
Будем обозначать последовательность одной буквой, скажем,
* = {Гп)> Х' = (Г'п)> И Т' П'
Г Сложение. Положим х + х' = [гп + г'п) (см. Книга II, гл. III,
разд. III, § 2). Если х н х'— последовательности Коши, то тако-
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 211
вой будет и х + х'. Действительно, из | тр — г q | < е и | r'p — rq \ < г
вытекает
\rP + r'p-{r^r'q)\-Vp-r^r'p-r'q\<\rp-rq\ + \r'p-r'q\<2b.
Обозначим через 0 последовательность (0), которая, очевидно,
является последовательностью Коши. Тогда х + 0 = 0 + х = х.
Если положить (—х) = (—гп)\ то х + (—х) = 0. (—х) тоже
будет последовательностью Коши, поскольку | (—гр) — (—rq) | =
= \гр — гя\.
2° Умножение. Положим хх' = {гпг'^ (см. Книга II, гл. III,
разд. III): Если х и х' — последовательности Коши, то таковой
будет и хх*, поскольку г/р - r/q - (rp - rq) r'p + rq {r'p _,/).
Отсюда, по свойствам абсолютной величины,
\ Р Р Я Я1^\ Р\\ Р Я\ \ Я\\ Р Я \
Но согласно теореме 1 из § 4 для последовательностей Коши
{гп) и (г^) найдутся такие числа М и ЛГ, что |rn|< Af, |г^|<ЛГ
при любом и. С другой стороны, если задать е > 0, то найдется
такое По, что одновременно
\rp-rq\<e/2M' и |r^r;|<e/2M
для любых р ^ п0 и q ^ п0. Следовательно, каковы бы ни были
р ^ по и ^ ^ По, имеем
lvp-r/;i<i+!=e>
и стало быть, (г/^) есть последовательность Коши.
Операции сложения и умножения превращают множество
последовательностей Коши в кольцо.
Замечания. 1. Если х = 0, то хх' = 0 при любом х'.
2. Последовательность Коши ограничена, т. е. |гр|<а.
3° Подпоследовательность последовательности Коши. Если
(rnk) — некоторая подпоследовательность последовательности
Коши (гп), то (rnk) тоже будет последовательностью Коши.
Действительно, если для любого рационального е > 0
выполняется \гр — гд\<Е для pyq > Р(е), то выполняется также и
k**"~r«A'|<e для к,к'>К(г), где пк{в)>Р(г)у ибо nh,nk'
являются отдельными значениями р и q. В частности, если из
последовательности Коши исключить конечное число членов, то
оставшаяся последовательность будет снова
последовательностью Коши.
4° Симметричность относительно умножения. Имея в виду
свойства поля (Книга II, гл. III, разд. I, § 3), попытаемся
2i2
КНИГА III. АНАЛИЗ
построить для любой последовательности Коши, отличной от О,
симметричную ей относительно умножения. Это свойство не
является столь точным.
Обозначим через 1 последовательность (1). Имеем х-\ = 1-х,
каково бы ни было х. Однако если х есть последовательность,
сходящаяся к нулю, но не равная нулю, то не существует такой
последовательности Коши л/, чтобы хх' = 1. Пусть, например,
х = (1/п); определение равенства двух последовательностей
влечет, что если х' = (г£) и хх' = 1, то — г'п= 1, а значит, г'п = п.
Но последовательность (п) целых чисел не будет
последовательностью Коши, ибо р — q = 1 при р = q + 1. Пусть теперь х =
= (^п) — последовательность Коши, не стремящаяся к нулю.
Мы видели (теорема 2 из § 4), что \гп\ ^ г > 0, кроме
конечного числа значений п.
Будем считать, к примеру, что последовательность (гп)
состоит, не считая конечного числа членов, из рациональных чисел
гп > г > 0. Тогда, если хг = (1/гп), то хх' = 1, причем х' есть
последовательность Коши, так как
1 1
Гр-гЛ
rDrt
p'q
^ \rP-rq\ ^ г
для р > Р(е) и q > Р(г) при достаточно большом Р(е).
Итак, существуют последовательности, каждый член которых
отличен от нуля и которые не имеют симметричных
относительно умножения. Поэтому логично рассматривать как нулевую
всякую последовательность (гп), сходящуюся к нулю. Это
послужит исходным пунктом для определения отношения
эквивалентности 91 во множестве Е последовательностей Коши
рациональных чисел, которое мы введем в начале раздела II.
Настоящее замечание приводит к необходимости
предварительного изучения сходящихся к нулю последовательностей
рациональных чисел, являющихся последовательностями Коши.
5° Операции со сходящимися к нулю последовательностями
рациональных чисел. Рассмотрим две сходящиеся к нулю
последовательности (г^) и (г£). Их сумма, т. е. последовательность
(г'п + г"), тоже сходится к нулю. Действительно, пусть задано
е > 0; найдется такое п0, что для п^ п0 одновременно |г^| <е/2
и |r^ | <е/2; следовательно, для любого п^п0 имеем\г'п -Ь г£| <
< е/2 + е/2 = е, и суммарная последовательность сходится к
нулю. Последовательность (0) принадлежит к тому же
семейству, так же как и (— г£), если (г^)' сходится к нулю.
Итак, сходящиеся к нулю последовательности образуют
подгруппу множества последовательностей относительно закона
сложения последовательностей.
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 213
Пусть теперь (г£) — последовательность, сходящаяся к нулю,
а (гп)—произвольная последовательность Коши. Тогда
существует такое М > 0, что \гп\ <М при любом п. Если задано
е > 0, то найдется такое по, что для любого п ^ п0 выполняется
| г'п | <e/Af; тогда для любого п^ п0 имеем | rnr'n | < е, и значит,
произведение (гпг^ сходится к нулю. Объединив предыдущие
результаты, можно сформулировать следующую теорему.
Теорема. Сходящиеся к нулю последовательности Коши
образуют идеал кольца последовательностей Коши (Книга И,
гл. III, разд. I, § 2).
Этот идеал будет обозначаться через X.
6° Абсолютное значение. Из свойств абсолютного значения
заключаем, что
l|rp|-|rJ|<|/>-r<|.
Стало быть, если (гп) есть последовательность Коши, то
последовательность {\гп\) тоже будет последовательностью Коши.
II. ПОСТРОЕНИЕ ПОЛЯ R ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ.
ТОПОЛОГИЯ В R
*§ 1. Отношение эквивалентности во множестве
последовательностей Коши рациональных чисел
Обозначим через 2£ идеал сходящихся к нулю
последовательностей (которые являются последовательностями Коши).
Определение. Две последовательности Коши х = (гп) и
хг = (г^) рациональных чисел называются эквивалентными, если
последовательность (гп — г£) принадлежит идеалу &
последовательностей Коши, сходящихся к нулю.
Иными словами, (гп)~(г'п), если lim (гя — г'\ = 0. В этом
случае будем писать х ~ х' или х = x'(modi£). Это отношение
эквивалентности, ибо
1° х~х, так как х — х = 0^3£;
2° х~хг влечет х'~х9 ибо если х — л;'е j£,
то последовательность
х' - х = - (х - х') <= Х\
3° х ~ х' и х' ~ х" влечет х ~х"\ действительно, х — х' е X
и х' — х"^3£ влечет (л;— х') + (х' — х") = х — х"^3£у ибо
%£, есть группа относительно сложения.
Это отношение эквивалентности позволяет произвести
разбиение множества последовательностей Коши на классы
214 КНИГА III. АНАЛИЗ
эквивалентности. Будем писать
Б-с1(*), g' = cl(*').
Множество классов есть фактормножество множества
последовательностей Коши по отношению эквивалентности.
§ 2. Поле R
В указанном фактормножестве мы определим сложение и
умножение.
Г Сложение. Положим
Ъ + Ъ'-с1(х + х') = Ъ' + 1.
Этот класс не зависит от выбора представителя в классах g, g',
ибо если Х{ ~ х, то х — ^ = zs£,h если х\~х', то х' — л;' =
= 2х е i2J; следовательно,
х + х' — {xx + xf^z + zf<&% и л;+ л/~ #! + #(.
Пусть
О = cl 0 @ #;
тогда | + 0 = | при любом |. Пусть
(-l)-cl(-x);
тогда | + (—|) = 0 при любом g.
Итак, сложение превращает множество классов в
коммутативную группу.
2° Умножение. Положим
gg' = cl (**') = I'g.
Класс элемента хх' не зависит от выбора представителя в
классах g и g', ибо если Х\ ~ х, то х — Х\ = г е 5J, и если я{~
~#', то л:' — #{ = z' e j£; следовательно,
хх' = (jCj + г) {х\ + г') =» ATjATj + xxz' + x\z + zz'\
но хгг' е <2S, a:7z e <2S, 22' s X, поскольку 2Е — идеал; стало
быть, хх' — ххх\<^Х, и лгл:7^^^^
Умножение дистрибутивно относительно сложения, так как
I (V + Г) = cl х (х' + х") = cl (**') + cl {хх") - И' +Ц".
Итак, множество классов есть кольцо.
Нейтральным элементом умножения служит класс
постоянной последовательности, равной (1). Мы обозначим его через 1.
Таким образом, 1 = cl (1) и 1 • g = g при любом g.
Всякий класс £ Ф 0 обладает симметричным относительно
умножения; то есть множество классов есть тело.
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 215
В самом деле, если £ ф О и если х есть некоторый
представитель из g, скажем, х = (гп), то (гп) ф 3Z и значит, по теореме 2
(разд. I, § 4) найдется такое яг >0, что \гп\ >т для п^п0.
Поэтому последовательность (1/гп) тоже будет
последовательностью Коши (разд. I, § 5, 4°). Положим I"1 = cl(l/rn); тогда
Множество рассмотренных классов эквивалентности
обозначается через R.
Множество R, наделенное двумя предыдущими законами,
является полем.
3° Изоморфизм между Q и подмножеством из R. Пусть
reQ. Поставим в соответствие г класс р последовательности
(гп), определенной как гп = г для любого п. Отображение г->р
множества Q в R является взаимно однозначным
отображением Q в подмножество из R классов р. Действительно, если
p = cl(r), p' = cl(r/) и р = р', т. е. классы последовательностей
(г) и (г') совпадают, то последовательности (г) и (г7)
эквивалентны, т. е. lim (г — г') = 0, или г = г'. Кроме того^ числам
г + г' и тт' отвечают соответственно классы р + р', рр'.
В силу этого изоморфизма мы будем считать
тождественными поле рациональных чисел Q и его образ в R при
отображении г -> р.
Назовем тогда R полем действительных чисел, а его
элементы £ — действительными числами.
Таким образом, мы погрузили Q в более широкое поле R.
Предыдущие рассмотрения имеют алгебраическую природу.
Распространив на R понятия порядка и абсолютного значения, мы
сможем определить в R топологию, т. е. понятие предела.
4° Отношение порядка. Пусть £ е R. Неравенство | > О
будет означать, что в классе | существует последовательность
Коши рациональных чисел (гп), у которой все члены гп > г > О,
где г рационально. Тогда любая последовательность
рациональных чисел, эквивалентная (гп), а значит, принадлежащая |,
состоит из рациональных чисел, обладающих тем же свойством, за
исключением, быть может, конечного их числа. Неравенство
I ^ О будет означать, что в § существует последовательность
(гп), эквивалентная (0), или последовательность, все члены
которой >0 в Q. Будем считать теперь, что %> |', если g — I' > 0
и £>£', если I — |'>0. Тем самым установлено отношение
порядка (Книга I, гл. III, разд. I). Действительно, оно рефлексивно,
так как всегда 6^1; антисимметрично, так как, если | ^ £' и
i' ^ St то в I найдется последовательность (гп), а в £'—
последовательность {г^, для которых одновременно гп — r'n ^ 0
216
КНИГА III. АНАЛИЗ
(поскольку I ^ £' означает £ — £' ^ 0) иг^-гп>0 (поскольку
|' ^ g означает £' — g ^ 0). .Стало быть, для любого п имеем
rn=--r'ni и значит, | = |'. Транзитивность очевидна.
Легко проверяются следующие свойства:
a) Если |, |', g"— такие три действительных числа, что
|>|',то| + Г'>Г + Г.
b) Если I > Г и Г > 0, то Ц" > 1%".
Введенное отношение порядка, в применении к элементам р,
которые являются классами последовательностей (гп), где
гп = г при любом п, и которые определяют в R
рациональные числа, снова дает отношение порядка, установленное
ранее в Q.
Мы докажем еще два важных предложения.
Если 0 < |, где | — действительное число, то, по
определению, в классе £ существует такая последовательность (гп), что
0 < г < гп. Следовательно, 0 < г ^ |. Стало быть,
рассматривая число г/2, приходим к тому, что, каково бы ни было
действительное £ > 0, между 0 и I найдется рациональное число.
Применяя этот результат к г| — £, видим, что для любых
действительных чисел |, т), где g < т), существует такое рациональное
число г, что | < г < т).
Иначе говоря, множество действительных чисел,
заключенных строго между двумя действительными числами, не
пусто.
Наконец, каковы бы ни были g > 0 и ц > 0, найдется такое
целое п > 0, что г\ < ng (аксиома Архимеда). Действительно,
согласно предыдущему, ■ существует такое рациональное число
p/q, что 0 < plq < £, и такое рациональное число p'lq\ что т] <
< p'lq'. Тогда достаточно взять п так, чтобы /гр#' > ЯР'-
Эти результаты показывают, что если заданы два
действительных числа g и g', то либо g'—gX), либо g — g'X);
иными словами, всегда либо g ■< g', либо g' •< g, и если оба
неравенства выполняются одновременно, то g = g'. Стало быть,
множество действительных чисел линейно упорядочено (Книга I,
гл. III, разд. I).
Примечание. В Книге IV, гл. III, разд. I, § 6 мы
докажем, что множество действительных чисел несчетно.
5° Сечения. Отношение порядка во множестве
рациональных чисел, превращающее Q в линейно упорядоченное
множество, позволяет также построить множество действительных
чисел способом, который мы здесь лишь наметим.
Определение. Будем говорить, что в Q определено сечение,
если произведено разбиение Q на такие две части А и А',
чтобы для любых рациональных чисел а&А и а'&А' было
а^а'.
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 217
Определенное так посредством множеств Л, А' сечение
обозначим через а; пусть, точно так же, р есть сечение,
определенное в Q разбиением В, В\
Пусть а, а', 6, У — произвольные рациональные числа, такие,
что аеА, а!еЛ'; беВ, Ъ'еВ'. Обозначим тогда через А + В
множество рациональных чисел а + Ь> через А' + Вг —
множество рациональных чисел а! + Ъ'\ АВ — множество
рациональных чисел abt А'В* — множество рациональных чисел а'Ь'.
Доказывается, что А + В и А' + В' образуют в Q сечение,
обозначаемое а + Р; точно так же АВ и А'В' образуют сечение в Q,
обозначаемое ар. Два определенных таким образом внутренних
закона превращают множество сечений в кольцо; можно
доказать, что они образуют поле. Это поле изоморфно полю R,
построенному как множество классов последовательностей Коши.
6° Абсолютное значение (Книга II, гл. II, разд. III, § 3).
Доказано (разд. I, § 5, п. 6°), что если (гп)
—последовательность Коши рациональных чисел, то таковой будет и (|гп|).
Положим ||| = cl (|гп|) для | = cl (rn). ||| называется
абсолютным значением числа £.
Если £ ^ О, то в классе | существует последовательность
(гп), эквивалентная (0) или такая, у которой все члены >0.
В последнем случае |гп| = гп, и следовательно, U | = cl (|rn|) =
= cl (гп) = £. А в первом случае (|гп|) тоже эквивалентна (0),
и значит, ||| =cl (|rn|) =cl (0) -0.
Так же убеждаемся, что если g < 0, то |£| = —|.
Это абсолютное значение обладает свойствами абсолютного
значения рациональных чисел (разд. I, § 1).
а) Если £ = 0, то |£| = 0, и наоборот. Действительно, если
I = 0, то I = cl (0), так как 0 = |0|, (0)~(|0|), и значит, £ =
= cl (|0|) = |£|. Если |g| = 0 и если гп есть последовательность
из класса |, то ||| = cl (|гп|) = 0 = cl (|0|), и стало быть,
(К1)~ (°Ь а значит, (rn) ~ 0, и | = 0.
б) U + 6'I<UI + U'I. или UI + iri>U + ri («^а-
венство треугольника).
В самом деле, это свойство означает, что в cl (| гп\ + | г'п | — | гп +
+ г'п |) существует последовательность (| гп \ +1 г'п | — | rn + r'n |),
которая ^ 0 или эквивалентна нулю, что вытекает из того же
неравенства для рациональных чисел,
в) IK'IHglll'l.
Действителшо^(|г^|)-с1(|гя||г;|)-с1(|г11|)с1(|г;|)-
= ||11|'|. Из неравенства треугольника вновь следует, что ||£| —
— I5 II ^ II — VI• В самом деле, в силу б) имеем 11| = 11 — |' +
+ i'Kli-i'| + |Г|; значит, UI — ||'| <|| —Г|,и точно так
< |-6' . Поэтому | £ - ||'| | < 6-Г .
218 КНИГА Ш. АНАЛИЗ
§ 3. Интервалы действительных чисел; сходящиеся
последовательности, последовательности Коши
В целях большей ясности мы до сих пор обозначали рацио*
нальные числа латинскими буквами г, г', а, Ь, ..., а
действительные числа — греческими. Отныне мы уже не будем делать
между ними различия.
а) Интервалы. Пусть а и b — два действительных числа
иа<&. Говорят, что а находится левее 6, или b находится
правее а.
Открытым интервалом с концами a, b называется множество
таких действительных чисел х> что а < х < Ь. Его обозначают
]а, Ь[.,
Замкнутым интервалом с концами a, b называется множество
таких действительных чисел х, что а ^ х ^ Ь. Его обозначают
[а, Ь].
Действительные числа называются также точками, a R
называется числовой прямой.
Если а ^ х ^ 6, то говорят еще, что точка х заключена
между точками а и Ь.
Если а = ft, то открытый интервал ]а, 6[ не содержит ни
одной точки, т. е. будет пустым. Если а = &, то замкнутый
интервал сводится к точке а = Ь. Таким образом, точка считается
замкнутым интервалом.
Рассматриваются также интервалы ]а, Ь]9 замкнутые справа,
открытые слева, состоящие из таких точек лс, что а<х ^ 6, и
интервалы [а, 6[, замкнутые слева, открытые справа, состоящие
из точек х, удовлетворяющих условию а ^ х < Ь.
Концы а, Ъ открытого интервала ]а> Ь[ не принадлежат
интервалу, в то время как концы замкнутого интервала [а, Ь] ему
принадлежат.
Непустой открытый интервал содержит бесконечно много
точек, так как он содержит полусумму (а + Ь)/2 = а\, а также
полусумму а и а\, а\ и b и т. д.
Точка (а + Ь)/2 называется серединой интервала с
концами а, Ь.
К предыдущим интервалам мы отнесем также следующие
множества действительных чисел.
Множество таких действительных х, что а ^ х
(соответственно а < х), обозначается через [а, + оо[ (соответственно ]а, + oof).
Множество таких действительных х, что х ^ а
(соответственно х < а), обозначается через ] — оо, а] (соответственно
]—оо,а[).
Множества ]а, + оо[ и ]— оо, а[ считаются открытыми
интервалами, а множество [а, + оо[ считается замкнутым слева и
открытым справа.
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА
219
Множество R всех действительных чисел обозначается через
]— оо, + оо[ и считается открытым интервалом.
б) Сходящиеся последовательности (ср. разд. I, § 2).
Говорят, что последовательность (хп) сходится к нулю, когда п
стремится к бесконечности, если для любого действительного
положительного г можно указать такое натуральное р, что для
любого п^ р выполняется неравенство \ хп || < е.
Говорят, что последовательность (хп) сходится к д:0, если
(хп — *о) сходится к нулю.
Если нет опасности смешения, то слова «когда п стремится
к бесконечности», опускают. Пишут lim хп = х0 или хп > х0.
Говорят также, что хп стремится к Хо\ х0 называется пределом
сходящейся последовательности (хп).
Последовательность (хп)у не являющаяся сходящейся,
называется расходящейся.
Как и в случае рациональных чисел, мы приведем некоторые
комментарии и различные эквивалентные определения
сходимости.
Г Мы определяем сходимость к нулю, а затем сходимость к
действительному числу лг0, не обязательно равному нулю,
пользуясь тем, что R есть аддитивная группа; мы пытаемся
посредством сдвига воспроизвести в точке Хо явление,
сформулированное для нуля.
2° р зависит от е и может быть заменено на pf > р. Иногда,
чтобы подчеркнуть зависимость от е, мы будем писать р(е).
3° Условия, требуемые определением, должны выполняться
при любом е > 0. Однако достаточно, чтобы для некоторой
последовательности (ет) действительных чисел, стремящейся к
нулю (в частности, можно взять рациональные числа), можно
было любому ет отнести такое целое рту что- \хп — х0\ < em при
п ^ Рту и тогда мы сможем утверждать, что (хп) сходится к х0.
Это вытекает из того, что если заданы две последовательности
(хп) и (х'п) действительных чисел, причем |*Л|<|-*£| и (л;^)
стремится к нулю, то (хп) тоже стремится к нулю.
4° Если (хп) сходится к х0, то {\хп\) сходится к |#о|, ибо по
свойствам абсолютного значения
fl*J-|*o l|<l*»-*ol.
5° Последовательность рациональных чисел (которые, в
частности, являются действительными числами), может,
следовательно, сходиться к действительному числу; отчасти для того, чтобы
получить этот результат, мы и проводим построение
действительных чисел при помощи последовательностей Коши
рациональных чисел.
220
КНИГА III. АНАЛИЗ
Казалось бы, следовало тщательным образом уточнить, что
сходящаяся последовательность действительных чисел сходится
именно к действительному числу. Мы увидим (§ 4), что в этом
уточнении нет надобности, так как ничего иного быть не может.
6° Выражение «для любого п ^ р» или «каково бы ни было
п ^ р» означает через логическое отрицание, что, кроме, быть
может, конечного числа целых чисел, меньших р, выполняется
неравенство \хп — х0\ < г.
Отсюда следует эквивалентная формулировка: (хп) сходится
к Хо, если для любого действительного положительного в
неравенство \хп — #о|< е выполняется для всех хп из
последовательности, кроме, быть может, конечного числа.
Итак: (хп) сходится к Хо, если, каково бы ни было
действительное положительное число е, \хп — д:0| >е не более чем для
конечного числа значений п.
Действительно, индексов т, для которых \хш — х0|^е,
имеется конечное число или нет вовсе; если р — наибольший из
них, то для п ^ р + 1 имеем \хп — *0| < е.
7° Для сходимости последовательности действительных
чисел снова имеет место единственность предела.
Если последовательность (хп) действительных чисел
сходится, то ее предел х0 будет единственным.
Допустим, что существуют такие х0 и х'0 ф х0, что (хп)
сходится к х0 и х'0; возьмем г = \х'ц — #0|/3. Так как (хп) сходится
к #о, то, за исключением, быть может, конечного числа значений
п, имеем \хп — Хо\< е; а так как (хп) сходится к лб, то так же
К~*о|<е- Но
Значит, для всех п, кроме, быть может, конечного числа,
что невозможно.
8° Как и в случае рациональных чисел, если (хп) сходится
к Xq, то любая подпоследовательность (хч) последовательности
(хп) тоже сходится к Хо.
9° По свойствам абсолютного значения неравенство
| Хп — Хо | < е эквивалентно условию х0 —- е < х < х0 + е, что
может формулироваться так: Хо есть середина открытого
интервала ]х0— е, Хо + е[.
10° Так же как и в Q, из сходимости последовательности
действительных чисел следует, что двойная последовательность
(xv — xq) сходится к нулю (см. ниже, д). В R фундаментальным
является тот факт, что последнее условие необходимо и
достаточно для сходимости последовательности (хп) в R (§ 4),
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА
221
11° Из определения сходимости последовательности
действительных чисел вытекает, что если последовательность (хп)
сходится и ее члены ^ 0 (соответственно ^ 0), то предел есть
число ^ 0 (соответственно ^ 0).
Действительно, предположим, что хп сходится к х0 и хп ^ 0
при любом п. Если бы Хо было отрицательно, то, взяв е = |#о|/2,
мы получили бы, что Хо + е = хб + \х0\/2 есть число
отрицательное, и для всех п, кроме конечного числа, х0 — е < хп < х0 + г<0;
значит, хп должно быть < 0 для всех п, кроме конечного числа.
Результат остается справедливым, если хп ^ 0 (или ^ 0)
для всех значений м, начиная с некоторого числа.
в) Определение сходимости через открытые интервалы.
Любой открытый интервал ]а, Ь[ действительных чисел, содержащий
число *о, содержит некоторый интервал ]х0 — е, х0 + е[ и
содержится в подобном интервале. В силу свойства б) можно, как и
в § 2 первого раздела, утверждать, что последовательность (хп)
действительных чисел сходится к х0, если любой открытый
интервал, содержащий лг0, содержит все хп, кроме, быть может,
конечного числа из них.
г) Сходящиеся двойные последовательности действительных
чисел (ср. разд. I, § 3). Пусть (xVfq)—двойная
последовательность действительных чисел, т. е. отображение множества
NxNbR.
Говорят, что двойная последовательность (хР) q) сходится к
нулю, если для любого действительного положительного числа г
можно указать такое целое Р(е), что, каковы бы ни были р ^
S£ Р(г) uq^z P(e), |*Plff|< е.
Говорят, что xPt q сходится к Хо, когда р и q стремятся к
бесконечности, если xVt q — х0 сходится к нулю.
Снова записывают
lim Xp,q — xQ, или lim xp, q = x0, или lim xpy q = лг0, или xp,q->xQ.
р->оо р, </->оо
q->oo
Последние две записи используются в том случае, если это не
может вызвать путаницы.
д) Последовательности Коши. Говорят, что
последовательность (хп) действительных чисел есть последовательность Коши,
если двойная последовательность (хр — xq) сходится к нулю,
когда р и q стремятся к бесконечности.
Понятие последовательности Коши будет играть
фундаментальную роль на протяжении всего этого курса.
Если назвать расстоянием от хР до xq число \хр — xq\ (это
понятие будет уточнено в гл. V), то можно будет также сказать,
что (хп) есть последовательность Коши, если расстояние между
точками хр и xq стремится к нулю, когда р и q стремятся к
бесконечности. - -
222 КНИГА III. АНАЛИЗ
Этот параграф мы завершим доказательством следующего
важного результата.
Теорема. 1° Если последовательность (гп) из Q сходится
в Q к некоторому г е Q, то она сходится к г в смысле
сходимости в R.
2° Обратно, если последовательность (гп) из Q сходится в R
к некоторому г е Q, то она сходится к г и в смысле
сходимости в Q.
Этот результат означает следующее: так же как понятие
сложения или порядка в R в применении к элементам из Q
воссоздает понятие, принятое первоначально для Q, так и понятие
последовательности рациональных чисел, сходящейся к
рациональному числу в первоначальном смысле, может быть заменено
понятием сходимости в /?.
Действительно, если lim rn = г, то для любого
рационального р >0 имеем \гп-— г\ < р, исключая конечное число гп.
Покажем, что выполняется также \гп — г\ <е для любого ее/? и
е > 0. Достаточно доказать, что, каково бы ни было е & R и
е > 0, между 0 и е найдется рациональное число. Но е есть
класс эквивалентности последовательности (pn), а е>0
означает, что, за исключением конечного числа, все рп ^ ро > 0,
Ро^ Q-
Тогда-f >f >0. Ное~^ = с1(рл-^-)^с1(^),истало
быть, е--^->0; отсюда 0<-§-<е.
Обратно, если для любого е >0, ее/?, неравенство
\rn — H<e (r^Q) выполняется для всех п, кроме конечного
числа гп, то и | гп — г | < р для любого pEQc^, p > 0.
Отметим, что эта теорема справедлива также для двойных
последовательностей.
§ 4. Два основных свойства множества R
Мы покажем, что
Г Каждое действительное число является пределом
рациональных чисел (понятие предела в R определено в предыдущем
параграфе).
2° Любая последовательность Коши действительных чисел
сходится к действительному числу (тогда как во множестве Q
рациональных чисел это не всегда так).
Первый результат выражают, говоря, что Q плотно в R,
а второй, что R полно.
Теорема 1. Q плотно в R.
В самом деле, пусть | е R. | есть класс последовательности
(гп) рациональных чисел, которая является последователь*
ГЛ. I. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 223
ностью Коши в Q, а значит, и в R (ср. конец предыдущего
параграфа). Но гП) рассматриваемое как действительное, число,
будет классом последовательности, все члены которой равны гр,
a |£— rp\ будет классом последовательности
\г{ - гр |, | г2 - гр |, ..., | гп - гр |, ...
Но так как (гп) — последовательность Коши, то \гп —гр\ <е,
если п и р>Р(г). Следовательно, |£ — гр\ стремится к нулю,
когда р стремится к бесконечности.
Теорема 2. R полно.
Пусть (In)n^N есть последовательность действительных
чисел, являющаяся последовательностью Коши, т. е.
Нт ||р-^| = 0.
р, </->оо
Пусть далее (ер) есть последовательность таких
действительных положительных чисел, что lim гр = 0. Для любого gp мож-
Р->оо
но указать такое рациональное число гр, что |gP — rv\< ер (по
предыдущей теореме 1). Тогда
|rp-rJ<|rp-6p| + ||p-6J + |Sv-rJ<ep + e^ + |iP-gJ.
А так как lim | |р — %q | = 0, то отсюда следует, что
Р, <7->°°
lim I rp — rq\ = 0. Следовательно, (гР)р€=# есть последователь-
р, д->°°
ность Коши. Из доказательства предыдущей теоремы видно,
что число g, определяющее эту последовательность (гр), есть
предел чисел гр. А поскольку
то lim £p = g.
Р-»ео
Выражение, что R полно, означает, что метод, позволяющий
построить Rt исходя из последовательностей Коши
рациональных чисел, в применении к R снова даст R. Построение R из Q
при помощи метода последовательностей Коши было возможно
потому, что в Q существовали последовательности Коши, не
сходящиеся в Q; теорема 2 означает, что любая последовательность
Коши из R сходится в R. С другой стороны, мы видели, что в R
любая сходящаяся последовательность есть последовательность
Коши (§3).
Поэтому мы дадим другую формулировку теоремы 2.
Теорема 2. Для того чтобы последовательность
действительных чисел сходилась в R, необходимо и достаточно, чтобы
она была последовательностью Коши.
Это утверждение очень важно, так как оно является
критерием, позволяющим выяснить, сходится ли последовательность
действительных чисел, без нахождения ее предела. А поскольку
224 КНИГА Itl. АНАЛИЗ
это есть необходимое и достаточное условие, то можно также
сказать, когда последовательность (gn) не будет сходиться; для
этого необходимо и достаточно, чтобы Цр — gg| не стремилось
к нулю (ср. разд. I, § 1).
Приведенный критерий, который будет играть в дальнейшем
важную роль, называется критерием Коши,
ГЛАВА II
ЧИСЛОВАЯ ПРЯМАЯ
Числовой прямой называется . поле R действительных
чисел, наделенное понятием предела, определенным в предыдущей
главе.
Математический анализ базируется на свойствах числовой
прямой. Поэтому мы отведем ей отдельную главу.
§ 1. Определения, относящиеся к точечным множествам:
мажоранты, миноранты, точка прикосновения, точка накопления
1° Множества мажорированные, минорированные,
ограниченные. Множество Е точек из R называется мажорированным,
или ограниченным сверху (соответственно минорированным, или
ограниченным снизу), если существует такая точка а, что для
любого х е Е выполняется х ^ а (соответственно х ^ а).
Множество Е точек из R называется ограниченным, если оно
мажорировано и минорировано.
Если Е ограничено, то существуют такие два числа а и 6, что,
каково бы ни было х е Е, а ^ х ^ 6. Если мы обозначим
через а наибольшее из чисел \а\, |6|, то получим также \х\^ а.
Обратно, всякое множество, для которого |#|^ос, ограничено.
Говорят также, что множество Е ограничено, если оно может
быть заключено в ограниченный интервал.
Таким образом, немажорированное множество Е обладает
следующим свойством: каково бы ни было число а, найдется
такое х е Е, что х > а. Так как для любого действительного числа
можно найти число, его превосходящее, то для заданного а\
найдется такое Х\ е £, что Х\ > аи Если затем а2 > #ь то найдется
такое #2, что х2 > а2, и т. д. Значит, если Е не ограничено сверху,
то можно найти такую последовательность (хп), состоящую из
точек множества £, что, как бы велико ни было а, все хпу кроме,
быть может, конечного числа из них, будут > а. Этот результат
можно сформулировать иначе, сказав, что если Е не ограничено
сверху, то существует последовательность (хп) точек из Е, обла-
ГЛ. II. ЧИСЛОВАЯ ПРЯМАЯ
225
дающая следующим свойством: каков бы ни был интервал
\а + °°[ (множество чисел ^ а), все хп, кроме конечного числа
из них, содержатся в этом интервале. Это замечание будет
уточнено, когда мы введем элементы + оо, — оо *).
Аналогичные свойства имеют место для не ограниченного
снизу или неограниченного множества.
2° Мажоранты, миноранты. Мажорантой мажорированного
множества Е называется любое число а, для которого х ^ а,
каково бы ни было х е £, а минорантой минорированного
множества Е — любое число й, для которого b ^ х, каково бы ни было
х е £•
Если Е мажорировано и а — его мажоранта, то любое число,
большее чем а, тоже будет мажорантой.
Так, рассмотрим множество £, состоящее из всех целых
отрицательных чисел и всех чисел 0 ^ х < 1. Множество Е не ми-
норировано, но мажорировано, и любое число ^ 1 является его
мажорантой.
Важный пример ограниченных множеств являет собой
последовательность Коши.
Пусть Е — множество точек последовательности Коши (хп).
Каково бы ни было е > 0, найдется такое целое Р(е), чта
\хр — xq\ < е для р > Р и ф> Р. Пусть xq — точка, для которой
справедливо неравенство \хр — xq\<e\ тогда для любого р,
кроме конечного числа значений р, будет |#р|^|#<70 I + е.
Обозначим через I наибольшее абсолютное значение \хр\, не
удовлетворяющее этому неравенству. Если а — наибольшее из
чисел | и | XgQ | + е, то | хР | *< а при любом р.
3° Точка накопления-*). Рассмотрим, например, множество
Е точек из R, содержащее все числа х вида 1 < х ^ 2, число 3
и числа последовательности (—1/п), где п принимает все
натуральные значения. Интуитивно различаются, с одной стороны^
точки (—1/п) и 3, а с другой стороны, точки интервала ]1, 2] и
точки 0, 1 (последние, по определению, не принадлежат Е).
Различие состоит в том, что любая из точек (—1/п) и 3 может быть
заключена в открытый интервал, в котором из множества Е
содержится лишь одна эта точка. Напротив, любой открытый
интервал, содержащий точку 0 или 1, или точку из интервала ]1, 2],
содержит по крайней мере одну точку из Е (отличную от
рассматриваемой, если она принадлежит интервалу ]1, 2]). Именно
это интуитивное различие точек и мотивирует введение понятия
точки накопления.
*) Выражение «бесконечное число» пока не имеет смысла, а выражение
«стремится к бесконечности» не должно вызывать никаких ассоциаций с
понятием предела.
**) В русской терминологии чаще называется предельной точкой.
8 Ш. Пизо, М. Заманский
226
КНИГА III. АНАЛИЗ
Определение точки накопления. Пусть Е— множество точек
из R. Говорят, что точка xq есть точка накопления
множества Е, если любой открытый интервал, содержащий х0,
содержит ТОЧКУ U3 Е, ОТЛиЧНуЮ ОТ Xq.
В предыдущем примере 0 является точкой накопления,
поскольку любой открытый интервал, содержащий 0, содержит по
крайней мере одну точку (—1/я). Все точки из интервала [1, 2]
будут точками накопления. Точка накопления может и не
принадлежать множеству. Такими в нашем примере являются
точки 0 и 1. Если х0 есть точка накопления множества Е, то при
ХофЕ уточнение «отличная от л;0» в определении не требуется.
Множество точек накопления называется производным
множеством множества Е и обозначается через Е'.
Пусть Е — множество точек из R, имеющее точку
накопления Xq. И пусть 8i — положительное число. В открытом
интервале ]х0 — ei,*o + ei[ существует по крайней мере одна точка
из Е, отличная от х0; обозначим ее через Х\. Пусть далее 0 < е2 <
< | Х\ — х0\. В открытом интервале ]хо — 82, х0 + ег[, который
в силу выбора 82 не содержит хи найдется по крайней мере одна
точка из Е, отличная от Хо. Обозначим ее через х2. Продолжая
этот процесс, получим бесконечное множество (хп) точек
хи х2, ... из Е. При этом любой достаточно малый открытый
интервал, имеющий серединой Xq, содержит интервал
]лг0 — ей, хо + ел[, которому принадлежат все хп, кроме
конечного числа. Стало быть, последовательность (хп) сходится к х0.
Итак:
Точки накопления могут существовать только для тех
числовых множеств, которые содержат бесконечно много различных
чисел.
Если х0 — точка накопления множества Е, то существует
последовательность (хп) точек из Е, сходящаяся к х0.
Теперь возьмем сходящуюся последовательность (хп)
действительных чисел, состоящую из бесконечного числа различных
элементов. И пусть х0 — ее предел. Тогда Хо будет точкой
накопления множества точек хп. Эта точка накопления единственна,
так как если бы имелась еще одна точка х'0, то при е =
~|х0—*о|/3 нашлось бы бесконечно много точек хп в интервале
]х0 — е, х0 + е[ и бесконечно много хп в ]*q —е, хо + е[> 3
поскольку е = | х0 - х'0 |/3, то найдутся сколъ^упжно большие р и q,
удовлетворяющие неравенству \хр — xq\ > е/3; значит, не будет
выполнен критерий Коши, и последовательность (хп) не будет
сходиться.
Замечание. Пусть Е, F — такие два множества
действительных чисел, что EzdF, т. е. любая точка x^F является также
точкой из Е. Если Е' и F' означают множества точек накопления
гл. и. числовая прямая 227
для Е и F, то E'zdF'. Действительно, если x0mF'f то х0 есть
точка накопления множества F, т. е. предел последовательности
(хп) точек из F, а стало быть, и последовательности точек из £,
ибо если хп е F, то #n e E.
Любая точка накопления множества Ег является, очевидно,
точкой накопления для Е\ поэтому, если обозначить через Е"
множество точек накопления множества £', то Е" с= Е'.
4° Точка прикосновения, замыкание, замкнутые множества.
Последнее утверждение из 3° не является достаточным, так как
оно исключает последовательности, принимающие лишь
конечное число значений. Так, последовательность (хп)
действительных чисел, определенная как хх = 0 и хп = 1 (п = 2, 3, ...),
сходится к 1, но множество хп не имеет точки накопления. Это есть
одна из причин введения понятия точки прикосновения, более
общего, чем понятие точки накопления. Последнее отличается
от первого тем, что в его определении отсутствует выражение
«отличная от хо».
Определение точки прикосновения и замыкания множества.
Пусть Е — множество точек из R. Говорят, что Хо есть точка
прикосновения для Е, если любой открытый интервал,
содержащий хо, содержит точку из Е.
Множество точек прикосновения множества_Е называется
замыканием множества Е и обозначается через Е.
Если Хо — точка из Е, то любой открытый интервал,
содержащий хо, всегда содержит точку из Е, например саму точку хо.
Стало быть, каждая точка из Е является его точкой
прикосновения, т. е. Е czE.
Пусть Хо — точка прикосновения множества Е, не
принадлежащая Е. Тогда любой открытый интервал, содержащий х0у со-^
держит точку из Е, отличную от х0, поскольку предполагается,
что ХофЕ. Значит, Хо будет точкой накопления. Таким образом,
каждая точка прикосновения множества Е, ему не
принадлежащая, является точкой накопления этого множества.
С другой стороны, очевидно, что всякая точка накопления
множества Е будет его точкой прикосновения, вне зависимости
от того, принадлежит она Е или нет. Следовательно, Е'аЕ.
Рассмотрим теперь замыкание Е множества Е. И пусть
#0e£\ Точка х0 либо будет точкой накопления для £, либо
нет. Если она не является для Е точкой накопления, то най-
дется открытый интервал, содержащий х0 и не содержащий
точек из Е, отличных от рассматриваемой точки .% Такая
точка называется изолированной. Таким образом, в Е
различают, с одной стороны, точки из £, которые изолированы,
а с другой стороны, точки накопления множества Е. Среди
точек накопления множества Е одни ему принадлежат, другие
8*
228
КНИГА III. АНАЛИЗ
не принадлежат (но принадлежат Е). Следовательно, _если мы
добавим к_£ все его точки накопления, то получим Е. Таким
образом, Е = Е[]Е'- _ _
Если Е, F — множества из R, то очевидно, E\JF = E{JF,
и Е czF влечет Е с:F. Поэтому, исходя из равенства Е = Е\}Е\
получаем=£' ~ E'JJ Е'[_ = Е' с=£, поскольку Е" а Е'. С другой
стороны, E=E[}E' = E\JE'=E, поскольку Е' а Ё. Значит, Ё = Е.
Определение замкнутого множества. Говорят, что
множество Е замкнуто, если оно совпадает со своим замыканием: Е = Е.
Конечное множество замкнуто, поскольку оно не имеет точек
накопления.
Это определение вместе с предыдущими замечаниями
составляет характеристическое свойство замкнутого множества
с бесконечным числом элементов. _
Если Е = Е, то Ё замкнуто, так как Е = Ё. ^
Предположим, что множество Е замкнуто. И пусть £' —
множество его точек накопления. Ясно, что Е' аЕ. Но £==£;
следовательно, Fc£, Обратно, предположим, что Е' czE. Torjxa
Е U Е' cz E U Е = Я, т. е. Е U Е' с= Я. Но Е [} Е' = Ё. Значит, ЁаЕ.
Но поскольку всегда Е а Е, то Е = Е, и стало быть, Е замкнуто.
Таким образом, для того чтобы множество Е, состоящее из
бесконечного числа элементов, было замкнуто, необходимо и
достаточно, чтобы оно содержало все свои точки накопления.
Пример. Рассмотрим множество Е, определенное в 3° и
составленное из действительных чисел 1 < х ^С 2, числа 3 и чисел
,(—1/п). Точки (—1/п) и точка 3 изолированы. Точка 0 является
точкой накопления множества £ и не принадлежит Е. То же
самое относится к 1. Множество Ef точек накопления есть 1 -<
^х^2 и 0. Множество Е, являющееся замыканием
множества Е, состоит из (—1/п), 0, 1 ^.хК2 и 3.
Свойства. 1. Множество точек, названное нами замкнутым
интервалом [а, Ь], очевидно, будет замкнутым множеством в R.
Интервал [а, +оо[ тоже замкнут в R. Он не ограничен, тогда как
предыдущий ограничен.
2. Объединение двух замкнутых множеств есть замкнутое
множество. Действительно, пусть Еи Е2 — два замкнутых
множества. Так как ЕХ = ЕЬ Е2 = Е2, то Ех \}Е2 = Е\ \}Е2 = ЕХ [)E2.
Из этого следует, что объединение любого конечного числа
замкнутых множеств замкнуто.
Но для бесконечного числа множеств это, вообще говоря,
неверно. Так, рассмотрим
S.-bnFT.-Sr] («-1.2.3,...).
ГЛ. И. ЧИСЛОВАЯ ПРЯМАЯ
229
[)Еп не содержит 0, который служит для []Еп точкой
накопления, и значит, [)Еп не замкнуто.
3. Пересечение двух замкнутых множеств Е\, Е2 замкнуто,
ибо если а\— точка накопления множества Е\ П Е2, то она
является пределом последовательности точек, принадлежащих Е\
и Е2, а поскольку Ех и Е2 замкнуты, тоаЕ£| «ае£2)и
значит, а е £i П £г.
Можно показать, что пересечение бесконечного числа
замкнутых множеств замкнуто. В частности, точка а составляет
замкнутое множество, ибо она служит пересечением множеств [а, Ь] и
[У, а] (b'<a<b). Это согласуется с тем фактом, что точка
есть множество, состоящее из единственного элемента.
Пересечение замкнутого множества F с интервалом [а, Ь\
т. е. множество точек из F, принадлежащих [а, Ь], замкнуто.
Замечание. Если пересечение F П [а, Ь] = 0, т. е. F и
[а, Ь] не имеют общих точек, то результат кажется не имеющим
смысла. В этом случае пустое множество рассматривается как
замкнутое. Но мы не будем останавливаться на этом.
§ 2. Основные теоремы
1. Теорема Больцано—Вейерштрасса. Всякое ограниченное
множество, состоящее из бесконечного числа элементов, имеея?
точку накопления.
Пусть Е — ограниченное множество точек из R. Оно может
быть заключено в замкнутый интервал [а, Ь]. Возьмем середину
а\ = (а + Ь)/2 интервала [а* Ь]. Тогда ах — а = (Ь — а)/2,
Ь — ах = (Ь — а) /2.
Если Е имеет бесконечно много элементов, то хотя бы одна
из частей множества Е, принадлежащих [а, а{\, [аи Ь\ состоит
тоже из бесконечного числа элементов, иначе объединение их,
составляющее Е, имело бы лишь конечное число элементов.
Возьмем тот из интервалов, который содержит бесконечно много
элементов из Еу и обозначим его через Л = [ось pj. Отметив
далее середину интервала [\, получим 12 = [а2, Рг], который также
содержит бесконечно много точек из Е, причем 1\ гэ /2.
Продолжая этот процесс, получим интервалы
1п = [и>п> PnL
г , q __ b — а
^п-^'п + и Рл ал ~~ 2п
Следовательно, если m > п,
In^Im И 1 Р„ — рт К 2п .
Но 1/2" стремится к нулю, когда п стремится к бесконечности,
ибо индукция показывает, что 2и>/г (имеем: 2]>1, и если
230 КНИГА III. АНАЛИЗ
2n > п, то 2n+1 > 2n > n +1). Значит, (рп) —
последовательность Коши, и стало быть, сходится. То же самое относится к ап\
но так как рп — ап = (Ь — а)/2п стремится к нулю, то ап и рп
имеют один и тот же предел а. Теперь возьмем какой-нибудь
открытый интервал ]а', Ь[, содержащий а. Можно найти такое
достаточно большое Р, что если п > Р, ап и рп содержатся
в ]а', &'[; следовательно,
/я = [ая, fc]c]c', b'[.
А так как /п содержит бесконечно много элементов из Е, то
\а\ Ь% т. е. произвольный открытый интервал, содержащий а,
содержит точку из Е, отличную от а. Это показывает, что а есть
точка накопления множества Е.
Замечания. 1. Эта теорема формулируется также
следующим образом: из любого ограниченного множества, имеющего
бесконечно много элементов, можно выделить сходящуюся
последовательность.
2. Теорема неверна, если Е не ограничено. Так, множество
натуральных чисел N не имеет в R точки накопления.
2. Монотонные последовательности. Последовательность (хп)
действительных чисел есть функция целого числа п,
принимающая действительные значения.
Последовательность называется возрастающей, если эта
функция от п возрастает, т. е. если для любого п имеем хп -^
^ яп+1. Отсюда следует, что если р < q, то хр ^ xq.
Она называется строго возрастающей, если хп < хп+\ для
любого п.
Она называется убывающей (соответственно строго
убывающей), если для любого п имеем хп ^ xn+i (соответственно
хп>хп+\). В этом случае последовательность (—хп) будет
возрастающей.
Все эти последовательности называются монотонными.
Утверждение о монотонности последовательности без
дальнейшего уточнения означает ее принадлежность к одному из
четырех предыдущих типов.
Теорема о монотонных последовательностях. Всякая
монотонная ограниченная последовательность сходится.
Предположим, что последовательность (хп) возрастает. Если
она принимает лишь конечное число значений, то, начиная с
некоторого индекса р, хп = xv при любом п, и хр есть предел
для (Хп). Если имеется бесконечное число различных членов и
если хп^хп+\ при любом п, то х\ *Схп для любого п.
Следовательно, множество элементов хп минорировано элементом х\.
По предположению, оно ограничено. Тогда по теореме Больца-
но — Вейерштрасса оно обладает хотя бы одной точкой
накопления а. Покажем, что эта точка единственна (§ 1, п. 3°). Если
ГЛ. II. ЧИСЛОВАЯ ПРЯМАЯ
231
бы имелась вторая точка р, то существовало бы бесконечно
много хп в интервалах
допустим, например, что р > а. Выберем во втором интервале
некоторое хр; в первом интервале можно найти такое xq, что
q>p. Тогда xq<a + $~a < Р - -^р-<хру т. е. xq<xv для
q > р. Значит, последовательность не будет возрастающей.
Стало быть, допущение о существовании р абсурдно.
Важное замечание. Всякая сходящаяся
последовательность ограничена, так как всякая сходящаяся
последовательность является последовательностью Коши (см. п. 2° § 1).
Логическое отрицание этого предложения выглядит так: если
последовательность не ограничена, то она не сходится.
Следовательно, предыдущая теорема может
формулироваться следующим образом: для того чтобы монотонная
последовательность была сходящейся, необходимо и достаточно,
чтобы она была ограничена.
Значит, можно также сказать, что для того, чтобы
монотонная последовательность была расходящейся, необходимо и
достаточно, чтобы она не была ограничена.
Теорема Бореля — Лебега. Пусть F есть замкнутое
ограниченное множество на R. Если множество открытых интервалов
покрывает F, то найдется конечное число этих интервалов,
покрывающих F.
Пусть & — множество открытых интервалов,
покрывающих F. Это означает, что каждое xeF лежит внутри по
крайней мере одного интервала семейства <%. Если F состоит из
конечного числа точек, то теорема очевидна. Предположим, что F
состоит из бесконечного числа точек и доказываемое свойство
не выполняется, т. е. не существует конечного множества
интервалов из 8, покрывающих F. Если тогда разбить F на два
множества F' и F", то хотя бы одно из множеств F', F" не может
быть покрыто конечным числом интервалов из 8, иначе
объединение F' U F", представляющее собой F, было бы покрыто
конечным числом этих интервалов. Множество F ограничено;
поэтому оно содержится в некотором интервале [а, Ь]. Пусть
#i — середина [a,b]; Ff — часть F, расположенная на [а, а{], F" —
часть F, расположенная на [аь Ь\ т. е. F' = F П [а, а{\, F" =
= F П [аи Ь]. Множества F' и F" замкнуты (см. конец
предыдущего параграфа). Обозначим через F\ одно из множеств F', F",
Для которого теорема неверна, а через 1\ — интервал, его
содержащий.
232
КНИГА III. АНАЛИЗ
Повторяя этот процесс, получим семейство Fn замкнутых
множеств, лежащих на интервалах /п = [ап, рп], У которых
Рп — ап = (Ь — а)/2п. При этом Inczlm, если n>m, и
|осп — ост|< (Ь — а)/2п (п*>т). Значит, (ап) —
последовательность Коши в R и сходится к некоторой точке а. То же самое
будет иметь место и для точек рп, ибо рп — ап = (Ь —а)/2п.
Так как мы предположили, что каждое множество Fn не
может быть покрыто конечным числом интервалов из <§, то Fn
имеет бесконечно много элементов; следовательно, а будет
точкой накопления множества F, поскольку она является пределом
точек ая, Рп и поскольку Fn, будучи частью F, содержится
в [осп, Рп]. Но F замкнуто, поэтому aEF. По предположению
же, любая точка из F есть внутренняя точка открытого
интервала 9 семейства ё\ в частности, это верно и для а. Стало быть,
существует интервал ]а — е, а + е[ с: 0. Но если п достаточно
велико, то в силу того, что рп — ап стремится к нулю, получим
/n cz ]a— е, а + е[ cz 9, так что F Г) /п, будучи подмножеством
из F, лежащим на /п, содержится в ]а — е, а + е[, и значит,
в открытом интервале 9 из &. Иначе говоря, одно множество 9
уже покрывает Fn = F П /п, что противоречит нашему
допущению; тем самым теорема Бореля — Лебега доказана.
Замечания. 1. Теорема неверна, если множество F не
ограничено. Достаточно рассмотреть множество [а, +оо[ или N,
которые являются замкнутыми множествами, и покрыть их
открытыми интервалами ]х — е, х + е[, где е > 0 фиксировано, а
х является точкой множества.
2. Можно также сформулировать теорему Бореля — Лебега
следующим образом: если любая точка х ограниченного
замкнутого множества принадлежит открытому интервалу 0*, то
найдется конечное число этих интервалов, снова покрывающих
множество. Следовательно, во множестве существует конечное
число таких точек хи х2, ..., хр, что р интервалов вЖ1, ..., Q.x"p
полностью покрывают ограниченное замкнутое множество.
Общее замечание о теоремах Больцано—
Вейерштрасса и Бореля — Лебега. Важность этих тео-*
рем будет проявляться всюду в дальнейшем, в частности
посредством их расширения и применения к точечным множествам,
более общим, чем множества действительных чисел.
§ 3. Верхние и нижние грани
В § 1 мы определили понятие мажоранты мажорированного
множества. Более точным является понятие верхней грани. Его
определение основано на следующей теореме.
Теорема 1. Множество мажорант мажорируемого
множества Е имеет наименьший элемент.
ГЛ. II. ЧИСЛОВАЯ ПРЯМАЯ
233
1° Для конечного Е теорема очевидна: наименьшей
мажорантой является наибольший элемент из Е.
2° Если в Е существует элемент, являющийся мажорантой
для всех элементов из £, то он и будет наименьший из всех
мажорант.
3° Пусть а — мажоранта множества £, не принадлежащая
£, а х — некоторый элемент из Е. Если х не является
мажорантой, то возьмем середину а{ интервала [я, а]. Если а,\ е Е и
является мажорантой, то эта мажоранта будет наименьшей. В
противном случае на одном из интервалов ]#, аЦ, [аь а[ имеются
точки из Е. Если же оба интервала содержат точки из Е, то берем
правый. Продолжая этот процесс, мы либо после конечного
числа шагов получим точку из £, являющуюся мажорантой, либо
получим последовательность таких интервалов In = [an, bn], что
In zd /п+ь причем ап и Ьп имеют общий предел 6,
принадлежащий всем /п. Это есть точка накопления множества Е\ в Е не
существует точки х > й, иначе для достаточно больших п в Е
нашлись бы точки, лежащие правее /п. Следовательно, Ь есть
мажоранта множества Е.
Е не имеет мажоранты 6', меньшей 6, так как в противном
случае в интервале ]Ь\ Ь[ не было бы точек из Е, что
невозможно, поскольку Ъ есть точка накопления множества Е.
С надлежащими заменами доказанное свойство справедливо
и для минорированного множества.
Определение. Верхней гранью (соответственно нижней)
мажорированного (соответственно минорированного) множества Е
называется наименьшая (соответственно наибольшая) из
мажорант (соответственно минорант) множества Е.
Верхняя грань множества Е обозначается через sup £, a
нижняя — через inf £. Для большей точности пишут
sup£, in!£, sup a:, inf a:.
Х<==£ *€=£ Х&Е *€=£
В случае, когда Е есть мажорированное счетное множество
точек хп, мы будем писать
sup хп, или sup хп.
п
Из доказательства теоремы 1 видно, что если Е — замкнутое
и мажорированное множество, то оно содержит свою верхнюю
грань. Действительно, наименьшая из мажорант
мажорированного множества либо принадлежит этому множеству (п. п. Г и
2°), либо не принадлежит, и тогда она является точкой
накопления множества, а значит, принадлежит его замыканию. Во
всех ^случаях она принадлежит Е, а так как Е замкнуто, т. е.
Е = Е, то имеет место
234
КНИГА III. АНАЛИЗ
Теорема 2. Любое замкнутое ограниченное множество со*
держит свою верхнюю и нижнюю грани.
Важное замечание. Если Е мажорировано, то его
верхняя грань характеризуется следующим фактом: каково бы ни
было хе£,х< sup Е, и каково бы ни было а < sup E, найдется
такое х е Е, что а < х -< sup E.
Если Е минорировано, то его нижняя грань характеризуется
следующим аналогичным фактом: каково бы ни было х^Еу
inf£-<A;, и каково бы ни было b>\niEy найдется такое х^Е,
что inf Е < х < Ь.
К теореме 2, которая будет использоваться при изучении
непрерывных функций, мы добавим следующую теорему,
характеризующую интервалы прямой R.
Теорема 3. Для того чтобы множество Е точек из R
составляло интервал, необходимо и достаточно, чтобы для любых
двух точек а и Ь, принадлежащих Е, замкнутый интервал [а, Ь]
содержался в Е.
Необходимость очевидна.
Допустим, что условие выполнено. Множество Е может не
быть ни мажорированным, ни минорированным, быть
мажорированным и не быть минорированным, быть минорированным и
не быть мажорированным, быть ограниченным.
Если Е ни мажорировано, ни минорировано, то для любого
действительного числа х найдутся такие а ^Е и Ъ е £, что а <
< х < Ь. А так как по условию [а, Ь] е Е, то х е Е. Значит,
любое х ^R принадлежит £, и стало быть, £■ = /? = ]—оо, + оо[.
Предположим, что Е мажорировано, но не минорировано.
Рассмотрим верхнюю грань sup E. Для любого действительного
числа #<sup£ в Е найдется такая точка й, что x<b^C supE
(предыдущее замечание). А так как Е не минорировано, то
найдется такое йе£, что а < х. Следовательно, а < х < Ъ. Но по
условию [а, Ь] с: Е, и значит, х е Е. Стало быть, Е может
представлять собой лишь одно из множеств ]—оо, sup E[ или
]—оо, sup/?]. Точно так же рассуждаем в остальных двух
случаях.
§ 4. Теоремы о пределах
Элементарные теоремы о сходящихся последовательностях
используются постоянно. Частично они являются повторением
свойств последовательностей Коши. Но мы добавим несколько
замечаний, касающихся случая не сходящихся
последовательностей.
Во всем этом параграфе мы для простоты вместо
выражения «хп сходится к хо, когда п стремится к бесконечности»
будем писать «хп сходится к х0».
ГЛ. II. ЧИСЛОВАЯ ПРЯМАЯ 235
1. Если хп сходится к Хо, а уп — к у о, то хп + уп сходится
К Хо + Уо-
Действительно, каково бы ни было е > 0, для всех п, кроме
конечного числа, имеем \хп — х0\ < е/2, \уп — Уо\ < е/2, и
значит, также
I (хп + Уп) - (*о + У о) I = I хп - х0+уп - у о К | хп - х01 +1 уп - у 01< е.
2. Если #п сходится к хо, то, каково бы ни было число а е R,
ахп сходится к ахо.
Действительно, если а = О, то ахп = 0, ах0 = 0, и свойство
очевидно. Если же а^О, то при любом е для всех п, кроме
конечного числа, имеем
I *п - х0 |<8/| а |;
следовательно,
| ахп - ах01 = I « 11 хп - *0|< |а|е/| а | = е.
В частности, если хп сходится к х0> то —хп сходится к —х0.
3. Если хп сходится к х0, а уп — к у0у то хпуп сходится к х0у0.
В самом деле, так как (хп) и (уп) —сходящиеся
последовательности, то хп и уп ограничены. Пусть а > О таково, что
\хп\ < а, \Уп\ <а при любом п. Каково бы ни было е > 0, для
всех п, кроме конечного числа, имеем
I хп- х01 < е/2а, \уп-Уо\< е/2 а.
Значит, для всех л, кроме конечного числа,
I хпуп - х0у0 | -1 хп (уп - у о) + у0 (хп - *о) |< | хп (уп - у0) | +
+ \'Уо{Хп-Хо)\ = \хп\\Уп-Уо\ + \Уо\\Хп-Хо\<
<a\yn-y0\ + a\xn-xQ\<a^+a-^=e.
4 Следствия. Каково бы ни было целое число р > О,
из того, что хп сходится к Хо, следует, что последовательность
с общим членом хрп (р-я степень от хп) сходится к *£, ибо
достаточно в предыдущем случае взять уп = хп, затем уп = х2п и т. д.
Тогда из первых трех результатов вытекает, что если / —
многочлен и Хп стремится к х0, то f(xn) стремится к f(x0).
Этот факт имеет истоки в свойствах непрерывных функций
(гл. III).
5. Если хп сходится к х0 Ф О и хп ф О при всех п, то 1/хп
сходится к 1/л*0.
236 КНИГА III. АНАЛИЗ
Действительно, каково бы ни было е > 0, для всех п, кроме,
быть может, конечного числа, \хп — хо\ < е. Пусть р таково, что
\хп — Хо\ < е при п > р. Отсюда следует, что | \хп\ — \х$\ \ < г
и хп
| > \хо\—е для п>р. Поскольку х0Ф0, то, выбирая е
достаточно малым, получим Xq\ — е > 0. Ясно, что для п > р
величина \хп\ остается больше некоторого числа X > 0.
Обозначим через а наименьшее из чисел Я, \х\\, ..., \хр\. Тогда \хп\^
^а>0 для любого п. Иными словами, inf |л;п|>0. Каково бы
ни было е > 0, для всех л, кроме конечного числа, \хп — х0\ <
<Сеа2. Значит, для всех п, кроме конечного числа,
|_1 |__ Хп — х$
хп х0 I I хпХо
Замечание. Если хп сходится к х0 ф 0, то | хп | > | х0 | — е 1
при п> р. Рассматривая 1/хп, но только для п> р, получаем 1
искомый результат. Напротив, если хп Ф 0 при всех п, но хп I
сходится к нулю, то результат не имеет места. I
Следствие. Если хп сходится к х0 ф 0, хп Ф 0 при всех п I
и если уп сходится к у0, то уп/хп сходится к уо/х0\ действительно, I
достаточно применить результат 3 к 1/хп и уп. I
6. Если хп сходится к x0t то \хп\ сходится к \х0\. Это выте- 1
кает из неравенства 11 хп \ — | х0 \ \ fC \хп — х0 \. и
Важные общие замечания. Эти результаты не рас- I
пространяются на расходящиеся последовательности. Однако 1
следующие факты являются существенными. 1
а) Если (хп)—сходящаяся последовательность, а (уп)— I
расходящаяся, то (хп + уп) будет расходящейся последователь- 1
ностью. |
Действительно, если бы (zn) = (хп + уп) была сходящейся, I
то на основании свойств 1 и 2, последовательность (уп) = 1
= (%п — хп) была бы сходящейся. I
б) Если (хп) и (уп)—расходящиеся последовательности, 1
то нельзя утверждать, что (хп + уп) расходится. I
Так, возьмем хп = (—1)п-и (т. е. хп = 1, если п нечетно, 1
и хп = —1, если п четно) и уп — (—1)п. Обе эти последователь- 1
ности расходятся: они jie являются последовательностями Коши, I
поскольку \хп — xn+i\ =2, \уп — Уп+i] =2. Однако хп + уп = 0 I
есть сходящаяся последовательность. m
в) Если (хп) — расходящаяся последовательность и а — от- щ
личное от нуля действительное число, то (ахп) расходится; если j
а = 0, то (ахп) сходится. \
В самом деле, пусть а Ф 0 и уп = ахп, т. е. хп = — уп. Соглас- 1
но свойству 2 сходимость уп влечет сходимость хп. Если а = 0, |
то ахп = 0 при любом п, и поэтому ахп сходится. I
1 хп — Хр 1
IхпХо |
<
а2
= е.
ГЛ. III. ОТОБРАЖЕНИЕ R В R
237
ГЛАВА III
ОТОБРАЖЕНИЕ R В R; ДЕЙСТВИТЕЛЬНЫЕ ФУНКЦИИ
ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО
В этой главе будут изучаться функции, у которых
переменное х и значение f(x) функции f являются действительными
числами. Но во множестве R действительных чисел определены
многочисленные понятия, такие как порядок, предел, абсолютное
значение..., и многочисленные свойства (Q плотно в /?, R полно,
теорема Больцано — Вейерштрасса, ...). Различные типы
функций определяются и исследуются путем рассмотрения некоторых
из этих понятий и свойств одновременно для переменного х и
для значения f(x) функции. Так, определение возрастающей-
функции требует использования понятия порядка для
переменного х (х ^ х') и для значений f(x) (f(x) ^ /(я')); определение
непрерывности требует использования топологии в R для х и
для f(x) (выражение: f(x) стремится к f(xo), когда х стремится
к л;0). Однако некоторые, и притом весьма важные, операции и
свойства основываются только на том, что значение f(x)
функции есть действительное число, и справедливы без уточнения
природы переменного. Руководствуясь педагогическими
соображениями, мы укажем лишь некоторые из этих определений и:
свойств.
I. ОБЩИЕ СВЕДЕНИЯ О ЧИСЛОВЫХ ФУНКЦИЯХ
§ 1. Определения
Определение числовой функции. Числовой функцией
называется отображение множества Е в R.
Переменное х есть элемент произвольного заданного
множества Е. Если функция обозначается через /, то f(x) есть
действительное число.
Иногда говорят о конечной числовой функции, в отличие от
тех, которые могут принимать «бесконечные значения» и
определение которых нам необходимо будет дать в дальнейшем.
Вместо числовой функции говорят также о действительной
функции, или о функции с действительными значениями.
Последовательность действительных чисел есть числовая
функция, у которой роль переменного выполняет целое число п.
Напомним, что выражение «числовая функция,
определенная на Е» означает, что каждому х е Е ставится в соответствие
действительное число f(x), и притом единственное.
/(£) означает множество значений f(x) функции /. Это есть
подмножество из R\ оно не обязано составлять ни все R, ни
интервал из R.
238 КНИГА III. АНАЛИЗ
Кольцо числовых функций, определенных на Е (см.
Книга II, гл. III, разд. III, § 1). Будем рассматривать числовые
функции на одном и том же множестве Е. Если / и g— две
такие функции, то функция x-*f(x) + g(x) тоже будет числовой
функцией, определенной на Е. Ее обозначают через f + g и
называют суммой функций / и g.
Эта операция задает на множестве определенных на Е
числовых функций внутренний закон — сложение.
Этот закон ассоциативен, т. е. / + (g + h) — (f + g) + h, ибо
f + {g + h) есть функция x^f(x) + (g(x)+h{x)), a (f+g)+h—
функция *->- (f(x) + g(x)) + h(x)= f{x) + (g(x)+ h(x)), в силу
ассоциативности сложения действительных чисел.
Он коммутативен, т. е. f + g = g + f для любых числовых
функций / и g, определенных на Е.
Если 0 означает функцию л;-^0, которая каждому х е Е
ставит в соответствие Og/?, to, каково бы ни было /, имеем
f + 0 = 0 + f = f; следовательно, 0 есть нейтральный элемент
сложения.
Наконец, если обозначить через —/ числовую функцию х-*
-**—/(*)> то / + (—/) = 0; всякая числовая функция,
определенная на Е, обладает симметричной относительно только что
введенной операции сложения.
Можно определить и второй внутренний закон — умно-
оюение.
Двум числовым функциям fug, определенным на Еу
ставится в соответствие функция x^f(x)g(x), где f(x)g(x) есть
произведение действительных чисел f(x), g(x). Полученная
таким путем функция обозначается через fg.
Этот закон также ассоциативен и коммутативен. Если
единица означает функцию *-> 1, то If = /1 при любом /;
следовательно, умножение обладает нейтральным, или единичным
элементом.
Таким образом, предыдущие два закона превращают
множество определенных на Е числовых функций в унитарное
коммутативное кольцо.
Для числовой функции /, определенной на Е и не
принимающей значение 0, т. е. такой, что }(х)Ф0 при любом х^Е,
можно определить функцию x-+l/f(x). Эта функция обозначается
через 1//. Имеем /у=1, но только в том случае, если 1//
существует.
Ни в коем случае нельзя смешивать fg и fog (композиция
функции g на /). Иногда для большей ясности мы будем вместо
fg писать f-g. Нельзя также смешивать 1// и f_1. Обозначение
f-1 представляет обратное отображение к f и никогда не будет
представлять 1//.
ГЛ. III. ОТОБРАЖЕНИЕ R В R
239
Векторное пространство числовых функций, определенных
на Е. Каждой числовой функции f, определенной на £, и
каждому аЕЙ поставим в соответствие функцию x-+af(x). Эта
функция обозначается через af. Таким образом, на множестве
определенных на Е числовых .функций определен внешний
закон, операторами которого являются действительные числа.
Очевидно, a(f + g) = af + ag, (a + p)/ = af + p/, a(pf) - (ap)f,
1 . f = f9 каковы бы ни были a, р, /, g. Этот внешний закон, а
именно умножение / на действительное число, и определенное
выше сложение превращают множество числовых функций,
определенных на £, в векторное пространство над R.
Отношение порядка, функции f+, f~, \f\. Если О означает
нулевую функцию: х-+0, то /<>0 означает /(л;)Х) при всех
х е Е.
Если fug — две числовые функции, определенные на Е, то
f&zg означает f(x) ^ g (x) при всех х^Е.
Это соотношение рассматривается как эквивалентное тому,
что g ^ f, т. е. g(x) ^ f (х) при всех х е Е.
Так определенное отношение является отношением порядка,
ибо оно рефлексивно, транзитивно и антисимметрично. Однако
в то время как для двух действительных чисел х, у либо х4^у,
либо у-*Сх, для двух числовых функций f и g это не так: может
не выполняться ни одно из отношений f ^ g, g ^ f. Стало быть,
множество числовых функций не является линейно
упорядоченным (Книга I, гл. III, разд. I).
Если f ^0, то говорят, что / неотрицательна. Говорят также,
что f положительна. Если, каково бы ни было хе£, f(x) > 0,
то пишут f > 0 и говорят, что f строго положительна. Точно так
же f>. g истолковывается как f больше или равна g> а f > g,
т. е. fix) ;> g(x) при любом л:, как f строго больше g.
Пусть ) — числовая функция, определенная на Е. Построим,
исходя из /, числовую функцию /+, положив f+(x) = f(x)y если
f(x) ^ 0, и f+(x) = б, если f(x) ^ 0. Точно так же f- есть
функция, определенная равенством f"(x)=f(x)i если f(x)^0, и
f'(x) = 0, если f(x) ^ 0. Образно выражаясь, функция f+
получается из функции f путем замены отрицательных значений на
нуль. Очевидно, f~ = —(—/)+. Имеем также f = f+ + f'.
Наконец, обозначим через \f | функцию #-> \f (x) |, т. е.
функцию, которая каждому х ставит в соответствие абсолютное
значение величины f(x). Имеем \f+\ = f+, \f~\ = — f", \f\ =f+ — f~.
Если f = 0, то |/1 = 101 =0. Очевидно, верно и обратное. \f + g\
есть функция x-+\f(x) + g(x)\. Имеем
\f(x) + g(x)\^\f(x)\ + \g(x)l
и стало быть, |f + g|^|/| + lffl Для любых числовых функций
/ и g, определенных на Е\ отсюда ||f| — |g||^|f — #|.
240 КНИГА III. АНАЛИЗ
\fg\ есть функция х-+\f(x)g(x)\ = \f(x)\\g(x)\, и значит,
Ограниченные числовые функции. Рассмотрим множество
f(E) значений f(x), принимаемых числовой функцией /,
определенной на множестве Е. f(E) составляет часть R. Если f(E)
мажорировано, то функция / называется мажорированной. Тогда
найдется такое действительное число а, что f(x) ^ а для любого
*<=£. По теореме 1, доказанной в § 3 гл. II, существует
наименьшая мажоранта множества f(E), которую называют
верхней гранью этого точечного множества. Эта верхняя грань
называется также верхней гранью функции f на Е и обозначается
sup f(x).
Точно так же говорят, что f минорирована на £, если f(E)
минорировано в R, а нижняя грань irif f(x) функции / есть ниж-
няя грань множества f(E).
§ 2. Верхний и нижний пределы последовательности
Понятие верхнего предела есть сложное понятие, которое мы
изложим только для счетных последовательностей
действительных чисел.
Как уже было сказано, последовательность (хп) есть
функция, у которой переменным служит целое п ^ 1 (Книга I, гл. II;
Книга III, гл. I). Последовательность действительных чисел (хп)
есть функция, у которой переменным является п, а значением —
действительное число, записываемое обычно в виде хп вместо
х(п).
Напомним еще раз, что последовательность (хп) сходится
к числу Xq, если любой открытый интервал, содержащий лг0,
содержит все члены последовательности (хп), кроме, быть может,
конечного числа из них.
Может оказаться, что последовательность принимает лишь
конечное число значений; так будет, например, в случае
последовательности (хп) с хп = #0 при любом п^ 1. Эта
последовательность, очевидно, сходится. Она может принимать и бесконечно
много различных значений; такой будет, например,
последовательность (хп) с Х2р = x2p+i = \\р (р = 1, 2,...), которая
сходится к нулю.
Будем писать х (п) вместо (хп) и будем считать, что х есть
функция, которая элементу п^ N ставит в соответствие число
х(п) е/?. Множество значений этой функции обозначается через
x(N).
Рассмотрим, например, последовательность (хп), у которой
^зр = у» хзр+\ — 1 ту > *зр+2 = 2.
ГЛ. III. ОТОБРАЖЕНИЕ R В R
241
Множество значений x(N), принимаемых этой
последовательностью, состоит из точек 1//?, 1 + \/р (р « 1, 2, 3,...) и точки 2.
Точки 0 и 1 для множества x(N) являются точками накопления,
но точка 2 таковой не будет, хотя и существует
подпоследовательность (язр+г) последовательности (хп), сходящаяся к 2.
В итоге видим, что по множеству значений, принимаемых
последовательностью, еще нельзя судить о характере самой
последовательности.
Таким образом, мы пришли к тому, что для множества
значений последовательности хп следует различать, с одной стороны,
точки накопления, а с другой стороны, те значения, которые
функция п-+хп принимает бесконечно много раз.
Первоначально понятия верхнего и нижнего пределов можно
ввести следующим образом.
Пусть (хп) есть мажорированная последовательность
действительных чисел; обозначим через Е = x(N) множество
числовых значений, принимаемых этой последовательностью. Через <%
обозначим множество точек, которые либо являются точками на-
копления множества Е, либо представляют собой значения,
принимаемые последовательностью (хп) бесконечно много раз.
Назовем верхним пределом мажорированной
последовательности (хп) верхнюю грань множества &.
Назовем нижним пределом минорированной
последовательности (хп) нижнюю грань множества &.
Эти числа, если они существуют, обозначаются через
lim sup#,t, или lim xn, или Нтл;д
Л->оо Л->оо
для верхнего предела и
lim inf хп, или lim xnt или lim xn
tl->oo
П->оо
для нижнего. - - .
Эти понятия можно будет расширить, когда мы определим
элементы +оо, —оо.
Характеристическое свойство. Для того чтобы число а было
верхним пределом последовательности чисел хп, необходимо и
достаточно, чтобы для любого е > О нашлось такое целое р, что
для п^ р выполняется неравенство хп^а + г и для
бесконечного множества значений п выполняется неравенство хп ^ а — е.
Для того чтобы число а было нижним пределом
последовательности чисел хп, необходимо и достаточно, чтобы для любого
8 > 0 нашлось такое целое р, что хп ^ а — е для п^ р и хп ^
<: а + е для бесконечного множества значений п.
Можно еще сказать, что а есть верхний предел
последовательности (хп), если, каково бы ни было е > 0, число индексов п, для
242
КНИГА III. АНАЛИЗ
которых хп ^ а + е, конечно, а число индексов п, для которых
хп ^ а — е, бесконечно.
Точно так же утверждение, что а есть нижний предел
последовательности (хп), равносильно тому, что, каково бы ни было
е > 0, число индексов п, для которых хп ^ а — е, конечно, а
число индексов п, для которых хп ^ а + е, бесконечно.
Действительно, допустим, что существует a = \imxn. По
определению множества 8, для которого а служит верхней гранью,
всякое значение а' > а может приниматься последовательностью
(хп) лишь конечное число раз, и значит, для любого е > 0
неравенство хп > а + е может выполняться лишь для конечного
числа значений п. Если а есть точка накопления, то существует
последовательность (Xnk)> сходящаяся к а; стало быть, каково
бы ни было 8 > 0, для бесконечного множества значений п
имеем хп ^ а— е. Если же а не будет точкой накопления, то
функция п-+хп принимает значение а бесконечно много раз,
т. е. для бесконечного множества значений п имеем хп = a S>
>а — е.
Обратно, если существует такое число а, что для любого е >
> 0 неравенство хп ^ а + е выполняется для всех значений п>
кроме конечного числа, то множество Е значений хп
мажорировано. А так как для любого е неравенство хп^. а + е
выполняется для всех значений п, кроме конечного числа, то, каково бы ни
было Ь > а, Ь не может быть точкой накопления множества Е.
Следовательно, множество Ef точек накопления множества Е
(если оно не пусто) мажорировано числом а.
Кроме того, если при любом е > 0 для бесконечного
множества значений п имеем xUk ^ а— е, то либо при любом е > О
имеется бесконечно много различных значений xnk с этим
свойством, и тогда а есть точ!са накопления, а стало быть, а = sup E'\
либо при каком-то е > 0 последовательность xnk принимает
лишь конечное число различных значений. В последнем случае
непременно хп = а для бесконечного множества значений п, и
тогда а является наибольшим из чисел, которые
последовательность (хп) принимает бесконечно много раз. Следовательно,
вновь а = sup E.
Свойства. Мы ограничимся лишь несколькими указаниями.
Г Пусть (хп) —мажорированная последовательность, и пусть
а > 0; тогда последовательность (ахп) мажорирована и
lim ахп = а \\тхп.
Но если а < 0, то может случиться, что говорить о верхней
грани последовательности не имеет смысла. Так, возьмем х2р =
= —*/2Pl_ *2p+i = — (2р + 1), где р — целое положительное.
Имеем Птл;„ = 0, но если взять а =—1, то последовательность
(—хп) не будет мажорирована.
ГЛ. III. ОТОБРАЖЕНИЕ R В R 243
2° Пусть (хп) — мажорированная положительная
последовательность, а (уп) — сходящаяся положительная
последовательность; тогда (хпуп) есть мажорированная последовательность, и
iim xnyn = (lim yn) lim xn.
Действительно, пусть a = \\mxn, b = l\myn. Возьмем
произвольное е > 0. Для всех целых п, кроме конечного числа, имеем
0^хп<а + е, 0^уп<Ь + е и значит, 0 < хпуп < аЪ + е',
где е' = аг + fee + е2. Если задано е" > 0, то можно выбрать
г так, чтобы е'^е". Следовательно, для всех п, кроме
конечного числа, хпуп < ab + е".
Покажем, что, с другой стороны, для бесконечного множества
значений п выполняется неравенство хпуп ^ аЬ — е". Если одно
из чисел а или Ь равно нулю, то свойство очевидно. Если же
а Ф 0 и Ь ф 0, то для всех п, кроме конечного числа, имеем уп >
>Ь — е, и для бесконечного числа хп > а — е. Если же число
г > 0 выбрать так, чтобы а — е ^ 0 и Ь — е ^ 0, то для
бесконечного множества значений п будет выполняться
хпуп > (а — е) (6 — е) = ab — га — ей + е2.
3° Точно так же, если (хп) мажорирована, а (уп) сходится, то
lim {хп + уп) = lim xn + lim yn.
Важное замечание. Если (хп) и (#г0 мажорированы,
то, вообще говоря, равенство \im(xn +yn) =\\mxn + \imyn
может не выполняться.
Возьмем, например, последовательность (хп), у которой лг2р =
= 1, Х2р+\ = 0, и последовательность (уп), у которой у2р = 0,
t/2P+i= 1. Имеем limхп=* 1, Итл:Л = 0, Нтул=1, Птг/„ = 0. Но,
по определению суммы (хп + уп) двух последовательностей,
имеем х2р + yiv = U *2p+i + f/2p+i = 1, и значит, хп + уп = L
Поэтому lim (л:Л + г/п) = 1, но lim xn + limy„ = 2.
Этого примера достаточно, чтобы обратить внимание на тот
факт, что пользоваться этими понятиями следует с должной
осмотрительностью.
§ 3. Пределы в точке
В главе I, разд. II, § 3 мы определили сходимость
последовательности действительных чисел, являющейся числовой функцией
от п. Распространим это понятие предела на числовые функции,
определенные на интервале / из R и дадим несколько
эквивалентных определений.
Пусть a, b — концы интервала 1(а < &).Мы не предполагаем,
что они обязательно принадлежат /. Однако если аф I, то а есть
244
КНИГА III. АНАЛИЗ
точка накопления для /, и чтобы придать смысл выражению
«/(я) стремится к уо> когда х стремится к аф.1», мы
воспользуемся понятием точки накопления.
Определение 1. Пусть f есть действительная функция,
определенная на интервале I из /?, и х0 — точка интервала /.
Говорят, что f(x) стремится к уоУ когда х стремится к x0i оставаясь
внутри /, если любому открытому интервалу 9', содержащему
Уо, соответствует такой открытый интервал 9, содержащий х0у
что если х<= / П 9 и хф х0} то f(x) ей'.
В этом случае говорят, что у0 есть предел функции f(x), и
записывают limf(x) = у0.
Х + Ха
Если х0 не является концом /, то можно взять 9, лежащий
целиком в /, и тогда / П 9 = 9 (рис. 11, а).
Рис. 11.
Так как всякий открытый интервал прямой, содержащий
некоторую точку, содержит и открытый интервал, имеющий эту
точку серединой, то в предыдущем определении можно
ограничиться рассмотрением лишь тех интервалов, для которых точки
х0 и уо служат серединами.
Открытый интервал с серединой у0 имеет вид ]у0 — е, уо + е[,
где е есть некоторое действительное число, е > 0. Этому
интервалу, т. е. числу е, можно поставить в соответствие открытый
интервал 9 = ]х0— a, Xq + а[, т. е. число а ф 0; а зависит от е, лг0, f.
Допустим, что лго не является концом /, т. е. х0 ф а, х0Ф Ъ. Если 9
есть интервал, содержащий х0у то пересечение / П 9 есть
интервал, содержащий х0 и содержащийся в /. Стало быть, если взять
а достаточно малым, то получим ]л;0— а, х0 + а[с=/. Но
утверждение х^]х0 — а, х0 + а[ эквивалентно неравенству \х0 — л;| <
< а. Следовательно, для любого х, удовлетворяющего условиям
\х — лг0| < а и хф хо, имеем \f(x) —yo\ < е.
Если Хо = Ь, то / Г) ]х0— ос, х0 + а[=]й — а, Ь[.
Если Хо = а, то / П ]х0 — а, х0 + а[ = ]а, а + а[.
ГЛ. III. ОТОБРАЖЕНИЕ R В R
24$
Определение 2. Г Если х0 лежит внутри I, то говорят, что
f(x) стремится к у$, когда х стремится к х0, если любому е > О
соответствует такое а, что для всех х, удовлетворяющих
условиям \х — х0\ < а и хфх0у имеем \f(x) — y0\ < е.
2° Говорят, что f(x) стремится к у о, когда х стремится к b на
I, если любому г > О соответствует такое а, что для b — а <
< х < b выполняется неравенство \f(x) —у0\ < е.
3° Говорят, что f(x) стремится к уо, когда х стремится к а на
I, если е > О соответствует такое а, что для а < х < а + а имеем
\f(x)—yo\ <e.
Для того чтобы выразить 2°, используется также
эквивалентное высказывание, что f(x) стремится к у0, когда х стремится к Ь
слева, а для 3° — что f(x) стремится к уо, когда х стремится к а
справа.
»В обоих случаях выражения «справа» и «слева» имеют смысл,
поскольку в R установлено отношение порядка. Можно также
i
i
i
i
i
Г/
б)
в каждой точке х0 внутри / определить выражения «f(x)
стремится к уо, когда х стремится к х0 слева» и «/(#) стремится к у^
когда х стремится к Хо справа». Для этого достаточно применить
предыдущее определение к интервалу с концами а, х0, если х
стремится к х0 слева, и к интервалу с концами х0, Ь, если х
стремится к Хо справа.
Если f(x) имеет пределом */0, когда х стремится к х0 справа
(соответственно слева), то пишут lim f(x) = y0 (соответственно,
lim f(x) = yQ)u обозначают у0 через f(x0 + 0) (соответственно*
f(xo — 0)) (рис. 11, б)). Очевидно, что если f имеет предел справа
и слева в некоторой точке х0 внутри / и если /(#0 + 0) =
= f(x0 — 0), то f имеет предел у0 = f(x0 + 0) = f(x0 — 0), когда х
стремится к х0.
Примеры. 1° / есть функция, определенная на [0, 1]
следующим образом: если #<=]0, 1], то f(x) = x, а /(0)=1
(рис. 12,а). Если #о^]0, 1], то f(x) стремится к у0 = х0у когда к
f(0)k
*М\
о)
Рис. 12.
246
КНИГА III. АНАЛИЗ
стремится к хо. Если х стремится справа к 0, f(x) стремится к О
(тогда как значение / в О равно 1).
2° f(*) = 0, если *g=[0, l/2[, /(1/2)= 1/2, f(x)=l, если
xg]1/2, 1] (рис. 12,6)). В точке х0 = 1/2 функция f(x) имеет
левый предел 0, а правый предел 1.
Определение при помощи сходящихся счетных
последовательностей. Для того чтобы f(x) стремилась к у0, когда х
стремится к точке Хо е /, необходимо и достаточно, чтобы для
любой последовательности (хп), сходящейся к х0 и имеющей х0
точкой накопления, последовательность f(xn) стремилась к у о,
когда п стремится к бесконечности.
Если f(x) стремится к у0, когда х стремится кх0е/,и (хп)
есть последовательность точек из /, сходящаяся к х0 и
имеющая х0 точкой накопления, то lim f(xn) = y0. В самом деле,
для всех п, кроме, быть может, конечного числа, \хп — х0\<а
влечет \f(xn) — у0\ < е. Обратно, предположим, что для любой
последовательности (хп), сходящейся к х0 в / и имеющей х0
точкой накопления, f(xn) сходится к уо. Утверждается, что f(x)
стремится к уо, когда х стремится к Хо. Действительно, пусть
е > 0. Допустим, что предложение неверно, т. е. существует
такое е > 0, что для любого а > 0 в интервале ]лг0 — а, х0 + а[
найдется такое х Ф х0, что \f(x) — Уо\^ г. Тогда возьмем ai > 0
и такое Х\фхо, что |лг0 — х\\ < а\ и \f{x2)— #о| ^е. Пусть
далее а2 меньше чисел -^ \хх — лг0| и ~^ах. Найдется такое х2 фх0,
что \х2— л;0|<а2 и \f(x2) — f/o|>e и т. д. Таи, постепенно,
построим последовательность (хп), которая сходится к х0, ибо
последовательность ап выбрана сходящейся к нулю, а в то же
время \f{xn) — yo\^ г, что противоречит предположению.
Следствия. 1. Для того чтобы f(x) не имела предела,
когда х стремится к х0 на I, необходимо и достаточно, чтобы
существовала хотя бы одна последовательность (хп),
сходящаяся к Хо, имеющая х0 точкой накопления и такая, что f(xn)
не сходится.
Так, функция f, определенная условиями /(0) = 0, f (х) = 1/х,
^сли хе]0, 1], не имеет предела, когда х стремится к 0, ибо
для последовательности хп = l/п, сходящейся к нулю,
последовательность f(xn) = n не имеет предела. Однако же
значение / при х = 0 равно нулю.
2. Если f(x) имеет предел у0, когда х стремится к х0, то
этот предел единственный. Ибо если бы имелся еще один,
скажем, у'0¥=у0, то для последовательности (хп), сходящейся к х0,
последовательность (f(xn)) имела бы два различных предела,
у0 и у'0, что невозможно (единственность предела
последовательности, гл. II).
ГЛ. III. ОТОБРАЖЕНИЕ R В R
247
Теоремы о пределах в точке. Определение предела функ^
ции f(x), когда х стремится к x0i при помощи сходящихся
последовательностей делает очевидными свойствами пределов
относительно операций над числовыми функциями, так как они
воспроизводят свойства сходящихся счетных
последовательностей.
1. Если f и g— две действительные функции, определенные
на одном и том же интервале /, и если f(x) и g(x) имеют
предел, когда х стремится к ^е/, то f(x)+g(x)
стремится к сумме пределов, т. е. еслиу0= Нш /(#), z0= limg(A;), то
y0 + z0= lim (f(x) + g(x)).
х-*хь
2. Если а —действительное число, то lim af (x) = a lim f(x).
x->Xa x->Xo
3. lim f{x)g(x)= lim f(x) lim g(x).
4. lim |/(#)| = |lim f(x)\, т. е. если f(x) стремится к y0, то
X->Xo X->Xo
\f(x)\ стремится к \y0\.
5. Предположим, что в точке х0 функция f(x) имеет
предел уофО. Возьмем е<|уо|/2. Тогда можно найти такое ar
что если \х — х0\<а, то |/(л;)— у0\<е. Но неравенства
\f(x) — f/o|<e можно записать в виде у о — г < f (х)< у0 + е.
Если f/o>0, то Уо — е>у0/2у и поэтому для х^]х0 — а, х0 + а[
имеем f(x)>y0/2 > 0. Если у0 < 0, то f/o + e<z/0/2, и f{x)<
< уо/2 для х е ]х0 — а, х0 + а[, т. е. | / (а:) | > | у0 | /2 во всех
случаях при x^]xq — а, х0 + а[. Следовательно, если в точке х$
функция f(x) имеет ненулевой предел, то существуют два
интервала ]*о — OLyXo[ и ]#o, #o + a[, на которых f не обращается
в нуль. На этих интервалах можно рассматривать функцию 1//.
Ограничиваясь этими интервалами, получаем, что если f(x)
стремится к уоФО, когда х стремится к х0, то l/f(x) стремится
II. НЕПРЕРЫВНЫЕ ДЕЙСТВИТЕЛЬНЫЕ ФУНКЦИИ
ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО
§ 1. Определение непрерывности. Первые свойства
непрерывных функций
Первое определение. Числовая функция, определенная на
интервале I из R, называется непрерывной в точке лг0, если f(x)
стремится к f (хо), когда х стремится к лг0.
Это определение означает, что в точке х0:
Г функция f имеет предел у0, когда х стремится к х0\
2° предел #0 совпадает со значением /о, принимаемым
функцией / в точке #о.
^48 КНИГА III. АНАЛИЗ
Если интервал / замкнут слева, т. е. если а е= /, и если f
непрерывна в а, то говорят, что / непрерывна справа в точке а;
в этом случае f(а + 0) = f (а).
Точно так же, если интервал / замкнут справа, т. е. если
бе/, и если / непрерывна в точке 6, то говорят, что
/непрерывна слева в точке Ь\ здесь f(b — 0) = f(b).
Можно, очевидно, определить непрерывность слева или
справа в любой точке х0. Тогда можно сказать, что функция,
непрерывная слева и справа в точке *o, непрерывна в этой точке. Это
определение может быть также сформулировано следующим
образом.
Любому е > 0 можно поставить в соответствие такое ее, что
если худовлетворяет неравенству \х—х0\<а, то \f(x)—/(д:0) |<е.
Как и в определении предела, число а зависит от е, от х0
л, очевидно, от функции f.
Заметим, что здесь уже не нужно исключать точку х0, как
мы должны были делать это в предыдущем разделе (§ 3).
Определение 1. Числовая функция, определенная и
непрерывная в каждой точке интервала /, называется непрерывной
на /.
Разрывные функции. Прежде чем дать другие,
эквивалентные определения непрерывности, мы скажем несколько слов
о разрывных функциях.
Числовая функция f,. определенная на интервале /, разрывна
в точке #o, если она не является непрерывной в этой точке.
Когда говорят, что / разрывна на /, то тем самым хотят
сказать, что найдется хотя бы одна точка, в которой / не будет
непрерывна. Определение разрывности путем логического
отрицания вскрывает непростое явление. Существуют числовые
функции, определенные на интервале / и не являющиеся
непрерывными ни в одной точке из /, иначе говоря, разрывные в каждой
точке. Такова, например, функция f(x) = 0 Для х рациональных
и f(x) = 1 для остальных х. Но даже если / разрывна только в
одной точке #о, ее поведение в окрестности этой точки может
принимать совершенно различные формы, даже если f(x0) вполне
определено. Так, могут существовать' f(x0 + 0) и f(x0 — 0), но
числа f(xo + 0), f(xo-O) и f(x0) могут быть различными;
такова на [—1,+1] функция /(*) = 0 для *е[—1,0[, f(0)-2, и
/(*)= 1 для *€=]0, +1].
Функция f может не иметь ни правого, ни левого предела,
может быть как ограниченной, так и неограниченной. Например,
функция f(xj= 1/х(хФ0)у f(0) = 0 не ограничена. Функция /,
у которой /(0)=0 (или любому другому значению) и f(x) =
= sin l/x для хф 0, ограничена (\f(x) | < 1, если хФО), но, как
легко видеть, любое число из [—1, +1] служит пределом функ-
дии f в некоторой точке из любой окрестности, содержащей точ-
ГЛ. III. ОТОБРАЖЕНИЕ R В R
249*
ку 0: график функции / «сплющивается» в интервале [—1, +1]^
когда х стремится к нулю.
«Наименее разрывными» являются функции, у которых
f(x + 0) и f(x — 0) существуют в каждой точке х^1. Для таких
функций скачком в точке х называют число f(x + 0) — f(x — 0);
это число не учитывает значения f(x) функции / в точке х.
Замечание. Предположение, что f имеет в точке х0
предел справа и предел слева, означает только то, что f(#o + 0)
и f(x0— 0) существуют, и из этого еще не следует, что /(#0+0) =
= / (*о — 0), тогда как допущение о том, что / непрерывна
справа в точке xQi означает существование f(х0 + 0) и равенство
f(xo + 0) = f(xo)\ стало быть, если при этом существует
д*о — 0) и / (х0 — 0) = f (хо), то / непрерывна. Это есть
определение непрерывности в точке лг0, уже приведенное выше.
Второе определение. Пусть f есть числовая функция,
определенная на /, х0 — точка внутри /, у0 = f(x0)—значение f в
точке х0. Если для любого открытого интервала 9', содержащего
точку уо, множество f~l(Q' П/(/)) содержит открытый интервал^
содержащий в свою очередь точку л;0, то f непрерывна в
точке Xq.
Действительно, 8'Г1/(/) есть множество значений f(x)
функции /, лежащих в 6'. Так как по условию f(x0)^Q\ то прообраз
f~l(Q' (]f{I)) множества 9' f)f(I) содержит х0. Допустим, что*
каждый такой прообраз содержит открытый интервал 9,
содержащий х0. Тогда, взяв 9' = ]уо — е, уо + е[, выводим отсюда
существование интервала ]#о —е, x0 + e[cz9, причем f(x)^Q' для
любого х е ]х0 — е, х0 + е[.
Обратное очевидно.
Следующее определение повторяет определение предела при
помощи сходящихся последовательностей.
Третье определение. Функция f непрерывна в точке х0 е /,
если для любой последовательности (хп) в /, сходящейся к
xo,f(xn) стремится к f(x0).
Операции с непрерывными функциями. Из свойств,
доказанных для пределов (разд. I), вытекает, что если / и g — две
числовые функции, определенные на одном и том же интервале /
и непрерывные в одной и той же точке х0 е /, то функции а/„
f + g> fg> 1/1 тоже непрерывны в этой же точке Хо. Тем же
свойством будут обладать и функции /+ и /~, поскольку
t+=\{f+\f\i r-j{/-m>, или r=\{f±\f\).
Точно так же, если / непрерывна в точке х0 и !(х0)Ф0у та
функция 1//, рассматриваемая лишь в том частичном интервале,
содержащем х0у на котором / не обращается в нуль, непрерывна
в точке Хо-
250
КНИГА III. АНАЛИЗ
Заметим, что множество непрырывных функций на одном и
том же интервале образует векторное пространство над R.
Следствия. 1. Постоянная функция на / непрерывна,
функция а:—►а: тоже непрерывна на /, поэтому предыдущие
свойства позволяют утверждать, что функция х-+х2 непрерывна
(непрерывность fg), что функция х-+хп (п— натуральное)
непрерывна на /, что х-+апхп непрерывна на / (непрерывность а/)
г
и что любая полиномиальная функция х —► 2 akXk = Р {%) не-
0
прерывна на /. А так как / — произвольный интервал, то любая
полиномиальная функция (действительного переменного х с
действительными коэффициентами ak) непрерывна на R.
2. Пусть / — функция, определенная на / и непрерывная
в точке х0е/, a g— функция, определенная на интервале /',
содержащем у0 = f(x0). Рассмотрим сложную функцию h = g of.
Предположим, что g непрерывна в точке уо. Тогда, если 9" есть
открытый интервал, содержащий g(yo), то ^(в") содержит
открытый интервал 6', содержащий yo = f(x0). Но поскольку f
непрерывна в точке х0, то f~l(Q) содержит открытый интервал,
содержащий х0. Множество f~l(g~l(&"))> состоит из тех х, для
которых g-(f(*))e=e", а так как g-1(6/,)=) В', то, f-'teT1^"))^
id/-1 (6'). Следовательно, f~l(g-l{G»")) содержит открытый
интервал, содержащий х0. Но hrx — /-1 og-1 (см. Книга I), поэтому
k = gof непрерывна в точке х0. Таким образом, справедлива
следующая
Теорема о сложных функциях. Если f есть числовая
функция, определенная на интервале I и непрерывная в точке х0 е /,
a g — числовая функция, определенная на интервале /',
содержащем точку f/o = /(#o)> и непрерывная в точке у0, то сложная
функция h = g. о / непрерывна в точке х0.
Следствия. Пусть имеется функция х->\/х. Она
непрерывна в любой точке х0Ф0. Чтобы в этом убедиться, мы
должны для любого е>0 найти такое а, что из условия
\ х — х0 \ < а следует неравенство ~- < е. Предположим
I % *о I
вначале, что | х — х01^| xQ |/2; тогда |*0i^2|*|. Если теперь
потребовать, чтобы | х — х0| < е | х0 р/2, то получим | х — х0 | <
< е | хх01, или ■- < е. Стало быть, в качестве а доста-
| X Xq \
точно взять наименьшее из чисел \х0\/2 и -^- е | л:0
Отсюда следует, что если на / функция / не обращается в
нуль и непрерывна, то 1// также непрерывна на /. В частности,
на любом интервале, где многочлен Р не обращается в нуль,
1/Р непрерывна. Следовательно, всякая рациональная функция
непрерывна в любой точке, отличной от полюса.
ГЛ. III. ОТОБРАЖЕНИЕ R В R 251
§ 2. Две основные теоремы о непрерывных функциях
на интервале
В этом параграфе фундаментальную роль будут играть
свойства числовой прямой.
Теорема 1. Пусть I — ограниченный интервал из R, a f —
непрерывная действительная функция на I. Если 5Г есть
замкнутое множество, лежащее в /, то множество f{ST) замкнуто
и ограничено. _
Сначала покажем, что всякая точка накопления множества
f(&~) принадлежит f(&") (гл. II, § 1). Напомним, что f(£T)
есть множество значений /(х), для которых x^$F. Пусть у0 —
точка накопления множества f{ST). Тогда у0 есть предел
последовательности чисел уп, среди которых имеется бесконечно
много различных. Точки уп принадлежат f{&~)\ стало быть, уп
является значением функции /, т. е. существует такое хп^ЗГ, что
!{Хп) = Уп. Имеется бесконечно много различных хп, так как
если бы их было конечное число, то число точек уп тоже было
бы конечно. А поскольку хп лежат на ограниченном интервале/,
то множество, состоящее из хп, ограничено, и значит,- имеет по
крайней мере одну точку накопления х0. Но SF замкнуто,
ал;пеУ; стало быть, x0^!F. Найдется подпоследовательность
[xnk)9 сходящаяся к х0. А так как / непрерывна, то lim f (*ЯЛ) —
= f (хо)> т- е- lim Упь = f (*о)- Но по условию lim yn = у0, значит,
lim уПь = у0. Отсюда следует, что у0 = /(#о), т. е. точка накоп-
/г->оо Л
ления множества f(#~) принадлежит f(&~). Следовательно,
f{!F) замкнуто.
Докажем, что f((F) ограничено. Если допустить, что f(&~)
не ограничено сверху, то найдется последовательность таких
точек yn^f(^)y что, каково бы ни было У, уп>У начиная
с некоторого достаточно большого п. Пусть хп таково, что
f(Xn) = yn- Найдется снова подпоследовательность (xnk)9
сходящаяся к некоторому XiE?". Тогда lim f{xn^ = f {хх), т. е. уч
имеет конечный предел, что противоречит нашему допущению
о том, что Уп может сделаться больше любого числа У. Таким
образом, ЦТ) ограничено сверху. Аналогично доказывается,
что f{ST) ограничено снизу, и значит, оно ограничено.
Эта весьма важная теорема формулируется короче: образ
ограниченного замкнутого мнооюества посредством непрерывной
функции есть ограниченное замкнутое множество.
Следствие. Пусть f есть непрерывная действительная
функция на замкнутом интервале [а, Ь]. Тогда функция f
ограничена и в [а,Ь] существует такая точка а, что /(а)= supf(jt),
и такая точка р, что /(Р) = inif(x).
252
КНИГА III. АНАЛИЗ
В самом деле, образ f([a,b]) интервала [а, Ь] посредством f
есть ограниченное замкнутое множество. Но такое множество
содержит свою верхнюю и нижнюю грани (гл. II, § 3); таким
образом, функция f ограничена, и грани множества f([a,b])
являются значениями / в некоторых точках а и р из [а, Ь], т. е.
/(a)=sup/(x),f(p)==inff(x).
Важные замечания. I. Предыдущий результат может
не выполняться, если интервал, на котором рассматривается f,
не замкнут. Так, функция х-*\/х конечна в любой точке
интервала ]0, 1], но не ограничена. Функция может быть непрерывной
на открытом интервале, быть ограниченной, но ее грани могут
не быть значением функции. Такова функция х->х на ]0, 1[,
которая имеет грани 0 и 1, но они не являются значениями
функции, поскольку эта функция не определена для 0 и 1.
2. Образ открытого интервала при непрерывном
отображении не обязательно является открытым интервалом (в теореме 2
мы докажем, что образ есть интервал*)). Так, функция х—► я2,
определенная на ]—1, +1[, непрерывна и переводит этот
открытый интервал в интервал [0, 1[, замкнутый в 0 и открытый в I.
Теорема 2. Пусть f — действительная функция,
определенная и непрерывная на интервале I из R. Пусть, далее, а и Ь — две
точки из I, а уо — произвольная точка замкнутого интервала
[/(a),f(&)]. Существует по крайней мере одна точка л;0<=/, для
которой f(xo) = уо.
В самом деле, функция х—>f(x)—у о непрерывна, а поскольку
yo^[f(a),f(b)], то одно из чисел f(b) — y,/f{a) — y0 будет
неотрицательно, а другое неположительно. Значит, достаточно
доказать теорему в предположении, что f(a)^C0, f(b)P>0, y0 = 0.
Если f(a)= 0 или f(&) = 0, то теорема очевидна. Предположим,
что f(a) < 0, /(6)>0. Пусть ai = (a + 6)/2. Обозначим через Л
интервал [а, а{], если f(ai) > 0, и интервал [аиЬ], если f(ai)<0.
Тогда на концах интервала 1\ функция f принимает значения
противоположных знаков. Продолжая этот процесс, получим
последовательность таких интервалов /п длины (b — a)/2n+1, что
1п :э /n+i при любом п. Концы ап, а'п интервалов /п образуют
последовательность, сходящуюся к некоторой точке Xq, а так как
функция непрерывна, то f(an), f(a'n) стремятся к /(*0). Можно
считать, что f (an) <0, f {cQ > 0, поэтому lim f (an) < 0, lim / {а'Л >
Л->оо Я->оо
> 0, откуда f (х0) = 0.
Эта теорема формулируется также следующим образом:
непрерывная на интервале числовая функция при переходе от од-
ного значения к другому принимает все промежуточные
значения.
*) Промежуток.
ГЛ. III. ОТОБРАЖЕНИЕ R В R 253
Но более важным является следствие из этой теоремы.
Следствие. Образ интервала посредством непрерывной
действительной функции есть интервал.
Действительно, если f постоянна, то образом служит одна
точка, т. е. (замкнутый) интервал. Предположим, что / не
постоянна. Возьмем две произвольные точки a'=*f(a)t b' = f(b)
из /(/). По предыдущей теореме любая точка, заключенная
между я' и Ь\ тоже является значением f, а стало быть,
принадлежит /(/). Следовательно, множество /(/) обладает тем
свойством, что если оно содержит две точки а' и Ъ', то оно
содержит и замкнутый интервал [а\ У]. А это, как известно (гл. II,
§ 3, теорема 3), есть характеристическое свойство интервала.
Замечание. В формулировке следствия мы не
предполагали, что интервал / ограничен. Он может составлять и всю
прямую /?, для которой этот факт выражается в том, что
непрерывная числовая функция на R переводит R в интервал.
§ 3. Равномерная непрерывность
Определение равномерной непрерывности. Говорят, что
числовая функция /, определенная на интервале /, равномерно
непрерывна, emu для любого г > О можно указать такое число а,
что если \х — х'\<а, то \f(x) — f(x') \ < е.
Иными словами, это означает, что если мы выберем
произвольно две точки в /, лишь бы расстояние между ними было
достаточно мало, то разность значений функции / в х и в х' тоже
будет сколь угодно мала.
Свойство равномерной непрерывности влечет непрерывность
в каждой точке, поскольку можно считать, что, например,
х' = х0 фиксировано. Обратное же неверно; так, функция а: —> 1/л:
на ]0, 1] будет непрерывной, но не будет равномерно
непрерывной.
Непрерывность функции / в каждой точке ограниченного
замкнутого интервала влечет равномерную непрерывность. Это
свойство выражается теоремой, которая доказывается сразу,
если применить теорему Бореля — Лебега.
Теорема. Действительная функция, непрерывная на
ограниченном замкнутом интервале [а, Ь], равномерно непрерывна
на нем.
В самом деле, пусть е > 0. Каждому х е [а, Ь] можно
поставить в соответствие такое положительное число а(е, я), что если
х' <=]х — а,х + а[, то |/(*) — /(*') I < е/2. (Для концов
необходимо оговорить, что х' принадлежит [а, Ь]).
Тогда замкнутый интервал [а, Ь] будет покрыт открытыми
интервалами ]х — ос, х + а[. Следовательно, существует конечное
254
КНИГА III. АНАЛИЗ
число этих интервалов |
]xk-aky xk + ak[ (& = 1, 2, ..., п), \
покрывающих [а, Ь]. Обозначим их через 1к. 1
Любые два из этих интервалов h либо не имеют общих то- |
чек, либо имеют в пересечении открытый интервал. Рассмотрим I
все точки разбиения интервала [а,Ь\ произведенного концами
интервалов /&, и пусть а — длина наименьшего из вновь
полученных интервалов. Если x,xf — такие две точки из [а, Ъ\, что
\х — х'\ < а, то х и х' принадлежат одному h или двум Ikl
имеющим общий конец, и тогда
\f(x)-f(x')\<\f(x)-f(xk)\ + \f{xk)-f{x')\<e.
Итак, любому е > 0 поставлено в соответствие такое не
зависящее от х число а, что если \х — х'\<а, то \f(x) — f (х') \ < е.
Следовательно, f равномерно непрерывна. }
Колебание. Если f непрерывна на [а, Ь], то колебанием
функции f на [а, Ь] называется положительное или равное нулю число
sup f(x)— inf f (x). Его обозначают со (/, а, й) или со (f).
х е [a, b) xe [a, b]
Заметим, что если/ непрерывна на [a, ft], то sup f{x) =
х «ее [а, Ь]
= sup f(x)> и то же самое для inf f(x).
По предыдущей теореме можно разбить [а, Ь] на конечное
число замкнутых интервалов так, чтобы для х и #',
принадлежащих одному из этих интервалов, которые мы обозначим
через /*, выполнялось неравенство \f(x) — /(#')!< е. Стало быть,
и ®{f> /£)<e. Итак, в каждом интервале колебание функции f \\
будет меньше е.
III. МОНОТОННЫЕ ФУНКЦИИ ,
I
§ 1. Монотонные функции f
Понятие монотонной действительной функции использует
понятие порядка в R. Оно обобщает понятие монотонной последо- |
вательности, которая является монотонной функцией натураль- ||
ного п. Ц
Определение. Пусть f — числовая функция, определенная на §1
интервале I. Говорят, что f возрастает на /, если f(x)<Cf(x') ||
для любых х<х' из I. *|
Она называется строго возрастающей на /, если f(x)<f(x') I
для любых х<х' из /.
Она называется убывающей на I (соответственно строго
убывающей на /), если /(*)> f(x') (соответственно f(x)> f(x/)) для
любых х <х' из I.
ГЛ. III. ОТОБРАЖЕНИЕ R В R
255
Функция, обладающая на / одним из этих четырех свойств,
называется монотонной (на /). Монотонная на / функция либо
возрастает, либо убывает, и этот термин употребляется всегда,
когда не требуется уточнить, возрастает / или убывает.
Определение сводится к утверждению, что /, скажем,
возрастает, если для х>х' имеем f(x)^f(x'), и значит, xf — x и
/(#') — f(x) имеют одинаковые знаки; f убывает, если х' — х
и f(x') — f(x) имеют противоположные знаки.
Так как предполагается х Ф х\ то для установления
возрастания или убывания / можно использовать отношение
- I * > если Z / ^ Q> T0 f возрастает; если
f (х\ _ f (х'\
" - ' ^Q> то / убывает. Такая запись полезна в связи
с определением производной.
Операции с монотонными функциями. Свойства монотонных
функций, относящиеся к алгебраическим операциям с
числовыми функциями, будут не так просты, как для непрерывных
функций (разд. II, § 1).
Прежде всего заметим, что если /, к примеру, возрастает на
интервале /, то она возрастает на любом интервале /' с= Л
Если f и g обе возрастают на /, то / + g возрастает на /, так
как если
Ж^Ш1>0 и *(«)-*<*) >0>
х — х' ^ х — х' ^ '
то для любых х, xf е /
/(*)-/(*') , g(x)-g(x') _ f(x) + g(x)-(f(x') + g(x')) ^л
х-х' ^ х-х' ~ х-х' ^и'
Если fug обе убывают, то f + g убывает.
Эти результаты, в частности, верны, если одна из функций
постоянна.
Если / возрастает, то.—f убывает, ибо
rf (*)-(-/(*0) __ f(*W(*0
х — х' х — х' "
Если / убывает, то —/ возрастает.
Вообще, если / возрастает (убывает) и если а
—неотрицательное действительное число, то af возрастает (убывает). Если
жеа40, то / убывает (возрастает).
Если /\>0, g">0 возрастают, то fg тоже возрастает.
Если / и g монотонны (без дальнейшего уточнения), то из
этого нельзя заключить, что f + g монотонна.
Так, функция f(x) = x на [—1,+1] возрастает; функция g,
определенная на [—1, +1] равенствам g(x)= О, если х^[—1,0],
я ё(х) = — 2*> если х €5 [0, 1], убывает. Но f (х) + g(x) = х, если
256
КНИГА III. АНАЛИЗ
xg[-1,0], и f(x) + g(x) = — xy если х^[0, 1]; следовательно,
f + g не монотонна (она возрастает на [—1,0] и убывает на
[0,1]).
Если, к примеру, обе функции / и g возрастают, то из этого
нельзя заключить, что произведение fg монотонно. Так, возьмем
f(x)=:g(x) = x на [—1,+1]. Имеем f{x)g(x) = х2, но функция
fg убывает на [—1,0] и возрастает на [0, 1].
Если / строго положительна (или отрицательна) и
возрастает (убывает) на /, то 1// убывает (возрастает), так как
_j l_
fix) f(*') = 1 /(*')-/(*)
х-х' f(x)f(x') • х-х' э
а произведение /(#)/(*')> 0.
Замечание. Можно определить понятие возрастающей
функции на произвольном подмножестве Е из R\ для этого в
определении достаточно указать, что х к х' ^Е. Тогда на
основании этого замечания можно показать, что если / строго
возрастает на /, a g возрастает (убывает) на интервале /',
содержащем f(/), то сложная функция g.°/, возрастает (убывает)
на /. Действительно, х < х' влечет f(x)<f(x') при любых
х, х' е/. А так как g возрастает (убывает), то g(f(x))^Cg(f(x'))
(соответственно g (f (x)) > g (f (x'))).
Примеры. 1° Постоянная функция на / монотонна. Она
может рассматриваться равным образом и как возрастающая,
и как убывающая. Обратно, если f одновременно возрастает
и убывает на /, то она постоянна. В самом деле, пусть х0
фиксировано; для любого х Ф х0 имеем
f(x)-f (*о) ^ q и f(x)-f(x0) <Q
X — Xq X — Xq
Следовательно, / (х) — f (х0) = 0, и значит, f (х) = /(#о), при всех
х, т. е. все значения f(x) между собой равны.
2° Пусть п — натуральное число; рассмотрим функцию f(x) =
= хп на [0, + оо[. Из тождества хп — х,п =^= (л; — х') (хп~1 + ...
... + х'п~1) вытекает, что если л; и я' оба неотрицательны, то
-—V>o.
X — х' ^
Стало быть, функция х—>хп возрастает на [0, +оо[.
Рассмотрим теперь функцию f(x)=xn на ]—оо,0]. Если п
четно, то f(—х) = /(*), а если п нечетно, то f(—x) = —f(x).
Следовательно, f убывает на ]—оо,0], если п четно, и
возрастает, если п нечетно.
ГЛ. III. ОТОБРАЖЕНИЕ R В R
257
Грани монотонной функции. Пусть /—функция, определен-
ная на / и, к примеру, возрастающая. Если интервал / не
замкнут справа, то /, вообще говоря, не будет ограниченной сверху.
Так, функция я-* 1/(1—х) на [0, 1[ возрастает, но не
ограничена сверху.
Напротив, если f возрастает на I и интервал I замкнут
справа, то f ограничена сверху на I.
Действительно, пусть Ь есть правый конец интервала /,
a f(b) — значение f в точке бе/. В силу возрастания
функции f для любого другого значения f(x) функции / имеем
f(x)<f(b).
Точно так же, если f возрастает на I и интервал I замкнут
слева, то f ограничена снизу на I.
Следовательно, если / монотонна на замкнутом интервале,
то она ограничена.
Замечание. Если f определена и монотонна на открытом
интервале /, то на любом замкнутом интервале I' a I функция
/ будет снова монотонна, а значит, и ограничена на /' (хотя
на / не обязательно ограничена).
Разрывы монотонной функции. Мы покажем, что монотонная
на интервале / функция f непрерывна в большинстве точек.
Точнее, множество точек интервала I, в которых f разрывна,
счетно (Книга II, гл. I, § 3).
Допустим, например, что f возрастает. Сначала покажем,
что в каждой точке х0^1 существуют f(x0 — 0) и f(x0 + 0),
т. е. предел слева и предел справа. Достаточно показать, что
существует f (х0 — 0).
Пусть (хп)—возрастающая последовательность точек из /,
стремящихся к х0. Поскольку f возрастает, то
последовательность (f(xn)) тоже возрастает. Но тогда f(xn)^f(x0) при
любом п. Следовательно, по теореме о монотонных
последовательностях (f(xn)) имеет предел X^f(x0). Покажем, что f(x)
стремится к К когда х стремится к х0 слева. Действительно, для
любого е > 0 можно найти такое целое Р(е), что если п > Р(е),
то хР < хп < х0 и Я — f(xp) < е. Пусть а = х0 — хР. Тогда если
хо — х < а, то Я — f(x)<s, так как / возрастает.
Стало быть, если / монотонна на /, то в каждой точке #о <= /
существуют f(xo + 0) и f(x0 — 0) (если х0 есть конец
интервала /, то можно рассматривать только один из этих
пределов).
Теперь будем изучать разрывы и вначале предположим, что
/ = [а, Ь] замкнут. В точке х, где / разрывна, существуют f(x — 0)
и /(# + 0), и каково бы. ни было х, f(a)Kf(x — d)^f(x)*C
^f{x+0)^f(b). Вообще пусть имеются р точек Xi02< ... <хр
из /; тогда f(a)<f(x[-0)<f(xl)<f(xl+0)<f(x2-0)<
<f(x2)<f(x2 + 0)<...<f(b)% Положив sh = /(.vA + 0) —
9 Ш. Пизо, М. Заманский
25В книга ш. анализ
— f(xk— 0) (что составляет скачок в точке а:^),. получаем
f(b)-f(a)-f{b)-f{xp + 0) + f(xp + 0)-f{xp-0) +
+ f(xp-0)-f(xp-l + Q) + f(xp-l + 0) + f(xp-l-0)+ ... -f(a) =
= f(b)-f(xp + 0) + sp + f{xp-0)-f(xp-x + 0) +
+ sp-i + ... +f(*i-0)-f(a),
а так как
f(ft)-/(*P + 0)>0, /(xp-0)-f(xpM + 0)>0, ....
TO
/(ft)-/(fl)>Sp + Sp-1+ ,.. +Sle
Следовательно, сумма какого угодно конечного числа
скачков не превосходит f(b)— f(a). Стало быть, имеется конечное
число скачков, превышающих 1 (иначе, взяв достаточно большое
число таких скачков, мы получили бы, что их сумма превосходит
f(b) — f(a). Точно так же имеется конечное число скачков,
заключенных между 1 и 1/2 (1/2<5^1), конечное число
скачков, заключенных между \/п и 1/п + 1, ... Итак, скачков
оказывается не более чем счетное множество; столько же и
соответствующих точек х.
Но в точке х, где f не имеет скачка, f(x + 0) и f(x — 0) будут
равны, и значит, / непрерывна в этой точке. Таким образом,
любая монотонная функция на замкнутом интервале I
непрерывна во всех точках, кроме, быть может, счетного множе-
жества точек.
После этого переходим к случаю, когда / = ]а, Ь[ — открытый
интервал. Рассмотрим последовательность замкнутых
интервалов 1п = [tfn> bn], где Ьп возрастает и стремится к Ъ, ап убывает
и стремится к а. В каждом 1п функция f имеет не более чем
счетное множество разрывов. А так как счетное объединение
счетных множеств счетно, то получаем следующий результат.
Любая монотонная функция на интервале I непрерывна во
всех точках, кроме, быть может, счетного множества точек.
§ 2. Непрерывные монотонные функции. Расширенная
прямая
Мы видели (разд. II, § 3, следствие теоремы 2), что
непрерывная функция f на / переводит интервал / в интервал. Если /
Замкнут, то f(I) тоже замкнут. Но если I открыт, то интервал
/(/) может и не быть открытым. Интервал /(/) будет открытым,
если кроме непрерывности предполагается, что / строго
возрастает или убывает (пример функции, f (х) = 1 на ]а,Ь[
показывает, что одного предположения монотонности недостаточно).
Действительно, пусть / определена на интервале /,
непрерывна и, к примеру, строго возрастает. Тогда f осуществляет взаИхМ-
ГЛ. III. ОТОБРАЖЕНИЕ R В R
259
но однозначное отображение / на интервал /(/), ибо если х и
х' е / и если х ф х', то f(x) ф f(x'), поскольку/ строго возрастает.
Пусть /_1 — обратная функция, т. е. если у = f(x), то /_1
определена как x = f~i(y) для любого #<=/(/). Очевидно, что /-1
тоже строго возрастает.
Пусть ]а, р[ — открытый интервал в /; тогда /(]ос, р[) будет
интервалом. Если */е=/(]а, р[), то / (а) < у < /(Р); но /
непрерывна, и потому, когда х стремится к р слева (соответственно к а
справа), то y = f(x) стремится к /(р) (соответственно к /(a)).
Следовательно,/(а) и /(р) являются концами интервала / (]ос, р[),
но ему не принадлежат.
Таким образом, любой открытый интервал из / переходит
в открытый интервал. Согласно второму определению
непрерывности обратная функция /_1 непрерывна на /(/).
Итак, справедлива следующая
Теорема 1. Если / — действительная функция,непрерывная
и строго возрастающая на интервале I, то обратная функция /~*
непрерывна и строго возрастает на интервале /(/).
Говорят, что такая функция / осуществляет между I и /(/)
взаимно однозначное и взаимно непрерывное соответствие, или
преобразование; в этом случае f называется гомеоморфизмом,
а интервалы I и /(/) —гомеоморфными.
Теорема 2. Для того чтобы непрерывная функция f
осуществляла гомеоморфизм между двумя интервалами I и J из /?,
необходимо и достаточно, чтобы / была строго монотонна на I
и чтобы /(/) = Л
В самом деле, достаточность только что была показана. Для
доказательства же необходимости предположим, что /, будучи
непрерывной, не монотонна. Следовательно, найдутся по крайней
мере три таких значения а < b < с из R, что f(b) не будет
заключено между f(a) и f(c). Допустим, к примеру, что f(b)^f(a)
и f(b)^f(c). Так как преобразование взаимно однозначно,
то /(а) Ф /(с). Допустим, что / (с) <f(a). Имеем также !(Ь)Ф[(а)
и, значит, f(c)<f(a)<f(b). Но из непрерывности / вытекает,
что существует такая точка a', b <а' < с, что \{а!) = f(a). А так
как а' Ф а, то это противоречит взаимной однозначности. Стало
быть, необходимо, чтобы / была монотонна.
Предыдущая теорема позволяет нам ввести —оо, +оо, и
после добавления этих элементов к R мы получим множество R,
которое будет обладать тем свойством, что всякое бесконечное
множество имеет точку накопления (тогда как на R теорема
Больцано — Вейерштрасса требует, чтобы это множество было
еще и ограниченным); но надо будет расширить понятие точки
накопления.
Пусть ] a, b [ — ограниченный открытый интервал из R.
И пусть / есть действительная функция, определенная формулой
9*
260
КНИГА III. АНАЛИЗ
/ (х) = — ( х_а + ь ) для а <х<Ь. Функция /, будучи суммой
двух непрерывных функций, непрерывна. Она строго возрастает,
поскольку функции Х'—^х — а и х\—>х— Ь строго возрастают на
]а, Ь[ и не обращаются в нуль. Следовательно, функции
jch->—-.—, х+->——г- строго убывают, их сумма тоже строго
убывает, и стало быть, #»—> — (— 1——А строго возрастает.
Наконец, легко убеждаемся в том, что для любого y^R
найдется такое х е]а, Ь[, что у = f(x).
Следовательно, f(]a, b[) = R. Значит, эта функция f переводит
взаимно однозначно и взаимно непрерывно открытый интервал
]atb[ в R. Таким образом, любой открытый
интервал из R гомеоморфен R.
При таком гомеоморфизме отношения
порядка согласуются, т. е. если х есть точка
из R, а {• — ее образ в ]а, 6[, то в принятых
обозначениях имеем
Точно так же, если (хп) есть
последовательность, сходящаяся в R к х е /?, то
последовательность образов (gn) ^:ть
последовательность, сходящаяся в / = ] a, b [ к об-
Рис. 13. разу I точки х (рис. 13). Разумеется, этого
уже не будет для алгебраических свойств,
ибо даже если х + х* принадлежит /?, то сумма \ + |7 образов
в / точек х и х' может и не принадлежать /. Можно образно
сказать, что понятия порядка и топологии переносятся из / в R и
из R в /. Мы интуитивно понимаем, что во множестве R точка
может бесконечно удаляться вправо и влево; в соответствии
с этим на интервале / мы должны рассматривать а и b как
элементы, не принадлежащие / (если / открыто), а находящиеся
«очень далеко» слева и справа. Если мы добавим к / точки а и 6,
то получим замкнутый интервал / = [a, b].
По аналогии мы добавим к R два элемента, которые
обозначим через —оо и +оо. По определению, каково бы ни было д:е
^/?, —oo<#<+oo, элемент +оо будет служить пределом
для любой неограниченной возрастающей последовательности,
а —оо — пределом любой неограниченной убывающей
последовательности. Полученное таким способом множество называется
расширенной прямой и обозначается R.
Взяв в качестве / только что рассмотренную функцию,
положим f(a) =—оо, f(b) = +оо; эта функция, дополненная таким
путем, осуществляет взаимно однозначное отображение [a, b] на
ГЛ. III. ОТОБРАЖЕНИЕ R В R
261
R. Обратное отображение^-1 = g продолжается до взаимно
однозначного отображения R на [а, Ь],
После этого условимся считать, что +оо есть точка
накопления любого немажорированного множества в R, а —оо — точка
накопления любого неминорированного множества в /?. Тогд£
справедливо утверждение, что всякое бесконечное множество в R
имеет хотя бы одну точку накопления,.
1. Алгебраические операции в_#. Алгебраические свойства
множества R не продолжаются в R.
Условимся для любого хе/?, что х + ( + оо) = +оо, х +
+ (—оо) = —оо, но +оо — оо не имеет смысла; следовательно,
в R сумма х + у не имеет смысла, когда х = + оо, у = — оо.
Если л;<= /? и х > О, то условимся, что *•(+<»)= + оо,
а если х < 0, то х- ( + оо) = — оо, но 0- (Ч-оо) или 0- (—оо) не
определено. В частности, имеем
_(+оо)=-оо и (+оо)(+оо)= + оо, (+ оо)(— оо)= — оо.
2. Грани и пределы последовательностей в R. Каково бы ни
было ^Gft имеем —оо ^л;^ + оо. Стало быть, в R всякое
множество ограничено.
Придадим смысл выражению: последовательность
действительных чисел хп стремится к +оо (или —оо), когда п
стремится к бесконечности. Будем говорить, что хп стремится к +оо,
когда п стремится к +оо, если любой интервал ]а, +оо[
содержит все хп, кроме конечного их числа. Это определение
эквивалентно следующему: каково, бы ни было действительное
число а (в частности, сколь угодно большое), найдется такое целое
Р (а), что если п > Р{а), то хп > а. Точно так же определяется
выражение: хп стремится к —оо, когда п стремится к +оо.
В этих случаях пишут
lim хп = + оо или lim хп = + оо (или lim хп = — оо).
Л->+оо
Если Нтл;п =хей и Нтуп = +оо (соответственно —оо), то
l\mxnyn = +оо (соответственно —оо), если х > 0, и limхпУп =
= —оо (соответственно +оо), если х < 0; а если х = 0, то хпуп
может не иметь предела.
Если l\mxn = +оо, то lim l/xn = 0, так как для п>Р(а)
имеем хп > а, и значит, \/хп < 1/а, а поскольку а произвольно,
то в качестве е > 0 можно взять число 1/а. Если limxn = —оо,
то lim(—хп) = +оо, так как хп > а эквивалентно —хп <—а;
значит, как бы велико ни было а > 0, все хп, кроме конечного
числа, таковы, что —хп < —а. Стало быть, снова имеем
lim 1/хп = 0. Таким образом, Птл;п = +оо или limxn = —оо
влечет lim \/хп = 0. Отметим, что limxn=—оо влечет Пт|л:п| =
262
КНИГА III. АНАЛИЗ
= -f-oo, но обратное неверно (пример: Х\ = 1, х2 = —2, лг3 =
= 3, х4 = — 4 и т.д.).
Точно так же, если хп стремится к нулю, то отсюда не
следует, что lim \jxn = +оо или —оо. Однако если хп > 0 и хп
стремится к нулю, то lim l/xn = + оо; если же хп < 0 и хп
стремится к нулю, то lim l/xn = —оо.
Допустим, например, что lim хп = х, где х > 0 и х е R> и что
limyn = +оо. Тогда для всех целых я, кроме конечного числа,
имеем хп > х — е > 0, где е выбрано достаточно малым
(например, е = х/2). Следовательно, хпуп > (л; — г)уп. А поскольку
уп стремится к +оо, то для всех индексов, кроме конечного
числа, будет выполняться неравенство уп>а/(х — е), где а>0
задано; стало быть, для всех индексов, кроме конечного числа*
*пУп >{*-е)Уп> а.
Следовательно, \\тхпуп = оо. Если же хп стремится к 0, а уп
стремится к +оо, то хпуп может не иметь никакого предела
в R. Действительно, возьмем уп = п, х2р = 1/2р, х2р+\ = 0; ясно*
что limxn = 0; но хпуп = 1, если п = 2р и хпуп = 0, если п =
= 2/7+1.
Применение предыдущих результатов позволяет в некоторых
случаях выяснить, имеет ли предел выражение хп/уп. Например*
если хп стремится к +оо, а уп > 0 стремится к 0, то хпуп
стремится к +оо. Однако в каждом случае требуется проводить
специальное исследование.
3. Грани и пределы функций применительно к R. Теперь мы
придадим смысл таким выражениям, как «f(x) стремится
к +оо, когда х стремится к х0», или «f(x) стремится к +оо,
когда х стремится к +оо», или «/(я) стремится к z/0, когда х
стремится к +оо», а также выражениям, полученным из
предыдущих заменой +оо на —оо.
Определение, которое последует, повторяет первое и второе
определения (разд. I, § 1).
Говорят, что: 1) f(x) стремится к +оо, когда х стремится
к jc0e/?, если для любого открытого интервала ]а, +оо[
существует такой открытый интервал ]х0 — а, х0 + а[, что если х е
е ]х0 — а, х0 + а[, то f (х) е= ]а, + оо[;
2) f(x) стремится к + оо, когда х стремится к +оо, если для
любого открытого интервала ]а, +оо[ существует такой
открытый интервал ]а, +оо[, что если х е ]а, +оо[, то f(x) e
<=]а, +оо[.
3) [(л:) стремится к y0^R, когда х стремится к +оо, вела
для любого открытого интервала ]у0 — а, г/0 + 4 (я > 0) суце-
ствует такой открытый интервал ]а, +оо[, что если х е ]а, +оо[^
то f(x) еЕ]г/0 —я, |/о + я[.
ГЛ. III. ОТОБРАЖЕНИЕ R В R
263
Когда в каком-нибудь из этих определений + оо заменяется
на —оо, то ]а, +оо[ заменяется на ]—оо, а[у а ]сс, + оо{ на
]—оо, а[. >
Заметим, что если дл;) стремится к +оо, когда х стремится
к Хо, к +оо или к —оо, то при тех же условиях —f(x)
стремится к —оо.
Эти определения могут быть выражены при помощи
неравенств. Так, первое из трех предыдущих определений
формулируется так: f(x) стремится к +оо, когда х стремится к Хо,
если, каково бы ни было ое^, найдется такое а е R, что для
!# —л:0| <а имеем f(x) > а; второе выглядит так: f(x)
стремится к +оо, когда х стремится к +оо, если, каково бы ни
-было flsi?, найдется такое а е R, что для х> а имеем f(x) >
> а, и т. п.
Важные замечания. Г Определение 1) имеет смысл
.лишь в том случае, если / определена на интервале,
содержащем Хо\ определения 2) и 3) имеют смысл только тогда, когда
/определена для любого значения х из /?, превосходящего
некоторое число р.
2° Число а в определениях 2) и 3) зависит от а.
Обозначения. В соответствующем случае пишут
Iim/(*H + oo, Hm /(*)=+оо, iim f(x) = y0,
lim /(*)= - оо, lim /(*)=--оо, Hm /(*)= +оо,
lim f(x)= -оо, lim f(x) = y0.
Х-> — оо Х->— оо
Обобщение. Рассмотрим функцию, определенную на R как
f(x) = 1/х (х ФО), /(0) == 1. Когда х стремится к нулю, нельзя
сказать, стремится ли f(x) к +оо или —оо, ибо если п —
натуральное, то f(l/n) стремится к +оо, a f(—\/n) стремится к — оо,
когда п стремится к бесконечности. Таким образом, здесь
необходимо различать случай, когда х стремится к нулю справа, и
случай, когда х стремится к нулю слева. Будем говорить, что
f(x) стремится к +оо, когда х стремится к х0 справа
(соответственно слева), если для любого открытого интервала ]а, +оо[
существует такой открытый интервал ]х0, х0 + а[, а > 0
(соответственно ]х0 — а, #о[), что если х<=]х0у х0 + а[ (соответственно
]#о — а, х0[), то f(x) е]а, +оо[. В случае, когда f(x) стремится
к —оо, определение аналогично.
Сформулированное нами определение означает также
следующее: f(x) стремится к +оо, когда х стремится к х0 справа,
если, каково бы ни было а <= /?, найдется такое а е R, что для
*о < х < х0 + а имеем f(x) > а. При этом может оказаться, что
/(#), определенная на интервале, содержащем х0, стремится,
264 КНИГА III. АНАЛИЗ
например, к + оо, когда х стремится к х0 справа, и f (x)
стремится к —оо, когда х стремится к х0 слева; такова функция /(#) =
= 1/х в точке Хо = 0.
Свойства. 13 формулировках, которые последуют ниже, х0
есть точка из R, т. е. xq может быть конечным числом, + оо или
—оо. Эти формулировки справедливы также при замене слов
«... когда х стремится к х0» словами «... когда х стремится к х0
справа» или «... когда х стремится к х0 слева».
Очевидно, если лг0 = +оо (соответственно —оо), то имеет
смысл только выражение «... когда х стремится к +оо слева»
(соответственно к —оо справа). Мы предполагаем, что fug
определены на интервале, содержащем х0.
Если f(x) стремится к +оо и g(x) стремится к -foo, когда х
стремится к х^ то
Г f{x) + g(x) стремится к +оо.
2° of(х) стремится к +оо, если сое/? и со > 0, и к —оо,
если со е R и со < 0.
3° f(x)g(x) стремится к +оо.
4° \/f(x) стремится к 0.
Действительно, предположим, что для любого а и любого Ь
найдутся такие аир, что если х е ]х0 — а, Хо + а[, то f(x) e
е]а, +оо[, а если х^]х0 — р, х0 + р[, то f(x) e ]6, +оо[ (мы
предполагаем х0 конечным). Пусть у — наименьшее из а и Р;
если х<=]х0 — у, х0 + у[у to f(x) + g(x) <=]а + 6, +оо[. А так
как а и Ь произвольны, то любому с соответствует такое у, что
если х<=]х0 — у, х0 + y[> to f(x) + 8(х) е1с> +°°1
Когда х0 = +оо, то ^£]а, +оо[, х е ]р, +оо[, и в качестве
Y можно взять наибольшее из а, р.
Если /(х)е]а, +оо[ и (о>0, то cof(x) <=]асо, +оо[; если
со < 0, то <о/(л;) g]—оо, асо[. Отсюда следует свойство 2°.
Если f(*)€=]a, +oo[ и g(x) €=]Ь, +оо[, то /(*)£(*) е=
е]ай, +оо[, если а > 0 и Ь > 0. А это доказывает 3°. Можно
также вместо записи f(x)e]a, +oo[ пользоваться записью
f(x) > аи т.д.
Свойство 2° влечет, что если f(x) стремится к +оо
(соответственно —оо), то —f(x) стремится к —оо (соответственно
.+ оо).
Отсюда выводится, что если f(x) и g(x) стремятся к —оо,
то f{x) + g{x) стремится к —оо, af(x)— к —оо при со > 0 и
к +оо при со<0, f(x)g(x) стремится к +оо; и что если f{x)
стремится к +оо или —оо, то \f{x)\ стремится к +оо.
Что же касается свойства 4°, то если f(x) стремится к +оо
(соответственно — оо), когда х стремится к х0, то существует
такой интервал / ^содержащий х0, если х0 конечно, или
имеющий Хо концом в 7?), что если х£/, то Д#)>а>0
(соответственно f (х) < а < 0), и значит, \f{x)\ > \а\ > 0. Следователь-
ГЛ. III. ОТОБРАЖЕНИЕ R В R
265
но, 1// определена на / и ll\f(x)\ < 1/|а|. Стало быть, если х
стремится к х0у то l/\f(x) | стремится к нулю.
Замечания. Г Если f(x) стремится к +00, a g(x) к —оо,
когда х стремится к х0, то относительно f (x) + g(x) ничего
утверждать нельзя (но в то же время f(x) —g(x) стремится
К +оо).
2° Если |/(*)| стремится к +оо, то можно только
утверждать, что f не ограничена.
3° Если />0 стремится к 0, то 1// стремится к +оо.
4. Верхний и нижний пределы последовательности в R (ср.
разд. I, § 2). Понятие верхнего или нижнего предела
последовательности хп действительных чисел может быть обобщено
путем придания смысла записи limxn= + оо или Итл;п= — оо.
Мы ограничимся несколькими краткими указаниями.
Если последовательность (хп) ограничена сверху, то
верхний предел для этого случая уже был определен (разд. I, § 2).
Если же (хп) не ограничена сверху, то в (хп) найдется
подпоследовательность {хПк), которая стремится к +оо, когда
Устремится к бесконечности; в этом случае положим \\тхп= + оо.
Ограничимся следующими свойствами.
Г Если {хп) — неотрицательная последовательность, а
(^п) — строго положительная последовательность, сходящаяся
к числу Ь > О, то lim хпуп = (Hm xn) (lim уп).
Достаточно доказать^ это свойство для случая lim хп = + оо
(разд. I, § 2). Если Ппися«= + оо, то найдется такая
подпоследовательность (xnk), что \imxnk= + оо. Но тогда в силу того,
что уп>0, хп>0, 6>0, имеем
lim х у = + оо = (+ оо) Ъ = (lim xn) (lim уп).
2° Если{уп) — сходящаяся последовательность,то 1\т(хп+уп)~
= Hm хп + lim уп. Действительно, если Нтд:п= + оо, то найдется
такая подпоследовательность (хп\ что lim л:Л. = + оо. Так
как уп сходится, например, к числу Ь, то
lim УПь = &> ,lim (xnh + УЛь) = + оо = + оо + Ь = Шхп + lim уп.
IV. СТУПЕНЧАТЫЕ ФУНКЦИИ
Ступенчатые функции являются числовыми функциями.
В этом разделе мы будем изучать ступенчатые функции на
замкнутом интервале [а, Ь] из R. Важность этих функций
обусловлена использованием их в большей части курса анализа.
Действительно, мы увидим после определения равномерной
266
КНИГА III. АНАЛИЗ
сходимости, что непрерывные функции и монотонные функции
представляют собой равномерный предел ступенчатых функций.
Ступенчатые функции играют фундаментальную роль во всех
разделах, касающихся интегрирования. Отметим, что
ступенчатые функции могут быть определены на любом множестве, а
нетолько на замкнутом интервале из R. Кроме того, ступенчатые
функции на [а, Ь] не будут, вообще говоря, непрерывными или
монотонными. Следовательно, они выглядят более общими, чем
непрерывные или монотонные функции.
§ 1. Определение и свойства ступенчатой функции
на интервале [а, 6]
Пусть имеется замкнутый интервал / = [а, Ь] из R.
Рассмотрим конечное возрастающее множество таких точек ао, аь
..., ссп из /, что ао = а, ал < ал+ь ап = ^ Тогда [а, Ь] =■
п-1
= (J [afe, otft+i].
Каждому открытому интервалу ]а&, аи+\[ поставим в
соответствие конечное действительное число /*. И, наконец, определим
числовую функцию ф на /
следующим образом: если
х е ] aft, ah+iL T0 положим
ф(х)=4; кроме того,
зададим как-то значения ф(а&).
Определенная таким путем
функция ф постоянна на
каждом открытом
интервале ] a*, aft+i [, причем
объединение замкнутых
интервалов [aft, afc+i] составляет
[atb] (рис. 14).
Определение. Пусть [a, b]
— ограниченный замкнутый
интервал из R. Ступенчатой функцией на [а, Ь] называется,
любая числовая функция ф, для которой [а, Ь] может быть
разбит на конечное число интервалов, внутри которых ф имеет
постоянное значение.
Прокомментируем это определение и укажем основные свойт
ства ступенчатой функции.
1. Ступенчатая функция ф на [a, b] принимает лишь конечное
число значений; это будут /i, 4, ..., К и <p(at), ..., <р(ап).
Обратное же неверно. Так, уже упоминавшаяся функция /,
определенная как f(x) = О, если х рационально на [0, 1], и {(х) = 1
для остальных х из [0, 1], принимает только два значения, 0 и 1»
а=*о *i *г ** аы *п-1 ь'Лп
l i
Рис. 14.
ГЛ. III. ОТОБРАЖЕНИЕ R В R
267
но не является ступенчатой, поскольку рациональные числа
плотны на [0, 1], и поэтому не существует интервала, на
котором f была бы постоянна.
2. Внутри каждого интервала ]ад, ад-н[ функция <р
постоянна, а стало быть, непрерывна. Иными словами, ср может быть
разрывна лишь в точках ад, число которых конечно.
Следовательно, ступенчатая функция имеет не более чем конечное число
точек разрыва,
3. Всякая числовая функция ср, определенная на [а, Ь],
имеющая конечное число точек разрыва и принимающая лишь
конечное число значений, является ступенчатой. Действительно,
пусть <%о, аь ..., ап — точки разрыва функции ср, и пусть ад <
< ад+i при любом k = О, 1, ..., п— 1. Функция ф непрерывна
на ]ад, ад+it и может принимать лишь конечное число значений.
Если бы она принимала на ]ад, ад+1[ несколько различных
значений, то образ интервала ]ад, ад+if при отображении ф состоял
бы из конечного множества точек. Но мы знаем, что образ
интервала посредством непрерывной функции есть интервал,
который может сводиться к точке. Значит, здесь множество
<р(]а&, ccfe-иО сводится только к одной точке, чем доказано, что
Ф постоянна на ]ад, ад-н[.
4. Если имеется ступенчатая функция ф на [а, 6], то каждый
интервал ]ад, ад+it может быть разбит на конечное число
интервалов точками
fa,\ =afc<Pfc,2<Pfc,3< •■• <Pfe>P£ = a*+i>
и если на каждом подинтервале сохранить те же значения
функции ф, то получим новое разбиение интервала [а, й],
определяющее ф.
Но в общем случае первоначальное разбиение интервала /
посредством интервалов ]ад, ад+it, определяющее ф, нельзя
заменять разбиением на интервалы ]рр, pP+i[, которые содержали
бы точки ад, так как в общем случае значения функции ф
различны по обе стороны от ад, или, точнее, ф разрывна в точке ад.
Однако если ф постоянна на [a, b], то эта операция возможна.
Заметим, что любая числовая функция, обращающаяся
в нуль всюду на [а, Ь], кроме конечного числа точек, есть
ступенчатая функция.
5. В каждой точке ад существует предел справа ф(ад + 0) и
предел слева ф(ад — 0), поскольку ф(ад + 0) = /fe, ф(ад —0) =
= /ft_i. Следовательно, скачок функции ф в точке ад равен
4 — h-\*
6. Всякая ступенчатая функция ограничена; ее верхней
* гранью служит наибольшее из всех значений lhf ф(ад), а
нижней гранью — наименьшее из всех этих значений.
268 КНИГА III. АНАЛИЗ
7. Если изменить значения функции ф в конечном числе
точек, то полученная функция снова будет ступенчатой. В
частности, если взять для любого ак (к = 0, ..., п— 1), ф(сс&) =
= ф(а& + 0) = /ft и ф(6) = /п, то ф станет непрерывной справа
в каждой точке.
§ 2. Операции со ступенчатыми функциями
1. Пусть ф и у— две ступенчатые функции на [а, Ь]. Так как
Ф и у принимают не более чем конечное число значений и имеют
не более чем конечное число точек разрыва, то это имеет место
и для ф + Y-
Стало быть, ф + у есть ступенчатая функция на [а, Ь].
Накладывая одно на другое разбиения интервала [a, b\
служившие для определения ф и у, получим разбиение интервала [а, Ь]
относительно суммы ф + у.
Очевидно, что —ф тоже является ступенчатой функцией,
равно как и функция 0.
Множество всех ступенчатых функций на [а, Ь] будем
обозначать через Ф.
Закон сложения для числовых функций, примененный к
ступенчатым функциям, превращает Ф в абелеву группу.
2. Если а — действительное число, то функция аф,
определенная как #н-~>аф(л:) для всех хе[а, 6], есть ступенчатая
функция.
Следовательно, Ф, наделенное этими двумя законами,
является векторным пространством над R.
Это свойство приводит нас к следующему замечанию. Пусть
а = а0<а,<а2< ... <аЛ = 6;
рассмотрим функции %k> определенные условиями
%k (х)= 1, если *е= ]ak, afe+1[,
%k (x) = 0, если х ф ]aki аЛ+1[.
Это ступенчатые функции.
Так как ф — ступенчатая функция, принимающая на ]а&, aft+i[
значения /&, то для любого х ф аи имеем: ф(л;) = 'оХо(^) + ...
... + /п%п(*)> ибо если х не равно никакому а*, то оно
принадлежит некоторому ]aft, a*+i[. Но на ]ос&, ос&-и[ функции %0> ...
..., зс*-ь Xfc+ь • -.. Хп Равны нулю, а хлМ = 1.
Таким образом, для всех точек, кроме ал, функция ф
является конечной линейной комбинацией функций %h.
3. Пусть ф и у — две ступенчатые функции на [a, b].
Произведение фу тоже будет ступенчатой функцией, так как фу
принимает лишь конечное число значений и в силу того, что произ-
ГЛ. III. ОТОБРАЖЕНИЕ R В R
269
ведение непрерывных функций дает непрерывную функцию, фу
непрерывно всюду, кроме конечного числа точек. Разбиение
интервала [а, Ь] на интервалы постоянства функции еру снова
получается путем наложения разбиений, служивших для
определения ф и у.
4. Наконец, отметим как очевидный факт, что если ф есть
ступенчатая функция на [а, Ь], то таковыми будут и ф+, ф", |<р|.
V. РАВНОМЕРНАЯ СХОДИМОСТЬ
Этот раздел посвящен фундаментальному понятию
равномерной сходимости, которое будет изложено вначале для
последовательности действительных функций, определенных на
интервале.
§ 1. Определение равномерной сходимости
последовательности числовых функций
Определение простой сходимости. Пусть (fn) есть
последовательность числовых функций, определенных на одном и том же
интервале I из R. Говорят, что эта последовательность сходится
к числовой функции f, определенной на I, если для любой
точки х е / последовательность f{(х), Ы#), ..., /п(*),... сходится
Kf(x).
Это определение сходимости, называемой простой
сходимостью, является наиболее естественным. К сожалению, оно
оказывается недостаточным для сохранения некоторых свойств
функций /п. Так, важно знать, будет ли предельная функция /
непрерывна, если таковыми будут все функции fn. Условия
простой сходимости для этого недостаточно (см. ниже,
замечание 1°).
Для «сохранения непрерывности при переходе к пределу»,
а также по другим причинам вводится понятие равномерной
сходимости.
Определение равномерной сходимости. Пусть (fn) есть
последовательность числовых функций, определенных на одном и
том же интервале I из R. Говорят, что эта последовательность
равномерно сходится к числовой функции f, определенной на I,
если любому е > О можно поставить в соответствие такое
целое Р (е), не зависящее от х^1, что для любого п> Р(г)
выполняется неравенство \ fn (х) — f (х) | < е.
Говорят, что последовательность (fn) равномерно сходится
и что / есть равномерный предел функций /п.
Замечания. Г Если (/п) равномерно сходится к /, то в ка-
"ждой точке х^1 последовательность (fn(x)) сходится к f(x),
так как любому е можно поставить в соответствие такое
270
КНИГА III. АНАЛИЗ
целое Я, что для п> Р будет \fn(x) — f(x) | <в. Обратное же
неверно. Так, рассмотрим на [0, 1] последовательность функций
fn, определенных следующим образом:
fn(x) = (n— l)x, если лге[0, 1/п],
fn(x)=*l— xy если х^[1/п, 1].
Для хе]0,1] имеем lim fn(x) = 1 — х> ибо если п достаточно
Я-»оо
велико, то 1/п < х и, значит, х принадлежит интервалу [1/п, 1].
Для х = 0 имеем fn(0) = 0, и значит, lim fn(0) = 0. Стало быть,
П->оо
последовательность функций fn сходится. Но она не сходится
равномерно. Действительно, для предельной функции f имеем
/СО) = 0 и f(x) = 1— ху если #е]0, 1]. Поэтому неравенство
\fn(x) —f(x)\ < e может иметь место лишь в том случае, если
для х €= [0, 1/п] будет | (п — 1) х — (1 — х) | < е, т. е. | пх — 11 <
< е, что выполнимо для любого х, если выбрать п достаточно
большим, но выбор п зависит от точки х.
2° Можно также представить понятие равномерной
сходимости следующим образом. Если при любом х^1
последовательность (fn(x)) имеет предел f(x), когда п стремится к
бесконечности, то \fn(x) —f(x) | < е для любого п>Я(е,х)у причем
целое Р зависит от е и от х. Равномерная сходимость будет
иметь место как раз тогда, когда Р может быть выбрано
независимо от х (но Р зависит, очевидно, от числа е, интервала /
и от последовательности (/п)).
3° Пример, приведенный в Г, показывает, что
последовательность непрерывных на / функций fn может сходиться в
каждой точке х е / к разрывной функции f. Одна из причин
введения равномерной сходимости состоит именно в том, что
равномерно сходящаяся последовательность непрерывных функций
сходится к непрерывной функции (ср. ниже, § 3).
46 Если проанализировать определение равномерной
сходимости, то можно констатировать, что тот факт, что переменная
х принимает свои значения на интервале / из /?, не играет
существенной роли. Следовательно, можно без какого бы то ни
было изменения определить равномерную сходимость
последовательности (fn) числовых функций, определенных на одном и
том же произвольном множестве Е. Можно даже
предположить, что fn(x) есть не число, а точка метрического
пространства (ср. гл. V, VI, VII).
Замечание. Если мы хотим доказать, что функция /есть
равномерный предел последовательности функций (фп),
выбранной в некотором множестве функций, произвольный элемент
которого обозначен через ср, то достаточно показать, что для
любого е > 0 можно указать такую функцию ср из множества,
ГЛ. III. ОТОБРАЖЕНИЕ R В R 271
что \f(x) — q>(x) | < e при любом x\ действительно, задав
последовательность еп, стремящуюся к нулю, выберем для
каждого еп функцию ц/п так, чтобы |/(л;) — <рп(х) \ < enf тогда
последовательность (фп) равномерно сходится к /.
Говорят, что f равномерно приближается посредством ф.
§ 2. Равномерная сходимость последовательности
ступенчатых функций. Ярусные функции
1. Определение нормы на множестве ступенчатых функций.
Пусть Ф есть векторное пространство над R ступенчатых
функций на [а, Ь]. Если в векторном пространстве определена норма,
то в нем можно ввести понятие расстояния между двумя эле*
ментами (см. Книга II, гл. III, разд. II, § 2 и Книга III, гл. V).
Пусть феФ есть ступенчатая функция на [а, Ь]. И пусть
v^) = syp |ф(л) |, т. е. наибольшее из значений, принимаемых
функцией |ф|. Если ф и у — Две функции из Ф, то
v(9 + Y)esup^(jc) + YWI<sup(^WI + |YWIX
<supM*)| + sup|Y(*)Hv(q>) + v(Y)
Если а е /?, то
v (аф) = sup | аф {х) |»| а | sup | ф (х) | = | а | v (ф).
Если 0 есть нулевая функция, то v(0) = 0; обратно, если
у(ф) = 0, то 8ир|ф(л:) | = 0, и значит, |ф(*) | =0 Иф(х) =0 при
всех х.
Обозначим v(cp) через ||ф||. Тогда имеем
||фН-04Фф-0
Иф + уКИфИ + ИуН
Цаф11 = |а|||ф11,
каковы бы ни были ф, у s Ф и а е R.
Таким образом, отображение ф-*||ф|| удовлетворяет трем
условиям, определяющим норму в векторном пространстве (см.
Книга И, гл. III, разд. II, § 2). Эта норма определяет
расстояние от ф до у как d(q>> y) = Иф — yII- Напомним (см. там же),
что |||ф|| — \\у\\ |.^ И<? — yII- Определенная таким путем норма
в Ф позволит нам весьма просто истолковывать понятие
равномерной сходимости последовательности (фп) ступенчатых
функций на [а, Ь].
2. Определение ярусных функций. Говорят, что числовая
функция f, определенная на [а, Ь], является ярусной, если для
любого г > 0 найдется такая ступенчатая на [а, Ь] функция ф,
что \f{x)— <p(x) \< е, каково бы ни было х е [а, 6].
В этом случае говорят, чтр / равномерно приближается
посредством ф С ТОЧНОСТЬЮ ДО 8»
272
КНИГА III. АНАЛИЗ
Пусть теперь еп — последовательность положительных чисел,
стремящаяся к нулю. Тогда каждому еп можно поставить в
соответствие такую ступенчатую функцию фп, что \f(x)—уп(х) |<
< гп при всех х е [а, Ь]. Если е — любое положительное число,
то найдется такое целое Р(е), что, каково бы ни было п> Р(е),
гп < е, так как еп стремится к нулю. Стало быть, тем более, для
любого п^Р(г) и любого х^[ау Ь] имеем \f(x) — фп(*)| < е.
Это означает, что если / есть ярусная функция, то существует
последовательность (фп) ступенчатых функций, равномерно
сходящаяся к f. Обратно, пусть (фп) есть последовательность
ступенчатых функций, равномерно сходящаяся к числовой функции /,
определенной на [а, Ь]. Тогда, по определению равномерной
сходимости, любому е > 0 можно отнести такое целое Р(е), не
зависящее от х, что для любого п^Р(е) и любого хе[а, Ь]
выполняется неравенство \f{x) — ©п(*)| < е. Следовательно,
всякому е > 0 соответствует хотя бы одна такая ступенчатая
функция ф, что | f (х) — ф (х) | < е при всех х\ стало быть, f —
ярусная функция. Итак, можно принять следующее определение,
эквивалентное первому.
Определение. Ярусной функцией на интервале [а, Ь]
называется любая числовая функция f, определенная на этом
интервале и являющаяся равномерным пределом последовательности
(фп) ступенчатых функций на [а, Ь].
Обратимся снова к определению равномерной сходимости
и придадим ему иное выражение, которое позволит ввести
норму и сформулировать свойства ярусных функций.
Пусть (ф„) есть последовательность ступенчатых функций,
равномерно сходящаяся к числовой функции f на / = [а, Ь].
Это означает, что для е>0 можно указать такое не зависящее
от х целое Р(е), что для любого п^Р(е) имеет место
1/(*)-ф« (*)!<«• Если Р>р(ъ) и Я>Р(г), то |<рр(х)-фа(*)|=»
Таким образом, | фр (х) — % (х) | < 2е, pfq > Р (е), каково бы
ни было х (это означает, что двойная последовательность
(фр —Ф^) равномерно сходится к нулю).
Обратно, допустим, что последовательность (фп) обладает
вышеуказанным свойством, т. е. для любого г > О найдется
такое Р(е), что для р, q> Р(е) имеет место | фр (х) — щ (х) | < е.
Это влечет, что последовательность (фп(*)) для любого х есть
последовательность Коши, и значит, сходится. Определим теперь
числовую функцию / на /, положив f(x)= lim q>n{x) для любого
П->оо
xg/. Если в последнем неравенстве заставить q неограниченно
возрастать, то
|Фр(*)-/(*)1<е
ГЛ. III. ОТОБРАЖЕНИЕ R В R
273
для любого j^g/ и любого р>Р(е). Но это означает, что
последовательность (фп) равномерно сходится к /, или / есть
равномерный предел для фп.
Следовательно, для того чтобы последовательность (фп)
равномерно сходилась, необходимо и достаточно, чтобы для любого
е>0 нашлось такое целое Р{г), что если р^-Р(г) и q^P(e),
то \уР{х)—щ(х) |<е.
Важность этого условия очевидна, ибо оно позволяет
выяснить, сходится ли равномерно последовательность (фп), не зная
предельной функции f. Это условие выступает как аналог
условия Коши, которое позволяет решить вопрос о сходимости
числовой последовательности (хп) в том случае, когда предел
неизвестен. Эта аналогия станет еще более отчетливой после того,
как мы введем понятие нормы.
В самом деле, утверждение о том, что, каково бы ни было х
из [а, Ь], | фр (х) — щ (х) | < е, равносильно тому, что
8ир|фр(л:) — ф«Дл:)|<е. Значит, ||<рр — щ\\<г, если' /?>Я(е) и
X
q^P(e) *). Иными словами, расстояние между фр и щ
стремится к нулю, когда р и q стремятся к бесконечности. В этом
случае говорят, что последовательность функций (фп) есть
последовательность Коши относительно нормы в Ф, определенной
как || ф || = sup | ф(лс) |. Наш результат может быть сформулиро-
х
ван в виде следующей теоремы.
Теорема. Для того чтобы последовательность (фп)
ступенчатых функций на [а, Ь] равномерно сходилась, необходимо
и достаточно, чтобы она была последовательностью Коши для
нормы || ф || = sup | ф (х) |, определенной в векторном простран-
х
стве Ф ступенчатых функций на [а, Ь].
Теперь можно принять следующее
Определение. Говорят, что последовательность ступенчатых
функций (фп) на [а, Ь] равномерно сходится, если (фп) есть
последовательность Коши относительно нормы
IIФII — sup | ф (х) |.
х
Рассмотрим последовательность Коши ступенчатых
функций фп. Согласно неравенству | ||ф|| — \\у\\\К ||<р — vll имеем
| НфрН — 11ф(?11|^11фр — Фд1|. Значит, если (фп) есть
последовательность Коши в Ф, то последовательность положительных
чисел (||фп11) есть последовательность Коши в R и, стало быть,
сходится. С другой стороны, в силу того, что |фп(А:) — f(x) | < е,
*) Здесь снова появляется необходимость четко различать символы ф и
Ф(*); ИфН есть неотрицательное число, отнесенное функции ф, и переменное х
тут не фигурирует.
274 КНИГА III. АНАЛИЗ
если п^Р(г), имеем |/(д:) |-< е + |фп(#) |^е + ||ф„||.
Следовательно, величина |f {х) \ ограничена, и можно рассматривать
величину sup | f{x) |, которая будет конечным числом.
х
Наконец, отметим два свойства равномерно сходящейся
последовательности ступенчатых функций. Если фп равномерно
сходится к ярусной функции /, то эта функция будет
единственным пределом, ибо если допустить, что g— другая ярусная
функция, являющаяся равномерным пределом той же
последовательности (фп), то для п>Р(г) будет \q>n(x) — f(x) | <е,
|фп(#)— g(x) |< е, каково бы ни было х. Отсюда
\f(x)-g{x)\-\f(x)-9n(x) + 9n{x)-g(x)\<
<\f(x) - <ря(*) 1 +1 <ря (х) -g(x)\<2*.
Но е произвольно, и поэтому f(x) = g(x) для любого х, т. е.
f — g. Следовательно, как ив/?, имеет место единственность
предела.
С другой стороны, если две последовательности (фп) и (уп)
ступенчатых функций равномерно сходятся к одной и той же
ярусной функции /, то для любого х^[а, Ь] и любого м>Р(е)
\<fn{x)-f(x)\<e, \yn(x)-f(x)\<*.
Отсюда
\Vn(x)-yn(x)\-\Vn(x)-f(x) + f(x)-yn(x)\^
<\<Pn(x)-f(x)\ + \Vn(x)-f{x)\<2B.
Обратно, пусть (фп) # (уп)— две последовательности Коши
ступенчатых функций на [а, Ь]. И пусть f и g — два
соответственных ярусных предела для (фп) и (уп). Допустим, что ||фп — Ynll
стремится к нулю; тогда
\f(x) -g(x)\ = \f(x)~ q>n(x) + <рп(х) - уп(х) + уп(х) - g (х) |<
<\f(x)-Vn(x)\ + \<fn(x)-yn(x)\ + \Vn(x)-g(x)\,
Но заданному е соответствуют такие числа Р\(г), Р2(в), Я3(е),
что при любом a: \f(х)— (рп(х) | <е для пр-Ри \g(x)— yn(x) |<е
для п>Р2 и Нфп—YnIKe для п;>Р3, или |фп (х)— уп(х) | < е
при любом х. Обозначив через Р наибольшее из чисел Ри Р2>
Р$> получим для любого п> Р и любого х
1/(*)-*(*)1<Зв;
а так как е произвольно, то отсюда следует, что f = g.
Снова приходим к тому же явлению, что и с рациональными
числами (ср. гл. I), когда определялась последовательность
Коши (гп) рациональных чисел условием lim |rp — rJ==G
p,q->oo
ГЛ. III. ОТОБРАЖЕНИЕ R В R
275
и две эквивалентные последовательности (rn), (гп) — условием
lim |гя —г^| = 0. Эквивалентные рациональные последова-
тельности Коши определяли одно и то же действительное число,
являющееся классом этих последовательностей. В нашем
случае норма -играет ту же роль, которую играло абсолютное
значение. Так что предыдущие результаты формулируются
следующим образом.
Две последовательности (срп) и (уп) ступенчатых функций
на [а, Ь] называются эквивалентными, если lim ||<pn — уп\\ = 0.
Этим определяется отношение эквивалентности в Ф.
Две эквивалентные последовательности Коши определяют
одну и ту же ярусную функцию, которая является их
равномерным пределом.
3. Векторное пространство ярусных функций на [а, 6]. Пусть
/ и g— две ярусные функции на [а, Ь]. Они служат
равномерным пределом для последовательностей ступенчатых
функций (фп) и (уп). Из неравенств 1фп(#)—f(x)\<e и
\Vn(x)—g(x)\<e получаем \<рп(х)+yn(x) — (f(x)+g(x))\<2e.
Значит, последовательность (<рп + уп) равномерно сходится
к функции f + g, которая, следовательно, будет ярусной. Точно
так же для любого действительного числа а функция af тоже
будет ярусной.
Через Ф у нас обозначается векторное пространство
ступенчатых функций на [a, b], a -через Ф мы обозначим множество
ярусных функций на [а, Ь]. Предыдущие два свойства
превращают Ф в векторное пространство над R.
Множество ярусных функций на [а, Ь] есть векторное
пространство над R.
Заметим, что Ф является подпространством пространства Ф,
поскольку ступенчатая функция есть частный случай ярусной.
Норма ярусных функций. Точно так же, как после
определения действительных чисел вводилось их абсолютное значение,
будет введена и норма ярусной функции. Поскольку /, будучи
ярусной функцией, ограничена, то можно снова рассматривать
величину sup|f(xH которая является конечным числом и об-
х
ладает тремя свойствами, определяющими норму. На основании
этого положим
||f|| = sup|/(*)|.
Из неравенства I Фл (л:) — f (л:) | < е (для любого х и любого
п>Р(е)) вытекает ||<ря(*) |-| Д*)| 1<«. т. е. -е<|<ря(*)|-
Н/(*)!<£• Отсюда
|фя(*)К1/(*)1 + в; \f{x)\<\9n(x)\+s
276
КНИГА III. АНАЛИЗ
при любом х, и значит,
suplqprtMKsupl/MI + e,
х х
sup|/(*)l<sup|q>n(*)l + е.
х х
Исследуем некоторые свойства равномерно сходящихся
последовательностей ярусных функций. Используя без малейшего
изменения доказательство предыдущей теоремы, убеждаемся,
что для того, чтобы последовательность (fn) ярусных функций
равномерно сходилась, необходимо и достаточно, чтобы
lim II/р —/^ || = 0, т. е. чтобы она была последовательностью
Коши относительно нормы || /1| = sup | / (я) |.
X
Более того, можно доказать, что равномерный предел
последовательности ярусных функций есть ярусная функция.
В самом деле, если /п равномерно сходится к функции F на
[а, Ь\ то для любого х \ tn(x) — F(x) |<e/2, если п>Р(е). Но
для каждой функции /п, которая является ярусной, можно
указать такую ступенчатую функцию фп, что | fn (х) — <рп (х) \ < г/2
при любом х. Тогда |фп(#)—F(A:)|<e, каково бы ни было х
и п>Р(е). Следовательно, функция F равномерно
приближается ступенчатыми функциями с точностью до произвольного гу
и, стало быть, F есть ярусная функция.
В итоге получаем, что точно так же, как последовательность
Коши действительных чисел сходится в R, так и
последовательность ярусных функций на [а, Ь], являющаяся
последовательностью Коши для нормы 11/11= sup |/(я) |, сходится в Ф, т. е.
сходится по этой норме (равномерно) к функции из Ф.
Говорят еще, что Ф, наделенное этой нормой, полно.
Наконец, тот факт, что (по определению) всякая ярусная
функция есть предел (в смысле рассмотренной нормы)
ступенчатых функций (так же, как всякое действительное число есть
предел рациональных), выражается еще и так: Ф плотно в Ф
(ср.: Q плотно в /?).
Подытоживая, сформулируем предыдущие результаты
следующим образом.
Пусть Ф— векторное пространство ступенчатых функций ф
на [а, Ь]. Ф наделено нормой || ф || = sup | ф (а:) |.
Всякая последовательность Коши (фп) ступенчатых функций
определяет ярусную функцию /, к которой она равномерно
сходится.
Множество Ф ярусных функций / на [а, Ь] может
рассматриваться как векторное пространство, || / II = sup | / (х) \ есть норма
в Ф-
ГЛ. III. ОТОБРАЖЕНИЕ R В R
27Т
Если lim || Фп - /1| = 0, то || /1| = lim || Фл ||.
Л->оо П->оо
Для того чтобы последовательность ступенчатых функций
(фп) равномерно сходилась, необходимо и достаточно, чтобы
она была последовательностью Коши.
Любая последовательность Коши ярусных функций (fn)
равномерно сходится, г. е. сходится по норме пространства Ф к
функции из Ф.
Окончательная формулировка такова (ср. гл. I, § 4,
теоремы 1 и 2):
Векторное пространство Ф ярусных функций f на [а, Ь],
наделенное нормой || f || = sup | / (л:) I, полно, а подпространство Ф
х
ступенчатых функций плотно в Ф.
Аналогия между Q и R, с одной стороны, и Ф и Ф — с
другой, приводит к весьма общей теореме, формулировка и
доказательство которой не могут быть изложены в этом курсе.
4. Другие свойства ярусных функций, а) Пусть /—ярусная
функция на [а, Ь], а ф — такая ступенчатая функция, что
II/ —фН<е, т. е. \f(x)—q)(x)\<E, каково бы ни было яе[а, 6].
Из неравенства | |а| — \Ь\ |<|а—Ь\ получаем | \f(x) | — |ф(л:) 11<
<|f(*)—ф(*)1 <е-
Следовательно, если f — ярусная функция, то таковой будет
"\fl
Очевидно, \\f\-\g\\4\f-g\ и \f + g\<\f\ + \g\.
В силу того, что / = /+ + /~, а |/| = /+ — /-, функции /+ и f-
тоже будут ярусными.
б) Покажем, что любая ярусная функция непрерывна всюдуу
кроме, быть может, счетного множества точек.
Это предложение вытекает из более общей теоремы.
Теорема 1. Пусть (fn) есть последовательность числовых
функций на [а, Ь\ равномерно сходящаяся к числовой функции /.
Если в точке х0 все функции fn непрерывны, то предельная
функция f тоже непрерывна в этой точке.
Говорят, что равномерная сходимость сохраняет
непрерывность. Действительно, мы должны доказать, что для
произвольного е>0 можно указать такое а, что если \х — х0\<а, то
\f(x)—/(л;0)|<е. Но мы можем найти такое целое п, что,
каково бы ни было x^[a,b], \f(x)—fn(x)\<e/3 (равномерная
сходимость (fn))- Следовательно, и |/(#о) —/™(*о) |< е/3.
Отсюда
l/W-/WI = l/W-/«W + /nW-fnW + /ftW-/WI<
<\f(x)-fn(x)\ + \fn(Xo)-f(Xo)\ + \fn(x)--fn(Xo)\<:
<2|+im*)-U*q)I-
278 КНИГА Ш. АНАЛИЗ
А поскольку fn непрерывна в точке х0 е [а, 6], то найдется
такое а, что если \х — л:0|<а, то \fn(x) — fn(xo)\<e/3y и стало
быть, \f(x) — f(x0) |<е.
Применим этот результат к последовательности (<рп)
ступенчатых функций на [а, й], равномерно сходящейся к ярусной
функции f. Пусть Dn есть конечное множество точек, в
которых <рп не является непрерывной, a D = [J Dn — объединение
п
всех множеств Dn. Множество D счетно или конечно. Если
jxq ф D, то все функции фп непрерывны в х0, а значит, и / тоже,
в) Разрывы ярусной функции. Точки, в которых / может не
быть непрерывной, принадлежат D. Если последовательность фп
ступенчатых функций равномерно сходится к /, то для любого
x^[afb] имеем \f(x) — yn(x)\<e, п>Р(е), откуда |<рр(*) —
— фд(*)|<2е, p, q>P{e). Так как фп — ступенчатая функция,
то в любой точке х0 существуют пределы справа и слева:
<Рп(#о + 0), фп(^о —0), ибо, например, фп(*о + 0) является
значением функции фп в точке х0 + hy где h > 0 и столь мало,
чтобы интервал ]х0, х0 + h] принадлежал некоторому интервалу,
на котором фп постоянна. Следовательно, для любого х0 е D
имеем также
1<Рр(*о + 0)-Фв(*о + 0)К2в, |q>p(*0-0)-q>,(*0-0)|<2e
(р, q>P(e))>
чем доказано, что последовательности чисел фп(#о + 0) и
~Фп(#о — 0) являются последовательностями Коши и, стало быть,
Сходятся.
Обозначим через К предел фд(х0 + 0), а через \i — предел
<f)q(xo — 0), и заставим q неограниченно возрастать. Тогда
получим \ч>р(х0 + 0) — Я|<2е, |фР(а:0 — 0)—|л| < 2е, р> Р(е).
Возьмем А>0 и рассмотрим разность f(x0 + h) — Я. Имеем
f(xQ+h)-k = f (х0 + К) - фр (*<> + h) + фр (х0 + К) -
- ФР (*0 + 0) + Фр (-^о + 0) - Я,
\f(x0 + h)-X\^\f(x0+h)-qp(x0 + h)\ +
+1 Фр (*о + 0) - ^ I +1 Фр (*о + '*) - Фр (*о + 0) |.
Если выбрать /? > Я(е), то
rf(*0+ Л) - Л |<е + 2е +1 фр (*о + А) - Фр (*0 + 0) |.
А поскольку р фиксировано, то можно взять h столь малым,
чтобы |фр(#о +. А) — фр(#о + 0) | < е; следовательно, для
достаточно малого h > 0 имеем
l/(*o + A)- Hm Фя^о + 0)К4е,
Л->оо
ГЛ. III. ОТОБРАЖЕНИЕ R В R 27£>
Иными словами, предел справа f(x0 + 0) функции f в точке аг0
существует, и если (фп) равномерно сходится к /, то f(x0 + 0) =
= lim фп(*о + 0). То же самое и слева: / {х0 — 0) = lim фп(л:0 — 0).
П->Оо П->оо
Таким образом, имеет место
Теорема 2. Всякая ярусная функция f на [а, Ь] ограничена
и непрерывна, кроме разве что счетного множества точек;
в точке #о, в которой f разрывна, существуют пределы слева и
справа: f(x0 — 0) и f (x0 + 0).
г) Положительные ярусные функции. Следующее свойство
используется в теории интегрирования.
Если f есть неотрицательная ярусная функция, то можно
найти последовательность неотрицательных ступенчатых
функций, равномерно сходящуюся к f.
Прежде всего заметим, что если для любого п ступенчатая
функция фп<^0 и если (фп) равномерно сходится к /, то /\>0,
ибо для любого х имеем <рп(х)^0, a f(x) = lim q>n(x). Из вы-
Л-»оо
шеизложенного свойства а) вытекает, что если (фп)
равномерно сходится к /, то (|фп|) равномерно сходится к |/|. Но
/ = /+ + /-, |Л = /+ — /"" Для любой числовой функции. Поэтому
Ф+ = Ф~ + | Фп |, и последовательность (ф+) равномерно сходится
к /~ + 1Лх=/ч~- В частности, если />0, то / = f+, и если (фп)
равномерно сходится к /, то (<р+) тоже равномерно сходится
к /, из чего следует, что (ф~) равномерно сходится* к нулю.
Итак, если lim |Ф/г-/|=0,тоНт II|ср l-| /|||==0, lim |q>+-/+|«0„
И->оо /1->оо /1->оо
ит|Ф;-г|-о.
П->оо
д) Произведение fg двух ярусных функций на [а, Ь] есть
ярусная функция на [а, Ь].
Действительно, пусть (фп) и (уп) — две последовательности
ступенчатых функций, равномерно сходящиеся соответственно-
к / и g. Имеем
fg - УпУп = fg - 4>ng + Vng - <РпУп = (f-q>n)g + Ф« (g ~ Уп)-
Функции fug ограничены на [а, Ь], равно как и числа
||<ря|| = 8ир|фя(*)| (этот параграф, п. 2); поэтому
х
\f(x)g(x)-Vn(x)Vn(x)\<\f(x)-<Pn(x)\sup\g(x)\ +
X
+ \g(x)-yn (x)\ sup|<p„ (х) | < M(\f(x) - <(n(x)\ + \g(x) - y„ (х)\),.
X
где x^[a,b] — любое, а М — некоторая постоянная. Иными-
словами,
Mg-9*4A<M(\\f-<b\\ + \\g-yn\\).
-230 КНИГА III. АНАЛИЗ
Jrlo по условию
лоэтому
lim||fe--<p„Yn|| = 0,
Я->оо
чем и доказано предложение.
§ 3. Примеры ярусных функций! непрерывные функции,
монотонные функции
Имея в распоряжении ступенчатые функции, которые
являются «простыми» функциями, хотя бы они и не были
непрерывными, мы построили ярусные функции как равномерные
пределы ступенчатых. И если предыдущий результат
показывает, что ярусная функция непрерывна, кроме разве лишь
счетного множества точек, то еще не установлено, существуют ли
в действительности ярусные функции, терпящие разрыв в
некоторых точках из [а, Ь], причем достаточно знать, что сумма
двух разрывных функций fug может быть непрерывна, ибо
тогда можно, например, взять g = —f. Две теоремы,
составляющие содержание этого параграфа, как раз и уточняют, что среди
ярусных функций имеются два важных типа функций:
непрерывные функции и монотонные функции, причем последние,
вообще говоря, могут быть разрывными.
Теорема 1. Всякая числовая функция, определенная и
непрерывная на [а, Ь], есть ярусная функция, т. е. является
равномерным пределом ступенчатых функций на [а, Ь].
Доказательство основывается на том факте, что если /
непрерывна на замкнутом интервале [а, Ь], то она равномерно
непрерывна.
Пусть е > 0; можно найти такое не зависящее от х число а,
что если \х — х'\<а, то \f{x) — f(x') \ < е. Разделим [а, Ь] на
конечное число интервалов Ik, каждый из которых имеет длину
меньше ее. Будем считать, что интервалы' /& замкнуты слева и
открыты справа. Определим ступенчатую функцию ф, положив
ее на интервале Ik равной значению / в некоторой произвольной
точке xk из Ik, а ф(&) = f(ft). Рассмотрим f(x) — <р{х). Точка х
принадлежит какому-то /*; в этой точке f(x)—y(x) = f(x) —
— f(xk), а так как \x — xk\<a, то \f(x) — ц(х) |< е.
Теорема 2. Всякая числовая функция, определенная и
монотонная на [а, Ь], есть ярусная функция, т. е. равномерный
предел ступенчатых функций на [а, Ь].
Пусть функция f определена, и допустим, к примеру,
возрастает на [а, Ь]. Пусть далее при заданном е
#о = /(а)<У1<2/2< ••• <Уп = !{Ь)
ГЛ. III. ОТОБРАЖЕНИЕ R В R
281
— конечное число таких точек, что | yk+\ — уи \ < е. Рассмотрим
множество точек х, для которых yk < f (х) < ук+х. Это
множество может оказаться пустым, если f(x) не принимает ни одного
значения между yk и yh+\\ будем брать лишь те интервалы
)уи, Уи+\[, Для которых это множество не пусто. Множество
таких х, что yk<f(x)<yk+\ (которое равно /-1 (Ь/*> 0*+i[) Ь
расположено на [а, Ь], а значит, ограничено; пусть xh, xh+\ — его
нижняя и верхняя грани (которые могут совпадать, когда
множество сводится к точке). Для любого х е ]xk, xk+\[ имеем
yk<f(x)<yh+\.
Пусть ф — ступенчатая функция, определенная следующим
образом:
Ф (xk) = f (xk) при любом k,
Ф (х) = / (W Для х е= ] xk, xk+l[9
где lk — есть произвольная фиксированная точка из ]xk, xk+{[.
Рассмотрим разность f(x) — <р(х). Если x = xk, то / (х) — <р (х) =
= f(Xk)-v(Xk) = f(*k)-f(Xk) = 0- пУсть X€=]xki xk+l[. Тогда,
если х<U, то 0 < ф (*) - f (*) -/(У -f(*)<#л+1 - ук<е; точно
также, если x>lfct toO^f(x)-q>(x) = f(x)-f{U)<yk+l-yk<e.
Значит, \f(x) — ф(д:)|<8, каково бы ни было х^[а,Ь]\
следовательно, / есть равномерный предел ступенчатых функций.
Замечание. Тем самым снова доказано, что монотонная
функция имеет не более чем счетное множество точек разрыва.
Равномерный предел непрерывных функций на [а, 6].
Теорема 1, доказанная в предыдущем параграфе, показывает, что
если последовательность непрерывных функций fn на [а, Ь]
равномерно сходится, то предельная функция f тоже непрерывна.
Но если fug непрерывны, то / + g тоже непрерывна и,
каково бы ни было a^R, af непрерывна. Обозначим через С
множество непрерывных функций на [а, 6]. Это векторное
пространство над R (ср. разд. II, § 1).
Так как всякая непрерывная функция является ярусной,
то С содержится в векторном пространстве Ф ярусных функций
на [а, Ь]. С есть векторное подпространство пространства Ф. Но,
кроме того, последовательность (fk) функций из С равномерно
сходится к функции из С. Рассмотрим снова норму
II /1| = sup |/ (х)\ пространства Ф в применении к непрерывным
х
функциям. Тогда отмеченный факт означает, что С, наделенное
этой нормой, полно, как было и в случае Ф.
Итак, Ф и С суть векторные подпространства
пространства Ф. Ф, наделенное нормой ll/r|| = sup|/!(A:) |, полно. С, наде-
X
ленное той же самой нормой, тоже полна, но для Ф это уже
не так.
Зд2 КНИГА III. АНАЛИЗ
VI. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
Во втором разделе было введено понятие непрерывности
числовой функции и изложены свойства функций,
удовлетворяющих этому условию. Условие же дифференцируемости, как мы
увидим, есть новое условие, которое влечет за собой
непрерывность и позволяет сформулировать новые свойства, которыми
непрерывная функция, вообще говоря, не обладает.
§ 1. Определения
1. Производная в точке. Пусть f — действительная функция
действительного переменного х, определенная на интервале I.
Говорят, что f дифференцируема в точке х0 е / относительно х,
если выражение
fM~f(x0)
где х ф х09
имеет предел в /?; когда х стремится к х0у оставаясь внутри /.
Если этот предел существует, то он называется производной
функции / в точке х0 и обозначается f'(x0). Когда f'(xo)^R>
f(Xn)*f'(xo-0)(a;-xA-
f'(xo+0>
Произбодная + <х> /
Рис. 15.
говорят, что производная конечна. Если же f'(x0)^R, то
Г(х0)= +оо или —оо, и тогда говорят, что производная в
точке Хо равна +оо или —оо (рис. 15).
Понятие производной в точке прежде всего предполагает,
что / определена на интервале, содержащем эту точку, и что
этот интервал не сводится к точке. Например, функция,
определенная на множестве ]1,2[ как f(x) = 1, если хе]1,2[, а для
х = 0 как f(0)= 1, имеет в каждой точке из ]1, 2[ производную,
равную нулю, но в х = 0 понятие производной не имеет смысла.
2. Правая, левая производные. Пусть х0&1. Если в /
имеются точки правее х0 (соответственно левее) и если /
определена на /, то говорят, что / имеет в точке xQ правую (соот-
ГЛ. III. ОТОБРАЖЕНИЕ R В R 28£
ветственно левую) производную, если выражение -^—'-^- (х ф
— х~~ х°
Ф х0) имеет предел в Л, когда х стремится к х0 справа
(соответственно слева), т. е. когда х стремится к х0 и х> х0
(соответственно х<х0). Этот предел, если он существует,
обозначается через /' (#o + 0) (соответственно /' (х0 — 0)). Если /
имеет, к примеру, левым концом л:о, а левее точки х0 функция f
не считается определенной, то выражение «/ имеет в х0
производную f'(xo)» эквивалентно тому, что «/ имеет в х0 правую
производную !'(х0 + 0)». Очевидно, что если Xq лежит внутри /
и f'(x0) существует, то правая и левая производные /'(#0 + 0)
и /'(*о —0) существуют и равны между собой. Но /'(*о + 0) и
f'(xo — 0) могут существовать и без того, чтобы существовала
f (х0). Так, функция /(л;) = |л;| для х^[— 1, +1] имеет в точке 0
правую производную 1, а левую —1, ибо если х > 0, то f (х) = х
и f(x) — f(0) = x. Следовательно, xZ0 Д *• Точно так же,
если #<0, то х_0 — — It поскольку f(x) = —x. Но /'(0)
не существует. В следующем разделе будет дано определение
функции Vх (*>0). Функция f(x)=Y\x\ на [—1,+1] имеет
в точке D правую производную, равную +оо, и левую,
равную —оо.
3. Полукасательные, касательные. Числовая функция,
определенная и постоянная на /, дифференцируема в каждой точке
из /, и ее производная равна нулю.
Действительно, если f(x)=a для всех #е/, то f(x) —
— / (*о) = 0 для х и Хо из /, а значит, "" * =0 (если х Ф х0)~
X Хо
Линейная функция, т. е. функция, определенная на /
формулой f(x) = ax + b, где а и Ъ — заданные числа, имеет
производную в каждой точке, и эта производная равна а.
Действительно, f(x) — f (х0) = ах + Ъ — ах0 — Ь = а (х — х0); стало быть,
f(x)-f (хо)
если х Ф x0i то ' ; у = а.
X Xq
Пусть / — числовая функция, определенная на интервале /,
и пусть Г — ее график в /?2, т. е. множество точек (я, /(#))> гДе
Если Г(^о + 0) существует и конечна, то правой полу
касательной к Г в точке (x0/f(xo)) называется график функции,
определенной для х ^ х0 путем соответствия x-+f(x0) +
+ f'(*o + 0)(x — Xo).
Если f'(x0 — 0) существует и конечна, то левая
полукасательная есть график функции x-+f(x0) + f'(x0 — 0) (х — х0),
определенной для x4Lx0.
Если f (хо) существует и конечна, то касательной к Г в точке
(*о, f(xo)) называется график функции x-*f (х0) + f'(x0) (х — х0).
284
КНИГА III. АНАЛИЗ
Если f'(x0 + 0) = +оо (—оо), то правой полукасательной
называется множество точек (х,у) вида х = xQ, f/W(*o)
(f/<f(*o)).
Если f'(xo) бесконечна, то касательной называется
множество таких точек (я, у), что х = х0.
Если f'(x0) существует, то f'(x0 + 0) = /'(*о — 0). Пусть ф
есть функция x-^f(x0) + Г (*о) (х — *о), ф! — функция,
определенная для #>Xo путем соответствия x-*f(x0) + /'(л;о+0)Х
X (х — х0), ф2 — функция x-»f (х0) + ¥ (*0 — 0) (а: — *0) Для
х^х0. Имеем ф1(#) = ф(*)> если х ^ x0f фг(л:)=ф(х), если
х-*Сх0. Таким образом, объединение двух полукасательных
составляет касательную к графику функции / в точке (х0, f(x0)).
4. Производные функции. Если / определена на интервале /
и имеет в каждой точке из / конечную производную ¥{х), то
функция х->¥(х), определенная на /, называется производной
функцией от f и обозначается через /'; эта функция называется
также производной от /. Выражения «/ дифференцируема на /»,
или «f есть производная от /» означают, что производная
функция /' определена, и значит, / имеет конечную производную
в каждой точке х е /.
Функция f в предположении, что она определена на /, сама
может быть дифференцируемой; ее производная обозначается
через /". При этом f называется первой производной от /,
а у — второй производной от /, или производной второго
порядка.
Вообще производные, определяемые таким путем по
индукции, если они существуют, обозначаются /<3> или f", f<4>, ...
..., f<n>, ...; /<п+1) есть, по определению, (п + 1)-я производная,
или производная (п + 1)-го порядка от /\ и первая производная
от f<4 Эти производные называются последовательными
производными функции f.
Обобщая, можем сказать, что если функция f имеет
производную порядка р + q (р, q — целые), то /**+«> есть q-я
производная от р-й производной или р-я. производная от q-и
производной:
(№){q) „ (fW){p) = *<р+0#
Иногда условливаются рассматривать / как свою
собственную производную порядка 0 и записывают /<°> = f.
Если на интервале / для любого целого м>0 существует /<п>,
то говорят, что f бесконечно дифференцируема.
Важное замечание. Когда говорят, что «функция /
определена на некотором интервале / и имеет в точке х0 е7
производную (п + 1)-го порядка, /<п+1)(*о), то тем самым
предполагают, что fln)(x) определена на интервале, содержащем л;0, и
f{p)(x) (p<n) тем более; следовательно, эта фраза влечет за
ГЛ. III. ОТОБРАЖЕНИЕ R В R 285
собой предположение о том, что / имеет производные вплоть до
л-го порядка в каждой точке некоторого интервала,
содержащего точку х0.
Замечание об обозначениях. Иногда используются
следующие обозначения: вместо х — х0 пишут ft; если ft = х — х0,
то х = х0 + ft (ft ф 0), и
f(*)-7(*o) = f(*o + a)-f(*0) .
х — х0 h '
пишут также Ад: = х — х0 = ft, что приводит к записи Af =•
= /(*) —/(*о), и тогда
/(*)-f(*o) = А/
х- *0 Ал:
Но эти подчас удобные обозначения (ими мы будем
пользоваться в представлении понятия дифференциала) лишены
точности.
Когда f'(x) существует, то ее обозначают также через
df(x)/dx (ср. гл. VII, разд. II, дифференциалы). Производная
л-го порядка, если она существует, также обозначается
символом dnf(x)/dxn.
§ 2. Общие свойства
1. Непрерывные и дифференцируемые функции. Если
числовая функция /, определенная на интервале /, имеет в х0 е /
конечную производную /'(*о), то f непрерывна в точке х0.
f (x) — fix)
Действительно, раскрывая смысл выражения «-*-^—м о;
- X Xq
стремится к !'(х0), когда х ф х0 стремится к х0» (см. разд. I, § 3),
получаем
для любого х^]х0 — а, х0 + а[, где а надлежаниш образом
выбрано в зависимости от е > 0.
Следовательно,
\f(x)-f (х0) - Г (*о) (х-х0)\<е\х-х0\
\f(x)-f(x0)\<\x-x0\(e + \f'(x0)\).
Если е'— заданное положительное число, то можно найти такое
число а', что
I*~ *ol(e +1¥(*о)1)<е' Аля I х- х01<а'.
286 КНИГА III. АНАЛИЗ
Точно так же, если f имеет конечную правую (соответственна
левую) производную, то / непрерывна справа (соответственно,
слева) в точке х0.
С одной стороны, обратное неверно (см. пример f(x) = \x\
в § 1), а с другой стороны, свойство перестает выполняться, как
только /' перестает быть конечной: функция, определенная как
f(x)= 1, если х <= ] 0, 1], и f (0) = 0, не будет непрерывной справа
в точке 0, однако имеет в ней производную, равную + оо.
В частности, функция, дифференцируемая на интервале,
непрерывна; напомним, что выражение «дифференцируемая функ*
ция» означает, что «f'(x) конечна во всех х е /».
2. Свойства производных относительно алгебраических
действий с числовыми функциями, а) Пусть f и g— две числовые
функции, определенные на одном и том же интервале / и
обладающие конечной производной в одной и той же точке х0.
f (х) — f (х )
Пусть далее ф (f) есть функция х -> ' '1 (* ^ *<>)•
X Xq
Имеем ф(/ + g) = Ф (/) + Ф (g), и, каково бы ни было а е Rr
ф(а/) == аф(/). Пользуясь теоремами о пределах в точке (разд. I,
§ 3), получаем следующие результаты: производная в точке х0
функций f + g равна f'(x0) + g'Uo), а производная от af равна
af'(x0). Следовательно, преобразование fr-+f есть линейное
отображение.
б) Рассмотрим произведение fg. Имеем
/ (х) g(x)-f (xq) g (хо) = f(x)-f(xp) 2(x) + f(x\ SM-g(xp)
X-Хо X-Xo S\ ) I \ 0) x-Xo
Если x стремится к лг0, то g(x) стремится к g(*o), так как g, бу-
, дучи дифференцируемой в точке х0, непрерывна. Значит,
f(x)-f(x0) g^ имеш предел f'(x0)g(x0) (разд. I, § 3). Точно
X — Xq
так же f(xz) g(^""f(jCo) имеет предел f(x0)gf(xQ). Итак, произ-
X Xq
водная произведения fg в точке х0 равна
в) Пусть / определена на интервале /, дифференцируема
в точке Хо е / и такова, что f(x0) ф 0. Допустим, к примеру, что
/(*о)>0. Так как f непрерывна, то можно найти такое я > 0,
что если х е ]*о-в, *о + в[, то (42)f(xo)<f(x)<(*/2)f(x0).
Значит, на этом интервале определена функция 1//. Имеем
1 l
f(x) f(x0) 1 /(*)-/(*о)
х-х0 ~ f(x)f(x0) ' x-Xq »
ГЛ. III. ОТОБРАЖЕНИЕ R В R 287
и предел этого выражения равен числу
П*о)
lf(xo)]2 '
Если f и g— функции, дифференцируемые на интервале /,
го
(f + gY = f' + g','(afy = aff (as Л), № = f'g + g'f*
Если при этом определена функция 1//, то (1//)' = —f'lf2*
Следствия. 1. Применим результат б) для нахождения
производной функции f2. Положив g = /, получаем, что
производная от f2 равна 2ff. Вообще по индукции выводим, что если
л — целое положительное, то (fn)' = nfn-lf.
2. Производная от хп равна пхп-\. В силу а)
полиномиальная функция дифференцируема и
(| я***)'= (|/а***-').
Следовательно, производная тоже есть многочлен. Он совпадает
с производным, многочленом, определенным в Алгебре, Книга II,
гл. IV, разд. IV, § 1.
3. Дифференцирование сложной функции. Пусть / —
действительная функция от х, определенная и непрерывная на
интервале /. И пусть g — действительная функция, определенная на
интервале, содержащем интервал /(/); предположим, что в точке
jc0 ^ / производная f(#o) существует, конечна и что в точке
yo^fixo) производная g'\f(x0)] также существует и конечна.
Исследуем, будет ли сложная функция g°f иметь производную
в точке Xq. Так как ff{xQ) существует, то можно написать
f(x) = f (*<>) + (х- х0) (Г (х0) + г (х)), где lim е (х)= 0.
х->хо
Точно так же
g(y) = g Ш + (У~ Уо) (§' (Уо) + Ч (Уо)). гДе lim Ц (у) = 0.
Будем считать, что у. берется в интервале f (/) достаточно близко
к у0; тогда у является значением f(x) функции /, и ц{у) =
= Л (/(*)) ^ <*(*)• Эта функция стремится к нулю, когда х
стремится к х0у поскольку, в силу непрерывности f, y = f(x)
стремится к уо =» f (xo). Таким образом,
g(f(x))-g(f(x0)) = (f(x)-f(x0))(g'(f(x0)) + a(x)) =
- (х ~ х0) (/' (х0) + в(х)) ig' {f (x0) + а(х)) =
- (х - *0) f (xo) g' (f (Xo)) + р (х) (х - х0),
288
КНИГА III. АНАЛИЗ
причем lim (J (x) = 0. Следовательно, g —g(/(*o)) СТремится
к g'(f (*o))f'(*o), когда а: стремится к х0.
Производная от gof в точке х0 равна g'(f(xo))f'(Xo) (при
выполнении сформулированных выше условий).
Для производных функций имеем (g °f)' ~ g'(f)* f.
4. Дифференцирование обратной функции. Пусть f —
непрерывная строго возрастающая функция на интервале / (ср.
разд. III, § 2). И пусть g = /_1 есть обратная функция, которая
тоже является непрерывной и строго возрастающей.
Обозначим через / интервал /(/). Если х е /, то у = f (х)^ /.
Каждому j/e/ соответствует g(y) = х е /; имеем g(f(x)) = х,
f(g{y)) = У- Значит, если у Ф у0, то
g(y)-g(yo) = х-х0
у~Уо f(*)-f(x0) '
Так как / возрастает, то ° >0, и если f'(x0) суще-
X Xq
ствует, то f (*о) может быть числом конечным или бесконечным,
но обязательно >0, иначе говоря, /'(#о) или конечно и >0, или
равно + оо; значит (разд. III), если 1'(хо)ФО, то
X — XQ 1
f(*)-f(*o) fW-f(Xo)
x-xQ
стремится к 1/Г(х0). Если /'(*о) = 0, то это отношение стремится
к + оо, когда х стремится к х0. Следовательно:
Если f — непрерывная строго возрастающая функция на
интервале /, имеющая в точке х0 е / производную, то обратная
функция /-1 имеет в точке f(x0) производную, равную l/f'(x0).
При этом подразумевается, что если Г(х0) = 0, то l/f'(#o) ^
= + оо. Если предположить / строго убывающей, то
предыдущий результат останется справедливым при соглашении, что
если П*о) = 0, то 1/Р(*о) = — оо.
Если допустить, что /' существует на /, то для производных
функций имеем (rlY=llf-
но эта запись может привести к недоразумению.
5. Максимум, минимум. Пусть f — действительная функция,
определенная на интервале /. Говорят, что / имеет в точке х0 ^ I
относительный максимум (соответственно относительный
минимум) , если существует такой интервал ]х0 — а, х0 + а [ с: /
(а > 0), что для х <= ] х0 — а, х0 + а [ выполняется неравенство
f(x)<f(x0)((f(x)>f(xo)).
Например, если f непрерывна на замкнутом интервале [а, о],
то множество значений f(x) имеет верхнюю грань, равную
значению f(x0) функции / в некоторой точке х0. Эта верхняя грань,
ГЛ. III. ОТОБРАЖЕНИЕ R В R
289
называемая также абсолютным максимумом, является и
относительным максимумом, если х0 лежит внутри [а, Ь].
Если / имеет в точке х0 относительный максимум или
минимум, то из этого еще нельзя заключить о существовании
производной. Но если f имеет в точке xq относительный максимум или
минимум и если /'(яо) существует, то f'(xo) = 0.
В самом деле, допустим, что f имеет в х0, к примеру,
относительный хмаксимум и что f (х0) существует. Тогда правая
производная П*о + 0) и левая П*о — 0)
существуют и равны. А поскольку
f(x)^Cf(x0) для любого х из
некоторого интервала, содержащего хо, то
f'(#o + 0), являясь пределом отношения
f{x)-t(xo) ^ когда х> х0 и стремится
X "~* Xq
к х0, будет <<0; f (x0 — 0) является
f(x) — f(xo) ' о b
пределом для J-L-J-———-, когда х<Хо Относительные
х~ х0 моксимум и минимум
стремится к л;0, и поэтому jf'(x0 — 0) >0. Рир ,fi
Но П*о + 0) = П*0-0) = П*о); сле"
довательно, производная f'(x0) одновременно неположительна
и неотрицательна, а значит, равна нулю.
Замечание. Обратное утверждение неверно, т. е., если
f'(*o) = 0 в некоторой точке х0, то f может не иметь в ней ни
относительного максимума, ни минимума (пример: точка х = 0
для f(x) = хг).
Практическое заключение. Значения х0, для
которых f(x) имеет относительный максимум или минимум, всегда
принадлежат множеству, состоящему из следующих чисел:
Г Значения х0, для которых Г{х0) не существует.
2° Значения х0, для которых /'(*о) существует и равна нулю
(рис. 16).
Это необходимое условие не является, однако, достаточным.
§ 3. Теорема Ролля и ее приложения
В двух предыдущих параграфах излагались лишь локальные
определения и свойства, т. е. свойства, имеющие место на
каком-то достаточно малом интервале, содержащем точку лг0.
В этом параграфе будут изложены свойства, которые вытекают
из условия существования производной на всем интервале.
1. Теорема Ролля. Пусть f — действительная функция,
определенная на замкнутом интервале [а, Ь]. Предположим, что f
непрерывна на [а, Ь], в каждой точке из ]а, Ь[ существует
конечная или бесконечная производная и f(a) = f(b). Тогда найдется
хотя бы одна точка се]а, Ь[, в которой f'(c) = 0.
Ю Ш. Пизо, М. Заманский
290
КНИГА III. АНАЛИЗ
Прежде чем приводить доказательство, обратим внимание на
то, что предполагается существование f лишь на интервале ]а, Ь[,
что, очевидно, не исключает существования f'(a) и f'(b); но для
доказательства теоремы существование f (а) и f'(b) не требуется.
Предположим, что f постоянна; тогда теорема очевидна, так
как в этом случае f = 0. Если же f не является постоянной, то
она принимает значения, отличные от /(a) = f(6). Допустим,
к примеру, что / принимает значения, превосходящие /(а).
Будучи непрерывной функцией на замкнутом интервале [а, 6],
функция f имеет верхнюю грань, достигающуюся в некоторой
ffaH(b)
ffahf(b)
а)
0)
Рис. 17.
точке с из [а, Ь] (разд. II, § 2). А поскольку эта верхняя грань
больше чем /(я), то с не может совпадать ни с а, ни с Ь\
значит, се]а, Ь[. При этом /(с), являясь верхней гранью
функции / на [а, Ь], служит ее относительным максимумом; а так
как предполагается, что f существует в каждой точке из ]а, Ь[9
то из предыдущего параграфа (см. п. 5) вытекает, что f'(c) = 0.
3 а м еч ание. Условия, при которых справедлива теорема
Ролля, точны в том смысле, что если предположить f непрерыв-,
ной на открытом интервале ]а, Ь[, не требуя непрерывности в а
и Ь, то теорема может не выполняться. В качестве примера
определим на интервале [а, Ь] функцию /, положив f(x) =
= — (т^+7^т)> если а<х<ь> и f(a) = f(6) = О'» Для
любого х<=]а, Ь[ имеем /'(*)= (л;-а)2 + (х~ь)2 >0'
Если / не дифференцируема в какой-нибудь точке из ] а, Ь [,
теорема может быть неверна (пример: f(x) = \x\y если — 1 <
<^л:^ 1; эта функция не имеет /'(О).
Контрпримеры. А. Функция, Дифференцируемая на ]а,Ь[ и
разрывная ваий (рис. 17,а)). Б. Функция, не
дифференцируемая на ]а, Ь[ и непрерывная ваий (рис. 17,6)).
2. Следствие из теоремы Ролля: теорема о конечных
приращениях. Пусть f — действительная функция, определенная и
непрерывная на [а, Ь] и дифференцируемая на ] а, Ь [ (производная
ГЛ. III. ОТОБРАЖЕНИЕ R В R
291
может быть конечной или бесконечной). Тогда существует по
крайней мере одна такая точка С£]а, Ь[, что f(b)—/(a) =
= (Ь-а)Г(с).
В самом деле, пусть g — функция, определенная на [a, Ь]
(аф Ь) следующим образом:
g(x) = f(x)-f{b)-[{al(x-a).
Она непрерывна на [а, Ь] как сумма непрерывных функций; по
той же причине она дифференцируема на ]а, Ь[, и если х е
ez]a,b[, то
ё,{х) = Пх)-Ж^Ж..
Кроме того,
g(a) = f(a), g(b) = f(b)~(f(b)-f(a)) = f(a) = g(a).
Следовательно, g удовлетворяет условиям теоремы Ролля; стало
быть, найдется такая точка с е]а, й[, что g'(c) = 0; а так как
то
в/(С)»^(с)-Л«=Ш.о,
/(&) -/(a) = (6 -а) Г (с).
Замечания. 1° Если Х\ и х2^[а, 6], то теорема о
конечных приращениях тем более верна для интервала [xit л;2], но точка
Хг<=]х\,х2 [, удовлетворяющая
равенству
f(x2)-f(xl) = (x2-xl)f/(x3)y
f(a№)\
с b
Рис. 18. Теорема Ролля.
может быть отлична от с.
2° Название теоремы о
конечных приращениях проистекает
из того, что разность f{b)—f(a)
называется приращением
функции f между точками а и b
(а<Ь).
3° Графическое изображение теоремы Ролля выглядит так:
пусть через А (рис. 18) обозначена точка (a, /(a)), а через
В — точка (й, f(b)) графика Г непрерывной на интервале [a, b]
функции /. Если f(a) = f(b), т. е. если А и В имеют одинаковые
ординаты, и если /' существует на ]a, b[, т. е. Г имеет
касательную во всех точках, кроме, быть может, А и В, то на графике Г
существует отличная от А и В точка С, в которой касательная
параллельна хорде АВ.
292 КНИГА III. АНАЛИЗ
Аналогично интерпретируется и теорема о конечных
приращениях: существует отличная от Л и В точка С графика Г
(рис. 19), в которой касательная параллельна хорде АВ. В
принятых обозначениях величина g(x) совпадает с длиной отрезка
РМ, где Р лежит на хорде АВ, а М на Г, причем Р я М имеют
одну и ту же абсциссу х.
3. Следствия. Предыдущие две теоремы порождают
следующие важные результаты.
Г Для того чтобы дифференцируемая на [а, Ь] функция была
постоянна, необходимо и достаточно, чтобы ее производная
равнялась нулю.
Если / постоянна на [а, Ь], т. е., каково бы ни было х <= [а, Ь],
f(x) = k (постоянная), то f(x) —f(x0) =k — fe = 0 для любых
лД х, x0^[a,b], и стало быть, f'(x) существует
для всех х и /' = 0. Обратно, если f'(x)
существует для любого х е [а, Ь] и если
f'(x) = 0, каково бы ни было х, то по
теореме о конечных приращениях найдется
такое Б, что f(x)-f(a) = (x-a)f'(t).
А поскольку /' = 0, то f(x)=f(a) для
— любого х, и значит, f постоянна.
а ° Л и 2° Примитивные. Пусть f — число-
Рис. 19. вая функция, определенная на интервале
[а, Ь\ Говорят, что функция F,
определенная на [а,Ь], есть примитивная функции f, если для любого
х е [а, Ь] производная от F существует и F' (х) = f (x).
Например, примитивная функции f(x) = nxn~l (п > 0 целое)
равна функции F(x) = xn, а примитивная функции f(x) = xn
£й-н
равна FM^-^j- (м>0).
Если F — примитивная для / (предполагается, что она
существует), то функция G = F + k, где k — произвольная
постоянная, тоже будет примитивной функции /, ибо G' =(F + k)' =
= Fr = f, поскольку производная постоянной равна нулю.
Весьма важным является обратное утверждение, ибо если
мы докажем, что для производной f функции F все ее
примитивные получаются прибавлением к F некоторой постоянной, то
мы будем уметь находить все примитивные, имея одну из них.
Допустим, что f есть производная функции F на интервале
[а, Ь] и пусть G— другая примитивная функции /. Тогда F—G
имеет поизводную F'—G' = f — / = 0, и значит, в силу
изложенного выше результата F — G есть постоянная функция.
Необходимо отметить, что этот результат никоим образом
не дает возможности выяснить, будет ли функция f производной
для другой функции и существуют ли на интервале [а, Ь]
функции /, для которых не найдется такой функции F, что F' = /.
ГЛ. III. ОТОБРАЖЕНИЕ R В R 293
Если f есть производная другой функции, то мы будем
говорить, что / есть производная функция. Итак, справедлива важная
Теорема. Если f есть производная функция, то разность
двух примитивных функции f постоянна.
Примеры. 1° Примитивная функции f(x) = xn (п > 0 це-
лое) равна F (х) = { , и любая другая примитивная имеет
xn+l
вид *-+irTT + k-
2° Если f(x)=a (постоянная) на [а, 6], то примитивная
для f определяется как F(x)=*ax, ибо F' = а. Стало быть, все
остальные определяются как х-+ах + р (f} —постоянная).
3° Функция f(x) = xn (n натуральное), являющаяся
многочленом, бесконечно дифференцируема на R. Имеем
f'(x) = nxn-\ f/W = /i(^l)^2, ...\
/<*>(*) = л (л- 1) ... (п-р+\)хп-Р (п>р).
В частности,
fn-l)(x) = n(n-\) ... 2-х, f[n\x) = n\, /(tt+1)(*) = 0.
Пусть имеется многочлен
f(x)=%akxk (апФ0)
степени п. Он бесконечно дифференцируем как сумма конечного
числа бесконечно дифференцируемых функций. Имеем
Г(х) = п\ап, f(n+,)(*) = 0.
Обратно, если функция / дифференцируема на [а, Ь] до
(п + 1)-го порядка включительно и f(n+1> = 0, то f есть
многочлен степени п. Действительно, функция /<п\ которая служит
примитивной для /<п+1), равна постоянной Ьп. Следовательно,
?п~1) (х) = Ьпх + Ьп-и fin~2) (х) =bn^~+ Ьп-tx + Ьп-ъ, ...
Применяя общие теоремы для вычисления производной от
п
f = 2 ak (x — а)*, получаем
о
Г (х) = S feaft (х - а)6"1, Г (*) = л! а„.
О
3° Мажорирование приращений. Предположим, что
функция / определена на [а, Ь\ дифференцируема и ее
производная f ограничена, т. е. что М = sup\f'(x) | существует
294
КНИГА III. АНАЛИЗ
и является конечным числом. Пусть далее х, х' — точки из
интервала [а, Ъ\ Тогда f(x) — f(x') = (a: — #')/'(£)> где | лежит
между х и х\ Следовательно, |/(л;)— f(x')\4iM\x— xf\, каковы
бы ни были х, х' е [а, Ъ\
4° Дифференцируемые монотонные функции. Мы уже
отмечали (§ 2, п. 4°), что если / возрастает на [а, Ь] и
дифференцируема, то f>0 (а если / убывает, то Г^О). Ибо если / воз-
растает, то ^ ; ^0, каковы бы ни были хфх'\ поэтому
если /' существует, то f'(x0) есть предел неотрицательных чисел,
и значит, /'(#о)>0. Обратно, если f существует на [а, 6] и если
/'(#)> 0 при любом а:, то для х, л;'е[а, Ь] имеем f(x) — f(x') =
= (х— л;')/'^), и, стало быть, / возрастает. Таким образом, для
того чтобы дифференцируемая на [а, Ь] функция f была
возрастающей (убывающей), необходимо и достаточно, чтобы
/'>0 «0).
Если /'(#)> 0 при любом х, то для х' >x имеем f(x') —
— f(x) = (xf — х) f'&)> 0; следовательно, f(x')>f(x), т. е. /
строго возрастает, но, как уже было замечено (§ 2), f может
строго возрастать и, однако, f может обращаться в нуль.
Предыдущий результат иногда формулируется так: знак
производной /' на некотором интервале показывает, возрастает
функция / или убывает; относительные максимумы и минимумы
отыскиваются среди точек, в которых /' обращается в нуль.
* § 4. Выпуклые функции
Мы проведем краткое описание выпуклых функций,
пользуясь при этом в определении и в доказательствах графическим
Рис. 20.
представлением'в R2. От этого изложение упрощается, и такие
классические выражения, как хорда, дуга, ниже, ... лишь
помогают истолковывать математические символы и выражения
Крис. 20),
ГЛ. III. ОТОБРАЖЕНИЕ R В R
295
Определение. Пусть f есть функция переменного х,
определенная на интервале I. Будем говорить, что f выпукла, если
множество точек (х, у) из R2f удовлетворяющих условию
y^f(x), eCTb выпуклое множество (Книга II, гл. VII3
разд. VII, § 3).
Это определение сводится к утверждению, что, каковы бы
ни были Xi и Хг из /, отрезок из R2 с концами (xuf(xi)) и
(лг2, / (х2)) целиком принадлежит множеству y^f(x) или еще:
для любого а, 0<а-<1, имеет место следующее неравенство
выпуклости:
f{axl + (l-a)x2)^af(xl) + {l-a)f{x2).
Если Г — график функции f в R2 (рис. 20), т. е. «кривая»,
описываемая точкой (xty)^R29 для которой y = f(x), ^e/, то
утверждение, что / выпукла, равносильно тому факту, что,
каковы бы ни были точки М\ и М2 графика Г, никакая точка дуги
кривой Г с абсциссой, заключенной между абсциссами точек М{
и М2, не может находиться выше хорды М\М2.
Следующий результат показывает, насколько интересны вы-
пуклые функции.
Теорема 1. Любая выпуклая функция имеет в каждой
внутренней точке интервала I конечные правую и левую
производные.
Для доказательства этого результата мы вначале докажем
следующую лемму.
Лемма. Пусть М0 — фиксированная, а М — переменная
точка графика выпуклой функции /. Тогда наклон хорды М0М
есть возрастающая функция абсциссы х точки М.
В самом деле, пусть М0, М', М — три точки графика Г
функции /, абсциссы которых х0, х\ х следуют в порядке
возрастания; если / есть интервал с концами а, й, то мы предполагаем,
что рассматриваются лишь точки х, удовлетворяющие условию
а<х <Ь. А так как точка М' лежит не выше хорды MqM', to
наклон хорды МоМ не меньше наклона хорды М0М'.
Допустим теперь, что точки М0, М', М таковы, что х' < х0<х\
тогда М' не может лежать ниже хорды М0М, иначе М0
находилась бы выше хорды М'М, что противоречит определению
выпуклости. Следовательно, наклон хорды М0М снова по меньшей
мере равен наклону хорды М0М'. Наконец, если абсциссы
точек М0, М\ М следуют в порядке х' < х < х0, то точка М не
может лежать выше хорды MqM\ и значит, наклон хорды М0М
не меньше наклона хорды М0М'. Тем самым лемма доказана.
Аналитически она выражается в следующей форме: функция
ф(*0, *н/(1:'('о) (***>
296 КНИГА III. АНАЛИЗ
есть возрастающая функция от х е /, причем эта функция
ограничена на любом интервале, лежащем строго внутри /.
Перейдем к доказательству теоремы. Когда х стремится
к х0, функция <p(*oi*)i будучи возрастающей и ограниченной,
имеет конечный левый предел ф(*о, *о — 0) и конечный правый
предел ф(*о, *о + 0). Стало быть, производные f'(х0— 0) и
У (х0 + 0) существуют; при этом /' (х0 — 0) = ф (х0у х0 — 0),
a f'(xo + 0) = ф(хо,Хо + 0). Итак, теорема 1 доказана.
Следствие. Всякая выпуклая функция непрерывна
в каждой внутренней точке интервала, на котором она
определена.
В самом деле, если a, b — концы интервала, то для любого
х^]а,Ь[ функция f имеет конечные правую и левую
производные, а значит, непрерывна.
Дифференцируемые выпуклые функции. Предыдущая
теорема доказывает, что всякая выпуклая функция / на интервале /
имеет конечную правую производную и конечную левую
производную в каждой точке х внутри /. Кроме того, если х < х' < х'\
то
fW-f(x) < f(x")-f(x)
х' — х "^ х" — х '
поскольку функция
^Щ=Ш. {1Фх)
возрастает. Отсюда следует, что f'(x + 0) Kf'(x' + 0). Значит,
если f выпукла, то функция х—*р(х + 0) возрастает. То же
самое имеет место для функции х —> f' (а: — 0).
Допустим, в частности, что функция f выпукла и
дифференцируема на I. Так как /' существует, то для любого х имеем
/' (*) = Г (х + 0) = Г (х — 0) • Стало быть, f — возрастающая
функция. Иными словами, если f выпукла и дифференцируема,
то р является возрастающей функцией.
Теперь докажем обратное утверждение. Предположим, что
определенная на / функция / дифференцируема и что
производная функция р возрастает на /. Пусть хи х2 е / и 0<1а^1.
Допустим, что х\ < х2, и положим х = ах{+(\— а)х2.
Формула конечных приращений дает f(x\) = f(x) + (хх —х)р(1\), где
X\<l\<x, №) = f(*) + {Ч — x)f'(l2), где х < |2 < х2.
Умножим первое равенство на а, а второе на 1 — а и сложим.
Принимая во внимание, что Х\—х =— (1 — а)(х2 — х{) и
(х2 — х) = а (х2 — х\), получим
а/ (*!) + ( 1 - а) / (х2) - / (х) + а (1 - а) (х2 - хг) [Р (У - /' ft,)].
ГЛ. III. ОТОБРАЖЕНИЕ R В R
297
А так как а > О, 1 — а > О, х2 — х{ > 0 и f'(g2) >/'(gi), то
приходим к неравенству, определяющему выпуклость:
<*/(*i) + (1 - a)f(x2) >f (x) = / (ах, + (1 - а)*2).
Итак, мы доказали следующую теорему.
Теорема 2. Для того чтобы дифференцируемая на
интервале I функция была выпукла, необходимо и достаточно, чтобы
ее производная f была возрастающей функцией.
Если при этом предположить, что функция / имеет вторую
производную f"(x) в каждой точке х е /, то ясно, что в случае,
если /" неотрицательна, f возрастает (ибо f" есть производная
от /'), и значит, / выпукла. Поэтому имеет место
Следствие. Если функция f, определенная и дважды
дифференцируемая на I, имеет неотрицательную вторую
производную, то она выпукла.
Нижеследующие примеры частично затрагивают вопросы,
излагающиеся позже.
Примеры. 1) Функция ха выпукла для х > 0, когда а > 1
и когда а К 0. Действительно,
(*«)" = а (а- 1)*<*-2.
2) Функция — In\х\ выпукла, с одной стороны, для х > 0,
а с другой стороны, для х < 0, так как
(-in|^ir = (-l)/ = ^>o.
Пусть g(x) — функция, определенная на конечном или
бесконечном интервале / и такая, что g(x) >0 для любого xzsL
Допустим, что g(x) имеет вторую производную при всех х <= /.
Тогда необходимым и достаточным условием выпуклости
функции lng(x) будет неравенство
[gf Ml2 ^ S (*) &" (х) Для любого х е /.
Действительно,
* § 5. Периодические функции
В этом параграфе мы соберем воедино несколько понятий и
свойств, относящихся к периодическим функциям одного
действительного переменного. Первые из этих понятий должны
были бы фигурировать в предшествующих главах, но
сосредоточены здесь во избежание слишком большой разбросанности.
Определение. Числовая функция /, определенная на всей
прямой R, называется периодической, если существует такое
298 КНИГА III. АНАЛИЗ
число ©, что f(x + ©) = f(x) для любого x^R. Число ©
называется периодом функции /. Если не накладывать условий на ©,
то ясно, что любая функция /, определенная на R, может
рассматриваться как периодическая с периодом со = 0, но очевидно,
этот случай не представляет интереса.
Если предположить, что существует период © Ф О, то
периодов будет бесконечно много. Действительно,
/(* +2©) = /(* +со+ ©) = /(*+ ©) = /(*).
Вообще, каково бы ни было целое /?, число р© тоже является
периодом. Ибо если р > 0, то
f(x + /ко) = / (х + (р - 1) © + ©) = f (х + (р - 1) ©);
проделав это вычисление р раз, получим !(х + ры) =f{x) для
любого х. Если же р < 0, то полагаем р = — q (q > 0); тогда
f(x — q(o)=*f(x—(q+l)(u + (u)==f(x — (q+l)(o)9 и после
конечного числа шагов получим f(x— qa) = f(x).
Пусть / есть определенная на # периодическая числовая
функция, имеющая по крайней мере один ненулевой период; и
пусть Й — множество периодов функции /. Изучим это
множество. Пусть © и ©' е Й. Так как для любого х е R справедливо
равенство f (х + со) = f(x + ©') = f(x), то f(x + © + ©') =
= / (х + со) = f(*) и /(* + © — со7) = f{x - ©') = f(x - со7 + ©0 -
= f(#). При этом равенство f(x — со7) = /(л:) означает, что если
со' — период, то —©' — тоже период. Следовательно, если © и
о' е Q, то to + to' G Q, о — й'ей. Таким образом, мы должны
прежде всего изучить такое множество й чисел или точек из R,
что если to и о' е Й, то to + о' е Q, to — ©'ей.
Допустим, что О служит точкой накопления множества й.
Тогда существует последовательность (©п) таких точек из Й, что
lim©„ = 0.
Пусть ] а, Ь [ — произвольный ограниченный интервал из R
(а<Ь). Так как Нт©л = 0, то в последовательности (©п)
П->оо
можно найти такое ©р, что |©р|< b — а. Значит, во множестве
чисел ©р, —©р, 2©р, —2©р, ..., &©р, —&©р, ... имеется хотя бы
одно, принадлежащее интервалу ] а, Ь[. Но все эти числа
принадлежат Й, поскольку
2©р==©р + ©р, — ©р==©р —2©р и т. д.
Иными словами, любой интервал ]а, Ь[ из R содержит точку
из й, т. е. Й плотно в /?.
Таким образом, если О есть точка накопления для Й, то й
плотно в R.
ГЛ. III. ОТОБРАЖЕНИЕ R В R
299
Допустим, что Q имеет точку накопления а Ф 0. Тогда
существует такая последовательность (о)п), что Нт(оЛ~а, и значит,
Я->оо
lim | <ьр — аь | = 0. Следовательно, можно найти последователь-
р,</->оо
ность ((о£) чисел <ьРк — ©^ которые принадлежат Q и
стремятся к нулю. Значит, все свелось к предыдущему случаю.
Итак, если Q есть множество действительных чисел, не
сводящееся к нулю и такое, что вместе coiio'gQ оно содержит
со + о/ и со —- о/, то либо Q плотно в R, либо Q не имеет точки
накопления.
В последнем случае любой ограниченный интервал из R
содержит конечное число точек из Й.
Рассмотрим интервал [0, а] (а > 0) и обозначим через со0 > 0
наименьший отличный от нуля элемент множества Q Г1 [0, а].
Поскольку любой ограниченный интервал может содержать лишь
конечное число элементов из Q, то это множество не более чем
счетно. Пусть это будет, скажем, множество его положительных
элементов, расположенных в возрастающую последовательность
о)о, о)ь (02, • • •, о)р, ... Утверждается, что о>р есть целое
кратное coo- Действительно, так как все кратные соо принадлежат Q,
то найдется, и притом единственное, такое целое &, что
б0о<шр<(£+ 1)со0.
Если бы £о)о > <Ор, то сор — /zcoo было бы элементом из Q,
причем 0 < сор — £(оо < о)о, что невозможно. Значит, соР = &о>о и,
как легко видеть, k = р + 1.
Итак, если Q не имеет точки накопления, то Q состоит из
целых (положительных и отрицательных) кратных одного и того
же числа соо-
Перейдем теперь к рассмотрению периодических функций.
Пусть Q — множество периодов некоторой периодической
функции f. Множество Q может быть плотным в R. Действительно,
если / такова, что f(x) = 1 для л; <= Q (рациональных) и f(x) = 0
для х ф Q (иррациональных), то любое рациональное число г
служит периодом; ибо если xeQ, то х + г е Q, и f(x + r) =
= 1 =f(*); если же x<£Qy то х + r<£Q, и f(x + r) = 0 = f{x).
Эта функция разрывна.
Покажем, что если f — непрерывная периодическая функция
и множество Q ее периодов плотно в R, то f постоянна.
В самом деле, для любого х е R и любого шей, плотного
в R, имеем f(x + со) = f(x). Зафиксируем точку х0; тогда
f (х0 + о) =f(#o). Так как f постоянна на плотном множестве
точек х0 + со и непрерывна на R, то она постоянна на R
(продолжение непрерывной функции).
Отсюда получаем следующую теорему.
300 КНИГА III. АНАЛИЗ
Теорем а. Если отличная от постоянной периодическая
функция непрерывна, то множество ее периодов состоит из
целых кратных одного и того же числа со.
Укажем вкратце некоторые свойства непрерывных
периодических функций.
1. Если / дифференцируема, то /' будет периодической.
Действительно,
f'(x + <») = lim{(x + h + (»)-f{x + (») = limHx + h)-nx)-f'(x).
Л->0 п h-+Q n
Всякий период функции / будет периодом для /'.
2. Для примитивных это не так. Если F есть примитивная
непрерывной периодической функции f, то F не обязательно будет
периодической. Пример:
/ (х) = cos х + 1, F (х) = sin х + х9 со = 2я.
Замечание. Не следует полагать, что разрывная
периодическая функция непременно имеет плотное множество периодов.
Так, функция f, определенная следующим образом:
f(n) = 0 (п целое) и f(x) = 1, если х Ф п,
является периодической, и со = 1.
§ 6. Формула Тейлора
Формула Тейлора обобщает теорему о конечных
приращениях. Доказательство теоремы о конечных приращениях состоит
в применении теоремы Ролля к функции g, представляющей
собой разность между f и многочленом первой степени. -.
- Пусть К — постоянная, а
g(x) = f(x)-f{a)-k(x-a).
Так как g— / есть многочлен первой степени, то его
производная постоянна и равна X. Кроме того,
вГ(а)-0. g(b) = f(b)-f(a)-X(b-a), g'{x) = f'{x)-h.
К функции g можно применить теорему Ролля лишь в том
случае, если g(b) = g(a), т. е. если g(b) = 0; для этого требуется,
чтобы f(b)—f(a)—K(b — a)=0, и значит, Я,« /(^1^(а) ■
Именно поэтому мы и рассматривали раньше g(x) = f (х) — /(а) —
b — a v ;
Пусть / есть функция, определенная на [а, Ь] и обладающая
на [а, Ь] производными до п—1-го порядка включительно.
ГЛ. III. ОТОБРАЖЕНИЕ R В R 301
И пусть
п-\
g(x) = f{x)-j(d)-Yij-^l{x-a)k-X{x-af,
где Л —постоянная и а^СхКЬ; имеем g(a) = 0. Выберем X
так, чтобы выражение
g(x) = f(x)-f(a)--^-(x-a)-
-lM.(x-af- ... -£^)-(х-аГ-1-Цх-а)п
обращалось в нуль при х = Ь, что возможно, так как условие
g(b) = 0 определяет Я. После этого, применив к g теорему
Ролля, доказываем существование такого b\^]af Ь[ (стало
быть, Ь\фа), что g'(b{)=0. Но
g'(x)4'{x)-f'(a)-£^(x-a)- ...
... - ^"ЛУ(*-аГ 2-ы<*-а>*~!;
значит, снова g'(a) = 0. Тогда функция g' обращается в нуль
в точках а, Ь\ и дифференцируема; стало быть, найдется такое
ЬгФ а, что g"(b2) = 0. Так как для а: = а производные от g
вплоть до п — 1 порядка обращаются в нуль, то отсюда после
п — 2 шагов выводим, что
f-* {х) = /(П-2) {х) _ f<„-2> (а) _ f<„-,) (д) (ж _ а) _
~Хп(п-\) ... 3(#-а)2
обращается в нуль для а и для йп_2 =£ а. Следовательно,
£<"-•> W = /<»-'> W _ /<"-» (а) _ я„! (х - а)
обращается в нуль для некоторого значения Ьп-\ Ф а, лежащего
на [a, b]. Отсюда
Я- /il^-t-a) (а<6я-,<6).
Допустим теперь, что я-я производная /<п) существует на ]а, Ь[\
теорема Ролля снова применима, и поэтому
Я = /(^(с) , где а<с<й.
А поскольку Я было выбрано именно так, чтобы g(b) = 0, то
0-/(ft)-/(a)-S^(6-«)»-i^-(6-ar.
302 КНИГА III. АНАЛИЗ
Получаем первую формулу Тейлора.
Теорема 1. Если действительная функция f определена и
дифференцируема на [а, Ь] вплоть до п—1-го порядка и если
/<п> существует на ]а, Ь[, то найдется такое число сб]а, Ъ[,
что
f(b)-f{a) + &=4-f'(a) +
+Щ*- Г <«)+...+ У0£- Г"'" (а) + -^ Г (О.
Теперь предположим, что fW существует только в точке а,
а производные вплоть до п— 1-го порядка существуют на
некотором интервале, содержащем а.
Снова имеем
- ^"-"^гм.'««<».-<»•
причем Ъ есть некая точка рассматриваемого интервала. Если
взять b достаточно близко к а, то в силу того, что |ftn-i —а|<
< \Ь — а\, значение X может сколь угодно мало отличаться от
f(n)(a)/n\. Иными словами, если b стремится к а, то Я стремится
к fW(a); таким образом,
XeiWj2L+ej|(6)f где цтВя(Ь)-0.
Получаем вторую формулу Тейлора.
Теорема 2. Если действительная функция f, определенная
в окрестности точки а, т. е. на некотором интервале,
содержащем точку а внутри, обладает в этой точке конечной п-й
производной, то для любого х, достаточно близкого к а,
f(x) = f(a) + ±=±f>(a)+ ... + V-Ot" f("~>> +
где фп (х) стремится к нулю, когда х стремится к а.
Замечания и определения. Г Выражения —--р- f^n) (с)
(х~ а\п
и Фя (х) —i" называются остаточными членами или остатками
формулы Тейлора; правые части формул в двух последних
теоремах называются разложениями Тейлора порядка п; во второй
формуле правая часть называется разложением Тейлора п-го
порядка в окрестности точки а.
ГЛ. III. ОТОБРАЖЕНИЕ R В R 303
2° Если заменить х на а + h и а на х, то получится
/(*+Л)-/(*) + £/'(*)+ ... + -^-/<">(*) + (р,1(Л)^.
В первой формуле остаток часто записывается в виде
-^ff (х + 6A)f где Э есть число, заключенное между 0 и 1.
3° Если функция /, определенная в окрестности 0, имеет п-ю
производную /(п)(0), то в этом случае формула Тейлора носит
название формулы Маклорена:
f(*)_f(0) + -i-/'(0)+ ... +-£/<»> (0) + Фя (*)-£-.
4° Если предположить, что на [а, Ь] существует /(п+1)(л;) и
мажорируется числом Afn+i, т. е. |/(п+1)(л;) | ^ Мп+и то,
рассматривая первую формулу Тейлора, в которой Ь заменено на
х е [а, Ь], получаем в качестве остатка
(x-a)n+l f(/i+D/ ч
(л+1)! ' {С,Ш
Значит, если положить
г„(*)-/(*)-/(а)—^Па)- ••• --^г^ГНа),
то в этом случае
\гя(х)\<Мп+1 ]Х~па/^ •
П
5° Если f — многочлен n-й степени, f{x)^^akxk> то к f
о
можно применить формулу Тейлора любого порядка, так как
функция / бесконечно дифференцируема. Если применяется
формула Тейлора порядка р > п, то в силу того, что /<*>) = 0,
получаем
f(x) = f(a) + -^r(a)+ ... +-^V>(a).
Остаток для любого х равен нулю.
Здесь мы вновь приходим к формулам Маклорена и Тейлора,
изучавшимся в Алгебре (Книга II, гл. IV, разд. IV, § 2).
VII. ПОКАЗАТЕЛЬНАЯ ФУНКЦИЯ
Многие элементарные функции (Книга IV, гл. IV) имеют
своим началом функцию х —* ах. Поэтому мы посвящаем ей
отдельный раздел этой главы.
304
КНИГА III. АНАЛИЗ
§ 1. Постановка вопроса
Пусть а — положительное, а п — натуральное число. ап
означает произведение п чисел, равных а. Тем самым определяется
отображение множества N натуральных чисел во множество
положительных действительных чисел. Обозначим это
отображение через фа. Таким образом, фа(л) = ап> что произносится:
«а в степени п».
Свойство ап • ап' = ап+п' приобретает вид фа(я + и') =
= Фа (я) фа (л') • Иначе говоря, сумме п + п' двух натуральных
чисел фа ставит в соответствие произведение их образов
фа (Л) фа М-
Мы хотим «продолжить» функцию фа на все множество R,
т. е. указать функцию (которую мы снова назовем фа), которая
была бы определена для всех х е R и чтобы для любых х, х'
ВЫПОЛНЯЛОСЬ фа (А: + X) = фа(*)фа(*')- ПрИ ЭТИХ УСЛОВИЯХ фуНК-
ция ф будет переводить сложение в умножение, чем она и
интересна. Найдем некоторое количество необходимых условий,
которые позволят нам определить фа для любого рационального х,
иначе говоря, определить символ ar (r <= Q).
1. Предположим, что существует функция фа, определенная
на /?, принимающая положительные значения и такая, что
ца(х + х') = фа(*)фа(*'Ь каковы бы ни были х и х\ Тогда,
в частности, должны выполняться равенства
Фа (*) = Фа (X + 0) = фа (X) фа (0) - фа (0) фа (А:), (1)
Фа (X - X) « Фа (X) Фа ( ~ *) = Фа (0). (2)
Обозначим через Ga множество фа(#) значений,
принимаемых функцией фа. Рассмотрим в качестве внутреннего закона
на Ga умножение. Этот закон (на Ga) ассоциативен, фа(0)
служит нейтральным элементом, а фа(— х)—симметричным
элементом к фа (#). Следовательно, Ga есть подгруппа группы
положительных чисел, наделенной законом умножения. Согласно
гл. III Книги II нейтральный элемент в Ga будет тот же самый,
и значит, должно быть фа(0) = 1, а стало быть, фа(— х) =
= 1/фа(*). Если мы хотим, чтобы фа(л) = ап для натуральных л,
то, в частности, должно выполняться условие фа(1) = а.
Обратно, еСЛИ фа(1) = «, ТО ИЗ УСЛОВИЯ фа (Х + х') = фа (х) фа (#')
следует, что фа(л)=ап, поскольку п есть сумма п чисел,
равных единице.
Теперь рассмотрим целые отрицательные числа. Пусть
(—р) —такое число (р>0); тогда фа(—Р) = 1/фа(р) = \\ар.
Таким образом, условлено, что если р — натуральное, то а~р
представляет \\ар и записывается атр = 1/ар. Условлено также,
что а° представляет единицу и записывается а0 = 1, .
ГЛ. III. ОТОБРАЖЕНИЕ R В #— 305
Итак, к настоящему моменту мы знаем, что если существует
такое фа, что каковы бы ни были х, x'^R, фа (* + *') =
= фа(*)фа(*')> го всегда <ра(0) = 1, <ра(1) = а.
Эти условия определяют фа на множестве Z целых
относительных чисел, причем на N. функция фа совпадает с функцией
п —» ап.
Чтобы определить фа на /?, достаточно определить значение
фа(х) для *>0, поскольку фа(—*) = 1/фа(*). Заметим теперь,
что если я — натуральное, то, применив должным образом
равенство фа (X + X') = фа (*) фа (*') , ПОЛуЧИМ фа (tix) = (фа (х) ) п,
так как пх есть сумма п чисел, равных х. В частности,
Фа (л*') - (Фв (п) f - (Фв (лО Г = (аУ - (а"Т = апп\
если п, п! е Л?.
2. Теперь найдем, каким должно быть значение фа для
рационального х — г.
Рациональное число г есть класс эквивалентности пары (р, q)
целых чисел, причем отношением эквивалентности,
связывающим, (/?, q) и (/>', #'), будет /?#' = p'q. Иными словами, г
представляется как дробью p/q, так и дробью p'\q\ лишь бы pqf =
= p'q (д,Я'Ф0).
Поскольку должно быть фа (ял;) = (фа (я) )п, то необходимо,
чтобы ya(p/q) — (фа(1/?))р. Стало быть, достаточно знать
значение фа(1/<7), а затем удостовериться, что фа (p/q) = фа (p'/q)I,
когда pq' = p'q. Но при этом должно выполняться равенство
(фа (Ш) ) q = фа (9' 1/?) = фа ( 1) = Д. ЗнаЧИТ, фа ( 1/?) ДОЛЖНО
быть таково, чтобы его q-я степень равнялась а.
Итак, мы подошли к вопросу о том, существует ли такое
число х, что х<* = а, где а > 0, a q — натуральное, и то же
самое при любом q.
§ 2. Изучение функции *-**"
при натуральном п
Функция х —► хп определена для всех х е R и непрерывна
(это многочлен). Из тождества
х»-х'п~(х-х')(хп-1 + хп-*х'+ ... +а:,п""1)
вытекает, что если х > *' > 0, то хп > *'*, т. е. функция х-+хп
возрастает, если х ^> 0.
Так как м> 1, то #п > х, лишь только х > 1. Значит,
функция хп возрастает вместе с х. Наконец, 0п = 0.
Следовательно, функция х -+ хп для х > 0 непрерывна и
возрастает от 0 до + оо, когда х растет от 0 до + оо. Она
осуществляет гомеоморфизм множества /?+ неотрицательных
действительных чисел на себя (гл. III, разд. III).
306
КНИГА III. АНАЛИЗ
Обратное отображение имеет вид
х-+хХ1п (*>0).
Эта функция тоже непрерывна и строго возрастает от 0 до + оо.
Стало быть, для любого а > 0 существует, и притом
единственное, число х ^ 0 такое, что хп = а. Это число обозначается
через а1/п. Следовательно, решение уравнения хп = а
записывается как х = а}1п.
При этом, для того чтобы числа х^О, х' ^ 0 удовлетворяли
неравенству х>х' (соответственно х^х'), необходимо и
достаточно, чтобы для любого целого п > 0 выполнялось условие
хп > х'п (соответственно хп 1> х'п), а для того чтобы х = хг > 0,
необходимо и достаточно, чтобы хп = xf .
Таким образом, доказана
Теорема. Функция х-*хп осуществляет гомеоморфизм
множества [0, + оо[ на себя. При любых n^N и а^О
существует, и притом единственное, такое число х > 0, что хп = а.
Для того чтобы было х > х' (соответственно х > х\ х = х'),
при условии, что х и х' > 0, необходимо и достаточно, чтобы
для какого-нибудь натурального п выполнялось условие
хп > х'п (соответственно * хп > *'", хп = х'п) или хх1п > х'1/п
(соответственно Х{!п^Х/1/П9 Х]'п = Х'1/П).
§ 3. Определение и свойства выражения ar (r e Q)
Определение. Согласно результатам § 1, фа(1/я) = а1/п.
Обозначим через г рациональное число, представленное дробью p/q
или pf\q\ причем pqf = p'q. Должны выполняться равенства:
Фа(р/?)-(Ф«(1/?))р-(а1/Г,
Фа(р/9) = ФЛ(Р7?/).
Но для того чтобы <pa(p/q) = фа(р'/<7')> достаточно, по
предыдущей теореме, чтобы степени порядка qq' этих чисел были равны.
Имеем
(Фа ШГ' " «Фа ШГГ' = (Фа (11я)Г"' =
= ((фа(1/9))?Г' = (фа(1)Г' = а^,
(ф* (РЮГ' = ((Фа 0/<7'))Т' - (Фа (WW'™' »
= ((Фа(1/9')Г'Г = (Фа(1)Г = ар'';
а поскольку pq/==:p'q, то
(фа(р/?)Г' = (фа(/>7<7')Г'.
ГЛ. III. ОТОБРАЖЕНИЕ R В Я 307
Следовательно, фй(г) однозначно определяется посредством
С другой стороны, в силу свойств функции х-+х1/п, положив
b = (фл(p))Uq> получим bq = ya(p) = ap\ значит, Ъ={ар)х1(*. Но
Стало быть, {ya{plq))q = &* и (pa(p/q) — Ь. Таким образом,
<f>a(p/q)=:(aliq)p=(av)l/q' Следовательно, можно условиться
записывать фа (р/д) = а*/*.
Наконец, если г рационально и отрицательно, то, согласно
§ 1. должно выполняться равенство фа(0 = 1/фа(—0> что
определяет фа на множестве Q рациональных чисел. Полагаем
Фа (О =яг.
Свойства. Г ar • аг' = ar+r', каковы бы ни были r,r'^Q.
Действительно, пусть г = /?/#, г' = p'lq'. Для того чтобы два
положительных числа были равны, необходимо и достаточно,
чтобы равнялись их n-е степени. Допустим, что г, г' > 0 и
возьмем п = qq'\
/ рд'+р'д\ЯЯ'
= арч'аР* = apq'+p'q = la w' J = (ar+r')™'.
Если гигЧО, то arar' = ————г = v ,,. = ar+r/.
a r*a r а кг^г'
Если же r>0, r'<0, то
откуда в случае pq'>p'q получаем
nPQ' ( M-P'<i\qq'
±— = aM'-P'q=[a «*' j = (a'+r')qq\
а? ч
точно так же при pq'<p'q получаем
аР'я аР'я-Ря' \а-<г+п) K ' *
2° (a'f'-a"'.
3° ar'6r = (a&)r, каковы бы ни были г е Q и a, b > 0.
Доказательства проводятся при помощи того же способа,
состоящего в установлении равенства путем возведения в
надлежащие целые степени.
Обозначения. Если дано число а > 0, то a1/n представ-
п 2
ляется также в виде у а, а вместо |/а пишется У a . Эти
308
КНИГА III. АНАЛИЗ
символы называют соответственно корнем я-й степени и
квадратным корнем. Иногда также обозначают a*f(t при помощи
Уар, но это обозначение не удобно.
Правила вычисления. Хотя правила вычисления и
являются всего лишь перенесением предыдущих результатов, мы
все же укажем их.
Если г представлено дробями pjq и p'lq\ то aplq = ap,jq,\ если
p/q и p'\q' представляют два рациональных числа, то
ор\я . ap'lqf = aplq+p'iq' = a(pq,+p'qyqq',
nPlQ
(apuf1* = app'fqq\ ap/Q . bPlq - (abfq.
Замечание. Когда пишут ap/q, al!q> Ya, j/a , то при
этом подразумевают, что а есть положительное число и сами
эти выражения представляют положительные числа.
Для заданного натурального п все решения уравнения хп = а,
где х и а — действительные, можно выразить при помощи
предыдущих символов. Вот как это делается. Если п = 2р (четное),
то лгп^>0; значит, уравнение хп = а имеет решение только в
случае а^>0. Но если х является решением, то —х тоже будет
решением. Стало быть, достаточно знать положительные
решения. При а > 0 такое решение единственно, а именно,
2р — 2р
ai/2p= у а # Тогда другим решением будет— у а. Чтобы за-
2р /—
писать оба решения, применяют обозначения ± \а\ при этом
2р
а>0, у а >0. Если я = 2р+1, то а может быть
отрицательным. Так как функция х—>x2v+l возрастает от —оо до
+ оо, то уравнение лг2р+1 = а при любом а всегда имеет решение,
и притом единственное; это решение положительно, если а > 0,
и отрицательно, если а < 0. Но если а > 0, то этим решением
2р+1 _
будет а1/(2р+1)= J/а . Если а < 0, то положим а = —Ь\ тогда
2р+1
X2p+i = —й, или (—я)2*3*1 = 6, откуда - х = fc^+n = -j/y =
2р+1 2р + 1
= У —а; значит, л:= — у — а.
Изучение функции г—>аг. Мы изучаем функцию г—►а7",
исходя из того факта, что множество Q рациональных чисел
наделено топологией, определенной в главе II. Если г и г'— два
рациональных числа, то, поскольку а°=1, имеем аг' — аг =
= аг (аг'~г — 1). А так как аг — положительное число, то аг>' — аг
имеет тот же знак, что аг'~г — 1, и при г', стремящемся кг (в Q),
ГЛ. III. ОТОБРАЖЕНИЕ R В R
309
стремится к нулю в том и только в том случае, если ат'~т — 1
стремится к нулю.
Стало быть, возрастание и непрерывность функции аг
вытекают из свойств этой функции в окрестности точки г = 0.
Поэтому изучим разность аг—1. Так как arbr = (ab)r4 то, взяв
b = l/а (а>0), получим br = 1/аг = (\/а)г. Если а<1, то
6 = 1/а > 1, и ar—l = (l/b)r—l=(l—br)/br. Значит, при
положительном br выражение аг—1 имеет тот же знак, что
— (br— 1). Следовательно, если а > 1, а' < 1, то аг— 1 и а'г — 1
имеют противоположные знаки, и если одно положительно, то
другое отрицательно.
Допустим, что а>\. И пусть г = plq> 0. По теореме
предыдущего параграфа, для того чтобы а>1, необходимо и
достаточно, чтобы а1/?>11^.= 1, а для того чтобы alf<*>l9
необходимо и достаточно, чтобы (а1^)^ > 1? = 1, т. е. аг>\.
Значит, если а>1, то аг > 1 для любого положительного г.
Следовательно, если -г' > г и а > 1, то аг' — аг = аг (аг'~~г — 1) > 0.
Итак, функция г-+ат строго возрастает на Q при а > 1; при
а < 1 она строго убывает.
Для изучения поведения функции аг мы предварительно
установим следующее неравенство, называемое неравенством Бер-
нулли.
Пусть w — действительное число, причем 1 + w > 0; тогда
для любого целого п^-Х имеет место неравенство (1 + w)n^
£> 1 + nw.
Это неравенство легко доказывается индукцией по п. В са-
MOxM деле, для п = 1 оно верно. Допустим, что оно справедливо
для некоторого п. Умножив обе его части на 1 + w > 0, получим
(1 + w)nJrX >(1 + nw)(1 + w) = 1 + (п + 1) w + nw2> 1 + (п + 1) w.
Отсюда непосредственно следует, что если а > 1, то Игл ап = + оо.
Я->оо
Действительно, положив a=l+w, получим w > 0 и ап>- 1+дш,
откуда видно, что ап бесконечно возрастает вместе с п.
Последующее изучение обращено к величине (аг— 1)/г. Так
как а0 = 1, то это есть величина, которая образуется при
исследовании существования производной в точке г = 0
относительно Q. Из поведения этой величины мы выведем выпуклость и
дифференцируемость функции г~*аг.
Положим tya(r) = (ar—l)/r (f^O) и покажем, что функция
фа, определенная для любого а > 0 и для любого рационального
г Ф 0, есть возрастающая функция от г.
С этой целью мы преобразуем неравенство Бернулли. Пусть
и > 0 — произвольное число; положим 1 + w = ип п~1 , где
310 КНИГА III. АНАЛИЗ
„L. / ±_J_ \
n^2 — целое. Тогда и n~x ^l+n\un n~l — 1/. Умножив обе
части на и^п~1)^0у получим 1 ^и1^п"1) + п(и^п — итп~% или
П
Стало быть, последовательность ifa (1//г) убывает. В частности,
для любой пары целых р, q, удовлетворяющих условию q^p^-l,
будет выполняться q(u1^ — 1)<р(*/7р — 1). Число v = uXjv
является, как и и, произвольным действительным положительным
числом. Имеем м = и*, и тогда
<7(i>^-l)<p(u-l), или -2.(0^— 1)<о— 1, (1)
что может быть записано как фЛ-^) ^ФЛО для любого v>0
и 0<£<1.
Пусть теперь г и г' — два произвольных рациональных числа,
удовлетворяющих условию О < г ^ г'; пусть далее r/r7 = p/q.
Положим в (1) и = аг'; здесь а>0 может быть произвольно.
Тогда получим —(аг — 1)^аг — 1, и, после деления на г'>0,
у (аг—1) ^-р-(аг'~ 1). Таким образом, ФЛГ)"^^МГ') Для
любого а > 0 и любых рациональных чисел г, г', удовлетворяющих
условию 0 < г К г\
Если г и г' — два рациональных числа, удовлетворяющих
условию r4ir' <0, то, положив rjr' = plq и и =» аг, получим
i>>0, 0<-~<1; поэтому (1) дает г{аг' — 1)/г'<аг — 1, или,
после деления на г<0, —у—^ а ~ . Стало быть,снова имеем
iMr)^*Mr') для любого а и любых рациональных г и г7,
удовлетворяющих условию г ^rf < 0.
Наконец, если г и г' — два рациональных числа,
удовлетворяющих условию г < 0 < г', то мы положим г" = —г и
рассмотрим неравенство iMr")^iMr' + г"); оно записывается в виде
(r' + r'/)(ar"— 1)<г"(аг'+г" — 1). Разделив обе его . части на
аг" = дгг > 0, получим (г' + г") (1 - аг) < г" (аг' - аг), т. е. - г7 (аг—
— 1)<г"(аг' — 1), откуда в силу того, что г" = —г > 0, прихо-
ar-l ^ ar'-l
дим к неравенству <;—-,—.
Итак, каковы бы ни были отличные от нуля рациональные
числа г и г\ причем г<Сг\ и каково бы ни было действительное
ГЛ. III. ОТОБРАЖЕНИЕ R В R 311
число а > О, всегда
+•(')<*«(/"). (2)
где
Возрастание функции r-*tya(r) (гФО) равносильно тому,
что функция ах выпукла для рациональных х.
В самом деле, пусть х и у —два произвольных
рациональных числа, причем х > у, и пусть а — произвольное
рациональное число в пределах 0 < а< 1. Если допустить, что ах выпукла,
то должно выполняться неравенства* аах^1~а^■< аах + (1—a)av,
т. е. аах-Н{-^У — аУ^а(ах — аУ). Умножив обе части этого
неравенства на положительное число (л: — y)arvf получим
(х - у) [аа<х~У) - 1] < а (х - у) (ах~У - 1).
Положив затем г = а(х — у), г'= х — у, видим, что 0<г<г',
и rr(ar — l)^r(ar' — 1), откуда и следует, что
♦«(')<♦* И-
Обратное утверждение доказывается рассуждением, прове-
деннЫхМ в обратном порядке.
Поскольку множество Q рациональных чисел наделено
топологией, определенной в главе II, мы изучим теперь функцию
г —>аг, определенную на Q.
Если г и г' — два рациональных числа, то
a? -ar==ar(ar'~T-\).
А так как аг — положительное число, то аг' — аг имеет тот же
знак, что и аг'~г— I. Тогда в случае, если г' — г>0, пусть
rf — r = pjq\ если а>1, то по теореме предыдущего параграфа
получим axlq>\ и apfCf = (а1/")р > 1; значит, аг'>аг, и функция ат
строго возрастает. Если а<1, то мы положим &=1/а; тогда
Ъ>\ и аг = 1/йг, и стало быть, аг строго убывает. Поэтому для
изучения вопроса о непрерывности достаточно исследовать
поведение разности аг'""г— 1, когда г'— г стремится к нулю. Но
для любого рационального r" = r' — r, удовлетворяющего
условию \г"\<1, выполняются неравенства
ФЛ-1)<гЫ>-'')<^(1).
Стало быть, фв(г") ограничена и
стремится к нулю, если г" стремится к нулю. Следовательно, ат
есть непрерывная функция на Q.
Подытожим эти результаты.
3*2
КНИГА III. АНАЛИЗ
Теорема. Функция г-+аг, определенная на Q, обладает
следующими свойствами:
Г Она строго возрастает, если а > 1, и строго убывает, если
а<\.
2° Если а>\, то lirh ar= + oo, lim аг = 0; если а<1, то
lim ar = О, lim а7 = + °о.
Г-> Ьоо Г->— оо
3° Она непрерывна на Q.
4° Ояа выпукла на Q.
Замечание. Если а = 1, то аг = 1 при любом г; если а = 0,
то аг = 0 при любом г =£ 0; значение 0° не определено.
§ 4. Функция х-»ах
Попытаемся определить функцию фа на множестве R
действительных чисел так, чтобы для любых х, /g/? выполнялось
равенство фа(х + х') = фа(*)фа(*')- В предыдущих трех
параграфах мы определили функцию фа на множестве Q
рациональных чисел. Напомним, что найденные нами два необходимых
условия фа(0)= 1 и фа(1)=й позволили сразу же определить
значение фа(^)=^г, как только было доказано, что для а >0
и целого п > 0 уравнение хп = а имеет единственное
положительное решение. Чтобы определить ах для всех действительных
х, мы продолжим функцию г-+аг по непрерывности.
Воспользуемся результатом, доказанным в этой же главе (разд. I, § 3):
для того чтобы f(x) стремилась к Я, когда х стремится к х0,
необходимо и достаточно, чтобы lim f {xn) = Я, какова бы ни
П->оо
была последовательность {хп), стремящаяся к х0.
Пусть х — действительное число, а (гп)—возрастающая
последовательность рациональных чисел, стремящаяся к х. Если
г > х — некоторое рациональное число, то гп4^х<г. Числовая
последовательность (аГп) будет возрастающей и ограниченной
числом аг, ибо функция г —>аг возрастает. Следовательно, (аг«)
имеет предел (который мы обозначим через Х(х)),т. е.Я(л:) = ПтаЧ
П->оо
lim rn = x.
Если (г'п) есть убывающая последовательность
рациональных чисел, тоже стремящаяся к х, то [а п) также имеет предел,
и этим пределом снова будет Л (я), поскольку гп — г'п стремится
Г / Г ( Г -Г \
к нулю, и ап — ап = ап\ап п— I) стремится к нулю, так как
г->аг непрерывна на Q.
Пусть (рр) —произвольная последовательность рациональных
чисел, стремящихся к х\ a9f> вновь стремится к Х(х), когда р
ГЛ. III. ОТОБРАЖЕНИЕ R В R
313
стремится к бесконечности, поскольку для любого р можно
указать такие rpf r'p, что (гр) возрастает, а (г'р) убывает, и
гр<9р<т'р для любого /?, откуда агр<арр<ар\ а так как
lim arp= lim ap = X(x), то и lim аРр = Х(х).
Положим %(х)=ах. Тем самым функция х~*ах определена
на /?. Если х = г, то очевидно, что так определенное значение
этой функции есть аг.
Докажем, что функция х-*а* непрерывна. Достаточно
показать, что для любой последовательности (хп) действительных
чисел, стремящихся к х, aXfl стремится к ах. Но любому хп
можно отнести рациональное гп так, чтобы lim | хп — гп | = 0 и
\ахп — а л|<еЛ, причем lime„ = 0. А так как хп стремится к х,
П->оо
то и гп стремится к ху поэтому а*п вместе с аГп стремится к ах.
Теорема 1. Какова бы ни была последовательность (гп)
рациональных чисел, сходящаяся к х е /?, последовательность
(аГп) имеет конечный предел, обозначаемый ах. Полученная та-
ким путем функция х-+ах определена и непрерывна на R и
называется показательной функцией с основанием а. Для х = г
она совпадает с функцией г —> аг.
Теперь мы установим другие свойства показательной
функции. Пусть х, х' е R\ (гЛ) и (г£) — две последовательности
рациональных чисел, сходящиеся соответственно к х и х'. Так
г +г' г г
как ап п = апап и так как гп + гп сходится к х + х', то ах+х =
= ах • ах\ Покажем, что {ах)х = ахх'. Функция x->xl/i (q— целое)
непрерывна для #>0; это есть функция, обратная к x->xq.
Если /? — целое, то функция x->(x],q)p = xp,q тоже непрерывна,
т. е. х-+хг непрерывна для х>0.
Если г—рациональное число и последовательность
рациональных чисел гп стремится к х, то {ах)г, по определению,
равно угу где у = ах. Но ап стремится к ах> а функция у-*уг
непрерывна в у. Следовательно, lim (аГп) = (ах)г. Но (аГп)г = a v,
П->оо
и в силу непрерывности функции х->ах имеем lim аГпГ~ахг.
П->оо
Отсюда (ахУ = ахг.
Пусть теперь х' = lim r'n\ непрерывность показательной функ-
ции с основанием ах влечет lim (ах) п = (axf. Но (ах) п — аХГп,
П->оо
и непрерывность показательной функции с основанием а влечет
lim axrn =?= ахх\ Отсюда для любых х, *'е /? получаем (а*)*' = а**'#
Л->оо
314 КНИГА III. АНАЛИЗ
Наконец, каковы бы ни были а, Ь>0 и x&R, имеем
ахЬх = (аЬ)х, ибо если
х = lim rn, то axbx = lim dn lim ЬГп =
Л->оо Я->оо Л->оо
= lim аЧг" = lim (ab)r" = (ab)x.
Я->оо Я->оо
Таким образом, каковы бы ни были х, xf ^ R и a, b > О,
а а = а , (а ; = а , а о = (ас?) .
Из этих равенств вытекает, что
а * = —, ( —) = —, —- = ах *.
ах \а/ ах ах
Завершим изучение функции х-*а* исследованием вопроса
о ее возрастании. Так как ах— ах' = ах' (ах~~х' — 1) и так как
ах' > О, то достаточно выяснить, будет ли для х > 0 ах > 1 или
ах<1. А поскольку (\/а)х = 1/ах, то достаточно ограничиться
изучением случая а> 1.
Итак, пусть х > 0, и пусть (гп) — возрастающая
последовательность рациональных чисел, стремящаяся к х. Для
достаточно больших п имеем гп > р > 0, где р рационально.
Следовательно, аГп>ар>а° = 1. А так как а*= lim аЧ то из этого вы-
П-><х>
водим, что ах^>ар>1. Стало быть, функция х->ах строго
возрастает при а > 1.
Если х стремится к +оо и если п — ближайшее целое число,
меньшее ху т. е. п ^.х <п + 1, то ап^ах, чем доказано,
что Mm a*=+oo, если а>1. А поскольку от* = 1/а*, то
lim а* = 0, если а < 1.
Эти результаты объединяются следующей теоремой.
Теорема 2. Если а>\, то функция х-+ах строго
возрастает,
lim а* =+00, lim ax — 0.
£ ели 0 < а < 1, го х -* а* строго убывает,
lim а* = 0, lim а* =+00.
Отметим, что случаи а = 0, а = 1 не представляют интереса,
ибо 0* = 0 для х=£0, 1* = 1.
Исследование, проведенное в этих четырех параграфах,
может быть сформулировано в очень краткой форме.
ГЛ. III. ОТОБРАЖЕНИЕ R В R 315
Cfa'J'ffty
a<1
«2Г X+JC
В самом деле, если а>0, аф\, то функция х-+аху будучи
непрерывной и строго возрастающей или убывающей и
изменяясь между 0 и +оо, осуществляет гомеоморфизм между
множеством R действительных чисел и множеством R+
положительных действительных чисел (рис. 21). Кроме того, эта функция,
сохраняя свойства, наложенные
первоначально на фа, переводит
аддитивную группу действительных чисел
в мультипликативную группу
положительных действительных чисел
(ах+х' = axs а*').
Итак, каково бы ни было а > О,
отличное от единицы, функция
х-+ах осуществляет гомеоморфизм
между ]—оо, +оо[ и ]0, +оо[ и
переводит аддитивную группу
действительных чисел в
мультипликативную группу положительных
действительных чисел.
Важное замечание. Определение ах для ОО и
любого действительного х позволяет в то же время придать смысл
символу xv при любом х > 0 и любом y^R; это есть значение
для у показательной функции с основанием х.
§ 5. Функции log а X И X
Определение 1. Обозначим через #-»logaA; отображение,
обратное к х-+ах (а > 0, а ф 1). Эта функция называется
логарифмической функцией с
основанием а.
Следовательно, по опре-
~а>1
Рис. 21. Функция х -+ах.
1од0я'
ни были х > О,
Рис. 22. Функция x->logax.
при а < 1 (рис.
ни
22). Так как at
делению,
* = aIog**,
каковы бы
а > О, аф\. Функция
*-*loga* определена при
всех а > О для х > 0. Она
непрерывна, строго возрастает
при а > 1 и строго убывает
= 1, то loga 1 = 0, каково бы
каково бы ни
-о _
было а > 0. Так как а1 = а, то loga а == 1, каково бы
было а > 0. Соотношению а*+*' = а* • а*' отвечает равенство
loga хх'«loga х + loga х' (а > 0, х, х' > 0).
1
Отсюда log,, — = — log^ x. Соотношению
loga (**') = X' bga X (х> 0)
(axf = а**
отвечает
316
КНИГА III. АНАЛИЗ
Если а> 1, то
lim loga#=+<x>, Hm logaA;~—oo.
X-++00 X->+0
Если a< 1, то
lim loga# = — oo, Hm loga#=+oo.
JC->+oo X->+0
Последние, два свойства являются перенесением на
логарифмы свойств функции а* (теорема 2 из § 4).
Соотношение loga xx' = logax + logax' означает, что
произведению двух положительных чисел х, х' логарифмическая функ-
Рис. 23. Функция х~>ха
\сс<0 ,а>/ ЦИЯ ставит в соответствие сумму
их образов.
Итак, функция х —► loga x
определяет гомеоморфизм между
]0, +оо[ и ]—оо, +оо[ и
переводит мультипликативную группу
положительных действительных
чисел в аддитивную группу всех
действительных чисел.
Замечание. Легко
находится соотношение между
логарифмами одного и того же
числа х > 0 относительно
оснований а и 6. Действительно, x = alogaX, откуда logbA: =
= loga x • log& а. И значит, loga x = log*, x. loga 6, откуда
logab-log&a= 1.
Определение 2. Обозначим через х-+ха функцию, которая
всякому х > 0 и a e R ставит в соответствие число ха. Эта
функция называется степенной функцией.
Нами уже отмечалось (конец § 4), что определение
выражения ах было дано для любых а > 0, x^R. Заменяя а на х,
х на а, получаем обычное обозначение функции *—►#*.
Из тождеств х = аХо%ах и (а*)*' = ахх' следует:
ха = аа10ё«х.
Свойству axbx = (ab)x (a, b > 0) отвечает соотношение
{xx'f = хах'а (х, х' > 0, a e= #).
Так как ха = аа loga* , то степенная функция х-*ха
является композицией логарифмической функции л:—►logaл: на
показательную. Это позволяет сразу же сформулировать свойства
степенной функции (рис. 23).
ГЛ. III. ОТОБРАЖЕНИЕ R В R 317
1° Степенная функция строго возрастает, если а > О, и строго
убывает, если а < 0.
2° Она непрерывна для х > 0.
3° Если а>0, то lim ха = 0, lim #а=+оо.
Если а<0, го lim #а=+оо, lim xa = 0. ^
В итоге эти свойства выглядят так: всякая функция х-*ха
(а е R) определяет гомеоморфизм между ]0, + оо[ и ]0, + оо[ и пе-
реводш мультипликативную группу положительных чисел в себя.
Замечания. 1° я0 — 1, каково бы ни было х > 0.
2° Если а = п, где п — натуральное число, то ха = хп; таким
образом, многочлен является конечной линейной комбинацией
степенных функций.
3° Если а = —п есть целое отрицательное число, то ха=1/хп.
§ 6. Дифференцирование показательной функции. Число е
Теперь мы исследуем, имеет ли функция х —> ах производную.
С этой целью составим отношение
а*' - ах х ах'~х -\ , , А
для которого мы должны найти предел, когда xf стремится к х,
т. е. когда х' — х стремится к нулю. Так как 1 = а0, то
предыдущее равенство указывает, что если показательная функция
имеет производную при х = 0, то она имеет производную в
любой другой точке. Если при х — 0 производная существует и
обозначается через Х(а) (ибо ее значение зависит от
основания а), то производная в точке х будет равна ахХ(а). Но в
процессе изучения аг мы показали, что функция
г-*«(г)--^ (гФО)
возрастает, т. е. «фа (г) < г|>а (г'), если г Кг'.
Пусть х Ф 0 и (гп) — последовательность рациональных
чисел, сходящаяся к х. Тогда
t. ап-\ ах-\ , , ч
Значит, функция x-*tya(x)--= (ах—1)/х (хфО) тоже
возрастает (в R).
Как и в рациональном случае, этот факт равносилен
выпуклости функции х-+ах.
Так как функция х-^>ах выпукла, то она имеет правую и
левую производные в каждой точке, в частности и в точке х = 0,
т. е. (ах— 1)/х имеет конечный предел, когда х стремится к нулю
318 КНИГА III. АНАЛИЗ
по положительным значениям, и конечный предел, когда х стре-
мится к нулю по отрицательным значениям. Но ——— ==
= — = ^ = — • - » а поскольку lima*=l, то (ах — 1)/*
# — xcl а х х->о
имеет один и тот же предел при х—>0 как справа, так и слева.
Следовательно, tya(x) = (ах—\)/х имеет в х = 0 предел,
который мы обозначим t|?a(0), после чего можем сформулировать
теорему.
Теорема 1. Функция х-+ах непрерывна, выпукла и
дифференцируема. Если ее производная при х = 0 равна tya (0),
то (ах)' = фа(0)а*.
Отсюда следует, что эта функция бесконечно
дифференцируема и что
(ахУп>=(Ъа(0))па\
Ясно, что для дальнейшего было бы удобно выяснить,
существует ли такое а, при котором tya(0) = 1, ибо для этого числа
п-я производная в точке х будет равна а*. В § 5 показано, что
если а>0 и & >0, то a = 6Iog*a, a* = bxlogt>a. По теореме
дифференцирования сложных функций имеем
-^-(а') = фв(0)ах = (^1оеи)^(0).1од,а = а^(0)1о§6а,
где ^а(О) есть производная от х—>ах при х = 0. Отсюда фа(0) =
=* -фь (0) logb а. Зафиксируем Ь и заставим а изменяться от 0 до
+ оо. Тогда г|эа(0) с точностью до постоянного множителя равно
log&a, и значит, возрастает от —оо до +оо или убывает от
+ оо до —оо. Следовательно, найдется, и притом единственное,
число.е, при котором ty<?(0) = 1. Но поскольку loga6*log&a= 1,
то фь(0) = loge(6). Стало быть, функция x-*tyx(0) для jc>0
имеет вид x-*logex\ ^x(0)= loge*.
Выражение logeA: называется неперовым логарифмом числа*
и записывается In а: вместо logeA:. Значит, tya(0)=lna.
В итоге
(ах)' = ах\па, (ех)' = ех
при любом x^R и при а > 0.
Отсюда для п-п производной получаем
(о*)<я>«а*(1па)я, • (е*)<л>-е*.
По теореме о дифференцировании обратной функции
(разд. VI, § 2) производная от loga* равна 1/(л;1па), а
производная от In л: равна 1/х.
Теорема 2. -^(logaх) = -—^, -^ (In *)«-j- (*>0).
ГЛ. III. ОТОБРАЖЕНИЕ R В # 319
Отметим, что производная от \пх является рациональной
функцией и что функция х -> In x бесконечно дифференцируема
для х > 0.
Важное значение. Согласно теореме о дифференциро^
вании сложных функций, если и есть положительная функция,
дифференцируемая в точке л;0, то функция х—>\пи(х)
дифференцируема в точке х0 и j£-{\nu{x))= "(*°; *
Возьмем, в частности, #(#) = |л;| для любого хФО. Так как
In J л: | определен при любом действительном х, отличном от нуля,
и так как производная от \х\ равна 1 при х > 0 и —1 при х < 0,
то
JL(ln|*|)=4 (хФО).
Этот часто используемый результат формулируется так:
примитивная функции х—*1/х, определенной для всех
действительных х, кроме нуля, есть функция х-*1п|л;|.
Из предыдущих результатов сразу же выводим, что функция
х-+ха (аеЛ, ^>0) дифференцируема. Действительно, ха =
= еа1пх. Отсюда
^(ха) = jealnx = j ха =аха~1.
Обратно, если аФ1у то примитивная функции х-*ха есть
х-»ха+1/(а+ 1).
Теорема 3. При любом х>0 функция х-*ха (а е R)
имеет производную аха~х.
Свойства числа е. Число е было определено посредством
равенства if>e (0) = L Напомним, что г|эа(0) есть предел выражения
1|?а(л:) = (ах—1)/х, когда х стремится к нулю. Значит,
lim tye {x)= 1. А поскольку функция х—>^е{х) возрастает, то
для любого у > 0 имеем
+'(-7ТГ)<1 <*•(?) •
— (У+ 1)(е~1«У+»- 1)< 1 <уИ*- 1).
или
Левое неравенство дает е1/(^+1) <! И—, а правое дает
1+-<^1^. Отсюда
(1+1)Ч.<(.+гЧ'4Г('+7)-
320
КНИГА III. АНАЛИЗ
А так как lim (1+—) = 1, то
е = lim (l+jf.
Для у =10 имеем И10. 1(Г10<е<1111 - КГ11, т. е.
2,59 <е< 2,86.
Важно знать, что число е не рационально, ибо если бы этим
числом было, например, 8/3, то незачем было бы называть его е.
Последнее неравенство показывает, что оно не целое; в
дальнейшем (Книга IV, гл. III) мы покажем, что оно не рационально.
Все рассмотренное выше может быть обобщено. Пусть у есть
положительное действительное число, которое мы заставим
неограниченно возрастать, и пусть к есть фиксированное
действительное число. Предположим сначала, что х > 0. Тогда
*.(-^)<*.(°>-1<Мт)'
т. е.
. £±JL (e-*/u+y> - 1)< 1 <-J (exy - I).
Эти неравенства дают
е*'<*+^<1+ — и 1+-<е*Ч
0 У
Следовательно,
('+*)'<«*<('+ 7)" <»
А так как lim 11 + —) = 1, то это двойное неравенство влечет
у-*оо \ У I
ех= lim (l + —)У.
у->+оо \ У I
В частности,
ех = lim 11 Н— для целых п.
Из (1) получаем также неравенство
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 32l
верное для произвольных г/>0, а из него выводим, что
Для фиксированного у и бесконечно возрастающего х
выражение в скобке в правой части стремится к 1/(у + 1), и значит, его
у + 1-я степень остается ограниченной. С другой стороны, х
в*
неограниченно возрастает; следовательно, lim — =-}-оо, ка-
Х->+оо Х
ково бы ни было г/ X).
Для х < О использование неравенств
.♦.(f)<*.(0)-K+.(-7TF)
снова приведет к двойному неравенству (1), которое, таким
образом, верно для всех x^R и всех у > 0; утверждение для
пределов также остается справедливым, т. е.
ех= lim (1+^)У-lim fl + ^f.
ГЛАВА IV
ИНТЕГРИРОВАНИЕ ДЕЙСТВИТЕЛЬНЫХ ФУНКЦИЙ
ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО
Эта глава имеет огромную важность. И важность эта
проистекает, прежде всего, из того, что интегральное исчисление
используется во всех науках, а также из того, что в настоящее
время математическая сторона вопро- „,
са может считаться полностью
выясненной.
Иногда в элементарном изложении f(x)
задачу представляют на интуитивный
манер следующим образом. Пусть f
есть действительная функция
действительного переменного ty определенная -
и непрерывная на [а, Ь]. Для любого
х е [а, Ь] рассматривается площадь ча- рис, 24.
сти плоскости, ограниченной осью /,
параллелями к оси у (на которой откладываются значения
£/ = /(*) функции /) и другой, изображающей функцию f. Для
простоты предполагается, что /X) (рис. 24). Площадь,
полученная таким путем, является функцией от х\ обозначим эту
И Ш. Пизо, М. Заманский
322
КНИГА III. АНАЛИЗ
функцию через F. Остается предположить, что F непрерывна и
имеет для всех х производную, в точности равную f(x).
ъ
Если х = Ъ, то общая площадь обозначается через J f(t)dt;
а
площадь, соответствующая интервалу [а, х], обозначается через
х
J f(t)dt = F{x). Тогда F'(x) = f(x), F(a)=0.
а
В этом изложении все основано на одной лишь интуиции.
Строго ничего не определено. Можно было бы думать, что для
любой функции, не обязательно непрерывной, существует
примитивная (а это неверно); что интегральное исчисление
предназначено для отыскания примитивных функций в предположении,
что функция их имеет, и т. п.
Элементарная теория интегрирования, изложенная в этой
главе, порывает с некоторыми традициями. Обычно
определялся интеграл Римана и затем показывалось, что всякая
непрерывная функция интегрируема в смысле Римана; практически
же использовались лишь интегралы от непрерывных функций,
а надуманные задачи и бесполезные переходы к пределу лишь
направляли использование интеграла от функции, имеющей
несколько разрывов.
С другой стороны, уже пятьдесят лет как интеграл Лебега
сделал интеграл Римана бесполезным. И мы считаем, что
необходимо как можно раньше научиться пользоваться понятием
интеграла от,функций, не обязательно непрерывных.
Наконец, настоящая простая функция, а именно взятая из
физики, является ступенчатой; определение же интеграла
ступенчатой функции проводится легко и в полном согласии с
интуицией. Для расширения такого понятия интеграла мы
обращаемся к равномерной сходимости, и на этом пути придем
к ярусным функциям, которые могут иметь счетное множество
точек разрыва и часть коих составляют функции непрерывные и
функции монотонные.
Так мы получаем понятие интеграла для достаточно
широкого класса функций, которые все интегрируемы в смысле
Римана, что мы по ходу дела указываем; при этом они не
исчерпывают всех функций, интегрируемых в смысле Римана, но
широко покрывают все элементарные потребности.
Этот метод, состоящий в определении понятия интеграла
путем пополнения векторного пространства Ф ступенчатых
функций, наделенного* нормой равномерной сходимости, не привносит
никакой теоретической новизны, и, более того, рассмотрение в Ф
другой нормы дает возможность определить интеграл Лебега,
понятие которого выходит за рамки этого курса.
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 323
I. ИНТЕГРАЛЫ ОТ СТУПЕНЧАТЫХ ФУНКЦИЙ НА ИНТЕРВАЛЕ [а, Ь]
§ 1. Определение интеграла
Определение. Если ф есть ступенчатая функция на [а, Ь]
(а<Ь), принимающая значение 4 на открытом интервале
]а&, afc+j[, то интегралом от ф по интервалу [а, Ь] называется
действительное число
п~\
2 h(<*k+\ -а*) («j = a<«l < • • • <«л = 6).
Это число обозначается q>(t)dt. Мы будем также обозначать
а
его /(ф). Имеем
ь
I (ф) = J Ф (/) Л = /0 (а! - а0) + /i (а2 - а,) + ... + ln-x (an - а,^).
а
Если положить ^ = «^+1 — а&>0> то можно записать инте-
п—1
грал в виде /(ф)= 2 /л»**.
Выражение «ф интегрируема на [а, й]» означает, что для ф
можно указать это число /(ф).
Переменное t, называемое также переменным
интегрирования, фигурирующее в символе, представляющем интеграл от ф,
есть немое (связанное) переменное, т. е. букву t можно
заменить другой буквой и, 0, ...
Интервал [а, Ь] называется интервалом интегрирования.
Общие замечания (ср. гл. III, разд. IV).
1. Значение интеграла /(ф) не зависит от чисел ф(ал); стало
быть, можно изменить значение ф в точках ал, не изменив
значения интеграла.
2. Функция ф = 1 есть ступенчатая функция на [а, Ь] и
ь
$ ldt = b-a.
а
3. Пусть в [а, Ь] имеется интервал с концами а, р, и пусть %
есть функция, определенная как %(х)=1, если х<=]а, р[,
ь
Х(*) = 0, если хф]а, р[. Имеем J %(t)dt = $ — a.
а
Ъ
4. В определении, данном для J y{t)dt, точки ал образуют
а
разбиение, которое служит для определения ф. Значит, может
и*
324 КНИГА III. АНАЛИЗ
показаться, что интеграл зависит от этого разбиения. На самом
деле это не так. Действительно, пусть р— точка из интервала
]ctft, afe-i[. Функция ф снова может быть определена при
помощи разбиения
a = aQ<a{< . .. ak <р<а^+1 < ... <% = &
(гл. III, разд. IV). Определим затем ступенчатую функцию y
равенствами:
Y(я) = ф(а:), если хе]ар, ар+1 [(р =И= &),
Y(ар) — Ф(ар)> каково бы ни было р = 0, 1, ..., п,
у(х) = <р(х), если x<=]ak, р[ или *е=]р, ай+1[, и у(Р) = ф(Р)-
Очевидно, y=^> и
(/0 (а! - ао) + ... + /*-1 (ал - afe-j) + /л (Р - aft) + 4 (aft + 1 - Р) +
+ 4+i(a^+2^«fe + i)+ ••♦ +/rt_,(aft —an-!) =
Применив это рассуждение конечное число раз, видим, что,
каковы бы ни были точки а£ = а<а'< ... <о!т = Ь,
Ь т-\
/ф(ол-Ц/;(а;+1-аа.
a fe=0
где Vk есть значение функции ф на |а£, <Хр+1[.
5. Точно так же если y—ступенчатая функция, отличаю-
ь
щаяся от ф лишь в конечном числе точек, то \ у (t) dt =
а
Ь
= j y(t)dt. Действительно, достаточно показать, что в предыду-
а
щем доказательстве можно взять у($)Ф ф(Р); но это очевидно.
В частности, если изменить значения ф в точках ее разрыва, то
интеграл не изменится.
6. Пусть ф — ступенчатая функция на интервале [a, b]\ тогда
она будет ступенчатой и на любом интервале [а, р] с: [а, Ь\
Рассмотрим функцию фь определенную на [а, Ь] как ф!(л;)=ф(л;)
для х <= [а, р] и ф! (х) = 0 для х ф [а, р]. J Ф1 (t) dt есть интеграл
a
от ф по [а, р]; чтобы это увидеть, достаточно взять разбиение
[а, Ь\ содержащее точки ос, р. Говорят, что ф интегрируема по
любому замкнутому интервалу, содержащемуся в [а, Ь]. В част-
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 325
ности, если ф(х)= /* на ]aki ал+il. то j (p(t)dt = lk[ik, и тогда
записывается
J ф(0 Л = S /ft (a*+1 ~ a*) = S J 'О Л.
a fe=0 ak
7. Интеграл от ступенчатой функции по интервалу, сводя-
a
щемуся к точке, равен нулю, т. е. j <p(t)dt = 0.
а
§ 2. Свойства интеграла от ступенчатых функций
1. Если Я — произвольное действительное число, а ф —
ступенчатая функция, то функция y = А*ф тоже является
ступенчатой. Если на ]ад, ajH-i[ имеем <p(x) = /*, то у(*) = Дь» и
Ь я-1 я—1- Ь
a k=0 k=0 a
Стало быть, /(Яф)= Х/(ф). В частности, /(—ф) =—^(ф)-
2. Если ф и y — Две ступенчатые функции, то ф = ф + у —
тоже ступенчатая. Пусть имеется такое разбиение [a, b] при
помощи точек pft, что ф (*) = ** +'л на ]Pft«Pft+i[ (£=0,1, ..., /п),
причем /^ и /£—значения соответственно функций ф и y на
этом интервале. Имеем
Ь т-\
a fc=»0
m—1 m—1
в силу замечания 4 предыдущего параграфа, получаем
ъ ь ь
jty(t)dt= J <f(t)dt+ jy(t)dtt
a a a
ИЛИ /(ф + У) = 1(ф) + Цу)-
Пусть теперь Ф есть векторное пространство над R
ступенчатых функций на [а, 6]. Каждой функции ф<=Ф ставится
325 КНИГА III. АНАЛИЗ
в соответствие число /(ф)- И предыдущие два свойства
принимают такой вид.
Теорема 1. Отображение ф-»/(ф) пространства Ф в R
есть линейная форма на Ф.
Иногда сокращенно говорят, что интеграл от ф есть
линейная форма от ф.
ь
Значит, если 0 есть нулевая функция, то /(0) = Г 0Л = 0.
а
Интеграл от нулевой функции равен нулю. Обратное неверно.
Так, пусть ф(л:)=1 на [—1,0], ф(л:) = —1 на ]0,+1]. Тогда
+i
[ <р (/)<# = 0, но, однако, ф Ф 0.
-1
Замечание. Пусть для любого интервала ]а, (3[ функция
Х(а, Р) определена как %(а, р, х)=1, если *е]а,р[, и
х(а, р, х) = 0, если хф]а, р[. Мы отмечали уже (гл. III,
разд. IV, § 2), что всякая ступенчатая функция ф всюду, кроме
конечного числа точек, является конечной линейной
комбинацией функций X» отнесенных интервалам ]а&, a*+i[. Так как,
с другой стороны, интеграл от ф не изменится, если изменить
значения ф в конечном числе точек, то для интегрирования мож-
п-\
но заменить ф на 2 hlk> гДе %ч = х(а&> «ли). А поскольку
о
ф->/(ф) есть линейная форма, то
/ (ф) = / (S /fexA> = 2 /ft/ Ы = S W
Следовательно, можно было бы, исходя из функций х>
отнесенных любому интервалу из [а, 6], определить /(х(а, Р)) = Р — а,
а затем определить /(ф) при помощи той же линейной
комбинации, которой определялась ф, исходя из функций х-
3. Интеграл от произведения функций. Если ф и у — две
ступенчатые функции на [a, b\ то произведение щ тоже есть
ступенчатая функция, но интеграл от произведения, вообще
говоря, не будет равняться произведению интегралов.
Так, возьмем ф = у = 1- Имеем /(ф) = 1(у) = (Ь — а),
I(<p)I(y) = (b-a)M(w) = b-a.
4. Функции ф+, ф~, |ф| являются ступенчатыми, если
такова ф, и значит, они интегрируемы.
Поскольку ф = ф+ + ф- и |ф| = ф+ — ф~ (гл. III), то
/(Ф)=/(ф+)+/(ф-),/(|ф|)=/(ф+)-/(ф-).
5. Неравенства. Пусть ф — неотрицательная ступенчатая
функция на [а, 6], т. е. ф(#)!> 0 для любого х. Тогда /&^>0, и так
л—1
как \ik = ан+\ — ah > 0, то 2 /*Уа > 0.
Лг=-0
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 327
Отсюда вытекает
Теорема 2. Интеграл от неотрицательной (соответственно
неположительной) функции есть неотрицательное
(соответственно неположительное) число.
Обратное неверно. Так, для ф, определенной как ф(#)= 2 на
2
[О, 1] и ф(*) = — 1 на ]1,2], имеем j ф(/)Л = 2- 1-1. С дру-
о
ъ
гой стороны, предположим, что ф > 0 и Г ф (/) rf/ == 0. Тогда
а
tk\ik = 0. Так как эта сумма составлена из неотрицательных
чисел, то непременно 1ъ\хь = 0 при любом k. А поскольку \ik > 0,
то lh = 0, каково бы ни было k. Значит, ф равна нулю всюду,
кроме конечного числа точек.
Обратно, если числовая функция ф, определенная на [а, Ь],
равна нулю всюду, кроме конечного числа точек аъ, (осо< ai<...
... <ап), то это ступенчатая функция, и ее интеграл равен нулю,
поскольку он определяется только значениями ф на открытых
интервалах ]а&, ак-\ [.
Следовательно, для того чтобы неотрицательная ступенчатая
функция имела нулевой интеграл, необходимо и достаточно,
чтобы эта функция обращалась в нуль всюду, кроме, быть
может, конечного числа точек.
Из предыдущей теоремы вытекают следующие утверждения
и неравенства.
Интегралы от функций ф+ и |ф| неотрицательны. Интеграл
от ф~ — неположителен.
Если ф и y — Две ступенчатые функции на [а, Ь] и ф ^ у, т. е.
ъ
если ф(#) > у(х) для любого х, то ф — у > 0, и j (ф(t)—у (t)) dt ^
а
> 0, откуда в силу линейности
ъ ь
j <f{t)dt- jy(t)dt^0;
а а
значит,
Ь Ь
j<p(t)dt^fy(t)dt.
а а
Это неравенство, дающее начало часто употребляемым
верхним оценкам, записывается в следующей, более удобной форме.
2
328
КНИГА III. АНАЛИЗ
Если ф <^ у то
J Ф(0Л< J y(t)dt.
(1)
Так как —|ф|^Ф^|ф|, то для любой ступенчатой функции
Ф имеем
ь ь ь
- J | <р(0 |Л< J" <р(*)Л< J | ф(/) \dt.
а а а
Но из неравенств —|а|-<р^|а| между действительными
числами следует, что |р|^|а|. Значит,
jq>(t)dt <||ф(0|Л, или |/(ф)|</(1ф|).
(2)
Пусть теперь || ф || = sup | ф(д:) |; тогда для любого х имеем
X
I Ф (л:) | ^ II ФII = sup | ф (л:) |.
Если у есть ступенчатая функция, равная |]ф|| на [a, fe], то
|ф|<у> и значит,
ь ъ ъ
Jl<p(OI<tt<J y(0*= /Иф11Л-(6-а)||ф||.
а а а
Следовательно, для любой функции ф
Ъ I Ь
J | Ф(0 |Л < J |Ф(01Л <(6 - «)supI ф(-^) 1 = (& — а)||Ф||9
или
|/(ф)1</(1ф1)<(*-а)11ф|1-
Тогда неравенство |ф + у|^>1ф1 + М Дает
(3)
|(ф(0 + у(0)Л <|1ф(0 + у(01Л
<
<
l\y(t)\dt+j\y{t)\dt,
или
|/(<p + Y)l</(|q> + Yl)</(lq>l) + /(lYl).
(4)
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 329
Точно так же неравенство ||ф| — М 1^|ф— vl (которое, как
и предыдущее, формулируется на основании неравенств между
действительными числами) дает
ь ь
J 11ф(01-1у(011Л</|ф(0-у(01Л.
а а
и, как очевидно, правая часть последнего неравенства не пре-
ь
восходит J(|q>(0l + lY(0l)<ft.
а
Это неравенство записывается также в виде
/(11Ф1-|УИ)</(1Ф-У1). »5)
Следовательно, на основании полученного выше неравенства
(3) имеем
/( Мф l-l vll) </(1ф-у1) <(*-«) suP|V(*)-yWI-
— (& — а)||ф —vH- (6)
Теперь уместно привести важное неравенство Шварца. Как
уже говорилось (в предыдущем параграфе), если ф и у — две
ступенчатые функции, то интеграл от произведения фу, вообще
говоря, не равен произведению интегралов. Но имеется
неравенство Шварца, дающее оценку сверху для этого интеграла.
Неравенство Шварца. Мы видели, что интеграл есть
линейная форма на векторном пространстве Ф ступенчатых функций.
Теперь рассмотрим интеграл
ь
l(w)-l<f(t)y(t)dt.
а
Ясно, что этот интеграл есть симметрическая билинейная форма
на пространстве ФХФ (Книга II, гл. X, разд. II, §§ 3 и 4).
Соответствующая квадратичная форма /(ф2) неотрицательна для
любой функции ф (она не является положительно определенной,
поскольку может быть равной нулю при <р =р0). То же самое
доказательство, которое применялось в случае определенной
квадратичной формы, дает нам неравенство Шварца
(/(<py))2</(<pV(y2).
Оно записывается также в виде
|/(9Y)K(/(<P2))VW)),/J-
330 КНИГА III. АНАЛИЗ
Это неравенство справедливо для любых ф, уЕф. Возьмем,
в частности, функции |<р| и \у\\ тогда
1ф12 = ф2, lYi2 = Y2
и
/( 1ф11у1Х(/(ф2))1/2(/(у2)),/2.
Из этого, принимая во внимание неравенство (3), получаем
| / (Фу) I < / (I ФУ IX (/ (Ф2) )72 (/ (Y2) )V%
или
ь I ь , ъ \ч%{ ъ \ъ
/ф(0у«)Л </1ф(0у(01Л< /(фС))2* M(y(0)2^| .
а \ а \а 1 \а }
Замечания. 1° При помощи перехода к пределу эти
неравенства будут распространены на интегралы от ярусных
функций.
ь
2° Пусть V!^)= Г | q> (/) | rf/; кроме того, условимся рас-
а
сматривать как нулевую всякую ступенчатую функцию^
обращающуюся в нуль всюду, кроме конечного множества точек
(соглашение принимается в пределах этого замечания). Тогда
легко видеть, что vi (ф) есть норма в Ф, т. е.
vi (Ф) = 0 £Ф ф = 0, v, (ф + у) < v, (ф) + v, (у),
г,(аф) = 1а|г1(ф).
/ » \'А
Точно так же, можно показать, что v2 (ф) = | ф (t) |2 dt есть
другая норма. Так что неравенство Шварца записывается в виде
VitoYXv2(qp)v2(Y).
§ 3. Свойства, относящиеся к интервалу
интегрирования
1. Условимся, что если а^СЬ, то
а Ь
f<p(t)dt~- J Ф(/)<».
Ъ а
Пусть теперь a, b и с — три действительных числа, а ф —
ступенчатая функция на интервале, полученном в результате объ-
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 331
единения [а, Ь] и [Ьу с]; имеет место равенство
b с а
[<р(0Л4 [<р(0Л+/<р(/)Л = 0,
а Ь с
которое может быть, на основании предыдущего соглашения,
записано в виде
be ас
\<f(t)dt+ [ <р(/)<//= - |ф(/)Л= |ф(/)Л.
а 6 с а
Действительно, если а<Ь<с, то доказательство сводится
к замечанию 4 § 1 этого раздела. Если, к примеру, а<с<Ь,
ebb b b с
то Г + Г = I , или Г — j — I , и в силу принятого соглашения
аса аса
b с с
Ь а
а
2. Напомним снова, что \ y(t)dt — О и что | 1 -d/ = 6 —а.
а а
3. Пусть ф — неотрицательная ступенчатая функция на [а, 6];
и пусть [а, р] и 1а', р']— такие два интервала из [а, Ь], что
[а, р] гэ [а7, Р']. Тогда
а и'
Действительно,
3 о' Р' Э Р'
|ф(/)Л= J Ф (*)<# + J Ф(0Л+ /ф(0Л> J ф(')Л.
а а а' 3' а'
поскольку ф > 0.
II. ИНТЕГРАЛЫ ОТ ЯРУСНЫХ ФУНКЦИЙ НА ИНТЕРВАЛЕ [а, Ь]
§ 1. Определение
Пусть / — ярусная функция на [а, 6], т.е. равномерный
предел последовательности (фп) ступенчатых функций на [а, Ь]. Мы
видели (гл. III, разд. V, § 2), что тогда (фп) есть
последовательность Коши относительно нормы IIФI! = sup |ф(х) |, или,
332 КНИГА III. АНАЛИЗ
иначе говоря, для произвольного е > 0 найдется такое
натуральное Р(е), что если p,q> Р(г) (причем Р не зависит от я), то
Нфр —- фд11 < б-
ь
Рассмотрим последовательность чисел / (cprt) = | Ф„ (t) dt.
а
Имеем /(фр) — /(фд) ==/(фр — фд). Применив к этому
интегралу неравенство (3) (разд. I, § 2), получаем
|/(фр)-/(фд)К11фр-фЛ(6--а)<е(*-а) (/>, ?>Я(е)).
Значит, последовательность чисел /(фп) есть
последовательность Кош и в R и, стало быть, сходится. Пусть Я= lim /(ф„).
Рассмотрим теперь другую последовательность (уп)
ступенчатых функций, равномерно сходящуюся к той же ярусной
функции f. Тогда найдется такое Я'(е), что ||фп — уп\\ <е для
любого я>Р'(е) (гл. III, разд/V, § 2). Следовательно,
|/(ф*) —/(Y*)l —|/(ЧЙЕ —Y»)K/(l4^ —Y«IXe(6 —а);
это означает, что 1{уп) имеет тот же предел Я, что и /(фп).
Стало быть, этот предел будет один и тот же для любой
последовательности ступенчатых функций, равномерно сходящейся
к ярусной функции /. Отсюда вытекает
Теорема 1. Если f — ярусная функция на [а,Ь], а (<рп) —
последовательность ступенчатых функций на [a, Ь], равномерно
ь
сходящаяся к f, то последовательность интегралов \ ф„ (/) dt
а
сходится, и предел интегралов будет тот же самый для любой
другой последовательности (уп) ступенчатых функций,
равномерно сходящейся к /.
Определение. Если f есть ярусная функция на [а, 6], а (фп) —
последовательность ступенчатых функций на [а, Ь], равномерно
сходящаяся к /, то интегралом от f no интервалу [а, Ь] назы-
ь
вается предел интегралов J ф„ (/) dt, когда п стремится к беско-
а
нечности.
Это записывается так:
и и
\f{t)dt= lim [yn{t)dt.
Говорят, что f интегрируема на [a, b]. Переменное t,
называемое также переменным интегрирования, которое фигурирует
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 333
Ь
в символе J f(t)dt, есть немое переменное, т.е. такое, что
а
букву t можно заменить любой другой: и, 6, ... Интервал [а, Ь]
называется интервалом интегрирования.
Будем также записывать
ь
1(f)- f/(ОЛ-Ит/Ы.
а
Общие замечания. Г Если ф — ступенчатая функция,
то последовательность ступенчатых функций фп, определенных
как фп = Ф при любом п, равномерно сходится к ф. Таким об-
ъ ъ
разом, интеграл Г <р (/)<#= Нт |фп(0^ °т функции ф, рас-
а а
сматриваемой как ярусная функция, равен интегралу, который
был определен для нее как для ступенчатой функции.
2° Пусть [а, р] с: [а, Ь]. Если / есть ярусная функция на [а, 6],
то функция /ь равная f на [а, р] и нулю вне [а, ji], есть ярусная
функция, ибо если (фп) равномерно сходится к f, то
последовательность (уп) функций, определенных как уп = фп на [а, р] и
уп = О вне [а, р], равномерно сходится к ft. Стало быть, fi
интегрируема на [а, 6] и
ь р
а а
&
3° Если а « 6, то J* / (О Л = 0.
а
Теорема 2. Непрерывные, а также монотонные функции
на интервале [а, 6] интегрируемы.
Действительно, эти функции являются ярусными.
§ 2. Свойства интеграла от ярусных функций
Пусть / есть ярусная функция, т. е. равномерный предел
последовательности (фп) ступенчатых функций. Так как действи-
ь
тельное число f f{t)dt определяется как предел, при п->оо,
а
Ь
действительных чисел | фЛ (t) dt> то все последующие свойства
334 КНИГА III. АНАЛИЗ
b
интеграла \ f(t)dt получаются путем предельного перехода из
а
соответствующих свойств интегралов от ступенчатых функций.
1. Каковы бы ни были действительное число Я и ярусная
функция f на [а, 6],
ъ ь
J Xf(t)dt = x\ f (/) dt, или / Ш) = %l (f).
a a
2. Каковы бы ни были ярусные функции / и g на [а, 6],
$(f(t) + g(t))dt=jf(t)dt+jg(t)dt,
a a a
ИЛИ
/(/ + £) = /(/) + /(£).
Следовательно, отображение f—>I(f) есть линейная форма
на векторном пространстве Ф ярусных функций на [а, Ь].
ь ь
В частности, J (- / (/)) dt = - J* / (t) dt.
a a
3. Функции /+, /-, |/| являются ярусными функциями, и
потому интегрируемы. В силу того, что / = /+ + /" и |/| = /+ — /~",
имеем
/(/)-/ (Г) + / (Г), /(|/|) = /(Г)-/(Г).
4. Неравенства. В главе III, разд. V, § 2 мы видели, что
если последовательность (срп) ступенчатых функций равномерно
сходится к ярусной функции /, то (фл) и (ф^Г) будет
соответственно сходиться равномерно к /+ и /~. В частности, пусть
имеется ярусная функция f > О, т.е. f = /+. Если (ф^)
равномерно сходится к /, то тем же свойством обладает и (ф^),
причем каждая функция ф„, по определению, X). Значит, если
f^O, то существует последовательность неотрицательных
ступенчатых функций, равномерно сходящаяся к f.
Обратимся теперь к неравенствам из § 2 предыдущего
раздела.
Теорема. Интеграл от неотрицательной (соотв.
неположительной) ярусной функции есть неотрицательное (соотв.
^неположительное) число.
Отсюда выводятся следующие основные неравенства,
получающиеся из предшествующих им путем предельного перехода.
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 335
Если для двух ярусных функций f и g имеем f<g, то
f — g<C0 и, по предыдущей теореме, приходим к тому, что
если f ^C g, то
ь ь
jf(t)dt<jg(t)dt. (1)
Точно так же
\f{t)dt\^\\f(t)\dt.
(2)
где
Ранее показано (гл. III, разд. V), что если
Нт ||ф„-Л1 = 0, то lim HcpJlHI/
rt->oo Л->оо
llqpJI===sup|(p„(*H llfll = sup|f(*)
Отсюда
b I b
\f(t)dt \< j \f(t)\dt <^(Ь - a)\\f\\ = (b - a)sup\f (x)\. (3)
Справедливы также неравенства
ь I ь ь ь
j(f(t) + g(t))dt\^l\f(t) + g(t)\dt^l\f(t)\dt+l\g(t)\dt, (4)
a I a a a
b b
l\\f(t)\~\g(t)\\dt^j\f(t)-g(t)\dt^(b-a)\\f-g\\ (5)
a a
и, наконец, неравенство Шварца
b . \ / b \ V? / b \l/2
\f{t)g{t)dt\^{j(f(t)fdt\ i$(g(t))2dt\ .
a \ \a J \a J
§ 3. Свойство, относящееся к интервалу интегрирования
Если, как и в случае ступенчатых функций, условиться, что
Jf(0*--Jf(0*.
то для любых а, 6, с и любой ярусной функции /, определенной
336 КНИГА III. АНАЛИЗ
на [a, b] U [6, с], будет также выполняться равенство
Ь с а
jf(t)dt+jf(t)dt+ jf(t)dt = 0,
a b с
ИЛИ
Ь с Ь
jf(t)dt=jf(t)dt + \f{t)dt.
а а с
§ 4. Интегрирование последовательности ярусных функций
Одной из важных задач теории интегрирования является
следующая: пусть (fn) —последовательность интегрируемых
функций, сходящаяся поточечно к функции /; интегрируема ли
функция /, и если это так, то можно ли утверждать, что Г f(t)dt*=*
-lim \fn(t)dt?
Это есть задача о почленном интегрировании
последовательности. При формулировании этой задачи сходимость fn к f
априорно считается поточечной, т. е. для каждого х имеем
lim fn (x) = f(x). Задача, поставленная в такой весьма общей
П-»оо
форме, имеет отрицательное решение. Стало быть, нужно искать
достаточные условия.
Мы ограничимся изучением случая равномерной сходимости
ярусных функций.
Пусть (/„) — последовательность ярусных функций на [а, Ь],
равномерно сходящаяся к функции f, которая также является
ярусной функцией (гл. III, разд. V). Пусть, далее, (еп) есть
последовательность положительных чисел, стремящаяся к нулю.
Для функции fn можно указать такую ступенчатую функцию <рп,
что \\fn — фп11 < еп.
Так как lim || /п — /|| = 0, то в силу неравенств
П-*оо
II Фя-/11 = 11 Фя"/» + /»-/IKl^n-fnll + ll/n-ZIK^+H/,,-/||
имеем lim || фп — / II — 0. Следовательно,
ъ ь
\f(t)dt = \\m Гфя(/)Л.
а а
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 337
Но по неравенству (5)
ь ь
jfn(t)dt-jq>n(t)dt
а
<(6 — а) ||/Л — Ф» 1К(6 — а)в„.
Стало быть,
ь ь ь
J fn(t)dt имеет тот же предел, что и Г <рп(0<И» т. е. [ /(ОЛ.
а а . а
Теорема. Пусть (/Л) — равномерно сходящаяся
последовательность ярусных функций на [а, Ь]. Тогда предельная функция
f будет ярусной, а значит, интегрируемой, и
ь , ь
Этот факт записывают также в виде равенства
JJn [ J -/„ (О Л j = \ (Mirn /я (0) Л
и говорят, что значки lim и Г, т.е. предельный переход и
интегрирование, можно менять местами.
Хотя эта теорема и является весьма частной, поскольку она
предполагает, что последовательность (/п) сходится
равномерно, все же она имеет очень важное значение. Очевидно, что если
fn есть ступенчатая функция при любом я, то эта теорема
тождественна определению интеграла от ярусной функции.
Важное замечание. Среди ярусных функций
находятся непрерывные функции. Но, как мы уже видели (гл. III,
разд. V, § 3), если последовательность (fn) непрерывных
функций равномерно сходится, то предельная функция / тоже
непрерывна. Значит, предыдущая теорема порождает частный случай,
получаемый при замене в ней термина «ярусная» на термин
«непрерывная».
§ 5. Интеграл Римана
Пусть / — ярусная функция на интервале [а, 6], а <р — такая
ступенчатая функция, что ||/ — <р|| < е, т. е. \f(x) — <р(*) | < е
для любого х € [а, Ь]. Пусть, далее, a* (k = 0, ..., п) — точки,
в которых ф терпит разрыв, и пусть на каждом открытом
интервале ]оьа, ал+i [ произвольным образом выбрана точка gfc.
Рассмотрим теперь ступенчатую функцию y на [а, Ь],
определенную следующим образом: если х^ ]<xft, ak+l[, то у(х) =
-/(Ы; если * = <**> то у Ы = / (ак). Тогда I Y (*)-/(*) К 2ef
338
КНИГА III. АНАЛИЗ
каково бы ни было х^[а, Ь]. Действительно, если х е ]с^, ай+1 [,
то |у(*)-/(*)1<1у(*)-ф(*)1 + 1ф(*)-/(*Н Но на ]ofc,ofc+1[
имеем |у(*)-ф(*)1Н/(Ы-ф(*)1Н/(Ы'-ф(6*)1<е. так как
на этом интервале функция ф постоянна. С другой стороны,
|ф(*) —/(*)|<е. Значит, на ]ak, ak+\[ имеем \y(x) — f(x)\<2e,
а в точке ak имеем \y(x)-f(x)\=*\f {ak)- /{ak) \ = 0.
Очевидно, этот результат можно сформулировать и так: если
f — заданная ярусная функция, то можно найти разбиение
интервала [а, Ь] точками аь и ступенчатую функцию у, значение
которой на ] а*, а/и-i [ равно любому из значений f на ] а*, ал+i [
и которая равномерно приближает f с точностью до 2е.
ъ
Исходя из основного неравенства
\f(t)dt
<(b-a)\\f\\ и
из его следствия
к неравенству
jtf(t)-g(t))dt
а
Ь
\f(t)dt-\y{t)dt
<:{b-a)\\f-g||, приходим
<2(6-a)e.
Но, по.самому определению интеграла от ступенчатой
функции,
я-1
/?(0Л-ЕШ(а*+1-а*).
Отсюда
Л-0
п-\
lf{t)dt-%ffa)(*k+i-*k)
ыо
<2в{Ь-а),
где Ik — произвольная точка из ] ал, a&+i [. Заметим, что,
согласно результатам гл. III, разд. II, § 3, можно в последнем
неравенстве вместо f(lk) брать f(a& + 0) или f(au+\ — 0). Как легко
проверить, можно также положить |* = а& или 1и = ос/и-ь
Дадим теперь определение интеграла Римана. Пусть f —
числовая функция, определенная на интервале [a, b]. Рассмотрим
все разбиения интервала [a, b] при помощи конечного числа
точек. Для каждого разбиения Р точками
а = а0 < а{ < а2 < ... <ап = Ь
рассмотрим суммы
п-\
0(Я, f)-S(a»+|-a»)/tt*).
k-0
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 339
где Ik — произвольная точка замкнутого интервала [а&, ccm-i]-
Если существует такое конечное число 1(f), что при любом
е>0 можно найти разбиение Р, для которого |/(f) — о(Ру f) \*С
■^е, то говорят, что / интегрируема в смысле Римана и /(/)
ь
есть ее интеграл. Снова записывают / (/) = Г / (t) dt.
а
Суммы o(PJ) называются суммами Римана.
Всякая ярусная функция интегрируема в смысле Римана, но
обратное неверно.
III. ИНТЕГРАЛЫ И ПРИМИТИВНЫЕ НЕПРЕРЫВНЫХ ФУНКЦИЙ
В этом разделе мы изучаем главным образом связь между
интегрированием и отысканием примитивных функции /,
определенной и непрерывной на замкнутом интервале [а, Ь], однако
несколько приведенных замечаний указывают, что некоторые
результаты могут быть обобщены на ярусные функции.
§ 1. Первая формула о среднем значении
Пусть / и g — две числовые функции, определенные и
непрерывные на интервале [а, Ь]. Допустим, что g > О, т. е.
g(x) > 0 при любом х е [а, Ь]. И пусть m = inf/(x), Af = sup/(A:);
X X
значит, m^Cf(x) -< Af, каково бы ни было х&[а,Ь]. Так как
g(x) > 0, то
mg(x)^f(x)g(x)^Mg(x).
Согласно неравенству (1) из § 2 разд. II получаем
ь ь ' ъ
jmg(t)dt^jf(t)g(t)dt^JMg(t)dt,
а а а
ИЛИ
Ь Ь Ъ
mj g(t)dt^ j f(t)g(t)dt^M J g(t)dt.
a a a
Ь
Если [ g(t)dt=£0, то число
a
b J b
b=jf(t)g(t)dtng(t)gt
a I a
заключено между m = inlf(x) и М = sup/(#). Стало быть, это
х х
340 КНИГА III. АНАЛИЗ
число является значением функции / в некоторой точке | е
е [а, Ь] (гл. III, разд. II, § 2, теорема 2). Следовательно,
ь ь
$f(t)g(t)dt = f&)jg(t)dt,
а а
Эта формула называется первой формулой о среднем
значении и справедлива для неотрицательной функции g.
Она, очевидно, справедлива также и для g, всюду равной
нулю.
ь
Частный случай. Если g(x) = 1 для любого х, то J g(t)dt =
а
Ь
-6-а, и Jf(0*»fft)(6-a).
Замечания. Г Если fug — ярусные функции и g > 0, то
снова можно написать J f(t)g{t)dt = Я J g(()dt, где inf/(A:X
a a
^^^sup/(A:), но нельзя заранее утверждать, что X есть одно
из значений функции /.
ь
2° Если g непрерывна, g>0 и f g(t)dt = 0, то g = 0. Ибо
а
если бы в некоторой точке х0^[а,Ь] было g^oJ^O, то в силу
непрерывности можно было бы найти интервал [а, р],
содержащий хо и такой, что на нем g(x) > (l/2)g(Xo). А поскольку
g>0, то
Ъ а Э & Э ,
|в(0Л- f + J+J>jfif(0^>i«rW(P-a)>0.
a a a £ a
Следовательно, J g(t)dt не может равняться нулю.
a
3° Доказанная формула о среднем значении, очевидно,
справедлива на любом интервале [а, р] с: [а, 6].
§ 2. Примитивные и интегралы непрерывных функций
В главе III, разд. VI мы определили понятие примитивной
и показали, что если F — примитивная функции f, то все
остальные примитивные получаются прибавлением к F некоторой
постоянной с, или, еще, что если F и G — две примитивные функ-
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 341
ции /, то F — G постоянная функция. Но мы не знаем, является
ли определенная на [а, Ь] функция / производной какой-либо
функции F. Цель этого параграфа, между прочим, будет
заключаться и в том, чтобы показать, что любая непрерывная
функция / на [а, Ь] является производной некоторой другой
функции F и что знание примитивной F функции / позволяет
вычислить интеграл от /.
Пусть / — функция, непрерывная на [а, Ь], а значит,
интегрируемая как на [a, &], так и на любом интервале [а, х\ где х<^
е [а, Ь]. Положим
X
F(x)=jf(t)dt.
а
Тем самым на [а, Ь] определена числовая функция F. Она
непрерывна. Действительно,
х' х х'
F(x')-F(x) = J* f{t)dt- J f(t)dt = J* f(t)dt,
a a x
откуда
x'
\F(x')-F{x)\^ \\f(t)\dt^\x'-x]sup\f(x)\.
J X
X
Если xr стремится к ху то \х' — x\ стремится к нулю; но тогда
и \F(x') — F(x)\ стремится к нулю. Значит F непрерывна.
Функция jF дифференцируема на [а, Ь]. В самом деле, по
первой формуле о среднем значении (частный случай)
х'
F(х')-F(x)-jf (/)dt = f(l)(x'- х),
X
где | заключено между х и хг. Пусть х ф х'\ имеем
F(jg:;w-/(6).
Так как / непрерывна, то /(g) сколь угодно мало отличается от
/(х), как только х' — х достаточно мало. Следовательно, в
любой точке х функция F обладает производной, равной f(x).
Таким образом, справедлива
Теорема. Всякая непрерывная функция f на интервале
[а, Ь] есть производная функция, а функция F, определенная
X
равенством F(x)= f / (t) dt, есть примитивная функции Д
342 КНИГА III. АНАЛИЗ
Замечание. Доказательство того факта, что F
непрерывна, годится и для произвольной ярусной функции f.
Следствие. Обозначим теперь через Ф другую
примитивную непрерывной функции /. Имеем Ф(д:) = F(x) + с, где с —
постоянная. Стало быть,
х ь
ф(х) = \f{t)dt-Vc, Ф(й)= \f(t)dt + c.
а
а
Но если х = а, то I f(t)dt = 0. Значит, для х=а имеем Ф(а)=с.
а
Отсюда
ь
Ф(Ь) = {/(/) dt + Ф(а),
ИЛИ
|/(0Л-Ф(6)-Ф(а),
а
причем Ф — любая примитивная непрерывной функции*/.
Таким образом, интегральное исчисление позволяет построить
примитивную непрерывной функции /, и обратно, если известна
примитивная функции /, то можно вычислить интеграл от f на
интервале, на котором f непрерывна.
Отметим, что для а,ре [а, 6], очевидно, Ф (Р) — Ф (а) =
= | f(t)dt и что примитивная F, определенная равенством
а
х
F{x) = \ f(t)dtf обладает свойством F(a) = 0.
а
§ 3. Интеграл от сложных функций (замена переменного)
Пусть g — непрерывная функция переменного t e [a, р], a f—
непрерывная функция переменного х^[а, Ь]. Предположим, что
я ^> S (0 ^ Ь, каково бы ни было t e [a, р].
Композиция h — fog есть непрерывная функция на
интервале [а, р]; это есть, по определению, функция t-+f(g(t)) = А(0-
ь
Мы предполагаем вычислить Г / (х) dx при помощи функции А.
а
Помимо всего, мы допустим, что g имеет первую
производную g', непрерывную на [а, р]. Функция t-*f(g(t))g'(t) непре-
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 343
рывна на [а, р], ибо является произведением непрерывных
функций. Согласно результатам § 2, функция Ф, определенная
равенством
<b{t)-ffte(u))g'(u)du,
непрерывна, дифференцируема для а *С t < p, и
W(t) = f(g(t))g'(t).
X
Пусть F (х) = j f (и) du. Функция i-*F(g(t)) непрерывна
а
и дифференцируема, ибо является композицией функций,
обладающих этими свойствами. Но по теореме о
дифференцировании сложных функций (гл. III, разд. VI)
dF (х) о / ч
так как dx - f (x).
Найденная производная совпадает с производной от Ф; иначе
говоря, функции /->Ф(/)= J f(g(u))g'(u)du и t-+F(g(t))f
а
т.е. Ф и Fogy имеют одинаковые производные на [а, р], и
значит, отличаются друг от друга лишь на некоторую постоянную с:
<b(t)-F(g(t)) = c.
Отсюда
t git)
lf{g{u))g'{u)da~] f(u)du = c.
a a
Зададим переменному / значение а; получим
g(a) a
с = — J f{u)du— \ f (u) du.
a g (a)
Тогда
t z(t)
\f{g{u))gf{u)du=l f{u)du + c~
a a
git) a git)
-J f(u)du+ j f(u)du~ f f{u)du (a</<P).
344 КНИГА III. АНАЛИЗ
Таким образом, если g непрерывна на [а, р], имеет
непрерывную производную g' и а<^ g(t) ^ 6, a f непрерывна на
[а, 6], то
\f{g{u))g'{u)du= J f(u)A<.
а g(a)
Теперь, сверх имеющихся предположений, допустим, что
g(a) = a, g(P)= ft. Тогда
a a
Эта формула носит название формулы замены переменного
в интегралах. Когда ее применяют, то говорят, что
производится замена переменного (и подразумевают: интегрирования).
Интеграл от периодических функций. Пусть / —
периодическая ярусная функция, периоды которой кратны одному и тому
же числу со. Каковы бы ни были a,b^R, можно рассматри-
b a+to
вать f f(t)dt. Пусть Ъ = а + со. Утверждается, что ) f{t)dt
а а
не зависит от а.
a + to 0 © to+a
Действительно, запишем J = J + Г + • В интеграле
a a 0 to
j* f{t)dt положим tf = co + tt. Имеем
>+a a a a
too 0 0
Так как
a 0 a+to to
J = - J, TO J f(t)dt- \f{t)dt.
0 a a 0
Таким образом, интеграл от периодической функции, взятый
по интервалу длины со, не зависит от положения начала этого
интервала.
§ 4. Интегрирование по частям
Пусть f и g — две непрерывные числовые функции на
интервале [a, i], a F и С- примитивные соответственно для fug.
функция FG, определенная как x-*F(x)G(x), есть примитив-
to+a
to+a
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 345
ная функции F'G + FG' = fG + Fg, что следует из формулы
дифференцирования произведения функций и из того, что F'=f,
G' = g- Стало быть, согласно формуле из § 2, которая
позволяет вычислить интеграл непрерывной функции при помощи ее
примитивной, получаем тождество
ь
j(f(t)G(t) + F(t)g(t))dt = F(b)G(b)-F(a)G(a).
а
Интеграл, стоящий в левой части, является суммой двух
интегралов от fG и Fg, что позволяет записать
ь ь
j F(t)g(t)dt = F(b)G(b)-F{a)G(a)~ J* f(t)G(t)dt.
a a
Для любой числовой функции ф употребляется запись
Ф(6)-Ф(а) = [<р]£ или ф(0|£.
И если использовать принятое дифференциальное
обозначение (ср. гл. VII, разд. И), то полученная формула запишется
следующим образом:
ь ь
J FdG = [FG]ba- J* GdF,
a a
где
dG = g (t) dt = G' (t) dt, dF = f (t) dt = F' (t) dt.
Эта формула называется формулой интегрирования по
частям. Когда применяют эту формулу, то говорят, что
интегрируют по частям.
Приложение к формуле Тейлора. Пусть / и g —
функции, определенные на [а, Ь] и обладающие м-ми
непрерывными производными. Проинтегрируем по частям выражение
ъ
\ f{n) (t) g (t) dt; так как f(n\ по определению, является первой
а
производной от f(n~l), то
J fn) (t) §(0 dt = [f*-l) (t)g(t)fa - / /<"-"(/)g' (t) dt.
a a
А так как /<n_1) есть первая производная от /(п~2), то
/ fin- ° (0 8 (0 л - [fin-2) (0 s (t)t - / Г~2) (О g" it) dt.
346
КНИГА III. АНАЛИЗ
Продолжая интегрировать по частям, получим
ь
jfm(t)g(t)dt =
а
£(-1)*Г-*_1)(0Л) +(- 1)" \ f (*)*<•> (t)dt.
k=0
Если g есть многочлен от t степени (п— 1), то gf(n) = 0, и
{ / (0 &(п) (0 ^ = 0. Возьмем, в частности, g (t) = ^ _ ; тогда
(*-/)"'
(я-
Отсюда
j>(0^
1)!
dt =
= \£рп-ь-»{ь)(х^ЬУ
Д-Л-1
rt-1
£=»0
(/г-^-1)!
.^/^-"(а)-^^
*=0
л-Л-1
Наконец, положим Ь = л:; тогда
чЛ-1
a fe-0
л-1
<л-1")Т
р«0
-/'Ча)-^-'...-/,ге-1)(а)^^-.
ИЛИ
ж —а
(*-а)2
/W = f(a)+/'(a)^p-+/,,(a)i±irL- +
+ /(n-i) (fl) .(*-«)■
/1-1
■j>w^*.
(я-1)!
Мы пришли к формуле Тейлора (п—1)-го порядка для
функции f, имеющей n-ю непрерывную производную; остаточный
член формулы представлен интегралом
j>(,)i£]
^i1
1)!
■dt.
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 347
§ 5. Интегрирование и дифференцирование
последовательности действительных функций
В разд. II, § 4 мы показали, что если (/п) —
последовательность ярусных функций на интервале [а, Ь]у равномерно
сходящаяся к функции /, то функция / — тоже ярусная, и
ъ ъ
\f(t)dt= Mm \fn(t)dt.
a a
Допустим, что все функции fn непрерывны. В этом случае
х х
j f(t)dt=\im ffn(t)dt (x<=[a, b]).
a a
Ho
x x
FnW^ J fn(t)dt, F(x)= J f(t)dt определяют примитивные для
a a
fn и /, обращающиеся в нуль при х = а. Имеем, далее,
\ X I X
\Fn(x)-F(x)\-n(fn(t)-f(t))dt\<j\fn(t)-f(t)\dt;
, I a \ a
отсюда
\Fn(x)-F(x)\ < (» ^ в) II/»-/II-
Так как Iim||/rt— /11 = 0 (следствие того факта, что последо-
П->оо
вательность (fn) равномерно сходится к /), то \\Fn — F\\=*
= sup| Fn(x) — F(x) | тоже стремится к нулю, когда п стремится
х
к бесконечности, т. е. Fn равномерно сходится к F.
Теорема 1. Пусть (fn) — последовательность
непрерывных функций на интервале [а, й], равномерно сходящаяся к
функции f (которая будет непрерывна), a Fn — примитивная
функции /п, обращающаяся в нуль при х = а. Тогда
последовательность (Fn) равномерно сходится к непрерывной функции F,
которая является примитивной функции f и при х = а
обращается в нуль.
Заметим, что эта теорема обусловливает выбор
примитивных для /п. Ясно, что Fn + n — тоже примитивная для /п, но
Fn + п не сходится, поскольку п стремится к бесконечности.
Теперь изучим дифференцирование последовательности
функций. Если (fn) — последовательность функций,
определенных, непрерывных и дифференцируемых на [а, Ь\ и если для
любого xe[a,J] последовательность (f'n(x)) сходится, а значит,
348
КНИГА III. АНАЛИЗ
определяет функцию ф, то, вообще говоря, неверно, что
последовательность (/п) сходится к дифференцируемой функции /,
имеющей в качестве производной функцию <р. Мы дадим
критерий, позволяющий выяснить, при каких предположениях это
будет выполняться. Этот критерий представляет собой иную
форму предыдущей теоремы.
Пусть (fn) — последовательность непрерывных на [а, Ь]
дифференцируемых функций, производные которых f'n непрерывны
и образуют последовательность, равномерно сходящуюся к
функции ф. Тогда
х
а
По предыдущей теореме последовательность функций
x-»fn(t)-fn(a) = Q>n(x)
равномерно сходится к примитивной для функции ф= lim f,
причем эта примитивная принимает при х = а значение нуль;
X
положим ф(я)= J y(t)dt. Предположим, что числовая после-
а
довательность (fn(#)), т.е. последовательность значений
функций fn в точке а, сходится; и пусть lim fn(a) = 'K. Так как (Фп)
П->оо
равномерно сходится к Ф и так как /п = Фп + fn(a), T0 (fn)
равномерно сходится к функции Ф + к, производная которой
как раз равна ф. Отсюда следует
Теорема 2. Пусть (fn) — последовательность
непрерывных на интервале [а, Ь] действительных функций, производные
f'n которых непрерывны на [а, Ь\ Если последовательность (fQ
равномерно сходится, а последовательность значений fn
сходится хотя бы в одной точке, то последовательность (fn)
равномерно сходится к функции, производная которой является
пределом последовательности (/„)•
В этом случае пишут (lim / V = lim П'\
П->оо Я->оо
Этот важный результат должен применяться с
осмотрительностью. Мы подчеркиваем тот факт, что одним из условий
является равномерная сходимость последовательности
производных.
Пример. Пусть fn(x) = 1 + х + ... + хп и — 1 + е<л;<
^ 1 — е (е > 0). Элементарное вычисление дает
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 349
Так как |*|< 1, то хп+* стремится к нулю, и lim /„(*) = 1/(1 —я).
Эта последовательность сходится равномерно, ибо если,
например, р < ?, то
м*)-м*>-* ,_; -* г-х ■
Отсюда
i/pW-Mx)Kl''p+I1l!7J,""<i*ri-4<ii-er-f
Следовательно,
И/р-М1<4|1-еГ+| (в>0).
Значит, (fp) есть последовательность Коши, и, стало быть,
равномерно сходится.
Пусть £(*)-1+2*+ ... +пх«~1= ***+1^У**+1 .
Выкладка, аналогичная предыдущей, показывает, что (/^)
равномерно сходится. Следовательно, (f'n(x)) равномерно сходится
к производной от 1/(1—-*), которая равна 1/(1—х)2\ итак,
lim (1+*+ ... + **) = —l—9 lim (1 + 2* + ... +nxn~l)~ n l ,2
для *е[— 1 +е, 1-е].
IV. ФУНКЦИИ, ОПРЕДЕЛЯЕМЫЕ ПОСРЕДСТВОМ ИНТЕГРАЛОВ
В этом разделе мы дадим несколько кратких указаний
относительно функций, определяемых посредством интегралов.
Как мы увидим, здесь важную роль играют действительные
функции многих действительных переменных, гл. VII. По
соображениям порядка расположения, этот материал излагается
здесь, и читатель должен будет обращаться к гл. VII для
уяснения свойств, с которыми он будет знакомиться.
§ 1. Определение
Пусть f — числовая функция, определенная на интервале
[а, Ь]\ переменное обозначается через /. Если / непрерывна, то
ь
можно вычислить интеграл Г f(t)dt. Однако возможно, что
а
значение функции / зависит не только от /, а и от других
переменных, которые по разным соображениям желательно считать
фиксированными. Например, пусть требуется проинтегрировать
по интервалу [а, Ь] функцию / -> t + X, где X — постоянная.
350
КНИГА III. АНАЛИЗ
Имеем
ь ь ь
^(t + X)dt=\tdt + x\ dt = [-Jf + X(b-a) = -^y~ + X(b - a).
a a a
В этих вычислениях X считается постоянной, но значение
интеграла зависит от значения X. В действительности же мы
рассматриваем функцию двух переменных /, X, которая паре (/, X)
ставит в соответствие число t + X, но при интегрировании мы
считаем t единственным переменным. У нас встречался другой
пример (разд. III, конец § 4), когда мы вывели формулу Тей-
(х — t)n~l
лора, интегрируя относительно / функцию g (t) = у, _ .
Ограничимся простым случаем. Пусть / — числовая
функция точки (/, х) из R2 с обычной евклидовой нормой,
определенная для а < / -< й, a^*4^p. И пусть D означает только
что определенный замкнутый прямоугольник (см. гл. V).
Предположим, что функция / непрерывна относительно точки
(t, х) (см. гл. VII), т. е. для любого е>0 найдется такое у,
что если |/ —/o|^Y и \х~хо\ ^Y» т0 |/(*»*) —f(*o,*o) | < е
при условии, что t, х, t0i Xo принадлежат D. Но f также и
равномерно непрерывна на D, т. е. число у может быть выбрано
независимо от (toyXo) е/) (см. гл. VIII). В предположении, что
х фиксировано, функция t-+f(t,x) переменного t может быть
b
проинтегрирована по [а, Ь]. Полученное число \ f(t, x)dt за-
а
висит от х. Если а и Ъ предполагаются жестко закрепленными,
то значение этого интеграла можно обозначить через F(x):
ь
F(x)=jf(t, x)dt.
а
Тем самым на [а, р] определена числовая функция F.
Чтобы отметить важную роль, которую играет х, его, когда
ь
речь идет об интеграле f f (t, x) dt, называют параметром.
а
Иногда говорят, что функция t-*f(t3x) зависит от параметра х,
и даже вместо f(t, x) пишут fx(t).
Хотя мы и ограничились в высшей степени простыми
случаями, все же заметим, что определение функции F не требует,
чтобы х принадлежало конечному интервалу [a, (J]; x могло бы
быть и элементом любого множества. Такой пример нам
известен — это счетная последовательность (fn) непрерывных (или
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 351
ярусных) функций, значение которых для t обозначается через
/п(0» но могло бы обозначаться через f(t, n).
Итак, пусть F есть функция, определенная интегралом
ъ
F(x)-jf(t9x)dt.
а
Исследуем, будет ли F непрерывна, будет ли она дифференци-
Р*
руема на [а, р] и как можно вычислить J F(x)dx.
а
§ 2. Непрерывность
Исследуем F на непрерывность. Пусть х, х0 е [а, р]; тогда
ь
F(x)-F(x0)=j[f(t,x)-f(t,x0)]dt.
а
Согласно свойствам интеграла
ь
\F(x)-F (х0) \<j\f(t9x)-f{t9 x0) | dt.
а
Но если предположить / непрерывной на Д а значит, и
равномерно непрерывной, то для любого е > 0 можно будет
указать такое y» не зависящее от {t,x), что если две точки (t,x) и
(t\ x') из D отстоят друг от друга на расстоянии, меньшем у,
то \f(ty х) —l(t\ x') l< е. То есть, если взять одну из трех
эквивалентных норм в R* (ср. гл. V), например V2, то при \t — V|<
<Y и \х — х'\<у будет \f(t,x) — f(t\ х') | < е. В частности,
если /' = /, то |/(/,х) — /(/',x') |< е; лишь только \х — х'\<у.
Следовательно,
ь
\F(x)-F(xQ)\KJ\f(t, x)-f(t, x0)\dt^e(b-a),
а
если |я — х0\ <у. Тем самым доказана непрерывность F.
Таким образом, справедлива
Теорема. Если f есть функция двух переменных t, х,
непрерывная по (/, х) на замкнутом прямоугольнике,
определенном неравенствами а •< / < bt a ^ x -< р, то функция
ь
F(x)=\f(t,x)dt
а
непрерывна на интервале [а, р].
352
Книга in.анализ
Замечание. Этот результат остается справедливым, если
а, Ъ заменяются двумя числами а\ Ь' ^ [а, Ъ\ так как f
непрерывна и для а < х < р, а! •< / < Ь'. Пусть, в частности, X е
. я
е [а, Ь]\ положим Ф(А, х)= \f{t, x)dt. Тогда Ф представляет
а
собой функцию от Я и а:, определенную на замкнутом
прямоугольнике D. Покажем, что Ф тоже непрерывна. В самом деле,
Я Я'
Ф(Л, х)-Ф(Я', *')={/('> х)Л-J/(*, *0Л =
а а
= J/(*, x)dt- J/(f, x')dt~ j f(t, x')dt~
a a \
Я Я'
= /#(<. x)-W, x*))dt-jf{t, x')dt
|Ф(Х, *)-Ф(А/, .*')|< jl/(*, x)-f{t, x')\dt+ j f(t, *')Л<
а Я
b I V
<JlfC. *)-/(<. ^)|Л+ J Ifft *')!<«
Но мы знаем, что числу е > 0 можно отнести такое уу что если
\х — *'|^y> T0 \!(*>х) — f(t>x') |<e при любом /. С другой
стороны, f непрерывна на замкнутом прямоугольнике D\
поэтому |/| ограничена некоторым числом М (ср. гл. VII, разд. I).
Следовательно, для абсолютного значения последнего интеграла
имеем оценку
]\f(t,x')\dt
<М|А/-Н
Значит, эта величина будет меньше е, если взять |V— Я| <
< е/М (которое не зависит ни от К, ни от я). Стало быть,
обозначив через y' наименьшее из чисел y и e/AJ, получим
|Ф(Х, х)-Ф(Л', *')|<в(&-а) + в,
если |Х —Х'| < у', \х — х'\ <у\ Тем самым доказана
непрерывность Ф на D.
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО
353
§ 3. Дифференцирование
Исследуем вопрос о том, имеет ли F производную в точке
хо е [а, р]. Так как разность х — х0 не зависит от t, то для х Ф х0
и х, Хо е [а, Ь] имеем
ь
F(x)-F(x0) = Г /f(t,x)-f(t,x0)\ dL
х — Xq J\ x — Xo J
a
Допустим, что функция x~-*f(t, x) имеет производную по х,
каково бы ни было х и каково бы ни было t\ пусть, далее,
fx есть функция (t, x)->f'x{t, x) от (t,x) (ср. гл. VII, разд. I).
Наконец, допустим, что fx непрерывна на Д а значит,
равного
мерно непрерывна. Тогда интеграл f'x(1f x)dt существует при
а
всех х е [а, р]. С другой стороны, по теореме о конечных
приращениях
f (t, х) - f (t, х0) ^ ,, ^ ,
где | заключено между х0 и х и зависит от х0, х, t. Поскольку
\1 — х0\ < \х — х0\ и fx непрерывна, то для \х — х'\ <уу имеем
\f'x(t> *) """/*(*> х')\<г, каково бы ни было t^[a, b]. Возьмем
\х — х0\ < у; тогда, тем более, \1 — х0\<у, и поэтому
или
Так как
F(x)-
ь
FM Г
|Г,('.6)-£Мо)1<'
'b'lZ'^-M. -о)
г,
<е.
b
га. *ла = ((fV'^-f
(<■ *о)
то для |я— х0\<у получаем оценку
F(x)-F(x0)
х-х0
о
j4(<.*o)
dt
<
<
f(t,x)-f(t,x0)
x — xtt
-K(*> xo)
dt^e(b-a),
12 Ш. Пизо, М. Заманский
354 КНИГА III. АНАЛИЗ
чем доказано, что F имеет в точке х0 производную и что значе-
ъ
ние этой производной равно J fx(t, x0)dt. Этот результат, при
а
наших предположениях о непрерывности /£, справедлив для
любой точки л;0е[а, р]. Таким образом, имеет место
Теорема. Если f — числовая функция от (t, x)t
определенная и непрерывная на замкнутом прямоугольнике а «< t < b,
а<^х-< р и обладающая производной f'x по х, также непрерыв-
ь
ной на том же прямоугольнике, то функция F(x) = \ f(t, x)dt
а
дифференцируема для любого х е [а, р] и
. F'{x) = \f'x(Ux)dt.
Эта формула называется формулой дифференцирования под
знаком интеграла. Она может быть выведена при более общих
предположениях, однако необходимо помнить, что ею нельзя
пользоваться неосмотрительно.
§ 4. Интегрирование
Найдем, чему должен быть равен J F(x)dx, который опре-
делен, если f предполагается непрерывной на Z), ибо тогда F
непрерывна. Следует написать, что
j F{x)dx = J И f{t, x)dt\dx\
a a \a I
но обозначение упрощается, если мы запишем этот интеграл
в виде
j dxjf(tt x)dt.
При использовании этого упрощенного обозначения
необходимо помнить, что оно означает, что сначала надо вычислить
интеграл относительно tt а затем полученный результат
должен быть проинтегрирован относительно х, что сводится к
чтению справа налево.
ГЛ. IV. ИНТЕГРИРОВАНИЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 355
Так как мы предположили / непрерывной по (t, x), то
можно рассмотреть
а
причем функция G получается в результате интегрирования /
относительно х по [ос, р]; G тоже непрерывна по t на [а, Ь]
ъ
и значит, можно рассматривать J G(t)dt. Мы покажем, что
а
Ъ Р
Г G(t)dt= \F(x)dx. Пусть £ — точка из [а, р]; докажем факт
а а
более общий, а именно, что, каково бы ни было | е [а, р],
I ь ь 1
j" dx J f (t9 x)dt= J* dt J* /(f, a:) d*.
а а а а
Рассмотрим функции от £ вида
1 & 6 1
|-> Jd*J"f(f, *)<# и £-> J Л J/(/, *)Лс.
а а а а
Положим
F(x)=jf(t9 x)dt9 Ф(|, /)— Jf(*. x)dx.
а а
Мы хотим доказать, что
j F(x)dx = |ф(£, О Л.
а а
Функция Ф непрерывна на D (ср. § 2, замечание). Она
дифференцируема по £ для любого значения /, и ее производная
в силу результатов § 2 разд. III равна Ф|(£» t) = f(t9 |). Так
как / непрерывна, то Ф| тоже непрерывна. Функция Г Ф (£, /) dt9
а
будучи функцией от £, дифференцируема (предыдущий пара-
ъ ь
граф), и ее производная совпадает с Г Ф|(£, t)dt=* \ f(tt Qdt.
а а
I
Но функция \ F(x)dx9 как функция от |, дифференцируема,
а
12*
356 КНИГА III. АНАЛИЗ
b
и ее производная равна F(Q= \ f(t, l)dt. Стало быть, при
а
£ Ь
любом I функции \F(x)dx и |Ф(£, t)dt имеют одинаковые
а а
производные, и, значит, отличаются друг от друга лишь на
а Ь
постоянную. Но если £ = а, то J F {x) dx = 0, и J Ф (а, /) dt = О,
а а
а
поскольку Ф (а, t) = \ f (/, х) dx = 0.
а
I Ь
Окончательно имеем ] F(x)dx= J Ф(£, t)dt, каково бы ни
а а
было |^[а, р], и следовательно,
б ь ь р
\dx jf(t9x)dt=j dt jf(t,x)dx.
a a a a
Отметим, что эта формула остается справедливой, если
заменить а, р другими точками а', р' из [а, р] и а, Ь — другими
точками а\ V из [а, Ь].
Эта формула носит название формулы перемены порядка
интегрирования. Напомним еще раз, что при ее доказательстве
мы предполагали, что f непрерывна на замкнутом
прямоугольнике D.
ГЛАВА V
МЕТРИЧЕСКОЕ ПРОСТРАНСТВО Rn
Цель этой главы — распространить, насколько это
возможно, свойства числовой прямой (гл. II) на более общие
множества; такими множествами будут векторные пространства Rn
(Книга II, гл. VII). Знание этих свойств позволит нам изучать
функции, обобщающие действительные функции одного
действительного переменного, или отображения R в R. Мы придем
к рассмотрению отображений R в Rn (векторные функции
одного действительного переменного), отображений Rn в R
(действительные функции многих действительных переменных),
отображений Rp в Rq (множество q действительных функций от р
действительных переменных).
ГЛ. V. МЕТРИЧЕСКОЕ ПРОСТРАНСТВО Rn 357
Все свойства, изложенные в гл. III, основываются на том
факте, что в пространстве переменного и в пространстве
значений функции имеется понятие предела. Поэтому мы прежде все*
го введем в Rn понятие расстояния, которое позволит нам
переносить определения и свойства, относящиеся к R.
§ 1. Общее понятие расстояния
Общее понятие расстояния имеет своим истоком большое
количество элементарных математических фактов.
В плоской геометрии, например, расстояние понимается
следующим образом. Прежде всего оно является неотрицательным
числом, отнесенным паре точек Л, В; т. е. оно является
функцией от пары (Л, В) и принимает действительные
неотрицательные значения. Принято обозначать эту функцию буквой d, а ее
значение для пары (Л, В) — через d(A,B).
Расстояние обладает следующими хорошо известными
свойствами:
Г Расстояние от Л до В равно нулю, если Л и В совпадают;
т. е. d(A,A) = О, какова бы ни была точка Л. И обратно, если
расстояние от Л до В равно нулю, то Л и В совпадают, что
записывается d(A9B) = О =Ф Л = В. Следовательно, d(A, В) =*
= оол = в.
2° Расстояние от Л до В равно расстоянию от В до Л, т. е.
d(A,B) = d(B,A), каковы бы ни были точки Л, В.
3° Расстояние от Л до В меньше или равно сумме
расстояний от Л до С и от С до В, каковы бы ни были точки Л. В, С;
записывается d(A, B)^d(A,C) +d(C,B)9 каковы бы ни были
Ау В, С. Это и есть то, что называют неравенством треугольника
(«в треугольнике длина одной стороны меньше суммы длин двух
других сторон»; эта формулировка нам очень близка, но в
последующих вопросах не понадобится рассматривать
треугольники или прямые).
С другой стороны, если Р — плоскость в элементарной
геометрии, то множество пар (АУВ), где Л и В —точки плоскости,
обозначаемое через Р X Р, есть произведение двух множеств,
равных Р (Книга I). Таким образом, d есть отображение РХР
во «множество неотрицательных чисел.
Теперь мы определим понятие расстояния в произвольном
множестве Е.
Определение. Говорят, что во множестве Е определено
расстояние dy если каждой-паре ху у точек из В, т. е. каждому
элементу (х, у) <= Е X В, поставлено в соответствие
неотрицательное действительное число d (х, у), удовлетворяющее следующим
условиям:
Г d(x,f/)>0; d(x,у) = 0 эквивалентно тому, что х- у.
358 КНИГА III. АНАЛИЗ
2° d(x9y) = d(y9x).
3° d(x, у) ^ d(xy z) + d(z, у) (неравенство треугольника),
каковы бы ни были х, у, 2Е Е.
Множество Е, наделенное расстоянием, называется
метрическим пространством. Оно обозначается через (Е, d).
Замечания. 1. Всякое множество может быть наделено
расстоянием. Действительно, определим d как d(xty)= 1, если
хФу, и d(x, x)= 0. Легко убеждаемся в том, что d
удовлетворяет трем условиям определения расстояния, но это расстояние
практически бесполезно.
2. В одном и том же множестве могут быть определены
несколько расстояний (см. § 3, ниже).
Примеры. 1. Абсолютное значение во множестве
действительных чисел позволяет считать, что d(xtу) — \х — у\, т. е.
что абсолютное значение разности х — у, где х, y^R, есть
расстояние; в самом деле, d(x, y) = 0 тогда и только тогда, когда
х = у9 \х — у\ = \у — х\, \х — у\ = \х — z + z — y\4,\x — z\ +
+ \z — у\. Однако мы заметим, что для определения понятия
расстояния необходимо иметь возможность расположить
действительные числа в такие комбинации, чтобы основную роль
играло их абсолютное значение.
2. Пусть Ф есть множество ступенчатых функций на
интервале [а, Ь] (гл. III, разд. IV). Если фЕФи уеФ, то равенство
d (ф_, Y) = sup | ф {х) — y (*) I определяет расстояние в Ф. Точно
х
так же будет и для множества Ф ярусных функций, и для
множества С непрерывных функций на [а, Ь].
Основные свойства. 1. Из условия 3° вытекает, что, каковы
бы НИ быЛИ А% Z\, 22, • • , 2Я, У е ^>
d(x, y)^d(x, z{) + d(zu z2)+ ... +d{zn-uzn) + d(zn,y).
2. Следующее свойство воспроизводит хорошо знакомую
формулировку: в треугольнике длина одной стороны больше или
равна абсолютному значению разности длин двух других сторон.
Каковы бы ни были х9 у, х\ у', d(x, y)^Cd(xf x') +d(x\ у') +
+ d(y'y), d(x' у') ^ d(x\ x) + d(x9 у) + d(yy у'). А так как
d (х9 х') = d (*', х), d (у9 у') = d (у', у), то d (x9 y)—d (х'9 у') <
^ d (х, х') +d(yyy')y d (*', у') — d(xyy)^d (x, x') + d(y,y').
Отсюда
\d(x9y)-d (*', у') I < d (x9 х*) + d (y9 y').
Возьмем, в частности, yf = у, х' = z\ получим
\d(x,y)~d(y,z)\^d(x,z).
Это неравенство и неравенство треугольника из определения
ГЛ. V. МЕТРИЧЕСКОЕ ПРОСТРАНСТВО Rп
359
дают
\d(x,y)-d(y,z)\^d(xtz)^d(x9y) + d(y9 z),
каковы бы ни были х, у, 2Е £.
Если множество Е наделено расстоянием, т. е. является
метрическим пространством, то можно определить понятие предела.
Так, говорят, что последовательность (хп) элементов из Е
стремится к элементу х^Е, если последовательность
действительных чисел d(xn, x) стремится к нулю, когда п стремится к
бесконечности. А раз это фундаментальное понятие существует, то
мы сможем определять и изучать в Е знакомые понятия (точки
накопления, замкнутые множества, ...).
Метрические пространства, которыми мы будем пользоваться
в настоящем курсе, — это пространства Rn. Для других
пространств (например, пространство ярусных функций,
пространство непрерывных функций) мы указываем только их
качественную особенность как метрических пространств без
систематического исследования их свойств.
Rn может рассматриваться как векторное пространство над
R (Книга II, гл. VII, разд I, § 2). Поэтому мы вначале
определим для векторного пространства над R понятие нормы, при
помощи которого и введем затем понятие расстояния.
§ 2. Понятие нормы в векторном пространстве над R
Пусть Е — векторное пространство над R. Элементы из Е
обозначаются через я, у, z, ..., а действительные числа через
а, р, у ... Допустим, что в Е определено расстояние d.
Символ 0 будет означать как нуль поля R, так и нуль в Е
(нейтральный элемент сложения).
Интуитивно внутренний закон в Е (сложение) может
интерпретироваться как сдвиг (перенос). В элементарной геометрии
сформулировано следующее полезное свойство (допускаемое
или доказываемое): если два отрезка АВ и А'В' прямых
получаются один из другого путем переноса, то они имеют
одинаковую длину; если же они получаются один из другого путем
гомотетии с коэффициентом а, то длина одного из них равна
произведению длины другого на |а|. Гомотетия соответствует
интерпретации внешнего закона на Е.
Итак, мы подошли к рассмотрению в векторном пространстве
Е над R некоторых специальных расстояний, удовлетворяющих
следующим условиям:
Г d(xy у) = d(x + z, у + z), каковы бы ни были xyy,z^E.
2° d(ax, ay) = \a\d(xf у), каковы бы ни были х, у^Е, a^R.
Эти два условия заведомо возможны, поскольку в Е
существуют законы: (х,у)-+х + у, (ос, #)->a*, и это не будет
произвольное множество.
360 КНИГА III. АНАЛИЗ
В условии 1° возьмем z = —у (что возможно, так как Е —
векторное пространство). Тогда
d(x, y) = d{09 х-у),
т. е. расстояние от х до у в Е есть расстояние от элемента
0е£ до элемента х—г/. Обратно, если известно расстояние отО
до любого элемента из £, то можно определить и расстояние
между любыми двумя элементами х и у.
Точно так же d(ax, ay) = d(0, ax — ay) = d(0, a(x — у)).
Отсюда следует, что d(0iaz) = \a\d(0,z) для любых зе£, asi?.
Исходя из неравенства треугольника d(x, y)^.d(x, z) +d(z,y),
путем замены х и у соответственно на 0 и х + у, получаем
rf(0, x + y)<d(0, z) + d(zy x + y) = d(0, z) + d(0, x + y — z).
Возьмем z = x. Тогда d (0, x + y) < d (0, #) + d (0, y).
В итоге, положив v(x)= d(0,а:), получаем:
1° v(*)>0.
2° v(jc) = 04^jc = 0.
3° v(x + y)<v(x) + v(y).
4° v (ад:) = | a | v (x).
5° d(xyy)==v{x-y).
Эти соотношения показывают, что v(x) есть норма в £
(Книга II, гл. III, разд. II, § 2); напомним ее определение.
Определение. В векторном пространстве Е над R определена
норма v, если на Е определена числовая функция v с
неотрицательными действительными значениями, обладающая
следующими свойствами*.
1° v(*) = 0e#, Ф»* = 0е=£.
2° v(x + y)^v(x) + v(y) (неравенство треугольника).
3° v(a*)*|a|v(*),
каковы бы ни были xf y^E, aEJ?.
Тогда Е называется нормированным векторным
пространством над R или, короче, действительным нормированным
пространством.
Если v — норма в Е, то равенство
d(x,y) = v{x-y)
определяет расстояние в Е\ это расстояние d называется
расстоянием, порожденным нормой v.
Обозначение. Иногда в действительном векторном
пространстве Е можно определить несколько норм. Тогда их
обозначают vi» V2, ... Но если иметь дело только с одной нормой,
то разумнее пользоваться более удобным обозначением. В са-
ГЛ. V. МЕТРИЧЕСКОЕ ПРОСТРАНСТВО Rn 361
мом деле, заметим, что абсолютное значение в R или в С
является нормой: v(#) = |a:|, x^R или х& С (а в § 1 мы
заметили, что \х — у\ есть расстояние). По аналогии с этим
обозначением абсолютного значения пользуются следующим
обозначением нормы.
Норма элемента х из Е будет обозначаться через ||я||, если
это не может повести к неоднозначности. Тогда свойства нормы
перепишутся в виде:
Г ||*|Н04Ф*=»0е£.
2° \\х + у\\^\\х\\ + \\у\\.
3° 1|а?||-|а|||х||.
||* — у\\ есть расстояние от х до у. Имеем
||*-у|| = 0£М = у,
\\*-у\\ = \\у-х\\,
ll*-jHI<IU-*ll + ll*-jM|.
Последнее неравенство из § 1 дает для нормы неравенство
IIUII-lliMIKII*-»!,
которое для расстояний записывается в виде
\d(0,x)-d(0,y)\^d(x,y).
Примеры. 1. Абсолютное значение |д:| элемента x^R или
х&Ф есть норма.
2. Если Ф есть векторное пространство над R ступенчатых
на интервале [а, Ь] функций ф£Ф, то ||ф||= sup|ф(л:) | есть
норма в Ф. Точно так же определяется норма в Ф, $*.
§ 3. Нормы в Rn
Прежде всего напомним, что Rn (n — натуральное) есть
произведение п множеств, тождественных числовой прямой R.
Любой элемент из Rn обозначается буквой х и является
упорядоченным множеством п чисел |i, |2, • • •, In. Записывается
Обозначения, принятые в этом параграфе, не являются
обязательными. Часто, когда п = 2 или п = 3, пишут (х, у) или
(х, у, z) вместо (£i,g2) или (%и\ь Ы- Тогда в предыдущем
обозначении надо вместо х брать другую букву, например X, М, ...
Однако обозначения, которые мы принимаем, более просты.
Если п = 2, то 1\ называется абсциссой, £2 — ординатой.
Если я = 3, то |i называется абсциссой, |2 — ординатой, |3 —
362 КНИГА III. АНАЛИЗ
аппликатой. Эти старые термины в настоящее время заменяются
термином проекция (первая, вторая, ...).
Определив, таким образом, Rn как множество, определим
в Rnструктуру векторного пространства. Пусть х = (|ь ..., |п),
У = (Ль ..., Цп)\ полагаем х + у = (gi + тц, ..., |n + г\п) и
оса: = (agi, ..., agn), каковы бы ни были ху y^Rn, aei?.
Напомним, что х = у означает Ik = Ль ПРИ всех & = 1, 2, ..., я;
в частности, а: = 0 означает, что %ь, = 0 при всех & = 1, 2, ..., п
(этот 0 является нулем в R).
Евклидова норма (см. также Книга II, гл. X). Пусть
vW-(Sll*p)/f. где * = (!,, ..., |n)etfn.
1. v(a;) определено для любого x^Rn и является
неотрицательным числом. Если х = 0, то £* = 0 при всех А, и значит,
п
v (0) --= 0. Обратно, если v (х) = 0, то (v (а;) )2 = 0, и 2 I £* I2 e 0,
что влечет ||ft|2 = 0, ибо сумма неотрицательных чисел может
равняться нулю лишь при условии, что все числа равны нулю;
следовательно, I £* I = 0, и £ь = 0 при всех k.
2. Если aEi?, то v (ад:) = ( 2 I а£л I2) , так как cia; =
-(с*,, оЬ, .... аБ„). Ho!a|J2 = |a(2||,|2, Ц| ag* l2 = | a |22l h I2,
и значит, (| а |2 21 U I2)7' = I a | (21 6* l2)''2- Стало быть, v (ах) =
= | a Iv(л:), каковы бы ни были x^Rn и aEi?.
3. Пусть х = (lu ..., In), у = (т]Ь ..., rin). Мы видели
(Книга II, гл. X, разд. I), что v(x + y)-*Cv(x) + v(y). Следовательно,
v(a:) удовлетворяет трем условиям нормы.
Заметим (ср. Книга II, гл. X), что если называть скалярным
произведением х и у значение билинейной формы
п
(х, у)-*х-0 = 2б*т1*.
то
1*-0|<11*111Ы1.
Определение. Функция v, задаваемая равенством v(x) =
= (2ll* l2)'/2> определяет в Rn норму, называемую евклидовой
нормой. Пространство Rn, наделенное этой нормой, называется
n-мерным евклидовым метрическим пространством.
Евклидово расстояние между двумя точками х = (%и ..., |п)
и У = (r|ir . .,> rin) из Rn определяется равенством
lu-yll-(Sl6*-ruP),/f.
ГЛ. V. МЕТРИЧЕСКОЕ ПРОСТРАНСТВО Rn 363
Замечание. Имеем J*-# lP = 2gf+ 2ri|-22^, или
\\х-у\? = \\х\? + \\у\?-2х-у.
Два элемента х и у называются ортогональными, если
л: •# = (). Стало быть, если х и у ортогональны, то \\х — у\\2 =
= IMI2 + llf/ll2 (теорема Пифагора).
п
Вторая норма в Rn. Пусть vi(x)= ^\lk\. Имеем vi (*)>0;
очевидно, V! (0) = 0, и обратно, если vj (я) = 21 £* I = °» то £fe = 0
при всех k9 и значит, # = 0. Кроме того,
V! (€х^) — 2SI оБА | — Si а II 6* I-= I a 1211 Б* I — I « I vj (jc).
vi^ + ^-Si^ + ruKSdg^i + i^i)-
— S I Б* I + S I Т|* | — Vм (JP) + Vt (У).
Следовательно, vi тоже является нормой в Rn.
Третья норма в Rn. Пусть v2(#) = sup| |Л |, т. е. v2(#) есть
k
наибольшее из чисел |gi|, ||2|, ..., \ln\- Имеем V2(#)>0,
V2(0) = 0, и обратно, если v2(#) = 0, то sup|^| = 0; а раз наи-
k
большее из чисел ||fe|4>0 равно нулю, то все они равны нулю;
значит, х = 0. Кроме того,
v2 (а*) « sup | alk | = | a | sup | lk | =| а | v2 (a:),
& k
v2(* + «/) = sup||ft + rift|<sup(|tft| + |Tul)<
k k
<sup|^| + sup|rife| = v2(A:) + v2(f/).
Следовательно, v2 тоже является нормой в Rn.
Замечания. 1. Если интерпретировать введенные
понятия на плоскости R2, отнесенной к двум прямоугольным осям
01\ и 0£2, то v(x) выступает как длина гипотенузы
прямоугольника, образованного осью 01\ и параллелью к оси 0|2,
проведенной через точку ху или осью 0|2 и параллелью к оси 0|ь
проведенной через х.
\\{х) есть сумма катетов, a v2(#) — наибольший из них.
2. В анализе, как мы увидим, больше 'используются нормы
vi и V2- Но важно знать, что для определения понятия предела
можно использовать любую из этих трех норм; понятие
предела будет одно и то же. Это будет показано в дальнейшем.
364 КНИГА III. АНАЛИЗ
Соотношение между тремя нормами. Рассмотрим нормы
vi и V2. Имеем
п
v,(*) = 2 1£*|<л • suplgfej =nv2 (x),
1 k
V2(*)-8Upl6»|<Sli»| = V,(*).
X 1
Значит, каково бы ни было х е Rn,
v2 (a:)< V! (а:) < т2 (х).
Рассмотрим теперь нормы V2 и v. Имеем
v2W = sup||ft|<(SlI*l2)'/2 = vW)
k
ибо если наибольшее из | |j |, ..., 11„ | есть 11, |, то 11, |2 <
<I6iP+ ••• +\h?+ ••• +11вР. С другой стороны,
v (х) - (SI 6* р)Л < V^T sup IU I - VT v2 (х),
так как 21 g* I2 < n (sup | £Л | )2. Значит, каково бы ни было x<=Rn,
1 &
^2(х)<v(#)< Ул v2(л).
Из этих неравенств выводим также
-v,W<v2M<v1(4
-tLtv(a:Xv2(a:Xv(a:).
Таким образом, среди этих трех норм между любыми двумя
из них, которые мы обозначим через р(х), q(x), имеется
соотношение
ap(x)^q{x)^bp(x),
где а и Ь — конечные положительные числа.
Следовательно, если для последовательности точек в Rn одна
из этих трех норм стремится к нулю, то две другие тоже
стремятся к нулю.
Такие три нормы называются эквивалентными.
Отныне мы будем через Rn обозначать векторное
пространство Rn, наделенное одной из этих норм.
ГЛ. V. МЕТРИЧЕСКОЕ ПРОСТРАНСТВО R п
365
§ 4. Понятие предела в J?rt
Определения. 1. Говорят, что в метрическом пространстве
Е последовательность (хп) точек из Е стремится к точке х^Е,
если (для рассматриваемого расстояния d) d(xnyx) стремится
к нулю, когда п стремится к бесконечности. Последовательность
(хп) называется сходящейся к х.
2. Если Е — нормированное пространство, то говорят, что
последовательность (хп) стремится к х^Еу если {для
рассматриваемой нормы) \\хп — х\\ стремится к нулю, когда п стремится
к бесконечности.
Снова пишут lim xn = х, но это обозначение опасно, по-
П->оо
скольку расстояние не уточнено.
Основные замечания и свойства. Г В том, что
касается второго определения, отметим, что если, в
нормированном пространстве Еу хп стремится к ху то хп — х стремится
к 0е£. Стало быть, то обстоятельство, что Е есть векторное
пространство, позволяет, как и для Ry определить вначале
сходимость к нулю, а отсюда уже вывести сходимость
последовательности точек хп из Е в общем случае.
2° Если, при расстоянии d, хп стремится к х в Et т. е.
lim d (хПУ х) = 0, то предел будет единственным.
Действительно, если бы существовал другой предел х' е Еу
для которого lim d(xn, #')= 0, то из неравенства треугольника
Л->оо
вытекало бы, что d(x, x')*Cd(xyxn) + d(хпу х'), и поэтому
d(xy х') = 0; но тогда, в соответствии с первым условием,
наложенным на d при его определении, получаем х = х\
3° Если lim d(xn, x) = 0, то любому положительному чис-
Л->оо
лу е соответствует такое целое Р(е, х)у что если п^Р(еу х)у
то d(xny х)*Се. Значит, если р и q— целые числа, не меньшие,
чем Р, то d(xPyx)<ey d(xqyx)<e, и, по неравенству
треугольника,
d {xp, xq) < d (хр, х) + d (xq, x) < 2е.
Стало быть, если хп сходится к ху то lim d(xpy jO = 0;
р, q->oo
т. е. двойная последовательность бр, g = d(xpy xq)
неотрицательных чисел стремится к нулю, когда р и q стремятся к
бесконечности, в смысле, придаваемом этой фразе в гл. I и II.
Условие lim d(xp, xq) = Q называется условием Коши,
а всякая последовательность (хп) точек метрического
пространства Е, удовлетворяющая условию Кошиу называется
последовательностью Коши.
366 КНИГА III. АНАЛИЗ
Итак, если последовательность (хп) точек из Е сходится,
относительно расстояния d, к точке х^Е, то (хп) есть
последовательность Коши.
Если всякая последовательность Коши сходится по
расстоянию d, т. е. если условие lim d(xp, xq) = О влечет существова-
р, q->oo
ние такого х^Е, что lim d(xn, #) = 0, то говорят, что Е полно
П->оо
относительно расстояния d.
Эти результаты и определения переносятся на нормированное
векторное пространство, поскольку в этом случае d (х, y)=\\ x — у ||.
Если lim || *я — а: || = 0 (хп<= Е, а:е£), то lim || хр — xq || = 0.
П->оо q->oo
Условие Коши для последовательности (хп) имеет вид
lim ||xp-*J| = 0.
Последовательность Коши (хп) есть такая
последовательность, что lim || хр — хд || = 0.
р, q->oo
Если любая последовательность Коши сходится к
некоторому элементу х е Е, то Е есть полное нормированное
векторное пространство.
Пример. 1. Пространство ярусных функций на [а, Ь],
наделенное нормой ||/1| = sup | f(x) |, есть полное нормированное
х
векторное пространство. То же самое имеет место для
пространства ^ непрерывных на [а, Ь] числовых функций, наделенного
той же нормой.
2. R, очевидно, есть полное нормированное векторное
пространство, где нормой элемента х служит его абсолютное
значение \х\.
3. То же самое, как мы увидим, имеет место для Rn.
4° Если в Е определены два расстояния d и б, то
последовательность (хп) может быть сходящейся к х е Е по
расстоянию d и не быть таковой по б.
Тем более метрическое пространство может быть полным,
будучи наделенным некоторым расстоянием d, и не быть
таковым, если оно наделено другим расстоянием б.
Это замечание, очевидно, справедливо для нормированного
векторного пространства, наделенного несколькими нормами.
Следующее замечание является важным, и в нем мы
ограничимся лишь нормированными пространствами.
5° Пусть Е — векторное пространство, в котором определены
две нормы р и q. Допустим, что эти две нормы эквивалентны,
т. е. найдутся такие два конечных положительных числа а и Ь,
что, каково бы ни было хе£,
ар (#)< q {х) < Ьр {х)
(см. предыдущий параграф).
ГЛ. V. МЕТРИЧЕСКОЕ ПРОСТРАНСТВО .<?«
367
Предположим, что последовательность (хп) сходится к #<=£
по норме р. Тогда lim р (хп - х) = 0, атак как q(x)^.bp{x),
то q (хп - *)< 6р (хп - #), и lim q (xn - х) = 0. Следовательно,
(хп) стремится к х по норме q. Обратно, так как а Ф09 то
р (#)< ■— q (х), и lim q(xn — x) = 0 влечет lim р (хп — *) = 0.
Точно так же ар (хт -xn)^q (хт - хп)*^Ьр (хт—хп). Стало быть,
для того чтобы lim р (хт — хп) = 0, необходимо и достаточно,
т, я-»оо
чтобы lim q (xm — хп) = 0.
т, л->оо
Следовательно, если (хп) есть последовательность Коши
относительно нормы р, то она будет таковой и относительно
нормы #, и обратно.
Отсюда получаем следующий важный результат.
Теорема. Если векторное пространство Е наделено двумя
эквивалентными нормами, то всякая сходящаяся
последовательность (соответственно всякая последовательность Коши)
относительно одной из норм является сходящейся
последовательностью (соответственно последовательностью Коши)
относительно другой нормы.
Более краткая формулировка этой теоремы такова: если две
нормы эквивалентны, то понятия пределов совпадают.
Этот результат объясняет, почему топологические свойства
пространства Rn совпадают при трех нормах v, vi, V2,
определенных в предыдущем параграфе.
§ 5. Шары и брусы в Rn
Мы видели в гл. II роль открытых или замкнутых
интервалов в понятии предела на числовой прямой R. Ту же роль
играют в Rn брусы и шары.
Определение. Пусть Е — метрическое пространство и d —
расстояние, определенное в Е. Открытым шаром с центром х0
и радиусом г называется множество таких точек х из Е, что
d(x0j х) < г; замкнутым шаром с центром х0 и радиусом г
называется множество таких точек х из Е9 что d (х0, х) ^ г.
Пусть В(х0, г) —открытый (соответственно замкнутый) шар
в пространстве Е, наделенном расстоянием d. Выражение
«точка х из Е принадлежит В(х0, г)» означает, что d(x0, x) <r
(соответственно <>). Говорят также, что В(х0у г) содержит х.
При помощи понятия шара понятие предела формулируется так
же, как и для числовых последовательностей (гл. I, разд. II,
§§ 3, 4). Будем говорить, что последовательность {хп)
стремится или сходится к х0, если любой открытый шар с центром
х$ содержит все точки хп из последовательности, кроме, быть
368 КНИГА III. АНАЛИЗ
может, конечного числа из них. Если Е является
нормированным пространством, то d(xQt х) = \\х — х0\\, и открытый
(соответственно замкнутый) шар В(х0, г) определяется как
множество тех точек х из Е, для которых \\х — х0И < г (соответственно
\\х — Хо\\^г).
Мы определили в #лтри нормы v, vi, v2.
Пусть х0= (g0,i, |0,2, ..., go,n), x= (gb ..., ln). Тогда
открытый шар с центром Хо и радиусом г состоит из таких
точек х, что ||я —*oll < f. Неравенство \\х — х0\\ < г записывается
в виде
( (h ~ h,!? + (h - U2)2 + . . . + (In ~ go, n)2 )V2 < Г.
Для нормы vi открытый, к примеру, шар В(х0у г)
определяется как множество точек х, для которых
IEl~E<ul + l62-Eo,2l+ ... +\Ъп~1ьп\<Г.
И для нормы V2 это будут такие ху что
supl6ft —Бо,л|<г.
k
Но из основных неравенств между этими тремя нормами
(см. §§ 3, 4) вытекает, что в любом открытом шаре с центром
Хо е Rn, определенном посредством одной из этих трех норм,
можно найти открытый шар с центром х0, определенный
посредством двух других норм.
Это свойство обобщает теорему предыдущего параграфа.
Благодаря этому свойству мы можем, например, определить на
Rn непрерывную функцию, не уточняя, какая именно норма
выбрана среди трех предыдущих.
Рассмотрим открытый шар относительно третьей нормы; он
представляет собой множество тех х = (gb ..., gn), для
которых sup|£ft — £0,*l<r' Пусть для заданного индекса k (k =
k
= 1, 2, ..., п) через g& обозначено любое число,
удовлетворяющее условию \1п — go, h I < г; тогда g& e ] go, к — г, g0, к + г [.
Обратно, возьмем все х = (gb ..., gn) е /?п, которые получены
таким путем. Очевидно, что V2(* — х0) <г. Следовательно, этот
шар является множеством тех точек (gi, ..., gn), у которых |й
принадлежит открытому интервалу длины 2г с серединой go, ft.
Значит, этот шар представляет собой произведение п равных
между собой открытых интервалов, причем произведение
понимается как произведение множеств (см. Книга I).
Если обратиться к элементарному представлению этого
произведения, то станет понятным, почему такому шару дается
название открытого куба.
ГЛ. V. МЕТРИЧЕСКОЕ ПРОСТРАНСТВО R" 369
Определение. Открытым (соответственно замкнутым) кубом
в Rn называется произведение (в теоретико-множественном
понимании) п открытых (соответственно замкнутых) и равных
между собой интервалов из R.
Терминология. В R2 вместо открытого (соответственно
замкнутого) шара употребляется термин открытый (соответственно
замкнутый) круг, а вместо сферы — окружность. Вместо куба
используется термин квадрат.
Обозначения. В R2 координаты |ь £2 точки М часто
обозначаются через g, ц или х, у, а в R3 — через £, т|, | или х, у, z.
Круг в R2 есть множество точек М, координаты х, у которых
удовлетворяют неравенству (х — х0)2 + (у — у0)2 < г2 (или < г2)
при условии, что берется евклидова норма. Квадрат есть
множество точек, координаты которых удовлетворяют неравенствам
| х — х01 < а и | у — уо | < а, где а — положительное число.
Брус. Открытым (соответственно замкнутым) брусом в Rn
будем называть произведение п открытых (соответственно
замкнутых) интервалов из R. В R2 это множество называют
прямоугольником (ср. Книга II, гл. IX, § 1). Всякий открытый брус
содержит открытый куб, и наоборот.
Замечание. В Rn открытый шар с нулевым радиусом
пуст, а замкнутый шар с нулевым радиусом сводится к его
центру.
* § 6. Топологические свойства пространства Rn
Отныне Rn будет означать векторное пространство Rn>
наделенное одной из трех предыдущих норм. Свойства будут
сформулированы с применением кубов, т. е. в терминах третьей
нормы V2; ибо точно так же как Rn является произведением п
множеств, равных /?, так и открытый куб представляет собой
произведение п равных между собой открытых интервалов из /?,
которые играли важную роль в топологических свойствах R
(гл. 1и II).
Эта основная идея выражается следующей теоремой.
Теорема 1. Для того чтобы последовательность точек
*р = (£Р,1> 1р,2, ♦••> Ър,п) из Rn сходилась в Rn (к элементу xs=Rn),
необходимо и достаточно, чтобы последовательности координат
Бьл, Ег»» -•> Бр,*> •••> сходились в R.
В самом деле, пусть *р = (£р,ь • • •> Ер, пН допустим, что
существует такое х = (£,, ..., |п), что lim |] хр - х || = 0, где
р->оо
|| х|| = sup| lk |. Для заданного е>0 найдется такое целое Р(е),
что если р>Р(е), то \\хр - х\\<е9 и значит, ISP>*-|J<e.
Следовательно, каково бы ни было k, lim | gp, * — 6л 1 = 0, т. е.
р-»оо
370 КНИГА III. АНАЛИЗ
lim£p,fc = £fc. Обратно, предположим, что для любого k най-
дется такое lk e R, что lim £Pf k = |л. Тогда для е > 0 сущест-
р->оо
вуют такие числа Р^(е), что если p^Pk(e), то |£р, * — |*|<e.
Пусть Р (е) — наибольшее из целых чисел Рх (е), ..., Рл(е). Если
р>Р(в)9 то ||p^-gfe|<8, и стало быть, sup|£Pf*-£*!<е.
Пусть # = (|,, ..., |л). Последнее неравенство записывается
в виде || яр — х ||<е; следовательно, lim || хр — * II = 0-
Определение 1. Последовательностью Коши в R называется
любая последовательность (хр) точек из Rn, для которой
lim II *р - *„ || = 0.
ру q-^oo
Теорема 2. Пространство Rn полно, т. е.
последовательность (хр) сходится в Rn в том и только том случае^ если она
является последовательностью Коши.
Действительно, если (хр) сходится к x^Rny то lim || хр—х ||=0;
р->оо
т. е. ||л:р — #||<е, если р>Р(е); значит, для q^P(e) имеем
|| л^ — # ||< е. По неравенству треугольника,
II *р - я* II = II хр - х + х - хя || < II Хр - х || + \\х- хя || < 2е.
Стало быть, (хр) есть последовательность Коши в Rn. Обратно,
предположим, что для р, q^P(e) выполняется ||яр — xq\\ < е.
Тогда для любого k имеем ||р,% — \qth\ < e, поскольку
supl6p,fe-^,J-|Up-^||<e.
k
Значит, каждая последовательность £i, и, h, ft, h, ft, • •. есть
последовательность Коши в R; следовательно, существует £& е R,
к которому она сходится. Если q стремится к бесконечности, то
lim6gfft = gft, инеравенство \lv,h — gg,ft|<e дает ||Р|л — |л|<е,
р Г^Р(е). Согласно теореме 1, (хр) сходится к х = (gi, g2, ..., gn).
Определение 2. 1° Точка х0 е /?л называется точкой
прикосновения множества Е cz #rt, ес/ш любой открытый шар с
центром х0 содержит точку из Е.
2° Гоч/са #о е #л называется точкой накопления множества
Е е /?и, если любой открытый шар с центром х0 содержит точку
из Е, отличную от х0.
Эти определения полностью повторяют определения
соответствующих понятий в R.
Любая точка множества Е есть его точка прикосновения;
всякая точка накопления множества Е есть предел некоторой
последовательности точек из Е.
Определение 3. 1° Множество точек прикосновения множества
Е с Rn называется замыканием этого множества и
обозначается Ещ
ГЛ. V. МЕТРИЧЕСКОЕ ПРОСТРАНСТВО /?«
371
2° Говорят, что множество Е плотно в R?, если Е = Rn, т. е.
если замыкание множества Е совпадает с Rn.
Здесь снова каждая точка накопления множества Е
принадлежит £; утверждение, что Е плотно в Rn, равносильно
утверждению, что любая точка из Rn служит пределом
последовательности точек из Е.
Теорема 3. Множество точек из Rn с рациональными
координатами плотно в Rn (ср. гл. II, разд. II).
В самом деле, пусть х = (|ь ..., £п) —точка из Rn. Так как
множество рациональных точек плотно в R, то можно найти
последовательность рациональных чисел gi, ь, |г,ь, ..., |з,и, ...,
сходящуюся к Ik, k = I, ..., п. Пусть хр = (|р, i, iPt 2, ...,' |р, п),
Поскольку координатные последовательности сходятся
соответственно К gi, . . . , |п, ТО (Хр) СХОДИТСЯ К X.
Определение замкнутого множества. Говорят, что множество
Е замкнуто, если оно совпадает со своим замыканием: Е = Е.
Поскольку каждая точка из Е принадлежит Е, то всякое
конечное множество Е, т. е. множество, содержащее лишь конечное
число элементов, замкнуто в Rn.
Если множество Е содержит бесконечно много элементов, то
всякая точка накопления х0 множества Е, по определению 2, 2°,
принадлежит Ё. Значит, если Е замкнуто, то каждая точка
накопления (если таковая существует) принадлежит Е. Обратно,
предположим, что Е есть множество, содержащее свои точки
накопления; тогда Е замкнуто. Ибо точка из Е есть точка
прикосновения для Е\ следовательно, она либо принадлежит Е
(определение 2, Г), либо является точкой накопления для Е
(определение 2,2°), и значит, принадлежит Е; таким образом,
Е = Е.
Итак, замкнутое множество либо конечно, либо бесконечно,
и в этом случае оно содержит свои точки накопления.
Определение ограниченного множества. Множество Е из Rn
называется ограниченным, если множество норм \\х\\ элементов
х е Е ограничено.
Это означает, что Е может быть заключено в шар или брус
конечного радиуса с центром в 0. Ибо если для х^Е
множество чисел IMI ограничено, то это равносильно существованию
такого действительного а > 0, что ||#|| <! а. По неравенству
треугольника, это равносильно тому, что Е может быть заключено
в шар конечного радиуса с центром в произвольной точке x0^Rn.
Важное замечание. Поскольку при п ^ 2 в Rn не
определено отношение порядка, то здесь не имеют смысла, например,
понятия мажоранты или верхней грани множества.
Теперь докажем для Rn теорему Больцано — Вейерштрасса,
одну из важнейших теорем для числовой прямой R.
372 КНИГА III. АНАЛИЗ
Теорема Больцано — Вейерштрасса. Всякое бесконечное
ограниченное множество имеет точку накопления.
В самом деле, пусть Е — ограниченное множество из Rn,
содержащее бесконечно много точек; значит, Е может быть
заключено в куб П. Рассмотрим k-ю проекцию Ek множества Е
(см. Книга I), т. е. множество координат g& всех х^Е; Ek
заключено в k-ю проекцию куба П, являющуюся некоторым
интервалом [яь, bk] из R. Хотя бы один из этих интервалов, [ak, bk],
содержит бесконечное множество точек g^, ибо в противном
случае их произведение, представляющее собой П, содержало бы
лишь конечное число точек, и поэтому Е было бы конечным. По
теореме Больцано — Вейерштрасса в применении к интервалу
[cik, bk], множество Ek имеет точку накопления go, л, являющуюся
пределом последовательности (g*>, ь): Hm gp,k = go,ft.
p->oo
Допустим, что найдется бесконечная последовательность
таких попарно различных точек луе£, что Hm gp', h = g0, h су-
ществует при h— 1, 2, ..., k—1; тогда последовательность
(!p',ft)P'sjv имеет точку накопления go, k или же gP', k принимает
для бесконечного множества индексов р' одно и то же значение,
которое мы обозначим через go, к\ стало быть, всегда можно
выделить такую бесконечную подпоследовательность чисел //', что
Ит ЪР»,к = g0lfc. Имеем также lim \^h = %0lh для h = 1, ..., k - 1,
pff -» oo p' -> oo
и значит, lim g^,лв^о»h Для A = 1, ..., &. Проводя индук-
p"->oo
цию по &, получаем при k = n последовательность точек
хр — (1р, 1» •••» 1р,п), имеющую, в силу теоремы 1, пределом
точку Хо = (go, 1, ..., go, n). Следовательно, лг0 есть точка
накопления множества Е.
* Теорема Бореля—Лебега. Всякое ограниченное замкнутое
множество, покрытое какой-то совокупностью открытых кубов
или открытых шаров, может быть покрыто конечным числом
этих кубов или этих шаров.
Эта теорема доказывается тем же методом, что и
предыдущая. В самом деле, достаточно заметить, что если Е замкнуто
и ограничено в Rn, то его проекции Ek обладают теми же
свойствами в R. Действительно, если множество Ek конечно, то
предложение доказано. Если же Ek бесконечно, то точка
накопления go, k множества Ek служит пределом последовательности
6i,ft, Ъ,k, ..., gp,h, .-• точек из Е^ которые являются k-un
проекциями точек хи х2, ..., хр, ... из Е. Множество проекций
Ei, ь g2.it • • • > 1р, ь • • • этих точек ограничено. Если оно конечно,
то сохраняется последовательность хи х2, ..., хр, ... Если же
оно бесконечно, то по теореме Больцано — Вейерштрасса имеется
точка накопления go, i. Значит, найдется подпоследовательность
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 373
последовательности gifl, g2, i, ..., Ъ, и ...-, сходящаяся к g0ft.
Обозначим ее через (lPl, i). Рассмотрим последовательность тех
xPlf первые проекции которых сходятся к g0> ь a k-e — к g0ffe.
Повторяя это рассуждение п — 2 раза, приходим к
подпоследовательности {хР') последовательности (хр), сходящейся к х0 =
= (6о, ь So, 2, ..., So, n), поскольку &-е проекции при любом k
сходятся к go, ft в R. А так как проекция любого ограниченного
замкнутого множества есть ограниченное замкнутое множество,
то для доказательства теоремы достаточно применить к каждой
проекции теорему Бореля — Лебега для R.
Можно также доказать эту теорему тем же способом,
которым мы доказывали ее для R.
Замечание. Замкнутые шары, кубы и брусы являются
замкнутыми множествами в смысле нового определения.
Г Л А В А VI
ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО
ПЕРЕМЕННОГО; ОТОБРАЖЕНИЯ R В Rp
I. ВЕКТОР-ФУНКЦИИ
Вектор-функции одного действительного переменного ставят
в соответствие действительному числу элемент векторного
пространства. Здесь этим пространством будет метрическое
пространство У?**, изучавшееся в предыдущей главе (р —
натуральное).
Цель настоящей главы — распространить, насколько
возможно, на эти функции понятия и свойства, относящиеся к
числовым функциям одного действительного переменного. Мы
ограничимся двумя основными понятиями — непрерывностью и
дифференцируемостью. Будет отмечаться, какие понятия и
свойства не переносятся; для подробных доказательств будем
отсылать к гл. III.
Во всей этой главе мы будем стараться сохранить
следующие обозначения: действительные числа будут обозначаться
греческими буквами ос, р, ...,§, т), ...; числовые функции — тоже
греческими буквами ф, ...; вектор-функция будет обозначаться
строчной жирной латинской буквой /, g,..,
§ 1. Определения и общие замечания
1. Пусть I — интервал числовой прямой R, и пусть каждой
точке | е / поставлена в соответствие точка из Rp. В этом
случае говорят, что определена функция действительного
374
КНИГА III. АНАЛИЗ
переменного £ е / с векторными значениями в Rp, или, короче,
вектор-функция от g.
Эту функцию обозначают через f, а ее значение для % —
черев f(l); /(g) есть элемент пространства Rp. Выражение
«вектор-функция от g e / со значениями в Rp» имеет тот же смысл,
что и следующие выражения: вектор-функция, определенная
на I, или отображение I в Rp.
2. Обозначим через еи ..., ер элементы канонического
базиса пространства Rp, определенные следующим образом: е&
для l^k-^p есть элемент из Rp, имеющий все координаты
нули, кроме 6-й, которая равна единице (ср. Книга II, гл. VII,
разд. II, § 2).
Если /—вектор-функция, определенная на / и принимающая
значения в Rp, то /(g) есть элемент из Rp и, значит,
представляет собой множество р действительных чисел, значение
которых зависит от £ и которые мы обозначим через q>i (|), ..., фр (£);
это будут координаты, или компоненты точки /(£) по
каноническому базису. Таким образом,
f(6) = <Pi(l)ei+ ... +ФР(1)^-(Ф,(&), ..., ФР(Ш.
Следовательно, для любого £ е / определены р действительных
функций ф1, ..., фр и, стало быть, / является упорядоченным
множеством р действительных функций фЬ ..., фр, которые
определены на интервале /. Функции ф& называются
координатными функциями,
3. Понятия, которые мы хотим определить для таких
функций, буквально повторяют понятия, определенные в гл. III. Они
используют одновременно или порознь свойства R и Rp.
Но в Rp мы определили три нормы (а значит, и три
расстояния), затем ввели понятие предела и показали, что понятие
сходимости будет одно и то же относительно любой из трех норм
(эквивалентные нормы). Через ||/(g)ll будет обозначаться норма
элемента f{Q^Rp, причем, вообще говоря, нет необходимости
уточнять, какая из трех эквивалентных норм выбрана.
Отметим сразу же, что:
Г Понятие порядка в Rp (р^-2) не определено;
следовательно, не определено понятие монотонной вектор-функции.
Стало быть, выражение — положительная вектор-функция — не
имеет смысла.
2° Функции ф1, ..., фр — действительные функции
действительного переменного, принимающие конечные значения.
4. Если / и g — два отображения / в Rpy то функции f + g
и а/ (а — любое действительное) тоже будут отображениями /
в Rp, ибо f + g есть отображение %-*f(I) + g(l), а
^--отображение £-*ос/(6), где f(l) + g(l) и af{l) —элементы из Rp,
поскольку Rp есть векторное пространство над R.
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 375
5. Если £ —отображение Rp в Rq (см. гл. VII, разд. Ш),
а / есть отображение / в Rp, то композиция gof отображения /
на g есть отображение / в Rq, определенное соответствием
l~+g(/(g)); стало быть, это есть вектор-функция
действительного переменного g (со значениями в Rq).
Если g — действительная функция р действительных
переменных, определенная на множестве из Rp, содержащем
множество /(/), то композиция gof функции / на g есть
действительная функция действительного переменного g, определенная
соответствием g-*g(/(g)). (Относительно определения g см.
гл. VII, разд. I.)
6. Пусть / — отображение интервала / из R в /?р. Допустим,
что функция /-1, т. е. обратное отображение, существует; это
означает, что для любой точки х е Rp, являющейся значением
функции /, множество тех |е/, для которых х = /(g), сводится
к одной точке. Тогда f~l будет действительной функцией р
действительных переменных (гл. VII, разд. I).
7. Вектор-функция /, определенная на /, называется
ограниченной, если числовая функция |—41/(1)11 ограничена, т. е. если
найдется такое число М > О, что ||/(g) 11^ М, каково бы ни было
* § 2. Непрерывные вектор-функции
Мы придерживаемся порядка изложения, принятого в гл. III
(разд. II и VI).
1. Непрерывность. Пусть /— отображение I в Rp. Говорят,
что f непрерывно в точке goe/, если ||/(g)—/(go) II стремится
к нулю при g, стремящемся к g0. Это выражение имеет смысл,
ибо /(g) —/(go) имеет смысл в силу того, что R? есть векторное
пространство, и значит, ||/(g) —/(go) II есть неотрицательное
действительное число. Стало быть, определение свелось к прежним
понятиям. Допустима также формулировка, что рассматривается
числовая функция g->||/(g) — Г (So) II» и мы будем говорить, что.
отображение / непрерывно, если при |g — go|, стремящемся к
нулю, значение указанной числовой функции стремится к нулю.
Другое эквивалентное определение гласит, что числу е > О
соответствует такое a (go, e), что если |g — go|<a (и ge/), то
11/(1)-/(Ы1Кв. пр
Или еще: любому открытому шару В в Rp с центром /(g0)
и радиусом 8 соответствует такой интервал J с центром g0, что
если g<=/, то /(g) <= В.
Действительно, неравенство ||/(g) —/(go)II <е означает, что
/(g) отстоит от /(go) на расстоянии, меньшем е.
Будем говорить, что / непрерывна на /, если / непрерывна
в каждой точке из /.
876
КНИГА III. АНАЛИЗ
Пусть х = (£ь ..., gp) —точка из Rp. Если ||д:|| есть всегда
одна из трех норм, определенных в Rp (гл. V, § 3), и если
||#|| < е, то для k = 1, 2, ..., р имеем \lk\ < е (гл. V, § 5).
Обратно, если \lk\ < 8 (k = 1, 2, ..., р), то существует такая
абсолютная константа Я, что ||х|| < Кг.
Пусгь теперь f(£) = (q>!(E), ..., Фр(|)). Тогда
/ (I) - f (lo) = (<Pi (l) - Ф1 (У, ..., фр (i) - фр (Ы)•
Если НШ-/(£о)11<в для |g-|0l<a, то и | Фл(£)- Ф,(1о) 1<е
(6=1, 2, ..., р). И обратно, если | <р* (g) - Ф* (go) К е (&=1,
2, ..., р), то ||/(g)-/(g0)ll<^.
Итак, 5ля того чтобы вектор-функция f была непрерывна
в точке g0 ^ Л необходимо и достаточно, чтобы числовые
функции фь ..., фр были непрерывны в точке |о.
2. Операции с непрерывными вектор-функциями. Если / и
g— отображения одного и того же интервала / в Rp,
непрерывные в точке go ^ / (соотв. непрерывные на /), то очевидно, что
/ + g и ос/ непрерывны в точке go ^ / (соответственно
непрерывны на /), каково бы ни было asJ?.
Понятие произведения fg мы не определяем, поскольку не
определено произведение двух элементов из RPm
Так как в Rp не введены ни произведение, ни порядок, то не
определяются и понятия, соответствующие функциям /+, /-, 1/f.
Числовая функция |f| непрерывна одновременно с f (гл. III,
разд. II). Рассмотрим по аналогии числовую функцию g—► 11/(1)11.
Так как 11|*|| - \\у\\ \<\\х- у\\, то 1||/(g) || - ||/(g0) II | <
< ll/(g)—/(g) II- Стало быть, если / непрерывна, то числовая
функция £-41/(5)11 тоже непрерывна.
3. Основные теоремы.
Теорема. Пусть I — ограниченный интервал из Ry a f —
отображение I eRp, непрерывное на I. Если $Г есть множество
точек из /, замкнутое в /?, то множество f{@~) замкнуто и
ограничено в Rp.
Понятие замкнутого множества в Rp определено в гл. V, § 6.
Как и на числовой прямой, мы показали, что замкнутое
множество либо состоит из конечного числа точек, либо содержит
бесконечно много точек, и в этом случае характеризуется тем,
что содержит свои точки накопления.
Для доказательства того, что f(@~) замкнуто в Rp,
обратимся вновь к доказательству этого утверждения для
непрерывных числовых функций (гл. III, разд. II, § 2, теорема 1), где на
этот раз lim/(g^)==/(g0) означает, что |/(Ц)-/ (Щ
стремится к нулю, когда k стремится к бесконечности. Для
доказательства того, что /(#") ограничено, воспользуемся теоремой 1
(гл. III, разд. II, § 2). В самом деле, если / непрерывна
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 377
на /, то числовая функция g-4lf(£)|| тоже непрерывна (п. 2).
Значит, множество чисел ||/(|)|| ограничено (^е^), а это
равносильно тому, что / ограничена на У.
Следовательно, можно дать более краткую формулировку:
Образ в Rp ограниченного замкнутого множества из R
посредством вектор-функции f ограничен и замкнут.
Но мы не можем сформулировать следствие, аналогичное
тому, которое было в гл. III, разд. II, § 2, ибо понятия sup/
и inf / не определены в силу того, что в Rp не определено
понятие порядка. По этой же причине мы не можем перенести ни
теорему 2, ни ее следствие.
4. Равномерная непрерывность. Будем снова говорить, что
отображение f интервала I из R в Rp равномерно непрерывно,
если произвольному г > О можно поставить в соответствие
такое число а, не зависящее от % е /, что если \% — £'|<а, то
iif(i)-f(i')H<e.
Просто мы в определении, данном для числовых функций,
заменяем \f(x)-f(x')\ на ||f(£)—f(£')ll (гл. Ш, разд. II, § 3).
Опять очевидно, что если / равномерно непрерывна, то она
непрерывна. Теорема о равномерной непрерывности, когда /
есть замкнутый интервал [а, Ь], снова верна, причем в
первоначальном доказательстве (там же) ничто не меняется, кроме
замены |f(*) — fix') | на \\f{Q—f(l')\\ и применения
неравенства треугольника, имеющего место для нормы.
Итак, если f — непрерывное отображение интервала [а, Ь]
в Rp, то f равномерно непрерывно.
5. Гомеоморфизм. Хотя понятие строго возрастающей
вектор-функции и не определено, все же гомеоморфизм определить
можно. Будем говорить, что / осуществляет гомеоморфизм
интервала I в /(/), если f и f~l непрерывны. Мы ограничимся
весьма кратким пояснением этого определения (см. разд. II).
Пусть Е— множество точек в Rp. Если х и у — две точки
из Е, то число d(x, у), являющееся расстоянием от х до у в Rр,
определяет в Е расстояние, и утверждение, что
последовательность (хп) точек из Е стремится кхе£, сводится к тому, что
lim d{xn> x) = 0. После этого можно определить понятие ото-
Я->оо
бражения Е в /?, т. е. числовую функцию переменного х е £,
непрерывную на Е относительно точек из Е. Если f — такая
вектор-функция, определенная на /, что f (I) = £, т. е. /
отображается на Е, и если / взаимно однозначна, то выражение «f~l
непрерывна на Е» имеет смысл.
6. Последовательность вектор-функций. Равномерная
сходимость. Ярусные функции. Пусть (fn) есть последовательность
отображений интервала / в Rp. Будем снова говорить, что
эта последовательность равномерно сходится к функции f,
378 КНИГА III. АНАЛИЗ
определенной на / и принимающей значения в Rp9 если для
любого е >0 найдется такое Р{г), что ||/п(6) — f (I) II < е,
каковы бы ни были I е / и п ^ Р(г).
Используемая норма есть одна из трех эквивалентных норм,
определенных в гл. V. Согласно соотношениям между этими
тремя нормами (гл. V, § 3), если положить fn = (фп, i, ..., фп, р),
f = (фь • •., фр), то неравенство ||fn(£) — f(l)\\ < e при любом
|s/ влечет для любого k выполнение неравенства |фп,ь(£) —
— фь(£)1<е ПРИ любом I <= /. Следовательно, для того чтобы
последовательность (/п) равномерно сходилась на интервале /,
необходимо и достаточно, чтобы последовательности
координатных функций (фп, k) n&N равномерно сходились на /.
Как и в случае числовых функций, строго доказывается, что
если все функции fn непрерывны на I и если последовательность
(fn) равномерно сходится, то предельная функция f непрерывна
на I.
Пусть теперь / — ступенчатая вектор-функция на интервале
[а, &], т. е. существует разбиение а0 = а < а\ < а2 < ... < aq = 6,
при котором f постоянна на ]aif й{+\[\ это значит, что для
/(£) = ** = («/,!> «№ ..-> а*,р),
где cti,fe — действительные числа. Следовательно, координатные
функции фь тоже являются ступенчатыми функциями (гл. III,
разд. IV).
Будем снова называть ярусной функцией на [а, Ь] всякую
вектор-функцию, являющуюся равномерным пределом
ступенчатых функций.
Согласно результатам предыдущего параграфа, для того
чтобы вектор-функция /, определенная на [а, Ь], была ярусной
функцией, необходимо и достаточно, чтобы все координатные
функции фь были ярусными.
§ 3. Дифференцируемые вектор-функции
Определение и общие свойства. Пусть f — отображение
интервала I в Rp. Будем говорить, что f дифференцируемо в точке
1о е /, если отношение ll» (5 ^ So) имеет предел в Rp,
когда £ стремится к %0 в I. Значение этого предела обозначается
Мы пишем здесь п% г* вместо ~r(f(l)-f(lo))>
S -* So ь So
что является элементом из Rp, полученным путем образования
разности /(!)•— f{lo) двух элементов векторного пространства
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 379
Rpf которая снова будет элементом из Rp , и умножения этой
разности на действительное число » » (£ ф £0).
Это определение означает, что в Rp существует такой
элемент, обозначаемый f'(6o). что
1Im|imzp_r(y|-o,
f (go) есть элемент пространства Rp.
Если вектор-функция f дифференцируема для любого g е /,
то говорят, что / дифференцируема на /, а вектор-функция
5 "*/'(£) обозначается через f или d//dg и называется
производной.
Производная я-го порядка, когда она существует,
обозначается через /<п> или dnf/dln и является производной от п— 1-й
производной. Производная же /' называется первой производной.
Снова имеем (/<*)) <w> = (/<m))<n> = f(m+"), если последняя
существует.
Если f(go) существует, то lim J f ^[^ ~Г<&>)\-О-
Пусть /'(goHfci, а2, ..., ар). Так как
/(£)-/(So) =/ф!(6)-Ф1(6о) Фр(6)-ФР(6)^
6 —Бо V Б-6о ' '■■• ё~6о Г
то ясно, что для того чтобы существовала /'(#о), необходимо и
< и 1 о фл(Б)-фл(Бо)
достаточно, чтобы для k = 1, 2, ..., /? отношение ——г—г=—
S"~So
стремилось к а*, когда g стремится к g0. Иными словами,
необходимо и достаточно, чтобы ф& имела производную ф&(Ёо)>
каково бы ни было k = 1, 2, ..., /?.
Следовательно, для того чтобы / = (фь ..., фр) имела
производную в точке go ^ Л необходимо и достаточно, чтобы р
функций фь ..., фр были дифференцируемы в точке g0, и тогда
г &)-№&). .... <ш)-
Можем написать / = ф1б1 + ... + <ррер9 f = ф[е, + ... + <р'р ер.
Вообще, /<п) существует в том и только том случае, если м-я
производная функции щ существует при любом k = 1, 2, ..., р\
тогда /(п)=фГЧ+ ...+qfv
Если f существует, то функции щ дифференцируемы, а
значит, непрерывны, и то же самое верно для f.
Если f и g — отображения / в Rp, дифференцируемые в
точке g0 е /, то / + g и af тоже дифференцируемы, и их
производные равны П|о) + вГ(|о), аГ(1о).
380 КНИГА III. АНАЛИЗ
Отображение f-+f и вообще f-+f(n) есть линейное
отображение
Если вектор-функция / постоянна, т. е., каково бы ни было
£е/, /(|) = ае/?р, т. е. функции ф^ постоянны, то f = 0, ибо
ф£ = 0 при всех k.
Примеры. 1. Отображение / прямой R в R2, определенное
как ф1 (g) = g, ф2(Ю==12» непрерывно, дифференцируемо, и
f/ = (l>2g) = e1 + 2g4
2.. Пусть f = (фЬ ф2, Фз), g = (Yb Y2, Y3) • Положим / • g =ф^1 +'
+ ф2У2 + фзYз, причем функции ф^ и Yfe — действительные
функции от |, определенные на одном и том же интервале / из R.
f-g есть внутреннее (или скалярное) произведение
векторов f и g\ функция
3
6 -* / (Б) • * (6Н Ф1 (6) Yi (|) + Ф2 (I) Y2 (I) + Фз (I) Y3 (Б) - 2 Ф* <fe) Y* (Б)
есть числовая функция; (f,g)-+f-g есть билинейная форма
(Книга II, гл. X, разд. I).
Следуя правилам вычисления производных числовых
функций, при условии, что щ и уи дифференцируемы, получаем
(f-g)' = :S<p'ftYft+2cpftY;==f' g + fg'.
В частности, если / = g, то /2 представляет собой скалярный
квадрат отображения f; имеем
(/(Ш2 = 2(фИШ2Ч1Ш1Р>
причем здесь \\f(l)\\ есть евклидова норма для /(g). Тогда,
в сокращенных обозначениях, имеем -тг- f2 = 2f • f. В частном
случае снова получаем, что если f постоянно, то f' = 0 и,
значит, /-f = 0.
3. Полагаем
f Л g = (ф2Yз - Y2Фз> ФзУ1 ~ YзФl, ФПЬ - Yi<fe)-
Это отображение интервала / в Rz определяет
вектор-функцию, называемую векторным произведением. Имеем
if Л g)' = ( ^2Y3 ~ Y2Фз)^ (<P3Yi - YзФl)^ (ф^2 ~ Y^2)').
Но (ф2у3 - Y2Фз), = (<P2Y3)' - (Y2Фз), = Ф& ~ Y24P& + <P2Yj - Y&. Сл*-
довательно,
(f Л gY = (Ф^з - Y24>J. • • •) + (*2Yi - Yfo. • • •) - f Л g + f Л g'.
Производная от /°ф. Пусть ф — действительная функция,
определенная на интервале / из /?, a f — отображение в /?" ин-
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 381
тервала из R, содержащего ф(/). Если ф'(£о) существует для
lo^I и если /'(ф(£о)) существует, то вектор-функция /оф
дифференцируема в точке go и ее производная р'авна /'(ф(Ы)ф'(Ы-
Без малейших изменений проходит доказательство,
проводившееся для случая, когда / есть числовая функция.
§ 4. Формула Тейлора
Для вектор-функций не существует теоремы Ролля, но
формула Тейлора имеет место. Если /<п) существует в точке |, то
.существуют и ф^ (/5=1,2,...,/?). В окрестности точки ае/
имеем
где limrftin(6) = 0.
1->а
Стало быть, вектор-функция rn = (rhny r2tn, ..., rp,„) такова,
что lim rn (g) = 0. Отсюда
f(l) = f(a)+^f'(a)+ ... +ii^p)(a)+r„(i)-^f^,
limr„(g) = 0.
i->a
§ 5. Интегрирование вектор-функций
Теория интегрирования может быть перенесена без
изменений, если положить для ступенчатой функции
Ь х> / Ь
Jf(0*-S /ф*(0ЛЦ.
k=\ \a
Это приведет к определению интеграла любой ярусной
функции / на [a, b] посредством равенства
Ь Р Г Ь \
/К0Л-2Иф*(0л)*ь
где фь — ярусные числовые функции.
ь
Интеграл Г f (t) dt есть точка пространства Rp
а
Следующие свойства интеграла очевидны.
382 КНИГА III. АНАЛИЗ
1. Каковы бы ни были ярусные функции / и g на / = [а, Ь]
и А,<=#,
ъ ь ь
\{t{t)+g(t))dt=\f{t)dt+ \ g{t)dt,
а а а
Ъ Ь
fkf(t)dt-K \f{t)dt.
а а
2. Если / — ярусная вектор-функция на [а, Ь] и на [Ь, с], то
она будет ярусной и на объединении этих двух интервалов, и
ъ с ь
jf(t)dt = jf{t)dt+jf(t)dt.
а а с
§ 6. Примитивные непрерывных вектор-функций
Согласно теоремам о непрерывности и дифференцируемости
(§§ 2 и 3) и свойствам интеграла J <p(t)dt от непрерывной
а
числовой функции ф, равенство
jf(t)dt = Ucpl(t)dt)el+ ... + \j<pp(f)dt)ep-F®
определяет вектор-функцию F на [а, й], непрерывную,
дифферента
цируемую и такую, что ее производная равна /(£)= 2ф^(|)^.
F есть примитивная функции f.
Если F и G— два отображения интервала I в Rp, имеющие
одну и ту же производную /, то F — G есть постоянная вектор-
функция, т. е. такое отображение I в Rp, что F(l) — G(Q = a
при любом ^Е/ = [а, Ь], где а есть фиксированная точка из Rp.
Действительно, F' — С = 0. Значит, компоненты разности
F' — С по векторам ek есть нулевые числовые функции,
примитивные которых постоянны. Имеем F — G — а\в\ + а2е2 + ...
... + арер = а, причем ak (k = 1, 2, ..., р) — действительные
фиксированные числа.
Отсюда снова вытекает, что если Ф — произвольная
примитивная непрерывной вектор-функции /, то
<S>(b)-<b(a)=jf(t)dt.
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 383
Теорема о замене переменного остается справедливой
(гл. IV, разд. III, § 3), но только относительно композиции
числовой функции g на вектор-функцию /: если g есть непрерывная
действительная функция на интервале [а, р], имеющая
непрерывную производную g\ и если / — непрерывное отображение
интервала [а, Ь] в Rv, причем а *С g{t)^i bf то
Р ъ
jf(g(t))g'(t)dt~jf($)dl.
а а
II. НЕПРЕРЫВНЫЕ ДУГИ, СПРЯМЛЯЕМЫЕ ДУГИ
Этот раздел посвящен изложению внешне близкого всем
понятия непрерывной кривой и длины дуги кривой.
Здесь уместно уточнить само понятие кривой. Если / —
вектор-функция, определенная на интервале / из R и принимающая
значения в Rp, то элементарные примеры (такие, как
окружность на плоскости: x(t) = rcost, y(t) = rsint, 0*Ct<2n)
заставляют думать, что практически можно было бы
довольствоваться тем, чтобы назвать кривой в Rp множество точек f(t)
из Rp, где t&I. По причинам, которые мы не можем здесь
изложить, такое определение неприемлемо. Например, в
Книге I, гл. II, § 2 было показано, что множества [0,1] с: R и
[0, 1] X [0, I] a R2 имеют одинаковую мощность.
Даже в том случае, когда / является непрерывной
бесконечно дифференцируемой вектор-функцией, могут возникать
трудности. Так, возвращаясь к элементарным геометрическим
понятиям, рассмотрим то, что называют окружностью радиуса г
с центром 0; это множество точек, евклидово расстояние
которых от 0 равно г, причем г есть положительное действительное
число. Если обозначить через х, у прямоугольные координаты
точки этой окружности, то окружность будет определена как
множество точек (х,у), удовлетворяющих соотношению х2+у2 =
= г2. Теперь рассмотрим вектор-функцию /, определенную на R
посредством равенств ф1 (^) = x(t) = r cos/, ф2(/) =*/(/) =
= г sin t. Если брать только значения функции / для интервала
[а, а + 2л [, то будет установлено взаимно однозначное
соответствие между окружностью и точками из [а, а + 2я[; но если /
принимает все действительные значения, то соответствие между
окружностью и R уже не будет взаимно однозначным.
Так мы приходим к следующей концепции: среди всех
точечных множеств из Rp выбираются те, которые являются
множеством Е образов интервала / посредством непрерывной
функции /, осуществляющей взаимно однозначное соответствие
между/и Е. Мы не затрагиваем вопроса о том, существует ли для
заданного в Rp множества Е непрерывная вектор-функция /,
384
книга in.Анализ
осуществляющая между некоторым интервалом и Ё взаимно
однозначное соответствие.
Изложение будет проводиться для Rpy где из соображений
записи и ради того, чтобы оставаться в привычных рамках,
точки будут обозначаться прописными буквами Л, В, М, ...,
а координаты точки относительно канонического базиса —
через хи *2, • • •, хр. Если р = 2, то часто вместо хи х2 пишут х, у,
а если р = 3, то вместо Х\, х2у хъ часто пишут х, уу г.
Ориентированная жорданова дуга. Жордановой дугой
называется множество Г из Rpy гомеоморфное некоторому
замкнутому интервалу I.
Таким образом, существует непрерывная вектор-функция f,
осуществляющая взаимно однозначное отображение
интервала /, а ^ t ^ р, на жорданову дугу Г. Переменное t
называется параметром.
Пусть существует другая непрерывная вектор-функция g,
осуществляющая гомеоморфизм между / и Г, и т — другой
параметр. Тогда каждой точке из Г можно поставить в
соответствие одно, и только одно, значение t и одно, и только одно,
значение т из /. Тем самым установлено взаимно однозначное
соответствие / на себя. Это соответствие непрерывно, и (по-
этому, в силу теоремы 2 из гл. III, разд. III, § 2, соответствие
t—*% строго монотонно и отображает / на себя. Обозначим
эту функцию т = ф(0- Значение ф(а) может быть равно
только а или Р; если ф(а) = а, то ф возрастает; если ф(а) = р, то ф
убывает. Если на [а, р] ввести обычное отношение порядка, то
это отношение сохраняется, если ф возрастает, и меняется на
обратное, если ф убывает. Переводя это отношение порядка на Г,
условливаемся, что если М и М' — две точки из Г, то М^М\
если соответствующие параметры tut' находятся в отношении
t ^ ?. Ясно, что имеются два, и только два, взаимно обратных
способа упорядочения точек множества Г. Будем говорить
в этом случае, что Г есть ориентированная жорданова дуга.
Это понятие не зависит от выбора параметра.
* § 1. Ломаные линии в Rp
В элементарном толковании прямая на плоскости есть
множество точек с координатами х, у, удовлетворяющими
равенству ах + by + с = 0, где а, 6, с — действительные числа, или
еще: множество точек с координатами х, у, которые являются
аффинными функциями некоторого параметра t, принимающего
все действительные значения, х = at + р, у = aft + р', где а, р,
а', р' —заданные действительные числа. Это сводится к
заданию вектор-функции f: t-+(x,y), отображающей R в Я2, и
рассмотрению образа f (R) прямой R при отображении /, причем /
гл. VI. вёктор-функций одного Действительного переменного 385
Определена как f(t) = at + b, где а = (ос, а'), &==(р, р'). Тогда
при изменении t на интервале / из R получается
прямолинейный отрезок, и этим отрезком является /(/).
Мы дадим точные определения прямолинейных отрезков,
ломаных линий и дуг кривых при помощи вектор-функций.
1. Отрезок. Пусть А и В — две различные точки из Rp.
Отрезком АВ называется множество точек М из Rp вида
(1 — 1)А + %В, где 0<|<1. При Л = В отрезок АВ
обращается в точку.
Отрезок есть множество значений в Rp вектор-функции f
вида |-*(1—1)А + |5, определенной на [0,1]. Данное
определение принадлежит к определениям из алгебры (Книга II,
гл. VII, §7).
Пусть Е,Ге[0,1]; тогда /(g)_f(g')-(g-g')(B_4). А
поскольку элемент В — А из Rp отличен от нуля в силу того, что
В ФА, то равенство (£ — £') (В — Л) = 0 может иметь место
лишь при условии, что I — |7 = 0, или | — £' (Книга II, гл. VII,
разд. VII, §3).
Следовательно, / есть взаимно однозначное отображение
интервала [0, 1] на АВ. Ясно, что оно взаимно непрерывно.
Пусть а < Ь — два произвольных действительных числа, и
t = (b — a)l + a. Установленное таким путем соответствие
между [0,1] и [а, Ь] взаимно однозначно и взаимно непрерывно.
Вектор-функция
b—a ' b — a *
полученная композицией функции ф вида g =*= ф(0 — ь~_~ на
/, есть взаимно однозначное и взаимно непрерывное
отображение [а, Ь] на АВ\ t называется параметром. Говорят, что точка
М = ~ А + ъ~ух В пробегает отрезок АВ, когда t возрастает
от а до Ь.
На АВ вводится отношение порядка между двумя точками М
и М\ как образами значений t и f параметра, путем соглаше*
ния, что М4^М\ если t<*Ct'. Говорят, что М пробегает
отрезок АВ от А до 5, когда t возрастает от а до Ь, что АВ
ориентирован в направлении возрастания t и что А есть его начало^
а В — конец.
Если условиться, что М>ЛГ, когда t^t\ то АВ будет
ориентирован в направлении убывания t\ тогда В будет его
началом, а Л — концом.
В обоих случаях точки А я В называются его концами.
Всякий гомеоморфизм, Переводящий действительный
параметр в другой действительный параметр 9, сохраняет эти
ориентации в совокупности, т. е. если 0 — ф(/) есть строго возрастающая
13 Ш. Пизо, М. Заманский
386
книгл ш. анализ
непрерывная функция, то порядок М ^ М' на АВ не
изменится; если же 9 = ф(0 есть строго убывающая функция, то
порядок М^М', определенный посредством /<£' (или t'^>t)
заменяется на М>ЛР, определенный посредством 6<9' (или
в'>е).
2. Длина отрезка. Длиной отрезка АВ называется конечное
неотрицательное действительное число \\В — Л|| = ||Л—ВЦ. Эта
длина, очевидно, служит расстоянием от А до В, но лишь
только перестает идти речь об отрезке прямой, как уже нельзя
смешивать расстояние от А до В как точек из R? с длиной
«линии» АВ. Длина отрезка обозначается через 1(АВ).
Пусть теперь М — произвольная точка из АВ, at — ее
прообраз в интервале [а, Ь]. Тогда
ЦАМ) = \\М-А\\ = \^(В-А)\ = \ *~а
IIВ-Л ||f
что следует из свойств нормы. Если t возрастает от а до Ь
(а<Ь), то 1{АМ)— фЦд'ЦД — А\\. Тогда отношение порядка
на Л В, определенное так, чтобы /•</' соответствовало М^СМ'
(ориентация в направлении возрастания t), эквивалентно
отношению 1(АМ)^1(АМ'). Точно так же отношение 1(ВМ)*С
•*С1(ВМ') устанавливает ориентацию в направлении
убывания t.
3. Ломаная линия. Рассмотрим конечное число точек в Rp.
Мы можем считать их значениями отображения в Rp конечного
множества неотрицательных целых чисел: 0, 1, 2, ..., п.
Обозначим такое отображение через ср и каждой из
рассматриваемых точек отнесем в качестве индекса то число k (О ^ k <; п),
образом которого она считается. Тогда точки будут обозначены
через М0, Ми М2у ..., Mki Affc+b ..., Мп.
Ломаной линией называется объединение отрезков
М0Ми МХМЪ ..., Мп^Мп.
Ее обозначают через М0М\ ... Мп. Точки М0 и М п называются
концами, а точки Ми — вершинами ломаной.
Говорят, что она получается путем соединения точек в по-
рядке следования их индексов. Но из одних и тех же. точек
можно образовать и другие ломаные линии, соединяя точки
в другом порядке, что сводится к выбору иного отображения,
чем ф.
Отрезок MkMk+i есть образ в Rn интервала [аи, a'k]
посредством вектор-функции fu вида
ak~ak ak~ak
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 387
Пользуясь заменой переменного, можно допустить, что
afk^ak^v Положим а0 = а, ап = Ь\ тогда интервал [а, Ь]
разбивается точками а0 = а < а\ < а2 < ... < ап = Ь, и образ
интервала [ah, ак+\] при отображении fk есть МкМк+л. Пусть
теперь f есть вектор-функция, определенная как f(t) = fk(t), если
t e [akj ak+\].\ Тогда ломаная М0М\ ... Мп будет в Rp образом
f[a, b] отрезка [а, Ь] посредством f. Говорят, что она определена
путем разбиения [а, Ь] точками ак. Здесь снова соответствие
между [а, Ь] и f([ay b]) взаимно однозначно. Точки Mk
расположены на ориентированной кривой в порядке следования их
индексов. Очевидно, что / — непрерывная функция; кроме того,
в каждой точке t ф ак (ft =1,2, ... п—1) существует
производная
ak+i ak
Обратное отображение f~l тоже непрерывно на ломаной линии.
В точке ак функция f имеет правую производную Г(ак + 0),
а в точке ак+\ — левую производную, причем
f'(ak+i-0) = f'(ak + 0)= ' Щш-Мк).
ak+\ ak
Обозначим ломаную линию М0у Мь ..., Мп через П.
Длина ломаной линии П, по определению, равна
tl(MkMk+l).
Пусть М — точка на этой ломаной; М является образом
некоторого t, лежащего на интервале [ак, ah+\]. Если М' — другая
точка, а именно образ точки /'g^,, ak>+\]> T0 отрезки MMk+u
Mk'M' и отрезки MiMi+u У которых i заключено между k + 1
и kr—1, определяют ломаную линию, которую обозначим
сокращенно ММ'. Ее длина равна
/ (ММ') = I (ММк+г) + Ц / (MtMM) +1 {MkrM%
k+\
В частности, l(MQM) есть функция от /, равная нулю при t = a
и возрастающая, когда t меняется от а до Ь.
Если М, М' и М"— три точки ломаной П и если ломаная
с концами М, М', с одной стороны, и М\ М"у с другой, имеют
только одну общую точку ЛГ, то
IЩМ") = / (AfAfO +'/ (М'М").
1(М0М) называется также криволинейной абсциссой точки М
па ломаной П, ориентированной по возрастанию /т
13*
388 КНИГА III. АНАЛИЗ
Из предыдущих определений вытекает, что длина
прямолинейного отрезка А В не превосходит длины любой ломаной с
концами Л и В, так как
\\В-А\Ы\В-Ап-1 + Ап-1-Ап-2 + ... +Л!-Л||<
^НВ-Л^Щ- ... +||Л1~Л(|.
* § 2. Спрямляемые жордановы дуги
Пусть Г — жорданова дуга, определенная при помощи
вектор-функции f на интервале [а, Ь]. Точки Л = /(а), В =f{b)
называются ее концами. Дуга Г будет также обозначаться
через ЛВ.
Если ф — непрерывная действительная функция переменного
и е [а', Ь'\ осуществляющая гомеоморфизм (взаимно
однозначное и взаимно непрерывное соответствие) между [а', Ь'] и [а, Ь],
так что u-*>t — y(u)f то функция, определенная равенством
g(u) = /(ф(м)), тоже осуществляет взаимно однозначное и
взаимно непрерывное соответствие между [а', У] и Г.
Мы выделим среди жордановых дуг так называемые
спрямляемые дуги, т. е. те, для которых можно определить понятие
конечной длины.
Определение 1. Пусть ао = а < а4 < а2 < ... <ak < ak+i < ...
... < ап = Ь — разбиение интервала [а, Ь] конечным числом
точек таку что если k < k\ то ak<akr И пусть точка Mh = /(ац)
на Г есть образ точки а& посредством /, а П — ломаная линия
AMiM2 ... Mn-iB. Рассмотрим множество всех ломаных П,
соответствующих всем конечным возрастающим разбиениям
интервала [а, Ь\ Если верхняя грань длин /(П) всех этих
ломаных есть конечное число, то дуга Г называется спрямляемой, и
ее длина, по определению, равна I (Г) = sup / (П).
п
Предположим, что дуга Г спрямляема. И пусть / (Г) есть
ее длина, которую мы обозначим также через 1(АВ). Какова
бы ки была ломаная П из семейства ломаных, рассмотренных
нами в предыдущем определении (исключая всякую другую
ломаную линию), 1{И)^1(АВ), ибо 1{АВ) есть sup / (П).
Согласно определению верхней грани, для любого е>0 найдется
такая ломаная П, что /(ЛВ) — е/2 < 7 (П)<; / (Л5). Пусть Oq =
= а<ах< ... <ak<ak+l< ... <an = ft —разбиение,
определяющее П. Так как вектор-функция f непрерывна на [а, Ь],
то она равномерно непрерывна; значит, можно найти такое
6 > 0, что если |/-Г|<б, то || f (t) — f {t') \\ < e/4n. Пусть теперь
П/ — ломаная, определенная посредством такого разбиения:
а'^=а<а\<а'г<... <а'.<а\+х< ... <а^ = &, что |a'i+l--aj|<6f
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 389
каково бы ни было / = 0, 1,..., т— 1. Между ak и ak+x
имеются точки а\\ пусть это будут cik^:a/i <aj +1< .. .
.i.. <aj ^^+r По неравенству треугольника (как свойству
нормы),
|/Ы-/К+1)!<|КЫ-/К+!)|+|КК+.)-^К+1)||+
+ S FK+v+.)-/K+v)||<
V=0
Отсюда
*+£* |KK+v+I)-^K+v)||>|/K)-fK+1)l-^-
Проводя суммирование по k = О, 1, ..., n, получаем
m я
Sl'(e5+i)-/(«0l>S|/(«*)-/K+0|—!•
или / (ПО > / (П) -1- > / (ЛВ) - е. Следов ательно,
/(Ай)-е</(П0</(АВ).
Этот результат формулируется также следующим образом:
каково бы ни было деление АВ, лишь бы оно было достаточно
мелким, длина полученной ломаной отличается от длины Г
меньше чем на е.
Или, более строго:
Теорема 1. Если дуга Г спрямляема, то длина ломаных
линий Пп, соответствующих последовательности делений
интервала [а, Ь] такими точками akr что наибольшее из \ а^\ — ал |
стремится к нулю, стремится к длине дуги Г.
Теперь легко доказываются свойства 1(АВ):
1. l(AB)^l(AB). ^
2. Если М и М'— две точки дуги Г, то дуга ММ' спрямляема,
ибо достаточно рассмотреть ломаные линий П, соответствующие
достаточно мелким делениям и имеющие вершины в М и М'.
3. Какова бы ни была точка С на Г, / (АВ) = /(АС) +1 (CB)
(аддитивность).
390
КНИГА III. АНАЛИЗ
Теперь мы установим еще одно важное свойство.
Пусть М = f(f) — точка на Г. Если Г спрямляема, то дуга
AM тоже спрямляема и ее длина 1(АМ) есть функция от
t €= [а, Ь]. Запишем l(t) = l(AM).
Теорема 2. Если М = f(t) есть переменная точка
спрямляемой дуги Г, то функция /, значение которой для t e [a, b]
является длиной дуги AM, есть непрерывная возрастающая
функция от t.
Аддитивность (предыдущее свойство) показывает, что эта
функция возрастает. Покажем, что она непрерывна.
Пусть точкам Л, ЛГ, М соответствуют параметры а, V, t\
допустим, например, что t'<t. Для заданного е>0 можно
найти такую ломаную IT с концами Л, М' и такую ломаную П"
с концами М\ М", что / (ПО + / (IF) > I (AM)-в. Но ЦАМ) =
= I (AM') + ЦМУМ). Отсюда I (IP) + /(П") >I (AM") +1 (WM) - е,
или 0^1(AM/)-1(W)^1(U^-1{aFm) + b. А так^как /(П")<
</(Л17М), или /(П")-/(Л1'Л0<0, то 0</(ЛЛ1,)~/^П,)<
< I (IF) -/ (М7М) + 8<е, Но из неравенства 0</ (П") -/ (ATM)+е
вытекает, что / (М'М)<^1 (II")+е, какова бы ни была ломаная П",
лишь бы разбиение отрезка [а, Ь] было достаточно мелким.
В частности, если выбрать \t — V | достаточно малым, то это
условие будет выполняться, если линия П" будет отрезком
прямой М'М. Стало быть, 1(ЛрМ) <||f (t) -f(t') || + e, если
| f — *' | достаточно мало.
Этим доказана непрерывность слева функции / в
точке М.
Точно так же I непрерывна справа, и значит, непрерывна.
Определение 2 (криволинейная абсцисса). Если Г —
спрямляемая дуга, то криволинейной абсциссой точки М на Г с
параметром t называется значение любой функции s вида s(t)=*
= l(t) + а, где а — произвольная постоянная.
Возьмем a = l(t0), где 4е[а, b}\ l(t0) есть длина дуги
АМ0у где Afo = f(^o). Тогда точка М0 называется началом
отсчета криволинейных абсцисс. И криволинейная абсцисса точки
M = f(t) будет равна s(t) = l(t)—l(to). Функция s непрерывна
и возрастает, но она может и не быть положительной. Она
осуществляет гомеоморфизм между интервалом [а, Ь] и интервалом
[1(a) — l(to), 1(b)— l(U)\ длина которого равна /(Г).
Если отношение порядка на дуге Г вводится по параметру s,
то говорят, что Г ориентирована в направлении возрастания s.
Если же при s^<s' полагать М^М', то Г будет
ориентирована в направлении убывания s.
ГЛ. Vt. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 391
Важная (и очень трудная) задача состоит в том, чтобы
выяснить для случая, когда Г спрямляема, a g— другая вектор-
функция, снова определяющая Г, будет ли новая
криволинейная абсцисса, определяемая функцией g, совпадать с s (с
точностью до аддитивной постоянной). В следующем параграфе
мы разберем эту задачу для простых случаев.
Евклидова длина. Во всех предыдущих рассуждениях пред*
полагалось, что Rp наделено одной из трех норм, определенных
в гл. V. Если норма элемента х = (|ь ..., 1Р) есть евклидова
норма Н«II = (61+ ... +&р)1/2» то длина /(Г) называется
евклидовой длиной. Именно она и будет наиболее часто
использоваться в дальнейшем.
Необходимо заметить, что если три нормы определяют в Rp
одну и ту же топологию, т. е. одно и то же понятие предела,
то, напротив, они не приписывают спрямляемой жордановой
дуге одну и ту же длину.
§ 3. Аналитические условия спрямляемости дуги
1. Пусть Г — непрерывная дуга, определенная при помощр
вектор-функции /, непрерывной на [а, 6]. Через П обозначена
одна из ломаных линий, определявшихся в предыдущем
параграфе. Дуга Г спрямляема в том и только том случае, если
длины /(П) ограничены. Необходимое и достаточное условие
будет, следовательно, состоять в том, что, каковы бы ни были
aQ = a<ax<a2< ... <ak<ak+l< ... <ал = 6, сумма
%\f(ak+l)-f(ak)\\
ограничена.
Но в гл. V (§ 3) мы видели, что если х = (|ь <♦., £р) есть
точка из Rp, то, обозначив через ||дс|| евклидову норму, получаем
v2(«) -suplg* |<Цж ||< 1/рГv, (ж)- V7" 2!lБ< I.
k i-l
Пусть теперь / =* (фь ..., фр). Функции <рь ..., фр являются
действительными функциями от t e [a, b\ непрерывными на
[а, 6]. Обозначив через ф одну из этих функций, получаем, что
предыдущее неравенство, в котором произведена замена х на
№-№, а Ь на ФЛ0-ф^П5ир|ина|ф(0-фЮ1(^^е
k
е [а, Ь\), записывается в виде
|ф(0-ф(ОК11/(0-/(О1К>/р"2|фг(0-ф<(О1.
3§2 книга iii. Анализ
Отсюда
2 I Ф (ал+1) - Ф (ak) К 2 II f (fl*+i) " / («*) II <
fc-o fc=o
P. n-.l
< V^p" 2 2 I Ф* (a*+i) - Ф* Ы I-
Тем самым получена
Теорема 1. Для того чтобы Г бьма спрямляемой,
необходимо и достаточно, чтобы все функции ф (координаты
функции f) удовлетворяли условию: каковы бы ни были точки
а0 = а<а]<а2< ... <ап = Ьу сумма 2 I Ф (e*+i) — ф(#&) I огра*
о
ничена некоторой постоянной.
Если функция удовлетворяет этому условию, то говорят,
что она является функцией с ограниченным изменением на [а, Ь\
Мы не будем подробно изучать функции с ограниченным
изменением, но мы дадим достаточные аналитические признаки
того, чтобы ф была функцией с ограниченным изменением, а
значит, чтобы дуга Г была спрямляемой.
Следствие 1. Если все функции ф (координаты
функции f) монотонны на [а, Ь], то Г спрямляема.
Действительно, каково бы ни было деление [а, Ь] точками а&,
всегда
2 I Ф (я*+1) - Ф (ак) I = I Ф Ф) - Ф (а) I,
о
ибо если ф возрастает, то <p(a/t+i)— ф(я*)^0 при любом k,
а если ф убывает, что ф(а*-н)— ф(а^)^0 при любом k.
Замечание. Функции ф, очевидно, непрерывны,
поскольку / предполагается непрерывной. Если можно разбить
интервал [а, Ь] на конечное число интервалов, на каждом из
которых ф монотонна, то следствие снова будет выполняться.
Приведем теперь второй достаточный признак, более
специальный, чем предыдущий.
Если все функции щ дифференцируемы на [а, Ь] и если
производные ф£ ограничены, то
I Ф (fl*+i) ~ Ф (ак) К sup | ф' (0 | • | ak+l - ak |.
Отсюда
2 I ф (a*+i) - Ф Ы К sup | <р' (t) | 2 I (a*+i - ak) |«
= (6 - a) sup | ф' (0 |.
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 393
Следовательно, если <р' существует на [а, Ь] и ограничена, то
я— 1
2l<p(e*+i) —<р(ял)1 ограничена, каково бы ни было разбиение
интервала [а, Ь]. Но, с другой стороны, для того чтобы f была
дифференцируема на [а, Ь], необходимо и достаточно, чтобы
этим свойством обладали функции щ. Отсюда получаем
Следствие 2. Любая жорданова дуга Г, определенная при
помощи непрерывной функции р дифференцируемой на [а, Ь] и
имеющей ограниченную производную р, спрямляема.
Эта теорема, дающая достаточное условие спрямляемости
жордановой дуги, касается обычных дуг, а именно тех, которые
обладают касательной в каждой точке; но она не доказывает,
что любая дуга, имеющая касательную в каждой точке,
спрямляема, ибо относится лишь к дугам, определяемым при помощи
дифференцируемой функции / с ограниченной производной р на
[а, Ь].
В предыдущем разделе мы разъяснили, что понятие
бесконечной производной для вектор-функции не имеет смысла, но f
может существовать в каждой точке из [а, Ь] и не быть
ограниченной, т. е. lif (О II может не быть ограниченной на [а, Ь].
Утверждение, что р ограничена на [а, й], равносильно
утверждению, что ограничена IIP (О II» а значит, и все функции qp', ..., ср^.
Следующий, хорошо известный пример окружности
иллюстрирует эту теорему и показывает те трудности, которые не могут
быть устранены в рамках этого курса.
Возьмем метрическую евклидову плоскость, где точка имеет
координаты х, у относительно канонического базиса (1,0), (0, 1)*
Рассмотрим вектор-функцию /, определенную на [—1, +1]
посредством равенств x(t)*=t, y(t) = Yl—t2. Она определяет
полуокружность с центром О, радиусом 1 и с неотрицательными
ординатами у. Имеем x'(t) = 1, yf{t) = -tJYx - Р^Ф± 1). Если
t стремится к —1 слева или к +1 справа, то y'{t) стремится
к +оо или к —оо. Стало быть, функция / не дифференцируема
в точках t = —1, +1. Но следствие 1 показывает, что
полуокружность спрямляема, так как функция у возрастает на' [—1, 0] и
убывает на [0, 1].
С другой стороны, вектор-функция g= (x, y)f определенная
как x(t) = sin /, у(t) = cos t (0 < t < я), тоже представляет
собой полуокружность. Для g имеем x'(t) =* cos t, y'{t) — — sin /,
т. е. \х'\ •< 1, \y'\ iC\. Значит, для утверждения о том, что эта
полуокружность спрямляема, достаточно воспользоваться
следствием 2. Этот пример показывает, насколько важна задача
о представлении дуги. Дадим несколько кратких указаний.
Прежде всего отметим, что мы определили спрямляемую
дугу, но не имеем еще иного метода для ее вычисления, кроме
394 КНИГА III. АНАЛИЗ
того, который состоит в отыскании верхней грани длин ломаных
линий П.
Теперь мы покажем, как интегральное исчисление позволяет
вычислять длину спрямляемых жордановых дуг, на которые
наложены более ограничительные условия, чем ранее. Иными
словами, в некоторых случаях (которые можно рассматривать как
употребительные) интегрирование позволяет вычислять длину
дуги.
Допустим, что f имеет на [а, Ь] непрерывную первую
производную f. Для вычисления длины I (Г) дуги Г, если известно,
что таковая длина существует, достаточно найти предел длин
l(Uq) последовательности (И^) ломаных, соответствующих
последовательности таких разбиений аф0 = а < &фi < аф2 <
••• <ая,п=Ь, что lim (sup|a,f,+1-a,fi|) = 0. Но
* g->oo i
nq-\
/ОУ- 2 WfKM)-f(a,ti)l
/Ki + l) - f K,«) = (Ф1 K^+l) ~ Ф1 (uq,t), • • •» Фр (<Wl) - Фр К,*))-
Формула конечных приращений, примененная к каждой
функции фь, которая, согласно наложенным на / условиям,
непрерывна и имеет производную, дает
Ф* К , + l) - Ф* К ,) = К Ш - %. г) Ч>£ К ,).
где a* i^]aq r aq <+1[*)- По свойствам векторного пространства
^Ki+i)-^(«*.i)-Ki+i-e,)(^Ki). •••• ^КО)- Точка
(ф{(<*я, i)» ..., Фр(«^;)) из /?р, вообще говоря, не является
значением f в какой-то точке, ибо а* ( (k= 1, 2, ..., р) в общем
случае не равны. Обозначив через lqt { произвольную точку
из ]aQyi, aqii+{[, рассмотрим разность
*f-K.i+.-«,.i)((4W.i) <Ki))-f'(hi))>
т. е.
Xi = f К, ги) - f К *) - К, «+i - ** *) Р (I*. *)•
Имеем
i^i-K.i+i-«*i)IWKi). ■••• ККд)-
-(ФЦ|,.1),...,Ф;(1,,г))1=
*) В аа ( буква k означает индекс.
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 395
А так как функции qp£ непрерывны на [а, й], а значит, и
равномерно непрерывны, то можно выбрать все % гч-i — ag,i столь
малыми, чтобы для заданного е>0 выполнялось |<р£(а£ () —
— ФИ£<7,*)|<8> т- е- ^Р|фЦ«Ь)"^(^<м)1<е- В СИЛУ ^ера-
к
венств между тремя определенными в Rp эквивалентными
нормами (гл. V), существует такая постоянная X, что \\Xi\\ *C
< K(aQi i+i — аъ {)е. С другой стороны, мы видели, что
111*11 — \Ы \<\\х — у\\ (гл. V). Следовательно,
ill/(/«^, i+i) — /(«^, /) II — (^^» г — ^^, /) II/(ё^, /) ИI =^ >- (^^, л-1 — «^, /)е;
отсюда сложением получаем
SII / К ш) - / К д И - 2 К ,+, - аф,) || f (Ц t) ||
<
<3|||/(а,,ж)-/К/)11-Кт-^/)11/Ч^,£)111<Я(6-а)е.
Стало быть, вместо того чтобы отыскивать предел для
2llf (я*?» *+i)~~f (я?, *)И при q> стремящемся к бесконечности, мы
будем искать предел выражения 2 (аф t+x - аф () \\ /' Цф t) ||.
Но f->Hf (011 есть непрерывная числовая функция на [а, Ь]
(разд. I, § 2), и поскольку %ф1^\афЬ афШ[, то в силу гл. IV,
разд. II, § 5, последняя величина имеет пределом число
ъ
\\rm\dt.
а
Теорема 2. Пусть Т — жорданова дуга, определенная при
помощи вектор-функции /. Если f со значениями в Rp определена
на [а, Ь], непрерывна и имеет непрерывную производную, то
дуга Г спрямляема, и
l(r)=j\\f'(t)\\dt.
Во всем предшествующем мы не уточняли, какая именно
норма выбирается в Rp; результат справедлив для любой из них.
Выберем, в частности, евклидову норму. И возьмем случай
р ^ 3, который и будет встречаться в дальнейшем. Обозначим ко«
ординатные функции вместо qpi, фг, фз через х, у, z\ пусть,
следовательно, /= (х, у, г). Предположим, что f непрерывна и что /'
существует и непрерывна на [а, й], т. е. что действительные
функции х, у, z, x\ y\ z' от t e [a, b] непрерывны на [а, 61.
396 КНИГА III. АНАЛИЗ
Имеем
Г (0 = (*' (0, у' (О, *' (t)), у /' (О у - [(*' (О у + (у' (t) у + (z' (t) )2f
b
/ (Г) = J Vx'2 (t) + у'" (t) + 2'' (t) dt.
a
Тогда длина дуги /(О, соответствующей интервалу [а, /],
определена равенством
t
/(0= J Vx'2 + t/ + z'2 dt.
a
Стало быть, функция / есть примитивная функции llf (OIL Из
этого следует, что криволинейная абсцисса s(t) = l(t) + const
определяется посредством произвольной примитивной для
функции ||Г(0 И-
ь
В случае, когда x(t) = tf p = 2, имеем /(Г) = Г V1 + у'2 dt.
а
Тогда, как правило, говорят о кривой Г, представленной
посредством функции f/ = f(x), что в действительности означает, что
х = t, что функция t->y{t) обозначается через f и что Г есть
график функции f, т. е. множество таких точек (я, у) из R2,
что а ^Сх*СЬ, у = f(x). Тогда длина кривой Г равна
ь
l{Y)=\Vl + f'{t?dt.
§ 4. Замена параметра
Мы ограничимся изучением простого случая.
1. Пусть t—>ср(и) — действительная функция от ие[а, р],
непрерывная, строго возрастающая и имеющая непрерывную
производную и, кроме того, ф(а) = а, <р(Р) = Ь.
Пусть, далее, Г — жорданова дуга, определенная при помощи
непрерывной вектор-функции f с непрерывной на [а, Ь]
производной f. Функция £ = /°Ф, т. е. функция tf->f(qp(w)),
определена, непрерывна, дифференцируема на [а, р] и осуществляет
взаимно однозначное соответствие между [а, (3] и Г. Дуга Г
ь
спрямляема, и ее длина, выраженная через /, равна J ||7'(0I№.
а
Длина этой же дуги Г, выраженная с помощью функции gy
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 39/
равна ) \\g'(u)\\du. Но gf (и) = f (ф (и)) q>' (и), и, по свойствам
а
нормы,
11йг,(^)|| = ||Г(ф(«))фЧ^)11 = ф,(^)11Г(ф(^))||,
так как ф возрастает, и поэтому ф' > 0. Следовательно,
3 Э
/||^(м)||Л-/||Г(ф(а))1ф'(и)Л,
а а
и, согласно правилам замены переменного в интегралах (гл. IV,
разд. III, § 3), имеем
3 ь
l\\r{<*{u))W{u)du = \\\r{t)\\dt.
а а
Таким образом, длина будет одна и та же, представлена ли
дуга Г функцией / или gy если новый параметр является
непрерывной строго возрастающей функцией с непрерывной первой
производной. Отметим, что если ф строго убывает, то ф' jC 0, и
что если а < р, то
Э 3 а
j\\g'(u)\\du=\\\f'(cp(u))\\\q>'(u)\du=- j\\r^(u))W(u)dut
а а Ь
ибо ф' fC 0 и ф(а) = й, ф(р) = а. Значит, снова
ь , 3
/(Г)-/1Г(оил-/ wm\du.
а а
2. Пусть s — криволинейная абсцисса; ее значение
определяется равенством s{t)= j \\f'(Q)\\dQ + ХУ где Я — постоянная.
п
Пусть Я = 0 и U е [а, 6]. Определенная таким образом абсцисса
обращается в нуль для /о, т. е. для точки из Г, являющейся
образом точки /0. Функция 5 есть возрастающая функция от t.
Выясним, будет ли она строго возрастающей. Если она не будет
строго возрастать, то для некоторого t\ < t2 будет s(t}) = s(t2),
и
т. е. 5 (/2) ~ 5 (t{) = Г || Р (0) ||dQ = 0. Поскольку s возрастает,
и
то она должна быть постоянной между t\ и t2i а так как 5 (t) =*
= НПО II и *'(/)= 0, то НПО 11= 0 Для любого значения t
398
КНИГА III. АНАЛИЗ
между /i и h, т, е. f'(t) = 0. А раз функция f постоянна, то
каждому значению t, заключенному между t\ и t2, будет
соответствовать единственная точка /(/) из Г, что противоречит
предположению о том, что Г — жорданова дуга и что f — взаимно
однозначное отображение [а, Ь] на Г.
Таким образом, s строго возрастает и непрерывна; поэтому
можно рассматривать обратное к t-+s(t) отображение s—>
=*/-!(s).
Тогда получаем представление дуги Г посредством вектор-
функции g от параметра s.
Пример. Рассматривается множество Г точек плоскости /?2,
имеющих координаты x(t) = a(t — sin^), y(t) = a(\ — cos t),
a > 0, t ^ R. Определенная таким путем на R вектор-функция
f = (х> У) непрерывна, ибо таковы ее компоненты х, у. По тем же
соображениям она дифференцируема. Так как x'(t) =
= 2а sin2 (//2) > 0 и обращается в нуль лишь в точках 2пп
(п — целое), то функция х строго возрастает, непрерывна и
изменяется от — оо до + оо. Значит, каждому х соответствует
единственное значение t. Если (х0, Уо) есть точка из Г,
определенная значением /о переменного t, то и, наоборот, этой точке
соответствует только одно значение t0, ибо уравнение x(t) = x0
имеет в качестве решения только t0. Дуга Г есть жорданова
дуга, и для ее представления мы сохраняем обозначение /.
Чтобы вычислить ее евклидову длину, нужно вычислить ||f(0ll«
Имеем
Г (t) - (*' (*), У' (0) = fa sin2 j, a sin t) =
= (2а sin2 у, 2 a sin у cos-«И .
Отсюда
||f(0ll=(4a2sin24)V2 = 2a|sin|-|.
Длина дуги Г, заключенной между t == а и t = p, равна
2а f | sin (//2) | dt. Если a = 0, p = 2я, то t/2 меняется от 0 до я,
a
и sin (t/2) остается положительным; поэтому длина, этой дуги
равна 2а J sin (t/2) dt = 8a. Криволинейная абсцисса s(t), считая
о
t
(•
от точки t = 0, определяется равенством s(t) = 2al
о
sin
du.
ГЛ. VI. ВЕКТОР-ФУНКЦИИ ОДНОГО ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 399
Криволинейная абсцисса точки, являющейся образом значения /,
2я < t < 4я, будет
2л
s(0 = 2a J|sin-|- dtt=2a Jsin-j-rf" + 2fl J (-sin~) da =*
0 0 2л
- 8a + 4a (l + cos|) = 8a (l + cos2 jj,
3. Кратные точки, замкнутая дуга. До сих пор мы
предполагали Г такой, чтобы между Г и интервалом [a, b] прямой R
существовало взаимно однозначное соответствие. Предыдущие
понятия распространяются и на дуги, имеющие кратные точки.
Мы ограничимся следующими указаниями.
Пусть Г есть множество точек на Rp', обладающее
следующим свойством: существует такая непрерывная на [a, b] вектор-
функция /, что /([а, Ь\) = Г и что найдется конечное разбиение
[а, Ь] точками а0 = а < а^ < а2< ... ап == ft, при котором /
осуществляет взаимно однозначное и взаимно непрерывное
соответствие между f(]ak, ah+i[) и ]afe, dk+il каково бы ни
было k. Г снова будет называться жордановой дугой. Пусть
М — точка на Г; если множество f~l (М) значений t, для
которых f(t) = М, состоит из конечного числа (более одной) точек,
то этими точками могут быть лишь точки а^. Если имеется v
значений ty для которых f (t) = Af, то говорят, что точка М имеет
кратность порядка v. Точку называют двойной, если v = 2, и
тройной, если v = 3. Это определение выражает образное
высказывание, что кривая Г проходит v раз через точку М. Если
подвергнуть параметр / е [a, b] замене, т. е. вместо него взять
значение ф(и) непрерывной строго возрастающей (или убывающей)
функции ф на интервале [a, b] с ф(а) = а, ф(р)= й, то кратные
точки, если таковые существуют, будут получаться при
значениях и, являющихся прообразами точек ak при отображении ф,
ф(а/1)=аь. Понятие ориентации, длины для таких дуг
определяется в точности тем же способом, а затем определяется
понятие криволинейной абсциссы.
Наконец, если /(a) = f(b), то говорят, что дуга замкнута.
Если вектор-функция f задана и определяет дугу Г, то
отыскание кратных точек состоит в том, чтобы выяснить,
существуют ли такие различные значения tu t2, ..., параметра t,
для которых f(t\) = f(t2) = ... Если, например, f есть вектор-
функция со значениями в R2 и если #, у — компоненты функции /,
то двойные точки будут найдены в результате исследования
уравнений х (t) = х (?), y(t) = у (?), когда оба уравнения
400 КНИГА III. АНАЛИЗ
одновременно выполняются, ибо f(t)=* f{t') означает, что x(t) =
= х(Г) uy(t) = y(t').
Замечание. Может оказаться, что вектор-функция f,
определенная, к примеру, на множестве /?, является
периодической, т. е. f(t + со) = f(t), каково бы ни было t<=R. Тогда
координатные функции щ будут периодическими. Если,
рассматривая сужение f\ функции / на интервал / длины, равной
периоду со, получаем взаимно однозначное и взаимно непрерывное
отображение /i интервала / на f(R) =/(/), то множество f(R)
есть жорданова дуга.
Таким будет, например, случай окружности, где f(t) =
«= (cos t, sin t), со = 2я. Функция f\ получается, если заставить t
изменяться, скажем, на [0, 2я] (см. функцию ег).
§ 5. Топология на спрямляемой жордановой дуге
Мы ограничимся рассмотрением спрямляемых жордановых
дуг, определенных при помощи непрерывной вектор-функции f
с непрерывной первой производной на [а, Ь], причем
соответствие между Г и [а, Ь] будем считать взаимно
однозначным.
Мы распространим на Г многие понятия, имеющие место
для /?.
Г Пусть М0 есть точка на Г, а (Мп) — последовательность
точек на Г.
Стараясь придать смысл выражению «Мп стремится к М0,
когда п стремится к бесконечности», можно, рассматривая
норму в Rp, условиться, что стремление Мп к М0 означает, что
lim || Мп — М0\\ = 0, т. е. Мп стремится к М0 по расстоянию, при-
П->оо
нятому в Rp. Величина ||МЯ — М0\\ есть длина отрезка М0Мп.
А так как эта длина стремится к нулю вместе с длиной дуги
М0Мп, то это равносильно утверждению, что 1(М0Мп) стремится
к нулю. Так как между точками ЛеГ и t^[a, b] имеется
взаимно однозначное соответствие и так как длина есть строго
возрастающая непрерывная функция от /, то если tn — значение
параметра, соответствующее точке Мп, a t0 — значение,
соответствующее точке Mq, to получаем, что tn стремится к to, когда
1(М0Мп) стремится к нулю. Обратное очевидно.
2° Если дуга Г ориентирована, то на Г устанавливается
отношение порядка и понятие предела. Поэтому на Г
распространяются все понятия замкнутого множества, точки накопления,
открытого интервала, теоремы Бореля — Лебега и Больцано —
Вейерштрасса,
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 401
ГЛАВА VII
ДЕЙСТВИТЕЛЬНЫЕ ФУНКЦИИ МНОГИХ
ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ:
ОТОБРАЖЕНИЯ Rp В R И ПОНЯТИЯ
ОБ ОТОБРАЖЕНИЯХ Rp В Rq
Общие свойства числовых функций, т. е. функций,
значениями которых являются действительные числа (ср. гл. III,
разд. I), очевидно, справедливы и для числовых функций
многих действительных переменных. Довольно просто определить
общие понятия непрерывности, частных производных, и даже
дифференциалов в окрестности точки из Rp. Трудности
возникают, когда речь заходит о получении таких, например, свойств,
как равномерная непрерывность. Так же, как мы, по
обыкновению, рассматривали действительные функции на интервале [а, Ь]
из R, мы рассматриваем теперь действительные функции,
определенные на множестве Е точек из Rp'. Мы не можем здесь
входить в подробности, например, задачи об определении в R2
внутренности множества, ограниченного замкнутой жордановои
кривой, или об определении в R3 понятий поверхности и т. п.
Часто для определения двойных интегралов мы будем
ограничиваться изучением достаточно простых случаев в R2. Что же
касается отображений Rp в Rqt то мы практически
довольствуемся случаем р = q = 2, с тем чтобы установить несколько простых
понятий для комплексных функций комплексного переменного.
Обозначения. Точки из Rp будут обычно обозначаться
строчными жирными буквами ж, у, ...; иногда прописными буквами
М, Я, ... Координаты точки х <= Rp в каноническом базисе
будут обозначаться через хи х2> ..., хр\ х = (хи х2, ..., xv).
Действительная функция р действительных переменных на
множестве точек из Rp будет обозначаться через /, g, ..., а ее
значение в точке х — через f(x) или f(x\,x2i ..., Хр).
I. НЕПРЕРЫВНОСТЬ, ЧАСТНЫЕ ПРОИЗВОДНЫЕ
ОТОБРАЖЕНИЙ Rp В R
§ 1. Точечные множества в R2
В гл. V, § б, мы изложили для метрического пространства Rp9
наделенного тремя эквивалентными нормами, понятия
сходящейся последовательности, точки накопления, замкнутого
множества, теоремы Больцано — Вейерштрасса и Бореля — Лебега.
Эти понятия и теоремы являются инструментом, при помощи
которого можно распространить на действительные функции
402 КНИГА III. АНАЛИЗ
нескольких действительных переменных многие свойства,
установленные для действительных функций одного действительного
переменного (гл. III, разд. II, IV, V). Например, можно, не
внося изменений в ход доказательства", получить следующую
теорему: если / есть действительная функция от х е Rp,
определенная и непрерывная на ограниченном замкнутом множестве F
из Rp, то множество f(F) значений, принимаемых /, когда
х е F, есть ограниченное замкнутое множество из R\
следовательно, sup f(x) есть значение функции / по крайней мере
АГ<= F
в одной точке х0 е F. Но на самом деле нам необходимо знать,
являются ли некоторые точечные множества из Rp замкнутыми
и ограниченными, когда эти множества определены тем или
иным способом. Так, замкнутый брус есть замкнутое
множество. Однако необходима осмотрительность, когда речь идет
о множестве точек из R2, состоящем из замкнутой кривой и ее
внутренней части; все эти термины должны быть определены.
Мы ограничимся несколькими совсем элементарными
понятиями в метрическом пространстве R2. Пусть Г — замкнутая
жорданова дуга в метрической плоскости R2, не имеющая
кратных точек, a f — непрерывная на [а, Ь] вектор-функция,
осуществляющая взаимно однозначное и взаимно непрерывное
отображение [а, Ь[на Г и такая, что f(a) = f(b)\ пусть f = (л:, г/).
Функция t—>x(t) непрерывна на [а, й], поэтому множество ее
значений образует замкнутый интервал, который может
сводиться в точку. То же самое имеет место для функции t—*y(t).
Пусть #i, х2— соответственно нижняя и верхняя грани для
функции х (см. гл. III, разд. II), а у{ и у2 — для у. Если
х0 ^]хи х2[, то найдется такое t0 ^ [а, 6], что x(t0) = #0; и
аналогично для точки у0^]у\у у2[. Кроме того, мы предположим,
что Г обладает следующим свойством: каково бы ни было
х0^]хи х2[, найдется не более двух точек на Г, имеющих
абсциссу х0; каково бы ни было у0^]уи Ы, найдется не более
двух точек на Г, имеющих ординату у0. Если существуют две
точки М0 и Мо на Г, отличные друг от друга и имеющие
абсциссу #i, то обозначим через М некоторую точку
прямолинейного отрезка MQM'0. Пусть у0, у, у'0 — ординаты соответственно
точек MQy My М'0. Так как у0 и у'0 являются значениями уо = у (to)
и у'0=*у(*'0) функции t-+y(t), то любое значение уу
заключенное между у0 и у'0 будет значением функции t-*y(t) в некоторой
точке, в силу непрерывности. Можно показать, что каждая
точка М прямолинейного отрезка МоМ'о принадлежит Г. Этот
результат иллюстрируется на рис. 25. Несомненно, можно
рассматривать и несколько более общие дуги Г, предположив, что
интервалы [хи х2] и [уи у2] могут быть разделены на конечное
гл. vii. функции многих действительных переменны* 403
сс? х
число таких интервалов, что если, скажем, хо лежит внутри
одного из этих интервалов, то найдется не более двух точек
из Г, имеющих одну и ту же абсциссу х0.
Выражаясь более элементарно, будем говорить, что
рассматриваются лишь жордановы дуги Г без кратных точек, которые
могут содержать конечное число прямолинейных отрезков,
параллельных осям и таких, что любая параллель к одной из осей,
не содержащая ни одного из этих
отрезков, пересекает Г не более чем
в двух точках.
Пусть, например, [х\, х2] —
отрезок значений, принимаемых
функцией t-+x(t)\ допустим, что, каково
бы ни было х е )хи х2[, найдутся
точно две точки из Г с абсциссой х\
пусть ф1 (а:) и ф2(х) — ординаты этих f,(x)\ "-Р
точек, и пусть, для определенности, Ui\
<Pi(#)<(p2(*). Вектор-функция f
непрерывна, И ПОЭТОМУ фуНКЦИИ ф1
и ф2 от х е= [хи х2] непрерывны. На- Множество D
зовем областью, ограниченной Г, Рис. 25.
множество таких точек (х, у) из
R2, - что Xi < х < Хг и ф1 (х) < у < ф2 (х). Будем обозначать^ ее
через D. Через D обозначим объединение D и Г, т. е. D =
= D U Г. Можно показать, что D определяется еще следующим
образом: пусть у&]уиУ2[, a ty\(y), фг(у)—абсциссы двух
точек из Г с ординатами у\
D будет также
множеством таких точек (я, у)
из /?2, что у\<у<у2
и Ь(У)<*< Ь(У)>
причем г|)1 и г|)2 непрерывны
на \у\,у2]. Заметим, что
можно определить D и D,
задавая заранее две
непрерывные на [хьХг]
функции ф! < ф2.
Множество D
замкнуто. ^Действительно,
пусть М0 — точка прикосновения множества D, М0 является
либо точкой из D, либо точкой накопления для D (см. гл. V).
Покажем, что еслиМо — точка накопления, то она принадлежит D.
В самом деле^Мо служит пределом последовательности Мп точек
(*п, Уп) из D\ имеем хп^[хи х2], q>i(*n)^ Уп ^ <$г{хп). Если
(*<ь Уо) — координаты точки М0, то хп стремится к х0 и ' уп
стремится к уо. Значит, х0 е [хи х2], а так как функции ф1 и фг
Графин функции рг
о)
Рис. 26
\Cj Ut «Те
График функции а,
6)
404 КНИГА III. АНАЛИЗ
непрерывны на [*lf *2], то <pi(xn) стремится к <pi(*o), а <р2(хп)
стремится к q>2(#o), и стало быть, (pi(xo) ^ f/o ^ ф2(#о). Наконец,
можно показать, и мы это принимаем без доказательства, что
если Р есть точка из Z), то существует открытый брус с центром Р,
все точки которого принадлежат D (рис. 26). .
§ 2. Непрерывные отображения пространства Rp в R
1. Определения. Пусть / — действительная функция от х =
= (*ь *2, ..., хр), определенная в окрестности точки х0 =
= (*о, и *о,2, •. •, *о, р), т. е. на множестве Е точек, содержащих
открытый брус с центром х0 (или открытый шар с центром *0).
Будем говорить, что f непрерывна в точке *0, если при х е Е
и при \\х — *0||, стремящемся к нулю, f(x) стремится к /(*о),
т. е. для любого е > 0 можно указать такое положительное
а(е,*0), что если *е£ и \\х — х0\\ < а, то \f(x) — f (*0) \ < е.
Рассматриваемая норма есть одна из трех эквивалентных
норм, определенных в Rp. Тогда условие ||* — *0И < а
выражается посредством р одновременных неравенств \xk — х0)k\<
< a (k = 1, 2, ..., р), что записывается также в виде
su\)\xk — x0tk\< a.
k
Рассмотрим р действительных функций
*£—*/(% 1> %2» •••! xkt •••> Х0,р) (k=l, 2, ..., p)f
которые получаются, если зафиксировать координаты х0) и
#о,2, ..., #o,fc-i, *о,fe+i, • ••> хо,р и заставить Xk изменяться так,
чтобы точка х = (x0tи х0)г ..., #ь, ..., *о,р) принадлежала Я.
Зга р функций непрерывны в точке х0г &, каждая по своему
переменному, ибо из \хи — х0)и\ <а следует, что
1/(*о,ь •••! *о, k-ъ xk> хо, fe+i> •••> %р)""
~~/(*o»i> •••» *о>ь •••» %р)К8'»
обратное же неверно.
Предыдущее определение касается непрерывности
функции /, определенной в окрестности точки *0. Оно предполагает,
что множество Е, на котором определена /, содержит не только
*о, но и некоторый открытый шар с центром хо, У нас же будут
встречаться более общие случаи, когда Е не обязательно
содержит открытый шар с центром *о, в частности, когда Е будет
множеством Z), а *о— граничной точкой множества D. Нам
достаточно будет следующего определения: функция /,
определенная на множестве Е, непрерывна в точке х0^Е, если при
*<=£ и при ||* — *oll, стремящемся к нулю, |/(*) — /(*о)| стре-
4 мится к нулю.
2. Операции с непрерывными функциями, а) Если fug —
две функции от**е/?р, определенные в окрестности одной и той
же точки, то функции / + g, fg% af(a^R) и |f| непрерывны.
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 405
б) Пусть f — функция от хе/?р, непрерывная в точке х;
допустим, что множество значений функции / содержит
интервал /, содержащий f{x). Если g—вектор-функция,
определенная на / (или если g есть действительная функция) и
непрерывная в точке /(х)е/, то сложная функция gof непрерывна
в точке х. Это свойство вытекает сразу же из определений.
Заметим, что если g есть отображение R в Rq, то gof есть
отображение Rp в RQ.
в) Если / определена в окрестности точки х0, непрерывна
в ней и не обращается в нуль, то найдется окрестность точки хо,
где |f(x)|>a>0, ибо существует такой шар радиуса а, что
если ||х — xolK а, то | / (х) - f (х0) К у I / (х0) I, что влечет |/ (х) | >
> ~£ I /(*о) \=аф 0. Тогда можно определить в окрестности
точки х0 функцию 1//, которая, как легко доказать, непрерывна
в этой точке.
г) Если /, определенная на множестве Е с: Rp', осуществляет
взаимно однозначное отображение множества EczRp, на
f(E)czR, то обратная функция (Книга I) является
отображением некоторого множества из R в Rp, т. е. является вектор-
функцией.
Примеры непрерывных функций. Предыдущие
свойства позволяют легко находить примеры непрерывных
функций многих действительнх переменных.
Так, многочлен от трех действительных переменных х, уу г
является конечной линейной комбинацией функций х== (х,у,z) —>
->xvyrzs, где q, r, s — неотрицательные целые числа. Если f
есть функция х->х«, g— функция х->уг, Л —функция x-+zs,
то / (х) g (x) h (x) = x<tyrzs. Стало быть, многочлен есть функция,
определенная и непрерывная на Rp. Точно так же если а > 0,
то функция х~>ах+У2+г3 непрерывна, ибо она является
композицией функции x-+x + y2 + z3 на функцию t-*a%.
3. Свойства. Пусть f — действительная функция от х =
= (х\, х2, ..., хр), определенная и непрерывная на
ограниченном замкнутом множестве Е из Rp. Доказывается, что
множество ее значений ограничено и замкнуто в R, а значит, /
ограничена, и ее верхняя грань sup /(х) и нижняя грань inf f(x)
хе=Е х&Е
достигаются значениями функции /, т. е. существует по
крайней мере одна такая точка Xi е£, что f(x1)= sup f(x), и такая
X €=£
точка х2^£, что /(х2)= inf /(x).
Рассмотрим, в частности, случай р = 2, г. е. случай
действительных функций двух действительных переменных х, у.
Пусть / — действительная функция от х = (х, у)у определенная
406
КНИГА III. АНАЛИЗ
и непрерывная на точечном множестве Д определявшемся в
предыдущем параграфе, ^огда / ограничена на D\ найдется
такая точка х0 = (*0, у0) е Д что / (х0) = f (х0, у0) = sup / (ж).
Будем считать известным, что__ множество f(D) значений,
принимаемых функцией f при х € Д есть (замкнутый) интервал
или точка. Тогда отсюда еще вытекает (ср. гл. III, разд. II), что,
каковы бы ни были два значения а, Ь функции /, определенной и
непрерывной на Д для любого действительного числа с,
заключенного между а и й, найдется такая точка *€ Д что f(x) = с.
Точно так же, если / — действительная функция двух
действительных переменных, определенная и непрерывная на некотором
множестве из R2, типа Д то f равномерно непрерывна, т. е.
каково 6ъ\_ ни было е > 0, найдется такое а, не зависящее от
х, х' <= Д что если ||х — ж'|| < а, то \f (х) — /(*') \ < е.
Доказательства этих свойств аналогичны таковым для
числовых функций с заменой абсолютного значения на норму.
§ 3. Равномерная сходимость. Ступенчатые функции
1. Мы определили (гл. II, разд. V) равномерную сходимость
для действительных функций одного действительного
переменного, заметив, однако (там же, § 1, замечания, к 4°), что
определение применимо и к более общим случаям.
Мы ограничимся рассмотрением действительных функций
двух действительны^ переменных (#, у), определенных на
некотором множестве D. Пусть (fn) — последовательность таких
функций. Будем говорить, что последовательность (/п) равно-
мерно сходится на Д когда п стремится к бесконечности, если
существует такая определенная на D функщш /, что для любого
е >0 найдется такое не зависящее от x^D целое число Я(е),
что при п^Р(г) \fn(x) — f(x) | <е для любого xgeD. Тогда
очевидно, что если все функции fn непрерывны на D, то такова
будет и предельная функция /; кроме того, если (fn) равномерно
сходится к /, то (\fn\) равномерно сходится к |/|.
2. Понятие ступенчатой функции (гл. III, разд. IV) может
быть здесь также определено и позволит нам построить двойной
интеграл. Однако сразу же возникает трудность, ибо если в
случае интервала приходит естественная идея разбиения этого
интервала на конечное число интервалов, то в случае плоскости
столь же простая идея не выявляется. Вероятно, мож^о пытаться
разрезать плоскость /?* или множество такое, как D,
посредством подмножеств, которые сами были бы такими множествами,
как D. Мы не станем вникать в эти детали и ограничимся
рассмотрение кубов или брусов, т. е. произведений интервалов из R
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 407
(в смысле теории множеств). Понятно, что ступенчатые
функции, которыми мы будем пользоваться, будут определены при
помощи брусов или прямоугольников.
Пусть (хп) и (уп)—две возрастающие последовательности
(п принимает все целые значения, как положительные, так и
отрицательные, и нуль) действительных чисел, т. е. такие, что если
п < п'9 то хп<х'п и уп< у'п.
Рассматривается бесконечное счетное множество открытых
прямоугольников, или плиток, определенных при помощи
произведения открытых интервалов, ]хи #*+i[X]*/j, Уш[> где i и /
принимают все целые значения, положительные, отрицательные и нуль.
Одна такая открытая плитка будет обозначаться через Pk.
Будем говорить, что множество этих прямоугольников составляет
мощение плоскости R2. Нам понадобится рассмотрение
нескольких мощений. Если (д:^) и (у'п) — две другие возрастающие
последовательности действительных чисел, то тем же путем
определяется другое мощение и через Р' обозначается одна из
открытых плиток. Когда мы будем говорить о «наложении двух
мощений» или о «рассмотрении мощения, полученного в результате
объединения двух предыдущих», это будет означать, что
множество точек (#rt), (#Q располагается в счетную возрастающую
последовательность (|т) попарно различных точек, что та же
операция проделывается с точками (//я), (у'^ так, чтобы получить
возрастающую последовательность (rjm), и что рассматривается
мощение, определенное последовательностями (|ш), (r\m)\ точки
ilm), (r\m) будут составлять строго возрастающие
последовательности, т. е. m < m! влечет Em<£m/ и r\m< r\m,.
Ступенчатая функция ф относительно мощения
прямоугольниками Pk будет числовой функцией точки х = (х> у) е R2,
принимающей на каждой открытой плитке Pk постоянное значение
Ik. Тогда всякая ступенчатая функция ф непрерывна в точке из
Pk и, вообще говоря, разрывна в точке, не принадлежащей
никакому Pk\ точки, не принадлежащие Pk, лежат на прямых с
абсциссой хп или с ординатой уп. Определение, данное нами для
наложения мощений, позволяет сразу же доказать, что если ф и
\f> — две ступенчатые функции, то ф + ф, аф (где aei!) и ф\|э
являются ступенчатыми функциями. Кроме того, очевидно, что
если ф — ступенчатая функция, то |ф| —тоже ступенчатая.
Пусть теперь / — действительная функция двух
действительных переменных х_ и у, определенная и непрерывная на
множестве таком, как D (ср. § 1). Пользуясь равномерной
непрерывностью, мы покажем, что существует последовательность (фп)
ступенчатых функций, равномерно сходящаяся на D к f.
Достаточно доказать, что для любого е > 0 можно построить такую
ступенчатую функцию ф, что для любой точки дс»(д:,|/)еД
408
КНИГА III. АНАЛИЗ
\f(x)—ф(х)|<е. Для е можно указать такое а, что если
II* — *'11<а, то \f(x) — f(x') | < е. Примем, например,
евклидову норму. Пусть * = (*, у), х'=(х\у). Если \х — х'\ <
<а/У2, |*/-Я<<*/^2, то||*-^||<(4+-у)1/2 = а-ПУстьте"
перь имеется мощение плоскости /?2, полученное при помощи
таких точек (хп) и (Уп), что, каково бы ни было п, \хп — хп+1 |<
< у= ЛУп~ Уп+i I < tf=- J пусть Ph — плитка ]хи х{+1[Х]Уэ, у ml
Обозначим через Ръ, множество, состоящее из Рь, с
границей, т. е. с четырьмя прямолинейными отрезками вида x = xif
У1<У<У1+и * = **+г»_ ///<//<У]+ь **<*<**+!> У = УГ>*1<
^x^.xi+b у = У1+\ (~Pk есть замыкание множества Ри)-
Если Рп целиком содержится в D (внутри D), то мы определим
ступенчатую функцию ф, положив ф(ж) =f(xk)> где ^ —
произвольная точка из Рк\ в том случае, когда х^Рь или лежит на
левом или нижнем крае Рк (т. е. если Х\ ^ х < я*+ь y^^L у <
<^j+i), принимаем <р(*)_= <р(*,#) =f(*k) (^ePfc)). Если РА
находится целиком вне А т. е. не содержит ни одной точки из
D, то берем <р(х) =0 для x^Pk. Если Рь содержит хотя бы
одну точку из Г (а значит, содержит точки из D и, возможно,
точки, не принадлежащие Ъ), то мы возьмем ф(*) =f(Xk) для
#г ^ * < Xi+u У)^ у < J/j+i, причем дсь — произвольная точка из
D (может оказаться, что хи е Г и Xk e /\).
Утверждается, что тогда \f (х) — ф(дс) | < е, каково бы ни
было х^В. Действительно, пусть ж— некоторая точка из D\
х непременно принадлежит либо открытой плитке Pki либо
одному из ее двух краев — левому или нижнему. В этой точке
ф(*) =/(*&)> причем Xk принадлежит /V А так как стороны Pk
имеют длину, меньшую чем а/1/2, то || х ~ xk ||<а и | /(л:) —
-Ф(*)1Н/(*)-/(**)Ке.
§ 4. Частные производные
Пусть функция / от x<=Rp, определена в окрестности
точки дс0. Если функция xk -*7(*o, i, *о, 2, ..., *о, k-u xk, x0f fe+i, ... xof P)
имеет производную по Xk в точке х0, ь, то эта производная
называется первой частной производной функции f в точке х0 по
переменному Xk и обозначается через f'x (лс0) или д °' .
Если для любого х0 из окрестности точки х0 производная
df(x)/dxk существует, то функция x-+df(x)/dxk определена в
окрестности точки дс0. Если функция
df(xQ 1» ••" х0, i-V Xi> х0, £+1» •"» х0, р)
hfi. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 46й
имеет в точке х0, i первую производную по xiy то эта производная
называется второй частной производной функции f в точке х0,
взятой по хи, Хи и обозначается через fx х (лг0) или d2f(x0)/dXkdxu
Если xk = Хи то имеем d2f{x^jdx\ или /J2 {*<)-
Так последовательно определяются, если они существуют,
частные производные п-то порядка. Очевидно, что если они
существуют для функции р действительных переменных, то имеется
р первых производных, р2 вторых производных, рп производных
n-го порядка. Но их запись мы дадим уже после того, как будут
найдены достаточные условия, позволяющие снижать их число.
В самом деле, важно знать, что в обычных случаях
производные f" х.(хо) и f'xx (*o) Равны» мы приводим следующее условие.
Теорема. Если в окрестности точки х вторые производные
d2f(x)/dXkdXf и d2f (х) /дх{дхи существуют и непрерывны в точке х,
то
d*f(x) = d*f(x)
дх. дх. dxi dxk
Эту теорему мы докажем для пространства R2\ будем
писать (ху у) вместо (хи х2). Пусть
gi(x, К y)~f(x + ht y)-f{x, у),
gi2 (x, А, у, 1) = gx (x, h,y + l)-gi (x, h, у) -
**f(x + hfy + l)-f{x,y + l)-f(x + h,y)+f(x,y).
Величину gi2 естественно составить для получения f"y. Для
получения же fyX естественно точно так же рассмотреть величины
ft(*. У, l) = f(*> y + l)-f(x, у),
g2l {X, К У, I) = g2(x + К У, I) - #2 (X, У у I) =
**f{x + h,y + l)-f(x + h,y)-f{x%y + D + f(x,y).
Если А и / достаточно малы, то рассматриваемые точки из R2
остаются в окрестности точки дс. Применив к разности gl2 для
переменного у теорему о конечных приращениях, получим
g\2e' (/i (* + А» у + /') - fy (x, у +1')). Применив снова ту же
теорему для переменного х9 получим gl2 = lhfy/x(x + h', y + P)9
причем число V заключено между у и у + /, а число А' — между х
и x + h. Точно так же g2ls*hlf'x^(x + h"t y + l"), где А" — тоже
заключено между х и х + Л, а Г'- между у и у + L Но
очевидно, что £i2ag2i* Следовательно,
/" (х + А", у.+/") - /" (х + А', у +/').
4i0 Книга ш. анализ
А так как мы предположили непрерывность производных в точке
* = (х> f/)> то Для любого е>0 можно найти \h\ и |/|,
достаточно малые для того, чтобы
\Ку{х + к,у + 1)-Гяв{х,у)\<в,
\f;x(x + h,y + l)-r;x(x,y)\<e.
Но |й'| <|А| и \h"\ <h, л |/'| < \1\ и |/"| < |/|. Значит,
\Ку(х + Н",у + 1")-Пу(х,у)\<е,
\f;x(x+ti',y+n-f:y(x,y)\<z.
А поскольку \"ху {х + h", у + I") - \"ух (х + h', yt 1% то
\ПУ(Х,У)-Г;х(х,у)\<2г.
Но е произвольно, и поэтому
Эта теорема означает, что если производные f и f'£x
непрерывны, то они равны. В этом случае говорят, что можно
менять порядок дифференцирования.
Если частные производные непрерывны, то n-я производная
от /, взятая nti раз по хи ш2 раз по х2, ..., mv раз по хр, будет
записываться в виде
dnf (x)
!Л-1 (тх + гп2 + ... Н-тр = /г).
дх^'дх2П*...дхрР
Важное замечание. Если все первые производные функ*
ции / равны нулю в каждой точке плитки, то все частные функ*
ции Xh-*f (... ,Xk,...) постоянны, а значит, / постоянна.
Обратное очевидно.
Операции с дифференцируемыми функциями. 1. Определе*
ние частных производных не требует введения нового понятия.
Все, что было доказано для дифференцируемых функций (гл. III,
6-й разд. VI), применимо к действительным функциям р
действительных переменных, когда их рассматривают как функции
одного из этих р переменных, зафиксировав остальные р—1.
Так, допустим, что множество значений f(x) содержит интервал
/, на котором определена непрерывная и дифференцируемая
действительная функция ср. Тогда ср о / есть снова
действительная функция р действительных переменных хи ..., хр. Если
df/dxh существует в точке х е Р?, то
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 411
2. Если fug, определенные в окрестности одной и той же
точки х, дифференцируемы в точке х по Хъ, то
d(1 + g) = а/ , dg
dxk dxk ' d#^ *
d(fe) = df f dg
dxk dxk « ^ *
Отсюда
Следовательно, многочлен от р действительных переменных
бесконечно дифференцируем.
Функция (х, у) -*- sin (x + у2) дифференцируема, и
-jfc sin (a: + у2) = cos (а: + у2),
-щ- sin (х + у2) « 2у cos (* + у2).
II. ДИФФЕРЕНЦИРУЕМЫЕ ОТОБРАЖЕНИЯ ПРОСТРАНСТВА Rp В #.
ДИФФЕРЕНЦИАЛЫ
Понятие дифференциала вводится для того, чтобы связать
с действительной функцией многих действительных переменных
нечто, выполняющее ту же роль, что и производная функции
одного переменного.
§ 1. Определение дифференцируемых функций
Определение. Пусть f — отображение Rp в R, определенное в
окрестности некоторой точки x<=:Rp и имеющее в этой точке
первые частные производные df(x)/dxk (k = 1,2,...,/?). И пусть
точка h = (hu ..., hp) такова, что х + h принадлежит
рассматриваемой окрестности точки х. Говорят, что f дифференцируемо
в точке х, если, каково бы ни было А,
/(* + л)-7(*) = 24г^ + <р||й||,
Л-1
где ф стремится к нулю вместе с ||А||.
Это определение прежде всего требует некоторых разъяснений.
Нормой служит одна из трех эквивалентных норм, определенных
412 КНИГА III. АНАЛИЗ
в Rp. Можно брать в качестве ||А|| какую угодно из величин
Vh\ + ... +h2py \h\\+ ... +\hp\, sup | Ал |. Напомним (гл. V),
k
что если Я и \х — любые две из этих трех величин, то существует
такая положительная абсолютная константа а, что X < a\it
откуда вытекает, что если одна из трех величин мала, то две
другие тоже малы.
Величина <р, которая входит в определение, зависит от х, А.
От нее требуется лишь, чтобы она по абсолютному значению была
меньше любого е > 0, как только ||А|| достаточно мало, т. е.
чтобы для любого е > 0 можно было указать такое р(е, х, А),
что ||А|| < р влечет |<р| < е. Выражаясь иначе,
*-1 *
стремится к нулю быстрее, чем ||А||.
Говорят, что отображение f множества Е aRp в R
дифференцируемо на Е, если f дифференцируемо в каждой точке «е£
Свойства. 1. Любая функция, дифференцируемая в точке xt
непрерывна в этой точке.
Действительно, пусть А — наибольшее из чисел \df(x)/dxh\.
Тогда
|/(* + А)-/(*)|<(Л + |ф|)||А||,
и при достаточно малом ||А|| правая часть может быть сделана
меньше е.
2. Любая функция f, имеющая в окрестности точки х первые
частные производные dfjdxu, непрерывные в этой точке,
дифференцируема в точке х.
Действительно, для достаточно малых ||А|| имеем
f{x + h)-f(x)^f(xx + hu x2 + h2, ..., xp + hp)-
V
— f(xu ..., xp) = 2j (f(x\, ..., xk~u xk + hk, xk+l + hk+l, .. *
..., xp + hp)-f(xl9 ..., xh9 xk+l + hk+u ..., Xp + hp)).
Применяя формулу конечных приращений, получаем
/ (хи ..., xk~u xk + hk, xk+l + hk+u ..., xp + hp) —
— f{xu ..., xki xk+i + hk+i, ..., xp + hp) =
~~dx7(xi' •'•, xk-v xh~^^k* %н + ^fc+p •••> xp + hp) • hH,
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 413
где \h'k\<\hk\. Так как dfjdxk непрерывна в точке х, то мы
можем написать
-&-(х19 ..., xh_l9 xk + h'„ ..., *р + /д = ^1 + ф,,
к к
где |фд| < е, если ||А|| достаточно мало. Тогда имеем
/(*+A)-/w-2^л*+2ф*ла
/5-1 * fc-1
2 ф*а*
^ 2 I Фл11 Ал К е 2 I hk |, то можно напи-
А так как
сать 2 Ф*А*'=ф2 \Ьь\ = ф||А||, где |ф| < е, если ЦАЦ доста-
точно мало, т. е. ф стремится к нулю вместе с ЦАЦ. Тем самым
свойство доказано.
Таким образом, дифференцируемые функции оказываются
более специальными, чем функции, обладающие первыми
производными, и более общими,,чем функции, имеющие непрерывные
первые производные.
Когда первые частные производные непрерывны, говорят, что
f непрерывно дифференцируема.
Замечания. 1. Иногда дают определение
дифференцируемой функции, кажущееся более общим, с помощью равенства
/(* + *)-/(*)-2ЛЛ + ф||*|||
где Ak — действительные числа, а ф стремится к нулю вместе
с ЦАЦ. Но, исходя из этого определения, можно сразу же
показать, что / непрерывна в точке х и обладает первыми частными
производными df(x)/dXh = Л*; доказательство непрерывности
было уже проведено ранее, а существование первых частных
производных доказывается на основе того, что А произвольно и
что можно взять А *= (Аь 0,0,..., 0), откуда f(x + К) — f(x) =
= Aihi + ф|А4|.
2. Определение дифференцируемой функции применимо к
числовой функции f. Если
/(* + Л)-/(*)-А/'(*) + Ф|А1
для \h\ достаточно малого и ф, стремящегося к нулю вместе с
|А|, то / называется дифференцируемой. Но в случае
функций одного действительного переменного существование
производной влечет дифференцируевдость, ибо если i
414 КНИГА III. АНАЛИЗ
стремится к f'{x), когда h стремится к нулю, то можно написать
/(« + *)-/(*) „п,) + ф|> Итф1-0,
п А->0
откуда
f(x + h)-f(x) = hf'(x) + <f\h\9 lim q> = 0.
|А|->0
3. Если Е — замкнутый брус, то непрерывные функции dffdxk
равномерно непрерывны на Е\ из этого следует, что |ф| < е для
||А|| < р, где р = р(е) зависит только от е и не зависит от х е Е.
§ 2. Операции над дифференцируемыми функциями
Если / и g— числовые функции от дс<=/?р, определенные
в окрестности одной и той же точки х и дифференцируемые, то
функции f + g, af (aEi?) и fg тоже дифференцируемы в точке х.
Докажем это для fg. Имеем
р
f(x + h) = f(x) + Y^hk + <p\\hl Нт Ф = 0,
р
g(x + h)^g(x) + y^hk + ^\\hl lim ф = 0.
Отсюда
/(*+A)^(*+ft)-/Wfi[(*)+S(^Ie(*)+/(*)-^EL)A*+
+ г(х)»|*|+(S j2S^71 л«) <р ИА И -»-
ТО
\i * / VT *
Если Л4 — наибольшее из чисел
р . . \ / р
*/(*> | | а*(*)
<Ч Г I дхи
1 fe / \ 1 *
4^*. S^4 <*,(SiM)'-'*ur.
Пусть Л — наибольшее из чисел |f(*)l» |ffW |, Af2, Af||ft||, а ф4 —
наибольшее "из |ф|, |г|)|, ||А||. Тогда абсолютное значение суммы
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 4l6
членов, стоящих в трех последних строках основного
неравенства, мажорируется величиной бЛф1||А||. Значит, можно написать
-£(^«w+f«4f)*.+*i*i
где Jim % = 0. А так как -^ =<*1^ g(x) + f(x)H^% тоокон-
ЦЛ||->0 axk °Xk 0Xk
чательно,
р
f(x + h)g(x + h)-f(x)g(x)^^-hk+x\\h\\.
ft-i k
Что же касается функций / + g и а/, то здесь рассуждение
проще. Имеем
f(x + h) + g(x + h)-(f(x) + g(x)) =
*-1
a/(^ + A)-afW = 5]^^ + aXllA|l = a2^^+xl|AI|.
Композиция дифференцируемых отображений. Мы особо
остановимся на этой задаче ввиду ее важности; при этом мы
ограничимся двумя простыми случаями, из которых первый
является не более как частным случаем второго, *
Г Пусть / — отображение Rp в R, дифференцируемое в точке
хе/?р, а g — отображение R в R (действительная функция
действительного переменного), дифференцируемое в точке f(x).
Пусть F = g о /, т. е. F(x) = g(f(x)). Имеем F(x + ft) — Fix) =
= *(/(* + *))-*(/(*))• Но
p
/(* + *)-/(*) + 2^*а + ф11*11.
где t = f(x), lim ф = 0, lim «ф = 0.
||A||->0 |/|->0
Пусть I — f(x + h) —f(x). Так как / дифференцируема, то она
непрерывна, и значит, / стремится к нулю вместе с ||й||. Имеем
416 Книга iti. анализ
также / = 2 -j^- hk + <p || А* ||. Поэтому
f (* + *)-F(*)-ff (/(*) + /)-fftfW)-
-3-er(/0r)) + /er/(f(*)) + *|/|-«(/(*))-
Обозначив через Л наибольшее из чисел \df/dxk\9 приходим
к неравенству |/|<(Л + | ф|)||А||. Следовательно,
I <РёГ'(f (^))I!Л П^ «РиМ^!^'(/(^))11<Р| ИЛ НН- (-4Ч-1 <р|)|-ф| НЛЦ.
Стало быть, можно написать, что
Ф£Ч/(*))1|Л|1 + г|>|/| = х11А||, lim х = 0.
Окончательно, если F = g о /, то (см. разд. I, § 4) имеем
р р
F(x + h)-F(x)=%g'(f(x))^hk+%\\h\\ = %§- АЛ+х||*||.
k~i k k~\ k
Следовательно, отображение F = g o f дифференцируемо.
2° Пусть g = (gu 82, ..., gp) — отображение Rq в Rp;
предположим, что каждая координатная функция gk, которая является
отображением Rq в /?, дифференцируема в точке у е Rq. И пусть
f есть отображение /?р в /?, дифференцируемое в точке х =
= £(») = (Ы^ЬЫ^Ь-••>£?(»))• Мы покажем, что
композиция F = f °g, которая является отображением Rq в R,
дифференцируема в точке y^Rq. Пусть / = (/ь/& ..., /д). По условию
имеем
8k(y + t) = gk(y)+ S aSr7»-*-**1"!!'
m = l
где t|)ft стремится к нулю вместе с ||/||, причем ||/|| означает норму
элемента / B~Rq. Имеем также по условию
/(* + А) = /(*) + 24г1л* + (Р||А|1-
ft-i *
ГЛ. VH. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ
417
Пусть х = g (у), и пусть h = g (у +1) - g (у), а значит, hk —
= gk(y + t)~8k(y)- Тогда f°g принимает в точке у значение
f(g(y))=F(y)- Имеем
F(y + l)-F(y) = f(g(y + l))-f(g(y))-f(g(y) + h)-f(g(y)) =
= f(g(y)) + S df%iy)) hk + <p\\h\\-f(g(y)) =
k-i k
dgk
Так как gk(y + l)-gk(y)= S Slm + +*"'"» T0
m«l
^^'^^H^imi
) + ф||А|| =
ft-l * \ra-l / \ft-l /
Ho |A*| = |**(«r + 0-ft(«f)l
S^r«.+*i"
m=l
. Пусть В —
наибольшее из чисел | dgk(y)/dym | (ш= 1, 2, ..., q, k- 1,2, ..., p)r
Л —наибольшее из чисел \df(x)/dxk |. Имеем | й*|< #£ Ц|/да| +
+ 1%IIIl\\ = (qB + \ ф*|)|| /1|. Следовательно,
2|^1 = ||А||<р(^ + |^|)||Л|.
Точно так же
написать
/г=1
s
4м %
<
рА 2j | i|)fe |. Стало быть, можно
k=\
Ш%)1/||+<р||А||=х1'и „!imn^=0-
f" "** / 11*11-» о
Окончательно, если i7 = f ° g, имеем
m-1
0f(«) d*i , df(«) dg2
dym ' dx2 ' dym
14 Ш. Пизо, M. Заманский
+
df(x) d8p
dxp ' dym
)lm + %\\
11
418 КНИГА III. АНАЛИЗ
Тем самым доказано, что функция F = fog дифференцируема.
Но из этого, кроме того, можно заключить (§ 1, замечание 1),
что F имеет первые частные производные по уи Уг> ..., уп и что
dF(y)
дут
df(x)
dgi
' дУт "
df(x)
*" дх2
<^2
df(x) dgp
" ''' + дхр ' дут
Y df(x)
~~ 2d дх.
Мы будем опираться на этот результат, но только в других
обозначениях. Точке у = (уи Уг, ..., yq) при отображении g
ставится в соответствие точка х = (хи #2>..., хр) из Rpt т. е. Хи есть
функция от у и ..., yq\ пишут xk(yu • • •, #<?) вместо gk(y). Точке
л: отображение / ставит в соответствие в R число f(xu... ,#р).
Стало быть, сложная функция F — f о g ставит в соответствие
точке, {уи ..., */?) число
/4*1 (#1, •-., Уд),Х2(У\> ....У^)» ...,*p(Vl. -**>yq))=F{yu ..м^).
;ифференцируема, если таковы р фуню
Из этого следует, что F имеет произвс
w(*i *,) Ь df(xi хр) дх*
Функция F дифференцируема, если таковы р функций Xi, ..., хр
и функция f. Из этого следует, что F имеет производную и что
■2
d"m g dxk дУт'
Допустим, например, что g есть отображение (ut v) -+ (x, у)
плоскости R2 в /?2, дифференцируемое в точке (и, v), a f есть
отображение (xyy)-+f(xyy) плоскости в R2 в R, дифференцируемое
в точке (х, у). Тогда функция F действительных переменных и, v,
определенная соответствием (и, v)-+F(u9 v) = f(x(u, v), у (и, v))y
дифференцируема, и
dF (и, v) _ df дх . df ду
д« д* д# ду ди '
(a, t>) ^ df дх . df ду
dv дх ' dv ■* ду * dv '
§ 3. Дифференциалы
Г Пусть f есть отображение Rp в /?, дифференцируемое в
точке лс е /?р. Дифференциалом отображения f называется линейная
форма от (Ль Аг,..., Ар) вида
оя обозначается df(x) или df.
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 419
Дифференциал df(x) есть не число, а символ линейной
формы. Для f(x) = xk имеем df/dxh = 0, если h Ф kt и df/dxk = 1.
Значит, дифференциал df(x) = dxk есть линейная форма,
имеющая в точке (Ai, А2,..., Ар) значение .Аь. Итак, приходим к
записи
Свойства дифференциалов повторяют свойства
дифференцируемых функций, изложенные в предыдущем параграфе.
Пусть / и g — две функции, дифференцируемые в одной и той
же точке х. Имеем
d(f + g) = df + dgr
Для любого aeJ) имеем
d (af) = a df.
Имеем также
d(fg) = fdg + gdf9
ибо
dxk g dxk"r ' dxk »
p
df(x)=^^p-dxk>
fc-1 *
f(* + *)(r(* + *)-H*)sr(*>-
-<*/-*+<te-f + xll*ll.
В том, что касается композиции дифференцируемых
отображений, мы снова обратимся к двум случаям, рассмотренным
в предыдущем параграфе.
1° Пусть g — действительная функция, дифференцируемая
в точке f(x), а / — отображение Rp в /?, дифференцируемое
в точке х е Rp. И пусть F = g о /. Результат
ft-i ft
fc-i * fc«i ft
14*
420
КНИГА III. АНАЛИЗ
порождает выражение
d(g(f(x))) = g'(f(x))df(x)
или
d(g*f) = g'-df.
2° Пусть g(y) = (х{(у),...,хР(у))— значение в точке у =
= (Уи - • • >Уя) отображения g пространства Rq в Rp\
предположим, что р числовых функций хи #2, •.., Хр от у
дифференцируемы в точке у. И пусть f — действительная функция р
переменных хих2у ..., хр, дифференцируемая в точке (Х{(у), ..., хр(у)).
Мы показали, что функция F = f о g9 определенная как
F(y) = F(yl9 ..., yq) = f{xl(yu ..., yq)9 ..., хр(уи ..., yq))>
дифференцируема и что
,(,+o-,w-£(£.£+...+£.g)t.+xi«i
Следовательно, дифференциал функции F имеет вид
А / df дхг df дХр\
Но это выражение записывается также в виде
V { Я
Л-1 \m=l m / * fc-i
« dxu
гдеЯ^=^ ~faT~dym. Но Л fe есть дифференциал функции y->xk(y)
m=l
в точке у = (yif..., #w). Значит, Kk = ^A, и стало быть,
р
**-%-£:**»
Таким образом, мы приходим к следующему важному
результату.
Теорема. Если Хи х2, ..., хр — функции от (уи у2, ..., yq),
дифференцируемые в точке {УиУг, ..., yq), то действительная
функция F действительных переменных уи ..., yq, определен-
ная равенством F (yu ....ya)=f(xi (у и ..., У я),..., хр (уи ..., yq)),
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 421
дифференцируема в точке (у и ...tyq),uee дифференциал
может быть записан в виде
<П, ч V» df(*i> .... хр)
dF(yu .-•> yq) = Zl дх dXkt
причем теперь dxh рассматривается как дифференциал в точке
(Уи .. ♦, yq) функции xh.
Этот факт называют инвариантностью формы дифференциала
и записывают в виде
d(fog) = df.
3° Пусть / — действительная функция от Хи ...» xPt
дифференцируемая в точке х = (хи ..., хр). Предположим, что df = 0.
Тогда, обращаясь вновь к определению дифференциала, видим,
что р первых частных производных df/дхи (k = 1,2,..., р)
обращаются в точке х в нуль.
Если функция f, определенная на некотором множестве,
таком, как D^R2 (разд. 1,_§ 1), дифференцируема на D и если
df(x)_== 0 для любого хе Д то df(x)/dxh = 0, каковы бы ни были
x^D и &, и следовательно, f = const на D (разд. I, § 4, важное
замечание). Очевидно, справедливо и обратное.
Точно так же, если / есть функция, определенная на
некотором брусе из Rp9 дифференцируемая на этом брусе, и если
d(f{*)) = 0 для любого х из этого бруса, то / = const (см. там
же). Из этого следует, что если f и g— две дифференцируемые
функции, определенные на одном и том же брусе из Rp (или на
одном и том же множестве D из /?2), и если df = dg для любого
*i то / — g — const, ибо df — dg = d(f — g) = 0.
Приведем в качестве примера одно применение этого
свойства. Пусть f — действительная функция, определенная,
непрерывная и дифференцируемая для х^[а, 6], a g — действительная
функция, непрерывная и дифференцируемая для у е [с, d].
Предположим, что df = dg. Но df(x) =f'(x)dx, dg(y) = g'(y)dy.
Пусть х = (а:, у) e [a, b] X [c> d]. Функция x-+f(x) — g(y) есть
отображение R2 в R, и ее дифференциал равен нулю, d(f*— g) =
■= 0. Следовательно, f(x) —g(y) = const.
Замечания. Г Пользуясь обозначением дифференциала
для действительной функции действительного переменного я,
получаем df = f'(x)dx, и значит, приходим к записи f'(x) =
= df(x)/dx, упомянутой в гл. III (разд. VI).
2° Можно определить дифференциалы второго, третьего и
вообще n-го порядка, которые обозначаются d2f, d3/, ... Мы не
будем заниматься этим вопросом.
422
КНИГА III. АНАЛИЗ
р
3° Заметим, что 2j q hk есть значение лри (ж, А) выра-
жения В(/, А), линейного по f и линейного по А, ибо из
Ц^ = ^ + ТГк вытекает, что B(f + g, А) = ВЦ А) +
+ B(g, А), и ясно, что
B(f,h1 + h2) = B(f,hl) + B(f,h2).
Это есть билинейная форма, значение которой записывается
также в виде внутреннего произведения двух элементов из Rp+
Первый элемент имеет в каноническом базисе компоненты df/dxk
(k = 1, 2,..., р) и называется градиентом функции /; его
обозначают символом grad /. Второй элемент есть А = (hu ..., А*).
Тогда дифференциал функции / запишется в виде df = grad/*dxy
в то время как значение для А линейной формы df равно grad f • А.
Пример. Пусть f — действительная функция двух
действительных переменных (л:, у)у определенная на R2. Рассмотрим
функцию g, которая точке (г, 9), удовлетворяющей условиям
г ^ 0, 0 ^ 9 < 2я, ставит в соответствие точку (г cos 9, г sin 9)
из R2. Пусть f og = F. Мы записываем F(r, 9) = f {r cos 9, г sin 9).
Обратно, каждой точке из /?2, отличной от (0,0),
соответствует единственная точка (г, 9) плоской полосы,
определенной неравенствами 0 ^ г, 0 ^ 9 < 2я. Точке (0, 0) соответствуют
все точки вида г = 0, 0 -< 9 < 2я. Следовательно, определяемое
функцией g соответствие между множеством 0 < г, 0 ^ 9 < 2л
из R2 и плоскостью R2y исключая (0,0), взаимно однозначно.
Функции х, у от (г, 9) дифференцируемы, и
dx = dr cos 9 — г sin 9 d9,
dy = dr sin 9 + r cos 9 dQ.
Если f дифференцируема, то в силу инвариантности понятия
дифференциала, имеем
dF-df-Qdx+lLdy-
= -|£- (dr cos 9 - г sin 6 dQ) + -|£- (dr sin 6 + г cos в dQ) =
= (lcose + fsin0)d'- + ''(--|-sin8 + -|-cos9)rf9-
Отсюда
^r = ^-cose + -^-sm9(
*-'(■§«•-■£ •*»•)•
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 423
Формулы для вычисления дифференциалов. Вычисление
дифференциалов не представляет никакой трудности, ибо если
/ — дифференцируемая действительная функция р
действительных переменных хи ..., хр> то df = ~- dx{-i- ... + -^- dxp
«есть значение линейной формы относительно частных
производных, которые сами являются линейными операциями по
отношению к функции. Следовательно,
d(f + g) = df + dg,
d(af) = adf (ae=#),
d(fg) = fdg + gdf,
Примеры. Для функции /(#, у) = хг + у2 двух
действительных переменных х, у имеем df = 2(xdx + у dy).
Следовательно,
d(x2 + y2) = 2(xdx + y dy) = dr2 = 2r dr,
«если r2 = x2 + у2. Точно так же, если у Ф О,
у dx — х dy
<(т)-
У2
d(ex2+y2) = d(er2) = 2rer2dr.
§ 4. Формула Тейлора
Пусть / — отображение Rp в R, дифференцируемое в точке
x^Rpj a g — отображение R в Rp, определенное как t-+x + th,
где х, h(=Rp, t&R. Функции t-+xk + thk (k = 1, 2, ..., p)
дифференцируемы для любого значения t. Пусть F = f o g. Тогда
^(0 =f(g(t)) =f(x+ th)fm значит,
F(l)-F(0) = f(x + h)-f(x).
Если / имеет частные производные вплоть до я—1 порядка
и все они дифференцируемы (что влечет существование
производных п-то порядка), то функция F имеет производные вплоть
до n-го порядка для любого значения /. Тогда
F(l)-F(0) + ±F'(0) + ... +ifF^(Q) (0<е<1).
Вычислив производные F&\ получим формулу Тейлора для функ-
дии /. Имеем
424 КНИГА Ш. АНАЛИЗ
Затем
F" (0 = 2d [ li dxkdxm hm)hk
Так как вторые производные дифференцируемы, то они
непрерывны; значит, можно изменить порядок дифференцирования*
что дает
р k*° р, т^р
F„{t)^<mz+M{hkf+2 s ^т-^аа,
иг dxk и , 1 dxkdxm
Видим,, что F7/(0) может быть получено путем вычисления квад-
р
рата дифференциала 2j я "k и замены в конечном результате
Л-1 *k
d*fe Я*т dxkdxm \ dxk ) dxl
f2]
U*l *
Ясно также, по индукции, что это соглашение позволяет, исходя
из
Р \[Q\
/ P \M
формы I 2~д^ йл I > вычислять F^)(0); записываем
F^M-lX^fh
Пусть *' = x + 8A. Тогда
/ P \P1 / P „ ч \[«-П
+^(Е^*»)М-
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 425
Пример. Если f — функция двух переменных,
дифференцируемая вплоть до 3-го порядка, то
Hx + h, y + k)-f(xt y) = hf'x(x, у) + кГу(х, у) +
+ j№fe y) + 2hk%y{x9 y) + k%(*, y)] +
+ ъкЩ'^г (х + ел, у + щ + щ* (х + ел, у + ел)].
111. ОТОБРАЖЕНИЯ ПРОСТРАНСТВА *р В Rq. ПОНЯТИЕ
О КОМПЛЕКСНЫХ ФУНКЦИЯХ ОДНОГО КОМПЛЕКСНОГО
ПЕРЕМЕННОГО. ОПРЕДЕЛЕНИЕ ФУНКЦИИ ег
§ 1. Отображения Rp в Rq
Мы дадим лишь несколько весьма кратких указаний,
необходимых для введения некоторых понятий, касающихся
комплексных функций одного комплексного переменного.
Отображение / пространства Rp в Rq представляет собой
функцию, у которой переменное есть х = (хи ..., хр) е Rp,
а значение есть f(x)^Rq. Если положить у = f(x) = (yu ..., уд),
то уъ будет значением в точке х действительной функции щ от
р действительных переменных хи ..., хр, так что уъ, = Фь(*),/ =
= (ф!,..., фь); тогда f будет упорядоченным множеством q
действительных функций р действительных переменных.
Непрерывность. Пусть функция / определена в окрестности
точки jcg^; будем говорить, что она непрерывна в этой точке,
если любому е > О можно поставить в соответствие такое
<х(дс, е), что из условия ||ж —*'|| < а, следует неравенство ||/(*) —
— /(*')Н<е- В первом из написанных соотношений берется
норма в Rpt а во втором — норма в Rq. Строго говоря, им нужно
было бы приписать на этот раз различные символы, чтобы
различать два пространства, а также различать в каждом
пространстве три эквивалентные нормы. Однако в этих элементарных
случаях мы сохраняем ту же символику. В дальнейшем будет
р = q, и R2 будет отождествлено с полем С комплексных чисел.
Если f и g— два отображения Rp в R9, определенные в
окрестности одной и той же точки х е Rp, то f + g есть функция х—>
-*/(*) + 8(х) ^Rq, af (asi?) —функция x-+af(x). Если f и g
непрерывны в точке x,Tof + gnaf тоже непрерывны.
Функция *-Н1/(*)||, которая является действительной
функцией от ж, тоже непрерывна, ибо из неравенства треугольника
для нормы вытекает
lllf C*)U —П/(*0ИКИ/С*) —f («ОЙ.
426
КНИГА III. АНАЛИЗ
Если <7=1, т0 Н/(*)П = l/(*)h здесь функция х-> ||Да:) |f
превращается в функцию |/|.
Последовательность функций, равномерная сходимость.
Пусть (fn)—последовательность отображений Rp в Rq,
определенных на одном и том же множестве Е a Rp. Будем говорить,,
что эта последовательность равномерно сходится к
отображению / пространства Rp в Rq, если для любого е > 0 можно
указать такое целое Р (е), что если п ^ Р (г), то ||/п (*) — /(*) II < е,.
каково бы ни было х^Е. Без труда доказывается, что если все
функции fn непрерывны в некоторой точке ^е£, то непрерывна,
и предельная функция /.
§ 2. Поле С комплексных чисел и пространство R2
Комплексные числа изучались в Книге II (гл. V); в С была
определено абсолютное значение.
Можно отождествить С и R2 как векторные пространства
над R. Если z = х + iy—комплексное число, то \z\ = (х2 + у2)Ч*
есть евклидова норма элемента (я, у) е R2.
Стало быть, если наделить С топологией, определяемой при
помощи абсолютного значения, т. е. если условиться считать, что*
Игл 2й = 0е С означает lim | zn | = 0 e R, то сразу же станет
И->оо Я->оо
ясно, что все результаты, относящиеся к метрическому
пространству R2, могут быть перенесены в С.
Нам остается получить основные свойства, касающиеся
второго закона в С, т. е. закона умножения.
1. Сходящиеся последовательности. Говорят, что
последовательность (zn) комплексных чисел сходится, или стремится
к нулю, когда п стремится к бесконечности, если lim | zn \ = 0Ь
/i-5»'oo
и что она стремится к комплексному числу z, если Hmf гл—г | = 0.
й-»оо
Записывается lim гл = 0, lim zn = z.
/1->оо rt->oo
Говорят, что двойная последовательность (xVtq) стремится
к нулю, если lim 1^,^1 = 0, т. е. если двойная последователь-
ность (\zp q\) действительных чисел стремится к нулю (ср. гл. I
и И).
Пусть Zn — %п + iyn, хп е /?, уп <= R- Для того чтобы после- •
довательность zn ==: хп + iyn сходилась к числу z = х + iy,
необходимо и достаточно, чтобы действительные
последовательности (хп) и (уп) сходились соответственно к х и у\ это свойства
вытекает из свойства последовательностей в /?2 (гл. V, § 6,
теорема 1).
2. Операции со сходящимися последовательностями. Пусть
(zn), (г'п) — две последовательности комплексных чисел. Если»
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 427
ъ соответствии с принятыми обозначениями (Книга I), положить
гп = хп + iyny z'n = x'n + iy'n, то (zn+ z'n) есть последовательность
{хп + Уп + *(хп + У'п))» если a^R> T0 (azn) есть
последовательность (axn + iayn); (\гп\) есть последовательность (| хп + 1уп |),
или ((#2 + /4)1/2); (гл^) есть последовательность (хпх'п — */tt^ +
+ *(хпУп~*~ х'пУп))- Из св°йств Я2 вытекают следующие свойства
для С.
Если lim 2Л = z и lim г^ = z', то lim (гл + z'n) = z + z'.
rt->oo Л->оо Л->оо V
Если lim zn = 2, то lim (azn) = аг.
П->оо Л->оо
Если lim гл = 2, то lim | zrt | = | г I, так как | \гп | — | z | К
Л->оо П->оо
^|2Л — z|, что следует из свойств абсолютного значения или
нормы.
Покажем, что если последовательности {zn) и (zQ сходятся,
то последовательность (zz') тоже сходится, и что если lim z„=z,
a lim z' = г', то lim zz' = zz'.
л->со П П->оо П П
Действительно, если lim zn = z = а: + /у, то lim хл = лг,
Л->оо П->оо
lim Уп = У1 если lim 2/ = г' = а:7 + 1у\ то lim ^ = a:7, lim у'п = у'.
По свойствам последовательностей действительных чисел
lirn^ (хпх'п - г/Х)в **' - W'i ^ (*Х + **0Ц==*0'+*/0- Значит,
lim ((хпх'п - упуп) +1 {хпУ'п + хпУп) ) = **'-УУ'+i W + х'у), а это
в силу определения произведения комплексных чисел и
означает, что
lim z„z'„ = lim zn lim z' = zz'.
rt->oo rt->oo Л->оо
Если последовательность (zn) сходится к гфО, то (zn — г)
стремится к нулю; стало быть, исключая конечное число
значений п, имеем \zn — z\ < е, где е>0 заранее задано. Возьмем
-г = |г|/2; имеем | \zn\ — \z\ \ < |«г|/2, и следовательно, —\z\/2 <
< 12д IН 2 | < | 21/2» или 0 < | z |/2 < | zn |. Таким образом,
исключая, быть может, конечное число значений п, числа \zn\
•остаются больше некоторого строго положительного числа;
иными словами, для я>Я имеем |,гп|>|г|/2. Поэтому можно
рассматривать последовательность (l/zn) для значений п^Р.
Покажем, что lim l/zn = 1/г. Действительно, если zn = хп + iyn, то
/1->оо
JL s- 1 = хп-т _ хп j Уп
*п хп + *Уп Х1+У2п Хп + У2п 4 + Уп'
428 КНИГА III. АНАЛИЗ
А так как х\ + у2п = | zn |2 сходится к | z |2 Ф О, то xnJ{x\ + yfy
и Уп/(х2п + у2п) сходятся соответственно к х/(х2 + у2) и у/(х2 + у2)*
Это свойство может быть доказано быстрее, если
предварительно установить следующий важный факт.
Если последовательность (zn) комплексных чисел сходится к
z, то последовательность (zn) сопряженных чисел сходится к г..
Действительно, хп = хп + iyni zn — xn — iyn. Так как хп
стремится к х, а уп стремится к у, то zn стремится к х — iy, т. е.
к z (в силу п. 1). Тогда, если zn Ф 0, то l/zn = zn/znzn=*zn/\ zn |2.
Поскольку | z\ | стремится к | z |2, a zn — к 2, то при zn,
стремящемся к z ф О, мы получаем, рассматривая
последовательность (zn)y из которой исключены первые Р членов, что
Замечания. 1. Символ z^Cz' или z< z' не имеет смысла,
ибо в С не определено отношение порядка. Имеют смысл лишь
символы IzJ^lz'l или |г|<|г'|, которые представляют собой
неравенства между положительными действительными числами.
2. Все предыдущие свойства приложимы, очевидно, к случаю
действительных чисел и выражают известные свойства.
Отметим, что последовательность (zn) комплексных чисел может
сходиться к действительному числу х\ для этого необходимо
и достаточно, чтобы (уп), т. е. мнимая часть 2П, сходилась к
нулю.
3. Топологические свойства пространства С. Поскольку в /?2
или вообще в нормированном векторном пространстве
определено понятие последовательности Коши, то будем говорить, что
(zn) есть последовательность Коши в С, если lim \zp — zq\ = 0.
p,q->oo
Перенесение свойств из R2 на последовательности комплексных
чисел приводит к следующим результатам.
Теорема. Для того чтобы последовательность (zn) была
сходящейся, необходимо и достаточно, чтобы она была
последовательностью Коши.
Это свойство имеет еще такую формулировку: С полно.
Ясно, что для того, чтобы последовательность (zn) была
последовательностью Коши в С, т. е. была сходящейся,
необходимо и достаточно, чтобы последовательности (хп) и (уп)
действительных чисел были последовательностями Коши в R.
Здесь нет теоремы о монотонных последовательностях, на
теорема Больцано — Вейерштрасса справедлива (см. гл. V).
Последовательность (гп) называется ограниченной, если
такова последовательность (|^п|), т. е. если существует такое
положительное действительное число А, что |гп|^Л, каково бы
ни было /г.
ГЛ VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 429
Любая последовательность (zn), содержащая бесконечно
много различных элементов и ограниченная, имеет точку
накопления.
Или: из любой последовательности (zn), имеющей
бесконечно много различных элементов и ограниченной, можно выделить
сходящуюся подпоследовательность.
Точно так же, как в R2, в С рассматривается понятие
замкнутого множества; множество комплексных чисел замкнуто, если
оно содержит свои точки накопления (или совпадает со своим
замыканием).
Теорема Бореля — Лебега верна. Рассмотрим замкнутое
ограниченное множество Е и открытые круги. Напомним, что
открытый круг с центром z0 и радиусом г есть множество таких г,
что \z0 — z\<r.
Если любая точка ограниченного замкнутого множества Е
в С лежит внутри открытого круга из некоторого семейства ЗГ,
покрывающего Е, то найдется конечное число кругов семейства
2Г, покрывающих Е.
§ 3. Комплексные функции одного действительного
переменного
Комплексной функцией одного действительного переменного
называется отображение R в С.
Поскольку С как векторное пространство отождествляется
с R2, то такая функция может быть представлена как векторная
функция действительного переменного. Пусть х принадлежит
замкнутому интервалу [а, Ь] из R, a F есть комплексная функция
от х. Значение функции F в точке х есть комплексное число,
действительная и мнимая части которого суть действительные
числа, значение которых зависит от х. Таким образом,
F(x) = f{x) + tg(x),
где / и g — действительные функции, определенные на [а, Ь].
1. Непрерывность. Так как поле С наделено абсолютным
значением, которое является евклидовой нормой пространства R2,
то очевидно, что для того, чтобы F была непрерывна на [а, Ь],
необходимо и достаточно, чтобы таковы были действительные
функции fug.
Если Ф(а:) = ф(#)+ iy(x) — Другая непрерывная комплексная
функция от х^[а, Ь], то F+Ф также непрерывна, равно как и
функция РФ, имеющая вид
x->F(x)0(x) = f(x)q>(x)-g(x)y(x) + i(f(x)y(x) + g(x)q>(x)).
2. Дифференцирование. Будем говорить, что F
дифференцируема в точке Хо е [а, Ь], если существует такое комплексное
430 КНИГА III. АНАЛИЗ
число, обозначаемое снова через F (х0), что любому е > 0
соответствует а, для которого \х— #о|<а (#е[а, Ь\ хфх0) влечет
F(x)-F{x0) рчл
х-х0 г W
<е.
Положим F'{x0) = А + iB. Так как для z = g + ix\ имеем
|||<|г| и |т||<12|| то неравенство
f(x)-f(x0) . . g(x)-g(x0) ^
Х •— Xq X —" Xо
ttf
<е
влечет
<е.
fW-f (*о) _ А I < g н I g (*) - g (дер) _ ^
X — Xq I j X — Xq
Следовательно, / имеет в точке х0 производную, равную A, a g
имеет в точке х0 производную, равную В. Верно и обратное,
поскольку для комплексного числа z = I + ir\ имеем |<г|<;
<\l\ + \r\l
Итак, для того чтобы комплексная функция F
действительного переменного х была дифференцируема в точке х0,
необходимо и достаточно, чтобы действительные функции fug были
дифференцируемы в точке х0» и тогда
F'(xo) = f'(*o) + ig'(xo).
Если F'(x) существует для любого х^[а, Ь\ то F' означает
функцию x-+F'(x). Пишем как для функций: F = / + ig> так и
для производных: F' = f + ig'. Тогда вычисления для
производных комплексных функций одного действительного переменного
производятся в точности по тем же правилам, которые
установлены для действительных функций:
(F + Ф)' = f + <?' + i(g' + y') = F' + Ф',
(FOy = F'0) + O'F и т. д.
3. Интегрирование. Пусть F = f + ig — комплексная
функция от х^[а, Ь]. Будем говорить, что F — ярусная функция,если
таковыми являются fug. Для определения интеграла от F на
[а, Ь] положим
ъ ъ ъ
JF(t)-jf{f)dt + ijg{t)dt.
а а а
Это соглашение в соединении со свойствами интегралов
действительных функций и алгебраическими свойствами комплексных
ь
чисел позволяет производить вычисления для J F (t) dt по тем
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 431
же правилам, как если бы F была действительной функцией.
Так,
ъ ъ ь
\ (F(t) + G(t))dt = j F(t)dt+ j G(t)dt;
a a a
b b
j(z0F(t))dt = z0j F(t)dty
a a
ибо если Zq = (x0 + iy0), то
z0F(t) = (x0 + iy0)(f(t) + ig(t))=x0f(t) + i*y0g(t) + i(y0f(t) + x0g(t))9
b
j(z0F{t))dt =
a
b b b b
- \ x0f (t) dt + ij yQf (t) dt + ij x0g (t) dt + i2 j y0g (t) dt,
a a a
b b / b \
j zQF (t) dt = (xQ + iy0) j f (t) dt + i I (*0 + iyQ) j g (t) dt
a a \ а ^
= (x0 + iyQ)ljf(t) dt + ij g(t) dt\=z0 j F(t)dt.
\a a I a
Важное замечание. Предупредим, что при вычислении
интеграла комплексной функции действительного переменного
необходимо тщательно соблюдать принятые соглашения.
Так, возьмем F(x)= l/(x + i)y где х^[а, Ь]. Приступая квы-
b b
числению интеграла J F(f)dt=*\ угу» следует воздержаться
а а
от утверждения, что примитивная функция l/(t + i) есть
In|f + f|. Необходимо вначале записать F в виде f + ig, где
/ и g — действительные функции. Стало быть,
b b b b b
Г dt = Г '-* Hf_ Г t-i ,,_ г tdt . с dt
J / + / J (t + i)(t-i)a l~~J /2+ 1 a J /2+l 4 t*+\%
a a a a a
*§ 4. Комплексные функции одного комплексного
переменного
Комплексной функцией одного комплексного переменного
называется отображение С в С.
Пусть Е — множество из С. Если каждому 2е£
ставится в соответствие комплексное число F(z), то действительная и
432
КНИГА III. АНАЛИЗ
мнимая части F(z) суть действительные числа, значение которых
зависит от z\ стало быть, это будут значения двух
действительных функций комплексного переменного z e £. Таким образом,
F(z) = f(z) + ig(z). Но С отождествляется с R2, т. е. каждое
комплексное число z = х + iyeC отождествляется с точкой
(а:, у) е /?2; поэтому мы можем считать fug действительными
функциями двух действительных переменных х и у.
Следовательно, можем написать F (г) = / (я, у) + ig (х, у), или F = f\ ig.
Тогда функция F выступает как отображение R2 в R2 или как
упорядоченная пара двух действительных функций двух
действительных переменных. Мы приведем несколько кратких указаний.
1. Непрерывность. Будем говорить, что /*', определенная в
некоторой окрестности точки z0, т. е. на множестве, содержащем
открытый круг с центром Zo, непрерывна в точке z0, если
любому е >0 соответствует такое oc(zo, е), что если \г — z0|<a,
то \F(z) — F(z0)|<e. Согласно свойствам абсолютного
значения, для комплексного числа г = х + iy имеем |#|<|z|,
\у\ -< |z|, \z\ ^ \х\ + \у\\ поэтому, для того чтобы F была
непрерывна в точке z0 = Хо + iy0y необходимо и достаточно, чтобы
действительные функции fug двух действительных переменных х
и у были непрерывны в точке (x0i yo) пространства /?2,
наделенного евклидовой нормой.
Следовательно, если F и Ф — две комплексные функции от
z, определенные в окрестности точки z0, то функции F + Ф,
aF(a<=C) и ^Ф, определяемые как z-+F(z) +Ф(2), z-+aF(z)
и z—*F(z)<b(z), непрерывны в точке z0.
Обозначим через |F| функцию z-+\F(z)\. Это
действительная функция от г с неотрицательными значениями, и для
z = х + iy имеем
\F(z)\ = \f(x, y) + lg(x, y)\ = ((f(xy y))2 + (g(x, у)У)ч\
Если F непрерывна в точке z0, то |F| тоже непрерывна, *
поскольку 11F (z) | — | F (z0) 11 < | F (z) — F (z0) I. Если F непрерывна
в точке z0 и если F(zq)^=0> то существует круг с центром Zo,
на котором \F(z) |, а значит и F(z), не обращается в нуль.
Действительно, если взять е = \F(z0) |/2, то из \F(z)— F(z0) | < е =
<
F(z0)
/2 будет следовать неравенство [^(z)! — |^(2о)||<
/2, и значит, \F(z) |>|F(z0) |/2 для \г — г0\ < а при а,
выбранном надлежащим образом. Стало быть, в этом круге
определена функция z—*l/F(z), которая обозначается через
1/г. Если F непрерывна в точке z0 и если F(z0)if=0, то \/F
тоже непрерывна в точке z0. Действительно, если \z — z0|<a,
то
1 1
F (г) F (г0)
\F(z)-F(z0)\ ^ \F(z)-F(z0)\
\F(z)F(zQ)\ ^ \F(z0)\*
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 433
2. Свойства непрерывной функции. Г Пусть Е —
ограниченное замкнутое множество из С, к примеру, такое, как D или
более специальное — замкнутый круг (разд. I, § 1).
Если F непрерывна на Е, т. е. непрерывна в каждой точке
из Е, то она равномерно непрерывна, т. е. произвольному е > О
соответствует такое ее, что, каковы бы ни были z, г' e Е, удов-,
летворяющие условию \г — г'|<а, всегда \F(z) — F(z') \ < е.
Ибо для того, чтобы это было так, необходимо и достаточно, на
основании неравенства треугольника, чтобы это выполнялось
для / и g, т. е. чтобы действительные функции двух
действительных переменных х и у были равномерно непрерывны на
Е a R2. А это следует из утверждения первого раздела
настоящей главы. - '
2° Если Е замкнуто и ограничено в С, в частности, если Е
есть множество D или замкнутый круг, и если F непрерывна
на Е, то F ограничена, т. е. найдется такое М > О, что
\F(z)\^M, каково бы ни было гЕ£. В самом деле, для этого
необходимо и достаточно, чтобы f и g были ограничены на Е,
что и выполняется (разд. I).
Заметим, что если F непрерывна, то можно применять k.|F|
все результаты, касающиеся действительной функции двух
действительных переменных. В частности, если F непрерывна на
замкнутом круге D, то \£\ обладает тем же свойством, а
значит, ограничена, и в D найдется такое z0, что |F(zo)| =
= sup \F(z)\. Однако мы еще раз заметим, что символ sup F(z)
z^D z<==~5
не определен.
3. Равномерная сходимость. Пусть Е — множество из С, а
(Fn)— последовательность комплексных функций,
определенных на Е. Будем снова говорить, что (Fn) равномерно сходится
на Е к функции F, если любому е > О соответствует такое не
зависящее от г целое Р (е), что еслип^Р(г),то \Fn(z) — F(z) |< е.
Здесь опять это свойство имеет место в том и только том
случае, если функции fn и gn, определяемые равенством Fn =
= fn + *'gn, равномерно сходятся соответственно к функциям /
и g, определяемым равенством F = f + ig. Если все функции Fn
непрерывны в точке z0 и если последовательность (Fn)
равномерно сходится, то предельная функция F непрерывна в
точке го.
4. Дифференцирование. Поскольку С есть поле, и значит,
наделено законом умножения, то для функции F, определенной
в окрестности точки Zq e С, можно рассматривать комплексное
F(z)-F (г0)
число —— *-^.
z-~ г0
Будем говорить, что F имеет в точке z0 производную, которая
будет обозначаться F'(zq), если существует такое комплексное
434 КНИГА III. АНАЛИЗ
число F'(zo), что любому е>0 соответствует а, для которого
неравенство \z — z0\ < a (z близко к г0, гФ z0) влечет
Г1:Го)-^о)1<е.
Записывают также F'(z0)= dF(z0)/dz.
Очевидно, что если z и F действительны, то предыдущее
определение совпадает с определением производной
действительной функции действительного переменного.
С этого момента начинается существенное различие между
действительными функциями действительного переменного и
комплексными функциями комплексного переменного. В самом
деле, для дифференцируемое™ функции F вида F = f + ig
недостаточно, чтобы действительные функции f и g от (х,у) имели
частные производные даже любого порядка.
Пусть F = / + ig. Предположим, что F определена в
окрестности точки z = x0 + iy0 и дифференцируема. Тогда для
любого zt удовлетворяющего условию \z — г0|<а, имеем
щ±ш.-р>ы\<*.
или
/ (*. У) - f (*о. Уо) + i (g (*. У) - g (хо> Уо) )
x-x0 + i(y- у0)
-F'(zo)\<b.
В частности, последнее неравенство будет выполнено, если взять
z таким, чтобы у = yQ и | х — х0 \ < а. Отсюда
f (*» Уо) - f (*о. Уо) , t g(*. yo)-g(xo, y0) _ p, , v
x-x0 x-x0 * °'
<l
Пусть F'(zo) = A + iB (А и В — действительные). Из свойств
абсолютного значения выводим неравенства
/ (*> Уо) - f (*о» Уо)
х-х0
g (*» У о) ~ g (xp, Уо)
X — Xq
А <8.
В|<8.
Этим доказано, . что существуют частные производные
df(x0,yo)/dx и dg(x0,y0)/dx и что
df (*о, Уо) _ л dg (*о. Уо) _ р
дх Л> дх ~а>
pf(~\— df (*о» Уо) . ; dg (*о> Уо)
г w~~ дх ~^1 дх •
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 435
Если же теперь взять z так, чтобы х = xQ и \у— уо\<а, то
1 f (*о, У) - f (xq, У о) | g (xp, y)-g (xp, у q) л iB I
I '(У-Уо) "*" У~Уо I
или
I _ . / (*o> У) ~ f (*o, Уо) | g (*o> У) - g (*o> Уо) _ ^ _ iB
I У-Уо У~Уо
<8,
что влечет
I f (y~ ii\ — f f *•„ г/Л __ [
I f (*o, y)-f(xp, y0) . B
I У - Уо
g (*o, y)-g (*o, Уо) д
У-Уо
<e.
Следовательно, df(x0jy0)/dy = —5, dg(x0jy0)/dy = А, и
ev /^ ч _ dg fro, Уо) .. d/ fro, Уо) _ df fro, Уо) , ; dg fro, yQ)
Из условия равенства двух комплексных чисел окончательно
получаем, что для существования F'{zq) необходимым условием
является наличие у функций f и g в точке (х0, уо) первых
частных производных по х и по у, и кроме того, выполнение равенств
df fro, Уо) = dg (xq, Уо) df fr0, у0) __ dg (xQt у0)
дх ду • ду дх
Если, например, F дифференцируема в круге и функции /
и g имеют непрерывные вторые производные, то в этом круге
будут выполняться следующие равенства:
дх ду * ду дх *
Отсюда
d2f = d2g d2f = d2g = d2f
дх2 ду дх * ду2 дх ду дх2
дх2 ^ ду2 и и дх2 ^ ду2 и>
и значит, функции f и g удовлетворяют одному и тому же
«уравнению с частными производными».
5. Операции с производными. Алгебраические операции с
дифференцируемыми комплексными функциями комплексного
переменного обладают теми же свойствами, что и в
действительном случае. Без труда доказываются следующие свойства:
(F+G)' = F'+G',
{aF') = aF' (a e= G),
{FG)' = F'G+G'F.
436
КНИГА III. АНАЛИЗ
Если рассматривать Ьб как композицию двух
отображений, причем G дифференцируемо в точке z, a F
дифференцируемо в точке G(z), то снова получаем
-&(F(G{z)))-F'(G(z))G'(z).
Если F^O, то (l/F)'=—(F'/F2).
*§ 5. Показательная функция z-+ez
Показательная функция х-+ах (а > 0) осуществляет
взаимно однозначное и взаимно непрерывное отображение множества
действительных чисел на множество положительных
действительных чисел; это отображение переводит сложение в
умножение, т. е. сумме х + х' эта функция ставит в соответствие
произведение ах*ах' образов слагаемых: ах • ах' = ах+х\ Очевидно, что
весьма важной является возможность расширения такого
свойства на комплексные числа. Итак, исследуем вопрос о том,
существует ли комплексная функция / комплексного переменного,
определенная на С и такая, что, каковы бы ни были zf z' e С,.
f(z + z') = f(z)f(z'). (1)
Допустим, что такая функция f существует; тогда должно
выполняться f{z + z') = f(z)f(z')y каковы бы ни были геС и
z' е С. Если найдется значение z0j при котором f(z0) = 0, то^
взяв в соотношении (1) «го вместо z и z — z0 вместо г', получим
f(z0 + z — z0) =f(z) *=f(Zo)f{z — z0) = 0. Стало быть, при этом
предположении f(z) =0 при любом геС. Такая функция /
полностью удовлетворяет соотношению (1), но не представляет
никакого интереса.
Итак, отныне мы предполагаем, что найдется хотя бы одна
значение z0> для'которого !и0)Ф0\ тогда /(г)^0, каково бы ни
было зеС. Возьмем в соотношении (1) произвольное 2, а 2'=0;
получим f(z + 0) = f(z) = f(z)-f(0), т. е. f(z)[f(0)— 1] = 0. А так
как /(*)=£ 0, то/ (0)= 1.
Докажем теперь индукцией по п формулу
f (nz) = [f (z)]n, каково бы ни было z e С. (2)
Для п = 1 эта формула верна. Допустим, что она верна для п.
и применим соотношение (1) с nz вместо z'\ получаем
f(nz + z) = f[(n+l)z] = f(nz)f(z) = [f(z)]nf(z) = [f(z)rl.
И формула верна для п + 1; значит, она верна для любого
целого п ^ 1.
Руководствуясь свойствами функции х-+ах, потребуем,
чтобы f была дифференцируема.
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 43Г
Изучим тогда ее дифференцирование в комплексном смысле^
Каковы бы ни были зеСиАеС, имеем для h Ф О
ф(2, л),/»+*)-/(«) ,/(я)1а^±,/(г)ф(Л, о),
поскольку f(0)= 1. Если найдется значение 2, для которого
существует производная //(«г)= lim<p(2, /г) в комплексном смысле*
то в силу условия \{г)ФЪ получаем, что lim<p(A, 0) существует,,
л->о
а значит, существует и /'(0). Обратно, если существует /'(О),
то существует limqp (А, 0), и стало быть, существует Птф(г, h)r
fc->0 ft->0
т. е. f'{z) существует при любом z^C. Следовательно, если
существует значение zy при котором f дифференцируема в
комплексном смысле, то f дифференцируема в комплексном смысле
для любого ге С и f'(z) = f'(0)f(z).
Если бы мы имели /'(О) = 0, то имели бы f'(z) = 0 при любом
2бС,и значит, f(z) была бы постоянна; стало быть, мы имели
бы f(z) = f(0) = 1. Такая функция снова удовлетворяет соотноше-
нию (1), но и она не представляет никакого интереса.
Поэтому допустим, что /'(0)=£0; тогда и }'^)Ф0 для
любого z e С. Обозначим через а фиксированное комплексное
число и рассмотрим функцию g вида
g(z) = f(az).
Для любых 2gC и z'gC имеем
g (* + z') - f [a (z + г')] - f (az + az') = / (az) f {az') = g(z)g (z%
Следовательно, g удовлетворяет соотношению (1). С другой
стороны, g> как и f, дифференцируема в комплексном смысле, и
g' (z) - af (az) = aV (0) f (az) - af (0) g (z).
А поскольку f'(0)=£0, то можно выбрать комплексное числа
а= 1//'(0) таким образом, чтобы af'(0)= 1. Полученную таким
путем функцию g мы обозначим через ехр г\ она удовлетворяет
соотношениям
ехр (г + г7) = ехр z • ехр г', (3)
ехр 0=1, ехр (nz) = (ехр г)",
(ехр z)f = ехр 2. (4)
В частности, (ехрг)^=0 = ехр0= 1, т. е.
,. (ехр h) — 1 1
Пусть z — любое комплексное число; так как zjn стремится
к нулю, если п неограниченно возрастает, то можно взять-
438 КНИГА III. АНАЛИЗ
h = z/n, и тогда
И-Mil-I.
я
или
(ехр — )- 1
у- = 1 + ея> где hm е„ = 0.
п
"Из этого выводим (ехр ~) — 1 = -——^ . Положив (l+en)z==
= гп, получаем
ехр~=1+-^-, где lime„ = z.
Наконец, применив формулу (2), приходим к равенству
ехр z — (1 + —) , где lim zn = г.
Этот результат показывает, что если существует функция ff
удовлетворяющая соотношениям (3) и (4), то всегда
f (г)« lim (l + ~Y, где lim zn = z.
Будем поэтому систематически изучать эти соотношения. Итак,
пусть имеется такая последовательность комплексных чисел zn,
что lim zn = z. Тогда
Я->оо
zn-z \я
('^)"-(>^)Ч'+-Цг^]-(>+т)"('+^)".
гДе ед= fl^/L » и значит» Hmen = 0.
Мы докажем, что lim (1 +еп/п)п существует и равен еди-
П = оо
яш^е. Отсюда будет следовать, что величины (1 + zn/n)n и
(1 + z/n)n при бесконечном возрастании п одновременно имеют
один и тот же предел или же одновременно не имеют никакого
предела. Зафиксируем комплексное число z. Тогда
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 439»
1° Если ll + —1<1, то
I п I
К'+тГ
1 <
[1 + 1+ ... +1] = U|.
2° Если |1 +-^|>1, то |l +y
., п— 1, и значит,
*<|,+т
для /г = 0, 1,.
!('+*)■-
^ I п
1+т
п
= z
1+4
Предположим теперь, что |г|<1/2; тогда из последнего
\+-\ , т.е.
1+-^
П
нера-
"<2;
венства получаем 14 ^ *+"5"
следовательно,
К'+тГ-'И21"-
В итоге для любого 2 e С, удовлетворяющего условию*
\z\*C 1/2, шиееж
К» +-5-Г-
Пусть теперь имеется последовательность таких комплексных
чисел еп, что Нтел = 0. Тогда для п>п0 будет |en|^l/2, m
Л->оо
значит,
откуда
|(l+-&)"- l|<2|*|,
Таким образом, отныне достаточно будет изучать
последовательности вида
«■-('+тГ-
где 2Е С задано, и выяснять, имеет ли последовательность
(sn) предел при бесконечном возрастании п. Прежде всего
покажем, что числа |sn| ограничены. Если |г|^1/2, то
предыдущие рассуждения показывают, что \sn— 1 |<[2 • -=- = 1,
значит, |sn|<2, и \sn\ ограничено. Пусть \z\ не обязательно
меньше 1/2. Обозначим через k такое фиксированное целое число,..
что 2\z\<k. Для любого целого п> k_2\z\ бУдем иметь
ТТЛ—Т ^ ^ стало быть, найдется такое целое га, что-
440 КНИГА III. АНАЛИЗ
л/k < т <n/2|z|, т. е. 2\z\ <n/m<k. Полагая z' = mz/n,
получаем | zf | < 1/2, и значит,
Ki+ff-'M'K'-
т. е.
1'+4Г<«-
или
\т
<2,
1+1
откуда
К1 =
л
< 2л/т < 2
1+±
л |
Следовательно, \sn\ ограничено, каково бы ни было геС;
тшеем |sn|<M Константа М зависит от г, и если |г|«<1/2, то
можно взять М = 2.
Покажем теперь, что последовательность (sj имеет предел;
достаточно показать, что последовательность (sn) есть последо-
Z Z
зательность Коши. Положим и = 1 Н—, v = 1 Н—--т-;
получаем 5п+1 — 5л = у"+1 — ап. При этом имеет место тождество t;"+1 —
— ип[{п+ l)v — nu] = (v — uf{vn-~x + 2vn-2u+ ... +пип~1),
полученное в результате дифференцирования по £ равенства 1+£ +
1 —£n+1
+ £2 + ... + £* =—fzrr~ и замены £ на u/v. Но поскольку
<п+ 1)у — пи = п + 1 + г — п — г = 1, то
0я+1 - ия = 5л+1 - 5л «,(г _ и)2 [ti»-i + 2у*~2и + ... + ли»-1]. (5)
Но |5л|^Л1, где М>\\ стало быть,
ин|5л|1/Л<м1/Л<м1/(Л-°,
Следовательно,
!^+1-^пК1 t;-«|2Al[l+2+ ... +ti\ = Mn(n+X)\v-u\\
Hoo.ttei»^e_£_; значит,
l*n+l «nl< 2 U /г-ИГ
Таким образом, для любого п^\ и любого £>- 1 имеем
J sft+*-sJ<|s*+fc-s*+ft-11+ ... -Hs„+1-sn|<
<Ж1!!.Г( ! L\+ . .(1 LVU
2 U л + *Г
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 441*
Итак,
М I z I2
15л+й — $п\<—2п > каковы бы ни были &;>1 и п^\. (6>
Стало быть, sn есть последовательность Коши, и предел
(z \п
1 Н— существует при любом 2еС.
.. r~ n I
Положим теперь
/ г\п
exp2 = lim 1 + —
и выясним, удовлетворяются ли соотношения (3) и (4). В
самом общем случае
ехрг = Нт (1 + ~ч > если Mm zn = z.
Для (3) имеем
(expz)(expz') = Hm ll+^Y(l+^-)П = lim 1 +
'+<**£]'
Но lim zz'jn = О, и значит, (3) выполняется.
Л->оо
Для (4) заметим, что (6) с п вместо п + 1 и с 1 вместо m
дает
I sn - s{ | =
(l+|)"-(l+2)
Отсюда, перейдя к Пределу при п-+оо и разделив на |г|,
получаем
[JSER^li^l^UKI*!, если |2|<1,
ибо в этом случае можно положить М = 2. Следовательно, если-
г—►(), то
lim <«P*>-i,lt
т. е. (ехрг)^ = 0 существует и равна единице, и значит,
производная от expz в комплексном смысле существует при любом z^C^
и мы имеем соотношение (4):
(exp z)' = exp z.
Изучение функции exp z. Функция exp z была определена
как предел при /г-*оо выражения 11+ — ) . Если z = x
действительно, то, как мы видели (гл. III, разд. VII, § 6) ехрг —
-442
КНИГА III. АНАЛИЗ
<ехрл; = Нт(1 + х/п)п = ех. Это служит причиной тому, что функ-
Л->оо
ция exp z, совпадающая с е* при действительных г,
обозначается ег. Итак, мы пришли к утверждению:
Пусть ez = lim(l + z/n)n. Функция z->ez есть единствен-
П->оо
наяу отличная от нуля и единицы дифференцируемая
комплексная функция f комплексного переменного, для которой f(z+z') =
= f(z)f(z') и /'(0) = 1. Она совпадает с функцией х-*ех при
действительных х.
Исследуем теперь эту функцию и, в частности, найдем
модуль для ег, вспомнив, что \z\2=zz, где z—комплексно
сопряженное к z. Пусть г = х + iy, где х и у — действительные. Имеем
ex+iy _. ех. eiy9 и значит, достаточно изучить егХ Комплексно
сопряженной к
** = lim (l + ^Г
Л-»оо \ П J
будет функция
Следовательно,
ety . e-iv = \eiv f = еъ=\%
Таким образом, e{v есть число с модулем единица. Отсюда
вытекает, что
\ex+iy\ = exm
Тригонометрические функции. Определив действительные
функции cosy и sin у действительного переменного у, положив
eiy = cosy + isiny, каково бы ни было действительное у. Так
как |егу|2=1, то cos2 у + sin2 у = 1, и значит, — l<cos#<l и
— l<sin#<l. Если а и 6—два произвольных
действительных числа, то ei{a+b) = eia • eib, откуда получаем
cos (а + Ь) = cos a cos Ь — sin a sin 6, (7)
sin (a + b) = sin a cos b + cos a sin b. (8)
Производная функции e{v по действительному переменному у
равна ie{y, а следовательно, cosy и sin у дифференцируемы, и :
(cos y)r = — sin у и (sin у)' = cos у.
Наконец, ei0 = е° = 1, и значит, cos0 = 1, sin0 = 04
Рассмотрим функцию
<Pi (У) = 1 - cos У > О-
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 443:
Имеем
Ф! (У) = Фз (У)> где ф2 (*/) = у -sin у и ф2(0) = 0;
Ф2(у) = Ф^(//), где (pz(y) = ^-+cosy-l и ф3(0) = 0;
Ч>г(У) = Ч>4(У)> гДе 94^) = T+sin^""^ и Ф4(0) = 0;
Ф4 Ыв Фз &)» гДе Ф5(У)==^-С08У--|-+1 и ft(0) = 0.
Допустим, что Фл-1(#)Х) для #.>0; в частности, при h = 2 это
верно. Тогда фл(#) возрастает при #>0, ибо Фа(#) = Фй-1 (уУ*
с другой стороны, фд(0)= 0, и значит, фл(*/).>0 для #>0.
Стало быть, это неравенство верно при любом целом h. В частности,
при А = 5 имеем cosy^. уг — -у + *• Биквадратный трехчлен
в правой части обращается в нуль при #=Уб — 2 у'З <1,6.
Следовательно, cosy обращается в нуль для значения у,
меньшего чем 1,6. А так как cosO= 1, то при # = 0 функция cosy
не обращается в нуль.
Обозначим символом я/2 наименьшее положительное
значение, обращающее cosy в нуль. Тогда cosy > 0, если 0-<у < я/2,.
и cos я/2 = 0.
Имеем также ф4(у)^0 для f/>0, т. е. sxny^y ——• для-
у>0. Но у — (у3/6)>0 для 0<у<Уб; отсюда вытекает, что
sin у > 0, ибо 0<у< 1,6 < ]/б. С другой стороны, равенство
cos2 я/2 + sin2 я/2 = 1 дает sin2 я/2 = 1, и следовательно,
smT=l.
Тогда формулы сложения (7) и (8) дают
cos (у + у) = cos у cos у — sin у sin у = — sin у,
sin (у + у) = sin у cos у + cos # sin у = cos у.
Из этого выводим
cos (у + я) = — cos у, cos {у + 2я) = cos у;
sin (у + я) — — sin у, sin (у + 2я) = sin у.
Значит, функции cos у и sin у — периодические и 2я — одиш
из возможных периодов,
444 КНИГА III. АНАЛИЗ
Так как комплексно сопряженным к efy будет e~*v, то
cos( — у) = cos у и sin(— у) = — sin у.
Стало быть, cos у — четная функция, a sin у — нечетная.
Следовательно, cosy > 0, если —я/2 < у < я/2, а так как
cos (у + я) = —cos у, то cos у < 0, если я/2 < у < Зя/2; значит,
2я — наименьший возможный период для cos у. А поскольку
sin у = —cos (у + я/2), то 2я есть также наименьший из всех
возможных периодов и для sin у. Отсюда вытекает, что 2я —
наименьший период периодической функции ег\ и е* (у+гя) — e*yf
-т.е. e2iTl = 1.
cosy
/
У
-£ 0
у г
-/
X X 1
X х i
г \
1
/зл
ZX *
Рис. 27.
Обратно, найдем такое число а + ф, при котором ea+1'P = 1.
Рассматривая модули, получаем 1еа+*Р| = еа = 111 = 1, и
значит, а — 0. Пусть р таково, что е*р = 1. Тогда e*(P+v) = еР*. ег'^ =
■«■ е**>, и значит, либо р = 0, либо р есть период функции е{У т. е.
Р является целым кратным 2я.
Поведение функций cos у и sin у. Для 0 < у < я/2 имеем
siny>0; но (cosy)' =—sin у, и значит, cosy строго убывает.
Поскольку (sin у) ' = cosy > 0, то sin у строго возрастает на
этом интервале. Для я/2 < у<я имеем cosy =—sin(y— (я/2));
таким образом, cosy<0 и строго убывает; siny =
= cos (у — (я/2)) > 0 тоже строго убывает. Соотношения
cos (у + я) = —cosy и sin (у + я) = —sin у характеризуют
поведение этих функций на интервале 0 < у < 2я, имеющем длину,
равную периоду. И, наконец, cos 0=1, sin 0 = 0, cos я/2 = 0,
sin я/2 = 1. Теперь можем начертить графики (рис. 27, 28).
Заметим, что вводимые таким путем определения
тригонометрических линий не зависят от так называемой элементарной
геометрии.
Числа с модулем единица. Пусть и + iv — число с модулем
единица. Тогда и2 + v2 = 1, и значит, —1 ^ и <С 1 и —1 ;< v ^ 1.
Если и > 0 и f > 0, то в силу непрерывности cos у и ее
строгого возрастания для 0 < у < я/2 существует одно, и только
-одно, такое значение у, что cos у = и. Тогда
siny= j/l — cos2 у = УI — и2 = v,
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 445
так как v > О и elv = и + iv. Если и < О, v > О, то поступаем
аналогичным образом на интервале я/2 < у < я. Если */ < О,
v < 0, то используем интервал я < # < Зя/2. Если */ > 0, у < О,
то используем интервал Зя/2 ■< у < 2я. Следовательно, какие бы
знаки ни имели числа и и и, всегда найдется, и притом
единственное, такое значение у из интервала 0 ^ у < 2я, что е{у =
= */ + ш. Тогда все другие значения у, удовлетворяющие этому
равенству, будут получены прибавлением к этому значению
целого кратного 2я.
Рис. 28.
Пусть Wi и w2 — два комплексных числа с модулем единица,
\w\\ = 1, \w2\ = 1, а у\ и уч — такие два действительных числа,
что х01 = е1У1у w2==eiy\ Тогда w{ • ау2 = £м*',+1'2).
Следовательно, функция e{v осуществляет отображение
аддитивной группы действительных чисел по модулю 2я на
мультипликативную группу комплексных чисел с модулем 1. Любое
действительное число у, удовлетворяющее равенству е{У = w,
называется аргументом числа w и обозначается arg w. Аргумент
определен с точностью до целого кратного 2я.
*§ 6. Теорема Даламбера
Теорема. Любой многочлен имеет хотя бы один корень.
Пусть А— многочлен степени п и Z —Л(г). Каждому
комплексному числу z функция А ставит в соответствие
комплексное число Z. Мы будем рассматривать z и Z в двух различных
плоскостях. Для того чтобы A (z) обращалось в нуль, необходимо
и достаточно, чтобы обращался в нуль |Л(г)|. Но |Л(г)|
действительно и ^0. Значит, для того чтобы показать, что A(z)
обращается в нуль по крайней мере для одного значения z,
достаточно показать, что для какого-нибудь замкнутого круга
с центром О и радиусом R (множество тех 2, для которых \z\K-
•< R) минимум \A(z)\ не может быть строго
положительным. Так как функция г-*|Л(г)| есть непрерывная
действительная функция от z = х + iyy то она имеет на замкнутом
446
КНИГА III. АНАЛИЗ
круге минимум, достигаемый з некоторой точке г0. После этого
завершим доказательство, записав по формуле Тейлора
A (z) = A (z0) + а(г - z0)m(l + <р(г)).
Такова схема доказательства. Докажем сначала пять
предварительных утверждений.
Г Пусть Z = г — г0. Когда г описывает в своей плоскости
окружность у с центром z0 и радиусом г > О, Z описывает в своей
плоскости окружность Г с центром О; ибо у есть множество
таких г, что \z — z0\ = г, и значит, образ Г окружности у есть
множество таких Z, что \Z\ = г.
2° Пусть Z = (z — Zq) w (m > 0 — целое); имеем arg Z =
= mavg(z — zQ) и |Z| = |2 —20|w. Следовательно, если z
пробегает у один раз и в одном направлении, то Z пробегает
окружность Г с центром О и радиусом гш m раз в том же
направлении.
3° Пусть Z = a (z — 20)m, где а — комплексное число, не
зависящее от z. Положим Zx = (z — z0)m и Z = aZu Имеем |Z] =
= \a\ \Zi\ и argZ = arg a + argZb Когда z описывает у один
раз в одном направлении, Z\ описывает Г m раз в том же
направлении. А так как \Z\ = |а| \ZX\ = |a|rm, то Z лежит на
окружности с центром О и радиусом |a[rm, и поскольку
arg Z = arg а + arg Zx = arg a + tn arg (г — z0)y
то Z описывает свою окружность m раз в том же направлении.
4° Пусть ф — непрерывная комплексная функция от г,
причем |ф(«г) | < е < 1, когда z е у; и пусть Z = 1 + ф(«г). Тогда
\Z — 11 < е. Когда г описыва-
^^1 ет у, Z остается внутри круга
T(V ^'7^t¥(^s\ с центром 1 и радиусом е, Зна-
\ ^Й-тГ^/^у \ чит' найдется такое число А,,
tf^Cj'X [f-e f~~"p~e 0<Я<я/2, что — K<avgZ<X
^^\ У (рис. 29).
"^^^-^ 5° Пусть ф — функция из 4°,
^- Z= arg (г — z0)m(l + <р(г)), а
Рис.29. Ш>1. ПОЛОЖИМ r = \z — Zq\,
0 = arg (г — го). Имеем 0< р =
= \а\гш{1 — е)< \Z\ < \а\гш(\ + е) = р' и argZ = arg a +
+ m9 + arg(l + ф(г)). Неравенство для модулей показывает,
что Z изменяется в кольце, ограниченном двумя окружностями
с центром О и радиусами р и р'. Равенство аргументов
показывает, что если 8 изменяется на 2я, то arg Z меняется
непрерывным образом по меньшей мере на 2я. Стало быть, если Z0 есть
значение Z, то прямая, соединяющая О с Z0, пересечет кривую,
описываемую точкой Z, по крайней мере в одной точке Z' с
аргументом arg(Z0 + я).
ГЛ. VII. ФУНКЦИИ МНОГИХ ДЕЙСТВИТЕЛЬНЫХ ПЕРЕМЕННЫХ 447
6° Доказательство теоремы Даламбера.
Предположим, что И (,г)| не обращается в нуль. Тогда, каков бы
ни был замкнутый круг с центром О и радиусом /?, минимум
модуля |Л (г)| на этом круге, достигаемый в некоторой его
точке го, будет >0. Поскольку Л (г) = anzn + Ax(z), где Ах —
многочлен степени не выше п—1 и, следовательно, для |г|>1
справедливо неравенство |Лi (-г) | ■< ^г)"-1 с некоторой
константой с, не зависящей
от г, то при |г| > 1
будем иметь И (г) | ^
> \ап\\г\п — c\z\n~i =
Чг^-ЧЫИ— с).
Отсюда, если г меняется на
окружности с центром О
и радиусом /?, т. е. если 0Q
|г[=/?, то можно взять
R столь большим, чтобы
на этой окружности
\А(г)\>\А(0)\. Для
выбранного так R
минимум модуля |Л(г)| не может достигаться в точке го,
удовлетворяющей условию |г0| =/?, поскольку для |г| — R имеем
| А (г) | > | А (0) | ^ min | А (г) |. Пусть г0 таково, что | А (г0) I =
1г|<*
*= min I Л (г) |; этот минимум достигается в некоторой точке го
замкнутого круга, ибо функция г => | А (г) | непрерывна.
По формуле Тейлора
p = |a|rm(l-e), p'Ha|rw(l+e).
Рис. 30.
где
A(z) = A (г0) +a(z- z0)m (1 + Ф (г)),
ф(г) = а,(г-г0) + ... + а„_т (г - г0)л
Пусть теперь г > 0 таково, что одновременно
|г0| + г<#, |Ф(г)|<е<1, | a \rm{\ +г)<\\ А (г0) |,
где г — любое комплексное число, удовлетворяющее условию
J г — г01 = г. Положим
Z = A(z)> Z0 = A(z0), г1 = а(г~г0Г(1+Ф(г)),
и значит, Z «= Z0 + Zb Согласно 5°, когда г меняется на
окружности у с центром г0 и радиусом г, описывая у достаточное число
раз, то argZ меняется по крайней мере на 2я, и \Zi\ > р > 0,
Следовательно, Z описывает кривую, расположенную в кольце
с центром Z0 и по крайней мере один раз пересекающую
прямолинейный отрезок, соединяющий О с Z0 (рис. 30). Точка
448 КНИГА III. АНАЛИЗ
пересечения £ представляет собой значение Z = А (г) для z = zu
лежащее на у, и
ICI<|Z0|-p<|Z0|44(26)|.
Значит, внутри круга с центром О и радиусом R должна
найтись точка zx из у, в которой H(^i)| < |Л(г0)|, что
невозможно, так как |Л(г0)| есть наименьшее значение, принимаемое
И (г) | на этом круге. Отсюда следует, что непременно
\А (z0) | = 0, что и доказывает теорему.
ГЛАВА VIII
КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ
Эта глава содержит некоторые элементарные сведения о
криволинейных интегралах. Мы ограничимся несколькими, главным
образом практическими, указаниями.
§ 1. Криволинейный интеграл
Предварительные замечания. 1. Пусть Г — жорданова дуга
в Rn, определенная при помощи вектор-функции f на [а, 6],
осуществляющей взаишю однозначное и взаимно непрерывное
отображение интервала [а, Ь] на Г.
На Г вводятся две ориентации, или (равносильное
выражение) два направления обхода, а именно тот, который
соответствует /, возрастающему от а до Ь, или тот, который
соответствует /, убывающему от Ь до а. Эти ориентации либо
сохраняются, либо переходят одна в другую при изменении
параметра, т.е. при замене t на q>(9), где ф есть функция,
определенная и непрерывная на [а, р], строго возрастающая или
строго убывающая. Мы будем предполагать, что ф имеет
непрерывную первую производную ф'. Если ф' ^ 0, то ориентация,
введенная при помощи возрастающего 8, будет та же, что и
введенная при помощи возрастающего /. Если же ф' •< 0, то
ориентация, введенная при помощи возрастающего 8, будет
ориентацией, введенной при помощи убывающего L В частности, если Г
спрямляема и если s(t) есть криволинейная абсцисса точки
МеГ, отсчитываемая от некоторой заданной точки на Г, то,
поскольку s есть строго возрастающая и непрерывная функция
от t, можно взять в качестве ф функцию, обратную к t-*s(t).
Заметим, однако, что если мы хотим обеспечить, чтобы
всякая замена параметра осуществлялась посредством функций
с непрерывной первой производной, то мы должны будем огра-
ГЛ. VIII. КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ
449
ничиться рассмотрением в качестве ф только функций,
обладающих непрерывной первой производной q/, строго положи-
тельной или строго отрицательной. Действительно, любое
взаимно однозначное и взаимно непрерывное соответствие между
/е[а, Ь] и Os[a, p] определяется при помощи непрерывной
строго возрастающей или строго убывающей функции ф
(гомеоморфизм); именно, / = ф(0), 0 = ф-1(0-
Если ф имеет первую производную, то ф' > 0 или ф' ^ 0; но
ф' может обращаться в нуль для некоторых значений 0.
Например, /<=[— 1, +1], 0€=[— 1, +1], / = 93. Если ф7 обращается
в нуль, то обратная функция будет иметь в этих точках
бесконечные производные.
2. Предстоящему изучению примитивных для
дифференциалов и двойных интегралов предпошлем замечание, касающееся
замкнутых дуг. Если Г есть некоторое множество точек из /?л
и между [а, Ь] и Г имеется взаимно однозначное и взаимно
непрерывное соответствие /, то Г не может иметь двойных точек,,
т.е. не может существовать такая точка МеГ, чтобы для
/€=[а, Ь] и *'еЕ[а, 6], *=£*', имело место /(/) - f {Г) = М»
В частности, f(a) = А 4= f(b) = В.
Стало быть, замкнутая дуга Г получается путем
установления такого взаимно однозначного и взаимно непрерывного
соответствия / между [а, Ь[ и Г, что lim f{t) = f(a), или такого
соответствия между ]а, Ь] и Г, что lim fi^ — fib),
t->a+0
Можно еще сказать, что / есть вектор-функция,
определенная на [а, Ь] и такая, что f(a) = f(b), и что соответствие между
[а, Ь[ и /([а, Ь[) (или ]а, Ь] и f(]a, Ь])) взаимно однозначно и
взаимно непрерывно.
Это уточнение понадобится нам, когда будет идти речь об
изучении криволинейного интеграла применительно к
дифференциалу.
Пример. В R2 окружность с центром О и радиусом г
получается путем установления взаимно однозначного и взаимно
непрерывного соответствия f, определенного на [0, 2д[, или ]0, 2я],
или вообще на любом интервале [а, а + 2я[ так, чтобы /(/) =
= (г cos t, r sin t).
Если дуга Г замкнута, спрямляема в R2 и определяет
множество типа D (см. гл. VII), то два направления, введенные
на Г, иногда называются прямым и противоположным
(обратным). Прямое направление можно представить как
направление, по которому наблюдатель, находящийся на плоскости /?2,
движется по Г так, что при этом параметр возрастает, а
внутренность D вблизи Г находится все время слева от него.
Противоположное направление представимо тем же способом,
|5 Ш. Пизо, М. Заманский
450 КНИГА III. АНАЛИЗ
только внутренность D находится справа. В первом случае Г
обозначается при помощи Г+, а во втором Г-.
Определение криволинейного интеграла. Пусть Г — жорда-
нова дуга; / — вектор-функция на [а, 6], осуществляющая
взаимно однозначное и взаимно непрерывное соответствие
между [а, Ь] и Г. Дуга Г — ориентированная. Пусть \х есть
непрерывная функция от t с непрерывной первой производной \i\
И пусть F — определенная на Г непрерывная функция с
действительными значениями. Рассмотрим интеграл
ь
а
Обозначим через Г+ дугу, ориентированную посредством
возрастающих t, а через Г" — дугу, ориентированную посредством
убывающих t. Положим, в соответствии с выбранной на Г
ориентацией, .
Ь а
\F(f(t))\L'{t)dt- JF(M)dvi9 J- jF(Af)rf|i-- J,
а Г>+ b p— Г+
где M = f (t) e Г, d\x = \x'(t)dt есть дифференциал от \i. Если
произвести замену переменного t = q>(0), где ф'^>0 и а <1
^ Э ^ р, то, согласно свойствам замены переменного в
интегралах, получим
ь
/^(Г(0)|*,(0Л-/^^(ф(в)))|*,(Ф(в))ф'(в)л.
а а
Но так как <р' > 0, то ориентация Г посредством возрастающих
0 будет та же, что и посредством возрастающих /.
Следовательно, исходя из принятого соглашения, мы должны записать, что
J= JF{M)dw
а р+
и стало быть, снова получаем то же выражение.
Если теперь ф'<0, то а = ф(Р), Ъ = ф(сс), и значит,
Ь а Р
|^(/(О)^(О^ = /^(/(ф(9)))^,(Ф(е))Ф,(0)^е=--J.
а Р а
Стало быть, следует написать, что
Jf(AI)d|i-- jF(Af)d|i.
г+ г"
ГЛ. VIIT. КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ 451
В итоге, еслиГ+ представляет собой ориентированную дугу Г
[(без необходимости уточнения, какое из двух направлений быт
брано), то интеграл
ъ
JF(f(t))ii'(t)dt
а
сохраняет свое значение, когда переменное t претерпевает
какую угодно возрастающую или убывающую замену параметра
с непрерывной производной. Стало быть, этот интеграл
зависит лишь от Г, от выбранной ориентации и, очевидно, от
функций F и (I. Обозначим его через
J* F(M)d\x
г
и назовем криволинейным интегралом.
Следующие свойства этого интеграла очевидны.
Г Он линеен относительно F, т. е. если F и G — две
непрерывные функции на Г и a g i?, то
$ (F(M)+G(M))dii = j F(M)d\i + J G(M)d\if
V Г Г
j aF{M)d\i = a j F(M)d\i,
г г
j F(M)d\i=- j F(M)dii.
r+ r-
2° Он линеен относительно \i, т. е. если \i и v — две функции
с непрерывными производными ц,' и v', то
j F(M)d{\i + v)= j F{M)d\i+ j F(M)dv}
г г г
j F(M)d{a\i) = a j F(M)d\i.
г г
3° Если Ti и Гг составляют разбиение Г, так что Г = Г1 U Г2,
то
г г, г2
ь
[ F(M)d\i\^sup\F{M)\ [\W{t)\dt.
16*
452 КНИГА III. АНАЛИЗ
Последнее неравенство получается следующим образом:
Ь I Ъ Ь
\ F(f(t))uL'(t)dt < f \F(f(t))\\ii'(t)\dt<sup\F(M)\ filial Л.
b
Если \x(t) — монотонная функция, то J | \i'(t) \dt = \ \i(b)—\i(a) |.
a
Замечание. Если Г есть прямолинейный отрезок [а, Ь], то
ь
jf(M)dix= jf(t)v/{t)dt9
Г а '
и мы, очевидно, возвращаемся к обычному понятию интеграла.
Обобщение. Пусть имеются та же дуга Г, числовая
функция G, определенная и непрерывная на Г, и непрерывная
функция v от t с непрерывной первой производной v'. Записываем
J F(M) d\i + J G (M) dv = | f (Af) tf|i + G (Af) dv.
г г г
Таким образом, под одним знаком интеграла объединена
сумма двух интегралов. При этой записи Г предполагается
ориентированной раз и навсегда определенным образом. Если Г+
означает Г, ориентированную одним способом, а Г" означает Г,
ориентированную другим способом, и если рассматривается
f F(M)d\i+ \ G(M)dv, то мы запишем
Г* Г""
j F(M)dp+ j G(M)dv = j* F(M)d\i-G{M)dv =
r+ r- r+
= j -F{M)d\i+G(M)dv.
Пусть Г — непрерывная дуга плоскости R2, a F и G —
функции от М е Г. Обозначим через x(t) и y(t) координаты точки
М\ F и G суть функции двух действительных переменных л; и
у, определенные на Г, a F(x(t), y(t)) есть значение функции,
являющейся суперпозицией (композицией) функций /—»
-* (*(*), у(0) и (#, у) -*F(Af). To же самое имеет место для G.
Будем писать
j F(x, y)d\x+G{x, y)dv.
ГЛ. VIII. КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ 453
Важным частным случаем является тот случай, когда функции
х и у от t непрерывны и имеют непрерывные первые
производные х' и у' (тогда дуга Г имеет непрерывную касательную и
спрямляема). В этом случае можно взять \i = x, v = у, и
криволинейный интеграл запишется в виде
j F{x, y)dx+G(x, y)dy.
г
Аналогично в Rz имеем
j F (х9 у, z)dx+G (х, у, z)dy + H (*, у, z) dz.
г
Эти интегралы приводят нас к изучению задачи
интегрирования дифференциала. Мы дадим здесь краткий разбор этой
задачи.
Замечание. Последний интеграл встречается в механике
и в физике.
Предположим (наиболее простой случай), что каждой точке
из R3 соответствует вектор (F(х, у, z), G(х, у, г), Н(х, y,z)),
т. е. определено отображение М-+Ф(М) пространства R3 в R3.
Ему, в свою очередь, соответствует вектор (dx, dyt dz) =4M.
Внутреннее произведение Ф(М)*йМ равно
Ф (М) • dM = F (х, у у z)dx+ G (xt у, z)dy + H (х, у, z) dz,
и криволинейный интеграл по (спрямляемой) дуге Г,
представленной посредством функций #, yf z от t с непрерывными
первыми производными, т. е. интеграл
j($(M).dM,
г
есть работа вектора Ф(М), когда М описывает Г.
§ 2. Интегрирование дифференциалов
Пусть в Rp имеется жорданова дуга Г, у которой
координаты Х\, ..., Хр точки MgT являются непрерывными
функциями от t^ [а, Ь] с непрерывными первыми производными. И пусть
^"ь •••> Рр — Р действительных функций, непрерывных на Г, от
р действительных переменных хи ..., хр. Рассмотрим
$ Fx(xu *2. •••> xP)dxt+ ... +Fp(xl9 ..., xp)dxp.
г
Предположим, кроме того, что Л, ..., Fv определены и
непрерывны в окрестности любой точки из Г и существует такая
454 КНИГА III. АНАЛИЗ
функция I) от хи ..., хр, что
Р*(хг хр)=ди(Хид"'Хр) (А-1, 2, ..., р).
Р
Тогда 2 ^fc (*i> • • •> xp)dxk есть дифференциал функции £/, ибо,.
/5=1
как известно, любая функция, имеющая непрерывные
производные, имеет дифференциал, и
р
dU e 21 "^гd**=SF*dx*
Л-1 Л *-1
Вычислим /= ] £jFbdxk. Если Г ориентирована, скажем, по
г
возрастающим f, то этот интеграл, по определению, равен
Но
7 = J (21FЛх1W. *2 (0, .... хр (/)) *;(*) I dt.
£'.(*,».»..*,wk<i>-^,(,) "W)
Л
ft-1
и значит,
rfc/ (jc, (0. --..МО)
<й =
= £/(*,(&), ..., хр (ft)) - t/U, (а), ..., *р(а)).
Обозначим через А и В точки на Г, являющиеся
соответственно образами а и Ь. Тогда J ]\ Fk dxk\ = U (В) — U (Л). Если Г
г
ориентирована в направлении убывающих t, то J \\^ Fk ixk\ ==■
г
= £/(Л)—U(B). В итоге мы пришли к такому утверждению.
Пусть Г — жорданова дуга в Rp, причем координаты
точки М дуги Г непрерывны на [а, Ь] и имеют непрерывные
первые производные, Г+ означает дугу Г, ориентированную в
направлении возрастающих t, а Г" — дугу Г, ориентированную-
в направлении убывающих t, А означает образ точки а, а В —
вбраз точки Ь. Пусть, кроме того, U есть функция,
определенная и непрерывно дифференцируемая в окрестности любой.
ГЛ. VIII. КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ
455
точки из Г. Тогда
j dU = U{B)-U (Л), j dU = U (Л) - U (В).
г+ г-
Эта формула, очевидно, обобщает элементарную формулу
ь
jf(1)dt-F(b)-F(a),
а
а если учесть, что F есть примитивная непрерывной функции/,
ъ
то формулу, записываемую как [ dF = F{b) — F (а).
а
Случай замкнутой дуги. Понятие потенциальной функции.
Бее предыдущее справедливо и для любого интервала [а, й']е
-е [а, Ь]. Пусть Г/+ — часть дуги Г, соответствующая интервалу
la, b*], а точки Л, В' — образы точек а, Ъ'\ тогда
|</С/ = £/(В')-£/(Л).
Г'+
Если предположить, что V стремится к Ь, то В' стремится к В
на Г, а так как U непрерывна в окрестности любой точки из Г,
то U(В') стремится к U(B).
Теперь мы предположим, что Г — замкнутая дуга; тогда
Г будет образом интервала [а, Ь[ при взаимно однозначном и
взаимно непрерывном отображении /, определенном на [а, Ь\ и
таком, что f(b) = f(a). Пусть а < Ь' < Ъ и Л, В', В —
соответственно образы точек а, Ь\ Ъ при отображении /; когда У
стремится к b, f(b') стремится к /(а), т.е. В' стремится на Г к Л.
Для дуги Г'+ снова имеем
j dU = U (ВО - U (Л).
Значит, если функция U определена в окрестности каждой
точки из Г и непрерывно дифференцируема в окрестности любой
точки из Г, то lim U(B') = U(A), и
j dU = 0.
г+
Здесь необходимо обратить внимание на новое явление,
которое мы сначала изложим на примере. Пусть в R2 задана
точка (Хуу)ФО. Каждой точке (х, у) мы ставим в соответствие
аргумент комплексного числа z = х + iy, заключенный между 0
и 2я. Пусть И означает функцию от (х, у), определенную таким
456
КНИГА III. АНАЛИЗ
путем для всех (х,у)ФО\ имем 0< U(x, у)< 2я. Для л: > О
имеем U(x, 0) = 0. Теперь рассмотрим окружность Г с
центром О и радиусом 1; пусть А есть точка х = 1, у = 0. И пусть
х = cos t, у = sin t; тогда каждая точка Л1 = (л:, у)
окружности Г поставлена во взаимно однозначное и взаимно
непрерывное соответствие с 0</<2я, и t= U(x(t), y(t)) = U(M).
Когда точка М описывает Г+, U(M) меняется от 0 до 2я, 0<1
<С U(M) < 2я. Итак, будем говорить, что если М описывает Г+
один раз, то U(M) меняется до 2я, если же М описывает Г+
т раз, то U(M) меняется до 2тл. Если М описывает Г~ m раз,,
то U(M) меняется до —2ягя, и т. д.
Именно здесь и проявляется особенность случая замкнутых
кривых. Пусть f есть вектор-функция f(t) = (cos/, sin/). Когда
t меняется на числовой прямой R, множество f (R) будет
множеством Г из R2. Взаимно однозначное соответствие
устанавливается между этим множеством Г и интервалом [0, 2я[, но
отнюдь не между Г и R. Стало быть, необходимо делать различие
между выражениями «М меняется на окружности Г» и «М
описывает Г р раз в одном направлении и q раз в другом».
Следовательно, определенная выше функция U не может
рассматриваться как непрерывная в окрестности точки t = 0, ибо
она определена лишь для t ^ 0. Здесь мы имеем пример не
потенциальной функции, точное понятие которой выходит за
рамки этого курса. Мы ограничимся тем, что приведем
следующее определение.
Пусть в R2 имеется множество типа D и числовая функция U,
определенная и непрерывная^ на D. Будем говорить, что U есть
потенциальная функция на D, если, какова бы ни была
замкнутая жорданова дуга Г, лежащая в D, выходящая из некоторой
точки М и в нее возвращающаяся, значение функции U,
полученное по непрерывности при возвращении в М, будет совпадать
с исходным.
Взяв предыдущую функцию U, мы видим, что если
описывается дуга Г, не обращающаяся вокруг О, то U возвращается
к своему исходному значению. Значит, если рассматривать
сужение U на круг, не содержащий О, то получим потенциальную
функцию.
Итак, уточним предыдущий результат следующим образом.
Если числовая функция U, определенная в окрестности Г,
непрерывно дифференцируема и потенциальна, а Г замкнута, то
J rft/ = 0.
г
Если U не потенциальна, то J dU может не быть равным нулю.
г
ГЛ. IX, ДВОЙНЫЕ ИНТЕГРАЛЫ
457
ГЛАВА IX
ДВОЙНЫЕ ИНТЕГРАЛЫ
Понятие двойного интеграла, излагаемое в этой главе, не
претендует на возможность изучения всех аспектов и всех
задач, и некоторые из них даже не будут сформулированы. Мы
ограничимся тем, что укажем несколько, слособов применения
двойного интеграла.
I. ОПРЕДЕЛЕНИЕ, СВОЙСТВА, ВЫЧИСЛЕНИЕ ДВОЙНЫХ ИНТЕГРАЛОВ
§ 1. Мера
Понятие меры. Рассмотрим плоскость R2. Зададимся
предположением, что некоторым множествам точек соотнесено
понятие площади, или меры. Такие множества будут называться
измеримыми. Вначале мы наложим некоторые условия на меру,
а затем попытаемся определить меру «простых» множеств,
таких, как прямоугольники, спрямляемые дуги. После этого мы
•сможем построить (двойной) интеграл некоторых числовых
функций на более общих множествах и при помощи интеграла
распространить на эти множества понятие площади, или меры
{см. также Книга II, гл. IX, разд. I).
Пусть £, Е\ ... — множества точек, которым может быть
отнесена мера. Обозначим ее через \i(E) и предположим, что
%i(E) обладает прежде всего следующими свойствами:
Г \х(Е) есть неотрицательное действительное число.
2° Если Е и Е' измеримы и Е гэ £', то \х(Е) > \i(E').
3° Если Е и Е* измеримы и если Е и Е' не имеют общих
точек, т. е. если Е (]Е' = 0, то объединение Е U Е' измеримо, и
. li(E[}E^)^\i(E)+]x(E%
Для измеримых множеств Е эти три условия выглядят так:
Г tu есть функция с неотрицательными значениями;
2° ]х возрастает относительно операции включения с:;
3° ^х аддитивна относительно операции объединения U,
когда множества не имеют общих точек.
Из 3° сразу вытекает, что если Еи ..., Еп — п измеримых
п
множеств попарно без общих точек, то множество \JEk из-
меримо, и ji(U£/J= 2 **(£*)•
Рассмотрим теперь в R2 открытые прямоугольники
П = ]а, 6[ХК, 6'[,
458 КНИГА III. АНАЛИЗ
представляющие собой произведения открытых интервалов:
(а < bt a' < b') из R. Положим
\х(П) = (Ь-а)(Ь'-а').
Первые два условия выполнены. Что же касается третьего, та
положим для двух открытых прямоугольников Пи П' без
общих точек
Мпипо-|1(П) + |*(по.
Пусть теперь с* лежит между а! и &', о! < с' < У. П есть
объединение следующих трех множеств: открытого прямоугольника
III = ]а, b [X] а\ с'[, открытого прямоугольника Ш = ]ау b [X] с\ Ь'[
и открытого отрезка Д прямой, определенного условиями
а <х <Ь, у = с\ П = IIi U ГЬ U Д, причем эти три множества
попарно не пересекаются. Согласно определению \x(Ui) и ^(Пг)
имеем \х(П) = jjl(П±) + \х(П.2), Следовательно,
ii(m и ш и д) = ii(no + ц(п2).
Если мы условимся приписывать Д меру нуль, то третье
условие будет выполнено. Точж) так же любому прямолинейному
отрезку, для которого х = const, приписывается мера нуль.
Пусть а{<ау а\<а'\- рассмотрим прямоугольники П к
П/ = ]ар b[X]a'v b'[. Учитывая условие 3°, мы должны
приписать еще меру нуль множеству точек (а^. х <Ьуу — а') и (х =
= а, а! ^ у < У). Это множество, составленное из двух
открытых отрезков и из точки (а, а'), должно иметь меру нуль на
основании все того же условия 3°; следовательно, точка имеет
меру нуль. Из этого, в частности, вытекает, что открытому
прямоугольнику П и замкнутому прямоугольнику, полученному из П
добавлением его границы, состоящей из четырех
прямолинейных отрезков, приписывается одна и та же мера*
Мера или площадь спрямляемой дуги. Мы только что припи*
сали некоторым прямолинейным отрезкам меру нуль. Теперь мы
объясним, почему мы пришли к необходимости приписывать меру
нуль вообще спрямляемой дуге. Пусть Г — спрямляемая дуга АВ
длины L, определяемая вектор-функцией f действительного
переменного t e [a, b]. В силу самого определения L (ср. гл. VI,.
разд. II), каковы бы ни были t0 = а < ti < t2 < ... <tn' — b>
имеем
Sllf(^+i)-f(/*)ll<L.
В частности, каково бы ни было t e [а, 6],
ll/W-/(fl)ll + ll/(ft)-f(OB<^
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ
459
и ||/(/) —f(a)\\ ^ L. Если М есть точка f(t) дуги Г, то это
означает, что длина отрезка AM не превосходит L, а значит, тем
более, строго меньше 2L. Значит, открытый квадрат с центром А и
стороной длины 4L целиком содержит Г. Разделим Г на
дуги АМи ..., МкМк+и ..., Мп-хВ длины L/n и для каждой
точки Mk (Mo = Л, Мп = В) укажем открытый квадрат с
центром Мь и со сторонами длины 4L/n. Объединение этих п + 1
открытых квадратов содержит Г, а площадь объединения этих
квадратов меньше чем
t , , ч 16L2 1 fi Я + 1 Г 9
(/г + 1) j- = 16 —J— ^ >
х ' я2 я2 '
и значит, может быть сделана сколь угодно малой.
Таким образом, спрямляемая дуга Г может быть покрыта
конечным числом открытых квадратов со сколь угодно малой
суммой мер. Поэтому мы и приписываем Г меру нуль: |л(Г) = 0.
Будем говорить, что Г имеет нулевую меру, или^нулевую площадь.
Мера или площадь границы множества /). Граница
множества D составлена из прямолинейных отрезков и из точек (х, #)е
^/?2, где y = q>i(.*0, # = ф2(*Ь причем функции ф! и ф2
непрерывны на [хи х2]. Функции ф! и ф2 также равномерно непрерывны.
Разделив [хи х2] точками £а так, чтобы 1ин — |* < т), получим,
что q>i(x) для |ft^A:^|fe+1 изменяется меньше чем на е; стало
быть, точка (#, ф1 (х)) содержится в прямоугольнике площади
гц. Множество точек (x,q>i(x)) содержится в объединении этих
прямоугольников, общая мера которых, равная г(х2— #i), сколь
угодно мала. Следовательно, множеству точек (х> q>i(x)), равно
как и множеству точек (х, ц>2(х)), приписываем меру нуль.
§ 2. Двойной интеграл от ступенчатой функции
Рассмотрим плоскость R2 как произведение множества R на
множество R, первое из которых есть множество абсцисс х,
а второе — множество ординат. Рассматриваем упорядоченное
множество xk {k = ..., —2, —1,0, 1,2, ...) абсцисс xk < xh+l и
упорядоченное множество ух ординат у{ < */г+ь Рассматриваем
множество всех открытых прямоугольников Щ, %
]*k, *k+i[ X ]yh уш[,
которые мы обозначим также через их вершины при помощи
следующих обозначений: Akfh 4ftfl+i, Ак+иШу Лл+1,«. Добавляя
к ним их стороны, получаем мощение плоскости /?2.
Мы будем рассматривать только следующие ступенчатые
функции. Пусть ф — действительная функция, принимающая
460
КНИГА III. АНАЛИЗ
ненулевые постоянные значения лишь на конечном числе
прямоугольников. Если life, г — открытый прямоугольник мощения, то
пусть <р(х, у) =/fe, и если хеЩ,,-; если же х принадлежит
стороне Щ, и то мы задаем ц(х) произвольное постоянное
значение. Можно, к примеру, условиться, что ф(д:) = lk,i для 0^xk<.
< Xk+u У = Ух и для х = Хи, Уг^У < Ух+1- Таким образом,
только для конечного числа значений k, i будет у(х)Ф0, если
х <= Щ, i.
Двойным интегралом от функции ф называется
действительное число 2 lkt (\х (Щ, t), где \х (Щ,,) = (xk+l - xh) (yM - У;)- Эта
k, i
сумма распространяется на все значения k и / е Z, т. е. на
множество целых относительных чисел, но в действительности
суммы состоят из конечного числа членов, поскольку /&, \ отличаются
от нуля лишь для конечного числа значений k, и Положим
/ (ф) = j \ Ф (х, У) d\i = J] h, tV> (Пд,<).
Этим обозначением мы будем пользоваться только при
вычислениях, а вообще мы заменим его более простым обозначением,
где вместо ф(#, у) будем писать ф(М), причем М есть точка
(х,у)> и где мы используем только один знак интеграла
/(9)=j9(M)d|*-2/*.,I*(n^£).
М
Легко проверяются следующие свойства:
1° Если ф и у — две ступенчатые функции, то
J(V(M) + v(AI))rf|i=JV(AI)rf|i+jY(A«)rf|i,
или /(ф + у) = /(ф) + /(у).
2° Если Я<=#, то { kq>{M)d\i = X ( q>{M)d\i> или /(А,ф) =»
= У(Ф).
3° Если ф ^ 0, т. е. если ф принимает только неотрицательные
значения, то или /(ф)^0. Отсюда следует, что
если ф < у, то J ф (М) d\i < Г y (Af) d\i.
Если II ф || = sup | ф (М) | и если Д есть объединение тех Щ и на
которых ф не обращается в нуль, то
|/ф(М)ф|<||ф(М)|ф<||ФЫД),
причем ц(Д), т. е. мера Д, равна сумме ц(Пь,г) (<р(М) Ф0 на
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ 451
§ 3. Двойной интеграл от непрерывной функции
Пусть имеется множество D b__R2 (см. гл. VII) и функция fr
определенная и непрерывная на D (там же, разд. I). Мы
показали, что / является равномерным пределом последовательности
(фп) ступенчатых функций, которые мы определили путем
рассмотрения достаточно мелких мощений Дп; Фп равна нулю на
любой плитке или любом прямоугольнике, если_ни сама плитка,
ни ее граница, не содержат ни одной точки из D. С другой
стороны, D можно заключить в достаточно большой прямоугольник
П, DczII, так, что площадь или мера |i(An) объединения
прямоугольников, на которых фп отлична от нуля, будет меньше*
чем \х(Щ,
|i(All)<|i(ID.
Мы покажем, что последовательность интегралов \ ynd\i
имеет предел и что если (уп) есть другая последовательность
ступенчатых функций, равномерно сходящаяся к f, то J yn d\i имеет
тот же предел.
Покажем, что если р и q достаточно велики, то Г фр d\i —
— ) 4>qd\i\ может быть сделан сколь угодно малым.
Если наложить два мощения, относящиеся к фр и к фд, то
получим одно единственное мощение, в котором мы_будем
различать прямоугольники, целиком лежащие внутри £>, и
прямоугольники, содержащие точки из Г или внешние точки к D. Если
в качестве исходных выбрать достаточно мелкие разбиения, то,
поскольку Г, являясь границей D, имеет меру нуль, сумма
площадей^ прямоугольников, содержащих точки Г или внешние
точки к D, будет <е, где е задано заранее. А так как / непрерывна,
значит, и равномерно непрерывна, то в точке М внутри D будет
|фр (М) — фд (М) | < е. Наконец, для любого п имеем | фр (М) | ^
<|| /1| = sup / (М). Отсюда, рассматривая f (фр (М) — ф^ (М)) d\i
м J *
как сумму интеграла, взятого по внутренним к D
прямоугольникам, и интеграла, взятого по остальным прямоугольникам,
получаем
|(Фр(М)~ф,(М))^|<||фр(М)-ф,(М)|ф<28||/|| + е^(П).
Значит, J (f>pd\i представляет собой последовательность Коши
действительных чисел, и стало быть, сходится. В точности такое
же рассуждение доказывает, что если (уР)—другая последова-
462
КНИГА III. АНАЛИЗ
тельность ступенчатых функций, равномерно сходящаяся к f, то
Г фр d\i — | ур d\x стремится к нулю.
Итак, если lim || ур — /1| = 0, т. е. если срр равномерно схо-
р->оо
дится к f на D, то интегралы | фр (М) d\i имеют конечный
предел, один и тот же независимо от последовательности (фр), равно-
мерно сходящейся к f. Этот предел называется двойным
интегралом от функции f no D и обозначается
I(f)-jf(M)dix=jjf(x9y)d[i.
D D
Путем предельного перехода сразу же получаем следующие
свойства.
или
Если f й g — две непрерывные функции на D, то
I(f + g) = I(f) + I(g),
или
j j (f(x> У) + ё(х> y))d\i = J J f(xy y)d\x + I j g(x, y)d\K\
D D D
$ jbf(x y)dii = kj j f(x9 y)d\i (XezR);
|/(f)l</(l/l)<sup|/(iM)|.|i(A)f
м
или
jj f(*> y)dvL\<\ j\f(x9 у)№<МЫЬ)-
Обобщение. Понятие двойного интеграла^ распространяется
на множества, более общие, чем множества D. Мы ограничимся
следующим случаем. Пусть Е—множество точек из R\ пред-
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ
463
ставляющее собой объединение конечного числа множеств 25,
т. е. множеств JDi, D2y ..., DPy и пусть два множества Du Dj
(i Ф /) либо не имеют общих точек, либо, если имеют, то только
общую дугу, принадлежащую их границе. Тогда для
непрерывной функции / на Е положим
J/(A«)d|i-S Jf(Af)d|i.
Е *-1 ^
В_элементарных случаях при заданном Е пытаются найти
такие D, объединение которых составляло бы £, например, пр-и
помощи прямых, параллельных оси у или оси х (рис. 31).
§ 4. Расширение меры
Теперь мы определим меру множества Л. Функция %, равная
единице на D и нулю вне D, является равномерным пределом на
D ступенчатых функций <рп> полученных путем задания фп
значения 1 на любом прямоугольнике, содержащем точки из D, и
значения^ в остальных точках. Действительно, для любой точки
М <=£> имеем %(М) — уп(М) = 0. _
Интеграл от % есть, по определению, мера множества D.
А так как мы любой спрямляемой дуге Г приписали меру нуль,
то D имеет ту же меру, что и ее внутренняя часть D.
Тогда говорят, что мера множества D или D есть предел
суммы мер содержащихся в D прямоугольников, определенных
путем мощения плоскости, когда стороны прямоугольников
стремятся к нулю.
. Теперь можно распространить понятие меры, или площади на
п
другие множества из i?2. Всякое объединение {jEt n множеств,
являющихся множествами типа D или D, или же множествами D,
наделенными частью своей границы, и не имеющих попарно
общих точек, будет иметь в качестве меры сумму
* (О *<)-!>(£«)•
Если / есть непрерывная функция на замыкании множества
п
\jEi9 то
1
п
|/(А1)</|1-2 jfWd».
^64 - КНИГА III. АНАЛИЗ
Легко доказывается, что элементарные множества
(треугольники, многоугольники) измеримы и их мера выражается
обычными формулами элементарной геометрии.
§ 5. Вычисление двойного интеграла
Для того чтобы напомнить, что мера прямоугольника равна
произведению мер его сторон, пишут также
J/(Af)d|i«JJ/(E, л)<*6Л).
D Ъ
Это обозначение допустимо не всегда (например, замена пе-
ременного)^
Пусть D — множество точек из R2 такое же, как
определявшееся ранее в гл. VII. Мы сохраним обозначения этой главы.
Пусть ф! и ф2 — непрерывные функции на [a, ft], которые
определяют, быть может, вместе с прямолинейными отрезками х = а,
х = ft, дугу Г — границы множества D. Определим для любого х
функцию
F{x)= J f(xyr\)dr\.
Т|=Ф. (X)
Покажем, что F непрерывна, если / непрерывна на Л. Для {х,у)
вне D положим f(x, у) = 0. Функция y-+f(x0,y) будет ярусной
(гл. IV, разд. II, § 1, замечание 2). Тогда, если х и x + h&
е [a, ft], то
<М*+Л) 4>2(х)
F(x + h)-F(x) = j f(x + h,4)dr\- j f(xt r\)dy\ =
<Pi(*+ft) q>i(*)
= J f(x + hfr\)dr)+ j f(x + h9r\)dr\ +
q>2(x)
+ j lf(x + h9 y\)-f(x,ri)]dxi.
4>i(x)
Согласно одному из свойств интеграла
I ь |
<1/У(*-а)|
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ
465
имеем
<Pl(*)
J* f(x + h9 \))di)
Ф. (x+h)
4>г (x+h)
< (I «Pi (* + h) - ф, (x) |) sup | / {xt y) |,
xty
j f(x + h,r\) dx\
4>2{X)
<(| ф2 (x + h)- Ф2 (*) I) sup I f(x, y)\.
x,y
С другой стороны, /, будучи непрерывной на Д равномерно
непрерывна. Значит, заданному е > 0 можно^ поставить в
соответствие такое а, не зависящее от (х,у) еД что если |А| < а,
то \f{x+Ky)—/(х,#)|<е. При этом в случае надобности
можно взять а столь малым, чтобы \($i(x + h)—9i(#)|<e,
|ф2(* + h) — ф2(*) | < 8, ИбО ф! И
ф2 непрерывны. Тогда
|F(* + A)~F(*)I<
<2е sup | f (х, у) |+а| ф2 (л^-ф, (х) |,
х,у
чем и доказана непрерывность F.
Покажем, что
Напомним сначала, что если
взять достаточно мелкое мощение Рис. 32.
при помощи точек xh, f/&, то
будет определена ступенчатая функция ф, сколь угодно точно
приближающая непрерывную на D функцию /, если положить
для (х,у) &[Xk,xk+i[X[yi,yi+il причем (h;i>r\k,i) есть
произвольная точка этого прямоугольника. Стало быть, интеграл от ф
по D приближает интеграл от / по D с любой степенью точности.
Итак, пусть выбранные нами точки **, ук осуществляют такое
мощение (или, тем более, еще мельче) (рис. 32).
ь
Рассмотрим | F (|) d\ и разбиение
а
a = *i<*2< ... <Ч< ••• <хп = Ь.
Если это разбиение достаточно мелко, то
ь п-\
\ F(I)d\ - 2F (хк)(хк+1 - **) Ке.
466 КНИГА III. АНАЛИЗ
Но
1>S (Xk)
F(4)= j f(xk,r\)dn.
«"l (*k)
Пусть yi<q>i(xk)^y2<y3< ... <У(< ... <Ут-1<<Р2(хк)<Ут
(см. рис. 32). Имеем
%(*k) H Уг *Лхк)
I - J +J + -+ J •
Применим к каждому интегралу в правой части первую формулу
о среднем; получим
<Р2 (*k)
J* = (f/2 - <Pi (хк)) / (**, Л*, i) + (f/з ^ f/2) f (*k> tu, 2) + •. • .
Если теперь в первом и последнем членах заменить уг— q>i(#fr) на
Уг — Уи а ф2(*ь) —Ут-i на ут — Ут-и то при этом ошибка будет
меньше чем
l(#2-J/l)f(*fc, 4l) 1 + 1 (Ут-ftii-l)/(*lk. Tbi-l)b
и если ||Л1= sup |/(я, y)i, то ошибка будет меньше чем
((f/2 - f/i) + (Ут - Ут-i)) II / II • Следовательно,
J / (**> т|) dx\ - J] (y£+I - yt) f (xk, r\ky i) I
<\\Т\\(У2-!Г1+Ут-Ут-1)*
Стало быть, величина
2 Z7 (**) (**+i - **) - 2 (**+i - **) (2 (Уш ~ f/*) / (*ь Ла, *)) I
будет, с точностью до множителя ||/||, меньше суммы всех
величин вида (хк+1 - xk) (у2 - Уг), (xk+\ - xk) (ym - ут-х)9 т. е. суммы
площадей прямоугольников мощения, покрывающих Г. Сумма
этих площадей при достаточно мелком мощении сколь угодно
мала, ибо Г имеет нулевую меру. Значит, разность
ъ
J F (I) d\ - ^ (xk+i - хк) (уш - у,) / {xkt л*, *)
a k,i
<
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ
467
может быть сделана сколь угодно малой. Но, с другой стороны,
разность
J* j f (h Л) <*fc *l - ]£ (**+i ~ *k) (Уш - Уд f (**» i\k, i)
d k>i
тоже сколь угодно мала все при том же условии, что принятое
разбиение достаточно мелко.
Следовательно,
ь
///(!. п)**1-/^(6>«.
где
ф2(*)
F(x)= j f(x9rddi\.
9i(x)
Очевидно, что если положить
G(y)= j f(t,y)dt,
то получим (рис. 33)
Рис. 33.
**t>zW
JJ/(fe.n)rfferf4-J G(r\)d4.
D c
В итоге
J/(Af)rf|i-JJfftfn)rf6rf4-
~D D
- J If /ft. ^*lU- J I /(S,n)« U.
Сокращаем обозначения, записывая
£-6 Т|-ф«(6)" Ц-£* S—Ф> (Т|)
jjfil, л)</£^ = J rf& J /(Б. Л)*|- J dTl J /(6. n)rf|.
£=a Ti-Ф, (I)
Ч)=С 6-Ф1(Т|)
5 га/сой записи члены, стоящие справа от знака равенства,
должны читаться справа налево. Так что для вычисления
J J /(I, rj)d|dr) поступают следующим образом.
468 КНИГА III. АНАЛИЗ
Г Вычисляют интеграл | /(£, r\)dr\, т. е. сначала инте-
-п=ф, (I)
грируют по ц.
2° Полученную функцию от £ интегрируют в пределах от | =
= а до | = Ь.
Замечание о вычислении площади * множества D. Если
применить предыдущий результат к функции f = 1, то
•*^)= II dxd>y= \ dx \ аУ= I (ч>2 (*) - <Pi (*)) <**»
д *=а 1/=Ф| (х) х=а
ФгМ —q>i(#) есть длина отрезка MiM2 (см. рис. 32). Обозначим
через \n\MiMz) длину отрезка М^Мг, которая является мерой &
#i = /?, а через (Агф)—меру, или площадь D в R2. Имеем
1*2 0)= I MM^dx.
Точно так же (см. рис. 32)
V-d
МЯ)= I HiiPiPJdy.
§ 6. Примеры
В приводимых примерах мы пользуемся методом
аналитической геометрии, считая при этом, что плоскость отнесена к двум
прямоугольным координатным осям.
Г Пусть f есть функция, определенная и непрерывная на
треугольнике 7, образованном прямыми у = О, х = а, х = у.
Вычислим
JJf(&.n)dfc*b
Будем интегрировать сначала по ц. Функции q>i и фг от х
определяются как q>i(x) = 0, фг(^) = х (О ^ х ^ а). Затем заставим
X меняться от 0 до а. Получим
JJ/(l.4)d6*i- I dfe I /(6. л)^ч.
Если же интегрировать вначале по g, то, поскольку функции
*|3i и фг от у определяются равенствами tyi(y) = у, tyz(y) = а
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ 469'
[(О ^ у ^ а), а у меняется от 0 до а, получаем
JJ/(!,4)d&A|- J <*Л J /(I. n)dg.
Следовательно,
а £ а а
Jrf6 J/(Б, тОrfri — J rfri J f №• i|)dfc.
0 0 n
2° Пусть надо вычислить в евклидовой плоскости площадь
круга с центром О и радиусом а(а>0), т. е. множества точек,,
удовлетворяющих условию х2 + у2 ^ а2. Границей служит
окружность х2+ у2 = а2. Искомой площадью будет
В последнем интеграле производим замену переменного Б =3
= a sin tf (0 <; t ^ я/2). Получаем
Я/2 Я/2
4 f a2 cos / • cos / Л = 2а2 J (1 + cos 2t) dt = na2.
о о
Замечания. 1° Если D есть прямоугольник и /(£, r|)=r
= ^(Б) -G(r|), to б эгсш случае имеем
ъ d г ь \ [ d
J/ /(I, П)<*6*1-/ <*! J F(|) G(t,)^=M F(i)rf|) J Gfo) A,]
27 а с \а ' \c
2° Хотя в рассмотренных простых случаях вычисление
двойного интеграла сводится к вычислению двух (простых)
интегралов, не следует думать, что двойной интеграл есть произведение
простых интегралов даже тогда, когда D — прямоугольник.
II. ДВОЙНЫЕ И КРИВОЛИНЕЙНЫЕ ИНТЕГРАЛЫ
§ 1. Формула Римана
Рассматриваемые в этом разделе множества D имеют своей
границей спрямляемую дугу Г, некоторые части которой могут
быть прямолинейными отрезками, параллельными осям, скажем
ВС, DE, FG, НА (рис. 34). График функции <pi от #е[а, Ь] есть
дуга ABCD, а график <р2 — дуга HGFE. График функции г|н от
у^[с,d\ есть дуга GHAB, а график ф2— дуга FEDC.
470
КНИГА III. АНАЛИЗ
Пусть^ теперь f — числовая функция от (х, у) ^ D,
непрерывная на D и имеющая непрерывную на D частную производную
df/dy. Рассмотрим
D
Применяя изложенный в предыдущем разделе способ
вычисления двойного интеграла, получаем
Т1=Ф2 (6)
dt|
rfrj.
Но в интеграле 'J' л drj переменное g зафиксировано,
Т|-Ф| (I)
г -г—/(|f ti) является непрерывной производной функции f no y|
У\
ft
и
С
F
Гг >,
—_-Н
fi J
\^в су
р>
1
\
Г*
i ~" a b «r
Рис.
У
d
с
0
34.
/У
4
ff
,.. . ^
£ \Г+
At г
b x
или, еще: f является примитивной для df/dv\ при любом |.
Следовательно,
П=Ф2 (6)
J iLSrLd4=;& ф2(|)}"f il'ф< (|) >•
Стало быть, имеем
-/- J (ffc. <P2(I)W(£> <Pi(|)))d|-
J /(I. <!*(&))*- J /ft. 9i(6))*-/2-/i.
£=a
S-a
S-e
Интеграл /2 является криволинейным интегралом от / по дуге
JIGFE, ориентированной в направлении возрастающих абсцисс,
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ
471
a /i — по дуге ABCD, ориентированной в направлении
возрастающих абсцисс. Значит, — h есть криволинейный интеграл от f
по дуге EFGH, ориентированной в направлении убывающих
абсцисс. С другой стороны, криволинейный интеграл от / по
прямолинейным отрезкам АН, DE равен нулю, поскольку для этих,
отрезков х = а или х = Ь. Наконец, ориентируем границу Г
множества В в направлении, определенном порядком ABCDEFGH,
и обозначим так ориентированную Г через Г+. Тогда интеграл /
запишется в форме криволинейного интеграла
/= - f f(x, y)dx.
г+
В итоге: если D имеет в качестве границы спрямляемую жор-
данову дугу Г+ при условии, что f есть непрерывная на D
функция от (х,у) еД производная df/dy которой определена и не*
прерывна на D, то следующая формула, называемая формулой
Римана, позволяет выразить значение двойного интеграла от
df/ду по D через значение криволинейного интеграла от f no Г+:
Я m^ML dxdy = -\f <*. у)dx- о>
D Г+
При сделанных предположениях эта формула позволяет, и
обратно, выразить криволинейный интеграл посредством
двойного интеграла:
lfb,y)dx--[J2%U-dxdy.
Г+ D
__ Рассмотрим теперь другую определенную и непрерывную на
Л функцию g, у которой производная dg/dx тоже непрерывна на.
Z). Пусть
D
Применим тот же метод к /, но сначала проведем
интегрирование по I,
y\=d £И>2 (т|) *
Г\=С |=1|>1 (11)
- J (г(Фг(п)» л)-г(+1(л). л)) А)8-
T)«rf 1) = d
- J g(*8(T|)t П)А)- J fif (+i (Л). iUdi\ = J2-Jx..
472
КНИГА III. АНАЛИЗ
Л есть криволинейный интеграл от g по части CDEF дуги Г+,
а —J\ — криволинейный интеграл от g по части GHAB.
Криволинейные интегралы от f по прямолинейным отрезкам ВС и GF,
Рис. 35.
равны нулю, так как для этих отрезков у = с или у = d. Стало
быть, имеем
ll&$J!L'dxdy-[g(fi.y)dy.
(2)
Объединяя формулы (1), (2), получаем следующую формулу:
lf(x,y)dx + g(fi,y)dy-ll(*^-*^)dxdy. (3)
Г+ D
Обобщение. Предыдущую формулу можно
распространить на случаи, более общие (рис. 35), но только с некоторыми
оговорками.
§ 2. Вычисление площадей
Возьмем в формуле (1) предыдущего параграфа функцию
f(x,y) = У- Тогда
Г J dx dy = — j y dx.
Двойной интеграл, по определению, является мерой, или пло-
щадью области D. Следовательно,
\х (D) = - J у dx.
г+
Взяв в (2) функцию g(x, у) = х, снова получим
\х (D) = j х dy.
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ 473:
Отсюда сложением (или при помощи формулы (3)) получим
Ц Ф) = j J xdy~y dx.
г+
Примеры. 1. Площадь замкнутого круга х2 + у2 4^. а2*
в евклидовой плоскости может быть получена следующим
образом. Сначала устанавливается какое-нибудь определенное
представление границы Г+ в соответствии с параметрическим,
представлением Г+, имеющим вид
х = a cost, y^asint, а^/<а + 2я,
где а — произвольное действительное число (которое обычно
берут равным 0, либо —я). Пусть ориентация Г+ соответствует
возрастанию параметра t\ тогда вычисление криволинейного-
интеграла производится так:
*=а+2я
J х dy — у dx = a2 J cos / d (sin /) — sin / d (cos /) =
а+2я а+2я
- a2 J (cos21 + sin21) dt = a2 J dt..
a a
Отсюда jn (D) = na2.
2. Если Г состоит из интервала [а, й], графика функции / ^ О,,
непрерывной на [а, Ь], и прямолинейных отрезков х = а, х = Ь,
то мы возвращаемся к элементарному понятию площади,,
используемому иногда для наглядного толкования понятия
интеграла. Площадь определенного таким путем множества В
ь
выражается через функцию f ^ О интегралом Г f(x) dx.
а
§ 3. Замена переменных в двойном интеграле
Задача о замене переменных в двойном интеграле является:
трудной задачей, относительно которой мы приведем лишь
некоторые соображения.
Пусть имеется отображение ср пространства R2 в R2,
ставящее в соответствие точке (и, v) первой плоскости П точку-
(хуу) второй плоскости 1Г; х(и, v) и y(uyv) суть значения х, у
в точке (utv). Мы сделаем следующие простые допущения и
будем _считать известными некоторые результаты. Пусть
область D' в IT ограничена спрямляемой жордановой дугой Г',,
а D в П ограничена спрямляемой жордановой дугой Г.
Предположим, что предыдущее отображение ф взаимно однозначно»
-474 КНИГА III. АНАЛИЗ
и взаимно непрерывно и что первые и вторые производные от
х, у по и, v непрерывны. Более того, мы предположим, что это
отображение устанавливает взаимно однозначным и взаимно
непрерывным образом соответствие между границами Г" и Г
соответственно областей D' и D. Предположим еще, что
определитель
дх
ди
ду
ди
дх
dv
ду
dv
дх dy
~~ du dv
dx dy
dv du
не обращается в нуль на D' и, значит, не меняет знак на £>'.
Тогда можно показать, что если этот определитель положителен
на D\ то Г'+ переводится в Г+, а если этот определитель
отрицателен на Z)', то Г/+ переводится в Г~.
Этот определитель называется функциональным определите-
.лем, или якобианом функций х, у относительно переменных
(и, v) и записывается следующим образом:
Ж*,*)
D(utv)
dx
du
ду
du
dx
dv
ду
dv
Пусть теперь f — функция от (х, у), непрерывная в D и
равная нулю вне этого множества, a g— функция от (и, v),
непрерывная в W и имеющая вид g(u9v)=*f(x(u,v)f y(u,v))y
т. е. g = fo<p. Допустим, что D(x,y)/D(u, v)> 0. Мы
предполагаем выразить двойной интеграл Г J f(x, y)dxdy посредством
d __
двойного интеграла функции g по множеству D'.
х
Пусть F(x,y)— f(t, y)dt> так что -^-^f./7 есть непрерыв-
а __
ная функция от (я, у) е D. Действительно, имеем для двух
точек из D
х х'
f{x, у)-Fix', y')=jf(t, y)dt-\f{t, tf)dt-
= f (f(t, y)-f(t, tf))dt+ J f(t9 trtdt.
А так как f непрерывна на D, значит, и равномерно непрерывна,
то можно выбрать \у — у'\ столь малыми, чтобы \\(t,y) —
~—f(t*y')\<B* каково бы ни было t Если еще считать, что
ГЛ. IX. ДВОЙНЫЕ РЯДЫ
475-
I* — х'\< е, то
\F(x, y)-F(xf, */')|<
j(f(t,y)~f{t,y'))dt
-b
jf(t,y')dt
X'
+
<(&-а)в + |1Л1в.
Применим формулу (2) из § 1. Получим
J F (ху у) dy = j j f(x, y) dxdy.
Г+ D
Если произвести в криволинейном интеграле замену
переменного (и, а) —>(х, у)у то в силу равенства dy = -^-du + ~dv к
предположения D ;*' у\ > О получаем
\F{x,y)dy= \F(x(u9v),y(u9v))(^du + %dv).
Пусть G(и, v) = F(х(и, v),y(u,v)). Последний криволинейный
интеграл представляет собой сумму двух криволинейных
интегралов. Применяя формулу (1) из § 1, где и и v заменяют х, уу
получаем
Г/+ D' .
Применяя формулу (2), получаем
/а<*.)£*-Я(£#+«Яг)*'*-
Г'+ D'
Отсюда
Имеем
476
КНИГА III. АНАЛИЗ
А так как ^(*(*/,*), yiu, v)) s;(jc(<l> v)y y{tli v))$ т0
окончательно
Если £> (a;, y)/D {u, v) < О, то вместо J мы получим J , т.е.
г,+ Г/-
-J, и
Г' +
IJ/(ж, y)dxdy~-jj-f(x(u, v), у (и, v))~^dudv.
Окончательно
\\f(x%y)dxdy-\\f(x(u9 v),y(u, v))\-^^\dudv9
где
D (*, у)
д* дх
ди dv
ду ду
ди dv
Следовательно^ эта формула позволяет вычисление двойного
интеграла по D от_(л;, у)—»f(x, у) заменить вычислением
двойного интеграла по D' от функции
{и, ,)-/(*(«, v), у (и, 0))(«£^i^J!L_ *^L5egjL).
Эта формула и называется формулой замены переменных в
двойных интегралах. Важно выяснить, в какой степени она
подчинена довольно ограничительным условиям, перечисленным
в начале этого параграфа (условия, которые могут быть
заменены другими, менее жесткими).
Новое обозначение. Формула замены переменного не
всегда вносит то относительное упрощение, которое имеет ме-
^сто в случае интегралов с одним переменным; там, как пра-
ь
вило, интеграл J f(x)dx преобразуется в интеграл, в кото-
а
ром dx заменяется на x'(t)dt, т. е. обычно можно
рассматривать dx как дифференциал. Если же в двойном интеграле
попытаться рассматривать символ dxdy как произведение двух
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ 477
дифференциалов, то при замене переменных мы придем к
абсурду. Таким образом, выясняется, что обозначение dxdy,
предназначавшееся вначале для того, чтобы напомнить, что мера,
выбранная в R2, есть произведение мер в /?, здесь уже не
годится. Мы примем следующее соглашение. Вместо dxdy мы
будем пользоваться обозначением dx A dy, приписывая этому
символу, называемому внешним произведением, хорошо известные
свойства обычного векторного произведения. Вообще говоря,
отображение (а, Ь)-+аАЬ будет предполагаться линейным
относительно а, линейным относительно b и антисимметричным,
т. е. (а Л Ь) = — {Ь А а). В частности, а Л ^ = 0. Это случай
знакопеременной билинейной формы (ср. Книга II и
определители). Если мы примем это соглашение для символов du, dv, dx,
dy, то, рассматривая частные производные как числа, получим
+(£-*)<*л*)+(££)(*л**+
+(4Н9«* л *>-(££)<*. л л»-
-(■£*)<***->-■§££<* л*».
Символ dxAdy называют внешним дифференциалом от (х,у).
Двойной интеграл J J f(x, y)dx Л dy может быть вычислен
путем замены переменных, подчиненной сформулированным
выше условиям, причем если рассматривать dx, dy как
дифференциалы, то dxAdy преобразуется в **' ^ du Л dv, где
duAdv есть внешний дифференциал от (u,v). Тогда запишем
jjf(x,y)dxAdyi = ejjf(x(u, v), y(u, v))^-^duAdv9
где |е| = и имеет тот же знак, что и л *' у\ .
Условимся пользоваться обозначением
///(*, y)dy, или jf(M)dp,
d Б
478
КНИГА III. АНАЛИЗ
когда имеются в виду лишь свойства интеграла и нет
необходимости его явного вычисления; обозначением
///(*» y)dxdy>
когда речь идет о действительном вычислении этого интеграла
по формулам
11 f(x, y)dxdy= J dx j f(x,y)dy =
2) x~a y=*4i(x)
y=d x=ty2(y)
= J dy I f(*> y}dx*
У~с x=tyi(y)
и обозначением
I j f(x* У)dx Л dy, >
ъ
когда появляется необходимость замены переменных.
Пример. Этот пример касается так называемого
«перехода к полярным координатам». Если положить # = rcos9.
Рис. 36.
у = г sin 6, то тем самым будет определено отображение ф
плоскости П' точек (г, 9) на плоскрсть П точек {х,у) (рис. 36).
Выясним, будет ли это отображение взаимно однозначно, иначе
говоря, выясним, будет ли для заданной точки (х, у)
существовать, и притом единственная, такая точка (г, 9), что х = г cos 9,
у = г sin 9. Ответ на этот вопрос, очевидно, отрицателен, ибо
если точка (г, 9) является искомой, то таковой будет и точка
(г, 9 + 2kn), где к — целое число, а также точки (—г, 9 +я).
Следовательно, если точка (г, 9) меняется в плоскости IT, то
отображение ср не будет взаимно однозначным отображением П'
на П. Рассмотрим в П' полосу 5, определенную следующим
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ 479
образом: 0< г, 0^С9<2л. Из равенства х2 + у2 = г2 выводим,
что каждой точке (я, у) е II соответствует единственное число
г > 0. Если (х, у) Ф 0, т. е. если не будет одновременно х = у = 0,
то существует, и притом единственное, такое 0е[О, 2я[, что
* = rcos9, у = rsin9. Но если (х,у) = 0, т. е. если х = у = 0,
то любая точка (0,9) имеет образом нуль. Следовательно,
Ф устанавливает взаимно однозначное соответствие полосы В
на плоскость П без нуля. Отображение ф непрерывно на В и
имеет непрерывные частные производные всех порядков.
Обратное отображение ф"1 определено на П без нуля и имеет вид
г = Ух2 + у2, 9 «\|) (х, у), где г|э выражается следующим образом:
X
ф (дс, у) -= arccos . 2 , если а: > 0, у > 0,
Ф (*, У) = arccos [ ' ~+ —, если л; < 0, у > 0,
У хг + у* 2
ф(л:, у) = arccos '*' 2 + я, если х < 0, у < 0,
Ф (*» #) = arccos > + — > если х > 0, у < 0.
Легко видеть, что на П без нуля функция ф-1 непрерывна.
Следовательно, ф есть взаимно однозначное и взаимно непрерывное
отображение полосы В на Л без нуля. Наконец, имеем
dx = dr cos 9 — г sin 9 d9, dy = dr sin 9 + r cos 9 d9. Отсюда
dx /\-dy — r dr /\ dQ. Значит,
^^ = r>0.
D (r, 6)
Таким образом, при вычислении
f f f (x> У)dx Л dy = J* J / (r cos 9, r sin Q)rdr A dQ
1) P
нужно вначале тщательно определить область D\ которая будет
подмножеством из В, поставленным _во взаимно однозначное и
взаимно непрерывное соответствие с D. __
Замечание. Трудность возникает тогда, когда D
содержит О, ибо между D и D' не может быть установлено взаимно
однозначное соответствие, поскольку точке О соответствует
г = 0. В такой ситуации бывает полезен тот факт, что интеграл
по множеству, состоящему из спрямляемой дуги или одной
точки, равен нулю.
Пример. Пусть f есть функция двух действительных
переменных (я,*/), определенная на замкнутом круге х2 + у2<С
480
КНИГА III. АНАЛИЗ
•< а2 •< 1 и имеющая вид / (л;, у) = У а2 — х2 — у2. Для
вычисления
/ = J J* >Л*2-*2-У2 ^ Л <ty (l)
вычисляем
/= J J" l/a2-'2 rdr AdQ, (2)
где D' есть прямоугольник плоскости (г, 9), определенный
посредством 0 <1 г < а, 0<i 9 << 2я. В формуле (2) функция от
(г, 9), определенная как F (г, Э)= ]/я2 — г2 • Л представляет
собой произведение функции от^ г на функцию от 9 (последняя
равна единице). А поскольку D' есть прямоугольник, то (разд. I,
§ 6, замечание)
J* d9JI ||/?^72"гйг)-2я| yW^Wrdr^
а
« я JV - г2)* с/ (г2) - 4 я (а2 - /*)% £:° -
2яа3
Тем самым вычислен объем полушария с центром О и
радиусом а.
§ 4. Инвариантность меры относительно движения
Теория меры, которую мы лишь наметили, была нами
построена по следующей схеме: вводилось понятие меры для
открытых прямоугольников (как произведение открытых
интервалов из R), некоторым множествам точек из R приписывалась
мера нуль (границам множеств D), строился интеграл от
непрерывных функций на D_ (а можно также построить интеграл
от ярусной _функции на D), и после этого определялась мера
множества D как значение интеграла от функции, равной
единице на D и нулю вне D (разд. I, § 4). Это расширение понятия
меры нуждалось лишь в понятии меры интервала из /?, в
определении множеств Dhb понятии равномерной сходимости. Мы
не брали в расчет то обстоятельство, что R2 может быть
наделено структурами, более богатыми, чем структура векторного
пространства.
Поскольку R2 рассматривается как метрическое евклидово
пространство (Книга II, гл. X, разд. II), то могут быть
определены преобразования R* в R2 и, в частности, линейные пре*
образования, сохраняющие норму (см. там же).
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ 481
Рассмотрим в евклидовом пространстве R2 группу движений,
состоящую из множества вращений вокруг некоторой точки
и сдвигов. (Отметим, что движение не является линейным
преобразованием.) Всякое движение сохраняет расстояния и углы.
При этом оно переводит любое множество D во
множество Е той же меры в указанном выше смысле.
Действительно, движение всегда может рассматриваться как
композиция переноса и поворота (вращения) вокруг О.
Перенос ставит в соответствие точке {и, v) точку (х9 у) вида
х = х0 + и, у = уо + v. Пусть %Е есть функция, равная единице
на Е и нулю вне Е\ Хд есть функция, равна единице на D и
нулю вне D. Очевидно,
%Е(х9 у) = %п(и> »)■
Согласно результатам ' предыдущего § 3, учитывая, что
\ П(х, у) \ «
href г1- полУчаем
f J 1 (х, у) dx A dy = J* J" %(uy v) du A dv\
и Е имеет ту же меру, что и D. Точно так же вращение
вокруг О определяется равенствами
х = аи + $v,
y = a'u + fi'v,
и определитель этого линейного преобразования по абсолютному
значению равен единице (см. Книга. II, гл. X, разд. II, § 4).
Следовательно, 1 ^ ;*' у1 = 1. Отсюда вытекает, что множество,
полученное из D вращением, имеет одинаковую с ним меру.
§ 5. Применение к вычислению объемов
Последний пример из § 3 предыдущего раздела
демонстрирует один из простых случаев вычисления объема.
Пусть в евклидовом пространстве R3 имеется множество Е
точек (х, у, z), определенное следующим образом!
Г Множество точек (х, у) плоскости, для которых
(х, у, г) е Е, есть множество D.
2° Какова бы ни была точка М = (x,y)^D, в Е найдется не
более двух точек, имеющих проекцию М, скажем, (x,y,Z\) и
(xtyyz2) с 2i<z2.
3° Функции Zx = fi(x, у) и г2 = h(x, У) непрерывны на D. При
этих условиях будем называть мерой, или объемом множества Е
16 Ш. Пизо, М. Заманский
482 КНИГА III. АНАЛИЗ
в R3 двойной интеграл
|i3 (Е) = J | (f2 (а:, у) - f х (х, у)) dx dy.
Ъ
Если (i2 — мера, определенная в Rz, a fx± — мера в /?, то
запишем
М£)= J \ii{MlM2)d\i2y
Ъ
поскольку |jh(AliAi2) = /2(а:, у)—fi(xyy) есть длина отрезка
МХМ2. В § 3 предыдущего раздела был приведен пример на
применение этой формулы.
По способу вычисления двойного интеграла имеем
х=Ъ у**Ц>2(х)
Из(Е) = J dx J (f2(x, у)- fx {x, y))dy =
x=a 1/=Ф, (x)
х=ь у=Фг(х)
= J dx J |i! (AfiAf2) dy.
*=a |/=ф|(х)
А интеграл (ср. разд. I, замечание к вычислению площади мно-
жества D) \ \ii(MiM2)dy есть площадь множества ЕХУ
представляющего собой пересечение множества Е с плоскостью,
имеющей абсциссу х и параллельной осям Оу и Ozy т. е.
множество точек из Е, имеющих одну и ту же абсциссу х:
М^*Н J \xl(MlM2)dy.
Следовательно,
*=& х=Ь
\i3(E)= J |i2(EJdx= J \x2{Ex)d\\x.
x**a x=*a
Точно так же* если fj/ есть множество точек из Е, имеющих
одну и ту же ординату у, то
у=& y=d
|х3 (^) = J \i2(Ey)dy= J* V*$y)dv.x.
Пример. Для того чтобы вычислить объем шара 5,
х2 + у2 + z2 к?а2, надо менять а: от —а до +а; Ех есть замкну-
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ
433
тый круг с центром О и радиусом У а2 — х2. Значит, |г2 (£"*) —
= я (а2 — #2), и
^з (В) = я (а2 — a:2) dx = я а2х —^" = у яа3.
III. ТРОЙНЫЕ ИНТЕГРАЛЫ
Мы изложим кратко, не приводя доказательств, определение
и свойства тройных интегралов.
Определение. В пространстве /?3, наделенном евклидовой
нормой, рассмотрим брус как произведение трех интервалов
из R. Мера, или объем бруса есть произведение мер трех интер- *
валов.
Рассмотрим в /?3 точечное множество типа Е (см.
предыдущий раздел), определенное по отношению к множеству D из
/?2 посредством непрерывных действительных функций fb f2 двух
действительных переменных. Тогда Е будет множеством таких
точек P(x,yyz) из /?3, что M=(^,j/)Ei) и fi(M)*Cz-tCf2(M).
Снова приписываем объем 0 множеству точек (я, у, z), для
которых (х, y)^D, z = f\ (х, у) или г = f2 (xy у), поскольку это
множество опять же может быть покрыто брусами, сумма
объемов которых <е. Для мощения пространства R3 при помощи
брусов вновь возьмем ступенчатые функции ф, обращающиеся
в нуль всюду, кроме конечного числа брусов. Любая непрерыв*/
ная функция на Е будет равномерным пределом ступенчатых
функций ф,г. Тройной интеграл от / по Е есть предел интегралов
от фл. Этот интеграл записывается в виде
jf(P)d\i3,
Е
причем обозначение |1з служит для напоминания о том, что речь
идет о мере в /?3. Применяются также обозначения
////(*»& z)dx аУ dz>
E
I J" J f(x* y> Z^ dx hdy Л dz.
E
Вычисление. Пусть Д D', D" — проекции множества Е
соответственно на плоскости {х, у), (y,z)f (z, х). Предполагается,
что любая параллель одной из осей пересекает множество Е
не более чем в двух точках (рис. 37) и что определенные т^ким
lb*
484
КНИГА III. АНАЛИЗ
путем функции непрерывны; допустим, что
Фь Ф2~ Функции от (х, y)e=D9
tyu t|)2—функции от (уу z)^D't
%и %2~ функции от (г, #)<=/)".
Когда (х9 у) меняется в Д точки (х, у, г) множества Е
получаются, если (х, y)^D и ф!(л;, у) ^
^г^ф2(л:, у); пусть а и Ъ —
крайние значения для г.
Можно показать, что
\ \ \ f(x> У> *} dx аУ dz =
Е
= \ dz j j f(x, y, z) dx dyy
или
\ f(x, У у 2)фз =
E
где Ez — множество точек из Е, имеющих одну и ту же
высоту z. Таким образом, в этих простых случаях вычисление
тройного интеграла состоит в том, что вначале вычисляется
двойной интеграл \ \ f(x, у. z)dxdy (после того, как опреде-
лено Ez)\ затем, получив функцию от z, вычисляют ее интеграл
на [а, Ь].
Можно также вычислить тройной интеграл по следующей
формуле:
*«ф2(Х, У)
J J J f(x' У> z) dxdydz^ J J dxdy j f {x, y, z) dz,
E D 2=<pi(*. #)
т. е. сначала вычисляется простой интеграл от f для г,
удовлетворяющих условию
<Pi(*> у)<«<Ф2(*э У)>
что сводится к фиксированию (х, у) в Д а затем вычисляется
двойной интеграл по D полученной таким путем функции от
ГЛ. IX. ДВОЙНЫЕ ИНТЕГРАЛЫ 435
Очевидно, что при надлежащих условиях будут иметь место
также следующие формулы:
х-$г(у, г)
j j j f (x, у, z).dxdy dz = J" J* dydz j f{x, yt z) dx =
E D' *=4>i(0, г)
У-%г{г%х)
= j j dzdx j f{x9 y, z) dy.
D" У=Х\(г,х)
При / = 1 интеграл по Е есть мера, или объем \1${Е). Тогда
ф2 (*, У)
J j j dxdydz= J* J* dxdy j dz = j j (<p2(*, */)-<Pi(x, y))dxdyy
E D 4\(x,y) D
т. е. получаем формулу, приведенную в предыдущем разделе.
Дополним последние формулы из § 5 предыдущего раздела,
заметив, что если f = 1, то имеем также
2«& Z=*b
^3 (£) я J dV>\ \ dV>2 - j 1*2 (^г) Ф».
г=а Bz z**a
Пример. Е есть шар радиуса а с центром О. Пусть
f(*f у, *)Ч* + ^ + (г-*а)Т*
есть обратная величина евклидова расстояния между точками
(Ху у у z) и (0,0, Zq) . И пусть Zq > а. Вычислим
Е
Имеем
2—+а
/ - J J J / (Ху у у z) dx dy dz.
i = Г <& f f d**y
J J J K^ + ^ + ^-Zo)1 '
z=*—a Ez
где £z есть круг радиуса Y<z2 — z2. Произведем в двойном
интеграле замену переменных х = rgos0, у = г sin0. Получим
е-2я Vtf-z*
Я dxdy = Г ^Q Г /"^
Е Vx> + y* + (z-z0y eJ0 Jo Уг» + (*-
*o)2
Ka*-22
0
+a
= 2я J ((a»-220 + ^-(^-2))rfz.
486
КНИГА III. АНАЛИЗ
Примитивная функции (а2 — 2z0z + zffi равна
Отсюда после упрощений получаем / = 4яа2/3г0.
Замена переменных. Пусть <$ есть множество точек
(и, vy w) из R3, а ф — отображение & в /?3, переводящее & в Е.
Предположим, что ф взаимно однозначно, взаимно непрерывно
и производные от х, у, г по и, v, w непрерывны; допустим, что
определитель
D (х, у, z) =
D (ut v, w)
дх
ди
ду
ди
dz
ди
дх
dv
ду
dv
dz
dv
дх
dw
dy_
dw
dz
dw
не обращается на <S в нуль. Этот определитель называется
якобианом, или функциональным определителем функций х, уу z
по отношению к и, v, w.
При этих условиях для непрерывной функции / имеем
////(*, У, z)dxdydz=jjJF{u, v9 w)\^x>y>z)
Е %
D (и, v, w)
du dv dwy
где F(u, v, w) = f(x(uy v, w), y(u,v,w), z(u,v,w)). Можно
также ввести обозначение dx f\dy f\ dz, условившись, что
(а,Ь,с)-+а Л ft Л с линейна по а, по 6, по с и знакопеременна,
т. е. если два элемента из трех элементов а, Ь, с равны, то
а Л b Л с = 0.
КНИГА IV
МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
ГЛАВА I
ЛОКАЛЬНОЕ ИССЛЕДОВАНИЕ ЧИСЛОВЫХ ФУНКЦИЙ
Предмет изучения этой главы будет вначале
продемонстрирован на примере. Рассмотрим функцию /:
fM** x-2x* #
Эта формула определяет / только в том случае, если
л- — 2хг ф О, т. е. если х Ф О, хФ—~ , х Ф —-=•. Когда х
стремится к нулю,
г / \ 1 1 + 2х
стремится к бесконечности; именно, Нт/(д:)= +оо, если х
стремится к нулю справа, т. е. по значениям, большим нуля, и
limf(x) = —оо, если х стремится к нулю слева.
Рассмотрим теперь
для достаточно малых #>0. Как уже известно, f(x) стремится
к +оо, когда х стремится к нулю. Но
\+2х
xf (х):
1 — 2л:2
стремится к единице, когда х стремится к нулю. Или, что то же,
f(x) /х~* стремится к 1, что является дополнительным уточнением.
Далее, для х Ф О, х ф —^} хФ —-= имеем
1{Х) х 1-2x2-
Следовательно, lim (/(#) — (I/*)) = 2. Этот результат снова
^олее точен, чем предыдущие. И еще: можно показать, что для
достаточно малых х
f(x) = ± + 2 + 2x + 4x2 + e(x)x\
488 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
где г(х) стремится к нулю вместе с х. Анализ этого примера
приведет нас к общим элементарным понятиям, следующим
ниже. Положим
ф-! (X) = -, ф0 (*) = 1, ф1 (*) = X, ф2 (*) = X2.
Эти функции определены и не обращаются тождественно в нуль
на интервале с левым концом 0.
Полученные результаты означают, что:
Г /(л;)/ф-1(л;) ограничена, когда х стремится к нулю;
2° f(x)/q>-.\(x) стремится к единице, когда х стремится
к нулю;
3° если t</, то ф;(лО/фгМ стремится к нулю, когда х
стремится к нулю;
4° г{х)х21щ(х) стремится к нулю, когда х стремится к
нулю.
1° ведет к первому понятию сравнения двух функций,
которое будет представлено символом О;
2° ведет к понятию локально эквивалентных функций;
3° дает второе понятие сравнения, обозначаемое символом о;
2° дает также понятие главной части;
3° дает также понятие эталонов сравнения;
4° дает идею порядка приближения функции / функцией
j + 2-|-2* + 4a;2.
В предыдущем примере можно для х Ф 0 составить
отношение / (х) /ф_1 (а:) . Но, вообще говоря, это невозможно, кроме как
при дополнительных предположениях, усложняющих задачу.
Так, когда х стремится к бесконечности, то нельзя утверждать,
что | sin2 лг/sin л:| ограничено, т. е. что | sin2 jc/sin #|^ 1 при
х ^ X, ибо для х = kn (k — целое) отношение sin2A:/sinA: не
определено. Поэтому мы, чтобы не составлять отношений, будем
писать |sin2A;|-< 1 • [sin x\.
Функции, с которыми мы будем иметь дело, будут
действительными функциями одного действительного переменного #.
На протяжении всей этой главы через Хо будет обозначаться
действительное число, конечное или нет, т. е. либо конечное
действительное число, либо +оо, либо —оо.
Рассмотрим семейство &~ числовых функций,
удовлетворяющее одному из следующих условий:
Г Какова бы ни была функция /е^", существует
содержащий Хо интервал, на котором / определена, кроме, быть может,
точки х0.
2° Какова бы ни была функция / е &~, существует интервал,
имеющий концом Хо и такой, что на нем / определена, причем х0
ГЛ. I. ЛОКАЛЬНОЕ ИССЛЕДОВАНИЕ ЧИСЛОВЫХ ФУНКЦИЙ 489
есть конец, находящийся с одной и той же стороны для всех
интервалов относительно всех функций из &~.
Если, например, лг0=+оо, то ЗГ состоит из функций f,
которые определены для любого л->а; при этом конечное
число а в зависимости от / может меняться.
Примеры. Г Семейство 2Г составлено из многочленов
от х, a xq e R.
2° Семейство У образовано всеми функциями /,
определенными для х > О, как / (а:) = ха (a6i?),ax0 = 0.
3° х0= +оо, а ЗГ состоит из функций, определенных либо
как f(x) = xa (aEi?), либо /(х)=ах (а>0), либо как f(x) =
= (lnx)P (Р€=Д).
Ниже мы изучаем функции из У в окрестности точки х0\
здесь термин окрестность должен пониматься в более широком
смысле, чем ранее, ибо это уже не обязательно множество,
содержащее интервал, который содержит х0.
§ 1. Сравнение функций. Символы Ландау
Условия. Пусть Xq — заданная точка из Л. И пусть К есть
семейство интервалов X, У, Z, ..., которые либо все
содержат *о, либо все имеют х0 в качестве общего конца. Тогда,
если X и УеК,то^иУи1ПКЕК,а если X g= К и Z cz X,
то ZgK. Функции f, g, h, ... суть функции, образующие
множество ЗГ. Для любой функции f еЗГ существует ХеК, на
котором она определена; л: означает точку из X, f(x)—значение
функции /. Пусть g— другая функция из ЯГ, a FeR —
соответствующий ей интервал.
Если существуют ZczXHY^Ku конечная постоянная Х>0,
обладающие тем свойством, что для любого х е Z имеет
место \g(x)\^h\f(x)\, то будем писать
g = 0(f).
Если для любого е > 0 существует такое Z cz X Л Y е К, что
для любого x^Z имеет место |g(х) | ^ е|f (x) |, то б*/деж
«Г-o(f).
Символы О и о называются символами Ландау.
Свойства. 1° Пусть f,g,h,k, ... <=&~; g = 0(f) и h = 0(g)^
=фй = 0(/).
Действительно, найдется такой интервал Z е К, на котором
| g (х) К К | f (лг) I и | h {х) | < \i | g (х) | одновременно. Отсюда
|AWK^|/W|.
490 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
2° Если h = О(/) и & = О (g), то на Z€ К имеем | h(x) |<;
<Л|/(*)|, |й(*)|<ц1г(*К откуда
|А(х)*М|<Лц!/(х)г(д?)|э
hk = 0{fg) или 0{f)0{g) = 0{fg).
3° Если а есть постоянная, то О (а/) = | а | О (/) = О (/), ибо
если
|g(*)KMa/(*)| (xeZeK),
то
. 1вГ(х)КА|а||/(х)|.
4° Если g = 0{f) и Л = 0(/), то существует такое ZgK„
что для xeZ
|gr(*)l<A,|/(*)|, |A(*)K|i|/(*)|.
Отсюда
|*(*) + A(*)K|*(*)| + |A(*)|<(* + |i)|/(x)|f
g + h-0{f).
Это соотношение записывается также в виде
0(f) + 0(f) = 0(f).
5° Если g = o(f) и A = o(gf), то на ZeK имеем |gr(*)|<C
<e|f(*)|, |A(x)|<e|g(*)|, откуда |А(*)|<в2|/(*)|, т. е.
h = o(f).
6° Если h=o(f), k=o(g), то на ZeK имеем \h(x) \ <e\f(x) g
и |А(*)|<в|£(х)|, откуда |А(*)*(*) |<e2|f(*) 1\g(х) |, или
AA-o(fe).
7° Если g = o{f), h = o(f), тона Ze К имеем | g(*) |<е| f (x) \»
|А(*)|<е|/(*)|, откуда \g(x) + h(x) |<2в|/(*) |, или
g + h = o(f).
8° Если g = 0(f), а А = о(/), то найдется такое ZeK, что
на Z имеем \g(x)\<%\f(x)\, \h(x) |< е|/(лг) |. Следовательно,.
|*(x)+A(*)|<(b + e)|/(x)|<|i|f(*)|, или
g + A = 0(/).
9° Если g = 0(f), а Л = o(g), то на некотором ZeK имеем
|£(*)|<Я|/(*)| и |A(x)|<e|*(x)|. Отсюда \h(x)\<Ke\f{x)\p
т. е.
Л = о(/).
ГЛ. I. ЛОКАЛЬНОЕ ИССЛЕДОВАНИЕ ЧИСЛОВЫХ ФУНКЦИИ 491
В итоге
0(f) + 0(f) = 0(f), o{f)o(f) = o(f),
0(f)0(g) = 0(fg), о (о if))-о {f),
0(0(f))=0(f), 0(/) + o(/) = 0(/),
o(f) + 6(f) = o(f), o(0(f)) = o(f),
0(o(f)) = o(/).
Важные замечания. 1° Пусть / есть функция из семейства &*.
Если /= 0(1), то найдется конечная постоянная к > 0 и такой
интервал ХеК, что для любого х^Х будет |/(д:) |<Я. Значит,
/ ограничена в окрестности точки х0 (термин окрестность
берется в расширенном смысле, указанном выше).
2° Если / = о(1), то для любого е > 0 найдется такое ХбК,
что если х^Х, то \f(x)\<e. Это, стало быть, означает, что
jf(x) стремится к нулю, когда х стремится к хо на X.
3° Если / и g — две функции из семейства SF и если
одновременно f = 0(g) и g = 0(f)', то найдутся такие числа Я, [i > О
м такой интервал X е К, что на X
\f(x)\<X\g(x)l |«f(*)K|*|f(*)|.
Значит, на некотором ZeK имеем
±\g(x)\<\f(x)\<\i\g(x)\
m
^\f(x)\<\g(x)\<ii\f(x)\.
Часто говорят, что отношения f/g и g/f ограничены, но это
выражение нуждается в уточнении, выраженном в следующем
замечании.
4° Пусть на некотором ХеК имеет место |f(*) |<A,|g(x) |.
Если для XiGl имеем g(#i) = 0, то /(#i) = 0. Стало быть,
.на X функция / обращается в нуль для тех же значений, что и g.
В частности, если f = 0(g) и g = 0(f), то / и g обращаются
а нуль для одних и тех же значний х, по крайней мере на
некотором интервале X е К. Может даже оказаться, что на
некотором интервале ХеК функция g имеет бесконечно много
нулей (пример: х0 = 0, g(x) = sin(l/x), нули х=\/пп).
Поэтому мы и не определяли отношения f = 0(g) или f = o(g)
щри помощи выражений «f/g ограничено, когда х стремится
к хо на X» или «f/g стремится к нулю, когда х стремится
к Хо на X».
Эквивалентные функции. Пусть f, gE^". Допустим, что g
хтрого положительна и f(x)/g(x) имеет предел 1, когда х
492 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
стремится к Хо на некотором интервале IgK. Тогда для
достаточно малого е и некоторого ZeR имеем
1-8<il-<1+8'
или
g(x)-eg(x)<f(x)<g(x) + eg(x),
- eg {x) <f(x)-g (x) < eg (х)у
т. е.
f-g = o(g).
Обратное очевидно.
В этом случае будем говорить, что fug эквивалентны
(подразумевая: когда х стремится к х0 на некотором интервале
X е К) и записывать f ~ g. Если же функция g не является
строго положительной, то мы говорим, что fug эквивалентны,
если f — g = o(g), т. е. когда для любого е >0 найдется
некоторый интервал ХеК, на котором \f(x) — g(x)\<e\g(x)\.
Тогда выводим
ll/l-l«fll<lf-*l<e|ff|f
-e|ff|<|f|-|*l<e|ff|f
(1-в)1вг|<т<(1+в)|вг|.
\g\<jzr^\fl
g=0(f)y f = 0(g).
Так как о(0(f)) = о(/), то из f — g = o(g) выводим, что
/ — g = o(f). Следовательно, отношение, связывающее функции
/, gy hy ... из ST и определенное как f — g = o(g), есть
отношение эквивалентности.
Действительно, для f = g оно выполняется. А поскольку
f-g^o(g) влечет f — g = o(f), то g — / = о(/); 'значит, это
отношение симметрично. Кроме того, если / — g = o(g), g — h =
= o(h)y то, в силу того, что при этом g = 0(h), имеем f — g =
=■• o(h)y g — h = o(h), откуда
f — h = o(h).
Очевидно, что если / — g = o(f) = o(g)y то на некотором
интервале X ^ К функции fug обращаются в нуль для одних и
тех же значений х. Если рассматривать функцию ф,
определенную как <р(х) = f(x)/g(x)y если /(.*)=£ О, и ф(х) = 1, если /(*) =
= g(x) = 0» то f — g = o(f) означает, что ф стремится к единице,
когда .v стремится к х0.
Отсюда
т. е.
ГЛ. I. ЛОКАЛЬНОЕ ИССЛЕДОВАНИЕ ЧИСЛОВЫХ ФУНКЦИЙ 493
Иногда говорят (что, однако, некорректно в случае, если /
может обращаться в нуль), что отношение f(x)/g(x) стремился
к единице, когда х стремится к *о.
Примеры. Г Пусть х0 = О,
f{x) = apxP + ap+lxP+l+ ... +апхп,
g(x) = bqxq + ... +Ьтхт,
так что fug — полиномиальные функции (р У> 0 — це.юе,
<7>0 — целое). Если ар и Ьр отличны от нуля, то найдется
содержащий х0 интервал X, на котором
|/(*)|<| вр*'|(1+e)f \g(x)\<\bqx«\(l+e)y
ибо
aD+l an ba+l bm
-~^-x+ ... +-?x"-p и -ТГ-Х+ ... + — xm~"
ap ap Oq Oq
стремятся к нулю вместе с х. Значит, / = 0(*р), g = 0(х<*).
Отсюда fgz=0(xP+4). Если p<q, то из равенств x<i = хч-vx* =
= о(хр) заключаем, что f + g = 0(х?) + o(xp)= O(xv). С
другой стороны, записывая
f(x) = apxp(l + q>(*)),
где
Ч>(Х) = ^—Х+ .-• +—а i
Up Up
видим, что если х принадлежит достаточно малому интервалу
X, содержащему нуль, то \f(x)\p-\apxv\(l— г). Следовательно,
\архр\ = 0(f), или х*> = 0(f).
Теперь допустим, что р = q и ар = bQf т. е.
/ (х) = архр + ap+lxp+l + ... + апхп,
g(x)=-apxf) + bp^lxP+l+ ... +bmxm.
Имеем
f(x)-g(x) = (ap+l-bp+l)xr+i+ ... =0(х*+>).
А так как хр = 0(f), то
f-g=--0(xp^) = o(xp) = o(f).
Стало быть, fug эквивалентны (в окрестности х — 0). Короче
говоря,
f(x)
8М
архр + ар+ххр+х + .
архР + Ьр+хХ?*1* .
.. +апхп
.. +bmxm
1 , ap+1
1 Н * + ...
ар
bp+i
1+ ——х+ ...
dp
и отношение f(x)/g(x) стремится к единице, когда х стремится
к нулю.
494 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
2° Пусть #o = +оо, а У — семейство функций х —*ха,
каждая из которых определена, начиная с некоторого значения ху
т. е. на полупрямой. Известно, что если а>0, то lim л:а= + оо;
* = + оо
если а<0, то lim #a=0. Возьмем теперь две функции из #",
соответствующие аир. Так как ха = ха-$х$у то ясно, что:
если а < р, то ха = о(х^);
если а > р, то л;Р = о(ха).
£с/ш функции не обращаются в нуль, то для такого
исследования составляется их отношение-, так, для х Ф 0 запишем
ха/х$ _. ^а-^ если а > р, и **/*& = 1/л;Р-а, если р > а, что
позволяет сразу же получить сделанное выше заключение.
3° Пусть х0 = +оо, /(а:) = sin x, g(x) = sin2*. Имеем
|g(*)|<|/(*) |, ибо |sinA:|<l. Значит, g = 0(f). Тогда
выражение, что g/f ограничено, когда х стремится к +оо, незаконно,
ибо отношение g(x)/f(x) определено только для хФпл.
Замена переменного. Пусть, например, К есть семейство
интервалов Ху имеющих левым концом x0i причем Хо конечно или
равно —оо. И пусть x = q>(t) есть непрерывная функция,
определенная на интервале Т с концом to (конечным или нет) и
такая, что если t стремится к /0, то х стремится к х0. Например,
х = хо + (l/t) (х0 е /?) переводит любой интервал, имеющий
правым концом' +оо, в интервал, имеющий левым концом х0\
х = tsin2(l/t) переводит любой интервал с правым концом
/ = 0в интервал с правым концом х = 0 и т. д.
Если X есть интервал из семейства К, то можно найти
такой интервал Т, что у(Т)с:Х. Мы ограничимся этими простыми
случаями. Если существует такое конечное Я > 0, что \f(x)\<
<k\g(x)\ на некотором ХеК, то можно найти интервал Г,
на котором |/(ф(/)) | <М#(ф(0) I- Следовательно, /°ф =
= 0(£оф), если / = 0(g).
Если для любого е > 0 можно найти интервал ХеК, на
котором \f(x) | < e\g(x) |, то можно найти такой интервал Г, что
на Т имеет место |/(ф(/)) | < е|#(ф(0) |, т. е. / °ф = о(#оф),
если f = o(g).
Эти замечания, в частности, позволят в многочисленных
случаях заменить поиск разложения функции в окрестности 0
разложением в окрестности +оо и обратно.
§ 2. Сравнение последовательностей
Результаты предыдущего параграфа применимы к
последовательностям. В самом деле, последовательность есть
отображение множества N в /?, т. е. функция, у которой переменным
является натуральное я, а значением — действительное число.
Здесь xq= +оо, а X есть множество натуральных п, превосхо-
ГЛ. I. ЛОКАЛЬНОЕ ИССЛЕДОВАНИЕ ЧИСЛОВЫХ ФУНКЦИЙ 495
дящих некоторое заданное натуральное число; следовательно,
К есть множество дополнений конечных подмножеств из N.
Если (хп), {Уп) — две последовательности действительных чисел
и если, начиная с некоторого значения п, для любого п имеем
|#п|<М*п|, где ^ — конечное положительное, то будем писать
Уп = 0(хп).
Если для любого е>0 найдется такое п0, что для п^п0
имеем | уп \ < г \ хп |, то будем писать уп = о (хп).
Предоставляем читателю установить и сформулировать
заново все результаты предыдущего параграфа, заменяя в них к
на п, f(x) на (хп), g(x) на уп и т. д.
§ 3. Эталоны сравнения
Пример, приведенный в начале этой главы, дает возможность
ввести в простом случае эталоны сравнения. Пусть х0 — точка
из R, Ф — семейство числовых функций ф, каждая из которых
определена на интервале, имеющем в качестве конца Xq,
притом для всех функций ф с одной и той же стороны (если
Хо = +оо, то это правый конец, если Хо = —оо, то левый), и не
обращается тождественно в нуль ни на каком из этих
интервалов. Предположим, что множество Ф функций ф счетно (но
это условие может быть заменено более общим: см. замечание
ниже). Тогда всякий элемент из Ф можно обозначить через фг-,
где индекс i пробегает множество Z целых чисел.
Допустим, что множество Ф удовлетворяет' одному из
следующих условий:
либо, каково бы ни было i < /, ф^ = о(фг), i
либо, каково бы ни было i < /, фг- = о(ф^).
Первое условие выполняется, например, в случае фг-(#) = #*
и х0 = 0 или фг(л0=1/л:г' и *о=+°о. Второе условие
выполняется, например, в случае фг-(#) = #* и х0 = +оо или фг(л;) =
= l/х* и Хо = 0.
Мы будем предполагать, что, каково бы ни было i < /, ф;- =
= o((Pi)> причем i и j принимают все целые значения,
положительные, отрицательные и нуль. Функции фг- суть эталоны
сравнения.
Пример. Пусть а:0= +оо, а функции фг определены для
х > 0 следующим образом. Если /<^0 — целое, то фг(#) = лт*г;
если i\> 1, то <р{(х)=*({1пх)1х){. Если i</<0, то Ф> = о(фг);
если 1 <л < /', то фг = o(q>j), ибо
Ф/(х) /1п*у-'
ф. (X) \ X J
стремится к нулю, когда х стремится к +оо.
496 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Замечание. Предположение о счетности семейства
функций Ф не является необходимым. Достаточно предположить, что
индексы I принимают свои значения в упорядоченном
множестве и что если i < /, то ф^ == о(фг). Можно было бы даже
предположить, что каждая функция феФ снабжена несколькими
индексами, составляющими упорядоченное множество.
§ 4. Асимптотические разложения
Пусть Ф — семейство эталонов сравнения (см. предыдущий
параграф). Предположим, что функция f определена на
интервале с концом х0, который для всех функций ф^еФ является
общим концом и лежит с той же стороны.
Будем говорить, что f обладает разложением порядка п
относительно эталонов q>i, если на интервале с концом хо имеем
f(x) = aiq>i(x) + ai+iq>i+l(x)+ ... + апуп (х) + о («ft,).
^akcpk называется главной частью разложения функции /. Бу-
дем писать
п
f = 2 4Vk + о (ф„).
i
Мы сформулируем простейшие свойства этих разложений,
а в следующем параграфе изучим операции над этими
разложениями. Прежде всего отметим, что такое изучение
предполагает выбор эталонов сравнения, что функция / может обладать
разложением относительно одного семейства эталонов и не
обладать относительно другого.
Единственность. Так как i<j влечет Ф; = о(фг), то f(x) =
= anpi'ix) + о(фг), или f — агфг = о(фг). Следовательно, f ~ а*ф<#
Утверждается, что если в Ф существует такая функция ф^ и
такое число #j, что / ~ afflj, то непременно на некотором
интервале X будет фг = ф; и а\ = а,- (предполагается, очевидно,
а{Ф0, цФО).
Действительно, отношение ~ есть отношение
эквивалентности, и afflj ~ а^фг. Стало быть (в силу § 2), ягфг == 0(a^j) и
а№э = 0(агфг). Если а\, ФО и а^ ФО, то фг- = О(ф^) и ф^ = 0(фг).
Но если 1Фи то ли^о фг = o((pj)y либо ф^- = о(фг); если бы,
например, фг = о(ф^), то мы имели бы ф; = 0(фг) = о(ф^), что
невозможно. Значит, / = /.
Покажем, наконец, что если а.ф. — а^, то at = a'r В самом
деле, по определению эквивалентности имеем (at — а^Ф,- = о (ф^,
т. е. существует такое X, что для любого х е X
К-<||ф*(*)|<в|ф,(*)|.
ГЛ. I. ЛОКАЛЬНОЕ ИССЛЕДОВАНИЕ ЧИСЛОВЫХ ФУНКЦИИ 497
А поскольку фг- не обращается тождественно в нуль ни на
каком Ху то а. = а!{.
Теперь покажем, что если f имеет разложение порядка м,
то главная часть единственна. Прежде всего заметим, что если /
имеет разложение n-го порядка, то / имеет разложение любого
порядка р, iKp^Cn. Действительно, фп = o(cpn_i), фп-1 =
= о(фп_2); значит, фп = о(фп_2) и т. д., откуда
п
2 я*Ф* = о (фр).
P+I
Индекс i представляет собой наименьший из индексов
функций фг, при котором коэффициент а% ф 0. Для главной части
можно проще записать 2 ЯлФь считая аи = 0 для k < £.
Если g— функция, обладающая разложением порядка п, то
g = 2 bkq>k + o(q>n) и f + g = S (ak + bk)q>k + o{q>n).
Наконец, если Я — постоянная, то Xf = 2 а^Ук + ° (ф«)-
Чтобы показать, что для функции /, обладающей
разложением порядка п, главная часть единственна, достаточно
доказать, что нулевая функция обладает разложением я-го порядка,
главная часть которого имеет все коэффициенты а& равными
нулю. Итак, допустим, что
0 - а,<р, + а£+1<р,+| + ... + ап<рп + о (<рп) (а, ф 0).
Тогда
- a^i = at+1ф;+1 + ... + anq>n + о (ф„) = о (%),
что невозможно. Значит, щ = 0.
На этом мы заканчиваем теоретическое изложение, и в
дальнейшем будем ограничиваться изучением разложений
относительно эталонов фг(*) = х* (I—целое).
§ 5. Основные разложения. Свойства
Мы рассматриваем эталоны вида xk, где k — целое
положительное, отрицательное или нуль, а точка х0, в окрестности
которой берутся разложения, есть 0, +оо или —оо; если же х0
конечно и отлично от нуля, то мы выбираем эталоны (х — x0)k.
Будем предполагать, что Хо = 0. Если / определена в
окрестности 0 (возможно, только с одной стороны), то будем говорить,-
что / имеет разложение п-то порядка, если на интервале,
содержащем 0 (или имеющем 0 в качестве конца), имеет место
f(x) = apxP + ap+[xp+l+ ... + апхп + о(хп);
498 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
здесь р — целое число, которое может быть и отрицательным,
ар — первый отличный от нуля коэффициент.
1. Главная часть avxv + ... + апхп единственна (см. § 4).
2. Если х стремится к нулю, то f(x)/apxP стремится к
единице. Могут представиться два случая:
а) Если р — целое неотрицательное, то f(x) (которая не
обязательно определена для х = 0) имеет конечный предел,
когда х стремится к нулю; этот предел равен нулю при р > 0
и а0 при р = 0.
б) Если р — целое отрицательное, то f(x) стремится к
бесконечности, когда х стремится к нулю; знак бесконечности,
к которой стремится f(x), определяется знаком ар, четностью р
и знаком х,
3. Если f имеет разложение я-го порядка, то / имеет и
разложение порядка п' <п. В самом деле, достаточно записать
главную часть в виде 2 akxkf условившись, что ah = 0, если
к<р.
4. Если g имеет в окрестности 0 разложение порядка п' и
если пг — наименьшее из п и п', то
fix)- 2 акхк + о(хп)= 2 akxk + o(xm),
g(x)= 2 М* +о (*»')- 2 М* +о (*"»).
k < n' k < m
Отсюда
jf (*) + *(*)- S (ak + bk)xk + o(xm).
Л< m
5. Произведение. Пусть
f(x) = aPxp+ ... + аЛ*Л + о (*Л),
g(*HM'+ ••• +Ьп>хп' + о{хп'\
где предполагается арф0, ЬдФ0 (р^Сп, q^Cn),
Пусть m — наименьшее из целых чисел р + п'у q + n
(которое может быть и отрицательным); значит, m = min(p + п'у
q + n), т</? + /г', m*Cq + n. Так как р</г, то р + п' <
^ п + м'; а так как q^Cn', то </+ я^я + я', и стало быть,
в частности, m<n + /г'. Тогда
/ м «г м - (i ****) (Д ****)+° (^)-
Возьмем теперь члены akak>xk+k\ у которых & + &'<т;
для всех других членов akbk'Xk+*, т. е. таких, что k + k'>m9
имеем xk+k' = о (хт) в окрестности точки л; = 0. Отсюда
/(*)«(*)- 2 a^x^+o(jc-).
ГЛ. I. ЛОКАЛЬНОЕ ИССЛЕДОВАНИЕ ЧИСЛОВЫХ ФУНКЦИЙ 499
Никакой трудности не представляет распространить этот
результат на произведение конечного числа разложений и, в
частности, на степени функции /.
6. Композиция разложений. Если fug имеют
разложения, то чтобы узнать, имеет ли разложение сложная
функция go/, мы вынуждены сделать более ограничительные
предположения, чем предыдущие. Предполагаем, что:
Г f(x) стремится к нулю, когда х стремится к нулю и имеет
разложение п-го порядка;
2° g есть функция, определенная на открытом интервале,
содержащем О, и обладающая разложением порядка т.
Первое условие влечет, что для любого х, принадлежащего
некоторому интервалу (который содержит нуль или имеет его
только в качестве левого либо правого конца),
f(x) = apxP + ap+lxf>+l+ ... + апхп + о(хп)9
где 1 ^ р ^ п. Т. е. р — натуральное число.
Второе условие влечет, что
g(t) = b0 + blt+ ... +bmtm + o(tm).
o(tm) есть значение при / функции ф, обладающей тем
свойством, что существует содержащий 0 интервал, на котором
|ф(0| <е|/|т. Но на интервале значений х для любого Х>0
имеем |/(#) | < д| х |Л Значит, на этом интервале
\q>(f(x))\<e\f(x)\m<eX\xr = o(xpm)-
Следовательно,
«(/W) = »o + MvP+ ••• +<*п*? + о(хп))+ ...
... +Ьт(архр+ ... +о(хп))т + о(хрт).
Пусть bq — первый отличный от нуля коэффициент. Применяя
k раз предыдущий результат (п. 5. Произведение), получаем
для (архР+ ... + anxn + o(xn))k разложение порядка {k—l)p +
+ п. Стало быть, для bqfQ + ... + bmfm получаем разложение
порядка ц, где \х = nt если q = 0, и \i = (q — \)p + п, если q^-1.
Итак,
g (/ (х)) = щх™ + а^™*1 + ... + а^х» + о (х*) + о (*"").
Формулировка окончательного результата зависит от
соотношения между числами (i и рт.
Если bo Ф 0 и если п ^рт, то имеем для g of разложение
порядка п, т. е. того же порядка, что и для /.
Если ЬоФО и если рт<п, то имеем для gof разложение
порядка рт.
Если Ь9 = Ь\ — ... =■ bq-\ = 0, ЬяФ0 (q^l) и если
(q — 1)р + п^рт, то имеем для gof разложение порядка
500 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
(q—\)р + п, которое является разложением и для bqf <* + ...
... + bJm.
Если b0 = fei = ... = bq-i = 0, ЬЯФ0 (q>l) и если pm <
<(q— \)p + п, то имеем для gof разложение порядка pm.
Примеры. Г В окрестности точки х = 0 имеем, по
формуле Тейлора,
Ях)-1п(1+х)-х-^ + ^--£ + о{&).
f(x) стремится к нулю, когда х стремится к нулю.
Точно так же
g(t) = sint = t--^ + o(t*).
Рассмотрим gof. Имеем
g(f(x))-(x-£ + ^—£+o(x*))-
Здесь о(/3) = о(х*), р = 1, я = 4, q= 1, от = 3, (q— 1)р + п = 4,
pm = 3.
Можно получить разложение лишь 3-го порядка, на что
указывает тот факт, что o(f3) — о(х3). При вычислении все члены
с xv, где v>4, следует заменить на о(х3). Итак,
g(f(x)) = x-^ + ^-^ + o(x\
sin (In (1+*)) = *-4+1Г +° (*3>-
2° f(x) = sm2x = x2-^j+o(x4),
g{x) = et = l+t+-^ + ^+o(fi).
Здесь р = 2, п = 4, <? = 0, от = 3, \х = п = 4, рот = 6. Можно
получить для gof разложение 4-го порядка. Имеем
g(f(x)) = l+x2-^-+o(x<) + ±(x2-^- + o(x<)f +
+т (х* - 4+ °(*4))3+° (sin6 *>•
Следует сохранить лишь члены с xv для v ^ 4, на что
указывает первое о(х4). Получаем
ГЛ. I. ЛОКАЛЬНОЕ ИССЛЕДОВАНИЕ ЧИСЛОВЫХ ФУНКЦИЙ 50 Г
§ 6. Обобщения. Различные замечания
Г Если точка, в окрестности которой ищется разложение,,
есть х0ФО или xq = —оо, или х0 = +оо, то можно сначала
сделать замену переменного / = х — х0 или / = l/х. А затем в
полученном результате вернуться к переменному х с помощью замены
X = Хо + t ИЛИ X = l/t.
Пример. Рассмотрим в окрестности +оо функцию / со
значениями
Найдем разложение 3-го порядка относительно эталонов хп+
Положим х = 1//. Приходим к выражению
/(т) = -Т^Т = е'--ьЬ = (1+^|- + |- + 0^)(1+^ + ^ +
+ t3 + o(t3)) = l+2t+^t2 + -¥-t* + o(t%
Отсюда
2° Рассмотрим функцию /, определенную в окрестности
точки х = 0 (справа, слева или по обе стороны) и такую, что*
lim|/(x)|= +oo (ср. пример в начале этой главы). Во многих
*->о
встречающихся случаях существует такое а > О, что xaf(x}
имеет конечный предел, когда х стремится к нулю. Тогда
пытаются найти разложение функции g вида g(x) = xaf(x) в
окрестности точки х = 0. Если мы получим разложение g(x) = a0+]
,+ а{х + а2х2 + ... + апхп + о(хп), то сможем написать
/М-^- + ^Г+ ... +апх«-* + о{хп-%
Пример. Пусть функция ф дифференцируема на
интервале, содержащем 0, вплоть до я-го порядка, и q—1 первых,
производных при х = О обращается в нуль. Найдем разложение
для 1/ф. Имеем
q>(x) = agx<* + aq+lxc*+l+ ... + апхп + о (хп) (ад Ф О, q>\).
Пусть f = 1/ф определена для х ФО. Очевидно, что Jim xqf(x) =
= аг Для того чтобы получить разложение функции / = 1/ф,
запишем ф следующим образом:
<р(х) = адхд(1+${х)), где ty(x) = -~x + ... + ^-хп~4+ о(хп~«)-
аа аа
502 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
тогда
йдХ 1 + "ф (X)
Так как Нт-ф(л:) = 0, то применяем предыдущие результаты
х->0
к функции 1/(1 + я|)(л')), рассматриваемой как суперпозиция
{композиция) гр(л:) на g(t) = 1/(1 + t). Так, пусть
Но
/ ч ,9 1 — cos 2л: 1 1 п
ф (х) = sinJ х = 5 ^ Т ~~ "5" cos
cos л: = 1 + 0* - ~- + О*3 + -^ + О*5 + о (х5),
Тогда
2 - — - 24
cos 2х = 1 - 2л:2 + J- л:4 + о (*5),
1 - cos 2л: = 2*2 - J- л;4 + о (х5),
y(l~cos2x) = x2(l-^ + 0^5))- *
sirrx
'-(т-+0Н'
\~3~ ^ 7
sin2 л: jc2 ' 3 ' v '
3° Предыдущие методы распространяются на случай, когда
ищется разложение относительно эталонов jc06, где а —
действительное, не обязательно целое число (л: должно предполагаться
положительным).
Пример. Пусть х > 0 и для х, близких к нулю,
/(*) = 1п(1 +У~х).
Если положить Yx = t, то приходим к разложению
1п(1+0 = *-у+-у+°(/3>-
Отсюда
3/2
fW-Vx-^ + ^ + oixW)
(х > 0 близко к нулю).
4° Предыдущие методы применимы и в том случае, когда
ищется разложение относительно эталонов лса(1пл;)Р в
окрестности точки х0 (необходимо рассматривать только те значения
х, а, р, для которых ха(\пх)& имеет смысл).
ГЛ. I. ЛОКАЛЬНОЕ ИССЛЕДОВАНИЕ ЧИСЛОВЫХ ФУНКЦИЙ 503
Пусть, например, #о=+оо; поскольку мы считаем, что х
достаточно велико, то мы можем задавать для а, р любые
действительные значения. Чтобы показать, что функции л;а(1пл:)&
образуют семейство эталонов, докажем, что ха(1пл:)р =
= o(xa'(ln xf) для а < а' и любых р, р', или а = а', р < р'.
Имеем
лг (lnx)p
и
lim ф(а:) = 0, или lim (1/ф(л;)) = + оо.
Если а = а' и р < р', то этот результат вытекает из свойств
функции In а:. Если a < а', то он выводится из полученного
ранее результата (гл. II, разд. VI, конец § 6). В самом деле, мы
показали, что
ех
lim —у = + оо (у ;> 0),
*_>+«> х'
причем для у < 0 это свойство очевидно. Заменяя х на \пх,
а у на —у (действительное), получаем
lim а:(1па:)'~у= + оо, или lim (In xfjx = 0.
Если б > 0, то
lim (!££)!.= lim iil£^f=0,
что и доказывает наше утверждение.
Если Хо = 0, то снова получаем эталоны для х > 0, близких
к нулю, задавая а действительные значения, а р — целые
значения (ибо ln#<0); этот результат может быть получен из
предыдущего заменой х на 1/х.
Пример. Пусть /(*) = (1 +(1/*))-* (х>0 близко к нулю).
Пусть
ФМ = *1п(1 + -±-)> / (*)«*»<*>,
Ф (х) = — х In х + х In (1 + х) = — х In л: + х (х — ^+о (#2)) =
л:3
= - Х\П X + X2 - -£- + о(Х%
еа=1+и + £ + о(и2).
;504 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Но о(ф2) = о(л;2(1пл;)2). Отсюда
+ у (- хInх + х2 - ^" + ° И)2 + ° (*2 (1п *)2)-
Так как о(ф2) = о(х2(Inл:)2), то мы получим разложение,
остаточный член в котором будет равен о(х2(\пх)2).
Следовательно,
4Hx)=l-xlllX + X2 + 0 (X2 (1П X)2) + у (X2 (1П xf) +
+ о (x2(lnx)2) + о(х2(\пх)2) =
= l-xlnx + x2 + jx2(mx)2+o(x2(\nx)2).
Отсюда, для х>0, близких к нулю, имеем
(l + ^)* = 1 -х In х + х2 + ±х2 (In х)2 + о(х2 (In х)2).
5° Очевидно, что предыдущие результаты справедливы, если
ищется разложение для f(xn), где (хп)—последовательность,
стремящаяся, скажем, к нулю, когда п стремится к
бесконечности.
Так, пусть / есть р раз дифференцируемая функция на
открытом интервале, содержащем 0. Имеем
f {x) = aQ + ахх + а2х2 + ... + а?хр + о (хр).
Отсюда, например,
f(^) = a0 + al± + a2±+ ... + flp-^ + 0 (-^-),
В частности,
ибо In — = — Inn).
п )
Фтот метод будет использоваться при изучении рядов.
ГЛ. II. ИНТЕГРИРОВАНИЕ НА НЕКОМПАКТНОМ ИНТЕРВАЛЕ 505-
ГЛАВА II
ИНТЕГРИРОВАНИЕ НА НЕКОМПАКТНОМ ИНТЕРВАЛЕ
§ 1. Определения, сходимость, абсолютная сходимость
Определение 1. Компактным интервалом из R
называется ограниченный замкнутый интервал.
Определение 2. Пусть I = [а, Ь[ — интервал числовой
прямой R, один конец которого а ему принадлежит, а другой Ь не-
принадлежит, причем Ь может быть равно +оо.
Пусть функция f определена на [а,Ь[ и является ярусной
на любом интервале [а, Ь'], содержащемся в [а, Ь[.
Если lim Г f(t)dt сушествует и конечен, то этот предел
а
обозначается символом \ f(t)dt, если Ь конечно, и \ f(t)dtr
а а
если Ъ = + оо.
В этом случае говорят, что f интегрируема на I, а предел
Ь'
J / (/) dt при У у стремящемся к Ь9 называется интегралом функ-
ь
ции f на I.
ь
Если 1 = ]а, Ь] и если lim \ f(t)dt (a<a'<b) существует и
ь
конечен, то будем его обозначать через J f (t) dt или, соответ-
а+0
ственно, \ f (t) dt.
— эо
Прежде всего разъясним это определение. В Книге III,
гл. IV мы определили интеграл от ярусной функции на
ограниченном замкнутом интервале [а, Ь\ Ярусная функция на [а, Ь)
есть равномерный предел ступенчатых функций на [а, Ь]. На
незамкнутом же интервале понятие ярусной функции не была
нами определено. На замкнутом интервале [а, Ь] непрерывная
ь
функция является ярусной, и символ J f(i)dt имеет смысл.
а
Однако часто встречаются простые примеры, не
удовлетворяющие этим требованиям, что приводит нас к необходимости
расширения понятия интеграла. Например интеграл функции,
определенной равенством f(x)= l/х2 (при х^ 1) и рассматриваемой
506 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
на [1, +оо[, или f(x) = l/Yx, рассматриваемой на ]0, 1]. Эти
два примера соответствуют: первый — случаю функции,
непрерывной на [1, +оо[ и ограниченной, второй — случаю функции,
непрерывной на ]0, 1] и неограниченной.
В приведенном общем определении предполагается, что f —
ярусная функция на любом ограниченном замкнутом интервале,
содержащемся в /, что позволяет вычислить ее интеграл на этом
ограниченном замкнутом интервале, а затем, следуя
естественному побуждению, пытаться «перейти к пределу».
Мы как раз предполагаем изучать этот переход к пределу
и свойства определенного здесь интеграла (который иногда
называют обобщенным интегралом), а также выяснить, обладает
ли он свойствами интегралов числовых функций, изучавшимися
в Книге III.
Определение 3. Если lim \ f(t)dt = \ f(t)dt суще-
Ъ' + Ъ J J
а а
Ь-0 + оо
ствуету то говорят, что интеграл \ f(t)dt или J f(t)dt cxo-
а а
дится или существует.
Отметим, что в этом определении мы уже называем инте-
Ь-0 +оо
гралом число J f(t)dt или Г f(t)dt.
а а
* Критерий Коши. Пусть f — ярусная функция на любом
Ь'
[а, У] с [а, Ь[. Ищем предел \ f(t)dtt когда Ь' стремится к й,
а
т. е. рассматриваем для а^х<Ь поведение функции
X
F{x)=\f(t)dt.
а
Функция F непрерывна. Следовательно, задача состоит в
отыскании критерия, позволяющего выяснить, имеет ли F(x)
предел, когда х стремится к Ь по значениям, меньшим Ь. Точно
ь
так же, если рассматривается ]a,b]t то F(x)= J f(t)dt и нужно
X
выяснить, существует ли предел F(x)y когда х стремится к а
справа.
Если при х, стремящемся к й, ^(л:) имеет (конечный)
предел Я, то при х и х\ одновременно стремящихся к й, F(x)^
— F(x') стремится к нулю.
Если b конечно, то это означает, что функция F(x) — F(x')
двух переменных стремится к нулю, когда \Ь — #| + |й—хг\
ГЛ. II. ИНТЕГРИРОВАНИЕ ЫА НЕКОМПАКТНОМ ИНТЕРВАЛЕ 507
стремится к нулю. Если Ъ = +оо, то это означает, что функция
F(x)— F(x') двух переменных стремится к нулю, когда х и хг
стремятся к +оо.
Докажем обратное утверждение, предположив, например,
что Ъ конечно. Если F(x)—F(x') стремится к нулю, когда х и х'
стремятся к by то, в частности,
,.':". И6-})-f(*-?))-0-
Значит, последовательность [F \Ь ) ) есть последователь-
ность Коши и, стало быть, сходится. Пусть X = lim F{b — l/n).
Л->оо
Если п > Р (е), то \F [b — ~J — А < 8. Отсюда
\Р{х)-К\<\р(х)-р[ь-±) + р[ь-±)-х\к
<\F{x)-F(b-±)\ + s.
Но по условию
\F(x)-F(x')\<e, если |&-*|<а, |&-*'|<а,
где а выбрано надлежащим образом. Теперь нужно найти
такое т|, что если \Ь — х\<ц, то \F(x)— Я| < 2е. Возьмем
п> Р, п> 1/а, ц = min(l/P, а) и \Ь — х\ < rj.- Так как п > Р,
то 1/п< 1/Р; так как п > 1/а, то 1/л<а; значит, 1/п<цу и
\b — (l/n)—b\<r\ <а. Следовательно, \F(x)— F(b — l/n) |< е
и \F(x)— Я|<2е, если \Ь — х\<г).
Этот результат есть не что иное, как критерий Коши
сходимости последовательности, в котором целые переменные /?, q
заменены на х, х'. Отсюда получаем
Критерий Коши. Пусть F — непрерывная функция на
интервале /, содержащем b или имеющем b концом. Для того чтобы
F(x) имела конечный предел, когда х стремится к b на этом
интервале /, необходимо и достаточно, чтобы
\im\F(x)-F(x')\ = 0 (xeeI, х'ееI).
х'+Ъ
В этой формулировке b есть конечное или бесконечное число.
Критерий сходимости интегралов. Применяя предыдущий
X
результат к F (х) = Г / (t) dt и замечая, что | F (х) — F (х/) | =
а
получаем следующий результат.
J f(t)dt
508 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
6-0
Для того чтобы существовал \ f (t) dt, необходимо и доста-
а
х'
точно, чтобы J f{t)dt стремился к нулю, когда х и х' стре-
х
мяте я к Ь.
Абсолютная сходимость. Предыдущее условие реализуется
в одном важном случае. Так как мы предположили f
интегрируемой на любом компактном интервале, содержащемся в [а, Ь [,
то, согласно одному из основных свойств интеграла по такому
интервалу, имеем
*' I *'
\ f(t)dt <J \f(t)\dt.
Отсюда выводим следующий достаточный признак.
&-о б-о
Теорема. Если \ \f(t)\dt сходится, то Г f(t)dt тоже схо~
а а
дится.
6-0
Определение. Если \ \f(t)\dt сходится, то говорят, что
б-о
интеграл \ f(t)dt абсолютно сходится.
а
х'
Если Г \f{t)\dt стремится к нулю, то это тем более так для
6-0
| f{f)dt, из чего мы и заключаем о сходимости Г f(t)dt.
* a
Эта теорема с ее очень простым доказательством является
весьма важной. Мы встретимся с ее многочисленными
приложениями.
6-0
Замечания. 1. Когда говорят, что J f(t)dt абсолютно
a
сходится, то здесь содержится и утверждение, что он сходится.
2. Если на [а, Ь[ функция / неотрицательна, то сходимость
6-0
интеграла J f(t)dt имеет место одновременно с абсолютной
а
сходимостью, ибо / = |/| на [а, 6[.
ГЛ. II. ИНТЕГРИРОВАНИЕ НА НЕКОМПАКТНОМ ИНТЕРВАЛЕ 509
3. Если /^0, то F(x)~\f{f)dt возрастает вместе с х
а
(а^.х<Ь). Тогда без труда показывается, что для того, чтобы
6-0
существовал \ f (t) dtt необходимо и достаточно, чтобы интегралы
Г f(t)dt были ограничены сверху.
Этот результат представляет собой аналог критерия
сходимости возрастающих ограниченных последовательностей.
6-0
Ясно, что если f^O и если | f(t)dt не является схо-
а
6-0
дящимся, то J f(t)dt=+ оо.
а
Ь
Если рассматривать /^0 на ]а9 Ь] (а<&), то F(x)=* | f(t)dt
х
Ь
убывает, когда х возрастает, ибо если х<х'<Ь, то Г f(t)dt =
X
х' Ь
-J f(t)dt+jf(t)dt, откуда
X X'
X'
F{x)-F{x') = \ f(t)dt>0,
или F(x) ^ F{x'), если х < л/. Значит, если х убывает к а, то F
возрастает. Стало быть, критерий остается тем же. Заметим, что
этот критерий можно применять и к /<10, заменив / на —f.
4. Подчеркнем разницу между обобщенным понятием
интеграла и тем, которое изучалось в Книге III.
ь-о
Интеграл J может сходиться без того, чтобы сходи-
а
мость была абсолютной. Иначе говоря, существуют такие
ярусные (и даже непрерывные) функции на любом компактном
интервале, содержащемся в [а, Ь [, что
6-0 х
Г /(*)#- lim [f{t)dt
5i a
КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
существует, а
J \f(t)\dt= + оо (Ь конечно или нет).
а
Можно придумать простой пример, основанный на том, что
ряд ^ — расходится, а ряд 2j —~^~~ сходится (см.
следующую главу). Вот схема построения такой функции / на ]0, 1]
Рис. 38.
(рис. 38). На каждом интервале [\/(п+ 1), \/п] функция /
изображается двумя сторонами равнобедренного треугольника с
основанием [\/(п + 1), 1/п] и с противоположной ему вершиной,
имеющей ординатой (—1)пп. Функция / непрерывна на ]0, 1J.
Тогда
j,w*.^(-,r,(i-^r)_fj=jf>
1/(л+1)
[
1/(01^=4 '
1/(л+1)
Из этого выводим, что
2 п+ 1 *
+0 1+0 1
Это замечание выявляет основное различие, которое
существует между рассматриваемыми интегралами и теми, которые
изучались в Книге III.
ГЛ. И. ИНТЕГРИРОВАНИЕ НА НЕКОМПАКТНОМ- ИНТЕРВАЛЕ 5П
5. Если f — ярусная (а значит, интегрируемая) функция на
[а, Ь\ то, очевидно,
ь-о ь ь
j f(t)dt= jf(t)dt = jf(t)dt.
а а+0 а
§ 2. Алгебраические свойства
Алгебраические свойства интегралов на некомпактном
интервале очевидны, но необходимо удостовериться в том, что
рассматриваемые функции определены на одном и том же
интервале [a, b [ и что их интегралы сходятся.
Пусть / есть ярусная функция на любом компактном
интервале, содержащемся в [a, b [; тогда это будет иметь место и
для а/ при любом аей.
6-0 х
Если Г f(t)dt= lim f f(t)dt существует, то, очевидно,
J x->b J
а а
6-0 Ь-0
• j af(t)dt = aj f{t)dt.
а а
Пусть f и g— две ярусные функции на любом компактном
интервале, содержащемся в [a, b [. Тогда f + g тоже такова.
6-0 6-0
Если J f(t)dt и j g(t)dt существуют, то
а а
х хх
Ит { {f{t) + g(t))dt = lim\f(t)dt + lim f g(t)dt9
х-> Ь J x->b J x->b J
a a a
и следовательно,
6-0 6-0 6-0
J" (f(t)+g(t))dt=j f(t)dt+j g(t)dt.
a a a
Таким образом, множество & функций f, ярусных на любом
содержащемся в [а,Ь[ компактном интервале и имеющих схо-
ь-о
дящиеся интегралы I / (/) dt, образует векторное простран-
а
ство над R.
6-9
Отображение f -> f f(f)dt пространства <$ в R есть ли-
а
нейная форма.
512 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
§ 3. Замена переменного
Пусть функция f определена на [а,Ь[ и непрерывна. И пусть
g есть такая примитивная непрерывной функции g' на
интервале [а, р[, что g([ay p[)c: [а, Ь[ (а, а —конечные
действительные числа). Согласно Книге III, гл. IV, разд. III, § 3 можно
написать, что, каково бы ни было / е [a, (J [,
\f{g{u))g'{u)du= \ f(u)du.
а в (а)
Но
£(')=/ g'(u)du + g{a).
а
0-0
Предположим, что \ f (g(и))g'(и)du существует, и что g(t)
а
имеет бесконечный предел g(p — 0), когда t стремится к р
(оставаясь на [а, р[). Тогда, очевидно,
Р-о жР-о)
J* fig(u))g?(u)du- J* f(u)du.
а g{a)
Стало быть, при изложенных условиях в интегралах на
некомпактном интервале можно производить замену переменного
(мы ограничимся случаем непрерывных функций). Итак, пусть /
ь-о
непрерывна на [а, Ь [ и \ f (t) dt существует. Пусть, далее,
а
[а, р[ — другой интервал из R\ а и а конечны, но р и Ь могут
быть как конечными, так и бесконечными. Можно найти
функцию g с непрерывной первой производной, осуществляющую
взаимно однозначное и взаимно непрерывное отображение
(гомеоморфизм, Книга III, гл. III, разд. III, § 2, и разд. VI) между
[а, Ь[ и [а, р[, причем g(a) = а, g(p — 0) = b — 0. Тогда ^>0 и
Ь-0 0-0
j* f(u)du=j f(g(u))g'(u)du.
а а
Ъ-0
Предположим, в частности, что J f(u)du абсолютно схо-
а
дится, т. е. существует Г \f (u)\du. Если g — такая непрерыв-
ГЛ. И. ИНТЕГРИРОВАНИЕ НА НЕКОМПАКТНОМ ИНТЕРВАЛЕ 513
пая строго возрастающая функция с непрерывной (и
неотрицательной) первой производной g\ что g([a, р[) = [а, 6[, то
Ь-0 0-0 р-о
/ \f(u)\du-j \f(g(u))\g'{u)du->j \f(g(u))g'(u)\du.
а а а
Следовательно, абсолютно сходящийся интеграл заменяется
абсолютно сходящимся интегралом. Короче, абсолютная сходи-
мость сохраняется.
Приведем несколько следствий и примеров.
а) Пусть f непрерывна на компактном интервале [а, Ь]. Тогда
Ь 0-0
jf(u)du=j f(g(u))g'(u)du (a<b, а<р).
При этом функция t-+f(g(t))g'(t) непрерывна на [а, р[, но не
обязательно на [а, р]. Здесь а, Ь, а, р конечны.
П р и^м е р. Пусть f(x) = 1 на [0, 1]. И пусть g (/) = ]/7, g'(t) =
- 1/21// на ]0, 1]. Имеем
i-L- г1 *
Таким образом, интеграл от непрерывной функции на [0, 1J
переходит в интеграл от неограниченной функции на ]0, 1].
б) Предположим, что a, b конечны, а конечно, р=+оо„
/ непрерывна на [а, b]y g(a) = а, g( + <x>) = b. Тогда
Ь +оо
[f(u)du~] f(g{u))g'{u)du.
а а
Примеры.
1° fdu-1, g(t) = -LT-(t>l)r jdu = j -f.
о о i
2° /W-^Oc^l); ■*(*) = -}-. В этом случае
f^du- /sin>.
1 0+0
1 7 Ш. Пизо, М. Заманский
514 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
§ 4. Интергирование по частям
Пусть f, g— две функции, определенные и непрерывные
на [а, Ь[ (а конечно), с первыми производными /', g',
непрерывными на [а, Ь[. Для а ^ х < Ъ имеем (Книга III, гл. IV,
разд. III, § 4)
JC X
J" f'{t)g(t)dt = f(x)g(x)-f(a)g(a)- j f(t)g'(i)dt.
а а
Если при х, стремящемся к й, два из трех членов этого
равенства имеют конечный предел, то третий тоже имеет ко-
6-0 6-0
нечный предел. В частности, если J f'(t)g(t)dt и J f{t)g'{t)dt
а а
Ь-0
существуют или существуют J f (t) g (t) dt и f(b—0)g(b —0), то
a
6-0 6-0
J f'(t)g(t)dt = f(b-0)g(b-0)-f(a)g(a)-$ f(t)g'(t)dt.
Для интегралов на некомпактном интервале интегрирование
по частям необходимо применять с осторожностью. Так,
например, оно, вообще говоря, не сохраняет абсолютной сходимости.
Пример. Пусть F — непрерывная функция, определенная
равенствами /7(0)=1, F(x) = s\nx/x (x>0). Рассмотрим
о
Положим t = 2u\ тогда
X X
х Х/2
Но sin 2и = 2 sin и cos и есть производная функции sin2 и. Пусть
f'(x) = sin2 a:, g(x) = l/х. Тогда
х/2 х/2 х/2-
{ f'(t)g(t)dt= J Ш^± = ^Ш-+ J ^jLdUt
0+0 0+0 0+0
ибо (sin2 x) /x стремится к нулю, когда х стремится к нулю.
ГЛ. I Г. ИНТЕГРИРОВАНИЕ НА НЕКОМПАКТНОМ ИНТЕРВАЛЕ 515
Пусть теперь G — непрерывная на [0, +оо[ функция,
определенная как G(0)=1, G(x) = (sin2x)/x2 (x>0). Имеем
X Х/2
JF(t)dt = ^0-+\ G(t)dt.
О О
Когда х стремится к бесконечности, S1"[ * | < -^ стремится
к нулю. Так как
х/2
X' X'
/■тМ-*</т-т-г <*<*'>
+ 00
стремится к нулю, то интеграл j G(t)dt абсолютно сходится
о
(поскольку 00). Следовательно,
-f-oo +оо
j F(t)dt= j G(t)dt.
о о
+ оо
Тем самым доказано существование J F(t)dt. Перепишем по-
о
зиде
следнее равенство в виде
+ оо +оо
о
+ оо
Нетрудно доказать, что |S1" ' dt= +00; следовательно,
о
здесь интегрирование по частям преобразует интеграл,
сходящийся абсолютно, в интеграл, сходящийся, но не абсолютно.
§ 5. Признаки сходимости
1. Положительные функции, а) Пусть / — неотрицательная
функция на [а,+оо[, ярусная на [а,х] при любом х > а
(частный случай: / — ступенчатая или непрерывная). Согласно § 1,
+ 00
для того чтобы существовал J f(t)dt, необходимо и достаточно,
а
х
чтобы интегралы \f(t)dt были ограничены сверху.
а
17*
516 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ ч
б) Если / и g — две неотрицательные функции,
определенные на [а, +оо[ и ярусные на [а, х], и если 0^/<Cg, то
X X
jf(t)dt^jg{t)dt.
а й
+ 00
Следовательно, сходимость J g(t)dt влечет сходимость
а
+ 00 + 00
J f{t)dt\ если интеграл Г f{t)dt не является сходящимся, то
+ оо
j g (t) dt тоже не будет сходящимся.
а
в) Пусть, в частности, для 0<а<л; имеем g{x)=l/xa.
Тогда
х
If=T^r(^-^") {аф1)'
а
х
j-~ = lnx-lna (а = 1).
а
Если а>1, то Iim а-1 = lim #1~-а = 0; если а<1, то
*-> + oo X я_>+оо
lim (—г^г)= lim (#l-a)= + oo и lim ln*= + <x>.
Х->+оо\Л: / tf-»+oo *-> + оо
оо
Значит, —сходится тогда и только тогда, когда а>1.
а
г) Пусть g(x) = l/xa в окрестности 0 (х>0). Имеем, как и
а
в предыдущем случае, J — = — j^h^r- "^РгЬ еслиа^=1;
X
а
-у- = In a — In х, если а=1. Если а<1, то lirrW-^^j-j^
X
а
= Нтд:1"-а = 0, и стало быть, — сходится. Если а>1 или
а
а -1, то J -4L-+00.
ГЛ. II. ИНТЕГРИРОВАНИЕ НА НЕКОМПАКТНОМ ИНТЕРВАЛЕ 517
а
Значит, — сходится тогда и только тогда, когда а<1.
+о *
Общее замечание. Рассмотрим случай интервала
[а, +оо[ и функции g, ярусной на любом компактном интервале
[а, с]. Если х достаточно велико, то
X С X
jg(t)dt=jg(t)dt + jg(t)dt.
а а с
6-0
Видно, что для сходимости | g{t)dt достаточно знать,
а
сходится ли Г g (t) dt, (a^c < 6). Короче говоря, достаточно
с
знать поведение g в окрестности точки й. В некоторых случаях
асимптотические разложения позволяют судить об этом
поведении.
В частности, для того, чтобы ) g (t) dt сходился, достаточно,
а
чтобы для х > с было g(t) = 1/хау где а > 1.
д) В случаях в) и г) в действительности рассматривается
семейство функций ga, зависящих от параметра а и, в зависи-
мости от значений а, интеграл Г ga(t)dt либо сходится, либо
а
не сходится.
Функции ga составляют эталоны сравнения, рассмотренные
в главе об асимптотических разложениях. Можно брать и
другие семейства.
Пример. Пусть, ga, $(х) = (1пх)$1ха (х>1, a, p
—конечные действительные). При a > 1 выберем а! так, чтобы
1 < а! < а, и запишем ga, э (х) в виде: ga, р (х) = -^^ \г .
Так как a>a', то ха~а' стремится к +<х>, и значит, каково бы
ни было р, (In xflxa~a' стремится к нулю. Стало быть, как
только х сделается достаточно большим, то
^a,pW = j^--^r<e-^r (а'>1),
и в силу б) J ga,fi(t)dt сходится.
хь
518 """ КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Точно так же при а<1 выберем а < ос' < 1; тогда
ga, $ (*) > А —, гДе Л> 0 — конечная постоянная, а х
достаточно велико; ибо (\пх) 1ха~~а стремится к бесконечности.
Так как J —г=+оо (а'<1), то J gay^ (t)dt = + 00, если
а а
а<1.
Наконец, если а=1, то
(In*)»
и для достаточно больших а
X X
а а
Сделаем замену u = lnt; все сводится к изучению J tfi du +
а'
Если —р> 1, т. е. если р<—1, то этот интеграл сходится;
если р ^ —1, то он расходится.
2. Абсолютная сходимость. Пусть / — ярусная функция на
[а,х] при любом х, a g — такая неотрицательная ярусная функ-
+ оо
ция на [а,х\ что существует J g(t)dt, и найдется такое х0, что
о
для х > х0 выполняется неравенство | / (х) | ;< g (x); тогда
4-оо
J / (t) dt будет абсолютно сходящимся.
а
Воспользовавшись предыдущими функциями g^ или ga, ^
получим достаточные признаки абсолютной сходимости.
Пример. Пусть а, Р >0 и f(x) = sin x/xa(l + х$) для
достаточно больших х. Имеем
ибо ха (1 + х$) = ха + *a+P > ха+$.
+ 00
Следовательно, если a + р > 1, то Г f(t) dt абсолютно
сходится.
ГЛ. II. ИНТЕГРИРОВАНИЕ НА НЕКОМПАКТНОМ ИНТЕРВАЛЕ 519
3. Сходимость не абсолютная. Основой для доказательства
сходимости (не абсолютной) ] f(t)dt является критерий Коши.
а
Однако может представиться следующий случай. Функции /
м g непрерывны при х^ау a F, G — их примитивные. Тогда
х' х'
J* F(t)g(t) dt = F(х') G(*') -F(x)G(x)~ j f {t) G (t)dt.
X X
Отсюда
X' I *'
J* F (t)g(t) dt\<\F(x') G (x')-F(x) G(x)\+j\f(t) G(t)\dt.
X I X
Предположим, что G ограничена на [а, +оо[, г. e. \G(x) \^M,
+00
что lim F(x) = 0 и \ f{t)dt абсолютно сходится.
Тогда F(x')G(x') и F(x)G(x) стремятся к нулю, и
х' х'
j\f(t)G(t)\dt^M j\f(t)\dt
X X
xf
«стремится к нулю. Стало быть, тем более J F (t) g (t) dt стре-
X
змится к нулю. Тем самым доказано существование | F(t)g(t)dt.
а
Пример. Исследуем при а > О сходимость интеграла от
<sin#)/A:a. Еслиа>1, то, поскольку | (sin *)/*a| <l/*a, J -~-dt
а
-абсолютно сходится.
Если 0<а<1, то полагаем G(x)=— cos*, g(x) = G'(x) =»
-sinл:, F{x)=* l/xa = x~a, f(x)=F'(x)=-a*x-a~l a/x*+l.
+00
Так как a > 0, то { \f(t)\dt сходится; lim F {x) = 0;
i X->oo
a
+00
\G(x) |<Л. Следовательно, I -^~- dt сходится, если 0<a^l.
520 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
ГЛАВА Ш
РЯДЫ
Эта важная глава излагается следующим образом.
Первый раздел отводится числовым рядам. Понятие
абсолютной сходимости (§ 1) естественным образом приводит
к изучению рядов с неотрицательными членами (§ 2). Далее
следуют абсолютно сходящиеся ряды (§ 3), а затем условна
сходящиеся ряды (§ 4).
Второй раздел посвящен функциональным рядам. После
напоминания или доказательства общих свойств мы
рассматриваем два частных случая рядов — степенные и
тригонометрические.
Третий раздел составляют задачи, обратные рассмотренным
в разделе II, т. е. задачи о разложении функций в ряды Тейлора
и ряды Фурье.
Читатель должен будет обращаться к предыдущим разделам,
как-то: Книга II, гл. I, Книга III, гл. I, II и гл. VII, разд. III.
I. ЧИСЛОВЫЕ РЯДЫ
§ 1. Определения и общие свойства
1. Определение ряда. Сходимость. Пусть (ип)—счетная по*
следовательность действительных или комплексных чисел.
Индекс п будет принимать значения 0, 1, 2, ... Рассмотрим после-
п
довательность (sn), где s„ = w0-f- ... + ип = 2 ик. Совокупность
fe=0
двух последовательностей (ип) и (sn) будем называть рядом.
Этот ряд называется сходящимся, если последовательность
(sn) имеет предел (в R или в С), когда п стремится к
бесконечности. Если ряд сходится, то предел последовательности
оо
(sn) называется суммой ряда и записывается 2 uk- Поэтому
+ 0О
ГОВОрЯТ ПРОСТО «РЯД 2 ttfc» ИЛИ «рЯД Uq + U\ + . . . + Un + . . .».
Числа Uh называются членами ряда; uk есть (k + 1)-й член или
член с номером k + 1.
Часто мы будем называть конечной суммой ряд, все члены
которого, кроме конечного их числа, равны нулю.
Ряд, который не сходится, называется расходящимся.
Рассмотрим множество & всех счетных последовательностей
действительных чисел (или комплексных чисел). Каждому
элементу (ип)^.& можно поставить в соответствие (sn). Обратно,
если задается (sn), то формулы и0 = so, ип = sn — sn_i (n^>l)
гл. ш. ряды 521
определяют (ип); следовательно, имеется взаимно однозначное
•отображение множества & на <§, определенное соответствием
(un)-+(sn).
То, что & есть векторное пространство над R (или С)
(см. Книга II), приводит к определению суммы двух рядов
Ч-оо +оо +оо
2 Щ и 2 vk; это будет ряд 2 (w* + vk), и мы записываем
+ оо +оо +оо
2(и* + »*) = 2 «* + 2 »*•
fc=0 fc=0 k=0
Точно так же, если осе/? (или С), пишем
fc=0 fe=0
Произведением двух рядов 2 и* и 2 »л назовем ряд
fc-0 /5=0-
2^, где
*-0
W*e «0^ + 11!^-,+«20^2+ ... +UkV0
(см. произведение многочленов).
Соглашения. Когда не может возникнуть никакого сом-
+ оо
нения, мы вместо 2 Щ будем писать 2 ы* или 2 uk-
Когда п — целый параметр, то выражение sn = 0(l) или,
скажем ип = о(—\ означает, что |sn| ограничено, когда п
стремится к бесконечности или соответственно, п2ип стремится к
нулю, когда п стремится к бесконечности (см. Книга IV, гл. I).
2. Алгебраические операции и сходимость, а) Если a —
отличная от нуля постоянная, то ясно, что ряды 2 и* и 2««£
одновременно сходятся или расходятся; и если они сходятся, то
сумма ряда 2<ш* равна произведению суммы ряда 2 и* на а.
б) Из элементарных теорем о пределах вытекает, что:
Если 2 и& и 2 vk сходятся, то 2 ("ь + vk) сходится и
имеет сумму, равную сумме сумм слагаемых.
Если 2 uk расходится, а 2 vk сходится, то 2 (ил + v*)
расходится.
Но если оба ряда 2 Wft u 2 vu расходятся, то, вообще
говоря, нельзя сказать, сходится или расходится ряд 2 (иц, + vh).
Пример: uh = (—1)\ uft = (—l)ft+1; оба эти ряда расходятся, но
uk + vh « 0.
522 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
В §§ 2 и 3 будет показано, что можно сказать о
произведении двух рядов.
3. Порядок членов. Из самого определения ряда ясно, чта
если, исходя из 2 uh, построить ряд, имеющий те же члены, на
расположенные в другом порядке, то получится ряд, который
может не быть сходящимся, если сходится 2 uk, и наоборот.
Задание счетной последовательности (ип) равносильно
заданию отображения / множества N в R (или С), и часто для
удобства мы будем вместо ип писать и(п). Значит, так
называемая «перемена порядка» означает замену функции f другой
функцией от п. В § 3 будет указан случай, когда можно
произвести такую перестановку и получить снова сходящийся ряд>.
если исходный ряд сходится.
4. Отбрасывание членов ряда. Суммирование группировкой.
Если, исходя из 2 иъ построить ряд, заменяя
произвольное конечное число членов конечным числом других членов, та
новый ряд будет сходиться (или расходиться) одновременна
с 2 иъ имея не обязательно ту же сумму.
Таким образом, можно сказать, что два ряда одновременно
сходятся или расходятся, если они имеют одинаковые члены,,
кроме конечного их числа.
Из этого вытекает следующее свойство: пусть (pk) есть
возрастающая последовательность целых чисел, р0 = 0; положим
Vk= 2 ип\ если ряд 2 Щ сходится, то ряд 2 vk сходится
п
и имеет ту же сумму. Действительно, ^vk = sp , где sm —
= 2 И*.
Но для расходящегося ряда это неверно. Так, пусть ип =-
= (—l)n+1; имеем 52n+i = —1, s2n = 0. Напротив, если этот ряд
— 1 + 1 — 1 + ... заменить рядом (—1 + 1) + (—1 + 1) + ..., та
получим сходящийся ряд.
Однако если uk = o(\) и если ри+\ — рь = 0(1), то ряд 2^
п
сходится или расходится вместе с рядом 2^, ибо ^jVk=?sp =»
k=0 п
= 2 «Ь И еСЛИ Рп^: m < Pn+U TO Spn= Sm +0(1), ПОСКОЛЬКУ
0
pk+\ — pk ограничено.
Следовательно, если общий член ряда стремится к нулю, та
ряд 2^ можно суммировать, собирая члены, в порядке их
следования, в отдельные группы, содержащие ограниченное a
совокупности число членов.
гл. ш. ряды 523
Это свойство (когда оно верно) носит название
суммирования посредством группировки членов.
1 1 1 ( —1)л-1
Пример. Для изучения ряда 1 —y + yij"+ "'"' п *~ •'*
+ оо
можно изучить ряд (l -!) + (!-1)+ ... =S(2fe+l)War
Здесь Pfc+i-^^2.
5. Условия сходимости. Теоретически проблема сходимости
ряда 2^& есть проблема сходимости последовательности (sn).
Практически же важно уметь по поведению членов uk судить
о том, сходится ряд или нет, не обращаясь к sn. Например, если
tfn = f(fl+l)— f(n)> ГДе / — заданная функция, то sn =
= f(n+ 1) — /(0), и необходимым и достаточным условием
сходимости ряда 2 Ид будет существование lim f(n); тогда сумма
ряда равна lim f (п) -/(0). п+°°
П->оо
Критерий Коши в применении к последовательности (sn)
лриводит к утверждению:
Критерий Коши. Для того чтобы ряд 2 ип был сходящимся,
l n
I k—rn
= 0.
необходимо и достаточно, чтобы lim
m, /г->оо |
В частности, если 2 и* сходится, то, взяв пг = п, получим
следующий результат: если ряд сходится, то lim */„ = ()
(необходимое условие сходимости). rt_>00
Более важная, однако, негативная форма: если wn я# сгр#-
мится к нулю, то 2 uk расходится (достаточное условие
расходимости) .
Ряд 2 uh называется остатком порядка п или п-м остатком
ряда 2 и*. Стало быть, если 2^ сходится, то lim 2 Щ ) в 0.
6. Абсолютная сходимость. Ряд 2 ^ называется абсолютно
сходящимся, если сходится ряд 2! uk I-
Ряд 2|и*1 есть ряд с действительными неотрицательными
членами.
Теорема. Абсолютно сходящийся ряд сходится. Обратное
не всегда верно.
Доказательство получается сразу же из критерия Коши. Дей-
h n
ствительно, если lim 2 I tik | = 0, то lim 2^ = 0, ибо 0 ^
т, л->оо т т, л->оо т
\ п I п
< 2 % < 21 «й I-
624 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
-— сходится,,
а ряд 2 J Расх°Дится-
Ряд 21 uk | называется рядом из абсолютных величин.
7. Замечание о рядах с комплексными членами. Если
uk = ak + ibk (aki bk — действительные) и если 2^ сходится,
п п п
то sn = 2 и* = 2 afc +* 2 &fc имеет в С предел, а значит,,
ооо
2 а* и 2#£ тоже имеют предел; стало быть, ряды 2 я* и 2 *&
сходятся, и, кроме того, 2^=2^ + '2Ь*. Следовательно:
Одновременная сходимость рядов ^jak и ^bk с
действительными членами есть необходимое и достаточное условие
сходимости ряда ]jj{ak + ibk).
8. Ряды и интегралы. Предположим, что (ип) есть
последовательность действительных чисел. И пусть и{х)~ип для
п*Сх<п + 1. Тем самым определена ступенчатая функция на
П Л + 1
[0,+оо[, причем ^ uk = J u(t)dt. Для м-<л;</г+1 имеем
о о
# л х п—\
J u(t)dt- J u(t)dt+ J* а(0Л = 2ил + (*-л)ап.
0 0 л 0
Если 2^ сходится, то в силу 5 нЛ = о(1), и следовательно,
х
f u(t)dt имеет конечный предел, когда а: стремится к + оо,
о
X
Обратно, если J u{t)dt имеет предел при #->+оо, то эта
о
я + 1 л
будет иметь место и для J u{t)dt = ^ uk. Таким образом,
о о
справедлива
Теорема. Ряд 2^ сходится или расходится од нов ре-
+ оо
менно с интегралом J u(t)dt.
о
Пусть un = an + ibn (аПу Ьп — действительные); обозначим
через а (а:) и Ь(х) значения ступенчатых функций, связанных
указанным выше способом с последовательностями (ап) и (Ьп).
гл. in. РЯДЫ 525
Имеем (Книга III, гл. VI, разд. I)
п л+1 д+1
5X = J. a(t)dt+t\ b(t)dt\
0 0 0
следовательно, 2 Щ сходится или расходится одновременно
•foo +оо
с J a(t)dt и j b (t) dt. Когда имеет место сходимость, то
о о
+ оо + оо
]£«* = j a(t)dt+ij b(t)dt.
о о
§ 2. Ряды с действительными неотрицательными членами
Мы только что доказали, что абсолютно сходящийся ряд
сходится. А поскольку ряд из абсолютных значений является
рядом с неотрицательными членами, то любой достаточный
признак сходимости ряда с положительными членами порождает
достаточный признак абсолютной сходимости числового ряда
(действительного или комплексного). Заметим, что все
последующее справедливо для рядов, члены которых неотрицательны,
начиная с некоторого номера, что связано с исключением
конечного числа неположительных членов.
1. Сходимость. Пусть 2"£— ряд с неотрицательными
членами. Суммы sn первых п членов образуют возрастающую
вместе с п последовательность, ибо если ип > 0 при любом п,
то sn+i == sn + Un+i ^ sn. Стало быть, проблема сходимости ряда
2^ь есть проблема сходимости возрастающей
последовательности. Значит, мы можем вместо критерия Коши пользоваться
следующей теоремой (ср. Книга III, гл. II, § 2).
Теорема 1. Для того чтобы ряд ^uk с неотрицательными
членами был сходящимся, необходимо и достаточно, чтобы сум-
п
мы sn= 2 Щ были ограничены.
о
п
В этом случае 2wA=0(l).
о
Следствие.Для того чтобы ряд 2 ^ с
неотрицательными членами был расходящимся, необходимо и достаточно^ чтобы
lim sn = + оо.
Я-*оо
Согласно (§ I, п. 8) сходимость ряда 2 Щ логически эквива-
+ 00
лентна сходимости интеграла j u(t)dt9 где u(t)=un при
о
526 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
n^t<n+ 1. Предположим теперь, что ип — значение функции
f, определенной для a:J>0, положительной, убывающей и,
допустим, непрерывной (условие, достаточное для дальнейшего),т.е.
wn = f(n). Тогда f(0 <«(*)</(<-!)■
Следовательно,
п п п
J /(*)*</ u(t)dt<j f(t-\)dt.
i l l
Заменяя t— 1 на t в третьем интеграле, получаем
п п п—\
J f(t)dt^j u(t)dt< J* f(t)dt.
i
+ oo n
Если J f(t)dt сходится, то j u(t)dt = sn — u0 ограничен, и зна-
0 1
n n
чит, ряд сходится. Неравенство J f(t)dt^. J u(t)dt показывает,
l l
что верно и обратное.
Теорема 2. Пусть ^jtin есть ряд с неотрицательными
членами, где ttn = f(n)f причем f — положительная убывающая
функция, непрерывная начиная с некоторого значения а
переменного. Для того чтобы ряд 2*/Л сходился, необходимо и до-
статочно, чтобы сходился интеграл J / (t) dt.
а
Заметим, что если предположить / возрастающей, то ип не
будет стремиться к нулю, и ряд 2^Л будет расходиться.
Пример. Ряд Римана ип = 1/па, а — действительное, я>1.
Имеем un = f(n), где f(/)= Vta (/>1). Если а<0, то ип не
стремится к нулю, и значит, ^ип ~ +оо. Предположим, что
а > 0. Мы видели (гл. II), что если а > 1, то — сходится
J ta
а
(а > 0 — произвольное); если a^Cl, то этот интеграл
расходится. Следовательно, У,—=- расходится при а<1 и сходится
^* п
при а> 1.
Пример 2. Геометрический ряд: wn = ап, а > 0. Если
л ^ 1, то un не стремится к нулю, и значит, 2 яЛ= +оо. Если
ГЛ. III. РЯДЫ 627
а<1, то полагаем f(t)=aK Примитивная этой функции
X
равна aVlna, а lim а1 = 0. Следовательно, \а! dt = -г-— (ах — 1)
+ оо
стремится к —j—. Стало быть, a* dt сходится. Геометриче-
о
ский ряд сходится, если 0 < а < 1, и расходится, если а ^ 1.
2. Сравнение рядов с неотрицательными членами. Пусть (рн) —
последовательность всех таких чисел, что ир > 0, а (qk) —
последовательность таких целых чисел, что uq = 0. Ряд 2 ип
сходится или расходится одновременно с рядом 2 иРь* Значит,
k *
можно предположить, что ряд с неотрицательными членами
состоит из строго положительных членов. Это замечание будет
использовано, в частности, когда будет рассматриваться
отношение Vk/tik для рядов 2 Vk> 2 и* с положительными
членами.
' 1° Если, начиная с некоторого номера, 0-*Cun^Cvny то
сходимость ряда 2 ®п влечет сходимость ряда 2 tim а
расходимость ряда 2 ип влечет расходимость ряда 2 «V
п п п п
Действительно, 2 Щ ^ 2 vk. Если 2^ = 0 (1), то 2% =
оо оо
= 0(1). Если 2 иЛ= + оо, то 2 vk= + оо.
о о
2° (Следствие). £сли существуют такие две
положительные постоянные а и й, что, начиная с некоторого номера,
О < aKun/vn^Cb < + оо, го рядь* 2 иЛ a 2 vn сходятся или
расходятся одновременно.
Это вытекает из Г в силу неравенств avn ^un^ bvn.
3° (Частный случай). Если п стремится к +оо и при
этом отношение un/vn имеет предел с, где с — отличное от нуля
конечное число, то ряды 2 Un u 2 vn одновременно сходятся
или расходятся; если с = 0, то сходимость ряда 2 vn влечет
сходимость ряда 2 *V> если с=+оо, то расходимость 2^
влечет расходимость 2 ип*
Действительно, если с конечно и не равно нулю, то, начиная
с некоторого номера, 0<с — e<un/vn<c + e. Если с= +оо, то,
начиная с некоторого номера, avn < ип (а конечно). Если с = О,
то, начиная с некоторого номера, ап-<еУп. Случаи c=+oot
с = 0 получаются из 1°.
528 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Замечание. Согласно главе I предыдущие условия могут,
быть сформулированы так: 1° ип = 0(vn); 2° un = 0(vn) и
vn = 0{ип)\ 3° найдется такое сФО, что ип ~ cvn.
3. Приложения. Признак паип, признак Коши, признак Да-
ламбера. Примеры. Все эти признаки будут получены, исходя из
(основного) утверждения Г, приведенного в п. 2. Если, в
частности, один из рядов 2 и>п или 2 vn выбирается достаточно
простым способом, то получаются обычные признаки; этот метод
заключается в выборе рядов, играющих роль эталонов (ср. гл. 1).
1° Признак паип. Возьмем за эталон ряд 1/па. Если а> 1
и ип = 0(1/па), то 2 и>п сходится. Если 0<а*Спаип4^Ь< + оо,
то 2 ип сходится при а > 1 и расходится при а-< 1, ибо а/па^С
-Cun^Cb/n*. Если lim паип = с Ф О, то 2 и„ расходится при
а41 и сходится при а> 1. Если lim паип = 0 для некоторого
Я->оо
а > 1, то 2"« сходится (ип = о(1/па)). Если lim паип= + оо
для некоторого а^1, то 2 "л расходится.
2° Признак Коши. Возьмем в качестве эталона
геометрический ряд 2 ап (я>0). Если ип<ап, то (ип)^п<а
(свойства хг). Если ип > ап, то (un)i/n^a. Но ряд 2 аП сходится
при а<1 и расходится при а^1. Отсюда выводим признак
- Коши.
Пусть 2 tin — ряд с положительными членами;
если lim («„)""< 1, то 2 Un сходится;
п
если \im(un)Vn>l, го> 2 ип расходится,
п
В самом деле, по определению lim (Книга III, гл. III, разд. I,
§ 2), в первом случае, начиная с некоторого номера,
(un)lln<lim(unfn + e. Положим А, = Ш(ипУ/п. Если К < 1, то мы
п п
выберем е так, чтобы Х + е<1. Тогда (ип)1/п< X + е, откуда
ип<(Х + е)п, и геометрический ряд 2(^+е)л сходится,
поскольку К + г < 1. Если X > 1, то выберем е так, чтобы X— е > 1.
Тогда найдется бесконечно много таких индексов лр, что
(ипр)иПр>Я - е, откуда иПр >(Я - e)V Так как X — г > 1, то
lim (1 — в)пр= + оо, и значит, ип не стремится к нулю, что
р->оо Р
влечет расходимость ряда 2 ы«.
Частные случаи. Если lim (unYfn существует и lim («n)1/n<
П-*оо П->оо
<1, то 2 ип сходится; если lim (un)l/n>l9 то 2 tin расходится.
П->оо
ГЛ. III. РЯДЫ
529
Замечание. Если \\т(ип)1/п = 1, то ничего сказать
п
нельзя, кроме того случая, когда бесконечно много ип
удовлетворяют условию («п)1/п > 1, ибо тогда ип > 1, и ряд 2 tin
расходится.
Для ряда Jj— имеем
(_ 1 = * =- n-ajn -~ p-a/n Inn
и стало быть, lim l/na,n=l. Ряд Римана нельзя исследовать
лри помощи признака Коши.
3° Признак Даламбера.Если lim Un+l < 1, то ряд Vип
** tin. ***
сходится; если lim Un+1 > 1, то ряд V ил расходится.
п
Действительно, пусть A = lim Un*1 , и е>0 таково, что если
п ип
Я<1, то Я + е<1. Начиная с некоторого номера р,
——<л + е, <л + 8, ..., ——<А, + е.
Отсюда в результате почленного умножения получаем
ип+1<ир(Х + е)п~р+\
что доказывает утверждение, поскольку р фиксировано, а к+г<1.
Пусть \i = lim п*х . Если ja > 1, то мы выберем е > 0 так,
чтобы |л — е>1. Тогда для п>р имеем M/l+1 >^~е> 1, и до-
казательство завершается в точности так же, как и в 2°.
Частный случай. Если lim Un+l > 1, то ряд Vип расхо-
дится, а если lim Un+1 < 1, то ряд сходится.
п->оо ип
И ничего нельзя сказать, если lim Un+l = 1.
Примеры. 1° un = l/nny (un)l/n=l/n, lim (ия)1/я = 0; Следо-
П->оо
вательно, 2 и* сходится.
2° wn = \/п\, ип+\/ип = 1/(д + 1) стремится к нулю, и стало
быть, 2 и* сходится.
530 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
То же самое будет для ряда ип = |а:|п/л!, каково бы ни было
действительное или комплексное х.
3° ип = | х \пп\у un+Jun = | х | • (п + 1)
бесконечно возрастает. Следовательно, ряд 2иЛ расходится
всюду кроме х = 0.
4° Пусть а > 0 — действительное не целое, а х —
действительное или комплексное, и
_ 1<х(а-1) ... (а-/г+1)| Л
"я — п! I х | .
Выражение
Ия + 1
а —п
и | л+l l1*' ПРИ п"~*°° имеет предел,
равный |я|.
Стало быть, если |л;|>1, то этот ряд расходится, а если
|л;| < 1, то он сходится.
* 4. Замечание к признакам Коши и Даламбера. Ограничимся
частным случаем, когда ип+\/ип имеет конечный предел X > 0„
Тогда для п^>р
ир(Х-г)<ир+1 <(Х + в)ир, ..., ип(X- е)< un+x<(Х + г)ип.
Отсюда
ир (Я - еГр+1 < ил+1 < (X + е)п-р+1ир;
а поскольку р фиксировано, то
(ар)'^1 (А-в) *+I <(ил+1)"+1 <(Ир)я+1 (Я + е) *+l.
Это показывает, что если lim u*+l = Я, то и lim (ил)1/л = X.
Именно это дает повод говорить, что признак Коши является
более общим, чем признак Даламбера. В частности, если
установлено, что lim п*1 = 1, то бесполезно применять признак
Коши, ибо тогда и lim (un)lln = 1.
Я->оо
Наконец, заметим, что эти признаки сходимости весьма
грубы, так как они могут давать результат лишь для рядов с
общим членом, «очень быстро» стремящимся к нулю.
Признак же паип является более тонким и может быть
результативным, когда его применяют к таким рядам, где
lim (ия)1/й=*1.
П->оо
5. Формула Стирлинга. Будем искать такое выражение для
/(/г), образованное показательными функциями и функциями,
из них получающимися, чтобы lim-^^- = l. Имеем In /г! =
Я->оо Л!
ГЛ. III. РЯДЫ 531
2j 'n P> а также J In x dx = n (In n — 1). Рассмотрим sn -•
1 +0
= Inn! — n(\nn— 1) и ряд с общим членом
Un = $n — Sn-i = Inn — /г Inn — n\n(n— 1) — ln(n— 1)+ 1 =
-l+«ln^-ln-^=l + (n-l)ln(l--l) (n>l).
Применяя разложение Тейлора для In (1 + л;) в окрестности 0,
получаем
*.-! + («- i)(-±-1ir-1ir+o(7L)) = i+^..+ o(^-).
Отсюда
/г /г /г
0 0 0
оо
где Vn = О ЦА. Заметим, что J] -^- - О (-^т) (а > 1) (это
4-оо
легко получить, если рассмотреть —Л. Отсюда
Л +оо оо
0 0 л+1
Пусть далее, огд = 1 + у + ...+ — . Рассмотрим ап — Inп = /д„
Имеем
w„ = **+1 ~ tn - -j+7 "! п <Л + *)+ Х п Л ™
Следовательно, *п имеет конечный предел С, который
называется постоянной Эйлера. Итак, запишем
l+j+...+4==lnn + C + °(1)-
Отсюда
п
632 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Таким образом, мы пришли к изучению
s'n = sn — y ln я = In я!- ~ л1п -~- — у In я.
Из предыдущего равенства следует, что
оо
lims; = C/2+i-£ir + ^ = A.
Разложение Тейлора в применении к s^ — s'nmml дает s'n — s'nmm{*=*
= -ib+0{-h)- 0тсюда
^-iniii-iiin-J—|",пя-Л+15Г+0(-гг)»
ибо неравенство
1 ■<^W<-1 1
л+1 /г + 2 ^ (n+1)2 ^ n n+\
дает
2*Ч-°(?)-
rt+1
Окончательно
Так как е* = 1 + х + О (#2), то
Постоянная ^ находится путем вычисления
я/2 Я/2
| sinnxdx9 j cos^xdjc.
о о
Получаем
, ч„ .. 22П(п\)2
(n)fi = lim —г,—^-z—.
Заменяя здесь п\ его найденным выше выражением,
полумаем [а = (2я)*/а. Отсюда
п\ = п«е-*УШ(\+-^+0(-±г)).
Это равенство называется формулой Стирлинга.
ГЛ. III. РЯДЫ
533
6. Умножение рядов с положительными членами. Если ип^09
Dn>0 « ряды 2tin и 2vn сходятся, то ряд с общим членом
wn = u0vn + UiVn-\ + ... +unvo сходится, и его сумма равна
произведению сумм рядов 2 ип и 2 vn.
Положим
п п п
0 0 0
Для любого п имеем Wn *С UnVn. А так как Un и Vn имеюг
конечные пределы U и V, то £/пУп ограничено, значит, и WV
тоже. Следовательно* Wn имеет предел W, т. е. 2 ®>п сходится.
С другой стороны, каково бы ни было п9 UnVn^W2n^> ^2nV2n-
Тем самым доказано, что
§ 3. Абсолютно сходящиеся ряды
Любой признак сходимости ряда с положительными членами
порождает признак абсолютной сходимости для произвольного-
ряда с действительными или комплексными членами. Целью
этого параграфа будет выявление еще некоторых новых свойств
рядов. Речь будет идти о роли порядка членов, об умножений-
рядов и о двойных рядах.
1. Безусловно сходящиеся ряды, а) Если ряд 2 ип абсолют-
но сходится, то любой ряд 2^л> полученный из 2ил путем
перемены порядка членов, абсолютно сходится.
Пусть vn — ир — общий член некоторого ряда, составленного
из членов ряда 2 "л- Предположим, что lim рп = + оо..
Я->оо
Имеем |1>я| + |0л+1|+ ... +1 vm | = |^pj+ ... +|иР|Д|. Если к
выбрано столь большим, чтобы рп, рп+и ...* Рт были >Р(е),
т0 la*J + lt4+il+ ••• + |"PJ< 2 1Ы<е, поскольку 2lM
сходится. Следовательно, \vn\ + ... 4- \vm\ < е.
б) Если последовательность (рп) есть перестановка
последовательности 0, 1, 2, ..., т. е. если каждое ип содержится в-
2 vn один, и только один раз, то 2 ^n u 2 ^« имеют одну w
ту же сумму.
Положим Um = щ +'... +ит, Vn = vq + ... + vn. Любому
целому т можно поставить в соответствие такое целое пт, чтобы
все члены и0, ии ..., ит содержались в УПт. Тогда У«т — Um
содержит члены ир с индексом р> т. Если мы выберем
т > М (г) так, чтобы | ит+\ \ + \ ат+2| + ... < е, что возможно»
;534 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
поскольку ряд 2 I ит I сходится, то получим | УПт — Um | < е.
Пусть U есть сумма ряда 2 ип; для достаточно больших т
имеем \U—Um\<s и \Vn — [/|<2е. Стало быть,
последовательность (Vn ) имеет пределом t/, а так как 1/„, на осно-
вании предыдущего, имеет предел, то lim Vn= lim Vn ={/.
Я->оо Д-»оо m
Имея в виду свойства а) и б), говорят, что абсолютно
сходящийся ряд 2 ип является безусловно сходящимся.
в) Если ряд 2 Vn содержит не все члены ип, то рассмотрим
ряд 2 wn* составленный из членов ип, не принадлежащих 2 vn.
Ряд 2 I ®>п | тоже сходится. И каждому п снова можно
отнести такие тп и />„, что \\т (Vm+Wp — £/п) = 0. Отсюда по
индукции получаем следующий результат.
Если ряд 2 ип абсолютно сходится и если составлены
k рядов 2 Vn\ • - • , 2 v<n\ удовлетворяющие тому условию, что
каждое ип содержится в каком-нибудь ряде 2 Vn\ и притом
единожды, то ряды ]£jvn(i=l,2,..,,k) абсолютно сходятся,
и если Vu • • •, Vk — ux суммы, то U = V\ + ... + Vh-
Стало быть, можно написать
2 tin = 2 unt + 2 tin2 + ... +2 ипк;
0 nl n2 nk
при этом последовательности (п{) образуют разбиение
последовательности 0, 1, 2, ..., т. е. каждое целое п содержится, и
притом только один раз, в одной из этих k последовательностей
(ср. Книга I).
2. Произведение. Сохраним обозначения § 2, п. 6. Из
результата, полученного в § 2, п. 6, вытекает, что если 2 I и* I и | 2 vk
сходятся, то 2 I w>k I тоже сходится, ибо
\wn\^\u0\\vn\ + ••• +1ы«1|0о1.
Пусть 1), V, W — суммы рядов 2 ыл> 2 vk9 2 и>*. Покажем,
что W=UV.
Положим u'k-\uk\, v'k = \vk\, w'h = \uQ\\vk\+ ... +\uh\\v0\.
Приведенное ниже графическое изображение (рис. 39)
показывает, что
\w*-u»v»\<\v*-n\-
Следовательно, Win имеет предел UV\ то же самое и для Wn.
Отсюда вытекает
ГЛ. III. РЯДЫ
535-
Теорема. Если ряды 2|ид| и 2|^п1 сходятся, то ряд-—
произведение
2 (u0Vn + ЩОп-х + . . . + UnV0)
абсолютно сходится, и его сумма равна произведению сумм
рядов 2 ^ и 2вя.
Пример. Пусть мп = хп/п\, vn = f/n/n!, где х, у —
действительные или комплексные и где полагаем 0! = 1. Мы знаем, что
при любых х и у ряды 2lwrt| и 2|»я1 сходятся. Вычисление
оо
wn дает wn — (я + */)п/я! Сумма ряда Jj—г есть значение /(#)
о
некоторой функции / от переменного х
оо
т. е. f (х) = 2 "tj • По предыдущей
о
теореме
(Ё4)(Ё£)-2(^)-
т. е.
%% W %% ад
'оигп
-Van
Рис. 39.
.) есть счетная
f(x)f(y)-f(x + y).
3. Двойные ряды. Пусть ^jUn (ft = 1, 2,
п
последовательность абсолютно сходящихся рядов с суммами.
Uk, a 2 Яд есть ряд, составленный из Un ив котором каждое
Un содержится один, и только один, раз. Пусть £7* = 2U„|>
п
и пусть 2^* сходится. Тогда ряды 2^ и 2^^ абсолютно
п k
сходятся и имеют равные суммы.
Так как \UP\KTJP, то сходимость ряда 2^Р влечет
абсолютную сходимость ряда 2 ^р- Рассмотрим vx + ... + vm, и
пусть пту пт„ рт9 рт,— такие целые числа, что:
1° все и%, расположенные в прямоугольнике с вершинами и\>
и\ > и»ту wfm> содержатся в о, + ... + vm\
2° все vu v2, ..., vm (которые состоят из щ) принадлежат
прямоугольнику с вершинами и\9 и\ ,, upnm't, upxm' (птг>пт>..
Рт'>Рт) (РИС- 4°)-
536 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Имеем
оо
\v{\+ ... +\vm\<Ul+ ... +UPm'<%Up.
i
Следовательно, ряд 2^Л абсолютно сходится. Но, согласно 1а)
и 16), изменение порядка членов ряда 2иЛ не меняет его
<суммы. Так что для вычисления суммы ряда, состоящего
из всех w£, можно выбирать любой
j/'lt,; и' 4 ~—ui порядок.
1 ' ' Пт °т' Пусть
£/JJ-af+ ... +up.
UP.m иЦ" UPnm оо
Возьмем такое /?, чтобы 2j U < е;
tMuto Лк™ И* . p+1
/ \«i unmt unm, зафиксировав это p, возьмем такое пу
чтобы
Рис.40. \U1-Ul\+ ... +\Up-UPn\<*.
Тогда сумма чисел и£, лежащих в прямоугольнике с вершинами
и\ и1П9 Un* wft равна Uln+ ... + Up и отличается от С/1 + ... + Up
vPm\
меньше чем на е, а поскольку
1
<2t/*<ef
то она отличается от U + ... +UP + ... меньше чем на 2е.
Этот результат обобщает 1в).
Запишем
+ 00 / + 00 \ ОО
Л-1\я-1 / 1
Мы будем использовать этот результат для ряда 2 &пУп> гДе
1/ = 2*я.
хп.
§ 4. Условно сходящиеся ряды с действительными членами
Пусть 2 ип"" сходящийся ряд с действительными членами,
обладающий тем свойством, что 21 ия | расходится. Такой ряд
имеет бесконечно много строго положительных членов и
бесконечно много строго отрицательных членов, ибо в противном
случае ряд 2|ttrtl был бы сходящимся.
Пусть vn = ttn. если ип > О, и vn = 0, если unr<0; wn = ип>
если ип < 0, и wn — О, если ггп > 0. Ряды 2 vn и 2 ^Л
расходятся, так как в противном случае либо они оба будут сходить-
гл. ш. ряды 53Г
ся, и тогда из сходимости 2^Л — 2^rt будет следовать
сходимость 21 ип 1> либо один из них, скажем 2 vn> будет сходиться,,
а другой расходиться, а значит, будет расходиться и ряд.
2у/1 + 2^л> и стало быть, ряд 2иЛ будет расходиться.
Можно найти такую перестановку чисел 0, 1,2, ..., что если
по, пи щ, ... — последовательность, полученная в результате
этой перестановки, то ряд 2^nft сходится и имеет заранее
заданную сумму.
В самом деле, пусть А — действительное число.
Предположим, например, что А > v0. Выберем я0 так, чтобы
v0+ ... -гУЛо<Л<ао+ ... +vth+vtH+u
что возможно, так как vn^0n^jvn= + oot Затем выберем щ
так, чтобы
i>o+ ... +Vn9+i + (wo+ ... +wni+\X:A<vQ+ ...
или
rt + 1 Л| + 1 W0+l П\
2 *>*+ 2 wk<,A< 2 vk + 2±wk9
0 0 0 0
что возможно, так как %<0 и 2^л= — °°. Таким образом^
получаем ряд
Vo+ ... +Vn<i+Wo+ ... + Wni + l + Vtit+l + ... +Vn2+ ...
Разность между частичной суммой этого ряда и А есть член*
vn или шп, который стремится к нулю, поскольку 2 ип сходится.
Пример. Ряд 1—"2""^"з"~Т^~ '''' называемый
знакопеременным гармоническим рядом, сходится, ибо, как мы
видели в § 1, п. 2, этот ряд может быть просуммирован
группировкой по два члена, а
(2fc+l)(2£ + 2) =0\W)'
Гармонический же ряд * +Т + Т + • • • "^ *"•••
расходится, ибо это есть ряд \ —> где а = 1. Следовательно,
знакопеременный гармонический ряд сходится, но не абсолютно.
Исходя из знакопеременного гармонического ряда, образуем^
ряд
1 _1_±4_±_±_±4- 4—J ! * ,
2 4"г3 6 8 ^ •*• ^ 2л+ 1 2(2/г+1) 2(2л + 2)"г#^
:S38 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Он снова сходится, так как, группируя по три члена, получаем
1 1
J = ±(_! L) = 0fM
Ы + 2) 2 \ 2п + 1 2л + 2 J ^ W2 j
2л+1 2(2л+1) 2 (2л
и его сумма совпадает с суммой ряда
JL_±+1_±+ +U—[ —U - 1 V (-0fe+1
2 4^6 8^,#,^2\2л+1 2л + 2;^,,# 2 ^J к *
что составляет половину суммы исходного знакопеременного
гармонического ряда.
Сходимость. Если обозначить через и ступенчатую функцию:
u(t) = ип для nKt <п + 1, то ряд 2^л будет сходящимся или
+ оо
нет одновременно с интегралом J u(t) dt. Следовательно, лю-
о
бой критерий сходимости интеграла на некомпактном интервале
дает нам критерий сходимости ряда 2 "„.
В частности, в гл. I этой книги мы видели, что
интегрирование по частям может иногда показывать, что такой условно
сходящийся интеграл равен некоторому абсолютно сходящемуся
интегралу. Таков случай
+ оо +оо
Г sin t ,, Г sin21
J —d'-J —
dt.
Здесь аналогом интегрирования по частям является
преобразование Абеля.
Пустьаь, bk — действительные числа,й0=Во, Ь0 + ... + bk = Bkf
и значит, bh = Bk — Bk-i (k> 1). Имеем
п п—\
2 akbk = 2 (а* - flfc+i) Я* + л,А.
о о
Допустим, например, что а& > 0, что последовательность (ак)
убывает, стремясь к нулю, и что Bh ограничены. Тогда
| (ak-ak+l)Bk \<M(ah-ak+l)9 \Bh\^M.
п
А так как ^Ei(ak —ak+l) = a0—an+l = a0 + o(l), то отсюда за-
о
ключаем, что ряд ^uk, uk = (ak — ak+i)Bk9 абсолютно сходится.
Значит, ряд ^akbk сходится.
Пример. Знакопеременные ряды. Это ряды с
действительными членами вида %{—1)пип, где ип > 0. Если ип убывает^
ГЛ. III. РЯДЫ
539*
стремясь к нулю, то они сходятся. В самом деле, достаточно в
предыдущем результате взять ak = uh, bk = (—l)k. что влечег
\Bh\<l.
Это имеет место для ряда \-—~-, где 0 < а-< 1, сходи-
*■* п
мость которого доказывается также суммированием
группировкой по два члена, так как
па (/i + l)e Ua+1/
Этот метод применяется и к исследованию сходимости рядов
^ancosnx (x^2nk), 2a„sinn#, где ап>0, убывая, стремится
п п
к нулю. Достаточно убедиться в том, что Scospx, 2sin/?Ar
. о •
ограничены (х Ф 2kri). Пусть Сп (х) = 1 + cos *+...+ cos nx..
Имеем
2 sin у Сл (л;) =
о • х , . Зх . х , , . 2п +1 . 2д — 1
= 2smy+sin-^—sin*2+ ••• + sin ^ "
. 2лг -h l
1 1 Sin~2 х
. а:
-х — sin -
. X
esmT
(а: # 2fort),
2
— лс =
, . 2л + 1
+ sin-^-
*^
откуда
I CM I'
2 sinf
Точно так же пусть Sn (x) = sin x + sin 2x + ... + sin nx.
Преобразовав аналогичным образом 2sin~-Sn(A:), получаем
х х 2/z -4- 1
2 sin у 5rt (а:) = cos -^ — cos —5— = 2 sin nx sin (n + 1) x;
значит,
SAx)=sinnxSin(n+l)x {x¥z2kn)t
sinf
I $,(*)!<■ '
. x
вшт
340 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
* § 5. Бесконечные произведения
Пусть имеется последовательность (ап) действительных
чисел. Если рассматривать сложение, то последовательность сумм
а\ + й2+ ... + ап подводит нас к введению понятия ряда; если
же рассматривать умножение, то последовательность
произведений aiu2 ... ап подводит нас к введению понятия бесконечного
произведения.
Положим
п
Рп = ам ... ап = Цак.
Если Рп имеет предел, когда п стремится к бесконечности,
то мы запишем
оо
lim Ра = П ак.
Я->оо k**\
оо
Символ П ak изображает бесконечное произведение.
1
Необходимо заметить, что если одно из чисел ап равно
нулю, то все Рп, начиная с некоторого номера, равны нулю, и,
значит, lim Рп = 0. С другой стороны, | Рп | = | а{ \\ а2 \ ... \ап\у и
П->оо
П
In| Рп | = S In | ak |. Но In | Рп | стремится к —оо, когда |Рп \
стремится к нулю, и мы приходим к следующему определению.
00
Определение. Бесконечное произведение Ц ak называется
1
«сходящимся, если последовательность [J\ ak) сходится
к конечному ненулевому значению.
Если Рп = й[. ..ап имеет конечный ненулевой предел, то
акФО при любом k. Кроме того, имеем аЛ = РЛ/РЛ«1. Значит,
если Рп имеет конечный ненулевой предел, то непременно
liman=l. Это есть необходимое условие сходимости беско-
оо
нечного произведения; для ряда 2 Uk необходимое условие
состоит в том, что lim un = 0; 0 есть нейтральный элемент сло-
Я->оо
жения, а 1 — умножения. Именно поэтому мы полагаем а^ =
= 1 + uk и ограничиваемся рассмотрением бесконечных произ-
оо
<ведений Ц (1 + uk), у которых lim uk = ()•
1 /S-*oo
гл. ш. ряды 54!
Исключив конечное число множителей, снова получим
сходящееся (или не сходящееся) бесконечное произведение, если
исходное было сходящимся (или не было сходящимся).
Следовательно, для того чтобы выяснить, сходится ли произведение,
можно предположить, что, каково бы ни было ft, I + ик> О, ибо
lim uk = 0.
п п
Пусть теперь Рп = П (1 + ик) и In Рп = 2 In (1 + uk). Если
1 1
ряд 2"fc сходящийся, то ряд 21п(1+мД_ вообще говоря,
таковым не является (пример: uk = (-~l)k/Yk ). Но если сходится
ряд 2|иД то сходится и ряд 21п(1+иЛ); действительно, так
как uh стремится к нулю, то | In (1 + uk) | = О (| ик |).
Итак, абсолютная сходимость ряда S^ влечет сходимость
оо
произведения П (1 + ик).
Теорема. Если ряд 21 и* I сходится, то бесконечное про-
оо
изведение Ц (1 + и*) сходится.
1
В таком случае произведение называется абсолютно
сходящимся.
Когда произведение абсолютно сходится, можно записать,
что
1пП(1 + и*)-21п(1+и*).
1 1
Ряд 2ln(l+ttfc), будучи абсолютно сходящимся,
безусловно сходится; тогда и бесконечное произведение обладает тем
же свойством; то есть если изменить порядок членов абсолютно
сходящегося бесконечного произведения, то получится
абсолютно сходящееся бесконечное произведение с тем же значением.
Пример. Каково бы ни было х, бесконечное произведение
'П('-Кг)
1
абсолютно сходится, поскольку сходится ряд ^-ггт* Можно
показать, что значение этого произведения равно sin x.
*§ 6. Представление действительных чисел в системе
счисления с основанием а
Пусть имеется 1j^ioe число а>1, называемое основанием.
И пусть х—^нбфъ ^действительное число. Целая часть числа
«есть наибольшее целое число, положительное, отрицательное или
542 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
нуль, меньшее или равное х\ его обозначают [х]. Значит, числа
X = х — [л:] удовлетворяет условиям 0 ^ X < 1. Тогда очевидно,
что если каждое число X из [0, 1] представить в виде суммы
сходящегося ряда, то можно будет сделать это для любого
действительного числа, ибо х = [а:] + X.
Поэтому мы предполагаем 0^.х < 1.
Пусть, следовательно, х е [0, 1 [; рассмотрим для заданного»
целого ttj> 1 последовательность чисел
О ± 1- ±
Существует, и притом единственное, такое целое /?п, что
поскольку это неравенство, записанное в виде рпКхап <рп + К
означает, что рп есть целая часть числа хап.
Рациональное число рп\ап называется приближенным
значением числа х с недостатком с точностью до 1/ап. Отметим, что
при таком определении числа рп
Х<* ап •
Покажем, что последовательность рп1ап возрастает. В самом
деле, имеем
Рп-\ _ flpn-i ^ ^ Pn-i + 1
а»"1 ~~ а* ^ Х<- а*-1 '
т. е. арп-\ ^ хап < (рп-\ + 1) а. Стало быть, арп-\ меньше или
равно целой части хап, равной рп. Таким образом, apn-i ^
^.рп <хап\ отсюда, разделив на ап, получаем рп^{/ап"1^.рп/ап.
Положим теперь рп = apn-i + Яп, где %п ^ 0 — целое число,
поскольку таковы рп, л, pn-i.
Но из условия рп ^ хап <(pn-i + l)a вытекает неравенство
рп < арп-.1 + а, или apn-i + Яп < арп-\ + а, и значит, 0 < %п < а>
или, что то же самое,
0<Я„<а-1.
Следовательно, целые числа Кп принимают только значения
О, 1, 2, ..., а— 1. Они определяются однозначно, если известны
целые числа рп. Итак, имеем
Рп _, Pn-i | Д/1
ап ап~х "*" ап '
Записывая эти равенства для п— 1, л — 2, ..., 1 и замечая, что
Ро = 0, получаем
ап~ а^ а*^ •" ^ ап '
гл. ш. ряды 543
1 п 1
Наконец, так как а>1, то lim--^=0, и значит, х--^г< —
стремится к нулю, когда п стремится к бесконечности, и
оо
lim Ц- = х. Таким образом, ряд У\ -£• сходится и его сумма
равна х.
Любое действительное число #е[0,1[ есть сумма ряда
оо
2j -тг » где а > 1 — заданное целое число9 а Хп — целые числа,
1
принимающие значения О, 1, 2, ..., а—1:
оо
1
Этот ряд называется разложением числа х по основанию а.
В обычном исчислении берется a = 10; это десятичные
разложения. Если а = 2, то разложение называется двоичным, а
если а — 3, то разложение называется троичным.
• Если а считается заданным, то число х записывается в форме
вместо того, чтобы быть записанным в виде суммы ряда.
Выясним, будет ли для данного х последовательность (Хп)
единственной при заданном основании а.
Заметим, что если (\хп) есть последовательность целых чисел,
оо
принимающая лишь значения 0, 1, 2, ..., а—1, то ряд У!-^г
1
оо
сходится, так как "рг^ ап > а так как я>1> то ряд У,—^
сходится. Кроме того,
оо
Равенство ^ Щ = 1 может быть только в том случае, когда
[in = а — 1 при любом п. Действительно, если для некоторого
значения я, скажем &, рд < а—1, а значит, поскольку щ-^
544 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
целое, ць^а — 2, то
а— 1 а —2 vi «"'
а а шт а *ш а а ^т а
1 /я-1 1 fc+i
оо
— ZJ я » fe ft — ft ^ *
а а а а
Значит, целое число 1 может быть записано в виде
оо оо
1 = 1 + 2d IF ^ 2d ~а*~ '
1 1
(Пример: а= 10, 1 =0,9999...) Остатив в стороне этот случай,
оо
получаем x = jj-^-^[09 l[.
1
Обозначим через %п целые числа, полученные для хе[0, 1[;
они определяются как %п — рп — арп-и где рп/ап —
приближенное значение числа х с недостатком с точностью до l/an. Предпо-
ложим, что число х является также суммой ряда £j—f->
~ h
оо оо
■"" 2и „* ~ 2а ** '
1
Чтобы выяснить, совпадают ли \ih с Кн при любых k, будем
оо
изучать приближение числа х частичными суммами ряда ^—]Г*
Имеем
1 a
1 л+1
Сумма 2"Т" есть РаДиональное число вида qn/an. Так как
jxn<a— 1, то
S'^-<S£^ "V"[a + a2 + •"]"" в»1
n+l rt+1
ГЛ. in. РЯДЫ 545
Как и выше, равенство >, —#- = — может быть выполнено,
~ а аг
лишь если все \ih равны а— 1 для kp-n + I. В этом случае
-t$+7
н , 1 _^+1
Стало быть, qjan не будет приближенным значением с
недостатком с точностью до \\ап\ таковым будет (qn + 1)/ап.
Итак, если, начиная с некоторого номера пу все \ik равны
п
а—1, то х рационально и равно \—!- + —=-• Тогда разложе-
1 а
ние JjHr называется несобственным разложением числа х.
Предположим теперь что для бесконечного числа значений k
имеем \ik < а—1, т. е. \ih^a — 2. Тогда, каково бы ни было п,
оо * оо
и значит,
1
так что qn/an есть приближенное значение с недостатком числа
х с точностью до 1/ап.
Таким образом, несобственное разложение могут иметь лишь
рациональные числа вида r/anf где 0 ^ г ^ ап.
Обратно, пусть имеется рациональное число х вида г/ап, где
0<Сг^ап. Случаи г = О, г = ап, т. е. х = О и*=1, уже
изучены.
Найдем приближенные значения числа г/ап при 0 < г < ап
с недостатком с точностью до l/afe.
Если & = п, то -~ = д: < -—рр-. Значит, рп = л
Если & < п, то —г- < — = л:, так как последовательность /?£/дг
а* а"
возрастает. Стало быть,
fl Т /.2 ^ * * • ' л«
18 Ш. Пизо, М. Заманский
546 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Но
Ьп __ Ьп- 1 I 1 Яд— 1 , 1 ( а- 1 , а- 1 , , а- 1 , \
ал~ а* ^а*"" ал "*" ал \ а "^ а2 "Г ' • • "1 ^"Т"'"/
Отсюда
Л—1 +оо
Я/к , Яя - 1 , V а - *
«-^-s-^+^+s -
а*
Л-л+1
В итоге получаем утверждение.
Теорема. Если а>\—заданное целое число, то любое
число х из [О, 1] записывается в виде ряда
* Ь а**
где Кп — целые числа, принимающие значения О, 1, ..., а—1.
Рациональные числа г/ап (г — целое) из [0,1] записываются
п
в двух видах: в виде конечной суммы ^-| а б виде ряда
V-~, где все Я*, начиная с некоторого номера, равны а—1.
Всякое число, отличное от т\ап, записывается единственным
оо
способом в виде суммы ряда V -\ •
~ от
Пример. Пусть а = 3; имеем
оо оо оо
1 "" 2и з*» з *а sk' з2 ^ з*'
1 fe=2 fc=3
з2 ~~ з2 + з2 ~ з2 f» з*
«=■3
и т. д.
Следствие. Множество R действительных чисел несчетно.
Достаточно показать, что множество [0, 1 [ или [0, 1] несчетно.
Каждому х е [0, 1] можно поставить в соответствие
последовательность (Я*) целых чисел, принимающих значения 0, 1, ...
..., а—1, где а^>3 есть целое число, являющееся заданным
основанием. Согласно предыдущему можно предположить, что
не все Kky начиная с некоторого номера, равны нулю; иначе
говоря, что, каково бы ни было х е [0, 1], имеется бесконечно много
Ял, отличных от 0. Допустим, что множество [0, 1] счетно, и пусть
гл. ш. ряды 547
хи х2> •••> хп, ... — его элементы. Числу хп сопоставляется
последовательность Скп> ь Лп,2. • •> ^n,fe, ...) (0<ЯП, fe-^л—1);
это соответствие взаимно однозначно. Последовательность чисел
jilf |I2, • • • , M<fe, • • . , уДОВЛеТВОрЯЮЩИХ УСЛОВИЮ jlfe ф %h, fe,
О < |ife ^ й—1, не может соответствовать ни одному числу
х^[0, 1], поскольку это число должно быть отлично от всех хп.
Таким образом, предположение о том, что множество чисел из
[О, 1] счетно, неверно.
II. РЯДЫ ФУНКЦИЙ
§ 1. Общие рассмотрения
В предыдущем разделе нам встречались ряды функций
2мя(лг), где ип— действительная или комплексная функция
действительного или комплексного переменного х, как-то: ^ хпу
— . Результаты, полученные для тюследовательностей
функций, переносятся на ряды функций путем рассмотрения функ-
п
ций вида sn(x)= 2 ип{х). Напомним, что если для х, действи-
о
тельного или комплексного, sn есть последовательность функций
с действительными или комплексными значениями,
определенная, скажем, на подмножестве Е из R или С, то говорят, что sn
равномерно сходится на £, если существует такая определенная
на Е функция /, что для любого е > 0 найдется такое не
зависящее от х^Е целое число N(e), что для любого п>Л/г(е) имеем
\sn(x) — /(лг)|^е, каково бы ни было х^Е. Заменяя $„(.*;) на
п
2 ип (*)> получаем определение равномерно сходящегося ряда
1
2 "п (х).
В дальнейшем мы предполагаем, что если ип—
действительные функции действительного переменного х, то они определены
на некотором интервале из /?, а если это комплексные функции
комплексного переменного z, то они определены на круге с
центром Zo и радиусом р, не обязательно конечным.
Сразу же получаем следующие результаты (Книга III, гл. I,
разд. V, гл. IV, разд. III, § 5).
Теорема 1. Если S "Л W равномерно сходится на
рассматриваемом интервале или круге, и если функции ип
непрерывны, то сумма ряда ^jun(x) определяет непрерывную
функцию от х.
Сумма будет обозначаться также через 2wn(4
2
18*
h
548 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Теорема 2. Пусть х — действительное, а ип при любом п
есть действительная функция от х, непрерывная для х е [а, й];
если ряд 2 tin (x) равномерно сходится на [а, й], то
Ь / оо \ оо/& ^
л \ 0 / 0 \л /
(почленное интегрирование равномерно сходящегося ряда).
Теорема 3. Пусть х — действительное, ип при любом п
есть действительная функция от х^ [а, й], дифференцируемая на
[а, й], и пусть функции и'п непрерывны на [а, й]; если ряд
2 ип (х) сходится в некоторой точке хо е [а, й], а ряд 2 и'п {х)
равномерно сходится на [а, й], то ряд 2 ип {х) равномерно
сходится, функция х -> 2 ип (х) дифференцируема на [а, й] и имеет
производную, равную 2 и'п (х), т. е.
d
dx
^ип(х)\==^--^ип(х)
(почленное дифференцирование).
Последние два результата были доказаны только для
последовательностей действительных функций одного
действительного переменного. Теорема 2 формулируется также при
помощи примитивных, если заменить й на х.
Признак равномерной сходимости. Если, каково
бы ни было х е [а, й] (или г из круга \z — г0| ^ р), имеет место
неравенство \ ип (х) | < an, где 2<*« есть сходящийся
действительный ряд са^О, то ряд 2 ип (х) равномерно сходится.
В самом деле, для любого х е [а, й] ряд 21 ип (х) | сходится,
а значит, сходится и ряд 2 tin (x). Имеем
+ оо
Им*)
+ оо
<2l «*(*)!<
+ оо
^2а/г<е> если п>Р(г), независимо от х, поскольку ап не
п
зависит от х.
Заметим, что этот признак обеспечивает больше чем
абсолютную сходимость ряда 2 ип (х) при любом х е [а, й]. Именно,
доказано, что ряд абсолютно и равномерно сходится. Но
равномерная сходимость ряда может существовать и без наличия
абсолютной сходимости.
Примеры. 1. 2гл и |z|<a<l. Тогда \zn\Kan, а так
как а< 1, то 2 ап сходится. Стало быть, ряд 2 г* абсолютно
и равномерно сходится в любом замкнутом круге радиуса а < 1.
ГЛ. III. РЯДЫ 51Э
2. 2j—j и |z|^a при конечном положительном а. Имеем
|iy ^ —р, и ряд £ — сходится при любом а (признак Далам-
бера).
3. Пусть х — действительное. На любом ограниченном интер-
вале ряд 2jTT РавномеРно сходится. Пусть /(#) —его сумма.
Производная от хп/п\ равна хп~1/(п— 1)!; ряд из производных
будет совпадать с исходным рядом. Следовательно, р (х) —
Рассмотрим еще ряд \+х + ...+хп + ... для | х | < а < 1
со
при х действительном. Производный ряд 2 пхп~х равномерно
сходится для |x|^a, так как \пхп-1\*Спап-х, а признак Далам-
бера показывает, что ряд 2 пап~1 сходится.
/ оо \ оо
Но элементарное вычисление дает 1 + х + ... + хп = sn =
—{_х (рассматриваются sn и — xsn). А так как !л;|^а<1,
Стало быть,
то |*Г+1 стремится к нулю, и f (x)= t ; отсюда, если
оо оо
|х|<а<1, то -JL-J*», -(nb^S"*"-1-
О 1
оо
4. Ряд 2j -^-sinnx равномерно сходится при 0^х^2я,
оо
^ I sin пх I . 1 ~ V^ 1
поскольку —^— < -р-. Ряд производных 2j "^f cos ПЛ: тоже
1
равномерно сходится. Если обозначить через f(x) сумму ряда
оо
2^ -^-sinnx, то будет определена функция с периодом 2я;
оо
/' непрерывна, и р (х) = 2j "^г cos пх.
Эти примеры приводят нас к степенным и
тригонометрическим рядам.
Получив общие результаты, касающиеся рядов функций,
можно, естественно, стараться выяснить, будут ли для
специальных функций, взятых в качестве ип, получены более точные
550 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
свойства; например, если в качестве ип выбрать полиномиальные
функции от х. Если многочлены произвольны, то новых свойств
не получаем. Причина заключается в теореме Вейерштрасса
(которую мы не будем здесь доказывать): если задана
непрерывная на [а, Ь] функция /, то можно найти последовательность
многочленов Рп, равномерно сходящуюся на [а, b] к f. Но если
взять весьма специальные многочлены, такие, как ип(х) = апхп
(ап не зависит от х), то получим большое количество свойств
при небольших дополнительных условиях (скажем, сходимость
в точке, отличной от х = 0). И мы приходим к степенным рядам.
Когда речь идет о периодических функциях, то
рассматривается
ип {х) = ап cos пх + bn sin nx.
И мы приходим к тригонометрическим рядам. Но здесь уже
не так легко получить простые результаты о сходимости.
Это те два типа функциональных рядов, относительно
которых мы приведем некоторые результаты, в частности свойства
сумм и коэффициентов.
Обратная задача будет состоять в том, чтобы представить
заданную функцию / степенным рядом (или
тригонометрическим рядом, если / — периодическая функция). Приходим к
рядам Тейлора и к рядам Фурье.
§ 2. Степенные ряды
1. Определение. Радиус сходимости. Степенным рядом
называют ряд 2^(2) с общим членом un{z) = anzn, an^Cv
геС, п>0 — целое.
Предположим, что ряд ^anzn сходится в некоторой точке
z0 Ф 0. Тогда
Так как ряд 2япг{? сходится, то |аЛг£| = о(1), и значит,
числа \anz%\ ограничены. Если |zK|z0| —e (где 0<е<|г0|)„
то |2/z0l<A,, где К= **fl~[e <1. Следовательно, | anzn | = 0(1)Я\
I z0 I
Но геометрический ряд 2 А/* сходится, и поэтому можно
сформулировать следующий результат.
Лемма. Если степенной ряд ^anzn сходится в некоторой
точке z0 Ф 0, то он абсолютно и равномерно сходится в любом
замкнутом круге с центром О, не содержащем точку z0.
Рассмотрим теперь lim | anzn \lfn = (lim | ап |1/л) | г\ = \i. (См.
tt->oo П->оо
Книга III, гл. III, разд. I, § 2). Если \х < 1, то признак Коши
для рядов (разд. 1, § 2, п. 3) показывает, что ряд ^anzn cxo-
20
гл. ш. ряды 551
дится. Следовательно, степенной ряд сходится для |г|<р, где
рв lim \ап\Х1п '
Л->оо
С другой стороны, если \z\ >р, то lim | anzn \l/n > 1, а в этом
п->оо
-случае, как мы знаем, ряд 21 cinzn | расходится, поскольку \anzn\
не стремится к нулю. Более того, если |,г|>р, то и сам ряд
^janzn расходится, ибо в случае его сходимости он по
предыдущей лемме сходился бы абсолютно.
Следовательно, любому степенному ряду ^anzn
соответствует такое, конечное или нет, неотрицательное число
р = -=- -rj-, что если Ы < о, то ряд ^anzn сходится, а если
hm| any'n
п
\z\> p, то ряд ^anzn расходится, р называется радиусом
сходимости. Круг с центром О и радиусом р называется кругом
сходимости.
Теорема 1. Если р есть радиус сходимости ряда ^janzny
то степенной ряд абсолютно и равномерно сходится в любом
замкнутом круге с центром О и радиусом, меньшим р; он
расходится вне круга с центром О и радиусом р.
Если lim | an+l/an | существует, то, как известно (разд. I,
rt-*oo
j§ 2), \ап\ xln имеет тот же предел, и тогда р == lim
И->оо
Примеры.
ай+1
1. 2Л р-1; |)4. «>°. Р=1-
о о п
оо
2. 2 n\zn, р = О (ряд сходится лишь при z я- 0).
о
оо
3- 1йй' Р= + °°-
о
Замечание. Если |<г|=р, то, вообще говоря, нельзя
ничего заключить ни о сходимости, ни о расходимости ряда ^janzn.
оо
Так, для z = 1 и z = — 1 ряд 2 zn расходится.
о
оо
Для z = 1 ряд V — расходится, а для z = — 1 сходится.
1
оо
Для z = ± 1 ряд 2 -^ сходится.
552 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
2. Непрерывность. Производные. Примитивные, а) Пусть
^anzn есть степенной ряд, радиус сходимости которого р
отличен от нуля. Функции z—>anzn непрерывны. Для |z|^a<p-
сходимость ряда будет равномерной. Обозначим через f функ-
оо
цию, определенную для |г|<р формулой f(z) = 2 anzn\ f есть
о
функция от z, непрерывная в любой точке открытого круга
сходимости.
оо
б) Ряд из производных ^nanzn~l имеет тот же радиус схо-
димости р, что и S anzn-
Действительно, lim| пап \ш = \\тп]/п \ ап |1/Л, а так как lim nUn =
п п п
= lim e(In n)/n = 1, то lim | пап \т = lim | ап \ш. Из этого следует»
п п п
что все производные ряды имеют тот же радиус сходимости.
Если бы мы хотели ограничиться рассмотрением таких
действительных значений х переменного 2, что |я|<р, то мы уже
могли бы утверждать, что f(x) бесконечно дифференцируема
на ]—р, +р[. Но мы хотим доказать это для любого z,
удовлетворяющего неравенству |«г|<р.
Если z и z' взяты в круге сходимости, то
о о
причем ряды абсолютно сходятся. В последнем ряде
коэффициент при ап имеет вид
2'""' + Z,n~2Z + ... +2,n"PzP-4- ... + Z"-1 - т"-1 =
= (z"l~1-zn-i)+ ... +(z,n~"zP-1-zn-1)+ ... +(zV-2-z"-|)=
= (z,-z)[(z",-2 + z",-3z+ ... + z""2) + ...
... +ze-1(z"l-p-l + z'n-p-2z+ ... +zn-»~l)+ ... + z""2]*
Пусть p'<p и I z |< p', I z' I<p'. Тогда
<P'p-1(n-p)p,"-p-1 = (n-p)p'"-2.
Значит, абсолютное значение коэффициента при ап меньше чем
lz'-z\p'n-2[(n-l) + (n-2)+ ... +\] = \z'-z\n{n-X) 9,п~К
гл. ш. ряды 553
Следовательно,
Но *!2i n (n — 1) р'п 2\ап\ есть значение второй производной от
р'. Этот ряд сходится, поск
~%папг*-*-0{\г'-г\).
21 ап I*п в точке z = р'. Этот ряд сходится, поскольку р' < р,
и стало быть,
z'-z
Тем самым доказана
Теорема 2. Степенной ряд 2яЛ£Л определяет внутри
круга сходимости непрерывную бесконечно дифференцируемую
функцию, все производные которой получаются путем
почленного дифференцирования исходного ряда,
оо
V Zn+l
Заметим, что эта теорема показывает, что ряд b + 2^ап . i >
о
имеющий тот же радиус сходимости р, определяет примитивную
F функции /.
в) Вычисление коэффициентов. Пусть р — отличный от нуля
радиус сходимости ряда %ап2п, и пусть
оо
/(г)=2а„гп.
О
Коэффициенты ап могут быть выражены через функцию f.
Действительно, дифференцируя р раз, получаем для z = 0 и для
любого р
?Р)(0)
йР"~ р! '
3. Алгебраические операции над степенными рядами. Пусть
2аЛ<гЛ имеет радиус сходимости р, а 2 bnzn — радиус
сходимости р'. Если р=£р', то ^{an + bn)zn имеет радиусом
сходимости наименьший из двух радиусов р, р', ибо если, например,
р < р', то для р < |г| < р' ряд 2 ап*п расходится.
Если р = р', то ^j(an + bn)zn имеет радиус сходимости, по
крайней мере равный р, но, может быть, и больший (пример:
ап = 1, Ьп = —1).
Внутри круга сходимости наименьшего радиуса можно
перемножать два ряда. Полученный ряд
2 {апЬ0 + ап-.{Ь{ + ... + афп)zn
/
554 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
будет абсолютно и равномерно сходиться, и его сумма будет
равна f(z)g(z), если f(z) = %anznf g(z) = %bnzn.
4. Замечания, а) Формулы, выражающие коэффициенты
ар как функции от суммы /, позволяют определить ряд Тейлора
бесконечно дифференцируемой функции z—>f(z).
б) Вместо того чтобы рассматривать степенные ряды от zr
можно рассматривать степенные ряды от (z — z0), т. е.
2 ап (z — z0)n. ^се полученные выше свойства справедливы
внутри круга сходимости с центром 20. Если f(z) есть сумма этога
ряда, то ап = п) .
в) Если х действительно и ряд 2 cinxn сходится для
—р < х < р, то этот ряд 2 апхп определяет в комплексной
плоскости функцию f (z) = 2 anzn ПРИ Iz I < P. которая для
z = xe] — p, + p[ совпадает с суммой ряда ^апхп. Сопоставим
п
с тем, что имеет место для полиномиальных функций 2 akxk*
о
п
определяющих в то же время 2 ukzh.
о
§ 3. Тригонометрические ряды
Тригонометрическим рядом (действительным) называется
ряд 2 ип (х), где
ип (х) = ап cos пх + Ъп sin пх,
причем ап и Ьп — действительные числа, не зависящие от х. По
причине, которая станет ясной в процессе изучения рядов Фурье»
тригонометрический ряд записывается в виде
оо
-7г + ^ (Я/г cos /г* + bn sin /гл;).
1
Сходимость. Вычисление коэффициентов. Здесь не
существует результата о сходимости, подобного результату для
степенных рядов. Тригонометрический ряд может сходиться в точке»
на интервале и не быть равномерно сходящимся. Причину этого
можно уяснить, если заметить, что степенной ряд %anzn с
радиусом сходимости 1 дает на окружности сходимости 2 anzn =»
= 2 ап (cos пх + i sin пх)\ значит, 2 ап (zn + zn) = 2 2 ап cos пх>
где ап предполагается, например, действительным.
Очевидно, что все предыдущие критерии сходимости (разд. I)
справедливы. Укажем некоторые из них.
гл. ш. ряды 555
а) Если 2я« и 2бп абсолютно сходятся, то в силу того,
что | sin шс | <; 1 и | cos nx | <; 1, тригонометрический ряд
абсолютно и равномерно сходится на любом интервале.
б) В частности, это верно, если ап = О ( —) (а> 1), Ьп = О 1-j-)
оо
<Р> 1). Если, например, а>2, р>2, то f (я) = -^+ ^(аЛcosttл; +
+ bn sin nx) непрерывна и дифференцируема, и /' (х) =
оо
= Hj(nbncosnx—nansmnx), поскольку пап = О{п[-а), nbn=0{nx-$).
в) Если {ап) и (Ьп) — убывающие последовательности,
стремящиеся к нулю, то ряд сходится для любого х ф 2kn.
оо
Если -^y +2^(ancosnx + bnsinnx) сходится для любого
о
х е [0,2я], то он определяет функцию / с периодом 2я. Если
сходимость равномерная, то / непрерывна. Предположим, что
сходимость равномерная и что
оо
/ (х) = -у + 2j (an cos пх + bn sin nx).
i
Тогда ряд
оо
/ (х) cos рх = •— cos рх + ^j (ял cos nx cos px + bn sin nx cos px)
тоже равномерно сходится. Обозначим через со замкнутый
интервал длины 2я и почленно проинтегрируем ряд по <о, что
законно в силу равномерной сходимости. Заметив, что
j cos pt cos qtdt = 0 для р Ф q, J cos2 pt dt = я,
J cos pt sin qt = 0, J sin p£ sin gtf = 0 для р Ф q,
J sin2 p* dt = n,
получим следующие формулы, называемые формулами Фурье:
ар = ± jf(t)cosptdt (р-0,1,2, ...),
(О
6р—S" jf(t)sinptdt (p=l,2, ...)•
556 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Таким образом, имеем результат, аналогичный результату,
полученному для степенных рядов, а именно, что ар и Ьр могут
быть выражены через сумму f ряда, только теперь мы
предполагали этот ряд равномерно сходящимся. Результат остается
верным во всех случаях, когда возможно почленное
интегрирование, однако одно только предположение сходимости при
любом х не могло бы позволить путем простого интегрирования
выразить ар, Ьр как функции от /.
Замечание. Если ряд сходится для любого х и если
ап = О при любом м, то / нечетна, т. е. /(—х) = —f(x), а если
Ьп = О при любом я, то / четна, т. е. /(—x) = f(x) при всех х.
III. ПРЕДСТАВЛЕНИЕ ФУНКЦИЙ РЯДАМИ
§ 1. Ряды Тейлора
Мы рассматриваем действительную функцию /
действительного переменного х, определенную в окрестности точки х = 0.
Если мы хотим представить ее в виде суммы степенного ряда
2 cinxn9 сходящегося в окрестности точки х = 0, то нам,
согласно разд. II, § 2, необходимо будет предположить, что f
бесконечно дифференцируема в окрестности точки х = 0, и тогда
f(n) (q\
CLfi^ —| • Таким образом, всякой функции, бесконечно
дифференцируемой в окрестности точки х = 0, можно отнести
степенной ряд
Za п\ х»
/г=0
называемый рядом Тейлора функции / в точке х = 0.
Выписать этот ряд — значит разложить f в ряд Тейлора.
Теперь задача заключается в том, чтобы выяснить: 1)
сходится ли этот ряд Тейлора в окрестности точки х = 0, 2) будет
ли в случае сходимости его сумма равна f(x).
Ответ, вообще говоря, отрицателен1). Мы приведем
несколько критериев, позволяющих давать утвердительные ответы.
Рассмотрим в окрестности точки х = 0 конечное разложение
порядка п функции /:
/М-/<о»+-<№-*+ ... +-£№*"t^*" (о<»<1).
1) Примером служит f{x)^e""x^ для х Ф 0 и /(0) = 0Г "Если
вычислить /^ (0) (которые существуют), то /^ (0) = 0 при любом я. Следова-
V f(n'(0)
тельно, ряд У* —|—*я сходится для всех х, но имеет суммой 0, тогда
как / (х) Ф 0 для х ф 0.
гл. ш. ряды 557
Если для | # 1^*0 выражение -—^р^*Л стремится к нулю при
п->оо, то для |#|<;#о имеем
~ fin)(0) .л
м-1Ч**
Отсюда вытекает следующее достаточное условие. Допустим,
что для | х К х0 будет | f{n) (х) | = О (апп\), где число а > 0; если х'о
означает наименьшее из чисел х0 и аг1, то V-—^-хп абсо-
0).
1-0(1 о* Iе);
0
лютно и равномерно сходится для |jc|^xJ —в (е>0).
I № (0л:) I
В самом деле, так как 0<9<1, то -—у^-/1
для | х | ^ хо — е выражение | ах \п стремится к нулю.
В частности, если | f{n) (д:) | == О(я!), то для | х |< 1 имеем
V4 /^ (0)
/ (*) — 2а —I *Я» если' ^ равномерно ограничены для | х \^x0f
о
т. е. \ f{n) (x) \ = О (1)9 то результат тем более верен.
Примеры. 1. п-я производная е* равна ех. Стало быть, она
ограничена на любом интервале. Следовательно, каково бы ни
было ху
г*-1+-&+...+■£+...
В частности, е = 1 + -yj-+ ... Н—р+ . • •
2. То же самое имеет место для sin* и для cos а:. Отсюда
sinA: = 2j (2л+1)1 ' cosa:==2j (2п)\ при любом *•
о о
3. Для | а: |< 1 — е (0<е<1) имеем lim \хп\ = 0; так как
П->оо
= 1+*+ ... + *"■' Х
1-* ~ ^"^ '•• т* -г {_х>
оо оо
то ~yzt- = ^*л(1 * |<1); имеем также In (1— х)= —2d^(\x\<l).
о о
В последних двух примерах функции определены и для
значений, не принадлежащих ]—1,+1[: первая для любого хф\,
а вторая для любого #<1. Но их разложение Тейлора
558 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
в окрестности точки х = О сходится лишь для 1*|< 1. Было бы
-— 2п для х = —2.
о
4. Разложение (1 + х)а. Оценки для производных
порядка 'п, которые мы только что применяли, имеют место и здесь
при х ^ 0. Чтобы получить разложение для (1 +#)а при
любом |л:|<1, промажорируем остаток формулы Тейлора другим
способом. В Книге III, гл. IV, разд. III, § 4 мы записали
остаток конечного разложения Тейлора в окрестности 0 в такой
форме:
^ (x-t)nfin+"(t)dt.
Пусть а —любое действительное. Имеем для х> — 1
ffe+!> (х) = а (а - 1) ... (а - п) (1 + х)а~п~1
(\ + х)а=\+±х+ ... +
а(а-1)... («-ft+ 1) п ,
_ х +
X
, а(а-1) ... (а~п) Г (*-<)" м ..g-i ,,
В последнем интеграле f меняется между Оих. Если #>0,
то 0<-^j<x; если х<0 (нох>-1), то 0<-^~<-л:.
\<\х\. Отсюда
Следовательно,
1-И
Кда+Т'л
<ui
j (1 + о""1 л.
Стало быть, остаток мажорируется по абсолютному значению
выражением 0(1). l«(a-lb.. (a-n)l ^ Но очевидно, что
если | х |<а< 1, то ряд ^ а(с-1) .,.■ (a-в) у, сходится
(критерий Даламбера). Итак, на интервале 1—1, +1[ имеем
(!+,)•- !+.«,+ ... +a(a-l).Ma-»+l)x.+ _
Эта формула называется формулой бинома, как и в случае,
когда a — натуральное число.
гл. ш. ряды 559
5. Определение ег (ср. Книга III, гл. VII, разд. III,
оо
§ 5). Ряд 2j-j имеет радиус сходимости р = +оо. Если z = х
о
00
SZn
о
знаем (разд. I, § 3), что, каковы бы ни были г и z\ f (z + г') =
== f(z)f(z'). Все это дает повод обозначить f(z) через ez:
ег
ио
Так как (е*%в0 = 1, то ег совпадает с функцией, определенной
в Книге III, гл. VIII, разд. III, § 5.
Если х, у означают действительные числа, то
eiy = 2j -^р = cos у + i sin у.
Из равенства ег • ег' = ez+z' выводим ех • е1* = ех (cos у -ь;
+ isinу). Отсюда
| ег | = е*, arg <?* = у + 2*я.
В частности, ein = —1, ein/2 — i, e~inl2 = —f. Тогда пишут
г = rei0, г = |z|, 8 = arg2.
Кроме того, cos x = ^ » sin л; = ^ .
Теперь можно. определить cos г и sine для комплексного zy
положив
C0S2 = - тг , Sin 2 =
eiz + e-iz . eiz-e~iz
2i
и убедиться в том, что остаются справедливыми классические
формулы, в частности cos2 г + sin2 г = .1.
Гиперболические функции определяются формулами
ez + e~z , ez-e~z
ch z = ~—, sh z =
имеем ch2 z — sh2 z = 1, cos г = ch iz9 i sin 2 = sh £2.
6. Определение логарифма комплексного
числа. Найдем для заданного z такое Z, чтобы ez = 2. Если
записать z = r (cos G + 1 sin 8), a Z = X + iУ, то
е* = г, У-8 + 2/гя.
560 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Отсюда
Z = \nr + iQ + 2kni.
Стало быть, имеется счетное множество решений. Пишем
Zk (z) = In г + Id + 2Ы, z = reib.
Имеем
Zk{z) + Zk>(z') = lnr + \nr' + i(Q + Q') + 2{k + k')ni =
- In (rr') + / (9 + 9') + 2 (k + k') ni - ZkW {z • z%
Множество всех функций Z& обозначается через Ln г, причем
каждая из функций Zk называется ветвью логарифма. Ветвь,
которая для действительного z > 1 принимает положительное
действительное значение, должна быть такой, чтобы Zk(x)~
= In а:, что требует k = 0, т. е. Zo(x) = \пх. Исходя из ветви Z0,
называемой главным значением логарифма, получаем все
другие по формуле
Zk{z) = Z0(z) + 2km.
§ 2. Ряды Фурье
1. Определения. Если f—ярусная функция действительного
переменного х, имеющая период 2я, т. е. такая, что f(x + 2rc) =
= f (x) для любого х, то можно вычислить
ap = ^f(t)cosptdt (р-0, l, 2, ...),
о
2я
bp = ±$f{t)sinptdt (p-1, 2, ...),
О
а затем составить тригонометрический ряд
оо
Ц~ + 2j (art cos па: + йЛ sin шг).
Когда an, bn вычисляются по предыдущим формулам, этот
ряд называется рядом Фурье функции fy а числа ап и Ьп
называются коэффициентами Фурье.
Ниже мы увидим логическую аналогию между рядом Тейлора
и рядом Фурье. Основными вопросами будут следующие:
1) сходится ли ряд Фурье функции f и 2) если сходится, то
будет ли он иметь суммой /(#). Ответ, вообще говоря,
отрицателен.
гл. ш. ряды 561
Здесь мы ограничимся рассмотрением довольно простых
случаев. Но вначале сделаем одно замечание и выведем
предварительные формулы.
Заметим, что если функция f с периодом 2я интегрируема,
а+2я 2л
то ] f{t)dt=\ f{t) dt, каково бы ни было а (Книга III, гл. IV,
а о
разд. II, § 6). Если через со обозначен интервал длины 2я, то мы
будем писать Г f (t) dt, а в случае надобности выберем надлежа-
(0
щим образом начало й.
Чтобы исследовать вопрос о сходимости ряда Фурье
функции /, вначале преобразуем частичные суммы sn(x) ряда, а
затем оценим sn(x) — f(x). Пусть
п
"5?t*) = -у + S (ak cos kx + bk sin kx),
l
'ak cos kx + bk sin kx =
~±(jf{t) cos kt di\ zoskt + ±(j f (t) sin kt dt\ sin kx -
= — / (0 (cos kt cos &x + sin kt sin kx;) dtf = — J f (t) cos k(x — t)dt.
Так как-^--^-J /(*)#, то
ft)
snW = ^J /(0[j + COS(*-0+ ... + С08Л(*-*)]Л-
sin(/i+-g-J(x-f)
*/'»
2 sin—т—
Л,
что справедливо в силу одной из формул в конце § 4 разд. I.
Положим t = х + 2и. Получаем
/ \ 1 Г * / i о \ sin (2л + 1) и *
s*M=n )f(x + 2u) sinu du*
to/2
С другой стороны, пусть имеется функция, представляющая
собой конечную линейную комбинацию из cosnx и sin/гл: и
562 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
называемая тригонометрическим полиномом:
п
^nW="f" + 2^ (ak cos kx + bk sin kx).
i
Ясно, что ряд Фурье функции Рп есть Рп. В частности, если
/(л;)=1, то для этой постоянной функции sn(x)=l при
любых п, х. Следовательно, в соответствии с выражением для
$п(х) получаем
- 1 Г sin (2я + 1) и *
1=1Г J sin» du
w/2
(можно в качестве интервала брать, например, [0, я] или
[—я/2, я/2], ...).• Отсюда
z / \ 1 Г s / \ sin (2n + 1) и *
I (х) = — А (х) ^ — du
1 v ' я J ' v ' sin и
w/2
и
sn(x)-f(x) = ± ftf(* + 2Q-/(*))8ln(*;+1) rff.
Ю/2
Эта формула верна с одним только условием — что f
интегрируема на [0, 2я].
2. Простейшие свойства. Исследуем поведение
коэффициентов ап, Ьп. Если ф есть ступенчатая функция с периодом 2я и
если ф(л:) = / на [а, р], то
р
J<p(*)cos/rfrff-/'ln/>p~
sin /га
стремится к нулю вместе с \\п. Следовательно, коэффициенты
Фурье ступенчатой функции стремятся к нулю. Если / есть
ярусная функция, то найдется такая ступенчатая функция ф, что
|/(0 —ф(01<в| где е>0 задано. Значит,
апв [ (/(0"" Ф(0)cosnt dt + J ф(*) cosnfd*.
Отсюда
|fl«K J If (0 —Ф(0 1Л + 1 |ф(*)со8л*л| <2ея + j q>(t)cosntdt.
6) I GS I CO
Стало быть, ап стремится к нулю. То же самое имеет место и
для 6П.
ГЛ. III. РЯДЫ 563
Коэффициенты Фурье ярусной функции стремятся к нулю
вместе с \\п: Следовательно, необходимое условие сходимости
ряда Фурье интегрируемой функции / будет выполняться.
Заметим, что это доказательство проходит, если рассматривать
ь
поведение интегралов J f(t) cos xtdt при х, стремящемся к оо.
а
Возьмем теперь
я/2
sn(x) = - J f(x + 2t) \ш at.
-Я/2
Заменяя t на — t в интеграле J , получаем
-Я/2
я/2
s»(*)-ij if(x + 2t) + f(x-2t))aa{^+tl)t dt,
О
я/2
sn(x)-X = ±j (f(x + 2t) + f(x-2t)-2k)sin{2+l)t dt,
где К — произвольное число. Пусть ф* есть функция от ty опреде-»
ленная для (Х/^я/2 равенством
,Л f(x + 2fl + f(x-2/)-2*,
«если /=£0 и <pz(0) = р, где р — заданное конечное число. Пусть
<х — положительное число. На интервале [а, я/2] функция фх
будет ярусной, поскольку 1/sin ^ непрерывна (ср. Книга III,
гл. IV). Следовательно,
я/2]
lim f <p*(0 sin (2n+ l)tdt = 0,
Л->оо J
а
ибо этот интеграл равен коэффициенту Фурье &2n+i ярусной
функции, равной ф«(0 для a^t^Cn/2 и 0 для остальных t
Сходимость последовательности функций sn — К зависит,
стало быть, только от сходимости интеграла
^ Г (fx(t)sin(2n+ \)tdt.
о
Этот факт мы сформулируем в виде следующего утверждения.
664 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Сходимость ряда Фурье функции f в точке х зависит только
от значений, принимаемых f в окрестности этой точки.
Итак, предположение о существовании производных на
интервалах [0, х — а] и [л: + а, 2я] не дает возможности
выяснить, будет ли ряд Фурье функции / сходиться в точке х.
Поскольку сходимость sn (х) к А, при п -* оо вытекает из схо-
а
димости Г фх (t) sin (2n + 1) t dt к нулю, и так как коэффициенты
о
Фурье ярусной функции стремятся к нулю, то мы выводим из
этого следующее достаточное условие.
Если функция t-+yx(t) является ярусной в окрестности
точки t — 0, то sn (x) стремится к Л.
С этого момента мы положим Я = /(х), причем ограничимся
несколькими простыми случаями. Предположим, что f обладает
в точке х правой производной б и левой производной у\ тогда
для 0 < t ^ а функция yx(t) непрерывна и Нгпфя(/) = у + 8. За-
дадим функции фх значение р = y + б Для t = 0. Тогда фж
непрерывна, а стало быть, и ярусна в окрестности точки t = 0.
Отсюда вытекает
Теорема. Если f имеет в точке х правую и левую
производные, то ряд Фурье сходится к f(x).
Пример. 1. Пусть f(x) = х для —я < х < я, /(±я) = 0. Ряд
Фурье функции / есть
~ / . sin 2л: . sin Зх , , iyi+1 sin пх , \
2 ^sin^ 2 ' з ••• +(~1) —^— +•••)'
Для х= ±я этот ряд имеет сумму 0. В любой другой точке /;
дифференцируема. Значит,
£/ \ л/ • i / 1\Я-Н Sinn* , \
f(x) = 2\smx- ... +(-1) — Ь ...J.
Для x = -j получаем 1- j+j + ... + 2p+i + ••• = Т-
2. Пусть f(x)=cosax для —я^Ся^я (а не целое). Ряд
Фурье имеет вид
sin an ( 1 2a cos * , , /_\\n 2a cos д* \
Для jc Ф я ряд сходится и имеет сумму cos ax. Для х = я он
также сходится в силу того, что / имеет правую и левую
производные.
ГЛ. IV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 565-
ГЛАВА IV
ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
В этой главе, которая носит технический характер, мы
собрали необходимые понятия, касающиеся основных
элементарных функций. В ней примерно повторяется порядок изложения,,
принятый в Книге III, к которой читатель должен будет
постоянно обращаться. Чаще всего результаты даются с
указанием теорем или теорий, позволяющих их установить. Первый
раздел отводится действительным функциям действительного
переменного; в частности, он содержит перечень основных
результатов, необходимых для изложения. Второй, очень
короткий, содержит некоторые сведения о комплексных функциях
комплексного переменного. В третьем разделе приводится
несколько примеров графического изображения вектор-функций
(отображение R в У?2).
I. ДЕЙСТВИТЕЛЬНЫЕ ФУНКЦИИ ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО
§ 1. Перечень результатов
, Напомним, что если / означает действительную функцию*
от х, определенную и непрерывную на [а, Ь], имеющую одну или
несколько производных, то:
1. Если дифференцируемая функция f возрастает
(соответственно убывает), то f ^ 0 (соответственно ^0).
2. Если_^>0, то / возрастает на [а, Ь)\ если /'<0, то /
убывает.
3. Если /' возрастает, то / выпукла. В частности, если /">0,
то / выпукла.
4. Если в точке xQ^]ayb[ функция / имеет относительный
максимум или минимум и дифференцируема, то f'(xo) = 0.
Если на интервале [а, р] с [а, Ь]9 содержащем точку х0 строго
внутри, функция / имеет непрерывную производную и /'(лг0) = 0,
а сужение на интервал [а, р] функции / выпукло, то f{x0) есть
относительный максимум; если же выпукла —/, то f(xQ) есть
относительный минимум.
5. Если / строго возрастает (соответственно убывает),
непрерывна и дифференцируема, то отображение /-1 = <р определено
и обладает теми же свойствами; более того, ср' = 1//'.
6. Если х -+f(x) есть отображение подмножества / из R
в R, то график функции /.есть множество точек (х,у) на R2,
для которых y = f(x) и хе/. Точку из R2 обычно
представляют ее координатами: абсциссой х и ординатой у,
откладываемыми на двух прямоугольных осях. Из самого определения
пространства R2 (как множества упорядоченных пар действительных.
566 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
чисел) следует, что если обратное отображение f~l является
действительной функцией действительного переменного j/e[(/),
т. е. y-+f~x{y)y то графиком функции f~l будет служить
множество точек из R2 с первой координатой y^f(I) и со второй
f~~l(y)- Обычно же записывают x-+f~l{x) и x^f(I), переходя
к привычным обозначениям. Тогда графики / и f~l становятся
симметричными относительно так называемой первой
биссектрисы осей Ox, Of/, т. е. множества точек из R2y для которых
х = (/, называемого также диагональю. Но иногда удобнее
бывает считать для графика функции f~l первой координатой
y^fV)* a второй x — f~l(y). Тогда оба графика совпадают.
7. Если существует такая функция F, что F' = /, то F есть
примитивная функции f, и все примитивные получаются путем
прибавления к F произвольной постоянной.
Обозначения. Вместо df(x)/dx, f(x), dnf(x)/dxn, ... мы бу-
лем применять обозначения Df, D2f, ..., Dnf соответственно
для 1-й, 2-й, ..., я-й производной.
Значениями этих функций будут Df(x), D2f(x), ..., Dnf(x).
<§ 2. Перечень свойств функций ах, loga х, ха
Относительно вида графиков см. Книга III, гл. III, разд. VII.
Производные.
1. Dax = ax In a, Dnax = ах (\па)п (а>0).
Dex = Dnex = ex.
Z)ln* = ~ (*>0)>. D\n\x\ = ± {хф%
3. Dxa - а*а~\ DV = a (a - 1) ... (a - n + 1) xa~n
(ае=Я, х>0).
Возрастание (знак Df).
_x-+ax возрастает при а > 1 и убывает при 0 < a < 1,
jc -* In х возрастает (х > 0),
jt -* ха возрастает при a > 0 и убывает при a < 0 (л: > 0).
Выпуклость (знак D2f).
х->ах выпукла при а > 0,
х -v In а: вогнута (х > 0),
.jc->xa выпукла при а^О или а^1 и вогнута при 0< a < 1
<х>0).
ГЛ. IV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 567"
Обратные отображения. Обратное отображение к х-+ах
есть x-*logax (и наоборот), а обратное к х-»ха (а=£0) есть,
х -* *1/а.
Максимум, минимум. Все эти функции строго монотонны,,
кроме функций ах при а = 1 и ха при a = 0, которые не
представляют интереса.
Разложения в ряд. 1. Каково бы ни было действительное х^„
ех= 1 -Ь — 4- . 4-— 4-
т. е. ряд Тейлора показательной функции имеет бесконечный
радиус сходимости. Заменяя х на х — х0, получаем разложение-
в точке х0.
2. Для функции х->1пд: можно записать разложение в
точке х0 > 0. Имеет место равенство
ln(jc0 + A) = ln^(l+1~) = ln^ + ln(l4^).
Поэтому достаточно записать разложение функции х—►1п(1+д:)
для, х = 0, т. е. разложение функции #-*lnx для jc = 1. Имеем!
ln(l+je)-*-4- + T+ ••• +Mr— *" + •••
Это разложение справедливо лишь для |я]<1. Очевидно,
Для |#|<1 законны почленное интегрирование и
дифференцирование. Запишем, например,
Dln(l+x) = T±v=l-x + x2+ ... +(-l)n-V-1+ ...
и, для |#| < 1:
X оо ■* оо
ji„a+x)^-sbipj^-s-i^^«.
0 п=1 0 /г=1
Отметим, однако, что равенство Dln(l + х) = 1/(1 + х) верно
для всех х >—1, тогда как разложения имеют место только
для —1 <х < +1.
3. Точно так же для х0 > 0 имеем (х0 +ti)a = x%(l + (h/x0))a;.
и в окрестности 0 имеет место разложение
_ + a(a-l) .„(«-»+V+ _ (,,|<l)..
568 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
§ 3. Действительные гиперболические функции
Гиперболические функции — это функции, обозначаемые:
sh — гиперболический синус,
ch — гиперболический косинус,
th — гиперболический тангенс,
cth — гиперболический котангенс.
Они определяются следующим образом:
sjia: = s > спл; = ~ >
2
ch* * ^blwv — thx ~~ sh*
thx-Sr. cttn-aL—Sf (*f*0).
Тогда
~ ac , f t cth.*; = —
<r* +1 el
ли e — e e — i , « e + l , # лч
th^=^T7^7=5T2FTT' cthx==T2F~T fr^Ob
Вместо (shA:)n, (ch*)n, ... (n —целое) пишется shn#, chnjc,
Производные.
D (sh x) = ch л:, D (ch #) = sh x,
ch2 x — sh2 * 1
D(th*) =
ch2 at ch2 x
ибо ch2* —sh2# = 1, D(cthx)= r^.
Производная от ch в точке 0 равна 0 (shO = 0), а
производная от sh, th равна 1 (ch 0=1).
chx при любом х больше или равен 1; chO = 1.
sh x < 0 при *<0HshA;>0 при х > 0;
sh 0 = 0.
chx убывает при х < 0 и возрастает при х > 0, имея
минимум при х = 0;
ch (—х) = ch х.
shx возрастает всюду на /?; sh(—х) = —shx.
Так как lim е*=+оо, a lim е-* = 0, то lim сЬд:= + оо,
#-»+оо Х->+оо #_щ-оо
lim сЬлг= + оо, lim sh#= + oo, lim sh.x;= —oo.
:>:-»-oo дс->+оо *->—oo
Точно так же th( —x)= — thx, lim thx=l, lim" th*(*)= — !.
Я-»+оо x->-.oo
th возрастает, a cth убывает.
Графики (рис. 41, 42).
Функция ch четная, а функции sh, th, cth нечетные.
Выпуклость. Производная от ch есть sh; sh — возрастающая
функция, поэтому ch есть выпуклая функция.
ГЛ. IV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 569
Точно так же sh выпукла на [0, +оо[ и вогнута на ]—<х>,0].
th выпукла на ]—оо,0], ибо ее производная 1/ch2 возрастает
на]—оо, 0], и вогнута на [0, +оо[.
ХЪх
О х
th
I'm\ II.
/
-X
1 /
1 /
1 /
1 /
1 /
\
к~
/' '1
/ '
/ •
/ 1
0 «2Г
-/
Рис. 42.
Cth
Обратные отображения. 1. Так как функция sh непрерывна
и строго возрастает на /?, то обратное отображение определено,
непрерывно и возрастает. Обратное отображение обозначается.
arsh;
х = arsh у означает аргумент, гиперболический синус которого
равен у.
Эти обозначения и понятия мало интересны, поскольку arsh
выражается через логарифмическую функцию. В самом деле,.
y = shA: = -
3)70 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
положим ех = X. Получаем
У = -^Г> *2-2f/Z-l=0.
Решим это уравнение второй степени относительно Х\ оно имеет
„два корня, произведение которых равно — 1; а так как
~Х = ех > 0, то мы должны выбрать корень > 0. Следовательно,
~Х = у + |Л + у2 = g*. Отсюда для любого действительного у
лмеем х = In (у + У1 + у2), и
arsh a: = In (л: + ]Л + *2).
2. Функция th непрерывна, строго возрастает и переводит R
в ]—1, +1[. Стало быть, обратная функция arth непрерывна,
строго возрастает и переводит ]— 1, +1[ в R. Она также может
быть выражена через логарифмы, ибо, положив е2х = Х(>0)+
получаем
j,ethx = 4TT» (X + l)y = X-U X(l-y)-l+y (\у\<1).
и
1 +У \ . 1+у
7=f» или х = 11пТ=7
Отсюда, заменяя у на х, приходим к равенству
arth^ = lln^ (|*I<1). ^
Так как ch2х — sh2х=^ 1, то сЬх=У\ +sh2x> shл: = + |/ch2л: — 1
(х>0), sh* = - |/ch2л: — 1 (*<0).
Производная от arsh х = In (л: + У\ + х2) равна 1/У1+Х2
(ибо производная от f~l равна I//7).
Производная от arthлс = -=■ In~гг^ (1*К0 равна ^ 2
<|х|<1). Эти два результата можно сформулировать в такой
форме: на R примитивная функции \/У\+х2 равна 1п(* +
+ V1 + а:2); на ]—1, +1[ примитивная функции t 8 равна
1 I- {+х
Замечание. Для любого хф ± 1 имеем
= y(tz—Ь-pz—)• А так как для всех хфО производная
имеет про-
ют In | а: | равна 1/х, то заключаем, что -~-1п
1-х2
прои
1+х
2
лзводную 1/(1 — х2) для всех х Ф 1 и а: ф — 1
ГЛ. IV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 571
3. Функция ch непрерывна, строго убывает на ]—оо;0] и
строго возрастает на [0,+оо[. Значит, определить обратное-
отображение как непрерывную строго монотонную функцию мы
можем только путем сужения функции ch либо на ]—оо, 0]>.
либо на [0, +оо[. Обычно через arch обозначается
отображение, обратное к сужению на [0, +оо[ функции ch.
Пусть y = ch*= **У Х (*>0) и ех = ХО*\). Тогда у =
*2 + 1 Х2-2*/Х+1=0. Так как */>1, *>1, то из двух
2Х
корней этого уравнения (дающих в произведении 1), мы должна
выбрать тот, который больше 1. Поэтому ех = Х = у + У у2 — 1>~
и x = ln(r/+ Yу2— l) (у> 1). Отсюда, заменяя у на х, получаем
arcbx = In (х + У^Т) (х > 1).
Эта функция переводит взаимно однозначно и взаимно
непрерывно [1, + оо[ в [0, + оо[.
Второй корень уравнения X2 — 2уХ +1=0 будет
положительным и меньшим 1. Он дает х = In (у — У у2 — l); меняя у
и х местами, получаем y = ln(x— \fx2—\). Имеем In (х — Ух2 —l) =
= In z f . . Функция х -> In (x — Ух2 — l) осуществляет*
обратное отображение к #-->chx для #<0.
Отметим, что производная от arch* равна 1/Ух2 — 1, и зна-
чит, примитивная для х-> \/Ух2— 1 равна 1п| х+ Ух2 — 11 при
х2>\.
Разложения в ряд. Из разложения е* в точке х = 0
заключаем, что, каково бы ни было х,
sh'A: = A: + -~- + ... +
3 -г • •• т (2rt + i)i
ch*=l + ^r+ ... +■
2! ' " " " ' (2n)l '
Что же касается обратных функций, то сначала находятся
разложения в ряд производных, а затем почленным
интегрированием находятся разложения функций. При этом мы будем
разлагать arch а: лишь в окрестности значения Хо>1, поскольку
arch а: определено только для х ^ 1.
Так, D arsh* = (1 + x2)-i/2. Значит, пользуясь разложением
функции (1 + Х)а, где а = —1/2, а X = а:2, получаем при х2 < 1„
т. е. при — 1 < х < 1,
DarshA:= 1 --у^+у^ а:4+ ...
£72 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
и для arshx, которая при х = О обращается в нуль,
-arsn;c = A; — у~з~+ •••
+ („ lfii-J2Mti^+ (IxKl)
•••" *' 2-4-....(2л) 2д+1^-#' U^I^U.
Формулы, относящиеся к гиперболическим функциям. Мы
уже знаем, что, каково бы ни было х,
ch2 х — sh2 x == 1.
Именно эта формула послужила причиной тому, что
функции названы гиперболическими, ибо множество точек (|, ц) из
/?2, для которых I2 — т)2=1, представляет собой равнобочную
гиперболу, и эта гипербола является также образом прямой R
при отображении посредством вектор-функции #—►(ch*, shx).
{Ср. окружность б2 + т)2 в 1, | — cosx, T1 = sin а:; см. § 4.)
Тогда
ch х = /1 + sh2 x = (1 + sh2 x)x,\
shx = (ch2x-l),/2 при х>0,
sh*-- (ch2x- 1),/2 при х<0.
Отсюда можно вывести формулы, аналогичные следующей:
sh * sh x
th* =
ch* (l+sh2*)I/2
Формулы сложения. Из основного свойства ех • еУ = ех+У для
любых х и у выводим, что
sh (х + у) = sh х ch у + sh у ch x,
ch (a: + у) = ch # ch у + sh x sh #.
Формулы умножения. Точно так же получаем
sh2x = 2sh#ch#,
ch 2x = ch2 x + sh2 x,
+ьо — 2 th*
xnzx- i + th2* *
Отсюда
H-ch2A: = 2ch2A:,
l-ch2*=-2sh2*.
Тогда
1 - ch 2x +h2
l + ch2*~ ХП *>
ГЛ TV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
573
откуда
1-th2* > ° ^ l-th2x "
Замечание. Эти формулы не представляют большого
интереса. Обычно предпочитают пользоваться выражениями,
включающими в себя лишь показательные функции и
логарифмы.
Пример. Для вычисления S = sh х + sh 2х + ... + sh пх
пишем
n n
2 ekx = 2 (e*)k есть сумма п первых членов геометрической
прогрессии со знаменателем ех. Поэтому
^ 1 е(п+\)х_ех { е-(п+\)х__е-х _
~~~ 2 е*-1 2 в~*-1 ~~
= J ! (Мп+1/2) х + />-(я + 1/2) * _ Рх/2 _ />-*(2\ __.
ch(n+l/2)*-ch(*/2)
2 sh (ж/2)
§ 4. Действительные тригонометрические функции
Эти функции были определены в Книге III, гл. VII, разд. III
при помощи ё1. Если z = ix (x действительное), то
е1* = zos х + isin х.
Из разложения в степенной ряд функции ezy при z = ixy
выводим
со
*-2^-('-т+-+(-«-таг+-)+-
rt=0
/ X3 *-2«+I \
•••+ф-1г+---+(-1)"(£тж+---)-
Отсюда
, V (-1)**2" . __У (-\)пх2п + 1
COS*-^ (2д)! > Sin*-^ (2/1+1)! '
Из е'* = cosх + isinx и е-** = cosх — isin л: перемножением
получаем
cos2 х + sin2 x = 1.
574 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Функции л;—►cos* и л;—►sin* определены и непрерывны для
всех х\ это периодические функции с периодом 2я. При этом
cos а: обращается в нуль при х = (я/2) + kn (k — любое целое),
a sin л: обращается в нуль при х = &я.
Имеем sin \Л- — х) = cos х\ поэтому cos \Л — х\ = sin x.
Для хфп/2 + kn определяем функцию tg: tg л: = sinAr/cos.*:;
это непрерывная функция с периодом я. Полагаем
ctg* =
Имеем
tg х sin х
ctg* = tg(-J -х)
(х Ф kri).
что
Производные. Из выражений для cos* и sin* заключаем,
D sin х = cos x, D cos x = — sin x.
Затем получаем
ZMg* =
sin2 x + cos2 x
cos-2 л;
= tg2X+l.
Возрастание. Функция sin неотрицательна при O^x^.
<Ся (тос12я) и неположительна при я^д:^2я (пкк!2я).
Функция cos неотрицательна при
—я/2 ^С х << я/2 (то(12я) и
неположительна при я/2 •< л; << Зя/2 (то(12я).
Функция tg неотрицательна при 0«<
^х^.п/2 (mod я) и неположительна при
л/2<^д:<я (modя). Имеем
lim tg л; = + оо (mod я),
*-Mt/2-0
lim tg л: = — оо (mod я).
Х>Я/2+0
Напомним элементарную
геометрическую интерпретацию (рис. 43):
OP = cosa:, OQ = sin x, AT = tgx.
Рис. 43.
Выпуклость. Возрастание или убывание первых производных
функций sin, cos, tg показывает, на каких интервалах из R
эти функции выпуклы или вогнуты. Можно также использовать
знак второй производной: так, D2sinA: = —sin a:, D2cosa: =
= —cos x\ следовательно, sin и cos выпуклы на любом
интервале, где они отрицательны.
ГЛ. IV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
575
Максимум, минимум. Так как |sin#|sg;i, |cosa:|^1 (a: —
действительное) и
sin (у + 2kn) = 1, sin (-у- + 2/гя| = — 1,
cos 2kn = 1, cos (я + 2kn) = — 1,
то здесь находится относительный максимум и минимум этих
функций.
Графики. См. рис. 44, 45, 46.
Обратные отображения. На всяком интервале, где одна из
предыдущих функций строго монотонна, можно определить
обратное отображение, которое обозначается через Arcsin, Arccos,
Arctg с указанием, какой
интервал выбран. Через arcsin, arccos,
arctg обычно обозначают
функции, . определенные следующим
образом.
1° arcsin.
Через х —► arcsin х
обозначается обратное отображение к
сужению на [—я/2, + я/2] функции
#-»sinA;. Функция arcsin
определена, непрерывна и строго
возрастает на [—1, +1].
arcsin х читается как «дуга, синус которой равен х» или
«арксинус х».
Если положить у = arcsin х, то, по определению, х = sin у,
•—я/2 < у < я/2, — 1 <#< +1; у возрастает от —я/2 до я/2,
когда х растет от —1 до +1 (рис. 47).
Рис. 46.
576
КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Так как производная от х по у равна, cos у, то производная
от arcsinA; равна 1/cosr/. Но у^[—я/2, +я/2]; поэтому cos у J> О,
и значит,
cos у = + |Л — sin2 у = У\ — л:2.
Следовательно,
£> arcsin л; =
D arcsin x = + оо для л; = + 1
(- 1<х<+ 1);
и л; = — 1.
Разложение в степенной ряд в окрестности точки х = О
получается почленным интегрированием степенного ряда для
1/У1 — х2 = (1 — л:2)^]/2с учетом того, что
arcsin 0 = 0. Имеем
(1^х2Г1/2==1+4+...
ЬЗ-5.
2-4.6-
•J2£±X*n+...(\x\<\),
arcsin л: = л; + -
. 1 -3. ..
•(2л)
•Х+ ...
.(2л-1) *2л+1
2-4-
•(2л)
2л + 1
(1*1<1).
Замечание. Если х задано на
[—1, +1], то решения уравнения лг—sini/
от у легко находятся при помощи одного
из них. Если уо — решение, то все другие
записываются в виде у0 + 2kn или я— уо + 2£я, где k
принимает все целые значения, положительные, отрицательные или
нуль. Стало быть, счетное множество всех функций
arcsin + 2&я, я — arcsin + 2kn
представляет собой множество обратных отображений к
функциям, равным sin на интервалах [—я/2 + пя, я/2 + мя].
Это множество обозначается через Arcsin и является
многозначной функцией (ср. функцию Ln в комплексной
плоскости).
2° arccos.
Через х -+ arccos x обозначается обратное отображение к
сужению на [0, я] функции #-*cosa;. Функция arccos определена,
непрерывна и строго убывает на [—1, +1].
arccos х читается как «заключенная между 0 и я дуга,
косинус которой равен х» или, короче, «арккосинус х».
ГЛ. IV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 577
Если положить у = arccos х, то, по определению, х = cos у,
0-<г/^я, —1<<д:-<+1; у убывает от я до 0, когда х растет
от —1 до +1 (рис. 48).
Производная от х но у равна —sin у; стало быть,
производная от arccos а: равна —1/siny.
arccos
Рис. 48.
Т
orctg
Рис. 49.
Так как 0 s^t/^я, то sinf/^O, и sint/=]/l — cos2# = У \ — х2.
Следовательно,
и arccos х = . .
Разложение в степенной ряд в окрестности точки х = О
находится путем почленного интегрирования разложения для
— (1, — x2Ym с учетом того, что arccos0 = я/2. Получаем
я 1 xz
arccos л; = у — х — -^ * ""з"
1-3-
2-4«
(1*|<1).
»(2д--1) г
2/1+1
•(2л)
2л+1
Замечание. Очевидно, что arccos a: + arcsin х = я/2, что
позволяет сразу же получить все свойства для arccos из свойств
функции arcsin.
3° arctg.
Через х —► arctg x обозначается обратное отображение к
сужению на ]—я/2, +я/2[ функции A:->tgx Функция arctg
определена, непрерывна на R = ]—оо, +оо[ и строго возрастает от
—я/2 до я/2.
arctg л: читается как «заключенная между —я/2 и +я/2 дуга,
тангенс которой равен х» или «арктангенс #».
Если положить (/ = arctg*, то, по определению, x = tgj/,
—я/2 < у < я/2, и x^R\ у возрастает от —я/2 до +я/2,
когда х растет от —оо до +оо (рис. 49).
19 Ш. Пизо, М. Заманский
578 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Производная от х по у равна 1 + tg2y = 1 + х2\ стало быть,
Z)arctgA:= {+x2 ;
производная есть рациональная функция от х.
Для |л:| < 1 имеем
7TF=l-^ + ^+ ••• + (-1)**2л + ...
Отсюда, учитывая, что arctgO = 0, получаем
arctg*=*-^- + ^- + ... + (-1)».2^_ + ... (|*|<1).
Замечание. Как мы уже заметили, несмотря на то, что
функция *-* 1/(1—а:) определена для всех хф\, следует пи-
сать 1/(1 — х)= 2 *п лишь для | х |< 1.
о
То же самое имеет место и здесь для функции л;—►arctgx;.
§ 5. График действительной функции
действительного переменного
Мы приведем некоторые соображения относительно
графического изображения действительной функции действительного
переменного.
Утверждение, что функция / действительного переменного х
задана на интервале / из R, означает, что каждому х е /
ставится в соответствие действительное число f(x). Способы
установления этого соответствия даже на практике бывают в
высшей степени различны и не позволяют указать общего
«построения» или «конструкции» графика в интуитивном понимании этих
терминов. Так обстоит дело с функцией, равной 1 для
рациональных (соотв. иррациональных) х и 0 для иррациональных
(соотв. рациональных), с непрерывной не дифференцируемой
функцией, которую можно определить как равномерный предел
последовательности непрерывных функций, имеющих графиками
ломаные линии, с функцией, равной sin(l/A:) для хФО и 0 для
х = 0, и т. д. Даже употребление элементарных функций, как
в последнем случае, не позволяет указать такого «построения».
Напомним еще, что среди технических средств, позволяющих
«задавать» функцию, имеются также следующие: интеграл от
а до х функции /, степенной ряд, ряд многочленов,
рациональные дроби, тригонометрический ряд, решения дифференциаль-
ГЛ. IV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
579
ных уравнений, интеграл от а до ft по переменному t, от
функции (х, t)—► /(#, t) двух действительных переменных и т. д.
То, что излагается ниже, теоретически применимо к самым
общим случаям, практически же — к функциям, полученным
в результате конечного числа элементарных алгебраических
операций над элементарными функциями.
1. Первая производная. Ее знак свидетельствует о
направлении изменения /, а ее возрастание или убывание — о
выпуклости или вогнутости /. Значения х, в которых первая
производная обращается в нуль, могут быть точками относительного
максимума или минимума.
2. Вторая производная. Ее знак указывает на выпуклость
или вогнутость /.
3. Асимптоты, а) Если при х, стремящемся к (конечному)
а справа или слева, или же, сообразно случаю, с двух сторон,
f(x) стремится или к +оо, или к —оо, то прямая х = а
называется асимптотой.
б) Точно так же, если при х, стремящемся к бесконечности,
{(х) стремится к (конечному) Ь, прямая у = Ь называется
асимптотой.
в) Если при х, стремящемся к бесконечности, значение f(x)
стремится к +оо или —оо и если существует такая прямая,
выражаемая линейной функцией у = ах + Ь (ауЬ — конечные),
что lim (f (х) — ах — Ь) = 0, снова говорят, что прямая у = ах + Ь
есть асимптота.
г) Вообще, если существует такая функция ф от х, что при
рассматриваемых условиях lim (f(x) — ф(л;)) = 0, то говорят, что
график функции ф является асимптотой графика функции /.
Часто асимптотические разложения позволяют найти ф.
4. Пределы. Можно в некоторых точках х0 путем разложе*
ний в окрестности х0 определить поведение функции f и, в
частности, найти lim /(а:), если этот предел существует.
Х->Хй
Примеры. 1. Определим / следующим образом:
f(x)= V(x- 1)(л: — 2) для *<1, х>2;
/(*) = - У(х-\)(2-х) для 1<*<2.
Можно рассматривать / как сумму ф1 и ф2, причем ф1 = /
на ]—оо, 1] и [2,+оо[, ф1 = 0 на [1, 2]; ф2 = / на [1, 2] ф2 = О
2# з
на С [1,2]. Имеем D^ (х) = , —--. Если через D2<pi(x)
2 У (X 1) \Х 2)
обозначена вторая производная, то
^,(*)---f((*-i)(*-2)rw;
19*
580
КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
/)ф1<0 при х<1, Dcpi >0 при х>2, Д2ф1<0. С другой
стороны,
Z)ffi2 (х) = —г "" =г;
/)ф2<0 при *€=[—1,3/2 [; £ф2>0 при ] 3/2, 1]; £>ф2(3/2) = 0.
При х = 3/2 функция / имеет минимум.
Наконец, когда х—► +(»,
/(*>-«*- ЩХ-2)Г = (х>(1-±)(1-1))т =
= ,(1_1Г(1_|Г = ,(1_^ + о(1))(1_1+о(1)) =
Значит, у = х — (3/2) есть асимптота при л;->+оо. Когда же
,^—.,м-И'-±)('-4)Г"*('-7П'-Г.
ибо У*2*58 - х для л: < 0. Отсюда /(л:) = — х + 3/2 + о(1).
ч\<^
«■
\\ .
\ ч
Ч/
И
^ 1
]
0 /
я
Рис. 50.
Рис. 51.
Начертим график функции f (рис. 50). График функции ф1
есть ветвь равнобочной гиперболы, а график функции фг —
полуокружность с центром х = 3/2, у = 0 и радиусом 1/2; эти два
графика гладко «соединяются» на оси х, т. е. первые производные
слева и справа равны (—оо при х = 1 и +оо при х = 2).
2. Пусть / определена как f(0) = 0 и f(x) = ei/x(l + хг) для
л: =£0. Для хФО имеем Df(x)
№
(2х*-х2-
1). Поскольку
Df(x) имеет тот же знак, что и 2хъ— х2—1, то мы исследуем
при хФО функцию ф: ф(л;) = 2л;3— х2—1. Имеем D<p(x) =
= 6л;2 — 2х = 2*(3л; — 1). Dy(x)>0 при *<0 или х>
1 . г. / ч .Л Л ^ ^ 1
>у; £ф(х)<0 при 0<x<j.
Имеем lim ф(*) =
оо,
ГЛ. IV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 581
(1 \ 28
-о*) = — «5=-, lim ф(х) = + оо. Согласно одной из
основных теорем о непрерывных функциях, ф обращается
в нуль лишь один раз, для значения дг0> 1/3, а именно <р(1) = 0.
Стало быть, ф<0 при х<1, ф>0 при лг>1, ф(1) = 0. Из этого
•следует, что Df{x)<0 для х<0 и для 0<x<l; Df(x)>0 для
jc > 1. Кроме того, lim f (x) = + оо, lim / (х) — 0. Наконец,
жогда х-^оо,
^d+^-l+l+^+^ + o^J + ^ + ^ + ^+^+o^)-
+£ + •$■
=^2+х+4
Следовательно, парабола у = г* + л: + (3/2) служит асимптотой
<рис. 51).
11. КОМПЛЕКСНЫЕ ФУНКЦИИ ОДНОГО
КОМПЛЕКСНОГО ПЕРЕМЕННОГО
Пусть / — функция, которая комплексному числу г,
принадлежащему некоторому множеству из С, ставит в соответствие
^комплексное число Z,
Z-/(2).
Мы ограничимся несколькими элементарными
соображениями, касающимися представления геометрических
преобразований, которые осуществляются этими функциями (ср. теорема
Даламбера). Исходя из этого, мы будем
считать z точкой метрической евклидовой
плоскости, a Z — точкой другой такой же
шлоскости.
Мы рассмотрим семейства функций /, ко- | ри л%
торые будут определены на С и будут зави« Х/*^0"^
сеть от одного или нескольких параметров. q\
Эти семейства могут образовывать группы,
«а чем и основывается интерес к ним'. Рис. 52.
Приведем несколько примеров.
1. Пусть имеется функция z—►г + а, где а — заданное
комплексное число. Обозначим эту функцию через /а,
fa(z) = z + a.
Тогда всякой точке г плоскости ставим в соответствие точку
z + а, полученную из z переносом т а (рис. 52). /о есть
тождественное отображение. Суперпозиция (композиция) двух
/
/
582 ~ КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
функций /а, fb определяет произведение двух переносов; fbof<*
есть функция г-*(г + Ь) + а = z + (а + й). Следовательно,
fb°fa = fa+b = fa ° fb-
Имеем также
f of =f of =f , f of = f , f off of\=*(f of\of
'a '0 '0 la 'a' 'a '-a 'O' 'a \'b 'c) \] a ' b) ' c-
Это есть те свойства, которые определяют абелеву группу^
2. Пусть а есть комплексное число с модулем 1, т. е. а — е{®
(9— действительное). И пусть
fe(z) = az = emz.
Таким образом, определены вращения с центром О net
угол 9.
h ° /е'== U ° /е = W>
так как fe°fe, есть функция z->em(eie'z) = е^е+0,)г. Имеем
4We0o/e*e/Wkofe*);
fe°/o = fo°fe = fe;
Вращения вокруг О тоже образуют абелеву группу.
Вращения с центром z0 определяются соответствием
z -> eiQ (z — z0) + z0.
3. Пусть k есть действительное число, и пусть
fk(z) = kz.
Тем самым определены гомотетии с центром О и
коэффициентом k.
Имеем
fk0f\==fi°fk== fk>
и если k Ф 0, то
fi есть тождественное отображение. Гомотетии с центром О и
ненулевым коэффициентом k образуют абелеву группу.
Гомотетии с центром Zo и коэффициентом k определяются
следующим образом:
г -> k (z — z0) + zQ.
4. Пусть а — отличное от нуля комплексное число и
fa{z) = az.
ГЛ. IV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 583
Имеем a = \a\eiQ\ fa представляет собой композицию вращения
с центром О на угол 9 и гомотетии с центром О и
коэффициентом \а\. Тем самым определено подобие с центром О.
Имеем снова
fa°fb=sfb0fa = fab
fa°(fb°fc) = (fa°h)°L
fa* f I-fa,
fa°f\la = fv
Подобия с центром О образуют абелеву группу. Гомотетии
и вращения с центром О являются ее подгруппами.
Замечания. 1) при а = —1 получаем симметрию
относительно О.
2) Заменяя 9 на 9 + я, получаем 2 —►—az.
5. Симметрии относительно точки z0 определяются следую-
тцим образом: fzo (z) = — z + 2zQ, или —^—^^o- Здесь fz ofg,
есть перенос 2(zQ — z'0)t ибо — (— z + 2z'^ + 2z0 = z + 2 (z0 — z'0)t
Следовательно, во множестве симметрии композиция двух
симметрии не определяет внутреннего закона.
6. Если к есть отличное от нуля действительное число, то
преобразование Z «= k/z есть инверсия с центром О и степенью /г.
В самом деле, если z = reie, то z = re~m, ~ =—eiB = —rZ.
' * ' 2: г г2
Стало быть, точки z, 1/2 и О лежат на одной прямой. Кроме
того, | Zz | = к — = I & |. Если произвести композицию инверсии
с центром О и степенью к' на инверсию с центром О и
степенью k, то получится преобразование z->-r-z> т. е. гомотетия
с центром О и коэффициентом k'/k.
7. Преобразование z~*z есть симметрия относительно
действительной оси.
8. Преобразование z-+l/z может рассматриваться как
композиция симметрии относительно действительной оси на
инверсию с центром О и степенью 1, ибо
\/z = (Щ.
Замечание. Преобразование z—► 1/z, равно как и
преобразование z-+k/z, не определено при z = 0.
Добавим к множеству С элемент, обозначаемый оо и
являющийся, по определению, пределом любой
последовательности (zn), для которой lim |zrt|=+оо. Условимся, что если
М-»оо
f(z) есть многочлен, обращающийся в нуль при 2 = 0, то
1//(0)=оо; что если f(z) есть многочлен, то /(оо)=оо, и
1//(оо) = 0. Если f(z) = P(z)/Q(z) есть рациональная дробь, то
584 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
при 2, стремящемся к оо, f(z) имеет предел, которым может*
быть и оо. Условимся, что /(оо)== lim f (z)*
2-Х»
9. Дробно-линейное преобразование.
Рассмотрим отображение С в С, определенное следующим образом:
az + b
cz + d *
где а, й, с, d — четыре заданных комплексных числа. Для того
чтобы эта функция от z не была постоянна, необходимо и
достаточно, чтобы ad — ЬсфО, что мы и предполагаем. Если за-
менить а, 6, с, d на Яа, Xb, Kct Ы (ХФО), то получится та же
функция. Стало быть, достаточно предположить ad—be = L
Такое преобразование Г, или функция, называется
дробно-линейным. Оно представимо также в виде обратимой квадратной,
матрицы 2-го порядка,
с:)-
Множество этих преобразований (при условии ad — be = l)r
зависит от трех параметров.
Понятия, относящиеся к матрицам, позволяют
сформулировать следующие свойства:
Г Композиция двух дробно-линейных преобразований есть
дробно-линейное преобразование (матрица есть произведение
двух матриц, взятое в надлежащем порядке).
2° Множество этих преобразований образует группу
относительно предыдущего закона. Группа эта, вообще говоря, не
коммутативна. Взяв a = d=l, с = О, получим z-+z + b\ взяв
Ь == с = 0, получим z -> az/d9 а при а = d = 0, получим z -> b/cz^
Если а Ф О и с Ф О, то можно написать
az+b а . Л
Если а = 0, с ф О, то
если а Ф О, с = 0, то
сг + d с ^ z + B '
az+b _ Л
'cz + d ~" г + В э
cz + d
Az + В.
Значит, дробно-линейное преобразование есть композиция
переноса, инверсии и симметрии относительно действительной оси,,
подобия, переноса. Стало быть, оно сохраняет величину углов.
Наконец, если для четверки чисел г4, z2, 2з, £4 назвать ан*
гармоническим или двойным отношением число, обозначаемое
ГЛ. IV. ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 585
-символом (2i, г2, г3, %ь) и определенное равенством
[ги z2i zs, z4)- 22_2з Zi_Z4,
то нетрудно показать, что ангармоническое отношение четверки
-£', zfv zrv z'A9 полученной из Zu 22, Zz, Z4 дробно-линейным
преобразованием, равно исходному отношению. Можно показать,
что это свойство характеризует дробно-линейные функции,
отличные от постоянных.
10. Замечание о тригонометрических и
гиперболических комплексных функциях. Исходя из ezf
определяем
sh Z = 2 » ChZ = 2 >
eiz + e"iz . eiz-e-iz
COS 2 = ^ » Sinze—g.
Здесь, как и в действительном случае, справедливы все
формулы, относящиеся к сложению и умножению, и мы опять имеем
ch2 z — sh2 z = 1, cos2 z + sin2 2=1.
Определение обратных отображений производится для каждой
из этих функций / путем решения относительно z уравнения
f(z) = Z. Изучение этих функций выходит за рамки настоящего
курса. Заметим только, что
ch iz « cos г, sh iz = / sin zy
m значит, в частности, если х действительно, то
ch/A: = cosA:, sh ix = / sin x, cosu; = chx, sinix = ishx.
Можно показать, что если z комплексно, то абсолютные
значения cos г и sin г могут быть больше 1.
III. ВЕКТОР-ФУНКЦИИ: ОТОБРАЖЕНИЯ * В R2
Пусть f — отображение интервала IczR в R2. Это есть
совокупность двух действительных функций х, у действительного
переменного t&I. Мы приведем несколько соображений о
методе, позволяющем в некоторых случаях изобразить множество
./(/) в плоскости /?2, т. е. то, что называется интуитивно кривой,
описываемой точкой (х,у), когда t пробегает /. Обратим
внимание на то, что если / — действительная функция
действительного переменное х е /, то (Д х) определяет вектор-функцию от
.t<sl:f(t)~f(x),x-t.
Чтобы* графически изобразить f(I), вначале изучают
отдельно функции х и у от t, а затем объединяют результаты
в таблицу, позволяющую рассмотреть одновременно изйене-
ния х и у.
586 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
В элементарных случаях /(/) представляет собой
объединение конечного числа таких множеств, что каждое из них яв~
ляется графиком действительной функции действительного
переменного х\ это имеет место, когда можно разбить / на конечное
число интервалов, на которых функции х, у строго монотонны.
t
Хг
X
У
1 У
-ОО -/-VT 0 -/+УТ / +00
+ +
-оо/ / 0
— оо / \ —оо
+ 0 -
- - +
-foo\ \ е / -+• оо
0 \ / 0 / +оо
- + +
Рис. 53.
Так как dy/dx = yf\x\ где х\ у' — производные
относительно /, то изменение dy/dx относительно х позволит исследовать
выпуклость. Имеем
JL[*!L\ = JL(JL\ -L
dx\dx) dt \х' J x'
на интервале, где х есть дифференцируемая строго монотонная
функция от L Отсюда
d Му\ х'у"-х"!/
dx[dx) х,г '
если эта величина >0, то соответствующая дуга /(/) выпукла.
В том случае, когда хну неограничены при /, стремящемся
к некоторому (конечному или бесконечному) значению t0y
асимптотические разложения в окрестности t0 часто позволяют уточ-*
нить вид функции /(/). Этим методом можно еще найти
асимптоты. Если, например, при t, стремящемся к бесконечности,
x(t)**at + b+o{l),
y(t) = a't + b' + o(l)9
где а, 6, а\ Ъ' — постоянные, то
a'x(t) - ay(t) = a'b - Ь'а + о{1);
прямая, определенная уравнением а'х — ау = а'Ъ = Ь'а, есть
асимптота.
Пример. Пусть х (t) = texl\ у (t) = (t - 1) е~** (t Ф 0). Имеем
х< (t) = £j-(t- 1), у' (t) = -^р- {t2 + 2t - 2); у' обращается в нуль
ГЛ. V. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
587
при t = — 1 — ]/3 и t = — 1 + УЪ. Когда t стремится к 0,
оставаясь положительным, x{t) стремится к + оо, y(t) стремится
к 0. Когда t стремится к 0, оставаясь отрицательным, x(f)
стремится к 0, y{t) стремится к —оо. Когда t стремится к
бесконечности, х и у стремятся к бесконечности; асимптотическое
разложение дает
У
.^3+± + о(1).
Отсюда х(0-у(0в4~ + о(у).
Значит, асимптотой будет прямая
JC — y — 4 = 0. Таблица (рис. 53) Рис.54.
резюмирует эти результаты.
При графическом построении можно учесть, что у'\хг
является в точке (x(t),y(t)) наклоном касательной. Дальнейшее
уточнение производится вычислением точного или
приближенного значения х, у при значениях /, обращающих в нуль
производные. Так, для / = —1 — ]/3 имеем y(t) < 0. Окончательные
результаты изображены на рис. 54.
Г Л А В А V
ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
В этой главе рассматриваются действительные ярусные
функции, определенные на ограниченном замкнутом интервале [а, Ь\
ъ
м интегралы J f(t)dt от этих функций.
а
Если / задана, то нахождение численного значения ее
интеграла состоит в нахождении приближенного значения этого
действительного числа. Методы многочисленны; мы укажем
некоторые из них, заключающиеся в замене f «более простой»
функцией, скажем ступенчатой. В особых случаях, когда f не-
лрерывна и при этом выражается посредством простых функций
(многочленов, рациональных функций, показательной
функции, ...), знание в явном виде примитивной F для / позволяет
588 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
вычислить интеграл по формуле
ь
F(b)-F(a)~jf{t)dt.
Однако знание примитивной F представляет интерес только
в том случае, когда эта примитивная сама тоже выражается
через простые функции. Это еще более частный случай, по
которому мы приведем некоторые соображения, иллюстрированные^
несколькими примерами.
^ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
ь
Приближенное вычисление интеграла | f(t)dt может быть
а
произведено путем замены f ступенчатой функцией <р. Если
найдена или построена такая функция qp, что
sup|f(*)-q>(*)| = ||f-<p||<e,
X
ТО
' Ь I Ь
j(f(t)-<p(t))dt <{|/(0-ф(*)|Л<(6-а)в.
а \ а
Ь
Значит, ошибка для J f(t)dt, получающаяся при замене f на фг
а
будет меньше чем г(Ь — а). Если наложить на /
дополнительные условия (непрерывность, дифференцируемость,
выпуклость, ...), то можно будет для выбранного способа
построения <р оценить е. Это как раз делается для случая ступенчатой
функции ф, получаемой делением [а, Ь] на конечное число
равных частей. Рассмотрим несколько частных случаев.
Г Допустим, что f непрерывна на [а, Ь\ и разобьем [а, Ь] на
п равных частей точками х0 = а, хи лг2, ..., хп = Ь. Стало быть,
положив h = (b — a)/nt получаем Xi = а + h, ..., Xh = a + kh
(& = 1,2, ..., n).
Рассмотрим ступенчатую функцию ф, определяемую
равенствами
Ф(х) = f (xk), если х€= [xk9 xk+x[ {k = О, ..., n- 1).
Ошибку \\f — ф|| обозначим через еп; она равна
e* = sup|/(*)-<p(*)l>
X
ГЛ. V. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
589>
и следовательно,
ert= max / sup \f(x)-q>(x)\\ =
= max( sup |/(*)-/(*л)|\
Интеграл от ф равен
/Ф(ол—^-2^*»)
fc«0
и называется усредненным значением функции /. Имеем
jf(t)dt—^-nj^f(xk)
ft=0
<en(b-a).
Допустим существование ограниченной первой производной:
|/'(*) |<ЛГ. Имеем
значит,
I/(*)-/(**) I-(*-**) IГ &)1<ЛА«';
е„ < max {hM') = МГ = -^- ЛГ,
J/w^—^S^*»)
k~Q
<tt^)!.M,.
Стало быть, ошибка имеет порядок не более чем 1/п. Но
в мажоранту этой ошибки входит т «= sup | f (х) |.
2° Можно также рассмотреть функцию ф вида
/(*») + /(*» + !)
ф(*) = -
, дсенцл^, #Л+1 [.
Тогда
a *«0 V 1
S/(**)
Ошибка еп мажорируется величиной
ел = тах( sup I fW -!Щ<Ь±й. I) =
* V*st*ft. **+![' ** 7
-4 max/ sup I/(**) + /(**+,)-2/(дг) | \
590
КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Этот метод иногда называется методом трапеций, так как
j\(t)dt^(xk+l-xk)nX")+l{X^)
ч
при />0 является площадью трапеции AkMkMk+iAk+l (рис. 55).
Заметим, что | <p(t)dt является также значением интеграла
ч
по интервалу [xk, xk+l] от функции
t^f(*kx+1)-n*k){t_Xk)+HXk).
именно fe+l k
Ч
Пусть теперь -ф есть функция вида
+ (х) - f(**-">~'<*»> (* -*Л) + f (xk), xe [**, *ft+I [;
графиком функции я|> будет ломаная линия с вершинами Mk.
Таким образом, мы подошли к оценке интеграла
ь
мь_
/(ft*)- + (*))<**.
Пусть е'п = sup | / (х) — г]) (х) |. Имеем
снова
е' - max I sup | / (*) - г|> (*) | \.
ы Но на [xk, xk+x\
**« f (*)-*(*) =
Допустим теперь, что f имеет ограниченную вторую
производную: |/"(х)|<Л!". Применяя формулу Тейлора, получаем на
Значит, е'„<Л2М", и
Рис. 55.
и
<в;(6-а)<-&=^Л1*
ГЛ. V. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
5^
Стало быть, ошибка имеет порядок не более чем l/п2. Но
в мажоранту этой ошибки входит Af" = sup| f"(x) |.
х
3° Если предполагать f выпуклой, то для оценки ошибки
можно использовать метод Понселе. Допустим, что / непрерывна и
выпукла на [а, Ь]. Покажем, что
(b-a)f(^)<Sf(t)dt<(b-a)na)+2nb) .
а
Действительно, так как / выпукла, то на [а, Ь]
f(x)<nb)bZfa(a)(x-a) + f(a).
Следовательно,
ъ ь ь
ff{t)dt<nb)bZfala) \{t-a)dt + f{a)\dt =
eIl^^.i^+/(a)(6-e)-(6-e)m±^.
С другой стороны, так как / выпукла, то в любой точке М
графика функции / найдется хотя бы одна прямая Д, лежащая
ниже графика функции f (это
свойство вытекает из того, что в каждой
точке существует правая и левая
производные и что левая производная
меньше или равна правой); когда в
точке х существует производная /',
прямая Д является касательной к
графику, т. е. прямой, проходящей через
М и имеющей наклон /'(#)•
Пусть теперь ф — функция, график
которой есть Д; ф (*)</(*) на [а, Ъ\
ь ь
Значит, J г|) (t) dt < \ f (t) dt. Если Рис. 56.
а а
взять точку М с абсциссой (а +■ Ь) /2 (рис. 56), то
о
^(t)dt = (b-a)f(l±±).
Это и доказывает наше утверждение.
Возьмем теперь д:0== а<хх<х2< ... <Jtn = й, xk+l—xk =
= (b — а)/п, и применим предыдущий результат к каждому
интервалу [xk, xk+l]. Обозначив через х'к середину интервала
592
КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
К> **+i]. т- е- x'k = {xk + xk+i)l2> получим
xk+l
ч
Отсюда, складывая, получаем
п-1 ъ
Л=0 a fc=0
Тогда в качестве приближенного значения интеграла | f(t)dt
а
возьмем одну из предыдущих сумм, которые снова являются
интегралами ступенчатых функций, именно функции, равной
*(xk + xk+A f(xk) + Hxk+\) г 1
П * 2 / или соответственно 2 на [л^, A:fe+i].
Ошибка будет меньше разности двух сумм; эта разность равна
Если предположить, что f имеет ограниченную вторую
производную, |f" (я) |^Af, то ясно, что
f(xk) + f(xk+i) Jxk + xk+i\
<T('4+i-*k)2M".
Стало быть, ошибка меньше чем
п-\
я-1
2|(**+1-**)зл*''==Е-
„у (Ь-аУ м „ ш J_ (Ь-аУ ЛГ_
fc=0
fc-0
Замечание. Мы лишь указали методы приближенного
вычисления интеграла. Более детальное исследование может
улучшить подсчет ошибки. Так, в 2°, изучая разность
а
можно показать, что если f" существует и ограничена, то
J f{t)dt-j<f(t)dt
^ 12 m n2 #
ГЛ. V. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
593
II. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ ПРИ ПОМОЩИ ПРИМИТИВНЫХ
В этой главе мы изучаем основные случаи, когда для
функции / действительного переменного х, значения которой могут,
однако, оказываться и комплексными и которая задается
посредством элементарных операций над функциями,
полученными из е* (хп, lnx, sin a:, sh#, агссоэд: и т. п.), можно найти
примитивную F, тоже выражаемую через эти функции.
п
1. Многочлены. Если f(x)= 2 я***| где х — действительное,
£!>0 — целое, аь, — действительное или комплексное, то
примитивная функции / есть многочлен
^W^S^T
k+i
поскольку для xk примитивная равна xh+l/(k + 1).
2. Рациональные функции. Любая рациональная функция f
единственным образом записывается (путем разложения на
простейшие дроби) в виде суммы многочлена и конечного числа
рациональных дробей вида А/ (х — a)ft, где х — действительное,
А и а — комплексные или действительные, k ^ 1 — целое.
Для нахождения примитивной, в целях вычисления интег-
*i
рала [ f(t)dt (при условии, что [x0yXi] не содержит ни одного
полюса функции /, т. е. никакой точки а), поступаем
следующим образом.
а) Если k > 1, т. е. если £>2, то примитивная для (х — a)~h
равна
(x-a)"k+l __ 1 1
-k+\ l-k ' (x-a)+k~l '
б) Если &= 1, то будем различать два случая: именно,
случай, когда а действительное, и записывать, что примитивная для
1/(х — а) равна In \х — а|, и случай, когда а = а + if)
комплексное, и, чтобы не привлекать логарифмы комплексных чисел,
записывать вначале
х-а ~~ х — а — /р ~" (х-а)2 + р2 (х - а)2 + р2 +1 (*-а)2 + р2 '
Примитивную для / *аТ2^о2 получим следующим образом:
1 1 \p/ n( i *-*\
J' TTT^T=TTn^w = D Ие —) •
594 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Стало быть, примитивная равна In Y(x — а)2 + р2. Примитивную
для / _а)2 + в2 П0ЛУчаем следующим образом:
р.+(«-.)• P'. + fi^.)1 i + iizi)'
Стало быть, примитивная для ^- равна
In У(* - а)2 + р2 + / arctg ^5-.
Замечание. Когда коэффициенты рациональной
функции действительны, разложение содержит попарно_сопряженные
члены, т. е. наряду с А/(х — a)h оно содержит и А (х — a)k, где
А и а — сопряженные к Л и а.
Пример. Пусть
f( v _ 2 (*2 + I)3 (х - 2) - б*4 + 12*3 - Юл:2 - 2* + 4
' W (x2+l)3(*2-2x + 2)
Находим
1 W (х-/)3 ^ (jc + 03 ^ (x — 1 — /) ^ x-\+i '
Тогда примитивная функции f равна
+ (/- l)arctg(>;- l) + -5-=iln(l +(дг- l)2) + (-i- l)arctg (л: - 1).
F (*) = (x%,)2 + In (1 + (x - l)2) - 2 arctg (x - 1).
Отсюда
Jf(/)d/ = F(l)-F(0)-4~ln2-T'
3. Случаи, сводящиеся к предыдущему. Г Пусть
/—рациональная функция. И пусть требуется вычислить на надлежащим
образом выбранном интервале интеграл
хч
где а — действительное число, отличное от нуля. Замена
переменного eat = и дает aeat dt = dut или dt = du/au\ и мы
ГЛ. V. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ 595
приходим к вычислению на [ЫЫ с х0 = еа*\ Х\ — еа^{ интеграла
a J . и у
т. е. интеграла от рациональной функции.
2° Пусть / — рациональная функция двух переменных, а —
действительное число; требуется вычислить
| /(cosax, $'max)dx.
Хч
Произведя замену переменного tg(a#/2) =/, получаем
cosa^-y^ , sin a* =7+72-» dx = ^ ' TWdt
и, следовательно, приходим к интегралу
a J 1 +t2 ' [ 1 + t2 > \-t*)ai>
т. е. к интегралу от рациональной функции.
Замечания, а) В последнем случае можно сократить
вычисление для функций f специального вида. Так, если / —
рациональная функция, то вычисление
Xi
J f (cos #) sin x dx
сводится к вычислению
- jf(t)dt9
1*
если положить cos a: = t, ибо sinArdA; = -—dt.
*i, li
Точно так же | / (sin x) cos x dx = j f(t)dt (/ = sinA:).
xo Ь
Xi
Для J f(igx)dx возьмем igx = t и получим
f'-Ш-л
J 1 + ^2 ai•
So
596 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
б) Особо выделяется случай, когда / — многочлен; тогда
Х\
все сводится к вычислению J s'mp x cos* x dx (/?, q — неотрица-
тельные целые).
Если р нечетно, p = 2k+l, то запишем
sin2*+1A:cos*A:dA: =
= sin2k x • cos* x • sin x dx = (1 — cos2 x)k cos* x d (— cos x)
*
Если q нечетно, то возьмем в качестве переменного sin л:.
Если же и р и q четны, то можно заменить sin а: на
^—9 а cos а: на ^ > что приведет к интегрированию
eimx (m_ целое); можно еще заменить sin2 а; на ~°2S x , a cos2at
на c2°s х , что приведет к понижению показателей р и q.
я/2
Пример. J sin4xcos6л:dA\ Имеем
о
sin4 х cos6 х = (sin a: cos a:)4 cos2 х = (-g sin 2л;j ( °20S j =
1 /l~cos4A:\2/t . п л
" a2"( 2 ) 0+cos2*) =
4=3 "128" ^ ~* 2 C0S 4* + COs2 *X) ^ ~*~ C0S ^ =
= ж (т""2 cos 4* + тcos 8*) ^l + cos2a:) -
256
e -йен- (3+3 cos 2a:—4 cos 4a: + cos8a:—4 cos 2x cos 4a:+cos 2a: cos 8#).
я/2 я/2
Так как f cos2ptdt = 0 (рфО целое), J cos 2pt cos2qt dt = 0
о о
(p, 9 — целые), то
л/2
Зя
J
sin4xcos6A:tfA: = *gj2
3° Случай, когда /—рациональная функция двух
переменных и где надо проинтегрировать
Xi
\ f(shax, chax)dx,
ГЛ. V. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ 597
сводится к п. 1, ибо shoa, chax являются рациональными
функциями от е™.
4° Пусть / — рациональная функция двух переменных, и
пусть требуется вычислить
Х\
*> J'(*. \fmy-
где т — целое положительное, и
Х\
б) ( f (х, У ах2 + bx + c)dx.
*о
J"1 f ах + Ъ
1/ сх + d
а) Пусть у—\/ —"ГТ% ^та замена переменного дает
b-dym
Х 'сут-а '
Значит, х есть рациональная функция от у и ее
производная— тоже. Стало быть вопрос сводится к интегрированию
рациональной функции.
б) Если же в подынтегральном выражении содержится
У ах2 + Ьх + су то мы находим замену переменного,
руководствуясь следующими соображениями. Можно написать
ax> + bX+c = a(x> + ±X+i) = a((X + ±)2+^).
В зависимости от знака разности 4ас — Ь2 полагаем
, Ь У4ас-Ь2 U4 , Ь УЬ2- 4ас . ,
*+2^ = J—Та Sh' ИЛИ Х + -2а- = Та Sln''
Тогда Vах2 + Ьх + с, с точностью до постоянного множителя,
равен ch t или cos t. И вопрос сводится к п. 2° или к п. 3°.
Можно поступить иначе. Рассмотрим график функции
х -> У ах2 + Ьх + с. Пусть у = У ах2 + Ьх + с. Множество точек
(#, у) плоскости, для которых
у2 = ах2 + Ьх + су
представляет собой коническое сечение. Это будет гипербола,
если а > О, эллипс, если а < 0, и парабола, если а = 0. Более
частным является случай а = —1, когда коническое сечение есть
окружность. Если а = 0, то мы имеем случай а) (в котором
c = 0,d=l).
598 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Теперь попытаемся рассматривать это множество точек как
множество значений вектор-функции t-^*-(x, у); будем, как
говорят, искать параметрическое представление этого
конического сечения. Могут представиться различные случаи.
Если а>0, то у - У ах2 + Ьх + с= У~а (г2 + А х + ^ЛШ —
-±*VT(l+£.l + i--i-),/2. Тогда
,-±,уг(1+£.1+£.^+о(1))-
Тем самым показано, что асимптотами являются
— Ь
y = x}^ + —F=r, y=-xVa -
2Va * v 2Va '
Положим y = xYa +t, т. е. будем находить пересечение
гиперболы с_прямой, перемещающейся параллельно асимптоте.
Имеем 2txYa + t2 = bx + c, и
c-t*
х = —г ,
т. е. получена рациональная функция от t. Далее, у = х Уа + t —
тоже рациональная функция от L
Если а < О, то, поскольку выражение ах2 + Ьх + с должно
принимать положительные значения, то этот трехчлен имеет два
действительных корня, и мы можем написать ах2 + Ьх + с =
= —а(х — а) (Р — х) (а^х^.^). Теперь приравняем y = t(x — а),
т. е. будем находить пересечение эллипса с подвижной прямой,
проходящей через точку (а, 0) конического сечения. Получаем
t2(х - а)2 = -а(х - а)ф- х),
t2 (х — а) = — а (р — х).
Отсюда выражаем х, а затем у в виде рациональных
функций от /.
Замечание. В действительности между двумя
приведенными точками зрения нет никакого принципиального
различия, ибо в первом случае коническое сечение представимо
параметрически посредством тригонометрических или
гиперболических функций.
Xi
Примеры. 1. Пусть а<х0<х{<Ь и /=( у ^~ dx.
Хч
г. х — а ,9 п a + bt2 . 2(b — a) t dt
Положим -^Z7 = *. Получаем х= 1 + ;2 > dx==1 n+p)2—•
ГЛ. V. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ 599
Отсюда
где
и мы пришли к интегрированию рациональной функции.
о
2. Пусть требуется вычислить / = Г х Ух2 + 2х + 2 Лс. Можно
-1
написать х2 + 2х + 2 = (х + I)2 + 1 и положить л: + 1 = sh t. Тогда
х = — 1 для 7 = 0, и если через 9 обозначено такое число» что
1 == sh 9, то, учитывая, что dx = ch t dt> получаем
в ее
/= J(sh*-l)ch2*df= Jch2/sh/^- jctftdt.
О 0 0
Имеем
е е
Jch2*sh^:= Jch2^(ch0 = [£^1|==y(ch39---1),
о о
о о
Hosh9 = l, ch29~-sh29=1^значит, ch29 = 2 исЬЭ-У^
Далее, sh29 = 2sh9ch9 = 2 У2. Следовательно,
/.^VT-D-Jf-f
Для вычисления _9 запишем ее — е-0 = 2, или в20 — 2ев—1=0,
откуда в0 = 1 + У2 и 9 = In (l + У2). Окончательно
/-^-4-ln(l + V2).
Другой способ состоит в том, чтобы рассмотреть у =
= Ух2 + 2а: + 2, а затем положить y = x + t. Тогда у2 = а:2 + 2а: + 2У
(x + t)2 = x2 + 2x + 2, x = ^=^yf y = x + t =**-** + * , tf* =
/2 + 2/ 2
= 2(t-1)2 *"• Чтобы определить значения |0, |i, между
600 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
которыми должно меняться t> проведем исследование функции
i->(2 — t2)/2(t — 1). Так как х меняется от — 1 до 0, то могут
подойти прежде всего те значения /, которые дают выражению
(2 — t2)/2(t_ — 1) отрицательное значение или нуль; значит,
будет -У2 <*<1 или У2 <*.
С другой стороны, у = Ух2 + 2х + 2 положительно, и стало
быть,
t2-2t + 2 (/-1)2 + 1
У 2(*-1) 2(*-1)
должно быть положительно, а это требует, чтобы t> 1.
Итак, нужно брать значения /^ ]/2, для которых
—1<х40 и у>0.
Для а: ==—1 имеем t2 — 2t = 0, т. е. / = 0 или £ = 2; значит,
мы должны брать go = 2. __
Для а: = 0 имеем 2 — t2 = 0,jr. е. / = У2 или f = — У"2;
значит, мы должны брать |, = У2.
Окончательно
YT
У"" 8 J (/-I)4 аг"
2
Поскольку ^2 — 2/ + 2 = (/ — 1)2 + 1, то
(t*-2)(t*~2t + 2)* _,,2 0v (/-1)Ч2(<-1)Ч1 __
(/-I)4 Kl z; (>-1)4
./2-2 + 2(^-2)^ + ^^
Далее пишем /2 — 2 = (/— 1 + I)2 — 2 = (^ — I)2 + 2 (/— 1) — 1.
Окончательно получаем выражение
'"^f-l (/-l)2 ^ (*-l)3 (;-1)4*
примитивная которого равна
Вновь найдем для предыдущее значение,
если заметим, что ]/2" — 1 «* 1/{У% + 1).
4. Использование интегрирования йб частям. Г При
вычислении интегралов может представлять интерес использование
интегрирования по частям.
Приведем несколько примеров.
ГЛ. V. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ 60f
Х\
а) Пусть нужно вычислить Г хпехdx {п^О — целое).
Полого
х
жим 1п = J xnex dx. Имеем
Хц
X Х\
1п- J* xnd(ех) = [хпех]*-п j xn~]exdx.
Хц #0
Значит,
jn~x«ex>-x%ex>-nln_v
Стало быть, мы получили рекуррентную формулу, которая
Х\
сводит вычисление 1п к вычислению /0 = J ех = еХх — еХо.
Хо
Вообще, если Р — многочлен от х, то таким путем вы-
Х\
числяется I Р (х) ех dx.
Хо
Х\
б) Этот способ годится для вычисления J P(x)eaxdx>
Хо .
где Р — многочлен с действительными коэффициентами, а
число а может быть комплексным; тогда х—>еах есть комплексно-
значная функция действительного переменного х.
В частности, так можно вычислять
Х\ Х\
Г Р {х) cos ал; dx или J P (х) sin ax dx
(а — действительное), ибо
eiax + em
cos ax = о » sin ax
eiax + e-iax ^ eiax_e-Hix
2/
в) Пусть р и <7 —Делые неотрицательные числа, и пусть
нужно вычислить для 0<лг0<*1
Хх
1Р,Я= J xp{\nx)qdx.
602 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Запишем
Xq Xq
Следовательно,
Таким образом, вычисление интеграла IPtQ сводится к
вычисли
f xpdx.
Х\
лению
Xi
г) Интегралы вида [л;р (arcsin л:)*7^, | xp (arsh x)q dx и т. п.
Хц Xq
также могут быть вычислены интегрированием по частям.
Xi
Так, J xp (arcsin л;)dx после интегрирования по частям дает
х9
Xi
Г хр~х
J vr^W dx (^1<a:q<a:i<1).
Но можно также произвести замену переменного. Если х =
Xv Si
— sin/, то arcsinx ==/, и J xp(arcsinx)qdx = J ^siri7/ costdt
Xq £o
(cm. 6)).
2° Интегрирование по частям с успехом применяется иногда
при отыскании рекуррентной формулы. Приведем несколько
примеров, из которых некоторые иллюстрируют также
вычисление интегралов от рациональных дробей.
Я/2
а) Пусть требуется вычислить /n= J sin^d* (n— целое
о
неотрицательное). Имеем
я/2
/„=1 s\rin"lxd{—cosa:) =
о
Я/2
= [ —s\nn~x x zos х§12 + (п — 1) [ sin*""2 x cos2 x dx =
о
Я/2
= (п - 1) J sin"-2* (1 - sin2 x) dx = (n- 1) (/д_2 - /Л),
ГЛ. V. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ
60S
Отсюда
/г/д = (л-1)/п-2.
Теперь будем различать случаи п = 2р и п = 2р + 1.
Если п = 2р, то
2pI2p = (2p-l)I2p„2i
(2p-2)I2p-2 = (2p-3)I2p-4i
Отсюда
2/2 — /о — -у •
/ = il ЬЗ-5- ... -(2/7-1)
/2Р 2 ' 2.4-6- ... .(2р)
Если п = 2/7 + 1, то
(2p+l)/2p+1 = 2p/2p-lf
3/3 = 2/! -2.
Отсюда
т 2-4-6- ... *(2р)
,2Р+1~~ ЬЗ-5- ... -(2р+1) '
я/2
Точно так же вычисляется интеграл /„ = | cos^jcrfA: или
о
же производится замена переменного х = (я/2) — /, которая
приводит к равенству Jn = In.
Когда рациональная функция с действительными
коэффициентами разложена на простейшие элементы и сопряженные
элементы сгруппированы, то может оказаться, что нужно
интегрировать, в заданных пределах,
Xi
aX + b dX
Xi
I
где n — целое, a x2 + px + q не имеет действительных корней-
Замена переменного приводит к двум типам интегралов:
Г xdx Г d*
J (х*+\)п> J 0*2 +1)* •
Пусть
*0
Т — I Х^Х
п~~ J (*2+l)"'
*0
€04 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Если п Ф 1, то
_ f xdx 1 Г rf(r>) 1 1 Г 1 Т
ln" J (*2+1)а 2 J (*2 + 1)Л 2 1-n Lu2+l)n-1J.
*o
Если я = 1, то
'.-|-?fv-ij'-^-4nn(i+^:.
Точно так же
/rt== J (*2 + l)*H(*2 + l)*Le + 2n J (*2+ i)n+l dXe
Отсюда
/rt " [ C^TTf] ' + 2nJn ~~ 2n/"+1 и 7l * *arctg *&
Этот метод применим также для вычисления
5. Вычисление интегралов на некомпактном интервале.
Вернемся к определению. Если, к примеру, речь идет о вычислении
+ 00
Г f(t)dt с заданной точностью е, то, после того как мы убе-
а
димся, что этот интеграл сходится, можно будет указать
такое 6, чтобы
+ оо
/мл
<-j> а затем, с точностью до ошибки,
\ъ I
меньшей чем е/2, каким-либо способом вычислить интеграл
\f{t)dt.
Если можно указать примитивную F функции /, то пишем
f f{t)dt = F(b) — F(a) и находим предел F(b) при 6, стремя^
а
щемся к+оо. ^
а
Ь
ГЛ. V. ВЫЧИСЛЕНИЕ ИНТЕГРАЛОВ 605
Если ^(+00)= lim F(b), то
+ оо
j f(f)dt = F(+co)-F(a).
о
+ 0О
Примеры. 1. J 1+/2 ■ Но поскольку J { t2 — arctgа и
о
lim arctg « = я/2, то
Г <** = я
J 1+/2 2#
2. /== * , рассматриваемый как lim I . х
0 &-И-0*
Полагаем * = sin2*; когда 0<*<1, имеем 0^*<~*
Тогда
л/2
/_- Г 2sin /costdt __
J sin / cos / ~Я'
0
3. In~ J e~ftn~l dt (n — натуральное). Имеем
о
Так как lim e~a.— =0, то
/V'<" л-±/,-*•*.
О О
т. е.
00
А так как /|=s J e-'dt=l, то /д+1«я!
606 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
ГЛАВА VI
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
Определения. Пусть F есть функция п + 2 действительных
или, иногда, комплексных переменных. Дифференциальным
уравнением называется соотношение вида F(x,y,y'9... ,r/<n))=0.
Решением этого дифференциального уравнения называется
действительная (или в некоторых случаях комплексная) функция у
действительного переменного х, имеющая для любого х из
некоторого открытого интервала производные у№> порядка h^Cn
и удовлетворяющая соотношению F(x, y,yf,..., */<n)) = 0.
Может оказаться, что некоторые из величин х, у, у', ..., у^-1)
не фигурируют в F. Наивысший порядок входящих в F
производных называется порядком дифференциального уравнения.
Примеры. Уравнение у'2 — у2 — х = 0 есть
дифференциальное уравнение первого порядка.
{/" + У — 0 есть дифференциальное уравнение второго
порядка; оно не содержит х и у'.
у{п) _ о есть дифференциальное уравнение порядка п\ оно
не содержит х, у, у\ ..., у^п"^.
у' — f(x) = 0 есть дифференциальное уравнение первого
порядка, которое подробно изучалось в Книге III. Если f(x)
непрерывна, то примитивная F функции f является решением
этого уравнения, и любое решение имеет вид у = F(x)+ С, где
С — произвольная постоянная. Следовательно, это
дифференциальное уравнение имеет бесконечно много решений. Можно
еще написать эти решения в форме
X
у= jf(t)dt + C,
Хо
где х0 принадлежит интервалу определения функции /. По
аналогии с этим уравнением решению любого дифференциального
уравнения дается название интеграла.
Если / — непрерывная комплексная функция
действительного переменного х, то можно написать f{x) = g(x) + ih(x)>
где g{x) и h(x)—непрерывные действительные функции. Тогда
решениями дифференциального уравнения y' — f(x)=0 будут
комплексные функции действительного переменного х,
определяемые равенством ^
X X
у= J g{t)dt + i J h(t)dt + C.
Xq Xq
Дифференциальное уравнение, заданное в виде
yM = f{x,y,y', ..., </(п-'>),
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 607
называется уравнением в разрешимой (относительно старшей
производной) форме. Так, y'~f{x) имеет разрешимую форму.
Когда F линейно по у, у\ ..., у^п\ дифференциальное
уравнение называется линейным дифференциальным уравнением.
Тогда оно имеет вид
fl«Wy(n,+ ••• +Я1 (x)yA+a0(x)y = b (х).
Функция b называется правой частью уравнения: если b = 0,
то дифференциальное уравнение называется уравнением без
правой части.
Так, f/,/ + y = cosA: есть линейное дифференциальное
уравнение второго порядка с правой частью; у" + у = 0 —
соответствующее уравнение без правой части.
Когда все решения дифференциального уравнения
выражаются при помощи интегралов, будем говорить, что
дифференциальное уравнение может быть проинтегрировано в
квадратурах; однако это исключительный случай.
Часто бывает удобно рассматривать у как кривую у = у(х)
в системе осей Ох, Оу. Такая кривая называется интегральной
кривой.
Обозначения. Руководствуясь практическими
соображениями, мы часто будем во всей этой главе обозначать функцию не
через /, а через f(x), смешивая, таким образом (вопреки
исходным соглашениям), символы f и f(x).
I. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ ПЕРВОГО ПОРЯДКА
§ 1. Уравнения с разделяющимися переменными
Уравнения с разделяющимися переменными. Рассмотрим
семейство кривых Г, представленных уравнениями вида
<р(*, у) = С,
где ф есть дифференцируемая функция (Книга III, гл. VII,
разд. II, § 1) действительных переменных х, у, а С —
произвольная постоянная. Тогда
d<f> = q£ (x, у) dx + q>'y (х, у) dy = 0,
т. е. на любой кривой Г наклон у* касательной удовлетворяет
соотношению
Ч'х(*> У) + Ч>'у(*> ?)/ = 0.
Обратно, рассмотрим предыдущее дифференциальное
уравнение. Если, допустим, у есть дифференцируемое решение, то
'* [*> У (х)] + у'у [х, у (х)] у' (х) является производной сложной
Функции у[х,у(х)]. При обращении этой производной в нуль
608 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
имеем ф[х,у(х)] = С, и функция у(х) удовлетворяет
соотношению ф(х,у) = С, т. е. представляет кривую Г.
Возьмем, в частности, дифференциальное уравнение вида
g(x) = h{y)y',
где g(x) и Л (у) ^непрерывные функции соответственно от х
и от у. Такое уравнение называется уравнением с
разделяющимися переменными. Заменяя в нем у' на dy/dx, получаем
g (x) dx-h {у) dy = 0.
X
Пусть G {х) = J g (и) du — примитивная функции g> а Н (у) =
= f А (о) do — примитивная функции А. Тогда
I/O
*(*) d* - А (у) df/ = Gx (x) dx - «J (у) dy - d [G (x) - Я (у)].
Следовательно, любое решение у(х) удовлетворяет также
уравнению
G{x)-H[y(x)]-C.
Иными словами, все решения получаются из равенства
х у
J g(u)du= \ A(y)dy + C,
Х0 1/0
где С — произвольная постоянная.
Итак, уравнение с разделяющимися переменными
интегрируется в квадратурах.
Пример. Рассмотрим уравнение
у'= (2*+ 3*2)(1+у).
Воспользовавшись понятием дифференциала, запишем
уравнение в виде
(2* + 3x2)dJC~T^- = 0.
x2 + xz есть примитивная для 2x + 3x2t а 1п| 1+у|—
примитивная для 1/(1+у); значит, x2 + xz- ln| 1 +у\ = Си где Сх —
произвольная постоянная. Отсюда выводим, что In 11 + у | =
= х2 + х3 — С,; значит, 11 + у I = е~С| • е*2+х\ и
у = Се*'+*'-1,
если принять С = е£~с>, где е = ± 1 имеет тот же знак, что и
1+у.
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 609
Уравнения, в которые не входит либо х, либо у. Если
уравнение имеет разрешимую форму, то или yf = f(x), или у' = f(y).
х
Первое сводится к квадратуре у= \ f(u)du + C; второе яв-
Хо
ляется уравнением с разделяющимися переменными и дает
у
йх^~Ш)* откуда ]-^==* + С,
Уо
причем через С всюду обозначается произвольная постоянная.
Если уравнение не представимо в разрешимой форме, то оно
записывается в виде F(x,y') = 0 или F (у, у') = 0. Предположим,
что известно параметрическое представление | = ср(/), г] = «ф(/)
кривой /7(|,ri) = 0, где ф и г|? — функции с непрерывной
производной. Для нахождения решения у = у(х) можно положить
р первом случае и
во втором случае. Отсюда получим
dy = ф (0 dx;
это соотношение, в соединении с dx = q'{l)di в первом случае,
приводит к равенству
dy = $(t)qf(t)dt.
t
Отсюда, положив Ф(/)= Г ф(и)<р'(u)du, получаем параметриче-
to
ское представление интегральных кривых: # = qp(/), у = ф(/)+С.
В случае же F{y,y') = 0 имеем dy = q'(t)dt\ следовательно,
t
если ф(/)¥=0, то dx^^-dt, т. е. положив ¥(*)=. j ^Ш duy
и
получаем параметрическое представление решения: д:==Чг(^) + С,
y = ty(t). Для значений t0 параметра t, для которых ф(/о) = 0,.
имеем ^[ф(^о),0] = 0, и */ = ф(А>) заведомо является решением,
ибо если у постоянно, то #' = 0. Эти решения не должны
упускаться.
Примеры. 1° Пусть имеется уравнение у* + Ъху* — 2х3 = 0.
Можно найти параметрическое представление кубической
кривой
г)3-2|3 + 3|г) = 0,
20 Ш. Пизо, М. Заманский
610 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
имеющей в О двойную точку, разрезав ее прямой г\ = fg.
Получим
r st з;2
5 — 2 - *3 > ^ ~~ 2 - *3 '
Таким образом,
3/ - _ з;2 ^
*— 2 — t3 } У— 2 — t3
Следовательно,
, QAl±£Ht и « б(1+;3)3;2^
ал "" (2-/3)2 и ау~~ (2-*3)3
Для того чтобы проинтегрировать последнее соотношение,
заметим, что Zt2dt есть дифференциал выражения t3y так что,
положив и = t3 — 2, получим St2dt = du и tf3 = и + 2, откуда
Стало быть, интегральные кривые имеют следующее
представление:
Л 2 - /з > J/ (2 - /3)2 *
Заметим, что, решая исходное уравнение относительно у', мы
получили бы
у* = ^xz+V~x^W + ^jfl-YW+jfr
2° Пусть имеется уравнение #2(*/'2 + 1)= a2f/'2. Можно найти
параметрическое представление кривой
|2(ri2+l)-aV = 0,
положив 1ц = ar\ sin t, I = ar| cos £. Таким образом, для у\ ф 0
имеем | = asini, T) = tg/,*т. е. # = asin/, dy = {gtdt. Первое
соотношение дает dy = a cos / d/, откуда
d* = a ^Ц*- Л = (-Дт- - asin f) Л.
sin r \ sin t J
Тогда
a: = a In
*4
+ a cos ^ + С, у = a sin *,
Эта кривая называется трактрисой. Дифференциальное
уравнение выражает тот факт, что длина отрезка касательной,
заключенного между точкой касания и осью Ох, постоянна и
равна а.
Для ц = у' = 0 имеем у2 = 0; функция у = 0 при любом х
заведомо будет решением дифференциального уравнения, Это-^
асимптота интегральных кривых.
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
611
Однородное уравнение. Рассмотрим семейство кривых,
гомотетичных относительно точки О. Поскольку касательные в
соответственных точках параллельны, то их наклон у' зависит
только от направления, выходящего из О, т. е. имеет место
соотношение вида
Однородным дифференциальным уравнением первого
порядка называется любое дифференциальное уравнение вида
y' = f(ylx).
Мы предполагаем, что функция f(t) непрерывна, когда /
принадлежит некоторому открытому интервалу. Тогда точки х, у
находятся в вертикальных углах, заметаемых прямыми у = tx,
когда t пробегает интервал.
Теорема. Однородное уравнение интегрируется в
квадратурах. В области, заметаемой прямыми у = tx, для которых
/(/)=££, интегральные кривые гомотетичны относительно
начала О. Если /о есть значение, для которого f(t0) = t0, то
прямая у = Ux является решением.
Для доказательства этой теоремы заметим, что если
положить х = СХ, у = CY, где С — постоянная, то дифференциальное
уравнение относительно У как функции от X будет иметь вид
*L = f(l)
т. е. будет исходным уравнением. Заметим далее, что если
в уравнении у' — ф(х) = 0 положить х = X, у = У + С, то
уравнение не изменяется.
Руководствуясь этим, положим t = у/х и w = In jл: | и найдем
дифференциальное уравнение dw/dt = F(w,t) для функции w
переменного t. Искомая функция F(w,t) должна оставаться
неизменной, когда заменяются: х на СХ, а у на CY, т. е. когда t
остается тем*же, a w заменяется на w + ln|C|, и значит, dw/dt
тоже остается неизменным. Отсюда следует, что F не может
зависеть от w, а тогда dw/dt = F(t), и уравнение сводится к
одной квадратуре.
ПроизведехМ указанные операции. Разрешим соотношения
t = у/х и w = 1п|л:| относительно х и у\ получим х = eew> где
е = +1 или е = —1; затем у = tx = ztew. Тогда dx = eewdw,
dy = eew(dt + tdm), откуда
dy __ dt + tdw 2 , ,v
dx dw ' "''
т. е. если /(/)— t ФО, то
dw 1
dt ~ t-f(t) •
20*
612 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
и значит, w*=Q>{t) + C't где
и
а С"— произвольная постоянная. Положив гес' = С, можем
считать С тоже произвольной постоянной, и тогда х = Сеф^\
у = Cte°V), что и дает нам семейство гомотетичных кривых.
Обратимся теперь к случаю, когда t имеет такое значение
/о, что f(to) — t0 = 0; тогда y/x = t0 и у' = /(/0) = *о, и значит,
прямая у = fox с наклоном /0 является решением, ибо линейная
функция у = t0x имеет производную у'= t0 = f(to) = f(y/x).
Заметим, что нет смысла вводить явно функцию w> так как,
положив у = tx, можно написать dy = tdx + xdt = f(t)dx, что
представляет собой уравнение с разделяющимися переменными
и дает непосредственно
dx __ dt
х ~ *-/(*) '
А поскольку dx/x = dw, то интегрирование завершается, как
и выше.
Примеры. Г Рассмотрим уравнение уг = у/х. Положив
у — £#, получим dy = t dx + x dt = t dx. Имеем f{t) = t при
любом /, и значит, решениями будут прямые у = t0x при
произвольном to. Здесь нет гомотетичных кривых.
2° Пусть имеется уравнение у' = *ах ^ ; положив y = txt
получим
//
У
_-.
__* + <*#
ах-у
\+at -
г dx,
откуда
* ~ 1 + *2
Л.
Из этого, интегрируя и называя постоянной интегрирования
—1п|С|, где С имеет знак переменного х, выводим
In £ = aarctgt----In(1 +t\
откуда
Kl-И2
Возвращаясь к л: и у, ибо £ = у/л:, получаем
v — I * ' pa arctg #/*.
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 613
отсюда, в силу того, что С имеет знак переменного х, получаем
V^T7=\C\eaarcisy/x.
В полярных координатах г и 0 это равенство имеет вид
-г = |С|еа0; получено семейство логарифмических спиралей,
гомотетичных относительно их асимптотической точки.
Вообще можно заметить, что переход к полярным
координатам переводит однородное уравнение в уравнение с
разделяющимися переменными. Действительно, так как интегральные
кривые имеют вид г = Сер (9), то
dr q/ (9) dQ
г Ф(9) •
И если # = rcos0, y = rsinQ, то
dx = dr cos 0 — r sin 0 dQ, dy = dr sin 0 + r cos 0 dQ, y/x = tg 0,
а значит,
dr sin 0 + r cos 0 dQ - (dr cos 0 - r sin 0 dQ) f (tg 0) = 0,
т. e.
dr f (tg 9) sin 9 -f cos 9 -ft
г /(tg 9) cos 9-sin 9 aW»
что и представляет собой уравнение с разделяющимися
переменными.
В случае, когда уравнение неразрешимо относительно
производной и имеет вид F(yfx,y')=* 0, мы снова предположим, что
известно параметрическое представление | = ср(0, Л = г|>(0
кривой F(l, r\) = 0. Получим
y = y(t)x и ||-=:ф(*),
откуда
dy = ф (/) afx + *q/ (/) rf< = г|) (f) d#.
Для значений t, для которых ф(/) — ф(0=£0> имеем
rfx _ tf(t)dt
х ♦(0-Ф(0>
откуда
* = Сеф(|\ y-CV(0^w.
где
*0
а С — произвольная постоянная.
WW- J ф(«)-ф(«)»
614 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Если ^о — такое значение, что ср(^о) =|Ф(^о), то линейная
функция y = y(to)xy т. е. прямая, проходящая через О, является
решением. \
Пример. Рассмотрим уравнение х2у'2 — (у2 + х2) = 0. Эта
уравнение однородно, так как оно записывается в форме
у/2 — (у2/х2)= 1. Положим
t/' = ch/, y/x = sht\
тогда dy = ch tdx и у = х sh t9 откуда dy = sh t dt + x ch t dt~
Следовательно, (ch / — sh t) dx = x ch t dt. Ho ch t — sh t = ег* Ф 0„
каково бы ни было t. Таким образом,
х 2 *
И
х e2t + 2t
In 4- =
С ~ 4 '
откуда получаем семейство гомотетичных кривых
x = Cew<*\ y = Cshtew«\ где w(t) = - 4
e2' + 2f
Здесь никакая прямая у = /0* не является решением.
§ 2. Линейные уравнения
Линейные уравнения. Рассмотрим семейство функций у =»
= Cg + h, линейно зависящее от параметра С. И предположим,,
что на некотором интервале g(x)=£0y a g и h дифференцируемы.
Тогда
s
и после дифференцирования и приравнивания нулю числителя
производной получаем
[y'-h']g-[y-h]g' = 0,
или еще:
Обратно, написанное соотношение выражает тот факт, что
числитель производной от у~ V* равен нулю, т. е. y = Cg(x)-f.
+ h(x), где С — постоянная.
Написанное соотношение является линейным
дифференциальным уравнением первого порядка.
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 615
Рассмотрим теперь самое общее линейное
дифференциальное уравнение первого порядка
ai(x)y' + ao(x)y = b(x)9
где ai(#)> Qo(x), b(x) — заданные функции, непрерывные на
некотором интервале; кроме того, предположим, что а\ (х) Ф О на
этом интервале. Попытаемся отождествить это уравнение с
предыдущим линейным уравнением. Имеем
У' =
Следовательно, должно быть
g'(x) _ оо(*)
8 (*) а\ (*)
Из первого равенства квадратурой получаем g(x); имеем
X
In gA = а (х), где а (а:) = .— а° у*\ du, a C0 — постоянная; значит,
g(x) = C0e*<*K
Нетрудно видеть, что а(х) есть непрерывная функция от х на
любом интервале, и стало быть, g(x)Ф0.
Из второго равенства, разделив обе его части на g(x),
получаем
а0(х) , Ь(х)
э1ТЬ
„ g(x)h'(x)-g'(x)h(x)
11 g(x)
_ b(x)
а, (ж)
\ 8 (х) ) аг (х)
*(*)'
т. е., положив
rv ' J М")#(и)
*0
с произвольной постоянной С, получаем
h(x) / ч
Итак: все решения линейного уравнения
ах (х) у' + а0 (х) # = Ь (х),
е котором а0(х), а{(х)у Ь(х) — непрерывные функции от х и
<а\(х)фО на некотором интервале, задаются равенством
y = y(x)g{x)>
где g(x) и у(х)— определенные выше функции..
616 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Можно заметить, что g(x) определяется уравнением
fliW^W + floWgW = 0, и значит, функция g(x) является
решением уравнения «без правой части», а\(х)у' + а0(х)у = 0,
соответствующего исходному уравнению. Это уравнение имеет
в качестве решений функции C0g(x), где С0 — постоянная. Для
получения решений уравнения с правой частью положим,
У = У(х)ё(х) и определим у(х) так, чтобы у было решением
уравнения. Имеем
y' = V'{x)g(*) + y(x)g'(x)>
откуда
ах (х) у' + а0 (х) у = ах (х) у' (х) g (x) +
+ fa (x) g' (х) + а0 (х) g {x)] у(х) = Ь (х)%
и
y'{x)ax(x)g(x) = b(x)\
но это есть найденное ранее выражение для v'M-
Следовательно, в решении Cog(x) уравнения без правой части
постоянная С0 заменяется функцией у(х)\ говорят, что «производится
вариация постоянной», и метод называется методом вариации
постоянной', таким путем приходят к уравнению, в котором
коэффициент при у(х) равен нулю, и значит, достаточно в
дифференциальном уравнении ах(х)у/ + а0(х)у = Ь(х) заменить yh
на y'(x)g(x), а у на 0.
Правило вариации постоянной. Для интегрирования
линейного дифференциального уравнения с правой частью сначала
интегрируют соответствующее уравнение без правой части\
затем постоянную интегрирования заменяют неизвестной функцией
и подставляют в уравнение; тогда неизвестная функция нахо^
дится квадратурой.
Стало быть, такое линейное дифференциальное уравнение:
интегрируется двумя квадратурами.
Пример. Пусть имеется уравнение
(l-x2)t/ + 2xy*=x + x\
Нужно разбить множество значений переменного х на три
интервала, на которых ах(х) = 1— х2фОу а именно: 1) х<— 1,.
2) |#|<1, 3) х > 1. На каждом из этих интервалов уравнение;
без правой части имеет вид
(1-х2)*/' + 2*у = 0,
у' 2х
у ~ х2-\>
у = С(х*-1).
т. е.
откуда
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 617
Далее, положив у = (х2 — 1) у (х), получим — (х2 — 1) V (х) =
= 4х + #3, откуда
>/ \ _ х + хг __ л: 2л:
YW- (ля — 1)» - а:2 — 1 (*2-1)2
YW--ylnU2~l| + -F^T + C,
и, наконец,
y = i(l-j^Inl 1-*2| + С(х2-1)+1.
Ясно, что #' бесконечно возрастает, если а: стремится к +1
или к —1, тогда как у стремится к 1 при любом значении С.
Свойства интегралов линейного уравнения. Мы видели, что
все решения уравнения
а{(х)у' + aQ(xfy = b (х)
имеют вид у = Cg(x) + h(x), где С — произвольная постоянная,
a g(x) — решение уравнения без правой части.
Г Если известно частное решение y = q>\(x) уравнения, то
найдется такая константа Си что q>i(Ar) = Cig(x) + h(x), и
значит все решения задаются равенством
y = (C-Cl)g(x) + ^l(x).
Стало быть, можно утверждать, что
Все решения уравнения с правой частью получаются путем
прибавления к частному решению общего решения
соответствующего уравнения без правой части.
Следовательно, в этом случае решения находятся одной
квадратурой.
2° Если известны два различных частных решения у = Ц)\(х)
и // = q>2(*), то <p\(x)=Cig{x) + h(x) и <р2(*)= C2g(x)+ h(х);
стало быть, фг(л:) — <р\(х) = (С2 — C\)g(x), и любое решение
имеет вид
// = С,[ф2(^)~ф1^)] + ф1(д:),
где С = (С — С\)1(С2 — С\) — постоянная, которая, как и С,
произвольна.
Таким образом, все решения уравнения с правой частью по-
яучаются без квадратур, когда известны два различных
частных решения.
Пример. Пусть имеется уравнение
{1-х2)у' + 2ху = 2х.
Замечаем решение у = I, ибо тогда у' = 0; соответствующее
уравнение без правой части (1 —х2)у' + 2ху = 0 имеет решение
618 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
у = С(х2—1). Стало быть, все интегралы задаются равенством-
*/ = С(х2-1)+1.
Можно было бы также заметить, что у = х2 есть решение, ибо*
тогда уг = 2х, и значит, все решения снова находятся по
формуле
*/ = С(*2-1)+1.
Предположим, что правая часть Ъ (х) имеет вид
b{x) = Xlbl(x) + X2b2(x) + ... + knbn(x),
где Хи ta, ..., Хп— постоянные, и что известны частные
решения yh — ук{х) уравнений
a](x)y' + a0(x)y = bh(x) для й=1, 2, ..., п\
тогда у = Х\У\ + Х2у2 + ... + Хпуп есть частное решение
уравнения
al(x)yf + a0(x)y = b(x).
Это предложение получается сразу; в самом деле,
аг (х) Ун (х) + % (х) yh (х) = bh (х).
Умножив это соотношение на Хн, сложив полученные
соотношения для h = 1, 2, ..., пи положив затем
У (х) = Ххух (х) + Х2у2 (х)+ ... + Хпуп (*),
получаем соотношение
<*i (х) У' (х) + а0 (х) у{х) = Ь (х).
Значит, у = у(х) есть частное решение уравнения
а1(х)у/-та0{х)у = Ь(х).
Это замечание часто используется для нахождения частных
решений.
Пример. Пусть имеется уравнение
епх— 1
где п — целое, п>-1. Имеем
епх~\
= 1+6»* + ... +е^п"1)х.
Но уравнение уг + у = (/г + l)ehx имеет в качестве частного
решения у — ehx\ следовательно,
y=\+je*+ ... +-i.e<i-i>*
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 619
<есть частное решение, а
и 1 л_
y = Ce-*+l+i-e*+ ... + 4-e(n~1)J
есть общее решение.
Уравнение Бернулли. Уравнением Бернулли называется
уравнение первого порядка вида
у' + а(х)у + Ь(х)у« = Оу
где а — показатель, аФО, аФ1, и где а(х) и Ь(х) —
непрерывные функции.
Это уравнение сводится к линейному уравнению, так как,
умножая его на у~а, получаем
у'у~а + а (х) yl~a + b (х) = 0.
Но у~ау' есть производная 1_а у1~а* Стало быть, полагая
w = у1-а, приходим к уравнению
w' — (а — 1) а (х) w = (а — 1) Ъ {х),
которое линейно. Значит, его решения имеют вид
w = Cg (х) + h (х),
где С — произвольная постоянная. Следовательно,
у = wW-*> = [Cg (x) + h (x)]w'a\
Пример. Пусть имеется уравнение х3у' — х2у + */4 = 0;
.положим w = у~ъ\ тогда получим x?w' + 3x2w = 3, откуда
оХ *Т" О I/O **
W= -г- И y=W-l!z = -
УЗх + С
Уравнение Лагранжа. Уравнением Лагранжа называется
дифференциальное уравнение первого порядка, линейное
относительно х и у.
Таким образом, это уравнение имеет вид
Предположим, кроме того, что ф и ф — функция с
непрерывными производными, когда переменное принадлежит
некоторому интервалу. Примем t — у[ в качестве нового
переменного; для этого выясним -сначала, какое постоянное у' = t0
может давать решение. Находим у + xy(t0) + ф(^0) = 0, у'=—q>{t0),
и значит, U удовлетворяет соотношению ф (/<>)+ h = 0. Обратно,
любое значение t0, удовлетворяющее последнему соотношению,
дает интегральную кривую у + xy(to) + ty(to) = 0, т. е. прямую
620 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
у = t0x — \|)(£о). Будем считать теперь у' = t переменным на
некотором интервале, на котором ф(/) + /=£0. Дифференцируя
уравнение по х, получаем
У' + Ф (УО + W (У') + Ф' (У')] ^г = 0.
Полагая теперь у' = t и считая л: функцией от t, получаем после
умножения на dx/dt
[< + ф(')]-зг + ^Ф/(0 + +/(0-0.
Это — линейное уравнение относительно х\ его решения имеют
вид
x = Cg{t) + h(t),
где С — произвольная постоянная. А так как при этом
у + л:ф(/) + \|)(/) = 0, то приходим, таким образом, к
параметрическому представлению интегральных кривых:
x = Cg(t) + h(t), y=-Cg(t)q>(t)-h(t)q>(t)-^(t).
Заметим, что параметр* / представляет собой у\ т. е. наклон
касательной к интегральной кривой в точке, соответствующей
этому значению параметра t.
Уравнение Клеро. Важным частным случаем уравнения
Лагранжа является тот случай, когда соотношение ф(/)-М = Ф
выполняется при любом /, т. е. когда ф(0== —t. И мы приходим
к такому определению.
Уравнением Клеро называется дифференциальное уравнение
первого порядка вида
y-xy' + ty(y') = 0.
Мы снова предполагаем, что ф имеет непрерывную
производную. Это уравнение имеет в качестве интеграла любую
линейную функцию у = t0x — ф(^о); эти интегралы зависят от
произвольной постоянной U. Предположив, что t = у' — переменное,
и продифференцировав уравнение Клеро по х, получаем
[-*+*'(</')]^=о.
В случае dy'jdx = 0 получаем только указанное решение.
Пусть dy'fdx Ф 0, т. е. —х + t|/(f/') = 0, а значит, х = г|/(/);.
из у = tx — ty(t) получаем y = t$'(t) — ф(0» что и является
параметрическим представлением интегральной кривой. В точке
(х, у) у соответствующей параметру t = to, имеем, у = t0x — *И^о)>
и наклон касательной равен tQ, т. е. наклону прямой; значит,
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 621
найденные вначале решения суть касательные к кривой
К уравнению Клеро приходят при отыскании кривой, когда
в любой ее точке известно какое-то свойство ее касательных.
Действительно, уравнение касательной в точке х = |, у = у(1)
к кривой у = у(х) есть у'(Ъ)х — у + [у&) — Ъу'(Ъ)] = Ъ. Если
свойство касательной выражается соотношением между
коэффициентами касательной, т. е. у(1) — \у'{\) будет функцией
_ф(0'(6)), то y(l) — W(l) + *W(l)\ = Q* и у(х) есть решение
уравнения Клеро
у-ху' + Ъ(уЧ = 0.
Пример. Пусть Т7 —точка с координатами (с, 0), a f —точка
с координатами ( — с, 0). Найдем такую кривую, чтобы
произведение расстояний от F и от F' до касательной было
постоянно и равно р ф 0. Алгебраическое расстояние от F до
касательной равно су , у~~ху . Алгебраическое расстояние от f
VV+i,
до касательной равно —су. У *g_ . Следовательно, (y — xtf)2 —
Vy'2+i
— с2у'2 = р (у'2 + l). Отсюда (у — *#')2 = (с2 + р) г/'2 + р. Положим
с2 + /? = а2; получаем у — хуг = е V а2у'2 + р, где е = + 1 или
Тогда интегральными кривыми будут прямые
y = tx + e УаЧ2 + р
и кривая, имеющая параметрическое представление .
_ — гаЧ __ ер
Х ~" УаЧ1 + р ' ^ "" УаЧ2 + р э
и полученные прямые в качестве касательных. Для этой кривой
х2 _ аЧ2 у2 _ р
а2 ~ а2*2 + р И У~"^2 + Рэ
откуда
а2 ^ р 1в
Кривая есть эллипс при /? > 0 и гипербола при р < 0.
§ 3. Общие рассмотрения
Интегрирование квадратурой. Все дифференциальные
уравнения первого порядка, изучавшиеся нами до сих пор,
интегрировались в квадратурах. Однако это обстоятельство является
исключительным; вообще говоря, уравнение y' = f(x,y) не
интегрируется квадратурой. В самом деле, мы покажем, что в
622 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
предположениях дифференцируемое™, для того чтобы уравнение
могло сводиться к одной квадратуре, оно должно удовлетворять
специальным условиям. Допустим, что f — дифференцируемая
функция и существует замена переменного и функции, а также
обратная замена, которые дифференцируемы, т. е. существуют
£, г\ и ф, ф, дифференцируемые и такие, что x = l(t,w),
y = r\(t,w) и t = у(х, у), w = ф(а:, у). Предположим, что при
этой замене уравнение y/==f(x,y) переходит в уравнение
w' = g('); решения последнего имеют вид w = G(t) + k, где G —
примитивная для g, a k — произвольная постоянная. Полагая
X = l{t,w + k)9 Y = r\{t,w + k), получаем dY/dX = f(X,Y), т. е.
уравнение у' = f(x, у) инвариантно относительно произведенного
над ним преобразования Tk, определяемого формулами
ф(Х, У) = <р(*, у) и ty(X, У) = я|э(*, у) + /5, что будет нами
записываться (X, У) = Tk(x, у). Множество преобразований Tk
образует коммутативную группу, ибо TkTh = /*+&. Итак, можем
сформулировать следующее утверждение.
Для того чтобы уравнение у' = f(x,y) могло интегрироваться
квадратурой при помощи замены переменного и функции,
необходимо и достаточно, чтобы существовала группа
преобразований, зависящая от одного параметра k и оставляющая
уравнение инвариантным-, эта группа определяется формулами
Ф(Х, У) == Ф(х, у), Ц(Х, У) = ф(*, у) + k,
где ф и ф — дифференцируемые функции, причем обратное ото-
бражение существует и дифференцируемо. Чтобы свести
уравнение к квадратуре, достаточно положить t = ф(д:, у), w =
= *K*i У)> тогда уравнение имеет вид dw/dt — g(t).
Чтобы доказать достаточность, надо провести в обратном
порядке предыдущее рассуждение. Заметим, что мы уже
использовали этот метод для однородного уравнения. В том случае
было ф (х, у) = у/х и г|) (а:, у) = In | x |.
Пример. Пусть имеется уравнение х2уп — у2 = х.
Положим х = аХ, у = рУ; тогда уравнение переходит в
р2(Х2У'2— У2) = аХ, где У = dY/dX; значит, оно инвариантно при
а = р2. Стало быть, можно положить Ф(х,у) = х/у2, ф (*,#) =
= 1п|*/|. Таким образом, х/у2 = t, \n\y\ = w, откуда а: = te2w,
у = ее™, где е = +1 или —1. Подставляем эти выражения в
исходное уравнение; для этого находим
dx = e2w{dt + 2tdw)\ dy = eewdw. .
Полагая w' = dw/dt, приходим к t2 (I ^2tw') ~~ 1 = '' Tt e# если
e'= ± 1
, t(\+2e'VTTt)
w =—- /.-■— >
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 623
что и является квадратурой. Для ее проведения положим
е' У\ +t = и; тогда
dw =
2u2du
откуда
(н2~1)(1-2«)
w=Tln
_J^f 2 1 3 ] ,
— 3 L 2« — 1 и+1 «~lJ '
(2ы-1)2
(и + 1)(«-1)3
^=сч^-1)1/3(-^5г-)4/3> ^=еС
+ 1пС,
(2«-l)2'3
(tt+l)l/3(tt-l)
Теперь интересно выяснить, можно ли доказать
существование решений дифференциального уравнения в более общих
случаях. Один из методов состоит в том, чтобы надлежащим
образом обобщить теорию определенного интеграла; он, в сущности,
позволяет показать, что если f(x) — непрерывная функция, то
уравнение £//==f(#) имеет решения. Однако мы не будем
приводить никакого доказательства и ограничимся тем, что
формулируем следующий результат.
Теорема существования. Пусть f(x, у) есть непрерывная
функция переменных (х, у) в области D; допустим, что в D
существует f (х> у) и что | f (х, у) | ^ М для любых (х, у) е D.
При этих условиях, какова бы ни была точка (х0, у0) из D,
дифференциальное уравнение
У' = !{*> У)
имеет, и притом единственное, решение у = у (х), которое при
х = х0 принимает значение у0, т. е. такое,. что у (х0) = у$.
Приложение. Рассмотрим линейное уравнение а\(х)у'+]
.+ а>о(х)у = Ь(х), т. е.
</' =
а, (х) У +
а, (х)
sf(x, у).
Если на некотором интервале функции а^(х), а0(х), Ь(х)
непрерывны по х, то /(я, у) непрерывна по (а:, у), если а{ (х) ф О на этом
интервале. С другой стороны, здесь f (х, у) = — -а° '*' , и
значит, на всем замкнутом интервале будет ' а° ■-■■
ах (х)
<М, где М
не зависит от х. Тогда на основании теоремы заключаем, что
если Хо принадлежит этому замкнутому интервалу и если у0
есть произвольное значение, то существует, и притом
единственное, такое решение у(х), что у(хо) — уо. Впрочем, этот
результат можно было бы получить и непосредственным
интегрированием, проводившимся выше.
624 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Пример. Уравнение ху' — у = х имеет в качестве решений
у = xln\x\ + Сх, где С — произвольная постоянная. Если
задать произвольно л;0, f/o, то можно определить С, если Хо Ф 0.
Для Хо = 0 имеем у = 0 при любом С; значит, если при х0 = 0
задать уоФО, то не получим ни одного решения, а если
положить уо = 0, то решением будет лишь у = 0. Стало быть,
теорема существования неприменима; действительно, здесь у' =
= f(x,y), где
/(*. У) = — У+1> значит, /^(*, у) = — •
и \f'y(x, у)\ не ограничено в окрестности х = 0.
Когда теорема существования применима, множество
решений уравнения y/,=:f(x,y) зависит от произвольной постоянной.
В самом деле, можно зафиксировать х0, и тогда два решения
у(х) будут различны, если различны значения у(х0).
Следовательно, можно утверждать, что решения зависят от
произвольной постоянной уо. В общем же случае, когда теорема
существования и единственности неприменима, это не так.
Рассмотрим, например, уравнение у' — Зу2/3 = 0. Имеем
у' = f(x, у) = 3#2/3; значит, f (х, у) = 2jrI/3, и следовательно,
f (х? у) | ^ М в любой области, определенной условием
|у|>6>0. Напротив, f'y(x, у) не определено при у = 0. Но
уравнение может быть проинтегрировано. Если у Ф 0, то можно
разделить на у; тогда оно будет уравнением с разделяющимися
переменными: -j у~2/3у' = 1, откуда у1/3 = х — С, где С —
произвольная постоянная. Стало быть, у = (х—С)3. С другой
стороны, у = 0 — тоже является решением, ибо тогда у' = 0. Если
задать x0j Уо, то имеется, и притом единственное, решение вида
у=*(х — С)3, где С = #0 — У0/3- Но если у0 = 0, то имеется также
решение у = 0. Здесь мы снова видим, что для */0 = 0 не имеет
места единственность решения.
Рассмотрим еще следующую функцию:
у (х) = (а: - C{)z для а: < С{,
у (а:) == 0 для С! < х < С2,
у (х) = {х — С2)3 для С2^х,
где Ci и С2 — две произвольные постоянные; так определенная
функция у (х) непрерывна, имеет непрерывную производную и
является решением дифференциального уравнения. Это
решение зависит от двух произвольных постоянных.
Геометрическая интерпретация. Дифференциальное
уравнение y/=zf(xfy) определением f ставит в соответствие каждой
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 625
точке (я, у) области D число у', которое можно истолковать как
наклон некоторого направления. Таким образом,
дифференциальное уравнение определяет поле направлений. Тогда
интегральная кривая есть кривая, касающаяся в каждой своей
точке направления из этого поля в этой точке; интегральная
кривая называется также силовой линией поля. После всего
сказанного очевидно, что если существует кривая Е,
касающаяся в каждой своей точке некоторой интегральной кривой,
т е. если Е есть огибающая интегральных кривых, то она сама
является интегральной кривой.
В этих точках теорема единственности уже не может
применяться, что позволяет иногда найти такие кривые Е, ибо в этих
точках f (х, у) не существует или же не ограничена.
Пример. Возьмем снова уравнение уг = Зу2/3 = / (я, у).
Производная f (#, у) не определена для у = 0. Прямая у = 0
есть интегральная кривая, огибающая для кривых у = (х—С)3;
действительно, для х = С имеем у = 0, и кривая у = (х — С)3
имеет здесь точку перегиба с касательной Ох.
Изучение некоторых полей направлений. Г Однородное
уравнение. Пусть у1=f(y/x). Направления поля,
соответствующие точкам, лежащим на одной прямой, выходящей из х = 0,
у = 0, параллельны.
2° Линейное уравнение. После деления на коэффициент при
у' линейное уравнение принимает вид у' = р(х)у + q(x).
Уравнение прямой с наклоном у', проходящей через точку (х0, у0),
имеет вид у — у о = [р(х0)у0 + q(x0)](x — x0)9 т. е.
[у - q (*о) (* - *о)] - у о [р (*о) (* ~ *о) +1 ] = о.
Каково бы ни было г/о, эта прямая проходит через общую
точку двух прямых
y-q (х0) {х~х0) = 0 и р (х0) (х - *0) + 1 = 0.
Если р{хо)фОу то эта точка задается равенствами
Х"Х° Р(*о)> У~ ТЫ'
Если же р(хо) = 0, то прямой поля будет y — yo = q(x)(x — x0);
она имеет фиксированный наклон q(x0), и значит, все прямые
параллельны. Итак, можно утверждать, что:
Поле линейного уравнения обладает тем свойством, что
прямые, соответствующие точкам с одинаковыми абсциссами, либо
сходятся в одной точке, либо параллельны.
Обратно, предположим, что поле направлений обладает
указанным свойством. И пусть у — у0 = m (x — х0) есть уравнение
прямой, соответствующей точке (х0,у0). Если х0 фиксировано,
626 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
а уо — параметр, то для того, чтобы прямые были параллельны
или сходились в одной точке, необходимо и достаточно, чтобы
они линейно зависели от параметра (линейный пучок прямых).
Следовательно, должно выполняться т = ру0 + q. Числа р и (/
зависят от выбранной абсциссы х0, и значит,
Отсюда вытекает, что дифференциальное уравнение,
соответствующее этому полю направлений, есть у' = р(х)у + q(x) и,
следовательно, линейно.
3° Уравнение Лагранжа. Пусть имеется уравнение Лагранжа
У + Щ(у') + Ф(у') — 0. Геометрическое место точек, для которых
направление поля постоянно и задается наклоном у' = ty есть
прямая у + xq>(t) + ty(t) = 0. Прямые, для которых этот наклон
совпадает с наклоном самой прямой, т. е. те, для которых
наклон U удовлетворяет равенству t0 =—ф(^о), СУТЬ частные
решения уравнения.
4° Уравнение Клеро. Пусть у — ху* + г|э (у') = 0 есть
уравнение Клеро. Здесь поле обладает тем свойством, что
направление, соответствующее точкам прямой у — tx + ty(t) = 0, есть
сама прямая. Тогда решение, которое не является прямой, во
всяком случае, будет огибающей этих прямых.
Ортогональные траектории. Пусть имеется семейство кривых,
зависящих от параметра С и представимое в виде ф(л:, у)= С.
Тогда через точку (х0, Уо) области определения функции ф
проходит, и притом единственная, кривая из семейства, для ко*
торой С = ф(х0, уо). Кроме того, предположим, что ф есть
дифференцируемая функция по а: и по у\ тогда в точке (лг0, уо)
кривая ф (л:, у) = ф (#о, Уо) имеет касательную, и вектор с
компонентами dxo, dyo, направленный вдоль этой касательной,
удовлетворяет соотношению
Ф* (*о> У о) dxo + 4>'у (*о> Уо) аУо = °-
Допустим, что для любой точки (а:, у) из D величины
Ф^(*> У) и Ф^С*» У) не обращаются одновременно в нуль; тогда
тем самым определено некоторое поле направлений.
Ортогональной траекторией в D к кривым ф (я, у)— С будем
называть любую кривую, касательная к которой в точке (л;, у)
ортогональна касательной к кривой С, проходящей через эту
точку.
Таким образом, ортогональные траектории к семейству
кривых ф(#, у)= С тоже определяют поле направлений, и 4>'х(х, у),
ф' (л:, у) есть вектор, имеющий направление, соответствующее
точке (я, у). Стало быть, ортогональные траектории к кривым
<р(х,у) =С получаются путем интегрирования дифференциального
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 627
уравнения
<Р'Х (х, У) dy - <р'у (х, y)dx = 0
и взятия х в качестве переменного, а у — в качестве функции,
когда ф^ (х9 у) ф О или у в качестве переменного, а а: в
качестве функции, когда q>'y(xf у) ф 0. Практически же, если
семейство кривых задается уравнением вида F(x, у, С) = 0, где F
дифференцируема, то, продифференцировав, получают
Fx (х, у, С) dx + F'y (x, у, С) dy = 0,
затем выражают С из первого уравнения и подставляют во
второе; наконец, заменяют dx на dy, a dy на — dx, т. е. dy/dx
заменяют на —dx/dy и полученное уравнение интегрируют.
Примеры. Г Пусть имеется семейство равнобочных
гипербол, заданных уравнением ху = С. Дифференцируя,
получаем xdy + ydx — О', затем, заменив dx на dy, a dy на —dx,
имеем xdx — ydy = 0. Это — уравнение с разделяющимися
переменными; его интегрирование дает
х2-у2 = С.
Стало быть, ортогональными траекториями будут тоже
равнобочные гиперболы, оси которых повернуты на угол дх/4
относительно исходных.
2° Пусть имеется семейство окружностей линейного пучка;
тогда х2 + у2 — 2Су + р — 0, где С — параметр, а р —
постоянная, являющаяся степенью точки О относительно всех
окружностей с осью Ох в качестве общей радикальной оси.
Дифференцируя и деля на 2, получаем xdx + (y—C)dy = 0. Первое
соотношение дает С — (х2 + у2 +.р)/2у\ подставив его во второе и
умножив на 2у, получим 2xydx + (у2 — х2 — p)dy=0. Заменив dx
на dy, a dy на —dx, приходим к 2xydy — (у2 — х2 — p)dx = 0.
Положим еще w=y2\ тогда dw = 2ydy, и xdw — (w — x2 — p)dx=
= 0; это уравнение линейно относительно w\ имеем *-, w =
= — л;2 — р;его интегрирование дает w = —х2 + р + 2С'х, где С —
произвольная постоянная. А так как w = у2, то х2 + у2 — 2Сх —
— р = 0, и мы пришли к ортогональному пучку окружностей,
имеющему Оу радикальной осью и —р — степенью точки О.
Линии наибольшего наклона поверхности. Пусть z = y(x, у)
есть уравнение поверхности. Линией уровня называется
геометрическое место точек, для которых z имеет постоянное знаке-
ние\ линией наибольшего наклона называется траектория,
ортогональная к кривым уровня. Следовательно, в проекции на хОу
линия уровня выражается уравнением
Ф (*,*/) = zo,
где г0 — постоянная.
628 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Если ф дифференцируема и если ц'х(х, у) и ц>'у(х,у) не
обращаются одновременно в нуль, то линия уровня имеет
касательную, параллельную плоскости хОу, и значит, проекция на
хОу ортогональной траектории будет ортогональной
траекторией проекции, и вопрос сводится к предыдущей задаче.
Пример. Пусть имеется поверхность (параболоид) 2-г =
х2 и2 х2 и2
в f- —. Проекция на хОу линии уровня дает |--*- = 2z0>
откуда, дифференцируя, получаем -i-^-+-^—^- = 0. Заменяя dx
, , , х dy у dx A *
на ay, a ay на —ах, приходим к уравнению —— — ——= О
с разделяющимися переменными: —^-= -£- — , которое в резул.ь-
У Q X
тате интегрирования приводит к y = C\xfq, где
С—произвольная постоянная. Вместе с уравнением 2г = —+ — этодает
уравнения ортогональных траекторий. При pq>0 все они
проходят через О; при pq<0 через О проходят лишь две иа
них —те, которые проектируются на оси Ох и Оу, тогда как.
остальные имеют в проекциях эти оси в качестве асимптот.
Замечание. Изогональные траектории. Аналогичный
метод позволяет найти кривые, пересекающие семейство ф(х, у) = С
под фиксированным углом а. Для этого достаточно в
уравнении
Ф; {*, у) dx + q>'y (х, y)dy = 0
заменить dx на cos a dx + sin a dy, a dy иа — sin adx + cos a dy.
Пример. Пусть имеется семейство равнобочных гипербол
ху = С. Дифференцируя, получаем xdy + у dx = 0, затем
заменяем dx на cos adx + sin a dy, a dy на —sin adx + cos a dy, что
приводит к
у (cos a dx + sin a dy) — x (sin a dx — cos a dy) = 0,
или еще (x dy + у dx) cos a — (xdx — у dy) sin a = 0.
Левая часть есть полный дифференциал; поэтому мы можем
после умножения на 2 записать
2ху cos a — (л:2 — у2) sin a = С,
где С — произвольная постоянная. Это будет семейство
равнобочных гипербол, полученных из ху = С поворотом на угол а/2,
поскольку уравнение семейства можно переписать в виде
2 [х cos -у + у sin -уд - х sin -у +1/ cos у) = С7.
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 629J
II. УРАВНЕНИЯ ВТОРОГО ПОРЯДКА
§ 1. Специальные типы
Вначале мы изучим несколько специальных уравнений.
Уравнение, не содержащее у. Такое уравнение имеет вид
F(x, уг, #") = 0. Принимая у' = w в качестве новой неизвестной
функции и оставляя х в качестве переменного, приходим к
дифференциальному уравнению F(x, w, w') = 0 относительно w, т. е.
к уравнению первого порядка. И если мы умеем интегрировать
это уравнение первого порядка, то у получается затем
квадратурой.
Уравнение, не содержащее х. Такое уравнение имеет вид
F(y, у\ у") = 0. Оно не меняется при замене х на х + С, где
С — произвольная постоянная. Стало быть, если принять х в
качестве функции, а у в качестве переменного (после нахождения
возможных постоянных решений у), то все сведется к
предыдущему случаю, т. е. к уравнению первого порядка
относительно dx/dy. А вместо того, чтобы искать dx/dy, можно столь же
успешно положить w = dy/dx и получить дифференциальное
уравнение первого порядка относительно функции w
переменного у.
Итак, для того чтобы проинтегрировать уравнение
F(y, у\ у") = 0, положим w = у\ откуда
" — ^w — ^w ' ^
у -~ dx "~ dy У '
и уравнение принимает вид F(y, w, ww') = 0, где wr — dw/dy.
Если в уравнении F(y,y',y") = 0 фигурирует только
квадрат производной у\ т. е. если мы имеем дело с уравнением
G (у, у'2, у") = 0, то снова проще всего положить у'2 = z\
действительно, тогда
с\ , п dz dz ,
и значит, поскольку у не постоянно, имеем у* Ф 0 и г' =
= dz/dy = 2y". Таким образом, уравнение относительно
функции z переменного у имеет вид
*G(y, zy\ /) = 0, где г' = ^.
В частности, если в уравнение не входит у', т. е. если мы имеем
Н(УуУ") = 0, то можно применить предыдущий метод, а
именно, положить z = у' \ тогда уравнение относительно функции z
переменного у примет вид H(y,z'/2) = 0, где z' = dz/dy, а она
уже интегрируется квадратурой.
•630 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Все эти случаи завершаются интегрированием уравнения
с разделяющимися переменными: в первом случае dx = dy/wt
~а в двух остальных случаях dx= ± dy/Yz.
Пример. Пусть имеется уравнение 2kyy" — (l +y'2) = o,
где k — отличная от нуля постоянная. Постоянного решения у
не существует, ибо тогда было бы у' = у" = 0, откуда 1 = 0.
Положим, следовательно, г = у'\ у" = г'/2, где z' = dz/dy. Тогда
.получаем kyz' — (l + г) = 0, т. е.
kdz dy
Уравнение непосредственно интегрируется и дает C(l+z)k = y,
где С — произвольная постоянная.
Теперь мы должны проинтегрировать уравнение
Принимая у' = t в качестве параметра, получаем
у = С (1 + *2)*, dy = 2kCt (1 + f2)*"1*,
dx = -4jL=*2kC(l+t2)k-ldtt
-откуда
о
где С— произвольная постоянная. При целых 2k получаем в
качестве х элементарные функции.
Замечание. Изученное только что уравнение выражает
тот факт, что кривая у = у(х) имеет радиус кривизны,
отношение которого к длине отрезка нормали между кривой и осью Ох
равно 2k.
При 2k = 2 получаем параболу с директрисой Ох.
При 2k = 1 получаем цепную линию с основанием Ох.
При 2k = —1 получаем окружность с центром на Ох.
При 2k = —2 получаем циклоиду с основанием Ох.
Линейное уравнение. Линейное уравнение второго порядка
имеет вид
а(х)у" + Ь {х)у' + c(x)y = f {х).
Мы предполагаем, что на интервале / функции а(х), Ь(х),
с(х) и f(x)y которые могут быть и комплексными, являются
непрерывными функциями действительного переменного х й
м{х)ф0.
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 631:
Г Уравнение без правой части. Допустим сначала, что f(x).=
= 0, так что
a{x)y" + b(x)y' + c(x)y = 0.
Теорема. Интегралы линейного уравнения без правой
части образуют двумерное векторное пространство.
Действительно, если у\ есть интеграл, то и Ху\ будет
интегралом, какова бы ни была постоянная X. С другой стороны,
если у\ и у^ — интегралы, то у = у\ + уъ — тоже интеграл, ибо
имеет место
а (*) (Ух + %)" + b (х) (у{ + у<2)' + с (х) (ух + у2) = 0.
Для того чтобы показать, что векторное пространство
решений имеет размерность 2, вначале предположим, что уравнение-
обладает по крайней мере одним ненулевым интегралом у —
= yi(x)y когда х лежит в интервале /.
Найдем теперь интегралы вида у = zyu где г есть
неизвестная функция от х (метод вариации постоянной). Подставляя
в дифференциальное уравнение, получаем
а (х) {z"yx + 2г'у\ + zy'[) + Ь (х) {zfy{ + zy[) + с (х) гух - 0.
т. е.
a(x)ylz/' + [2a(x)y[ + b(x)yl]z' + [a(x)y[/ + b{x)y[ + c{x)yl]z^0-
Последняя скобка обращается в нуль, так как у\ есть
решение уравнения и поэтому остается уравнение с разделяющимися
переменными относительно функции z' переменного х:
* L У\ а{х)\ Х'
Положим g (х) = — -jW-dt, тогда интегрирование уравнения:
С
относительно г' дает zf = —j-e&{x\ где С\ — произвольная
постоянная.
Далее,
r-cj
* e*®dt
9 + С>2 — CiZi+Co.
Функция Z\ не может быть постоянной, поскольку
Ух
*632 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Отсюда следует, что любое решение линейного уравнения без
правой части имеет вид
y-=zy{^Clzlyl+C2ylt
где С\ и С2 — произвольные постоянные. С другой стороны, две
функции z\y\ и у\ линейно независимы, ибо в противном случае
существовали бы такие две постоянные X и |ш, не равные
одновременно нулю, что
tefli + W/i = У\ (tei + М-) = 0.
Но, по предположению, у\ Ф 0, и значит, Кг\ + \х = 0, чего
не может быть, поскольку zi не постоянна.
Следовательно, векторное пространство интегралов имеет
.размерность 2.
Заметим снова, что если известен частный интеграл, то все
интегралы получаются двумя квадратурами.
Нам остается лишь установить существование ненулевого
интеграла у\ на /. Но если у есть интеграл, то Су тоже интеграл,
и поэтому мы полагаем v = ln|y|, или еще: у = eev, где е = +1
или —1, a v есть неизвестная функция от х. Приходим к
уравнению
га (х) ev (v" + v'2) + eb {x) evv' + ec (x) e° = 0,
откуда, учитывая, что ev ф 0, получаем
а (х) {v" + v'2) + b{x)v' + c {x) = 0.
Положив v' = u, получим для функции и переменного х
уравнение первого порядка
/ , 9 . Ь (Х) , С (х) Л
а (х) а (х)
так как а(х)Ф0 для х из интервала /.
Таким образом, и' = f(u,x)= -и2- -^у и - ~^- и f'u(и, х) =
а (х)
Если х принадлежит некоторому замкнутому интервалу,
содержащемуся в /, и если \и\ ограничено некоторой константой
U, то f (u> х) будет ограничено; кроме того, f(u,x) непрерывна.
Значит, по теореме существования, существует, и притом
единственное, решение и = щ(х), которое при х = х0 принимает
произвольное значение и0, удовлетворяющее условию \uo\<U. Тогда
существует функция v = V\(x), задаваемая равенством v\ = и{,
и, наконец, существует */i = eeV{; при этом, разумеется, У\(х)ф0
на некотором замкнутом интервале, содержащемся в /.
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 633
Вронскиан. Пусть у = у\(х) и у = У2(х) —два интеграла
уравнения
а(х)у" + Ь(х)у' + с(х)у = 0.
Вронскианом функций у{ и у2 называется w~yxy2 — у2у\..
Имеем wf = yly/2/-y2y[/) с другой стороны, 0 = yiy2-y[yr
Значит, а(х) w'+ b (x)w + c(x) • 0 = 0, т. е. a(x)w' + b (x)w = 0.,
Следовательно, w есть интеграл линейного уравнения первого-
порядка без правой части, и
dw Ь (х)
w а (х)
Полагая, как и выше,
/ \ Г МО
dx.
(0
dt
получаем w = Се^х\ где С — постоянная, определяемая
значением х0 переменного х, ибо тогда
w Ы = ^о - У\ (*о) У2 (хо) ~ У2 (*о) У\ (*о) и 8 Ы = °-
Таким образом, w(x)= w0es(x\
Стало быть, если w0 Ф 0, то w {х) Ф 0, каково бы ни было
#е/. В частности, если Ь(л:)=0, то вронскиан постоянен.
Точно так же, если известно у\(х), то
иг
\ Уг = У\\ ~2
(0
следовательно, #2 = #i 9 / dt + С I, где С' — произвольная
J МО
постоянная; и мы приходим к уже полученной ранее формуле.
Уравнение Риккати. Незадолго до этого мы рассматривали
уравнения, являющиеся частным случаем уравнения
z' + a(x)z2 + p(*) г + у (х) = 0,
где а{х)у P(#), у(х) —непрерывные дифференцируемые функции-
на интервале I и а (х) ф 0. Это уравнение называется уравнением
Риккати. Положим z = u/a(x)\ тогда уравнение, выражающее и
как функцию переменного ху после умножения на а (я) выглядит-
так:
и' + и* + [р(х)-^]и + а(х)у(х) = 0;
оно имеет вид уже встречавшегося нам уравнения.
634 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Положим у = eev, т. е. и = vr = у'/у, получаем
г </'
-т. е.
*{*)!/'+ [*{х)Ш-*'(х)]У' + *(х)у(*)У = 0.
Таким образом, с любым уравнением Риккати можно связать
линейное дифференциальное уравнение второго порядка без
правой части, и обратно.
С ле дет в и е. . Интегралы линейного уравнения образуют
двумерное векторное пространство, т. е. представимы в виде
у = С\у\ + С2у2- Отсюда следует, что
_ У _ С\У\ + С<#2
U~ у " С1У1 + С2у2>
л если положить C2/Ci = С, то
__ У\ + СУ2
W~ a(x)[yx + Cy2y
стало быть, можно сказать, что:
Интегралы уравнения Риккати находятся в дробно
рациональной зависимости от произвольной постоянной.
Обратно, рассмотрим семейство функций
р (х) + Cq (x),
У- g(x) + Ch(x)>
где р, q, g, h — дифференцируемые функции с непрерывной
производной, g и h — дважды дифференцируемые, их отношение
непостоянно, когда х принадлежит интервалу /, и ph — qg=£Q4
Имеем ghyZP = "" С» откуда получаем дифференциальное
уравнение семейства:
(8У ~ Р)' (% ~Я)- № - q)' (gy - р) = О,
т. е.
<ph-qg)y' + (hg'-gh')y2 +
+ [{ph' - hp') - (qg' - gq')\ у + (p'q - q'p) = 0.
Это есть уравнение Риккати; действительно, функция
"v'v; ph-qg
непрерывна и дифференцируема, а так как g/h не постоянно, то
hg' — gh! Ф0У и значит, а(х) не может обращаться в нуль для
всех х из интервала. Функции
p/rv (Ph'-hp')-(qg'-gq') ,, qp'~ pq'
непрерывны.
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
63&
§ 2. Линейные уравнения без правой части
с постоянными коэффициентами
Уравнения с постоянными коэффициентами. Такое
уравнение имеет вид
ay" + by' + cy = 0,
где а, Ъ, с— постоянные, афО\ стало быть, это уравнение имеет
интегралы, определенные для всех х.
Связанное с ним уравнение Риккати получится, если поло-
жить у = eev, е = +1 или — 1; тогда
av" + av'* + bv' + c = 0,
и если v' = uy то
* аи' + au2 + bu + c = 0.
Это — уравнение с разделяющимися переменными, и, если и.
непостоянно, то
adu __ __ -
аи2 + Ьи + с ~
Значит, оно интегрируется в квадратурах. Вместо этого мы
сначала выясним, может ли постоянная и = г быть решением.-
Сразу же получаем, что г должно быть корнем уравнения
аг2 + Ьг + с = О,
называемого характеристическим уравнением.
Пусть г есть действительный или комплексный корень
характеристического уравнения; тогда и = г есть интеграл
уравнения Риккати, откуда v = rx, и тогда у = егх есть частный
интеграл уравнения ay" + by' + су = 0. Практически же нет
необходимости переходить к соответствующему уравнению Риккати;
достаточно найти для уравнения ay" + by' + су = 0 интегралы
вида у = егх\ если эта функция является решением, та
егх(аг2 + Ьг + с) = 0, а значит, и аг2 + Ьг + с = 0, т. е. получена
характеристическое уравнение.
Если характеристическое уравнение имеет два различных
корня ги ?2, причем г\ ф г2, го отношение интегралов еГхХ и er*xf
равное e(r2~ri)* не постоянно, и значит, любой интеграл
уравнения ay" + by' + су = 0 имеет вид
у = схег* + С2ег*х9
где С{ и С2— произвольные постоянные.
Если Г\ и г2 действительны, то интегралы действительны, еслет
таковы Ci и С2. Если а, й, с — действительны, a r{ и г2
комплексны, то они будут комплексно сопряженными; пусть
^i = 6 + йгь г2 = g — хт|; тогда у. = еЩСхе*** + С2е~^х\
>636 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Числа е?Ч* и e~ix^x являются комплексно сопряженными, и
поэтому скобка может быть действительной только в том случае,
если С\ и Сг тоже комплексно сопряжены; положим
C{=±(C + iC), C2=±(C-iC')t
где С и С— произвольные действительные постоянные; тогда
у = el* [С ^—^ + 1С' 1 {■ ) ,
т. е.
у = е1х (С cos r\x — С sin г|л:).
Здесь снова частные интегралы i/i = e^x cos г|л: и у2 = е^хъ\п\\х
имеют отношением у^уг = tg r\x, которое непостоянно, и поэтому
найденная формула полностью представляет все интегралы
уравнения ay" + by' + су = 0.
Если г — двойной корень характеристического уравнения, то
г = — Ы2а.
В этом случае соответствующее уравнение Риккати имеет
вид
a da ___ da -
аи2 Л~Ьи + с (и — г)2 ~~
Интегрируя, получаем 1/(и — г) = х, т. е. и = г + (1/х) есть
частный интеграл. Далее имеем v = тх + \n\x\, и у = ev = гхегх
•есть частный интеграл уравнения ay" +by' + су = 0. Но
интегралы у\ = егх и у2 = хегх имеют отношением у2/у\ = х, и это
отношение непостоянно. Следовательно:
Ясли характеристическое уравнение имеет двойной корень,
ю все интегралы уравнения ay" + by' + су = 0 выражаются в
-виде
у = егх(Сх + С%
где г — —Ь/2а — двойной корень характеристического уравнения,
а С и С — произвольные постоянные.
Пример. Пусть имеется уравнение у" + Ку = 0, причем %
действительно. Характеристическим уравнением будет г2+%==0.
Г Если_ Я >0, то корни различны, а именно: г1 = /|/гЛ и
4Г2=--/У Я. Стало быть, все интегралы записываются
формулой
у = С cos iVlx) + С sin {V% х).
Замечание. Можно также представить интегралы в форме
y = Acos[V~h{x-<t>j\>
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 637
где А и ф — произвольные постоянные, связанные при этом с С
и С по формулам A cos(|/^<p) = С, Л sin (УЯф) = С7. Эта
формула имеет некоторые преимущества, но ее недостаток в том,
что в ней не выступает явно линейная зависимость у от
произвольных постоянных.
2° Если А, = 0, то имеем для г двойной корень г = 0.
Следовательно, интегралы задаются выражением
у = Сх + С
Впрочем, здесь само дифференциальное уравнение, которое
имеет вид у" = 0, показывает, что у есть произвольный
многочлен первого порядка.
3° Если Я < 0, то корни характеристического уравнения
будут гх = У —Л иг2=- У"—Я; значит, все интегралы
записываются по формуле
у-С^^ + Са*-*1^.
Замечание. Это решение может быть также представлено
в форме
y = Cch{xy-X) + C'sh{xV-x),
где С = С\ + С2, С = С\ — С2 — произвольные постоянные.
Уравнение, которое путем замены переменного может быть
сведено к уравнению с постоянными коэффициентами.
Рассмотрим уравнение ay" + byf + су = 0, где у есть функция
переменного /, а а, Ьу с — постоянные, причем а Ф0.
Положим £ = ф(л:), где ф монотонна и дважды непрерывно
дифференцируема с у'(х)={=0. Тогда dt = ф' (л:) dx, и мы имеем
dt q/ dx ' dt2 \ф' dx2 ф'2 dx) dt
Следовательно,
a d2y
Ф'2 dx2
\ф' ф' / dx
Положим ф7{х) = ц( v ; тогда — ~г = ^^\ , и мы приходим
к уравнению
аи2 (х) у" + и {х) [Ь + аи' {х)] у' + су = 0. (1)
Обратно, если и(х) есть ненулевая функция с непрерывной
производной, то подстановка
х
638 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
сводит уравнение (1) к уравнению вида
«-$• + * ! + с,-0.
Следовательно, общий интеграл уравнения (1) есть
y = Cler^{x) + C2er^{x\
если аг2 + Ьт + с = О имеет различные корни гч и гг, и
у = ё"М[СМх) + С2],
если аг2 + 6г + с = 0 имеет один двойной корень г.
Примеры. 1° Уравнение Эйлера. Возьмем и(х)=х для
х > 0. Тогда уравнение (1) превратится в уравнение ах2у" -f
+ (а + &)##' + су = 0, называемое уравнением Эйлера. Имеем
q/(#) = l/u(x)= 1/х, значит, t = lnx, и общий интеграл равен
у = d#ri + С2хГ2 или у = а:г(С11па: + С2).
2° Пусть и (а:) = У ах2 + 2рл; + у, причем х меняется в
интервале, где ах2 + 2р# + у > 0. Здесь уравнение (1) с а = 1,
6 = 0 принимает вид
(а*2 + 2р* + у) у" + (cu + Р) </' + су = 0.
Имеем
откуда <p(x) находится элементарно квадратурой.
В частности, если а = 0, P=l, y = 0» то имеем уравнение
2**/" + у' + су = 0;
при а: > 0
Ф'(*) = у= и q>(*Hl/2*.
Уравнение для у как функции от t есть у" + с*/ = 0. Таким об*
разом,
y = Cl^2lc|* + C2e-K2lcU, если с<0,
и
у = С cos (У 2с*) + С sin (l/2c*), если с > 0.
§ 3. Линейное уравнение с правой частью
Уравнение с правой частью. Пусть имеется уравнение
a(x)y" + b(x)y' + c(x)y-f(x).
Теорема. Интегралы линейного уравнения с правой частью
образуют двумерное аффинное линейное многообразие, получен*.
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 639
ное прибавлением к некоторому частному интегралу уравнения
с правой частью общего интеграла уравнения без правой части.
В самом деле, пусть у = ty(x) —частный интеграл уравнения
с правой частью. Положим у = ф (я) + и (х) и попытаемся
определить функцию и. Получаем
а №" + и") + Ь (г|/ + и') + c(ty + u) = f.
Но aty" + 6г|/ + сф = /, и значит,
аи" + buf + си = 0.
Следовательно, и есть общий, интеграл уравнения без правой
части.
Имеет место следующее свойство.
Предположим, что правая часть f(x) дифференциального
уравнения имеет вид f (х) = fi (х) + /2 (*) + ... + fn (#), и
предположим, что известен частный интеграл у = tyk каждого из
уравнений
a(x)y" + b(x)y' + c(x)y = fk(x) (й-1, ..., /г),
тогда \р(л:) = ipi (л:) + ^(х) + ... + tyn(x) есть частный интеграл
уравнения с правой частью.
Для доказательства этого результата достаточно сложить
п равенств a(x)^ + b(x)tfk + c(x)$k = fk(x) для 6=1, 2, ..., п.
Метод вариации постоянной. Для нахождения частного
интеграла уравнения с правой частью можно, и притом двумя
способами, применить метод вариации постоянной/
а) Допустим, что известен ненулевой интеграл у = у\(х)
уравнения без правой части. Тогда положим
Уввг(х)у1(х)
и определим z так, чтобы у был интегралом уравнения с правой
частью. Проводившаяся уже выше выкладка дает
а (х) ух (х) г» + [2а (х) у\ (х) + Ь (х) у{ (х)] z' = / (*);
это — линейное уравнение первого порядка относительно zf\ мы
умеем его интегрировать квадратурами; для этого достаточно
найти какой-нибудь его частный интеграл, и тогда еще одна
квадратура приведет к г.
б) Допустим, что известны два интеграла У\{х) и у2(х)
уравнения без правой части, образующие базис векторного
пространства интегралов этого уравнения. Положим y = zx {x)yx (х) +
+ z2(x)y2(x) и найдем такие функции гх и г2, чтобы у был
интегралом уравнения с правой частью и чтобы при этом
640 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
выполнялось соотношение z\yx + z2y2 = 0. Тогда
У' = гУг + *2У2 + г'\У\ + г'Ж e 2i#i + гЖ
и
^ = 2^ + 2^ + 2,^ + ^.
Подставляя в ay" + by' + cy = ff получаем
* {<У\ + ty% + ИГ + 6^I + СУ\) z\ + И" + Wi + *V2) ^2 = I
Но у, и //2 — интегралы уравнения без правой части; а так
как а (х) ф 0, то
я V -I- z'u' = -iiiL
Вместе с уравнением z^ + z'2y2 = 0 имеем относительно z
и г£ линейную систему двух уравнений с двумя неизвестными,
определителем которой служит вронскиан w = уху2 — у2у[, и
значит отличен от нуля. Из этого выводим
„/ = _ У2 (x) f (х) . ^ _ yiJxUJjc)
7' ~ "л Л"' ' ' ' • У' =
1 a(x)w(xj> *2 a(x)w(x)>
откуда Z\ и 22 получаются двумя квадратурами.
Пример. Пусть х2у" + ху' + у = ctg (In х) для л:> 0.
Уравнение .без правой части есть х2у" + ху' + // = 0; это уравнение
Эйлера; оно имеет интегралы вида у = хг с г(г—Г) + г+1 =0, и
значит, г2+1=0. Следовательно, общий интеграл уравнения
без правой части равен
у = Сх cos (In x) + С2 sin (In я).
а) Положим # = 2 sin (In*)", тогда
z"x2 sin (In *) + г'х [2 cos (In x) + sin (In #)] = ctg (In a:).
tl Xtl*
Отсюда выводим z' = xs[n2{lnx) , причем ___eCtg(lnx),
откуда w = sin(ln*) —С|э и
, l С,
*sin (In a;) jcsin2 (In x) '
а значит,
г = 1п
tg^| + C,ctg(ln*) + C2;
наконец, имеем
у = [sin (In x)] In J tg -^~ J + C, cos (In x) + C2 sin (In x).
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
641
б) Положим уг=г{сов(\пх) + г2$т(\пх) с z{ cos (In х) +
+ z£sin(lnjic)==0. Подставляя в х2у" + ху'+ y = c\g(\nx)y
приходим к — xz'{sm{\nx) + xz'2cos(\nx) = ctg(\nx). Отсюда
"1
,_ cos (In x) u /== cos2 (In л:) __ 1
1 . х 9 2 л; sin (In л:) х sin (In*)
sin (In л:)
2i — — sin (In x) + Сi, z2 = In tg
In x
+ cos (In x) + C2.
И мы вновь находим интеграл
# = sin(ln*)ln|tg-^
-f С{ cos (In х) + С2 sin (In x).
§ 4. Линейное уравнение с правой частью с постоянными
коэффициентами
Уравнение с постоянными коэффициентами. Пусть
ay" + by' + cy = f(x)9
есть уравнение, в котором а, 6, с — постоянные, афО.
а) Изучим вначале частный случай, когда f(x) есть
многочлен от х\ пусть
f(x) = P{x) = pQ + lfrx+ ... + %х\
Найдем частный интеграл, который был бы многочленом от х.
Если с Ф О, то степень многочлена ay" + by' + су будет равна
степени многочлена у и, значит, должна равняться п. Запишем
многочлен у в виде
у = Щ + 1±Х+'±Х2+...+!±.Х«.
Имеем
«2
у' = щ+-^х +
ип
(л-1)!
»п—1
'«2 + • • • +
ип
rti-2
(м-2)!
Приравнивая коэффициенты, получаем равенства
сип
сип„2 + Ьип-Х + аип = рп-2>
21 Ш. Пизо, М. Заманский
642 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
В этих равенствах мы узнаем равенства деления многочленов.
Полагаем
P* = Po + Pil + .-• +РпЪп*
А* = а + Ь1 + с1\
и* = и0 + щ1+ ,.. +ип%п.
Тогда приходим к уравнению
W А* = l2P* + {buQ+ ащ) I + ащ.
Следовательно, при сфО многочлен U*, соответствующий
многочлену интеграла, получается как частное от деления £2Р*
на А* по убывающим степеням.
Когда с = 0, но Ь Ф О, многочлен у должен иметь степень
п + 1. С другой стороны, тогда и0 есть произвольная постоянная.
Предыдущие рассуждения позволяют показать, что если
положить U* = их + и21 + ... + ttn+i£n, то
При с = О, Ъ Ф 0 многочлен U* является частным от
деления £Р* на А* (который тогда будет первой степени) по
убывающим степеням.
Наконец, когда с = О, Ь = 0, а Ф О, уравнение принимает вид
ау" = Ро + $х+ ... +^г*п;
оно интегрируется непосредственно:
где и0 к и\ — произвольные постоянные.
Таким образом, получаем утверждение:
При с = 0, 6 = 0, а Ф 0, общий интеграл есть многочлен
степени п + 2.
Пример. Возьмем уравнение у" + у = хп/п\ Оно имеет
частный интеграл в виде многочлена степени п, так как с = 1 Ф 0.
Здесь Р* = £п, Л* = £2+1, и деление £2Р* на Л* дает \п+2 =
= (б* + О (БЛ - Г""2 + Г~4 +-••) + остаток. Таким образом,
и, следовательно, частный интеграл имеет вид
_ хп хп~2 . хп~*
У~~ п\ (я-2)! + (я-4)!
б) Предположим, что f(x) имеет вид f{x)=P(x)eaxy где
Р(х) есть многочлен степени п от х, и а — действительная или
комплексная постоянная.
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
643
В уравнении
ay" + by' + cy = f(x)
произведем замену функции по формуле у = eaxz, получим
еах [a (z" + 2az' + ah) + b (*' + az) + cz] = P (x) eax,
т. e.
az" + (2aa + b) z' + {aa2 + ba + c)z = P (x).
И нахождение г сводится к предыдущему случаю.
Условия аа2 + Ьа + с = О, 2аа + b ФО выражают, что а есть
простой корень характеристического уравнения ar2 + br + с = 0;
аа2 + Ьа + с = 0, 2аа + b = 0 выражают, что а есть двойной
корень характеристического уравнения.
Стало быть, справедливо следующее утверждение.
Уравнение ay" + by' + су = еахР (х), где Р (х) есть многочлен
степени п, обладает частным решением вида y = eaxU(x), где
U(x) есть многочлен. Если а не является корнем
характеристического уравнения, то U имеет степень п\ если а является
простым корнем, то U имеет степень п + 1; если а — двойной
корень, то U имеет степень п + 2.
Если правая часть имеет вид f(x) = P(x)eaxcos $х или f(x) =
= P(x)eaxs\n fix, то f(x) представляет собой сумму двух
функций вида -£ Р(*)е<а+'Р>* и у Р(х)е<а~№*. Если а, Ь, с
действительны и fi Ф 0, то а + ifi никогда не может быть двойным
корнем трехчлена ar2 + br + с, ни тем более простым корнем, ибо
в этом последнем случае а — ifi тоже было бы простым корнем.
Пример. Пусть имеется материальная точка с массой 1,
которая может перемещаться без трения по фиксированной
прямой и абсцисса х которой является функцией времени t. Эта
точка притягивается точкой О с силой — h2x, пропорциональной
расстоянию х (h постоянно). Кроме того, она испытывает
сопротивление, пропорциональное скорости, скажем, —2kx' при k
постоянном. Наконец, она может находиться еще под действием
периодической силы 2(ocos((o£). Тогда уравнение движения
будет иметь вид
x" + 2kx' + h2x = f(t),
где f (/)=() или f(t) = 2o) cos со/.
Характеристическим уравнением для уравнения без правой
части является г2 + 2kr + h2 = 0, имеющее в качестве корней
числа - k ± Vk2-h2.
а) Если k > h, т. е. если сопротивление скорости велико, то
оба корня действительны и отрицательны, пусть это будут —pi
и —-р2 с pi > 0, р2 > 0,
21*
644
КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Тогда
х = Схе-м + С2е-ь\
точка стремится к нулю без колебания; это затухающее
движение.
б) Если k = ft, то имеется двойной корень, и
х = е-к*(С^ + С2)\
точка снова стремится к нулю без колебания; затухающее дви-
жжение.
б) Если k<h% то корни комплексны, и
x = e~kt (С cos р/ + С sin pf) = Ле-*' cos (р/ - <р),
где Р= У ft2 — k2, а Л и ф — постоянные.
Имеем колебательное движение с амплитудой 'Aerht\ она
стремится к нулю; это затухающее колебательное движение. Его
период, равный 2я/р = 2я/)//12 — k2y стремится к бесконечности,
если k стремится к Л, и к 2я//г, если k стремится к нулю.
Пусть теперь f (t) = 2со cos at = ®еш + ®е-ш = f x {t) + f2 (/).
Полагая х = ешг, получаем для fi(t) уравнение
г" + 2 {m + k) z' + (Л2 - со2 + 2/feco) z = со.
Для того чтобы h2— о)2 + 2ik(o = О, необходимо, чтобы k = О
иА = о). Если хотя бы одно из этих двух условий не выполнено,
то мы имеем постоянное частное решение
__ со
Z-Zx- h2„tf + 2iku> #
Следовательно, имеется частное решение
шш сое~ш д 2со {h2 - со2) cos со* - 2feco2 sin cof .
Х ~ /г2 - со2 + 2/fcco + Л2 - со2 - 2/£со (Л2 - со2)2 + 4fc2co2 '
это колебательное движение с тем же периодом 2я/со и с
постоянной амплитудой, которое по истечении некоторого времени
остается единственным ощутимым движением; оно сдвинуто по
фазе относительно наложенной колебательной силы.
Если k = 0 и h = со, то уравнение для z имеет частным
интегралом многочлен первой степени от t. Имеем z" + 2шг' = со,
откуда z = y t и
х = -1- еш - 4? е~ш = t sin со*.
2i 2*
Следовательно, если f(t) есть сила, период которой равен
периоду движения, выражаемого уравнением без правой части,
и если нет пропорционального скорости сопротивления, то по-
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 645
лучаем для х колебательное движение с тем же периодом, но
с амплитудой, пропорциональной времени; это явление
резонанса,
В случае, когда правая часть f(x) линейного уравнения не
будет суммой выражений предыдущего вида, то для нахождения
частного интеграла применяется метод вариации постоянной.
III. СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
§ 1. Общие рассмотрения
Определение. Системой дифференциальных уравнений
первого порядка называется система вида
У*1=Ц*> Vv •••> УЛ)> •••; Уп=1п(х> Vv •••• УпУ
Решением или интегралом этой системы называется любая
совокупность п действительных или, возможно, комплексных
функций у\, ..., уп действительного переменного х, имеющих
для.любого х из некоторого открытого интервала производные
у\, ..., у'п по х и удовлетворяющих п равенствам системы.
Всякое дифференциальное уравнение м-го порядка вида
y{n) = f{x, y,tf,...9 у{п~]))
сводится к системе дифференциальных уравнений первого
порядка; именно, положив
У = Уи У' = Уъ .... У{п~1)=Уп>
приходим к системе
У\ = У2> У2~У* •••> У'п-1~Уп> y'n = f{x> У\> У* •••» Уп)-
Обратно, нахождение решения этой системы равносильно
нахождению решения дифференциального уравнения порядка п.
Теорема существования. Обобщая метод доказательства
теоремы существования для уравнения первого порядка, можно
доказать следующую теорему.
Пусть функции f\(x,yu ..,, уп), ..., fn(x,yu .-.-, Уп)
непрерывны по (х,уи •■♦, уп) б области D из /?n+1, и пусть в D
все частные производные dfi/dyj существуют и все по
абсолютному значению ограничены, 'При'эТих условиях для любой точки
(*<ь си • •, сп) из D система у\= /. (*, yv ..., у n), i = 1, ..., п,
имеет, и притом единственное, решение у\ = У\(х), ..., уп =
« уп(х)> которое при х — Xq принимает значения
С\ = У\ (*о). • • • > Сп = уп (Х0).
Эта теорема, в применении к уравнению
y{n) = f(x, у, у',..., у*~{))
646 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
я-го порядка, показывает, что если / удовлетворяет условиям
теоремы, то для любых х0У у0, у'0, ..., t$~l) из D существует,
и притом единственное, решение у = у(х), удовлетворяющее
условиям
У (*о) в Уь> У' (*о) = У* • • • > У(п-1) Ы = «ft1-0-
Доказательство теоремы существования мы не будем
приводить.
§ 2. Линейные системы с постоянными коэффициентами
Линейные системы. Система дифференциальных уравнений
первого порядка
y'i^fi&y Ур •••> Уя). ''=!> •••> л.
называются линейной, если функции fi линейны по уи ..., уп..
Стало быть, такая система будет иметь вид
У\=ац{*)Ух+ ••• +ain(x)yn+bt(x)9 /=1, ..., л.
Для любого интервала изменения х, на котором все функции
ац(х) и bi(x) непрерывны и ограничены по абсолютному
значению, теорема существования применима; при этом значения ch
принимаемые функциями у%{х) в точке х = х0, произвольны.
Мы изучим лишь тот случай, когда функции а^{х)
постоянны.
Система дифференциальных уравнений первого порядка без
правой части с постоянными коэффициентами. Такая система
записывается в виде
у[-апу{+ ... +а1пУп,
У'п=ашУ1+ ••' +аппУп-
Введем вектор У из Rn или, возможно, из Сп с
компонентами (уи .. *, Уп) и матрицу
/ап .*. а1п\
И »
\ап1 ... апп/
тогда система может быть записана в алгебраической форме
У'-Л (Г).
Мы видели (Книга II, гл. XI, разд. I), что для матрицы
А можно указать такую обратимую матрицу Г, что В = Т-ХАТ
имеет простой вид.
ТЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 647
Положим тогда Y = T(Z), где Z имеет компоненты Z\, ..,, zn,
получаем Y'=T(Z') и T(Z') =AT{Z), а значит, Z' = T~1AT(Z) =
= B(Z).
Вид матрицы В зависит от кратности корней
характеристического уравнения (Книга II, гл. IX, разд. I, § 1) матрицы Л,
т. е. от корней уравнения D(A — р/) = 0.
1° Предположим, что все собственные значения матрицы А
различны между собой. Тогда найдется такая обратимая
матрица 7\ что В = Т~1АТ принимает диагональную форму
'Pi 0
5=| ♦ |, где pi, i = 1, ■•., п, — различные между со-
*0 р„/
бой корни уравнения D(A — р/) = 0. Полученная относительно
Z система дифференциальных уравнений
Z\ e PlZV ' ' # » Zn = PnZn
непосредственным интегрированием дает
где Си ..., Сп — произвольные постоянные. Если векторы
еи ..., #п образуют канонический базис пространства Rn,
соответственно О, т. е. если ег= (6*ь •••> бгп), где 6ц есть
символ Кронекера, то можно еще написать
Z^Cle9xXel+ ... + Спе9»хеп.
(Не смешивать векторы ег- канонического базиса с числом
е — основанием натуральных логарифмов!)
Отсюда выводим
Y = T(Z) = CJle9lX+ ... +CJneQn\
где Tj = T(ej) есть у-й вектор-столбец матрицы Г. Значит, эти
векторы линейно независимы.
2° Предположим, что не все собственные значения матрицы
А различны. Тогда найдется такая обратимая матрица Г, что
Т~ХАТ имеет треугольную форму
Pi ©и - • - ®\пУ
g e | 0 Р2 • • • ©2«
0 0 ... рл
где pi —корни уравнения D(A — р/) = 0, из которых не все
различны. Тогда система дифференциальных уравнений для Z
648 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
имеет вид
Zn ^ PnZn*
<м = <»„_,, „z„ + P„_,V-p
Z'x = *lnZn + '•• +^l2Z2 + PlZV
Значит, ее уравнения можно интегрировать поочередно, на*
ходя последовательно zny zn-u - - ., Zi.
Для уточнения характера общего решения установим
прежде следующий результат.
Уравнение z' — pz = Ph (х) еах, где р и а — постоянные, а
Pk (х) — многочлен от х степени ky имеет общее решение вида
z = Ce<>x-Q(x)eax,
где С — произвольная постоянная, a Q(x) — многочлен степени k,
если а Ф р, и степени k + 1, если а = р.
Этот результат получается сразу при помощи метода
вариации постоянной. Уравнение без правой части имеет в качестве
интеграла ер*; значит, полагаем z = y(x)e^x и приходим
к y' = Ph {x) e(a_p)*. Для афр примитивная правой части равна
Q(x)e(a-®x, где Q(x) —многочлен степени k\ это легко проверить
дифференцированием.
Для а =р имеем у' = Ph{x), и значит, у = Q(x), где Q{x)—>
многочлен степени k + 1.
Применим этот результат к системе г' = В (z); обозначим
через СПу Сп-и ..., С\ произвольные постоянные, а через Q(x)
и Р(х)—многочлены от х.
Сначала получаем
z = С еРп*
Затем
гп-х = СЛ V1*-1* + С„шЛ.,. nQ (x) е"п\
Если рп-1 Ф Рп, то многочлен Q(x) имеет степень 0, если
Pn-i = рп, то многочлен Q(x) имеет степень 1; однако
соответствующий член может исчезнуть, если (on-i, n = 0.
Если рп имеет кратность X, то последовательно получаем
zn-k = Qk(х)еРп* для /5 = 0, 1, ...,Л— 1, где
Q^(a:)—многочлен, имеющий степень не выше h—1; в нем постоянная Cn-k
для k = 0,1, ..., h— 1 присутствует линейно.
Следующие уравнения будут иметь вид
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ g4Q
Но (Oj,n^n + ... + ©j,n-i2n-A+i имеет вид Р)(х)ерпх, где Рй(х)
есть многочлен степени не более чем h—1. Следовательно,
zJ = Cieplx + Ql(x)e^x+uh
где Qj(x) есть многочлен степени не более чем h—1, а щ есть
решение уравнения
а;-рЛ = со/ tn_hzn_h+ ... +©/i/+I2/+I.
Таким образом, оказываемся в пределах предыдущей задачи,
но для / = п — ft.
После этого можно заключить, что Zj есть сумма величин
вида Q(x)e^xf где р пробегает различные значения среди корней
рп, ..., pj, a Q(x)—многочлен, степень которого строго меньше
кратности соответствующего собственного значения р.
Многочлены Q(x) линейно зависит от постоянных
интегрирования Сп, Сп_ь ..., С\.
Обозначим теперь через Vj(x) ненулевой вектор,
компонентами которого являются многочлены степени строго меньшей
кратности собственного значения р/, тогда
Z = ClVl(x)ePlX+ ... +CnVn(*)e9"x.
Следовательно, имеем
Z=T{Z) = CXWX(x)em + ... + CnWn(x) A*,
где Wj (x)~ T( Vj {x)) для / = 1, ..., n есть ненулевой вектор,
компоненты которого суть многочлены степени строго меньшей
кратности собственного значения pj.
Теорема существования показывает, что существует, и
притом единственное, решение, принимающее при заданном х = х0
произвольно взятые значения у\(х0), ..., Уп(х0). Пусть У0 есть
вектор с компонентами у\(х0)у ..., уп(хо). Положим Kj = С^х°
«для / = 1, • • •, л. Тогда У0 = K\W\(x0) + ... + XnWn(x0).
Стало быть, всякий вектор У о принадлежит векторному
пространству, порожденному векторами W\(x0), ..., Wn(x0);
иными словами, эти векторы порождают n-мерное векторное
пространство; значит, они образуют базис этого пространства.
Отсюда получаем следующий результат.
Векторы W\ (х), ..., Wn (x) линейно независимы при любом
значении х.
Матрица А предполагалась действительной; если же
некоторые из ее собственных значений комплексны, то соответственно
действительные и мнимые части выражений Wj(x)eQfx являются
независимыми решениями; вместо с Wj (x) eр/* решением будет
и комплексно сопряженное выражение Wj(x)e*ix,
650 КНИГА IV. МАТЕМАТИЧЕСКИЕ ПРИЕМЫ И МЕТОДЫ
Заметим также, что если А имеет кратное собственное
значение порядка Л, то из этого не обязано следовать, что
соответствующие многочлены W(x) имеют хотя бы одну
компоненту степени h—1; может даже оказаться, что W(x) всегда
сводится к постоянному вектору.
Так, пусть имеется система
У* = Уъ>
/1 0 04
матрица А равна 10 1 0 ; она имеет в качестве собственных
\0 0 1/
значений р=1, являющееся тройным корнем. Но, интегрируя,
получаем
Y = (C{ex+C2e2 + C6ez)e\
где У есть вектор с компонентами у\, у2, Уг\ £i есть вектор
(1,0,0), е2 — вектор (0,1,0) и е3 — вектор (0,0,1). Несмотря на
тройной корень, не существует многочлена, отличного от
постоянной.
Примеры. Рассмотрим следующую систему:
Уг Ух + У*
У'ъ = У\~У*
имеем
Характеристическим уравнением будет р3 + Зр_= 0; оно имеет
три простых корня Р!==0, р2 = * V% и Рз^- i 1^3.
Для pi имеем решение из постоянных у\, у2, #з> значит,
0 = у2 — уз, 0 - —#i — t/з, 0 = f/i — f/з, и стало быть, у{ = Си
Уг = Си Уг = C\f где С\ — произвольная постоянная.
Для р2 положим ук = ePiXzh при h = 1, 2, 3; получаем
z\=* — i \[Zzx + z2 — zv
z'
z'd = zx — z2—i Vbk
= — z{-i Y3z2 + z3,
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 651
Эта система тоже обладает постоянным решением; если / и
/2 означают два кубичных корня из единицы, то Z\ = C2, z2 = /C2,
£з = /2С2, где С2 — некоторая постоянная.
Следовательно,
Ух = C2eix vlt у2 = С2е1 (* ^+2n/3)f уг = с2е< UK Г-ня/з),
Для р3 = — iY3 получаем аналогичным образом
у^С*-'***, у2 = С3^^^з+2я/з)э уза=Сзв-/икз+4^)в
Положим теперь
C2 = j(C2-iC'2\ С3 = 4(Сз + /Сз),
где С2 и Сз — две действительные постоянные, и тогда получим
действительное решение
у{ - d + С2 cos (л: |/3) + Сз sin (* |/3),
у2 = d + C2 cos (x V 3 + -^) + Сз sin (* /3+-у-),
y3-C1 + C2Cos(jcl/3 + -^) + C3sin(^l/3+^).
Замечание. Можно заметить, что у'1+у'2 + у'3 = 0, откуда
У\ + у2 + Уг = С; кроме того, функции ^ удовлетворяют
равенству У]у,1 + У2у/2 + У3у,3 = 09 откуда у\ + у\ + у\ = С.
Следовательно, точка с координатами (у{у уъ уг) описывает
окружность с осью ух = у2 = у3, причем найденные формулы
решения дают
с-зс„ с' = зс?+|-(с22+Сз2).
Рассмотрим следующую систему, к которой приводит в
механике изучение малых движений вокруг положения
равновесия; переменным будет время /, а искомые функции будут
обозначаться через х, у, г; это координаты материальной точки.
Имеем
х" = а{х + Ьху + схг,
у" = а2х + b2y + c2z>
z" - аъх + Ьгу + c3z,
где коэффициенты ahi bhy ch для h = 1, 2, 3 постоянны.
Эта система не является системой первого порядка, но легко
сводится к таковой, если ввести вспомогательные функции и=х\
v ш- у\ w — г'.
652 КНИГА IV. МАТЕМАТИЧЕСКИЕ. ПРИЕМЫ И МЕТОДЫ
Однако здесь это проводить не имеет смысла, поскольку
можно найти непосредственно решение вида
х - Со**, у = СреР', г = Суе&9
где С, а, р, у — постоянные. Тогда получим для а, р, у систему
ар2 = а1а + 61р + с1у,
рр2 = а2а + &2р + c2Y,
Yp2 = а3а + й3р + c3Y-
Значит, показатель р должен быть решением уравнения
|ai-P2 Ьх с, I
\а2 bo — р2 с2 = 0.
I «з &з с3 - Р21
Это есть уравнение 3-й степени относительно р2 и имеет по-
парно противоположные корни. Если все они различны, то
получаем общее решение, зависящее от шести произвольных постоянных:
• х = 2 <W*', у = 2 С£к№ % z - 2 (W*.
А=1 А-1 А=*1
Если имеются кратные корни, что может случиться, либо koi
гда уравнение 3-й степени от р2 имеет кратный корень, либо
когда оно имеет нулевой корень, то мы найдем решения в форме
х = Р (t) eP*t y = Q(t) е&, z = R(t) е&,
где Р, Q, R — многочлены степени строго ниже порядка
кратности р. Впрочем, в этом случае нам будет удобнее сначала
подвергнуть систему преобразованию х' = е&Х, yf = e&Y, zf =
= ePfZ, а затем искать решения X = P(t), Y=Q(t), Z = R(t).
Для того чтобы положение равновесия было устойчивым,
необходимо и достаточно, чтобы для начального положения,
достаточно близкого к положению равновесия х ~ у = г = 0 и
малой начальной скорости, точка не удалялась, т. е. х, у, z
должны оставаться ограниченными при любых CV А так как вместе
с рь корнем будет и —рь, то это возможно лишь в том случае,
если действительная часть р^ равна нулю, и значит,
характеристический многочлен матрицы
6,
ГЛ. VI. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 653
должен иметь отрицательные или нулевые корни. Однако в
случае кратных корней необходимо еще убедиться в том, что Р(0,
Q(t), R(t) будут иметь степень 0.
Линейные системы с правой частью. Рассмотрим систему
y/i = ail(x)y[+ ... +ain(x)yn + bl(x), /=1, ..., п.
Введем вектор Y с компонентами (уи ..., Уп), матрицу
/flu W ... aln{x)\
\ап1(х) ... ann(x)J
и вектор В с компонентами (b\(x)f ..., Ьп(х)). Тогда система
записывается в виде
Y' = A(Y) + B.
Допустим, что найдено решение соответствующей однородной
системы Y' = A (Y), которое имеет вид Y = C\Y\ + ... + CnYn,
где Си ...» Сп — постоянные, a Y\, .... Yn — п линейно
независимых частных решений. Тогда положим
Y = uxYx+ ... +unYnf
где ии ..., ип — функции от х\ попытаемся определить их так,
чтобы Y было решением уравнения с правой частью [метод
вариации постоянных).
Получаем
(u\Yl+...+u'nYn) + (ulY[+ ... +unY'n) =
= А («,К, + ... + unYn) + В.
Но Y'h = Л (КА) для Л = 1, .... п, и стало быть,
ulY'l+...+uJ'm-A{ulYl+. ..+«/„).
Остаются, таким образом,
иТ.+ ... +ы'К -В.
11 П П
А так как Yu ..., Уп есть базис пространства Rn или Сп,
то из этого, решая систему Крамера, получаем и|э ..., и^, и
иь *.., ^п находятся квадратурами.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Абсолютное значение 48, 53, 217
Аксиома Архимеда 216
Алгоритм Евклида 68
Асимптота 579
Асимптотическое разложение 496
Ассоциативность 31
Аффинное многообразие 130
— преобразование 132
Базис 109
— канонический НО
— ортонормированный 177
Барицентр 133
Варирцич постоянной 616, 639, 648
Вектор столбец 139
Вектор строка 139
Вектор функция 373
Вронскиан 633
Выпуклая оболочка 136
Гомеоморфизм 259
Грань верхняя 233
— нижняя 233
График 23
Группа 42, 49
— абелева 42, 49
— ортогональная 186
Делители нуля 51
Дистрибутивность 33
Дифференциал 418
Дифференциальное уравнение 606
— — в разрешимой форме 607
линейное 607
— — однородное 611
— — с разделяющимися переменными
Дополнение 19
Дробь 45, 98. 99
Дуга жорданова 384
— спрямляемая 388
Закон композиции внешний 31
внутренний 31
— —, симметризация 39
Замена переменного 475, 486
Замыкание 227, 371
Идеал 51
Изоморфизм 34
Индекс 21. 32, 37, 58
Индукция 36
Интеграл 323, 381, 430
— двойной 460, 462
— криволинейный 451
— Римана 338
— сходящийся 506
— — абсолютно 508
— тройной 483
Интегральная кривая 607
Интегрирование по частям 514
Интервал 206
— замкнутый 206
— компактный 505
— открытый 206
— полуоткрытый 206
Касательная 283
Класс эквивалентности 29
Колебание 254
Кольцо 50
— коммутативное 50
— унитарное 51
— целостности 51
Коммутативность 31
Композиция отображений 27
Компонента 20
Корень из единицы 95
— квадратный 93, 308
— я-й степени 95. 308
Коэффициенты Фурье 560
Кратность нуля 79
— полюса 100
Критерий Коши сходимости последова
тельности 224
— — — ряда 523
Круг сходимости 551
Линейная зависимость 108
— независимость 108
— упорядоченность 29
Логарифм 315
— комплексного числа 560
— неперов 313
Мажоранта 225
Максимум функции 288
Матрица 138
— диагональная 189
— квадратная 143
— обратимая 145
— обратная 144
— ортогональная 184
— регулярная 139
*- симметрическая 148
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
655
Матрица сингулярная 139
— транспонированная 147
— треугольная 192
Матрицы подобные 147
Мера 457
Метод Понселе 591
— трапеций 590
Минимум функции 288
Минор 162
Миноранта 225
Многочлен 61
— интерполяционный 81
— неприводимый 68
— от двух переменных 82
— производный 74
Множество 15
— бесконечное 24
— выпуклое 135
— замкнутое 228, 371
— ограниченное 224, 371
— плотное 222, 276, 371
— производное 226
— пустое 15
— счетное 37
Мощность множества 24
Надтело 51
Нейтральный элемент 32
Непрерывность равномерная 253, 37
Неравенство Бернулли 309
— треугольника 49
— Шварца 175, 329
Норма 54, 360,
— в Rn 361
— евклидова 362
Нормы эквивалентные 364
Область 403
Образ 21
— множества 22
Объединение множеств 18
Однородная система уравнений 126
Окрестность 302
Определитель 159
— Вандермонда 169
Ортогонализацня 178
Ортогональные векторы 176
Отношение антисимметричное 28
— бинарное 28
— порядка 28
— симметричное 28
— транзитивное 28
— эквивалентности 29
Отображение 21
— взаимно однозначное 24
— дифференцируемое 411
— линейное 115
— непрерывное 404, 425, 432
— тождественное 23
Отрезок 135, 385
Параллелотоп 149
Пересечение 17
Перестановка 25
Подгруппа 50
Подкольцо 50
Подмножество 15
Подпоследовательность 60
Подпространство 54 107
— ортогональное 1/8.
Подтело 51
Поле 51
— направлений 625
Полином тригонометрический 562
Последовательность 23, 38. 58
— двойная 38. 58. 207
— Коши 209, 221, 273, 366, 370, 423
— монотонная 230
— расходящаяся 203, 219
— сходящаяся 202, 206, 209, 212, 221, 223
365, 426
Предел верхний, нижний 241
— последовательности 203
— равномерный 269
— функции в точке 244
Преобразование Абеля 538
— дробно-линейное 584
— ортогональное 183
Признак Даламбера 529
— Коши 528
Примитивная 292. 382
Приращение функции 291
Произведение бесконечное 540
— векторное 380
— векторных пространств 106
— внешнее 477
— внутреннее 175, 380
— множеств 20
— скалярное 175
Производная 282, 379, 430, 433
— функция 284
*~ частная 408
Прообраз 23
Пространство векторное 62, 105
— евклидово 179
— метрическое 358
— полное 222, 276. 281, 370, 428
— сопряженное 119
Равенство 16
Радиус сходимости 551
Размерность векторного пространства 109
Ранг линейного отображения 117, 120
— матрицы 139
Расширенная прямая 260
Регулярный элемент 32
Рефлексивность 28
Ряд 520
— гармонический 537
— геометрический 526
— знакопеременный 538
— расходящийся 520
— Римана 526
— степенной 550
— сходящийся 520
— — абсолютно 523
— — безусловно 534
— Тейлора 556
— тригонометрический 554
— Фурье 560
Сечение 216
Символы Кронекера ПО
— Ландау 489
Симметричный элемент 33
Система дифференциальных уравнений 645
— Крамера 125
Скачок функции 258
Собственное значение 187
Собственный вектор 188
Среднее (первая формула о среднем) 340
— значение функции 589
Сужение отображения 22
Суммы Римана 339
Сходимость равномерная 273, 378, 406, 426,
433
656
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Тело 51
~ характеристики р 52
Теорема Безу 69
— Больцано—Вейерштрасса 229, 372
— Бореля—Лебега 231, 372
— Даламбера 96
— о конечных приращениях 290
Точка накопления 225, 370
— прикосновения 227, 371
Уравнение Бернулли 619
— Клеро 620
-* Лагранжа 619
— Риккати 633
— Эйлера 638
Условие Кош и 224, 366, 523
Фактормножество 30
Факторпространство 114
Форма билинейная 121, 180
— квадратичная 173, 182
— линейная 115. 119
<— полилинейная 124
— полуторалинейная 123
«— полярная 174
Формула Маклорена 76
— Муавра 90
— Римана 469
— Стирлинга 532
— Тейлора 76, 300. 345. 381, 423
Функция 21
— выпуклая 295
— дифференцируемая 282, 378, 411
Функция комплексного переменного 58Г
— монотонная 255
— непрерывная 247, 375, 425, 432
— нечетная 556
— обратная 24
— периодическая 297
— показательная 313, 436
— разрывная 248
— сложная 27
— с ограниченным изменением 392
*- ступенчатая 265, 407
— тригонометрическая 442
— четная 556
— числовая 237
— элементарная симметрическая 97
— ярусная 272
Характеристический многочлен 187
— определитель 166
Характеристическое уравнение 635
Числа действительные 215
— комплексно сопряженные 88
— комплексные 86
— натуральные .35
— относительные 42
— рациональные 47
Числовая прямая 224
Эталоны сравнения 495
Ядро линейного отображения 116
Якобиан 473, 486