/
Author: Беклемишев Д.В.
Tags: математика линейная алгебра аналитическая геометрия математический анализ естественные науки
Year: 1998
Text
Д.В.Беклемишев
КУРС АНАЛИТИЧЕСКОЙ ГЕОМЕТРИИ И ЛИНЕЙНОЙ АЛГЕБРЫ
7-е изд., стер. — М.: Высш. шк. 1998.—320 с.
В учебнике (6-е изд. — 1987г.) излагается основной материал, входящий в
объединенный курс аналитической геометрии и линейной алгебры: векторная
алгебра, прямые и плоскости, линии и поверхности второго порядка, аффинные
преобразования, системы линейных уравнений, линейные пространства,
евклидовы и унитарные пространства, квадратичные формы, аффинные
пространства, тензорная алгебра.
Для студентов высших учебных заведений.
ОГЛАВЛЕНИЕ
Предисловие 3
Греческий алфавит 4
Глава I. Векторная алгебра 5
§ 1. Векторы 5
1. Предварительные замечания (5). 2. Определение вектора (6). О
другом определении вектора (6). 4. Линейные операции над
векторами (8). 5. Линейная зависимость векторов (12).
§ 2. Системы координат 14
1. Декартова система координат (14). 2. Деление отрезка в
заданном отношении (16). 3. Декартова прямоугольная система
координат (16). 4. Полярная система координат (17). 5.
Цилиндрические и сферические координаты (18).
§ 3. Скалярное и векторное произведения 19
1. Скалярное произведение (19). 2. Ориентация тройки векторов
(22). 3 Векторное произведение (22). 4. Смешанное произведение
(23) 5. Выражение векторного и смешанного произведения через
компоненты сомножителей (25). 6. Детерминанты, второго и
третьего порядка (26). 7. Условия коллинеарности и
компланарности векторов (29). 8. Площадь параллелограмма (30). 9
Объем ориентированного параллелепипеда (31). 10. Двойное
векторное произведение (31). 11. Взаимный базис (32). 12. О
векторных величинах (32).
§ 4. Замена базиса и системы координат 23
1 Изменение базиса (33). 2. Изменение системы координат (35). 3.
Преобразование декартовой прямоугольной системы координат на
плоскости (36).
Глава П. Прямые линии и плоскости 37
§ 1. Общее понятие об уравнениях 37
1. Определение (37). 2. Алгебраические линия и поверхности (39) 3
Параметрические уравнения Линии (43). 4. Параметрические
уравнения поверхностей. Конусы (43). 5. Уравнения, не
содержащие одной из координат (44).
§ 2. Уравнения прямых и плоскостей 45
1. Поверхности и линии первого порядка (46). 2. Параметрические
уравнения прямой и плоскости (47). 3. Исключение параметра из
параметрических уравнений прямой (50). 4. Векторные уравнения
плоскости и прямой (52). 5. Признаки параллельности плоскостей и
прямых на плоскости (55). 6. Уравнения прямой в пространстве
(57).
§ 3. Некоторые задачи о прямых и плоскостях 69
1. Уравнение прямой, проходящей через две точки (59). 2
Уравнение плоскости, проходящей через три точки (59). 3
Признаки параллельности прямой и плоскости (60) 4. Уравнения в
отрезках (61). 5. Полупространство (61). 6. Расстояние от точки до
плоскости (62). 7. Расстояние от точки до прямой (63). 8
Расстояние между параллельными прямыми в пространстве (64). 9.
Вычисление углов (65). 10. Некоторые задачи на построение (66)
11. Пучок прямых. Связка и пучок плоскостей (67). 12. О
геометрическом смысле порядка алгебраической линии (70).
Глава П1. Линии и поверхности второго порядка 72
§ 1. Исследование уравнения второго порядка 72
§ 2. Эллипс, гипербола и парабола 77
1. Эллипс (77), 2. Гипербола (82). 3. Парабола (87).
§ 3. Линия второго порядка, Заданная общим уравнением 90
1. Пересечение линии второго порядка и прямой (90). 2. Число
асимптотических направлений. Тип линии (91). 3. Диаметр линии
второго порядка (92). 4. Центр линии второго порядка (93). 5.
Сопряженные направления (96). 6. Главные направления (97). 7.
Касательная к линии второго порядка (98). 8. Особые точки (99).
§ 4. Поверхности второго порядка 100
1. Поверхности вращения (101). 2 Эллипсоид (102). 3. Конус
второго порядка (103). 4. Однополостный гиперболоид (104).
Двуполостный гиперболоид (105). 6. Эллиптический параболоид
(106) 7. Гиперболический параболоид (107).
Глава IV. Преобразования плоскости 111
§ 1. Отображения и преобразования 111
1. Определение (111). 2. Примеры (111). 3. Произведение
отображений Обратное отображение (113) 4 Координатная запись
отображений (114).
§ 2. Линейные отображения 116
1. Определение линейных отображений (115). 2. Произведение
линейных отображения (118). 3. Образ вектора при линейном
отображении (119).
§ 3. Аффинные преобразования 121
1. Ортогональные преобразования (121). 2. Образ прямой линия
(134) 3 Изменение площадей при аффинном преобразования (126).
4. Образы линий второго порядка (128). 5. Описание всех
аффинных преобразований (130).
§ 4. Понятие группы
1. Аффинная геометрия (132). 2. Значение клейновых геометрий
(133). 3. Определение группы преобразований (134). 4. Группы
(134).
Глава V. Системы линейных уравнений и матрицы
§ 1. Матрицы
1. Определение (136). 2. Сложение в умножение на число (137). 3.
Транспонирование матриц (138). 4. Столбцы и строки (139).
§ 2. Детерминанты
1. Символ S (142). 2. Определение детерминанта (143). 8. Свойства
детерминантов (145). 4. Элементарные преобразования.
Вычисление детерминантов (150). 6. Миноры произвольного
порядка (181). 6. Формула полного разложения детерминанта по
элементам матрицы (152).
§ 3. Системы линейных уравнении (специальный случай)
1. Постановка задачи (154). 2. Правило Крамера (155). 3. Пример
(158).
§ 4. Ранг матрицы
1. Базисный минор (169) 2. Приведение матрицы к упрощенному
виду (161). 3. Теорема о базисном миноре (163).
§ 5. Общая теория линейных систем
1. Условия совместности (166). 2. Нахождение решений (168). 3.
Приведенная система (168). 4. Множество решения однородной
системы (169). 5. Общее решение системы линейных уравнений
(172). 6. Примеры (173).
§ 6. Умножение матриц
1. Определение и примеры (174). 2. Свойства умножения матриц
(176). 3. Обратная матрица (179). 4. Элементарные преобразования
как умножение матриц. Детерминант произведения (181).
§ 7. Комплексные числа и комплексные матрицы
1. Арифметические операции с комплексными числами (182). 2.
Число (183). 3. Модуль и аргумент комплексного числа (184). 4.
Комплексно сопряженное число (185). 5. Комплексные матрицы
(186).
Глава VI. Линейные пространства
§ 1. Основные понятия
1. Определение линейного пространства (188). 2. Простейшие
следствия (190). 3. Линейная зависимость (191). 4. Базис (192). 5.
Замена базиса (196).
§ 2. Линейные подпространства
132
136
136
142
154
159
166
174
182
188
188
196
202
1. Определение и примеры (196). 2. Сумма и пересечение
подпространств (199). 3. Прямая сумма подпространств (201).
§ 3. Линейные отображения
1. Определение (202). 2. Координатная запись линейных
отображений (205) 3. Изоморфизм линейных пространств (207). 4
Изменение матрицы линейного отображения при замене базисов
(208) 5. Канонический гид матрицы линейного отображения (209)
6. Сумма и произведение отображений (209).
§ 4. Задача о собственных векторах 211
1. Линейные преобразования (211). 2. Инвариантные
подпространства (213). 3. Собственные векторы (214). 4. Свойства
собственных векторов и собственных значений (217). 5. О
приведении матрицы преобразования к диагональному виду (221).
Глава VII Евклидовы и унитарные пространства 222
§ 1. Евклидовы пространства 222
1. Скалярное произведение (222) 2. Длина и угол (223). 3.
Ортонормированный базис (225). 4. Выражение скалярного
произведения через компоненты сомножителей (226). 5. Связь
матриц Грама разных базисов (227). 6. Ортогональные матрицы
(228). 7. Ортогональное дополнение подпространства (229).
§ 2. Линейные преобразования в евклидовом пространстве 231
1. Преобразование, сопряженное данному (231). 2.
Самосопряженные преобразования (233). 3. Изоморфизм
евклидовых пространств (237). 4 Ортогональные преобразования
(238).
§ 3. Понятие об унитарных пространствах 240
1 Определение (240). 2. Свойства унитарных пространств (243). 3.
Самосопряженные и унитарные преобразования (244).
Глава VIII Функции на линейном пространстве 245
§ 1. Линейные функции 245
1. Определение функции (245). 2. Линейные функции (246). 3.
Сопряженное пространство (248). 4. Линейные функции на
евклидовых пространствах (250).
§ 2. Квадратичные формы 251
1. Билинейные формы (261) 2. Другая точка зрения на билинейные
формы (253). 3. Квадратичные формы (253). 4. Ранг и индекс
квадратичной формы (258)
§ 3. Квадратичные формы и скалярное произведение 261
§ 4. Эрмитовы формы 265
Глава IX. Аффинные пространства 267
§1 . Плоскости 287
1. Аффинное пространство (267). 2. Плоскости в аффинном
пространстве (270). 3 Линейные функции в аффинном
пространстве (271). 4. Выпуклые многогранники (272).
§ 2 Общая теория линий и поверхностей второго порядка 274
1. Закон преобразования коэффициентов (274). 2. Линии второго
порядка на плоскости (277) 3. Поверхности второго порядка (280).
Глава X. Основы тензорной алгебры 286
§ 1. Тензоры в линейном пространстве 286
1. Геометрические объекты (286). 2. Пространственные матрицы
(288) 3. Определение и примеры (290) 4. Сложение и умножение на
число (293) 5. Умножение тензоров (295). 6. Свертывание (297). 7.
Транспонирование (298). 8. Симметрирование и альтернирование
(300) 9. Замечание (303).
§ 2 Тензоры в евклидовом пространстве 304
1 Метрический тензор (304). 2. Поднятие и опускание индексов
(305). 3. Евклидовы Тензоры (306).
§ 3. Поливекторы. Относительные инварианты 308
1. р-векторы (308). 2. Относительные инварианты (310). 3. Объем
n-мерного параллелепипеда (311).
Рекомендуемая литература 313
Предметный указатель 314
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Абсцисса 15
Алгебраическое дополнение 152
Альтернирование 301
Аппликата 16
Аргумент комплексного числа 185
Архимедова спираль 71
Асимптота 84
Базис 10, 192
— взаимный 32, 249
— левый (правый) 22
— ортонормированный 17, 225
Билинейная форма 251
---симметричная 262
Валентность тензора 291, 307
Вектор 6, 189
— направляющий 47
— нормальный 52
нулевой 6, 189
— присоединенный к линейной
функции 250
— противоположный данной 9, 189
— собственный 215
Векторы коллинеарные 11
— компланарные 11
— линейно зависимые (независимые)
12, 191
— ортогональные 19, 228, 241
— равные 6
Вершина многогранника 273
— конуса 44
Вложение 204
Геометрический объект 287
Геометрия аффинная 132
— евклидова 132
— клейнова 132
Гипербола 75, 278
Гиперболоид двуполостной 105, 285
— однополостный 104, 285
Гиперплоскость 271
Грань многогранника 273
Группа 135
— преобразований 134
Детерминант 27, 144
Диагональный вид квадратичной
формы 254
Диаметр 93
Директриса 80, 86, 88
Длина вектора в, 234
Закон инерции 259
Изоморфизм аффинных пространств
268
— евклидовых пространств 237
— линейных пространств 207
Инвариант 42, 287
— ортогональный 279, 307
— относительный 311
Индекс квадратичной формы 259
— суммирования 142, 290
Индексы ковариантные 290
— контравариантные 290
Канонический вид квадратичной
формы 257
Касательная 82, 87, 89, 98
Квадратичная форма 254
----большая (малая) 276
----отрицательно определенная 259
----положительно определенная
259
----полуопределенная 259
Ковектор 291
Компоненты (координаты) вектора
Ю,
— геометрического объекта 287
— линейной функции 247
— тензора 290
Комплексно сопряженное число 185
Комплексное число 183
Конгруэнтность фигур 132
Конус 44
— асимптотический 105
— второго порядка 103, 285
----мнимый 285
Координатная строка 247
Координатный столбец 192, 269
Координаты точки декартовы 15, 268
----полярные 18
Критерий Сильвестра 260
Линейная комбинация 9, 139, 191
----тривиальная 12, 140, 191
— оболочка 197
Линейное отображение 115, 202
----нулевое 203
-----обратное 211
— преобразование 202
-----ортогональное 238
-----присоединенное 261
-----самосопряженное 233, 244
-----сопряженное данному 231
-----унитарное 244
Линия алгебраическая 40
-----винтовая 43
— центральная OS
Луч 271
Матрица 27, 136
— билинейной формы 252
— Грама 227
-----диагональная 220
— единичная 145
— квадратичной формы 264
Матрица квадратная 136
— комплексно сопряженная 187
— линейного отображения 205
-----преобразования 212
— нулевая 138
— обратная данной 179
— ортогональная 228
— перехода 34, 195
— противоположная данной 138
— прямоугольная 136
— расширенная 154
— симметрическая 227
— унитарная 244
— упрощенная 162
— эрмитова 244
— s мерная 289
Метод выделения квадратов 256
— Гаусса 163
— ортогонализации 226
Минор 151
— базисный 159
— дополнительный 145, 152
Мнимая единица 183
Многогранник выпуклый 272
Множество выпуклое 274
Множество значений отображения
204
Модуль комплексного числа 187
Наложение 204
Направления асимптотические 91
— главные 97
— сопряженные 96
Направляющая 44, 45
Нарушение порядка 152
Начало координат 15
Неравенство Буняковского 224
— треугольника 225
Образ 111
Образующая 44, 45, 104, ПО
Объем 31, 312
Ограничение преобразования 214
Окружность 74
Опускание индекса 305
Ордината 15
Ортогональная проекция 111, 230
Ортогональное дополнение 229
Ортонормированная система 225
Оси координат 15
Отображение 111
— аффинное 115
— взаимно однозначное 113, 207
— иньективное 204
— линейное 115,202
—. обратное данному 114, 2IX
— сюръективное 204
Отрезок 271
Пара плоскостей мнимых
параллельных 285
-------пересекающихся 285
-----параллельных 285
—. — пересекающихся 285
-----совпавших 285
— прямых мнимых параллельных 76,
278
-----пересекающихся 74, 278
-----параллельных 76, 278
-----пересекающихся 7Б, 278
-----совпавших 76, 278
Парабола 76, 278
Параболоид гиперболический 107,
285
— эллиптический 106, 285
Параллелепипед п-мерный 312
Параллелепипед ориентированный 31
Параллелограмм ориентированный
30
Параметр 43, 47
Пересечение подпространств 200
Плоскость s-мерная 270
Площадь параллелограмма 30
— эллипса 127
Поверхность алгебраическая 40
— вращения 101
Поднятие индекса 305
Подпространство 196
— инвариантное 213
— направляющее 270
— нулевое 198
Поливектор 308
— простой 309
Полупространство 61, 271
Полюс 17
Полярная ось 17
Порядок алгебраической линии 40
----поверхности 40
Преобразование 111
— аффинное 121
— ортогональное 121
----первого (второго) рода 120
Произведение векторов векторное 23
-------двойное 31
----скалярное 19, 222
----смешанное 23
— детерминантов 182
— отображений 113, 210
— матриц 175
— на число вектора 8, 189
-------линейного отображения 210
-------линейной функции 248
-------матрицы 137
-------тензора 294
— тензоров 295
Прообраз 111
Пространство аффинное 267
— бесконечномерное 194
— векторов 267
— евклидово 222
----комплексное 241
----точечное 269
— линейное 189
— Минковского 264
— нулевое 190
— псевдоевклидово 264
— сопряженное 249
— унитарное (эрмитово) 241
Прямая 271
Пучок плоскостей 70
— прямых 67
Равенство векторов 6
— матриц 136
— тензоров 291
— фигур 132
Радиус-вектор 14
Размерность многогранника 273
— пространства 193
Разность векторов 9, 191
— матриц 138
Ранг квадратичной формы 138
— матрицы 169
— линейного отображения 206
Ранги линий и поверхностей второго
порядка 277
Расстояние 63, 64, 230, 260
Ребро многогранника 273
Решение системы линейных
уравнений 154
Решение системы линейных
уравнений общее 172
----------тривиальное 168
Свертывание тензоров 289
Связка плоскостей 69
Семиинвариант 280
Сжатие к прямой 112
Сигнатура квадратичной формы 260
Сигнатуры линий и поверхностей
второго порядка 277
Символ Кронекера 292
Симметрирование тензоров 300
Система координат декартова 14, 269
-------прямоугольная 17
-----полярная 17
-----сферическая 19
-----цилиндрическая 18
— линейных уравнений 154
-------однородная 154
----------сопряженная 188
-------приведенная 168
— решении фундаментальная 171
След матрицы 228
Собственные значения 215
Столбец 139
Столбцы (строки) линейно
зависимые 140
Строка 139
Сумма векторов 8, 189
— линейных отображений 209
-----функций 248
— матриц 137
— подпространств 199
-----прямая 201
— тензоров 294
Тензор 290
— антисимметрический 303
-----евклидов 307
— метрический 304
-----контравариантный 305
— симметрический 302
Теорема Кронекера — Капелла 185
— о базисном миноре 163
— о размерности суммы 200
— о ранге матрицы 164
— Лапласа 162
— об изоморфизме 207
— Фредгольма 166, 232
Тип линии 92
— тензора 290
Точка 267
Точка граничная 271
— начальная 47, 270
— особая 99
Транспонирование матрицы 138
— тензора 298
Тройка векторов левая (правая)22
Угловой коэффициент 60
Угол 19, 65, 223
Уравнение множества 37
— плоскости 46
-----векторное 52
-------параметрическое 48
— прямой 46
-----в отрезках 61
-----векторное 64
-------параметрическое 47
Уравнения параметрические 43, 44
Фокус 79, 85, 88
Функционал 245
Функция линейная 203, 246
-----нулевая 246
— на аффинном пространстве 271
— на линейном пространстве 246
— полилинейная 293
Характеристический многочлен 217,
218
Характеристическое уравнение 216
Хорда 92
Центр гиперболы 83
— линии второго порядка 94
— пучка 67
— связки 69
— эллипса 78
Цилиндр 46
— прямой круговой 46
Цилиндрическая поверхность
второго порядка 285
Эксцентриситет 79, 85, 88
Элементарные преобразования 150
Эллипс 74, 278
— мнимый 74, 278
Эллипсоид 102, 285
— вращения 102
— мнимый 265
Эрмитова форма 265
Ядро отображения 204
ПРЕДИСЛОВИЕ
Эта книга отражает многолетний опыт преподавания аналитической геометрии
и линейной алгебры в Московском физико-техническом институте. Особенности
подготовки студентов в МФТИ вызывают необходимость ускоренного изложения
курса математики, по объему приближающегося к университетскому. В связи с
этим аналитическая геометрия излагается так, чтобы на простом и доступном
материале подготовить студента к изучению линейной алгебры. Собственно
линейной алгебре, т.е. теории линейных пространств, предпослана большая глава
о системах линейных уравнений и матрицах. Ее цель — дать читателю
исследование систем линейных уравнений, независимое от методов линейной
алгебры. В этой же главе собраны и другие сведения, необходимые для
дальнейшего изучения. Более подробное представление о строении книги можно
получить из оглавления. Со времени первого издания в 1971 г. учебник
неоднократно перерабатывался при сохранении общего плана и стиля изложения.
Настоящее издание является стереотипным воспроизведением 6-го издания 1987
г. Мне хочется с благодарностью отметить то влияние, которое оказали на эту
книгу преподаватели кафедры высшей математики МФТИ, прежде всего те, кто
читал лекции по курсу аналитической геометрии и линейной алгебры. Особенно я
благодарен проф. А.А. Абрамову, проф. Л.А. Беклемишевой, чл.- корр. РАН Л.Д.
Кудрявцеву, проф. В.Б. Лидскому, академику Л.В. Овсянникову, проф. С.С.
Рышкову, проф. С.А. Теляковскому. Автор
ГРЕЧЕСКИЙ АЛФАВИТ
А, а — альфа Г, у — гамма
Е, Е — эпсилон Н, ч — эта
I, i — йота А, Л — лямбда
N, v — ню П, п — пи
Z, а — сигма Т, V — ипсилон
X, X — хи Q, о — омега
в, Р — бета Л, 3 — дельта
Z, С — дзета е, 0,1? — тета
К, к — каппа М, ц — мю
S, £ — КСИ Р, Р — ро
Т, т — тау Ф, ф — фи
Т, — пси
ГЛАВА I
ВЕКТОРНАЯ АЛГЕБРА
§ 1. Векторы
1. Предварительные замечания. Первые главы этой кни-
ги можно рассматривать как продолжение школьного курса
геометрии. Известно, что каждая математическая дисцип-
лина основывается на некоторой системе недоказываемых
предложений, называемых аксиомами. Полный перечень
аксиом геометрии, так же как и более подробные рассуж-
дения о роли аксиом в математике, можно найти в книге
Н. В. Ефимова [5]. (Цифры в квадратных скобках озна-
чают ссылки на список рекомендуемой литературы, поме-
щенный в конце книги.)
Мы не ставим себе целью изложение логических основ
предмета и потому просто опираемся на теоремы, до-
казываемые в курсе элементарной геометрии. Следователь-
но, все наши результаты можно считать доказанными
лишь постольку, поскольку доказаны эти теоремы.
Равным образом мы не пытаемся дать определение
основных геометрических понятий: точки, прямой, плоскос-
ти. Читатель, интересующийся их строгим введением,
может обратиться к той же книге Н. В. Ефимова; мы
же будем считать, что эти и другие введенные в курсе
средней школы понятия известны читателю.
Мы предполагаем также известными школьное опреде-
ление вещественных чисел и их основные свойства. (Стро-
гая теория вещественного числа приводится в учебниках
математического анализа.) Мы будем широко использовать
то обстоятельство, что при выбранной единице измерения
каждому отрезку можно сопоставить положительное ве-
щественное число, называемое его длиной. Единицу из-
мерения длин мы будем считать выбранной раз навсегда
и, говоря о длинах отрезков, не будем указывать, какой
единицей они измеряются.
5
2. Определение вектора. Отрезок прямой задается дву-
мя равноправными точками—его концами. Но можно
рассматривать направленный отрезок, определяемый упо-
рядоченной парой точек. Про эти точки известно, какая
из них первая (начало), а какая вторая (конец).
Определение 1. Направленный отрезок (или, что
то же, упорядоченную пару точек) мы будем называть
вектором. К векторам будем относить и так называемый
нулевой вектор, у которого начало и конец совпадают.
Направление на отрезке принято отмечать стрелкой.
Над буквенным обозначением вектора при письме ста-
вится стрелка, например! АВ (при этом буква, соответст-
вующая началу вектора, обязательно ставится впереди).
В книгах часто буквы, обозначающие вектор, набираются
полужирным шрифтом, например: а. Нулевой вектор
обозначается 0 или просто 0.
Расстояние между началом и концом вектора называ-
ется его длиной (а также модулем и абсолютной величи-
>
ной). Длина вектора обозначается | а | или | АВ |.
Векторы называются коллинеарными, если они распо-
ложены на одной прямой или на параллельных прямых,
короче говоря, если сущест-
1 вует прямая, которой они па-
/ / раллельны. Векторы назы-
/ / ваются компланарными, если
/ / существует плоскость, кото-
/ / рой они параллельны.
fi'A------------**g' Нулевой вектор считает-
ся коллинеарным любому век-
Рис- тору, так как он не имеет
определенного направления.
Длина его, разумеется, равна нулю.
Определение 2. Два вектора называются равными,
если они коллинеарны, одинаково направлены и имеют
равные длины.
Из этого определения непосредственно вытекает, что,
выбрав любую точку А', мы может построить (и притом
только один) вектор А'В', равный некоторому заданному
вектору АВ, или, как говорят, перенести вектор АВ в
точку А' (рис. 1).
3. О другом определении вектора. Заметим, что понятие ра-
венства векторов существенно отличается от понятия равенства,
например, чисел. Каждое число равно только самому себе, иначе
гбворя,* два равных числа при всех обстоятельствах могут рас-
6
смаТриваться как Сдио и то же число. € векторами, как мы видим,
дело обстоит по-другому: в силу определения существуют различные,
но равные между собой векторы. Хотя в большинстве случаев у нас
не будет необходимости различать их между собой, вполне может
оказаться (см. с. 14), что в какой-то момент нао будет интересовать
именно вектор АВ, а не другой, равный ему вектор А'В'.
Для того чтобы упростить понятие равенства векторов (и снять
некоторые связанные с ним трудности), иногда идут на усложнение
определения вектора. Мы не будем пользоваться этим усложненным
определением, но сформулируем его. Чтобы не путать, мы будем
писать <Вектор» (с большой буквы) для обозначения определяемого
ниже понятия.
Определение 3. Пусть дан направленный отрезок. Мно-
жество всех направленных отрезков, равных данному в смысле оп-
ределения 2, называется Вектором
Таким образом, каждый направленнный отрезок определяет Век-
тор, Легко заметить, что два направленных отрезка определяют
один и тот же Вектор тогда и только тогда, когда они равны. Для
Векторов, как и для чисел, равенство означает совпадение: два Вектора
равны в том и только в том случае, когда это один и тот же Век-
тор.
При параллельном переносе пространства точка и ее образ сос-
тавляют упорядоченную пару точек и определяют направленный
отрезок, причем все такие направленные отрезки равны в смысле
определения 2. Поэтому параллельный перенос пространства можно
отождествить с Вектором, составленным из всех этих направленных
отрезков.
Из начального курса физики хорошо известно, что сила может
быть изображена направленным отрезком. Но она не может быть
изображена Вектором, поскольку силы, изображаемые равными нап-
равленными отрезками, производят, вообще говоря, различные дейст-
вия (Если сила действует на упругое тело, то изображающий ее
направленный отрезок ие может быть перенесен даже вдоль той прямой,
на которой он лежит.)
Эго только одна из причин, по которым наряду с Векторами,
т. е. множествами (или, как говорят, классами) равных направлен-
ных отрезков, приходится рассматривать и отдельных представителей
этих классов. При этих обстоятельствах применение определения 3
усложняется большим числом оговорок. Мы будем придерживаться
определения 1, причем по общему смыслу всегда будет ясно, идет ли
речь о вполне определенном векторе, или на его место может быть
подставлен любой, ему равный.
В связи с определением вектора стоит разъяснить значение не-
которых слов, встречающихся в литературе.
Вместо определения 2 можно ввести другое определение ра-
венства векторов, согласно которому векторы равны, если они равны
по длине, лежат на одной прямой и направлены в одну сторону. В
этом случае вектор может быть перенесен не в любуюточку пространст-
ва, а только вдоль прямой, на которой он лежит. При таком понимании
равенства векторы называются скользящими векторами. В механике
сила, действующая на абсолютно твердое тело, изображается сколь-
зящим вектором.
Можно для векторов пе вводить никакого особого понятия ра-
венства, т. е. считать, что каждый вектор равен только самому себе
и характеризуется, помимо длины и направления в пространстве,
7
еще я точкой приложения. В этом случае векторы называются при-
ложенными векторами. Как уже упоминаюсь, сила, действующая
на упругое тело, изображается приложенным вектором.
Если нужно подчеркнуть, что равенство понимается в смысле
определения 2, то вектор называется свободным. Свободным вектором
изображается, например, угловая скорость тела. Определение 3
определяет свободный вектор.
4. Линейные операции над векторами. Линейными опе-
рациями называются сложение векторов и умножение
вектора на число. Напомним их определения.
Определение. Пусть даны два вектора а и Ь. .По-
строим равные им векторы АВ и ВС (т. е. перенесем
конец а и начало b в одну и ту же точку В). Тогда век-
тор АС называется суммой векторов а и b и обозначается
a-j-b.
Заметим, что, выбрав вместо В другую точку, напри-
мер В', мы получили бы в качестве суммы другой вектор
А'С, равный вектору АС.
Сложением векторов называют операцию, сопоставля-
ющую двум векторам их сумму.
Определение. Произведением вектора а на веще-
ственное число а называется любой вектор Ь, удовлетво-
ряющий следующим условиям:
а) | b | = | а | | а |;
б) вектор b коллинеарен вектору а;
в) векторы b и а направлены одинаково, если а > О,
и противоположно, если а < 0. (Если же а = 0, то из
первого условия следует, что Ь = 0.)
Произведение вектора а на число а обозначается аа.
Умножение вектора на число—-операция, сопоставля-
ющая вектору и числу произведение вектора на это число.
В курсе средней школы были выведены основные свой-
ства линейных операций. Перечислим их без доказательства.
Предложение 1. 1) Сложение векторов коммута-
тивно, т. е. для любых векторов a ub выполнено a4-b=b-|-a.
2) Сложение векторов ассоциативно, т. е. для любых
векторов а, b и с выполнено а-|-(Ь4-с) = (а4-Ь)4-с.
3) Прибавление нулевого вектора к любому вектору а
не меняет последнего: a-f-O==a.
4) Для любого вектора а вектор (— 1)а является про-
тивоположным, т. е. а-{-(—1)а = 0.
5) Умножение вектора на число ассоциативно, т. е,
для любых чисел а и $ и любого вектора а выполнено
(<х0)а = а(0а).
£
6) Умножение вектора на число дистрибутивно по
отношению к сложению чисел, т. е. для любых чисел а и
Р и любого вектора а выполнено (а+р)а=аа+Ра.
7) Умножение вектора на число дистрибутивно по
отношению к сложению векторов, т. е. для любых векто-
ров а и Ь и любого числа а выполнено a(a-f-b) ==aa4-ab.
8) Умножение вектора на единицу не меняет этого
вектора: 1а —а.
Вектор, противоположный вектору а, обовначается —а.
Разностью двух векторов а и Ь называется сумма век-
тора а и вектора, противопо-
ложного Ь, т. е. вектор а 4-
+( — b) или коротко а —Ь. / X
Вычитание — операция, об- az'
ратная сложению, сопоставляю- / \
щая двум векторам их раз- / \
ность: по сумме двух векторов У b \
Ь4*х = а и одному из слагае-
мых b мы находим второе ела- Рис* а
гаемое х = а—b (рис. 2).
Вычитание определяется через сложение, и мы не
будем считать его отдельной операцией. Точно так же не
будем выделять деление вектора на число а, которое можно
определить как умножение на число а-1. Применяя ли-
нейные операции, мы можем составлять суммы векторов,
умноженных на числа: + . 4-a*aft. Выраже-
ния такого вида называются линейными комбинациями век-
торов. Числа, входящие в линейную комбинацию, назы-
ваются ее коэффициентами.
Сформулированные выше свойства линейных операций
позволяют преобразовывать выражения, составленные из
линейных комбинаций, по обычным правилам алгебры;
можно раскрывать скобки, приводить подобные члены, пе-
реносить некоторые члены в другую часть равенства с
противоположным знаком и т. д.
Перечисленные в предложении 1 восемь свойств ли-
нейных операций образуют в некотором смысле полный
набор свойств: любые вычисления, использующие линей-
ные операции над векторами, можно производить, осно-
вываясь на этих свойствах и не обращаясь к определениям
линейных операций. Это обстоятельство будет в дальней-
шем (гл. VI) иметь для нас принципиальное значение.
Линейные комбинации векторов обладают следующими
очевидными свойствами: если векторы ait..., aft колли-
неарны, то любая их линейная комбинация им коллине-
ар на; если векторы ап .ак компланарны, то любая
их линейная комбинация в ними компланарна. Это сразу
следует из того, что вектор оса коллинеарен а, а сумма
векторов лежит в той же плоскости, что и слагаемые, и
даже на той же прямой, если они коллинеарны.
Определение. Базисом в пространстве называются
три некомплаиарных вектора, взятые в определенном по-
рядке.
Базисом на плоскости называются два неколлинеар-
ных вектора на этой плоскости, взятые в определенном
порядке.
Базисом на прямой называется любой ненулевой век-
тор на этой прямой.
Отметим, что векторы базиса на плоскости ненулевые,
так как, если бы один из них был нулевым, они были
бы коллинеарны. Точно так же никакие два из векторов
базиса в пространстве не коллинеарны—в противном слу-
чае все три были бы компланарны..
Если вектор представлен как линейная комбинация
некоторых векторов, то говорят, что он разложен по этим
векторам. Чаще всего рассматривается разложение век-
тора по базису.
Определение. Если elt ej, eg —базис в простран-
стве и а = a^j + а,е2 + aaeg, то числа otf, at, ag называют-
ся компонентами (или координатами) вектора а в данном
базисе. Аналогично определяются компоненты вектора на
плоскости и на прямой. Компоненты вектора пишут в
скобках после буквенного обозначения вектора. Напри-
мер, а(1, 0, 1) означает, что компоненты вектора а в оп-
ределенном ранее выбранном базисе равны 1, 0 и 1.
Теорема 1. Каждый вектор, параллельный какой-
либо прямой, может быть разложен по базису на этой
прямой.
Каждый вектор, параллельный какой-либо плоскости,
может быть разложен по базису на этой плоскости.
Каждый вектор может быть разложен по базису в про-
странстве.
Компоненты вектора в каждом случае определяются
однозначно.
Доказательство. Первое утверждение означает,
что для каждого вектора а, коллинеарного ненулевому
вектору е (базис на прямой), существует число а такое,
что а=ссе. Таким числом является либо |а|/|е|, либо
—|а[/1 е |, смотря по тому, направлены ли а и е одинако-
во или противоположно.
10
Второе утверждение означает, что для каждого векто-
ра а, компланарного с двумя неколлинеарными вектора-
ми ef и е, (базис на плоскости), найдутся числа и а;
такие, что a=cc1e14-ageg. Чтобы указать эти числа, поме-
стим начала всех трех векторов в одну точку О и прове-
дем через конец А вектора а прямую АР, параллельную
е$ (рис. 3). Тогда ОА=ОР+рА, причем ОР коллинеарен
ех, а РА коллинеарен е^. (В частности, любой из ОР и
РА может оказаться нулевым.) В силу первого утвержде-
ния теоремы существуют и aj такие, что ОР = а1е1
и РЛ=₽а,е,. Отсюда следует О A = а1е14-а,еа.
Третье утверждение теоремы означает, что для каж-
дого вектора а и некомпланарных векторов ef, е$ и е8
найдутся такие числа аа, и ag, что a = a1e14-ageg 4-
4- Озе8. Для доказательства поместим начала всех векто-
ров в одну точку О (рис. 4) и проведем через конец А
вектора а прямую АР, параллельную вектору eg. Тогда
ОА = ОР + РА, причем РА коллинеарен eg, а ОР компла-
нарен е* и eg. В силу уже доказанных утверждений най-
дутся такие числа с^, ag и ag, что РА — а8еа и ОР «я
«= оцех4-а»е»- Отсюда прямо вытекает третье утверждение.
Представим себе, что некоторый вектор а разложен
по базису в пространстве двумя способами: а = а1е14-
4-ageg4-ageg н a=₽1e14’P»eg4-P«es. Вычитая из первого
выражения второе, мы получим (о^—Pi)e14-(ai—pg) еа 4-
4-(ag—0g)eg = O. Если хоть одна из разностей в скобках
11
не равна нулю, мы можем разложить один из векторов
базиса по остальным. Например, при имеем
е ____а»~Р»- а»~Р»р
"1 “ ft “• ~ ft
«1—Pl z «1—Pl
Эго противоречит некомпланарности базисных векторов.
Полученное противоречие доказывает единственность раз-
ложения по базису в пространстве. Аналогично доказыва-
ется единственность разложения и в других случаях. Тео-
рема полностью доказана.
Возвращаясь к доказательству последней части теоре-
мы, мы можем заметить, что оно одновременно является
доказательством следующего предложения.
Предложение 2. Равные векторы имеют одинако-
вые компоненты.
В аналитической геометрии геометрические рассуж-
дения о векторах сводятся к вычислениям, в которых
участвуют компоненты этих векторов. Следующие два
предложения показывают, как производятся известные
нам операции над векторами, если заданы их компоненты.
Предложение 3. При умножении вектора на чис-
ло все его компоненты умножаются на это число.
Действительно, если а 4-сс2ег4-сс3е.,, то
la = k (ale1 + а8е, + а8е8) = (XaJ е, 4- (Ха5) е8 + (1а8) е,.
Предложение 4. При сложении векторов склады-
ваются их соответствующие компоненты.
Действительно, если а = а1ех4-а8е24-а8е8 и Ь=Р1е1 +
+ Р»ег+р8е3, то
a + b = + а2ег -f- а,е8) + ([^е, + р,е2 + р8е8) =
= («1'+ Pi) Ci + («.+Р») е8 4- (а8 4- р8) е8.
5. Линейная зависимость векторов. Линейная комби-
нация нескольких векторов называется тривиальной, ес-
ли все ее коэффициенты равны нулю. Разумеется, три-
виальная линейная комбинация любых векторов равна
нулевому вектору. Линейная комбинация не тривиальна,
если хоть один из ее коэффициентов отличен от нуля.
Определение. Векторы alt ..., ak называются ли-
нейно зависимыми, если существует нетривиальная ли-
нейная комбинация этих векторов, равная нулю; иными
словами, если существуют такие коэффициенты alt ..., ak,
что 043x4- • • • 4-®*»*=*0 и а?4-... 4-а|-?&>0.
В противном случае, т. е. когда только тривиальная
линейная комбинация векторов а1( ..., ak равна нулю,
12
эти векторы называются линейно независимыми. Если
векторы линейно независимы, то из равенства сод 4-...
. ..4-аАаА = 0 следует cq = а, = ...= ctA «= 0.
Отметим следующие свойства понятия линейной зави-
симости.
Если среди векторов ап ..., а* есть нулевой, то эти
векторы линейно зависимы. Действительно, рассмотрим
их линейную комбинацию, у которой при нулевом векто-
ре коэффициент 1, а при остальных—нули. Эта линейная
комбинация нетривиальна и равна нулю.
Если к линейно зависимой системе векторов at, ..., ak
добавить один или несколько векторов bf, ..., bp то полу-
ченная система at, ..., аА, Ьп ..., Ь, также линейно зави-
сима. Действительно, к имеющейся равной нулю нетри-
виальной линейной комбинации векторов а1( ..., ак можно
добавить векторы bif ..., b, о коэффициентами, равными
нулю.
Предложение 5. Система векторов линейно зави-
сима тогда и только тогда, когда один из них расклады-
вается в линейную комбинацию остальных.
Доказательство. Пусть аг, .... ak линейно зави-
симы, т. е. существуют такие коэффициенты af, ..., ctk,
что сод -|-а,а2-|- ... +оод = О и хоть один из коэффици-
ентов, например ctj, отличен от нуля. В этом случае aj
есть линейная комбинация векторов а2, ..., аА. Действи-
тельно, мы можем написать
Обратно, пусть один из векторов, например ait разложен
в линейную комбинацию остальных векторов:
at =₽2а24- ... +Э*аА.
Отсюда непосредственно видно, что линейная комбина-
ция векторов af, а2, ..., аА с коэффициентами — 1, Р2, ...
.... рА равна нулевому вектору. Так как она нетривиаль-
ная, то векторы ар ...» аА линейно зависимы. Предложе-
ние доказано.
Понятие линейной зависимости будет играть большую
роль в дальнейшем. Сейчас мы можем обойтись без него
в силу простого геометрического смысла, который имеет
линейная зависимость векторов.
Предложение 6. Любые два коллинеарных векто-
ра линейно зависимы, и наоборот, два линейно зависи-
мых вектора коллинеарны.
13
Действительно, пусть даны два коллинеарных векто-
ра. Либо они оба нулевые, и тогда утверждение очевидно,
либо один из них ненулевой, н тогда второй по нему рас-
кладывается. В обоих случаях векторы линейно зависимы.
Обратно, в силу предложения о из двух линейно за-
висимых векторов один линейно выражается через дру-
гой, и, следовательно, они коллинеарны.
Предложение 7. Любые три компланарных век-
тора линейно зависимы, и наоборот, три линейно зави-
симых вектора компланарны.
Доказательство. Пусть даны три компланарных
вектора. Рассмотрим какие-нибудь два нз них. Если оци
коллинеарны, то линейно зависимы и сами по себе и вме-
сте с третьим вектором. Если же два вектора не колли-
неарны, то третий вектор по ним раскладывается и век-
торы линейно зависимы в силу предложения 5.
Обратно, из трех линейно зависимых векторов один рас-
кладывается по двум остальным и, следовательно, им комп-
ланарен (и даже коллинеарен, если они коллинеарны)
Предложение 8. Каждые четыре вектора линейно
зависимы.
Действительно, рассмотрим любые три из четырех
векторов. Если они компланарны, то линейно зависимы
и сами по себе и вместе с четвертым вектором. Если же
они не компланарны, то четвертый вектор по ним рас-
кладывается, откуда следует, что все четыре вектора ли-
нейно зависимы.
§ 2. Системы координат
1. Декартова система координат. Фиксируем в прост-
ранстве точку О и рассмотрим произвольную точку М.
Радиус-вектором точки М по отношению к точке О назы-
вается вектор ОМ. Если в пространстве, кроме точки О,
выбран некоторый базис, то точке М можно сопоставить
упорядоченную тройку чисел—компоненты ее радиус-
вектора.
Определение. Декартовой системой координат в
пространстве называется совокупность точки и базиса.
Точка носит название начала координат', прямые, про-
ходящие через начало координат в направлении базисных
векторов, называются осями координат. Первая—осью
абсцисс, вторая—осью ординат, третья—осью аппликат.
Плоскости, проходящие через оси координат, называют
координатными плоскостями.
14
Определение. Компоненты радиус-вектора точки
М по отношению к началу координат называются коор-
динатами точки М в рассматриваемой системе координат.
Первая координата называется абсциссой, вторая—
ординатой, а третья— аппликатой.
Аналогично определяются декартовы координаты на
плоскости и на прямой линии. Разумеется, точка на пло-
скости имеет только две координа- .
ты (абсциссу и ординату), а точка V
На ПРЯМОЙ ЛИНИИ —ОДНУ. V________/
Координаты точки обычно пишут у
в скобках после буквы, обозначающей \ \
точку. ДгС*-----Д
Например, запись А (2, 1/2) оз- *i
начает, что точка А имеет коорди- Рис, 5.
ваты 2 и 1/2 в ранее выбранной
декартовой системе координат на плоскости (рис. 5).
Легко видеть, что при заданной системе координат
координаты точки определены однозначно. С другой сто-
роны, если задана система координат, то для каждой упо-
рядоченной тройки чисел найдется одиа-единственная точ-
ка, имеющая эти числа в качестве координат. Система
координат на плоскости определяет такое же соответствие
между точками плоскости и упорядоченными парами чисел.
Рассмотрим две точки А и В, координаты которых от-
носительно некоторой декартовой системы координат О,
ef, еа, е, соответственно равны xt, yit Zt и xt, yt, гг. По-
ставим себе задачу найти компоненты вектора АВ. Оче-
видно, что АВ =ОВ—ОА (рис. 6). Компоненты радиус-
векторов ОА и ОВ равны (xt, tf) и (ха, yt, za) по on-
ределению координат. Из предложения 4 § 1 следует, что
АВ имеет компоненты (х,—xit у,—yt, z,—z£). Этим до-
казано следующее
Предложение 1. Чтобы найти компоненты векто-
ра, нужно из координат его конца вычесть координаты
его начала.
2. Деление отрезка в заданном отношении. Найдем
координаты точки М на отрезке АВ, которая делит этот
отрезок в отношении А/p, т. е. удовлетворяет условию
IАМI _ Л. А О и *> О
(рис. 7). Это условие можно переписать в виде
рАМ^МАВ. (1)
Обозначив через (xv yt, zt) и (х,, yt, г2) соответственно
координаты точек А и В, а через (х, у, г) координаты точ-
ки М, мы разложим обе части равенства по базису, при-
чем компоненты векторов АМ и МЁ найдем по предло-
жению 1. Тогда
р (х—Xj) = А(ха—х),
И (У—ft) = М&—У)<
p(z —г1) = А(га — г).
Из этих равенств можно найти х, у и г, поскольку A +
4- р У= 0. Мы получаем окончательно
х~ х+р ’ У к+й~’ 2 ГЙГ-- Ю
Эти формулы известны под названием формул деления от-
резка в заданном отношении.
Если в формулах (2) мы будем считать одно из чи-
сел А или р отрицательным, то из равенства (1) видно,
что точка М (х, у, г) будет находиться на той же прямой
вне отрезка АВ, деля его в отношении | А/p |. Поэтому
Йэрмулы (2) служат решением более общей задачи,
менно, из них можно найти координаты точки, делящей
отрезок АВ в заданном отношении как внутренним, так
и внешним образом.
На плоскости задача о делении отрезка решается так
же, только базис состоит из двух векторов, и потому из
формул (2) остаются только первые две.
3. Декартова прямоугольная система координат. Об-
щие декартовы системы координат используются реже,
16
чем специальный 1 класс таких сиЬтем>-— декартовы пря-
моугольные системы координат.
Определение. Базис называется ортонормирован-
ным, если его векторы попарно ортогональны и по длине
равны единице. Декартова система координат, базис кото-
рой ортонормирован, называется декартовой прямоуголь-
ной системой координат.
Нетрудно проверить, что координаты точки относи-
тельно декартовой прямоугольной системы координат по
абсолютной величине равны расстояниям от этой точки
до соответствующих координатных плоскостей. Они име-
ют знак плюс или минус в зависимости от того, лежит
точка по ту же сторону или по другую сторону от коорди-
натной плоскости, что и конец базисного вектора, перпен-
дикулярного этой плоскости.
Аналогично находят координаты точки относительно де-
картовой прямоугольной системы координат на плоскости.
4. Полярная система координат. Декартовы системы
координат—не единственный способ определять при по-
мощи чисел положение точки
относительно некоторого геомет-
рического образа. Для этой цели
используются многие другие ти-
пы координатных систем. Здесь
мы опишем некоторые из них.
На плоскости часто употреб-
ляется полярная система коор-
динат. Она определена, если
задана точка О, называемая
полюсом, и исходящий из полю-
са луч I, который мы назовем
полярной осью. Положение точ-
ки М фиксируется двумя числами: радиусом г = |ОМ| и
углом <р между полярной осью и вектором ОМ. Угол ф
называется полярным углом. Мы будем измерять его в
радианах и отсчитывать от полярной оси против часо-
вой стрелки. У полюса г = 0, а ф не определено. У ос-
тальных точек г > 0 и ф определено с точностью до сла-
гаемого, кратного 2л. Это означает, что, например, пары
чисел (г, ф), (г, ф4-2л) и вообще (г, ф4-2ял), где k—
любое целое число, представляют собой полярные коор-
динаты одной и той же точки (рис. 8).
Иногда ограничивают изменение полярного угла каки-
ми-нибудь условиями, например: 0<ф<2л или —-я<
17
< Ф < л. Это устраняет неоднозначность, но зато вводит
другие неудобства.
Пусть задана полярная система координат и упоря-
доченная пара чисел (г, <р), первое из которых неотрица-
тельно. Мы можем сопоставить этой паре точку, Для Ко-
торой эти числа будут полярными координатами. Имен-
но, если г=0, то мы сопоставляем полюс. Если же г > О,
то пар? (г, <р) ставим в соответствие точку, радиус-век-
тор которой имеет длину г и составляет с полярной осью
угол ф. При этом парам чисел (г, ф) и (rlt фх) сопостав-
ляется одна и та же точка, если r=*rt, а ф—фх==2лА,
где k—целое число.
Выберем на плоскости декартову прямоугольную сис-
тему координат, поместив ее начало в полюс О и при-
няв за векторы е{ и е, векторы длины 1, направленные
соответственно вдоль I и под углом л/2 к I (угол отсчи-
тывается против часовой стрелки). Как легко видеть нз
рис. 8, декартовы координаты точки выразятся через ее
полярные координаты так:
х = гсовф, у = гз1пф. (3)
б. Цилиндрические и сферические координаты. В пространстве
обобщением полярных систем координат являются цилиндрические
и сферические системы координат, И для тех, и для других фигура,
относительно которой определяется положение точки, состоит из
точки О, луча /, исходящего из О, и вектора п, равного по длине
единице и перпендикулярного к I. Через точку О мы можем провес-
ти плоскость Р, перпендикулярную вектору п.
Пусть дана некоторая точка М. Опустим из нее перпендикуляр
ММ' на плоскость Р.
Цилиндрические координаты точки М — это три числа (г, К),
Числа г, ф—полярные координаты точки М' йо отношению к по»
18
люсу О и полярной осн I, a h—компонента вектора М'М по векто-
ру и. Она определена, так как эти векторы коллинеарны (рис. 9).
Сферические координаты точки—три числа (г, ф, в). Они опре-
деляются так: г=|ОЛ1 |, как и для цилиндрических координат ф—
угол вектора ОМ' о лучом I, а От—угол вектора ОМ с плос-
костью Р (рис. 10).
§ 3. Скалярное и векторное произведения
1. Скалярное произведение. Под углом между векто-
рами мы понимаем угол между векторами, равными дан-
ным и имеющими общее начало. В некоторых случаях
мы будем указывать, от какого вектора и в каком на-
правлении угол отсчитывается. Если такого указания не
сделано, углом между векторами считается тот из углов,
который не превосходит л. Если угол прямой, то векторы
называются ортогональными.
Определение. Скалярным произведением двух век-
торов называется число, равное произведению длин этих
векторов на косинус угла между ними. Если хоть один
из векторов нулевой, то угол не определен, и скалярное
произведение по определению считают равным нулю.
Скалярное произведение векторов а и Ь обозначается
(а, Ь). Таким образом, мы можем записать
(a, b) = |a||b|cos<p,
где <р—угол между векторами а и Ь. Очевидны следую-
щие свойства операции скалярного умножения:
1. Скалярное умножение коммутативно, т. е. для
любых векторов а и b справедливо равенство (а, Ь) = (Ь, а).
2. (а, а) = |а|* для любого вектора а.
3. Скалярное произведение равно нулю тогда и толь-
ко тогда, когда сомножители ортогональны или хотя бы
один из них равен нулю.
4. Векторы ортонор мированного базиса удовлетворяют
соотношениям
(в£, е1) = (е2, е2) = (е„ е,) = 1,
(elt е,) = (е±, е,) = (е», е,) = 0.
Предложение 1. Если базисные векторы е^, е,, et
ортогональны, то компоненты любого вектора а находят-
ся по формулам
19
В частности, если базис ортонормиреванный, то
<х,и(а, et), аа = (а, е8), а8 = (а, е8). (1)
Действительно, пусть а = а:(-|-а24-а8, причем каждое
слагаемое коллинеарно соответствующему базисному век-
тору. Мы знаем из доказательства теоремы 1 § 1, что
Of*" ± IЛ11/1 Ч1» гДе выбирается знак плюс или минус в
Рис. И,
зависимости оттого, одинаково или
противоположно направлены век-
торы а{ и е(. Но, как видно из
рис. 11, ± || = | a |cos<Pi, где
—угол между векторами а ,и
ер Итак, Oj = | а | cos cpj/l ef | = (а,
e^/jefl*. Аналогично вычисляются
и остальные компоненты.
Из предложения 1 следует,
что компоненты вектора в орто-
нормированием базисе равны про-
изведениям его длины на косину-
сы углов, которые данный вектор
составляет с соответствующими
базисными векторами.
Следующее свойство носит название линейности ска-
лярного произведения.
Предложение 2. Для любых векторов а, Ь, с и
любых чисел а и р выполнено равенство (aa-f-pb, с) =
= а(а, с)4-р(Ь, с). В частности, (аа, с) = а(а, с) и
(аЦ-b, с)==(а, с)4>(Ь, с).
Доказательство. Если с«= 0, то утверждение оче-
видно. Допустим, что с =5^=0. Примем с за первый вектор
базиса и выберем остальные ортогонально к нему и меж-
ду собой. Выражение (аа-|-РЬ, с)/| с|2—первая компонен-
та вектора аа + РЬ. Точно так же (а, с)/| с|а и (Ь, с)/| с |э —*•
первые компоненты векторов а и Ь. В силу предложений
4 и 3 из § 1 мы имеем
(cca + pb, с)/|с|’ = а(а, с)/| с |» + р (Ь, с)/|с|8.
Отсюда прямо вытекает требуемое равенство.
Легко доказать, что такая же формула справедлива
для линейной комбинации любого числа векторов.
Используя коммутативность скалярного умножения,
из предложения 2 мы получаем тождество
(а, pb -Ьус) = ₽(а, Ь)4-у(а, с).
Пусть дан ортонормированный базис. Исследуем, как
выражается скалярное произведение векторов а и b че-
рез их компоненты (ап а2, аа) и фц 02, р,). Используя
линейность скалярного произведения по первому сомно-
жителю, напишем
(a, b) = (a1e1 + a2e2 + a3es, b) =
= «1(е1, b) + a2(e2, b)4-as(e», b).
Но, согласно предложению 1, скалярные произведения
вектора b на базисные векторы равны его компонентам
Pi. Р« и Р»- Так мы приходим к следующей теореме.
Теорема 1. Если базис ортонормированный, то
скалярное произведение векторов выражается через их ком-
поненты по формуле
(а, Ь) = аД + а2р2 -J- аД. (2)
Отметим, что требование ортонормированности базиса
в этой теореме очень существенно—в произвольном ба-
зисе выражение скалярного произведения через компо-
ненты гораздо сложнее. Поэтому для задач, связанных
со скалярным произведением, пользуются ортонормиро-
ванными базисами. Если почему-либо все же надо вычис-
лить скалярное призведение в неортонормированном ба-
зисе, следует скалярно перемножить разложения сомно-
жителей. по базису и, раскрыв скобки, подставить в по-
лученное выражение известные скалярные произведения
базисных векторов.
Теорема 1 позволяет написать выражение длины век-
тора через его компоненты в ортонормированном базисе:
|a| = Ka?4-ai4-as, (3)
а также выражение угла между векторами через их ком-
поненты в ортонормированном базисе:
... „ __ (а> Ь)____«1Р1 + «2р8 + иЗрЭ /Л\
•а1*Ь| K(aJ+a*+al)(p?+p24₽34) ‘
Используя формулу (3), мы можем вычислить расстоя-
ние между точками, если заданы их координаты в де-
картовой прямоугольной системе координат. В самом де-
ле, пусть точки А и В имеют соответственно координаты
(х, у, г) и (xt, ylt гх). Тогда расстояние между ними равно
IАВI= V (х2—х)2 Ч- (У1—у)2 + (гх—z)2. (5)
21
2. Ориентация тройки векторов. Пусть даны два орто-
нормированных базиса ео е„ е4 и е’и е£, ej. Можно ли
совместить эти базисы при помощи движения? Разумеет-
ся, можно перенести и повернуть вектор ej так, чтобы
он совпал с вектором ef. При этом плоскость векторов е,
и ej, перпендикулярная ех', совместится с плоскостью век-
торов е, и е„ перпендикулярной ef. Далее можно пово-
ротом в этой плоскости добиться совмещения векторов е'2
и е,. После этого векторы е, и е, окажутся коллинеарны-
ми. Они либо совпадут—тогда базисы совмещены,—либо
окажутся противоположно направленными. В последнем
случае базисы совместить нельзя.
Рис, 12, а) Левый базис; б) правый базис.
Из этого рассуждения видно, что если два базиса не
налагаются, то каждый третий базис налагается либо на
первый, либо на второй. Таким образом, все ортонорми-
рованные базисы распадаются на два класса. Базисы,
принадлежащие одному и тому же классу, налагаются,
а базисы из разных классов не налагаются. Базис назы-
вается правым или левым в зависимости от того, вправо
или влево направлен вектор е^, когда е, направлен от
нас, а вектор е, направлен вверх (рис. 12). Один класс
состоит из всех правых, а другой—из всех левых бази-
сов. Это же определение распространяется и на любые
базисы следующим образом.
Определение. Упорядоченная тройка некомпланар-
ных'векторов называется правоориентированной или просто
правой, если из конца третьего вектора кратчайший по-
ворот от первого ко второму виден против часовой стрел-
ки. В противоположном случае тройка называется лево-
ориентированной или левой. (Начала векторов тройки
предполагаются совмещенными.)
3. Векторное произведение. Определение. Пусть
даны векторы а и Ь. Построим по ним вектор с, удовлет-'
воряющий условиям:
22
1) | с | = ] a 11 b | sin q> * *), где tp—угол между а и Ь;
2) вектор с ортогонален векторам а и Ь;
3) если а и Ь не коллинеарны, то векторы а, Ь, с
образуют правую тройку векторов.
Так построенный вектор с назовем векторным произ-
ведением векторов а и b и обозначим [а, Ь]. Приведен-
ные условия определяют векторное произведение с точ-
ностью до равенства, если сомножители—ненулевые век-
торы. Если хоть один из сомножителей—нуль, то век-
торное произведение по определению есть нулевой век-
тор.
Из определения вытекает, что модуль векторного про-
изведения неколлинеарных векторов численно равен пло-
щади параллелограмма, построенного на сомножителях
(если сомножители имеют общее начало). Подробнее это
обсуждается в конце параграфа (п. 12).
Векторное произведение равно нулю тогда и только
тогда, когда сомножители коллинеарны2).
Пример 1. Пусть е<, е2, е8— правый ортонормиро-
ванный базис. Тогда [ер е2] = е8, [е,, es] = ej, [е2, е£] = е2.
Если fp f2, fs—левый ортонормированный базис, то
[fi. = - f.. [f.. = [f.. tf]=-tr
Предложение 3. Векторное умножение антиком-
мутативно, т. е. всегда [а, Ь] =—[Ь, а].
Действительно, из определения следует, что модуль
векторного произведения не зависит от порядка сомно-
жителей. Точно так же вектор [а, Ь] коллинеарен век-
тору [Ь, а]. Однако, переставляя сомножители, мы долж-
ны изменить направление произведения, чтобы было вы-
полнено условие 3) определения. Действительно, если а,
Ь, Га, Ь]—правая тройка, то Ь, а, [а, Ь]—левая, а Ь, а,
—[а, Ь]—снова правая тройка.
Ниже мы вернемся к векторному произведению, но
сначала будет удобно ввести еще одну операцию.
4. Смешанное произведение. Определение. Число
(а, [Ь, с]) называется смешанным произведением векторов
а, Ь, с и обозначается (а, Ь, с).
Предложение 4. Смешанное произведение неком-
планарных векторов а, Ь и с по модулю равно объему
параллелепипеда, построенного на сомножителях. Оно по-
l)sln<p>0, так как 0<<р<п.
*) Мы договорились считать нулевой вектор коллинеарным лю-
бому вектору.
23
ложительнб, если трбйка а, Ь, с правая, и отрицатель-
но, если она левая.
Действительно, объем параллелепипеда, построенного
на векторах а, b и с, равен (рис. 13) произведению пло-
щади основания | [Ь, с]| на высоту |aHcos0|. Здесь 0 —
угол между векторами а и [Ь, с]. Поэтому мы можем
записать
V=|[b, c]||a||cos0| = |(a, [b, с])| = |(а, b, с)|.
Таким образом, первое утверждение доказано. Знак сме-
шанного произведения совпадает со знаком созО, и пото-
му смешанное произведе-
ние положительно, когда
а направлен в ту же сто-
зону от плоскости векто-
>ов b и с, что и вектор
Ь, с], т. е. когда тройка
а, Ь, с правая. Аналогич-
но доказывается, что сме-
шанное произведение левой
тройки векторов отрица-
тельно.
Если et, еа, es—орто-
нормированный базис, то (еа, еа, еа) = 1 или (ер еа,
е3)==—1, смотря по тому, правый это базис или левый.
Предложение 5. Смешанное произведение равно
нулю тогда и только тогда, когда сомножители компла-
нарны.
Действительно, (a, b, c) = la||[b, c]|cos0, гдеб—угол
между векторами а и [Ь, с]. Равенство | а 11 [b, c]|cos0 =
= 0 возможно только тогда, когда выполнено хоть одно
из условий:
а) а | = 0. Очевидно,что тогда векторы компланарны.
б) [Ь, с] | = 0. Тогда b и с коллинеарны и, следова-
тельно а, b и с компланарны.
в) cos 0 = 0. Тогда вектор а ортогонален [Ь, с], т. е.
компланарен b и с.
Обратное утверждение доказывается аналогично: если
а, b и с компланарны и не имеют места случаи а) и б),
то имеет место случай в).
При перестановке сомножителей в смешанном произ-
ведении, самое большее, может измениться только ориен-
тация тройки этих векторов. Поэтому, согласно предло-
жениям 4 и б, может измениться только знак смешанно-
го произведения. Для любых векторов а, b и е мы по-
24
лучаем, сравнивая ориентации троек векторов,
(a, b, с) = (с, а, b) = (b, с, а)»=«
==—(Ь, а, с) = — (с, Ь, а)« — (а, с, Ь). (6)
Применяя предложение 2 к скалярному произведе-
нию (Аа^ра,, [b, с]), мы получим тождество
(kai+pag, Ь, с) = А(а1, b, с)+р(а„ b, с). (7)
Из равенств (6) следуют аналогичные тождества для ос-
тальных сомножителей. Например, для второго сомножи-
теля
(a, Abj-f-pbj, с) —А (а, blt с)+р(а, bj, с).
Действительно, мы можем переставить интересующий
нас сомножитель на первое место, раскрыть скобки, а
затем выполнить обратную перестановку.
Эти тождества выражают свойство линейности смешан-
ного произведения.
Сейчас мы докажем линейность векторного произведе-
ния, т. е. следующее
Предложение 6. Для любых векторов а, b и с и
любых чисел % и р имеет место равенство
[Аа-|-рЬ, с] = А[а, c]-f-p[b, с].
Для доказательства воспользуемся линейностью сме-
шанного произведения по второму сомножителю:
(d, [Aa+pb, c]) = A(d, [a, c])4-H(«t [Ь, с]).
Это равенство имеет место при всех Л Мы можем вы-
брать ортонормированный базис еъ е2, е3 и подставить
вместо d последовательно каждый вектор этого базиса.
В силу предложения 1 мы получим равенство всех ком-
понент векторов [Aa + pb, с] и А [а, с]4-р[Ь, с], а отсю-
да и равенство векторов, которое нам было нужно дока-
зать.
Аналогично можно доказать линейность векторного про-
изведения по второму сомножителю.
S. Выражение векторного и смешанного произведения
через компоненты сомножителей. Если заданы разложе-
ния векторов а и Ь по векторам базиса ех, еа и е8, мы
можем написать, согласно предложению 6,
[a, b]«=[{aJe1 + aaes + aJea}, {Ра+Ра+Рл}]-»
*(«1₽.~аЛ)[е», е«] + (а2Р,—а,Р») [es, е8] +
+ (аД—atP.)[e«, ej. (8)
25
Как мы видели в примере 1, в ортонормированием базисе
[ei’ ез] == i®»* [е«> ®з] = ±®f. [®з< Cj] я
где берется знак плюс, если базис е1( е2, е, правый, и
знак минус, если базис левый. Чтобы избежать постоян-
ных замечаний об ориентации базиса, мы будем считать,
что базис выбирается всегда правый. Таким образом, мы
получаем следующую теорему.
Теорема 2. В ортонормированием базисе векторное
произведение выражается через компоненты сомножите-
лей формулой
[а, Ь] = (аар,—аД) + (аД—аД) е, + («Д—аД) е,.
(Если базис левый, то перед одной из частей этого ра-
венства следует поставить знак минус.)
Теперь может быть доказана
Теорема 3. Смешанное произведение векторов а, b
и с выражается через их компоненты (ах, а,, а,),
Д, Рг. Р8) и (?1> Тз) в произвольном базисе ех, е,, е8
по формуле
(а, Ь, с) = (аДу34-аДу14-аДу2—
—“зРз?1—«зРт—«iPs?,)(ef, е8, е8).
Для доказательства напишем произведение [Ь, с] по
формуле (8)-
[Ь, с] = (р2у3—РзЬ)[е2, eJ-HPsb—РгУзИе,, «414-
+ (Р1Т»—Рз?1)[ей ез1*
Умножая скалярно обе части этого равенства на вектор
а = а1е14-а1е2-{-а3ез, имеем
(а, [Ь, с])=ах Ду8—PaVa) (ef, [е„, е,]) +
Ч_®з(Рз‘У1 PlVs)(es> [ез» ®1]) Ч"«3 (Р1Тз P»V1) (ез» [®1> ®з])*
(Слагаемые, содержащие смешанные произведения с рав-
ными сомножителями, мы не выписываем, так как они
равны нулю) Отсюда, учитывая равенства (6) и приводя
подобные члены, мы получаем нужный нам результат.
6. Детерминанты второго и третьего порядка. Найден-
ные нами формулы для векторного и смешанного произ-
ведения достаточно громоздки Для их более наглядной
записи употребляются детерминанты второго и третьего
порядка 1).
*) Детерминанты называют также определителями.
26
Рассмотрим четыре числа 04, а„ 0,. Из них мож-
но составить таблицу
|а1 «а|
01 01Г
Таблицы такого вида называются матрицами второго по-
рядка. Число оцР,—называется детерминантом дан-
ной матрицы второго порядка или просто детерминантом
второго порядка. Оно обозначается
|«i «11
101 02 Г
Теперь выражение для векторного произведения в
ортонормированном базисе перепишется так-
Из компонент трех векторов можно составить табли-
цу—матрицу третьего порядка
|«1 «3 «з|
01 0а 011.
У1 Уа уэ|
Число
или, что то же самое,
называется детерминантом этой матрицы (или детерми-
нантом третьего порядка) и обозначается
«1 аг а3
01 02 0а
У1 Уа Уз
По теореме 3 в новых обозначениях
(а, Ь, с) =
СС1 Оа а8
01 02 03
У1 Та уз
(е1. «„ е„).
(9)
В частности, в ортонормированном базисе
(а, b, с)= 01
Of at
VI
0а
iVl
а3
0з
Та
(10)
27
При помощи теоремы 2 и определения детерминанта
третьего порядка можно получить следующую запись
векторного произведения через компоненты сомножите-
лей в ортонормированном базисе en е2, es:
[а, Ь] =
е1 ег
«1 (Xj
Pt Ра
е3
а»
Рз
(И)
Детерминанты тесно связаны с системами линейных
уравнений, решения которых удобно записывать с их
помощью. Этому будет посвящена значительная часть
гл. V, а сейчас мы дадим только геометрическую иллю-
страцию.
Пусть дана система из трех уравнений с тремя неиз-
вестными
а1х + 61у+с1г = /1,'
a2x + b2z/ + c2z = /2,
а,х+Ьйу+слг^[п.
Фиксируем в пространстве некоторый базис и рассмот-
рим векторы a(an at, as), b(&*, b2, ba), c(ct, ca, ct) и
f(/f, fa> /»)• Тогда систему можно рассматривать как
координатную запись векторного равенства
ха 4- yb + zc — f. (12)
Значит, решение системы х, у, г—коэффициенты разло-
жения f по векторам а, Ь и с. Мы можем быть уверены,
что система имеет единственное решение, если а, о и с
не компланарны, т. е. (а, Ь, с)=/=0. Предположим, что
это условие выполнено, и найдем решение. Для этого умно-
жим обе части равенства (12) скалярно на векторное
произведение [Ь, с]. Мы получим х(а, b, c) = (f, b, с),
и, следовательно, х равен отношению детерминантов
ft f, f,
ba Ьз
Cj ca ca
<h a2 a,
&i bt b,
Ci Cj
и
Аналогично находятся и остальные неизвестные.
Остановимся на следующем свойстве детерминантов.
Из равенств (6) вытекает, что детерминант меняет знак
при перестановке двух строк матрицы. Формула (7) озна-
чает, что
Xai+pal Xa2+paJ Xas+pai
Pl Ра Рз
71 V» Ya
== к
at a2
Pi P>
Yi Ya
as
Pi +P
Ya
<zi at aa
Pt Pi Pa
Yt Ya Ya
28
7. Условия коллинеарности и компланарности векто-
ров. Начнем Со следующего полезного предложения.
Предложение 7. Каков бы ни был базис е,, е2, е(,
попарные векторные произведения базисных векторов ли-
нейно независимы.
Докажем это от противного. Рассмотрим равную нулю
линейную комбинацию интересующих нас векторов
Х[е„ С|] + и[ея, et]-|-v[eT, е,]=0
и допустим, что какой-нибудь коэффициент» пусть для
определенности X, отличен от нуля. Умножив линейную
комбинацию на е1( мы получим X fo, е2, е4) = 0, т. е. X 0.
Полученное противоречие доказывает наше предложение.
Следующие предложения дают необходимые и доста-
точные условия коллинеарности и компланарности век-
торов.
Предложение 8. Обращение в нуль детерминанта
матрицы из компонент трех векторов необходимо и до-
статочно для компланарности этих векторов.
Предложение 8 сразу следует из предложения 5 и
формулы (9), поскольку (et, е2, е4)«/=0.
Предложение 9. Пусть (otj, а„ а4) и (₽lt ₽4, ₽4)-r
компоненты векторов а и b в некотором базисе. Эти век-
торы коллинеарны тогда и только тогда, когда
I а2 а31 I а8 си I | <х* «s I _ л
Psf IPs Р/ l=IPi PS|“U
Достаточность условия очевидна! из равенства (13)
по формуле (8) следует обращение в нуль [а, Ь], что рав-
носильно коллинеарности векторов. Заметим, что мы
пользуемся формулой (8), которая справедлива в любом
базисе, и потому можем не требовать ортонормированности
базиса. Наоборот, из обращения в нуль [а, Ь] и форму-
лы (8) мы можем вывести (13), так как в силу предло-
жения 7 векторы [е2, е4], [е4, ej и [е<, е2] линейно неза-
висимы.
В планиметрии признак коллинеарности двух векто-
ров, дается следующим предложением.
Предложение 10. Обращение в нуль детерминанта
матрицы из компонент двух векторов на плоскости необ-
ходимо и достаточно для коллинеарности этих векторов.
Для доказательства мы будем считать, что рассматри-
ваемая плоскость помещена в пространство и базис в
этой плоскости дополнен третьим вектором до базиса в
пространстве. Тогда вектор а с координатами (alt <х2) на
2d
плоскости имеет координаты (ах, аг 0) относительно ба-
зиса в пространстве. Теперь, применяя предложение 9
к векторам a (a,, аа) и b(0n р,), имеем единственное
условие
для их коллинеарности (остальные два детерминанта равны
нулю в силу а8 = ₽, = 0).
8. Площадь параллелограмма. Если в пространстве
заданы два неколлинеарных вектора а и Ь, имеющих об-
щее начало, то площадь параллелограмма, построенного
на этих векторах, может быть найдена через их компо-
ненты в ортонормированном базисе по формуле
5 = 1 [а, Ь]|=__________________________________
= И (аД-аД)’ + Н-<)’ + (аД-аД)*. (14)
Площадь параллелограмма в планиметрии вычисляется
аналогично. Хотя векторное произведение и не определе-
но, мы можем, как и при доказательстве предложения 10,
предполагать, что изучаемая плоскость помещена в
пространство и третий базисный вектор выбран пер-
пендикулярно плоскости и имеет длину 1. Тогда вектор-
ное произведение векторов на плоскости имеет одну-
единственную компоненту, отличную от нуля, а именно
третью, и площадь параллелограмма, построенного на
векторах а и Ь, выражается через их компоненты в орто-
нормированном базисе на плоскости формулой
5 = |аД—аД|, (15)
т. е. равна абсолютной величине детерминанта
I at а81
|₽£ Psi'
Когда мы составляем выражение aiPa—a2fa, то существенно,
что вектор а считается первым, а Ь—вторым. Если бы вторым был
а, а первым Ь, то компонента векторного произведения была бы
Pj«s—Psai- Площадь параллелограмма не зависит от порядка век-
торов, так как она равна модулю этого выражения.
Введем теперь понятие ориентации параллелограмма иа пло-
скости. Будем предполагать, чтд параллелограмм построен на двух
векторах, т. е. две его смежные стороны являются векторами с
общим началом.
Определение. Параллелограмм называется ориентирован-
ным, если пара векторов, на которой он построен, упорядочена.
Ориентация называется положительной, если кратчайший поворот
от первого вектора ко второму происходит против часовой стрелки,
и отрицательной в противоположном случае.
30
Мы будем предполагать, что параллелограмм, построенный на
бйзиёных векторах е, и е2 («базисный параллелограмм»), ориен-
тирован положительно. Если мы помещаем плоскость в простран-
ство, то (е,, esl=e>, так как базис в пространстве всегда правый.
Неравенство счР,—a2Pi > 0 означает, что вектор [а, Ь] направлен
-так же, как [elt еа], и, следовательно, параллелограмм, построен-
ный на векторах а и Ь, ориентирован также положительно.
Принято считать площадь ориентированного параллелограмма
числом со знаком: положительным для положительно ориентирован-
ных параллелограммов и отрицательным для отрицательно ориентиро-
ванных.
Как показывают предыдущие рассуждения, если базисный па-
раллелограмм ориентирован положительно, то число aiP2— ааР<
равно площади ориентированного параллелограмма, построенного
на векторах a(aj, a2) и b (₽i, ₽•>). Можно сказать также, что при
«1₽а—a2pt > 0 ориентация параллелограмма, построенного на век-
торах а и Ь, совпадает с ориентацией базисного параллелограмма,
а при а,Ра—СЦ01 < 0 противоположна ей.
9. Объем ориентированного параллелепипеда. Мы будем пред-
полагать, что параллелепипед построен на трех векторах, т, е, три
его ребра являются векторами, имеющими общее начало.
Определение. Параллелепипед называется ориентирован-
ным, если тройка векторов, на которой он построен, упорядочена.
Ориентация называется положительной, если эта тройка Правая, и
отрицательной в противном случае.
Принято считать объем ориентированного параллелепипеда
положительным, если его ориентация положительна, и отрицатель-
ным, если ориентация отрицательна. Предложение 4 можно теперь
сформулировать следующим образом.
Предложение 11. Смешанное произведение трех некомп-
ланарных векторов равно объему ориентированного параллелепипеда,
построенного на этих векторах.
10. Двойное векторное произведение. Выражение
[а, [Ь, с]] называется двойным векторным произведением
векторов а, Ь, с. Докажем, что
[а, [Ь, с]] = (а, с)Ь—(а, Ь)с. (16)
С этой целью выберем ортонормированный базис ер е2,
е, так, чтобы вектор е( совпадал по направлению с а
(т. е. a = aef, где « = |а|). Обозначим через (рр p3),
(Т<> Та» Vs) и (А1» да» Аз) координаты векторов Ь, с и
[Ь, с] соответственно. Тогда по формуле (1) имеем
(а, с)Ь = аух(рге,4-раеа4-р8еа)
и
(а, Ь) с « сф2 (у^ 4- у2е2 4- у,е3).
Это позволяет преобразовать правую часть формулы (16)
к виду
«(УхРа—PiVi) ®э + «(ТхР» “Р1?з) es = “ аД»е2+«Aa®3-
31
С другой стороны, из формулы (11) непосредственно
видно, что
[а, [Ь, с]]= — аЛ,е,4-аЛ2е3.
Это заканчивает доказательство.
11. Взаимный базис. Дадим следующее
Определение. Базис, составленный из векторов
с» . [еа, е3] е» _ [е3, et] е« _ [elt еа]
1 (ej, е„ е3) ’ 2 (е1( еа, е8) ’ 3 (еь еа, е3) ’
называется взаимным для базиса е,, е2, е3.
Из предложения 7 вытекает, что е,, е2, ез не компланарны и
действительно образуют базис.
Нетрудно проверить, что каждый ортонормированный базис
совпадает со своим взаимным.
Предложение 12. Если ej, е2, е3—базис, взаимный базису
е(, е3, ез, то компоненты произвольного вектора а в базисе еь е21 е3
находятся по формулам
ах=з>(а, el), а, = (а, el), а$ = (а, el).
Действительно, умножив равенство a=a1ei+aaea-]-a3e3 ска-
лярно на ер мы получаем (а, et) = е j • Аналогично до*
называются и остальные формулы.
Предложение 13. Если ej, еа, е3—базис, взаимный с ej,
eg, е3, то базис е,**, е*‘, el*, взаимный о е,, еа, е3, совпадает о
еи еа, е3 *
Доказательство начнем с того, что разложим вектор е, по ба-
зису е,( е2, е3, пользуясь формулами из предложения 12. Поскольку
ei имеет компоненты (1, 0, 0), мы видим, что
« <’) = *» (е’’ •в’)“(е1» е»*)=°
Аналогично, раскладывая е3 и е3, получаем еще шесть равенств:
(е3\ (в2> е7) = (еа< О"0’
«. О = ъ « <) = « еГ) = °-
Но эти же равенства, в силу того же предложения 12, означают,
что компоненты векторов е‘‘, е3* и е3* по базису е,, eg, е3 равны
соответственно (1, 0, 0), (0, 1, 0) и (0, 0, 1), т, е. ej* = ef, ej* = e2(
e** = es. Предложение доказано,
12. О векторных величинах. В приложениях матема-
тики часто рассматриваются величины, изображаемые
векторами: силы, скорости, моменты сил и т. д. Векто-
рам, изображающим такие величины, приписывается раз-
мерность. Не вдаваясь в существо дела, мы ограничимся
32
изложением формальных правил действий в размер-
ностями.
С формальной точки зрения размерность-—это одно-
член, составленный из какого-то набора символов. Такие
одночлены перемножаются и делятся по обычным прави-
лам действий над одночленами. Имеют место следующие
правила действий с размерностями:
1. Складывать векторные величины можно только в
том Случае, когда их размерности совпадают. При этрм
размерность суммы та же, что и у слагаемых.
2. При умножении векторной величины на скалярную
их размерности перемножаются.
3. Модуль векторной величины имеет ту же размер-
ность, что и сама величина.
4. Скалярное и векторное произведение имеют размер-
ность, равную произведению размерностей сомножителей.
Это легко следует из их определений и предыдущего
правила.
Для того чтобы изобразить векторную величину на
чертеже, мы должны условиться о масштабе: сколькими
единицами длины (например, см) мы будем изображать
одну единицу данной размерности (например, км,
м/сек, Н).
Если в векторном произведении сомножители имеют
размерность длины, то произведение имеет размерность
площади. Масштаб для изображения единиц Площади
выбирается так, чтобы одна единица площади изобража-
лась одной линейной единицей. При этом длина вектор-
ного произведения будет численно равна площади парал-
лелограмма, построенного на сомножителях.
Поскольку единица длины у нас выбрана раз навсегда
и не меняется, указанное соглашение ни к каким проти-
воречиям привести не может. Однако оно не так безобид-
но, как может показаться. Именно, два математика, поль-
зующиеся этим соглашением, но разными единицами
длины (например, француз, пользующийся сантиметрами,
и англичанин—дюймами), для одних и тех же векторов
нарисуют несовпадающие векторные произведения.
§ 4. Замена базиса и системы координат
1. Изменение базиса. До сих пор мы щ>едполагали, что
рассматривается один базис. Однако выбор базиса ничем
не ограничен, и принципиальное значение имеет задача о
нахождении компонент вектора в одном базисе по его
33
2-102
компонентам в другом базисе. При этом положение ново-
го базиса относительно старого должно быть задано, а
именно должны быть заданы компоненты новых базисных
векторов ej, еа, ej в старом базисе ev е2, еа. Пусть1)
e^alej+afo + aJej,
ез = aie, + aje2 + afe8. ,
(1)
Произвольный вектор а разложим по базису e't, е'г, e^i
а «= a;e,' 4- ааеа 4- аХ-
Обозначим компоненты вектора а в старом базисе через
04, а, и аа. Раскладывая каждый член предыдущего ра-
венства по базису еп еа, е8, в силу предложений 4 и 3 § 1
мы имеем
at — а{а[ 4- а'2а'г 4- ,
аг = alaj 4- а2а'г 4- а23а3,
at — a’a; 4- а32а2 4- а3а3.
(2)
Соотношения (2) и являются решением нашей задачи.
Если нас заинтересует выражение новых компонент через
старые, то нам придется решить систему уравнений (2)
относительно неизвестных а{, aj, а3.
Точно тем же способом мы можем получить формулы,
связывающие компоненты вектора в разных базисах на
плоскости. Эти формулы ТЭК0ВЫ1
аа = afaj 4- а22а2. | '
Коэффициенты при а'и aj и aj в формулах (2) можно
записать в следующую матрицу третьего порядка!
4
4
4
4
4
4
(3)
Эта матрица называется матрицей перехода от базиса
ei» es’ е» к базизу еп еа, еа. В ее столбцах стоят компо-
ненты новых базисных векторов еп еа и еа по старому
базису q, еа, ₽а.
Ц Здесь для удобства один из индексов мы располагаем сверху.
Это не показатель втейени, Например, 4 читается <д один-три»,
34
2. Изменение системы координат. Рассмотрим теперь
две декартовы системы координат! старую О, е{, е„ е( и
новую О’, ei, e't, ej. Пусть Af—произвольная точка, ко-
ординаты ее в этих системах обозначены соответственно
(х, у, г) и (х', у', г'). Поставим себе задачу выразить х, у,
г через х', у’, г', считая известным положение новой си-
стемы координат относительно старой, т. е. считая извест-
ными старые координаты а}, а%, <4 нового начала коор-
динат О' и компоненты новых базисных векторов в ста-
ром базисе, составляющие матрицу перехода (3).
Радиус-векторы точки М относительно точек О и О'
связаны равенством ОМ = 00' -^0'^1, которое мы можем
записать в виде
ОМ — 00' 4 x'e't 4- у'е2 4 г'е3, (4)
так как х\ у', г'—компоненты О'М в базисе е(', е,, е^.
Разложим каждый член равенства (4) по базису et, е„ е,,
имея в виду, что компоненты ОМ и 00' равны коорди-
натам точек М и О', которые мы обозначили соответст-
венно через х, у, г и aj, aj, а?. Мы получим три число-
вых равенства, равносильных равенству (4)>
х=а\х' 4 а\у' 4 ajz' 4 aj,
у=ajx' 4 4 aiz' 4 aj,
z = aix'4aj/4ajzf4aj.
(5)
Равенства (5) и представляют собой закон преобразова-
ния координат точки при переходе от одной декартовой
системы координат к другой.
3. Преобразование декартовой прямоугольной системы
координат на плоскости. Формулы перехода от одной си-
стемы координат на плоскости к другой могут быть полу-
чены из (5), если там оставить только первые два равен-
ства и в них вычеркнуть члены, содержащие zi
x=a}x'4a,!pr+aj, |
p=ajx'4a^'4aj. J '
Рассмотрим частный случай, когда обе системы коор-
динат декартовы прямоугольные. Через <р обозначим угол
между векторами <4 и ej, отсчитываемый в направлении
кратчайшего поворота от е, к ег Тогда (рио. 14)
е,'=cos ф е, 4 sin ф е„
63=cos ^iyjej + sin^iyje,.
2*
В разложении ei ставится знак плюс, если кратчайший
поворот от ej к ej направлен так же, как кратчайший
поворот от ef к т. е. если новый базис повернут отно-
сительно старого на угол <р. Знак минус в разложении е'2
Рис, 14. Два случая взаимного расположения ортонормированных
базисов на плоскости.
ставится в противоположном случае, когда новый базис
ие может быть получен поворотом старого. Поскольку
cos (<р ±4^ = sin <р, sin(<p±y) = ±cos<p,
мы видим что
x=x'cos<p4: у* з1пфЦ-а}, 1
p = x'sin<p±/cosq>-|-aj, J
причем при повороте системы координат берется верхний
знак.
ГЛАВА II
ПРЯМЫЕ ЛИНИИ И плоскости
§ 1. Общее понятие об уравнениях
1. Определение. Начнем о простого примера. Пусть в
пространстве задана декартова прямоугольная система
координат. Рассмотрим сферу радиуса г, центр которой
находится в точке О о координатами (а, Ь, с). Сфера —
множество точек, отстоящих от центра на одно и то же
расстояние г. Обозначим через х, у, г координаты произ-
вольной точки М и выразим через них равенство | ОМ | *=г.
Мы получим
+ - г. (1)
Возводя в квадрат обе части равенства (1), мы придадим
ему более удобную форму!
+ (2)
Очевидно, что это соотношение выполнено для всех точек
сферы и только для них, и, следовательно, его можно рас-
сматривать как запись определения сферы при помощи
координат. Равенство (2) называется уравнением сферы
в рассматриваемой системе координат.
Приведем еще один пример из геометрии на плоскости.
Г рафиком функции f (х) называется линия L, состоящая
из точек, координаты которых связаны соотношением
У—fM. Если нас интересует в первую очередь линия, а
не функция, мы можем встать на другую точку зрения и
считать, что соотношение y=f(x) есть уравнение линии Ь.
Определим теперь, что следует вообще понимать под
уравнением некоторого множества.
Пусть выбрана система координат. Под уравнением
множества S в этой системе координат мы будем пони-
мать выражение определения S через координаты его то-
чек, т. е. высказывание, верное для координат точек, при-
37
надлежащих S, и неверное для координат точек, ему не
принадлежащих.
Чаще всего уравнение представляет собой равенство,
записанное «математическими символами», но это вовсе
не обязательно: оно может быть словесным описанием,
перечислением, программой для ЭВМ и т. д. Это должно
представляться естественным для читателя, знакомого
с общим определением функции и способами задания
функций.
Часто уравнению множества точек в планиметрии
придается форма F (х, у) = 0, где F—функция от двух
переменных, а в стереометрии—F (х, у, г) —О, где' F —
функция от трех переменных. Написанное выше уравне-
ние сферы имеет такой вид, если не замечать то несу-
щественное обстоятельство, что член г* написан в другой
части равенства.
Может оказаться, что уравнение какого-либо множе-
ства удобнее записать в виде неравенства. Например,
шар, ограниченный сферой с уравнением (2), имеет
уравнение
(х—а)? Ч- (у—by + (z—с)2 г2.
Уравнения такого вида мы будем называть неравенствами.
Однако напрасно было бы надеяться разделить множества
на такие, которые задаются равенствами, и такие, кото-
рые задаются неравенствами. Действительно, равенство
Ф(х, у, z) — F(x, у, z)—\F(x, у, г) | = 0
задает то же множество, что и неравенство F (х, у, г) 0.
Следует подчеркнуть зависимость уравнения от систе-
мы координат: уравнения одного и того же множества в
разных системах координат, вообще говоря, различны.
Это связано с тем, что при изменении системы координат
меняются и координаты точки.
Обучаясь математике, мы знакомимся с логическими
и математическими правилами, по которым из одного
верного высказывания можно получить другое верное
высказывание. Строгое изучение этих правил относится
к специальной науке^-математической логике. Мы же,
формулируя приведенные ниже предложения, будем про-
сто считать, что такие правила известны. Естественно
поэтому, что о доказательстве этих предложений не мо-
жет быть речи.
Предложение 1. Если Р$ и Рг—уравнения ^то-
жеств S и Т, то уравнение пересечения S(\T есть вывка-
38
зывание, состоящее в том, что Ps и РТ верны одно-
временно.
Пусть Ps и РТ—равенства, содержащие координаты
точки} Fs(x,y, г) = 0 и FT(x, у, г) = 0. Тогда уравнение
пересечения есть система уравнений
Fs(x> У> г) = 0, FT(x, у, г) = 0.
Предложение 2. Если Ps и РТ—уравнения мно-
жеств S и Т, то уравнение объединения S[)T есть выска-
зывание, состоящее в том, что из Ps и РТ верно хотя бы
одно.
Если Ps и РТ имеют вид Fs (х, у, г)=0 и FT(x, у, z)=0,
то уравнение объединения можно написать в виде
Fs(x< У> z)-FT(x> У> г) = 0.
Предложение 3. Если Ps и РТ—уравнения мно-
жеств S и Т, и S есть подмножество Т, то из Ps сле-
дует РТ.
Предложение 4. Множества S и Т совпадают
тогда и только тогда, когда их уравнения эквивалентны,
т. е. из Ps следует РТ, а из Рт следует Ps.
Проиллюстрируем два последних предложения. Урав-
нения (1) и (2) эквивалентны! переходя от (2) к (1), мы
можем не ставить двойного знака перед корнем, так как
г > 0. Наоборот, уравнение
г_с= Кг*-(х-а)’—(у—&)» (3)
не эквивалентно уравнению (2). Действительно, хотя воз-
ведением в квадрат можно получить (2) из (3), но при
извлечении корня из (2) мы получаем
г—с == ± V гг—(х—а)г—(у—Ь)\
Это означает, что равенство (2) выполнено не только для
точек, удовлетворяющих уравнению (3), но и для точек,
удовлетворяющих уравнению
z—с = — К гг—(х—а)г—(у—Ь)*. (4)
Уравнение (2) следует также и из (4). Таким образом,
уравнения (3) и (4) определяют части сферы—«верхнюю»
и «нижнюю» полусферы.
Иногда предложения 3 и 4 считают определениями
отношений «следует» и «эквивалентно» для уравнений.
2» Алгебраические линии н поверхности. Изучение
произвольных множеств точек—задача совершенно не-
объятная. В этом пункте мы определим сравнительно
39
узкий класс множеств, все еще чересчур широкий для
того, чтобы быть подробно изученным.
Определение. Алгебраической поверхностью назы-
вается множество, которое в какой-нибудь декартовой
системе координат может быть задано уравнением вида
Аре**yi>zm' 4- ... 4- Ag&ybzP* — 0, (б)
где все показатели степени—целые неотрицательные
числа. Наибольшая из сумм1) ^4-4+ mi> +
называется степенью уравнения, а также порядком ал-
гебраической поверхности.
Это определение означает, в частности, что сфера,
уравнение которой в прямоугольной системе координат
имеет вид (2), является алгебраической поверхностью
второго порядка.
Определение. Алгебраической линией на плоскости
называется множество, которое в какой-нибудь декартовой
системе координат на^ плоскости может быть задано
уравнением вида
А^'у1' 4- • • 4- А^у1* « 0, (6)
причем все показатели—неотрицательные целые числа.
Наибольшая из сумм •••» kt + l3 называется сте-
пенью уравнения, а также порядком линии.
Легко видеть, что алгебраическая поверхность не обя-
зательно является поверхностью в том смысле, какой мы
интуитивно придаем этому слову. Например, уравнению
xa + </,+z’+l=0 не удовлетворяют координаты ни одной
точки. Уравнение
(х* 4- У* + г2) [(х -1 )’ 4- (у-1 )2 4- (z -1 )2] = О
определяет две точки, уравнение у2 + г2 = 0 определяет
линию (ось абсцисс). Такое же замечание следует сде-
лать и об алгебраических линиях. Читатель сам сможет
найти соответствующие примеры.
Приведенные определения имеют существенный недо-
статок. Именно, неизвестно, какой вид имеет уравнение
поверхности в какой-нибудь другой декартовой системе
координат. Если же уравнение и имеет в некоторой дру-
*) Разумеется, здесь имеется в виду наибольшая из сумм, фак-
тически входящих в уравнение, т. е. предполагается, что после
приведения подобных членов найдется хотя бы одно слагаемое с
ненулевым коэффициентом, имеющее такую сумму показателей.
Это же замечание относится и к определению порядка алгебраи-
ческой линии, приведенному ниже,
40
гой системе координат вид (5), то степень какого из этих
уравнений мы будем называть порядком поверхности?
Такие же вопросы возникают и об алгебраических линиях.
Ответом служат следующие теоремы, называемые теоре-
мами об инвариантности (неизменности) порядка.
Теорема 1. Если поверхность в некоторой декар-
товой системе координат может быть задана уравнением
вида (5), то и в любой другой декартовой системе коор-
динат она может быть задана уравнением того же вида,
имеющим ту же степень.
Теорема 2. Если линия на плоскости в некоторой
декартовой системе координат может быть задана урав-
нением вида (6), то и в любой другой декартовой системе
координат она может быть задана уравнением того же
вида, имеющим ту же степень.
Обе теоремы доказываются одинаково. Докажем, на-
пример, теорему 2. С этой целью перейдем от той декар-
товой системы координат О, et, еа, о которой шла речь
в определении, к произвольной новой декартовой системе
координат О', е;, Старые координаты х, у связаны
с новыми координатами х', у' формулами (6) § 4 гл. I:
x = a}x'4-a^'4-aj,
y=alx' +с$у' 4-aJ.
Чтобы получить уравнение линии в новой системе коор-
динат, подставим в ее уравнение выражения х и у через
х' и у'. При возведении трехчлена a?x'4-ajp'4-aj в
степень k мы получим многочлен относительно х' и у1
степени k. При возведении а*х' + а$у' + а$ в степень I
мы получим многочлен степени I. Перемножая получен-
ные многочлены, заметим, что каждый член вида Ах*у*
в левой части уравнения (6) переходит в многочлен сте-
пени k 4-/ относительно x'j и у'. Сумма многочленов —
это многочлен, степень которого не выше степеней слагае-
мых. (Она могла бы оказаться ниже, если бы члены с
наибольшей суммой показателей уничтожились.) Итак,
мы доказали пока, что алгебраическая Линия в любой
декартовой системе координат имеет уравнение вида (6),
причем степень уравнения при переходе от одной систе-
мы координат к другой не может повыситься. Нам оста-
ется доказать, что она не может и понизиться и, сле-
довательно, должна оставаться постоянной. Это легко
доказать от противного. В самом деле, при обратном пе-
реходе от системы координат О1, ei, ej к системе коор-
динат О, elt е2 старые координаты х{, у( точки выража-
41
ются через ее новые координаты х, у приведенными вы-
ше формулами, но решенными относительно х', у'. По-
этому, если при переходе от О, еп е, к О', е^, ej много-
член F(x, у) перешел в многочлен G(x', у'), то при об-
ратном переходе многочлен 0(х', у') перейдет в F (х, у).
Теперь допустим, что при переходе от системы коорди-
нат О, ef, е„ к системе О', ej, ej степень уравнения по-
низилась. Тогда при обратном переходе от О', ej, е, к
О, е,, е, степень должна была бы повыситься, что, как
мы знаем, невозможно.
Замечание. Свойство неизменности порядка не от-
носится к различным уравнениям, которые линия или
поверхность могут иметь в одной и той же системе коор-
динат. Хотя такие уравнения и эквивалентны, среди них
могут быть уравнения различных степеней и даже не
имеющие вида (5) или (6). Действительно, следующие
три уравнения определяют окружность радиуса 1 с цен-
тром в начале декартовой прямоугольной системы коор-
динат:
/х»4-и’=1, х* + у*—1=0,
(х’ + ^-1)’ = 0. (7)
Принято считать, что эквивалентные уравнения вида (6),
имеющие разные степени, задают разные алгебраические
линии (хотя множества точек, им удовлетворяющих, и
совпадают!). Например, говорят, что уравнение (7) опре-
деляет «сдвоенную окружность».
Порядок алгебраической линии—первый встретивший-
ся нам пример инварианта. Вообще инвариантом назы-
вают всякую величину, не меняющуюся при изменении
системы координат. Только инвариантные комбинации
величин (коэффициентов, показателей и т. д.), входящих
в уравнение линии или поверхности, характеризуют гео-
метрические свойства' самой линии или поверхности, не
зависящие от ее расположения относительно системы
координат. Какой геометрический смысл имеет порядок
линии, мы увидим в конце главы.
Теперь мы можем указать основной предмет курса
аналитической геометрии. В нем исследуются главным
образом алгебраические линии и поверхности первого
и второго порядка, которые доступны для изучения сред-
ствами элементарной алгебры.
Прежде чем перейти к их свойствам, рассмотрим не-
сколько более общих уравнений. Мы будем говорить
о линиях и поверхностях. Формулирование их общих оп-
42
ределений не входит в нашу задачу. Читатель, который
любит, чтобы все было точно определено, может под ли-
нией и поверхностью понимать соответственно алгебраи-
ческую линию и поверхность, однако все результаты
имеют место и в более общем случае.
3. Параметрические уравнения линий. Представим се-
бе, что линия—это траектория движущейся точки.
В каждый момент времени t нам известно положение
точки, т. е. ее координаты относительно выбранной за-
ранее системы координат. Это означает, что координаты
точки (х, у, г) (или (х, у) для линии на плоскости) яв-
ляются заданными функциями времени:
* = <₽(/)> Р = Ф(О» г = Х(0- (8)
Здесь не существенно, что переменная величина t имеет
физический смысл времени. Если мы зададим координаты
точки как функции от какой-нибудь переменной величи-
ны, или, как говорят, параметра, мы тем самым зада-
дим линию.
Уравнения вида (8) называются параметрическими
уравнениями линии в пространстве, а уравнения вида
х = <р (/), У = Ф (0—параметрическими уравнениями линии
на плоскости. Напомним, что уравнение линии есть вы-
сказывание о координатах точек, верное для точек ли-
нии и только для них. В данном случае полная форму-
лировка этого высказывания следующая: существует та-
кое число t, что выполнены равенства (8).
Например, уравнения x=rcos/, p = rsin/ задают ок-
ружность радиуса г с центром в начале координат.
В этом легко убедиться, если заметить, что t—здесь
угол между радиус-вектором точки окружности и базис-
ным вектором ер
Уравнения x = rcos/, у=г sin/, г —at залают винто-
вую линию, лежащую на цилиндре радиуса г и имеющую
шаг винта, равный 2ла.
4. Параметрические уравнения поверхностей. Конусы.
По аналогии с параметрическими уравнениями линии
введем параметрические уравнения поверхности. Уравне-
ния вида
х«ф(и, о), у = ф(и, о), «) (9)
называются параметрическими уравнениями поверхности,
если ДЛЯ, каждой 'точки М > на поверхности существует
.пара чисел и, V, при которой координаты М получаются
43
зуюгцая.
из этих уравнений, и наоборот, для точки, не лежащей
на поверхности, такой пары чисел не существует.
В качестве примера получим параметрические уравне-
ния конуса. Конусом называется поверхность, составлен-
ная из прямых линий, проходящих через фиксированную
точку—вершину конуса. Прямые носят название образую-
щих (рис. 15), а линия, которая
лежит на конусе, не проходит че-
рез вершину и пересекает все об-
разующие, называется направляю-
щей конуса
Пусть задана декартова сис-
тема координат, начало которой
совпадает с вершиной конуса О,
и даны параметрические уравнения
направляющей x = /(u), y — g(u),
z*=h(u). Образующая, проходя-
щая через произвольную точку
М (х, у, z) на конусе, пересекает
направляющую в точке Р с Коор-
динатами f (и), g(u), h(u), где и—
соответствующее значение пара-
метра. Векторы ОМ и ОР кол-
существует число и такое, что
это равенство в координатах, мы
произвольной точки на конусе через
линеарны, и потому
" > " >
OM = vOP. Записывая
выразим координаты
параметры и и и;
x=*vf(u),
y**vg(u),
i~vh(u}.
Читатель проверит, что точка, не лежащая на конусе,
не удовлетворяет этим уравнениям ни при каких и и V.
5, Уравнения, не содержащие одной из координат.
Рассмотрим частный случай,'когда в уравнение поверхности
не входит одна из координат, например г, и уравнение
имеет вид G (х, у)==0. Пусть точки М9 а координатами х0,
уа, г0 лежит на поверхности. Тогда точки с координата*-
ми х0, уа, г при любых г также лежат на поверхности.
Легко заметить, что все точки с координатами такого
вида заполняют прямую, проходящую через М9 в направ-
лении вектора е2. Таким образом, вместе со вейкой точ-
кой 7И0 на поверхности лежит прямая, проходящая че-
рез М, в направлении et.
44
или цилиндром,
Определение. Поверхность, которая состоит из пря-
мых линий, параллельных заданному направлению, на-
зывается цилиндрической поверхностью
а прямые линии— ее образу-
ющими (рис. 16). Линию, лежа-
щую на поверхности и пересе-
кающую все образующие, на-
зывают направляющей.
Мы показали, что уравнение,
не содержащее одной из коор-
динат, определяет цилиндр с
образующими, параллельными
соответствующей оси коорди-
нат.
В качестве примера реко-
мендуем читателю построить
поверхность, заданную уравнением х*+уя — гг относи-
тельно декартовой прямоугольной системы координат в
пространстве. Эта поверхность—прямой круговой цилиндр.
§ 2. Уравнения прямых и плоскостей
Этот и следующий параграфы посвящены уравнениям
плоскости, прямой линии на плоскости, а также прямой
линии в пространстве. В этих уравнениях много общего,
и мы будем изучать их одновременно. В тех случаях,
когда сходные предложения имеют, по существу, одина-
ковые доказательства, мы будем доказывать только одно
из них.
1. Поверхности и линии первого порядка. Уравнение
первой степени, или линейное уравнение, связывающее
координаты точки в пространстве, имеет вид
Лх-|- Ву+Сг-Ь D = 0, (1)
причем предполагается, что коэффициенты не равны ну-
лю одновременно, т. е. Аа + Вя+С*=£0. Аналогично,
уравнение первой степени, или линейное уравнение, свя-
зывающее координаты точки на плоскости,—это уравне-
ние
Ах By С — 0 (2)
при условии Л8 + ВМ=0.
Мы докажем, что поверхности и линии первого по-
рядка—это плоскости и прямые. Точнее, имеют место
следующие теоремы.
46
Теорема 1. В общей декартовой системе координат
в пространстве каждая плоскость может быть задана
линейным уравнением. Обратно, каждое линейное уравне-
ние (1) в общей декартовой системе координат определя-
ет плоскость.
Теорема 2. В общей декартовой системе координат
на плоскости каждая прямая линия может быть задана
линейным уравнением. Обратно, каждое линейное уравне-
ние (2) в общей декартовой системе координат на пло-
скости определяет прямую линию.
Обе теоремы доказываются одинаково. Докажем, на-
пример, теорему 1.
Пусть нам дана некоторая плоскость. Выберем систе-
му координат следующим образом. Начало координат О
и первые два базисных вектора е( и мы поместим в
плоскости, а вектор е3 выберем произвольно. В такой си-
стеме координат наша плоскость будет иметь линейное
уравнение z = 0. В силу теоремы об инвариантности по-
рядка она имеет линейное уравнение и в любой другой
декартовой системе координат.
Обратно, пусть даны общая декартова система коорди-
нат и уравнение (1). Найдем множество точек, коорди-
наты которых удовлетворяют этому уравнению. Предпо-
ложим для определенности, что в уравнении коэффици-
ент С не равен нулю, и сделаем замену системы коорди-
нат, положив
х'—х, у' —у, г' = Ax + By+Cz+D. (3)
Множество, определяемое в старой системе координат
уравнением (1), в новой системе координат будет иметь
уравнение г' = 0 и, следовательно, является плоскостью.
Нам остается только доказать, что уравнения (3) дейст-
вительно определяют переход к новой системе координат.
Для этого решим их относительно х, у и г. Мы получим
х = х', у = у, —иу+-5—5-.
На основании формул (5) § 4 гл. 1 мы можем сказать,
что эти равенства задают переход от исходной системы
координат к системе О', el, е,, ej, где О' (0, 0,—D/C),
ej(I, 0,—А/С), е!(0, 1»—В/С), е£(0, 0, 1/G). Компонен-
ты векторов el, e't и ej таковы, что независимо от значе-
ний А, В и С векторы эти не компланарны. Эго закан-
чивает доказательство теоремы.
Теоремы этого пункта полностью решают вопрос об
уравнениях плоскости н прямой на плоскости. Однако
ввиду важности этих уравнений мы получим их еще в
других формах.
2. Параметрические уравнения прямой и плоскости.
Прямая линия (на плоскости или в пространстве) пол-
ностью определена, если на ней задана точка ЛГ0 и за-
дан ненулевой вектор, параллельный этой прямой. Разу-
меется, и точку, и вектор можно выбирать многими раз-
личными способами, но пока мы будем считать, что они
как-то выбраны, и назы-
вать их начальной точкой
и направляющим вектором
прямой. Аналогично, плос-
кость задается точкой и
двумя неколлинеарными
векторами, лежащими в
этой плоскости, — началь-
ной точкой и направляю-
щими векторами плоскос-
ти.
Мы будем предполагать,
Рис. 17.
что задана декартова систе-
ма координат в пространстве или на плоскости (если мы
изучаем прямую линию в планиметрии). Это, в частно-
сти, означает, что каждой точке сопоставлен ее радиус-
вектор относительно начала координат.
Пусть дана прямая. Обозначим через г0 и а соответ-
ственнно радиус-вектор ее начальной точки Мв и направ-
ляющий вектор прямой. Рассмотрим теперь некоторую
точку М, радиус-вектор которой обозначим г (рис. 17).
Вектор г—г„, начало которого Мв лежит на прямой, па-
раллелен прямой тогда и только тогда, когда его конец,
точка М, также лежит на прямой. В этом и только в
этом случае для точки М найдется такое число (, что
г—г0 = /а.
(4)
Наоборот, какое бы число мы ни подставили в формулу
(4) в качестве /, вектор г в этой формуле будет радиус-
вектором некоторой точки на прямой.
В формуле (4) переменная Величина t, пробегающая
все вещественные значения, называется параметром, a
уравнение (4) носит название векторного параметричес-
кого уравнения прямой.
47
Векторное параметрическое уравнение прямой выгля-
дит одинаково и в планиметрии, и -в стереометрии, но
при разложении по базису оно сводится в одном случае
к двум, а в другом случае к трем скалярным уравнениям.
Действительно, обозначим координаты точек М и М9 че-
рез (х, у) и (х„ уа), если изучается прямая на плоскости,
и через (х, у, z) и (х0, р0, г0), если прямая в простран-
стве. Компоненты вектора а обозначим соответственно (ор
oj) и (ar, аг, at). Тогда, раскладывая по базису обе части
равенства (4), мы получим
или
X—Xg — Oft, )
У—Уо = а»1 I
X—X^ — 0-ft,
y—y, = att,
z — za = ast
(5)
(6)
в зависимости от того, сколько векторов составляют ба-
зис. Уравнения (5) называются параметрическими урав-
нениями прямой на плоскости, а уравнения (6)—пара-
метрическими уравнения-
ми прямой в пространстве.
Получим теперь пара-
метрические уравнения
плоскости. Обозначим че-
рез г„ р и q радиус-век-
тор начальной точки Мо
и' направляющие векторы
плоскости. Пусть точка М
с радиус-вектором г—про-
извольная точка в прост-
ранстве. Начало вектора
г—г, лежит на плоскости.
Следовательно, его конец
М лежит на плоскости
тогда и только тогда, когда этот вектор лежит в рас-
сматриваемой плоскости. Векторы р и q не коллинеарны
(рис. 18). Поэтому, если точка М лежит в плоскости (и
только в этом случае), найдутся такие числа tt и что
г—г0 = /1р-Н*Ч.
(7)
Это уравнение называется векторным параметрическим
уравнением плоскости. Каждой точке плоскости соответ-
ствуют значения двух параметров tt и tt. Наоборот, ка-
48
кие бы числа мы ни подставили как значения парамет-
ров, уравнение (7) определяет радиус-вектор точки на
плоскости.
Если (х, у, г) и (х#, yt, z0) —координаты точек М и
Мв, a (pt, Pi, р^ и (qt, qt, g,)—компоненты векторов
p и q, то, раскладывая обе части равенства (7) по бази-
су, мы получаем
ж—x0==/fpi4-Ggf,
У—+
(8)
Уравнения (8) называются параметрическими уравне-
ниями плоскости.
Отметим, что начальная точка и направляющий век-
тор прямой образуют на этой прямой ее внутреннюю де-
картову систему координат. Значение параметра t, соот-
ветствующее какой-либо точке, является координатой этой
точки по отношению к внутренней системе координат.
Аналогичное замечание можно сделать и о плоскости.
Ее начальная точка и направляющие векторы образуют
на ней внутреннюю сис ему координат. Значения парамет-
ров tt и соответствующие какой-либо точке, являются
координатами этой точки по отношению к внутренней
системе координат.
Рассмотрим переход от общих линейных уравнений
плоскости и прямой на плоскости к их параметрическим
уравнениям. Начальная точка находится просто: если в
уравнении плоскости (1), скажем, коэффициент А отли-
чен от нуля, то положим yo = z0 = 0 и найдем х0 из урав-
нения. В результате получается точка MQ(—D/А, 0, 0),
координаты которой удовлетворяют уравнению (1), и она
может быть принята за начальную точку. Для прямой
на плоскости координаты начальной точки определяются
аналогично.
Покажем теперь, как найти направляющие векторы.
Пусть прямая линия на плоскости задана своим уравне-
нием Ах + Ву+С = 0 в общей декартовой системе коор-
динат и (х0, у0)— координаты какой-либо точки Мо на
прямой. Вычитая из уравнения прямой равенство Ах0 4-
+ Вуо + С~0, мы приведем его к виду
Л (х—х„) + В(у—уа) — 0.
Рассмотрим теперь вектор с компонентами (х—хв, у—ув).
Его начало Мв лежит на прямой, а потому он паралле-
49
лен прямой тогда и только тогда, когда его конец—точ-
ка М с координатами (х, у)—лежит на прямой, и пре-
дыдущее уравнение удовлетворено. Обозначив компоненты
вектора М^М через а( и а,, мы получаем следующее
Предложение 1. Каждый ненулевой вектор, ком-
поненты которого ait at удовлетворяют уравнению
Aat 4- Вая — 0, может быть принят за направляющий
вектор прямой Ах 4- By 4- С = 0. В частности, направля-
ющим вектором будет вектор с компонентами (— В, А).
Аналогично доказывается следующее
Предложение 2. Любые два неколлинеарных век-
тора, компоненты которых удовлетворяют уравнению
Аа^ 4-4-Са3 = 0, могут быть приняты за направля-
ющие векторы плоскости, имеющей уравнение Ax-j-By-j-
+ Сг-j-D — O в общей декартовой системе координат.
3. Исключение параметра из параметрических уравне-
ний прямой. Рассмотрим на плоскости прямую линию,
заданную параметрическими уравнениями (5). Поскольку
направляющий цектор ненулевой, то отлична от нуля хо-
тя бы одна из его компонент at, ая.
Допустим сначала, что ^#=0. В этом случае из пер-
вого уравнения найдем / = (х—ха)/а^ Подставив t во вто-
рое уравнение, имеем
У-~Уа = ^(х—х0),
или
y-kxA-b, (9)
где k = aJOi, а Ъ^=уя—а^а^ Уравнение (9) называют
уравнением прямой, решенным относительно ординаты
Его можно получить также, решая уравнение Ах А-By 4-
4-С = 0 относительно у.
Определение. Отношение компонент направляю-
щего вектора aja^ называется угловым коэффициентом
прямой.
Положив х=0 в уравнении (9), получим у — Ь. Эго
означает, что точка о координатами (0, Ь) лежит на пря-
мой (рис. 19) Она является точкой пересечения прямой
с осью ординат. Все выше сказанное можно объединить
в следующее
Предложение 3. Если прямая не параллельна оси
ординат (at Ф 0), то ее уравнение может быть записано
в виде (9), причем k—угловой коэффициент, а b—орди-
ната точки пересечения прямой о осью ординат.
60
Рассмотрим уравнение, решенное относительно орди-
наты, в декартовой прямоугольной системе координат.
В этом случае свободный член b по абсолютной величине
равен расстоянию от начала координат до точки пересе-
чения прямой с осью ординат; b положительно, если эта
точка лежит с той же стороны от начала координат, что
и конец вектора е2; в противоположном случае b отри-
цательно.
Угловой коэффициент в декартовой прямоугольной
системе координат представляет собой тангенс угла, ко-
торый прямая образует с осью абсцисс. Угол этот отсчи-
тывается от оси абсцисс в направлении кратчайшего по-
ворота от оси абсцисс к оси ординат (рис. 20).
Предложение 4. Если прямая параллельна оси
ординат (а^ = 0), то ее уравнение имеет вид х—хв, еде
хв—абсцисса тонки пересечения прямой с осью абсцисс.
Для доказательства достаточно подставить ^ = 0 в
уравнения (5). Тогда первое из этих уравнений прини-
мает вид х = х,, а второе сводится к утверждению, что
у произвольно. Иными словами, прямая состоит из точек
с координатами (х0, у) для всевозможных у.
Исключим теперь параметр из параметрических урав-
нений (6) прямой в пространстве. Сначала допустим, что
ни одна из компонент направляющего вектора не равна
нулю. Тогда
t . _У—У>
<4 ' в» ’ а»
и мы получаем два равенства!
s—* У—У» а
(10)
51
которым удовлетворяют координаты любой точки прямой
и не удовлетворяют координаты точек, не лежащих на
прямой. Поскольку прямая в пространстве всегда может ,
быть представлена как линия пересечения двух пло-
скостей в соответствии с предложением 1 § 1, она и дол-
жна задаваться системой из двух линейных уравнений.
Если обращается в нуль одна из компонент- направ-
ляющего вектора, например а{, то уравнения прямой при-
нимают вид
(10')
(*3
Эта прямая лежит в плоскости х=х0 и, следовательно,
параллельна плоскости х=0. Читатель легко напишет
уравнения прямой, если в нуль обращается не at, а дру-
гая компонента.
Когда равны нулю дае компоненты направляющего
вектора, например н аг, прямая имеет уравнения
х~хв, У~Ув‘ (Ю)
Такая прямая пар'аллельна одной из координатных осей,
в нашем случае—оси' аппликат.
Часто пишут уравнение произвольной прямой в виде
(10), условливаясь считать равным нулю числитель, если
равен нулю знаменатель.
4. Векторные уравнения плоскости и прямой. Пло-
скость вполне определяется заданием ее начальной точ-
ки и ненулевого вектора п, перпендикулярного плоско-
сти. Такой вектор называется нормальным вектором. Ес-
ли г—радиус-вектор точки плоскости, то г—гв лежит
в плоскости и, следовательно,
(г—г0, п) = 0. (11)
Обратно, легко видеть, что точка с радиус-вектором г ле-
жит в плоскости, если г удовлетворяет (11). Равенство
(11) мы назовем векторным уравнением плоскости.
Если р и q—направляющие векторы плоскости, то
вектор [р, q] может быть принят за нормальный вектор.
Это приводит нас к векторному уравнению вида
(г—гв, р, q) = 0. (11')
Векторному уравнению плоскости можно придать форму
(г, п)+О = 0, (12)
где D- — (г0, п). Такое уравнение не содержит радиус-
вектора начальной точки.
еа
Предложениеб. Пусть х, у, г — компоненты векто-
ра г в декартовой системе координат. Тогда скалярное
произведение (г—г0, п) при п=#=0 записывается линейным
многочленом Ax+By+Cz-}-D (Л* + В*4-С*^0).
Обратно, для любого линейного многочлена найдутся
такие векторы г0 и п 0, что в заданной системе коор-
динат Ax+By+Cz + D — (r—г0, п).
Первая часть предложения очевидна! подставим раз-
ложение вектора г по базису в данное нам выражение
(xet+ уеа4-ге3—г„, п),
раскроем скобки и получим многочлен Ax + By + Cz + D,
в котором D — — (г0, п) и
Д = (ео п), В = (еа> п), С = (е„ и). (13)
А, В, С одновременно не равны нулю, так как ненулевой
вектор п не может быть ортогонален всем базисным век-
торам.
Для доказательства обратного утверждения найдем
сначала вектор п из равенств (13), считая А, В и С за-
данными. Будем искать этот вектор в виде
п = а[е2, е3] + ₽[е3, е^ + у^, et],
Умножив скалярно это равенство на ео получаем
(ех, п) = а(е1, еа, е,). Отсюда а= A/(eit е2, е8). Аналогич-
но находим Р и у. Вектор п не нулевой, так как [е8, е,],
[е,, ех] и [е*, е,] линейно независимы (предложение 7 § 3
гл. I), а а, Р и у не равны нулю одновременно, так же
как А, В н С.
Итак, мы можем придать заданному многочлену вид
xfa, n)4>?(et, п)4-г(е*, п) 4* #«*(**• n)4-D.
Вектор г, должен удовлетворять условию—(г0, п) = Р.
Один из таких векторов мы можем найти в виде г0 = Хп.
Подставляя, находим —X (п, п) ₽=« D, откуда г0 = — Dn/| п |*.
Заметим, что из доказанного предложения легко вы-
текает теорема 1. Кроме того, в качестве следствия полу-
чим следующее
Предложение 6. Если система координат декар-
това прямоугольная, то вектор с компонентами А, В и С
является нормальным вектором для плоскости Ах + Ву-\-
4- Cz+D = 0.
Эго вытекает сразу из формул (13) в силу предложе-
ния 1 § 3 гл. I.
63
В случае общей декартовой системы координат А, В,\С—ком-
поненты вектора п по базису е** ej, е£, взаимному с е^, еа, е3.
Все, сказанное выше о плоскостях, почти без измене-
ний может быть сказано и о прямых на плоскости. Если
г0—радиус-вектор начальной точки прямой, а и—нену-
левой вектор, перпендикулярный этой прямой, то урав-
нение прямой на плоскости может быть написано в виде
(г—г0, п) = 0 или (г, п)4-С = 0.
В координатной форме это уравнение имеет вид Ах +
+ Ву+С = 0, где
A = (ei, п), В~(е2, п).
Имеет место
«2
в,
Рис. 21.
Предложение 7. Если система координат декар-
това прямоугольная, то вектор с компонентами (А, В)
перпендикулярен прямой с уравнением
Ах -J- By С = 0.
В этом предложении, как и выше
в предложении 6, очень существенно,
что система координат предполагается
декартовой прямоугольной. Чтобы под-
черкнуть это обстоятельство, изобразим
на рис. 21 прямую х + у=*0 и вектор
с компонентами (1, 1) в том случае,
когда базисные векторы хотя бы раз-
личны по длине.
Перейдем теперь к векторному урав-
линии в пространстве. Оно может быть
нейию прямой .
написано в виде
[г—г0, а] = 0. (14)
Здесь а—направляющий вектор прямой, а г0—радиус-
вектор начальной точки прямой. В самом деле, это урав-
нение, как и векторное параметрическое уравнение пря-
мой, выражает коллинеарность векторов г—г0 и а. Если
мы обозначим [г,, а] через d, мы получим векторное урав-
нение прямой, не содержащее начальной точки:
[г, a] = d.
(15)
Если прямая задана уравнением (15), мы можем найти
начальную точку прямом, цапример, в виде r0 = /[a, d].
Подставляя г, в (15),. мы получаем t [[a, d], a]=d, откуда,
по формуле двойного векторного произведения, t {(a, a) d —
• 54
— (a, d)a} = d. Так как (a, d) = 0, мы находим t — (a, a)-1
и r0 = |a|-‘[a, d].
Отметим, что так определенная точка г0 есть основа-
ние перпендикуляра, опущенного из начала координат
на прямую, а г = /[а, d]—параметрическое уравнение
этого перпендикуляра.
5. Признаки параллельности плоскостей и прямых на
плоскости. Из предложения 1 легко получить условие,
накладываемое на коэффициенты уравнений двух прямых
на плоскости, при котором эти прямые параллельны.
Аналогичное условие для плоскостей вытекает из пред-
ложения 2 и формул (13). Следует, однако, иметь в виду,
что это условие выполнено не только тогда, когда урав-
нения определяют различные параллельные прямые, но
и в том случае, когда рассматриваемые уравнения опре-
деляют одну и ту же прямую. В этом случае нам будет
удобнее говорить, что прямые, определяемые уравнения-
ми, совпадают.
Предложение 8. 1) Прямые линии, задаваемые
уравнениями
Ах 4* By 4* С — О, Ах х 4" В^у 4* С~ О
в общей декартовой системе координат, параллельны
тогда и только тогда, когда соответствующие коэффи-
циенты при переменных в их уравнениях пропорциональ-
ны, т. е. существует такое число X, что
At = lA, Bt = KB. (16)
2) Прямые совпадают в том и только в том случае,
когда их уравнения пропорциональны, т. е., помимо ра-
венств (16), выполнено (с тем же X) равенство
Ct =КС. (17)
Доказательство. Первая часть предложения
прямо следует из того, что векторы с компонентами
(—В, А) и (—Bt, Aj)—направляющие для соответствую-
щих прямых.
Докажем вторую часть, В равенствах (16) и (17) X
не может равняться нулю, так как коэффициенты урав-
нения прямой одновременно в нуль не обращаются. По-
этому» если выполнены эти равенства, уравнения эквива-
лентны и определяют одну и ту же прямую.
Проверим обратное. Если прямые параллельны, то,
как мы видели, их уравнения должны иметь вид Ах +
4-Ву4-С=0 и X(Ах4-By)4-^ = 0 при некотором X.
55
Если, кроме того, точка с координатами (х0, у0) принад-
лежит обеим прямым, то выполнены равенства Ахл -р
4-Вро4-С = 0 и Л(Лхо4-В^о)4-С1 = О. Из этих равенств
вытекает, что Ct = XC. Предложение доказано.
Предложение 9. Пусть плоскости Р и Q заданы
уравнениями
Ах-ЬBy-{-Cz~^D = 0, Atx + Bty+Ctz + Di — O
в общей декартовой системе координат. Для того чтобы
они были [параллельны, необходимо и достаточно, чтобы
существовало такое число X, что
А1 = ХА, В£ = ХВ, С£ = ХС. (18)
Плоскости Р и Q совпадают тогда и только тогда, когда,
кроме соотношений (18), выполняется (при том (же X)
равенство
D1—kD. (19)
Доказательство. Необходимость. Согласно
предложению 5 уравнения плоскостей Р и Q можно пред-
ставить в виде (г—г0, п) = 0 и (г—г£, п£) = 0, где векторы
п и п£ связаны с коэффициентами уравнений формулами
(13). Если плоскости параллельны, то п и п£ коллинеарны
и, следовательно, существует такое число X, что п£«Хп
Теперь, в силу (13), мы имеем Л1 = (е1, nJ^Xfq, п)=ХЛ.
Аналогично получаем и остальные равенства (18). Пусть
теперь Р и Q совпадают. Тогда, по доказанному выше,
уравнение Q имеет вид Х(Ах4- Bp+Cz)4-D£=0. Поскольку
плоскости имеют общую точку, из
X (Ах0 4-В//о 4-Cz0) 4-О£ = 0 и Ах0 4-Cz04-D — 0
следует D£®=X£>.
Достаточность. Нам нужно доказать, что два
уравнения, удовлетворяющие условиям (18) и (19), яв-
ляются уравнениями одной и той же плоскости, а урав-
нения, удовлетворяющие условию (18), определяют па-
раллельные плоскости. Первое из утверждений очевидно,
поскольку такие уравнения эквивалентны. Второе утвер-
ждение следует из предложения 2. Действительно, если
выполнены условия (18), то компоненты направляющих
векторов обеих плоскостей должны удовлетворять одно-
му и тому же уравнению. А это означает, что одна и ta
же пара векторов может быть принята за направляющйе
векторы и той и другой плоскости. Предложение доказало!
56
Условия (16) выражают не что иное, как коллинеар-
ность векторов с компонентами (А, В) и (Л^ Вг). Ана-
логично, условия (16) означают коллинеарность векторов
с компонентами (Л, В, С) и (Л1# Bt, Q). Отсюда сле-
дует, что условие параллельности прямых на плоскости
можно записать в виде
т
А В
Аг В.
а условие параллельности плоскостей—в виде
в с
Bi С,
С А I |Л в I
Ci StH0,
(18')
(См. предложения 9 и 10 § 3 гл. I.)
Предложению 8 можно придать чисто алгебраическую
формулировку, если учесть, что координаты точки пере-
сечения прямых—это решение системы их уравнений.
Предложение 10. Если
то система уравнений
Ах -{* By -4- С = 0, AjX Л* BiP -4» Ci ” 0
не имеет решений или имеет бесконечно много решений
(в зависимости от С и Ct). Если
то, каковы бы ни были С и Ct, система имеет единст-
венное решение (х, у).
Разумеется, предложение 10 (легко доказать и непо-
средственно, не прибегая к геометрическим соображениям.
Для гораздо более общего случая это будет сделано
в гл. V. Такое доказательство является другим доказа-
тельством предложения 8.
6. Уравнения прямой в пространстве. Прямая в про-
странстве может быть задана как пересечение двух пло-
скостей и, следовательно, в общей декартовой системе
координат определяется системой уравнений
Ах By -{»Сг -|- О — 0, Atx -4- В-^у -4- C^z jDj =j0. (20)
Полученный нами признак параллельности плоскостей
позволяет указать условие, при котором эта система оп-
ределяет единственную прямую. Пересечение плоскостей
есть прямая линия тогда и только тогда, когда они не
параллельны (в частности, не совпадают). Поэтому систе-
ма (20) определяет единственную прямую линию тогда
и только ( тогда, когда хоть один из детерминантов (18')
отличен от нуля, т. е.
Разумеется, система (20) может быть заменена на
любую, ей эквивалентную. При этом прямая линия бу-
дет представлена как пересечение двух других проходя-
щих через нее плоскостей. Уравнения (10) представляют
ее как пересечение плоскостей
у—у0 г—г0 х—х0 у—go
^2 «3 ’ «1 @-2
параллельных соответственно оси абсцисо и оси аппликат.
Важно уметь находить какую-нибудь начальную точку
и какой-нибудь направляющий вектор на прямой, задан-
ной системой линейных уравнений. Условие (21) озна-
чает, что из трех детерминантов второго порядка хотя
бы один отличен от нуля. Допустим для определенности,
что ABt—Л^=/=0. Чтобы найти начальную точку пря-
мой, будем рассматривать систему (20) как систему урав-
нений относительно неизвестных х и у. Переменной г
придадим произвольное числовое значение, например 0.
Для хну получится система уравнений
Лх+бу4-О=0, Л(х4'51у4*Р1=0.
В силу предложения 10 у этой системы существует ре-
шение, которое мы обозначим (х0, уа). Точка Мв с ко-
ординатами (х0, у0, 0) лежит на нашей прямой, так как
ее координаты удовлетворяют системе (20).
Найдем теперь направляющий вектор прямой. Если
система координат декартова прямоугольная, то векторы
с компонентами Л, В, С и At, Bt, Ct перпендикулярны
плоскостям Лх4-Ву4-Сг4-Р = 0 и Atx+Bty + Ctz -f-
-f-D][=0. Следовательно, векторное произведение этих
векторов параллельно прямой (20), по которой плоскости
пересекаются. Вычисляя компоненты [векторного произ-
ведения в ортонормиров айном базисе, мы получим сле-
дующие компоненты направляющего вектора прямой:
IS С I IC А I MSI __
\at <£|’ к Л!» |л* sj*
и
Предложение 11. Вектор с компонентами (22)
есть направляющий вектор прямой (20), какова бы ни
была декартова система координат.
Доказательство. Согласно предложению 2 каж-
дый ненулевой вектор, компоненты которого 04, а2, а4
удовлетворяют уравнению Аа1 + Ваг + Сал = 0, паралле-
лен плоскости Ax+By + Cz + D = 0. Если, кроме того,
Of, аа и а4 удовлетворяют уравнению 4-
+ Cfag — 0, то вектор параллелен также плоскости Агх 4-
+ В^ + С^ + О^О и, следовательно, может быть при-
нят за направляющий вектор прямой (20). Вектор в
компонентами (22)—ненулевой в силу неравенства (21).
Непосредственно легко проверить, что его компоненты
удовлетворяют обоим написанным выше условиям. На этом
доказательство заканчивается.
§ 3. Некоторые задачи о прямых и плоскостях
1. Уравнение прямой, проходящей через две точки.
Пусть в пространстве задана общая декартова система
координат и две точки Afj и Mt с координатами (xlt yt, zt)
и (хг, У» г»)- Чтобы написать уравнение прямой, прохо-
дящей через Aft и Л4а, достаточно принять Mt за началь-
ную точку, a MjMj за направляющий вектор прямой.
Этот вектор не нулевой, если точки не совпадают. По
формуле (10) § 2 мы получаем
*—А _ У—У1 z—...
*»—*1 У»—У1 га—1 '
Если в этих равенствах какой-нибудь из знаменателей
равен нулю, то следует приравнять нулю соответствую-
щий числитель.
В планиметрии эта задача решается так же. Отличие
только в том, что координаты точек теперь (хь уг) и
(*»> Уз)’ и мы получаем (согласно предложениям 3 и 4
§ 2) уравнение
У—У1 = ~Ет1(х-~х1)> (2)
если и
> x=xt,
если хх — хг
2. Уравнение плоскости, проходящей через три точки.
Цусть Mv Mt—не лежащие на одной прямой точки
с координатами (хй yt, zt), (xt, yt, zj и (x„ yt, zt) в
59
общей декартовой системе координат. Чтобы написать
уравнение плоскости, проходящей через эти точки, выбе-
рем Aft в качестве начальной точки, а векторы Af 1Л4| и МхЛ/,
в качестве направляющих векторов. Тогда по формулам
(<!') § 2 настоящей главы и (10) § 3 гл. I имеем
х —Xi у —у1
*»—Xi yt—yi
х»—xi yt—yt
* —Xi
Z1 —2f
Zs —Zi
= 0.
3. Признаки параллельности прямой и плоскости.
Пусть прямая задана уравнением г—г0 = /а, а плос-
кость—одним из уравнений (г—гь п)=0, (г—rlt р, q) °=
= 0 или г—Прямая параллельна плоскости
(а возможно, и лежит в плоскости), если (а, п) = 0 или
(а, р, q) = 0. Пусть плоскость задана линейным урав-
нением Ах+ By-t-Cz-j- D — 0. Согласно предложению 2
§ 2 получаем
Aat + Ва3 + Сая — 0, (3)
где a?, а3, at—координаты вектора а.
Пусть прямая линия задана двумя линейными урав-
нениями;
AjX-}- В^у -j- C3z + Dj = 0, А3х + В3у + С,г 4- D3 = 0.
Тогда по предложению И § 2, мы можем положить
at' = I Bi Ci I I Ct Ai I _ I At Bl I 1 Bt Ct 1 ’ 8 1 Ct At 1 ’ ’ 1 A, Bt 1 ’
и условие (3) переписывается в виде л1? ?1+в1с as|+cIaI ?|=0’
или
АВС
Ai Bf с,
А3 Вя С3
= 0.
Легко проверить, что все приведенные здесь условия
являются не только необходимыми, но и достаточными.
Из формулы (4) следует, что три плоскости пересе-
каются в одной точке тогда и только тогда, когда коэф-
фициенты их уравнений удовлетворяют условию
АВС
Ar Bi Cf
Ая B3 C|
=/=0.
(5)
60
Действительно, это неравенство означает, что прямая
линия, по которой пересекаются какие-нибудь два Из
плоскостей, не параллельна третьей плоскости.
4. Уравнения в отрезках. Уравнение вида
а b + с
(6)
называется уравнением плоскости в отрезках. Относи-
тельно него справедливо следующее
Предложение 1. Если плоскость имеет уравнение
вида (6) в декартовой прямоугольной системе координат,
то числа а, Ъ, с по абсолютной величине равны длинам
отрезков, отсекаемых плоскостью на осях координат
(рйс. 22). Знаки этих'чисел зависят от того, на какой
полуоси (положительной или
отрицательной) лежат соотве- 3 1
тствующие отрезки. с
Для доказательства доста-
точно подставить в уравнение \
(6) следующие тройки чисел: \ .
(а, 0, 0), (0, Ъ, 0) и (0, 0, с).
Уравнение в отрезках для х.Х 2
.прямой линии на плоскости х
имеет вид 1
-J + f»1- (7) Рис'22‘
Относительно этого уравнения справедливо предложение,
аналогичное предложению 1.
5. Полупространство. Пусть дана плоскость Р и вы-
бран определенный ее нормальный вектор п. Полупрост-
ранством, определяемым Рип, называется множество
точек М таких, что для некоторой точки Л4в на плоско-
сти вектор МаМ составляет с п угол, не больший я/2.
Если г—радиус-вектор точки Л4, а г0—точки Мо, то
определение полупространства эквивалентно неравенству
(г—г0, п)>0. Это неравенство н является уравнением
полупространства.
Используя это, нетрудно проверить, что определение
полупространства не зависит от выбора точки М, на
плоскости. Действительно, если Mo(rJ)—другая точка
плоскости, то вектор a«r0—rj перпендикулярен п и мы
имеем
(г—г;, п) = (г—r.+а, п)«=(г—г., п).
61
Мы получим уравнение полупространства в коорди-
натной форме, 'если вспомним, что выражение (г—г0, п)
в координатах записывается линейным многочленом
Ax-f-B^-f-Cz-f-D. Итак, полупространство в декартовой
системе координат задается линейным неравенством
Ах By 4» Cz -J- D 0.
Обратно, каждое такое неравенство согласно предложе-
нию 5 § 2 можно записать в виде (г—гв, п) > 0, откуда
сразу получаем, что оно определяет полупространство.
Плоскость Р и вектор п' = — п определяют другое
полупространство, задаваемое неравенством (г—г0, п') ^
>0 или (г—г„ п)^0. Его можно назвать «отрицатель-
ным» полупространством, в отличие от «положительного»
полупространства (г—г0, п)>0. Однако такое наимено-
вание условно—оно определяется выбором вектора п.
Изменение направления этого вектора равносильно изме-
нению знаков коэффициентов и свободного члена в урав-
нении плоскости или умножению уравнения плоскости
на отрицательный множитель. При этом положительное
полупространство становится отрицательным, и наоборот.
Если (xit yt, zt) и Mt(xa, у,, zt)—две точки, не
лежащие в плоскости, и Axf4-By14-Czt4«D и Ах, 4-.
4- Byt+Czt + D—результаты подстановки их координат
в левую часть уравнения плоскости, то совпадение или
несовпадение знаков этих чисел не зависит от выбора
вектора п или от умножения уравнения плоскости на
любой числовой множитель. При совпадении знаков точ-
ки лежат в одном Полупространстве.
При решении задач иногда бывает полезно следую-
щее замечание: если точка х0, уа, г0 лежит на плоско-
сти, то точка с координатами х04-А, у„+В и z04- С ле-
жит в «положительном» полупространстве. Иначе говоря,
вектор с координатами А, В, С всегда направлен в
«положительное» полупространство. Читатель легко может
проверить это непосредственной подстановкой.
Вполне аналогично сказанному о полупространствах,
мы можем определить, что такое полуплоскость, и дока-
зать, что неравенство Ах+Ву+С^0, связывающее де-
картовы координаты точки на плоскости, определяет по-
луплоскость. Вторая полуплоскость, ограниченная пря-
мой Ах+Ву+С=*0, задается неравенством Ах+Ву +
4- С 0.
б. Расстояние от точки до плоскости. Пусть дана плоо-
кость о уравнением (г—г,, р, q)=0 и точка М о ради-
6»
ус-вектором R. Расстояние от точки до плоскости проще
всего определить, разделив объем
строенного на векторах R—г0,
основания (рис. 23). Мы полу-
чим
параллелепипеда, по-
и q, на площадь его
ь | (R -г0, р, д)'
IIP. ЧП ’
Для каждого вектора п, нор-
мального к плоскости, можно
так выбрать направляющие век-
торы р и q, чтобы [р, q] = n.
Поэтому при любом нормаль-
ном векторе п имеем
I (R—г0* ")1
р
Рис. 23,
(8)
Если в декартовой прямоугольной системе координат
точка М имеет координаты X, Y, Z, то равенство (8)
запишется (предложение 6 § 2) так!
А= /9)
/ А2+В*+С* ’ '
Здесь D = —(г0, п), а А, В, С—компоненты п.
Очевидно, Л = 0 тогда и только тогда, когда М лежит в плос-
кости, Уравнение
Лл-|-Ду-|-Ср-|-Р^д
V Аг + Вг+Са =
называют нормированным уравнением плоскости. Имеет место сле-
дующее
Предложение 2, Расстояние от точки до плоскости равно
абсолютной величине результата подстановки ее координат в нор-
мированное уравнение плоскости,
7. Расстояние от точки до прямой. Если прямая за-
дана уравнением [г—г0, а]=0, мы можем найти рас-
стояние h от точки с радиус-вектором R до этой прямой,
разделив площадь параллелограмма, построенного на
векторах R—г0 и а, на длину его основания (рис. 24).
Результат можно записать формулой
(10)
В случае прямрй в пространстве'мы не будем прнво-
/щтр координатной записи этого выражения. Рассмотрим
63
прямую на плоскости, заданную в декартовой прямо*
угольной системе координат уравнением Ax4-By«f-C = 0.
Возьмем в качестве направляющего вектор а(—В, А).
Согласно формуле (15) § 3 гл. I
ft : |(Х-хь)Л-(Г-уе)(-А)| ц
У л2+а» ’ 1 '
где М0(х»» У»)—некоторая точка прямой, X, Y—компо-
йенты R. Учитывая, что С = —Ах0—Byt, мы находим
fa _ |ЛХ+ВГ+С|
У
(12)
Исходя из (11), легко заметить, что
. _ |(R—Го, n) I
п~ пл »
где п(А, В)—нормальный вектор прямой. Сравнив это
выражение с формулой (8), мы видим, что аналогия
уи________________ между плоскостями и пря-
/Г мыми на плоскости сохра-
„ /А\|?-Гл \ няется н в этой задаче.
R/ "\ \ \
/ \\ Уравнение вида
7 /Мд “ Лх+Sy+C р
/
называется нормированным
/// уравнением прямой на плоское*
ти. Относительно него имеет
место предложение, аналогич-
4 ное предложению 2.
8. Расстояние между
Рис, 24, непараллельными прямы-
ми в пространстве. Пусть
прямые р и q не параллельны. Известно, что в этом
случае существуют две такие параллельные плоскости Р
и Q, что прямая р лежит в Р, а прямая q лежит в Q.
(Если уравнения прямых г—rt =/а4 и г—г8 = /аа, то
плоскость Р имеет начальную точку rj и направляющие
векторы и а2. Аналогично строится плоскость Q.) Рас-
стояние h между плоскостями Р и Q называется рас-
стоянием между прямыми р н q. Если р и q пересека-
ются, то Р и Q совпадают и Л = 0.
Для того чтобы вычислить расстояние h, проще всего
разделить объем параллелепипеда, натянутого на векто-
64
ры г2—гр Я] и а2, на площадь его основания (рис. 25),
Мы получим
h.. I («•»—«•<. »1. »t)l
|[аь а2Ц
Знаменатель этого выражения отличен от нуля, посколь-
ку прямые не параллельны.
Предложение 3. Прямые линии с уравнениями
г = г1-|-а1^ и г = г2-|-а2/ пересекаются тогда и только
тогда, когда h — Q, т. е.
а2)в0, [а£, а,]=/=0.
9. Вычисление углов. Чтобы
двумя прямыми, следует найти
ры и вычислить угол между
ними по формуле (4) § 3 гл. I.
При этом следует иметь в виду,
что, выбрав на одной из прямых
направляющий вектор, направ-
ленный в другую сторону, тем
Же способом мы получим дру-
гой угол, дополняющий первый
до я.
Для вычисления угла меж-
ду прямой и плоскостью опре-
деляют угол 6 между направ-
ляющим вектором прямой и век-
определить угол между
их направляющие векто-
Рис. 25,
тором, перпендикулярным плоскости, н по нему находят
искомый угол. Если направляющий вектор прямой выб
рать так, чтобы соз0>О, и взять 0^0^л/2, то угол
между прямой и плоскостью дополняет 0 до л/2.
Угол между плоскостями находят как угол между
векторами, перпендикулярными плоскостям.
Все вычисления проще всего делать в декартовой
прямоугольной системе координат. Тогда в качестве век-
тора, перпендикулярного плоскости, можно взять вектор
с компонентами, равными коэффициентам при перемен-
ных в уравнении этой плоскости.
Пусть Две прямые линии на плоскости заданы в де-
картовой прямоугольной системе координат уравнениями
y — y — k^c^bt.
(13)
Обозначим через <р угол, отсчитываемый от первой пря
мой ко второй в том направлении, в котором производит-
ся кратчайший поворот от первого базисного вектора ко
3-102
65
второму; tg<p можно найти как тангенс разности углов,
которые прямые составляют с осью абсцисс, а тангенсы
этих углов равны угловым коэффициентам прямых. Мы
получаем
<14>
Следует отметить, что эта формула не имеет смысла,
когда знаменатель дроби обращается в нуль. В этом слу-
чае прямые перпендикулярны. Действительно, согласно
предложению 1 § 2 векторы с компонентами (1, kJ и
(1, kJ—направляющие векторы прямых, и их скалярное
Произведение равно 1 4- ktkt.
Предложение 4. Для перпендикулярности прямых
(13) необходимо и достаточно выполнение равенства
1 -}• k-tkt в 0.
10. Некоторые задачи на построение, а) Перпендику-
ляр из точки на плоскость. Если плоскость задана урав-
нением (г—г0, п) = 0 и дана точка М с радиус-вектором
R,to прямая г==41-Нп проходит через М и перпендику-
лярна плоскости. Решая совместно уравнение плоскости
и уравнение прямой, найдем ортогональную проекцию
точки на плоскость. Из (R —г0 + /п, п) = 0 получаем /*=
= — (R—г0, п)/|п|®, откуда радиус-вектор проекции
г = R n(R~r<” п)
rf = R-n )п|а. .
б) Перпендикуляр из точки на прямую. Пусть пря-
мая задана уравнением [г—гЛ, а] = 0 и дана точка М с
радиус-вектором R. Вектор p = [R—г0, а] перпендикуля-
рен плоскости, проходящей через прямую и точку Л4.
Будем считать, что р=й=О. Вектор [р, a] = [[R—г0, а], а]
перпендикулярен а и р и, следовательно, лежит в ука-
занной плоскости и перпендикулярен прямой. Итак, пря-
мая
rs=R-H[a, [a, R—г0Ц
есть перпендикуляр, проведенный через М к заданной
прямой.
в) Проекцию точки М (R) на прямую Гв=гв4-а/ мож-
но найти, решая совместно уравнения прямой и плоско-
сти (г—R, а) = 0, проходящей через точку М перпенди-
кулярно прямой. Из (г04-а( —R, а)»0 получаем /=
=(R—г0, а)/1 а |2, откуда радиус-вектор проекции
(R —г„, а)/|а|».
вв
n] 5^ 0. Тогда плоскость
прямую перпендикулярно
г) Уравнение проекции прямой наплоскость просто
получить, если не требуется находить ее направляющий
вектор и начальную точку. Пусть заданная плоскость
имеет уравнение (г, п)-(-£)=» О, а прямая—уравнение
[г—гв, а]=0, причем (а,
(г—г0, а, п) = О проходит чер<
заданной плоскости. Таким
образом, проекция прямой на
плоскость может быть задана
системой двух уравнений как
пересечение плоскостей. Если
же нужно параметрическое
уравнение проекции, то, по-
видимому, лучше найти про-
екции каких-либо двух точек
прямой на плоскость.
д) Общий перпендикуляр
к двум скрещивающимся
прямым. Пусть прямые г =
=^ + 3^ и г = г24-аг< не параллельны, т. е. [аж, а2]=#0
Вектор р = [ах, аа] перпендикулярен обеим прямым. По-
этому плоскость
(г — г1( alt [alt а2]) = 0 (15)
проходит через первую прямую и общий перпендикуляр
(рис. 26), а плоскость
(г — г2, а2, [ах, = 0 (16)
— через вторую прямую и общий перпендикуляр к обеим
прямым. Следовательно, общий перпендикуляр можно за-
дать системой уравнений (15) и (16) как пересечение плос-
костей. Чтобы найти его начальную точку, можно решить
совместно уравнение первой прямой и уравнение плоскости
(16). Направляющим вектором является вектор p = [alf а,}.
11. Пучок прямых. Связка и пучок плоскостей.
Пучком прямых на плоскости называется совокупность
прямых, проходящих через фиксированную точку — центр
пучка. Обозначим через U (х, у) п V (х, у) трехчлены
А1х-\-В1у-\-С1 и АгхЦ-Вгу + Сг, причем будем предпола
гать, что A1Bi—AtB1=^=0. В этом случае уравнения
U (х, //) = 0 и V(x, у) = 0 определяют пересекающиеся
прямые и и о. Обозначим координаты их точки пересе-
чения Ма через (ха, уа). Уравнение
a,U (х, y)+?>V(x, у) = 0, (17)
з*
67
где а’+р* =#=0, называется уравнением пучка прямых,
определяемого прямыми и и V. Основанием для такого
названия служит следующее
Предложение 5. При любых а и р, не равных
одновременно нулю, уравнение (17) определяет.гпрямую-
линию, проходящую через центр пупка Мо. Обратно,
каждая прямая, проходящая через Mt, имеет уравнение
такого вида.
Покажем, что коэффициенты при переменных в урав«-
нений (17) одновременно не равны нулю. Перепишем этр
уравнение в виде
(a A t+рД,) х + (а5> + рВ8) у + (aCt + ₽С,) = 0.
Допустим, что аД1+рД, = 0 и аВ1 + рВ,=-0. Из пред-
ложения 10 § 2 вытекает, что значения а«=0 и р = 0
единственные, которые удовлетворяют этим двум условиям.
Но эти значения мы исключили. Таким образом, наше
предположение неверно, уравнение (17) линейное и oript-
деляет прямую линию.
Поскольку очевидно, что
U(xt, ^ = 0 и V (х9, уЛ)*=0,
мы имеем
аЩхЛ, £.)4-pV(xe, !/e) = 0.
Этб значит, что прямая с уравнением (17) принадлежит
к пучку.
Вторая часть предложения будет доказана, если ока-
жется, что через любую точку, отличную от точки Ме,
проходит прямая линия с уравнением вида (17). Легка
проверить, так ли это. Рассмотрим некоторую [точку Мг
с координатами (х1( рх). Подставив эти координаты в
уравнение (17), имеем
а£/(ли У1)+
Так как точка отлична от центра пучка, то числа
U Уг) и У (*ь l/i) одновременно в нуль не обращаются.
Поэтому мы вправе положить
a= — V(xt yt), ₽ = (/(хо yj.
При таких значениях а и ₽ прямая с уравнением (17)
проходит через Mit и предложение полностью доказано.
Заметим только, что каждая пара а, 0 определяет един-
ственную прямую, ио каждой прямой соответствует бес-
конечно много пропорциональных между со&>й пар а и ₽.
68
Если иам известны координаты центра пучка, то урав-
нение пучка можно написать в виде
а(х-хв)4-₽(у—р.)«0,
•положив, что пучок определяется прямыми о уравнениями
х—хо = О и «/—ро“О.
Впрочем, и без того очевидно, что это — уравнение про-
извольной прямой, прокодящей через заданную точку.
Связкой плоскостей называют совокупность плоскостей,
Ж сходящих через фиксированную точку — центр связки.
/сть плоскости о уравнениями
U (х, у, z) == А (X 4* Вху 4- CfZ 4- D, = О,
V(x, у, z)s&Atx+ !/+ С,гЧ-D, = О,
W (х, у, г) sAtx + Вяу Ч-С8г Ч*О» =0
пересекаются в единственной точке Уравнение
aU(x, у, г)4-рК(дс, у, г)4-?^ (х, у,г)=>$, (18)
где а’4-рг 4-у’ =# 0, называется уравнением связки а цент-
ром в точке Mt. Имеет место
Предложение 6. При любых а, 8 и у, не равных
нулю одновременно, уравнение (18) определяет плоскость,
проходящую через центр связки Mt, и каждая плоскость,
проходящая через Mt, может быть задана уравнением тако-
го вида.
Для доказательства, используя предложение 5 § 2,
представим U, V и V в виде
г/ (х, у, г) = (г, п^Ч-Dt,
У, г)==(г, п,)4-0„
W {х, у, г) = (г, п,)4-0».
Тогда уравнение (18) заменится на
(г, an14-₽n,4-yns)4-(aZ)14-PDJ4-yD,)=0. (19)
Поскольку плоскости пересекаются в единственной точке,
их нормальные векторы не компланарны. Следовательно,
an1+Pnl+yng Фб, как только аа4*₽*+?*¥'0. Это оз-
начает, что уравнение (19), а вместе с иим и (18), опре-
деляет плоскость. Эта плоскость проходит через центр связ-
ки. Действительно, его координаты х0, yt, zt удовлетво-
ряют уравнению (18), так как
U(xt, yt, zt)—0, V(xt, у„, z.)=0 и W(x„ yt, г,М
6?
Рассмотрим произвольную плоскость, проходящую че-
рез центр связки Mt. Пусть ее уравнение (г, n) + D^0.
Вектор п мы можем разложить по некомпланарным век-
торам nit па и nsi
(г, anI + Pn1 + ynJ) + D = 0.
Сравним теперь это уравнение с уравнением (19) при тех
же a, р и у. Радиус-вектор г0 центра связки Мо удов-
летворяет обоим уравнениям. Подставим его в каждое из
уравнений и вычтем полученные числовые равенства одно
из другого. Мы получим D = aD1+ pDs + yD4, что озна-
чает, что оба уравнения совпадают. Предложение дока-
зано.
Предоставим читателю самостоятельно вывести уравне-
ние пучка плоскостей, т. е. совокупности плоскостей, про-
ходящих через фиксированную прямую — ось пучка. Урав-
нение пучка плоскостей имеет вид
«(Л^ + В^Ч-С^ + ЛЛ-Р (AgxA* Bgy^C,2-^Dt) = 0,
где в скобках стоят правые части уравнений двух пло-
скостей пучка и aI + Ps5^0.
Посмотрим на уравнение пучков прямых с несколько
более общей точки зрения. Систему из уравнений прямых,
определяющих пучок, можно рассматривать как уравне-
ние центра пучка. Поэтому уравнение каждой прямой,
проходящей через центр пучка, есть следствие этой сис-
темы. Так же можно рассуждать и о пучке, и о связке
плоскостей. Наши результаты теперь можно сформулиро-
вать так: если система линейных уравнений имеет реше-
ние, то некоторое линейное уравнение является ее след-
ствием тогда и только тогда, когда оно есть сумма урав-
нений системы, умноженных на некоторые чиела.
Мы доказали это для нескольких частных случаев.
В 'общем виде это вытекает из результатов гл. V о си-
стемах линейных уравнений.
12, О геометрическом смысле порядка алгебраической
линии. Пусть на плоскости задана алгебраическая линия
L, имеющая уравнение
А&уг*+^.+ (20)
в декартовой системе координат. Рассмотрим произволь-
ную прямую, заданную параметрическими уравнениями
x=x04-ai(, y=yt+ati (21)
70
в той же системе координат. Найдем точки пересечения
прямой и линии L. Они будут известны, если мы найдем
соответствующие значения параметра t. Это будут те
значения, при которых х и у, выраженные по формулам
(21), удовлетворяют уравнению (20). Подставляя (21) в
(20), получим
А (*о 4- ati)k‘ (у0 +atf)'> +...
... + А, (х0 + а^(уп + att)h = 0. (22)
При раскрытии скобок в каждом члене мы получим много-
члены степеней + .... kt + ltотносительно t. Их
сумма будет многочленом относительно t степени не боль-
шей, чем максимальная из степеней
слагаемых. Но максимальное из чи-
сел ..., ks + la является по-
рядком линии L. Таким образом,
степень уравнения (22) не превосхо-
дит порядка линии.
Может, конечно, случиться, что
все коэффициенты уравнения равны
нулю и оно представляет собой тож-
дество. В этом случае прямая всеми
своими точками лежит на линии.
Если исключить этот случай, число п _
корней уравнения и, следовательно, ИС’ненйем
точек пересечения не превосходит по-
рядка линии. Мы доказали Следующее
Предложение 7. Число точек пересечения алге-
браической линии L с прямой, которая на ней не лежит
целиком, не может превосходить порядка линии L.
Существуют линии, которые ни с одной прямой не
имеют наибольшего возможного числа точек пересечения,
равного порядку линии. Примером может служить линия
четвертого порядка, имеющая в декартовой прямоугольной
системе координат уравнение у = х*. Она пересекается
с любой прямой не более чем в двух точках (рис. 27).
Пример. Архимедова спираль — линия с уравнением
г = аф в полярной системе координат — пересекает каж-
дую прямую, проходящую через полюс, в бесконечном
числе точек. Следовательно, она не является алгебраи-
ческой линией.
71
Г Л A В A III
ЛИНИИ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА
В первых параграфах этой главы мы будем заниматься
линиями второго порядка на плоскости. Такую линию
можно задать уравнением второго порядка общего вида1)
Лх24-2Вху + Сг/*Ч-2Лх-|-2£г/-|-Г = 0, (1)
в котором коэффициенты Л, fl и С не равны нулю од-
новременно.
§ 1. Исследование уравнения второго порядка
Мы хотим исследовать, что представляет собой произ-
вольная линия второго порядка. Для этого мы зададим-
ся некоторым уравнением (1), причем не будем относи-
тельно него предполагать ничего, кроме того, что Л, В и С
не равны одновременно нулю. Найдем множество точек,
которые удовлетворяют уравнению (1), не предполагая
заранее, что хоть одна такая точка существует. > € этой
целью мы будем менять декартову систему координат так,
чтобы уравнение стало возможно проще. С самого начала
будем считать систему координат декартовой прямоуголь-
ной, так как при переходе к прямоугольной системе- ко-
ординат общий вид уравнения (1) не изменится.
При повороте базиса -декартовой прямоугольной си-
стемы координат на угол <р старые координаты х, у бу-
дут связаны в новыми координатами х', у'1 формулами
перехода (ер. (7) § 4 гл. I)
X s»xl tOS ф —у' sin ф, у= х' sin ф + / COS ф.
В новых координатах уравнение (1) примет вид
Л (х' совф—у' sinф)* + 2В(х' совф—у' sinф)х
Х(х' 81Пф4-$/'С08ф) + С(х' stn ф + у' cos ф)а -|- ... =0.
х) Коэффициента при произведении переменных и при их первых
степенях обозначены 2В, 2D н 2£, так как ниже часто будут встре-
чаться половины этих коэффициентов.
72
Здесь многоточием обозначены члены первой степени от-
носительно х' и у' и свободный член, которые нам нет
необходимости выписывать. Нас будет интересовать член
с произведением х'у' в преобразованном уравнении. В не-
выписанные члены произведение х'у'1 не входит, и мы
легко можем подсчитать, что коэффициент при х'у'
В' = — Asinq>cos<p + B (cos2<p—sin’ф) +Csin<pcos<p.
Если В = 0, то поворачивать систему координат не будем.
Если же В =5^0, то выберем угол <р так, чтобы В' обра-
тилось в нуль. Это требование приведет к уравнению
2Bcos2<p = (A—С) sin2<p для <р. Если А = С, то cos2<p = 0
и можно положить <р = л/4. Если же А#=С, то вы-
бираем <p = 1/2arctg[2B/(A—С)]. Для нас сейчас важно
то, что хоть один такой угол всегда существует. После
поворота системы координат на этот угол рассматриваемое
уравнение заменится на уравнение
А'х'* + Су'» + 2D'x' + 2Е'у' + F' = 0. (2)
Выражения для коэффициентов уравнения (2) через коэф-
фициенты уравнения (1) и угол <р получить нетрудно, но
они иам не нужны. Важно только, что за счет поворота
системы координат произвольное уравнение второго по-
рядка можно привести к виду (2). Теперь В' = 0, а ос-
тальные коэффициенты мы по-прежнему считаем произволь-
ными.
Сформулируем следующее вспомогательное
Предложение 1. Если в уравнение (2) входит
(с ненулевым коэффициентом) квадрат одной из коорди-
нат, то при помощи переноса начала координат вдоль
соответствующей оси можно обратить в нуль член с
первой степенью этой координаты.
В самом деле, пусть, например, А’=/=0. Перепишем
(2) в виде
А' (ж'* + ^-х' + () + Су'» + 2E'y' + F'—%-~0.
Если мы сделаем перенос начала координат, определяе-
мый формулами х" = х' + D'/A’, у” = у , то уравнение (2)
приведется к виду
А'х"» 4- С'у"» + 2£ V + F" = 0.
Предложение доказано.
А) Предположим, что в уравнении (2) А'С'^0, т. е.
А( и С оба отличны от нуля. Согласи© предложению 1
73
уравнение -может быть приведено к виду
Л'Г* + СУ» + Г'=О. (20
Могут быть сделаны следующие предположения относи-
тельно знаков коэффициентов в этом уравнении.
1) Коэффициенты А' и С' имеют один и тот же знак.
Для знака F" имеются три возможности:
а) Знак F" противоположен знаку А’ и С. Перене-
сем F” в правую часть равенства и разделим на него
Уравнение примет вид
где а‘= — F"/A', b*=—F"lC'.
Мы можем считать, что в этом уравнении а Ь. В са-
мом деле, если а < Ь, можно сделать дополнительную
замену координат
х* = /, y*~S. (4)
Определение. Линия, которая в некоторой де-
картовой прямоугольной системе коррдинат может быть
задана уравнением (3) при условии а^Ь, называется
эллипсом, а уравнение (3)—каноническим уравнением эл-
липса.
При а *=Ь уравнение (3) есть уравнение окружности
радиуса а. Таким образом, окружность есть частный слу-
чай эллипса.
б) Знак F" совпадает с общим знаком А' и С'. Тог-
да, аналогично предыдущему, мы можем привести урав-
нение к виду
Этому уравнению не удовлетворяют координаты ни одной
точки. Уравнение, которое приводится к каноническому
виду (5), называется уравнением мнимого эллипса.
в) F" = 0. Уравнение имеет вид
агх"’+сгу"’ = 0. (6)
Ему удовлетворяет только одна точка х'=0, у" — 0.
Уравнение, приводящееся к каноническому виду (6),
называется уравнением пары мнимых пересекающихся
прямых. Основанием для такого названия служит сход-
ство с приведенным ниже уравнением (8).
2) Предположим, что в уравнении (2') коэффициенты
А' и С1 имеют' разные знаки. Относительно свободного
члена возможны два предположения.
тг=—t (5)
74
a) F” =£0. В случае необходимости делая замену (4),
мы можем считать, что знак F* противоположен знаку
А'. Тогда уравнение приводится к виду
где а’= — F’/A', bt=F*lCt.
Определение. Линия, которая в некоторой декар-
товой прямоугольной системе координат может быть за-
дана уравнением (7), называется гиперболой, а уравнение
(7)—каноническим уравнением гиперболы.
б) Г* = 0. Уравнение имеет вид
а5х,,-с’/а = 0. (8)
Его левая часть разлагается на множители
(ах’-с/) (ах"+с/)
и, следовательно, обращается в нуль тогда и только тог-
да, когда равен нулю хоть один из множителей. Поэтому
линия с уравнением (8) состоит из двух прямых. Пря-
мые эти пересекаются в начале координат, и мы имеем,
таким образом, пару пересекающихся прямых.
Б) Допустим теперь, что А'С'=0 и, следовательно,
один из коэффициентов А’ или С* равен нулю. В случае
необходимости делая замену (4), мы можем считать, что
Д' = 0. Заметим, что С' так как иначе порядок урав-
нения (2) понизился бы. Используя предложение 1, мы
приведем уравнение линии к виду
С'/» + 2О'х*4-Г = 0.
а) Допустим, что Df =^0. Сгруппируем члены сле-
дующим образом!
C'/’ + 2D' (х' + -^г)=0.
Теперь очевидно, что, перенеся начало координат вдоль
оси абсцисс в соответствии с формулами перехода х* =
«= х'4-/?'/2£)', y*«=tf, мы приведем уравнение к виду
CV"4-2Dx» = 0,
или
= (9)
где ра=>—D'/С'. Мы можем считать, что /? > 0, так как
в противном случае можно сделать дополнительную заме-
ну координат, изменяющую направление оси абсцисс.
75
Определение. Линия, которая в некоторой декар
товой прямоугольной системе координат может быть за-
дана уравнением (9) при условии р>0, называется па-
раболой, а уравнение (9)—каноническим уравнением
параболы.
б) Допустим теперь, что D'szO, т. е. уравнение
имеет вид
С/ + Г-0.
Если знаки С' и F” противоположны, то, разделив
на С, мы можем записать у1*—а*ва(у”—a) (if 4-й)»=0
Обращение в нуль каждого из множителей определяет
прямую и вся линия представляет собой пару парал-
лельных прямых.
Если знаки С' и F” совпадают, то, разделив на С,
мы приводим уравнение к каноническому виду
if* «t- а* == 0. (10)
Этому уравнению не удовлетворяет ни одна точка. Урав-
нение, приводящееся к каноническому виду (10), назы-
вается уравнением пары мнимых параллельных прямых.
Может случиться, что Г*«0. Тогда уравнение линии
равносильно у" »0. Линия второго порядка представля-
et собой прямую. Левая часть уравнения (1), приводя-
щегося к каноническому виду у" =0, представляет со-
бой квадрат линейного многочлена, и потому уравнение
эквивалентно линейному. Такое уравнение носит назва-
ние уравнения пары совпавших прямых.
Соберем вместе полученные результаты.
Теорема 1. Пусть в декартовой системе координат
задано уравнение второго порядка
Аз? 2Вху + Су* -\-2Dx -\-2Ey+F
Тогда существует такая декартова прямоугольная 'си-
стема координат, в которой это уравнение принимает
один из следующих девяти канонических видов)
ФН 2>5 + ^“-1-
4)£—£ = 1,
б) а* г2—c*if*=0, 6) у* = 2рх,
7) f—a**»0, 8) ?+а*-0,
9)
Гв
В соответствии с этим существует семь классов ли-,
ний второго порядка: 1) эллипсы, 3) точки (пары мни-
мых пересекающихся прямых), 4) гиперболы, 5) пары
пересекающихся прямых, 6) параболы, 7) пары парал-
лельных прямых, 9) прямые (пары совпавших прямых).
Уравнению 2) мнимого эллипса и уравнению 8) пары
мнимых параллельных прямых не удовлетворяет ни
одна точка.
§ 2. Эллипс, гипербола и парабола
В предыдущем параграфа мы познакомились с клас-
сификацией линий второго порядка. Геометрические
свойства только трех классов линий не являются оче-
видными. Ими мы и займемся в этом параграфе
1. Эллипс. Напомним, что мы назвали эллипсом ли-
нию, которая в некоторой декартовой прямоугольной си-
стеме координат определяется каноническим уравнением
при условии а>Ь. Система координат, о которой гово-
рится в определении, называется канонической.
Из уравнения (1) сразу следует, что для всех точек
эллипса и т. е. эллипс лежит внутри
прямоугольника со сторонами 2а и 2Ь. Точки Пересече-
ния эллипса с осями ка-
нонической системы ко-
ордйна^, имеющие коор-
динаты (а, 0), (—а, 0),
(0, Ь) и (0, —6), на-
зываются вершинами эл-
липса. Расстояния от
начала координат до
вершин а и b называ-
ются соответственно
большой и малой полу-
осями эллипса.
Поскольку в каноническое уравнение (1) входят только
квадраты координат, это уравнение обладает следующим
свойством: если координаты (х, у) какой-либо точки М
ему удовлетворяют, то ему удовлетворяют и координаты
(— х, у), (х, —у) и (—х, —у) точек Mit и Mt
(рис. 28). Отсюда вытекает такое предложение.
77
Предложение 1. Для эллипса оси канонической си-
стемы координат являются осями симметрии, а начало
канонической системы—центром симметрии.
Центр симметрии называют просто центром эллипса.
Внешний вид эллипса (1) проще всего описать, срав-
нив его с окружностью радиуса а с центром в центре
Рис. 29 Эллипс как сжатие окруж
ности. Здесь Ь/а=\!2
эллипса. Уравнение этой
окружности напишем в
виде
4+4=1-
а2 1 а2
При каждом х таком,
что | х| <а, найдутся две
точки окружности с ор-
динатами ± а И1 — хг/а2
и две точки эллипса с ор-
динатами ±b И1—х*/а2
Пусть точке окружности
соответствует точка эллип-
са с ординатой того же
знака. Тогда отношение
ординат соответствующих точек равно b/а. Итак, эллипс
получается из окружности таким сжатием ее к оси абсцисс,
при котором ордината каждой точки уменьшается в одном
и том же отношении b/а (рис. 29)
Геометрически преобразование окружности в эллипс
можно осуществить, взяв вторую плоскость Ps, пересе-
кающуюся с исходной Pt вдоль оси абсцисс под углом
а = arccos (&/а) (рис. 30) На плоскости Р, выберем де-
78
оба (boKvca совпадают с
картову прямоугольную систему координат О, eIt е.,
у которой начало и базисный вектор ef совпадают с На-
чалом и вектором ех системы координат на плоскости Pit
а вектор е3 составляет угол а с вектором es. Рассмотрим
окружность Х’ + У’ = а* на плоскости Pt. Если из точки
М(Х, Y) на плоскости Р, опустить перпендикуляр на
плоскость Pf, то координаты (х, у) его основания N
получатся по формулам х~Х, у =*Y cos a —bY/а. По-
этому эллипс является множеством оснований перпенди-
куляров, опущенных из точек окружности, или, как гово-
рят, ортогональной проекцией
окружности.
С эллипсом связаны две
замечательные точки, назы-
ваемые его фокусами. Пусть
по определению
с2 = д2—(2)
и с>0, Фокусами называют-
ся точки Ff и F3 с коорди-
натами соответственно (с, 0)
системе координат.
Для окружности с = 0 1
центром. Ниже мы будем предполагать, что эллипс не
является окружностью.
Отношение
(3)
называется эксцентриситетом эллипса. Отметим, что всег-
да е< 1.
Предложение 2. Расстояние от произвольной точ-
ки М (х, у), лежащей на эллипсе, до каждого из фокусов
является линейной функцией от ее абсциссы xi
г, = |F,Af| = fl—ex, 1
r2 = |F2M| = fl + ex J (4)
Доказательство. Очевидно, что
г1 = /(х-с)2 + ^
(рис. 31). Подставим сюда выражение у*, найденное из
уравнения эллипса. Мы получим
г1= j/x2—2сх-|-<.2 + &’--^-
79
Преобразуем подкоренное выражение, учитывая равен-
ство (2):
а4—2сх4--Ц-
а*
Мы видим, что под корнем стоит квадрат линейного дву-
члена, т. е. г1 = |а—ех |. Так как е<1 и х^а, имеем
а—вх > 0. Мы доказали первое из равенств (4). Второе
доказывается аналогично.
Предложение 3. Для того чтобы точка лежала на
эллипсе, необходимо и достаточно, чтобы сумма ее рас-
стояний до фокусов равнялась большой оси эллипса 2а
Необходимость условия очевидна: если мы сложим
равенства (4) почленно, то увидим, что
Г14-г2 = 2а. (5)
Докажем достаточность. Пусть для точки М (х, у) вы-
полнено условие (5), т. е.
/(х—с)44-г/4 = 2а — И(х 4- с)4 4- г/4.
Возведем обе части равенства в квадрат и приведем по-
добные члены: __________
хс 4- а* = аИ(х4-£)а4-р’." (6)
Это равенство также возведем в квадрат и приведем по-
добные члены, используя соотношение (2). Мы придем
к равенству, равносиль-
ному уравнению эллип-
са (1).
С эллипсом связаны
две замечательные пря-
мые, называемые его ди-
ректрисами. Их урав-
нения в канонической
системе координат (рис.
32):
Рис 32 x = v и хж=—2.. (7)
8 8
Директрису и фокус, которые лежат по одну сторону
от центра, будем считать соответствующими друг другу.
Предложение 4. Для того чтобы точка лежала на
аллипсе, необходимо и достаточно, чтобы отношение ее
расстояния до фокуса к расстоянию до соответствующей
директрисы равнялось эксцентриситету эллипса в.
80
Докажем это предложение для фокуса Ft (-с, 0).
Обозначим расстояние от произвольной течки эллипса
М(х, у) до директрисы с уравнением х — — а/е через d2
Тогда, согласно формуле (12) § 3 гл II,
d2===x4-2. = -j-(ex-f-a),
что только множителем 1/е отличается от выражения (4)
ДЛЯ г2
Обратно, пусть для какой-нибудь точки плоскости
r2/d2 = е, т. е.
V(*+с)а+у2_ _
х-\-а/е
Учитывая, что & = с!а, это равенство легко привести к
виду (6), из которого, как мы знаем, вытекает уравне-
ние эллипса (1).
Для другого фокуса предложение вытекает из сим-
метрии эллипса относительно оси ординат канонической
сйстемы координат.
Получим теперь уравнение касательной к эллипсу,
заданному каноническ м уравнением. Известно, что уг-
ловой коэффициент прямой, которая касается графика
функции в какой-то точке (х0, у0), равен производной
этой функции в точке хд. Пусть ^о=/=О. Через точку
(хв, у„) на эллипсе проходит график функции f(x), цели-
кбм лежащий на эллипсе. (Для ул>0 это —график
функции Д (х) =* bV 1 —х2/а2, для уа < 0—функции Д (х) *=
— ——х2/а2. Не уточняя знак у0, обозначим через
/(х) подходящую функцию.) Для функции /(х) выполне-
но тождество
, (И*))2 1
Дифференцируя его по х, находим
21 + 2!L~q
Подставляя х = х0, /(x0) = z/0 и решая относительно f (х0),
получаем, в силу у0 Ф О,
f (х ) 21 2»
' W а2 у0 •
Теперь мы можем написать уравнение касательной в точ-
ке (х0, уд)-. t
у-у.=~Ъ$(х-хЛ-
81
Для упрощения преобразуем его к виду a*yyt 4- Ь*Хх9 =
-= Ьгх% + а*у,. Так как точка (xt, у0) удовлетворяет урав-
нению эллипса, имеем Ь*х% + а2г/о = а’Ь2, откуда a*yyt 4-
+Ьгххе = а*Ь*. Итак, уравнение касательной к эллипсу
в точке (xe, у0) имеет вид:
-5г + -ьг=1- (8)
При выводе уравнения (8) мы исключили вершины эл-
липса (а, 0) и (—а, 0), положив уо=/=О. Для этих точек
уравнение (8) превращается соответственно в уравнения
х — а и х= —а, которые
определяют касательные
в вершинах. Проверить
это можно, заметив, что
в вершинах х как функ-
ция от у достигает эк-
стремума. Предоставим
читателю проделать это
подробно и показать тем
самым, что уравнение (8)
определяет касательную
Рис. 33. к эллипсу для любой точ-
ки (х0, уй) на эллипсе.
Предложение 5. Касательная к эллипсу в точке
Л10(х0, у0) есть биссектриса угла, смежного с углом меж-
ду отрезками, соединяющими эту точку с фокусами.
Доказательство. Пусть L—точка пересечения
касательной с осью абсцисс (рис. 33). Из уравнения (8)
сразу находим, что ее абсцисса равна аа/х0. Заметим, что
а2/|х„|>а и, следовательно, Ь лежит вне отрезка FjF,.
Расстояния от L до фокусов равны |FtL\ = |а?[ха — с| и
|FaL| = |а2/х04’с|, поэтому их отношение
I Fjf. | _ |да/х0—с| _ |д-ех„|
|F,£| |аа/х04-с( |а4-вх0|
равно отношению длин отрезков MtFt и MtFt. Отсюда
мы заключаем, что МаЬ есть биссектриса внешнего угла
треугольника MnFiFt, что нам и требовалось. Следует
заметить, что наше доказательство теряет смысл для вер-
шин эллипса. Но для них утверждение очевидно.
2. Гипербола. Гиперболой мы назвали линию, которая
в некоторой декартовой прямоугольной системе координат
определяется каноническим уравнением
82
Система координат, о которой говорится в определении,
называется канонической.
Из уравнения (9) сразу вытекает, что для всех точек
гиперболы |ха, т. е, все точки гиперболы лежат вне
вертикальной полосы ширины 2а (рис. 34). Ось абсцисс
канонической системы пересекает гиперболу в точках
(а, 0) и (— а, 0), называемых вершинами гиперболы. Ось
ординат не пересекает гиперболу. Числа а и b называ-
ются соответственно ве-
щественной и мнимой
полуосями гиперболы.
В точности так же,
как и для эллипса, до-
казывается следующее
Предложение 6.
Для гиперболы оси ка-
нонической системы ко-
ординат являются осями
симметрии, а начало
канонической системы —
центром симметрии.
Центр симметрии называется центром гиперболы
(рис. 34).
Для исследования формы гиперболы найдем ее пере-
сечение с произвольной прямой, проходящей через нача-
ло координат. Уравнение прямой возьмем в виде y = kx,
поскольку мы уже знаем, что прямая х = 0 не пересекает
гиперболу. Абсциссы точек пересечения находятся из
уравнения
хг Ьгхг__.
______ 1
или, если Ь2—а2А,2>0,
х = ±—7==-
К 62—'
Это позволяет указать координаты двух точек пересе-
чения:
(ab/v, abk/v) и (—ab/v, — abk/v),
где обозначено о = (&2—агкг)‘'*. В силу симметрии доста-
точно проследить за движением первой из точек прн из-
менении k (рис. 35).
Числитель дроби ab/v постоянен, а знаменатель при-
нимает наибольшее значение при k = 0. Следовательно,
83
ловыми коэффициентами тем
Рис. 35.
наименьшую абсциссу ' имеет точка с координатами
(а, 0). С ростом k знаменатель убывает и абсцисса х ра-
стет, стремясь к бесконечности, когда k приближается
к числу Ыа. Прямая у~Ьх/а с угловым коэффициентом
b/а не пересекает гиперболу, и прямые с ббльшими уг-
ловыми коэффициентами тем более ее не пересекают.
Любая прямая с мень-
шим положительным уг-
ловым коэффициентом-
пересекает гиперболу.
Если мы будем пово-
рачивать прямую от го-
ризонтального положе-
ния по часовой стрелке,
то k будет убывать, а
k*—расти и прямая бу-
дет пересекать гипербо-
лу во все удаляющихся
точках, пока не займет положения с угловым коэффй-.
циентбм —Ь/а. К прямой «/=—bx/а относится все, что
сказано о у=Ьх/а: она не пересекает гиперболу и отде-
ляет прямые, пересекающие ее, от непересекающих.
Определение. Прямые с уравнениями у=Ьх/а и
y——bx/a в канонической системе координат называются
асимптотами гиперболы.
Из приведенных выше рассуждений вытекает, что. ги-
пербола Имеет вид, изображенной на рис. 35.' Гипербола
состоит из двух отдельных кусков, называемых ее ветвями.
Запишем уравнения асимптот в виде Ьх—ау=0 и
Ьх-{-ау—0. Расстояния от точки М с координатами (х, у)
до асимптот равны соответственно (ср. (12) § 3 гл. П)
л __ и 1Ьх+°У\
* Vaf+b* * * Va?+b* '
Если точка М находится на гиперболе, то Ь*х*—а*у*
= а*Ь* и
|Мх«-а*у*| _
«1я» = а» 4-6» .-•«•+6»*
Предложение?. Произведение расстояний от точки
гиперболы до асимптот п стоянно и равно .
Отсюда следует важное свойство асимптот.
-Предложение 8. Если топка движется по гипер-
боле так, что ее абсцисса по абсолютной величине неог-
84
раниченно возрастает, то расстояние от точки до одной
из асимптот стремится к нулю.
Действительно, хотя бы одно из расстояний ht или
ft, при этих условиях должно неограниченно возрастать,
и, если бы предложение
было неверно, произве-
дение не было бы пос- х. »г
тоянно.
С гиперболой связа- \ Ь
мы две замечательные .---------Л-------
точки, называемые ее О
фокусами. Введем число 7
с, положив по опреде- 7^
лению 7
с* = а4 4-6s (10) Рис, Зв,
и с > 0. Фокусами гиперболы называются точки Ft и г,
с координатами соответственно (с, 0) и (—с, 0) в кано-
нической системе координат (рис. 36).
Отношение г*=с1а, как и для эллипса, называете^
эксцентриситетом. У гиперболы всегда е > I.
Предложение 9. Расстояния от произвольной
точки М (х, у), лежащей на гиперболе, до каждого из
фокусов следующим об-
Рис, 37, га—rf=2a, rj— г'г*=2а.
разом зависят от ее
абсциссы х!
г, = |FtAf | = |а—ех(,
^ = 1^»М|=|а4-ех|.
(И)
Доказательство этого
предложения почти дос-
ловно совпадает с дока-
зательством предложе-
ния 2, и мы не будем
его воспроизводить.
Равенства (11) подробнее можно записать так (рис. 37):
для х^а (правой ветви гиперболы)-
rf=ex—а, г, = ex-f-а;
для х<— а (левой ветви гиперболы)
/f=a—ex, r, = —ex—a.
85
Мы видим, что для правой ветви гиперболы г,—г, =*
— 2а, а для левой г,—г, —2а. В обоих случаях
|q-rt| = 2a. (12)
Это доказывает необходимость условия в следующем
предложении.
Предложение 10. Для того чтобы точка лежала
на гиперболе, необходимо и достаточно, чтобы разность
ее расстояний до фокусов по абсолютной величине равня-
лась вещественной оси гиперболы.
Для доказательства достаточности условия его нужно
представить в виде
± И*—с)’ + р* = 2a ± +<?)* + !/*.
Дальнейшее отличается от доказательства предложения 3
только тем, что нужно воспользоваться равенством (10),
а не (2).
С гиперболой связаны две прямые линии, называемые
ее директрисами. Их уравнения в канонической системе
координат!
х = — И № — —. (13)
8 8 ' '
Директрисы гиперболы лежат ближе к центру, чем
вершины, и, следовательно, не пересекают гиперболу.
Директрису и фокус, которые лежат по одну* сторону от
центра, будем считать соответствующими друг другу.
Предложение 11. Для того чтобы точка лежала
на гиперболе, необходимо и достаточно, чтобы отноше-
ние ее расстояния до фокуса к расстоянию до соответст-
вующей директрисы равнялось эксцентриситету гипер-
болы е.
Докажем это предложение для фокуса F,. Обозначим
расстояние от произвольной точки гиперболы М (х, у) до
директрисы с уравнением х = —a/е через dt (рис. 38).
Тогда, согласно формуле (12) § 3 гл. II, имеем
<, = 1* + т1 =Т
I ® I "
что только множителем 1/е отличается от г, (ср. (11)).
Достаточность условия доказывается так же, как в
предложении 4 для эллипса.
Уравнение касательной к гиперболе в точке (х0, у,),
лежащей на гиперболе, выводится так же, как и соответ-
86
ствукицее уравнение (8) для эллипса. Оно имеет вид
1 лдх
а® 6® • ' ’
Предложение 12. Касательная к гиперболе в точ-
ке М0(х0, у6) есть биссектриса угла между отрезками,
соединяющими эту точку с фокусами.
Доказательство почти не отличается от доказательства
предложения 5. Рекомендуем читателю полностью прове-
сти доказательство этого и остальных утверждений, сфор-
мулированных, но не доказанных для гиперболы в этом
пункте.
3. Парабола. Параболой мы назвали линию, которая
в некоторой декартовой прямоугольной системе коорди-
нат определяется каноническим уравнением
№ = 2рх (15)
при условии р > 0. Система координат, о которой гово-
рится в определении, называется канонической.
Из уравнения (15) вытекает, что для всех точек па-
раболы х>0. Парабола проходит через начало канони-
ческой системы координат. Эта точка называется верши-
ной параболы.
Поскольку вместе с каждой точкой М (х, у) уравнению
параболы удовлетворяет и точка (х, — у), ось абсцисс
канонической системы координат является осью симмет-
рии параболы.
Форма параболы известна из курса средней школы,
где парабола встречалась в качестве графика функции
у*=ах*. Отличие уравнений объясняется тем, что в кано-
нической системе координат по сравнению с прежней оси
координат поменялись местами и коэффициент а~1 обо-
значен через 2р.
87
Фокусом F параболы называется точка с координатами
(р/2, 0) в канонической системе координат (рис. 39).
Директрисой параболы называется прямая с уравне-
нием х =— р/2 в канонической системе координат.
Предложение 13. Расстояние от произвольной
точки параболы до фокуса равно
г = х + -^. (16)
Для доказательства подставим у* из уравнения (15) в
выражение г = И(х—р/2)* -f- уг для расстояния от точки
/ М(х, у) до фокуса:
Преобразовав подкоренное [выраже-
ние, мы находим
откуда в силу х>0 вытекает (16).
Заметим, что расстояние от точки
параболы до директрисы, согласно
формуле (12) § 3 гл. II, также рав-
няется
Рис. 39. d = x + ^.
Отсюда вытекает необходимость условия в следующем
предложении.
Предложение 14. Для того чтобы точка Л4 лежа-
ла на параболе, необходимо и достаточно, чтобы она бы-
ла одинаково удалена от фокуса и от директрисы этой
параболы.
Докажем достаточность. Пусть точка М (х, у) одинако-
во удалена от фокуса и от директрисы параболы (15), т. е.
К (*—f)2+^=x+f •
Возводя это равенство в квадрат и приводя подобные
члены, мы получаем из него уравнение параболы. Это
заканчивает доказательство.
Параболе приписывается эксцентриситет е = 1. В силу
этого соглашения формула
г
88
связывающая расстояния от точки линии до фокуса н до
директрисы, будет верна и для эллипса, и для гиперболы,
и для параболы.
Выведем уравнение касательной к параболе в точке
Мв(хв, //0), лежащей на параболе. Пусть уо¥=0- Через
точку Мй проходит график функции y = f(x), целиком
лежащий на параболе. (Это у = \^2рх или у — —\^2рх,
смотря по знаку ув.) Для функции /(х) выполнено тож-
дество (f (х))2 = 2рх, диф-
ференцируя которое имеем
2/ (х) f (х) — 2р. Подставляя
х = х0 и f (х0) = у0, находим
поскольку ув=£0. Теперь мы
можем написать уравнение ка-
сательной к параболе;
У—У<, = ^-(х—хв).
Уй
Упростим его. Для этого раск-
роем скобки; уу„—yl = px —
— рх„—и заметим, что yl — 2рхл.
Теперь уравнение касательной к параболе принимает окон-
чательный вид:
уу0 = р(х + х0).
(17)
Заметим, что для вершины параболы, которую .мы
исключили, положив уравнение (17) превращается
в уравнение х = 0, т. е. уравнение касательной в вершине.
Итак, уравнение (17) справедливо для любой точки
Мл(х0, ув) на параболе.
Предложение 15. Касательная к параболе в точ-
ке Мв есть биссектриса угла, смежного с углом между
отрезком, который соединяет точку Мо с фокусом, и
лучом, выходящим из этой точки в направлении оси па-
раболы (рис. 40).
Доказательство. Вектор I, который направлен
вдоль биссектрисы указанного в предложении угла, мож-
но получить как сумму векторов единичной длины, на-
правленных по сторонам угла, т. е. FM,/| FM0 | и е1. Если
Мо имеет координаты хв и у0, то FM# = (xe—p/2)et + ^ee,
89
и | FM01 == xt 4- p/2. Значит,
1 = (^+p?2 +1) e* +%= x0-f-p/2 + y^
Теперь мы можем подсчитать угловой коэффициент бис-
сектрисы k = yj(2xt), Выше мы вычислили угловой коэф-
фициент касательной k' ^р/у*. Докажем, что Л = £'. Дей-
ствительно, k/k' = уУ(2рхй) = 1. Предложение доказано.
§ 3. Линия второго порядка,
заданная общим уравнением
1. Пересечение линии второго порядка и прямой.
Рассмотрим линию второго порядка, заданную общим
уравнением
Ахг-\-2Вху + Су*-\-2Ох-{-2Еу-[-Е = 0 (1)
в декартовой системе координат, и исследуем пересечение
этой линии с произвольной прямой
х = х04-а/, y = y9 + $t. (2)
Значения параметра t, соответствующие точкам пересе-
чения, должны удовлетворять уравнению, получаемому
подстановкой (2) в (1):
А (х„ + а/)2 + 2В (х„ + а/) (у. + &) + С (у, + ₽/)’ +
+ 2D(xe4-aO + 2£(!/o4-pO + F = O. (3)
Раскрывая здесь скобки и приводя подобные члены, мы
получим квадратное уравнение
Pti + 2Qt + R = O, (4)
в котором
P = Aa2 + 2BaP + Cp2, (5)
Q = (Ax04-B^04-D)a4-(Bx04-Ci/04-£)P, (6)
или при другой группировке слагаемых
Q = (Aa+B₽)x„4-(Ba+C₽)^+Da+£p. (7)
Свободный член есть значение многочлена при t = 0, т. е.
R = Ахг0 + 2Вхоуа 4- Cyl + 2Ох0 4- 2Еу0 4- F- (8)
Вообще говоря, уравнение (4)—квадратное, оно имеет
не больше двух корней, и прямая пересекает линию или
90
в двух точках, или в одной (кратные корни) или не пе-
ресекает ее (комплексные корни). Но возможны исклю-
чительные прямые, для которых Р = 0, т. е.
Да2 4-2Ва0 4-С02 = О, (9)
и, следовательно, уравнение (4) является линейным.
В этом случае оно имеет один корень при Q=/=0, а при
Q = 0 либо выполнено тождественно (если и /? — 0), ли-
бо не имеет решений. Следовательно, «исключительные»
прямые пересекают линию в единственной точке, или
лежат на ней целиком, или не пересекают совсем.
В равенство (9) не входят координаты х0, у9 началь-
ной точки прямой. Кроме того, оно остается справедли-
вым, если умножить а и 0 на ненулевой множитель, т. е.
взять другой направляющий вектор прямой. Поэтому
свойство «исключительности» связано только о направле-
нием прямой.
Определение. Направление, определяемое векто-
ром, компоненты которого удовлетворяют уравнению (9),
называется асимптотическим направлением линии второго
порядка
2. Число асимптотических направлений. Тип линии.
Выясним, сколько асимптотических направлений может
иметь линия второго порядка. Обозначив
6=|д с|,
сформулируем следующее
Предложение 1. Линия второго порядка имеет
два асимптотических направления, если б < 0, одно, если
6 = 0, и ни одного, если б >0.
Для доказательства рассмотрим несколько случаев!
1) Пусть Д = С = 0. Тогда обязательно В^О и б =
=—В* <0. Уравнение (9) имеет вид 2Ва0 = О, и ему
удовлетворяют векторы (1, 0) и (0, 1).
2) Пусть С т^0. Тогда вектор (0, 1) не является ре-
шением уравнения (9), и каждое решение этого уравнения
можно задать угловым коэффициентом & = 0/а, удовлет-
воряющим уравнению C2£*4-2B&4-Д = 0. Дискриминант
этого уравнения В2—АС—— б. Следовательно, оно имеет
два корня при б < 0, один корень при 6 = 0 и не имеет
вещественных корней при 6 > 0.
3) Пусть А^0. Мы поступаем, как и в предыдущем
случае, с той разницей, что рассматривается не угловой
коэффициент, а отношение &j = a/0, удовлетворяющее
01
а) б)
Рис. 41. Асимптотические
направления: а) у параболы;
уравнению ЛА,+25^4-0=0. Дискриминант этого урав-
нения также равен —б.
Поскольку случаи 1)—3) исчерпывают все возможно
сти, предложение доказано.
В силу предложения 1 не только знак б определяет
число асимптотических направлений, но,и обратно, их чис-
ло определяет знак 6. Это сразу проверяется от противного
Мы определили асимптотические направлении при по
мощи аналитического условия (9). Поэтому в принципе
при изменении системы коор
дииат асимптотическое направ-
ление могло бы перестать быть
асимптотическим или, наоборот,
обыкновенное направление сде-
латься асимптотическим. Можно
доказать, хотя мы и не будем
этого делать, что определение
асимптотических направлений
на самом деле не зависит от
выбора системы координат.
Используя канонические
уравнения, Легко проверить, что
эллипс не имеет асимптотичес-
ких направлений, парабола имеет
одно, а гипербола два асимп-
тотических направления (рис.
41). На этом основании линии
б) у гиперболу. второго порядка называются Ли-
ниями гиперболического, парабо-
лического или эллиптического типов, смотря по тому,
имеют ли они два, одно или не имеют ии одного асимпто-
тического направления.
Для линий гиперболического типа б < 0, для парабо-
лического типа б as О и для эллиптического б>0.
3. Диаметр линии второго порядка. Назовем кордой
любой отрезок, концы которого лежат на линии, а осталь-
ные точки на ней на лежат. Таким образом, хорда не
может иметь асимптотического направления.
Мы предположим, что рассматриваемая линия второго
порядка имеет по крайней мере одну хорду. Этому усло-
вию удовлетворяют эллипсы, гиперболы, пары пересека-
ющихся прямых, параболы, пары параллельных прямых.
Формально почти все следующие вычисления остаются
справедливыми и для остальных линий и даже для урав-
нений мнимого эллипса и пары мнимых параллельных
92
прямых, но геометрического смысла полученные резуль-
таты иметь не будут.
Фиксируем какое-нибудь неасимптотическое направле-
ние и исследуем множество середин хорд, имеющих это
направление. Если начальная точка М9(х9, yt) секущей (2)
находится в середине хорды, W корни уравнения (4) рав-
ны по абсолютной величине и отличаются знаком (рис. 42).
Это выполнено в том и только в том случае, когда Q«0.
В силу выражения (7) для Q это означает, что середины
хорд направления (а, ₽)*) лежат на прямой
(Да4-ВР)х + (Ва4-Ср) 4-Da 4-ЕР = 0. (10)
Определение. Прямая (10) называется диаметром
линии второго порядка, сопряженным направлению (a, 0).
Стоит обратить внимание на
то, что диаметром называется J^~r~—Т~
вся прямая. Эго не означает, >*// /
что середины хорд ее заполня- / / /
ют целиком. Такое положение ТуЧ/!/ /
возможно, но возможно также, У /
что множество середин хорд / /
есть, например, отрезок или X / /
луч. А./
Конечно, остается сомнение, /Ч.
действительно ли уравнение (10)
определяет прямую: не окажут- Рис. 42»
ся ли коэффициенты при пере-
менных в нем оба равными нулю? Допустим, что это
так. т. е.
Ла4-Вр = 0, Ва-|-СР = 0.
Умножим первое из этих равенств на а, второе на 0 и
сложим. В результате мы получим равенство (9), которое
по предположению не имеет места. Итак, уравнение (10)
определяет прямую.
4. Центр линии второго порядка. Изучим множество
всех диаметров линии второго порядка. Оно описывается
уравнением (10), в котором а и 0 меняются так, чтобы
, направление (а, 0) не было асимптотическим. Используя
(6), мы перепишем это уравнение в виде
(Ах4* ВуЛ’О) ®4* (Вх 4-Ср-^Е) 0 «0, (11)
’) Здесь и далее мы обозначаем направление компонентами ка-
кого-нибудь ненулевого вектора, имеющего это направление. Ясно,
.что а в 0 интересуют нае только с точностью до общего множителя.
93
сразу заставляющем вспомнить пучок прямых. И действи-
тельно, если прямые Ах4-В^4-Д=0 и Bx-f-Cy + E^O
не параллельны, т. е.
б=3|в ?|^°’ (12>
все диаметры принадлежат пучку, определяемому этими
прямыми. Не утверждается, что каждая прямая этого
пучка—диаметр: исключение составляют прямые асимп-
тотического направления.
Центр пучка (11) при условии (12) определяется си-
стемой уравнений
Ах 4-4-0 = 0, 1
Bx+Ct/ + £=O. I ( '
Предложение 2. Точка О, координаты которой
удовлетворяют системе уравнений (13), является центром
симметрии линии второго порядка.
Предложение будет доказано, если мы покажем, что
пересечение линии с любой прямой, проходящей через
точку О, симметрично относительно этой точки.
Примем точку О за начальную точку прямой (2). Ес-
ли прямая имеет неасимптотическое направление, то в си-
лу равенств (6) и (11) уравнение (4) для этой прямой
имеет вид Pt* 4-# = 0> причем Р#=0. Если это уравнение
имеет различные вещественные корни, то они отличаются
один от другого только знаком. Если корень один, то он
равен нулю. Итак, в любом случае множество точек пере-
сечения симметрично относительно точки О.
Рассмотрим теперь прямую асимптотического направ-
ления. Для нее в уравнении (4) P = Q = O, и либо пря-
мая целиком лежит на линии, либо не имеет с ней об-
щих точек. Следовательно, и для прямых асимптотичес-
кого направления множество точек пересечения симмет-
рично относительно точки О.
Заметим, что предложение справедливо для любой
линии второго порядка, независимо от условия (12). Ра-
зумеется, предполагается, что линия содержит хоть одну
точку. В противном случае утверждение становится бес-
содержательным. При этом же условии мы можем дока-
зать и обратное предложение.
Предложение 3. Координаты центра симметрии
линии (1) удовлетворяют системе уравнений (13).
Доказательство. Пусть О(х0, у0)—центр симмет-
рии линии. Рассмотрим пересечение линии с произволь-
04
ной прямой, проходящей через О, приняв эту точку за
начальную точку прямой. Относительно О имеются две
возможности:
1) Точка О лежит на линии. Пусть прямая имеет не-
асимптотическое направление (а, 0). Тогда точка О —
единственная точка пересечения, так как в противном
случае с учетом симметрии точек пересечения было бы
не меньше трех. Следовательно, уравнение (4) имеет крат-
ный корень /=0, откуда следует Q = 0. Итак, координа-
ты О удовлетворяют равенству (11).
Из равенства (И) не следует еще, что координаты О
удовлетворяют системе (13). Нам придется написать такое
же равенство для другого неасимптотического направле-
ния (а', 0'). Тогда для координат (х0, у0) имеем
(Ахе 4- Ву„ 4- D) а 4- (Bxt 4- Сув 4- Е) 0 = О,
(Лх„ 4- Вул 4- D) а' 4- (Вхл 4- Су0 4- Е) 0' = О,
где а0'—а'0=/=О. Рассматривая эти равенства как си-
стему уравнений с коэффициентами а, 0, а!, 0', мы по-
лучаем
4- By,, 4* D = 0, Вх6 4- Сув 4- Е = 0, (14)
как и требовалось.
2) Пусть точка О не лежит на линии. Если прямая,
проходящая через О в направлении (а, 0), пересекает ли-
нию в точке М, ^которой соответствует значение парамет-
ра /t, то существует симметричная точка пересечения со
значением параметра —Итак, Pt2, 4* 2Qtt 4- /? = 0 и
PZ? — 2Qtf 4- R = 0, откуда в силу =й= 0 следует Q = 0.
Таким образом, если линия имеет точки пересечения
е двумя различными прямыми, проходящими через О, то,
как и выше, мы можем получить равенства (14) для ко-
ординат точки О.
Докажем, что две такие прямые обязательно найдутся.
Действительно, в противном случае все точки линии ле-
жат на одной прямой. Эта прямая имеет неасимптотнчес-
кое направление. В самом деле, она имеет с линией по
крайней мере две общие точки, и, будь она асимптотиче-
ского направления, все ее точки лежали бы на линии, в
том числе и О. Это противоречит сделанному выше пред-
положению, что О не лежит на линии. Теперь легко ви-
деть, что линия состоит ровно из двух точек. Но из тео-
рему 1 § 1 следует, что таких линий нет. Предложение
доказано.
95
Предложения 2 и 3 показывают, что условие 6у=0
необходимо и достаточно для того, чтобы у линии второ
го порядка существовал единственный центр симметрии
Линии, имеющие единственный центр симметрии, называ-
ются центральными. Таким образом, неравенство 6у=0
- является инвариантным (не
зависящим от системы ко-
ординат) признаком цент-
ральной линии. Равенство
о=»0 является инвариант-
ным признаком нецентраль-
ной линии.
X. у Вспомним, что 6 =/= О
---------у_____________-эй- для линий эллиптического
X /______________и гиперболического типов.
—-у-у------У------ХуХ— Это—центральные линии.
/______(/ Линии параболического
/ х. типа — нецентральные.
X 5. Сопряженные нап-
6) равления. Направление
Рис. 43. Сопряженные направления: (® • Р )» определяемое диа-
л) у эллипса; б) у гиперболы. метром, сопряженным нап-
равлению (а, р), называется
сопряженным для направления (а, Р). Компоненты нап-
равляющего вектора диаметра (10), согласно предложе-
нию 1 § 2 гл. II, удовлетворяют условию
(Аа+Вр)а'Ч-(Ва + Ср)0'=О (15)
или
Лаа' 4-В(а'Р-ЬР'а) + СрР' =0. (16)
В последнее выражение пары чисел а, Р и а', 0' входят
симметричным образом. Отсюда вытекает
Предложение 4. Если направление (а\ 0'), со-
пряженное с (а, 0), не является асимптотическим, то
сопряженным для (ае, 0') будет (а, 0) (рис. 43).
Возникает вопрос, при каких условиях направление,
сопряженное какому-нибудь направлению (а, 0), может
оказаться асимптотическим. Это легко выяснить.
Из равенства (15) следует, что в качестве а' и 0'
можно выбрать соответственно — (Ва-)-Ср) и (Ла-)-В0).
Подставим эти выражения в уравнение (9) для асимпто-
тических направлений:
А (Ва Ч-СР)»—2В (Ba + С0) (Ла + Bp) -|- С (Ла + Вр)* = 0.
66
После приведения подобных членов мы получаем
(АС—В1) (Ааг + 25ос0 4- Ср») - 0.
Поскольку (а, 0)—не асимптотическое направление, это
произведение может обращаться в нуль только за счет
первого сомножителя. Мы получаем следующий результат
Предложение 5. Если линия нецентральная (6 — 0),
то для любого направления (а, 0) сопряженное направле-
ние— асимптотическое Если линия центральная (б=£0),
то для любого направления
(а, 0) сопряженное направле-
ние — не асимптотическое
(рис 44).
6. Главные направления.
Если диаметр перпендикуля-
рен хордам, которым он соп-
ряжен, то он является осью
симметрии рассматриваемой
линии Введем следующее
Определение. Нап-
равление (а, 0)и направление
Рис. 44. У параболы любому
направлению сопряжено асимп-
тотическое.
(а', 0') сопряженного ему диаметра называются главными
направлениями, если они перпендикулярны.
Если система координат декартова прямоугольная, то
для главного направления а и 0 должны быть пропор-
циональны коэффициентам уравнения (10), т. е. должно
существовать такое число X, что
Да 4- В0 = Ха, I
Ва 4- С0 = Х0. J
(17)
Исключая X, мы получаем уравнение для а и 0:
(Я—С)а04-В(01—а*)==0. (18)
Если В —0 и Л —С, то это уравнение выполнено тожде-
ственно. Если В —0, А^С, то ему удовлетворяют на
правления осей координат (1, 0) и (0, 1). Если же В#=0,
уравнение (18) приводится к квадратному уравнению
для углового коэффициента А = 0/а:
Читатель заметит, что последнее уравнение всегда имеет
два корня kt и kv удовлетворяющих условию ktkt = — 1.
Согласно предложению 4 § 3 гл. II это означает, что
91
4-102
направления с угловыми коэффициентами kt и kt взаимно
перпендикулярны. Мы получаем
Предложение 6. Каждая линия второго порядка
имеет хотя бы одну пару главных направлений. Или
эта пара единственная, или каждая пара направлений
является главной.
Нетрудно доказать, что в последнем случае (т. е. ког-
да В = 0, А = С) уравнение (I) приводится к одному из
следующих канонических видов: ж* 4- у* — г*, х’ + у2 = 0
или **4-у*« — г*.
Для нецентральной линии главными являются асимп-
тотическое направление и перпендикулярное к нему.
7. Касательная к линии второго порядка. Как извест-
но, касательной к линии называется предельное положе-
ние секущей, когда хорда стягивается в точку. Здесь мы
выведем уравнение касательной к линии второго порядка,
заданной уравнением (1). Дадим предварительно следую-
щее
Определение. Особой точкой линии второго по-
рядка называется центр симметрии, который лежит на
линии.
Особыми точками являются: точка пересечения пары
пересекающихся прямых, единственная точка пары мни-
мых пересекающихся прямых и каждая точка пары сов-
павших прямых.
В особой точке касательная не определена. Если точ-
ка лежит на прямой, входящей в состав линии, то каса-
тельная совпадает с этой прямой. Для общего случая
докажем
Предложение 7. Если неособая точка не лежит
на прямой, входящей в состав линии, то через эту точ-
ку проходит диаметр.
Доказательство. Пусть точка Mt(xa, у9), лежа-
щая на линии, не является центром симметрии. Тогда
числа
а= — (Вх9 + Су6 + Е) и ₽ = Ax, + Byt + D (19)
одновременно не равны нулю и уравнение
(Ах 4- By A- D)fxA-(Bx А-Су 4-Е) р = 0 (20)
есть уравнение диаметра* проходящего через М9 и сопря-
женного направлению (а, р), если только это направле-
ние не асимптотическое. Допустим, что (а, Р)—асимпто-
тическое направление. Тогда для прямой, проходящей
через в направлении (а, Р), все коэффициенты урав-
98
нения (4) равны нулю: Р=0 по определению асимптоти-
ческого направления, Q—0 в силу равенств (6) и (19),
Я=0, так как Afe лежит на линии. Таким образом, М9
лежит на прямой, входящей в состав линии, что проти-
воречит предположению.
Мы получим касательную к линии в точке Ме, если
проведем через эту точку прямую линию в направлении
(19), которому сопряжен диаметр, проходящий через эту
точку. Эта прямая имеет уравнение ₽ (х—х9)—а (у—у,) =0,
или
(Лх, + Ву9+D) (х—х.) 4- (Вх9 + Су9+Е) (у—у9) = 0.
Преобразуем это уравнение с учетом того, что х9 и ус
удовлетворяют уравнению (1). Мы получим уравнение
касательной к линии (1) в точке М9(х9, у9):
Ахх„4-В (ху9 + ух9)+Суу9 4> D (х 4- х.) 4- Е (у 4- у9) 4- F » 0.
(21)
8. Особые точки. Исследуем, при каких условиях на
коэффициента уравнения (1) линия второго порядка име-
ет особую точку. Для координат х9, у9 такой точки долж-
ны быть справедливы равенства
Лх„4-Ву.4-О = 0,
Бх.4-С&4-£=0.
Ах* 4- 2Вх,у, 4- Су ’ 4- 2Дх, 4- 2Еу, 4- F == 0.
Умножим первое из них на хв, второе на у9 и вычтем
из третьего. Мы получим эквивалентную систему равенств
Лх, 4-By, 4-0 = 0,
Вх, 4-Су. 4-Е = 0,
Ох,4-£у,4-/г=0
(22)
Рассмотрим векторы р(Л, В, О), я (В, С, Е) и r(D, Е, F).
Равенства (22) представляют собой координатную запись
векторного равенства
г = — (х.р4-у.Ч). (23)
Отсюда следует, что при наличии у линии особой точки
векторы р, q и г компланарны, что может быть следую-
щим образом записано через их компоненты:
|Л В в
Д = Д С Е =9.
IDE F
(24)
И
Если, линия центральная, то векторы р и q не коллине-
арны и условие компланарности (24) равносильно суще-
ствованию разложения (23), т. е. существованию решения
системы (22). Мы получили
Предложение 8. Центральная линия имеет осо-
бую точку тогда и только тогда, когда Д = 0.
Итак, сочетание условий 6=# 0 и Л —0 характеризует
пары пересекающихся прямых и пары мнимых пересекаю-
щихся прямых.
Рассмотрим нецентральные линии. Для них равенство
Д = 0 выполнено всегда, когда существует центр симмет-
рии, хотя бы и не являющийся особой точкой. Действи-
тельно, в силу 6 = 0 прямые (13) параллельны. Если
система (13) имеет решение, то прямые совпадают. В этом
случае их коэффициенты и свободные члены пропорцио-
нальны и, следовательно, векторы р и q коллинеарны,
откуда Д = 0.
Обратно, пусть для нецентральной линии Д = 0, т. е.
векторы р, q и г компланарны. Это может быть в двух
случаях. 1) Векторы р и q не коллинеарны, и г раскла-
дывается по ним. Тогда, как и в случае центральных
линий, существует особая точка. 2) Векторы р и q кол-
линеарны. Это означает, что существует центр симметрии,
не обязательно являющийся особой точкой, и даже целая
прямая, каждая точка которой— центр симметрии. Мы
доказали
Предложение 9. Для нецентральных линий усло-
вие Д = 0 равносильно существованию центра симметрии.
Итак, сочетание условий 6 = 0 и Д = 0 характеризует
пары параллельных и пары совпавших прямых. Оно вы-
полнено также и для уравнения пары мнимых параллель-
ных прямых.
Из предложений 8 и 9 следует, что равенство Д = 0
является инвариантным, т. е. не может измениться при
переходе к другой системе координат.
§ 4. Поверхности второго порядка
Подобно тому как в § 2 были описаны все наиболее
интересные линии второго порядка, в настоящем парагра-
фе мы опишем важнейшие поверхности второго порядка,
а полную классификацию таких поверхностей отложим
до гл. IX. Составить себе общее представление о боль-
шинстве поверхностей второго порядка можно, рассмат-
100
про-
\ \м
Рис 45
ривая поверхности вращения линий второго порядка во-
круг их осей симметрии.
1. Поверхности вращения. Поверхность 8 называется
поверхностью вращения с осью d, если она составлена из
окружностей, которые имеют центры на прямой d и ле-
жат в плоскостях, перпендикулярных этой прямой. В ос-
нове этого определения лежит следующее представление
Рассмотрим линию L, которая лежит в плоскости Р,
ходящей через ось вращения d
(рис. 45), и будем вращать ее
вокруг этой оси Каждая точка
линии опишет окружность, а
вся линия—поверхность враще
ния.
Выберем начало декартовой
прямоугольной системы коорди
нат О, ех, еа, е, на оси враще-
ния d, вектор е8 направим вдоль
d, а вектор ei поместим в плос-
кости Р. Таким образом, точка
О и векторы ef и е3 образуют
на плоскости Р декартову сис-
тему координат. Допустим, что
линия L, вращением которой получена поверхность, имеет
в этой системе координат уравнение <p(x, z) = 0.
Рассмотрим точку М (х, у, г) Через нее проходит ок-
ружность, которая имеет центр на оси d и лежит в пло-
скости, перпендикулярной этой оси Радиус окружности
равен расстоянию от М до оси, т е. 1/Гх2 + уг. Точкам
лежит на поверхности вращения тогда и только тогда,
когда на указанной окружности имеется точка Л4П при-
надлежащая вращаемой линии L
Точка (xlt ylt zt) лежит в плоскости Р, и потому
t/j = 0 Кроме того, ?! = г и | xt | = Их2 + У*, так как Л41
лежит на окружности, проходящей через М Коорди-
наты точки Mj удовлетворяют уравнению линии L:
ф(Хц z1) = 0. Подставляя в это уравнение хг и zlt мы
получаем следующее условие на координаты точки М,
необходимое и достаточное для того чтобы М лежала на
поверхности вращения S: равенство
Ч>(± Кхг + у\ г) = 0
(О
должно быть выполнено хотя бы при одном из двух зна-
ков перед корнем. Это условие, которое может быть
IW
записано в эквивалентном вида
г)ф(—И**+^, г)“0, (2)
и является уравнением поверхности вращения линии L
вокруг осн а.
2. Эллипсоид. Рассмотрим поверхности, которые полу-
чаются при вращении
»)
Рис. 46. а), 6) Сжатый и
вытянутый эллипсоиды вра-
щения; в) эллипсоид
эллипса вокруг его осей симмет-
рии. Направив вектор е, сна-
чала вдоль малой оси эллип-
са, а затем вдоль большой
оси, мы получим уравнение
эллипса в следующих видах!
д2 , г2 , г2 , х2 .
(Здесь через с обозначена ма-
лая полуось эллипса.) В си-
лу .формулы (1) уравнения
соответствующих поверхнос-
тей вращения’будут
**+»’ 1 г*
о» с2
(3)
и
!г* ^Ч-у2
е2
о2
0)
назы-
Поверхности (3) и (4;
ваются сжатым и вытянутым
эллипсоидами вращения. Они
изображены на рис. 46 а, б.
Каждую точку М (*, у, г)
на эллипсоиде вращения (3)
сдвинем к плоскости У (ко-
ординатной плоскости, прохо-
дящей через ej и е,) так, чтобы расстояние от точки до
этой плоскости уменьшилось в постоянном для всех то-
чек отношении л < 1. После сдвига точка М совпадаете
точкой М', координаты которой определяются равенст-
вами х' = х, у' = Ьу, г' = г. Таким образом, все точки
эллипсоида вращения (3) переходят в точки поверхности
с уравнением
e« Т 6» Т (Я ~
(5)
102
где 6=Ха. Поверхность, которая в некоторой декартовой
прямоугольной системе' координат имеет уравнение (5),
назовем эллипсоидом (см. рис. 46 в). Если случайно ока-
жется Ь=с, мы получим снова эллипсоид вращения, но
уже вытянутый.
Эллипсоид, так же как и эллипсоид вращения, из ко-
торого он получен, представляет собой
ниченную поверхность. Из уравнения
(5) видно, что начало координат—
центр симметрии для эллипсоида, а ко-
ординатные плоскости—его плоскости
симметрии.
Эллипсоид получается нз эллипсоида
вращения сжатием так же, как эллипс
получается сжатием окружности. Сжа-
тием сферы х*+у* 4* г* = а* можно по»
лучить эллипсоид вращения (3). Для
того чтобы из сферы получить вытянутый
эллипсоид, нужно сделать аналогичное
преобразование, но с Х> 1—растяже-
ние.
В этом параграфе нам часто придет-
ся прибегать к сжатию, и мы не будем
каждый раз описывать его подробно.
3. Конус второго порядка. Рассмотрим на плоскости
Р пару пересекающихся прямых, задаваемую в системе
координат О, е1, е, уравнением а*х*—c*z* = 0. Поверх-
ность (рис. 47), получаемая вращением этой линии во-
круг оси аппликат, имеет уравнение
в* (** + //*)—с*г* = О
(6)
и носит название прямого кругового конуса. Сжатие к
плоскости Y переводит прямой круговой конус в поверх-
ность с уравнением
а*х* + &у'—свг’ = 0. (7)
Поверхность, которая в некоторой декартовой прямоу-
гольной системе координат имеет уравнение (7), называ-
ется' конусом или, подробнее, конусом второго порядка.
Конус состоит из прямых линий, проходящих через на-
чало координат. Сечения конуса плоскостями с уравне-
ниями z = а для различных а представляют собой эллипсы
а*х*+&у*=с*а*.
юз
4. Однополостный гиперболоид. Однопалатный гипер-
болоид вращения—это поверхность вращения гиперболы
вокруг той ее оси, которая ее не пересекает. По формуле
(1) мы получаем уравнение однополостного гиперболоида
вращения
а* с*
(8)
•В результате сжатия этой поверхности мы получаем по-
верхность с уравнением
ж* г»,
йг+Тд—-?-1*
(9)
Поверхность, которая в
угольной системе
Рис. 48
вую часть уравнения (9)
на миожителиг
координат имеет
некоторой декартовой прямо-
равнение (9), назы-
вается обнополостным гипер-
болоидом (рис. 48).
Интересное Свойство од-
нополостного гиперболоида—
наличие у него прямолиней-
ных образующих. Так назы-
ваются прямые линии, все-
ми своими точками лежащие
на поверхности. Через маже
дую точку однополостного ги-
перболоида проходят две
прямолинейные образующие,
уравнения которых можно
получить следующим образом.
Перенесем член у'/Ь* в пра-
и разложим обе части равенства
(^Ш-тМ'Н) ('-!).
Рассмотрим теперь прямую линию с уравнениями
(10)
где Л и р—некоторые числа. Координаты каждой точки
прямей' удовлетворяют обоим урйвненйям, а следователь-
104
но, и их произведению — уравнению (9). Поэтому все
точки прямых линий с уравнениями вида (10) при все-
возможных Л и р лежат на однополостном гиперболоиде
Такое же рассуждение можно провести и для семейства
прямых
V(W)-и'(>-*)• (1|)
НЫНФ+Я-
Подставляя координаты точки, лежащей на однополост-
ном гиперболоиде, в одно из уравнений (10) и в одно из
уравнений (11), мы найдем значения параметров X, р и
л', р', которые соответствуют прямолинейным образую-
щим, проходящим через эту точку. Естественно, что
каждая пара параметров определена с точностью до об-
щего множителя.
Если вместе с гиперболой мы будем вращать и ее
асимптоты, то они опишут прямой круговой конус, назы-
ваемый асимптотическим конусом гиперболоида враще-
ния. При сжатии гиперболоида вращения в общий одно-
полостный гиперболоид прямой круговой конус сжимает-
ся в некоторый конус, который называется асимптоти-
ческим конусом однополостного гиперболоида.
5. Двуполостный гиперболоид. Двуполостный гипер-
болоид вращения—это поверхность вращения гиперболы
с1 а»”-1
вокруг той ее оси, которая ее пересекает По формуле
(1) Мы получаем уравнение-двуполостного гиперболоида
вращения
га
а*
В результате сжатия этой поверхности получается по-
верхность с уравнением
г* х* £
с3 ~ а* Р""
Поверхность, которая в некоторой декартовой прямо-
угольной системе координат имеет уравнение вида (13),
называется двуполостным гиперболоидом (рис. 49). Двум
ветвям гиперболы соответствуют здесь две не связанные
между собой части («полости») поверхности, в то время
105
как при построении однополостного гиперболоида враще-
ния каждая ветвь гиперболы описывает всю поверхность.
Асимптотический конус для двуполостного гипербо-
лоида определяется так же, как и для однополостного.
6. Эллиптический параболоид. При вращении пара-
болы хг = 2рг вокруг ее оси симметрии мы получаем по-
верхность с уравнением i
х*Ч-у*»=2рх, (14)
называемую параболоидом вращения. Сжатие к плоскости
у=0 переводит параболоид вращения в поверхность
с уравнением
(!5)
Поверхность, которая имеет такое уравнение в некото-
рой декартовой прямоугольной системе координат, Назы-
вается эллиптическим параболоидом (рис. 50). Внешний
вид эллиптического параболоида ясен из способа его по-
строения. Отметим, что сечения этой поверхности пло-
скостями г—а. при а>0 представляют собой эллипсы
х1 и* ,
г~а'
а сечения плоскостями, параллельными другим коордй-.
натиым плоскостям, например' плоскостями у=а, -—па*
раболы
ite
7. Гиперболический параболоид. По аналогии а урав-
нением (15) мы можем написать уравнение
-г—^г"-2а. (16)
Поверхность, которая имеет в некоторой декартовой
прямоугольной системе координат- уравнение вида (16),
назовем гиперболическим параболоидом. Исследуем внеш-
ний вид этой поверхности. Для этого-рассмотрим сечение
гиперболического параболоида плоскостью ж=а при
произвольном а. В этой плоскости выберем декартову
прямоугольную систему'координат О', е„ е, с началом
в точке О' (а, 0, 0). Относительно этой системы линия
пересечения имеет уравнение
-&-2 («-4) <17>
Эта линия—парабола, в чем легко убедиться, перенеся
начало координат в точку О' с координатами (0, а*/2о‘)
(координаты относительно исходной системы координат
О, ей е„ е, в пространстве равны (а, 0, а’/2а’)). Точка
О", очевидно, является вершиной параболы, ось парабо-
лы параллельна вектору е,, а Знак минус в левой части
равенства (17) означает, что ветви параболы направлены
в сторону, противоположную направлению вектора е,.
Заметим, что после переноса начала координат в точку
О* величина а не входит в уравнение параболы,, и, сле-
довательно, все сечения гиперболического параболоида
плоскостями х = а представляют собой равные параболы.
Будем теперь менять величину а и проследим за
смещением вершины О’ 'параболы в зависимости от а.
Из приведенных выше координат точки О’ в системе О,
еп ез> е» следует, что эта точка смещается по линии с
уравнениями
г = '2Н»’
.в системе координат О, е,, е,, е,. Эта линия—парабола
в плоскости у==0. Вершина параболы находится в на-
чале координат, ось симметрии совпадает с осью аппли-
кат, а ветви параболы направлены в ту же сторону, что
и вектор е,.
Теперь мы можем построить гиперболический пара-
болоид следующим образом: зададим две параболы и
будем перемещать одну из них так, чтобы ее вершина
107
скользила по другой, оси обеих парабол были параллель-
ны, параболы лежали во взаимно перпендикулярных
плоскостях и ветви их были направлены в противополож-
ные стороны. При таком перемещении подвижная пара-
бола описывает гиперболический параболоид (рис. 51).
Рис. 51, ЛОВ—неподвижная парабола, KLM, NOP и QRS—разные
положения подвижной параболы.
Сечение гиперболического параболоида плоскостью
г = а представляет собой гиперболу, которая в этой пло-
скости имеет уравнение
ж* у1 п
a* 2a’
в системе координат О*, е^, е, с началом в точке
О* (0, 0, а). Для больших положительных а полуоси
гиперболы 2а а и К 2а b велики и уменьшаются с умень-
шением а. При этом та ось гиперболы, которая ее пере-
секает, параллельна вектору е< (рис. 52). При а = 0 ги-
пербола вырождается в пару пересекающихся прямых.
Если а < 0, то ось гиперболы, которая ее пересекает,
параллельна вектору е2. Полуоси растут с увеличением
ia|. Отношение полуосей для всех гипербол при одном
знаке а одно и то же. Поэтому, если мы нарисуем все
сечения гиперболического параболоида на одной и той же
плоскости, тр получим семейство всех гипербол, имею-
щих в качестве .асимптот пару пересекающихся прямых с
уравнением ^=0 (рис. 53).
108
Рис. 52.
Рие, 53, Проекция сечений гиперболического параболоида. Тонкие
линии соответствуют а < 0, толстые—а > О,
Рис, 54.
109
Гиперболический параболоид, как и одиополостныи
гиперболоид, имеет два семейства прямолинейных обра-
зующих (рис. 54), уравнения которых следующее!
') ‘(Н)-*
Выводятся эти уравнения так же, как и уравнения
прямолинейных образующих однополостного гиперболоида
ГЛАВА IV
ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ
§ 1. Отображения и преобразования
1. Определение. Под отображением f плоскости Р в
плоскость R понимают закон или правило, по которому
каждой точке плоскости Р сопоставлена некоторая опре-
деленная точка на плоскости R. Мы будем пользоваться
обозначением f: P—>R. Если потребуется указать, что
точке А на плоскости Р соответствует точка В на пло-
скости /?, мы будем писать В = ЦА). Точки плоскости
Р называются прообразами, а соответствующие им точки
плоскости R—их образами.
Из курса средней школы известны отображения пло-
скости на нее же. Такие отображения, для которых пло-
скости Р н R совпадают, мы будем называть преобразо-
ваниями. В этом параграфе мы приведем для отображе-
ний основные факты, известные читателю для преобра-
зований.
Подчеркнем, что ни для отображений, ни для преоб-
разований мы не предполагаем, что каждая точка пло-
скости R является образом некоторой точки. Вполне мо-
жет оказаться, что множество всех образов не совпадает
с R.
2. Примеры. 1) Рассмотрим две плоскости Р и 'R и
сопоставим каждой точке плоскости Р основание перпен-
дикуляра, опущенного из этой точки на плоскость R.
Так будет определено отображение, называемое ортого-
нальным проектированием. При ортогональном проекти-
ровании, вообще говоря, каждая точка плоскости R имеет
единственный прообраз. В одном случае ортогональное
проектирование резко меняет свои свойства. Именно,
если плоскости взаимно перпендикулярны, то не каждая
точка плоскости R имеет прообраз, а только точки, ле-
жащие на линии пересечения плоскостей. Зато каждая
из этих точек имеет бесконечно много прообразов—они
заполняют перпендикуляр к R, восставленный из этой точки.
111
2) Примерами преобразований мдгут служить извест-
ные читателю параллельный перенос, поворот, осевая
симметрия, гомотетия.
3) Рассмотрим прямую р на плоскости Р и зададим
число X > 0. Из произвольной точки М, не лежащей на р,
опустим перпендикуляр на эту прямую и обозначим его
основание через N. Точку f (М) определим соотношением
Nf = Если JU лежит на р, то положим f (М) = Л1
ууг, (рис. 55). Так построенное преоб-
разование f называется сжатием
к прямой р в отношении А (Если
уточнено, что Х> 1, определенное
здесь преобразование можно на-
----р зывать растяжением )
Мы уже пользовались сжатием
г к прямой в § 1 гл. III, когда изу-
М2 чали форму эллипса. Аналогичное
Рис. 55. преобразование пространства —
сжатие к плоскости—мы применя-
ли при определении поверхности второго порядка в § 4
гл. III.
4) Выберем на каждой из плоскостей Р и R декартову
прямоугольную систему координат и сопоставим точке
с координатами х и у на плоскости Р точку с коорди-
натами х* = х2—у*, у* — 2ху на плоскости R. Нетрудно
убедиться, решая эти уравнения относительно х и у, что
каждая точка плоскости R имеет два прообраза, за
исключением начала координат, которое имеет один про-
образ.
5) Зададим точку О и сопоставим каждой точке М,
отличной от О, точку f (А4), которая определяется равен-
ством
Of rf) = arot^°M I ом,
| ОМ I
Положим f (О) = О. При этом каждой точке плоскости
сопоставляется единственная точка внутри круга радиуса
п/2 с центром в точке О. Каждая точка, лежащая внутри
этого Kpyi’a, имеет единственный прообраз, а точки, не
лежащие внутри круга, не имеют прообразов.
6) Можно сопоставить каждой точке плоскости осно-
вание перпендикуляра, опущенного из этой точки на
фиксированную прямую р, а каждой точке на прямой —
112
саму эту точку. При этом всем точкам каждой прямой,
перпендикулярной к р, сопоставляется одна и та же точка
7) Можно сопоставить каждой точке на плоскости Р
одну и ту же точку на плоскости R.
3. Произведение отображений. Обратное отображение.
Из курса средней школы известно понятие композиции
преобразований. Мы будем называть ее произведением и
определим также и для отображений
Определение Пусть даны отображения f: P—+R
и g: R—*S. Отображение h, сопоставляющее точке А на
плоскости Р точку д (f (Л)) на плоскости S, называют
произведением отображения f на отображение д и обозна-
чают gof Отображение, которое производится первым,
пишется справа
Подчеркнем, что для того, чтобы можно было соста-
вить произведение отображений, нужно, чтобы плоскость,
в которую отображает первое отображение, совпадала
с плоскостью, которая отображается при втором отобра-
жении
Разумеется, произведение отображений, так же как
и произведение преобразований, зависит от порядка со-
множителей, т. е. gof, вообще говоря, не совпадает с fog
Стоит отметить, что для отображений оба произведения
одновременно определены только тогда, когда f: Р—> R
ид: R—>P
Предоставим читателю самостоятельно убедиться, что
умножение отображений обладает свойством ассоциатив-
ности, т. е. если произведение (fog)oh определено, то
произведение fo(goh) также определено и равно ему
Если мы обозначим через ер и ед тождественные пре-
образования плоскостей Р и R, то для любого отобра
жения f: Р —♦ R будем иметь foep=f и e/?of = f. Когда
f—преобразование плоскости, эти равенства сводятся
к eof = foe = f
По определению отображения f: Р—*R каждая точка
плоскости Р имеет только один образ. Примеры 4) и 6)
показывают, что одна точка на плоскости R может иметь
много прообразов, а в примерах 5), 6) и 7) не каждая
точка плоскости R служит образом какой-нибудь точки
Определение. Отображение f: Р—+ R называется
взаимно однозначным отображением плоскости Р на пло-
скость R, если каждая точка плоскости R имеет прооб-
раз и притом только один.
Отображения, рассмотренные в примерах 2), 3), вза-
имно однозначны, а в примерах 4)—7)—нет.
113
Пусть дано отображение f: P—+R. Точке А на пло-
скости Р оно сопоставляет ее образ f (А) на плоскости R.
Теперь, наоборот, образу f (Л) любой точки А мы сопо-
ставим саму эту точку. Очевидно, что такое соответствие
удовлетворяет нашему определению отображения в том
и только в том случае, когда каждая точка плоскости R
является образом некоторой точки и при этом одной
единственной. Это означает, что отображение f должно
быть взаимно однозначным.
Определение. Обратным отображением для вза-
имно однозначного отображения f: P—+R мы назовем
отображение f-1, /? —♦ Р такое, что (-1(((Л)) = Л для каж-
дой точки А на плоскости Р.
Легко видеть, что определение обратного отображения
равносильно соотношению f~1of = ep, где ер—тождест-
венное преобразование плоскости Р.
Совпадающие точки должны иметь совпадающие об-
разы, поэтому (Л))) = 1 (Л) или f(f-l(B)) = B для
любой точки В на плоскости R. Это, в частности, озна-
чает. что обратным для отображения f-1 будет отобра-
жение f. Условие f(f-1(B)) = B равносильно равенству
fof-1 = e^, где —тождественное преобразование пло-
скости R.
Если f—взаимно однозначное преобразование пло-
скости, то
f-1of = fof-1 =е.
4. Координатная запись отображений. Пусть нам за-
дано некоторое отображение плоскостей f: Р —» R По
определению это означает, что задан закон, по которому
каждой точке М на плоскости Р сопоставлен ее образ
f(A4) на плоскости R. Если мы выберем на плоскости Р
систему координат О, еь е2, а на плоскости R систему
координат Q, рп р2, то точка М будет определена парой
чисел х, у, а точка М* — числами х*, у*. Следовательно,
отображение сопоставляет каждой паре чисел х, у неко-
торые числа х* и у*. Таким образом, задать отображение
при выбранных системах координат—все равно что за-
дать две функции, каждая из которых зависит от двух
независимых переменных:
х* = Ф(х, у), у* = ф(х, у). (О
Координатной записью отображения мы пользовались
в примере 4) этого параграфа.
114
Подчеркнем, что системы координат на плоскостях
Р и /?, вообще говоря, не связаны между собой: точка Q
не 'Должна совпадать с Образом точки О, а векторы рх и
р,—с образами векторов ех и et.
При координатной записи преобразования, естественно,
достаточно выбрать одну систему координат, так как и
образ и прообраз находятся в одной плоскости.
Если функции ф и ф определены для любых пар чисел,
то формулы (1) при заданных системах координат на
плоскостях Р и R определяют отображение f: Р —> R.
Отсюда, в частности, следует, что изучение произволь-
ных отображений—задача столь же необозримая, как и
изучение произвольных функций или произвольных линий.
Здесь мы займемся очень узким, простым, но важным
классом отображений. Среди остальных отображений они
выделяются так же, как прямые линии среди произволь-
ных линий на плоскости.
§ 2. Линейные отображения
1. Определение линейных отображений. Рассмотрим две
плоскости Р и R н дадим следующее
Определение. Отображение f: P-'-R называется
линейным, если существуют такие декартовы системы
координат на плоскостях Р и R, в которых f может быть
задано формулами
у* = а^х+b,y + cv | ’
Взаимно однозначное линейное отображение называется
аффинным отображением.
Подчеркнем, что в определении линейного отображе-
нии вовсе не требуется, чтобы коэффициенты а* и bt или
at и bt не обращались в нуль одновременно. Правые
части формул (1)—многочлены степени не выше 1. Для
аффинных отображений они линейные, и, более того,
справедливо следующее
Предложение 1. Для того чтобы линейное ото-
бражение, задаваемое формулами (1), было взаимно одно-
значным, необходимо и достаточно, чтобы
<2>
Таким образом, аффинное отображение определяется фор-
мулами (1) при условии (2).
115
Доказательство. Наше утверждение вытекает,
по существу, из предложения 10 § 2 гл. II. Нам нужно
узнать, при каком условии каждая точка М* (х*, у*) имеет
единственный прообраз М (х, у). Координаты прообраза
находятся решением системы (1), а оиа имеет единствен-
ное решение при любых свободных членах х*—ct и у*—сг
тогда и только тогда, когда выполнено условие (2).
Приведем примеры аффинных и линейных отображе-
ний и преобразований.
1) Ортогональное проектирование (пример 1 § 1) яв-
ляется линейным отображением. Для доказательства вы-
берем на плоскостях Р и R декартовы прямоугольные
системы координат так, чтобы линия пересечения этих
плоскостей была их общей осью абсцисс. Тогда при орто-
гональном проектировании f: P—+R точки М и 1(М)
имеют одну и ту же абсциссу, а отношение их ординат
равно косинусу угла между плоскостями. Итак,
х* = х, у* —у cos ф.
Отображение аффинное тогда и только тогда, когда пло-
скости не перпендикулярны, т. е. созф=/=0.
2) Гомотетия проще всего записывается в декартовой
системе координат с началом в центре гомотетии О. По-
скольку вектор ОМ при гомотетии переходит в вектор
СИ(М)==ХОЛ1, то точка М с координатами х, у перехо-
дит в точку 1(М) с координатами Хх, ку. Итак, гомоте-
тия определяется равенствами
х* — кх, у*— ку.
3) Сжатие к прямой (пример 3) § 1) мы запишем,
приняв прямую, к которой производится сжатие, за ось
абсцисс декартовой прямоугольной системы координат.
Легко видеть, что в такой системе
X* — X, у* — ку,
где к—коэффициент сжатия.
4) Проектирование на прямую (пример 6) § 1) мы за-
пишем, приняв эту прямую за ось абсцисс декартовой
прямоугольной системы координат. В этой системе коор-
динат проектирование на прямую записывается формулами
х* = х, у* = 0.
Это—линейное, ио не аффинное преобразование.
116
5) Отображение, сопоставляющее каждой точке пло-
скости Р одну и ту же точку С плоскости R, записы-
вается формулами x* — clt у* — с2, где сп сг—координаты
точки С. Это также линейное, но не аффинное отображение
Определение линейного отображения обладает тем же
недостатком, что и определение алгебраической линии-
оно зависит от систем координат, и мы не знаем, будет
ли линейное отображение задаваться формулами вида (1)
в другой паре систем координат. Этот недостаток устра-
няется следующим предложением.
Предложение 2. Каковы бы ни были декартовы
системы координат на плоскостях Р и R, линейное ото-
бражение f: Р—► R задается формулами вида (1).
Доказательство. Пусть отображение f задано
равенствами (1) в системах координат О, е,, е2 и Q, рп р2
на плоскостях Р и R соответственно Перейдем к новым
системам координат О', е', е,' и Q', pi, pi. Пусть на пло-
скости Р старые координаты точки выражаются через
новые по формулам
г/ = а2х'+|32г/' + у2, |
а на плоскости R новые координаты выражаются через
старые по формулам
х*' = М*4-1М/*4- vlt
z/*^X2x* + p2z/* + v2. I
Нам нужно найти выражение новых координат х*', у*'
точки М* через новые координаты х', у' точки М. С этой
целью мы подставим в равенства (4) выражения (1) коор-
динат образа М* через координаты прообраза М. Мы
получим новые координаты М*, выраженные через старые
координаты Mi
X*' = Ki(aix + b1y+cl) + ц, (д2 г 4- b2tj 4- с2) 4- vt,
у*' = X, (а,х 4- Ь,у 4- ct) 4- ц2 (агх 4- bty 4- с2) 4- v2.
Для нас важно, что правые части этих равенств—мно-
гочлены степени не выше 1 относительно х и у, т. е.
имеют вид
х*' = 41х4-в1г/4-С1,
У*'— А2х-\-Bty|
Подставив в (5) выражения для х и у по формулам (3),
мы найдем зависимость новых координат образа от новых
117
координат прообраза, т. е. искомую зависимость
х*' = Лi fax' + РУ + у,) + В, fax'+РУ + у,) + Q,
у*' = Atfax' +РУ + Yi)+В,(аУ +РУ +у,)+С,
Мы видим, что правые части этих равенств—многочлены
степени не выше 1 относительно х* и /, т. е.
х*'=а,х' +Ъ\у' 4-q,]
!/•'=аУ 4-&У+<?;.
Это и требовалось доказать.
Заметим, что аффинные отображения выделяются из
линейных условием взаимной однозначности, которое не
зависит от выбора систем координат. Поэтому определе-
ние аффинного отображения в дополнительном обоснова-
нии не нуждается.
2, Произведение линейных отображений. Доказатель-
ство предложения 2 было основано на том, что резуль-
тат подстановки многочленов степени не выше 1 в мно-
гочлен степени не выше 1 будет снова таким же много-
членом. Это же обстоятельство лежит в основе следую-
щего предложения.
Предложение 3. Если произведение линейных ото-
бражений определено, то оно является линейным ото-
бражением.
Доказательство. Пусть заданы линейные отобра-
жения f: P-—R н gs /?—*3 и на плоскостях Р, R н S
выбраны декартовы системы координат. Тогда координа-
ты точки f(M) выражаются через координаты точки М
формулами
x* = qx4-M4- q, j
7 y* = atx + b3y+ct, J ' '
а координаты точки g(f(M)) через координаты точки
f (М)—формулами
U** = d,f + etf + fv I ' '
Подстановка (6) в (7) дает выражение координат g(f (М))
через координаты М'.
- dt fax + М+q) + q fax + bjj 4- q)4- ft,
if* = dt fax 4- bty + q) -J- q fax + bjj 4- cj 4- fv
Мы видим, что правые части—многочлены степени не
выше 1. Это доказывает наше утверждение.
118
Предложение 4. Произведение аффинных ото-
бражений является аффинным отображением
В силу предложения 3 нам достаточно доказать, что
произведение взаимно однозначных отображений также
взаимно однозначно. Это довольно очевидно: при отобра-
жении: д: /?—+S каждая точка А плоскости S имеет
единственный прообраз В на плоскости R, а он, в свою
очередь, имеет единственный прообраз С на плоскости Р
при отображении f: P—>R. Эта точка С и будет един-
ственным прообразом точки А при отображении gof
Предложение доказано.
Как и всякое взаимно однозначное отображение, любое
аффинное отображение имеет обратное.
Предложение 5. Отображение, обратное аффин-
ному отображению, также является аффинным.
Для доказательства нам надо решить уравнения (1)
относительно х и у. Умножим первое уравнение на Ьг,
второе—на —bt и сложим их. Мы получим
(аЛ—аД)х=&, (х*—с^—bx (tf—ct).
Из условия (2) следует, что х—линейный многочлен от
х* и у*. Аналогично получаем выражение для у.
3. Образ вектора при линейном отображении. Рассмот-
рим на плоскости Р вектор MtMt Обозначим координаты
точек Mi и Mt в системе координат О, elt е, через (xit ух)
и (xt, yt). Тогда вектор МгЛ^ имеет компоненты (х,—Xj,
yt—yt). Пусть формулы (1) задают линейное отображение
f Р—*R в системах координат О, ео е, и Q, ро р,.
Тогда образы и М,' точек Mt и Mt имеют абсциссы
xi^aiXt + btyt-i-Ct и x;=*atxt 4-М»+ ct.
Следовательно, первая компонента вектора равна
х‘г —х; ₽ Oi (х,—xf) 4- bi (yt—yj.
Аналогично находим вторую компоненту М[МJi
У^~У'=at (х,—xx) 4- bt (yt—yt).
Обратим внимание на следующее обстоятельство: ком-
поненты выражаются только через компоненты
MiMv а не через координаты точек Mt и Mt по отдель-
ности. Рассмотрим Два равных вектора на плоскости Р.
119
Их компоненты одинаковы, и, следовательно, они при
линейном отображении перейдут в векторы, компоненты
которых также одинаковы.
Предложение 6. При линейном отображении рав-
ные векторы переходят в равные векторы. При втом ком-
поненты образа (а,*, а^) в базисе Pj, р, выражаются через
компоненты прообраза (at, а,) в базисе е1( е, формулами
а; = ах“1+61«.. |
4-J ’
Из этих формул вытекает, что для линейного отобра-
жения f при любых векторах а и b и любом числе а
f(a + b) = f(a) + f(b), 1
f(ka) = lf(a). J (У)
Докажем, например, первое из равенств (9). Пусть
?Г и —компоненты вектора f(a-f-b). Тогда
?Г=я» + Pi) + (а, 4- 0,),
=а,(а14-01) + Ь1(а1+01),
где Of, а, и 0f, ₽,—компоненты векторов а н Ь. Отсюда
у,* = сцсЦ 4- fyct, 4- ^0,4- &Д=«Г 4- 0Г»
у,* = atOi 4- btat 4- а Д 4- ЬД = а»’ + 01-
Следующее предложение устанавливает геометрический
смысл коэффициентов в формулах (1).
Предложенное 7. Пусть отображение f: P—+R
записано в системах координат О, о» е, и Qt, р^ р, на
плоскостях Р и R формулами (1}. Тогда (cit с^—коор-
динаты точки f (О) в системе координат Q, р„ р, a (alt в,)
и (Ь{, bj—компоненты f (е,) и f (ej в базисе р,, р,.
Подставим в (1) значения х=0 и У-= 0, т. е. коорди-
наты точки О. Мы-видим, что координаты f(O) равны
с, и с*
Положим а, и а, в (8) равными компонентам en т. е.
«хвЬ а,==0. Тогда a*’=a1,ai = at Следоватёльно, f(e,)
имеет компоненты alt at. Аналогично доказывается, что
компоненты f (es) равны bt и bt.
Предложение >8. Каковы бы ни были три тачки
L, М и N, не лежтцие на одй/ой прямой на плоскости Р,
и три точки L*', М* и N* на плоскости Q, существует
единственное линейное отображение I такое, что £***
М‘вЦ'М) и Это отображение будет
120
аффинным тогда и только тогда, когда L*, М* и N* не
лежат на одной прямой.
Доказательство. Векторы LM и LN не колли-
неарны. Следовательно, L, LM, LN—декартова система
координат на плоскости Р. На плоскости R выберем си-
стему координат произвольно, и пусть с,—координа-
ты L*, а аи а, и bit b2—компоненты векторов и
L*N* в этой стистеме координат. Формулы
x* = a1x + M+<’f,
y*=afx + bty + ct
определяют линейное отображение fi Р—♦/?, которое, как
легко видеть, обладает требуемым свойством L* = f(L),
M* = f(M), JV* = f(JV) Более того, согласно предложе-
нию 7 это свойство однозначно определяет коэффициенты
в формулах.
Условие (2), равносильное аффинности отображения,
необходимо и достаточно для того, чтобы L*M* и L*N* не
были коллинеарны, т. е. £*, М* и N* не лежали на одной
прямой.
Предложение 9. При аффинном отображении f
образ М* точки М в системе координат f (О), tfe),
f (et) имеет те же координаты, что и точка М в системе
координат О, et, et.
Иными словами, в системах координат О, еп е, и f (О),
l(et), f(et) аффинное отображение f записывается форму-
лами х* = х, у* —у. Это утверждение немедленно следует
из предложения 7.
Выберем на плоскостях Р и R какие-либо декартовы
^системы координат и сопоставим точке М на плоскости
Р точку М* на плоскости R с теми же координатами.
Это соответствие будет аффинным отображением, опре-
деляемым формулами х* — х, у* —у. Из предложения 9
вытекает, что любое аффинное отображение можно описать
таким* образом.
§ 3. Аффинные преобразования
1. Ортогональные преобразования. Изучение аффин-
ных преобразований мы начнем с пункта, посвященного
перемещениям плоскости. Здесь и далее мы будем назы-
вать их ортогональными преобразованиями. Докажем сна-
чала, что три основных вида ортогональных преобразо-
121
ваний—параллельный перенос, поворот и осевая симмет-
рия—являются аффинными преобразованиями.
а) Параллельный перенос на вектор с сопоставляет
точке М о координатами х, у в некоторой декартовой
системе координат точку М* с координатами y-f-c,,
где ct и ct—компоненты с. Следовательно,
у*=у+с,. 0)
б) Рассмотрим поворот плоскости вокруг точки О на
угол а. В полярной системе координат с полюсом в точ-
ке О образ М* точки М (г, <р) имеет координаты г и
Ф4>а. По формулам (3) § 2 гл. I мы можем перейти от
полярной системы координат к декартовой прямоугольной
системе координат с началом в точке О:
х* =» г cos (<р 4-a), p,=rsln(<p+a).
Отсюда» согласно формулам косинуса и синуса суммы
двух углов, мы имеем
x*=xcoscc—и sin a, )
> (2)
у*=х sin a 4-у cos a. J '
в) Чтобы получить координатную запись осевой сим-
метрии, выберем ось симметрии за ось абсцисс декар-
товой прямоугольной системы координат. Тогда точка
М(х, у) переходит в точку М* с координатами х, —у
Итак, при осевой симметрии
х*х=х, у* = — у. (3)
Формулы (1), (2) и (3) имеют в правых частях линей-
ные многочлены и, следовательно, задают линейные пре-
образования. Поскольку эти преобразования взаимно од-
нозначны, они аффинные.
Ортогональное преобразование определяется как пре-
образование плоскости, сохраняющее расстояние4 между
точками. Известно, что оно сохраняет также и углы
между прямыми.
Отсюда вытекает, что при ортогональном Преобразо-
вании декартова прямоугольная система координат О,
ер е, перейдет в декартову прямоугольную систему коор-
динат О*, ej, ej, а точка М с координатами х, у отно-
сительно О, ер е, перейдет в точку М* с теми же коор-
динатами х, у относительно системы координат О*, ej, ej.
Но связь координат одной и той же точки в разных сис-
темах координат нам известна (формулы (7) § 4 гл. I).
В применении к точке М* эти формулы дают выражение
122
ее координат х*, / в системе координат О, е^ е, через
ее координаты х, у в системе О*, е’,
х* = х cos <р =F у sin q> 4- cit
p*=xsinq> ± ^cosf + Cg.
(<)
Здесь (ct, ct)—координаты точки О*, a q>—угол между
векторами е, и ej, отсчитываемый в направлении от
в! к ej.
Вспомним, что х, у—координаты прообраза м. Это
означает, что на формулы (4) можно смотреть как на
координатную запись рассматриваемого ортогонального
преобразования в системе координат О, е^, е,. Итак,
доказано
Предложение 1, Произвольное ортогональное пре-
образование является аффинным и записывается в любой
декартовой прямоугольной системе координат формулами
вида (4).
Из этого предложения легко следует
Предложение 2. Любое ортогональное преобразо-
вание есть произведение поворота, параллельного переноса
и, возможно, осевой симметрии.
В самом деле, пусть некоторое ортогональное преоб-
разование записано в декартовой прямоугольной системе
координат формулами (4). При осевой симметрии отно-
сительно оси абсцисс этой системы координат точка
М(х,у) перейдет в точку П (и, о), где и = х, v = — y.
При повороте на угол <р вокруг начала координат точка
N перейдет в точку К (w, г), где
w = и cos —v sin <р = х cos <р + у sin <р,
г = и sin <р + V cos <р = х sin <р—у cos <р.
Наконец, после параллельного переноса на вектор с (с1( с,)
точка К (w, г) перейдет в точку APfw-l-q, г-|-с,), коор-
динаты которой выражаются через координаты х, у по
формулам (4) при нижних знаках у коэффициентов при у.
Формулы (4) при верхних знаках мы получим, если про-
пустим осевую симметрию.
.Мы видцм, что произвольной точке плоскости постро-
енное произведение преобразований сопоставляет тот же
образ, что и заданное ортогональное преобразование.
Предложение доказано.
Следует иметь в виду, что полученное разложение
ортогонального преобразования в произведение не одно-
значно. Более того, можно поворот или параллельный
123
перенос разложить в произведение осевых симметрий,
произведение параллельного переноса и поворота пред*
ставить как один поворот и т. д. Мы не будем уточнять,
как это сделать, а выясним следующее общее свойство
всех таких разложений.
Предложение 3. При любом разложении данного
ортогонального преобразования в произведение любого числа
поворотов, параллельных переносов и осевых симметрий
четность числа осевых симметрий, входящих в разложение,
одна и та же
Для доказательства рассмотрим на плоскости произ-
вольный базис и проследим за изменением его ориента-
ции (направления кратчайшего поворота от et к е2) при
ортогональном преобразовании. Следует заметить, что
поворот и параллельный перенос не меняют ориентацию
ни одного базиса, а осевая симметрия меняет ориентацию
любого базиса. Поэтому, если данное ортогональное пре-
образование меняет ориентацию базиса, то в любое его
разложение должно входить нечетное число осевых сим-
метрий, и тогда меняется ориентация и любого другого
базиса. Если же ориентация базиса не меняется, то число
осевых симметрий в разложении может быть только чет-
ным, и в этом случае ориентация любого базиса остается
прежней.
Определение. Ортогональные преобразования, ко-
торые могут быть разложены в произведение поворота
и параллельного переноса, называются ортогональными
преобразованиями первого рода-, остальные называются
ортогональными преобразованиями второго рода. Мы мо-
жем сформулировать
Предложение 4. Ортогональные преобразования
первого рода записываются формулами (4) при верхних
знаках у коэффициентов при у и не меняют ориентацию
ни одного базиса. Ортогональные преобразования второго
рода записываются формулами (4) при нижних знаках
и меняют ориентацию каждого базиса.
2. Образ прямой линии. Ниже в этом параграфе f
обозначает аффинное преобразование плоскости, записы-
ваемое в декартово^ системе координат О, еп е2 фор-
мулами
х* = а1х + Ь1у+-с1,
у* — а3х + Ьгу + ся
при условии
(5)
(6)
1М
Рассмотрим на плоскости прямую линию с уравнением
г = г0-|-а/ и найдем ее образ при аффинном преобразова-
нии f. Радиус-вектор образа М* произвольной точки М
прямой можно вычислить так:
г* = ОМ* = 0f(3) + f (О) Af* = с + f (г).
Здесь с—постоянный вектор Of (б), а г—радиус-вектор
точки М. Согласно свойству (9) § 2 аффинных преобразо-
ваний, мы получаем
r‘ = c + f(r0)4-f(a)t (7)
При аффинном преобразовании ненулевой вектор пере-
ходит в ненулевой. Действительно, иначе нашлись бы две
различные точки, которые переходят в одну, что невоз-
можно для взаимно однозначного преобразования. Поэто-
му f(a)=#O и уравнение (7) является уравнением пря-
мой линии. Итак, образы всех точек прямой г = гв4-а/
лежат на прямой (7).
Более того, преобразование f задает взаимно однознач-
ное соответствие между точками прямых линий. При
сделанном нами выборе начальных точек и направляющих
векторов образ точки М имеет на прямой (7) то же зна-
чение параметра t, что и точка М на исходной прямой.
Отсюда мы получаем следующее
Предложение 5. При аффинном преобразовании
прямая линия переходит в прямую линию,
отрезок переходит в отрезок,
параллельные прямые переходят в параллельные.
Для доказательства второго утверждения надо заме-
тить, что отрезок прямой состоит из точек, у которых
значения параметра удовлетворяют неравенству вида
<1 t t,. Третье утверждение следует из того, что
в силу формул (9) § 2 коллинеарные векторы переходят
в коллинеарные.
Предложение 6. При аффинном преобразовании
отношение длин параллельных отрезков не изменяется,
Доказательство. Пусть отрезки АВ и CD парал-
лельны. Это означает, что существует такое число 1, что
AS = XCD. Поэтому образы векторов АВ и CD связаны
той же зависимостью A*B*—KC*D*. Отсюда вытекает, что
|ЛВ| |Л«а»| ,,,
7соТ~ |е»£>«| '•
юь
Следствие. Если точка С делит отрезок АВ в не-
котором отношении К, то ее образ С* делит образ А*В*
отрезка АВ в том же отношении X.
3. Изменение площадей при аффинном преобразова-
нии. Для начала рассмотрим произвольный параллело-
грамм. Выберем общую декартову систему координат О,
ер е, и обозначим через (хр и (xt, yt) компоненты
векторов р и q, на которых наш параллелограмм построен
Площадь параллелограмма мы можем вычислить, поль-
зуясь свойствами векторного произведения
S = | [р, q] | = | [ха 4- у^„ ха 4- у,е,] | =
е,]|.
Пусть афинное преобразование f записывается в выб-
ранной системе координат формулами (б). Из предложе-
ния 7 § 2 следует, что f (е.)=па 4-atet и f (et)« &а + &А-
Согласно предложению 9 § 2 векторы f(p) и f(q) в ба-
зисе f (ец), f (е,) имеют те же компоненты (xit yt) н (х„ у,),
что и их прообразы р и q в базисе ef, е,. Образ парал-
лелограмма построен на векторах f (р) и f (q), и его
площадь
S‘ = |[f(р), f(q)]| = |x1yt—xAll[4ei). f(e,)]| =
= I xtyt—ха 11 [оа + a^v 4- & а] | =
= I Х1У» —xtyt 11 a^,—дД 11 [ef, e,] |.
Отсюда окончательно
$•/£ = | аД—a,6J. (8)
Эго выражение показывает, что отношение площади S*
образа к площади S прообраза одно и то же для всех
параллелограммов. Отсюда же видно, что величина
|аД—аД[ на самом деле не зависит от системы коор
динат, в которой записано преобразование, хотя в ее выра-
жение и входят коэффициенты, зависящие от системы
координат. Эта величина представляет собой инвариант
(см с. 42), выражающий геометрическое свойство пре-
образования.
Пусть ха—ха > 0, Тогда, как мы видели • п. 8 § 3 гл. I,
пары векторов р, q и е^, е, ориентированы одинаково и пары f(p),
f (q) и f (ej), f(ej) также ориентированы одинаково. Поэтому, если
при аффинном преобразовании ориентация базисных векторов ме-
няется, то меняется и ориентация любой пары р, q, имеющей ту ж!е
ориентацию Точно так же можно доказать, что меняется ориента-
ция и любой пары, ориентированной противоположно паре базисных
векторов,
126
Если же при аффинном преобразовании ориентация базиса не
меняется! то ие меняются ориентации и других упорядоченных пар
векторов.
Это свойство, разумеется, ве зависит от того, какая пара век-
торов выбрана в качестве базиса: или меняется ориентация каждой
пары векторов, или не меняется ни у одной. Мы уже доказали это
свойство для ортогональных преобразований.
Отметим теперь, что пара векторов f (ei), f (еа) ориентирована так
же, как е<, еа, в том и только в том случае, когда atbt—aj>t > 0.
Отсюда мы заключаем, что не только модуль детерминанта aibt—atbi,
но и его знак ие зависят от выбора системы координат. Можно
утверждать, таким образом, что величина atbt—atbt представляет
собой инвариант, связанный с аффинным преобразованием. Геометри-
ческий смысл его—отношение площади произвольного ориентирован-
ного параллелограмма к площади ориентированного параллелограмма,
который в вето переходит при рассматриваемом аффинном преоб-
' разованни.
Займемся теперь площадями других фигур. Каждый
треугольник может быть дополнен до параллелограмма,
площадь которого равна удвоенной площади треугольни-
ки. Поэтому отношение площади образа треугольника к
площади самого треугольника удовлетворяет равенству (8).
Каждый многоугольник может быть разбит на тре-
угольники. Следовательно, формула (8) справедлива и для
площадей произвольных многоугольников.
Мы не будем здесь касаться определения площади про-
извольных криволинейных фигур. Скажем лишь, что в тех
случаях, когда эта площадь определена, она равна пределу
площадей некоторой последовательности многоугольников,
вписанных в рассматриваемую фигуру. Из теории Преде-
лов известно следующее предложение: если последователь-
ность Sn стремится к пределу S, то последовательность
&Sn, где б—постоянное, стремится к пределу &S. На
Основании этого предложения мц заключаем, что форму-
ле (8) справедлива в самом общем случае.
В качестве примера найдем выражение площади эл-
липса через его полуоси. В § 2 гл. II мы доказали, Что
эллипс с полуосями а и b может быть получен сжатием
окружности радиуса а к прямой, проходящей через ее
центр. Коэффициент сжатия равен bja. Очевидно, что при
этом преобразовании квадрат со стороной 1, основание
которого Лежит на указанной прямой, перейдет в'пря-
моугольник со сторонами b/а и 1. Таким образом, отно-
шение площади образа квадрата к площади самого квад-
рата равно b/а. Мы видели, что при. аффинном преобра-
. эованин площади всех фигур меняются в одном и том
же отношении. Поэтому для площади эллипса мы имеем
127
S = (ла2) (b/a). Отсюда получаем, что
S = nab.
4. Образы линий второго порядка. Мы видели, что
прямая линия переходит в прямую. Это частный случай
следующего предложения.
Предложение 7. Аффинное преобразование пере-
водит алгебраическую линию в алгебраическую линию того
же порядка.
В самом деле, пусть линия L в декартовой системе
координат О, еп еа имеет алгебраическое уравнение по-
рядка р. Согласно предложению 9 § 2 образы всех точек
линии L при аффинном преобразовании f имеют в сис-
теме координат f (О), I (ej, f (еа) те же координаты, что
их прообразы в системе координат О, ер еа. Следователь-
но, координаты образов в системе f (О), f (ej, f (еа) свя-
заны тем же алгебраическим уравнением порядка р. Это
означает, что образ линии L в декартовой системе коор-
динат f (О), f (ej, I (еа) определяется алгебраическим урав-
нением порядка р. Мы получили, что образ линии L
является алгебраической линией того же порядка, что и
сама линия.
Из предложения 7, в частности, следует, что линия
второго порядка при аффинном преобразовании перейдет
в линию второго порядка. Мы докажем более сильное
утверждение. Именно, в теореме 1 § 1 гл. III линии вто-
рого порядка разделены на семь классов. Будет доказано,
что класс линии сохраняется при аффинных преобразова-
ниях. На этом основании классы линий второго поряд-
ка, перечисленные в указанной теореме, называют аффин-
ными классами. Точнее наше утверждение формулируется
так.
Предложение 8. ’Линия второго порядка, принад-
лежащая к одному из аффинных классов, при любом аф-
финном преобразовании может перейти только в линию
того же класса. Кроме того, каждую линию второго по-
рядка подходящим аффинным преобразованием можно
перевести в любую другую линию того же класса.
Доказательство. Линию мы назовем ограничен-
ной, если она лежит внутри некоторого параллелограмма.
Легко видеть, что при аффинном преобразовании ограни-
ченная линия должна перейти в ограниченную, а неогра-
ниченная — в неограниченную.
1) Эллипс — ограничение? линия второго порядка, а
кроме эллипсов ограничены только линии, состоящие из
128
одной-единствен ной’ точки,— паря мнимых пересекающих»
ся прямых. Поскольку эллипс ограничен и состоит боль-
ше чем из одной точки, он должен перейти в эллипс при
любом аффинном преобразовании.
2) Гипербола состоит из двух не связанных между
собой ветвей. Эго свойство можно сформулировать так,
что станет ясна его неизменность при аффинных преоб-
разованиях. Именно, существует прямая линия, не пере-
секающая гиперболу, но пересекающая некоторые ее
хорды (т. е. такая, что по обе ее стороны лежат точки
гиперболы).
Из всех линий второго порядка только гиперболы и
пары параллельных прямых состоят из двух не связан-
ных между собой ветвей. У гиперболы эти ветви — не
прямые линии, и поэтому она при аффинном преобразо-
вании может перейти только в гиперболу.
3) Парабола — неограниченная линия второго поряд-
ка, состоящая из одного непрямолинейного куска. Этим
свойством не обладают никакие другие линии второго по-
рядка, и потому парабола может перейти при аффинном
преобразовании только в параболу.
4) Если линия второго порядка представляет собой
точку (пару мнимых пересекающихся прямых), прямую
(пару совпавших прямых), пару пересекающихся или
пару параллельных прямых, то из доказанных ранее
свойств аффинных преобразований следует, что эта линия
не может перейти в линию никакого другого класса.
Докажем теперь, что каждую линию второго порядка
подходящим аффинным преобразованием можно перевести
в любую другую линию того же аффинного класса. Для
этого заметим следующее. В теореме 1 § 1 гл. Ш кано-
нические уравнение линий второго порядка написаны
в декартовой прямоугольной системе координат и содер-
жат параметры а, Ь,... Таким образом, по существу,
каждое из выписанных в теореме уравнений представляет
собой целое множество уравнений, соответствующих раз-
ным значениям параметров. Если кол откажемся от орто-
нормированностн базиса, мы сможем привести все это
множество к одному и тому же каноническому виду, уже
не содержащему параметров. Например, замена коорди-
нат *''»х/а, y^ylb переводит уравнение эллипса
х'[агв уравнение х'*4-у'* = 1, каковы бы ни
были а и Ь. (Последнее уравнение не есть уравнение ок-
ружности, так как система координат не декартова пря-
моугольная.) Читатель без труда покажет, что для каж-
5-102 129
дого уравнения второго порядка существует общая декар-
това ' система координат, при переходе к которой это
уравнение приводится к одному из видов]
2) х’+у1-—1, 3) х*—y*=l,
4) —t/* = 0, 5) + 6) р* = 2х,
7) р’—1 =0, 8) у*+1 =0, 9) р* = 0.
Такую систему координат мы назовем аффинной канони-
ческой системой.
Из предложения 9 § 2 следует, что аффинное преоб-
разование, которое совмещает аффинные канонические
системы координат двух линий одного класса, совмещает
и эти линии. Предложение, таким образом, полностью
доказано.
Предложение 9. Линии второго порядка одного
аффинного класса при равных значениях параметров в
канонических уравнениях могут быть совмещены подхо-
дящим ортогональным преобразованием.
В самом деле, их совмещает то ортогональное преобра-
зование, которое совмещает их прямоугольные канониче-
ские системы координат.
5. Описание всех аффинных преобразований. Мы ви-
дели, насколько аффинное преобразование может изменить
все фигуры: окружность может перейти в произвольный
эллипс, правильный треугольник — в совершенно произ-
вольный. Казалось бы, никакие углы при этом сохра-
ниться не могут. Однако имеет место следующее неожи-
данное.
Предложение 10. Для каждого аффинного преоб-
разования существуют две взаимно перпендикулярные
прямые, которые перейдут во взаимно перпендикулярные.
Для доказательства рассмотрим какую-либо окружность.
При рассматриваемом аффинном преобразовании она пе-
рейдет в эллипс. Каждая ось симметрии эллипса — мно-
жество середин хорд, параллельных другой оси. При аф-
финном преобразовании хорда перейдет в хорду, парал-
лельность хорд должна сохраниться и середина хорды
переходит в середину (предложение 5). Поэтому прооб-
разы осей симметрии эллипса — отрезки, обладающие тем
же свойством: каждый из них есть множество середин
хорд окружности, параллельных другому отрезку. Такие
отрезки непременно являются двумя взаимно перпенди-
кулярными диаметрами окружности. Таким образом, пред-
ложение доказано: существуют два взаимно перпенди-
130
кулярных диаметра окружности, которые переходят во
взаимно перпендикулярные отрезки—оси симметрии эл-
липса.
Эго предложение позволяет нам описать все аффин-
ные преобразования.
Теорема 1. Каждое аффинное преобразование пред-
ставляет собой произведение ортогонального преобразо-
вания и сжатий к двум взаимно пер-
пендикулярным прямым.
Доказательство. Обозначим
через ех и е$ два взаимно перпен-
дикулярных вектора, которые при
рассматриваемом аффинном преобра-
зовании f перейдут во взаимно пер-
пендикулярные векторы. Такие век-
торы существуют согласно предложе-
нию 10. Рассмотрим какую-нибудь
точку О и систему координат О, en
et. Эта система перейдет в систему
координат f (О), f (вх), f (е,) (рис. 66).
При помощи ортогонального преобразования g мы можем
перевести точку О в f (О) и совместить направления ба-
зисных векторов е£ и е, с направлениями их образов, т. е.
мы -можем выбрать g так, что
в (О) = f (О), М (ej = f (ех), X,g (e.) = f (et), X^ X, > 0.
Пусть hj—сжатие в отношении Xt к прямой, прохо-
дящей через f (О) в направлении вектора f (е,). Оно пе-
реводит g (в]) в f (ех), а точку f (О) и вектор g (еа) не из-
меняет:
hiog(ei)sef(ei). Код (О) = f (О), hxog (e,) = g(e8).
Пусть ha — сжатие в отношении X, к прямой, прохо-
дящей через f (О) в направлении вектора f (еД Оно пе-
реводит g (е,) в f (е2), а точку f (О) и вектор f fa) не из-
меняет. Таким образом,
h»°hiog (О) = f (О), hjohfog fa) = f (%),
h1ohi[ogfa)«=f(e1).
Мы видим, что преобразование hjohpg переводит си-
стему координат О, ех, е, в ту же систему координат, что
и преобразование f. Мы знаем из предложения 8 § 2, что
аффинное преобразовавание вполне определяется образом
какой-нибудь декартовой системы координат. Поэтому
аффинные преобразования f и hjohjog совпадают, и тео-
рема доказана.
5*
131
$ ♦» Пойятяе группы
1. Аффинная геометрия. Геометрия изучает свойства, обШне для
веет конгруэнтных фигур Ms не исследуем, например, по отдель-
ности треугольники со етороиами длиной 3, 4 и в, начерченные на
разйых листах бумаги. Конгруэнтные фигуры рассматриваются как
равные, и понятие конгруэнтности (равенства) фигур является, та-
ким образом, Одним из основных геометрических понятий
Подчеркнем, что равенство (конгруэнтность) фигур определяется
как возможность наложить одну фигуру на другую при помощи
перемещения, т. е. преобразования, сохраняющего расстояние между
точками.
Сейчас мы обсудим, что получится, если вместо ортогональных
преобразований выбрать какую-нибудь другую совокупность пре-
образований и объявить равными фигуры, которые можно совмес-
тить преобразованиями из данной совокупности. Разумеется, фигура,
равные в таком смысле, будут, вообще говоря, не равны в смысле
обычного определения Поэтому у равных в новом смысле фигур будут
общими не те свойства, какие были общими у фигур, равных в
обычном смысле слова Таким образом, изменится все содержание
геометрии, и, введя новое определение равенства фигур, мы должны
будем говорить о новой геометрии. Теоремы о свойствах фигур, не-
изменных при преобразованиях из некоторого заданного множества
преобразований, образуют содержание геометрии, порождаемой данным
множеством преобразований. Каждую геометрию, порождаемую неко-
торым множеством преобразований, называют клейновой геометрией.
Классическая геометрия, т. е. клейнова геометрия, в которой
равенство определяется при помощи ортогональных преобразований,
носит название евклидовой геометрии1).
Дадим краткое описание геометрии, в которой фигуры считаются
равными, если их можно совместить аффинным преобразованием.
Такая геометрия называется аффинной.
Аффинное преобразование переводит прямую линию в прямую
линию. Поэтому в аффинной геометрии имеет емысл понятие прямой.
Если бы некоторые аффинные преобразования—движения нашей но-
вой геометрии —переводили прямые линии, скажем, в окружности,
го понятие прямой утратило бы свой смысл.
Точно так же сохраняется определение параллельных и пересе-
кающихся прямых
Рассмотрим тройки точек, лежащих на одной прямой. Если одну
такую тройку можно при помощи аффниного преобразования совмес-
тить с другой тройкой, то отношение, в котором средняя точка делит
отрезок между крайними, одно и то же для обеих троек. Это Отно-
шение представляет собой свойство, общее для всех троек точек, рав-
ных в аффинной геометрии. Все теоремы, касающиеся этого отно-
шения, входят в состав аффинной геометрии. Примером может служить
теорема о том, что параллельные прямые отсекают на сторонах угла
пропорциональные отрезки.
х) Здесь следует отметить, что большинство теорем евклидовой
геометрии относится к свойствам фигур, ие зависящим от выбора
единицы измерения длин, и, таким образом, принадлежит к геомет-
рии, порождаемой множеством преобразований подобия (произведений
гомотетий и ортогональных преобразований). По указанной причине
эту последнюю геометрию иногда также называют евклидовой.
132
Рассмотрим теперь отрезок прямой, Из предложения 8 $.2 еле*
дует, что каждый отрезок можно совместить с любым другим отрез*
ком при помощи подходящего аффинного преобразовании, Если аф-
финные преобразования мы считаем движениями, то должны сдедать
вывод, что все отрезки равны между собой. Поскольку равными
оказываются отрезки любых длин, длина не является общим свойст-
вом всех равных между собой отрезков н не может рассматриваться
в аффинной геометрии. Здесь мы не можем считать длину свойством
отрезка, так же как в евклидовой геометрии мы не считаем свойст-
вом отрезка угол, который он составляет с направлением на север
Аналогично обстоит дело с измерением углов. Любые два некол
линеарных вектора, имеющих общее начало, можно при помощи
подходящего аффинного преобразования перевести в любые другие
два неколлннеарных вектора, имеющих общее начало. Поэтому в дф
финной геометрии все углы равны между собой (за исключением
углов в 0 и л) и измерение углов не имеет смысла
предложение 8 § 2 показывает также, что для любых двух тре-
угольников существует аффинное преобразование, их совмещающее
Поэтому мы должны считать, что в аффинной геометрии все тре-
угольники равны между собой.
Медиану треугольника в аффинной геометрии мы определить
можем при аффинном преобразовании медиана переходит в медиану,
так как середина отрезка переходит в середину Теорема о том,
что медианы треугольника пересекаются в одной точке, которая де-
лит каждую из них в отношении 2.1, относится к аффинной гео-
метрии.
Те же свойства треугольников, которые формулируются при
помощи понятий длины и угла, не относятся к аффинной геометрии
Например, не имеет смысла говорить о высоте треугольника, так
как высота перейдет, вообще говоря, не в высоту при аффинном
преобразовании.
В аффинной геометрии имеет смысл понятие алгебраической
линии и, в частности, понятие линии второго порядка. Предложение
8 § 3 показывает, что все линии второго порядка, принадлежащие
одному аффинному классу, равны между собой, а линии из разных
аффинных классов не равны. Например, в аффинной геометрии ок-
ружности неотличимы от эллипсов, и окружности и эллипсы с лю-
быми полуосями—это с точки зрения аффинной геометрии разные
положения одной и той же линии, которую можно назвать эллип-
сом.
Эллипс не имеет фокусов и директрис В их определение вхо-
дит понятие расстояния, и, следовательно, это определение не имеет
смысла в аффинной геометрии. А вот центр у эллипса имеется—его
можно определить, используя только понятие середины отрезка, ко-
торое относится к аффинной геометрии.
2. Значение клейновых геометрий. Здесь описана одна из многих
геометрий, некоторые из них разработаны не менее детально, чем
евклидова. Разумеется, при описании физического пространства
евклидова геометрия была и останется незаменимой, но построение
таких геометрий, как аффинная, и многих других, гораздо более
диковинных, существенно с двух точек зрения.
Во-первых, их развитие играет важную роль в общем развитии
математики и, таким образом, связано с физикой и другими науками,
имеющими непосредственное приложение к практике. Например,
идеи, о которых идет речь, сыграли существенную роль при постро-
ении теории относительности.
133
Во-вторых, изучение разного рода обобщенных геометрий поз-
воляет глубже понять нашу евклидову геометрию. Например,
Н. И. Лобачевский построил свою геометрию, исследуя независимость
постулата о параллельных от остальных аксиом. (См. по этому по-
воду книгу 15].)
3. Определение группы преобразований. Рассмотрим теперь воп-
рос о том, какие совокупности преобразований могут быть исполь-
зованы для определения равенства фигур в некоторой клейновой
геометрии. Всякое понятие равенства должно удовлетворять трем
аксиомам:
1. Каждая фигура F равна самой себе, или F = F.
2. Если фигура F равна фигуре G, то фигура G равна F, или из
F = G следует G*=F.
3. Если фигура F равна фигуре G, a G равна Н, то фигура F
равна фигуре Н, или из F = G и G=H следует F = H.
Эти аксиомы налагают определенные условия на совокупность
преобразований g, определяющую равенство в клейновой геометрии.
Именно, первая аксиома равносильна условию
1'. Тождественное преобразование принадлежит совокупности
Если бы мы, например, условились считать равными только те
фигуры, которые можно совместить отражением, то фигуры, не имею-
щие осей симметрии, оказались бы не равными самим себе.
Вторая аксиома будет выполнена, если
2'. Каждое преобразование из совокупности $ имеет обратное
преобразование, также принадлежащее совокупности <$.
Если, например, совокупность содержит только преобразова-
ние, которое сопоставляет любой точке какую-нибудь одну точку
Лв, то любая фигура F будет равна точке Лф, а точка Л# может
быть равна только самой себе, н, следовательно, Ло # F, хотя
Е=А,.
Рассмотрим третью аксиому. Пусть фигура F совмещается е G
преобразованием I из совокупности J, a G совмещается с Н преоб-
разованием g также из $. Преобразование gof совмещает фигуры F
и Н. Поэтому третья аксиома означает, что
3'. Произведение любых двух преобразований из совокупности $
принадлежит к совокупности
Определение. Совокупность преобразований называется
группой преобразований, если она удовлетворяет приведенным выше
условиям 1', 2', 3'.
Из сказанного видно, что каждой группе преобразований плос-
кости соответствует некоторая клейнова геометрия на плоскости.
Приведем некоторые примеры групп преобразований. Доказанные
нами свойства ортогональных и аффинных преобразований позволяют
заметить, что совокупность всех ортогональных преобразований и
совокупность всех аффинных преобразований являются группами.
Читатель без труда поверит, что совокупность всех ортогональ-
ных преобразований первого рода является группой, а также что
группу представляет собой совокупность всех преобразований по-
добия.
4. Группы. Рассмотрим произвольное множество объектов любой
природы—чисел, точек, преобразований или чего угодно другого.
Мы говорим, что на этом множестве задана операция, если задан
закон, по которому любым двум элементам множества а и b сопос-
тавлен некоторый элемент с. Операцию чаще всего называют умноже-
нием. В соответствии с этим элемент с называют произведением и
обозначают ab.
134
Мномеетво, на котором задана операция, называют вруппоЛ, емн
операция удовлетворяет следующим условиям:
1. Умножение ассоциативно, т. е. л(6с) = (а£)в.
2. Существует элемент е, называемый единичным, такой, что для
любого элемента а выполнены равенства
ае**еа**а.
3. Для каждого элемента а существует элемент а“*. называемый
обратным, такой, что aa~l«=a”la»e.
В случае преобразований, как было оказано в § 1, аевоциатив-
нооть обязательно имеет место. Поэтому группы преобразований яв-
ляются группами в смысле этого определения.
Примерами групп могут служить также: множество целый чисел
с операцией сложения, множество не равных нулю вещественны в чи-
сел с операцией умножения, множество всех векторов е операцией
сложения.
Множество целых чисел е операцией умножения не является
группой. Также не является группой множество векторов пространст-
ва а операцией векторного умножения
Подробнее е темой настоящего параграфа можно познакомиться
по книгам [9], [5], [6].
ГЛАВА V
СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ
И МАТРИЦЫ
§ 1. Матрицы
1. Определение. Мы будем называть матрицей разме-
ров тх п совокупность тп чисел, расположенных в виде
таблицы из т строк и п столбцов!
i a} al ... al
112 2
g aj ai an
I # # ... a?l
Числа, составляющие матрицу, мы будем называть эле-
ментами матрицы. Если число строк в матрице равно
числу столбцов, то матрица называется квадратной, а число
строк—ее порядком. Остальные матрицы носят название
прямоугольных
Можно дать и такое определение матрицы.
Рассмотрим два множества целых чисел! /={1,2,.. .,т\
и / = {1,2, ..., п}. Через IxJ обозначим множество
всех пар вида (i, /), где i—‘Число из I, а /—из /. Мат-
рицей называется функция на множестве / X /, т. е.
закон, сопоставляющий каждой паре (i, j) некоторое
число а‘.
Две матрицы мы будем называть равными, если они
имеют одинаковые размеры и равны их элементы, стоя-
щие на одинаковых местах.
Рассматривая произвольные матрицы, мы будем обо-
значать их элементы буквами с двумя индексами. Если
оба индекса расположены снизу, то первый из них обо-
значает номер строки, а второй—номер столбца; если
один из индексов расположен сверху, как в написанной
выше матрице, то этот индекс обозначает номер строки.
Не следует путать верхние индексы с показателями сте-
пени.
136
Часто удобно бывает рассматривать матрицу как со-
вокупность столбцов или как совокупность строк. Пусть
Тогда написанную вначале матрицу можно записать в
виде
Ка,... a„f.
Аналогично, если
= Н ... а’|................a"=Ja?»... <J,
то та же матрица записывается в виде
2. Сложение и умножение на число. Пусть Л и В —
матрицы, состоящие из т строк и п столбцов. Мы можем
сопоставить им третью матрицу С тех же размеров тхл,
элементы которой равны суммам стоящих на тех же ме-
стах элементов матриц Л и В. Иными словами, элементы
clf матрицы С связаны о элементами и bt/ матриц А
и В равенством
= (О
для всех I = 1, ..., т и /= 1, ..., п.
Определение. Матрица С, определяемая по Л и
В формулой (1), называется их суммой и обозначается
Л 4* В.
Подчеркнем, что сумма определена только для матриц
одних и тех же размеров.
Определение суммы матриц вполне соответствует оп-
ределению суммы функций: складываются значения, со-
ответствующие одному и тому же элементу области оп-
ределения—одной и той же паре (/, /).
Определение. Матрица С, элементы которой clf
равны произведениям элементов atf матрицы Л на число
а, называется произведением Л на а и обозначается а А.
Мы имеем
С[/ яиц (2)
для всех 1—1, ..., т; .... п.
Из свойств сложения и умножения чисел легко выте-
кает следующее
13?
Предложение 1. Цля любых матриц А, В и С
одних и тех же размеров и любых чисел а и fi выполнены
равенства
А + В-В+А, (A+B)+C-A+(B+Q,
а(А+В)я*аА4-аВ, (а4*Р) А»аА 4-рЛ,
(оф) Л «««(рЛ).
Матрица, все элементы которой равны нулю, называется
нулевой матрицей. Бели О—-нулевая матрица размеров
ткя, то для любой матрицы Л тех же размеров имеем
А 4- О А.
Матрицу (—1)Л мы будем называть противополож-
ной матрице А и обозначать —Л. Она обладает тем свой-
ством, что
Л 4* (— Л) О,
Сумма матриц В и — Л называется разностью матриц
В и Л. Мы будем обозначать ее В—Л.
3. Транспонирование матриц. Рассмотрим матрицу
А»
аП «• afn
atl ••• ®»а
fl«t ••• алп
из т строк и п столбцов. Ей можно сопоставить матрицу
В из я строк и т столбцов по следующему правилу. Эле-
менты каждой строки матрицы Л записываются в том
же порядке в столбцы матрицы В, причем номер столбца
совпадает с номером строки. Ясно, что при этом f-я стро-
ка В состоит из тех же элементов в том же порядке, что
и f-й столбец Л. Эту матрицу
аа ... e„f I
’ * I
Of It Off, ... Л|пя|
называют транспонированной по отношению к Л и обоз-
начают Лг. Переход от Л к АТ называется транспони-
рованием.
Определение транспонированной матрицы можно запи-
вать в виде тп равенств
188
связывающих элементы матриц Ан В, для всех /=!, ...
..., т и j = 1, ..., п.
4. Столбцы и строки. Матрицу размеров 1хп, т. е.
состоящую из одной строки, мы будем называть строкой
длины п или просто строкой. Матрицу размеров mxl,
состоящую из одного столбца, мы будем называть столб-
цом высоты т или просто столбцом. Сложение строк оп*
ределено для строк одной длины, так же как сложение
столбцов—только для столбцов одной высоты. Для этих
двух видов матриц мы подробнее изучим сложение и ум-
ножение на число. При этом речь будет идти только
о столбцах, так как для строк все свойства формулиру-
ются и доказываются совершенно аналогично.
Столбцы и строки мы будем обозначать полужирными
буквами.
Определение. Столбец q назовем линейной комби-
нацией столбцов рь , рт одинаковой высоты, если при
некоторых числах .....аи
т
я— 2 akPkt
k • 1
или, в более подробной записи,
Отметим, что в силу определений сложения и умноже-
ния на число это равенство равносильно п числовым ра-
венствам
f -afp}+<v}+ ...
<7а = “iPi2+а2₽1 + • • • + a„Pm,
9” = a1p? + a2p?+ • • •
Выражение <линейная комбинация» мы употребляли по
отношению к векторам. Здесь имеет место не только фор-
мальное сходство определений. При выбранном базисе
векторам соответствуют строки их компонент (длины 3),
а линейной комбинации векторов—линейная комбинация
координатных строк. Мы продолжим аналогию между
векторами и строками и столбцами, определив понятие
линейной зависимости. Обозначим символом о столбец,
все элементы которого равны нулю, н введем следующее
139
Определение. Система из $ столбцов а(, ...,а,
одной и той же высоты называется линейно независимой,
если из равенства
ад+... Ч-а^=о (3)
следует = а, = ... = а4 = 0. В противном случае, т. е
если существуют s чисел at, .... а4, одновременно не
равных нулю и таких, что выполнено равенство (3), си-
стема ait .",as называется линейно зависимой.
Определения линейно зависимой и линейно независи-
мой системы строк формулируются дословно так же.
Линейную комбинацию, все коэффициенты которой
равны нулю, принято называть тривиальной. С помощью
этого термина определение можно сформулировать так.
Система столбцов линейно зависима, если существует
равная нулю нетривиальная линейная комбинация этих
столбцов. Система столбцов линейно независима, если
только тривиальная линейная комбинация этих столбцов
равна нулю.
Пример. Столбцы
(в столбце е{ на i-м месте стоит 1, остальные элементы
равны нулю) являются линейно независимыми. Действи-
тельно, равенство a^-J-... 4-апе„ = о можно записать
в виде
Отсюда видно, что ах = ... = а„ = 0.
Укажем несколько свойств линейно зависимых систем
столбце®. Предложения 2, 3, 4 формулировались в гл. I
для векторов, и доказательства совпадали с приводимыми
ниже.
Предложение 2. Система из s> 1 столбцов линейно
зависима тогда и только тогда, когда хотя бы один из
столбцов есть линейная комбинация остальных.
В самом деле, пусть система линейно зависима. Сог-
ласно определению выполнено равенство вида (3), в кото-
ром хотя бы один коэффициент отличен от нуля. Допу-
стим для определенности, что это ах. Тогда мы можем
140
переписать равенство в виде
Отсюда видно, что первый втолбеп—линейная комбина-
ция остальных.
Наоборот, когда один из столбцов (для определенности
пусть это at) есть линейная комбинация остальных, имеет
место равенство вида а{ = Если пере-
нести все члены в одну часть равенства, то это соотно-
шение превратится в равенство нулю нетривиальной ли-
нейной комбинации столбцов at, . ., а,.
Из доказательства видно, что можно представить как
линейную комбинацию остальных столбцов каждый стол-
бец, который входит в равную нулю линейную комбина-
цию с коэффициентом, отличным от нуля.
Предложение 3. Если в систему входит нулевой
столбец, то система линейно зависима.
Действительно, нулевой столбец представляет собой
тривиальную линейную комбинацию любых столбцов. Наше
утверждение сводится к предложению 2.
Предложение 4. Если некоторые из столбцов
а{, ..., а, составляют сами по себе линейно зависимую
подсистему, то и вся система alt ..., а3 линейно зависима.
Нам дано, что существует равная нулю нетривиальная
линейная комбинация некоторых из столбцов ап ..., аг.
Если мы добавим к ней остальные столбцы с нулевыми
коэффициентами, то получим равную нулю нетривиальную
линейную комбинацию всех столбцов.
Предложение 5. Любые столбцы, входящие в ли-
нейно независимую систему, сами по себе образуют ли-
нейно независимую систему.
В самом деле, в противном случае мы пришли бы к
противоречию на основании предыдущего предложения.
Предложение 6. Если столбец а есть линейная
комбинация столбцов at, ..., а„ то он является также
линейной комбинацией любой системы столбцов, содер-
жащей ait .... as.
Для доказательства к данной линейной комбинации
достаточно добавить недостающие столбцы с нулевыми
коэффициентами.
Предложение 7. Любой столбец а высоты п есть
линейная комбинация столбцов , .... еп, введенных фор-
мулой (4).
14!
Это видно из следующего равенства!
I дМ 111 И! 10
I л* О в л I al I •••
,|+a,| о |+...+ал| 0 .
I a" I I 0 I I’• ‘I | 1
• ’ 11 ° I 0 I “
Коэффициентами линейной комбинации являются эле-
менты столбца а.
§ 2. Детерминанты
В гл. I мы уже познакомились с детерминантами
квадратных матриц второго и третьего порядков. Задача
этого параграфа—определить и изучить детерминанты
квадратных матриц любых порядков. Для этой цели удобно
использовать символику, которую мы сейчас введем-
1. Символ 2. В математике часто приходится рас-
сматривать суммы большого числа слагаемых, причем
все слагаемые имеют один и тот же вид и различаются
только индексами. Для таких сумм принято следующее
а
обозначение. Символ 2 • после которого стоит некото-
Л=1
рое выражение, содержащее индекс k, обозначает сумму
таких выражений для всех значений индекса k от 1 до
п, например:
Л п
2 а* = а1 + а1+ ... +a„, 2 «*₽*=«i₽i+ • • • +«„₽»•
Я=1 Я=1
Индекс k называется индексом суммирования. Разумеется,
в качестве индекса суммирования может быть употреблена
и любая другая буква, т. е.
л л
2/.- 2, р,-
|Х=1
Имеют место следующие правила обращения со зна-
ком суммы 2* которые читатель без труда проверит.
Предложение 1. 1) Множитель, не зависящий от
индекса суммирования, может быть вынесен за знак
еуммы:
2 аРк—а 2 Pt-
1 * *=1
п п п
2) = 2 Л + 2 0*.
Й=1 ft=l k=A
142
Последняя формула представляет собой частный слу
чай (т = 2) следующего утверждения.
Предложение 2. Два знака суммы могут быть
переставлены, т. е.
пт т п
S 2 рik — 2 2 Рц-
»=!1=1 < = !*=!
Действительно, выражения Pik, стоящие под знаком
двойной суммы, зависят от двух индексов и могут быть
выписаны в виде матрицы из т строк и п столбцов. И
правая и левая части доказываемого равенства представ-
ляют собой сумму всех элементов матрицы: справа сна-
чала сложены элементы каждого столбца и потом взята
сумма всех полученных сумм, а слева сначала сложены
элементы каждой строки и затем сложены полученные
суммы.
Это предложение можно также получить, применяя
несколько раз правила 1), 2).
пл п
Двойную сумму 2 S Pit, обозначают через 2 Л»,
если оба индекса пробегают одинаковые значения 1, ...
..., п. Последовательным применением предложения 2
можно доказать, что многократная сумма
л, л, Пр
i‘iZ>... ip
не зависит от порядка, в котором расположены знаки
суммирования. Такую сумму обозначают
'•••'г ’
если все индексы пробегают одни и те же значения.
Иногда нам будет требоваться записать сумму всех
слагаемых, кроме одного или двух. Если пропущено сла-
гаемое с номером /, мы будем записывать эту сумму так:
S Л- Аналогично, если пропущены слагаемые с номе-
рами i и /, мы пишем 2 Рь-
t&i, I
2. Определение детерминанта. Детерминанты1) опре-
делены только для квадратных матриц. Детерминант
квадратной матрицы—это число, которое ей сопоставлено
1) Детерминанты называются также определителями.
143
и может быть вычислено по ее элементам в соответствии
со следующим определением.
Определение. 1) Детерминантом матрицы по-
рядка 1 называется единственный элемент этой матрицы.
2) Детерминантом матрицы
|«Н ац...а1п
........
anf oni...ann
порядка п>
называется число
Л
det Л =2
1
(1)
где —детерминант матрицы /Ц порядка п—1, полу-
ченной из А вычеркиванием первой строки и &-го столбца.
Детерминант матрицы А обозначается det А или, если
нужно выписать элементы матрицы,—прямыми чертами
по бокам этой матрицы»
ац.. .сцп
ani • * • апп
На первый взгляд определение детерминанта может
показаться неэффективным: детерминант матрицы поряд-
ка п определяется через детерминанты матриц порядка
п—1, а эти детерминанты сами не определены. В дей-
ствительности же в этом ничего плохого нет. Для опре-
деления чисел Ml мы можем воспользоваться той же фор-
мулой, поскольку она имеет место для матриц любого
порядка. Тем самым мы выразим det А через детерми-
нанты матриц порядка п—2. Можно продолжать этот
процесс, пока мы не придем к матрицам первого порядка,
а для них детерминант определен непосредственно.
Применим наше определение к матрицам порядка 2
и 3. Для матрицы
ац |
Kt a*sli
имеем М]==а2!, Ml==a2l, и, следовательно,'
Для матрицы
|«if ащ I
®»s|,
ли «и
144
очевидно,
М' = |а22 °291,
flssl
и
det А*=аа |®я
о»з I_______ |o»t «esl , _ e*# I
Oii I ls l«Sf аззI 1S I «it an |
Эти формулы совпадают с определением детерминантов
второго и третьего порядков, введенным в гл. I.
Вычислим в качестве примера детерминант матрицы
1 о о... о
Е
О 1 0...0
п
О О О ... 1
Такая матрица называется единичной матрицей. Для нее
M} = det£„_I, где E„_t—такая же матрица на единицу
меньшего порядка, и aIft*=0, если £=/=!. Поэтому detE„=
= det£„_f. Применяя это равенство п—1 раз, мы полу-
чим det Еп = det Ej = 1.
Число Ml называется дополнительным минором эле-
мента aik. По аналогии мы можем определить дополни-
тельный минор произвольного элемента а{/ как детерми-
нант матрицы Д}, получаемой из исходной матрицы А
вычеркиванием той строки и того столбца, в которых
расположен элемент at/, т. е. f-й строки и /-го столбца.
Дополнительный минор элемента at/ обозначим М/. Часто
говорят о строках и столбцах минора, имея в виду строки
и столбцы матрицы Д/. Мы будем пользоваться этой
вольностью, так как к ошибке она привести не может.
3. Свойства детерминантов. Методом полной индукции
докажем
Предложение 3. Для каждой матрицы А поряд-
ка п имеет место формула
deM = S (— 1)'+1алМ[. (2)
z=i
Эта формула называется разложением детерминанта
по первому столбцу.
Доказательство. Очевидно, что для матриц вто-
рого порядка формула справедлива. Допустим, что наше
утверждение имеет место для матриц порядка п—1, и
докажем его для матриц порядка и. Для этого перепи-
шем формулу (1), определяющую детерминант матрицы
145
порядка л, выделив первый член суммы:
Л
det Л^гтиМ'+ $
k=2
При любом k 2 в матрицу Л| входит (без своего
первого элемента) первый столбец матрицы А. Пользуясь
предположением индукции, мы можем разложить Ml по
этому столбцу. Надо только учесть, что i-я строка мат-
рицы А в матрицу Al входит под номером i—1, так как
в А1 не вошла первая строка матрицы А. Поэтому при
Л
М1=2(-1УайМЙ.
(=2
Здесь М1{—детерминант матрицы порядка п—2, полу-
чаемой из Al вычеркиванием ее (i—1)-й строки и 1-го
столбца или, что то же самое, получаемая из А вычер-
киванием 1-й и i-й строк и 1-го и k-ro столбцов.
Подставляя полученное выражение для Ml, находим
л Г л
det S Н-1)*+1а« S (-1МЙ •
к=2 \ 1 = 2 }
Внесем множитель, не зависящий от i, под внутренний
знак суммы:
Л л
det Л=айМ} + S S (-
k=2 1= 2
Изменим порядок суммирования и вынесем множитель, не
зависящий от k, за внутренний знак суммы:
л л
det Л=айЛ4}4- S (-1Г+1а« S (—l>*a»W- (3)
i= 2 k=2
Нетрудно заметить, что внутренняя сумма представляет
собой результат применения определения детерминанта
к минору А4(. Действительно,
Л
й=2
так как в матрице А[, детерминантом которой он явля-
ется, по сравнению с Л пропущен первый столбец и все
номера столбцов уменьшены на 1. Теперь мы можем
146
написать (3) в виде
det Л=аиМ’+ S (— 1)'+1ааМ‘,
(в 2
что совпадает с доказываемым равенством (2).
Предложение 4. Для любой квадратной матрицы
det А = det Аг.
Докажем это предложение по индукции. Для матриц
порядка 1 оно очевидно. Предположив, что предложение
верно для матриц порядка п—1, докажем его для матриц
порядка п. Пусть А}—матрица, получаемая из А-вычер-
киванием первой строки и /-го столбца, а В[—матрица,
получаемая из АТ вычеркиванием /-й строки и первого
столбца. Легко видеть, что Поэтому из предпо-
ложения индукции следует, что det В[ «= det А), или, сло-
вами, дополнительный минор элемента а^ в матрице А
равен дополнительному минору элемента Ьд в матрице Ат.
Кроме того, Оц — Ъд, и разложение det Л по первой стро-
ке совпадает с разложением det Ат по первому столбцу.
Из предложения 4 следует равноправность строк и
столбцов. Именно, если справедливо какое-либо утверж-
дение о детерминантах, касающееся строк соответствую-
щих матриц, то верно и аналогичное утверждение, касаю-
щееся столбцов, и обратно. В силу этого обстоятельства
следующие ниже предложения достаточно доказать только
для строк.
Предложение 5. Если е квадратной матрице
поменять местами какие-нибудь две строки (или два
столбца), то детерминант матрицы изменит знак, не
изменившись по абсолютной величине.
Докажем это утверждение для двух соседних строк
методом полной индукции. Для матриц второго порядка
оно проверяется непосредственно. Предположим, что ут-
верждение верно для матриц порядка п—1, и докажем
его для матриц порядка п.
Пусть номера переставляемых строк k и /г+1. Напи-
шем разложение детерминанта по первому столбцу, выде-
лив в нем два слагаемых, соответствующих переставляе-
мым строкам:
det А == (—1)»+1 амМ‘+(—1)*+» aki.it fMj+1 +
+ 2 (-1У+1айМ
i+k, *4-1
Аналогично для матрицы В, которая получается из А
147
перестановкой ft-й и (ft-f-l)4t строк!
(Jet В - (— 1)*+,а*+!. +(—!)*« aMN*” 4-
4- 2 (-l)^aaN\.
l + k,k+l
При l=£k, ft 4.1 в MJ и N{ входят ft-я и (Л4-1)-я
строки, но в разном порядке, а остальные их строки
одинаковы. Следовательно, по предположению индукции
—MJ при i=?tft, ft 4-1.
Матрицы, детерминанты которых обозначены М? и АГ?*’,
совпадают! оии получаются вычеркиванием (ft 4-1)-й стро-
ки из матрицы В или, что то же самое, ft-й строки мат-
рицы А. Поэтому Mfe=JVf+1. Аналогично, М*+’ = ЛГ*
Теперь, сравнивая det А и det В, мы видим, что они
равны по абсолютной величине и отличаются знаком.
Пусть теперь в матрице А порядка п переставляются
строки с номерами I и /, и пусть для определенности
i < /. Тогда между i-й и /-й строками находится /—I—1
строк. Перестановку i-й г /-й строк можно осуществить,
переставляя только соседние строки! сначала /-ю строку
переставляем последовательно с /—I строками, стоящими
над ней (последней из них будет i-я); затем f-ю строку
переставляем на /-е место, меняя местами с каждой из
/—I— 1 строк ниже нее. Всего будет проделано нечет-
ное число 2 (/—i)—I перестановок соседних строк. По-
скольку при каждой из них детерминант меняет знак,
при перестановке i-й и /-й строк он тоже должен изме-
нить знак.
Свойство, выражаемое предложением 5, называется
антисимметрией детерминанта по строкам (столбцам).
Используя свойство антисимметрии по строкам и столб-
цам, мы можем доказать разложения детерминанта по
любой строке и любому столбцу.
Теорема 1. Для каждой матрицы А порядка п
при произвольном t (1 ^i^n) имеет место формула
Ф&А-ТЫ-У^апМ (4)
feef
и при произвольном /(1</<п)—формула
det А - S (—(б)
Заметим, что при t»l формула (4) есть определение
детерминанта, а при /=1 формула (5) совпадает е дока-
148
занным в предложении 3 разложением по перрону столбцу.
Докажем формулу (4) при »1>2. Для этого переставим
t-ro строку матрицы на первое место так, чтобы не нару-
шить порядок остальных строк. Нужная нам переста-
новка будет осуществлена, если мы переставим t-ю строку
последовательно со всеми строками, расположенными
выше нее. Выше i-й находится i—1 строка. Поэтому,
если В—матрица, полученная после перестановки, то
det/l = (—l)'-1detS. Разложив det В по первой строке
(i-й. строке матрицы Л), мы получим
det 4«(-I/’* S
k= 1
Nl—детерминант матрицы, получаемой из В вычеркива-
нием первой строки и k-ro столбца или, что то же самое,
из матрицы А вычеркиванием i-й строки и ft-го столбца.
Поэтому Nl = Mlk, что и доказывает нужное разложение.
Формулу (5) можно получить таким же путем из раз-
ложения по первому столбцу.
Предложен и'е 6. Если i-й столбец (строка) мат-
рицы А есть линейная комбинация столбцов (строк) р
и q, т. е. имеет вид <xp-\-$q, то
det А = a det Ар 4- р det Да,
где матрицы Ар и Aq получаются из А заменой i-eo
столбца (строки) соответственно на р и на q.
Для доказательства достаточно обратить внимание на
то, что в силу определения операций со столбцами мы
имеем для всех k (\^.k^.n) равенства aki = apk-}-$qk,
где через р* и qh обозначены элементы столбцов р и q.
Подставляя эти равенства в разложение det ^4 по t-му
столбцу, мы получаем
det А » S (—1)*+' akiMf =
= а S (—1)*+‘р*М£ + ₽ S (—
*=i *=i
что и заканчивает доказательство.
Свойство, выраженное этим предложением, носит на-
звание линейности детерминанта по столбцу (строке).
Разумеется, det А можно представить аналогичным обра-
зом и тогда, когда столбец матрицы А есть линейная
комбинация + • • • +а«Р»-
149
Иногда линейность детерминанта по столбцу форму-
лируют в виде двух отдельных свойств]
1) При умножении столбца матрицы на число ее де-
терминант умножается на это число.
2) Если столбец матрицы есть сумма двух столбцов,
то ее детерминант есть сумма детерминантов соответ-
ствующих матриц.
Предложение 7. Если в матрице А столбцы (или
строки) линейно зависимы, то det 4=0.
Отметим, что если матрица содержит нулевой столбец
(или строку), то ее детерминант равен нулю. Это следует
из разложения по столбцу (строке). Допустим теперь, что в
матрице нет нулевого столбца.
Согласно предложению 2 § 1 доказываемое утвержде-
ние имеет и такую формулировку! если один из столбцов
(одна из строк) матрицы А есть линейная комбинация
остальных столбцов (строк), то det 4 = 0. Эту последнюю
формулировку мы и докажем. Начнем с частного случая.
Если в А есть два одинаковых столбца, то, переставив
их, мы не изменим матрицу, а изменим знак у детерми-
нанта. Следовательно, det 4=0.
В общем случае пусть /-й столбец af есть линейная
комбинация остальных столбцов, (Некоторые
коэффициенты aft могут равняться Нулю, т. е. не все
столбцы должны фактически входить в эту линейную ком-
бинацию.) Применяя свойство линейности по столбцам,
имеем det А = S det Ak, где Ak—матрица, получаемая
Л#1/
из А заменой /-го столбца на k-Ъ. В этой матрице стол-
бец ак повторяется дважды; поэтому det Ak = 0, что за-
вершает доказательство.
4. Элементарные преобразования. Вычисление детер-
минантов. В связи с задачей вычисления детерминанта
мы введем и в первый раз применим важное понятие —
элементарные преобразования матрицы.
Определение. Мы назовем элементарными пре-
образованиями матрицы следующие преобразования:
I) умножение строки на число, отличное от нуля;
2) прибавление к одной строке другой строки;
3) перестановку строк;
4) те же преобразования столбцов.
Комбинируя элементарные преобразования первого и
второго вида, мы можем к любой строке прибавить линей-
ную комбинацию остальных строк.
150
Предложение 8. Детерминант матрицы не изме-
нится, если к какой-либо его строке (столбцу) прибавить
линейную комбинацию остальных строк (столбцов).
Для доказательства нужно применить свойство линей-
ности по строкам и учесть обращение в нуль детерми-
нанта с линейно зависимыми строками.
Детерминант матрицы А можно вычислить так. Если
все элементы ее первого столбца—нули, то detA==O.
Если же в первом столбце есть ненулевые элементы, то
берем любой из них (например, максимальный по абсо-
лютной величине). Пусть это akt. В каждой строке, кроме
Л-й, мы прибавим k-ю строку, умноженную на — вд/Ли»
где ал—первый элемент преобразуемой строки. В резуль-
тате все элементы, кроме одного, в первом столбце пре-
образованной матрицы будут равны нулю, и нам удобно
будет разложить ее детерминант по первому столбцу.
Мы получаем
detA«==(— l)*+IaHdet А*.
Здесь det А'—дополнительный минор элемента aki в пре,-
образованной матрице. Для вычисления det А' мы приме-
няем тот же способ. Через п—1 шагов (если не раньше)
детерминант будет найден.
Описанный здесь способ хорош тем, что по сравнению
с другими требует меньшего числа арифметических опе-
раций. Для нахождения детерминантов небольших матриц,
элементы которых—целые числа или обозначены буквами,
этот способ лучше сочетать с разными искусственными
приемами.
5. Миноры произвольного порядка. Рассмотрим неко-
торую, не обязательно квадратную матрицу А. Выберем
какие-нибудь $ номеров строк it, ..., и $ номеров
столбцов /f, .... /,, причем будем предполагать, что эти
номера расположены в порядке возрастания: it < it <...
• • • < it </»<•••< L-
Определение, минором порядка s матрицы А
называется детерминант матрицы порядка s, образованной
элементами, расположенными на пересечении выбранных
строк и столбцов, т. е. число
-is —
ал а‘\ —
a/i a/‘ --’a/s
# a‘* ...aft
131
Каждая матрица имеет столько миноров данного по-
рядка s, сколькими способами можно выбрать номера
it, и ]\, ..ja. Нам удобно будет говорить, что
минор Ll/t /4 расположен в строках с номерами .....ia
и столбцах с номерами /ь ..., ja.
Если матрица А квадратная, то каждому минору
L/J, '1а порядка s мы можем сопоставить дополнительный
минор Л1/2 lfa. Эго по определению есть детерминант мат-
рицы порядка и—s, получаемой из А вычеркиванием
строк с номерами i\, ..., ia и столбцов с номерами /ь ...
.... fe> т. е. тех, в которых расположен минор .
Алгебраическим дополнением минора мы назовем ёгд'
дополнительный минор, умноженный на
(__1у«+-+'4+Л+-+/4
Имеет место следующее предложение, известное под
названием теоремы Лапласа.
Предложение 9. Выберем д строк матрицы с номе-
рами ix, ..., ia и составим произведения всех миноров,
расположенных в выбранных строках, на их алгебраиче-
ские дополнения. Детерминант рассматриваемой матрицы
равен сумме всех составленных произведений.
Аналогичное утверждение имеет место и для столбцов.
Доказательство этого предложения мы не приводим
и в дальнейшем не будем на него ссылаться. Заметим
только, что разложение детерминанта по строке пред-
ставляет собой частный случай предложения 9 для s = l.
6.....Формула полного разложения детерминанта по зле*-
ментам матрицы. Мы будем называть перестановкой чисел
1 п эти числа, написанные в каком-либо определенном
порядке. Например, из чисел 1,2 можно образовать две пере-
становки: 1, 2 и 2, 1. Произвольную перестановку чисел
1.....п мы обозначим i\, ..., t„.
Будем говорить, что число ik виновно в нарушении
порядка в перестановке ilt ..., i„, если оно стоит левее
меньшего числа. Например, при п — 4 в перестановке 2,
4, 3, 1 числа 2 и 3 виновны каждое в одном нарушении
порядка, число 4—в двух. Итак, общее число нарушений
порядка в этой перестановке равно четырем. Число нару-
шений порядка в перестановке it, ..., i„ мы обозначим
in)-
Перестановка i\, ..., in называется четной, если
М(ц, ..., i„)—число четное, и нечетной в противном
случае.
152
Докажем формулу полного разложения
ац ... а1п
• алл
=(1 2 (—1^<>>•• ... antn. (6)
Сумма в правой части равенства берется по перестанов-
кам. Это означает, что каждой перестановке чисел 1, ...
..., п соответствует слагаемое. Слагаемое, соответствую-
щее перестановке ..., in, составляют так: берут эле-
мент из первой* строки и /,-го столбца, элемент из второй
строки и ia-ro столбца и т. д. и перемножают их. В ре-
зультате в произведение входит по одному и только
одному элементу из каждой строки и каждого столбца.
Произведения складываются со знаками, определяемыми
четностями соответствующих перестановок.
Доказательство. Формулу (6) мы докажем мето-
дом полной индукции. Пусть п — 2 и дана матрица
Ни ан Л
1’
Двум перестановкам (1, 2) и (2, 1) соответствуют два
слагаемых (—2,аиаи и (—l)^2-1)а1гаг1. Их сумма
равна ДцО»—а12а21, т. е. как раз детерминанту данной
матрицы.
Допустим, что формула верна для матриц порядка
п—1, и докажем ее для произвольной матрицы А по-
рядка п. Детерминант определяется формулой (1). В Л-е
слагаемое этой формулы входит множитель Ml. По пред-
положению индукции
A!J = det^= 2 (-!)"«*•
(fl • fn —1)
здесь все номера ........1п_г отличны от k, а первые
индексы у сомножителей равны 2......п, так как, сохра-
няя старые обозначения для элементов матрицы А, мы
должны учесть, что в матрицу А\ не входят первая
строка и Л-й столбец.
Теперь в k-м слагаемом в формуле (1) можно внести
множитель (—l)*+1alft под знак суммы и записать это
слагаемое так:
(-1)*+Ч^ = 2 НИ'1..............!’-^k+1alkaiti...anln_l.
Щ ‘n-J
Числа k, ilt ..., in_i составляют перестановку чисел
1, ..., п, причем N (k, ilt .... = in-i) +
+ Л—1, так как правее k стоит ровно k—1 чисел, мень-
153
ших k. Следовательно, N(k, .... in_t) имеет ту же
четность, что W(ilt +L и мы имеем
(-1)*+1а1ЛМ1= S (-О* <*’ г‘.......
В правой части этого выражения собраны все те члены
из суммы (6), которые соответствуют перестановкам, имею-
щим k на первом месте. В сумму (1) входят слагаемые
для любого Л, и потому сумма (1) содержит все члены
суммы (6) и, конечно, не содержит никаких других чле-
нов. Формула (6) доказана.
§ 3< Системы линейных уравнений
(специальный случай)
1, Постановка задачи. Систему уравнений вида
a]xl 4-... 4-а,1х" = Ь1,
ajx1 4- apt* 4- ... 4- a’ хп = Ьг,
аГх14-аГх,4- • •. 4-a?x" = t
мы ’будем 'называть системой т линейных уравнений с п
неизвестными х*. х"1). Коэффициенты этих уравне-
ний мы будем записывать в виде матрицы
I а} al
I af’aj1
... aj |
... a?|
называемой матрицей системы. Числа, стоящие в правых
частях уравнений, образуют столбец Ь, называемый столб-
цом свободных членов.
Матрица системы, дополненная справа столбцом сво-
бодных членов, называется расширенной матрицей си-
стемы и в этой главе обозначается z
А* =
al al ... a\bl
a? ... tffb«
Если свободные члены всех уравнений равны нулю,
система называется однородной.
Определение. Совокупность п чисел а1, ..., ал
называется решением системы (1), если каждое уравнение
1) Индексы, различающие неизвестные, мы пищем вверху, так
как в дальнейшем нам будет удобно записывать совокупность не-
известных в виде столбца.
154
системы обращается в числовое равенство после подста-
новки в него чисел а' вместо соответствующих неизвест-
ных х1 для всех i=1, ..., п.
Наша задача состоит в нахождении решений системы
(1), причем мы не делаем заранее никаких предположе-
ний относительно коэффициентов и свободных членов си-
стемы и даже относительно числа уравнений и числа не-
известных. Поэтому могут представиться различные воз-
можности. Система может вообще не иметь решения, как
система
х» + х»=1,
х1 + х2 == О
(если бы решение существовало, то хЧ-х* равнялось бы
одновременно и нулю и единице). Система может иметь
бесконечное множество решений, как система (п = 2,
т=1)
х14-х* = 0.
Решением этой системы является любая пара чисел, от-
личающихся знаком и равных по абсолютной величине.
Примеры систем, имеющих одно-единственное решение,
в изобилии встречаются в школьном курсе алгебры.
Системы, не имеющие решений, мы будем называть
несовместными, а имеющие решения—совместными.
2. Правило Крамера. Сейчас мы рассмотрим простей-
ший случай, когда число уравнений равно числу неиз-
вестных, п = т. Кроме того, мы наложим определенные
условия и на коэффициенты системы. Если этого не сде-
лать, нам придется изучать здесь, например, и систему,
состоящую нз одного уравнения, повторенного п раз. Мы
хотим, чтобы все уравнения системы были в определен-
ном смысле независимы. Уже в школьном курсе широко
применялся следующий прием: умножали первое урав-
нение на число й, второе уравнение—на число 0, а за-
тем складывали эти уравнения почленно. Полученное
уравнение (его естественно назвать линейной комбина-
цией исходных уравнений) является их следствием. Мы
хотим, чтобы в нашей системе ни одно уравнение не яв-
лялось линейной комбинацией остальных. Если это вы-
полнено, мы будем говорить, что уравнения линейно не-
зависимы.
В случае = п для линейной независимости уравне-
ний системы достаточно потребовать, чтобы детерминант
матрицы системы был отличен от нуля. (Поскольку т —
155
^= п и матрица квадратная, имеет смысл говорить о ее
детерминанте.) Действительно* заметим, что при умноже-
нии какого-нибудь уравнения на .число соответствующая
строка матрицы системы умножается на это число. При
сложении уравнений строки матрицы складываются. По-
этому, если одно из уравнений является линейной ком-
бинацией остальных, соответствующая строка матрицы
системы есть линейная комбинация остальных строк. Из
предложения 7 § 2 следует, что при этом детерминант
матрицы равен нулю.
Теорема 1 (правило Крамера). Система из п
уравнений с п неизвестными
а}х14- ... +а1пхп — Ь1, )
................................ (2)
ajx1-}-... +a%xtt = btt J
в случае, когда детерминант матрицы системы отличен
от нуля, имеет решение, и притом только одно. Это реше-
ние находится по формулам
— (для всех /=1, .... п), (3)
аде через Д обозначен детерминант матрицы системы, а
через А1—детерминант матрицы, получаемой из матрицы
системы заменой i-го столбца столбцом свободных чле-
нов, т. е.
4 ... а}-1 Ь1 а}+1 ... 4
4 .., 4-1 6" 4+1 • • • 4
Для доказательства возьмем расширенную матрицу
системы А* и припишем к ней сверху произвольную ее
строку. Пусть номер этой строки /. В результате полу-
чается квадратная матрица Л порядка п4-1. В этой мат-
рице две одинаковые строки, и потому
det Л= a[ ... anb^ 4 ... 4&1 SSS 0,
4 ...
С другой стороны, мы можем вычислить det И по опре-
делению. Итак,
% (- O'+I a'tM,+(—det AM ** 0.
156
Здесь через М, обозначен детерминант матрицы, получае-
мой из расширенной матрицы Л* вычеркиванием t-ro
столбца. Следовательно, учитывая, что А « det Л в* О, мы
можем написать
ьу*1 2 (-w*1 Mi-
<1
Если внести множитель под знак суммы, это равенство
примет вид
г» г
где
J.I,....
л
Так определенный набор чисел х1, .Xя, как мы видим,
удовлетворяет f-му уравнению системы. Существенно, что
числа х’, .... х" не зависят от / и потому удовлетворяют
всем уравнениям системы, т. е. являются ее решением.
Существование решения доказано/
Мы приведем х* к нужному виду, если переставим
в А последний столбец b на f-e место, т. е, поменяем его
местами последовательно со столбцами о номерами п,
п— 1, ..f-Ь 1. Всего нужно n—I перестановок. Поэтому
(— 1)» + / — 1)п-1 д/ д/
х =-----------------
Это и есть требуемый вид для хг.
.Нам осталось доказать единственность полученного
решения. Сделаем это от противного. Пусть нашлось два
решения системы!
а\ ..., а" и 5% .... 3". (4)
Пользуясь операциями ёо столбцами, мы можем запи-
сать систему (1) в виде (см. е. 139)
нли, короче, х^Ч-... +хпа„ » Ь, где а{,..., ап—столбцы
матрицы системы, А—столбец свободных членов. Такая
запись системы очень удобна, и мы будем часто ею поль-
зоваться.
157
Результат подстановки решений (4) в систему имеет
вид
axaf4-... 4-а"а„=3,
pdtf 4-... +₽"а„ —3.
Вычитая почленно второе равенство нз первого, мы по-
лучаем
(a1—Р1) af +... + (а»—₽») d„ » о.
Если решения не совпадают, то хоть одна из разностей
—₽* отлична от нуля. Эго означает, что столбцы а<, ...
...» а„ линейно зависимы. В силу предложения 7 § 2
это противоречит тому, что det А Ф 0. Теорема до-
казана.
Стоит заметить, что в доказательстве единственности
мы вначале не использовали совпадение числа уравнений
и числа неизвестных и, по существу, доказали более об-
щее утверждение! если столбцы матрицы системы ли-
нейно независимы, то система не может иметь двух раз-
личных решений.
3. Пример. В качестве применения правила Крамера
получим условие, при котором три плоскости пересекаются
в одной точке. В общей декартовой системе координат
плоскости могут быть заданы уравнениями
Atx 4- Bty 4- CjZ 4- Of—0, ’
A^x 4- Bty 4- C^z 4- D, = 0,
AfX 4- Bty 4- C3z 4- Dt = 0.
(6)
Координаты точки пересечения должны-удовлетворять
одновременно всем трем уравнениям, т. е. быть решением
системы (6). Мы видим, что при условии
Лг Bi Ct I
Xg Sg cf I о
Xg Cf |
существует единственная точка пересечения. Эго условие
мы получили в § 3 гл. IL Из правила Крамера следует
только достаточность условия, поскольку оно само по себе
является достаточным условием существования решения
и его единственности.
Еще одна геометрическая интерпретация правила
Крамера для систем из трех уравнений была приведена
в п. 6 § 3 гл. I. Из нее вытекало на только условие един-
ственности решения, но и формулы для нахождения этого
решения.
158
Для исследования произвольной системы Линейных
уравнений нам потребуется изучить свойства прямоуголь-
ных матриц. Им и отведен следующий параграф.
§ 4. Ранг матрицы
1. Базисный минор. Определение минора порядка г мат-
рицы А было дано на с. 151. Введем теперь следующее
Определение. В матрице А размеров тхп минор
порядка г называется базисным, если он отличен от нуля,
а все миноры порядка г 4-1 равны нулю или миноров
порядка г 4-1 вообще нет, т. е. г совпадает с меньшим из
чисел т или п.
Ясно, что в матрице может быть несколько разных
базисных миноров. Все базисные миноры имеют один и
тот же порядок. Действительно, если все миноры порядка
г 4-1 равны нулю, то равны нулю и все миноры порядка
г 4- 2, а следовательно, и всех больших порядков. Это
становится очевидным, если применить определение детер-
минанта к какому-нибудь минору порядка г 4* 2; все до-
полнительные миноры элементов его первой строки явля-
ются минорами порядка г 4*1 нашей матрицы и, следова-
тельно, равны нулю.
Столбцы и строки, на пересечении которых располо-
жен базисный минор, мы назовем базисными столбцами
н строками.
Определение. Рангом матрицы называется поря-
док базисного минора, или, иначе, самый большой поря-
док, для которого существуют отличные от нуля миноры.
Если каждый элемент матрицы равен нулю, то ранг такой
матрицы, по определению, считают нулем.
Ранг матрицы А мы будем обозначать Rg4.
Перебирать все миноры в поисках базисного—задача,
связанная с большими вычислениями, если размеры мат-
рицы не очень малы. Проше всего находить ранг матрицы
и ее базисный минор при помощи элементарных преобра-
зований.
Предложение 1. Элементарные преобразования не
меняют ранга матрицы.
Доказательство. 1°. При умножении строки на
число X 0 базисный минор либо не изменится, либо ум-
ножится на X. Ни один минор, равный нулю, не сделается
отличным от нуля.
2°. Если все миноры порядка г 4-1 равны нулю, то
сложение строк не сделает ни один из них отличным от
159
нуля. Действительно, полученный после преобразования
Мйвор либо равен алгебраической сумме двух Миноров
порядка г -J-1 исходной матрицы (в том случае, когда
'к строке, входящей в минор, прибавили строку, в него не
входящую), либо он равен сумме минора порядка г 4-1
и детерминанта матрицы с двумя одинаковыми строками
(в том случае, когда к строке, входящей в минор, приба-
вили другую строку, в него входящую). Из этих сообра-
жений следует, что ранг матрицы не может повыситься.
Ясно, что он не может и понизиться, так как в противном
случе при обратном преобразовании—вычитании строк —
он бы повысился.
3Q. При перестановке строк минор может изменить
знак (если в него входят обе переставляемые строки),
или может замениться на минор, не больше чем знаком
отличающийся от другого минора той же матрицы (если
содержит только одну из переставляемых строк), или во-
обще не изменится. Ясно, что при этом порядок базисного
минора останется тем же.
4 . Неизменность ранга при алементарных преобразо-
ваниях столбцов доказывается аналогично.
Элементарные преобразования строк матрицы будут
для нас предпочтительнее ввиду их тесной связи с преоб-
разованиями систем линейных уравнений. Для системы
из т уравнений с п неизвестными
allxl+... 4-alnx" = bif)
.................................. (О
а^х1* ...+атпхп = Ьт)
расширенная матрица имеет вид
!аи •.< ain
...........
•••
Перестановке строк этой матрицы соответствует изме-
некие порядка уравнений в системе. Умножение строки
на число равносильно умножению соответствующего
уравнения на это число. Наконец, прибавить в матрице А*
к одной строке другую—то же самое, что сложить соот-
ветствующие уравнения системы. При всех этих преобра-
вованиях множество решений системы, разумеется, не
меняется. Итак, доказано
Предложение 2. Элементарным преобразованиям
строк расширенной матрицы соответствуют преобразова-
ны)
ния системы линейных уравнений в эквивалентную си-
стему.
Покажем теперь, как находить базисный минор мат-
рицы при помощи элементарных преобразований.
2. Приведение матрицы к упрощенному виду. Пусть
дана матрица А размеров тхп. Несколько первых ее
столбцов могут оказаться состоящими из нулей. Пусть
jt—номер первого столбца, содержащего ненулевые эле-
менты. Если такого столбца не нашлось, ранг матрицы —
нуль, а базисного минора нет.
Пусть a/)/i—ненулевой элемент /гго столбца. Пере-
ставим 1г-ю строку на первое место и разделим ее на atje
Обозначим элементы преобразованной матрицы через а;,.
Мы имеем a'llr = 1. Элементарными преобразованиями строк
обратим в нуль все остальные элементы /\-го столбца. Для
этого надо из каждой строки с (новым) номером k Ф1
вычесть первую строку, умноженную на а^.
После этого преобразования наша матрица примет вид
о ... о 1
о ... о о
о ... о о
Здесь (7|—матрица размеров тх(п—/().
Может оказаться, что последние т—1 строк матрицы
At—нулевые. Тогда преобразования закончены. В про-
тивном случае пусть /,—номер самого левого столбца,
содержащего ненулевой элемент в одной из последних т— 1
строк. Переставим строки так, чтобы строка с этим
ненулевым элементом стала' второй, и разделим ее йа этот
элемент.
Обозначим элементы преобразованной матрицы через а’ц.
Тогда a,,, = 1
Элементарными преобразованиями строк обратим в нуль
все остальные элементы /,-го столбца. Для этого из каж-
дой строки с номером k 2 надо вычесть вторую строку,
умноженную на a"kji. При этом первые ]t столбцов мат-
рицы At не изменятся, так как вторая строка в этих
столбцах имеет нули. Матрица примет вид
10 ... О 1 I* ... *| О'
0...0 0 0,..0 1 у
о ... о о о ... о о
6-102
161
Здесь (У,—матрица размеров тх(п——js); звездочками
обозначены элементы, о которых мы ничего не можем
сказать.
Если в последних т—2 строках есть ненулевые эле-
менты, то мы проделываем такое же преобразование, пре-
вращая столбец с номером /, в столбец, состоящий из
нулей, За исключением единицы на третьем месте. Левее
этого столбца в последних т—2 строках—только нулевые
элементы, поэтому ранее преобразованные столбцы не изме-
нятся.
Мы можем продолжать такие преобразования до тех
пор, пока не окажется, что последние т—г строк очеред-
ной матрицы Аг состоят из нулей, или не будут исчерпаны
все строки.
Итак, мы получили следующее
Предложение 3. При помощи элементарных пре-
образований строк каждую матрицу размеров тхпможно
привести к следующему виду, некоторые г столбцов сов-
падают с первыми г столбцами единичной матрицы по-
рядка т. Если г <.т, то последние т—г строк состоят
из нулей.
Вид матрицы, описанный в этом предложении, назовем
упрощенным видом. Матрицы такого вида коротко назовем
упрощенными.
Рассмотрим упрощенную матрицу. Ее минор, располо-
женный в первых г строках и столбцах Д, ..., jr, равен
единице. Ненулевых миноров большего порядка, очевидно,
нет. Следовательно, минор—базисный, а ранг упрощенной
матрицы равен г.
Если мы привели матрицу А к упрощенному виду и
получили упрощенную матрицу ранга г, это означает, что
ранг исходной матрицы А также был равен г. В самом
деле, ранг не мог измениться при элементарных преобра-
зованиях. За базисный минор матрицы А можно принять
минор, расположенный в столбцах с номерами jir ..., jr
и строках, которые после перестановок попали на места
1, .... г в упрощенной матрице. Это видно из того, что
преобразуя матрицу, мы не прибавляли к строкам этого
минора никаких строк, которые в него не входят. По-
скольку полученный минор ненулевой, исходный тоже не
равен нулю.
Обратим внимание на то, что в предложении 3 упро-
щенный вид матрицы достигается за счет преобразований
строк. Эго важно ввиду связи, отмеченной в предложе-
>62
нии 2. Метод, примененный при доказательстве, называется
методом Гаусса.
Рассмотрим квадратную матрицу с детерминантом, от-
личным от нуля. У нее все столбцы—базисные, и, следо-
вательно, ее упрощенный вид—единичная матрица. Отсюда
вытекает
Следствие. Каждую квадратную матрицу с нену-
левым детерминантом при помощи элементарных преоб-
разований строк можно превратить в единичную матрицу.
Поиск базисного минора при доказательстве предложе-
ния 3 приводит нас к самому левому набору столбцов,
в котором существует базисный минор. Для упрощенного
вида матрицы это не существенно. Имеет место
Предложение 4. Пусть А—матрица размеров
тхп. Каков бы ни был базисный минор этой матрицы,
при помощи элементарных преобразований строк А мы
можем превратить базисные столбцы в столбцы единич-
ной матрицы. Если RgA = r<m, то последние т—г
строк будут нулевыми.
Доказательство. Пусть базисный минор распо-
ложен в строках iit .... ir и столбцах /,, ..., /,. Переста-
вим базисные столбцы на первые г мест и будем дейст-
вовать так же, как при доказательстве предложения 3,
с той разницей, что ненулевой элемент в очередном
столбце берется не произвольно, а из строк с номерами
ilt ..., lr. Такой элемент обязательно найдется, так как
в противном случае оказалось бы, что мы обратили в нуль
базисный минор элементарными операциями только с его
строками. После окончания преобразований надо вернуть
столбцы на прежние места. Впрочем, можно и не трогать
столбцов, а немного видоизменить метод приведения мат-
рицы.
3. Теорема о базисном миноре. Дальнейшее изложение
существенно опирается на следующее утверждение, назы-
ваемое теоремой о базисном миноре.
Теорема 1. В произвольной матрице каждый стол-
бец является линейной комбинацией базисных столбцов,
а каждая строка—линейной комбинацией базисных строк.
Для доказательства второго утверждения теоремы
вспомним, какими элементарными преобразованиями мы
приводили матрицу к упрощенному виду при доказатель-
стве предложения 4. Помимо перестановок строк и умно-
жения базисных строк на числа, мы прибавляли к какой*
либо строке матрицы одну из ее базисных строк, умно-
женную на число. При этом базисные строки заменяются
ь*
163
на линейные комбинации базисных строк, а к небазисным
прибавляются линейные комбинации базисных. В упро-
щенной матрице небазисные строки—-нулевые. Значит, мы
прибавили к каждой небазисной строке исходной матрицы
такую линейную комбинацию ее базисных строк, что по-
лучилась нулевая строка. Отсюда непосредственно выте-
кает доказываемое.
Первая часть теоремы будет доказана, если мы при-
меним уже доказанное утверждение о строках к транспо-
нированной матрице, заметив предварительно, что после
транспонирования базисный минор остается базисным.
В предложении 7 § 2 утверждалось, что детерминант
матрицы, столбцы которой линейно зависимы, равен ну-
лю. Из теоремы о базисном миноре следует обратное
утверждение.
Предложение Б. Если А—квадратная матрица
«det А — 0, то по крайней мере один из столбцов—ли-
нейная комбинация остальных столбцов, а также одна
из строк—линейная комбинация остальных строк.
Действительно, условие detX = O означает, что
Rg4^n—1, где п — порядок матрицы. Поэтому по
крайней мере один из столбцов и одна из строк не пере-
секают базисный минор. Столбец и строка, не пересекаю-
щие базисный минор, линейно выражаются соответственно
через столбцы и строки, в которых расположен базисный
минор.
Теорема 2 (теорема о ранге матрицы). Рана
матрицы А равен максимальному числу линейно незави-
симых столбцов в этой матрице.
Если Rg Л == О, то все столбцы нулевые и нет ни од-
ного линейно независимого столбца. Пусть RgH = r > 0.
Покажем, что в А существует г линейно независимых
столбцов. Действительно, рассмотрим составленную из
элементов матрицы А матрицу А' порядка г, детерминан-
том которой является базисный минор. Столбцы А' пред-
ставляют собой части столбцов А.
Если бы столбцы А, в которых расположен базисный
минор, были линейно зависимы, то были бы линейно за-
висимы столбцы А! и базисный минор равнялся бы нулю.
Докажем теперь, что любые р столбцов матрицы А
линейно зависимы, если р> г. Составим матрицу В из
этих р столбцов. Rg В г, так как каждый минор матри-
цы В является минором матрицы А и, следовательно, в В
нет отличного от нуля минора порядка, большего чем г.
164
Таким образом, RgS<p и хотя бы один из столбцов
матрицы В не входит в ее базисный минор.
Этот столбец линейно выражается через остальные.
Тем самым теорема доказана.
Точно так же доказывается, что ранг матрицы равен
максимальному числу линейно независимых строк. Отсю-
да вытекает интересное следствие.
Следствие. Максимальное число линейно независи-
мых строк в матрице равно максимальному числу линей-
но независимых столбцов в этой матрице.
§ 5. Общая теория линейных систем
1. Условия совместности. Теорема о базисном мино-
ре позволяет дать простое и эффективное условие совме-
стности системы линейных уравнений
а\х14-... 4- а\хп = Ь1,
..................................... (О
афх14- ... 4- а„хп == Ьт,,
носящее название теоремы Кронекера—Капелли.
Теорема 1. Система (1) имеет хотя бы одно реше-
ние в том и только в том случае, когда ранг матрицы
системы А равен рангу расширенной матрицы А*.
Для доказательства перепишем систему (1), пользуясь
определением операций со столбцами. Мы получим
Г. Если существует решение, то запись (2) означает,
что столбец свободных членов есть линейная комбинация
столбцов матрицы системы. Значит, добавление этого
столбца не увеличивает общего числа линейно независи-
мых столбцов и Rg4*==Rg4.
2°. Пусть Rg4‘=Rg/l. В этом случае базисный ми-
нор матрицы А является базисным и в матрице А*. Это
означает, что столбец свободных членов есть линейная
комбинация тех столбцов матрицы А, в которых располо-
жен базисный минор. По предложению 6 § 1 в этом слу-
чае столбец свободных членов есть линейная комбинация
всех столбцов матрицы А. Коэффициенты этой линейной
комбинации представляют собой решение системы (1).
Следствие. Система (1) несовместна тогда и толь-
ко тогда, когда в упрощенный вид расширенной матрицы
165
А* входит строка |0 ... О 11. (Предполагается, что
столбцы не переставлялись.)
Доказательство. Если Rg4*>RgA то любой
базисный минор матрицы А* должен содержать последний
столбец. Если последний столбец является базисным, то
в упрощенный вид матрицы А* должна входить строка
|0 ... О 1J. Обратно, если такая строка содержится в
матрице, то ее последний столбец не может быть линей-
ной комбинацией остальных, и система с упрощенной
матрицей несовместна. Но исходная система эквивалентна
системе с упрощенной матрицей.
В качестве примера получим из теоремы Кронекера —
Капелли условие параллельности двух не совпадающих
прямых на плоскости Прямые
Atx + + 0,)
параллельны, если не имеют общей точки, т. е. если
Rg
Л1 Bi Ci
Вг Сг
Равенство рангов матрицы системы и расширенной
матрицы можно выразить, понимая ранг как максималь-
ное число линейно независимых строк. Это приведет нас
к нижеследующему предложению 1, известному как тео-
рема Фредгольма. Для практического исследования сис-
тем уравнений она не очень удобна, но имеет существен-
ное теоретическое значение.
Транспонируем матрицу А системы (1) и рассмотрим
систему из п линейных уравнений
^14-...+а?,ул, = 0,)
-............................. (4)
а'пУг+ ...+а"’ут = 0 )
с т неизвестными, с матрицей АТ и свободными членами,
равными нулю. Она называется сопряженной однородной
системой для системы (1).
Предложение 1 (теорема Фредгольма).
Для того чтобы система линейных уравнений (1) была
совместна, необходимо и достаточно, чтобы каждое ре-
шение сопряженной однородной системы (4) удовлетворяло
уравнению
b1yi+...+bjeya=O, (5)
где Ъ\ ..., Ь"—свободные члены уравнений (1).
166
Докажем достаточность. Если соотношение (5) выпол-
нено для всех решений системы (4), то система уравнений
а1^+...+а7*Ря=0, 'j
4й+...+вй‘Л,“0, | <6>
felf/t+...+be4,= l J
решений иметь не может. Поэтому для нее ранг расши-
ренной матрицы больше ранга матрицы системы. Транс-
понируя обе матрицы и учитывая, что ранг матрицы не
меняется при транспонировании, мы получаем, что
|а{ ... On Ы
Я
О
а? Ьт
о 1
IIal ... аД Ь1
> Rg ..................
||аГ ... а? 6»
Теперь из теоремы о ранге матрицы следует, что строка
|0 ... О 1|| не является линейной комбинацией строк
матрицы
Ja’ ... а'„ Ь1
Л’ = |.............
И ... а? Ьт
и потому строка такого вида не может входить в упро-
щенный вид этой матрицы. Отсюда на основании следст-
вия из теоремы Кронекера—Капелли мы заключаем, что
система (1) совместна.
Необходимость условия будет установлена, если мы
допустим, что условие не выполнено, и докажем, что тог-
да система (1) несовместна. Пусть условие не выполнено
Это означает, что существует решение yit ..., системы
(4), для которого Ъху1 + ... + Ьтут = р^О. Умножим
уравнения системы (1) на числа уи ..., уя с соответст-
вующими номерами и сложим их. Мы получим уравнение
Ох1-}-... +Ол" = р,
которое не имеет решений. Если бы система (1) имела
решения, они должны были бы удовлетворять этому урав-
нению. Следовательно, система несовместна.
В качестве примера применим теорему Фредгольма к
выводу условия параллельности двух различных прямых
на плоскости. Система (3) не имеет решений, если сущест-
вуют такие числа г/, и yit что = у^ -f-
+ yaBa = 0, но yjCj + yaCa ф 0. Легко видеть, что yt и у,
не равны нулю. Поэтому можно положить —Уа/Л = ^ «
167
записать полученное условие в виде: существует число X
такое, что Л1 = 1Д2, 2^ = 15, и
2. Нахождение решений, В этом пункте мы будем
предполагать, что дана совместная система из т линей-
ных уравнений с п неизвестными. Обозначим буквой г
ранг матрицы системы. Поскольку ранг расширенной
матрицы тоже равен г, мы можем выбрать базисный ми-
нор расширенной матрйцы так, чтобы он был расположен
в матрице системы. Применяя элементарные преобразо-
вания строк, приведем расширенную матрицу к упрощен-
ному виду (предложение 3 § 4). Данная нам система ли-
нейных уравнений, согласно предложению 2 § 4, перей-
дет в эквивалентную ей систему из г линейно независи-
мых уравнений.
Для удобства записи будем предполагать, что базис-
ный минор расположен в первых г столбцах. Тогда пре-
образованную систему можно записать в виде
х1 = Ь1— (а’г+1хг+1 +... -f- аДлс”),
xr = ^-(a;+ixr+1 +... +агпхп).
(7)
Здесь а/ и Ь1—элементы преобразованной расширенной
матрицы. В левых частях равенств мы оставили неизвест-
ные, соответствующие столбцам выбранного нами базис-
ного минора, так называемые базисные неизвестные.
Остальные неизвестные—называемые параметрически-
ми—перенесены в правые части равенств.
Как бы мы ни задали параметрические неизвестные,
по формулам (7) мы найдем базисные так, что они вме-
-ете с заданными параметрическими образуют решение си-
стемы (1). Легко видеть, что этим способом мы получим
вею совокупность решений.
На формулах (7) можно было бы остановиться, но ни-
же мы дадим более простое и наглядное, а также прин-
ципиально важное описание совокупности решений систе-
мы линейных уравнений.
3. Приведенная система. Сопоставим системе уравне-
ний (1) однородную систему с той же матрицей коэф-
фициентов, т. е. систему
alx1 + ... + а„х" = 0, )
(?)
а^х1 + ... + = 0. J
По отношению к системе (1) она называется приведенной.
,68
Предложение 2. Если'yi, ..., у^—решение си-
стемы (1), то у1, у—также решение системы (1)
тогда и только тогда, когда найдется такое решение
приведенной системы х1, хя, что У — у19 + х1 для
любого i = 1, ..., п.
Доказательство. 1°. Пусть ait ...,ап—столбцы
матрицы системы (1), b—ее столбец свободных членов,
УЪ .... решение:
ylat+...+^а^Ь, (9)
а также х\ хя—решение приведенной системы:
х1щ+... +х"а„‘=о. (10)
Складывая равенства (9) и (10) почленно, мы получаем
(yl+x1)ai+...+ (y'i + хп) ап = Ь,
т. е. числа у} 4-х1, ..., У + х” удовлетворяют системе (1).
2°. Пусть у1, у"—решение системы (1):
уа, + ...+упап = Ь. (11)
Вычитая (9) из (11), имеем
(У1—У»)+ • • + (У~У) ап = о.
Это значит, что числа xI = t/1—yl, .... Xя—у”—yi удов-
летворяют приведенной системе. Предложение доказано.
Записывая решения в столбцы высоты п, предложение
2 можно сформулировать так: если у0—решение систе-
мы (1), то у—также решение этой системы тогда и толь-
ко тогда, когда найдется такое решение х приведенной
системы, что у=_у04-х’.
Далее для краткости мы будем пользоваться подоб-
ной записью.
4. Множество решений однородной системы. Любая
однородная система линейных уравнений совместна. Она
имеет решение 0, ..., 0, которое называется тривиальным
решением. Все предыдущие результаты о системах ли-
нейных уравнений, разумеется, верны н для однородных
систем. В частности, справедливы формулы (7), которые
для однородной системы имеют вид
х1 — —(а’+1хг+14- • • • 4-««*"),
хг = — (а'+1хг+14- • • • +ЙАх").
(7')
Действительно, в формулах (7) Ь1 = 0, ..., Ьг — 0, посколь-
ку при элементарных операциях со строками нулевой
169
столбец свободных членов может перейти только в нуле-
вой столбец.
Множество решений однородной системы обладает
двумя важными свойствами, выраженными в следующем
предложении.
Предложение 3. Если столбцы xf их,—решения
однородной системы, то их сумма + также ре-
шение этой системы. Произведение решения однородной си-
стемы на любое число является решением той же системы.
Доказательство. Нам дано, что
4-... + ~ о и xlUf 4”... + х2ип ss= о.
Из этих равенств вытекает
W 4-х1,)at4- - • • 4-М4-*?) а„ = о
и
Kx}at 4-... 4-1х?аЛ =о,
каково бы ни было К. Предложение доказано.
Доказательства двух следующих предложений исполь-
зуют формулы (7'), и потому принятая в них нумерация
переменных соответствует сделанному в формулах (7) и
(7') предположению, что базисный минор матрицы систе-
мы расположен в первых г столбцах.
Предложение 4. Если ранг матрицы однородной
системы равен г, то система имеет п—r линейно неза-
висимых решений.
Для доказательства придадим параметрическим неиз-
вестным следующие п—г наборов значений:
1)х'+х=1, хг+' = 0........ .... х" = 0;
2) хг+1 = 0, ^+*=1, хг+’ = 0, .... г = 0;
п—г) хг+1 = 0, ..., ..., х“'‘ = 0, xnt=l.
Для каждого набора значений параметрических неиз-
вестных найдем соответствующие значения базисных неиз-
вестных. Полученные решения запишем в виде столбцов:
Л *1 У ^8 я Л *П—Г
• • •
г Xi -J 1 *2 I Xft~r
*1= 1 0 ь .... х„_г = 0 • (12)
0 1 1 . . .
0
0 0 1 1
Эти решения линейно независимы. Действительно, соста-
170
вим матрицу из столбцов хг, ...» Она имеет минор
порядка п—г, равный единице (в последних п—г стро-
ках), поэтому ее ранг равен п—r, и все столбцы линей-
но независимы.
Совокупность решений (12) называется нормальной
фундаментальной системой решений. Вообще, любая си-
стема из п—г линейно независимых решений называется
фундаментальной системой решений.
Предложение 5. Пусть xit...t хп_г—произволь-
ная фундаментальная система решений однородной си-
стемы линейных уравнений. Тогда любое решение х си-
стемы представляет собой линейную комбинацию реше-
ний X*,
Для доказательства составим матрицу X, столбцами
которой являются решения х и xit.... ж„_г. Ранг этой
матрицы не меньше чем п—г, так как в ней есть п—г
линейно независимых столбцов. С другой стороны, он и
не больше чем п—г. Действительна, первая из формул
(7') выражает первую базисную неизвестную х1 как ли-
нейный многочлен от параметрических неизвестных, при-
чем коэффициенты этого многочлена одни и те же для
каждого столбца матрицы X. Поэтому первая строка мат-
рицы есть линейная комбинация последних п—г строк.
Иначе можно сказать так: если последние п—г строк
матрицы X мы умножим на коэффициенты первой из
формул (7') и сложим, то мы получим первую строку
этой матрицы. Аналогично при помощи остальных фор-
мул (7') можно показать, что строки с номерами 2,...
..., г—линейные комбинации последних строк. Поэтому
элементарными преобразованиями можно обратить в нуль
первые г строк матрицы X, а это значит, что ранг ее не
превосходит п—г.
Мы видим, что ранг нашей матрицы равен п—р. Сле-
довательно, она имеет базисный минор, расположенный
в столбцах хх, ..., хп_„ и доказываемое предложение
следует из теоремы о базисном миноре.
Пусть хг, ..., х„_г—фундаментальная система реше-
ний однородной системы линейных уравнений. Рассмотрим
столбец х = + ... 4-Сп_гх„_,, или, в развернутом
виде,
==С11-.-|4-
(13)
Из предложения 1 вытекает, что линейная комбинация
любого числа решений однородной системы также явля-
ется решением. Следовательно, каковы бы ни были числа
Cf,.... С„_г, столбец х, определяемый формулой (13),
является решением рассматриваемой однородной системы
уравнений. Наоборот, согласно предложению 5 для каж-
дого решения однородной системы существуют такие числа
Ci( .... С„_г, при которых оно имеет вид (13).
Естественно возникает вопрос, нет ли такой совокупности из
s < ft—г решений, что каждое решение однородной системы ли-
нейных уравнений есть линейная комбинация решений из данной
совокупности. Легко доказать, что ответ отрицательный, В самом
деле, допустим, что такая совокупность решений существует, и
составим матрицу G размеров пХ(л—r-J-s), столбцами которой
являются решения, входящие в эту совокупность и в нормальную
фундаментальную систему решений. С одной стороны, мы имеем
RgG = s, а с другой, RgG = n—г, и мы приходим к противоречию.
5. Общее решение системы линейных уравнений. Те-
перь мы можем собрать воедино наши результаты —
предложения 2 и 5:
Теорема 2. Если х1,...,хп_г—фундаментальная
система решений приведенной системы уравнений, а
у„—некоторое решение системы (1), то столбец
У —УаЛ-СгХ! + • • • 4*Сп_,хп_г,
или в развернутом виде.
при любых числах С{,..., Сп_г является решением систе-
мы линейных уравнений (1). Наоборот, для каждого ре-
шения этой системы найдутся такие числа Clt ..., Ся_,,
при которых оно имеет вид (14).
Выражение, стоящее в правой части равенства (14),
называется общим решением системы линейных уравнений.
Теорема верна для любых систем линейных уравне-
ний, в частности для однородных. Формула (14) совпада-
ет с (13), если у„—тривиальное решение.
Правило Крамера гласит, что для существования и
единственности решения системы из п уравнений с п
неизвестными достаточно, чтобы детерминант матрицы
системы отличался от нуля. Из теоремы 2 следует необ-
ходимость этого условия.
Предложение 6. Пусть А—матрица системы из
п линейных уравнений с п неизвестными. Если det Л —О,
172
то система либо не имеет решения, либо имеет бесконечна
много решений.
Доказательство. Равенство det4 = O означает,
что ранг матрицы А меньше п, и, следовательно, приве-
денная система имеет бесконечно много решений. Если
рассматриваемая система совместна, из формулы (14) вы-
текает, что и она имеет бесконечно много решений.
6. Примеры. Рассмотрим уравнение плоскости в де-
картовой системе координат
Дх + Я^-|-Сг4-Р = 0 (15)
как систему из одного линейного уравнения в тремя
неизвестными. Пусть А=/=0 и, следовательно, является
базисным минором матрицы системы. Ранг расширенной
матрицы не больше единицы, и система совместна. Одно
ее решение можно найти, положив у = г—О. Мы полу-
чим х —— D]A. Так как п==3 и л=1, фундаментальная
система решений приведенной системы состоит из двух
решений. Мы найдем их, дав параметрическим неизвест-
ным два набора значений! «/=1, z = 0 и у — 0, 2=1.
Соответствующие значения базисной неизвестной х бу-
дут—В/А и —С/А. Итак, общее решение системы (15)
хЦ I—О/ЛВ О—В/Л11 II—С/ЯЛ
У М о +Q I Н-GJ 0 . (16)
г|| И 0 II || 0 || || 1 ||
Выясним геометрический смысл полученного решения.
Очевидно, прежде всего, что решение (—D/А, 0, 0) со-
стоит из координат некоторой (начальной) точки пло-
скости или, что то же, из компонент ее радиус-вектора.
В формуле (14) в качестве решения yQ мы можем брать
любое решение системы. Это соответствует тому, что на-
чальная точка выбирается произвольно. Согласно предло-
жению 2 § 2 гл. II компоненты лежащих в плоскости
векторов удовлетворяют уравнению Aat + Ва2 Н-Са8 = 0,
т. е. приведенной системе. Два линейно независимых ре-
шения этой системы могут быть приняты за направляю-
щие векторы плоскости. Таким образом, формула (16) —
не что иное, как параметрические уравнения плоскости,
причем и С3—параметры. Произвол в выборе фунда-
ментальной системы решений означает произвол в выбо-
ре направляющих векторов плоскости.
В качестве следующего примера рассмотрим прямую
линию в пространстве. Относительно декартовой системы
17Э
координат она может быть задана системой уравнений
41x + B1y4-CIz+Df = 0, |
Мы будем предполагать, что минор AtBt—AtBt отличен
от нуля и, следовательно, является базисным. Так как
ранг расширенной матрицы не может превосходить двух,
система совместна.
Для того чтобы выразить базисные иеизвестые х и у
через параметрическую г, в нашем случае (система из
двух уравнений с буквенными коэффициентами) естест-
веннее воспользоваться не методом Гаусса, а правилом
Крамера.
Одно решение системы—компоненты радиус-вектора
начальной точки прямой—можно найти, положив г, = 0.
Мы получим
° “ AiBf—AJBi. ’ ~ A^Bi-AtBi *
Приведенная система имеет вид
^ + ^ + ^2=0,1
Дгх4-В^+С,г=0. f (‘й)
Ее фундаментальная система решений состоит из одного
решения. Придав параметрической неизвестной г значе-
ние zt = 1, мы найдем из (18)
г —BtCj ______—CtAt
* ~ AiBt— AtBi ’ У1 ~ AtBt— AtBt *
Однако нам удобнее взять не нормальную фундаменталь-
ную систему, а умножить найденное решение однородной
системы на AtBt—A,Bt. Итак, общее решение системы
(17) имеет вид
j == | Jfo j-f-Cj —С1 . (19)
|0] । AiZfj—— Д2Й11
Направляющий вектор прямой в такой форме мы получи-
ли в предложении 11 § 2 гл. II.
§ в. Умножение матриц
1. Определение и примеры. Рассмотрим сначала стро-
ку в с элементами а{ \i— 1,..., п) и столбец b с элемен-
тами bt л). Существенно, что в а и в Ь число
ш
элементов одинаково. Произведением а на b называется
число, равное сумме произведений элементов с одинако-
выми номерами, т. е.
ab = аЛ 4- atbt 4-... 4- a„bn.
Пусть теперь дана матрица А размеров тхп и мат-
рица В размеров пхр. Матрицы таковы, что длина стро-
ки (число столбцов) первой равна высоте столбца (числу
строк) второй. Умножим каждую строку А на каждый
столбец В. Полученные тр произведений запишем в виде
матрицы С размеров тхр. Именно, каждый столбец
матрицы С составим из произведений всех строк матрицы
А на соответствующий столбец матрицы В. Любая строка
С состоит из произведений строки А, имеющей тот Же
номер, на все столбцы В. Таким образом, элементы мат-
рицы С можно записать следующей формулой]
п
cij—(О
Я S5 J
(/= 1, ...» т; / = 1,.... р).
Определение. Матрицу С, элементы которой вы-
ражаются через элементы матриц А и В по формулам
(1), назовем произведением А на В и обозначим АВ.
Определение произведения матриц формулируется бо-
лее сложно и кажется менее естественным, чем определе-
ние суммы. Однако если бы кто-нибудь захотел опреде-
лить произведение для матриц одинаковых размеров, пе-
ремножая соответствующие элементы, то такое определе-
ние не нашло бы себе существенных применений. Что же
касается приведенного определения, то оно, как чита-
тель в этом убедится, широко применяется.
Приведем несколько примеров.
1) Произведение квадратной матрицы А порядка п на
столбец х высоты п:
<Л.,,ап
1'' ’ п
х1 I
ха | I о"х14-... 4- а"хп
Произведение представляет собой столбец высоты п.
В обратном порядке эти матрицы перемножать нельзя,
т. е. произведение хА ие определено.
175
2) Произведение строки длины п на квадратную мат-
рицу порядка п будет строкой длины п>
All••*О1п
• .а2л
« • • • •
flrtf'• •Опп
п
JS
k SS 1
П В
. S
Я = ’ II
3) Произведение столбца высоты т на строку длины
п—матрица размеров mxn!
х1^ х1аг.,.х1ап
x2ai хга2...хаа„
хтсц хтаг.. .хтап
4) Пусть А—матрица размеров туп, е(—i-й стол-
бец единичной матрицы1) порядка т, а е, — j-й столбец
единичной матрицы порядка п. Тогда
еГАе/=|0...1...0||
ан.. ,at„
• ,а»лп
= «//•
1
О
Предложение 1. /-Д столбец матрицы АВ есть
линейная комбинация столбцов А с коэффициентами,
равными элементам j-eo столбца матрицы В.
l-я строка матрицы АВ есть линейная комбинация
строк В с коэффициентами, равными элементам i-й
строки матрицы А,
Оба утверждения доказываются одинаково. Докажем,
например, первое. Для этого обозначим столбцы матриц
А, В и АВ соответственно через ..., а„, bt, ..b£
и с4,..., ср. Отметим, что столбцы матриц А и АВ
имеют одинаковую высоту. Поскольку для составления
Cj мы последовательно умножаем все строки А на b/t
имеем Су = Ад/. Но, как видно из примера 1), произведе-
ние А&у можно записать -\-Ь/пап. Этим наше
предложение доказано.
2. Свойства умножения матриц. Умножение матриц
не коммутативно. Даже если определены оба произведе-
ния АВ и ВА, они могут быть не равны, как показывает
следующий пример:
1) Определение единичной матрицы см. на с. 145.
176
Если какие-нибудь матрицы А и В удовлетворяют со-
отношению АВ = ВА, то [они называются перестановоч-
ными. Перестановочные матрицы существуют. Например,
единичная матрица порядка п
Еп =
1 о о ... О О
О 1 о ... о о
О О О ... О 1
перестановочна с любой квадратной матрицей того же
порядка, т. е.
Л.ЕП =в ЕпА — А. (2)
Предоставим читателю самостоятельно проверить эти ра-
венства в качестве упражнения на умножение матриц,
То обстоятельство, что каждая матрица А не меня-
ется при умножении на единичную матрицу, представля-
ет собой важное свойство единичной матрицы, которому
она обязана своим названием. Если бы какая-нибудь дру-
гая матрица Ё обладала этим же свойством, мы имели
бы ЁЕ = Е и ЁЕ = Ё, откуда следовало бы Е = Ё.
Очевидно, что каковы бы ни были А и В, если О—
нулевая матрица, то
ЛО = О, ОВ = О.
(Предполагается, что произведения определены.)
Предложение 2. Умножение матриц ассоциативно,
т. е. если определены произведения АВ и (АВ) С, то оп-
ределены ВС и А (ВС) и выполнено равенство (АВ) С =
= А (ВС).
Действительно, обозначим размеры матриц А, В и С
соответственно через тлхпл, /пвхлв и тсхпс. Если
АВ определено, то пА = тв и матрица АВ имеет размеры
/плхлв. Поэтому, если определено произведение~(АВ) С,
то пв = тс. Матрица АВ состоит из элементов
лл
s (i=l, .... тЛ; р=1,.... пв),
а = I
и, следовательно, элементы (АВ)С имеют вид
пВ / ,1А \
s( S^«p (/=1,.... тл; X=l,.... nc). (3)
р=1\а=1 /
177
Поскольку пв — тс, определено произведение ВС. Его
элементы
пв
S WpX («=’• •••’ тА’ Х==1........М-
Р=1
Высота столбца матрицы ВС равна пА, т. е. длине строки
матрицы А. Таким образом, определено произведение
А (ВС). Элементы А (ВС) имеют вид
S а^( S Ь«РСР^ 0 = 1» •••» тА> х=1> •••» «с)- (4)
а=1 \р=1 /
В силу предложений 1 и 2 § 2 выражения (3) и (4) сов-
падают, и наше предложение доказано.
Предложение 3. Умножение матриц дистрибу-
тивно по отношению к сложению, т. е. если имеет
смысл выражение А (В + С), то
А(В + С) = АВ + АС.
Если имеет смысл выражение (А + В)С, то
(А-\-В)С — АС + ВС.
Обе части предложения доказываются одинаково. До-
кажем, например, первую. Очевидно, что В и С должны
иметь одинаковые размеры тхп, а А—размеры рхт
(р может быть любым). Мы можем выразить элементы
матрицы Л(В4-С) через элементы матриц А, В и С>
S axt(bla+cla) (1=1,..., р; а = 1, .... п).
Согласно предложению 1 § 2 эта сумма может быть пред-
ставлена в виде
i = l iss 1
Суммы, составляющие это выражение, равны элементам
матриц АВ и АС, стоящим в строке с номером Лив
столбце с номером а. Этим утверждение доказано.
Легко может быть доказано следующее свойство ум-
ножения матриц.
Предложение 4. Если произведение АВ имеет
смысл, то
а (АВ) — (аА) В = А (аВ)
для любого числа а..
178
Предложение 5. Ранг произведения двух матриц
не превосходит рангов сомножителей.
Для доказательства рассмотрим матрицу D, составлен-
ную из всех столбцов матриц А и АВ. Запишем ее:
D = jA|ABJ. Очевидно, что RgAB^RgD. По предло-
жению 1 столбцы АВ являются линейными комбинаци-
ями столбцов А. Отсюда следует, что RgD = RgA. Мы
имеем RgABs^RgA. Аналогично доказывается, что
RgAB^RgB. Для этого нужно составить матрицу D'
из строк матрицы В и строк матрицы АВ.
Предложение 6. Если определено произведение
АВ, то определено и произведение ВТАГ и выполнено ра-
венство
(ABf = BTAT.
Пусть матрицы А н В имеют соответственно размеры
тхп и пхр. В матрице АВ на пересечении i-й строки
и /-го столбца стоит элемент
S alabaf (f=l, .... m; /==1..........р). (5)
а=1
/-я строка матрицы ВТ состоит из элементов Ьц, ..., Ьп/,
а i-й столбец матрицы Аг—из элементов аЛ, а(п.
Поэтому произведение ВТАГ определено, и в нем на пере-
сечении /-й строки и i-ro столбца стоит элемент
п
S Ьа.]О{Л.
а=1
Он совпадает с элементом (5), а индексы I и / пробегают
в обоих выражениях одни и те же значения : = 1, . ..,т;
/ = 1, .... р. Этим предложение доказано.
Следствие. Если определено произведение АВС, то
(АВС)Т = СТВТАТ.
Действительно, (АВС)Т *= СТ(АВ)Т=СГВТАТ.
3. Обратная матрица. Исследуем теперь, насколько
возможно ввести операцию деления, обратную операции
умножения. Введем следующее определение.
Определение. Матрица X, удовлетворяющая вме-
сте с заданной матрицей А равенствам
ХЛ = ЛХ = £„ (6)
(где Еп—единичная матрица некоторого порядка п), на-
зывается обратной к А и обозначается Л-1.
179
Поскольку А и А~1 перестановочны, они обе должны
быть квадратными того же порядка п. Из (6) в силу
предложения 5 мы имеем Rg Еп Rg А. Отсюда Rg А > п.
Поэтому матрица А может иметь обратную только тогда,
когда ее детерминант не равен нулю. Приведенное усло-
вие является не только необходимым, но и достаточным
для существования обратной матрицы.
Предложение 7. Каждая квадратная матрица
с детерминантом, отличным от нуля, имеет обратную
матрицу, и притом только одну.
Док азате л ьство.'Для каждой матрицы Л с det Л=£0
существует единственная матрица X такая, что ЛХ = £.
Действительно, при любом / столбец xf матрицы X дол-
жен удовлетворять условию AXj — Qf, где ef—j-й столбец
единичной матрицы. Подробнее это условие записывается
системой линейных уравнений
4-а,„х7 = О, '
адх’4-... 4-а/пх;==1, ►
ап1х’ + ...+ап„х7 = 0.
(7)
По правилу Крамера эта система уравнений имеет един-
ственное решение, и, следовательно, каждый столбец ма-
трицы X однозначно определен.
Докажем, что ХА = Е. С этой целью заметим, что
detX#=0 и по только что доказанному существует такая
матрица У, что XY — E. Мы найдем Y, если умножим
обе части последнего равенства слева на матрицу А. Тогда
AXY = A, откуда в силу АХ = Е следует Y—A. Итак,
матрица X удовлетворяет обоим условиям (6).
Способ, примененный при доказательстве существова-
ния, является основой для нахождения обратной матрицы.
Согласно правилу Крамера i-я неизвестная в системе (7)
находится по формуле x/ = Az/det А, где Az—детерминант
матрицы, получаемой из А заменой ее i-ro столбца на
/-Й столбец единичной матрицы. Разлагая К{ по этому
столбцу, мы имеем только одно слагаемое, так как в et
только один элемент равен 1, а остальные—нули. Следо-
вательно, Az = (—где Д1{—дополнительный минор
элемента в матрице А. Окончательно!
г (-D'+'M'i
Xl ~ det А
(8)
180
Можно решать систему (7) и методом Гаусса. По-
скольку det Л #= О, по следствию из предложения 3 § 4,
элементарными преобразованиями строк расширенной ма-
трицы системы мы можем превратить матрицу А в еди-
ничную матрицу. При этом столбец свободных членов е7
превратится в решение системы X/ (ср. формулы (7) § 5,
в которых в данном случае отсутствуют параметрические
неизвестные).
При различных / системы (7) отличаются только столб-
цами свободных членов. Поэтому элементарные преобра-
зования строк расширенной матрицы одни и те же при
любых /. Мы можем решать все системы одновременно,
приписав к А столбцы свободных членов всех систем:
аи ... а1ч 1 0 ... О О
I а»1 • • • 0 0 ... 0 I
Из сказанного выше следует: если мы при
элементарных преобразований строк матрицы (9)
тим ее левую половину в единичную матрицу, то ее пра-
вая половина превратится в матрицу Л-1.
Из свойств обратной матрицы укажем следующие: не-
посредственно из определения видно, что
(Д-1)-1 = Л.
Кроме того,
(ЛВ^^В-Ч"’,
(ЛГ)~* = (Л-1)Г.
(9)
помощи
превра-
(Ю)
(11)
Проверим формулу (10): ЛВ(В-1Л-1) = Л (ВВ-1) Л-1 — Ё.
Для доказательства формулы (11) транспонируем обе части
равенства ЛЛ-1 = Е, мы получим (Л-1)ГЛГ = В, откуда
следует доказываемое.
4. Элементарные преобразования как умножение ма-
триц. Детерминант произведения. Каждое элементарное
преобразование строк матрицы Л размеров тхп равно-
сильно умножению Л слева на некоторую квадратную
матрицу порядка т. Именно, рассмотрим матрицу S,, ко-
торая получается из единичной матрицы перестановкой
t-й и /-й строк. Из предложения 1 легко следует, что при
умножении Л слева на St соответствующие строки ма-
трицы Л переставятся.
Пусть S2—матрица, получаемая из единичной заменой
t-й единицы на диагонали на Ху=0. Из предложения 1
следует, что при' умножении Л на Sa слева t-я строка А
умножится на X.
181
Обозначим через Sa матрицу, которая отличается от
единичной заменой на единицу нулевого элемента на пе-
ресечении i-й строки и /-го столбца. Умножение А слева
на St равносильно прибавлению /-й строки А к Z-й.
Заметим, что детерминанты St, St и Sa отличны от
нуля! detSj =—1, detSs = l, detS, = 1. Если матрица А
квадратная, то
det (Sf Л) = — det A, det (5аЛ) = 1 det A, det (S,Я) = det А.
Таким образом, для матриц элементарных преобразований
det (S Л) = det S det А. (12)
Последовательному выполнению элементарных преоб-
разований соответствует умножение слева на произведе-
ние соответствующих матричных множителей.
Элементарные преобразования столбцов Л можно осу-
ществить, умножая Л справа на аналогичные матрицы.
Предложение 8. Если det Л =/= 0, то найдутся
матрицы элементарных преобразований Slt...» Sp такие,
что A = Si.. .Sp.
Доказательство. Если det Л =£ 0, то существует
Л-1. Так как det Л0, элементарными преобразова-
ниями строк матрица Л-1 может быть превращена в еди-
ничную. Поэтому найдутся матрицы элементарных пре-
образований Sf, ...,Sp, для которых S{...SpA"1 —Е.
Очевидно, что это и есть нужные нам матрицы.
Теперь мы можем доказать
Предложение 9. Для любых квадратных матриц
А' и В одного порядка det (АВ) = det Л det В.
Действительно, в случае de^ = O утверждение выте-
кает из оценки ранга произведения матриц (предложе-
ние 5). Если же det Л =# 0, матрицу А можно предста-
вить как произведение матриц элементарных преобразо-
ваний A = St.. .Sp. Теперь, применяя формулу (12), мы
получаем
det(XB) = det (Si...S/)B) =
= det St... det Sp det В = det A det B.
§ 7. Комплексные числа и комплексные матрицы
1. Арифметические операции с комплексными числами.
В дальнейшем нам неоднократно придется иметь дело
с комплексными числами. Поэтому дадим определение и
изложим вкратце основные свойства комплексных чисел.
>82
Комплексным числом мы назовем упорядоченную пару
вещественных чисел (а, Ь). Комплексные числа zf =* (а, Ь)
н z, = (с, d) равны, если а = с и b~d. Вещественные числа
будем считать частным случаем комплексных. Именно,
отождествим вещественное число а с комплексным числом
(а, 0) (но не с (0, а)1).
Сложение комплексных чисел определяется формулой
(oj, ^) + (as, bt + bj,
т. e. так же, как для строк длины 2. Свойства операции
сложения легко следуют из этого определения. Сложение
коммутативно и ассоциативно, прибавление нуля (который
мы отождествили с парой (0, 0)) не меняет комплексного
числа. Комплексное число (—а, —Ь) является противо-
положным числу (а, Ь), т. е. в сумме с ним дает нуль.
Число, противоположное г, мы обозначим —г. Разность
zi—z8 чисел zf и г, определяется как сумма Zj-H—г2).
От строк длины 2 комплексные числа отличаются тем,
что для них определено умножение. Именно, произведением
чисел (ait bt) и (а„ bt) называется число
(а^, fei)(ag, bi) — (aiat—btbt,
В частности, при умножении на вещественное число с
имеем
с (а, Ь) = (с, 0) (a, b) = (са, cb),
как и для строк длины 2. Умножение обладает обычными
свойствами коммутативности и ассоциативности, оно дистри-
бутивно по отношению к сложению. Очевидно, что 1-г = г
для любого комплексного числа г.
Пусть комплексное число z^=(a, b) отлично от нуля.
Эго значит, что а и b не равны нулю одновременно, или
а*=рб 0. Рассмотрим число
* “\а»4-6«’ а*+Ь*)'
Для него
K-i=3fg+g, 2=g+^=(l,0) = l.
а8-|-68 / ' ’ ’
Число z~l назовем обратным к г, а произведение z£-z-1 —
частным от деления г£ на z. Таким образом, возможно
деление на комплексное число, не равное нулю.
2. Число I. Обозначим буквой i и будем называть
мнимой единицей число (0, 1). Согласно определениям
183
операций- слежения и умножения любое комплексное число
(а, Ь) можно представить в виде
(a, b) = (a, 0) + (0, h) = a(l, 0)4-6(0, 1) = а-Ш
Это—принятая запись комплексных чисел, которой мы
будем пользоваться в дальнейшем. Из определения умно-
жения следует, что
i* = (0, 1)(0, 1) = (—1, 0) =—1. (1)
Можно показать, что арифметические операции с комп-
лексными числами производятся как с двучленами, при-
нимая во внимание соотношение (1).
Из равенства (1) видно, что комплексные числа могут
удовлетворить уравнениям, которым никакое вещественное
число не удовлетворяет. Именно, уравнение х2 -}-1 = О,
не имеющее вещественных корней, имеет два комплексных
корня! Xf — i и л, =—i. Очевидно, что, каково бы ни было
отрицательное число а, комплексные числа г1 = »К|а| и
г3 = —i К| а | являются квадратными корнями из а, т. е.
г? = а и z3 = a.
Имеет место следующая теорема, называемая основной
теоремой алгебры: каждый многочлен степени п с комп-
лексными (а в частности и с вещественными) коэффици-
ентами имеет п, вообще говоря, комплексных корней, среди
которых могут быть и совпадающие. На эту теорему мы
будем несколько раз ссылаться. Ее доказательство обычно
приводится в курсах теории функций комплексного пере-
менного.
3. Модуль и аргумент комплексного числа. Рассмотрим
на плоскости декартову прямоугольную систему коорди-
нат О, ех, еа. Мы можем сопоставить комплексному числу
(а, Ь) точку с координатами а и b относительно этой си-
стемы. При этом каждому комплексному числу соответст-
вует точка, каждой точке—комплексное число.
Пусть комплексному числу г = (а, Ь) соответствует
точка М, Обозначим | ОМ | через г, а угол от ех до ОМ,
отсчитываемый против часовой стрелки, обозначим через ф.
Тогда точка М будет иметь координаты (rcoscp, гэшф)
и мы получим
г = г (cos ф i sin ф).
Число г называется модулем комплексного числа г и
обозначается |г|. Модуль—неотрицательное вещественное
184
число. Если z = a + W, то
|z| = /^+F.
| г | равен нулю тогда и только тогда, когда а = 6 = 0, т. е.
г = 0. Если 2 вещественно, то | г |—абсолютная величина г.
Число <р называется аргументом г и обозначается Arg z.
Аргумент z определен не однозначно, а, как и полярный
угол точки в полярной системе координат, с точностью
до слагаемого, кратного 2л.
При помощи простейших формул тригонометрии можно
проверить, что при умножении комплексных чисел их
модули перемножаются, а аргументы складываются.
4. Комплексно сопряженное число. Число а—Ы назы-
вается комплексно сопряженным числу а 4- Ы. Число, комп-
лексно сопряженное z, принято обозначать z. Поскольку
а—(—b)i — a + bi, мы имеем z = z. Отметим следующие
простые, но важные предложения.
1°. Число z вещественно тогда и только тогда, когда
г —г. Действительно, равенство а + Ы — а—Ы показывает,
что 6 = 0.
2°. Произведение числа на комплексно сопряженное!
равно квадрату его модуля!
zz = (a*J*W)(a—Ы) = а* + Ь*. (2)
Следовательно, произведение zz всегда вещественно и не-
отрицательно.
3°. Для любых комплексных г{ и га
zx + za = zi + z„ (3)
ZfZj^ZjZ,. (4)
Чтобы доказать, например, второе из равенств, напишем
Va = (Oi + M) (aa4*M = (“А—bjbt)—i (atb24-bra2)
и
гг z8 = (Oj—b^) (a2—b2i) == (ага2—b^)—l(axb2 4- b2a2).
Первое равенство доказывается аналогично.
По индукции нетрудно показать, что, сколько бы ни
было дано чисел, число, комплексно сопряженное их сум-
ме или произведению, равно соответственно сумме или
произведению комплексно сопряженных им чисел.
4°. Пусть апхп 4-... 4- а±х 4- а0—многочлен с вещест-
венными коэффициентами и Л—его корень. Согласно пре-
185
дыдуЩему из а„Л" + ... Ч-сД + а, ==0 следует
• • • +д1^+ав=а1Лп+ • • • +aA+aes=o.
Таким образом, X—также корень данного многочлена.
Отсюда вытекает, что многочлен с вещественными коэф-
фициентами всегда имеет четное число невещественных
корней. Это предложение имеет такое следствие: любой
многочлен нечетной степени с вещественными коэффици-
ентами имеет хоть один вещественный корень.
5. Комплексные матрицы. Перечисленные в п. 1 свой-
ства четырех арифметических действий над комплексными
числами такие же, как и для вещественных чисел. По-
этому все утверждения о вещественных числах, в кото-
рых используются только эти свойства, распространяются
и на комплексные числа. В частности, мы можем, как и
в § 2, определить детерминант квадратной матрицы, эле-
менты которой—комплексные числа. Это будет комплексное
число, но относительно него будут справедливы все пред-
ложения, доказанные нами в § 2.
При исследовании систем линейных уравнений в §§ 3,
4 и 5 мы пользовались только теми свойствами сложения,
вычитания, умножения и деления, которые совпадают
для вещественных и для комплексных чисел. Поэтому все
доказанное нами справедливо и для систем линейных
уравнений с комплексными коэффициентами и свободными
членами.
На матрицы с комплексными элементами распростра-
няется все сказанное о матрицах в §§ 1 и 6. Определение
и свойства сложения и умножения матриц, включая по-
строение обратной матрицы, формулируются и доказываются
одинаково для вещественных и для комплексных чисел.
Собственно, в предыдущих параграфах этой главы мы
нигде не уточняли, с какими числами имеем дело. Это
было и не нужно, так как все сказанное в одинаковой
мере относится к обоим случаям. Следует только подчерк-
нуть, что, рассматривая линейные комбинации комплекс-
ных столбцов, мы можем брать в качестве коэффициентов
любые комплексные числа.
Остановимся на некоторых особенностях комплексных
матриц. Пусть г^—элементы матрицы Z. Если гЛ/ = аЛ/ +
+ bk/t, то матрица Z может быть представлена в виде
где матрицы А и В составлены из элементов ак} и bk/ со-
ответственно. А называется вещественной частью, а В —
186
мнимой частью матрицы Z. Две комплексные матрицы
Z и Zi равны тогда и только тогда, когда А = и В = Bt.
Таким образом, одно равенство, связывающее комплекс-
ные матрицы, равносильно двум равенствам между веще-
ственными матрицами. Здесь полное сходство о равенст-
вом комплексных чисел.
Матрицу, составленную из элементов zA/, мы будем
называть комплексно сопряженной матрице Z и обозна-
чать Z. Из сказанного в предыдущем пункте видно, что
для любых матриц
+ Z2 = Zi + Z2, (5)
ZiZ2 = Z2 Z2, (6)
detZ = detZ (7)
(если только сумма, произведение и детерминант в одной
из частей равенства определены).
При доказательстве последнего соотношения можно
воспользоваться разложением (6) § 2. Мы получим
detZ== s (-I)W......wZi/i.=
= S (-l)W*......Wzv,...z„/e=detZ.
Равенства (5) и (6) доказываются аналогично.
Матрица вещественна (т. е. состоит из вещественных
чисел) в том и только в том случае, когда она равна своей
комплексно сопряженной, поскольку тогда каждый ее
элемент равен своему комплексно сопряженному.
ГЛАВА VI
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
§ 1. Основные понятия
1. Определение линейного пространства* В этой книге
нам уже встречались множества, в которых были опреде-
лены операции сложения и умножения на число. В гл. X
мы рассматривали множество векторов (направленных
отрезков). Двум векторам по правилу параллелограмма
мы сопоставили вектор, называемый их суммой. Вектору
а и числу а сопоставлен вектор. названный произведе-
нием а на а.
В множестве матриц одних и тех же размеров мы
ввели операцию сложения, назвав суммой матрицу, эле-
менты которой равны суммам соответствующих элементов
слагаемых. Была для матриц введена и операция умно-
жения на число1 произведение матрицы на число есть
матрица, элементы которой—произведения элементов
исходной матрицы на это число. При этом, если элемен-
ты матрицы—комплексные числа, то имеет смысл умно-
жение и на комплексное число. Свойства этих операций,
выраженные предложением 1 § 1 гл. V, совпадают со
свойствами тех же операций е векторами, сформулирован-
ными в предложении 1 § 1 гл. I.
В каждом множестве операции определяются по-свое-
му, но имеют одни и те же свойства: коммутативность и
ассоциативность сложения, дистрибутивность умножения
на число по отношению к сложению чисел и т. д. При
вычислениях в векторами или с матрицами мы не вспо-
минаем определения операций, а используем только эти
свойства. Ниже мы приведем и другие примеры мно-
жеств, в которых определены операции, обладающие теми
же свойствами.
Естественно возникает необходимость исследовать
множество, состоящее из элементов какой угодно приро-
ды, в котором определены операции сложения двух эле-
188
ментов и умножения элемента на число. Эти операции
могут быть определены каким угодно способом, лишь бы
они обладали определенным набором свойств.
Определение. Множество 3 мы назовем лы«вй-
ным пространством, а его элементы—векторами, если!
1) Задан закон (операция сложения), по которому лю-
бым двум элементам х и у из сопоставляется элемент,
называемый их суммой и обозначаемый х-\-у.
2) Задан закон (операция умножения на число), по
которому элементу х из 3 и числу а сопоставляется эле-
мент из 3, называемый произведением х на а и обозна-
чаемый ах.
3) Для любых элементов х, у и г из 3 для любых
чисел «и₽ выполнены следующие требования (или ак-
сиомы)!
1°. х + у4-х.
2°. (x + y) + z = x + (y+z).
3°. Существует элемент о [такой, что для каждого х
из 3 выполнено равенство х-^о^х.
4°. Для каждого х существует элемент — х такой, что
х4-(—х) = о.
5°. а(х-}-у)—ах + ау.
6°. (a4-0)x = ax-i-0x.
7°. а(рх) = (а0)х.
8°. Произведение любого элемента х на число 1 равно
х, т. е. 1х = х.
Если в п. 2) мы ограничиваемся вещественными чис-
лами, то 3 называется вещественным линейным прост-
ранством-, если же определено умножение на любое
комплексное число, то линейное пространство 3 называ-
ется комплексным.
Вектор —х называется противоположным вектору х.
Вектор о называется нулевым вектором или нулем.
Мы будем обозначать векторы строчными латинскими
буквами, а числа, как правило, греческими.
Приведем еще несколько примеров линейных про-
странств.
Пример 1. Рассмотрим множество всех функций от
одной независимой переменной £, определенных и непре-
рывных для Любым двум функциям f(l) и
§(£) из этого множества можно сопоставить их сумму в
обычном смысле слова f(£)4-g(£), которая будет также
определена и непрерывна для 0 1 и, следователь-
но, будет принадлежать рассматриваемому множеству.
Числу а и функции f(%) сопоставляется фуцкция af(l)
189
(обычное произведение функции на число), которая опре-
делена и непрерывна для 1, если этим свойством
обладает /(£). Все восемь аксиом выполнены. Роль нуля
играет функция, тождественно равная нулю.
Пример 2. Пусть &—множество всех многочленов
от одной переменной, степень которых не выше задан-
ного числа п. Сумма двух многочленов из & есть также
многочлен степени не выше п, и произведение многочлена
из S на число принадлежит S. Легко проверить, что
аксиомы линейного пространства выполнены и в этом слу-
чае. Роль нуля играет многочлен, все коэффициенты ко-
торого равны нулю 2 будет вещественным или комп-
лексным линейным пространством, смотря по тому, рас-
сматриваем мы многочлены с вещественными или с комп-
лексными коэффициентами.
Пример 3. Множество комплексных чисел по отно-
шению к обычным операциям сложения и умножения на
комплексное число представляет собой комплексное ли-
нейное пространство. Аналогично, множество веществен-
ных чисел по отношению к обычным операциям будет
вещественным линейным пространством.
Пример 4. Множество комплексных чисел по отно-
шению к обычным операциям сложения и умножения на
вещественное число представляет собой вещественное
линейное пространство.
Пример 5. Существует линейное пространство, со-
стоящее из одного элемента. Такое пространство называ-
ется нулевым. Единственный элемент по необходимости
оказывается нулем и самому себе противоположным. Опе-
рации задаются равенствами o-J-o=«o и <хо=>о.
2. Простейшие следствия. Из аксиом, определяющих
линейное пространство, вытекает, что может быть только
один нулевой вектор и для каждого вектора только один
противоположный. Действительно, допустим, что сущест-
вуют два вектора ot и удовлетворяющих аксиоме 3°.
Тогда их сумма должна быть равна каждому из них:
0i + 0ie°£ = 0»- Аналогично, если какой-нибудь век-
тор х имеет два противоположных —xt и —xv то
сумма (—Xf)4-x4-(—ха) должна быть равна и — xt
и —xt.
Равенство о-|-о==о означает, что противоположным
для нулевого вектора является он сам, а из равенства
(—х) + (х) — о следует, что противоположным вектором
для —х является вектор х.
190
Сумму векторов у и —х мы будем обозначать у—х и
называть разностью векторов у и х.
Легко видеть, что для любого вектора х выполнено
равенство Ох»о. В самом деле,
Ох == Ох 4-х—х = (1 4-0)х—
Отсюда вытекает, что (—1)х=—х для любого х.
Действительно,
(—1)х-|-х = (1— 1)х = 0х=о.
Отметим также, что произведение любого числа на
нулевой вектор равно нулевому вектору, поскольку
ао = а(х—х) = ах—ах = о.
Если ах = о, то либо а = 0, либо х = о. В самом деле,
пусть а*#0. Тогда мы можем умножить данное равенство
на а-1 и получить 1х = о.
Выражение вида c^Xj-f-... 4-а„х„, как и [в преды-
дущих главах, мы будем называть линейной комбинацией
векторов хь ..., х„ с коэффициентами 04, ..., а„.
Из всего вышесказанного следует, что действия с век-
торами в линейном пространстве производятся по тем же
правилам, что ,и действия с векторами (направленными
отрезками) обычного геометрического пространства.
3. Линейная зависимость. По аналогии с соответствую-
щими определениями для векторов и для столбцов, вве-
денными в гл. I и V, мы можем определить линейно за-
висимую и линейно независимую систему векторов в ли-
нейном пространстве. Напомним, что линейная комбина-
ция называется тривиальной, если все ее коэффициенты
равны нулю.
Определение. Система векторов называется ли-
нейно зависимой, если существует равная нулю нетри-
виальная линейная комбинация этих векторов. В против-
ном случае, т. е. когда только тривиальная линейная ком-
бинация векторов равна нулю, система векторов назы-
вается линейно независимой.
О линейно зависимых и линейно независимых систе-
мах векторов справедливы те же предложения, что и о
таких же системах столбцов. Мы приведем здесь только
формулировки, так как доказательства не отличаются от
доказательств предложений о столбцах (см. предложения
2—5 § 1 гл. V).
Предложение 1. Система из А>1 векторов ли-
нейно зависима тогда и только тогда, когда хотя бы один
из векторов есть линейная комбинация остальных.
191
Предложение 2. Если в систему входит нулевой
вектор, то она линейно зависима.
Предложение 3. Если некоторые из векторов, вхо-
дящих в систему, сами по себе образуют линейно зави-
симую подсистему, то вся система линейно зависима.
Предложение 4. Каждая подсистема линейно не-
зависимой системы векторов сама линейно независима.
4. Базис. Следующее определение будет играть важ-
ную роль в дальнейшем.
Определене. Базисом в пространстве мы на-
зовем упорядоченную конечную систему векторов, если)
а) она линейно независима и б) каждый вектор из 3
есть линейная комбинация векторов этой системы.
В определении сказано, что базис—упорядоченная
система векторов. Это означает, что каждому вектору в
базисе приписан определенный номер. Из одной и той же
системы векторов можно получить разные базисы, по-раз-
дюму нумеруя векторы.
Коэффициенты линейной комбинации, о которой идет
речь в определении, называются компонентами или коор-
динатами вектора по базису.
Векторы базиса ei,...,en мы будем записывать в
строку) e=let.. .ея|, а компоненты г, векторам
по базису е—в столбец)
1 & 8
н..|
I I
который назовем координатным столбцом вектора.
Теперь разложение вектора по базису можно записать
в любом из следующих видов 1):
„ р к
I |
Предложение 5. Если задан базис, то'компонен-
ты вектора определяются однозначно.
В самом деле, в противном случае мы имели бы два
равенства х— 2^ и из которых вытекало бы
2(5'—%i)et = о. Поскольку система векторов е1г •
линейно независима, все коэффициенты линейной комби-
нации равны нулю, и, следовательно, при всех I =
== 1, ..., п.
*) Элементы строки е—век-оры, га не числа. Мы можем рас-
пространить на такие строки определения операций с матрицами.
192
Предложение 6, Координатный столбец суммы
векторов равен сумме их координатных столбцов. Коор-
динатный столбец произведения вектора на число равен
произведению координатного столбца данного вектора на
это число.
Для доказательства достаточно выписать следующие
цепочки равенств:
*+У=4- ец == е (I + q)
и
ах = ае^ = в (а£),
где § и q—координатные столбцы векторов хну. Здесь
используются свойства умножения матриц—предложения
3 и 4 § 6 гл. V.
Из предложения 6 легко следует, что координатный
столбец линейной комбинации векторов есть линейная
комбинация их координатных столбцов с теми же коэф-
фициентами. Отсюда вытекает
Предложение 7. Векторы линейно зависимы тог-
да и только тогда, когда линейно зависимы их коорди-
натные столбцы.
Доказательство очевидно: равенство нулю нетриви-
альной линейной комбинации векторов влечет за собой
обращение в нуль линейной комбинации их координат-
ных столбцов с теми же коэффициентами. Так же дока-
зывается и обратное предложение
Теорема 1. Если в линейном пространстве сущест-
вует базис из п векторов, то любой другой базис в этом
пространстве состоит из того же числа векторов.
Действительно, пусть в пространстве существуют два
базиса е1г ....е„ и Д, ...,fm, причем тп>«. Каждый из
векторов базиса ft, ...,fm мы расположим по базису ev...
...,е„ и составим матрицу, столбцами которой будут по-
лученные координатные столбцы. Каждый столбец имеет
высоту п, а всего их т Поэтому матрица имеет размеры
nxm, и ранг ее не превосходит п. В силу теоремы 2 § 4
гл. V столбцы матрицы линейно зависимы, а следователь-
но зависимы и векторы ft, Таким образом, наше
предположение приводит к противоречию.
Теперь мы можем ввести следующее
Определение. Линейное пространство, в котором
существует базис из п векторов, назовем п-мерным, а чис-
ло п—размерностью пространства.
В нулевом пространстве нет базиса, так как система,
состоящая из одного нулевого вектора, является линейно
7-102
193
зависимой. Размерность нулевого пространства ио опре-
делению считаем равной нулю.
Может случиться, что, каково бы ни было натуральное
число т, в пространстве найдется т линейно незави-
симых векторов. Tgkoe пространство называется беско-
нечномерным. Базис в нем не существует.
Примеры. 1) Множество векторов на плоскости яв-
ляется двумерным линейным пространством, а множест-
во всех векторов пространства, изучаемого в элементарной
геометрии, представляет собой трехмерное линейное про-
странство (см. предложения 7 и 8 § 1 гл. I).
2) Линейное пространство столбцов высоты п имеет
размерность п. Действительно, столбцы единичной мат-
рицы порядка п линейно независимы (см. пример на
с. 140) и любой столбец высоты п является их линей-
ной комбинацией (предложение 7 § 1 гл. V). Линейное
пространство столбцов высоты п называют арифметиче-
ским п-мерным пространством.
3) Линейное пространство функций от одного аргу-
мента, определенных и непрерывных на отрезке 0 g 1,
является бесконечномерным. Чтобы это проверить, до-
статочно доказать, что при любом т в этом пространстве
существуют т линейно независимых векторов. Зададимся
произвольным числом т. Векторы нашего пространст-
ва—функции £°ss 1, L 5*, —линейно незави-
симы. Действительно, то, что линейная комбинация этих
векторов с коэффициентами а0, равна нулевому
вектору, означает, что многочлен
+«15+аа£* + • • • +
тождественно равен нулю. А это возможно только тогда,
когда все его коэффициенты равны нулю.
В линейной алгебре изучаются конечномерные линей-
ные пространства. Далее всюду, кроме некоторых при-
меров, мы будем предполагать пространство конечно-
мерным.
В пространстве конечной размерности существует бес-
конечно много различных базисов. Это видно из следую-
щих предложений, которыми мы будем пользоваться и в
дальнейшем.
Предложение 8. В п-мерном пространстве каждая
упорядоченная система из п линейно независимых век-
торов является базисом.
В самом деле, если дана такая система векторов, то
каждый вектор пространства раскладывается по этим
194
векторам, так как иначе в пространстве нашлось бы п +1
линейно независимых 'векторов.
Предложение 9. В п-мерном пространстве каж-
дую упорядоченную линейно независимую систему из
k<n векторов можно дополнить до базиса.
Это вытекает из того, что к любой такой системе мож-
но присоединить еще один вектор, который через нее ли-
нейно не выражается. (Если бы это было не так, то си-
стема сама была бы базисом.) Теперь мы имеем k 4-1
лррейно независимых векторов. Если k 4-1 < п, то повто-
ряем рассуждение. Мы действуем так до тех пор, пока
н$. получим п линейно независимых векторов, в число
которых входят данные k векторов.
В частности, до базиса можно дополнить любой не-
нулевой вектор.
5. Замена базиса. Если в n-мерном пространстве даны
два базиса eit ..., е„ и e'lt ..., е'п, то мы можем разложить
каждый вектор базиса по базису е& ...,e„i
ei-ioief (/==!, ..., n). (1)
Компоненты можно записать в виде квадратной матри-
цы порядка п!
Столбцы матрицы—это координатные столбцы векторов
е[, .... е'п по базису е. Поэтому столбцы матрицы <$ ли-
нейно независимы и detSy=O.
Определение. Матрицу, /-й столбец которой есть
координатный столбец вектора e't по базису е, мы назо-
вем матрицей перехода от базиса е к базису е'.
Равенство (1) можно переписать в матричных обоз-
начениях!
|е[.. .еп[в*[et.. .еп|S, (2)
или
е' == eS.
Это легко проверить, перемножая матрицы. Умножая обе
части равенства (2) на матрицу S”* справа, мы получим
e«=e'S"*.
7*
195
Отсюда следует» что S-» будет матрицей перехода от
«' к е.
Предложение 10. Пусть задан базис е. Каждая
матрица S с детерминантом, не равным нулю, служит
матрицей перехода от е к некоторому базису е'.
Действительно, если det S =/= 0, столбцы матрицы S ли-
нейно независимы. Они служат координатными столбца-
ми п линейно независимых векторов, которые и составля-
ют нужный нам базис е'.
.. Вычислим, как связаны между собой компоненты од-
ного и того же вектора в двух базисах е и е'. Рассмот-
рим вектор х и обозначим через & и его координатные
столбцы в базисах е и е'. Это означает, в частности, что
ж = Подставим сюда выражение е' через е и матрицу
перехода S от базиса е к базису е'. Мы получим х =
=ч eSfc'. Но, с другой стороны, х — е^. Сравнивая два пос-
ледних выражения, в силу единственности разложения
вектора по базису имеем
быть переписана в виде
Подробнее эта формула может
НЧ jab.
h” м’’
или, если выполнить умножение матриц,
п). (4)
/е1
Этот результат мы уже имели для трехмерного простран-
ства (формула (2) § 4 гл. I).
§ 2. Линейные подпространства
1. Определение и примеры. В обычном геометриче-
ском пространстве сумма векторов, лежащих в некоторой
плоскости, также лежит в этой плоскости, и умножение
вектора на число не выводит его из плоскости, в которой
он лежит. Теми же свойствами обладают векторы, лежа-
щие на прямой линии. Для линейных пространств обоб-
щением плоскости и прямой служат линейные подпро-
странства.
Определение. Непустое множество векторов
в линейном пространстве 2 называется линейным под-
196
пространством, если: а) сумма любых векторов из S'
принадлежит S' и б) произведение каждого вектора из
S' на любое число также принадлежит S’.
Читатель без труда докажет, что в силу этого опреде-
ления любая линейная комбинация векторов из ^"'при-
надлежит В частности, нулевой вектор, как произве-
дение Ох, должен лежать в Jzr. Точно так же для каждого
вектора х из S' противоположный вектор, равный —1х,
лежит в S'.
• Сложение и умножение на число, определенные в про-
странстве S, будут такими же операциями в его подпро-
странстве S'. Справедливость аксиом линейного прост-
ранства для прямо вытекает из их справедливости
в S. Таким образом, каждое линейное подпространство
салю является линейным пространством.
Пример 1, Пусть дано некоторое множество 3* век-
торов в линейном пространстве S. Обозначим через S'
совокупность всевозможных линейных комбинаций, каж-
дая из которых составлена из конечного числа векторов,
принадлежащих 9*. Множество S'- является подпрост-
ранством в S. Действительно, если х и у принадлежат
S', то
k т
где все pt и принадлажат 5». Мы видим, что х (-«/=:
= У} k/Pz + SlM7’ т-е' сумма снова является линейнойх
комбинацией конечного числа векторов из 3*. Точно так
же для вектора имеем (а^,) Pi-
Так построенное подпространство S? называется ли-
нейкой' обоЛЬчкой множества 3*.
Пусть ..., рт—линейно независимая система век-
торов из 3*, обладающая тем свойством, что каждый век-
тор из 3* есть линейная комбинация этих векторов. (Если
пространство конечномерно, то очевидно, что в каждом
множестве, содержащем ненулевые векторы, такая система
найдется.) Векторы рг, .... рт образуют базис в линей-
ной оболочке множества 3*. В самом деле, каждую ли-
нейную комбинацию векторов из 9* множно представить
как линейную комбинацию векторов pt, ..., рт, так как
каждый вектор из 3* можно разложить по р/, .... рт и
подставить эти разложения в рассматриваемую линейную
комбинацию.
В частности, если 5*—конечное множество векторов,
мы имеем отсюда
19?
Предложение 1. Размерность линейной оболочки
конечного множества векторов не превосходит числа этих
векторов.
Пример 2. Рассмотрим однородную систему линей-
ных уравнений с п неизвестными. Совокупность всех ре-
шений этой системы представляет собой подпространство
в линейном пространстве столбцов высоты п.
Для доказательства достаточно сослаться на свойства
решений однородной системы (предложение 3 § 5 гл. V).
Каждая фундаментальная система решений рассмат-
риваемой системы уравнений является базисом в этом
подпространстве.
Пример 3. В каждом линейном пространстве мно-
жество, состоящее из одного нулевого вектора, является
линейным подпространством. Это подпространство назы-
вается нулевым.
Пример 4. Множество, состоящее из всех векторов
пространства является подпространством, т. е. все про-
странство можно считать и подпространством.
Предоставим читателю проверить определение в двух
последних примерах.
Предложение 2. Пусть S'—подпространство
п-мерного линейного пространства Sn. Тогда S' имеет
размерность k^.n. Если k = n, то S' совпадает с Sп.
Доказательство нужно только для того случая, когда
S'—ненулевое подпространство. В этом случае мы мо-
жем, исходя из любого ненулевого вектора, построить
базис в S' так, как это сделано в доказательстве пред-
ложения 9 § 1. Процесс построения должен закончиться
не дальше, чем на n-м векторе, так как каждая линейно
независимая система в S' есть такая же система в Sn
и, следовательно, не может содержать более п векторов.
Пусть базис в 3* содержит п векторов. Тогда любой
вектор из Sn раскладывается по этому базису и, таким
образом, принадлежит S'. Мы видим, что подпростран-
ство 3' совпадает с Sп.
Поскольку S' есть линейная оболочка своего базиса,
из предложения 2 вытекает, что каждое подпространство
конечномерного пространства есть линейная оболочка
конечного множества векторов. Это относится и к нуле-
вому подпространству, так как оно—линейная оболочка
нулевого вектора.
Сформулируем еще следующее достаточно очевидное
Предложение 3. Пусть S'—подпространство в
п-мерном пространстве S. Если базис eit в S1
198
дополнить до базиса еь .... ек, e.+f, ..е„ в2, то в ба-
зисе et, .... е„ осе векторы из 2' и только такие векто-
ры будут иметь компоненты Е*+1=0, £"=«0.
Действительно, если для вектора х имеем Е*+| = 0, ...
..., Е" = 0, то х— Е1е, 4-... 4- Е*** и, следовательно, ле-
жит в J?'. Обратно, вектор х из 2' раскладывается в ли-
нейную комбинацию х = Е1^ 4* • • 4- Е*г*. Это же разло-
жение будет разложением по базису eit ..., е„, если поло-
жить Е*+1 = 0, Еп==0.
Заметим, что равенства Е*+х = 0, ..., Е" = 0 можно рас-
сматривать как систему линейных уравнений, связываю-
щую координаты вектора х. Это—система ранга п—k,
и множество ее решений—подпространство 2'. Нетрудно
показать, что 2' и в любом базисе определяется одно-
родной системой уравнений ранга п—k. Действительно,
при изменении базиса старые компоненты вектора выра
зятся через новые по формулам (4) § 1 и в новом базисе
система уравнений примет вид
Sa?+V = 0....... So?E'' = 0.
t=i f-i
Ранг этой системы равен также п—k, поскольку строки
матрицы перехода линейно независимы. Итак, мы дока-
зали
Предложение 4. Пусть в п-мерном пространстве
2 выбран базис. Тогда координатные столбцы векторов,
принадлежащих k-мерномц подпространству 2', удов-
летворяют однородной системе линейных уравнений
ранга п—k1).
2. Сумма и пересечение подпространств. Рассмотрим
два подпространства 2' и 2я одного линейного прост-
ранства 2.
Определение. Будем называть суммой подпро-
странств 2' и 2я и обозначать 2* +2* линейную обо-
лочку их объединения 2' и 2я.
Подробнее определение означает, что вектор х из
2' -\-2" (и только такой) представим в виде№5а/Р/ +
4- S гДе векторы р( лежат в 21, а векторы —в 2".
Обозначая написанные выше суммы через х* и х”, мы
видим, что подпространство 2'-±-2" состоит из векто-
*) При X'™ Ж система имеет ранг 0, т. е. не содержит ни од-
ного нетривиального уравнения.
199
ров, представимых в виде х = х' + х", где х'—вектор из
a Z—из S".
Пусть размерности подпространств S' и S" равны k
и /. Выберем базис en ек в S' и базис
в S”. Каждый вектор из S' + S" раскладывается по век-
торам ек, ..ек, flt .... ft. Мы получим базис в
если удалим из этой системы векторов те векторы, кото-
рые линейно выражаются через остальные. Сделать это
можно, например, так.
Выберем какой-либо базис в пространстве S и соста-
вим матрицу из координатных столбцов всех векторов
•, ek, fu ft. Те векторы, координатные столбцу
которых содержат базисный минор этой матрицы, состав-
ляют базис в ^'4-=?" Доказательство не сложно, и мы
его предоставим читателю.
Определение. Назовем пересечением подпрост-
ранств S' и S" и обозначим S' [\S" множество векто-
ров, которые принадлежат одновременно обоим подпрост-
ранствам
Пересечение S'(\S” есть подпространство.
Действительно, если векторы х и у лежат в S'
то они лежат и в S' и в S" Поэтому вектор х-\-у и
при любом а вектор ах также лежат и в S' ив S",
а следовательно, и в S'ftS".
В конечномерном пространстве S подпространства S'
и S'” задаются системами уравнений. Их пересечение за-
дается системой, получаемой объединением всех уравнений
из систем, определяющих S' и S". Фундаменталь-
ная система решений такой системы уравнений—базис
в подпространстве S'nS".
Теорема 1. Размерность суммы двух подпространств
равна сумме их размерностей минус размерность их пе-
ресечения.
Доказательство, Пусть S' и S"—два подпро-
странства в пространстве S конечной размерности. Рас-
смотрим в их сумме S' + S" следующую систему векто-
ров Если пересечение S'(}S"— ненулевое пространство,
го возьмем базис elt . ., ек в S'(}S" и дополним его
векторами /п ..., ft до базиса в S' и векторами
до базиса в S". Если же S'(\S" — нулевое простран-
ство, то просто берем объединение базиса в S' и базиса
в S" Докажем прежде всего, что каждый вектор х в
S' + S" является линейной комбинацией выбранных на-
ми векторов Это следует из того, что х = х'4-х", где х'
лежит в S', а х"—в S". Тогда х* разлагается по век-
200
торам et, ek, а х*—по векторам ef, ,.., ek<
St> • • •» S»’
Теперь покажем, что рассматриваемая система векто-
ров линейно независима. Возьмем какую-нибудь равную
нулю линейную комбинацию этих векторов!
S «‘ft 4- S ₽'*/ 4- S Гёз - л О)
Вектор лежит в .5?*. Но, очевидно, х=°>
р и поэтому х лежит и в «2”. Таким
образом, вектор х должен находиться в пересечении
Отсюда на основании предложения 3 можно
заключить, что а1» ,., = 0 и у* =»... =«ует =»0. В ра-
венстве (1) остаются только члены
если 3' П 3* =/* о. Но и их коэффициенты равны нулю,
так как векторы ех, ...» линейно независимы. Таким
образом, линейная комбинация (1) обязательно тривиаль-
ная и все векторы линейно независимы. Мы показали,
что система векторов fit .... ft, ef, ..., ек, git ..., ga
является базисом в подпространстве 31+3в.
Теперь закончить доказательство не представляет
труда. В самом деле, размерность 31 равна /+&, раз-
мерность 3" равна k 4- т, размерность З'{\3” есть k,
а размерность суммы З'+З", как мы показали, равна
k 4» 14» tn.
Из теоремы 1 следует, в частности, что два подпрост-
ранства, сумма размерностей которых больше п—размер-
ности всего пространства, обязательно имеют ненулевое
пересечение. Действительно, размерность их суммы не
может превосходить п.
3. Прямая сумма подпространств. Если пересечение
подпространств 3‘ и «S’'—нулевое подпространство, то
сумма З'+З" называется прямой суммой и обозна-
чается 3'^3” или З'^З*.
Размерность прямой суммы равна сумме размерностей
слагаемых. Пусть .... ft—базис в 3', a glt ..., g„—
базис в 3*. Из доказательства теоремы 1 видно, что си-
стема векторов fj[, .... fi, gi, .... ga является базисом в
З'&З".
Предложение б. Каждый вектор х в прямой
сумме 3' ф 3я раскладывается в сумму векторов х'из 3'
и х* из 3* единственным образом.
201
Действительно, если мы имеем два таких разложения
Х^х’+х" и хв/-|-/, то х'—у' == if—х". Ясно, что
вектор х'—у'£2', но он равен у— хги, следовательно,
принадлежит J?’. Таким образом, к'— g 2'[\2”,
откуда х1*=у' и х"
В заключение параграфа отметим, что понятия суммы
И пересечения подпространств легко могут быть распро-
странены на любое конечное число подпространств.
Сумма нескольких подпространств называется прямой
суммой, если каждое из них имеет нулевое пересечение
о суммой остальных.
§ 3. Линейные отображения
1. Определение. Пусть 2 и 2—два линейных прост-
ранства, оба вещественные или оба комплексные. Под
отображением А пространства 2 в пространство 2
понимается закон, по которому каждому вектору из 2
сопоставлен единственный вектор из 2. Мы будем пи-
сать коротко А! 2—*2. Образ вектора х обозначается
А(х).
Определение. Отображение А; 2—*-2 назы-
вается линейным, если для любых векторов х и у из 2
И любого числа а выполнены равенства
А(х + у) = А(х)4*А(у), А(ах)«аА(х). (1)
Следует подчеркнуть, что знак « + » в правой и левой
частях первой из формул (1) обозначает две, вообще го-
воря, различные операции! сложение в пространстве 2
и сложение в пространстве 2. Аналогичное замечание
относится и ко второй формуле.
Из определения немедленно вытекает, что при линей-
ном отображении линейная комбинация векторов перехо-
дит в такую же линейную комбинацию их образов.
Линейное отображение мы будем называть линейным
преобразованием, если пространства 2 и 2 совпадают.
Приведем несколько примеров линейных отображений.
1) Пусть X—фиксированное число. Сопоставим каж-
дому вектору х пространства 2 вектор Хх. Легко видеть,
что это линейное преобразование.
2) При аффинном преобразовании плоскости двумер-
ное пространство векторе», в ней лежащих, отображается
само на себя. При этом сумма векторов переходит в сумму
202
образов, а результат умножения вектора на число—в про-
изведение его образа на это же число.
3) Выберем в л-мерном вещественном линейном про-
странстве Зп какой-нибудь базис. Эго сопоставит каж-
дому вектору его координатный столбец и, следовательно,
определит линейное отображение рассматриваемого про-
странства в пространство столбцов высоты п.
Если мы сопоставим каждому вектору его первую
компоненту, то получим отображение пространства 3„
в линейное пространство 91 вещественных чисел. В силу
правил действий с компонентами векторе» такое отобра-
жение является линейным. Линейные отображения Зп —*
—♦54 называются линейными функциями на Мы бу-
дем изучать их ниже, в гл. VIII.
4) пусть С®[— 1, 1] и С° [0, 2]—пространства функ-
ций, непрерывных соответственно на отрезках [—1, 1]
и [0, 2]. Сопоставим функции /(х) из С®[—1, 1] функцию
/(х-{-1) из С® [0, 2]. Так построенное отображение, оче-
видно, является линейным. Менее тривиальный пример
можно получить, сопоставив каждой функции из С®[—1, 1]
ее первообразную F (х), удовлетворяющую условию
F (0) = 0.
5) Рассмотрим л-мерное арифметическое пространство
91 п (пространство столбцов высоты л) и прямоугольную
матрицу А размеров т х л. Сопоставим каждому столбцу |
из 91п столбец Д|. Он имеет высоту т. Таким образом,
будет определено отображение 9Ln в 91т. В силу свойств
умножения матриц это отображение—линейно.
6) Отображение, сопоставляющее каждому вектору
нулевой, является линейным. Оно называется нулевым
отображением.
В дальнейшем в этом параграфе буквы л и т будут
обозначать размерности пространств 3 и 3 соответст-
венно.
Докажем следующее общее свойство линейных отобра-
жений.
Предложение 1. При линейном отображении А1
— линейное подпространство 3‘ из 3„ переходит
в линейное подпространство А(31) из Зт, причем раз-
мерность А (3') не превосходит размерности З1.
В самом деле, пусть q, .... е*—базис в Зъ. Для лю-
бого вектора х из 31 имеем х = £4+---+£4, и, сле-
довательно,
А (х) = A G4 + ... + 54) - ГА 4) + • • + ГА 4). (2)
203
Эго означает, что произвольный элемент множества A(j2")
образов всех векторов из J?' есть линейная комбинация
векторе» A (ej, ..., А (е*). Наоборот, каждая такая ли-
нейная комбинация, очевидно, является образом вектора
из 3' Итак, множество A(j?') совпадает с линейной
оболочкой векторе» А (^), .... А (е„) и, следовательно,
есть подпространство. Размерность этого подпространства
не превосходит k в силу предложения 1 § 2.
Необходимо отметить частный случай доказанного
предложения: множество образов всевозможных векторов
из является подпространством в Зт.
Мы обозначим это подпространство К{3„) и будем
называть множеством значений отображения.
Определение. Размерность множества значений
отображения А называется рангом этого отображения.
Если ранг А равен т, т. е. A(j?n) совпадает с Зт,
то каждый вектор из 3 т является образом некоторого
вектора из Зп. Отображение, обладающее этим свойст-
вом, называется наложением или сюръективным отобра-
жением.
Предложение 2. Множество векторов из 3„, пе-
реходящих в нулевой вектор при отображении А, является
линейным подпространством в 3п.
Эго очевидно: если два вектора переходят в нулевой
вектор, то и их сумма переходит в нулевой вектор. Если
А(х) = о, то А(ах)«=ао = о.
Опре де лени е. Поди ространство векторов, отобра-
жающихся в нулевой вектор, называется ядром отобра-
жения А.
Ядро отображения не может быть пустым множест-
вом: оно во всяком случае содержит нулевой вектор.
Действительно, А(о)«= А(0х) = 0А (х) = о. Если размер-
ность ядра отлична от нуля и ядро содержит хоть один
ненулевой вектор, то в Зт существуют векторы, имею-
щие не один прообраз, а по меньшей мере два (таким
является, например, нулевой вектор из 3т\ Верно и об-
ратное утверждение: если существует вектор х, который
имеет два различных прообраза, т. е. А(х) = А(у) = х,
то ядро А содержит ненулевой вектор. Действительно,
в этом случае х—у^о и А(х—у) —о.
Отображение, при котором разные векторы имеют раз-
личные образы» называется вложением или инъективным
отображением. Итак, мы получили
204
Предложение 3. Отображение является вложе-
нием тогда и только тогда, когда егд ‘ядро—нулевое под-
пространство.
2. Координатная запись линейных отображений. Рас-
смотрим линейные пространства и размерностей
п и т и отображение А: —>^т. Пусть eif ...,е„ —
базис в пространстве 3п. Тогда образ произвольного век-
тора х = ^ + ...-Н"ео может быгь представлен в виде
А(х) = ^А(е1)Ч-...4-|»А(ея). (3)
Значит, А(х) может быть найден по компонентам х, если
известны п векторов А(ег), А(е„) в Sт.
Выберем базис также и в пространстве 3?т. Пусть
это Д, Каждый из векторов А(е.) мы можем раз-
ложить по этому базису:
F±=l
Если компоненты А (х) по базису f мы обозначим
Ч1, ..., т)т, то равенство (3) может быть переписано так:
т
S = S S'ccf/
p=i и р
Отсюда, в силу единственности разложения по базису,
S aft (4)
/ = 1
для любых р=1, ..., т.
Если мы составим матрицу А из чисел а?, то равен-
ства (4) могут быть записаны в матричной форме:
(б)
или, подробнее,
11)1 | I а* ... а\ || £* I
П"1 |аГ ... ай‘|1 Еп Г
Здесь координатный столбец образа (в базисе /) выражен
как произведение матрицы размеров т%п на координат-
ный столбец прообраза (в базисе е). Это полезно срав-
нить с примером 5) предыдущего пункта.
Определение. Матрицей линейного отображения
A: <2п —► в паре базисов ей/ называется матрица,
205
столбцы которой (в их естественном порядке)—коорди-
натные столбцы векторов A (et), ..., А (е„) по базису /.
Матрица А, которую мы построили выше из элемен-
тов а?, как раз является матрицей отображения А в рас-
сматриваемой паре базисов.
Матрица линейного отображения в следующем смысле
однозначно определена; если для любого вектора х=е%
координатный столбец образа А (х) в базисе / есть т]=В|,
то столбцы матрицы В—координатные столбцы векторов
А(е>) и матрица В совпадает с матрицей А.
Это утверждение нетрудно проверить. Умножим мат-
рицу В на координатный столбец вектора ej, т. е. на /-й
столбец единичной матрицы порядка п. Очевидно, что
произведение равно /-му столбцу В, и это есть коорди-
натный столбец A(ez).
Пример 5) показывает, что при выбранных базисах е
и / каждая матрица размеров тхп служит матрицей
некоторого линейного отображения —+ 3 т.
Итак мы видим, что выбор базисов в пространствах
3? п и Зт устанавливает взаимно однозначное соответствие
между линейными отображениями 3?п в & т и матрицами
размеров /пхп.
Предложение 4. Ранг матрицы линейного отобра
жения равен рангу этого отображения.
Доказательство. Пусть /f, ..., /,—номера столб
цов, в которых расположен базисный минор матрицы А
линейного отображения А Это значит, что векторы
A(eZ1), ...,А(е/г) линейно независимы и каждый вектор
А (в/) (t=l, ...,п) есть их линейная комбинация. Следо-
вательно, мы можем выразить образ любого вектора А(х)
только через A (eft), ..., А (е/г) Таким образом, эти век-
торы образуют базис в множестве значений отображения
А и их число равно размерности А(^п), т. е. рангу ото-
бражения. Предложение доказано.
Из предложения 4 следует, что ранг матрицы линей-
ного отображения один и тот же, какую бы пару базисов
мы ни выбрали.
Воспользуемся координатной записью линейного ото-
бражения для доказательства следующего предложения.
Предложение 5 Сумма ранга отображения и
размерности его ядра равна размерности отображаемого
пространства.
Доказательство. Согласно формуле (5) ядро ото-
бражения определяется однородной системой линейных
206
уравнений = о с п неизвестными. Как видно из пред»
ложения 4, ранг матрицы этой систему равен рангу ото*
Сражения г. Пусть размерность ядра равна d. Из свой-
ства множества решений однородной системы уравнений
тогда вытекает, что d = n—г. Предложение доказано.
В частности, равенство r — п необходимо и достаточно
Для того, чтобы отображение имело нулевое ядро, т. е.
было вложением.
Напомним, что отображение называется взаимно од-
нозначным, если каждый вектор к из является обра-
зом одного и только одного вектора х из Зп. Это озна-
чает, что взаимно однозначное отображение является
одновременно и вложением и наложением. Для вложения
r — п, а для наложения г = /и. Итак, имеет место
Предложение 6. Отображение A: 3? п —*3?л вза-
имно однозначно тогда и только тогда, когда размер-
ности пространств совпадают и равны рангу отображения.
Это предложение легко получить и из исследования
системы линейных уравнений (4): взаимная однозначность
отображения означает, что эта система имеет единствен-
ное решение § при любом столбце свободных членов ц.
3. Изоморфизм линейных пространств. Дадим следую-
щее
Определение. Взаимно однозначные линейные
отображения линейных пространств называются изомор-
физмами. Если существует изоморфизм 3 на 3?, то
пространства 3 и 3? называются изоморфными.
Из предложения 6 следует, что для того чтобы два
пространства были изоморфны, необходимо, чтобы их
размерности совпадали. Оказывается, что условие является
и достаточным, т е. имеет место следующая теорема об
изоморфизме.
Теорема 1. Два вещественных пространства изо-
морфны тогда и только тогда, когда их размерности
равны. То же верно и для комплексных пространств.
Нам остается доказать только достаточность условия.
Пусть 3 и 3—два n-мерных линейных пространства.
Если в каждом из них выбран базис, то любая квадрат-
ная матрица порядка п определяет некоторое отображе-
ние 3 в 3 по формуле (5). Это отображение будет изо-
морфизмом, если ранг матрицы равен п. Итак, чтобы за-
дать изоморфизм на 3, достаточно выбрать в этих
207
пространствах базисы и задать матрицу ранга п (т. е.
в детерминантом, отличным от нуля).
Значение теоремы об изоморфизме состоит в следую-
щем. Линейные пространства могут состоять из чего
угодно—столбцов, многочленов, чисел, направленных
отрезков, функций, матриц,— природа их элементов роли
не играет, когда изучаются только их свойства, связан-
ные с операциями сложения и умножения на число Все
эти свойства у двух изоморфных пространств совершенно
одинаковы. С алгебраической точки зрения изоморфные
пространства тождественны. Если мы условимся не раз.
личать между собой изоморфные пространства, то в сиду
теоремы об изоморфизме для каждой размерности найдется
только одно линейное пространство
4. Изменение Матрицы линейного отображения при
замене базисов. Рассмотрим линейное отображение А:
2 п —Если 2п и 2п выбраны соответственно ба-
зисы е и f, то А определяется матрицей А. Пусть другая
пара базисов е' и /' связана о е и / матрицами перехода
5 и Р. В базисах е' и /' отображение А имеет матрицу
А'. Наша задача—найти связь между матрицами А и Д'.
Рассмотрим произвольный вектор х из пространства
2п и его образ у — К(х) Обозначим координатные столбцы
х в базисах е и е' соответственно через £ и а коор-
динатные столбцы вектора у в базисах f и /' через т]
и I}'. Согласно формуле (3) § 1 мы имеем следующую
•связь старых и новых координатных столбцов рассмат-
риваемых векторов:
Подставив эти выражения в формулу (5), мы получим
Рх\ = Д5|'. Поскольку матрица перехода всегда имеет
обратную, мы можем найти if из этого равенства: q'=
=Р~ХД5£'- Но, с другой стороны, if = Д'§' по определе-
нию А'. Так как матрица линейного отображения для
данной пары базисов однозначно определена, мы получаем
Д'«Р-1Д5. (б)
Это и есть искомая связь между матрицами А и Д'.
Если обозначить элементы матриц Д и Д' через af
и а}1, а элементы Р~1 и S соответственно через рь и of,
то матричное равенство (6) можно переписать в виде тп
208
числовых равенств!
а/ = S <7)
Здесь индексы принимают следующие значения! I, k=
= 1, ..., т\ /, /= 1, ..п.
5. Канонический вид матрицы линейного отображения.
Как видно из формулы (6), матрица линейного отображе-
ния Aj Зп —► -Й’п может существенно изменяться при
замене базисов в Зп и 3т. Естественно возникает во-
прос, как выбрать базисы в 3 п и 3т с тем, чтобы мат-
рица линейного отображения А имела наиболее простой
вид.
Теорема 2. Для любого линейного отображения Aj
Зп —* 3„ можно так выбрать базисы е и f в простран-
ствах Зп и Зт, что матрица отображения будет иметь
вид *)
где Ег—единичная матрица порядка г.
Доказательство Пусть ранг отображения А ра-
вен г. Базис е в пространстве Зп, мы выберем следую-
щим образом! векторы er+1, мы поместим в ядре
отображения А (его размерность как раз равна п—г),
а векторы eit . ..,е, можем выбрать произвольно В силу
такого выбора, каков бы ни был базис f в пространстве
Зт, последние п—г столбцов матрицы будут нулевыми.
Так как ее ранг равен г, первые г столбцов должны быть
линейно независимыми. Это означает, что линейно неза-
висимыми будут векторы Afo), .,.,А(еД Примем их
за первые г базисных векторов в пространстве 3ni
=А(еД .... f, >=А(е,), а остальные векторы fr+t, ...
..., fm можем выбрать произвольно При таком выборе
базиса первые г столбцов матрицы будут первыми г столб-
цами единичной матрицы порядка т. Это и есть вид (8)
для матрицы отображения
6. Сумма и произведение отображений. Рассмотрим
два линейных отображения А’ 3—>-3 и В: 3—^3.
Назовем суммой отображений А и В и обозначим через
*) Если г=т или r=nt в матрице (8) нет нулевых отрок или
соответственно столбцов.
209
А + В отображение С; 3—+3, определяемое равенст-
вом С (х) = А (х) + В (х). Не представляет труда прове-
рить, что С—.линейное отображение. Действительно,
если в 3 и 3 выбраны базисы, то координатные столбцы
векторов А(х) и В(х) запишутся через матрицы отобра-
жений как и В%. Следовательно, С(х) будет иметь
координатный столбец Л£ + М = (Д+ #)£• Итак, А+В —
линейное отображение и его матрица равна сумме матриц
отображений А и В.
Произведение линейного отображения А: 3 —► 3 на
число а определяется как отображение В: 3 —+ 3, сопо-
ставляющее вектору х вектор аА(х). Нетрудно проверить,
что оно линейное и имеет матрицу аД, если А—матрица А.
Результат последовательного выполнения двух линей-
ных отображений К'. 3 ~* 3 и В: 3 —* 3 называется
их произведением и обозначается В о А (отображение,
которое делается первым, пишется справа). Разумеется
В о А отображает 3 в 3 и является линейным отобра-
жением.
Пусть в пространствах 3, 3 и 3 выбраны базисы
соответственно е, f и g. Обозначим через А матрицу ото-
бражения А в базисах е и f, а через В матрицу В в ба-
зисах f и g
Предложение 7. Отображение В о А имеет матри-
цу В А в базисах е и g.
Для доказательства рассмотрим координатный столбец
£ произвольного вектора х из 3. Координатные столбцы
векторов А(х) и В(А(х)) обозначим соответственно через
т) и £. Тогда по формуле (5) т)=Д£ и £ = Вт] = ВА%, как
нам и требовалось.
Поскольку ранг отображения совпадает с рангом его
матрицы, отсюда н из оценки ранга произведения матриц
(предложение 5 § 6 гл. V) следует
Предложение 8. Ранг произведения отображений
не превосходит рангов сомножителей.
Произведение отображения А на число можно рассмат-
ривать как его произведение на линейное преобразование,
состоящее в умножении всех векторов на это число (см.
пример 1) на с. 202).
Свойства сложения и умножения отображений легко
вытекают из соответствующих свойств умножения матриц,
и мы не будем на них останавливаться. Предоставим чита-
210
телю сформулировать и доказать, например,- свойство
ассоциативности умножения отображений.
Пусть дано линейное отображение Ai 2„-+2т. Ли-
нейное отображение Di Sm —♦ Sn мы назовем обратным
для А и будем обозначать А”1, если ВоА = Е и АоВ=Ё,
где Е и Ё—тождественные преобразования пространств
и 2 т. Иначе говоря, для каждого к из S,, должно
быть В(А(х)) = х и А(В((/))=>|/—для каждого у из &т.
Предложение 9. Линейное отображение А имеет
обратное тогда и только тогда, когда оно—изоморфизм.
Доказательство. Пусть А—изоморфизм. Тогда
его ранг удовлетворяет условию и к системе
уравнений связывающей координаты образа и
прообраза в некоторой паре базисов, применимо правило
Крамера. Она имеет единственное решение при любом
столбце свободных членов. Рассмотрим отображение Bj
сопоставляющее вектору у с координатным
столбцом т| вектор х с координатным столбцом равным
решению этой системы Л“4|. Поскольку столбец
получается из я умножением на матрицу, отображение
В является линейным. Очевидно также, что всегда
В(А(х))-»х и А (В (z/)) == г/. Итак, отображение В—обрат-
ное для А.
Пусть теперь А—не изоморфизм. Тогда либо г <т,
либо г < п. В первом случае в % т существует вектор и,
не принадлежащий А(=27п). Если бы существовало обрат-
ное отображение, мы имели бы и «= А (А-1 (и)) € А (.&„),
что противоречит выбору и. Во втором случае существует
вектор г^=о, принадлежащий ядру А. Если бы сущест-
вовало обратное отображение, мы получили бы противо-
речащее выбору г равенство г = А-’(А(г)) = о. Предло-
жение доказано.
При доказательстве первой части предложения мы
нашли матрицу отображения А”1. Именно, если отображе-
ние А в базисах ей/ имеет матрицу Л, то отображение
A-i в базисах f и е имеет матрицу Л-1.
§ 4. Задача о собственных векторах
1. Линейные преобразования. В предыдущем параграфе
мы назвали линейным преобразованием линейное ото-
бражение, которое отображает пространство само в себя.
Все результаты об отображениях, полученные в § 3, вер-
211
ньг и для Преобразований, ио здесь должны быть сделаны
существенные оговорки, касающиеся координатной записи
преобразования.
Именно, записывая в координатах линейное отображе-
ние A: 3—*3, мы выбираем базисы в обоих простран-
ствах 3 и 3. Если пространства 3 и 3 совпадают,
естественно пользоваться одним и тем же базисом для
образов и Для прообразов. Поэтому дается следующее
Определение. Матрицей линейного преобразования
А: 3 —+3 в базисе e—fa ... е„1 называется матрица,
столбцы которой—координатные столбцы векторов
А (с,), ..., А (е„) по базису е.
В соответствии с этим определением формула (6) § 3
для матрицы преобразования принимает вид
H' = S-MS. (1)
Множество матриц Л', получаемых из данной матрицы
А по формуле (1) при различных S, уже, чем множество
матриц, получаемых из той же А по формуле (6) § 3 при
не связанных между собой матрицах перехода S и Р.
Отсюда вытекают особенности координатной записи пре-
образований. Главнейшая из них состоит в том, что в
более узком множестве, вообще говоря, не найдется мат-
рицы канонического вида (8) § 3 и теорема 2 § 3 неверна
для преобразований.
Не следует думать, что это—случайное обстоятель-
ство, связанное с «неудачным» определением матрицы пре-
образования. Матрица отображения определяет это ото-
бражение, и потому все свойства отображения содержатся^
среди свойств его матрицы. Свойствами отображения
являются те свойства матрицы, которые инвариантны,
т. е. не меняются при переходе к другой паре базисов.
Остальные свойства матрицы определяются не только
отображением, но и парой базисов. Теорема 2 § 3, по су-
ществу, означает, что при фиксированных пространствах
3 и 3 единственным инвариантным свойством отобра-
жения является его ранг, поскольку все отображения
одного ранга в подходящих парах базисов записываются
одной и той же матрицей.
Линейные преобразования имеют больше инвариант-
ных свойств, чем линейные отображения. Это связано в
тем, что образ и прообраз лежат в одном пространстве, и
мы получаем возможность говорить об их взаимном рас-
положении. Например, приобретает смысл вопрос о том,
212
коллинеарен ли образ прообразу. Для отображения про-
странства- «S’ в .S’, отличное от 35, этот вопрос лише»
смысла.
В этом параграфе мы будем заниматься исключительно
линейными преобразованиями и теми их свойствами, кото-
рыми не обладают линейные отображения в общем случае.
2. Инвариантные подпространства. Рассмотрим линей-
ное пространство 35 и линейное преобразование А этого
пространства.
Определение. Подпространство 35' пространства
3? называется инвариантным относительно А, если для
каждого вектора х из .S" образ А(х) лежит в «S”.
Можно сформулировать это определение иначе, сказав,
что .S’' инвариантно, если А(3?') есть подпространство в 35'.
Пример 1. Рассмотрим обычное геометрическое про-
странство и поворот А этого пространства вокруг заданной
оси р на угол а. При повороте вектор переходит в век-
тор, и, следовательно, поворот порождает преобразование
в трехмерном векторном пространстве. Очевидно, что это
преобразование линейное. Векторы, лежащие на оси р,
образуют двумерное инвариантное подпространство, так
как для них А(х) = х. Векторы, перпендикулярные оси р,
образуют одномерное инвариантное подпространство, так
как вектор, перпендикулярный оси, после поворота оста-
нется ей перпендикулярным.
Пример 2. Нулевое подпространство всегда перехо-
дит само р себя и, следовательно, инвариантно относи-
тельно Любого преобразования.
Пример 3. Пространство 3\ рассматриваемое как
подпространство, является инвариантным подпростран-
ством.
Пример 4. Каждое подпространство является инва-
риантным относительно тождественного и нулевого пре-
образований
Пример 5. Ядро преобразования и множество его
значений являются инвариантными подпространствами.
Пусть в п-мерном линейном пространстве «S’ задано
линейное преобразование А, и пусть ^-мерное подпрост-
ранство J?' инвариантно относительно А. Выберем в .S’
базис et, ...t е„ так, чтобы векторы elt •. ек лежали в
35'. Матрйца А преобразования А может быть разделена
на чётыре клетки;
213
Клетки Ар Ла, At и At являютсй матрицами размеров
*хА, Ах(п—А), (л—Л)ХЛ и (л—Л)х(п—Л) соответст-
венно. Докажем, что клетка Л4 нулевая, т. е. элементы а|
матрицы Л равны нулю для значений индексов / =
— 1, ...,k и i = ^4-h ...,п. Действительно, первые k
столбцов матрицы А—координатные столбцы векторов
Afo), .... А(е4). Так как 3'—инвариантов подпрост-
ранство, эти векторы лежат в и согласно предло-
жению 3 § 2 их компоненты а| по базисным векторам
ел+1, ...,«„ равны нулю.
Легко видеть, что, и обратно, если в каком-нибудь
базисе матрица линейного преобразования А имеет вид
1Ш1- (2>
то линейная оболочка векторов^, ...,et есть инвариантное
подпространство. В самом деле, из вида матрицы следует,
что для всех j = 1, .... А
*
A (е,) » S
и потому образ линейной комбинации векторов ер ...>£*
является линейной комбинацией тех же векторов. Резю-
мируем сказанное.
Предложение 1. Матрица А преобразования А
имеет вид (2) тогда и только тогда, когда линейная обо-
лочка векторов еи ..ек—инвариантное подпространство.
Преобразование А каждому вектору из инвариантного
подпространства 3' сопоставляет вектор из 3'. Этим
определено преобразование пространства 3', которое мы
назовем ограничением преобразования А на подпростран-
стве 3' и обозначим А'. Для векторов из 3' имеем
А'(х) = А(х), а для векторов, не лежащих в 3‘, преоб-
разование А' не определено. Преобразование А' отличает-
ся от А только множеством векторов, для которых оно
определено.
Ограничение линейного преобразования, очевидно, бу-
дет линейным преобразованием.
Сохраним обозначения, введенные при доказательстве
предыдущего предложения. Нетрудно доказать, Что в ба-
зисе ер ..., eh пространства 3' матрицей преобразования
А' будет клетка At матрицы (2).
3. Собственные векторы. Рассмотрим одномерное под-
пространство 3t линейного пространства 3. Базис в 31
состоит из одного вектора х, не равного нулю, и каждый
214
вектор у из имеет вид ах, где а—подходящее число.
Если инвариантно относительно заданного в линей-
ного преобразования А, то А (л) лежит в J?t. Следова-
тельно, существует такое число Л, что
А (х) = lx. (3J
Обратно, если для некоторого ненулевого вектора ।из
выполнено условие (3), то оно выполнено и для любо-
го вектора из (это легко проверить, умножив |обе
части равенства (3) на произвольное число). Поэтому
будет инвариантным подпространством.
( Определение. Ненулевой вектор х, удовлетворяю-
щий условию (3), называется собственным вектором пре-
образования А. Число К в равенстве (3) называется соб-
ственным значением. Говорят, что собственный вектор х
принадлежит собственному значению К.
Мы видели, что каждое одномерное инвариантное под-
пространство определяется собственным вектором и, на-
оборот, каждый собственный вектор определяет одномер-
ное инвариантное подпространство.
Поставим себе задачу найти все собственные векторы
заданного Линейного преобразования А. Эта задача имеет
большое значение как в случае пространств конечной раз-
мерности, так и в случае бесконечномерных пространств.
Мы рассмотрим ее для пространств конечного числа изме-
рений п.
Если в пространстве 3 выбран базис, то равенство (3)
записывается как соотношение связывающее мат-
рицу А преобразования А и координатный столбец | век-
тора х. Обозначив через Е единичную матрицу порядка и,
мы можей переписать это соотношение в виде
(4-1£)§ = о (4)
или, подробнее,
a£«4-...4- a»--0,
aS* + (a»’-X) 5* 4-... + a’£« = 0,
a?i* + a»T +... + (aj—- 0.
Равенства (5) мы будем рассматривать как систему урав-
нений для нахождения компонент £*, ... Д'1 собственного
вектора х. Это система из п линейных однородных уравне-
ний с п неизвестными. Так как вектор х должен быть
отличен от нуля, нас интересуют только нетривиальные
215
V (5)
решения, т. е. такие, что хоть, одна из компонент £‘ не
равна нулю. Система имеет нетривиальное решение только '
тогда, когда ее ранг меньше числа неизвестных. В нашем
случае это означает, что должен равняться нулю детер-
минант матрицы системы:
(a}—X)as« •
det (Л—кЕ) =
а?-X)
(6)
-JI
«1
Равенство (6) называется характеристическим уравнением.
Это условие на параметр X, которому должны удовлетво-
рять все собственные значения преобразования А. Разу-
меется, в вещественном пространстве комплексные корни
характеристического уравнения не могут быть собствен-
ными значениями, так как для них не имеет смысла ра-
венство (3).
Если учитывать последнее замечание, условие, которое
мы получили, является н достаточным. В самом деле,
для каждого значения X, удовлетворяющего условию (6),
ранг системы (5) понижается, и она имеет нетривиальное
решение. Эго решение является координатным столбцом
собственного вектора х, соответствующего данному X. Мы
получили следующую теорему.
Теорема 1. В комплексном пространстве все корни
характеристического уравнения и только они являются
собственными значениями преобразования. В вещественном
пространстве то же утверждение имеет место для веще-
ственных корней характеристического уравнения.
Л?вая часть характеристического уравнения представ-
ляет собой многочлен степени п. Действительно, согласно
формуле (6) § 2 гл. V детерминант равен алгебраической
сумме произведений, в каждое из которых входит по п
элементов матрицы. Содержат X только элементы, стоящие
на главной диагонали. Существует одно произведение
(а|—X) (al-—X).. .(aJJ—X), (7)
в котором все сомножители содержат X. Если в какое-
нибудь другое произведение вошел сомножитель aj (i j),
то в него не могут войти сомножители (а‘—X) и (а{—X).
Поэтому каждый член суммы, кроме (7), содержит X в
степени не выше п—2. Раскрывая скобки в выражении
(7), выпишем два члена со старшими степенями X:
(—1)"Х"Ц-(—l)"~l(a}-f-... -f-ag)X"-1. Эти же члены будут
старшими и во всем многочлене. Свободный член много*
2J6
члена равен, его значению при 1 = 0, а это значение равно
det (Л—O£) = detA. Таким образом, многочлен в левой
части равенства (6) имеет вид
+ J} а + ... 4-det Л.
/«1
Этот многочлен называется характеристическим многочле-
ном матрицы А. Не представило бы труда выписать и
остальные его коэффициенты, но это нам не понадобится.
Многочлен степени п, как известно, не может иметь боль-
ше, чем п различных корней и всегда имеет хотя бы один
комплексный корень. Если мы рассматриваем веществен-
ное пространство, то может случиться (при четном п),
что характеристическое уравнение не имеет ни одного
вещественного корня и, следовательно, линейное преобра-
зование не имеет собственных значений и собственных
векторов. Примером может служить поворот плоскости.
В комплексном пространстве каждое линейное преоб-
разование имеет хоть одно собственное значение и, сле-
довательно, хоть один собственный вектор.
4. Свойства собственных векторов и собственных зна-
чений.
Предложение 2. Все собственные векторы,
принадлежащие одному и тому же собственному значе-
нию, вместе с нулевым вектором образуют линейное под-
пространство.
Утверждение немедленно следует нз того, что коорди-
натные столбцы этих векторов составляют множество всех
решений однородной системы линейных уравнений.
Теорема 2. Если собственные векторы xIt ..., xk
принадлежат попарно различным собственным значениям,
то они линейно независимы.
Теорема доказывается по индукции. Проверим утвер-
ждение для двух собственных векторов xt и х„ принад-
лежащих различным собственным значениям 1* и 1,. Пусть
они линейно зависимы. Так как векторы ненулевые, в этом
случае найдется число а такое, что хх<=ахг. Применяя
преобразование А, мы получим А(х,) = 11х1 н
A (xj = «А (xt) = а1гх2 = 1^.
Это означает, что klxl = 'k2xi, что невозможно при lf=^l2.
Итак, векторы линейно независимы.
Допустим теперь, что любая система из k—1 собст-
венных векторов, принадлежащих различным собственным
217
значениям, линейно независима, и докажем это утвержде-
ние для системы цз k векторов.
Пусть система векторов хп . ...,х* удовлетворяет
условию теоремы. Рассмотрим их равную нулю линейную
комбинацию
ед + ...+«Л-л (8)
Отсюда действием преобразования А и умножением на
мы получаем соответственно
otjlfX, 4-... 4- « о
и
Почленное вычитание этих равенств дает нам
otfCXj—4-... 4* a*-i (Ч-i—(9)
По предложению индукции эта линейная комбинация —
тривиальная, и, следовательно,
04(4,—A.k) = 0, —!*)*().
Поскольку собственные значения попарно различны, име-
ем 04 = ... иаь1и0. Учитывая это в равенстве (8), на-
ходим ak = 0. Итак, линейная комбинация (8)—тривиаль-
ная. Теорема доказана.
Предложение 3. Если А и А'—матрицы преоб-
разования А в разных базисах, то характеристические
многочлены втих матриц совпадают.
Действительно, согласно формуле A’ = S*XAS мы имеем
det (А'—ЛЕ) = det (S“XAS—IE) = det S"x (A—IE) S =
= det (A—IE) det S det S“x = det (A —KE).
Из этого предложения следует, что мы можем назы-
вать характеристический многочлен матрицы А характе-
ристическим многочленом преобразования А.
Коэффициенты характеристического многочлена явля-
ются инвариантами, связанными с преобразованием. В част-
ности, детерминант матрицы преобразования не зависит
от выбора базиса. Другим важным инвариантом является
коэффициент при (—К)*"*, называемый следом матрицы:
аЦ-а?4-...4-®2-
Рассмотрим теперь произвольный многочлен Р(А.) =
=у„А,в4-... 4-?Д+?«- Если X,—корень этого многочлена,
то Р(К) делится на двучлен 4,—т. е. представляет
218
собой произведение X—Хв на многочлен /^(Х)1). Может
случиться, что Р(к) делится не только на X—X,, но и
на (X—kt)a при некотором целом s > 1, иначе говоря, Р(к)
имеет вид (X—kt)sPt(k), где Pt—многочлен. Самое боль-
шое число s, обладающее этим свойством, называется
кратностью корня X,. Корни кратности 1 называются
простыми.
Теорема 3. Пусть собственное значение Хо преобра-
зования А является корнем характеристического уравнения
кратности s. Тогда ему принадлежит не более s линейно
независимых собственных векторов.
Доказательство. Пусть существуют А линейно
независимых собственных векторов, принадлежащих Хф.
Обозначим их eif ..., ek и дополним векторами еА+1,..., е„
до базиса в пространстве J?. В этом базисе матрица А
преобразования А имеет вид
|ХФ о
• I
О к.
~0----
В
где В—некоторая матрица размеров пх(п—А). Действи-
тельно, для каждого i^.k столбец с номером i—коорди-
натный столбец вектора A(^,)>=Xoez—состоит из нулей,
за исключением i-ro элемента, равного Хв. Составим мат-
рицу А—ХЕ. Раскладывая ее детерминант последовательно
по каждому из первых k столбцов, мы имеем det (Л—
=(Х0—Х)*Р(Х). По определению Кратности мы видим
теперь, что A<s.
Собственному значению кратности s может принадле-
жать и меньше чем s линейно независимых собственных
векторов. Например, читатель проверит, что линейное
преобразование двумерного пространства, задаваемое мат-
*) Для читателя, не знакомого с этим фактом, приведем следую-
щее доказательство. Заменим в-многочленеР (k)™YnX" + «..+YiX+Ye
аргумент к па двучлен к*+ко, где к*—новый аргумент Р*(к*) =
= уя(к*4-кф)" + ...+Т1(Х*+Х»)+ув. Этот многочлен может быть
записан по степеням к*: Р* (к*) = у*к*п+...+у*к*4-у*. Свободный
член yj многочлена Р* равен его значению при к* = 0, т. е. Р(к»).
Следовательно, е<уш к»—корень многочлена Р, имеем yj жО, Теперь,
подставляя к*=к—к*, мы получим? (к) = у*(к—кв)"+-..+у‘(к—к»),
или Р (к) = (к—к») [у* (к—kj)"-1 +... 4-уJ], Многочлен в квадрат-
ных скобках мы и обозначим через ?i(k).
219
рицей |J имеет собственное значение кратности 2 и
всего один независимый собственный вектор.
Предложение 4. Линейное преобразование имеет
собственное значение, равное нулю, тогда и только тогда,
когда оно не является взаимно однозначным.
Действительно, из предложения 6 § 3 следует, что пре-
образование взаимно однозначно в том и только в том
случае, когда его ранг равен п, т. е. детерминант его мат-
рицы отличен от нуля. Но детерминант—свободный член
характеристического многочлена и равен нулю тогда и
только тогда, когда нуль—корень характеристического
уравнения.
Заметим, что для собственного вектора, принадлежа-
щего нулевому собственному значению, А(х)=»о. Это
означает, что ядро А содержит ненулевой вектор к.
Предложение 5. Пусть А—линейное преобразование вещест-
венного линейного пространства. Комплексному корню характеристи-
ческого многочлена преобразования А соответствует двумерное инва-
риантное подпространство.
Если число «+•’₽ удовлетворяет уравнению det (Л—1£) = 0,
то система линейных уравнений {Л — (a-j-iP)E} s=o имеет нетриви-
альное решение. Оно будет комплексным столбцом высоты п, и мы
можем записать его в виде т)+'?> гДе Ч И £ — вещественные столбцы
Равенство двух комплексных столбцов Л|, = Ц равносильно двум
равенствам между вещественными столбцами, именно:
Лц=ат1— Pg, Л; = Рч+«5- 0°)
Столбцы т) и £ вещественные, н им соответствуют векторы, которые
мы обозначим у и г. Равенства (10) означают, что К(у) — йу—pi и
А (г) = fly-f-аг. Отсюда следует, что линейная оболочка векторов у
и г—инвариантное подпространство. В самом деле,
А (pp-f- vz) = рА (у) + vA (г) = (pa + vP) р+ (va—рР) г. (11)
Осталось доказать, что векторы риг линейно независимы. До-
пустим противное: при каких-то р и v (p*-f-va 0) имеем pp+vz^o.
Тогда, в силу (11), (pa+v₽)p+(va—рР) г^о. Предположим ддя
определенности, что у & 0. Умножив два предыдущих равенства соот-
ветственно на va-—рР и на v вычтем одно из другого. Мы получим
[v (pa + vP) — р (va—рР) ] р =. о,
откуда (v»+p2) Р —0, т. е, р = 0, хотя мы предполагали, что a-f-Zp—
комплексный корень.
Замечание. Как известно (см. § 7 гл. V), если a + Zft удов-
летворяет алгебраическому уравнению с вещественными коэффициен-
тами, то комплексное сопряженное число a—/р удовлетворяет тому
же уравнению. В нашем случае двум комплексно сопряженным кор-
ням соответствует одно и то же инвариантное подпространство. Пре-
доставим читателю это показать.
220
В. О приведении матрицы преобразования и дмаго-
нальному виду. Мы будем говорить, что квадратная мат-
рица А с элементами а* имеет диагональный вид или диа-
гональная, если а, = 0 при i=/> j, т. е. могут быть отличны
от нуля только элементы а/, расположенные на главной
диагонали.
Предложение 6. Матрица линейного преобразова-
ния А в базисе е» ..., е„ имеет диагональный вид тогда
и только тогда, когда все векторы базиса—собственные
векторы преобразования.
- < Действительно, если вектор собственный, то
А(е,) = Х,е. и, следовательно, i-й элемент координатного
столбца вектора А(е,) равен 1,, а остальные элементы
равны нулю. Остается вспомнить, что i-й столбец матрицы
преобразования—координатный столбец А(е().
Обратное утверждение доказывается аналогично.
Из теоремы 2 следует простое, но важное условие,
достаточное для того, чтобы существовал базис из собст-
венных векторов преобразования.
Предложение 7. Если преобразование имеет п
попарно различных собственных значений, то существует
базис из собственных векторов этого преобразования.
Если характеристический многочлен преобразования
имеет кратные корни, то его матрица может не иметь
диагонального вида ни в каком базисе. Пример такого
преобразования, не имеющего базиса из собственных век-
торов, был приведен на с. 219—220.
Однако вполне может случиться, что линейное преобра-
зование имеет меньше чем п собственных значений, но
все же имеет базис из собственных векторов. В самом
деле, мы можем задать базис и рассмотреть преобразова-
ние, определяемое какой-нибудь диагональной матрицей
с равными элементами на главной диагонали. Для нуле-
вого и тождественного преобразования каждый ненулевой
вектор собственный, и в каждом базисе их матрицы имеют
диагональный вид.
Предложению 7 можно придать и следующую форму.
Предложение 8. Если все корни характеристи-
ческого многочлена матрицы А различны, то существует
такая матрица S с детерминантом, не равным нулю,
что матрица S~rAS диагональная. Если матрица А ве-
щественна и мы хотим, чтобы вещественной была и S,
то нужно, чтобы корни характеристического многочлена
были вещественны.
221
ГЛАВА VII
ЕВКЛИДОВЫ И УНИТАРНЫЕ ПРОСТРАНСТВА
§ 1. Евклидовы пространства
L Скалярное произведение. Линейное пространство,
введенное в предыдущей главе, существенно отличается
от множества векторов обычного геометрического прост-
ранства тем, что в линейном пространстве не определены
понятия длины вектора и угла между векторами. В на-
стоящей главе мы дадим эти определения.
В гл. I, исходя из длины и угла, мы определили ска-
лярное произведение. Здесь удобнее поступить наоборот.
Мы аксиоматически определим операцию скалярного умно-
жения векторов, а длину и угол введем при помощи ска-
лярного произведения.
Полученные до сих пор результаты, как правило,
относились как к вещественным, так и к комплексным
пространствам. Определение скалярного умножения в этих
двух случаях формулируется различно. Этот параграф
посвящен вещественным пространствам.
Определение. Вещественное линейное простран-
ство называется евклидовым, если в нем определена опе-
рация скалярного умножениях любым двум векторам х и у
сопоставлено вещественное число (обозначаемое (х, у)), и
это соответствие удовлетворяет следующим условиям,
каковы бы ни были векторы х, у и z и число ai
Г. (х, у) —(у, х).
2°. (х+у, z)»(x, г) + (у, г).
8°. (ах, {0 я а (х, у).
4°. (х, х)>0, если х=/=о.
Укажем простейшие следствия из аксиом 1° —4°i
1. (х, а.у)*а(ау, х)=*а(у, х), и потоку всегда
(х, ау)т=а(х, &) (1)
2. Аналогично доказывается тождество
(х, у 4- г)«(х, у) 4- (х, г). (2)
822
3. Последовательно применяя аксиомы 2° и 3° и два
предыдущих следствия, легко доказать, что для любых
векторов и чисел
(S \ 8 \
Х«Л/, X У),
i- 1 / J=l
(Р \ Р
X, 5 РьУь )== X Рй (X, ук).
Л=1 / Ле=1 4
4. Каков бы ни был вектор х, имеем
(х, о) = 0.
(3)
(4)
Действительно, положим о = 0х. Тогда (х, о) =*
= 0(х, х)=0,
Пример 1. Для векторов—направленных отрезков —
было определено скалярное произведение как произведе-
ние их длин на косинус угла между ними. Так опреде-
ленное скалярное произведение обладает свойствами Г—4Q
и зависит от выбора единицы измерения длин. Поэтому,
если единица измерения длин выбрана, векторы обычного
геометрического пространства образуют трехмерное евкли-
дово пространство в определенном здесь смысле.
Пример 2. В линейном пространстве столбцов вы-
соты п мы можем ввести скалярное произведение, сопо-
ставив столбцам £ и 1) число
+ W + (5)
где через £* и т/ обозначены элементы столбцов. Число
(5)—матричное произведение строки |г на столбец ц.
Читатель легко проверит, что аксиомы 1°—4° выполнены.
При таком определении скалярного произведения про-
странство столбцов высоты п становится n-мерным евкли-
довым пространством.
Пример 3. В пространстве функций, непрерывных
на отрезке [0, 1], можно ввести скалярное произведение
по формуле 1
(/.
Аксиомы 1°—4° вытекают из известных свойств опреде-
ленных интегралов.
2. Длина и угол, В гл. I мы получили формулы, вы-
ражающие длину вектора и угол между векторами через
скалярное произведение. В соответствии с ними введем
следующее определение.
223
Определение. Назовем длиной вектора к и обо-
значим | х| число х). Углом между векторами х и у
назовем каждое число <р, удовлетворяющее условию
соз ф = . (6)
В силу аксиомы 4° длина вектора—вещественное не-
отрицательное число (мы рассматриваем арифметическое
значение корня). Длина вектора равна нулю тогда и тояько
тогда, когда вектор нулевой.
С определением угла дело обстоит несколько сложнее.
Нам предстоит доказать, что выражение в правой части
равенства (6) по абсолютной величине не превосходит
единицы. Это следует из неравенства
(». */)*<(*. х)(у, у), (7)
связываемого о именами Шварца, Коши и Буняковского.
Докажем это неравенство.
Пусть х и у—произвольные векторы в евклидовом
пространстве. При любых а и Р имеет место соотношение
(ах-f-pi/, ах4-0у) = а’(х, х)4-2а0(х, у) + Р*(у, #)>0,
(8)
причем равенство нулю достигается тогда и только тогда,
когда ах 4* Ру=о. Положив здесь а~(у, у) и 0 =— (х, у),
мы получим
(У. х)(у, у)—(х, //)*]> О,
откуда и вытекает требуемое неравенство, если у=ро.
В случае у*^о соотношение (7) очевидно.
Равенство в формуле (7) имеет место тогда и только
тогда, когда х и у линейно зависимы. Действительно, если
они независимы, то в (8) выполнено строгое неравенство
при а’4-За=#0. Следовательно, строгое неравенство вы-
полнено и в (7). Обратно, пусть существует нетривиаль-
ная линейная комбинация ах + fry, равная нулю. Умно-
жая ее последовательно на х и на у, получим павенства
a(xt х) + Р(у, х)«0 и а(х, у)+р(у, у)=*0.
Детерминант однородной системы, имеющей нетривиаль-
ное решение, равен нулю. Отсюда следует нужное равен-
ство.
Из неравенства (7) следует еще одно простое и полезное нера-
венство, а именно:
|*+?К|*1+1?1. (9)
224
Оно вытекает из следующей цепочки соотношений:
(*+?, х+₽)=1*Р+2(*. У)+|₽1*<
<|x|«4-2|x||j,|4-|yp = (|*|+|y|)«-
Знак равенства имеет место, если (х, ff) = [x||y|, т. е. если угол
менаду х в у равен нулю, и только в этом случае. Неравенство (9)
называется неравенством треугольника, так как, если векторы
являются направленными отрезками, оно означает, что сторона тре-
угольника меньше суммы двух других его сторон.
Рекомендуем читателю выписать неравенства (7) и (9)
для евклидовых пространств, рассмотренных в примерах
2 и 3.
Векторы х и у называются перпендикулярными или
ортогональными, если (х, у) = 0. Если хоть один из век-
торов х или у равен нулю, правая часть выражения (6)
не имеет смысла. Нулевой вектор мы по определению
будем считать ортогональным любому вектору
Предложение 1. Только нулевой вектор ортого-
нален каждому вектору.
Действительно, если (х, у) —О для всех у, то, положив
у — х, имеем (х, х) = 0, что возможно только для нуле-
вого вектора.
3, Ортонормированный базис. Систему векторов
ft • • •» fm в евклидовом пространстве мы назовем opfno-
нормированной, если (/,, ^)=0 при I / и (/,,
каковы бы ни были номера i и /.
Предложение 2. Ортонормированная система век-
торов линейно независима.
Доказательство Пусть Д, .... f„—ортонорми-
рованная система векторов. Рассмотрим равенство 4-...
... 4-amfm = o. Из него вытекает, что а, = 0 при произ-
вольном I. В самом деле, умножим скалярно на f; обе
части равенства. Все слагаемые, кроме i-го, обратятся
в нуль, и мы получим aytfi, fi) = a< = 0. Таким образом,
каждая равная нулю линейная комбинация векторов
•••• fm необходимо тривиальная Предложение дока-
зано
Теорема 1. В п-мерном евклидовом пространстве
существует ортонор мированная система из п векторов.
Заметим, что в силу предложения 2 такая система
векторов является базисом. Мы будем называть этот базис
оргцонорми рованным.
Доказательство проведем методом полной индукции.
1) При п *=* 1 утверждение очевидно. Если f — ненуле-
вой вектор, то вёктор е = ортоыормированная си-
стема из одного вектора.
8-102
225
2) Предположим, что в каждом (п—1)-мерном евкли-
довом пространстве существует ортонормированный базис,
и докажем то же утверждение для произвольного «-мер-
ного евклидова пространства $п. Пусть fit ..., /„—про-
извольный базис в £п. Линейная оболочка векторе»
Д, ••• > fn-i представляет собой (п—1)-мерное евклидово
пространство, и, по предположению индукции, там су-
ществует ортонормированная система из п—1 векторов
еь ••• » en~i- Рассмотрим вектор 7В“/в—“А—••• —
—an-ien-i- Коэффициенты cq, ... , an_t выберем так,
чтобы вектор 7» был ортогонален ко всем векторам eit ...
, • •» ел-1* Так как система eit ... , en_s ортонормирована,
имеем (/„, <?/)«=(/„, е,)—а,-, откуда а, «=(/„, е;) для всех
i»l, ... , и—1. Теперь рассмотрим вектор е„ж=|7„ |-17в-
Длина его равна единице, и он перпендикулярен векто-
рам q, .... Легко видеть, что система eit ...
..., e„_I, ер ортонормированная.
Метод, которым доказана эта теорема, называется ме-
тодом ортогонализации. Для его практического примене-
ния сначала нормируют вектор Д, т. е. строят вектор
е1в| Д |-хд. Затем находят ортонормированный базис еь ег
в линейной оболочке векторе» Д, Д. Это делают так же,
как во втором пункте доказательства. Потом точно так же
строят ортонормированный базис в линейной оболочке
векторов Д, ft, f9 и т. д.
4. Выражение скалярного произведения через компо-
ненты сомножителей. Пусть в евклидовом пространстве
задан базис et, , еп. Это позволяет нам записать
Любые векторы хи у в виде и Здесь
t I
и далее, если не оговорено противное, индекс суммиро-
вания принимает значения от единицы до размерности
пространства п. Итак, мы имеем
(х,
Пользуясь формулами (3), мы можем переписать скаляр-
ное произведение в виде
(*> (W)
1,1
Если базис ортонормированный, то (е„ еу).=О при
i / и в сумме остаются только те слагаемые, для кото-
рых i*=j. Поскольку (е{, то в ортонормированном
226
базисе
(Н)
Каков бы ни был базио, рассмотрим числа (et, 6f)
(lt / = 1, ... , n)—всевозможные попарно скалярные про-
изведения базисных векторов. Йх принято обозначать
через glf и записывать в виде квадратной матрицы:
*‘’.1-1 *?•.? 02)
|g«l 8(e„, «О ... (e„, ej I
Матрица (12) называется матрицей Грама базиса
et, ... , е„. В силу коммутативности скалярного умно-
жения gij—g/i, и, следовательно, матрица удовлетворяет
условию П=Г, т. е. не меняется при транспонировании.
Такие матрицы называются симметрическими.
Мы обозначим через £ и д координатные столбцы век-
торов х и у. Тогда, как легко проверить, перемножая
матрицы, равенство (10) можно записать в матричной
форме так:
(х, у) = ГГть (13)
Базис ортонормирован тогда и только тогда, когда
его матрица Грама Г—единичная матрица. Поэтому мы
имеем для ортонормированного базиса
(х, */) = 1гП- (И)
Это совпадает с (11).
5. Связь матриц Грама разных базисов. Пусть нам
даны два базиса eit ... , е„ н е{, ... , еп, связанных дри
помощи матрицы перехода S по формулам где
к
через of обозначены элементы S. При произвольных I и /
мы имеем теперь, в силу формулы (10),
gif-te;, e/)-(S<fo, =
Полученное равенство выражает элемент матрицы Грама
Г' базиса е' через элементы матрицы Грама базиса е. Со-
вокупность таких равенств для всех i и / равносильна
матричному соотношению
Г'=5ГГ5. (15)
Это легко проверить, выписывая подробно правую
часть (15).
8* Ш
Рассмотрим формулу (15) в том частном случае, когда
базис е ортонормированный. Тогда Гя»£ и Г'г=Зг5.
Вычисляя детерминант обеих частей равенства, получим
det Г' жв det 5Г det 5 = (det $)*. Поскольку базис е' про-
извольный, отсюда следует такое
Предложение 3. Детерминант матрицы Грама
любого базиса положителен.
Последнее предложение может быть усилено следую-
щим образом.
Теорема 2. Пусть xlt . г. , хк—произвольные (не
обязательно линейно независимые) векторы в евклидовом
пространстве. Тогда детерминант матрицы
l(*i. ... (Xi, xt)j
(**, Xi) ... (xk, xk) J ’
составленной из их попарных скалярных произведений,
положителен, если векторы линейно независимы, и равен
нулю, если дни линейно зависимы.
Первое утверждение теоремы прямо следует из пред-
ложения 3, так как, бели xlt ... , xk линейно незави-
симы, они образуют базис в своей линейной оболочке.
Докажем второе утверждение. Если векторы линейно
зависимы, то выполнено равенство оцлч +...-}- akxk = о,
в котором среди коэффициентов оц, ... ,ак есть отличные
от нуля. Умножая это равенство скалярно на каждый из
векторов Xi, , хк, мы придем к системе линейных
уравнений
«> (xit х^ 4-... + ак (х^ хк) = О,
сч (хк, Xi) + ... + ак (хк, хк) = О,
которой удовлетворяют коэффициенты ап ... , ак. Так
как система имеет нетривиальное решение, детерминант
ее матрицы должен равняться нулю, что и требовалось.
Заметим, что доказанное выше неравенство Коши —
Буняковского является частным случаем этой теоремы
для Л = 2.
6. Ортогональные матрицы. Пусть в формуле (15)
Г = Г' = Е, т. е. оба базиса ортонормированные. Тогда
формула принимает вид
5rS = E. (16)
Определение. Матрица, удовлетворяющая усло-
вию (16), называется ортогональной.
228
Мы видим, что ортогональные матрицы и только они
могут служить матрицами перехода от одного ортонорми-
рованного базиса к другому. Равенство (16) равносильно
следующему
Sr = S-4 (17)
В силу свойств обратной матрицы отсюда вытекает, что
$$Г = Е. (18)
Это означает, что матрица Sr будет также ортогональной.
Обозначив элементы матрицы S через о/, мы можем
переписать равенства (16) и (18) соответственно так:
JL (0, i i,
<20>
Впрочем, соотношения (19) можно получить и непосред-
ственно по формуле (11), если вспомнить, что столбцы
матрицы перехода—это координатные столбцы новых
базисных векторов по старому базису.
Вычисляя детерминант каждой части равенства (16),
мы получим (det S)* = 1. Поэтому детерминант ортогональ-
ной матрицы равен +1 или —1
Рекомендуем читателю проверить все соотношения
этого пункта для матрицы
II cos а — sin а j
II sin а со» а Ц '
7. Ортогональное дополнение подпространства. Рас-
смотрим /г-мерное подпространство <£к в л-мерном
евклидовом пространстве &п.
Определение, Ортогональным дополнением tпод-
пространства £к называется множество всех векторов,
перпендикулярных каждому вектору из
Ортогональное дополнение подпространства £к обозна-
чим через
Предложение 4. Ортогональное дополнение k-мер-
наго-подпространства 8к есть подпространство п—k из-
мерений.
Доказательство. Пусть .... ак—базис в
Вектор х лежит в тогда и только тогда, когда
(х, Ot)«0, (х, д*) = 0. (21)
229
Действительно, если х лежит в £k, то условия (21), оче-
видно, выполнены. Обратно, при выполнении этих усло-
вий х ортогонален к любому вектору а из £к, поскольку
(к \ Л
(х, а) = ( х, 2 ) = 2 ^ (*> ор) = 0.
\ p=i / p=i
Выберем в ортонормированный базис и обозначим че-
рез а|, а.р компоненты вектора ар (при любом р в
= 1, ..., k), а через • ••»£" компоненты вектора х.
Условия (21) запишутся тогда в виде однородной систе-
мы из k линейных уравнений с п неизвестными:
а*^+...+а?ёп=0,
аЙ1 + ‘..’+аЙ» = 0.
Ранг матрицы системы равен k, поскольку ее строки —
строки из компонент векторов alt ..., ак—линейно не-
зависимы. Совокупность всех решений системы, как мы
показали, определяет £к, я с другой стороны, как из-
вестно, совокупность всех решений такой системы опре-
деляет (п—Л)-мерное подпространство. Предложение до-
казано.
Рассмотрим —ортогональное дополнение орто-
гонального дополнения подпространства £к. Из опреде-
ления видно, что £к s (^)г. Но размерность (Sk)L
равна п—(п—k) = k. Итак, согласно предложению 2
§ 2 гл. VI (^)х=^.
Очевидно, что £к и не имеют общих ненулевых
векторов. Отсюда следует
Предложение 5. Евклидово пространство есть
прямая сумма любого своего подпространства £к и его
ортогонального дополнения.
Таким образом, согласно предложению 5 § 2 гл. VI
каждый вектор х из £п однозначно раскладывается в сум-
му векторов х’ из и х* из Sk- Вектор х' называется
ортогональной проекцией х на <£к. Легко видеть, что век-
тор х"—ортогональная проекция х на £к.
Длина х"—ортогональной проекции х на —назы-
вается расстоянием от вектора х до подпространства £к.
Она обладает следующим свойством минимальности.
Предложение 6. Если вектор х представлен как
сумма векторов х' из£к их' из $к, то для любого век-
230
тора у из £k, отличного от х', выполнено
|х*| = |х—х' | < |х—у\.
Доказательство. Обозначив х'—у через г, име-
ем |х—р|8 = |х' —«/Ч-х'|’ = |г + х'|’ = (г4-х', г+х*) =
= |г|’4-2(г, x*)-f-|x*|*. Но (г, г*) = 0, так как г лежит
в и, следовательно, |х—у|*«=|х'|* + |г|*. Отсюда не-
посредственно вытекает доказываемое утверждение.
§ 2. Линейные преобразования
в евклидовом пространстве
1. Преобразование, сопряженное данному. Все, ска-
занное в предыдущей главе о линейных преобразованиях
в линейных пространствах, остается, конечно, в силе и
для евклидовых пространств. В евклидовом пространстве
наличие скалярного произведения позволяет определить
некоторые важные классы преобразований. Их изучением
мы и займемся в настоящем параграфе. Все дальнейшее
относится только к вещественным евклидовым простран-
ствам.
Определение. Линейное преобразование А* ев-
клидова пространства называется сопряженным данному
преобразованию А, если для любых векторов х и у имеет
место равенство
(А(х), у) = (х, А*(у)). (1)
Допустим, что данное преобразование А имеет сопря-
женное А*. Выясним, как связаны матрицы преобразо-
ваний А и А* в некотором базисе е. Обозначим матрицы
этих преобразований соответственно А и А*, а коорди-
натные столбцы векторов х и у—через | и 1]. Тогда ра-
венство (1) можно переписать в виде
(4|)ГГЛ=ГГАЧ
где Г—матрица Грама базиса е. После очевидных пре-
образований имеем
|т(ЛгГ—Г А*) ч = 0. (2)
Так как £ и т]—произвольные столбцы, отсюда можно
заключить, что
АП1—ГА* = О, (3)
Где О—нулевая матрица. Чтобы сделать это заключение,
вспомним пример 4 на стр. 176. Мы видели, что для
231
любой матрицы Р и столбцов единичной матрицы е{ и ef
произведение efPe, равно элементу рц матрицы Р. Под-
ставляя вместо | и 1) столбцы единичной матрицы, мы
можем показать, что любой элемент матрицы Д’Т—ГА*
равен нулю.
Итак, матрицы преобразований А и А* связаны соот-
ношением (3). В частности, если базис ортонормирован-
ный и Т = Е, мы имеем
А*~АГ. (4)
Предложение 1. Каждое линейное преобразование
в евклидовом пространстве имеет сопряженное преобра-
зование, и притом только одно.
Для доказательства выберем ортонормированный ба-
зис и рассмотрим преобразование В с матрицей АТ, если
А—матрица заданного преобразования А. Условие (1)
для преобразования В равносильно очевидному равенству
(A^)rTi = 5r(ArTi). Следовательно, В — преобразование,
сопряженное для А. Если бы имелось два преобразова-
ния, сопряженных одному и тому же А, то в силу (4)
их матрицы совпадали бы Предложение доказано.
Поскольку (АГ)Г = А, из формулы (4) вытекает, что
(А*)*-А. (5)
В качестве приложения введенного в этом пункте по-
нятия дадим «геометрическое» истолкование теоремы
Фредгольма для важного частного случая систем из п
уравнений с п неизвестными. Для этого рассмотрим
n-мерчое евклидово пространство £п и ортонормирован-
ный базис в нем. Каждый столбец будем считать коорди-
натным столбцом некоторого вектора, матрицу системы
А—матрицей линейного преобразования ,А-
Теорему Фредгольму можно сформулировать так: хотя
бы один вектор х, для которого А (х) = Ь, существует тог-
да и только тогда, когда вектор b ортогонален каждому
у, удовлетворяющему условию А*(у) = о. Существование
вектора х означает, что b принадлежит подпространству
А («?„)• Множество векторов у—ядро преобразования
А*. Мы пришли4 ц следующей формулировке теоремы:
Множество значений преобразования А совпадает с
ортогональным дополнением ядра его сопряженного пре-
образования А*.
В гл. V мы доказали теорему Фредгольма, но и эта
ее формулировка легко непосредственно проверяется.
232
Действительно,
(А(х), у)=*(х, А*(у)) = (х, о) = 0.
Следовательно, A(rfn) принадлежит ортогональному до-
полнению ядра А*. Сравнение размерностей показывает,
что пространства совпадают.
2. Самосопряженные преобразования. Определе-
ние. Линейное преобразование А евклидова простоанст-
ва называется самосопряженным (или симметрическим),
если А = А*.
Из формулы (4) непосредственно следует такое
Предложение 2. Преобразование является самосо-
пряженным тогда и только тогда, когда его матрица в
любом ортонормированном базисе симметрическая (т. е.
удовлетворяет условию А = АТ).
Собственные значения и собственные векторы само-
сопряженных преобразований обладают рядом важных и
интересных свойств, к изложению которых мы и пере-
ходим.
Теорема 1. Все корни характеристического много-
члена самосопряженного преобразования вещественные.
Доказательство. Обозначим через А матрицу рас-
сматриваемого самосопряженного преобразования в ка-
ком-нибудь ортонормированном базисе. Допустим, что ха-
рактеристическое уравнение det (Л—ХЕ) —0 имеет комп-
лексный корень X,. Рассмотрим систему линейных урав-
нений
(Л-Х^)|=о (6)
с л неизвестными V, .... V' (л—размерность простран-
ства). Матрица системы комплексная, и потому реше-
ние вообще говоря,—комплексный столбец. Нетривиаль-
нее решение обязательно существует, поскольку
det (Л—Х,£)««0, Пусть —некоторое нетривиальное ре-
шение. Подставим в систему и умнбжим обе части
полученного равенства слева на строку
(7)
Так как 1Д8 = + •.. + Ш? — вещественное число,
то для получения противоречия достаточно показать, что
вещественным является число &ГЛ|0. С этой целью обоз-
начим <о=^1 Л£в. При транспонировании квадратная мат-
рица порядка 1 не меняется, и мы имеем
(й = ит = (^Л§оу = ^Л^.;
233
с другой стороны,
Но А—вещественная симметрическая матрица, и, сле-
довательно А<=Ав>*Аг. Поэтому мы имеем ю=со, и, зна-
чит, ю вещественно. Разделив обе части равенства (7) на
отличное от нуля число &Г10, мы видим, что обязатель-
но вещественное.
Доказанное утверждение допускает матричную фор-
мулировку.
Предложение 3. Если А—вещественная симмет
рическая матрица, то все корни уравнения det (Л—КЕ) =>
= 0 вещественные.
Теорема 2. Собственные векторы самосопряженного
преобразования А, принадлежащие разным собственным
значениям, ортогональны.
Действительно, пусть и А(х) = Хх, А(р)=ру.
Тогда
(А(х), у) = К(х, у).
Но иначе можно получить
(А(х), у) = (х, А(р)) = р(х, у).
Из этих двух равенств следует (1—р)(х, р)=О, откуда
(х н) = 0, как и требовалось.
Теорема 3. Если подпространство S' инвариантно
относительно самосопряженного преобразования А, то
ортогональное дополнение S’^ этого подпространства —
также инвариантное подпространство.
Доказательство. Нам дано, что для каждого х
из S' образ А(х) также лежит в S’. Это значит, что
(А(х), 1/)=0 для любого у из S'L- Но так как преобразо-
вание А самосопряженное, мы имеем отсюда (х, А(#))=0,
и, следовательно, А (у) лежит в S’-*-, как и требовалось.
Теперь мы можем доказать теорему, которая позволяет
описать все возможные самосопряженные преобразова-
ния. Мы будем называть ее основной теоремой о самосо-
пряженных преобразованиях.
Теорема 4. Пусть А—самосопряженное линейное
преобразование п-мерного евклидова пространства Sn-
Тогда в Sn существует ортонормированный базис из соб-
ственных векторов преобразования А.
Доказательство проведем индукцией по числу измере-
ний пространства. Для одномерного пространства St тео-
234
рема очевидна, так как в таком пространстве каждый
вектор—собственный для Див качестве искомого ба-
зиса достаточно взять любой вектор длины 1.
Предположим теперь, что теорема доказана для про-
странств размерности k—1, и докажем ее для Л-мерных
пространств. Согласно теореме 1 самосопряженное преоб-
разование А в имеет по крайней мере одно собствен-
ное значение1) и, следовательно, хотя бы одно одномер-
ное инвариантное подпространство. Обозначим такое под-
пространство а единичный вектор в нем—через е.
В силу теоремы 3 ортогональное дополнение под-
пространства & является (k—1)-мерным подпространст-
вом, также инвариантным относительно А.
Рассмотрим ограничение А' преобразования А на
подпространстве ^k^t (см. с. 214). Легко видеть, что
это—самосопряженное преобразование в Дейст-
вительно, равенство (А(х), у)*=(х, A (t/)) выполнено для
всех векторов из $к, а значит, и для всех векторе» из
а для вектора х из £k_t по определению А' (х) =
= А(х), Если х—собственный вектор преобразования
А',то А* (х) == А (х) = кх, и он является собственным для А.
По предположению индукции в 8k-i существует орто-
нор мированный базис eit ..., ek_t из собственных векто-
ров преобразования А'. Рассмотрим систему векторов
elt ..., e*_i, е. Все векторы попарно ортогональны, еь ...
..., ek~i—п0 построению, а е ортогонален каждому из
них, так как —ортогональное дополнение^. Длина
каждого из рассматриваемых векторов равна 1. Каждый
из них является собственным для преобразования А. Та-
ким образом, система векторов eit .. •, ek_it е и есть тот
базис, который нам нужно было построить.
Доказанная нами теорема допускает матричную фор-
мулировку.
Предложение 4. Если А—симметрическая матри-
ца, то существует ортогональная матрица S такая, что
S~XAS—диагональная матрица.
Действительно, матрица А задает самосопряженное
преобразование в ортонормированием базисе. В качестве
S можно взять матрицу перехода от этого базиса к бази-
су, построенному в теореме. Напомним, что в базисе из
X) В самом «худшем> случае все корни характеристического
многочлена совпадают, и тогда А имеет только одно собственное
значение.
235
собственных векторов матрица преобразования диагональ-
ная (предложение 6 § 4 гл. VI).
В теореме 1 § 3 гл. IV мы рассматривали, в частности,
аффинное преобразование плоскости, состоящее в сжатии
(растяжении) по двум взаимно перпендикулярным на-
правлениям. В п-мерном евклидовом векторном простран-
стве обобщением такого преобразования будет сжатие
(растяжение) по п попарно перпендикулярным направ-
лениям. Выберем ортонормированный базис так, чтобы
его векторы имели данные направления. Тогда каждый
базисный вектор е{ перейдет в ему пропорциональный
вектор kfit, где А,(—коэффициент сжатия. (Собственно,
это свойство является аккуратным определением сжатия
по попарно перпендикулярным направлениям.) В таком
базисе матрица преобразования будет диагональной, при-
чем по главной диагонали будут стоять коэффициенты
сжатия. Поскольку диагональная матрица симметрична,
а базис ортонормирован, сжатие по п попарно перпенди-
кулярным направлениям будет самосопряженным преоб-
разованием.
Обратно, в силу нашей теоремы каждое самосопряжен-
ное преобразование с положительными собственными зна-
чениями будет сжатием по п попарно перпендикулярным
направлениям. Нулевому собственному значению соответ-
ствует уже не сжатие, а ортогональное проектирование,
а отрицательному собственному значению—произведение
сжатия и симметрии.
Если X*—собственное значение кратности а, то ему
соответствует s-мерное инвариантное подпространство <£г.
Действительно, иначе не мог бы существовать базис из
собственных векторов: сумма всех кратностей равна п,
а число линейно независимых векторов, принадлежащих
каждому значению, не может превосходить его кратность.
При Л* > 0 ограничение преобразования А на таком
инвариантном пространстве представляет собой гомо-
тетию, т. е. равномерное сжатие по всем направлениям
в К* раз.
Рассмотрим теперь способ практического нахождения
базиса, существование которого доказано в теореме. Вы-
брав некоторый (удобнее, если ортонормированный) базис,
составляем матрицу данного преобразования. Находим
корни ее характеристического многочлена det (Л—Z£) = 0
и для каждого корня находим собственные векторы, ре-
шая систему уравнений (А—KE) £ = о. Для простых корней
нетривиальное решение системы остается пронормировать.
236
Для ’ Корня кратности s мы получаем фундаментальную
систему из s решений. Это—линейно независимые собст*
венные векторы, но они, вообще говоря, не ортогональны.
Их следует ортогонализовать и нормировать.
3. Изоморфизм евклидовых пространств. Дадим еле*
дующее
Определение. Евклидовы пространства S и S'
называются изоморфными, если существует взаимно одйо-
зНачное линейное отображение А: <£ —>-S', при котором
(А (х), А (у)) = (х, У) (8)
для любых х и у из S- Отображение А называется изо-
морфизмом евклидовых пространств.
Таким образом, термин «изоморфизм» имеет различные
значения в зависимости от контекста. Если речь идет об
евклидовых пространствах, то при изоморфизме, помимо
сохранения результатов линейных операций, требуется
и сохранение скалярного произведения.
Для того чтобы два евклидовых пространства были
изоморфны, разумеется, необходимо, чтобы были равны
их размерности. Действительно, в противном случае они
не изоморфны даже как линейные пространства. Оказы-
вается, что это условие и достаточно.
Теорема 5. Любые два евклидовых пространства
одной размерности изоморфны. Евклидовы пространства
разных размерностей не изоморфны.
Для доказательства первого утверждения выберем
в-каждом из рассматриваемых пространств S и S' по
ортонормированному базису. Отображение A: S —► S' за-
дадим, сопоставив друг другу векторы, имеющие одина-
ковые координатные столбцы в выбранных базисах. Мат-
рица этого отображения единичная, поэтому отображение
будет изоморфизмом пространств <£ и S', рассматриваемых
как линейные пространства. Из формулы (11) § 1 следует,
что при таком отображении сохраняется скалярное про-
изведение.
Интересно отметить, что условие (8) очень сильное.
Из него следует, что А—линейное отображение и, более
того, вложение. Действительно, рассмотрим произвольный
вектор х из S и произвольное число а. Скалярный квад-
рат'вектора А (ах)—аА(х) из S' можно записать в виде
(А (ах), А (ах)) —2а (А (ах), А(х))4-а2(А(х), А(х)). Учиты-
вая (8), видим, что это равно (ах, ах)—2а (ах, х) 4- а’ (х, х),
т. е. нулю. Таким образом, А(ах)=аА(х). Аналогично
доказывается, что А (х + у) = А (х) + А (у).
азг
Далее, пусть вектор х принадлежит ядру отображения
А, т. е. А(х) = о. Это означает, что (А(х), А(х)) = 0
и, в силу (8), что (х, х)==0. Таким образом, ядро А-1-
нулевое подпространство н А—вложение.
В общем случае отображение А, удовлетворяющее
условию (8), не взаимно однозначно: оно может быть
изоморфизмом £ на подпространство в
Пусть размерность т пространства равна размер-
ности п пространства Поскольку А—вложение, его
ранг г равен п, и тем самым m = n = r. Согласно предло-
жению 6 § 3 гл. VI А является изоморфизмом. Мы дока-
зали
Предложение 5. Произвольное отображение евкли-
дова пространства £п в евклидово пространство €'п той же
размерности является изоморфизмом, если оно сохраняет
скалярное произведение.
4. Ортогональные преобразования. Преобразование А
евклидова пространства называется ортогональным,
если оно сохраняет скалярное произведение, т. е. если
условие (8) выполнено для любых векторов из
Из предложения 5 следует, что ортогональное преоб-
разование является изоморфизмом <S на себя.
Предложение 6. Для ортогонального преобразова-
ния сопряженное преобразование равно обратному преоб-
разованию: А* = А-1.
Действительно, по формуле (8) имеем (х, А* о А (у)) —
=» (х, у), или (х, А* о А (у) — у) = 0. Это означает, что
вектор А* о А(у)—у ортогонален любому вектору прост-
ранства и, следовательно, является нулевым. Поскольку
равенство А* о А (у) — у выполнено для всех векторов,
преобразование А* о А является тождественным. Отсюда
прямо следует доказываемое предложение.
Следствие. В ортонормированном базисе ортого-
нальное преобразование имеет ортогональную матрицу:
АТА = Е.
Л
Предложение 7. Корни характеристического многочлена
ортогонального преобразования К (в том числе и комплексные корни)
по абсолютной величине равны единице.
Пусть А—матрица А в ортонормированном базисе и А,—корень
уравнения det(A—К£)=0 (возможно, комплексный). Система урав-
нений (Л—А£)£ = о имеет, вообще говоря, комплексное нетривиаль-
ное решение. Из равенства Л£=А£ следует |ГЛГ=1|Г, Помжпвдм
каждую часть первого равенства слева па соответствующую часть
второго: _^ГЛГЛ£ = Так как ЛГЛ=£ н"|г|^0, имеем
отсюда АА=1, как н требовалось,
238
Предложение 8. Если —подпространство, инвариантно»
относительно ортогонального преобразования А, то ортогонально»
дополнение £ -1- подпространства & также инвариантно.
Для доказательства заметим, что ограничение А* преобраэова-
ния А на ортогональное преобразование и, следовательно, вза-
имно однозначно, В частности, оно является наложением. Итак, если х
лежит в то вектор А“*(х) также лежит в
Рассмотрим произвольный вектор у нз . Нам надо доказать,
что его образ А (у) ортогонален каждому х из Мы имеем
А(у)) = (А-»(л)( У)=О,
поскольку у ортогонален каждому вектору нз Предложение
доказано.
Теорема 6. Пусть А—ортогональное преобразование п-мерного
евклидова пространства £п. Тогда является прямой суммой одно-
мерных и двумерных подпространств, инвариантных относительно А.
Доказательство. Любое ортогональное преобразование
в каждом евклидовом пространстве имеет хотя бы одно одномерное
или двумерное инвариантное подпространство, так как его характе-
ристический многочлен имеет хотя бы одни вещественный или комп-
лексный корень.
Используя это соображение, докажем нашу теорему по индукции.
Для пространств размернос'гей 1 и 2 утверждение не вызывает сом*
нений Предположим, что мы уже доказали теорему для пространств
размерностей k—1 и k—2, и докажем ее для й-мерного простран-
ства. В Ёь существует одномерное или двумерное инвариантное
подпространство а его ортогональное дополнение представ-
ляет собой соответственно (Л—1)-мерное или (k—2)-мерное инвари-
антное подпространство. К ограничению А' преобразования А на
мы применим предположение индукции. Подпространства ,...,
на которые распадается будут инвариантными также относи-
тельно А. Поскольку есть прямая сумма и и прямая
сумма ... , пространство является прямой суммой
&, 4>, Теорема доказана.
Можно предполагать, что двумерные инвариантные подпростран-
ства не содержат внутри себя одномерных инвариантных подпрост-
ранств. Действительно, если в двумерном инвариантном подпростран-
стве содержится одномерное <£i, то содержится и второе одномерное
инвариантное подпространство —ортогональное дополнение пер-
вого до <$а. Таким образом, есть прямая сумма & и и в раз-
ложении мы можем заменить слагаемое на два слагаемых
и
Выберем в каждом из двумерных и одномерных инвариантных
подпространств, на которые распадается по ортонормированному
базису и объединим все эти базисы. Мы получим ортонормированный
базис в], ..., еа в <£п. Построим матрицу А преобразования А в этом
базисе.
Пусть базисный вектор е,- соответствует одномерному инвариант*
пому пространству, т. е. является собственным. В силу предложе-
ния 5 соответствующее собственное значение равно 1 или—1. Поэтому
все элементы /-го столбца матрицы равны нулю, кроме элемента aj
на главной диагонали, равного 1 или —1,
239
Рассмотрим базисные векторы е* и ек+1, лежащие в двумерном
инвариантном подпространстве ^'.Векторы А(е*) и A (e*+i) рас-
кладываются только по векторам е* и e*+i, и потому в й-м и (6-|-1) м
столбцах матрицы А равны нулю все элементы, за исключением
клетки второго порядка
1^,. k 0
ак “fc+i|
„к+l „*+1|
ак “*+11
на главной диагонали, Эта клетка является матрицей ограничения А'
преобразования А на подпространстве Согласно предложению 6
§ 2 гд, IV и, формуле (4) § 3 гл IV матрица ортогонального преоб-
разования в двумерном пространстве в ортонормированном базисе
имеет вцд
Icos <р Т sin ф 8
sin ф ± cos ф J
где верхние знаки берутся для ортогональных преобразований пер-
вого рода, а нижнне—для преобразований второго рода. С нижними
вязками матрица является симметрической. Поэтому ортогональное
преобразование второго рода самосопряженное и, следовательно, имее?
два одномерных инвариантных подпространства. Это противоречит
сделанному выше предположению Таким образом, существует такое
число ф*, что
|“* “*+ 1 Bl СОЗ ф* — 81Пф|Л
“*+1 lista<₽* *
Предоставим читателю самостоятельно выписать общий вид
матрицы А.
§ 3. Понятие об унитарных пространствах
1. Определение. В этом параграфе мы покажем, как
определяется скалярное произведение в комплексных ли-
нейных пространствах. При этом мы не будем приводить
доказательств, поскольку их можно получить незначитель-
ным видоизменением доказательств соответствующих пред-
ложений из § 1. Здесь все числа, вообще говоря, комп-
лексные.
Рассмотрим комплексное линейное пространство 3
и предположим, что мы каким-то образом сопоставили
каждой паре векторов х и у число (х, у). Оказывается,
что естественные аксиомы, приведенные в определении
евклидова пространства, выполнены быть не могут. Дейст-
вительно, пусть х—ненулевой вектор. В нашем простран-
стве определено умножение вектора на комплексное число,
и мы можем взять вектор ix, где t —мнимая единица Если
выполнены аксиомы 1° и 2°, то имеет место равенство
(/х, tx) =— (х, х).
240
При положительном произведении справа ‘произведение
слева отрицательно Это противоречит аксиоме 4°.
В силу этого обстоятельства в комплексных простран-
ствах вводятся другие определения скалярного произве-
дения. В одном из них заменяют аксиому 4° более слабым
требованием’ чтобы из того, что (х, у) —О при всех х,
вытекало у = 0 Комплексное линейное пространство, в ко-
тором тдк определено скалярное произведение, называется
комплексным евклидовым пространством Комплексные
евклидовы пространства используются сравнительно редко,
Гораздо чаще в приложениях встречаются так называемые
унитарные пространства.
Определение Комплексное линейное простран-
ство 3? называется унитарным (или эрмитовым), если
задан закон, сопоставляющий каждым двум векторам х и у
из 3? комплексное число (х, у), и закон этот удовлетво-
ряет следующим аксиомам, каковы бы ни были векторы
х, у и г и число а.
Г. (х, у) —{у, х), т е. при перестановке сомножителей
скалярное произведение заменяется на комплексно сопря-
женное число
2°. (ах, у) = а(х, у)
3°. (х + t/, z)=;(x, г) + (у, г).
4° (х, х) > 0, если х #= о.
Число (х, у) называется скалярным произведением век
торов хну. ____
Заметим, что для любого вектора (х, х) = (х, х), и по-
тому скалярный квадрат вектора—всегда вещественное
число В аксиоме 4° требуется, чтобы это число было по-
ложительно для х #= о.
Из аксиом 1° и 2° вытекает такое правило вынесения
числового множителя от второго сомножителя в скаляр-
ном Произведении'
(х, ау) = (аг/, х) == а (у, х) = а (у* х)
(ср. (4) § 7 гл. V). Окончательно
(х, ау)~а(х, у). (1)
Длина вектора и угол между векторами определяются
теми же формулами, что и в вещественном случае. Длина
вектора всегда вещественна и неотрицательна. Угол, вообще
говоря, комплексный
Векторы называются ортогональными, если их скаляр-
ное произведение равно нулю. Нулевой вектор и только
он ортогонален каждому вектору.
241
Отметим, что имеет место неравенство
(X, х)(у, t/)>|(x, J/)|’ = (X, у) (у, х).
Оно доказывается так же, как и неравенство (7) § 1,
с учетом того, что
(ах+₽у, ах + ру) = аа (х, х) + оф (х, у) 4- 0а (yt х)4-(у, у).
Пример 1. Комплексное линейное пространство
столбцов высоты п становится n-мерным унитарным про-
странством, если определить скалярное произведение
столбцов § и 1] по формуле
(6. 4) = ^ +.••+№ (2)
Действительно, по этой формуле имеем также
(n. £) = n1l1 + ...+n<n-
Из формул (3) и (4) § 7 гл. V следует, что (5, 'П) = (ч. !)•
Аксиомы 2° и 3° следуют из свойств умножения мат-
риц, если заметить, что правая часть (2) представляет
собой произведение £г1], где ц—столбец из элементов
г]1, ..., т)и. Наконец,
(5, 1) = ^4-• • - +НП = |^|‘4*.•. +|5"|\ (3)
а следовательно, скалярный квадрат столбца неотрицате-
лен и равен нулю только для нулевого столбца.
Пример 2. Одномерное унитарное пространство
можно построить следующим образом. Рассмотрим в ка-
честве множества векторов все векторы обычной плоско-
сти. Операцию сложения определим, как обычно, по пра-
вилу параллелограмма.
Для того чтобы определить операцию умножения на
комплексное число, выберем некоторый ортонормирован-
ный (в обычном смысле) базис ех, е3. Произведением век-
тора х с компонентами £1, на число а4-ф мы назовем
вектор с компонентами а|х—и а^2^-^1. Смысл этого
определения такой. Каждому вектору мы можем сопоста-
вить комплексное число £*4-*£2; при этом соответствие
между числами и векторами взаимно однозначно: вектору
соответствует только одно число, и каждому числу соот-
ветствует единственный вектор. Произведение (а-(-ф)х
соответствует числу (а 4-ф) (5* 4-Заметим, что сумме
векторе» соответствует сумма чисел, соответствующих
слагаемым.
242
Проверим, выполнены ли аксиомы линейного прост-
ранства. Первые четыре аксиомы, относящиеся к сложе-
нию векторов, разумеется, выполнены. Далее, равенства
(Л+р)х=1х+рх и Л(х4-у) = Лх+1у следуют из дистри-
бутивности умножения комплексных чисел. Равенство
Я (цх) = (Ар) х вытекает из ассоциативности умножения.
Очевидно также, что 1х = х. Таким образом, мы имеем
комплексное линейное пространство. Размерность его
равна 1, так как каждый вектор х равен (V + (£’) ео где
tl-H£8—комплексное число, определяемое вектором х.
Базисом является вектор ef.
Скалярное произведение векторов х = Хе1 и у = це1
определим по формуле (х, Не представляет труда
проверить аксиомы скалярного умножения в унитарном
пространстве.
Унитарная длина вектора (1-M)®f равна УЪ. Скаляр-
ное произведение (ef, е,) = (ео teje — i, хотя по отно-
шению к скалярному произведению на вещественной пло-
скости векторы е( и еа перпендикулярны.
2. Свойства унитарных пространств. Все рассмотренные
выше свойства евклидовых пространств, иногда с незна-
чительными изменениями, переносятся на унитарные про-
странства.
В конечномерном унитарном пространстве существует
ортонормированный базис, т. е. базис из попарно ортого-
нальных векторов единичной длины. Такой базис можно
получить из произвольного базиса методом ортогонали-
зации.
Скалярное произведение выражается через компоненты
сомножителей в ортонормированном базисе по формуле
(х, ++ъп'йп.
Цпя гшоизвольного базиса вводится матрица Грама —
матрица Г, составленная из попарных скалярных произ-
ведений базисных векторов. Скалярное произведение век-
торов х и у с координатными столбцами | н q находится
по формуле
(*.
Поскольку (е{, et), матрица Грама в унитар-
ном пространстве удовлетворяет условию
ГГ=Г. (4)
243
(Здесь и далее черта над матрицей означает замену всех
ее элементов на комплексно-сопряженные.)
Определение. Каждая матрица, удовлетворяющая
условию (4), называется эрмитовой.
Матрица перехода S от одного ортонормированного
базиса в унитарном пространстве к другому такому же
базису должна удовлетворять равенству
STS = E. (5)
Это означает, что S-1 = ST, а отсюда следует
SST = E.
Определение. Матрицы, удовлетворяющие равен-
ству (5), называются унитарными.
Отметим, что из равенства (5) и формулы (7) § 7 гл. V
следует
det (SrS) «= det ST det S = (det S) (detS) = | det S |a = 1,
и, таким образом, детерминант унитарной матрицы —1
комплексное число, по модулю равное единице.
Ортогональное дополнение подпространства определя-
ется так же, как в евклидовом пространстве. Точно так
же можно доказать, что ортогональное дополнение будет
подпространством дополнительной размерности.
3. Самосопряженные и унитарные преобразования.
Преобразование унитарного пространства называется са-
мосопряженным., если для любых векторов х и у выпол-
нено равенство
(А(х), у) = (х, А (у)}.
Из этого определения вытекает, что преобразование уни-
тарного пространства является самосопряженным тогда
и только тогда, когда его матрица в любом ортонорми-
рованном базисе эрмитова. На самосопряженные преобра-
зования унитарных пространств без изменений переносят-
ся теоремы 1—4 § 2.
Преобразование унитарного пространства, удовлетворя-
ющее условию
(А(х), A(y))=j(x, у)
для любых векторов х и у, называется унитарным пре-
образованием. Нетрудно проверить, что преобразование
унитарно тогда и только тогда, когда его матрица в лю-
бом ортонормированном базисе унитарная.
244
ГЛАВА VIII
ФУНКЦИИ НА ЛИНЕЙНОМ ПРОСТРАНСТВЕ
g 1. Линейные функции
1. Определение функции. Как и в гл. VI, мы будем
рассматривать произвольное линейное пространство. В тех
случаях, когда различие между вещественными и комп-
лексными пространствами окажется существенным, будут
сделаны дополнительные предположения. Если слово
«число» употребляется без уточнения, следует иметь в
виду комплексное число для комплексного пространства
и вещественное число для вещественного. Как правило,
мы не вводим скалярного произведения, но значительная
часть результатов относится к евклидовым пространствам
Определение. Будем говорить, что на линейном
пространстве S задана функция (от одного вектора), ес-
ли каждому вектору х из 2 сопоставлено число; задана
функция от двух векторов, если каждой упорядоченной
паре х, у векторов из S сопоставлено число.
Число, которое функция f сопоставляет вектору х,
мы будем называть значением функции f на векторе х
и обозначать f (х). Аналогично определяется значение
д(х, У) функции g от двух векторов.
Функции на бесконечномерных пространствах принято
Называть функционалами.
Пусть пространство имеет размерность п. Если
мы выберем некоторый базис, то каждому вектору х из
будут сопоставлены п его компонент V, • • •» Sr‘- На-
помним, что в математическом анализе называют функ-
цией от п переменных закон, который ставит в соответ-
ствие некоторое число каждому упорядоченному набору
из п чисел g1, .... входящему в определенную сово-
купность таких наборов. Таким образом, при выбранном
базисе функция f на линейном пространстве задается
функцией от п переменных, определенной для всевозмож-
ных наборов Если базис изменится, тому же
245
вектору х будут соответствовать новые компоненты 5'1, ...
.... с'1 и, следовательно, прежняя функция f будет за-
даваться новой функцией от п переменных.
2. Линейные функции. Введем
Определение. Функция f на линейном простран-
стве S называется линейной, если для любых векторов х
и у из S и любого числа а выполнены равенства
1<х+у) = 1(х) + Цу), f(ax)-af(x). (1)
Читатель может заметить, что линейная функция на
линейном пространстве не является новым для него
объектом. Это в точности то же самое, что линейное отобра-
жение данного линейного пространства в одномерное
арифметическое пространство (ср. пример 3) § 3 гл. VI).
Пример 1. Функция, сопоставляющая каждому век-
тору число нуль, является линейной. Функция, сопостав-
ляющая всем векторам одно и то же число, не равное
нулю, линейной быть не может, так как для каждой ли-
нейной функции f(o) = 0. Рекомендуем читателю самосто-
ятельно проверить эти утверждения.
Пример 2. Пусть <Sn—n-мерное евклидово простран-
ство. Выберем в нем некоторый фиксированный вектор а.
Тогда каждому вектору х из £п мы можем сопоставить
число £ = (а, х). Очевидно, что равенства (1) выполнены,
и мы имеем линейную функцию на £п.
Пример 3. Пусть в линейном пространстве ,3?п вы-
бран базис et, ..., е„. Сопоставим каждому вектору х
его l-ю компоненту £' в данном базисе. Очевидно, что это
соответствие—линейная функция на Мы обозначим
ее р‘. Так может быть построено п функций р\ ..., р".
Конечно, они зависят от того, какой базис мы выбрали.
Пример 4. Рассмотрим бесконечномерное линейное
пространство состоящее из функций от одной незави-
симой переменной 5, определенных и непрерывных для
Пусть о(?)—фиксированная функция нз J?,
например o(5)=sin|. Тогда каждой функции и(|) из S
можно сопоставить число
1
c«Jpa)tt(g)dB.
о
Очевидно, что это соответствие—линейный функционал.
Впрочем, если вспомнить пример 3 § 1 гл. VII, станет
ясно, что этот функционал построен по образцу линейной
функции из примера 2.
246
Еще один линейный функционал на том же простран-
стве 3 мы получим, если сопоставим каждой функции
«($) из 3 ее значение ы(0) при | = 0.
Рассмотрим произвольное n-мерное линейное прост-
ранство Зп и выберем в нем некоторый базис eit ..., еп.
Значение линейной функции f на векторе к из мо-
жет быть записано через компоненты этого вектора
&......64
f (х) = f (Vet + ... + l’e„) = £4 (ex) + . • • +S"f (en).
Числа f(ex), f(e„) не зависят от вектора х, а опре-
деляются только по функции f и базису eit .... е„. Мы
доказали следующее
Предложение 1. Каждая линейная функция на
п-мерном линейном пространстве в произвольном базисе
eit .... еп задается линейным однородным многочленом
f(x) = xig14-...+xng” (2)
от компонент вектора по этому базису. Коэффициенты
многочлена Xj, ..., к„ равны значениям функции на ба-
зисных векторах.
Значения функции Г на векторах базиса е удобно на-
зывать компонентами (или коэффициентами) функции f
в базисе е. Матрица линейного отображения п-мерного
пространства в одномерное имеет размеры 1хп, т. е.
представляет собой строку длины п. В нашем случае
это—строка Jxt...x„(. Предоставим читателю проверить
это. Формула (2) в матричном виде записывается так:
U1 I
f(x) = fx1...xj ... = х£. (3)
I I
Легко видеть, что каждая строка х по формуле (3)
определяет линейную функцию. В самом деле, х(6+ч)в
=>-х£4-хт) и х(а£) = а(х£).
Формула (6) § 3 гл. VI выражает матрицу отображе-
ния в новых базисах через старую матрицу отображения
и матрицы перехода к новым базисам. Так как в одно-
мерном арифметическом пространстве базис фиксирован
раз навсегда, для линейной функции эта формула прини-
мает вид
x'=xS. (4)
Здесь х—строка коэффициентов функции в базисе е,
а к'—строка ее коэффициентов в базисе е' == eS. Разумеется,
формулу (4) легко получить и непосредственно. Действи-
247
тельно, запишем f (х) в каждом из двух базисов: f (х) =
= х£ = х'£!. Отсюда согласно (3) § 1 гл. VI х5§! = х’§* или
(xS—х')|' = о, Здесь —произвольный столбец. Подстав-
ляя на его место последовательно каждый столбец еди-
ничной матрицы, мы увидим, что каждый элемент стро-
ки xS—х' равен нулю.
3. Сопряженное пространство. В гл. VI мы ввели оп-
ределения суммы линейных отображений и произведения
линейного отображения на число. В применении к линей-
ным функциям эти определения формулируются так:
Определение. Суммой линейных функций 1ид
называется функция h, значение которой на каждом век-
торе х определено равенством h (х) = f (х) 4- g (х). Произ-
ведением линейной функции f (х) на число а называется
функция д(х), значение которой на каждом векторе х
определяется равенством g(x) = af(x).
Предложение 2. Пусть f и g—линейные функции
на линейном пространстве 2 ин и X—их строки коэффи-
циентов в некотором базисе е. Тогда сумма f 4- g — линей-
ная функция, имеющая строку коэффициентов н-}-К в ба-
зисе е, и для произвольного числа а произведение af —
линейная функция, строка коэффициентов которой в ба-
зисе е есть ах.
Для произвольных линейных отображений это было
доказано в п. 6 § 3 гл. VI. Воспроизведем, однако, это
доказательство для случая суммы линейных функций.
Для произвольного вектора х значения (ид записыва-
ются в базисе е как х| и Ц. Тогда значение суммы
f-f-g на том же векторе равно х$ + = |. Отсюда
видно, что f 4-g—линейная функция со строкой коэффи-
циентов x-f-X.
Предложение 3. Множество 2* всех линейных
функций на п-мерном линейном пространстве 2п по от-
ношению к введенным выше операциям сложения и умно-
жения на число представляет собой п-мернов линейное
пространство.
Действительно, существует взаимно однозначное ото-
бражение множества 2* в множество строк длины п.
Согласно предложению 2 при этом отображении сумме
функций соответствует сумма строк и произведению функ-
ции на число соответствует произведение строки на это
число. Поскольку аксиомы линейного пространства выпол-
нены для операций со строками, они будут выполнены
и для операций в 2*. Следовательно, 2*—линейное
пространство, изоморфное пространству строк длины п.
248
Определение. Линейное пространство 3* всех
линейных функций на линейном пространстве 3 называ-
ется сопряженным пространству 3.
Выберем в пространстве 3„ базис е и рассмотрим
линейные функции р‘ (7=1, п), определяемые ра-
венствами р'(х) = £', где — i-я компонента вектора х
(ср. пример 3). Это означает, что
О, i =/= /•
1, i = /,
р'(«?/)=
(б)
или, иначе, координатная строка функции р1 есть i-я
строка единичной матрицы. Отсюда легко следует, что
функции р1, ..., р" линейно независимы.
Строка х = ||х1.. .хи|| раскладывается по строкам еди-
ничной матрицы с коэффициентами х,, ..., х„. Это значит,
что элемент f пространства 3* со строкой коэффициен-
тов |х1...х„|| имеет разложение
f = x1p1+ ...Ч-х„рп. (6)
Таким образом р*, .... р”—базис в пространстве^*.
Определение. Базис р\ ..., р" пространства 3'._,
определяемый формулой (5), называется взаимным (или
биортогональным) базису en ..., е„ пространства Зл.
Введем столбец р, составленный из функций р‘. Те-
перь разложение (6) можно переписать в матричной,
форме:'
I ₽11
f = |«p--«Jr;*l’=>‘A (7)
I! Р t
Если для пространства 3„ придерживаться соглашения
писать компоненты вектора в столбец, то формулу (7)
следовало бы* написать f=prxr.
Пусть в пространстве Зп базисы е и е‘ связаны ра-
венством е'~eS. Найдем матрицу перехода между их
взаимными базисами р и р*. Для этого напишем форму-
лу (4) в виде (3) § 1 гл. VI, решив ее относительно ста-
рых компонент и записав компоненты в столбец. Мы по-
лучим
xr=(S-1)rx'T.
Отсюда видно, что матрицей перехода от базиса р к ба-
зису р' в пространстве 3*п будет матрица (S~1)r, т. е.
имеет место равенство р'т—рт . Если вернуть-
ся для пространства Зп к записи элементов базиса в
249
столбец, зависимость между базисами примет вид
P~Sp'. (8)
Пространство —такое же линейное пространство,
как и любое другое, и, следовательно, имеет сопряжен-
ное пространство 2", элементы которого—линейные функ-
ции на S’n.
Предложение 4. Пространство S*n* может быть
отождествлено с Sn.
Доказательство, фиксируем определенный век-
тор х из S„ и сопоставйм каждому элементу f из S’n
число f(x). Таким образом, х можно рассматривать как
функцию на S'n. Эта функция линейная. Действительно,
и, следовательно, функция х сум-
ме элементов из 2‘п сопоставляет сумму чисел, сопостав-
ляемых слагаемым. Аналогично, равенство (af)(x) = af (х)
означает, что произведению элемента f на а функция х со-
поставляет произведение а на число, сопоставляемое f.
Итак, х можно рассматривать как элемент из 2".
Докажем, что все пространство Sn совпадает с под-
пространством в Sn*. Для этого достаточно доказать,
что сумма и произведение на число для векторов из Sn
совпадают с их суммой и произведением на число, если
их понимать как линейные функции на S‘n. Но это оче-
видно. Например, для суммы это равносильно условию
((х + У)ж f (х) 4- f (у), верному для любых х и у из Sn
и любого f из S*n.
Теперь совпадение Sn и S*n* вытекает из равенства
их размерностей в силу предложения 2 § 2 гл. VI.
4. Линейные функции на евклидовых пространствах.
Выбор базиса в линейном пространстве S устанавливает
изоморфизм между S и S*. Если пространство евклидо-
во, то изоморфизм между ним и его сопряженным можно
установить независимо от базиса. Именно, в примере 2
было показано, что по формуле f (х) = (а, х) каждому век-
тору а евклидова пространства можно сопоставить линей-
ную функцию на этом пространстве.
Назовем вектор а присоединенным функции f (х) =
™ (а, х) и запишем связь между строкой х коэффициен-
те® этой функции и координатным столбцом вектора а в не-
котором базисе е. Мы имеем f (х) = х£ = агГ£, где а и
5—координатные столбцы векторов а и х, а Г—матрица
Грама базиса е. Так как коэффициенты линейной функции
определены однозначно (это ее значения на векторах ба-
260
виса), из последнего равенства следует, что
х=»агГ, или хг = Га.
Последнюю формулу можно рассматривать как координат-
ную запись линейного отображения Г» в паре
базисов е и р, причем базис р—взаимный базису е. По-
скольку detr=/=O, отображение Г является изоморфизмом
на рассматриваемых как линейные пространства.
Отсюда, в частности, следует, что для любой линей-
ной функции f на найдется присоединенный вектор f
такой, что f(x)=(f, х).
В пространстве пока не введено скалярное умно-
жение. Но мы можем ввести его по формуле (Г (а),
Г (Ь)) = (а, Ь). Если это сделано, то отображение Г будет
изоморфизмом евклидовых пространств.
Итак, между евклидовым пространством и его со-
пряженным существует вполне определенный, связанный
со скалярным произведением изоморфизм, который позво-
ляет отождествить эти пространства. Такое отождествле-
ние является общепринятым.
Рассмотрим векторы р' = Г~* (р‘) (1=1» п), отождествля-
емые с элементами базиса р. Из формулы (5) следует, что они
удовлетворяют условию
Я.
Отсюда нетрудно вывести, что при п=3 взаимный баэио, определен-
ный нами в § 3 гл. I, совпадает о взаимным базисом в смысле опре-
деления на с, 249,
§ 2. Квадратичные формы
1. Билинейные формы. Введем следующее
Определение. Билинейной функцией или билиней-
ной формой на линейном пространстве называется
функция b от двух векторе® на J?a, удовлетворяющая
(для любых векторов х, у и г и любого числа а) равен-
ствам
Ь (х+у, г) = Ь (х, г) 4- Ь (у, z), Ь (ах, у) =* аЬ (х, у),
Ь (х, у+г)== Ь (х, у) 4- Ь (х, г), Ь (х, ау) = аЬ (х, у).
Выберем в пространстве базис eit ...» е„. Если
ДР =5» » то значение билинейной формы
Ь на векторах х и у может быть вычислено следующим
251
! (1)
образом:
(9 П \
-Ss'*/» — ej),
Или окончательно*
Ь(х, y) = 2P//£V. (2)
п’ чисел Р/у—значения билинейной формы на всевозмож-
ных параХ базисных векторов—называются коэффициен-
тами билинейной формы в базисе eit .... еп. Их приня-
то записывать в виде квадратной матрицы порядка п:
IPfi Pla ... Pin|
P»i Зга • • • Pan |
Pni Рл« • • Рлп |
Эта матрица называется матрицей билинейной формы
в данном базисе. В матричном виде, как легко проверить
умножением матриц, равенство (2) записывается в виде
Ь(х, у)=*¥Вц. (3)
При замене базиса матрица билинейной формы, разу-
меется, изменяется. Получим закон ее изменения. Пусть
векторы нового базиса е[, ..., е„ выражаются через
векторы старого базиса eit ..., е„ равенствами £(&*,
где через о? обозначены элементы матрицы перехода S.
Для коэффициентов билинейной формы Ь в базисе е' мы
имеем при любых i, j—1, .... п
b (е{, е',) ь= Ь( 5 o*ek, £ о‘е() = S °f°/b (ek, et),
\ы <=i J k,l
или
Po-Scf/W (4)
k, I
Как легко проверить, равенства (3) равносильны матрич-'
ному равенству
B' — STBS, (5)
в котором В'—матрица билинейной формы в базисе е'
Билинейная форма b называется симметричной, если
при любых х и у имеет место равенство Ь(х, у) = Ь(у, х)
Если билинейная форма b симметрична, то Ь(е{, е^)—
=b(ey, et) при всех i и /, и, следовательно, матрица би-
линейной формы симметрическая. Обратно, пусть матрица
252
билинейной формы симметрическая, т. е. В=ВТ. Тогда,
поскольку матрица размеров 1 х 1 не меняется при транс-
понировании,
Ь (X, у)-(VB^T== ч\тВ1^Ъ (у, х),
и, следовательно, билинейная форма Ь симметричная. Мы
доказали
Предложение 1. Билинейная форма симметрична
тогда и только тогда, когда ее матрица симметриче-
ская (какое бы ни был базис).
?. Другая точка зрения на билинейные формы. Рассмотрим би-
линейную форму Ь (х, у) на линейном пространстве Хп и фиксируем
произвольный вектор у из Ха Тогда Ь (х, у)—линейная функция
от х. Чтобы подчеркнуть это, мы можем обозначить Ь(х, у) как
Ь0 (х). Таким образом, каждому вектору у из Хп сопоставлена ли-
нейная функция на Хп, т. е. мы имеем Отображение В. Хп—уХ*п.
Легко видеть, что отображение В линейнбе. Действительно рассмот-
рим О^раз В(х-|-у) суммы двух векторов х и у. Это—линейная функ-
ция Ьх+„, сопоставляющая произвольному вектору г число Ь(г,х^-у).
НоВ'силу линейности Ь по второму аргументу Ь(х, х+у) = Ь(г, х)4-
+ Ь(г, у). Отсюда Ьх+0«=Ьж-|-Ь0. Итак, B(x+y)JeB(x)4-B^).
Аналогично доказывается, что B(ax) = <xBj>).
Наоборот, пусть дано Линейное отображение В: Хп —* Хп- Век-
тору х из Хп оно сопоставляет линейную функцию Ь* на Хп> Сле-
довательно, двум векторам х и у из Х„ можно сопоставить число
Ь* (у), которое мы имеем право обозначить Ь(х, у). Функция Ь(х, у)
лиПейиа По первому аргументу, так как В—линейное отображение,
и линейна по второму аргументу, так как Ьх—линейная функция.
Итак, билинейную форму на Хп можно определить как линей-
ное отображение Хп в Хп.
Пусть е—базис в Хп, а р—взаимный ему базис в X*. Найдем
матрицу линейного отображения В соответствующего бялииейной
форме Ь Образ В (ед базисного вектора е/—линейная функция (у).
Она имеет строку коэффициентов bfa, «/), ,,,, Ь(е„, е/), Эти же
числа образуют i-й столбец искомой матрицы, так как они—коор-
динаты В (ед по базису р. Мы видим что матрица отображения В
в базисах в и р совпадает с матрицей В билинейной формы Ь в ба-
зисе е.
Из сказанного видно, что закон изменения матрицы билинейной
формы (5) есть простое следствие формулы преобразования матрицы
линейного отображения (6) § 3 гл, VI и равенства (8) $ 1,
Теорема 2 § 3 гл. VI не относится к билинейным формам, так
как базисы е и р не произвольны, а р— взаимный для е.
Если билинейная форма не симметричная, то, фиксируя первый
аргумент, а не второй,мы получим другое отображение Вг: X —* X*.
Его матрица в Паре взаимных базисов в и р равна транспонирован-
ной матрице билинейной формы ВТ. Проверить это—полезное уп-
ражнение.
3. Квадратичные формы. Сейчас мы переходим и изу-
чению важного класса функций на линейных-пространст-
вах, тесно связанного с билинейными формами.
2b3
Определение. Квадратичной формой называется
функция к на линейном пространстве значение кото-
рой на любом векторе х определяется равенстве»! к (х)*
» Ь (х, х), где Ь—симметричная билинейная форма на J?„.
Пр заданной квадратичной форме к однозначно опре-
деляется соответствующая симметричная билинейная фор-
ма Ь. Действительно, пусть х и у—произвольные векторы.
Рассмотрим значение квадратичной формы на векторе х+у
k(x-J-y) = b(x-J-z/,
=Ь(х, х)4-Ь(х, у)4-Ь(у, х) + Ъ(у, у).
Отсюда, используя симметричность билинейной формы,
получаем
Ь (х, у) = у [к (х+у)—к (х)—к (у)],
и, следовательно, значение Ь на любых векторах выра-
жается через значения к.
Матрица симметричной билинейной формы Ь называется
матрицей соответствующей квадратичной формы к.
Согласно (2) значение к (х) квадратичной формы к запи-
сывается через координаты вектора X в каком-либо базисе
формулой
kW’2^ (6)
или в матричном виде
к(х)«ГВ|. (7)
Правая часть (6)—однородный многочлен второй степени
относительно ..., Приведенная его запись содер-
жит подобные члены. Именно, при 1^1 члены Р/Д'£Л и
Р/Л7^ совпадают. Поэтому после приведения подобных
членов (6) принимает вид
k(x)-P„ ^)*-b2pJ1^*+Pa,(|a)a4-2pls^s4-... (8)
Теорема 1. Для каждой квадратичной формы к
существует базис, в котором
к W-Se, (&)
т. е. матрица квадратичной формы является диагональной.
Вид (9) называется диагональным видом квадратичной
формы.
ДМ
181 0 ... 0
0
... Ct
0
Доказательство. Рассмотрим квадратичную фор-
му к и обозначим ее матрицу в некотором исходном базисе
через В. Мы применим к матрице В последовательность
элементарных преобразований, которую для удобства опи-
сания разобьем на ряд шагов. На первом шагу возможны
два случая:
1) Общий случай: Рп^О. Если это условие выпол-
нено, вычитаем первую строку, умноженную на подходя-
щие множители ДЛЯ t-й строки), из всех нижеле-
жащих строк и вычитаем первый столбец, умноженный
на те же множители, из всех столбцов, расположенных
правее него. Множители выбираются так, чтобы матрица В
перешла в матрицу вида
(10)
где Ci—симметрическая квадратная матрица порядка п — 1.
2) Особый случай: Рл = 0- Здесь имеются две возмож-
ности: a) Pi/ = 0 для всех i = 2, ..., п. При этом матрица
уже имеет вид (10), б) Найдется /, для которого
При этом делается вспомогательное преобразование: если
Рп=/=0, то i-я строка переставляется с первой и г-й столбец
переставляется с первым; если же Р(, = 0, то l-я строка
прибавляется к первой и t-й столбец прибавляется к пер-
вому. В преобразованной матрице оказывается 0н=АО.
После вспомогательного преобразования матрица приво-
дится к виду (10) так же, как и в общем случае.
Пусть в результате k шагов мы получили матрицу
. О
__8fc
О Ck
Здесь Ск—симметрическая матрица порядка п—k, а через
..., ел обозначены левые верхние элементы матриц С;,
полученных на предыдущих шагах.
Следующий А + 1-й шаг состоит в применении к ма-
трице Вк такой последовательности элементарных преоб-
разований, которая равносильна применению преобразова-
ний первого шага к матрице Ск и не затрагивает первых k
строк и первых к столбцов матрицы Вк. В результате-мы
255
получаем матрицу Bt+i, имеющую тот же вид о '-большим
иа единицу значением k.
После п—1-го шага матрица Cn_t имеет порядок 1 и
не нуждается в преобразовании. В результате матрица В
будет превращена в диагональную матрицу
et
Разумеется, если исходная матрица нулевая или ну-
левой окажется какая-либо из матриц СА, то в дальней-
ших преобразованиях нет необходимости, так как матрица
уже диагональная. Это равносильно тому, что на всех
последующих шагах осуществлется особый случай а).
Важно заметить, что после каждого элементарного
преобразования со строками осуществлялось такое же пре-
образование со столбцами. Если осуществляемое элемен-
тарное преобразование со столбцами равносильно умноже-
нию преобразуемой матрицы справа на матрицу Sa (ср. п, 4
§ $ гл. V), то та же операция со строками равносильна
умножению преобразуемой матрицы слева на SJ.
В результате всей последовательности элементарных
преобразований мы получим матрицу B' = STBS, где 5=
=<Sf...Sjv—произведение всех матриц, соответствующих
проделанным преобразованиям со столбцами.
Мы доказали, таким образом, что матрица В' является
матрицей квадратичной формы к в базисе е’, который свя-
зан с исходным базисом е матрицей перехода S. Теорема
доказана.
Для приведения квадратичной формы к диагональному
виду можно воспользоваться методом выделения квадра-
тов. Покажем его на примере. Пусть квадратичная форма
задана формулой вида (8)
к (х) = 2 (§*)’ 4- 4?? 4- 3 (£•)• 4- 4^’ + 5 (S*)1.
Заметив, что коэффициент при (51)’ отличен от нуля, со-
берем вместе все члены, содержащие-£*:
2 [(^)* 4- 2^«] 4- 3 (£«)’ 4- 4^» 4- 5 (S’)1.
Теперь дополним выражение в квадратных скобках до
квадрата суммы, прйбавив и вычтя 2 (£’)*:
2 [(£*)•+26’6* 4- аУ]~2 (S’)1 4- 3 (S1)’ + 4g’&’<4- 5 (g»)«.
256
Теперь квадратичную форму можно переписать в виде
к (х) = 2 (£14- £*)* 4- к' (х), где к' (xj—квадратичная форма,
значение которой зависит только от £* и £’i
k'(x) = (?s)s + 4^’ + 5(g’)’.
К ней можно применить тот же прием:
к'(х) = а1 + 2|3)1 + (П8.
Теперь к(х) принимает вид
2(1Т + (12)а + (Н\
где
= (» = £* + 25\
Последние формулы задают преобразование координат
вектора при переходе к базису, в котором квадратичная
форма имеет диагональный вид.
При доказательстве теоремы 1 для приведения к сумме
квадратов была предложена определенная последователь
ность элементарных преобразований Метод выделения
квадратов только формой записи отличается от приведения
с помощью этой последовательности преобразований. Но
полезно иметь в виду, что можно использовать любую
последовательность элементарных преобразований, приво-
дящую матрицу к диагональному виду, при единственном
существенном условии: после каждого элементарного пре-
образования со строками должно выполняться то же эле-
ментарное преобразование со столбцами.
Диагональный вид квадратичной формы в веществен-
ном пространстве мы будем называть каноническим видом,
если числа еЛ могут быть равны только 1, —1 и 0. В комп-
лексном пространстве диагональный вид квадратичной-
формы—канонический, если ek могут равняться только 1
или 0.
Теорема 2. Для каждой квадратичной формы су-
ществует базис, в котором она имеет канонический вид
Для доказательства приведем сначала квадратичную
форму к произвольному диагональному виду, а затем сде-
лаем следующее преобразование. Если какой-либо из диа-
гональных элементов ей отличен, от нуля, то умножим А-й
базисный вектор на (ей)-1/г в случае комплексного про-
странства или на |ей|-‘/2 в случае вещественного прост-
ранства. Легко видеть, что это соответствует умножению
А-й- строки и А-го столбца матрицы квадратичной формы
ца тот же множитель. Сделав это для всех А‘, таких что
9-102
ЙЙ7
е*#=0, мы приведем квадратичную форму к каноничес-
кому виду.
4. Ранг и индекс квадратичной формы. Существует
много базисов, в которых данная квадратичная форма
имеет канонический вид. Коэффициенты ez должны были
бы быть, вообще говоря, свои для каждого из таких ба-
зисов. Однако оказывается, что они одни и те же (с точ-
ностью до порядка), как бы мы ни приводили квадратич-
ную форму к каноническому виду.
Начнем со следующего вспомогательного предложения,
имеющего и самостоятельное значение.
Предложение 2. Если det А и определены' про-
изведения АВ и С А, то RgAB=RgB и RgCA = RgG.
Действительно, согласно предложению Ъ § б гл. V мы
имеем одновременно RgB»=RgA"x(AB)^RgAB й
RgAB^RgB. Отсюда следует, что RgB=»RgAB. Ана-
логично предложение доказывается, если множитель А
стоит справа.
Теорема 3. Ранг матрицы квадратичной формы tie
зависит от базиса.
Действительно, согласно формуле (5) матрицы К. и К*
квадратичной формы к в базисах е и е' связаны равен-
ством 7C = ST7<S, где detS =Н=0. Отсюда, в силу предло-
жения 2 Rg/C' = Rg7<S«» Rg/C. Если квадратичная форма
имеет канонический вид, то ранг ее матрицы равен числу
коэффициентов еп отличных от нуля. Таким образом, это
число не зависит от базиса.
Определение. Число не равных нулю коэффици-
ентов в каноническом виде квадратичной формы к на-
зывается рангом к.
Мы видели, что ранг к равен рангу ее матрицы в про-
извольном базисе.
Заметим, что «геометрическую» интерпретацию ранга квадратич-
ной формы можно получить, рассматривая соответствующую симмет-
ричную билинейную форму как отображение Хп—► Хп.
В комплексном пространстве все квадратичные формы
одного и того же ранга г приводятся (каждая в своем ба-
зисе) к одному и тому же каноническому виду (I1)4 +•..
Рассмотрим теперь квадратичную форму к в вещест-
венном пространстве 2п.
Определение. Мы будем говорить, что к положи-
тельно определена на подпространстве S' пространства
«S’n, если к (х) > О для любого ненулевого вектора х из S*,
268
Аналогично, к отрицательно определена на .если
к (х) < О для любого ненулевого х из -2”.
Если к(х)>0 или к(х)<0 для любого х=^0 из
то про к говорят, что она положительно определенная или
соответственно отрицательно определенная квадратичная
форма.
Квадратичные формы, для которых при любом х вы-
полнены неравенства к(х)^0 или к(х)^0, называются
положительно или отрицательно полуопределенными.
Удобно считать, что на нулевом подпространстве каж-
дая квадратичная форма и отрицательно определенная и
положительно определенная одновременно. В силу этого
соглашения всегда существует (хотя бы нулевое) подпро-
странство, на котором квадратичная форма отрицательно
определена, и мы можем выбрать среди всех этих под-
пространств подпространство максимальной размерности.
Определение. Пусть —подпространство мак-
симальной размерности из всех, на которых квадратичная
форма к отрицательно определена. Размерность назо-
вем индексом, квадратичной формы к.
Теорема 4 (закон инерции квадратичных
форм). Число отрицательных и число положительных
коэффициентов e.t в каноническом виде квадратичной формы
не зависит от выбора базиса, в котором она приведена
к каноническому виду.
Мы докажем равносильную формулировку; если в ка-
ком-либо базисе квадратичная форма к приведена к кано-
ническому виду, то число отрицательных коэффициентов
совпадает с индексом к. Так как общее число положи-
тельных и отрицательных коэффициентов равно рангу, из
последней формулировки вытекает, что и число положи-
тельных коэффициентов не зависит от базиса.
Действительно, пусть в базисе е1( ..., еп квадратич-
ная форма с индексом s имеет канонический вид
-О-• • • -G')* + G/+1)’+ - • • +(ГЛ
Обозначим через «2^ линейную оболочку векторов еи ...
..., в/, а через линейную оболочку е/+1, ..., еп.
Для вектора х из Si имеем £/+l = ... » = 0 и к (х) =
= — (В1)’— • • • —(I7)2 < 0, если только х =И= 0. Следова-
тельно, на /-мерном подпространстве j2\ форма к отрица-
тельно определена и s^ j.
Допустим теперь, что s > / и существует s-мерное
подпространство J?1-’, на котором к отрицательно опре-
делена. Компоненты любого вектора х из -2\ удовлетво-
9*
259
?яюг равенствам В1 «• 0, и, следовательно,
(х)>0 для всех х из J?,. Размерность равна n — j,
и сумма размерностей J?, и J?*”’ превосходит я. По тео-
реме 1 § 2 гл VI и имеют ненулевое пересе-
чение. Для ненулевого вектора г из 3* П-!?1”’ мы дол-
жны были бы иметь одновременно к (г) < 0 и к(г) > 0.
Из полученного противоречия видно, что s ® /. Теорема
доказана.
Положительно определенные квадратичные формы имеют
ранг я и индекс 0 и приводятся к каноническому виду
О+--- + (£")*. (12)
Отрицательно определенные квадратичные формы имеют
ранг я и индекс я. Они приводятся к виду
-(В1)*-...-Не-
положительно и отрицательно полуопределениые формы
ранга г приводятся соответственно к каноническим видам
(Б*)2 + • - • + О. —(I1)2 — - • - — (Г)*.
Мы видели, что в вещественном пространстве квадра-
тичной форме сопоставляются два числа—-ее ранг и ин-
деис. Она характеризуется этими числами в том смысле,
что все квадратичные формы, имеющие одинаковые ранги
и индексы, приводятся (каждая в своем базисе) к одному
и типу же каноническому виду. Вместо ранга и индекса
можно характеризовать квадратичную форму любыми
двумя величинами, по которым можно найти ранг и ин-
декс. Например, часто вместо ранга задают число положи-
тельных коэффициентов в канонической виде Оно вместе
с индексом—числом отрицательных коэффициентов — ха-»
растеризует квадратичную форму. В § 2 гл. IX нам
будет удобно характеризовать квадратичную форму рангом
и разностью числа положительных и числа отрицатель-
ных коэффициентов в каноническом виде. Эта разность
называется сигнатурой квадратичной формы.
' Полезно уметь определять, является ли данная квад-
ратичная форма положительно определенной, не приводя
ее к каноническому виду. Это можно сделать при помощи
следующей теоремы, называемой критерием Сильвестра.
Т ер рема 5. Для положительной определенности
квадратичной формы необходимо и достаточно, чтобы
260
миноры ее матрицы удовлетворяли неравенствам
0п ••• Pi*
0м ••• 0м
>0
(13)
для всех k = 1, п.
Миноры вида (13) называются главными минорами
матрицы.
Для доказательства вспомним преобразования матрицы
квадратичной формы, примененные при доказательстве
теоремы 1.
1°. Необходимость Если квадратичная форма к (х)
положительно определенная, то диагональные элементы
ее матрицы в любом базисе удовлетворяют условию
₽«-Це()>0.
и, следовательно, при приведении матрицы к диагональ-
ному виду особый случай не встретится. В общем случае
к любой строке может быть прибавлена только вышеле-
жащая, а к любому столбцу—только расположенный ле-
вее. При таких преобразованиях главные миноры матрицы
не изменяются. Но у диагональной матрицы в случае по-
ложительно определенной квадратичной формы главные
миноры положительны. Поэтому они должны быть поло-
жительны и у исходной матрицы.
2°. Достаточность. Пусть все главные миноры
матрицы В положительны. В частности, Alt =»> О,
и первый шаг преобразования приводит матрицу к виду
(10) с вл > 0. Допустим, что после k шагов мы получили
матрицу ВА с положительными ..., еА, причем не воз-
никало особого случая. Тогда для левого верхнего эле-
мента матрицы Ск имеем еА+1 = МА+1/МА, так как глав-
ные миноры не менялись. Отсюда следует еА+1 > 0. На
очередном шаге преобразования имеет место основной слу-
чай, и полученная матрица Bk+i имеет положительные
элементы 8ц ..., eA+t. Проводя такое рассуждение для
всех k от 2 до п, придем к доказываемому утверждению.
§ 3. Квадратичные формы и скалярное произведение
Если в вещественном линейном пространстве задано
скалярное произведение (т. е. пространство евклидово),
то каждой билинейной форме независимым от выбора ба-
зиса образом может быть сопоставлено линейное преобра-
зование.
261
Определение. Линейное преобразование А евкли-
дова пространства называется присоединенным били-
нейной форме Ь, если для любых векторов х и у из Ёа
выполнено равенство
Ь(х, у) = (х, АШ (1)
Предложение 1. Каждая билинейная форма име-
ет одно-единственное присоединенное преобразование.
Для доказательства допустим сначала, что присоеди-
ненное преобразование для b существует. Обозначим че-
рез В м А матрицы b и А в некотором базисе е и запи-
шем равенство (1) в координатной форме
£тВт] «я VTAi).
Здесь Г—матрица Грама базиса е. Последнему равенству
можно придать вид (В—ГД)»] = 0. Выберем произволь-
ные векторы х и у равными базисным векторам е{ и ef.
Тогда их координатные столбцы & и i) будут соответст-
венно равны i-му и /-му столбцам единичной матрицы.
Этим будет показано, что равен нулю элемент в f-й строке
и /-м столбце матрицы В—ГД (ср. пример 4, с. 176).
Так как I и / могут быть взяты любыми, мы видим, что
В—ГД = О. Отсюда мы можем выразить матрицу А че-
рез матрицу В:
А = Г~1В. (2)
Это означает, что билинейная форма не может иметь
больше одного присоединенного преобразования— если
оно существует, его матрица равна Г“*В.
Теперь легко доказать и существование присоединен-
ного преобразования. Для этого достаточно проверить,
что преобразование с матрицей (2) является присоединен-
ным. Но из (2) следует В = ГД, а, значит, при любых
столбцах I и ц выполнено |гВт]»|тГДт]. Следовательно,
равенство (1) имеет место для любых векторов х и у
из £п. Предложение доказано.
Заметим, что в случае ортонормированного базиса связь
между матрицами билинейной формы и ее присоединен-
ного преобразования особенно проста—эти матрицы совпа-
дают:
В = А.
Отсюда и из предложения 2 § 2 гл. VI мы получаем
Предложение 2. Для симметричных билинейных
форм и только для них присоединенное преобразование
является самосопряженным.
262
Если линейное преобразование присоединено симмет-
ричной билинейной форме Ь, то его называют также при-
соединенным той квадратичной форме, которую определя-
ет Ь. Таким образом, каждой квадратичной форме при-
соединено самосопряженное преобразование.
Тесная связь между квадратичными формами и само-
сопряженными преобразованиями позволяет доказать сле-
дующую важную теорему.
Теорема I. В евклидовом пространстве для каждой
квадратичной формы существует ортонормированный ба-
зис, в котором она имеет диагональный вид.
Теорема почти очевидна: базисом, существование кото-
рого утверждается, будет ортонормированный базис из
собственных векторов линейного преобразования, присо-
единенного квадратичной форме. В нем В —А и Л —диа-
гональная матрица.
Теорема 2. Евклидово пространство можно опреде-
лить как такое вещественное линейное пространство,
в котором задана положительно определенная квадратич-
ная форма.
Действительно, сопоставив каждому вектору евкли-
дова пространства $п его скалярный квадрат, мы получим
функцию к(х) = (х, х). Если Г—матрица Грама некого
рого базиса, а §—координатный столбец вектора х в этом
базисе, то функция к запишется формулой к(х) = §гГ§
Значит, это—квадратичная форма. В силу аксиомы 4°
определения евклидова пространства, к(х)>0 для х=/»0,
и наша форма положительно определена.
Обратно, пусть в вещественном линейном простран-
стве 2п задана положительно определенная квадратичная
форма к. По ней однозначно восстанавливается соответст-
вующая симметричная билинейная форма Ь. Введем в 2?п
скалярное произведение, положив (х, р) = Ь(х, у). Акси-
омы 2° и 3° выполнены, так как Ь—билинейная форма.
Аксиома 1° удовлетворена, поскольку Ь симметрична. По-
ложительная определенность к равносильна аксиоме 4°.
Теорема доказана. Отметим только, что (х, у) в базисе е
записывается через координатные столбцы векторов и мат-
рицу квадратичной формы равенством (х, р) = £г/Сп, и,
следовательно, К. является матрицей Грама базиса е.
Из доказательства теоремы 2 видно, что положитель-
ная определенность квадратичной формы нужна только
для выполнения аксиомы 4°. Рассматриваются пространств
ва, в которых скалярное произведение определяется про-
извольной квадратичной формой. В таких пространствах
263
существуют векторы с отрицательным скалярным квадра-
том и геометрия значительно отличается от евклидовой.
Если скалярное произведение определено квадратичной
формой ранга, равного размерности пространства, то про-
странство называется псевдоевклидовым. Из псевдоевкли-
довых пространств в математической физике существенную
роль играет четырехмерное пространство, в котором за-
дана квадратичная форма —(£*)2—(£2)2—(&3)2 + (I4)2- Это
так называемое пространство Минковского.
Используем теорему 2, чтобы доказать следующую
теорему
Теорема 3. Пусть в линейном пространстве
заданы две квадратичные формы к и h, причем h—поло-
жительно определенная. Тогда в существует базис,
в котором обе формы имеют диагональный вид (а форма
h имеет даже канонический вид).
Для доказательства введем в скалярное произве-
дение при помощи положительно определенной формы h.
По отношению д этому скалярному произведению орто-
номированными будут те базисы, в которых h имеет кано-
нический вид (12) § 2, так как их матрица Грама еди-
ничная По теореме 1 для формы к существует ортонор-
мированный базис, в котором она имеет диагональный вид.
Это и есть базис, существование которого мы доказываем.-
Замечание Если евклидово, то теорема 3 оста-
ется, конечно, справедливой Уже существующее скаляр-
ное произведение оставляется без внимания, а вводится
новое скалярное произведение при помощи формы h.
Базис, в котором к и h имеют диагональный вид,
вообще говоря, не будет ортонормированный по отноше-,
нию д старому скалярному произведению.
Чтобы црактически привести две квадратичные формы
одновременно к диагональному виду, сначала строят базцс,
в котором h имеет канонический вид, и находят матрицу
К' формы к в этом базисе. Это осуществляет переход
к базису, который ортонормирован по отношению к вспо-
могательному скалярному произведению, введенному при
доказательстве теоремы. Линейное преобразование, Имею-
щее в найденном базисе ту же матрицу /С', будет присо1
единенным к форме к. Следует найти собственные векторы
этого преобразования, ортогонализовать их и нормировать,
находя скалярное произведение по формуле (11) § 1
гл. VII. Так будет получен базис из собственных векто-
ров, ортонормированный по отношению к вспомогательно-
му скалярному произведению. Он и является искомым
264
базисом. В нем матрица формы h .единичная, а матрица ЛС"
формы к диагональная, причем ее диагональные элементы
равны корням характеристического многочлена матри-
цы /<'.
Одновременное приведение двух квадратичных форм
к диагональному виду может быть осуществлено и иначе.
Пусть Д' и Н—матрицы квадратичных форм в исходном
базисе е. Как отмечалось при доказательстве теоремы 2,
Н будет матрицей Грама базиса е для вспомогательного
скалярного произведения. Матрица А — Н^К. является
матрицей линейного преобразования, присоединенного к
форме к. Характеристическое уравнение преобразования
имеет вид det (Н~Ч(—ХЕ) = 0 Так как —АЕ =
= —кН) и det/7_J=#O, характеристическое урав-
нение имеет те же корни, что и уравнение
det (К—М7) = 0. (3)
Для каждого из этих корней система линейных уравне-
ний (Я-1К—АЕ)| = о для нахождения собственных век-
торов эквивалентна системе
(Я—
При каждом к фундаментальную систему решений такой
системы следует ортогонализовать и нормировать, находя
скалярное произведение по формуле (13) § 1 гл. VII
с Матрицей Грама Н. Так будет построен базис е. Так
как он ортонормирован относительно вспомогательного
скалярного произведения, матрица формы h в нем будет
единичной. Так как он состоит из собственных векторов
преобразования, присоединенного к форме к, матрица фор-
мы к в нем будет диагональной с корнями уравнения (3)
на диагонали.
§ 4. Эрмитовы формы
Для квадратичных форм в унитарных пространствах
теоремы § 3 не имеют места Они справедливы для других
функций, называемых эрмитовыми формами. Приведем
только формулировки. Доказательства почти не отлича-
ются от доказательств соответствующих теорем в § 3.
Функция Ь от двух векторов в комплексном линейном
пространстве называется эрмитовой билинейной фор*
мой, если для любых векторов х, у и г и любого
265
комплексного числа а выполнены равенства
Ь(х4-у, ?) —Ь(х, у) + Ъ(у, z), b(ax, i/)«₽ab(x, у),
Ь (х, у4-г)««Ь(х, у)Ч-Ь(х, г), Ь(х, а.у)=аЪ(х, у).
•
Отличие этого определения от определения билинейной
формы в том, что при умножении второго аргумента на чис-
ло а значение эрмитовой билинейной формы умножается
на комплексно сопряженное число а.
Если в S а выбран базис, то значение Ь на паре век-
торов х, у может быть записано в виде
Ь(х, у}-^4 или Ь(х, 1/)==5гбЧ
1.1
где | и ц—координатные столбцы векторов х и у. Мат-
рица В = называется матрицей эрмитовой билиней-
ной формы. При замене базиса она преобразуется по за-
кону
Эрмитова билинейная форма называется симметрич-
ной, если Ь(х, у) = Ь(у, х). Это условие равносильно
тому, что ее матрица эрмитова.
Функция к(х) на называется эрмитовой квадра-
тичной формой или просто эрмитовой формой, если
к(х) = Ь(х, х) для некоторой симметричной эрмитовой
формы Ь. Форма Ь однозначно определяется по к.
Рассмотрим эрмитову форму к в унитарном простран-
стве Ч1п. Линейное преобразование А в называется
присоединенным форме к, если оно самосопряженное и
к(х) = (х, А(х)) для всех х. В ортонормированном базисе
матрица присоединенного преобразования совпадает с мат-
рицей, комплексно сопряженной матрице формы к. Отсю-
да следует, что для каждой эрмитовой формы к сущест-
вует ортонормированный базис, в котором ее матрица
диагональная с вещественными элементами на диагонали.
Растягивая базисные векторы, мы можем привести эрми-
тову форму к каноническому виду, в котором на диаго-
нали стоят числа 1, —1 или 0. Для эрмитовых форм
справедлив закон инерции.
Унитарное пространство можно определить как такое
комплексное линейное пространство, в котором задана
положительно определенная эрмитова форма.
Для пары эрмитовых форм, из которых одна положи-
тельно определенная, можно найти базис, в котором они
обе имеют диагональный вид.
266
ГЛАВА IX
АФФИННЫЕ ПРОСТРАНСТВА
§ 1. Плоскости
1. Аффинное пространство. В гл. I мы считали изве*
стным из школьного курса понятие обычного геометриче-
ского пространства и ввели определение вектора как
упорядоченной пары точек. В гл. VI—VIII была пост-
роена теория многомерных векторных пространств. Те-
перь, исходя из нее, мы можем дать аксиоматическое оп-
ределение точечного пространства любой размерности.
Рассмотрим «-мерное вещественное линейное прост-
ранство Sn и дадим следующее
Определение. Множество &п называется п-мер-
ным аффинным пространством, а его элементы—точ-
ками, если задан закон, сопоставляющий каждой упоря-
доченной паре его элементов А, В единственный вектор
►
из £п (который мы обозначим АВ) таким образом, что:
1°. Для любой точки А из &п и любого вектора х из
11 ф
Sn существует единственная точка В такая, что
Эта точка будет обозначаться Р(А, х).
2°. Для любых трех точек А, В и С выполнено ра-
венство АВ-}-ВС=*АС.
Мы назовем J?B пространством векторов простран-
ства <^в, а его элементы—векторами в
Чтобы установить соответствие с определениями из
§ 1 гл. I, заметим, что первая аксиома соответствует воз-
можности отложить любой вектор из произвольной точки,
а вторая аксиома соответствует определению сложения
векторов.
Приведем простейшие следствия из определения аф-
финного пространства.
а) . Для любых двух точек АА-]- АВ= АВ. Поэтому
вектор, соответствующий паре совпавших точек, являемся
267
нулевым вектором. Для любой точки Л имеем
Р(А, о) = А, поскольку Р(А, о) = Р(А, АА) — А.
б) Аксиома 2° для точек А, В, А дает АВ-[-ВА = ЛА,
откуда АВ =—В А.
в) Предоставим читателю доказать, что для четырех
точек А, В, А' и В’ равенство АВ = А'В' имеет место
тогда и только тогда, когда АА' — ВВ'. Это свойство со-
ответствует определению равенства векторов из § 1 гл. I.
Исходя из линейного пространства 2? п, можно по-
строить аффинное пространство. С этой целью возьмем в
качестве множества Sn множество векторов пространст-
ва 2 п и сопоставим каждой паре векторов х и у вектор
ху=.у—х. Легко проверить, что аксиомы 1° и 2° в этом
случае выполнены. Интуитивно это построение означает,
следующее. Представим себе векторы из 2п как направ-
ленные отрезки, исходящие из одной точки. Тогда точ-
ками пространства & п мы будем считать концы наших
векторов
Определение. Аффинные пространства S’n и S’n называ-
ются изоморфными, если существует такое взаимно однозначное
отображение: f. Sn —>- и такой изоморфизм их пространств век-
торов F: <$?„—что Для лю^ых точек А и В из Sn выполнено
равенство f (Л) I (В) =F (АВ).
Из определения сразу видно, что изоморфны могут быть только
пространства одной размерности.
Если для некоторой точки А известен ее образ ((Л) при ито-
морфизме I и задан изоморфизм F, то отображение f однозначно оп-
ределено. Действительно, образ любой другой точки В может быть
найден по формуле I (В) ~Р (f (Л), Р(ЛВ)) С другой стороны, как
бы мы ии задали f (Л) и F, мы обязательно получим изоморфизм
f: Sn—*Sn Действительно, легко проверить, что из f (Л) I (В) =•
= F (АВ) и f (Л) f (С) = F (ЛС) следует f (В) f (С) — F (ВС) для любых
точек В и С. Отсюда вытекает
Предложение 1. Любые два аффинных пространства од-
ной размерности изоморфны. Изоморфизм однозначно определяется
заданием образа одной из точек, и изоморфизма F. Хп —>- Х'п.
В изучении каждого класса пространств особую роль играют
те преобразования пространств, которые являются их изоморфиз-
мами на себя (ср § 4 гл. IV) Для линейных пространств это про-
извольные невырожденные линейные преобразования, для евкли-
довых пространств—ортогональные преобразования. Изучим изо-
морфные преобразования аффинного пространства
С этой целью предположим сначала, что в качестве изомор
физма F: ХП—выбрано тождественное преобразование. Зада
268
ди моя образом ((Л) некоторой точки А и рассмотрим преобразо-
вание; определяемое равенетвйм f (В) — Р (f (А1, ЗЙ) для любой
точки В. Обозначим для краткости |(Л}=Л*. Предыду-
щее равенство означает что А это в свою очередь,
в силу в), эквивалентно равенству ВВ* = АА*. Итак, образ каждой
точки получается сдвигом этой точки на один и тот же вектор АА*
Такое преобразование естественно назвать параллельным переносом.
Если мы предположим, что f(Z) = /4, a F—невырожденное
линейное преобразование то мМ получим преобразование аффин-
ного пространства, задаваемое формулой f(B) = P(A, F(Afi)). Эта
формула устанавливает взаимно однозначное соответствие между
невырожденными линейными преобразованиями и изоморфными пре-
образованиями аффинного пространства, оставляющими неподвиж-
ной ’точку А.
Мы видим, что существенное отличие аффинных про-
странств от линейных состоит в том, что множество их
изоморфных преобразований шире! оно содержит парал-
лельные переносы.
Определение. Аффинное пространство называется
точечным евклидовым пространством, если его простран-
ство векторов евклидово.
В точечном евклидовом пространстве расстоянием
между точками А и В называется длина вектора АВ.
Трехмерное точечное евклидово пространство совпа-
дает с пространством, изучаемым в элементарной гео-
метрии, если в последнем фиксировать единицу мас-
штаба.
Декартовой системой координат в аффинном прост-
ранстве &п называется совокупность точки О и базиса е
в'пространстве векторов S п. Если задана система коор-
динат О, е, то каждой точке А пространства одно-
значно сопоставляется упорядоченная система из п чи-
сел,* а именно компоненты вектора ОА в базисе е. Эти
числа называются декартовыми координатами точки А в
системе О, е, а столбец, из них составленный, —ее ко-
ординатным столбцом. Точка однозначно определяется
своими координатами при заданной системе координат.
Если даны координатные столбцы и точек А и В,
то координатный столбец вектора АВ равен £2—Это
доказывается рассуждением, уже примененным в § 2 гл. I.
Закон преобразования координат точки при замене
декартовой системы координат выводится так же, как это
делалось для трехмерного пространства в § 4 гл. 1.
269
2. Плоскости в аффинном пространстве. Пусть зада-
на точка А, в аффинном пространстве п и 6-мерное
подпространство 3?к в его пространстве векторов <£*\.
Множество всех точек вида Р(Ав, х), где х принадлежит
J?*, называется k-мерной плоскостью в <^п. Точка Ав са-
ма, разумеется, лежит в плоскости Мы назовем ее на-
чальной точкой, а подпространство &к—направляющим
подпространством.
Любая точка плоскости <£% может быть принята за
ее начальную точку. Действительно, пусть А = Р(Аа, х)
лежит в &к Тогда любая точка В = Р(А0, у) из <5% пред-
ставима в виде В = Р(А, у—х), поскольку А0В—AtA =
*=АВ, A Ji —у и АвА=х, причем у—х принадлежат^.
Аналогично, для каждого г из ^к имеем Р(А, г) —
— Р(А0, г 4-х), и, следовательно, Р(А, г) принадлежит
плоскости.
Не представляет труда доказать, что 6-мерная пло-
скость является 6-мерным аффинным пространством с
пространством векторов &к.
Предложение 2. Если в &п выбрана декартова
система координат, то координаты точек любой k-мерной
плоскости удовлетворяют системе линейных уравнений
ранга п—k. Обратно, множество точек, координаты ко-
торых удовлетворяют совместной системе линейных урав-
нений ранга г, является (п—г)-мерной плоскостью.
Для доказательства обозначим через £0 и $ столбцы
из координат, соответственно, начальной точки Аа и пе-
ременной точки А в плоскости <3%. Тогда, поскольку век-
тор А,А лежит в его координатный столбец $—
удовлетворяет однородной системе уравнений ранга
п—k (предложение 4 § 2 гл. VI). Пусть U—матрица
этой системы. Тогда U (|—$о) = О и % удовлетворяет си-
стеме линейных уравнений £/$4-0 = 0, где 0 = —£/$,.
Вторая часть предложения следует из теоремы 2
§ 5 гл. V.
Общее решение системы линейных уравнений (фор-
мула (14) § 5 гл. V) дает нам параметрические уравне-
ния (п—г)-мерной плоскости, в которых параметрами яв-
ляются коэффициенты в линейной комбинации фунда-
ментальной системы решений, а сама фундаментальная
система—базисом в направляющем подпространстве.
Начальная точка плоскости—частное решение неодно-
родной системы.
270
(n—1)-мер на я плоскость называется гиперплоскостью.
Она задается уравнением + 4-ая^"4-Р = 0.
Одномерная плоскость называется прямой линией.
Она определяется системой уравнений ранга п—1 или
же параметрическим уравнением fc = £o4-/ib в котором
|0—координатный столбец начальной точки, а ц—коор-
динатный столбец ненулевого вектора из направляющего
подпространства Jg’f.
Множество точек прямой, соответствующих значениям
t /0 при некотором выборе вектора ц, называется лу-
чом, а множество точек, соответствующее на-
зывается отрезком.
3. Линейные функции на аффинном пространстве.
Функция на аффинном пространстве—это закон, сопо-
ставляющий каждой его точке некоторое вещественное
число. Функция называется линейной, если ее значение
в каждой точке А пространства ffa удовлетворяет усло-
вию f(A) — f (Л0)4-<р(Л0Л), где Ло—фиксированная точ-
ка, а ф—линейная функция на пространстве век-
торов 2п.
В этом определении точка Ло играет особую роль.
Докажем, что на ее месте можно использовать любую
другую точку. Действительно, скажем, для точки Л1 мы
имеем_Д(Л1)=Д(Л0) + ф(Л'^1), и потому /(Л) = /(Л0) +
+ ф (^o^i4*=f ИО 4* ф (Л(Л).
Если в & п выбрана декартова система координат О, е,
то точке Л соответствует ее координатный столбец £,
функции ф—ее строка коэффициентов х и функция f
записывается в виде — 4-х§, так как £ одно-
временно является координатным столбцом вектора ОА-
Значение линейной функции мы будем обозначать так-
же через [(£).
Нетрудно доказать, что уравнение гиперплоскости
можно записать в виде /(Л) = 0, где /—линейная функ-
ция на zfn. В самом деле, пусть выбрана система коор-
динат О, е и гиперплоскость задана уравнением + ...
... 4-a„£n-f-0 = O. Обозначим левую часть уравнения че-
рез f (Л), где под Л понимается точка о координатами
f1, ..., £". Простая подстановка показывает, что /(О) =
=р. Кроме того, ясно, что аД1-!-. • •+«„1"—линейная
>
функция ф от вектора О А.
Линейные функции ft, ..., fh на аффинном простран-
стве называются линейно независимыми, если линейно
271
независимы соответствующие линейные функции <pf, ...
•••.Фл на Sn.
6-мерная плоскость определяется системой линейных
уравнений. Это означает, что каждая ее точка лежит в
любой из гиперплоскостей, задаваемых уравнениями си
стемы. Отсюда следует
Предложение 3. Каждая k-мерная плоскость яв-
ляется пересечением п—k гиперплоскостей, независимых
в том смысле, что линейно независимы задающие их
функции.
4. Выпуклые многогранники. Назовем полупростран
ством множество точек аффинного пространства, для ко
торых некоторая линейная функция f принимает неотри
нательные значения! /(А)^О. Очевидно, что неравенство
/(Л)^0 также определяет полупространство, так каково
равносильно неравенству —/(Л)^0. Гиперплоскость
f (А) — О является пересечением, т. е. общей частью, этих
полупространств.
Предложение 4. Отрезок прямой пересекает ги-
перплоскость тогда и только тогда, когда его концы при-
надлежат разным полупространствам относительно дан-
ной гиперплоскости.
Д'оказательвтво. Оставим без рассмотрения оче-
видный случай, когда хоть один из концов отрезка ле-
жит в гиперплоскости. Пусть выбрана система коорди-
нат О, е и отрезок задан уравнением g <= |0 + / —£0)
где и —координатные столбцы его концов и
Напишем (0)4-<р(|0)-Нф (§,— £в). Если
мы прибавим и вычтем tf (0), то заметим, что /(§) =
== (1—t) f (1П) 4* tf (£(). Следовательно, значение парамет-
ра t, при котором отрезок пересекает гиперплоскость,
должно удовлетворять равенству (1—t) f (|0) 4- tf = 0.
Так как t и (1 — t) положительны, f (£„) и f ((х) должны
быть разных знаков.
Докажем достаточность. Из написанного выше ра-
венства следует, что 1//«а1 — f (Ij/f (ge). Если f (|„) и
f(^t) имеют разные знаки, то решение существует и
I/O 1, т. е. 0 < / < 1.
Определение. Пересечение конечного числа по-
лупространств называется выпуклым многогранником.
Из определения вытекает, что выпуклый многогран-
ник есть множество точек, удовлетворяющих системе ли-
нейных неравенств //(Л)>0, где ft—линейные функции
на <У„ и i = 1, ..., г.
272
Пример 1 4-I>0, £—1 гиперплоскости с
сбщим направляющим подпространством не имеют об-
щих точек (параллельны) Многогранник—часть прост-
ранства, ограниченна^ этими гиперплоскостями.
Пример 2 —1 >0: гиперплоскости
параллельны, многогранник не содержит ни одной
точки.
Пример 3. ^>0, 1'^1 (/««I, ...» п)> параллеле-
пипед, построенный на базисных векторах и с вершиной
в начале координат.
Пример 4. ^>0, ^<0! гиперплоскость
Пример 5. Е'0, (ie= 1...............п—1), £м>0,
11 отрезок прямой.
Пример 6. (f»l, первый координат-
ный угол.
Из этих примеров видно, что многогранник может
лежать в некоторой плоскости — несколько из определя-
ющих его неравенств могут выполняться только как ра-
венства. Мы назовем размерностью выпуклого много-
гранника минимальную из размерностей плоскостей, его
содержащих В этом смысле размерность отрезка равна
1, а размерность треуюльника—2.
Рассмотрим выпуклый многогранник. Пусть некоторое
из Определяющих его неравенств, скажем Д(Д)^0, мо-
жёт выполняться как строгое неравенство, т. е. сущест-
вует точка А, для к торой Д (4) > 0. Точки многогран-
ника, в которых это неравенство выполнено как равенст-
во, по определению являются его граничными точками.
Вообще, граничными называются те точки многогранни-
ка, в которых обращаются в равенства одно или не-
сколько неравенств, выполненных как строгие неравенства
для каких-либо точек многогранника.
Из этого определения вытекает, что множество гра-
ничных точек выпуклого многогранника есть объедине-
ние выпуклых многогранников (меньших размерностей),
называемых гранями. Грани каждой из граней состоят
из граничных точек исходного многогранника.
Последовательно рассматривая грани граничных
многогранников все убывающих размерностей, мы либо
придем к грани, являющейся плоскостью размерности
k~^\, либо к грани, являющейся одномерным много-
гранником, т. е. отрезком или лучом. Такие грани назы-
ваются ребрами. Их границы — точки — называются вер-
шинами. Вершины можно рассматривать как 0-мерные
грани.
273
Теперь разъясним, что означает слово *выпуклый>, которое мы
уже много раз употребляли. Выпуклым множеством в аффинном про-
странстве называется множество, которое вместе о любыми двумя
своими точками содержит и весь отрезок, их соединяющий. Из
предложения 4 следует, что полупространство—выпуклое множе-
ство. Из определения можно заключить, что пересечение конечного
числа выпуклых множеств есть выпуклое множество. Поэтому на-
ши выпуклые многогранники являются выпуклыми в этом смысле.
Во многих прикладных вопросах, особенно в экономике, встре-
чается задача об отыскании максимального значения линейной
функции на выпуклом многограннике. Эта задача называется за-
дачей линейного программирования. Из математического анализа
известно, что функция, дифференцируемая в области, может дости-
гать максимального значения только в тех точках области, где все
ее частные производные равны нулю.
Если функция линейна, то частные производные равны ее
коэффициентам и одновременно равны нулю только для тождест-
венно постоянной функции, Поэтому максимум- линейной функции
на выпуклом многограннике, если вообще достигается, то дости-
гается в граничной точке. Последовательно применяя эти сообра-
жения к граням все меньших размерностей, мы увидим, что макси-
мальное значение может достигаться либо в вершине, либо на та-
кой грани положительной размерности, на которой функция—тож-
дественная постоянная.
Поэтому вопрос кажется простым: его решение сводится к срав-
нению значений функции в вершинах многогранника. Однако на
практике встречаются многогранники, задаваемые десятками и сот-
нями неравенств. Число вершин у них таково, что и с помощью
ЭВМ не может быть просмотрено за приемлемый срок, Это обстоя-
тельство вызвало создание ряда методов, позволяющих решать та-
кого рода задачи. Эти методы объединены общим названием теории
линейного программирования.
§ 2- Общая теория линий
и поверхностей второго порядка
В этом параграфе мы возвращаемся к геометрии
трехмерного точечного пространства, которой были по-
священы первые главы книги. Поэтому настоящий па-
раграф может изучаться независимо от § 1. Он содер-
жит применение результатов, полученных для квадра-
тичных форм в евклидовых векторных пространствах, к
исследованию произвольной линии или поверхности вто-
рого порядка.
1. Закон преобразования коэффициентов. Мы начнем
с рассуждений, одинаково пригодных для линий второго
порядка на плоскости и для поверхностей второго порядка
в пространстве, и потому не будем фиксировать размер-
ность п—она равна двум или трем в зависимости от
того, какой случай иметь в виду. И линии и поверхности
мы будем называть поверхностями, чтобы не делать боль-
шого числа оговорок.
274
Мы рассмотрим произвольное уравнение второго по-
рядка
S (1)
I, /ж 1 I ае t
связывающее координаты точки на плоскости или в про-
странстве, причем о точках, которые ему удовлетворяют,
не будем предполагать ничего, даже того, что такие точ-
ки вообще существуют. Если мы изменим систему коор-
динат и подставим в (1) выражение старых координат
текущей точки через новые, то мы получим новое урав-
нение (также второго порядка согласно теоремам 1 и 2
§ 1 гл. II). Мы будем говорить, что уравнение (1) при
замене координат перешло в новое уравнение или же что
преобразовались его коэффициенты.
Сейчас мы получим закон, по которому преобразуются
коэффициенты уравнения второго порядка при изменении
системы координат. Напомним, что декартова система
координат состоит из точки (начала) и векторного базиса.
Замена системы координат распадается на перенос начала
и изменение базиса (см. § 4 гл. I).
Если мы изменим базис при неизменном начале коор-
динат, то старые координаты выразятся через новые по
формуле
k=i
где о*—элементы матрицы перехода от старого базиса
к новому. Подставив это в уравнение (1), мы получим
уравнение второго порядка
S + 2 S ай<4£'*+«о» = О
1. i,k,i ' i.k
с коэффициентами
= = S = (2)
Если мы перенесем начало координат в точку с коор-
динатами р1 (l^i^tt), оставив базис без изменения, то
старые координаты выразятся через новые по формуле
Подстановка в уравнение (1) дает
S (£ + pOtl' W2 2ай((' + Р9+а.. = О,
275
или
S Ч* S «// (t'p7 +I7pO+2 S ai&+«м=о*
Отсюда
«// = «//. «zo = S«rtP*+art. (?)
k
так как суммы Sa/Д^Р7 и' SctyFp* отличаются только
обозначением индексов суммирования.
Формулы (2) я (3) выражают закон преобразования
коэффициентов уравнения (1) при замене системы коор-
динат. Выражение для свободного члена ам нам не по-
требуется.
ЧЛены второй степени в уравнении (1) образуют одно-
родный многочлен второго порядка. Мы видим, что его
коэффициенты alf не меняются при переносе начала коор-
динат; а при замене базиса преобразуются как коэффи-
циенты квадратичной формы. Поэтому многочлен
можно рассматривать как квадратичную форму'. Назовём
ее малой квадратичной формой. Из сказанного вытекает
Предложение 1, Ранг и сигнатура малой квадра-
тичной формы (4) не меняются при изменении декарто-
вой системы координат.
Сейчас мы получим закон преобразования коэффициен-
тов уравнения (1) в другой форме, позволяющей доказать
инвариантность еще двух чисел.
Рассмотрим однородный многочлен второй степени от
л-p t переменных
п п п
Левая часть (1) получается из (5) при £•=!.
Если мы произведем какую-либо невырожденную ли-
нейную замену переменных, коэффициенты многочлена (5)
будут преобразовываться как элементы матрицы квадра-
тичной формы. Эту квадратичную форму мы назовем боль-
шой квадратичной формой. Нам понадобятся не произ-
вольные замены, а только имеющие следующий вид (на-
276
пишем его для п = 2):
5*
ё2
11 о о I»g'4 j
=н °* °2 h'1. И °!
Н о? dM 0,2
¥=0.
(6)
Тут переменная не меняется, а остальные преобра-
зуются по формулам
$'= S <&'*+<&•.
ft=l
Если здесь положить £*=1, то мы получим наиболее
общее преобразование декартовой системы координат.
Итак, мы доказали
Предложение 2. Ранг и сигнатура большой квад-
ратичной формы (5) не меняются при замене декартовой
системы координат.
Поверхность, определяемая уравнением (1), не изме-
нится, если мы умножим уравнение на какой-нибудь
отличный от нуля множитель. При этом ранги квадра-
тичных форм (4) и (5) не меняются, а сигнатуры могут
изменить только знак (если множитель отрицательный).
Отсюда следует
Теорема 1. Четыре числа—ранги и модули сигна-
тур большой и малой квадратичных форм—являются
инвариантами поверхности второго порядка.
Мы обозначим ранг и модуль сигнатуры квадратичной
форму (4) соответственно через г и о, а ранг и модуль
сигнатуры формы (5)—через R и S.
2. Линии второго порядка на плоскости. В гл. П1
(теорема 1 § 1) мы показали, что самое общее уравнение
второго порядка на плоскости за счет выбора декартовой
прямоугольной системы координат может быть приведено
к одному из девяти канонических видов. В соответствии
с этим существует семь классов линий второго порядка
на плоскости (уравнениям двух классов не удовлетворяют
координаты никаких точек).
Составляя матрицы большой и малой квадратичных
форм для канонических уравнений, мы можем непосред-
ственно усмотреть значения г, о, R и S, соответствующие
каждому из классов уравнений. Единственное затрудне-
ние возникает в случае параболы. Матрица ее большой
квадратичной формы не диагональная, а имеет вид
В 0 0 — р\
А о I
1-Э о
01
01
277
Чтобы найти ранг /? и модуль сигнатуры 2, преобразуем
эту матрицу по формуле SMS при помощи матрицы
11 0 11
О 1 01.
-1 о 1|
Мы получим
12р 0 0 |
0 1 О I
О 0 —2рЦ
и обнаружим, что /? = 3 и 2»!. Матрица S не имеет
вида (6), но R и 2 не меняются при преобразовании при
помощи произвольной невырожденной матрицы.
Выпишем канонические виды уравнений второго по-
рядка на плоскости вместе с соответствующими значе-
ниями рангов и модулей сигнатур в табл. 1.
Из табл. 1 видно, что всем уравнениям одного класса
соответствует один и тот же набор инвариантов, а инва-
рианты, соответствующие уравнениям разных классов,
различны. Согласно предложению 8 § 3 гл. IV любые две
линии одного класса можно совместить подходящим аффин-
ным преобразованием, а ни одна линия не может быть
Т аблина 1
Название Каноническое уравнение к 2 Г (J
Эллипо (ЕТ . (£’)’ , а» 1 Ь» 3 1 2 2
«Мнимый ЭЛЛИПС! ат .ат . а« 1 6« 3 3 2 2
«Пара мнимых Пересе- в»ат+** ат=о 2 2 2 2
кающихся прямых»
Гипербола ат а8)» , а» Ьг 3 1 2 0
Пара пересекающихся в»ат~ь*ат-о 2 0 2 0
прямых
Парабола 3 1 1 1
Пара параллельных ат-<* 2 0 1 1
прямых
«Пара мнимых парал- 2 2 1 1
лельиых прямых»
Две совпавшие прямые ат=о 1 1 1 1
278
переведена аффинным преобразованием в линию другого
класса. Отсюда мы получаем такое
Предложение 3. Числа R, 2, г и а для двух ли-
ний второго порядка совпадает тогда [и только тогда,
когда эти линии можно совместить некоторым аффин-
ным преобразованием.
Если мы, как и в гл. III, будем пользоваться только декарто-
выми прямоугольными системами координат, то малую квадратичную
форму мы сможем привести лишь к диагональному виду, но не к ка-
ноническому. Например, в случае эллипса в каноническом уравне-
нии остаются коэффициенты при квадратах 1/а* и 1/6*. Это обстоя-
тельство связано с тем, что в ортонормированном базисе матрица
Квадратичной формы должна совпадать с матрицей присоединен-
ного преобразования (ср. с. 262), Поэтому, если мы приведем мат-
рицу
®ls
ИВ (Хм
(7)
квадратичной формы (4) к диагональному виду в ортонормированном
базисе, то на диагонали должны стоять собственные значения при-
соединенного преобразования.
Поскольку при замене одного ортонормированного базиса другим
матрица А остается матрицей одногб и того же линейного преобразо-
вания, корни ее характеристического многочлена не меняются при
переходе от одной декартовой прямоугольной системы координат
к другой такой же системе.
Определение. Величины, не меняющиеся при замене одной
декартовой прямоугольной системы координат на другую декартову
прямоугольную систему координат, называются ортогональными (или
евклидовыми) инвариантами.
Более удобно вместо корней характеристического уравнения
матрицы (7) использовать равносильную систему ортогональных ин-
вариантов—коэффициенты характеристического уравнения этой
матрицы:
7i=«n+«ii> /«==|«1Т
I аи «м I
Преобразование переменных (6) имеет специальный вид. Поэтому
большая квадратичная форма не может быть, вообще говоря, при-
ведена даже к диагональному виду (именно в случае ₽=3, г=1,
т. е. параболы). Однако если прямоугольная система координат
меняется на прямоугольную, матрица
М 02
«О? о’
(8)
будет ортогональной, и ее детерминант равен 1 или —1. В этом слу-
чае детерминант матрицы перехода в формуле (6) также равен ±1
н при преобразовании (6) детерминант матрицы
|«00 «10 «801
«1» «н «и| (9)
«20 «11 «211
279
квадратичной формы (5) остается неизменным! Мы получили еще
одни- ортогональный инвариант уравнения второго порядка:
/3 = det А.
Легко видеть, что матрица перехода в формуле (6) ортогональна
тогда и только тогда, когда ортогональна матрица (8) и oJ = Oo = 0,
т е. ортонормированный базис заменяется на ортонормированный, а
перенос начала координат ие производится. Коэффициенты характерис-
тического многочлена матрицы А останутся неизменными, если матри-
ца перехода ортогональная, поскольку в этом случае А остается
равной матрице присоединенного к форме (5) преобразования. Поэтому
величины !)
а114*ам4*<*ов О®)
и
1&И ®12|_|_|аво °a»l
I «И а22 I I а1в «11 I I «20 ам I
не меняются при ортогональной замене базиса и, возможно, меняются
при переносе начала координат. Величины такого типа называют
семиинвариантами (т. е. полуинвариантами). Вычитая нз (10) и (11)
соответственно инварианты и /2, мы получим семиинварианты н
К =|а®° I
1 I аи аи I I «и ass I
Впрочем, то, что ам—семиинвариант, видно н из формул (2),
Значения полученных здесь ортогональных инвариантов и семи-
инвариантов позволяют найти коэффициенты а, b и р в канонических
уравнениях и потому определяют линию второго порядка с точностью
до положения на плоскости (см. предложение 9 § 3 гл. IV). Подсчет
коэффициентов канонических уравнений по ортогональным инвариан-
там производится во всех подробных курсах аналитической геометрии.
Следует помнить, что величины /1, /г, /а и /Q связаны с мно-
гочленом второго порядка, а не с линией. Они меняются очевидным
образом, если уравнение умножить на отличное от нуля число.
Здесь уместно напомнить, что для читателя, ознакомившегося
с §3гл. III, ортогональные инварианты /2 и /3 не являются содеем
новыми. В гл. III они были обозначены б и Д и инвариантность их
обращения или необращения в нуль была доказана из геометриче-
ских, соображений. Нетрудно заметить, что условие /а = 0 [равно-
сильно г=1, а условия lt > 0 или 1г < 0 равносильны г=2 и
-соответственно а=2 или о = 0. Обращение в нуль /3 означает, что
R < 3. Теперь, глядя в табл. 1, мы можем снова установить гео-
метрический смысл этих условий.
3. Поверхности второго порядка. Пусть уравнение (1)
связывает координаты точки в трехмерном пространстве.
Мы покажем, что существует такая декартова прямоуголь-
ная система координат, при переходе к которой уравнение
принимает один нз 17 канонических видов.
*) Соответственно равные коэффициентам при Xs и —X в харак-
теристическом уравнении,
280
В качестве базиса искомой системы координаа мы вы-
берем тот ортонормированный базис, в котором малая
квадратичная форма имеет диагональный вид. Таким об-
разом, мы будем исходить из уравнения
Ъ ®У + Л, &У + Л, (£»)» + 2ахо£1 + 2а,+ 2а,+ а00 = О
(12)
и запомним, что уже выбран* определенный ортонормиро-
ванный базис. На коэффициенты уравнения не наклады-
вается никаких ограничений, за исключением того, что
Лх, А, и А, не обращаются в нуль одновременно. Дальней-
шие упрощения определяются следующим вспомогательным
предложением.
Предложение 4. Если в уравнение (12) входит
(с ненулевым коэффициентом) квадрат одной из коорди-
нат, то при помощи переноса начала координат вдоль
соответствующей оси можно обратить в нуль член с пер-
вой степенью этой координаты.
Это предложение доказывается так же, как и предло-
жение 1 § 1 гл. III.
Нам удобно будет рассмотреть отдельно несколько
случаев, соответствующих различным значениям инвари-
антов R, X, г и о.
1. Пусть г = 3. Тогда в силу предложения 4 начало
координат может быть перенесено в такую точку, что
уравнение (12) примет вид
AjG1)3 + A,G«)*+A,a’)»+p = 0. (13)
Здесь Л,, Л, и А, не равны нулю. ,
1А. Условие /? = 4 равносильно тому, что свободный
член р в (13) отличен от нуля. Разделив на него, получим
—£-(?у—£вау—^аз)’
1Аа. Пусть 2 = 4. Это означает, что Aj, А„ Aj и р од-
ного знака, коэффициенты в (14) отрицательны. Уравнение
приводится к каноническому виду
(I1)2 (Е2)2 , аз)а. 1
а! т р2 т уз —
Ему не удовлетворяет ни одна точка. Уравнение назы-
вается уравнением мнимого эллипсоида.
1А6. Если 2 = 2, а о = 3, то общий знак А^, А, и А,
противоположен знаку р. Коэффициенты в (14) положи-
281
тельны. Уравнение приводится к каноническому виду
а1)* 1 (£*)* , (£У_.
а* “ р* т" у*
Поверхность—эллипсоид.
1Ав. При 2 = 0 и а=1 знак одного из собственных
значений—не уменьшая общности, можно считать, что
это А,а,—противоположен общему знаку двух других (\
и Х2) и совпадает со знаком ц. В уравнении (14) два
положительных и один отрицательный коэффициент. Ка-
нонический вид уравнения:
(Е1)8, <е8)8
а3 “ р» у» •
Поверхность—однополостный гиперболоид.
1Аг. Пусть теперь 2 = 2, о=1. Знак одного из собст-
венных значений (например, противоположен общему
знаку двух других (Ха и Х8) и противоположен знаку ц.
В уравнении (14) два отрицательных и один положитель-
ный коэффициент. Оно приводится к виду
(У)8 (Е8)8 (Е3)8 1
а» р» у’
и определяет двуполостный гиперболоид.
1Б. Пусть /? = 3. В рассматриваемом случае г = 3,
и это условие равносильно р, = 0; уравнение (13) при /? = 3
однородно. Заметим, что обязательно 2=о
1Ба. При о = 3 в уравнении (13) все собственные зна-
чения и 1а имеют один знак, и уравнение может
быть записано в виде
а1)8 . (Е8)8 , (Е3)8 а
а» р» *г у» ’
Оно называется уравнением мнимого конуса. Поверхность
состоит из одной точки.
1Б6. Если о=1, то одно из собственных значений
отличается знаком от двух других. Уравнение приводится
к каноническому виду
(Е1)8 . (Е8)3 (Е3)8_,о
аа "Г ра ?а
Поверхность является конусом второго порядка.
2. Пусть теперь г = 2. В уравнении (12) одно из соб-
ственных значений равно нулю. Не уменьшая общности,
мы можем считать, что это X, Используя предложение 4,
282
приведем уравнение к виду
^(r*)’4A(VT+2a,or,+a^O. (16)
При этом мы перевесим начало координат вдоль осей £*
и I*. Выпишем детерминант матрицы квадратичной формы (5)
для уравнения (15):
а«о 0 0 aM
О If О О
О О А, О
ООО
2А. Условие /? —4 в силу равенства (16) равносильно
а,о =7^=0. Уравнение (15) можно переписать в виде
(Р)*ЧА +2aJe(5'» 4-<W2aio)=O.
Это показывает, что переносе»! начала координат вдоль
осн J'*:
|'=Г>, l9^r9 + a^2aitt
----06)
уравнение можно преобразовать в
атФг+ЧФГ+звД’-о. (17)
Далее могут представиться две возможности в соот-
ветствии со значением инварианта о.
2Аа. о = 2. В этом случае Af и %, одного знака и при
необходимости, заменяя базисный вектор е, на —еа, мы
приведем уравнение к виду
а» + ра *
Это—каноническое уравнение эллиптического параболоида.
2А6. о=0. В этом случае и 1, разных знаков
и уравнение приводится к каноническому виду
(V)’ gy _ gg
a8 “Р5 6
(тут также может потребоваться изменение направления е8).
Это уравнение определяет гиперболический параболоид.
2Б. Допустим теперь, что /? = 3 Как Вйдно из (16),
для таких уравнений а.0 = 0 и левая часть уравнения
не содержит переменной V- В соответствии со сказанным
в п. 5 § 1 гл. II это означает, что уравнение определяет
цилиндр, образующие которого параллельны базисному
вектору е„ а направляющая определяется в плоскости
283
векторов е£ и е, уравнением
*1(Г)‘+Ч(5г,)‘+<4=0. (18)
которое является уравнением (15) при а,о = О.
Уравнение (18) на плоскости может определять одну
из пяти центральных линий второго порядка. Им соот-
ветствуют пять цилиндров, которые оно может определять
в пространстве: эллиптический цилиндр, гиперболический
цилиндр, пара пересекающихся плоскостей (здесь направ-
ляющая—пара пересекающихся прямых), пара мнимых
пересекающихся плоскостей (поверхность состоит из одно!)
прямой линии, направляющая—точка, т. е. «пара мнимых
пересекающихся прямых») и, наконец, «мнимый эллипти-
ческий цилиндр (поверхность не содержит ни одной точки,
«направляющая»—мнимый эллипс). Сами канонические
уравнения приведены в табл. 2.
3. Теперь рассмотрим случай г = 1. Выберем ортонор-
мированный базис так, чтобы квадратичная форма (4) имела
диагональный вид. Мы придем к уравнению
Ь (В1)2 + 2а10? + 2a,Л* + 2a,.&«+a0„ = 0, (19)
где отлично от нуля.
ЗА. Допустим, что at>+aao¥=O. Тогда мы можем сде-
лать поворот базиса вокруг et:
£'2 = (oU’ + aaom r’==(-oU* + <!U*)/n.
Здесь о = ИогоИ-«зо- Теперь (19) примет вид
(g'2)’ + 2a105a + 2o5'*+aoe = 0,
который в силу предложения 4 преобразуется в
МВ'1)2 + 2с£'*+<4» = 0.
Далее, переносом начала вдоль оси 5*:
= Г, I2 = + aU/2o, f» = g’
мы преобразуем уравнение к виду
^4>)‘ + 2^«~О. (20)
Уравнение (20) приводится к каноническому виду (I1)2 =>
= 2a!;2, где a > 0. (При необходимости можно изменить
направление ej.) Это—уравнение параболического ци-
линдра.
ЗБ. Если aao = aso=O, то уравнение (19) содержит
только 51 и выделением квадрата приводится к одному
из трех последних канонических видов в табл. 2.
На этом классификация заканчивается. Ее результаты
собраны в табл. 2.
284
Таблиц» 2
H»SMHwe Каяояяяеекм уррвяеяяе к 2 Г ,0
«Мнимый эллипсоид* Эллипсоид Однополостный гипербо- лоид Двуполостный гипербо- лоид «Мнимый конуо» Кону« Эллиптический парабо- лоид Гиперболический пара- болоид Эллиптический цилиндр «Мнимый эллиптический цилиндр» Гиперболический ци- линдр Пара пересекающихся плоскостей «Пара мнимых пересека- ющихся плоскостей» Параболический цилиндр Пара параллельных Пло- скостей «Пара Мнимых параллель- ных плоскостей» Пара совпавших плоско-1 стей в» + р» + ~уГ- ’ ’а» 1 Г -1 (Е1)2, <е8)* а»)» 1 а» "г р» У8 (V)2 (Е2)8 (Е3)8. а3 ₽* У* (Е1)2, (Е8)8, (Е3)2 а» 1 р» 1 у« (Е1)8 , (Е8)8 (Е3)8 0 а» р» у» £L*+<£>!=2« а» 1 р* 6 (Е1)2 <E8)8=s2„ а» р* 2* (Е1)2 , (Е3)8 , а» +Т = (Е1)2, (ЕТ_ , а» р5 (££’ (Е8)2 . а» р« (Е2)8 Gl3=0 “а» р8 (Е1)8 , (Е8)8 « а» +-р5-“° (Е*)2=2аЕ8 (Е1)»+а8=0 (Ег)3“0 4 4 4 4 3, 3 4 4 3 3 3 2 2 3 2 2 1 4 2 0 2 3 1 2 0 1 3 1 0 2 1 0 2 1 3 3 3 3 3 3 2 2 2 2 2 2 2 1 1 1 1 3 3 1 ‘ 1 3 1 2 о' 2 <2 0 0 Г. 2 1 1 I 1
235'
ГЛАВА X
ОСНОВЫ ТЕНЗОРНОЙ АЛГЕБРЫ
§ 1. Тензоры в линейном пространстве
1. Геометрические объекты. В главах VI—VIII мы
рассматривали линейное пространство и в нем разного
рода объекты: линейные преобразования, квадратичные
формы и т. д. Изучение каждого объекта основывалось на
определении, которое формулировалось независимо от ба-
зиса. Например, линейное преобразование определялось
как отображение пространства в себя, удовлетворяющее
двум условиям (ср. (1) § 3 гл. VI). Таким образом, наши
объекты существуют и в принципе могут быть изучены
без введения базиса, как объекты, изучаемые в геомет-
рии. Для обозначения таких объектов мы будем пользо-
ваться словами геометрический объект.
Хотя геометрический объект и существует независимо
от базиса, нам удобнее, выбрав некоторый базис, задать
объект относительно этого базиса при помощи упорядо-
ченной системы чисел—компонент объекта. Например,
выбор базиса задает взаимно однозначное соответствие
между линейными преобразованиями и квадратными
матрицами. Линейное преобразование п-мерного прост-
ранства имеет п* {компонент. Неизменность объекта при
замене базиса приводит к изменению компонент. Во всех
встречавшихся нам случаях мы могли вычислить компо-
ненты объекта в одном базисе через его компоненты в дру-
гом базисе и через элементы матрицы перехода от первого
базиса ко второму.
Помимо изученных нами, существуют и другие геомет-
рические объекты. Не для каждого из них удобно давать
инвариантное, не зависящее от базиса, определение. Иногда
геометрический объект определяют при помощи компонент,
Компоненты геометрического объекта отличаются от про-
извольного набора чисел следующим признаком, который
принимается за строгое определение.
286
Определение. Мы будем говорить, что в линейном
пространстве задан геометрический объект, если каждому
базису однозначно соответствует упорядоченная система
чисел (компонент) и компоненты в одном базисе могут
быть выражены через компоненты в другом базисе и эле-
менты матрицы перехода. Это выражение называют зако-
ном преобразования компонент геометрического объекта
Например, если каждому базису соответствует одно
и то же число, то задан геометрический объект, называемый
инвариантом, с одной компонентой. Закон преобразования
состоит в том, что эта компонента не меняется при изме-
нении базиса.
В качестве еще одного примера рассмотрим квадра-
тичную форму к и сопоставим каждому базису е детер-
минант 6 ее матрицы К в этом базисе. Мы получим
геометрический объект с одной компонентой 6 в det К.
Поскольку в базисе e'«=eS мы имеем К't=sSTKS, закон
преобразования компоненты этого объекта имеет вид
6z = (det S)36.
Пусть задан вектор х. Сопоставим базису е сумму
компонент этого вектора в данном базисе. Каждому
базису будет сопоставлено вполне определенное число
y = Однако это соответствие не будет геометрическим
i
объектом. Действительно, число у', соответствующее ба-
зису е', выражается не через у, а через все компоненты
вектора по отдельности:
i i, i
(Здесь т/—элементы матрицы перехода от е' к е.)
В этой главе мы будем рассматривать вещественное
n-мерное линейное пространство ^п. Мы сохраним все
обозначения, принятые ранее. Если имеются два базиса
е и е', то всегда матрицу перехода будем обозначать S,
а ее элементы о/, так что е' == eS или е\ >= S a)ez. Элементы
матрицы обратного перехода S"1 будем обозначать через т/.
Рассмотрим произвольный геометрический объект. Обозначим его
компоненты в базисе е через аъ .... адг, а компоненты в базисе
е' через >>., а#. Закон преобразования компонент объекта оп-
ределяется W функциями Fj, .... Fff, каждая из которых зависит
от ^+n^ независимых переменных:
= ....“AS <Ф, •••, °") (К=1, N)s
или, короче,
aK~FK(a, S). (1)
287
Рассмотрим третий бази- е’ = е' R — eSR. Пусть at, .... —
компоненты Объекта в этом базисе От е к е" можно перейти непо-
средственно, причем матрицей перехода будет произведение SR. Мы
получим
ад = />(“. SR).
С другой стороны, можно от е перейти к е', а от в'— к е" Тогда
<i"k~Fk (a', R) = FK (Ft (a, S)........FN(a, S), R).
Поскольку компоненты объекта однозначно определяются базисом,
функции Ff( для всех К — 1, ..., N должны удовлетворять условно
Fk (a, SR)=Fk (F, (a, S)...FN (a, S), R), (2)
каковы бы ни были a, S и R. Мы получили
Предложение 1. Если функции вида (1) задают закон пре-
образования какого-нибудь геометрического объекта, то они необходимо
удовлетворяют условию (2)
Справедливо и обратное утверждение
Предложение 2. Каждый набор функций вида (1), удовлет-
воряющий условию (2), определяет ва, он преобразования некоторого
геометрического объекта
Для доказательства мы построим этот геометрический объект
следующим образом. В некотором базисе е зададим компоненты
произвольно (предполагается, что рассматриваемые функции опреде-
лены для любых значений независимых переменных) Компоненты
объекта в остальных базисах мы найдем, пользуясь заданным набо-
ром функций как законом преобразования. При этом компоненты в
произвольном базисе е" определяются этими же функциями от ком-
понент в любом базисе е' и элементов матрицы перехода от е> к е".
В самом деле, при введенных выше обозначениях мы имеем —
==fK-(a,SR) и a\ — Ff( (a, S). Отсюда, в силу (2), a^«F^(a', R),
как и требовалось
Осталось показать, что наше построение сопоставляет каждому
базису единственную систему чисел. Единственность может нарушать
ся только потому, что к одному и тому же базису можно прийти
разными путями: если е*, е" — какие-то базисы, то можно
переходить от е к е', от е' к а* и т, д. и, наконец, от к f
Многократно применяя условие (2), можно убедиться, что переход
по каждому из путей дает те же компоненты в базисе f, что и не-
посредственный переход от е к f.
Мы будем изучать простейшие геометрические объек-
ты, называемые тензорами. Закон преобразования их ком-
понент таков, что новые компоненты являются линейными
однородными многочленами от старых компонент. Подробно
он будет описан ниже. Компоненты тензоров принято
упорядочивать, нумеруя их несколькими индексами. Сле-
дующий пункт мы посвятим обозначениям.
2. Пространственные матрицы. Напомним, что на
с, 136 было дано второе определение матрицы, как функ-
ции, сопоставляющей некоторое число каждой упорядо-
ченной паре (i, 1), где m|-, /€{1, ..., п}. Мы
288
обобщим это определение. Поскольку нам потребуются
только матрицы, аналогичные квадратным матрицам, все
индексы будут принадлежать одному и тешу же множе-
ству {1,
Определение, s-мерной матрицей порядка п на-
зывается функция на множестве всевозможных наборов
вида (i(...Q, где it,..., it принимают значения 1,..., п.
Подчеркнем, что порядок матрицы совпадает с размер-
ностью рассматриваемого линейного пространства. Для
того чтобы разъяснить происхождение термина «s-мерная
матрица», рассмотрим трехмерную матрицу с элементами atfk.
При любом фиксированном значении индекса k = k0 эле-
менты матрицы вида ^„ составляют квадратную матрицу
порядка п. Таким образом, все элементы а^к составляют
упорядоченный набор из п квадратных матриц порядка п.
.... 5а//я|. Можно представлять себе эти матрицы
расположенными одна под другой- в виде слоев, так что
образуется куб, разделенный на пя ячеек, в каждой из
которых записано число. Аналогично, четырехмерная мат-
рица может рассматриваться как упорядоченный набор
из п трехмерных матриц и т. д.
Строку и столбец удобно считать одномерными матри-
цами Их элементы нумеруют одним индексом.
Выбирая обозначение для s-мерной матрицы, мы для
удобства можем условиться писать некоторые из индексов
сверху, а остальные снизу. Но, как только обозначение
выбрано, мы будем строго придерживаться принятого
нами расположения индексов. Если порядок индексов не
установлен иначе, мы будем считать, что нижние индексы
следуют за верхними так, как если бы они были написа-
ны правее верхних.
Многомерные матрицы полностью выписывать сложно.
Принято следующее соглашение: буквенный индекс рас-
сматривают как переменную величину, принимающую зна-
чения и если написано выражение, содержащее
буквенный индене1), не являющийся индексом, суммирова-
ния, то предполагается, что выписаны п таких выраже-
ний для каждого значения этого индекса. Когда имеется
несколько индексов, сказанное относится к каждому из
них. В соответствии с этим, например, а** обозначает
всю совокупность элементов s-мерной матрицы, а запись
х) У нас в качестве буквенных индексов будут, как правило,
употребляться буквы i, j, k, I, возможно, снабженные своими индек-
сами. Буква п всегда обозначает фиксированное число—размерность
пространства.
@89
10-102
«/*“₽/* означает, что равны друг другу стоящие на оди-
наковых местах элементы двух трехмерных матриц, т. е.
матрицы равны.
Введем следующее новое обозначение суммирования.
Пусть написано выражение, состоящее из одной буквы
или произведения нескольких букв с индексами, причем
какой-нибудь индекс встречается дважды—один раз
вверху, а другой раз снизу. Под этим выражением мы
будем понимать сумму членов такого вида, написанных
для всех значений повторяющегося индекса, а знак суммы
писать не будем. Если описанным образом повторяются
несколько индексов, то имеется в виду многократная
сумма. В гл. V—VIII мы постоянно .сталкивались с сум-
мами такого типа, но писали знак суммы. Теперь мы этого
делать не будем. Например, формулы
п
< (х) = S «и = S а/701о|
/=1 i, i
будем писать в виде
1(х) = и£, ай-а/уоИ- (3)
3. Определение и примеры. Мы рассматриваем веще-
ственное и-мерное линейное пространство Sп.
Определение. В а задан тензор типа (р, q), если
каждому базису сопоставлена (р + ^-мерная матрица по-
рядка п. При этом, каковы бы ни были базисы е и е',
элементы a, ? и а .
If-fq Н--
должны быть связаны
/ соответствующих
соотношениями
им матриц
= (4)
где о’—элементы матрицы перехода от е к е', а —
элементы обратной ей матрицы.
В правой части (4) суммирование осуществляется по
всем индексам k и I, т. е. мы имеем (рЧ-^)-кратную сум-
му. Мы условливаемся писать сверху те индексы, кото-
рым в каждом из пр+9 слагаемых соответствуют множи-
тели т1. Эти индексы называются контравариантными.
Внизу же мы пишем те индексы, которым в каждом сла-
гаемом соответствуют множители о'. Это—ковариантные
индексы.
Элементы матрицы, соответствующей некоторому бази-
су, называются компонентами тензора в этом базисе.
290
Число называют валентностью тензора, a q и
р—соответственно ко- и контравариантной валентностью.
Подчеркнем, что, несмотря на сложность суммы в пра-
вой части формулы (4), в каждое слагаемое входит в ка-
честве множителя одна-единственная старая компонента
тензора. Это означает, что новые компоненты выражаются
как линейные однородные многочлены от старых компо-
нент. Сложность формулы (4) связана с выражением ко-
эффициентов .этих многочленов через элементы матрицы
перехода.
Два тензора равны, если они одного типа и имеют
равные компоненты в некотором базисе. Тогда из закона
преобразования вытекает, что равны их компоненты и
в любом базисе.
Пример 1. Вектор является тензором типа (1,0).
Действительно, если задан вектор, то каждому базису
соответствует одномерная матрица—столбец. При этом
элементы столбцов, соответствующих равным базисам,
связаны формулой (4) § 1 гл. VI:
Найдем отсюда выражение £'* через
это закон преобразования компонент тензора типа (1,0).
Пример 2. Линейная функция на пространстве
является тензором типа (0, 1). Действительно, если задана
линейная функция, то каждому базису соответствует
одномерная матрица—строка коэффициентов этой функ-
ции. При изменении базиса коэффициенты линейной функ-
ции преобразуются по формуле (4) § 1 гл. VIII:
Xj = ff/Xft.
Эго и есть закон преобразования компонент тензора типа
(0, 1). Тензоры типа (0, 1) называют ковекторами.
Пример 3. Линейное преобразование пространства
п является тензором типа (1, 1). Действительно, если
задано линейное преобразование, то каждому базису со-
ответствует двумерная матрица порядка п. Если базис
меняется, то элементы матрицы преобразуются по формуле
(1) § 4 гл. VIj A' = S~MS, или
tty1 =
Пример 4. Билинейная форма на пространстве 3?п
является тензором типа (0, 2). В самом деле, если задана
ю* 291
билинейная форма, то каждому базису соответствует дву-
мерная матрица порядка п. Элементы матриц, соответст-
вующих двум базисам, связаны формулой;
Ро = а*°/Р*г
Следует заметить, что симметричная билинейная форма
и соответствующая ей квадратичная форма—один и тот
же тензор, поскольку их матрицы в любом базисе со-
впадают.
Пример 5. Инвариант можно считать тензором типа
(0,0).
Пример 6. Важным тензором типа (1,1) является
так называемый символ Кронекера, компоненты которого
в некотором базисе составляют единичную матрицу;
Согласно закону преобразования
(6)
Если 6/ определяются формулой (5), то из и2 слагаемых
в правой части (6) равны нулю все, кроме тех, для кото-
рых /г==/. Поэтому 6/' = TiO*, а —элемент произведе-
ния S-1S. Значит, 6'‘ = 6'_ Мы видим, что тензор типа
(1, 1), имеющий в одном базисе единичную матрицу,
имеет единичную матрицу и в любом другом базисе.
Пример 7. Рассмотрим обобщение билинейной фор-
мы—функцию F (хп . .., xq) от q векторов, линейную по
каждому из них, если остальные фиксированы. Разложим
каждый из векторов по произвольному базису е. Тогда,
в силу линейности по каждому вектору
F (xv ..., хд) ==F (£'>ей.tyeiq) =
= («;.. • • • > %) = ><& • • • ty,
где коэффициенты а/, ly = F(ez,, ..., eiq) играют ту же
роль, что и коэффициенты билинейной формы. Докажем,
что при замене базиса они преобразуются как компоненты
тензора типа (0, q). Для этого рассмотрим базис ei—ok{ek
и снова воспользуемся линейностью функции
F«,. ...,e’lq) = F(^ek....,o^ekq) =
=<£... o*«F(e,...,eN).
Полученное равенство доказывает наше утверждение.
292
Таким же способом можно построить пример тензора
любого типа (р, q). При этом функция F должна зависеть
от q векторов и р ковекторов и быть линейной по каж-
дому из них. Значение такой функции на векторах xit..., xv
и ковекторах I1, 1р можно вычислить, разложив век-
торы по произвольному базису eit а ковекторы —
по базису р1,..., р" в пространстве ковекторов кото-
рый мы выберем б и ортогональным базису eit .... еп. На-
помним (ср с. 249), что базис р1, ..., р" в пространстве
S'. всех ковекторов называется биортогональным базису
ех,.... еп в если
Р (ей)=»в£-
В силу линейности функции F мы имеем
F(xlt 1\
= F ..., E'de/(,, Vр'-, ..., Х^р'р) =
ЛуЧе,., .... e,7,.ph, ...»р'₽)-.
Базис р'*, .... р'", биортогональный базису е"и . со-
стоит из ковекторов р’;=т!р‘. Действительно,
p'z (el) » т<р‘ (o?eft) = tzo?
Отсюда, так же как и выше, вытекает, что <*);;;£ преоб-
разуются как компоненты тензора типа (р, q).
Функции, рассмотренные в этом примере, называются
полилинейными, функциями.
Из последнего примера видно, что существуют тензо-
ры любого типа (р, q). Тензор типа (р, q) будет опреде-
лен, если мы построим полилинейную функцию от р ко-
векторов и q векторов. Ее можно построить, задав базис
и какую-нибудь матрицу коэффициентов а'; • jr. После
этого каждому набору из р ковекторов и q векторов мы
можем сопоставить число
что и определяет полилинейную функцию.
4. Сложение и умножение на число. Для тензоров од-
ного и того же типа определена операция сложения.
Именно, пусть aj‘‘ и —компоненты двух тензоров
А и В типа (р, q) в одном и том же базисе е. Сопоставим
293
этому базису (р+^-мерную матрицу, сложив компоненты
тензоров А и В, имеющие одинаковые наборы индексов!
+ (7)
Предложение 3. Если мы сопоставим каждому
базису числа определяемые по компонентам тензо-
ров А и В в этом базисе формулой (7), то этим будет
определен тензор типа (р, q).
Для доказательства достаточно выяснить, как преобра-
зуются числа y'f" при замене базиса. Мы имеем
а''* = т'«.. .т'/’а'*.. .</««*’ ‘
/г •/<? «t яр h ]q
И
Складывая почленно эти равенства, получаем
,h...ip + = , ,т'го', .
li---lq 1 /1- 1Q 1 Яр '• lq' 1
т. е. тензорный закон преобразования для
Определение. Тензор С с компонентами y^-Jr,
определенными по формуле (7), называется 'суммой тен-
зоров А и В и обозначается А + В.
Таким образом, при сложении тензоров складываются
их соответствующие компоненты. Это значит, что обыч-
ная сумма векторов будет их суммой, если их складывать
как тензоры. То же относится к сумме линейных преобра-
зований, которую мы определили в гл. VI. (Определение
суммы там было дано для произвольных отображений.)
Предложение 4. Поставим в соответствие каж-
дому базису числа la*» - Jr, ац":%—компоненты тензора
А в этом базисе. Такое соответствие определяет тензор.
Доказательство этого предложения мы не приводим —
оно проводится по образцу доказательства предложения
3 и, как и оно, по существу, вытекает из того, что правые
части уравнений (4)—линейные однородные многочлены
от старых компонент.
Определение. Тензор, построенный в предложе-
нии 4, мы назовем произведением тензора А на число X
и обозначим ХА.
Свойства введенных операций списываются следующим
предложением.
294
Предложение 5. По отношению к операциям сло-
жения и умножения на число множество всех тензоров
одного и того же типа (р, q) является линейным прост-
ранством размерности пр+ч.
Предоставим читателю проверить все аксиомы в опре-
делении линейного пространства.
Выберем какой-нибудь базис в и рассмотрим тен-
зоры, у которых одна из компонент в данном базисе рав-
на единице, а остальные компоненты равны нулю. Су-
ществует ровно таких тензоров, так как произволь-
ный тензор типа (р, q) имеет пр*ч компонент. Эти тензо-
ры линейно независимы, и каждый тензор является их
линейной комбинацией (коэффициенты которой — компо-
ненты данного тензора). Таким образом, размерность про-
странства тензоров типа (р, q) равна п^+«.
5. Умножение тензоров. Пусть А—тензор типа (р, q),
а В—тензор типа (г, s) Произвольному базису е мы мо-
жем сопоставить (р 4- q 4- г 4- $)-мерную матрицу, состав-
ленную из произведений каждой компоненты А на каж-
дую компоненту В. Эти произведения упорядочим, запа-
сав сначала индексы, относящиеся к А, а затем индексы,
относящиеся к В, так, как показывает формула
Предложение 6. Если каждому базису мы сопо-
ставим числа у'л определяемые по компонентам тен-
зоров А и В в этом базисе формулой (8), то этим будет
определен тензор типа (p + r, q + s).
Доказательство мы проведем для случая тензоров ти-
пов (1, 1) и (0, 1). В общем случае доказательство отли-
чается только более громоздкой записью. Выразим ком-
поненты тензоров А и В в базисе е' через их компоненты
в базисе е:
a’^x^af, =
Отсюда
= Т£(Г'О* (Zfl5A =
т. е. величины преобразуются при замене базиса как
компоненты тензора типа (1, 2).
Это Доказательство, в отличие от предыдущих, исполь-
зует выражение через о) и т) коэффициентов при старых
компонентах в формулах (4).
Определение. Тензор, построенный в предложении
6, называется произведением тензора А на тензор В и
Обозначается А®В.
295
Пример. Рассмотрим две линейные функции f и h
на Зп и сопоставим каждой паре векторов х и у число
f(x) h(y). Пусть в некотором базисе значения f и h за-
писываются f(x) = x,£' и h (х) = р.йг|\ где и г)*—компо-
ненты векторов х и у. Тогда
Ь (х, у) = f (х) • h (у) = (х£) = (х,щ) »|*,
поскольку при перемножении многочленов каждый член,
одного сомножителя умножается на каждый член друго-
го. Итак, построенная нами функция Ь—билинейная
форма, т. е. тензор типа (0, 2). Этот тензор является тен-
зорным произведением тензоров, соответствующих f и h.
Мы можем записать b = f0h или, в компонентах, 0/А=
Тензорное умножение не коммутативно. Покажем это
на следующем примере. Тензорное произведение двух
векторов х и у есть тензор х ® У типа (2, 0). па его ком-
понент составляют квадратную матрицу (первый индекс—
номер строки). Если и т]*—компоненты х и у в неко-
тором базисе, то матрица из компонент х®у в этом
базисе имеет вид
£1^1 £1^2 £1,)В
gnyj2 , . , gBt)B
Составив таким же способом матрицу из компонент тензо-
ра мы получим транспонированную матрицу. Каж-
дая компонента £'т]*—произведение чисел, и, следователь-
но, Но упорядочиваются компоненты тензоров
х®у и у®х разными способами. То же относится и к
произведению произвольных тензоров.
Предоставим читателю самостоятельно убедиться в
том, что тензорное произведение ассоциативно и дистри-
бутивно по отношению к сложению. Легко заметить так-
же, что введенное ранее умножение тензора на число
совнадает с умножением на тензор типа (0, 0), имеющий
это число в качестве компоненты.
Предложение 7. Любой тензор типа (р, у) есть
линейная комбинация произведений, в каждое из которых
входит р векторов и у ковекторов.
Для доказательства достаточно показать, что .произве-
дениями требуемого вида являются тензоры, из которых
в предложении 5 был построен базис в пространстве
296
тензоров типа (/>, q). Мы сделаем это для тензоров
типа (2, 1), поскольку в общем случае рассуждение ана-
логично.
Пусть тензор Q таков, что в базисе еп его ком-
понента 6|3 == 1, а остальные компоненты равны нулю.
Рассмотрим базисные векторы et, е, и ковектор f, кото-
рый в базисе ev е„ имеет компоненты (1, 0, ..., 0).
Так как еа и е8 имеют компоненты (0, 1,0, ..., 0) и
(0, 0, 1, 0, ..., 0), произведение имеет только
одну компоненту (с номерами 2, 3 и 1), равную единице,
а остальные компоненты этого произведения равны нулю.
Таким образом, Q = ea®ea(g) f, как и требовалось.
Точно так же утверждение доказывается и для остальных
тензоров, составляющих базис в пространстве тензоров
рассматриваемого типа.
6. Свертывание. Пусть a^-jp—компоненты тензора
типа (р, q) в базисе е, причем 1 н 1. Выберем
какой-нибудь верхний индекс, например первый, и ка-
кой-нибудь нижний индекс, например последний. При
каждом фиксированном наборе значений остальных индек-
сов составим сумму тех компонент тензора А, у которых
равны значения выбранных индексов:
‘я = а!'* ,{р . 4-a?1*,‘р „ + ... + а”'* /я . (9)
'll lq-i fl fq-tl 1 /«-,2 1 1 /1 iq-,n ' '
Предложение 8. Сопоставим каждому базису си-
стему чисел, получаемую из компонент а‘> jp тензора
типа (р, q) по формуле (9). Такое соответствие опреде-
ляет тензор типа (p~~l, q—1).
Для доказательства выясним, как преобразуется ука-
занная система чисел при изменении базиса. Мы имеем
B'G ip = = т* V' ... т*я сф... ч&аф .тР.
г1, Iq-i ii- Iq-i* тр ii lq-i * lt.-.lq
Но так как — to это выражение равно
тб ... %{p о1'.. ',тР.
т, т, тр /, iq_t /, lq
При суммировании по индексам lq и тх равны нулю все
слагаемые, за исключением тех, для которых /,=«!•
Обозначив = = мы можем написать
В », ip =Т*« . . .t‘p ог*. . ,019-'О^т*, тРк.
"h iq-i m, тр h lq-t б‘- lq->k
Это означает, что числа ’я , преобразуются как ком-
поненты тензора типа (р—1, q—1).
297
Определение. Тензор, получаемый из тензора А
по формулам (9), называется его сверткой по первому
верхнему и последнему нижнему индексам. Аналогично
определяется свертка по любому верхнему и любому ниж-
нему индексу.
Сверткой двух тензоров называется какая-либо сверт-
ка их произведения по верхнему индексу одного сомно-
жителя и нижнему индексу другого. Например, образ
вектора х с компонентами & при линейном преобразова-
нии А с матрицей а1, есть свертка соответствующих тен-
зоров: = а^ = + . <. + а£п.
Значение линейной функции f с коэффициентами х,
на векторе х с компонентами есть свертка £ = хД‘.
Важным примером является свертывание тензора ти-
па (1, 1). При этом получается тензор типа (0, 0), т. е.
инвариант. Если мы обозначим компоненты тензора А
типа (1, 1), через а}, то его свертка имеет вид а,-=
=а}-}•••• 4-а"- Это—сумма диагональных элементов
матрицы А из компонент А. Сумма диагональных эле-
ментов матрицы А называется ее следом и обозначается
trA. На с. 216 мы видели, что trA—инвариант, если
А—матрица линейного преобразования. Теперь мы полу-
чили это с более общей точки зрения.
Напротив, для тензоров типа (0, 2) свертка не опре-
делена. В соответствии с этим след матрицы квадратичной
формы [не будет инвариантом—он может быть изменен
при изменении базиса. Предоставим читателю прове-
рить это.
7. Транспонирование. Рассмотрим множество элемен-
тов s-мерной матрицы, для которого все индексы, кроме
некоторых двух, имеют фиксированные значения. Это мно-
жество ,образует двумерный слой—квадратную матрицу.
Таким образом, вся матрица распадается на двумерные
слои, соответствующие различным сочетаниям значений
всех индексов, кроме выбранных двух.'
Транспонированием s-мерной матрицы по каким-ни-
будь двум индексам называется такая перестановка ее
элементов, при которой транспонируется каждый слой,
получаемый фиксированием всех индексов, кроме данных
двух. Например, при транспонировании матрицы aft"}?
по первым двум верхним индексам она переходит в мат-
рицу которая связана с исходной матрицей ра-
венством
0°)
298
Вообще, под транспонированием по некоторому множе-
ству индексов понимают результат последовательного
выполнения транспонирований по различным парам ин-
дексов из этого множества.
Операцию транспонирования иногда называют опера-
цией перестановки индексов.
Пусть для примера п = 2. Рассмотрим трехмерную
матрицу cty*. Значениям 1 и 2 первого индекса соответ-
ствуют два слоя. Мы выпишем их один рядом с другим:
1ат а11«|амг atilL
aisi а1зг I ®iif I
Транспонирование по двум последним индексам перево-
дит эту матрицу в матрицу ₽//A = art/, или, в развернутом
виде,
|₽Ш PiisIPsii Pals | __ I “u'i ®fsllasH «ы I
Pis! Pisa I Psst Psss В II aifs af»lasfs asssJ
Если при более сложном транспонировании yz/A = aA//, то
<у//А имеет вид
IThI Tils I Ysii Ysis I — I aiii asii I aist assiI
Tisi Yiss I Ynl Ysss II II ans asis I ®iss asss II
Предложение 9. /7усть каждому базису сопостав-
лена (p + q)-мерная матрица получаемая из мат-
рицы компонент тензора А транспонированием,
при котором переставляются только верхние или только
нижние индексы. Это соответствие определяет тензор В
того же типа, что и А.
Нам достаточно доказать это для транспонирований,
меняющих порядок только двух индексов, поскольку лю-
бое транспонирование—результат последовательного вы-
полнения таких транспонирований. Кроме того, для лю-
бой пары верхних или нижних индексов доказательство
одинаково. Поэтому мы докажем предположение для
транспонирования по первой паре верхних индексов, за-
писанного в формуле (10). Имеем
R'G- \р = a'Wr- ip = т(« тг> т(>... т/ро'’.. .o'wW’ кр.
«1 Л» Л» ftp и Iq^lt
Мы имеем право изменить обозначение индексов сумми-
рования ki на kit а Ла на kt и в каждом слагаемом пере-
ставить сомножители. Тогда мы получаем формулу
АЧл,1,..Лр — . .сЧаФЛ’- ьр ==
*= Ч* ть т1* • • .т/i'a}*. . .о’в65*М‘-,
«1 «в •«» Кр It
269
которая выражает тензорный закон преобразования для
р‘* ‘р.
1а
Определение. Тензор В, построенный в предло-
женин 9, называется результатом транспонирования тен-
зора А.
Заметим, что доказательство предложения 9 не про-
шло бы, если бы мы захотели переставить какой-нибудь
верхний индекс с каким-нибудь нижним Например, этим
объясняется следующий факт. Если мы возьмем две мат
рицы А и 5-1А5, определяющие одно и то же линейное
преобразование в разных базисах, и транспонируем их,
то полученные матрицы 4Г и Sr4r(S-1)r определят раз-
ные линейные преобразования
Если же мы транспонируем матрицы В и STBS, опре-
деляющие в разных базисах билинейную форму Ь, то
получим матрицы ВТ и STBTS, также определяющие одну
и ту же (но, вообще говоря, новую) билинейную форму
Ьг Эти билинейные формы инвариантно связаны между
собой Легко проверить, что Ьг(х, у) = Ъ(у, х)
Тензоры, являющиеся произведениями двух данных
тензоров в разном порядке, получаются один из другого
транспонированием
8. Симметрирование и альтернирование. Рассмотрим
тензор А, контравариантная валентность которого р не
меньше заданного числа s^2. Выберем какие-нибудь s
верхних индексов и подсчитаем, сколько тензоров можно
получить из А транспонированием по выбранным индек-
сам. Переставляя индексы попарно, можно расположить
их в произвольном порядке Поэтому вопрос сводится к
подсчету того, сколькими способами можно расположить
в ряд s индексов. Эго можно сделать s! способамих). Итак,
транспонируя исходный тензор по s индексам, можно по-
лучить s! тензоров Сложим все эти тензоры и разделим
сумму на si. Полученный тензор называется результатом
симметрирования исходного тензора А по выбранной
1) Число всех перестановок s индексов равно произведению
всех натуральных чисел, не превосходящих s, т. е. 1 2...(s—l)s
Это число обозначает s! (читается «эс-фактор и ал») Докажем это
по индукции. Очевидно, что при s = 2 утверждение справедливо
Допустим, что для s—1 индексов существует (s—1)! перестано-
вок В каждом из них мы можем поместить s ю букву на одно из
s мест слева, справа и в s—2 промежутках между уже стоящими
буквами. Итак, всего мы получаем (s—l)fs=s’ перестановок
для а индексов. Разумеется, результат Этот имеет место не только
для индексов, но и дли перестановок элементов любого множества,
содержащего з элементов,
300
группе индексов. Его компоненты обозначаются заключе-
нием в круглые скобки этой группы индексов у компо-
нент тензора А Индексы, не участвующие в симметриро-
ваний, могут быть выделены вертикальными черточками.
Аналогично определяется симметрирование по нижним
индексам. Приведем следующие примеры:
м ** = -1(а</л_}.алл)>
af/w> = "g" (а/« + a)U + akii + a>kii + ctiik + a/*/).
Рассмотрим снова тензор А типа (p, q), p^s, и выбе-
рем группу из s верхних индексов Если мы перенумеруем
индексы этой группы числами 1, .... $, то каждому тен-
зору, получаемому из А транспонированием, будет сопо-
ставлена некоторая перестановка оп ..., os номеров 1, ...
..., s (это значит, что при транспонировании на первое
место в рассматриваемой группе индексов поставлен ин-
декс с номером ст„ на второе место—индекс с номером о2
и т л ). Обозначим через N (стп ..., oJ) число нарушений
порядка в перестановке о,, ..., os, т е число таких пар
о0, ст₽, что а < р, а сто > ор (ср с. 152).
Транспонируя тензор А по выбранным s индексам, мы
получим s! тензоров. Сложим все эти тензоры, умножив
каждый из них предварительно на (—• »*), где
Од, ..., as—перестановка, ему соответствующая. Сумму
разделим на s'. Так построенный тензор называется резуль-
татом альтернирования исходного тензора по выбранной
группе индексов Его компоненты обозначаются заключе-
нием в квадратные скобки тех индексов, по которым
производится альтернирование, например:
oJ‘ I л *] = -i- (а’^А—а*7')-
Аналогично определяется альтернирование по нижним
индексам, например:
—^ikj —'O-jik) •
Приведем еще один пример. Рассмотрим детерминант
матрицы линейного преобразования. В § 4 гл. VI мы отме-
чали, что это инвариант. Теперь мы выразим этот инва-
риант при помощи тензорных операций. Пусть —эле-
менты матрицы линейного преобразования А в некото-
ром базисе е. Тогда n-кратное тензорное произведение
301
преобразования А на самого себя А 0 А 0.. .0 А имеет ком-
поненты a/'/x/J... а,”. Альтернируем это произведение по
всем нижним индексам, а затем свернем по всем индек-
сам. Мы получим инвариант
- .<ипу.
Здесь п индексов суммирования, каждый из которых при-
нимает по п значений. Следовательно, правая часть рас-
падается на пп слагаемых. Каждое из этих слагаемых
представляет собой алгебраическую сумму га! членов, воз-
никающих при альтернировании. Если в [наборе индек-
сов, определяющем какое-нибудь слагаемое, есть два рав-
ных индекса, то такое слагаемое равно нулю. Действи-
тельно, для каждого члена в нем, взятого со знаком плюс,
найдется неотлнчающийся член, взятый со знаком минус.
Если же в наборе индексов, определяющем слагаемое, все
индексы различны, то, переставляя сомножители в каждом
члене этого слагаемого, мы можем привести его к виду
otf!...»"]. Всего слагаемых второго типа га!. Следова-
тельно,
Д = «!«[,.. .a„j.
Расписав подробно альтернирование, мы получим
Д=п1-4- (— 1)*<**•••*«'а*,...а*„ = det|а{|.
(*.... м
Определение. Тензор называется симметричным
по паре индексов, если результат его альтернирования по
этой паре равен нулю.
Симметричный по паре индексов тензор не меняется
при транспонировании по этой паре индексов. В самом
деле, если, например, at/yj = O, то a// = a//.
Тензор симметричен по группе индексов, если он сим-
метричен по любым двум индексам из этой группы. В этом
случае он не меняется при любом транспонировании по
индексам из этой группы.
Не представляет труда убедиться, что результат сим-
метрирования тензора по нескольким индексам будет тен-
зором, симметричным по этим индексам.
Определение. Тензор называется антисимметрич-
ным по паре индексов, если равен нулю результат его
симметрирования по этим индексам.
Антисимметричный по паре индексов тензор меняет
знак при транспонировании по этой паре индексов.
302
Тензор антисимметричен по группе индексов, если он
антисимметричен по любой паре индексов из этой группы.
В этом случае он не меняется при транспонировании,
которому соответствует перестановка с четным числом
нарушений порядка, и меняет знак, если транспонирова-
нию соответствует перестановка с нечетным числом нару-
шений порядка. Действительно, такие транспонирования
сводятся соответственно к четному и нечетному числу
транспонирований, переставляющих пары индексов.
Можно доказать, что результат альтернирования тен-
зора по нескольким индексам антисимметричен по этим
индексам.
Если тензор антисимметричен по двум индексам, то
равны нулю все те его компоненты, у которых совпадают
значения этих индексов. Действительно, пусть, например,
— Тогда для тех компонент, у которых
I, = it = Л, мы имеем a**/= — a**и, следовательно,
В качестве примера докажем следующее
Предложение 10. Каждый тензор типа (0, 2) одно-
значно представляется в виде суммы симметричного и
антисимметричного тензоров.
Действительно, пусть такое представление имеет место,
т. е. где Р1ф = 0 и у(,7) = 0. Тогда, альтер-
нируя и симметрируя обе части равенства, мы получаем
соответственно
at//)^Vtz/j==y>7 и ai//> = ₽<//> = ₽//•
С другой стороны, всегда
, 1.1 .1 1
aU/> । a(i/j 2 ' 2 ' 2 2
т. е.
и предложение доказано.
9. Замечание. Пусть имеется какое-нибудь соотноше-
ние между тензорами, написанное при помощи введенных
нами тензорных операций. Если выбран базис, ему соот-
ветствуют такие же соотношения между компонентами
рассматриваемых тензоров. Тензорные операции инвари-
антны в том смысле, что соотношения между компонен-
тами выглядят одинаково, каков бы ни был базис. Скажем,
соотношение A = где х, у и г—векторы,
303
равносильно равенству ar/ = £G/-f-£'(/ между компонен-
тами, причем безразлично, в каком базисе, так как во всех
базисах оно выглядит одинаково
В силу этого обстоятельства часто, говоря о тензорах,
имеют в виду их компоненты или, наоборот, говоря о
компонентах, имеют в виду тензоры Говорят, например,
«тензор а(д» вместо «тензор, компоненты которого в та-
ком-то базисе равны а!/к» Это не может вызвать недора-
зумения и сильно упрощает речь В дальнейшем мы будем
пользоваться подобными сокращениями
§ 2. Тензоры в евклидовом пространстве
1. Метрический тензор. Все сказанное о тензорах в ли-
нейном пространстве, разумеется, справедливо и в случа-
евклидова пространства. Однако в евклидовом простран-
стве тензоры обладают многими свойствами, которых они
не имели в линейном.
Теорему 2 § 3 гл. VIII мы можем, пользуясь тензор-
ной терминологией, сформулировать следующим образом:
n-мерное евклидово пространство можно определить как
такое n-мерное линейное пространство, в котором задан
симметричный тензор G с компонентами g[f, причем
gij^V > 0 Для каждого ненулевого вектора Компоненты
тензора G в базисе е—это элементы матрицы Грама этого
базиса.
Определение. Сопоставим каждому базису евкли-
дова пространства матрицу Грама этого базиса. Опреде-
ляемый этим соответствием тензор типа (0, 2) называется
метрическим тензором пространства.
Предложение 1. Сопоставим каждому базису ев-
клидова пространства матрицу, обратную матрице Грама
этого базиса. Это соответствие определяет тензор типа
(2, 0).
Доказательство. Пусть Г и Г'—матрицы Грама
базисов е и е' — eS. Нам нужно выяснить, как связаны
матрицы Г-х и Г'-1. Мы будем исходить из формулы (15)
§ 1 гл. VIIi Г' — ХГГ5. Найдем матрицы, обратные
обеим частям равенства, пользуясь формулой (10) § 6
гл Vs
Как мы видели в § 6 гл. V, для любой невырожденной
матрицы (Sr)-1 = (5_д)г. Следовательно,
Г'-‘»$->Н(«-»)г. (1)
304
Перепишем формулу (1), обозначив через gU, g'‘J и tJ эле-
менты матриц Г-1, Г'-1 и S~l Мы получим
g'U = tiMgM,
т. е. закон преобразования ко понент тензора типа (2, 0).
Определение. Тензор, построенный в предложе-
нии 1, называется контравариантным метрическим тен-
зором.
Равенства ГГ-1 = £ и Г-1Г = £ могут быть переписаны
через компоненты glf и g'7 так
= 6?, = S*.
Кроме того, поскольку (Г-1)Г = (ГГ)~1 = Г~1, контрава-
риантный метрический «тензор симметричен:
gf/ = g/{>
2. Поднятие и опускание индексов. Наличие мегрнче-
ского тензора позволяет ввести в евклидовом пространстве
еще две операции над тензорами—поднятие и опускание
индексов
При опускании индекса тензору типа (р, </),/>>!, со-
поставляется тензор типа (р—1, <?+!), получаемый свер-
тыванием данного тензора с метрическим тензором по тому
индексу, который мы хотим опустить. При этом порядок
индексов сохраняется в следующем смысле. Мы отказы-
ваемся от соглашения, по которому каждый нижний индекс
следует за каждым верхним. Для того чтобы отметить
порядок индексов, над каждым нижним индексом и под
каждым верхним индексом ставится точка. Например, при
опускании первого индекса у тензора allk мы подучаем
тензор =
При поднятии индекса данный тензор сворачивается
с контравариантным метрическим тензором по тому ин-
дексу, который следует поднять. Результат будет тензором
типа (р+1, q—1). Разумеется, для этого нужно, чтобы
исходный тензор имел хотя бы один нижний индекс, т е.
q 1 Например, поднятие первого индекса у аД дает
а^ = g''a;'fr, а поднятие третьего дает a/* = .
Перед этим мы уже встречались с опусканием индекса.
В § 2 гл VII было введено понятие линейного преоб-
разования А*, сопряженного данному линейному преобра-
зованию евклидова пространства. В произвольном базисе
матрицы А и А* преобразований А и А* связаны равен-
305
ством (3) § 2 гл. VII, которое можно переписать в виде
ГЛ* = (ГЛ)Г. Обозначив через а, и а/' элементы матриц
А и А*, мы запишем это равенство в тензорных Обозначе-
ниях.'
Как легко заметить, оно означает следующее! после опу-
скания индексов у тензоров А и А* один из них получается
из другого транспонированием. Для самосопряженного
преобразования А тензор симметричен.
В § 3 гл. VIII мы ввели понятие линейного преобра-
зования А, присоединенного билинейной форме Ь. В произ-
вольном базисе матрица А присоединенного преобразования
выражается через матрицу Вбилинейной формы равенством
А = Г-15. В тензорных обозначениях это может быть
переписано как
Мы видим, что тензор А получается из тензора Ь подня-
тием первого индекса.
В § 1 гл. VIII был введен вектор, присоединенный
линейной функции на евклидовом пространстве. Строка
коэффициентов х этой функции выражалась через коорди-
натный столбец вектора а формулой х = агГ. Переходя от
матричной записи к записи через компоненты, мы получим
Hi = akgk/. Отсюда вытекает af = gtJnl (гл. VIII).
3. Евклидовы тензоры. При изучении евклидова пространства
часто можно ограничиться только ортонормированными базисами. При
этом все формулы, связанные со скалярным произведением, значи-
тельно упрощаются, так как метрический тензор имеет единичную
матрицу
(1,
giJ~ {о, iv/. (2)
При замене одного ортонорммрованного базиса на другой орто-
нормированный матрица перехода ортогональна, т. е. удовлетворяет
соотношению S~1 = ST, Это значит, что элементы S и ее обратной
связаны равенствами
= (3)
Если мы внесем соотношения (3) в закон преобразования компо-
нент тензора (4) § 1, мы получим
Л.../я v *» А A? ki...kp ...
“1» • » » л»
h, .... Iq
Здесь индексы суммирования klt ,.., kp расположены сверху, поэтому
мы пишем Знак суммы, Формула (4) показывает, что, ограничиваясь
306
ортонормированными базисами, мы уничтожаем различие между верх-
ними и нижними индексами: верхним индексам в законе преобразова-
ния (4) соответствуют такие же множители, как и нижним.
Заметим еще, что в силу (2) в ортонормированном базисе совпа-
дают компоненты всех тензоров, которые отличаются друг от друга
поднятием или опусканием индекса. Действительно, мы имеем, на-
пример, au/—giha'bi~abjt так как иэ п слагаемых в сумме по к
отлично от нуля только то, у которого i=k, а в нем gu—\.
Из сказанного следует, что, ограничиваясь рассмотрением орто-
нормированных базисов, мы можем отождествлять все тензоры, кото-
рые можно получить один из другого поднятием или опусканием
индекса. Точнее говоря, все тензоры, имеющие в ортонормированных
базисах одинаковые компоненты, мы объединяем в один класс и
рассматриваем этот класс как некоторый новый объект. Объект этот
является евклидовым тензором.
Определение. В евклидовом пространстве £п задан евклидов
тензор валентности «, если каждому ортонормированиому базису
сопоставлена s-мерная матрица порядка я. При этом, каковы бы ни были
ортонормированные базисы «и е', элементы а;1...^и ajt,,.^соот-
ветствующих матриц связаны соотношением
<4.../f=4‘ (5)
Все индексы у евклидовых тензоров равноправны, и мы будем писать
их внизу.
Из формулы (3) ясно, что каждый тензор типа (р, q) определяет
евклидов тензор валентности (p+q). При этом все тензоры, отли-
чающиеся друг от друга поднятием или опусканием индекса, опре-
деляют один и тот же евклидов тензор.
Если задан евклидов тензор, то его компоненты в неортонорми-
рованных базисах не определены. Однако для каждого евклидова
тензора валентности « можно определить эти компоненты так, чтобы
получился тензор любого типа (р, q), где p+q = s. Для этого их
нужно найти, пользуясь законом преобразования компонент тензора
соответствующего типа. Таким образом, каждый евклидов тензор
порождается любым тензором иэ некоторого класса тензоров. Легко
видеть, что все тензоры этого класса отличаются один от другого
поднятием или опусканием индекса.
Числовые величины, не меняющиеся при переходе от одного
ортонормированного базиса к другому, на с. 279 мы назвали ортого-
нальными (или евклидовыми) инвариантами. Теперь мы видим, что
это евклидовы тензоры валентности 0.
Для евклидовых тензоров можно определить операции, введенные
для тензоров в § 1. Определения, а также формулировки и доказа-
тельства соответствующих предложений были бы почти дословным
повторением сказанного, и мы не приводим их. Заметим только, что для
евклидовых тензоров свертывание возможно по любой паре индексов
и транспонировать их можно тоже по любому множеству индексов.
Например, если, ограничиваясь ортонормированными базисами, мы
отождествим квадратичную форму с присоединенным к ней преобра-
зованием, то полученный новый объект—евклидов тензор валентно-
сти 2—будет иметь инвариантную свертку (как линейное преобразо-
вание) и инвариантно будет удовлетворять равенству a/y = ay( (как
квадратичная форма). Инвариантность здесь, разумеется, имеет место
только относительно замены ортонормированного базиса другим.
307
§ 3. Поливекторы. Относительные инварианты
1. р-век торы. Мы начнем этот параграф с изучения
одного специального класса тензоров.
Определение. Антисимметричный по всем индек-
сам тензор типа (р, 0) мы будем называть р-вектором
или поливектором, если тип не уточняется.
Антисимметричный по всем индексам тензор типа (0, qj
называется q-ковектором или q-формой.
Теория <?-ковекторов аналогична теории поливекторов.
Мы будем заниматься в основном р-векторами.
Заметим прежде всего, что при р > п существует только
нулевой р-вектор. Действительно, из р > га индексов,
принимающих значения 1, .... п, хотя бы два должны
принимать равные значения. Это значит, что в каждой
компоненте есть два одинаковых индекса. При транспо-
нировании тензора, переставляющем эти индексы, компо-
нента должна изменить знак. Но, так как индексы равны,
она не меняется и потому равна нулю. Так можно рас-
суждать для каждой компоненты.
При р — п могут быть отличны от нуля только те
компоненты, у которых значения индексов представляют
собой перестановку чисел 1, ..., п (иначе снова окажутся
два равных индекса). Все такие компоненты выражаются
через одну ид них по формуле
в(г'я={_1)«Л......(1)
в которой N (i\,..., i„)—число нарушений порядка в пе-
рестановке 4, ..., »„ (ср. с. 152).
Действительно, мы покажем сейчас, что значения ин-
дексов ц, ..., i„ можно расположить в порядке возраста-
ния при помощи N (i\, ..., t„) транспонирований, пере-
ставляющих два индекса, а каждое такое транспонирование
мейяет знак у компоненты. Расположить значения индек-
сов в порядке возрастания можно так. Среди i\, ..., in
одно из чисел равно п. Переставим его на последнее
место, последовательно меняя его местами со всеми чис-
лами, стоящими правее него; со всеми этими числами п
образовывало нарушение порядка. Таким образом, мы
сделаем столько перестановок, в скольких нарушениях
порядка виновно число п, и не изменим порядка осталь-
ных чисел. Теперь возьмем число п—1 и переставим его
таким же образом на предпрследнее место. При этом мы
сделаем столько попарных перестановок, в скольких на-
рушениях порядка виновно число га—1, и не изменим
308
взаимного расположения остальных чисел. Поступим да-
лее таким же образом с числами п—2, 2. После
этого все числа, включая 1, которая автоматически ока-
жется на первом месте, будут расположены в порядке
возрастания. Чтобы этого достичь, мы сделали У (i\, ..., t„)
попарных перестановок.
р-вектор а*1 р называется простым, если он представ-
ляется как альтернированное произведение векторов, т. е.
= (2)
где, например, £р—компоненты вектора хр.
Предложение 1. Каждый п-вектор является про-
стым.
Доказательство. Рассмотрим какой-нибудь нену-
левой простой n-вектор 0^ ’п = £р1- • Отношение ком-
поненты а1 " данного нам n-вектора к 01-" мы обозначим
через 1. Из формулы (1) следует, что тогда и для всех
компонент a'1 ‘» = A0f1’ Положив г/ = имеем
а‘1- ‘o==r|(‘ig'a.. .^«1, как и требовалось.
Пусть даны р векторов хх, ..., хр с компонентами
....
Составим матрицу, столбцами которой будут коорди-
натные столбцы векторов хх, ..., хр.
(3)
Выберем р строк этой матрицы с номерами < it <...
.., < ip и рассмотрим минор, расположенный в этих
строках:
«V -'ар
Здесь о,, ..., <зр различны и принимают значения 1, ..., р.
Сравнивая это выражение с (2), мы находим те компо-
ненты простого р-вектора, у которых значения всех ин-
дексов попарно различны и расположены в порядке воз-
растания:
Остальные компоненты либо равны нулю (если среди ин-
309
дексов есть равные), либо отличаются от уже найденных
множителем (—l)w, где N—число нарушений порядка
среди значений индексов.
В частности, для n-вектора имеем
Из формулы (4) следует, что простой р-вектор явля-
ется нулевым тогда и только тогда, когда составляющие
его векторы линейно зависимы, т. е. ранг матрицы (3)
меньше р.
2. Относительные инварианты, n-вектор вполне харак-
теризуется в каждом базисе одним числом—его компо-
нентой а’-я. Попробуем выписать закон преобразования
этого числа при замене базиса без участия других ком-
понент n-вектора. Мы получим а'1-я = т*1.. —
= S (—l)w ............ .т? а1 "> или
Ci..'»)
a'1-n = (detS_1)aI—', = (detS)”,aI" я. (6)
Мы видим, что соответствие, относящее каждому базису
независимую компоненту n-вектора, определяет геометри-
ческий объект с одной компонентой и законом преобразо-
вания (6). В самом деле, каждому базису сопоставлено
единственное число, и число, соответствующее одному ба-
зису, выражается через число, соответствующее другому
базису, и матрицу перехода. Этот объект—не тензор, так
как тензор с одной компонентой необходимо имеет тип
(О, 0) и, следовательно, является инвариантом.
Другой пример геометрического объекта такого рода
мы видели в начале § 1з детерминант матрицы из компо-
нент тензора типа (0, 2) преобразуется по закону
6' = (detS)36. (7)
Определение. В линейном пространстве задан от-
носительный инвариант веса г, если каждому базису
сопоставлено число так, что числа, соответствущие бази-
сам е и e' = eS, связаны равенством
а' = (det S)r а. (8)
Инвариант, или, как говорят, чтобы подчеркнуть отли-
чие от относительного инварианта, абсолютный инвари-
ант, является относительным инвариантом веса 0.
310
Аналогично формуле (6) можно показать, что един-
ственная независимая компонента n-ковектора является
относительным инвариантом веса 1.
Отметим следующие свойства алгебраических опера-
ций с относительными инвариантами.
Предложение 2. 1) Пусть даны два относитель-
ных инварианта a ub одного и того же веса г. Сопостав-
ляя каждому базису сумму компонент а и be этом базисе,
мы получим относительный инвариант веса г.
2) Пусть даны относительные инварианты а и b весов
Соответственно rt и rt. Сопоставляя каждому базису про-
изведение компонент а и Ь в этом базисе, мы получим
относительный инвариант веса Г1 + га.
3) Пусть дан относительный инвариант а веса г
Сопоставляя каждому базису р-ю степень компоненты а
в этом базисе, мы получим относительный инвариант
веса рг.
Все три утверждения доказываются одинаково. Дока-
жем для примера второе из них. Перемножая равенства
вида (8), написанные для а и для Ь, мы получаем соот-
ношение
a’b' = (det S)r*+r« ab,
связывающее произведения компонент а и & в двух любых
базисах е и е', т. е. нужный закон преобразования
Теперь мы можем убедиться, что существуют относи-
тельные инварианты любого веса г. Чтобы построить от-
носительный инвариант веса г, достаточно возвести в сте-
пень г какой-нибудь относительный инвариант веса 1.
3. Объем «-мерного параллелепипеда. Рассмотрим П
обычном трехмерном пространстве параллелепипед, натя-
нутый на векторы х{, х, и xs, исходящие из начала ко-
ординат. Его можно определить как множество всех тех
векторов, которые имеют вид а = l1x1-|-A,JxJ4-A,,xs, при-
чем 01, и Из формулы (10)
§ 3 гл. I видно, что объем параллелепипеда равен абсо-
лютной величине детерминанта
61 61
6? 6? ?!,
6? 6? 6?
составленного из компонент векторов хо х, и х, в орто-
нормированном базисе. Детерминант равен произведению
31 на ту компоненту порожденного этими векторами
3-вектора, которая имеет индексы 1,2 и 3.
311
Введем следующий определения.
Определение. В л-.мерном линейном пространстве
мы назовем р-мерным параллелепипедом') множество всех
векторов вида а= X,xt4-где хг...................хр—
фиксированные линейно независимые векторы и при каж-
дом о=1...., р выполнено неравенство I
Определение Пусть в л-мерпом евклидовом про-
странстве n-мерный параллелепипед Р построен на векто-
рах X], .... х„. Если ......—компоненты этих век-
торов в ортонормированном базисе, то ми назовем объе-
мом n-мсрного параллелепипеда число
(9)
т. е. произведение п! на модуль той компоненты n-век го-
ра, порожденного векторами х,....х0, которая имеет
индексы I, .... л.
В определении не уточняется, о хаком ортонормирован-
ием базисе идет речь Поэтому мы должны доказать,
что V{Р) не зависит от выбора ортонорчнрованного ба-
зиса Согласно формуле (6) при переходе от ортонор.ми-
рованного базиса е к базису е' =е$ мы имеем V' (Р) —
= |detS-lJV(P). Если базис е’ ортонормированный, то
матрица S-1 ортогональная и |detS"*l = l, что доказы-
вает наше утверждение
Мы видим, что У(Р)—ортогональный инвариант, т. е.
евклидов тензор валентности 0 (см. с. 279).
Сейчас мы получим выражение для объема л-мерного
параллелепипеда в произвольном базисе. Для этого заме-
тим, что по формуле (7) детерминант матрицы метриче-
ского тензора det Г есть относительный инвариант веса 2.
Кроме Того, всегда det Г > С (предложение 3 § 1 гл. VII).
Поэтому мы вправе рассмотреть величину del Г, которая,
очевидно, при изменении базиса умножается на |detS|.
Произведение л! p^detrfjV • • - j является абсолютным
инвариантом. Но в ортонормированием базисе det Г= 1,
и потому & ортонормированном базисе
V(P)=n’F'3etr|^,..-K,|- (Ю)
Левая часть равенства—инвариант, и, следовательно, ра-
венство (10) имеет место в любом базисе.
а) Употребляется также сливе тлараллелотоп».
3)2