Text
                    В.В.Федорчук
КУРС АНАЛИТИЧЕСКОЙ ГЕОМЕТРИИ ИЛИНЕЙНОЙ АЛГЕБРЫ
В. В. Федорчук
КУРС АНАЛИТИЧЕСКОЙ
ГЕОМЕТРИИ
И ЛИНЕЙНОЙ
АЛГЕБРЫ
Допущено Государственным комитетом СССР по народному образованию в качестве учебного пособия для студентов механико-математических специальностей университетов.
Издательство
Московского университета 1990
ПЬК 22.15 Ф 33
УДК 514.74 +512.64
Рецензенты: кафедра геометрии МГПИ им. Лепина, профессор М. М. Чобан
Федорчук В. В.
Ф 33 Курс аналитической геометрии и линейной алгебры: Учеб, пособие. — М.: Изд-во МГУ, 1990. — 328 с.
ISBN 5—211—00941—X.
В основе учебного пособия лежит курс лекций, читаемый автором на механико-математическом факультете МГУ. Книга содержит в основном традиционный материал по программе курсов «Аналитическая геометрия» и «Линейная алгебра и геометрия». В отличие от известного учебника академика П. С. Александрова в настоящем пособии векторная алгебра строится на основе современного школьного курса геометрии с четким выделением используемых аксиом Эвклида, подробно исследуются плоские сечения поверхностей 2-го порядка, приведение матрицы оператора к жордановой форме основано па геометрическом подходе, даны элементы тензорной алгебры.
Для студентов вузов по специальностям «математика», «механика».
1602050000(4309000000)—136
ф -------------------------
077(02)—90
/ ISBN 5—211—0094l^X
79—90
ББК 22.15
.© Федорчук В. В., 1990 г.
ОГЛАВЛЕН ИЕ
Предисловие.....................<......................................... 6
ЧАСТЬ I. АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ
Глава I. Векторы.........................................................  7
§ 1.	Предварительные теоретико-множественные понятия	и	факты	7
§ 2.	Отрезок и полупрямая ............................................ 8
§ 3.	Полуплоскость и полупространство.............................12
§ 4.	Определение вектора.........................................14
§ 5.	Сложение векторов и умножение вектора на число ....	19
§ 6.	Векторы на прямой...........................................22
§ 7.	Линейная зависимость .	 24
§ 8.	Геометрический смысл линейной зависимости....................27
§ 9.	Базисы и координаты..........................................29
§ 10.	Проекции и координаты.......................................30
§ 11.	,	Определение скалярного произведения векторов	и	его	свойства	36
§ 12.	Скалярное произведение в координатах........................38
§ 13.	Системы координат...........................................40
Глава II. Уравнения прямой линии и плоскости..............................47
§ 14.	Уравнения прямой линии на плоскости.............................47
§ 15.	Взаимное расположение прямых на плоскости. Полуплоскости 50
§ 16.	Прямая линия на плоскости с прямоугольной системой координат ..................................................... ...	53
• § 17. Уравнения плоскости................................' .	55
§ 18.	Взаимное расположение плоскостей. Полупространства ...	58
§ 19.	Прямая в пространстве *.........................................60
§ 20.	Плоскость в пространстве с прямоугольной системой координат 61
Глава III. Преобразования координат. Ориентация. Векторное и смешанное произведения.............................».....................64
§ 21.	Матрицы и операции над ними ....	.	.	.64
§ 22.	Переход от одного базиса к другому..................... Ы
§ 23.	Переход от одной аффинной системы координат	к другой	.	.	69
§ 24.	Ориентации прямой, плоскости, пространства	.	...	71
§ 25.	Ориентированный объем параллелепипеда :................72
§ 26.	Векторное и смешанное произведения.....................75
§ 27.	Некоторые приложения векторного и смешанного произведений к прямым и плоскостям в пространстве..............................77
Глава	IV. Линии второго порядкд........................................81
§ 28.	Алгебраические линии на плоскости. Квадратичные функции и их матрицы........................................................81
§	29.	Ортогональные матрицы......................................... 84
§	30.	Преобразования прямоугольных	координат.........................86
§ 31.	Ортогональные инварианты квадратичных функций ....	88
§ 32.	Преобразование уравнения линии второго порядка при повороте осей координат...............................................89
§ 33.	Приведение уравнения линии второго порядка к каноническому виду..............................................................92
§ 34.	Определение канонического уравнения линии второго порядка по инвариантам....................................................93
3
3fi Дирскторипльпоо свойство эллипса, гиперболы и параболы .	97
$ 3(1. Фокальное свойство эллипса и гиперболы....................101
3/. Кривые второго порядка в полярных координатах .... ЮЗ
ЗМ. I пресечение линии второго порядка с прямой...............106
§ 39.	Теоремы единственности для линий второго порядка .	.	111
§ 40.	Центры линий второго порядка..............................113
§41.	Асимптоты и сопряженные диаметры линий второго порядка .	117
§ 42.	Главные направления и главные диаметры линий второго порядка. Оси симметрии............................................122
§ 43.	Расположение линий второго	порядка........................126
Глава V. Аффинные преобразования.............................. .	.	132
§ 44.	Преобразования.............................................132
§ 45.	Определение и свойства аффинных преобразований .	.	.	132
§ 46.	Аффинная классификация линий второго порядка .	137
§ 47.	Определение и свойства изометрических преобразований	.	.	140
§ 48.	Классификация движений плоскости..........................142
Глава VI. Поверхности второго порядка...............................146
§ 49.	Основная теорема о	поверхностях	второго	порядка	.	.	.	.	146
§ 50.	Эллипсоиды.............................................146
§ 51.	Гиперболоиды...........................................151
§ 52.	Конические сечения	..................................155
§ 53.	Параболоиды............................................159
§ 54.	Цилиндры...............................................161
§ 55.	Аффинная классификация	поверхностей	второго	порядка	.	.	164
Глава VII. Проективная плоскость....................................167
§ 56.	Пополненная	плоскость и связка............................167
§ 57.	Однородные координаты на проективной плоскости. Теорема Дезарга.........................................................169
§ 58.	Проективные	системы координат.............................175
§ 59.	Проективные	преобразования................................179
§ 60.	Линии второго порядка в однородных координатах .	.	182
§ 61.	Проективная и проективно-аффинная классификации линий второго порядка.................................................183
ЧАСТЬ II. ЛИНЕЙНАЯ АЛГЕБРА И ГЕОМЕТРИЯ
Глава I. Линейные пространства.............................................................................186
§ 1.	Определение линейного пространства...............................................................186
§ 2.	Линейная зависимость. Базисы. Размерность........................................................190
§ 3.	Подпространства линейного пространства. Операции над ними 194
§ 4.	Прямая сумма подпространств......................................................................198
§ 5.	Линейные отображения и изоморфизмы...............................................................201
Глава II. Сопряженные пространства.........................................................................204
§ 6.	Определение и простейшие свойства сопряженных пространств 204
§ 7.	Второе сопряженное пространство..................................................................205
§ 8.	Аннуляторы и нулевые подпространства. Системы однородных линейных уравнений............................«....................207
Глава III. Линейные операторы в линейном пространстве	211
§	9.	Матрица линейного оператора	.	  211
§	10.	Алгебра линейных операторов и алгебра матриц .	.	214
§	11.	Инвариантные подпространства.	Приводимые операторы . .	217
§	12.	Собственные векторы. Спектр	оператора. Диагонализируемые
операторы..................................................................................219
§ 13.	Характеристический многочлен оператора. Алгебраическая и геометрическая кратности его	корней.221
§	14.	Нильпотентные операторы. Их	характеристические многочлены	224
§ 15.	Разложение вырожденного оператора в прямую сумму нильпотентного и невырожденного..........................................227
§ 16.	Единственность жордановой формы нильпотентного оператора 228
§ 17.	Существование жорданова базиса для нильпотентного оператора 231
§ 18.	Жорданова форма произвольного оператора..........................................................234
§ 19.	Теорема Гамильтона—Кэли..........................................................................235
4
Глава IV. Билинейные и квадратичные функции............................239
§ 20.	Билинейные функционалы и их матрицы..........................239
§ 21.	Ранг билинейного функционала. Левое и правое ядра .	.	242
§ 22.	Квадратичнце функции и полярные к ним билинейные функционалы ............................................ .	.	.	. .	244
§ 23.	Приведение квадратичной формы к каноническому виду методом Лагранжа.......................................................246
§ 24.	Нормальный вид квадратичной формы. Закон инерции .	.	.	250
§ 25.	Теорема Якоби о приведении квадратичной формы к каноническому виду.......................................................252
§ 26.	Положительно определенные квадратичные функции. Критерий Сильвестра. Определитель Грама. Неравенство Коши—Буняков-ского..............................................................255
Глава V. Эвклидовы	пространства..................................259
§ 27.	Эвклидовы и	нормированные	пространства...................259
§ 28.	Длины и углы. Ортогональные системы векторов. Процесс ортогонализации ....................,................................262
§ 29.	Ортогональное дополнение. Общий вид линейного функционала в эвклидовом пространстве...............................266
§ 30.	Линейные отображения эвклидовых пространств.	Изоморфизмы.
Сопряженные операторы..............................269
§ 31.	Самосопряженные операторы.........................271
§ 32.	Изометрические операторы. Инвариантные	подпространства.
Корни характеристического многочлена .........................273
§ 33.	Канонический вид изометрического оператора........275
§ 34.	Неотрицательные операторы............................. ...	277
§ 35.	Разложение произвольного оператора в композицию неотрицательного и изометрического.........................................279
§ 36.	Квадратичные функции в эвклидовых пространствах	280
Глава VI. Точечные пространства........................................283
§ 37.	Аффинные	и точечно-эвклидовы пространства............283
§ 38.	Плоскости в аффинных пространствах. Различные способы их задания......................................................286
§ 39.	Пересечение плоскостей.	Их взаимное расположение	.	288
§ 40.	Выпуклые	множества в	аффинных пространствах	....	292
§ 41.	Точки общего положения. Симплексы. Барицентрические координаты ............................................................296
§ 42.	Аффинные отображения аффинных пространств. Разложение аффинного отображения точечно-эвклидова пространства в композицию изометрического и неотрицательного самосопряженного 298
§ 43.	Классификация движений пространства..........................302
§ 44.	Поверхности второго порядка в трехмерном пространстве .	.	305
Глава VII. Элементы тензорной алгебры..................................309
§ 45.	Тензоры. Запись в координатах................................309
§ 46.	Операции над тензорами. Базис в пространстве тензоров .	312
§ 47.	Симметрические и кососимметрические тензоры. Альтернирование .............................................................313
§ 48.	Внешнее умножение. Базис в пространстве кососимметрических тензоров...........................................................317
Предметный указатель	• • 322
ПРЕДИСЛОВИЕ
Книга представляет собой учебное пособие по объединенному курсу аналитической геометрии и линейной алгебры для университетов. В основе ее лежит курс лекций, неоднократно прочитанный автором на механико-математическом факультете* МГУ. Книга состоит из двух частей: «Аналитическая геометрия» и «Линейная алгебра и геометрия», соответствующих курсам лекций 1-го и 2-го семестров. Каждая из частей состоит из семи глав.
Пособие содержит в основном традиционный, но специально подобранный материал, соответствующий программам курсов «Аналитическая геометрия» и «Линейная алгебра и геометрия». Книга содержит ровно столько материала, сколько его можно с разумной скоростью прочитать на лекциях с 1 сентября по 20 декабря и с 7 февраля по 20 мая за вычетом праздничных дней. Поэтому, в частности, менее подробно изложена общая теория поверхностей 2-го порядка, нет унитарных пространств и л-мер-ного проективного пространства.
Одна из отличительных особенностей книги — стремление автора построить векторную алгебру на основе аксиом планиметрии. С этой целью в § 2 ч. I явно выделены применяемые ниже аксиомы порядка и откладывания, определены отрезок, полупрямая, полуплоскость и полупространство и выведены некоторые их свойства. Автор надеется, что тем самым построен необходимый мост между школьным курсом геометрии и курсом аналитиче* ской геометрии. Кроме того, устранены некоторые недоговоренности школьного курса геометрии, вполне объяснимый тем, что они касаются аксиоматического материала, излагаемого в 6-м классе.
Нумерация утверждений — сквозная в пределах каждой части, формул — в пределах каждой главы. Из-за экономии места автор зачастую вынужден ,обращаться к формальным ссылкам типа: «Отсюда согласно (АГ, I, предложение 7.7) и получаем...», где АГ означает «Аналитическую геометрию», т. е. первую часть книги. Ссылки в пределах одной части, как правило, ограничиваются номером утверждения или номером параграфа.
Для хорошего усвоения курса необходимо восстановить все недостающие доказательства (их немного), решить задачи и разобрать примеры.
Автор надеется, что небольшой размер книги привлечет к ней читателя, хотя и не обещает читателю легкой прогулки, полностью лишенной крутых подъемов й опасных спусков.
ЧАСТЬ I
Аналитическая геометрия
Глава I
ВЕКТОРЫ
§ 1. ПРЕДВАРИТЕЛЬНЫЕ ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ понятия И ФАКТЫ
Предполагаются известными из школы понятия множества, отображения из одного множества в другое и элементарных теоретико-множественных операций: объединения (J, пересечения П, разности \, произведения одного множества на другое.
Отображение f:X-+Y называется инъективным, или взаимно однозначным, если для любых различных элементов хь х2^Х их образы /(xi), f(x2) также различны.
Отображение f:X-+Y называется сюръективным, или отображением на, если для каждого элемента y^Y существует такой элемент х^Х, что f(x)=y.	,	1
Если выполнены оба эти условия, то отображение f называется взаимно однозначным отображением на, или взаимно однозначным соответствием, или биекцией.
Бинарное отношение Si на множестве X — это подмножество St множества ХхХ всех упорядоченных пар (хь х2) элементов из X. Если (хь х2)е5?, то говорят, что Xi и х2 находятся в отношении St, и пишут Х15?Х2.
Отношение эквивалентности на множестве X — это бинарное отношение St, удовлетворяющее аксиомам:
1)	рефлексивности: х5?х для любого элемента х«=Х;
2)	симметричности: если xi^?x2, то x2Slx\\
3)	транзитивности: если xi$?x2 и х25?х3, то Х15?х3.
Отношение эквивалентности обычно обозначается символом ~, хотя на любом множестве X, содержащем более одного элемента, существует не одно отношение эквивалентности.
Пусть----отношение эквивалентности на множестве X. Для
хеХ обозначим через Сх непустое множество {х'еХ:х'~х} и назовем егб классом эквивалентности элемента х. Читатель легко проверит, что имеют место
1.1.	Предложение. Если xi, х2^Сх, то xi~x2.
1.2.	Предложение. Если Сх{\Су^0, то СХ=СУ.
Таким образом, множество X разбивается на непустые классы эквивалентности, которые либо попарно не пересекаются, либо совпадают. Множество классов эквивалентности называется
7
фактор-множеством множества X по отношению эквивалентности — и обозначается Х/~. Согласно предложению 1.2 каждый элемент множества X принадлежит ровно одному классу эквивалентности. Поэтому, сопоставляя элементу х его класс эквивалентности Сх, получаем отображение множества X на множество Х/~.
Пусть на множестве X дано бинарное отношение 5?. Тогда оно .индуцирует бинарное отношение на произвольном подмножестве Ус=Х:
x9lYy^>x9ly и У^У-
1.3.	Предложение. Пусть YczX и на множестве X дано отношение эквивалентности 91. Тогда 9ty также является отношением эквивалентности, а классы эквивалентности С& и C^Y отношений 91 и 91у связаны друг с другом следующим образом:
Доказательство предоставляется читателю.
§ 2.	ОТРЕЗОК И ПОЛУПРЯМАЯ
Отрезок. Для дальнейшего нам понадобятся некоторые аксиомы эвклидовой геометрии. Имеются различные версии аксиом Эвклида. Сформулируем аксиомы порядка в терминах расстояния.
Аксиомы расстояния. Для любых двух точек Af и А эвклидова пространства Е определено неотрицательное число p(Af, N)—расстояние между этими точками. Функция расстояния р удовлетворяет следующим аксиомам.
Hi. Аксиома тождества. р(А1, А)=0 тогда и только тогда, когда M=N.
П2. Аксиома симметрии. p(Af, N) = р(А, AI).
Из. Неравенство треугольника. p(Af, N)+p(N, О)> >p(Af, О).
Определение 1. Говорим, что точка О лежит между точками М и N, и пишем (MON), если	и
р(М, О)+р(О, N)=p(M, №).
Определение 2. Интервалом (MN), соединяющим точки М и N, называем множество всех точек О, лежащих между М и N, т. е.
(MN)={0: (MOW)}.
Добавляя к интервалу (MN) точки М и N, получаем отрезок MN\ соединяющий точки М и N. По-другому это мржно записать так:
MA = {O:p(Af, О)+р(О, N)=p(M, N)}.
8
При этом точки интервала (AfjV1) называются внутренними точками отрезка MN, а точки М и N — его концевыми точками. Расстояние между точками М и N называется также длиной отрезка MN и обозначается через |M/V|. Поэтому определение отрезка можно записать следующим образом:
MN={0: |MO| + |CW| = |MV|}.
Если точки М и № совпадают, то отрезок MN имеет нулевую длину и состоит из одной точки.
Аксиомы порядка и откладывания.
Шь Для любых трех различных точек на прямой ровно одна лежит между двумя другими.
Ш2. Если точка О лежит между точками М и N, то точки М, N, О лежат на‘одной прямой.
Шз. Для любой точки О, лежащей на прямой I, и для любого числа d>0 существуют ровно две такие точки Afb М2е/, что р(Мь О)=р(О, M2)=d.
В силу того что будет доказано в 2.1 и 2.5, аксиому Шз можно сформулировать следующим образом:
От любой точки Ое/ на прямой I можно отложить ровно два отрезка заданной длины d.
Ш4 (аксиома Паша). Пусть в плоскости даны три точки М, N, О и прямая /, не содержащая ни одну из этих точек. Тогда если I пересекает интервал (ММ), то она пересекает ровно один из двух других интервалов (ТИО) и (NO).
2.1.	Предложение. В условиях аксиомы Шз имеем (М]ОМ2).
Доказательство. Согласно Illi одна из точек’ М, О, М2 лежит между двумя другими. Предположим, что (0М1М2). Тогда
р(О,М1)+р(МьМ2)=р(О,М2).
Но р(О, М])=р(О, М2). Следовательно, р(Мь М2)=О, т. е. Mi— =М2. Противоречие. Аналогично отбрасывается случай (OM2Mi).
2.2.	Предложение. Если O^MN, то MOczMN.
Доказательство. Надо показать, что всякая точка Ре еМО принадлежит MN. Для этого в силу неравенства треугольника достаточно проверить, что
р(М, Р)+р(Р, N)^p(M, N).	(1)
Согласно (MON) и (МРО) имеем
р(М, N)=p(M, О)+р(О, N)=p(M, Р)+р(Р, О)+р(О, N)>
>р(М, Р)+р(Р, N).
2.3.	Предложение. Если точки М, N, О лежат на одной прямой, то MOc.MN()NO.
Доказательство. Считаем, что точки М, N, О попарно различны, поскольку в противном случае утверждение очевидно.
9
Возьмем точку Ре (ЛЮ), отличную от точки N. Существует прямим /, пересекающая прямую, на которой лежат точки М, N, О, ровно в одной точке Р. Тогда согласно аксиоме Паша точка Р принадлежит одному из интервалов (MN) или (NO).
Из предложений 2.2 и 2.3 вытекает
2.4.	Следствие. Если N'^MO, то MN\JNO—MO.
2.5.	Предложение. Если N^MO, то N является единственной общей точкой отрезков MN и NO.
Доказательство. Предположим, что существует точка P^MNftNO, отличная от точки N. Тогда
р(М, Р)<р(М, N) и р(Р, 0)<p(N, О).
Поэтому р(М, О)=р(М, Р)+'р(Р, 0)<р(М, N) + (N, О)=р(М, О). Противоречие. Предложение 2.5 доказано.
2.6.	Предложение. Если (MNO) и (NPO), то (MNP).
Доказательство. По условию имеем
р(М, N)+p(N, О)=р(М, О),	(2)
p(N, Р)+р(Р, O)=p(N, О).	(3)
Кроме того, NOc^MO согласно 2.2. Следовательно, Р^МО, т. е.
р(М, Р)+р(Р, О)=р(М, О).	'	(4)
Из (2) и (3) вытекает
р(М, N)+p(N, Р)+р(Р, О)=р(М, О).	(5)
Сравнивая (4) и (5), получаем р (М, Р)=р(Му N)+p(N, Р). Предложение 2.6 доказано.
2.7.	Предложение. Если, (MNO) и (NOP), то (MNP).
Доказательство. Предположим, что точка N не лежит на отрезке МР. Тогда согласно Illi возможны два случая: Afe ^NP или P^MN. Рассмотрим первый из них. Поскольку Ое ^NP, то согласно 2.4 имеем Afe^OjOP. Но MNftNO—{N) в силу 2.5. Поэтому М^ОР. Из условия предложения 2.7 и аксиомы Illi вытекает, что М¥*Р. Поэтому имеем (ОМР). Но (NOP) и (ОМР) согласно 2.6 влечет (NOM), что противоречит условию (MNO) предложения 2.7. Аналогично разбирается случай Ре eAfM Предложение 2.7 доказано.
2.8.	Предложение. Для любого неотрицательного числа d^p(O, М) существует ровно одна такая точка N^OM, что р(О, N)=d.
Доказательство. Сначала проверим единственность. Предположим, что существует отличная от точки N точка Ре eOAf, находящаяся на расстоянии d от точки О. Тогда
р(Р, М)=р(О, M)—d=p(N, М).	(6)
Но согласно 2.4 точка Р лежит на одном из отрезков ON или
10
NM, т. e. p(0, P)<p(O, M) либо p(P, M)<p(Af, M). Противоречие.
Существование. Предполагаем, что М^О. Тогда согласно Шз на прямой /, проходящей через точки О и М, существует такая отличная от точки М точка Мь что
р(Мь О)=р(О, М).
Покажем сначала, что если Уе/ и p(N, О)^р(О, М), то Ne. еМ]М. Предположим, что это не так. Тогда согласно Illi лиоо (ЛМ^М), либо (MjMW).
Рассмотрим первый случай. Согласно 2.1 имеем (АЦОМ). Поэтому из 2.6 вытекает (NM10), откуда
р(УУ, 0)>р(Мь О).
Противоречие. Аналогично разбирается случай (M}MN).
Возьмем теперь существующие согласно Шз две точки N^l, такие, что
pGV,, О)=р(О, JV2)=d.
Согласно только что доказанному	Но отрезок MtM
является в силу 2.4 суммой отрезков MtO и ОМ. Если ни одна из точек N\, N2 не лежит на ОМ, то обе они принадлежат отрезку М]О, что противоречит уже проверенной единственности. Предложение 2.8 доказано.
Полупрямая. Возьмем произвольно точку О на прямой I. Введем отнощение эквивалентности на множестве /\{О}. Скажем,, что точки М, N^l\{0} лежат по одну сторону от точки О, если O^MN'. Так определенное бинарное отношение на /\{О} есть, отношение эквивалентности. В самом деле, рефлексивность и симметричность этого отношения очевидны, транзитивность вытекает из 2.3.
2.9.	Предложение. Отношение «точки лежат по одну сторону от точки О» разбивает множество /\{О} на два класса эквивалентности.
Доказательство. Пусть d — какое-нибудь положительное число. Возьмем существующие согласно Шз такие точки Mi,. М2^1, что
р(Мь O)=d=p(O, М2).
Тогда согласно 2.1 точки М3 и М2 лежат в разных классах эквивалентности. Покажем теперь, что всякая точка Afe/\{0) эквивалентна либо точке М1( либо точке М2. Пусть точка N не эквивалентна ни ни М2, т. е.
MiN=>Oi=NM2.
Но из аксиомы Паша вытекает, что если различные точки Mi, М2, N лежат на одной прямой, то никакая точка О не может принад
11
лежать трем интервалам (Aflt М2\ (M^N) и (NM2) сразу. Противоречие. Предложение 2.9 доказано.
Эти классы эквивалентности называем полупрямыми, на которые точка О разбивает прямую /, или полупрямыми с началом в точке О. Полупрямая с началом в точке О однозначно определяется любой своей точкой. Полупрямую с началом в точке О, проходящую через точку М, обозначаем (ОМ->). Добавив к полупрямой начальную точку О, получим луч ОЛТ-»-.
2.10.	Предложение. Любые два луча прямой I с началами 01 и О2
1)	либо не пересекаются,
2)	либо пересекаются по отрезку OiO2,
3)	либо один из них содержится в другом.
Доказательство. Предположим, что лучи пересекаются, и пусть М— их общая точка. Рассмотрим общий случай, когда точки 01, 02, М попарно различны. Предположим сначала, что точка М не лежит на отрезке OiO2, и пусть, например, (MOtO2). Тогда для любой точки N луча 01Л4->, если NeMOif то 1УеЛ102 согласно 2.2. Если же N^MOb то (TVAfOi), что вместе с (MOiO2) согласно 2.7 дает (МИ02) и, значит, #еО2Л1->-. Итак, если ^ОхО2, то луч 01ЛГ-»- целиком содержится в луче 02Л1->- или наоборот.
Пусть теперь (О]Л1О2) и N — произвольная точка отрезка ОГО2. Тогда интервал (MN) согласно 2.4 и 2.2 является частью интервала (OiO2) и поэтому не содержит ни точки 01, ни точки О2. Следовательно, точка N лежит по ту же сторону от точек 01 и О2, что и точка М. Значит, OiO2<^O}M^-[}O2M-^. С другой стороны, если Л^1^О1О2 и, например, (NOiO2), то из (ОЛМО2) и 2.6 вытекает (NOtM), т. е. N<^0iM->. Предложение 2.10 доказано.
Из него вытекает, что полупрямые на прямой располагаются аналогичным образом, только в случае 2) они пересекаются по интервалу.
2.11.	Предл ожение. Пусть даны прямая I, точка 0^1 и число d>0. Тогда в каждой из полупрямых, на которые точка О разбивает прямую I, существует ровно одна точка, находящаяся на расстоянии d от точки О.
Доказательство. Согласно аксиоме Ш3 на прямой I существуют ровно две точки Afi и М2, находящиеся на расстоянии d от точки О. В то же время согласно 2.1 точка О лежит между Mt и М2, т. е. точки и М2 лежат в разных полупрямых с началом в точке О.
§ 3.	ПОЛУПЛОСКОСТЬ И ПОЛУПРОСТРАНСТВО
Пусть даны плоскость л и лежащая на ней прямая /. Одна из аксиом планиметрии утверждает, что множество л\/ непусто. Введем на этом множестве отношение эквивалентности. Скажем, что точки М, N^at\l лежат по одну сторону от прямой I (пишем MStN), если MN[\l=0.
12
3.1.	Предложение. S/ есть отношение эквивалентности на
Доказательство. Надо проверить только аксиому транзитивности. Пусть MSiN и NSiO. Если точки М, N, О лежат на одной прямой, то MOczMN[)N'O согласно 2.3 и, значит, Л4ОГ)/ = 0, т. е. MSiO.
Пусть теперь точки М, N, О не лежат на одной прямой. Предположим, что МО[]1=^=0. Но тогда прямая Z, пересекая одну из сторон МО треугольника M1VO, должна согласно аксиоме Паша пересекать еще одну из его сторон. Противоречие. Предложение 3.1 доказано.
3.2.	Предложение. Существуют ровно два класса эквивалентности отношения Si.
Доказательство. Возьмем произвольно точки M&t\l и OeZ. Проведем через точки М и О прямую пг. На прямой пг согласно 2.9 существует точка N, не принадлежащая лучу О7И->. Точка О при этом является внутренней точкой отрезка MN\ а точки М и N неэквивалентны. Покажем теперь, что любая третья точка Pen\Z эквивалентна либо точке Л4, либо точке AZ. Предположим, что точки Р и М неэквивалентны, т. е. 1(](МР)^=0. Тогда прямая Z, пересекая интервалы (М№) и (МР), согласно аксиоме Паша не пересекает интервал (NP), т. е. PSiN. Предложение 3.2 доказано.
Классы эквивалентности отношения Si назовем полуплоскостями, на которые прямая I разбивает плоскость л. Обозначим эти полуплоскости символами л~, л+ или лг, лЛ
Непосредственно из определения полупрямых и полуплоскостей вытекает
3.3.	Предложение. Пусть прямая /с=л разбивает плоскость л на полуплоскости л~ и л+. Пусть, кроме того, в плоскости л дана другая прямая пг, пересекающая прямую I в точке О. Тогда множества /и«Пл“ и тГ|л+ являются полупрямыми, на которые точка О разбивает прямую пг (кратко: прямая пересекается с полуплоскостью по полупрямой).
Пусть теперь в пространстве Е дана плоскость л. Одна из аксиом стереометрии утверждает, что множество Е\л непусто. Скажем, что точки 7И, А/"еЕ\л лежат по одну сторону от плоскости л (пишем MSnN), если А1#Г|л=0.
3.4.	Предложение. Sn есть отношение эквивалентности на Е\л.
Доказательство. Надо проверить только аксиому транзитивности. Пусть MSnN и NSnO. Существует плоскость ль проходящая через точки М, N, О. Если плоскости л и Л1 параллельны, т. е. лГ|Л1=0, то я,(]МО = 0, поскольку Л1Ос=Л1 согласно ПЬ. Значит, MSnO.
Пусть теперь плоскости л и Л1 пересекаются по прямой Z, которая разбивает плоскость Л1 на полуплоскости лг и Л1+. Точки М и N лежат в одной из этих-полуплоскостей, поскольку в про
13
тивном случае отрезок MN, пересекаясь с прямой I, тем более пересекался бы с плоскостью л=>/. Аналогично точки N и О лежат в одной полуплоскости. Тогда все три точки М, N, О лежат в одной полуплоскости и, значит, МО(]Ь=0. Следовательно, МО(~|л = (поскольку М0сЛ1) = (ЛЮПл1)Пл =МОП(л1Лл)=МОГ|/=0. Итак, МО(]п=0, т. е. MSnO. Предложение 3.4 доказано.
3.5.	Предложение. Существует ровно два класса эквивалентности отношения S„.
Доказательство аналогично доказательству предложения 3.2 и предоставляется читателю.
Классы эквивалентности отношения называем полупространствами, на которые плоскость л разбивает пространство, или полупространствами, ограниченными плоскостью л.
Два следующих утверждения непосредственно вытекают из определений полупространства, полуплоскости, полупрямой.
3.6.	Предложение. Пусть лi и Л2 — плоскости, пересекающиеся по прямой I, и пусть Е~, Е+—полупространства, ограниченные полуплоскостью ль Тогда £+Г|л2 — полуплоскости, ограниченные прямой I.
3.7.	Предложение. Пусть плоскость л разбивает пространство на полупространства Е~, Е+, и пусть прямая I пересекается с плоскостью л в точке О. Тогда Е~(]1, Е+(]1 — полупрямые, на которые точка О разбивает прямую I.
§ 4.	ОПРЕДЕЛЕНИЕ ВЕКТОРА ............>
Вектором ММ с началом в точке Мп концом в точке N называют направленный отрезок MN, в котором точка М объявлена началом, а точка N — концом. Можно вектором назвать и упорядоченную пару точек (М, N). 1 ">
Длина |Л1Л7| отрезка ММ называется также длиной |ММ|
вектора MN. Векторы нулевой длины называются нулевыми. •  > “>
Ненулевые векторы M.iN\ и M2N2 называются одинаково направленными, если лучи ММ-* и M2N2->- одинаково направлены, а это в свою очередь означает, что либо
1) отрезки MiNi и M2N2 лежат на одной прямой и лучи MiMi-> и М2М2->- пересекаются по лучу (рис. 1), либо
-----"  >  - 	ь,.... ,  ----  > Л, м2-----------------------------. n2 ,
Рис. 1
2) отрезки М]М1 и M2N2 лежат на параллельных прямых /1 и 12, и лучи AfiM]-»- и М2М2^- лежат по одну сторону от прямой М|М2 в плоскости, проходящей через прямые 1\ и 12 (рис. 2).
14
4.1.	Замечание. Из 3.3 вытекает, что лучи	и М^т^~
лежат по одну сторону от прямой М{М2 тогда и только тогда, когда для какой-нибудь пары точек Ni'^MiNi-*- и	от-
резок Ni'N2' 'Не пересекается с прямой МгМ2.
Векторы MiNi и M2N2 называются .равными, если выполнены два условия:
а)	|ад| = |]йХ|
и (в случае |AfiWi |#=0)
б)	MiNi и M2N2 одинаково направлены.
4.2.	Предложение. Для любого вектора ММ и любой точки
Mi существует единственная такая точка Nlt что MN—MiMi.
Доказательство. Рассмотрим случай, когда точка М} не лежит на прямой ММ (два других случая: 1) М} лежит на прямой MN, 2) вектор MN нулевой — предлагается рассмотреть читателю). Тогда точка М должна лежать на прямой I, проходящей через точку М} и параллельной прямой MN. Такая прямая I существует и по пятому постулату Эвклида единственна. Рассмотрим плоскость л, проходящую через точки М, N, Mi. Прямая AlAfi разбивает плоскость п на две полуплоскости л- и л+. Предположим, что точка N лежит в полуплоскости л+, Тогда точка Ni также должна лежать в л+. Следовательно, точка Ni должна принадлежать множеству /("|л+, т. е. согласно 3.3 полупрямой с началом в точке Mi. Но согласно 2.11 на этой полупрямой существует ровно одна точка jVb находящаяся на расстоянии d= |Af#| от точки Mi. Предложение 4.2 доказано.
4.3.	Предложение. Отношение одинаковой направленности является отношением эквивалентности на множестве всех лучей. ,
Доказательство. В проверке нуждается только аксиома транзитивности. Одинаковую направленность лучей обозначаем
15
символом ~. Пусть Mll\ll->-~M2l\l2->- и А12А2-> — А13А’з—Обозначим через Ц прямую, на которой лежит луч MiN^. Предположим сначала, что прямые /i, l2, 13 не лежат в одной плоскости. Через точки Afb М2, М3 проведем плоскость л. Она разбивает пространство на два полупространства Е~ и Е+. По определению одинаковой направленности лучей прямые /ь /2, /3 попарно параллельны. Обозначим через n[2 плоскость, проходящую через прямые /1 и /2. В силу одинаковой направленности лучей MiNi—*-и M2N2—>~ отрезок М1Л/2 не пересекается с прямой /12=лПл12. Значит, отрезок NiN*2 не пересекается с плоскостью л. В самом деле, Л^1Л^2Пл= (А^1А^2Пл12) Пл; =Л^1Л^2П (л12Пл) =МУ2П^=0- Таким образом, отрезок NtN2 лежит в одном из полупространств, например в Е+. Аналогично N2N3cE+, так как А,2е£+. Значит, NiN3czE+. Отсюда, обозначив через Л13 плоскость, содержащую прямые 1\ и /3, получаем А7\Мз<=£+Пл1з. Но множество £"+Пл1з согласно 3.6 является полуплоскостью л13+, ограниченной прямой li3, проходящей через точки Aft и Af3. Таким образом, отрезок N\N3 не пересекается с прямой Лэ, откуда согласно 4.1 получаем одинаковую направленность лучей А^А^-*- и А1зА/3^-.
Пусть теперь прямые /ь /2, 13 различны, но лежат в одной плоскости л. Возьмем точку М, не принадлежащую плоскости л. Согласно 4.2 существует такая точка Л/, что MN—r~M2N2-+. Тогда тройки лучей M1N1-+, M2N2-+, М№+ и MN^~, АГ2А2->, M3N3-+-удовлетворяют условиям уже рассмотренного случая. Значит, MiNt-+ ~ MN-+, MN-*- ~ M3N>3-+. Лучи	MN-+, M3N3-+
также не лежат в одной плоскости. Следовательно, Al^i-> ~ ~ Л13А3->.
Пусть теперь 12=13. Тогда один из лучей M2N2-+, .M3N3-+ содержит другой. Предположим, что Л12А2->=>Л4зАз->. Пусть точки Mi, М2 принадлежат прямой li2, которая разбивает плоскость л на две полуплоскости Л12_ и Л12+. Точки IVi и N2 лежат в одной из этих полуплоскостей, например в Л12+. Аналогичный смысл придадим символам /1з, Л1з_ и Л1з+. Предположим, что А[ел|з+. На отрезке Af2Af3 возьмем внутреннюю точку Af и проведем через нее прямую /, параллельную прямой 112. Поскольку полупрямые (А11У1^-) и (А12ЛГ2->) лежат в полуплоскости Л12+, прямая I пересекает полупрямую (М1М->) в некоторой точке N (рис. 3).
Прямая /, пересекая сторону Af2Af3 треугольника А11А12Л43, согласно аксиоме Паша должна пересекать и другую его сторону. Этой стороной в силу параллельности / и /]2 может быть только AfiAf3. Итак, прямая I пересекает отрезок Л41АГ3. Поскольку отрезок МХМ3 лежит между прямыми /1 и 13, то и пересекаться он может только той частью прямой /, которая лежит между прямыми /1 и 13, т. е. отрезком MN. Значит, отрезок MN пересекается с прямой /1з. Поэтому точки М и N лежат в разных полуплоскостях, ограниченных этой прямой. Но точка N принадлежит полупрямой (AfiAi->), а мы предполагали, что A/ie«i3+. Значит, Ne ел|з+ и Alanis-. Тогда из (М3ММ2) вытекает, что Л12вП1з_. Поэтому из (M2M3N3) получаем A3enI3+. Итак, точки N и N3 при-16
надлежит одной полуплоскости Следовательно,
Таким образом, мы показали, что, уменьшая одинаково направленные лучи, снова получаем одинаково направленные лучи. Отсюда, переходя к допол ни тельным лучам, получаем, что увеличение одинаково направленных лучей снова приводит к одинаково направленным лучам. Итак, случай /2=^з и аналогичный ему случай /]=/г полностью разобраны.
Рис. 3
Рис. 4
Пусть теперь Ц=1з. Предположим, что лучи	и Л43ЛГз->-
направлены в разные стороны. Возьмем точку М3'е/з так, что Мз лежит между N3 и N3'. Тогда лучи	и М^-*- одинаково
направлены. А это вместе с одинаковой направленностью лучей MiNi-*- и M2Nz-+- согласно только что разобранному случаю дает одинаковую направленность лучей	и M2N2-*-, что проти-
воречит одинаковой направленности лучей M2N2-+ и А43М3->-.
Наконец, случай, когда три луча лежат на одной прямой, можно свести к уже разобранным случаям двух прямых так же, как при рассмотрении случая трех различных прямых, лежащих в одной плоскости, мы выходили в пространство. Но еще проще, не выходя в плоскость, воспользоваться предложением 2.10. Предложение 4.3 доказано.
Из него непосредственно вытекает
4.4.	Предложение. Отношение равенства является отношением эквивалентности на множестве всех векторов.
Класс равных векторов называется свободным вектором, или просто вектором. В дальнейшем слово «свободный», как правило, опускаем и понимаем под вектором М$ как направленный отрезок MN, так и свободный вектор а, рЬредеЛецццЙквектором MNr т. е. класс эквивалентности, состояний	равных
И
MN. Поэтому наряду с точным утверждением ALVea применяем и неформальное равенство Л1М=а.
Векторы нулевой длины образуют класс эквивалентности, называемый нулевым вектором и обозначаемый 0. Имеем 0=ММ для любой точки М.
Выражения «отложить вектор а от точки М» или «приложить вектор а к точке М» означают «взять (существующий согласно
4.2) вектор MN=a>.
4.5. Замечание. Мы определили свободные векторы в пространстве. Можно дать такое же определение, оставаясь в пределах плоскости или даже прямой. При этом из предложения 4.4 непосредственно вытекают его модификации, кргда «множество всех векторов» заменяется на «множество всех векторов на плоскости» или на «множество всех векторов на прямой». И здесь нас не должно смущать то, что при проверке транзитивности одинаковой направленности лучей на плоскости мы выходили в пространство. Надо просто вспомнить предложение 1.3.
Вектор как параллельный перенос. Возьмем произвольный вектор а. Определим отображение
Д :Е-+Е,
сопоставляющее точке М конец вектора а, отложенного от точки М, т. е. fa (М) =N, где N — единственная согласно 4.2 точка, такая, что MN=a. Отображение fa назовем параллельным переносом на вектор а. Это отображение обладает следующим основным свойством:
MN= fa(M) fa(N) для любых точек М и N.
В самом деле, предположим, что точки М, N и fa (М) не лежат на одной прямой (рис. 4). Тогда в четырехугольнике MNfa (N)X Xfa(M) противоположные стороны Mfa (М) и Nfa (N) равны' и параллельны. Значит, этот четырехугольник — параллелограмм. Тогда с учетом того, что точки N и fa(AT) лежат по одну сторону от прямой Mfa(M), получаем необходимое равенство MN=fa(M)x X fa(N). Рассмотрение случая, когда точки М, N и fa(M) лежат на одной прямой, сводится к перебору различных случаев взаимного расположения этих точек и предоставляется читателю.
Пусть теперь, наоборот, дано отображение f: Е-^Е, обладающее свойством MN=f(M)f(N) для любых точек М и N. Тогда существует единственный такой вектор а, что f=fa. В самом деле, единственность такого вектора вытекает из того, что упорядоченная пара точек М, f(M) определяет единственный вектор а=
18
Тэперь существование. Фиксируем течки О и полагаем а=О/(О). Для выполнения равенства f=fa надо проверить ра-, —.—.>	- >
венство Mf(M)= Of (О) для произвольной точки М. Делается это, опираясь на равенство OM=f	так же, как выше мы
доказывали равенство MN=fa(M) fa(N), исходя из
=S).
Итак, вектор можно отождествлять с параллельным переносом на этот вектор.
§ 5. СЛОЖЕНИЕ ВЕКТОРОВ И УМНОЖЕНИЕ ВЕКТОРА НА ЧИСЛО
Сумму двух векторов а и Ь определяем следующим образом. Приложим вектор а к какой-нибудь точке М. Пусть N — конец этого вектора; т. е. a=MN. Затем приложим вектор Ь к точке N. Пусть b=NP. Теперь положим а+b равным свободному вектору, содержащему МР в качестве своего представителя (рис. 5), т. е.
MN + NP=MP.
Рис. 5
Проверим корректность этого определения, т. е. независимость результата от выбора точки М. Пусть М'N' е а и N’P' е Ь, по-- • * 1 —>	— >
кажем, что МР=М.'Р'. Рассмотрим параллельный перенос fЕ—>-Е на вектор с=ММ'. Тогда MN—f(M) f (N). Но следовательно,	Аналогично NP=f(N)f(P) и, сле-
довательно, f(P)=P'. Таким образом, M'P'=f(M)f(P)—MP, что и требовалось доказать.
Произведение вектора а на вещественное число а определяем — - >'
так. Берем вектор Af2V=a и полагаем аа равным свободному вектору, содержащему такой вектор МР, что:
19>
a)	MP лежит на прямой MN;
б)	МР направлен так же, как MN, если а>0, и в другую сторону, если а<0;
в)	|МР| = |а| • |M/V|.
Легко видеть, что этими условиями вектор МР определен однозначно. Корректность определения операции умножения вектора на число проверяется так же, как и для операции сложения векторов.
5.1.	Теорема. Операции сложения векторов и умножения вектора на число обладают следующими свойствами:
1°. a+b=b+a (коммутативность сложения);
2°. (а+Ь)+с=а+(Ь+с) (ассоциативность сложения);
3°. существует такой вектор 0 (называемый нулевым вектором), что а+0=а для любого а;
4°. для каждого вектора а существует такой вектор — а (называемый вектором, противоположным .вектору а), что а+ (—а) = =0;
5° (а+0)а=аа+|0а для любых чисел а, 0 и любого вектора а;
6°. а(0а) = (а0)а для любых чисел а, 0 и любого вектора а;
7°. a(a+b)=aa+ab для любого числа а и любых векторов а, Ь;
8°. 1 -а=а для любого вектора а.
Доказательство. Коммутативность и ассоциативность сложения проиллюстрирована на рис. 6 и 7.
Свойства 3° и 8° очевидны. Если л—MN, то в качестве вектора —а можно взять вектор NM. Тогда по определению сложения
а + (—а)=MN + NM=ММ=0.
Свойства 5° и 6° проверяются перебором различных вариантов знаков и абсолютных значений чисел а и 0. Наибольший интерес
20
представляет свойство 7°. Пусть a=MN, b—NP. Тогда a-f-b = =МР. Отложим на прямой MN вектор МЛ4=аа и проведем через точку прямую, параллельную прямой NP, до пересечения ее с прямой МР в точке Л (рис. 8). Треугольники MNP и MNiPi
Рис. 8
подобны, имея общий угол М и пару равных углов при вершинах N и Nj. Тогда стороны одного треугольника подобны сторонам другого треугольника. Значит,
а= I MNt I | МЛ I  I I |MN I I МР | INP| 
Отсюда получаем, что Л?1Р1=аЬ и MPt = а (а 4- Ь). Следовательно, a(a4-b)=MP1=MA^14-JV1P1=aa+ab. Теорема 5.1 доказана.
5.2.	Замечание. Строгое доказательство теоремы о подобных треугольниках опирается на теорему о пропорциональности отрезков на сторонах угла, рассеченного параллельными прямы-
/	-	о I MNt |	| МРг | \ D
ми (в наших обозначениях — рис. 8 ---—=-------- . В по-
'	F | MN |	| MP | )
следние годы в школьном курсе по геометрии эта теорема не доказывалась. Ее доказательство легко извлекается из имеющейся в школьном курсе теоремы Фалеса:
Если параллельные прямые, пересекающие стороны угла, отсекают на одной его стороне равные отрезки, то они отсекают равные отрезки и на другой его стороне.
5.3.	Замечание. Мы определили векторы и проверили свойства 1—8°, опираясь на модифицированную аксиоматику Эвклида. Можно было в^ять эти свойства за аксиомы пространства векторов и строить геометрию, отправляясь от этих аксиом.
5.4.	Определение. Пусть V — некоторое множество, элементы которого называем векторами, хотя их природа может быть произвольной, и пусть К — некоторое поле (читатель может пока считать, что К — это множество R всех вещественных чисел). Предположим, что для любых двух векторов a, beV определен третий вектор, обозначаемый символом а+Ь и называемый
21
суммой векторов а и b. Кроме того, предположим, что для любого числа оеК и любого вектора aeV определен вектор, обозначаемый символом аа и называемый произведением вектора а на число а. Если при этом выполнены свойства 1—8° (из теоремы 5.1), то множество V называется векторным (или линейным) пространством. Свойства 1—8° называются аксиомами векторного' (линейного) пространства.
Теорему 5.1 можно переформулировать так:
Множество свободных векторов в эвклидовом пространстве является векторным пространством над Полем вещественных чисел.
Другим (простейшим) примером векторного пространства является множество V, состоящее из одного элемента — нулевого* вектора 0. Ниже познакомимся еще с некоторыми примерами векторных пространств.
5.5.	Замечание. Мы определили векторы, операции сложения векторов и умножения вектора на число, рассматривая направленные отрезки в пространстве. Но мы уже отмечали выше (замечание 4.5), что можно ограничиться рассмотрением лишь векторов на плоскости или на прямой. Операции сложения векторов и умножения вектора на число не выводят за пределы данной плоскости (или дайной прямой). Ясно также, что при таком уменьшении множества рассматриваемых векторов эти операции продолжают обладать свойствами 1—8°.
Таким образом, множества свободных векторов, на прямой, на плоскости, в пространстве с операциями сложения векторов и умножения вектора на число образуют векторные пространства над полем вещественных чисел, которые обозначаем 'через Vect (1), Vect (2), Vect (3) соответственно.
§ 6. ВЕКТОРЫ НА ПРЯМбй
Из определения одинаковой направленности лучей, предложений 2.9 .и 2.10 вытекает, что на прямой имеется лишь два направления лучей. Поэтому на ней имеется лишь два направления векторов. Следовательно, все ненулевые векторы на прямой разбиваются на два класса эквивалентности, состоящие из одинаково направленных векторов. Объявив векторы из одного класса положительными (положительно направленными), задаем положительное направление на прямой (направление движения от точки М к точке N положительно, если вектор MN положительно направлен). В таком случае мы задали на прямой ориентацию.
Прямую I с выбранным на ней ненулевым вектором е назовем осью (I, е). На оси положительное направление определяется вектором е.
На оси (/, е) каждый вектор а может быть однозначно записан в виде а=ае. В самом деле, отложим вектор е от какой-нибудь точки 0^1. Пусть e=OOi. От той же точки О отложим и 22
вектор а, пусть а=ОЛ4. Если М=О, то а=0-е. Если же вектор а ненулевой, то либо он направлен так же, как и вектор е, либо в противоположную сторону. Тогда согласно определению произведения вектора на число в первом случае
сю.,
I 00. I
а во втором случае —
ом= —оо
IOO1I •
Число а, для которого а=ае назовем алгебраическим значением вектора а на векторе е, пишем а=(азеа). Итак,
а=(азеа)е.	(7)
6.1.	Предложение. Алгебраическое значение обладает следующими свойствами:
1)	(азеЛа)=Л(азеа);
2)	(азе(а + Ь))=(аЗеа) + (аЗеЬ).
Доказательство. Имеем (азс (Ла) )е= (согласно (7)) = =Ла= (согласно (7)) =Л( (аз еа)е) =согласно аксиоме 6° векторного пространства) = (Л(азе а))е, откуда получаем равенство 1). Аналогично (азе (а+Ь))е = а+Ь=(азеа)е+ (азе Ь)е — (согласно аксиоме 7° векторного пространства) = ((азе а) + (азеЬ))е, откуда получаем равенство 2).
Вторая часть предложения 6.1 может быть сформулирована следующим образом.
6.2.	Лемма Шаля. При любом расположении точек М, N, Р на прямой имеет место равенство
(аЗеМУ) + (азеУР)=(азеМР).
6.3.	Определение. Пусть даны два векторных пространства V, W над одним и тем же полем К. Отображение f: V->W называется линейным, если оно удовлетворяет следующим двум свойствам:
1)	f(a+b)=f (a)+f(b) для любых a, be V;
’2) f(aa)=af(a) для любых аеК, аеК
6.4.	Определение. Линейное отображение f: W между векторными, пространствами называется изоморфизмом этих пространств, если оно биективно.
Читатель может легко проверить, что в этом случае обратное отображение f-1: W-+V также линейно.
6.5.	Пример. Читатель легко убедится в том, что множество R всех вещественных чисел с имеющимися в нем операциями сложения и умножения является векторным пространством над самим собой.
23
6.6.	Теорема. Отображение f: Vect (1)~>R, сопоставляющее каждому вектору а на оси (I, е) его алгебраическое значение на векторе е, является изоморфизмом векторных пространств.
Линейность этого отображения вытекает из предложения 6.1, биективность легко выводится из определений вектора и его произведения на число, а также из аксиомы Шз.
Зафиксируем точку О на оси (/, е). Тогда отображение f: :Vect(l)->R определяет отображение fo: /->R следующим образом:
fo(M)=f(OM).
Из предложения 4.2 вытекает, что, сопоставляя каждой точке М
вектор ОМ, получаем взаимно однозначное соответствие между точками и векторами. Таким образом, отображение f0— биекция между точками геометрической прямой I и вещественными числами, т. е. точками числовой прямой. Отображение f0 переносит порядок, имеющийся в множестве чисел, на прямую /:
Легко видеть, что этот порядок обладает следующим свойством: если M<N и (MPN), то M<P<N.
Итак, выбирая на прямой ненулевой вектор е и задавая тем самым ее ориентацию, мы упорядочиваем множество ее точек. Заметим, наконец, что если вектор е имеет единичную длину, то отображение fo сохраняет расстояние между точками.
§ 7. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ
Ассоциативность сложения векторов позволяет говорить о сумме трех векторов
a-hb+c==(a+b) +с=а+ (Ь + с).
По индукции может быть определена сумма любого числа векторов
ai + a2+ ... +ап.
При этом в силу коммутативности можно произвольно менять порядок слагаемых.
Отметим еще несколько следствий из аксиом векторного пространства:
0-а=0 для любого вектора а;
а 0=0 для любого числа а;
—а=(—1) - а для любого вектора а.
Итак, с векторными равенствами можно поступать так же, как с числовыми: произвольно расставлять скобки; переставлять слагаемые; прибавлять к обеим частям равенства одинаковые векто
24
ры; переносить слагаемое, меняя его знак, из одной части равенства в другую и т. д.
Выражение
ctiai + a2a2+ ... + ctnan
называется линейной комбинацией векторов аь...,ап с коэффициентами ai,...,an. Линейная комбинация называется тривиальной, если все ее коэффициенты равны нулю. В противном случае линейная комбинация называется нетривиальной.
Если вектор а равен линейной комбинации векторов аь...,ап, то говорят, что вектор а линейно выражается через векторы аь... ...,ап. Проиллюстрируем это определение двумя примерами.
1)	Нулевой вектор 0 линейно выражается через любую непустую систему векторов аь...,ап:
0=0.а1+-.-+0-ап.
2)	В начале § 6 было показано, что на прямой всякий вектор линейно выражается через любой ненулевой вектор.
7.1.	Определение. Система векторов аь...,ап называется линейно зависимой, если существует нетривиальная линейная комбинация этих векторов, равная нулевому вектору. В противном случае векторы аь...,ап называются линейно независимыми.
Из определения вытекает, что пустое множество векторов линейно независимо.
7.2.	Предложение. Система векторов, состоящая из одного элемента а, линейно зависима тогда и только тогда, когда а=0.
Доказательство. Из равенства 1-0=0 вытекает линейная зависимость системы, состоящей из нулевого вектора. Предположим теперь, что аа=0. Если а=^0, то 1 = — -а и, значит, а=1 -а= a
= |—а)-а=—(аа)=—0=0. Предложение доказано.
\ a / a	a
7.3.	Предложение. Всякая подсистема линейно независимой системы векторов линейно независима.
Доказательство. Предположим, что подсистема аь... ...,aft системы аь...,ап линейно зависима. Возьмем нетривиальную линейную комбинацию
aiai + • • • 4"afea/t=0-
Прибавим к обеим частям этого равенства нулевой вектор
0 а/г-н 4" - - • +0 ап=0.
Получим нетривиальную линейную комбинацию векторов аь... ...,ап, равную нулевому вектору. Значит, система аь...,ап, линейно зависима. Предложение 7.3 доказано.
25
Из предложений 7.2 и 7.3 вытекает
7.4.	Предложение. Всякая система векторов, содержащая нулевой вектор, линейно зависима.
7.5.	Предложение. Система, содержащая не менее двух векторов, линейна зависима тогда и только тогда, когда какой-нибудь вектор этой системы линейно выражается через остальные.
Доказательство. Предположим, что вектор ап линейно выражается через векторы аь..., an-i:
аЛ=а1а1 + ... + art_iart.i.
Тогда
«ЛИ- ... +art-ian_i—ап=0,
или, что то же самое,
aiai+ • • • +««—ian— 1 +(—1)ап=0.
Таким образом, нетривиальная линейная комбинация (ап= ==—1) векторов аь...,ап равна нулевому вектору, т. е. эти векторы линейно зависимы.
Наоборот, пусть
«1а1 + • • • +«пап = 0,
где, например, cti^O. Тогда
ai = f	а2 + ... + I--—1 ап.
\	«1 /	ХС*!/
Предложение 7.5 доказано.
7.6.	Предложение. Если вектор а линейно выражается через линейно независимые векторы аь...,ап, то такое выражение единственно.
Доказательство. Возьмем два таких выражения:
а=а1ах+ ... + anan,
а=рхах+ ... + Рпап.
Тогда, вычитая из одного равенства другое и приводя подобные члены, получаем
0 = («1 —Р1)а1+ • • • + («n“Рп)ап-
Но из линейной независимости векторов аь...,ап следует, что
«1—₽i=0, ... , аЛ—рп=0, т. е. <*!=₽!,	, аЛ=Р„.
7.7.	Предложение. Если при добавлении вектора а к линейно независимой системе аь...,ап получаем линейно зависимую систему, то вектор а линейно выражается через векторы аЬ . • • , ап«
26
Доказательство. Существуют такие числа си,.
<tn+i, не все равные нулю, что
а.а^ ... +апап4-а„+1а=0.
(8)
Тогда обязательно an+i^O. В самом деле, если an+i=0, то an+ia= =0 и, следовательно, равенство (8) превращается в равенство
<М1+ • • • +anan=0.
Согласно предположению , среди чисел си,..., ап имеется отличное от нуля. Следовательно, система ai,..., ап линейно зависима. Это противоречие показывает, что an+i^O. Поэтому из (8) получаем
а—
_^Ма,+ .-.+(—!Ма„.
ап+1 /	\ аП+1 /
Предложение 7.7 доказано.
§ 8.	ГЕОМЕТРИЧЕСКИЙ СМЫСЛ ЛИНЕЙНОЙ ЗАВИСИМОСТИ
Векторы а и b называются коллинеарными, если они параллельны одной прямой.
8.1.	Предложение. Два вектора коллинеарны тогда и только тогда, когда они линейно зависимы.
Доказательство. Пусть векторы а и b коллинеарны. Отложим их от одной точки. Тогда они лежат на одной прямой I. Предположим, что а=#0 (если оба вектора нулевые, то они линейно зависимы согласно 7.4). Но на прямой всякий вектор линейно । выражается через любой ненулевой вектор. Итак, Ь=аа и векторы а и b линейно зависимы согласно 7.5.
Пусть теперь векторы а и b линейно зависимы. Согласно 7.5 один из них линейно выражается через другой, например, Ь=аа. Тогда векторы а и Ь коллинеарны согласно определению умножения вектора на число. Предложение 8.1 доказано.
8.2.	Предложение. На плоскости существуют два линейно независимых вектора.
В самом деле, возьмем в плоскости три точки О, Af, N, не лежащие на одной прямой. Тогда векторы ОМ и ON неколлинеарны и согласно 8.1 линейно независимы.
8.3.	Пр едложение. Любые три вектора на плоскости линейно зависимы.
Доказательство. Пусть векторы а, Ь, с лежат в одной плоскости. Если среди них имеется коллинеарная пара, то они линейно зависимы согласно 8.1 и 7.3. Предположим, что векторы а, Ь, с попарно неколлинеарны. Тогда, отложив их от одной точки О: з=0М, b=ON, с=ОР, получим три различные прямые ОМ,
27
ON, OP. Проведем через точку Р прямую /ь параллельную прямой ОМ. Прямая ON, пересекая прямую ОМ, будет пересекать и параллельную ей прямую А. Пусть Nt—точка пересечения прямых ON и It. Аналогично прямая /2, проведенная через точку Р параллельно прямой ON, будет пересекать прямую ОМ в некоторой точке Mt (рис. 9). Четырехугольник OMtPNi — параллело-
грамм. Следовательно, QNt=MtP. Поэтому
Поскольку векторы ОМ и ON — ненулевые, существуют такие числа аир, что OMt=aOM и ONt=$ON. Значит,
. OP=aOM+$ON или c=aa+pb. .
Итак, векторы а, Ь, с линейно зависимы согласно 7.5. Предположение 8.3 доказано.
Из предложений 8.3 и 7.3 вытекает, что система векторов в плоскости, состоящая более чем из трех векторов, также линейно зависима.
Векторы а, Ь, с называются компланарными, если они параллельны одной плоскости.
8.4.	Предложение. Три вектора компланарны тогда и только тогда, когда они линейно зависимы.
Доказательство. Необходимость вытекает из 8.3. Достаточность. Пусть векторы а, Ь, с линейно зависимы. Тогда согласно 7.5 один из них, например с, линейно выражается через остальные: c=aa+pb. Отложив векторы а, Ь, с от одной точки О: а= =ОМ, b=OAf, с=ОР, видим, что вектор ОР является суммой век
28
торов, лежащих на прямых ОМ и ON. Значит, вектор ОР лежит в плоскости, проходящей через эти прямые.
8.5.	Предложение. В пространстве существуют три линейно независимых вектора.
В качестве таких векторов согласно 8.4 можно взять любую тройку векторов ОМ, ON, ОР, где точки О, М, N, Р не лежат в одной плоскости.
8.6.	Предложение. Любые четыре вектора в пространстве линейно зависимы.
Доказательство проходит по схеме доказательства предложения 8.3. Поэтому даем лишь его набросок. Отложим векторы аь а2, а3, а4 от одной точки:	Достаточно рассмотреть
случай, когда никакие три из четырех прямых ОМ{, ОМ2, ОМ3, ОМ4 не лежат в одной плоскости. Существует параллелепипед, такой, что:
1)	точка О является одной из его вершин;
2)	его ребра ONb ON2, ON3 лежат на прямых ОМХ, ОМ2, ОМ3 соответственно;
3)	отрезок ОМ4 является его диагональю (рис. 10). Тогда
OM4~ON 1 + ON2-}~ ON3~(i]OM-[ + а2ОМ2+ cl3OM3.
Итак, вектор a4 линейно выражается через векторы аь а2, а3. Предложение 8.6 доказано.
Из него следует, что любая система векторов в пространстве, содержащая более четырех векторов, также линейно зависима.
Результаты этого параграфа можно суммировать следующим образом.
8.7.	Теорема. Для п=1, 2, 3 в векторном пространстве Vect (п) существует система из п линейно независимых векторов, в то время как любая система, содержащая более п векторов, линейно зависима.
§ 9.	БАЗИСЫ И КООРДИНАТЫ
9.1.	Определение. Пусть V — векторное пространство и ei,...,en — некоторая система его векторов. Эта система называется базисом пространства V, если она линейно независима и полна. Последнее означает, что всякий вектор пространства V линейно выражается через векторы ei,..., еп.
Из 8.7 и 7.7 вытекает
9.2.	Предложение. Любые п линейно независимых векторов образуют базис векторного пространства Vect (и), и=1, 2, 3.
С другой стороны, из 8.1 и 8.4 вытекает
9.3.	Предложение. Любой базис пространства Vect(я) состоит из п векторов, п=1, 2, 3.
29
Пусть ei,...,en — базис пространства V и аеУ. Тогда в силу полноты базиса
a=a*ei+ ... + апеп.	(9)
Согласно 7.6 числа а1,..., ап вектором а определяются однозначно. Эти числа называются координатами вектора а в базисе еь... ..., еп. Равенство (9) назовем разложением вектора а по векторам базиса еь...,еп.
Если в векторном пространстве зафиксирован базис еь..., еп, то наряду с записью a=a1ei + ... +onen иногда пишем
а={а\..., ап}.
Из аксиом векторного пространства вытекает
9.4.	Предложение. Координаты суммы векторов равны сумме координат, а координаты произведения вектора на число равны произведению координат на это число, т. е.
{а1,... ,яп}+{^1, •. •,	... ,ап + Ьп},
Ца'....ап}={%а1,..., Лап}.
9.5.	Определение. Арифметическим п-мерным (вещественным) пространством называется множество Rn всех упорядоченных наборов из п вещественных чисел (ai,...,an) с операциями сложения
(аь • • •, ап) + (₽ь • • •, ₽п) = («1 + Рь..., ап + 0П)
и умножения на число
Х(а1( ... , ап)==(1сс1,	, Кап).
Легко проверить, что эти операции удовлетворяют аксиомам 1— 8° векторного пространства. Значит, Rn является векторным пространством. Нулем в этом пространстве является набор (0,...,0), противоположным к элементу (аь..., ап) является набор (—ai —ап). Пространство R1 очевидно совпадает с R.
Обобщением теоремы 6.6 является
9.6.	Теорема. Отображение f: Vect(n)->-Rn, n=l, 2, 3, сопоставляющее каждому вектору а набор его координат (а\...,ап) в некотором фиксированном базисе еь..., еп, является изоморфизмом векторных пространств.
Линейность отображения f вытекает из предложения 9.4, би-ективность очевидна.
§ 10.	ПРОЕКЦИИ И КООРДИНАТЫ
Теперь от алгебраического определения координат векторов, данного в § 9, перейдем к их геометрическому описанию. Пусть на плоскости даны две непараллельные прямые /1 и h. Через произвольную точку М плоскости проводим прямую h', парад-
но
лельную прямой Z2. Она пересекает прямую /1 в точке Л1г (рис. 11). Эта точка называется проекцией точки М на прямую* Zi параллельно прямой Z2.
Пусть теперь в плоскости дан вектор а. Отложим его от какой-нибудь точки О: а = ОМ. Пусть Ох и Afi — проекции точек О и М на прямую 1\ параллельно прямой Z2 (рис. 12). Вектор ai=== =О1Л41 назовем проекцией вектора а на прямую 1\ параллельно Z2 (пишем a1=npj«a).
Надо проверить корректность этого определения, т. е. независимость вектора ai от выбора точки О. Это можно сделать чисто геометрически, но мы привлечем алгебраические соображения. Спроектируем вектор ОМ на прямую Z2 параллельно прямой Zb Получим вектор а2=О2ЛГ2 (рис. 13). Ясно, что ОМ— О^М^О^М** т. е.
a—ai + ag.	'	10>
Итак, для того чтобы определение вектора а1=пр^а не зависело от точки О приложения вектора а, достаточно показать, что* представление (10) вектора а в виде суммы векторов, параллель-
31
ных (прямым /1 и /2, единственно. Возьмем другое такое представление:
a=bx+b2.
Тогда
(«1—Ь1) + (а2—Ь2)=0.	(11)
Значит, векторы ai—bj и а2—Ь2 линейно зависимы и согласно 8.1 коллинеарны. Но они лежат на прямых Zi и Z2 соответственно. Следовательно, один из них нулевой, но тогда в силу (11) второй также равен нулю. Таким образом, корректность определения вектора ах=пр^а доказана. Заодно мы проверили (равенство
а=пр'*а + пр£а.	(12)
Пусть теперь векторы еь е2 образуют базис в плоскости. Проекцией вектора а на вектор ei параллельно вектору е2 называется вектор
пр®*а=пр^а,	(13)
где прямые Ц и /2 параллельны векторам ei и е2 соответственно. Тогда равенство (12) можно переписать в виде
а=пр«*а + пр®*а.	(14)
Но вектор пр®«а можно записать в виде аеь где а, как мы знаем, равно азе^пр^а). Это число а обозначаем через (азпр^а) и называем алгебраическим значением проекции вектора а на вектор «I параллельно вектору е2. Итак,
пре*а=(аз пр^а) ех.
Из равенства (14) получаем
а—(аз пр®«а) ех + (аз пр£а) е2.	(15)
Но запись
а=а1е1 + а2е2
означает, что а1, а2 — координаты вектора а в базисе еь е2. Таким образом, координаты вектора а в базисе еь е2 — это алгебраические значения проекций вектора а на векторы ei и е2.
Пусть теперь в пространстве даны плоскость л и непараллельная ей прямая I. Через произвольную точку М пространства проведем прямую Z', параллельную прямой Z, и плоскость л', параллельную плоскости л. Обозначим через Mt точку пересечения плоскости л' с прямой I и через 2ИЯ точку пересечения прямой /' с плоскостью л (рис. 14). Точка называется проекцией точки
32
М на прямую I параллельно плоскости я, а точки — проекцией точки М на плоскость л параллельно прямой I.
Возьмем теперь в пространстве вектор а и отложим его от какой-нибудь точки О: а=ОМ. Спроектируем точки О и М на прямую I и плоскость л (рис. 15). Обозначим вектор OiMt через аг, а вектор ОЯМЯ — через ая. Назовем вектор а« проекцией вектора а на прямую I параллельно плоскости л, а вектор а„— проекциейвектора а на плоскость л параллельно прямой I. Обозначим эти векторы через пр|*а и пр^а соответственно.
Из рассмотрения трех имеющихся на рис. 15 параллелограммов получаем
а=ОМ= OMi’ -\-OMn'=OiMi -|- 0яМя =:ai-|-ая.
Как и выше, из 8.1 вытекает единственность представления
а=а1+а„	(16)
вектора а в виде суммы векторов, параллельных прямой / и плоскости л. Таким образом, определение проекций npf’a й пр^а не зависит от точки О приложения вектора а. Равенство (16) можно переписать в виде
а=пр"а+ пр'яа.	(17)
Если е — ненулевой вектор, параллельный прямой /, то вектор пр;яа называем также проекцией вектора а на вектор е парал-।
2 Зак. 283	33
лельно плоскости л и обозначаем через пр£а. Число (азДпр^а)) обозначаем через (азпр^а). Вектор пр^а называем также проекцией вектора а на плоскость п параллельно вектору е и обозначаем пр^а. В этих обозначениях равенство (17) можно переписать в виде
а=пр£а+пр«а.	(18>
Возьмем в пространстве базис еь ег, ез и отложим эти векторы от какой-нибудь точки О. Проведем через точку О плоскости ль лг, лз так, что
Л1 параллельна векторам е2, ез;
лг параллельна векторам еь е3;
лз параллельна векторам еь ег (рис. 16).
Назовем эти плоскости базисными.
Разложим вектор а по векторам базиса еь ег, ез:
а=а1е14-а2е24-а3е3.	(19>
Вектор а1^ параллелен вектору еХ) а вектор c?e^-\-a9e3 параллелен плоскости лх. Поэтому а1е1=пр^*а. Аналогично а2е2=пр£*а и а3е3 = = пр£»а. Следовательно, равенство (19) можно переписать в виде
а=пр^а + пр^!а4-пр^*а.	(20)
Ясно также, что
а‘=(азпр"/а), i = l, 2, 3.
Поэтому равенство (19) можно переписать еще в виде
а=(аз пр£>а) ех + (аз пр^а) е2 + (аз пр£»а) е3.	(21)
Таким образом, в пространстве координаты вектора — это алгеб-34
раические значения его проекций на базисные векторы параллельно базисным плоскостям.
Обобщением предложения 6.1 является
10.1.	Теорема. Для любых векторов а и b и любого числа а имеем
(аз пр (а + Ь))=(аз пр а) 4- (аз пр Ь),
(аз пр (аа))=а (аз пр а).
Здесь речь идет о проекциях типа пр®* в плоскости и пр" в пространстве. Утверждение теоремы вытекает из того, что алгебраические значения проекций — это координаты, и из предложения 9.4 о координатах суммы векторов и произведения вектора на число.
10.2.	Теорема. Для любых векторов а и Ь и любого числа а имеем
пр (а+Ь) =пр а+пр Ь,
пр(аа)=апр а.
Здесь речь идет о всевозможных типах проекций. В силу 10.1 в доказательстве нуждается только случай пр= пр^.Согласно {17) имеем
а + Ь==пр« (а + Ь) + пр^ (а 4- Ь).
Кроме того, уже установлено, что
прр (а + b)=npj'a + nppb.
Поэтому
пр^ (а 4- Ь)=(а + Ь)—пр" (а 4- b)=(а—npfa) 4-
4-	(b—пряЬ)=(согласно (17))=пр^а 4-nP„b.
Аналогично проверяется и равенство пр^(аа)=апр^а.
Итак, мы определили различные проекции векторов. Сама операция сопоставления вектору его проекции является отображением, называемым проектированием. Теорему 10.2 можно переформулировать следующим образом (см. определение 6.3): .
10.3.	Теор е м а. Проектирования
пр'* : Vect (2)->Vect (1),
пр" : Vect (3)->Vect (1),
npjj : Vect (3)-> Vect (2)
являются линейными отображениями.
2*
35
§ 11.	ОПРЕДЕЛЕНИЕ СКАЛЯРНОГО ПРОИЗВЕДЕНИЯ ВЕКТОРОВ И ЕГО СВОЙСТВА
Угол между двумя векторами. Пусть в пространстве (или на, плоскости) даны два ненулевых вектора а и Ь. Отложим их от одной точки О: а=ОМ, b=ON. В плоскости, проходящей через точки OMN, определены два угла между лучами OAf-> и ON-+.
Рис. 17
Эти углы принимают неотрицательные значения <р и 2л—<р (рис. 17), косинусы которых одинаковы. Наименьший из этих углов назовем углом между векторами ОМ и ON и обозначим через (ОМ, ON). Найдем его косинус. 'Спроектируем точку N ортогонально на прямую ОМ, получим точку АТ). Обозначим через е» вектор единичной длины, имеющий то же направление, что и вектор а. Пусть ONl=XeSL. Тогда |ОА7)| = |А,|, а знак X совпадает со знаком cos (ОА4, ON). С другой стороны, из прямоугольного треугольника ONNi имеем | ОЛ7] | — |ОЛ7| • cos | (ОМ, ON) | ? Следовательно,
k=\0N\cos(0NC0N). '	(22)
Для произвольного вектора с обозначим через преас ортогональную проекцию вектора с на вектор еа, т. е. проекцию вектора с на вектор еа параллельно плоскости, перпендикулярной вектору еа. Тогда
О^ = ПРеаЬ
и равенство ON1=‘kea. означает, что
1=(азпреаЬ).
36
Значит, согласно (22) имеем
(аз пр#аЬ) = | b | cos (ОМ, ON),
откуда
cos (ОМ? ON)
(азпр^Ь)
I Ь I
(23)
или —	(аз пр Ь)
cos (а, Ь)=---——
(24)
Равенство (24) можно взять за определение косинуса угла между ненулевыми векторами а и Ь, а предыдущие рассуждения показывают, что это определение совпадает с наглядно геометрическим. Поскольку под углом между двумя векторами а и b понимаем угол, принимающий значения от 0 до п, не имеет значения, в каком порядке рассматриваем эти векторы. Поэтому
cos(a, b)=cos(b, а)
и наряду с равенством (24) имеем
— (азпРеьа) - cos (а, Ь)=----—-------.	(25)
'	I,
Определение скалярного произведения. Скалярным произведением двух векторов а, b называется число (а, Ь), равное произведению длин этих векторов на косинус угла между ними:
(а, Ь)= |а| • |b| cos(a, b).	(26)
Скалярное произведение нулевого вектора на любой вектор полагается равным нулю.
Из (24) и (25) имеем
(а, Ь)= |а| (азпреаЬ)= |Ь| (азпр^а).
(27)
Свойства скалярного произведения.
11.1.	Теорема. Для любых векторов а, Ь, с и любого числа а имеем
1)	(а, а)>0, причем (а, а)=0 тогда и только тогда, когда а= =0.
2)	(а, b) = (b, а).
3)	(а + b, с)=(а, с)+(Ь, с).
4)	(аа, Ь)=а(а, Ь).
Доказательство. Свойства 1) и 2) очевидны. Проверим свойство 3). Имеем (а + b, с)=(согласно (27)) = |с| (аз пре<; (а + Ь)) = (согласно 10.1)= |с| (азпр^а)-)-|с| (азпресЬ)=(а, с) + (Ь, с). Аналогично проверяется свойство 4).
37
Из определения скалярного произведения и свойств косинуса непосредственно вытекает
11.2.	Теорема (н е р а в е нс т в о Кош и—Буняковско* г о). Для любых векторов а, b имеем
-|a|.]b|^(a, b)<|a|-|b|.
При этом если а=#0, то (а, Ь) = |а| • |Ь| тогда и только тогда, когда Ь=аа, где а>0.
§ 12.	СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ В КООРДИНАТАХ
Из свойств скалярного произведения вытекает, что линейные комбинации векторов можно перемножать как многочлены:
(ал + огаг + азаз- Pibi + p2b2)=(a1a1 + a2a2 + a3a3, PibJH-
+ (а1а1 + а2а2 + а3а3, ₽2Ь2)=а1Р1(а1, ЬО + аД^, bx) +
+ азР1(аз» b1) + aiP2(a1, b2) + a2p2(a2, Ь2) + ОзР2(а3, Ь2).
Возьмем в пространстве векторов на плоскости базис еь е2. Тогда для векторов
а—а^ + а2^, b=&1e1 + 62e2	(28)
имеем
(a, b)=a1&1(e1, е1) + а1&2(е1, е2)4-а261(е2, ej + а2Ь2 (е2.,. е^.’	(29)
Положим (е4-, e,)=gij и назовем числа g-ц метрическими коэффициентами базиса. Тогда, учитывая, что gij=gji, равенство (29) можно переписать в виде
(a, b)=aVgn + (аЧР + а2&) g12 + a2b2g22.	(30)
Аналогично в пространстве, взяв базис еь е2, ез, для векторов
3=0^ + а2е2 + а3е3, b=ft1e1 + t?e2 + b3e3	(31)
получаем
(а, b)=a1b1g11 + a2b2g22 + a3b3g33 + (а№ + a2*»1) £12 +
+ (aV + aV) g13 + (a2b3 + a*b2) g23,	(32)
или в более компактной форме
з з -
(а, Ь)=2 Е а‘ь’8и-	(33)
«-1 /=1
Равенства
|а|=]/(а, a), cos(a, b)=
38
позволяют по координатам векторов и метрическим коэффициентам базиса находить длины векторов и углы между ними. Так, для векторов (28) имеем	,
I al = V (a1)2 gn + 2ага2§12+(а2)2 gM,	(34)
COS (a^b) =_______alz,1gn + (д1^2 + Д2^) gn + a2&2g22__
l/(al)2gn + 2a1a2gi2+(a2)2g22 V(b1)2gu+26162gi2-|-(&2)2g»‘
(35)
Аналогичные формулы имеют место и для векторов (31) в пространстве. Дадим их в компактном виде, применяя равенство (33)
|а|==1/ £ £ а‘а^ц ,	(36)
Г i=l /==1
3	3
£ £ aibigu
cos(a7b)= з з	з з.	(37)
V Е Еa‘aigii V Е Е bib,gii i=i /=i	i=i /=i
Базис ei,...,en (на прямой, на плоскости или в пространстве) называется ортонормированным, если
( 1 для i = j;
ёи=\ п • , •
( 0 для i =£ ].
Длины векторов ортонормированного базиса равны единице:
|ei|=Vg7=l,
а равенство gi?=0 для i^j означает, что cos(ei, е->)=0, т. е. векторы ортонормированного базиса попарно перпендикулярны. Все приведенные выше формулы имеют в ортонормированном базисе значительно более простую запись. Так, для векторов в пространстве
(а, Ь)=а1Ь1 + а2Ь2 + а3Ь3,	(38)
|а| -/(а1)1 + (а1)1 + (а’)! ,	(39)
+ (40)
у (а1)2 + (а2)2 + (д3)2 У(Й1)2 +(62)2 +(Ь3)2
Отбрасывая по третьему слагаемому в формулах (38) — (40), получаем соответствующие формулы для векторов на плоскости.
Отметим еще одно утверждение. Из формулы (38) вытекает
12.1.	-Пр едложение. Координатами произвольного вектора а в ортонормированном базисе еь е2, ез являются скалярные произведения (a, ej, (а, е2), (а, е3).
39
§ 13.	СИСТЕМЫ КООРДИНАТ
Аффинные координаты. Пусть на прямой, на плоскости или в пространстве заданы , точка О и базис ei,...,en. Тогда говорим, что задан репер Oei... еп.
Для любой точки М вектор ОМ называется радиусом-векто-ром точки М (относительно точки О) и обозначается через гм. Пусть
0М=х1е14-...+хЧп-	(41)
Числа х',...,хп из равенства (41) называются (аффинными) координатами точки М в репере Oei... еп. Иногда будем говорить и о координатах вектора в репере Oei • • • еп, подразумевая под этим его координаты в базисе еь ...,еп. Таким образом, координаты точки М в репере Oei ... еп — это координаты ее радиуса-вектора в этом репере. Точку М с координатами х’,...,хп иногда будем записывать М (х1,..., хп).
Рис. 18
13.1.	Предложение. В данном репере для точек M(xi1,...
...,Xin) и N(X2X, . ..,х2п) имеем MN={x2}—Xi1.x2n—Xin).
Утверждение вытекает из равенства
MN—Tjf—Гм,	(42)
проиллюстрированного на рис. 18.
Строка (х1,...,хп) координат произвольной точки есть эле- ' мент арифметического n-мерного пространства Rn. Таким образом, задание репера Oei •..еп определяет, очевидно, биективное отображение
«точка»^-«строка ее координат».	(43)
13.2.	Определение. Биективное отображение (43) называется (аффинной) системой координат, определяемой репером Oei... еп. Ее обозначают обычно символом Ох1... хп или Ох\... ...хп? Точка О называется началом системы координат. Прямая с заданным на ней репером Ое называется осью координат Ох с началом О.
40
Таким образом, задание системы координат Oxyz в пространстве эквивалентно заданию трех осей координат Ох, Оу, Oz с общим началом. Эти оси называются соответственно
Ох — ось абсцисс,
Оу — ось ординат,
Oz — ось аппликат.
Начало О делит ось координат Ох на две полуоси: отрицательную и положительную (рис. 19).
- + -----------------------.
Рис. 19
Ось координат делит плоскость на координатные полуплоскости, а пара осей координат — на координатные квадранты или четверти I, II, III, IV (рис. 20).
I
Рис. 20
Плоскости, проходящие через пары осей координат, называются координатными плоскостями Оху, Oxz, Oyz (рис. 21).
Координатная плоскость1 делит пространство на два координатных полупространства, а тройка координатных плоскостей делит пространство на Восемь координатных октантов.
Возьмем в пространстве произвольную точку М. Спроектируем эту точку на координатные оси Ох, Оу, Oz параллельно координатным плоскостям Oyz, Oxz, Оху соответственно. Полученные проекции обозначим через Л4ь М2, М3. Пусть х — координата точки Mi на оси Ох, и пусть точки Л12 и М3 имеют на осях Оу и Oz координаты у и z соответственно. Тогда из сказанного в § 10 о связи между проекциями и координатами вытекает, что числа х, у, z являются’ координатами точки М в системе координат Oxyz. Таким образом, координаты точки в пространстве — это
41
координаты ее проекции на координатные оси параллельно координатным плоскостям.
13.3.	Замечание. Читатель всегда должен иметь в виду, что одну и ту же точку можно рассматривать на прямой, на плоскости и в пространстве. В зависимости от этого точка имеет одну, две или три координаты. Так, точка Л4Ь имеющая на оси Ох одну координату х, в пространстве имеет тройку координат (х, О, 0).
Деление отрезка в данном отношении. Говорят, что точка делит невырожденный отрезок Af0Afj в отношении 1, если
Л^=1Ма£.	(44)
Пусть, го, гь г — радиусы-векторы точек Af0, Afb М. Тогда уравнение (44) переписывается в виде
г—1-0=1(11—г),
ИЛИ
ri="T7T--	(45)
1 “7“ Л
42
Эго уравнение при всяком Х=#=—1 определяет радиус-вектор г точит М на прямой M0Mi. При Х=—1 получаем «бесконечно удаленную» точку этой прямой.
1 Расписывая равенство (45) покоординатно, получаем
У 4~	Уо 4~ Xyt _ 2р 4~ Xzx	(46)
14-Х ’ J 14-Х ’	14-Х ’	/ '
При Х=1 точка М является серединой отрезка Af0Afi и формулы (46) превращаются в
+	»= Уо + У1-	2 = _£»±А_	(47)
2	2	2
Прямоугольные координаты. Система координат Ох1... хп называется прямоугольной, если она определяется ортонормированным репером Oei... еп, т. е. репером, в котором базис еь...,еп ортонормирован.
Пусть в пространстве дана прямоугольная система координат Oxyz. Возьмем две точки Afi(хь Zi) и М2(х2, У2, z2). Тогда расстояние р(2И1, М2) между ними равно длине соединяющего их вектора
Af1M2={x2—хъ у2—у1г z2—-zj.
Поэтому согласно (39)
р(М1, М2)=1/(х2—х1)24-(у2—(/)2 + (z2—(48)
В частности, уравнение
(х—х0)24-(у—-y0)24-(z—г0)а=7?2,	(49)
где 7?>0, описывает геометрическое место всех точек М(х, у, z), находящихся на расстоянии R от данной точки Af0(x0, (/о, z0), т. е. сферу радиусом R с центром в точке Мо.
На плоскости с прямоугольной системой координат Оху расстояние между точками Mi(xb yi) и Af2(x2, уг) определяется равенством
р(Мн М2)=/(х2—Х!)84-(1/2— z/J2.	(50)
Уравнение
(х-хо)2+(г/-Уо)2=7?2	(51)
описывает окружность радиусом R с центром в точке Af0(x0, Уо)-
Полярные координаты. Зафиксируем на плоскости точку О и назовем ее началом, или полюсом. Пусть I — проходящая через точку О прямая. Зададим на прямой I ориентацию выбором ка-кого-нцбудь ненулевого вектора е, параллельного этой прямой. Луч с началом в точке О, имеющий направление вектора е, назовем полярной осью. Прямая I разбивает плоскость на две полу
43
плоскости, одну из которых назовем отрицательной (нижней),!а другую — положительной (верхней). Теперь для каждой точки М (рис. 22) плоскости можно определить ее полярные координатй, а именно:
1) расстояние г от точки М до начала О;
2) угол наклона <р радиуса-вектора ОМ точки М к полярной оси.
Число г называется полярным радиусом точки М. Полярный радиус Л1960Й точки, отличной от точки О, положителен; для точки О он равен нулю.
Угол <р называется полярным углом точки М. Полярный угол определен для всех точек плоскости, за исключением точки О. Полярный угол принимает значения на отрезке [0, л] для точек положительной полуплоскости, включая прямую I. Для точек же отрицательной полуплоскости полярный угол принимает значения в интервале (—л, 0) (рис. 23).
Рис. 23
Итак, полярные координаты точки — это полярный радиус и полярный угол. Описанное выше отображение, которое ставит в соответствие точке М^О пару (г, ф) ее полярных координат, называется полярной системой координат Ог<р на плоскости, определенной началом, полярной осью и положительной полуплоскостью.
44
I Вместо выбора положительной полуплоскости можно выбрать юложительное направление вращения в плоскости. Тогда естественно считать, что полярный угол <р принимает значения в полуинтервале [0, 2л) (рис. 24).
Рис. 24
Если на плоскости дана полярная система координат Огер, то по ней естественно определяется и прямоугольная система координат. Начало этой системы координат совпадает с началом полярной системы координат, положительная полуось абсцисс совпадает с полярной осью, а положительная полуось ординат находится в положительной полуплоскости.
Полученную таким образом прямоугольную систему координат Оху называем системой, определенной полярной системой координат Огер (рис. 25).
Наоборот, если дана прямоугольная система координат Оху, то однозначно определяем полярную систему координат Огер, сохраняя начало данной прямоугольной системы координат и требуя, чтобы полярная ось совпадала с положительной полуосью абсцисс, а положительная полуплоскость состояла из тех точек, ординаты которых положительны.
45
Очевидно, что такое соответствие между полярными и прямоугольными системами координат на плоскости является биективным.	\
Имеют место очевидные формулы, связывающие прямоугольные координаты (х, у) произвольной точки М с ее полярными кот ординатами (г, <р):	I
X=rc°s<p, |	(52^
#=rsin(p, J
С ,___________
r=Y х2 + уа ,
sin<p =
cos<p=—
У _ У'
Г 1/х2+уа
(53>
Глава II
УРАВНЕНИЯ ПРЯМОЙ линии и плоскости
§ 14. УРАВНЕНИЯ ПРЯМОЙ ЛИНИИ НА ПЛОСКОСТИ
Фиксируем на плоскости аффинную систему координат Оху. озьмем прямую I, лежащую в плоскости. Всякий ненулевой вектор а, параллельный прямой I, называется направляющим вектором этой прямой.
Пусть точка jMo(xo, Уо) лежит на прямой I. Тогда для любой точки А4(х, у) этой прямой векторы М^М и а коллинеарны. Значит, существует.такое число t, что
M0M=ta.
(1)


Наоборот, всякая точка М, для которой выполнено условие (1), лежит на прямой / согласно, определению произведения вектора на число. Таким образом, условию (1) удовлетворяют все точки М прямой I и только они. Равенство (1) •—это уравнение прямой л векторной форме.
Обозначим через г0 и г радиусы-векторы точек Мо и М соответственно. Тогда
М0М=г—г0
уравнение
(1)
принимает вид
г—r0=Za,
или
г=го+ /а.
(2)!
Это
также векторное уравнение
прямой
(рис. 26).
и

47
Если вектор а имеет координаты {а, 0}, то, переходя в формуле (2) от равенства векторов к равенству их координат, получаем
x=x04-ta, |	(	Л
У=Уо + $- J .	.	\
Это параметрические уравнения прямой, проходящей через точку!
(х0, Уо) с направляющим вектором {а, ₽}.	\
Исключая из уравнений (3) параметр t, получаем канониче-\ ское уравнение прямой
х—*0 _ У — У о	ч	(4^
а р
Здесь, например, если а=0, то уравнение (4) превращается в равенство
х—хо=О.
Это уравнение описывает прямую I, параллельную оси Оу и проходящую через точку Afo.(x0, 0) на оси Ох (рис. 27).
Приведем теперь уравнение (4) к общему знаменателю. Получим эквивалентное ему уравнение
ау—₽х0 + ом/о=О,
которое, полагая Л=р, В=—а, С——рх0+ш/о, запишем в виде
Лх -{- By -f- С = 0.	(5)
Это общее уравнение прямой линии'на плоскости.
Поскольку вектор а={а, ,р) — ненулевой, по крайней мере один из коэффициентов Л и В отличен от нуля. Поэтому левая часть уравнения (5) представляет собой многочлен первой степени от неизвестных х и у. Следовательно, уравнение (5) —уравнение первой степени, т. е. всякая прямая на плоскости есть линия первого порядка.
Верно и обратное: всякая линия первого порядка на плоскости является прямой, т. е. уравнение (5) в аффинной системе координат Оху на плоскости описывает прямую.
В самом деле, возьмем частное решение (х0, уо) уравнения (5). Такое решение всегда существует: если, например, Л¥=0, то можно положить г/о=0 и Хо=—С/Л. Рассмотрим прямую Z, проходящую через точку Afo(x0, z/0), с направляющим вектором а= ={—В, Л}. Возьмем теперь произвольную точку М(х, у) на прямой I и покажем, что ее координаты удовлетворяют уравнению (5). Согласно (1) существует такое число t, что
{х—х0, у—y0}—t{—В, Л}.	(6)
Отсюда получаем
Л (х—х0) 4- В (у—1/0)=(согласно (6))== Л (—BZ) + В • At=0,
4S
ИЛИ
Ах + Ву—Ах0—Вуо=О.	(7>
Но (х0, у0) есть решение уравнения (5), т. е.
С=—Ахо—Ву0.
Значит, равенство (7) совпадает с равенством (5). Итак, координаты (х, у) всякой точки М, принадлежащей /, удовлетворяют уравнению (5).
Пусть теперь точка М(х, у) удовлетворяет условию (5). Тогда из того, что точка M0(xq, уо) также удовлетворяет этому условию,, получаем
А (х—х0)+В (у—Уо)=0,
или
х— х0  В
У — Уо	Л
Значит, векторы Af0Af={x—х0, у—у0} и а={—В, А} пропорциональны. Следовательно, согласно (1) точка М лежит на прямой I.
Таким образом, нами доказана
14.1. Теор е м а. Прямые на плоскости — это в точности линии первого порядка.
Из доказательства этой теоремы следует, что а={—В, Л}—направляющий вектор прямой, задаваемой уравнением (5).
Если В¥=0, то уравнение (5) можно переписать в виде
или
y—kx+b.	(8)
Это известное из школы уравнение прямой с угловым коэффициентом k. Стоит отметить, что в аффинной системе координат число k не имеет геометрического смысла тангенса угла наклона прямой к оси Ох, как в прямоугольной системе координат. Так, на рис. 28 перпендикулярная к оси Ох прямая имеет уравнение у—х.
Вернемся теперь к уравнению (4). Пусть на прямой I кроме точки Af0(x0, уо) дана отличная от нее точка М\ (хь у\). Тогда в качестве направляющего вектора а прямой I можно взять вектор {xi—х0, у\—уо). При этом уравнение (4) принимает вид
Х—Хр  У — Уо	'
Х1 — х0 У1 — Уо '
Это уравнение прямой, проходящей через две точки Мо и Mi.
49 ‘
Выделим некоторые частные случаи общего уравнения (5) прямой I:
1)	I проходит через начало координат С=0;
2)	I параллельна оси Ох^А=0;
3)	I параллельна оси Оу4=»В=0;
4)	I совпадает с осью Ох-&А—С=0-,
5)	I совпадает с осью Oy^B=C—Q.
§ 15.	ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПРЯМЫХ НА ПЛОСКОСТИ. ПОЛУПЛОСКОСТИ
В пределах этого параграфа на плоскости фиксирована аффинная система координат Оху.
15.1.	Предложение. Для того чтобы прямые Л, 12, задаваемые соответственно уравнениями
А*+51{/+С1=о,	(Ю)
А^хВ$уС2=0,	,	ПО
совпадали, необходимо и достаточно, чтобы
_di_=JL=_£b	(12)
с2
50
Доказательство. Необходимость. Векторы {—Вь Л1}, {—В2, А2} являются направляющими для прямых Zi, 12. Значит, они коллинеарны. Существует такое число а, что
{-Ви Л1)=а{-В2, А2}.	(13)
Возьмем точку (х0, t/0)eZI=/2. Тогда
АуХ0+В1У0 + Су=0,
А$х0 -)+ С2=0.
Умнбжим второе из этих уравнений на а и вычтем его из первого. Тогда с учетом (13) получим
Су—аС2=Ъ,
а это вместе с тем же равенством (13) дает нам условие (12).
Достаточность. Из условия (12) вытекает, что
-|- Вуу + Су=а (Л2х + В^у С2)
для некоторого а, т. е. уравнения, задающие прямые 1\, 12, эквивалентны.
15.2.	Предложение. Прямые 1у, 12, задаваемые соответственно уравнениями (10), (И), параллельны и не совпадают тогда и только тогда, когда
(14)
Аа В2 С2	к '
Доказательство. Необходимость вытекает из пропорциональности направляющих векторов {—Вь Л1}, {—В2, Л2} прямых Zi, /2 и предложения 15.1. Достаточность. Первая часть условия (14) дает нам параллельность направляющих векторов прямых /ь Z2, а вторая часть вместе с предложением 15.1 — несовпадение прямых Zi, Z2.
Из предложений 15.1 и 15.2 вытекает, что условие
эквивалентно тому, что прямые /ь 12, задаваемые уравнениями (10), (11), пересекаются по одной точке.
15.3.	Предложение. Пусть прямые Zb Z2, задаваемые уравнениями (10), (11), пересекаются по одной точке М0(х0, уо). Тогда прямая Z3 проходит через точку А40 в том и только в том случае, когда она задается уравнением
® (Aix Вуу + Су) -f- р (Л2х + В2у+С2)=0,	(16)
являющимся линейной комбинацией уравнений (10) и (11).
51:
Доказательство. Достаточность очевидна. Проверим не- ' «обходимость. Пусть прямая /3, задаваемая уравнением
Л3х + В3у+С3=0,	(17)
проходит через точку ЛТ0. Возьмем на прямой Z3 какую-нибудь точку Afi (хь ух), отличную от точки Л1о. Положим
GVi + Baf/i + Q, |
Pi—Л1х1+В1г/1 + С1. J
Поскольку точка Afx не может одновременно принадлежать прямым Zi и 1г, по крайней мере одно из чисел cti и Pi отлично от нуля. Тогда уравнение
ai Mi* 4* В1У + Су) + pj (Л2х + В2у + С2)=0	(18)
согласно условию (15) является уравнением первой степени (коэффициенты при неизвестных одновременно в нуль не обращаются). Поэтому согласно 14.1 оно определяет некоторую прямую 1. Она очевидно проходит через точку Мо. Подставляя координаты точки Aft в левую часть уравнения (18), получаем
“i₽i + ₽i(—«по-
следовательно, прямая I проходит и через точку Afb Значит, она совпадает с прямой /3. Но тогда в силу 15.1 уравнение (17) получается из уравнения (18) умножением на некоторое число у. Тогда при a=yai, p=ypi уравнения (16) и (17) совпадают. Предложение 15.3 доказано)
Уравнение (16) называется уравнением пучка прямых, проходящих через точку пересечения прямых (10) и (11).
15.4.	Теорема. Пусть прямая I задана уравнением (5). Тогда множества Х~ и Х+ всех точек М(х, у) плоскости, для которых соответственно
Ах+Ву-)-С<0 и Лх + By+С>0,
являются полуплоскостями, ограниченными прямой I.
Доказательство. Пусть точки Afo(x0, у0) и Mi(х1( ух) лежат в множестве Х~. Возьмем произвольную внутреннюю точку М(х, у) отрезка AfoAfj. Эта точка делит отрезок М0Мх в некотором положительном отношении Л. Тогда, как показано в § 12,^
д. *о + 1хх	Уо + 1У1
1+1 ’ У 1+1
Поэтому, учитывая очевидное тождество
С =—-—С+ -- С, 1+1 1+1
52
имеем
А*+By + С =  *	(Ах0+Ву0+С) 4-	(Axj 4-	4“ Q < 0»
1 -j- Л	1 -j- л
I
так как обе точки Af0 и ЛЬ принадлежат Х~. Следовательно, Ate •еХ-. Итак, по определению полуплоскости (§ 3) Х~ лежит в одной из полуплоскостей; ограниченных прямой I. То же самое можно сказать и про множество Х+. Но плоскость исчерпывается множествами Х~, I, Х+. Значит, множества Х~ и Х+ лежат в разных полуплоскостях и исчерпывают их. Теорема 15.4 доказана.
Множество Х~ называется отрицательной полуплоскостью по отношению к уравнению (5) прямой I, а множество Х+ — положительной полуплоскостью.
§ 16. прямая линия НА плоскости С ПРЯМОУГОЛЬНОЙ СИСТЕМОЙ КООРДИНАТ
Угол между прямыми. Пусть на плоскости дана прямоугольная система координат Оху, определяемая ортонормированным репером Oeie2. Мы знаем, что вектор а={—В, А} являемся направляющим вектором прямой I, заданной общим уравнением (5). Угол <р между прямыми /1 и /2, задаваемыми общими уравнениями (10) и (11), равен углу между их направляющими векторами Hi={—Ви Л;} и а2={—В2, А2} (рис. 29). Следовательно,
созф= -	(19)
Iе»’ Аг + в2 у Л2 + В2
Формула (19) дает нам значение одного из углов между прямыми /1 и 12. Косинус дополнительного л—ф также получается из формулы (19), если уравнение одной из прямых умножить на —1.
Из формулы (19) вытекает условие
4" 13iB2=0
перпендикулярности прямых 1г и /2.
Расстояние от точки до прямой. Расстоянием от точки Мо до лрямой I называется длина перпендикуляра Af0Ali, опущенного из этой точки на прямую. Отрезок AIqAIj короче любого другого от
53
резка М0М, соединяющего точку Л1о -с произвольной точкой ЛГ прямой I, 1
16.1. Предложение. Расстояние от точки Мо с координатами (х0, yQ) до прямой I, заданной общим уравнением (5), вира-, жается формулой
р(М0,	+.С I. .	(20}
V л2 4- в2
Доказательство. Мы знаем, что вектор а={—В, Л) является направляющим вектором прямой I. Рассмотрим вектор п= ={Л, В}. Имеем
(а, п)=—ВЛ4-ЛВ—0.
Следовательно, вектор п перпендикулярен вектору а. Проведем через точку Мо прямую 1\ перпендикулярно прямой I. Точка Aft пересечения этих прямых и будет основанием перпендикуляра,, опущенного из Мо на /. Параметрические уравнения (3) прямой li имеют вид
x=x0 + tA,
y=y0 + tB.
Пусть точка Afj имеет координаты (xi, yi). Эти координаты получаются по формулам (21) при некотором значении ti параметра t. Поскольку Mi^l, имеем
(хо + ^М)+& (Уо + W + С—0.
Отсюда
. ___ Лх0 -f- Ву0 4- С
1	. Л24-в2
(21>
(22}
(5) прямой нормировано, если
(5) всегда можно перейти к
Вектор МуМъ соединяющий точку М0(х0, yv) с точкой М^Хо + ^Л, Уо + tiB), имеет координаты {^Л, /ХВ}. Следовательно, р(М0,1)— — I М0М1 I = I [ /Л8 4- В8=(согласно (22)) =1Л	t С1, что и тре-
бовалось доказать.
Скажем, что общее уравнение
Л24-В2=1. От общего уравнения эквивалентному нормированному
А	в t/ ______________
У А2 4- в2 * + У А2 + В2	У А2 4- В2
С
0.
(23)
Таким образом, предложение 16.1 можно переформулировать следующим образом:
Расстояние от точки до прямой равно (по абсолютной величине) результату подстановки координат этой точки в левую часть-нормированного уравнения этой прямой.
54
§ 17.	УРАВНЕНИЯ ПЛОСКОСТИ
Утверждения о плоскости в пространстве аналогичны утверждениям о прямой на плоскости. Основное отличие — в размере формул: на один вектор, на одно уравнение, на одну координату, на одно слагаемое больше. Поэтому при выводе формул, касающихся плоскости в пространстве и принципиально не отличающихся от формул для прямой на плоскости, опускаем некоторые детали.
Что такое плоскость в пространстве? Мы знаем (§ 8), что на плоскости существуют два линейно независимых вектора, через которые линейно выражается любой вектор, лежащий в этой плоскости. Более того, любые два линейно независимых (неколлинеарных) вектора образуют базис в пространстве векторов на плоскости (§ 9).
17.1.	Предложение. Пусть в плоскости л даны точка Мо и два не коллинеарных вектора а и Ь. Тогда точка М принадлежит плоскости п в том и только в том случае, когда существуют такие числа и и v, что
M0M = ua+vb.	(24)
Доказательство. Точка М лежит в плоскости л тогда и только тогда, когда вектор MqM параллелен плоскости. Это по определению означает компланарность векторов а, Ь, MqM. А последнее в силу неколлинеарности векторов а и b эквивалентно тому, что вектор AfoAf линейно выражается через векторы а и Ь. Предложение 17.1 доказано.
Равенство (24) представляет собой уравнение плоскости в векторной форме. Оно имеет описательный характер и утверждает в основном, что плоскость однозначно определяется лежащими в ней точкой и двумя неколлинеарными векторами.
Зафиксируем в пространстве начало О. Обозначим через г0 и г радиусы-векторы точек А1о и А1 соответственно. Тогда уравнение (24) принимает вид
г—го=ыа+Ыэ,
.........................................................• -ч ИЛИ......................................................’
г=го+«а+оЬ.	(25)
Это также векторное уравнение плоскости (рис. 30).
Возьмем теперь в пространстве аффинную систему координат Оху г. Пусть в этой системе координат точки и векторы имеют соответственно координаты
Af0(xQ,yo,Zo), M[x,y,z), а={аь Оз}, Ь={Ьь Ь2, Ь3}.
55
Переходя в уравнении (26) от равенства векторов к равенству их координат, получаем
x—Xo + uai + vbj,' y=y0 + uai+vb2, z=z0+003+^3.,
(26>
Это параметрические уравнения плоскости.
Система уравнений (26), или эквивалентная ей система
х—х0=uat+vblt у—Уз=иаз + оЬз, 2 — 20=иОз + уЬ3,
выражает линейную зависимость столбцов матрицы
X—х0
У—Уо (к Ь3 z—z0 (I3 Ьа
что в свою очередь эквивалентно равенству
X—х0 01 Ь,
У—Уо z~~zn
Оз	а3
^2	^3
= 0,
(27>
или (после раскрытия определителя по первой строке) уравнению
A (x—Xq) +В {у—у о) + С (г—20),
(28)
где
а*
°3 с___________
bi b^
(29}
56
Равенство (27) является уравнением плоскости, проходящей через точку Мо(хо,уо,г0) и пару неколлинеарных векторов а=(вь о2, а3} и b={i>b b2, Ь3}.
Пусть теперь в плоскости даны три точки Mtfx,, yi, zi), i=
— О, 1,2, не лежащие на одной прямой. Положим a=Af0Afj и Ь= =Af0A42. Тогда уравнение (27) принимает вид
X Хо
Xj—х0 х2 х0
У ~Уо z — г0
У1—Уо 21—г0
У% Уй Z2 Z0
=0.
(30)
Это уравнение плоскости, проходящей через три точки с координатами (Xo,yO,ZO), (ХЬ l/bZ]), (х2, t/2, Z2).
Вернемся к уравнению (28). Полагая D=—Ах0—Ву0—Cz0, запишем его в виде
Ax+By+Cz+D = 0.	(31)
Это есть общее уравнение плоскости. Из непропорциональности векторов а и b вытекает, что по крайней мере одно из чисел А, В, С, определенных равенствами (29), отлично от нуля. Значит, общее уравнение плоскости есть уравнение первой степени, а плоскость, таким образом, является поверхностью первого порядка.
Верно и обратное утверждение: всякое уравнение (31) первой степени является уравнением плоскости. В самом деле, предположим, что А#=0, возьмем точку Л40(—D/А, 0, 0), векторы а= = {—В/А, 1, 0), Ь={—С/А, 0,1} и покажем, что плоскость я, проходящая через точку Л40 и векторы а и Ь, совпадает с множеством решений уравнения (31). Уравнение (27) плоскости я имеет вид
(32)
Таким образом, уравнение (31) и задающее плоскость л уравнение (32) пропорциональны.
Итак, нами доказана
17.2.	Теорема. Плоскости в пространстве — это в точности поверхности первого порядка.
57
§ 18.	ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПЛОСКОСТЕЙ. ПОЛУПРОСТРАНСТВА
18.1.	Предложение. Вектор а={а, р, у} параллелен плоскости л, задаваемой общим уравнением (31), тогда и только тогда, когда
Ла+Вр+Су = 0.	(33)
Доказательство. Вектор параллелен плоскости тогда и только тогда, когда вместе с его началом плоскости принадлежит и его конец. Отложим вектор а от точки Mq(xq, yQ, z0) плоскости л. Тогда его конец Mi имеет координаты (х0+а, #о+Р> z0+y). Таким образом, параллельность вектора плоскости равносильна равенству
Л (%о+ ос) + В (t/o+Р) + С (zo+y) +Z) = 0,
которое с учетом условия
Л Xq+Вуо+ Czq+D = О
принадлежности точки Л10 плоскости л эквивалентно равенству (33). Предложение 18.1 доказано.
18.2.	Предложение. Плоскости Л1 и лг, соответственно заданные своими общими уравнениями
Л1Х4~ В\у+С iZ+D = 0	(34)
и
А2Х+В2У 4~ C2Z+D2=0,	(35)
параллельны в широком смысле слова (не пересекаются как множества или совпадают) тогда и только тогда, когда
(36)
А2 В2 С*2
Доказательство. Достаточность вытекает из 18.1. Проверим необходимость. Предположим, что Л1=#0. Тогда векторы
а={—Bi/Ль 1,0} и Ь = {—Ci/ЛьО, 1}
параллельны плоскости ль Значит, они параллельны и плоскости Л2. Тогда условие (33) для данных векторов а и b превращается в равенства
а(-4-)+в2=° и М—т4+с*=0
\ Л /	\ Л /
или
А%  В2 и ^2  ^2
Bi Ai	Ci	*
что и требовалось доказать.
58
18.3.	Предл о ж е н и е. Плоскости «1 и лг, заданные общими уравнениями (34) и (35), совпадают тогда и только тогда, когда
<37) /12	t>2	G2	1'2
Доказательство. В проверке нуждается только необходимость. Согласно условию (36) существует такое а, что
{Ль By С1} = а{Л2, В2, С2}.	(38)
Возьмем точку (х0, yQ, 20)ел1 = л2. Тогда
Л1*о+В1У0+	= 0,
Л2Хо + В2У0+ C2Zo+H2 = O.
Умножим второе из этих уравнений на а и вычтем из первого. Получим Di—а£>2=0, что и требовалось доказать.
Из предложений 18.2 и 18.3 вытекает
18.4.	Следствие. Плоскости Л1 и лг, заданные общими уравнениями (34) и (35), параллельны в узком смысле слова (не пересекаются как множества) тогда и только тогда, когда
41__Bi Ci , Di
Аг B2 ~ Сг D2 ‘	( ’
Из предложения 18.2 вытекает
18.5.	Предложение. Плоскости Л1 и л2, заданные общими уравнениями (34) и (35), пересекаются по прямой тогда и только тогда, когда векторы
П1 = {Дь Bi, CJ и п2={Л2, В2, С2} неколлинеарны.
18.6.	Предложение. Пусть плоскости лл и л2, заданные уравнениями (34) и (35), пересекаются по прямой I. Тогда плоскость лз проходит через прямую I в том и только в том случае, когда она задается уравнением
а (Л iX+Biy-\- C1Z+D1) + р (Л2х+^г{/+C22+D2) = 0.	(40)
Это уравнение называется уравнением пучка плоскостей, проходящих через линию пересечения плоскостей (34) и (35). Доказательство предложения 18.6 аналогично доказательству соответствующего предложения 15.3 для прямых.
18.7.	Теорема. Пусть плоскость л задана уравнением (31). Тогда множества Х~ и Х+ всех точек M(x,y,z) пространства, для которых соответственно
Ax+By+Cz+D<0 uAx+By+Cz+D>0, являются полупространствами, ограниченными плоскостью л.
59
Множество Х~ называется отрицательным, полупространством по отношению к уравнению (31) плоскости л, а множество Х+ — положительным, полупространством. Доказательство теоремы 18.7 аналогично доказательству соответствующей теоремы 15.4 о полуплоскостях.
I
§ 19.	ПРЯМАЯ В ПРОСТРАНСТВЕ
Векторные уравнения прямой на плоскости и в пространстве совпадают. Напомним, что уравнение (1)	4
МоМ=ta,
когда параметр t пробегает всевозможные вещественные значения, описывает переменную. точку М прямой I, проходящей через точку Af0 и параллельной ненулевому вектору а.
Если в пространстве фиксировано начало О, то уравнение (2)
г=г0-Ма
описывает радиус-вектор г переменной точки прямой I с направляющим вектором а, проходящей через точку Af0, радиус-вектор которой равен г0.
Пусть в аффинной системе координат Oxyz точка Л40 имеет координаты (х0, у0, z0), а вектор а — {а, р, у). Тогда векторное равенство (2) превращается в систему координатных равенств
х=х0 + а/,' х—Уо + ₽Л z=z0+yt .
(41)
Это параметрические уравнения прямой. Из уравнений (41) вытекает пропорциональность векторов {х—х0, у—Уо, z—z0} и {а, 0, у), которую можно записать в виде
х — х0  у —у0  г — г0	.
а ₽ У
Это канонические уравнения прямой. Здесь надо сделать те же оговорки, что были сделаны относительно канонического уравнения (4) прямой на плоскости. Если, например, а=0, то х—хо=О. Это означает, что прямая лежит в плоскости х=хо и имеет там каноническое уравнение
у —Уч __ z —?о р у
Если же, например, а=₽=0, то прямая лежит в плоскостях х— —хо=О и у—уо=О, т. е. является линией их пересечения.
Если на прямой I кроме точки Мо дана еще точка Afi(xb yit zi)r то в качестве направляющего вектора а можно взять вектор
Л)0Л11 = {Х1—х0, yi—уо, Zi— z0}.
60
Тогда уравнения (42) принимают вид
х — х9  у — уо  2 —z0
У1 Уо — *о
(43>
Это уравнения прямой, проходящей через две точки Af<j' и М\.
Каждая прямая может быть представлена как линия пересечения двух плоскостей. Очевидно, что уравнения (42) эквивалентны системе из двух уравнений первой степени, каждое из которых является уравнением плоскости.
19.1.	Предложение. Если прямая I задана как линия пересечения двух плоскостей ла и п2
Л2х + В^у-\-С2гЦ-Z)2=0, J
(44)
то вектор
а=
А сх
В2 С2
Сг А
с2 А
А А 1
Л2 В2 j
(45)
является направляющим вектором этой прямой. ' Доказательство. Отметим прежде всего, что из 18.5-
вытекает непропорциональность векторов
{Ль ВЬС1) и {А2, В2, С2}.
Поэтому по крайней мере одна из координат вектора а отлична, от нуля. Рассмотрим теперь определитель
А=
1 = 1, 2.
Он равен нулю, так как имеет одинаковые строки. Раскрывая его по первой строке, получаем
А
А А
В2 С2
+А
Су Л, С2 Л2
Л-Су
А в, Л2 В2
Но это равенство является условием (33) параллельности вектора а плоскости m, i= 1, 2. Итак, ненулевой вектор а параллелен каждой из плоскостей Л1 и п2, следовательно, он является направляющим вектором линии их пересечения.
§ 20.	ПЛОСКОСТЬ В ПРОСТРАНСТВЕ С ПРЯМОУГОЛЬНОЙ
СИСТЕМОЙ КООРДИНАТ
Пусть в пространстве дана прямоугольная система координат Oxyz. Условие (33) параллельности вектора плоскости показывает, что вектор п={Л, В, С} перпендикулярен плоскости л, заданной уравнением (31). Его называют нормальным вектором этой.
61
плоскости, а за угол между плоскостями принимают угол <р между их нормальными векторами. Поэтому для угла <р между плоскостями jit и П2, заданными уравнениями (34) и (35), имеем
cos <р = —-..АЛг + ад + СА---------	<4б)
Уа2+в^с^' а22+в22+с22
Условием перпендикулярности плоскостей Л1 и лг является равенство
CiC2=0.	(47)
Угол между вектором а={а, р, у} и плоскостью л есть по определению угол ф между этим вектором и его проекцией на плоскость (рис. 31). Угол этот заключен в пределах от 0 до л/2.
Обозначим через <р угол между вектором а и прямой I, перпендикулярной плоскости л. Тогда
sint|>=cos<p.
Но поскольку направляющим вектором прямой I является вектор п, имеем
cos <р =	1Ла + б£+£11. , , . ,.7:  	(48)
1/Л“ + В2 + С2 ’(/а2 + Р2 + у2
Здесь считаем, что плоскость л задана уравнением (31). Правая часть в равенстве (48) взята по абсолютной величине, поскольку угол <р не превосходит л/2. Итак, угол ф между вектором а и плоскостью л определяется по формуле
|Ла + ВР4-Су|
sin ф =-.	—7==^-- .
УД2 + В2 + С21/а2 + Р2 + у
(49)
В частности, по формуле (49) вычисляется угол между прямой I с направляющим вектором {а, р, у} и плоскостью л.
62
Расстояние от точки Мй(х<ь yQ, Zo) до плоскости л, заданной уравнением (31), определяется по формуле
р(Л10, n)=^t+Jy» + C2b + Dl
Уд2 + в2+с2
(50}
Вывод этой формулы, использующий перпендикулярность вектора {А, В, С} плоскости л, аналогичен выводу формулы (20) для расстояния от точки до прямой.
Глава III.
ПРЕОБРАЗОВАНИЯ КООРДИНАТ. ОРИЕНТАЦИЯ. ВЕКТОРНОЕ И СМЕШАННОЕ ПРОИЗВЕДЕНИЯ
§ 21.	МАТРИЦЫ И ОПЕРАЦИИ НАД НИМИ
Для дальнейшего нам понадобятся некоторые сведения из ал-тебры. Напомним, что прямоугольная таблица
а11 а12 •  • а1п а21 #22 • • • а2п
&т1 &т2 • '• •
О)
чисел, состоящая из т строк и п столбцов, называется матрицей размером тХд,
Матрицами размером 1Хп являются строки
Hat...
или (в более принятых обозначениях)
(аь..., ал).
Матрицами размером /пХ1 являются столбцы ai
При т=п матрица (1) называется квадратной. Квадратные матрицы размером иХп называются матрицами порядка п. В основном мы будем иметь дело с квадратными матрицами, а также со строками и столбцами. Множество матриц размером mXn •обозначаем через Мт,п. Для квадратных матриц используем более короткое обозначение: Мп,п=Мп.
В множестве Мт,п определены операции сложения и умножения на число. Суммой двух матриц
а11 а12 • • • а1п
fell &12 • • • Ь1п
И
В =
&т1 &т2 • • 
Ьт1 &т2 • • • Ьтп
размером тХп называется матрица
А + В=
ап + Ьц а12 +&12 ••• #1П + &177
4”	^т2 4“ ^тп2 ’ • • • ^тп 4” ^тп
64
а произведением матрицы А на число а называется матрица
аА —
аа1г аа12

&ат2

Очевидно, что эти операции удовлетворяют аксиомам 1—8° линейного (векторного) пространства (см. § 5, гл. 1). Записывая строки матрицы А размером тХп последовательно в одну строку длиной тп, получаем изоморфизм между линейным пространством Мт,п и арифметическим /пи-мерным пространством Rmn.
Матрицы размером тХп можно умножать на матрицы размером пХр. Произведением строки А = (aif..., ап) (матрицы размером 1Хл) на столбец
1
(матрицу размером лХ1) является матрица размером 1X1, т. е. число
АВ = Л]Ь1 + ... + апЬп.
В общем случае произведением матрицы
на матрицу
•	• ^ip
•	• ЬПр
является матрица АВ = С размером тХр, у которой стоящий на пересечении ьй строки и /-го столбца элемент сц равен произведению i-й строки матрицы А на /-й столбец матрицы В, т. е.
и
a^kj-	(2)
/?=1
Умножение матриц ассоциативно, т. е. если А, В, С — матрицы, имеющие соответственно размеры тХп, пХр, pXq, то
(АВ)С=А(ВС).	(3)
Это легко выводится из того, что в двойных суммах можно менять порядок суммирования. В самом деле, матрицу в левой ча
3 Зак. 283
65
сти формулы (3) обозначим через D, а матрицу в правой части формулы (3) — через D'. Тогда
Cih
I ' k a
dij ==5j	•
k i
Убирая скобки и меняя в одном из этих равенств порядок суммирования, получаем
dij — d ij.
Операция умножения очевидно дистрибутивна по отношению к сложению, т. е.
Д(В + С)=ЛВ + ЛС,	(4)
(Д + В)С = ДС + ВС,	(5)
где А, В, С — любые матрицы, для которых левые и правые части равенства (4) (соответственно (5)) имеют смысл.
Квадратная матрица
1 0 ... О
Е _ 0 1 ... О
О 0 ... 1
называется единичной матрицей. Она обладает тем свойством, что для любой квадратной матрицы А того же порядка
АЕ = ЕА = А.	(6)
Для матрицы А размером тХп определена матрица Д* размером nXm, называемая матрицей, транспонированной к матрице А (или просто транспонированной матрицей Л*). Она определяется равенством
c*n = Cji.
Легко проверить, что операции транспонирования и умножения матриц связаны следующим образом:
(ЛВ)* = В*Л*.	,	(7)
В алгебре каждой квадратной матрице А сопоставляется число, называемое ее определителем (или детерминантом) и обозначаемое через 1Л1 (или detX). Из курса высшей алгебры известно, что
det (4B)=detX-detB.	(8)
60
Квадратная матрица, определитель которой отличен от нуля, называется невырожденной. Известно, что матрица вырождена тогда и только тогда, когда ее строки (или, что то же самое, столбцы) линейно зависимы. Под линейной зависимостью строк (или столбцов) понимается линейная зависимость их как элементов линейного пространства Rn.
Для каждой невырожденной матрицы А существует единственная матрица, называемая обратной матрицей и обозначаемая символом Л-1, что
ЛЛ->=Л~‘Л=£.	(9)
Из (8) и (9) получаем
det(X->-l-.	(Ю)
det А
Операция перехода к обратной матрице связана с операциями умножения матриц и транспонирования формулами
(ЛВ)-1^-^-1,	1	(11)
(Л*)-1-(Л-1)*.	(12)
§ 22.	ПЕРЕХОД ОТ ОДНОГО БАЗИСА К ДРУГОМУ
В этом параграфе исследуем зависимость между различными базисами векторного пространства V и между координатами векторов в различных базисах. Под векторным пространством читатель может понимать здесь пространство Vect(n), п= 1,2,3, хотя наши рассуждения остаются справедливыми в общем случае. Для этого требуется только
Теорема. Любые два базиса векторного пространства V имеют одинаковое количество векторов.
Эта теорема будет доказана во втором семестре, но в интересующем нас случае V=Vect(n) она доказана в § 9 (предложение 9.3).
Итак, пусть в векторном пространстве V дано два базиса
еь ..., еп и е/,..., е/.
Представив каждый вектор второго базиса е/,е/ в виде линейной комбинации векторов первого базиса, получим
— ^ц.^! £21^2 4“ • • • 4-^/^,
(13)
е ---^1П^1 + ^2п^2 4- • • • 4“^ПП^П‘
Формулы (13) можно переписать в виде матричного равенства
е
Сц С21 • • • СП1
е'
(14)
Сщ ^2п • • • ^пп
3*
67
22.1.	Замечание. Определение произведения матриц можно распространить на случай, когда элементы одной из матриц являются векторами. Произведение таких матриц является матрицей с векторными элементами. При этом считаем, что
аа = аа
для любого вектора а и любого числа а. Из ассоциативности умножения вектора на число (аксиома 6° векторного пространства) вытекает, что для любых трех матриц А, В, С, среди которых одна является векторной, закон ассоциативности умножения (3) остается верным. При перемножении таких матриц, очевидно, остается в силе закон (7) транспонирования произведения.
Транспонируя равенство (14), получаем равенство
(<>  • е„)=<е1.
е»)
£11 £12 • • • £щ
£.ii £/12 • • • £/т
(15)
Матрица
£ц £12
•	• £1и
£/ii £/12
•	• £/1и
называется матрицей перехода от базиса еь..., еп к базису е/,... ..., е/. Столбцами этой матрицы являются координаты векторов нового базиса е/, ...,е/ в старом базисе. Из единственности разложения вектора по векторам базиса (предложение 7.6) вытекает единственность матрицы С перехода от одного базиса к другому.
Введя более короткие обозначения базисов (е) = (еь ..., еп) и (е') = (е/;..., е/), перепишем равенство (15) в виде
(е') = (е)С.	(16)
22.2.	Предложение. Если С — матрица перехода от базиса (е) к базису (е'), a D — матрица перехода от базиса (е') к базису (е"), то матрица CD является матрицей перехода от базиса (е) к базису (е").
В самом деле, из ассоциативности умножения матриц имеем
(e") = (e')D=((e)C)D=(e)(CD).
Из предложения 22.2 вытекает
22.3.	Предложение. Если С — матрица перехода от базиса (е) к базису (е'), то матрицей перехода от базиса (е') к базису (е) является обратная матрица С”1.
22.4.	Предложение. Невырожденные матрицы и только они являются матрицами перехода от одного базиса к другому.
68
Доказательство. Невырожденность матрицы перехода от одного базиса к другому вытекает из предложения 22.3. Пусть теперь (еь ..., ел) — базис и
£ц С12
.. с1п
Сп1 ^п2
• • ^пп
— невырожденная матрица. Тогда векторы е/,..., е/, получаемые из векторов еь ...»еп по формулам (13), линейно независимы, так как в противном случае были бы линейно зависимы столбцы невырожденной матрицы С. Но если в пространстве есть базис, состоящий из п векторов, то всякие п линейно независимых векторов образуют его базис. Предложение 22.4 доказано.
Найдем теперь зависимость между координатами векторов в двух базисах (е) и (е'). Пусть вектор х в базисе еь...,еп имеет координаты xh ..., хп, а в базисе е/,..., е/ — х/,..., хп'. В матричной форме это означает, что
(17)
Пусть С — матрица перехода от базиса (е) к базису (е')- Тогда с учетом равенства (16) равенство (17) переписывается в виде
(18)
Переходя от равенства (18) векторов к равенству их координат, получаем

(19)
Итак, если С — матрица перехода от базиса (е) к базису (е'), то координаты вектора х в этих базисах связаны между собой формулой (19).
§ 23.	ПЕРЕХОД ОТ ОДНОЙ АФФИННОЙ СИСТЕМЫ КООРДИНАТ к другой
Пусть в пространстве даны две аффинные системы координат Oxyz и O'x'y'z', определяемые реперами Oeie2e3 и О'е/ег'ез' соответственно. Пусть С — матрица перехода от базиса (е) к базису (е'), и пусть (аь а2, а3) —координаты нового начала О' в ста
69
ром репере. Предположим, что точка М имеет в этих реперах координаты (х, у, г) и (х', у', z7) соответственно. Тогда векторное равенство
ОМ==ОО;+О'М
по определению координат точки можно переписать в виде
Это равенство с учетом равенства (16) переписывается в виде
Переходя теперь от равенства (20) векторов к равенству их координат, получаем
х
У =С
хг
У' zr
(21)
z
tz3
или в развернутой форме
x=cux' + с12/ + с13г' + а},' у=с21х’ 4- с22у' + c23z' +а2, г=c3lx' + с32у’ + c33z' + а3.
Матрица
С12 С13 а1
^21 ^22 ^23 ^2
^31 ^32 ^33 «3
(22)
(23)
называется матрицей перехода от старой системы координат Охуг к новой системе координат O'x'y'z'. В компактной форме матрицу (23) можно записать в виде (С, а), где
а—
Я1
#2
#3
23.1.	Предложение. Если (С, а) — матрица перехода от системы координат Oxyz к системе координат O'x'y'z', a (D, Ь) — матрица перехода от системы координат O'x'y'z' к системе координат O"x"y"z", то матрицей перехода от системы координат
70
Oxyz к системе координат O"x"y"z" является матрица (CD, Cb + + а).
В самом деле,
§ 24.	ОРИЕНТАЦИИ ПРЯМОЙ, ПЛОСКОСТИ, ПРОСТРАНСТВА
В § 6 мы определили ориентацию прямой, выбрав один из двух классов одинаково направленных ненулевых векторов и объявив их направление положительным. Каждый ненулевой вектор на прямой образует базис, и переход от одного базисного вектора к другому осуществляется путем умножения вектора на отличное от нуля число. При этом одинаково направленные векторы связаны положительным множителем. Это определение ориентации распространяется на векторные пространства большего числа измерений.
Два базиса еь ..., ел и е/, ...,е/ векторного пространства V называются одноименными, если матрица С перехода от одного базиса к другому имеет положительный определитель.
24.1.	Пр едложение. Отношение одноименности ' является отношением эквивалентности на множестве всех базисов пространства V.
В самом деле, рефлексивность отношения одноименности вытекает из того, что переход от базиса к самому себе осуществляется посредством единичной матрицы, симметричность — из предложения 22.3 и формулы (10), транзитивность — из предложения 22.2 и формулы (8).
Поскольку определитель матрицы перехода от одного базиса к другому либо положителен, либо отрицателен (здесь мы рассматриваем векторное пространство над полем R вещественных чисел), в пространстве V существует ровно два класса одноименных базисов. Каждый из этих классов называется ориентацией пространства Ф7.
Интуитивно задание ориентации означает задание направления движения на прямой (слева направо или наоборот), направления вращения на плоскости (по часовой стрелке или против) и винта в пространстве (правого или левого). Так, правая ориентация пространства определяется таким базисом еье2, ез, что вектор ei кратчайшим способом совмещается с вектором при вращении против часовой стрелки, если смотреть на плоскость векторов ei и е2 с конца вектора е3 (рис. 32).
71

24.2.	Предложение. Пусть в пространстве даны два базиса еь е2, е3 и еье2, Сз', различающиеся третьим, вектором. Тогда они одноименны в том и только в том случае, когда
(азпр£е3)>0,
где через л обозначается плоскость, параллельная векторам в]
X
Рис. 32
Доказательство. Пусть вектор е3' имеет в базисе ei, е2, е3 координаты {а, Р, у}. Тогда матрица
1 0 а
О 1 р О 0 у
является матрицей перехода от базиса еье2, е3 к базису е/, е2', е3' и detC = y. С другой стороны, согласно формуле (22) из гл. I
Т=(азпр£е;),
что и завершает доказательство.
Из того, что при перестановке пары строк определитель матрицы меняет знак, вытекает
24.3.	Предложение. Базисы, получающиеся друг из друга перестановкой пары векторов, разноименны.
§ 25.	ОРИЕНТИРОВАННЫЙ ОБЪЕМ ПАРАЛЛЕЛЕПИПЕДА
Пусть в пространстве выбрана ориентация. Базисы, задающие эту ориентацию, назовем положительными.
Для упорядоченной тройки векторов аь а2, а3 определим число
^1, а2, а3),
72
называемое ориентированным объемом параллелепипеда, построенного на векторах аь а2, аз. Это число равно нулю тогда и только тогда, когда векторы аьа2, а3 компланарны. Если же векторы аь а2, а3 линейно независимы, то, отложив их от одной точки О, получим параллелепипед, тремя ребрами которого являются векторы аьа2, а3. Число (аьа2, а3) равно объему этого параллелепипеда, взятому со знаком «плюс», если тройка аьа2, а3 положительна, и со знаком «минус» — в противном случае.
Обозначим через Saja2 площадь параллелограмма, сторонами которого являются векторы а} и а2. Тогда
I а2» а3) I =Saia2-/z,
где h — высота параллелепипеда. Проведем через точку О прямую /, перпендикулярную плоскости векторов и а2, и обозначим через и тот из двух единичных векторов этой прямой, для которого тройка аь а2, и положительна (рис. 33).
Ясно, что
/г=| (аз прпа3) |,
где через прп обозначена ортогональная проекция на вектор п. В то же время из предложения 24.2 вытекает, что знак тройки аь а2, а3 совпадает со знаком (азпрпа3). Поэтому имеет место формула
(ар а2, а3) = 5а1а,-(азпрпа3).	(24)
25.1.	Теорема. Ориентированный объем параллелепипеда обладает следующими свойствами:
1°. (ал а2, а3) = (а3, аг, a2) = Ca2l а3, а^-= —(а2, а1? а3) =
=	(а3, а2, аг) — (ах, а3, а2);
2°. (аг, а2, %а3;=Х(а!, а2, а3);
3°. (ап а2, а' + а;) = (а1, а2, а^-.^а^ а2,а;).
В самом деле, свойства 2° и 3° линейности ориентированного объема вытекают из формулы (24) и теоремы 10.1 о линейности алгебраического значения проекций. Свойство 1° косокоммутатив-ности вытекает из предложения 24.3.
Для подстановки (взаимно однозначного отображения) о : {1, 2, 3}-+{1,2, 3} через (—1)° обозначается знак этой подстановки* т. е.
(	1, если подстановка о четна;
(—1)а =	1
'	(—1, если подстановка а нечетна.
В этих обозначениях свойство косокоммутативности ориентированного объема записывается так:
1°. (ах, а2, а3) = (—1) (aa(i), аа(2), &<цз)}-
25.2.	Замечание. Из косокоммутативности ориентированного объема вытекает, что свойства линейности 2° и 3° выполня
73
ются не только для третьего аргумента, ио также и для первых двух. Таким образом, ориентированный объем параллелепипеда является косокоммутативным трилинейным функционалом (числовой функцией) от трех векторных аргументов.
Пусть теперь в пространстве зафиксирован базис еь е2, е3 (не обязательно положительный), а векторы аь а2, а3 даны своими координатами в этом базисе:
а/ = {х?, X?, х?}, i = 1, 2, 3.
Тогда, воспользовавшись трилинейностью ориентированного объема, получаем
3	3	3
<а1( а2, а3) = (Е х\еь £ xi2e}, £ %звй)== г = 1	/=1	/г-1
3	3	3
==У У У *’1*2X3 (е,-, еъ eft).
1=1 /=1 /г_=1
Из 27 слагаемых этой суммы 21 слагаемое (когда среди трех векторов е/, е/, е& имеется пара совпадающих) заведомо равно нулю. Отбросив эти слагаемые и воспользовавшись косокоммутатив-ностью, получаем
(а1( аг. а3)=^х^1)х°(2’х°(3>( — 1)а<е1, %, е3). СТ
Но	1
2(-l)’x?(1)4(2M(3' = det
1	2	3
Xi Х\ Х\
1	2	3
х2 х2 х2
1 ч 9	?
Хз Хз Хз
Окончательно получаем
(а1, а2»
х\ Xi Xi
Х2 %2 *2
Хз Хз *з
е2, е3).
Если базис еь е2, е3 ортонормирован и положителен, то формула (25) принимает вид
(26)
При выводе формулы (25) мы не пользовались определением ориентированного объема, а исходили только из его косокомму-тативности и трилинейности. Поэтому для любого косокоммута-
74
тивного трилинейного функционала ср имеет место аналогичная формула
Ф(аь а2, а3)=
1	2	3
Х2 -^2 Х2
1	2	3
х3 х3 Х3
ф(еь е2, е3).
(27)
Отсюда, в частности, вытекает
25.3.	Теорема. Всякий косокоммутативный трилинейный функционал ф в Vect(3) пропорционален функционалу ориентированного объема.
В самом деле, коэффициентом пропорциональности является число
<P(ei, е2, е3)
. <ех, е2, е3)
На ориентированной плоскости аналогичным образом определяется ориентированная площадь (аь а2) параллелограмма со сторонами аь а2. Если в положительном ортонормированном базисе еь е2 векторы аь а2 имеют координаты
ai = {x\,y\}, а2 = {х2, у2}, то имеет место аналог формулы (26)
(ап а2) =
*1 У1
*2 У 2
(28)
Ориентированная площадь является косокоммутативным билинейным функционалом, и каждый такой функционал пропорционален функционалу ориентированной площади.
§ 26.	ВЕКТОРНОЕ Й СМЕШАННОЕ ПРОИЗВЕДЕНИЯ
Как и в предыдущем параграфе, считаем, что в пространстве задана ориентация.
26.1.	Определение. Векторным произведением векторов а и b называется такой вектор [а, Ь], что
1)	его длина равна произведению длин векторов а и b на гси-нус угла между ними;
2)	он перпендикулярен каждому йз векторов а и Ь;
3)	он направлен так, чтог упорядоченная тройка а, Ь, [а, Ь] положительна.
26.2.	Определение. Смешанным произведением трех векторов а, Ь, с называется число ([а, Ь], с), равное скалярному произведению векторного произведения векторов а и b на вектор с.
26.3.	Предложение. Смешанное произведение совпадает с ориентированным объемом
([а, Ь], с)=(а, Ь, с>.
(29)
75
Доказательство. Сравним формулу (24) из § 25
(a, b, c)=Sab- (аз прпс)
и формулу (27) из § 11
([а, Ь], с)=|[а, Ь]|-(азпре[а Ь]с).
Для завершения доказательства остается заметить, что согласно 26.1.1
1[а, Ь]|=5аь,
а согласно 26.1.2 и 26.1.3
П = е[а,Ь].
Из предложения 26.3 непосредственно вытекает формула
([а, Ь], с) = (а, [Ь, с]).	(30)
26.4.	Теорема. Векторное произведение обладает следующими свойствами:
1°. [а, Ь] = —[Ь, а];
2°. [а, лЬ]=Х[а, Ь];
3°. [а, Ь.+ с] = [а, Ь]+[а, с].
Доказательство. Проверим свойство 3°. Остальные можно проверить аналогично или извлечь непосредственно из определения. Равенство 3° эквивалентно тому, что вектор
d = [а, b+с]—[а, Ь]—[а, с]
•нулевой. Для этого достаточно показать, что (d, d) =0.
Имеем
(d, d) = ([a, b+c]—[a, b]—[а, с], d) = ([a, b + с], d) — (£а, b], d) — — ([а, с], d) = (согласно 26.3) = (a, b+c, d)—(a, b, d)—(а, с, d) = — (согласно 25.1.3°) =(а, b, d) + (a, с, d)—(a, b, d)—(а, с, d) = 0. Теорема доказана.	,
Векторное произведение в прямоугольных координатах. Найдем координаты векторного произведения [аь а2], если векторы -ai и а2 заданы своими координатами в положительном ортонормированном базисе еь е2, е3:
ai = {xi,
а2={х2, у2, z2}.
Пусть
[аь а2] = {X, Г, Z).
Тогда согласно предложению 12.1
X=([aba2],ei), К=([а1,а2],е2), Z= ([аь а2], е3).
76
Поэтому, исходя из (29) и (26), получаем
--(Др
Xi У1
*2 У 2
1 О
У1 21
Уг 22
Аналогично
21 ХГ
^2 *^2
х2
У1
У2
Z =
Итак,
У1 2i
У 2 ?2
21 Хг
z2 х2
Ч У1 х2 у
или в условной записи в виде определителя
[а15 а2] =
хх уг гх
•^2 У 2 %2
(31)
(32)

аг] — |
§ 27. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ВЕКТОРНОГО И СМЕШАННОГО ПРОИЗВЕДЕНИЙ к ПРЯМЫМ И ПЛОСКОСТЯМ В ПРОСТРАНСТВЕ
Решим сначала задачу взаимного расположения в пространстве двух прямых /1 и h, заданных векторными уравнениями
г=Г1 + /а1, г=г2-На2.	*	(33)
Условием их параллельности является коллинеарность векторов ai и а2, а условием совпадения — коллинеарность тройки векторов аь а2, г2—Г].
Для того чтобы прямые 1\ и /2 лежали в одной плоскости, т. е. пересекались или были параллельны, необходимо и достаточно, чтобы три вектора аь а2, г2—Г! были компланарны, т. е.
(г2—гп а1( а2) = 0	(34)
по определению ориентированного объема.
Отсюда вытекает, что условие
<г2 Гр ар а2)#=0	(35)
эквивалентно тому, что прямые Ц и /2 скрещиваются.
27.1.	Предложение. Расстояние от точки с радиусом-вектором г0 до прямой I
г=Г1 + /а
определяется по формуле
Р(МО, /)= l[r^’ al L	(36)
77
В самом деле, это расстояние равно высоте h параллелограмма, построенного на векторах п—г0 и а (рис. 34). А формула (36) и дает нам эту высоту по правиду «площадь параллелограмма, деленная на длину основания».
Пусть теперь в прямоугольных координатах Oxyz
гй={хй, Уо, Zo},	ylt zj, а={а, 0, у}.
Тогда формула (36) в силу равенства (31) принимает вид
Р(М„, /)=
-1 [\ Vi — Уо
V	1 0
21 — ?0 2 , Zi — Z0
-Г
V Y
%1 —х0 а
xi>— х0 а
У1	— Уо 2 fl
Д/а2 + Р2 + у2
(37)
27.2.	Предложение. Расстояние между скрещивающимися прямыми 1\ и I2 (длина общего перпендикуляра), заданными уравнениями (33), определяется по формуле
р(/п 4)=	' (38)
I [ах, аз]|
В самом деле, это расстояние равно расстоянию между параллельными плоскостями, в которых лежат прямые 1\ и /2. А это расстояние в свою очередь равно высоте h параллелепипеда, построенного на векторах г2—гь аь а2 (рис. 35). Но формула (38) и дает нам эту высоту — объем параллелепипеда, деленный на площадь основания.
Если в прямоугольных координатах
Уь Zi}, аг={аг, ₽г, уг), 1 = 1, 2,
78
то в силу (26) и (31) формула (38) принимает вид
Р(Л> 4)—
(39)
Приведем теперь некоторые векторные уравнения плоскости и прямой в пространстве. Векторное уравнение ,
г—r0=ua+ vb
плоскости, проходящей через точку с радиусом-вектором г0 и параллельной векторам а и Ь, означает компланарность векторов г—г0, а, Ь. Поэтому его можно переписать в виде
(г—г0, а, Ь)=0.	(40)
Воспользовавшись линейностью смешанного произведения, уравнение (40) можно переписать в виде
(г, a, b)+D=0,	(41)
где D=—(г0, а, b). Обозначим вектор [а, Ь] через п. Тогда уравнение (41) можно переписать в виде
(г, п) + П=0.	-	(42)
Это уравнение плоскости через ее нормальный вектор п.
Если в прямоугольной системе координат п = {А,В,С}, а г= = {х, у, г}, то
(г, п)=Ах-\-Ву + Cz,
и уравнение (42) переходит в общее уравнение плоскости. Векторное уравнение прямой I
г—г0=/а
означает коллинеарность векторов г—г0 и а, что эквивалентно равенству
[г—г0, а]=0,	(43)
или
[г, а]=М,	(44)
где
М==[г0, а].	(45)
27.3.	Предложение. Если вектор а ненулевой, а вектор М ему перпендикулярен, то уравнение (44) является уравнением некоторой прямой I с направляющим вектором а.
79
Доказательство. Надо найти вектор г0, удовлетворяющий условию (45). Тогда уравнение (44) будет эквивалентно уравнению (43), описывающему прямую. Положим
Если М=0, то го=О и условие (45), очевидно, выполнено. Если же Му=0, то тройка
а, М, Го
образует ортогональный и по определению векторного произведения положительный базис.
Тогда тройка
Го, а, М
также будет ортогональным положительным базисом. Поэтому вектор [го, а] может отличаться от вектора М только положительным множителем. Но
|[г„ а||_|гоИа!=М=-^=|М|.
Итак, условие (45) выполнено. Предложение 27.3 доказано.
Глава IV
ЛИНИИ ВТОРОГО ПОРЯДКА
§ 28.	АЛГЕБРАИЧЕСКИЕ ЛИНИИ НА ПЛОСКОСТИ.
КВАДРАТИЧНЫЕ ФУНКЦИИ И ИХ МАТРИЦЫ
28.1.	Определение. Множество Г точек плоскости называется алгебраической линией, если в некоторой аффинной системе координат это множество может быть описано как множество решений уравнения
F(x, у)=0,	(1)
где F — многочлен. Наименьшая степень такого многочлена на-зывается порядком линии Г.
28.2.	Замечание. Определение порядка алгебраической линии не зависит от аффинной системы координат, в которой рассматривается ее уравнение (1). Это вытекает из следующего утверждения.
28.3.	Предложение. Пусть Оху и О'х'у' — две аффинные системы координат, связанные между собой формулами перехода
х=СцХ' + с12г/' +ар |	J
У=с21х' + с22/ + а2. J
Тогда степень любого многочлена F(x,y) от переменных х и у совпадает со степенью многочлена
G(x', y') = F(cnx' + с12у' + alf с21х'+ с2,у'+ а2)	(3)
от переменных х' и у'.
Доказательство. Достаточно показать, что степень G не больше степени F. А это вытекает из того, что для любого одночлена ах^у**, входящего в F, многочлен
a (cnxr + с12у' + аг)р (с21х' + с22у' + a2)q
имеет степень +
Если многочлен F(x,y) задает линию Г в системе координат Оху, то всякий пропорциональный ему многочлен а/7, а=#=0, также задает линию Г. Конечно, данную линию можно задать и многочленом более высокой степени, например F2. Но хотелось бы, чтобы многочлены данной степени р, задающие в системе координат Оху линию Г порядка р, были пропорциональны. В таком случае говорим, что для линии Г верна теорема единственности. В § 15 мы уже доказали теорему единственности для линий первого порядка (для прямых). Но уже для линий второго порядка теорема единственности не имеет места. Так, линия второго по
81
рядка, состоящая из одной тбчки, может быть задана непропорциональными многочленами
х2-ру2 = 0 и х24-2г/2 = 0.
Все-таки ниже докажем теорему единственности для линии второго порядка, содержащей более одной вещественной точки.
28.4.	Определение. Отображение	плоскости л в
множество R называется квадратичной функцией, если для любой аффинной системы координат s = Oxy на плоскости л существует такой многочлен Fs второй степени, что для» любой точки М (х, у) ел
f(M)=Fs(x, у).	(4)
Ясно, что в данной системе координат только один многочлен F = FS может удовлетворять условию (4). Скажем, что многочлен F представляет функцию f в системе координат Оху, Пусть
F (х, у) = апх2 + 2а12ху + а22у2 + 2а13х + 2а23г/ + а33.
Тогда матрицу
аи
а13
а12	а13
^22	^23
^23	а33
(5)
(6)
называем матрицей квадратичной функции f в системе координат Оху. Читатель должен обратить внимание на то, что' элементы матрицы А, стоящие вне главной диагонали, равны половинам соответствующих коэффициентов многочлена F.
Матрицу
31 =	а11	а12	(	(7)
а 12 а22
называем матрицей квадратичной части функции f. По крайней мере один из элементов матрицы Ж должен быть отличен от нуля.
Квадратичная часть
(х, у)=апх2 + 2а12ху + а2#
многочлена F(x,y) может быть записана в матричной форме слв' лующим образом:
(8)
.а сам многочлен F(x,y) в матричной форме можно записать так:
F(x, у)=(х, у, 1)4
х
У 1
(9)
.82
Пусть теперь О'х'у' — другая аффинная система координат, и переход от системы Оху к системе О'х'у' осуществляется по формулам (2). В силу единственности многочлена, представляющего квадратичную функцию в данной системе координат, многочлен G(x', у'), определяемый равенством (3), будет представлять функцию f в системе координат О'х'у'.
Найдем матрицу А' функции f в системе координат О'х’у'. Для этого дополним формулы перехода (2) равенством
1 = 0-х/+0-у'+1 • 1.
Получим
х=сих' + с12у' 4-ог1,
У ~ ^21^ 4” ^аУ + ^2 ’ 1> 1 = 0 • х' 0 • у’ -f-1*1,
или в матричной форме
х
х'
У’ >
1
где
Транспонируя равенство (10), получаем (х, у, 1)=(х', у', 1) D*.
(10>
(П)
(12)
Если точка М имеет координаты (х, у) и (х', у') в системах Оху и О'х'у', то, учитывая (9), получаем
х'
(х', у’, 1)4'
у' =G(x', y’)=f(M)—F(x, у)=(х, у, 1)4
1
х
У *
1
Отсюда с учетом (10) и (12) имеем
(х', у’ 1)4'
=(х', у', V)D*AD
Таким образом, равенство
A'=D*AD
х'
У' •
1
(13>
выражает матрицу А' квадратичной функции f в новой системе
83
координат О'х'у' через ее матрицу А в старой системе координат Оху.
Наряду с реперами Oeie2 и O'et'e2', определяющими системы координат Оху и О'х'у', рассмотрим репер Ое/ег'. Пусть он определяет систему координат Ох"у". Тогда формулы перехода от системы координат Оху к Ох"у" отличаются от формул перехода (2) только отсутствием столбца свободных членов, т. е.
х
У
= С
хГ
У"
(И)
а-де
Обозначим через 91" матрицу квадратичной части функции f в системе координат Ох"у". Тогда, рассуждая так же, как при выводе формулы (13), получаем
Поскольку реперы Ое'ге'2 и O'eje^ отличаются только началом, соответствующие системы координат получаются одна из другой параллельным сдвигом, т. е.
х" = х' + &1,
у"=у'+ь2.
Но легко заметить, что при параллельном переносе системы координат квадратичная часть квадратичной функции не меняется. Поэтому, если мы обозначим через 91' матрицу квадратичной части функции f в системе координат О'х'у', то 91'» 91" и согласно (15)
91' = С* 9ГС.	(16)
ч
§ 29.	ОРТОГОНАЛЬНЫЕ МАТРИЦЫ
29.1.	Определение. Квадратная матрица С называется -ортогональной, если
СС* = £.	(17)
Равенство (17) означает, что формальные скалярные произведения различных строк равны нулю, а формальные скалярные квад
84
раты строк равны единице, т. е.
V*	f 1, если i = /;
LCihCik=\	‘
k	I 0, если i =£ /.
(18)
Эквивалентные условия (17) и (18) выражают ортогональность матрицы С по строкам. Из равенства (17) вытекает
С* = С-'.	(19)
Это еще одно определение ортогональной матрицы.
Эквивалентные условия (17) и (18) выражают ортогональность матрицы С по строкам. Из равенства (17) вытекает
С*С=Е	(20)
также является определением ортогональной матрицы. Оно выражает ортогональность матрицы С по столбцам:
скалярные произведения различных столбцов равны нулю, а скалярные квадраты столбцов — единице.
29.2.	Предложение. Произведение ортогональных матриц ортогонально, обратная к ортогональной матрице также ортогональна.
Доказательство. Пусть матрицы А и В ортогональны. Надо проверить условие (17) для матрицы С=АВ. Применяя свойства операций над матрицами из § 21, получаем
(АВ) (АВ)* = АВВ*А* = АЕА* = АА* =Е.
Аналогично для С=Л_| имеем
(Д-,)(Л-1)’=Д-1 (Л*)"1=(А*А)~1 —(согласно (20))=£-1 —£.
Поскольку единичная матрица £, очевидно, ортогональна, предложение 29.2 можно перефразировать следующим образом:
Ортогональные матрицы данного порядка п с операцией умножения образуют группу, обозначаемую символом О(п).
Ортогональные матрицы второго порядка. Поскольку при транспонировании определитель матрицы не меняется, из определения 29.1 ортогональной матрицы вытекает, что ее определитель равен ±1.
29.3.	П редложение. В зависимости от знака определителя ортогональные матрицы второго порядка имеют вид
cosq? —sin ф
5Шф cos ф
или
COS ф $Шф
51Пф —СО$ф
(21)
Доказательство. Пусть ортогональна матрица
сп сп
С21	Г22
85
Воспользуемся свойством ортогональности ее столбцов. Из условия
^, + 4,= ‘
вытекает существование такого <р, что cu=cos(p, 6?2i=sin<p.
Из ортогональности первого и второго столбцов
^11^12	^21^22 ==:0
следует, что	'
c12 = /sin<p, с22 =—/ cos ф.
Далее, из условия
г2 А-с2 =1 е12п °22	1
получаем, что / = ±1. Наконец, если |С| = 1Ч то t=— 1, а если |С| = — 1, то /=1, что и завершает доказательство предложения 29.3.
§ 30.	ПРЕОБРАЗОВАНИЯ ПРЯМОУГОЛЬНЫХ КООРДИНАТ
Здесь мы будем рассматривать прямоугольные системы координат и базисы на прямой, на плоскости и в пространстве.
30.1.	Теорема. Матрица С ортогональна тогда и только тогда, когда она является матрицей перехода от одного ортонормированного базиса к другому.
Доказательство. Пусть С — матрица перехода от ортонормированного базиса еь..., еп к ортонормированному базису е/,..., е/. Тогда
1,	если i = /;
0, если i j.
(22)

(23)
^nl • • • ^пп
имеем	Но в ортонормированном базисе еь..., еп скаляр-
k
ное произведение (е*, е;') равно сумме произведений соответствующих координат этих векторов. Поэтому равенства (22) превращаются в
Lf 1, если i — i;
CklChi = \ „	...
k I 0, если i =/= ]•,
(24)
86
Но это есть условие ортогональности матрицы С по столбцам. Наоборот, если С — ортогональная матрица и еь..., еп— ортонормированный базис, то для базиса е/,..., е/, полученного по формуле (23), условие (24) ортогональности матрицы превращается в условие (22) его ортонормировапности. Теорема доказана.
Из теоремы 30.1 вытекает
30.2.	Следствие. Если равенство
*1
задает переход от прямоугольной системы координат Охх... хп к прямоугольной системе координат (Ух\ ...х^, то матрица С ортогональна. Наоборот, если система координат Охх... хп прямоугольна и матрица С ортогональна, то система координат О'хх'... ... Хп также прямоугольна.
Посмотрим теперь, как преобразуются прямоугольные координаты плоскости. Пусть Oeie2 и Ое/ег' — два ортонормирован-ных репера. Тогда* согласно 30.1 и 29.3 переход от базиса еье2 к базису е/, е2' осуществляется с помощью одной из матриц вида (21). В первом случае
e' = {coscp, sinqp},
е'2={—sing), cosф}
легко видеть, что репер Ое/е2' получается из репера Ое^г по воротом на угол <р (рис. 36).
Рис. 36
87
Во втором случае
e' = {cos<p, sing?},
e^={sinq\ —cos ср}
репер Ое/ег' получается из репера Oeie2 поворотом на угол <р с последующим отражением второго базисного вектора относительно первого (рис. 37).
Таким образом, на плоскости две прямоугольные системы координат Оху и Ох'у' с общим началом связаны между собой либо формулами
,r=x'cosq) — z/'sincp, )	/ЛГХ
J I	(25)
у--х' sin © + у' cos ф J
поворота осей координат на угол ф, либо формулами
х = х' cos ф-]-£/' sin ф, ]
у — х' sin ср— у' cos ф |
поворота осей координат на угол ф с последующим отражением второй оси координат относительно первой. При этом положительным вращением является вращение от оси Ох к оси Оу.
§ 31.	ОРТОГОНАЛЬНЫЕ ИНВАРИАНТЫ КВАДРАТИЧНЫХ ФУНКЦИЙ
Пусть квадратичная функция f в системе координат Оху представляется многочленом
F (х, у) = апх2 + 2а12хг/ + а22у2 +.2а13х + 2ai2y + а33.
Наряду с матрицами А и 31 поставим в соответствие функции f их определители:
«11	«12	«13
A	«22	«23	’
«13	«23	«33
___	«11	«12 4
«12	«22
31.1.	Предложение. Если переход от системы координат Оху к системе координат О'х'у' происходит с помощью матрицы (С, а) и detC = + l, то
Д' = Д и б' = б.
Доказательство. Имеем Д' = det А' — (согласно- (13)) = = det(D‘AZ))=det D* • det А  det D=det A (det D)2=det4 • (det C)2=detA=Д. Аналогично на основании формулы (16) проверяется равенство б' = 6.
88
Из предложения 31.1 и следствия 30.2 вытекает
31.2.	Предложение. Для данной квадратичной функции числа А и д являются ортогональными инвариантами, т. е. они не меняются при переходе от одной прямоугольной системы координат к другой.
31.3.	Пр едложение. Для данной квадратичной функции ортогональным инвариантом является след
S а 11 -р а22
матрицы 31 ее квадратичной части.
Доказательство. Из формулы (16)
ап $12
а'2 а'.2
$и
$12
$21
$22
$п а12	$ц $12
$12 $22	$21 $22
непосредственно вытекает, что
$ц — $11 ^$11$11 + $21 $1г) 4" $21 ($11$12 +$21$22)»
$22 =~$12 ($12$11 4" $22$1г) 4" $22 ($12$12 4“ $£2$22)-
Поэтому, группируя коэффициенты при ац, получаем
S $ц $22	$11 ($11 4“ $^2^ 4“ $22 ($21	$22^
4" 2(712 ($11 $21 "4 $12$22)-$11 4" $22 — *5.
31.4.	Определение. Характеристическим многочленом квадратичной функции f называется многочлен
$11	$12
$12	$2°
SX + 6.
(27)
31 =
Здесь имеется в виду, что
$11	$12 I
$12	$22 I
ecVb матрица квадратичной части функции f в некоторой прямоугольной системе координат Оху. Из 31.2 и 31.3 вытекает, что характеристический многочлен функции f не меняется при переходе к другой прямоугольной системе координат, т. е. он является ортогональным инвариантом. Ортогональными инвариантами являются и корни Xi и Х2 характеристического многочлена квадратичной функции.
§ 32.	ПРЕОБРАЗОВАНИЕ УРАВНЕНИЯ ЛИНИИ ВТОРОГО ПОРЯДКА ПРИ ПОВОРОТЕ ОСЕЙ КООРДИНАТ
Пусть линия второго порядка Г в прямоугольной системе координат Оху задана своим общим уравнением
F (х, у)=$пх2 + 2а12ху + а22у2 + 2а13х+ 2бх23г/ + $33 = 0.	(28)
89
Перейдем к новой прямоугольной системе координат Ох'у', поворачивая оси исходной системы координат на угол ф. Тогда
I х —г х'
I У У'
где согласно (25)
С___ coscp —sin ф
sincp coscp
Многочлен F представляет в системе координат Оху квадратичную функцию f. Для матрицы §1' квадратичной части этой функции в системе координат Ох'у' согласно (16) имеем
coscp " —sin ф | sin ф соэф ।
Непосредственный подсчет показываёт, что
COS ф — sin ф
sin ф
COS ф
^11	^12
#12	#22
31' =
ап — ц31 cos2 ф + 2а12 cos ф sin ф + а22 sin2 ф, а\2—ап sin2 ф—2tz]2 cos ф sin ф + я22 cos2 ф, а'2 = (,— ап + а22) cos ф sin ф + #i2(cos2 ф—sin2 ф).
(29)
Итак, если	то, поворачивая систему координат на угол
Ф, 0<ф<л/2, такой, что
ctg 2ф=	>	(30)
2^12
получаем систему координат, в которой матрица 31' квадратичной части функции f имеет диагональный вид
Уравнение линии Г в этой системе координат Ох'у' принимает вид
#цх' + а^у' + 2^13%'+ 2а2зУЛ + ^зз — 9.	(32)
Найдем этот угол ф по-другому. Считая а' i2 = 0, имеем
а'п созф — а^ со$ф—а'2зшф.
Подставляя в правую часть этого равенства а'н и а'12 из формул
(29) и приводя подобные члены, получаем
аи соз ф=#n cos ф а12 sin ф.
90
Отсюда
di о
(33)
Но в системе координат Ох'у' матрица §1' квадратичной функции f имеет диагональный вид (31). Поэтому числа а'ц и а'12 являются корнями характеристического многочлена (27) функции f в силу его ортогональной инвариантности. Следовательно, равенство (33) можно переписать в виде
6712
(34)
Здесь в качестве X, берется тот из корней характеристического многочлена, для которого tg <р>0. Из ортогональной инвариантности S и б и из того, что а^^О, легко вытекает существование такого корня.
Определим еще одно число, связанное с матрицей (6) квадратичной функции f. Положим
К=
#22	#23
#23	#33
#11	#13
#13	#33
(35)
32.1. Предложение. При повороте осей прямоугольной системы координат число К не меняется.
Доказательство. Подставляя в многочлен F (х, у) вместо переменных х и у их выражения через х' и у' по формулам (25), непосредственным подсчетом убеждаемся в том, что
#i3==#i3cos(p + a23sin ф, «23= ~#1зsin ф + «23 cos ф, #зз~азз-
(36)
Поэтому, применяя формулы (36) и пользуясь инвариантностью S, получаем
К'=а33 (a; j + а'2)—а'з = а335—(а13 cos ф + а,3 si и ф)2 — — (—а13 si п ср + а23 cos ф)2 = а33 (flj! 4- а22)—а23—а23=К.
Легко видеть также, что число К не меняется и при отражении одной оси координат относительно другой. Поэтому для данной квадратичной функции оно является одинаковым во всех прямоугольных системах координат с общим началом. К называется ортогональным семиинвариантом.
§ 33.	ПРИВЕДЕНИЕ УРАВНЕНИЯ ЛИНИИ ВТОРОГО ПОРЯДКА К КАНОНИЧЕСКОМУ ВИДУ
33.1.	Теорема. Для любой линии второго порядка существует прямоугольная система координат, в которой уравнение этой линии имеет один из следующих видов:
1)	хг	у2   а2	Ь2	1,	эллипс]
2)	х2	у2   а2	Ь2	: —1,	мнимый эллипс]
3)	х2 . у2 	 а2	Ь2	:0,	пара мнимых пересекающихся прямых]
4)	X2	у2 t а2	Ь2	1,	гипербола]
5)	х2	у2 _ а2	Ь2	=0,	пара пересекающихся прямых]
6)	у2=2рх,		парабола]
7)	у2—а2=0,		пара параллельных прямых]
8)	z/2 + a2=0,		пара мнимых параллельных прямых]
9)	у2=о,		пара совпадающих прямых.
Доказательство. Без ограничения общности можно считать, что линия второго порядка Г задана в прямоугольной системе координат общим уравнением (28). В § 31 показано, что, поворачивая оси системы координат, можно добиться того, чтобы коэффициент 012 в уравнении (28) стал равным нулю. Теперь параллельным переносом системы координат хотим добиться того, чтобы в уравнении
а1Хх2 + а22г/2 + 2а13 ¥ + 2а23г/ + 033 — 0	(37)
исчезли члены первой степени. Рассмотрим сначала случай 0ц¥3О¥=022-
Выделяя полные квадраты, перепишем уравнение (37) в виде
2	2
/		«13 \2	,	!	I «23 V	1	^13	а23	п
0ц X -г +а22 у-}----------- 4-033------------=0.
\	«Ц /	\	«22 /	«11	«11
Это уравнение после замены переменных
х' = х+ —	у'==у-'Г-23--
«11	«22
и введения новых обозначений можно переписать в виде
апх2 + а22у2 + а33=0.	(38)
Предположим теперь, что в уравнении (37) один из коэффициентов при квадратах переменных равен нулю. Меняя в случае на
92
добности названия переменных, можно считать, что «ц = 0. Тогда после параллельного переноса системы координат вдоль оси Оу
Х' = Х, у' = у-----1^-
а22
уравнение (37) превращается в уравнение вида
а22у2 + 2а13х + а33=0.	(39)
Если П1з¥=0, то после параллельного переноса вдоль оси Ох
х' = х + ~-> У'=У
2д1з
уравнение (39) принимает вид
W2 + 2a13x=0.	(40)
Если же «13 = 0, то уравнение (39) имеет вид
022У2+Дзз = 0.	(41)
Итак, после поворота и параллельного переноса прямоугольной системы координат общее уравнение (28) линии второго порядка приводится к одному из трех видов (38), (40), (41), где числа «и, «22 и «1з отличны от нуля. Но уравнение вида (38) пропорционально одному из уравнений 1)—5), уравнение (40) пропорционально уравнению 6), а уравнение (41) пропорционально одному из трех уравнений 7) —9), Теорема доказана.
33.2.	Замечание. Переименовывая в случае надобности названия осей координат или меняя их направления, можно считать, что
а)	а2>Ь2 в уравнениях 1) —3);
б)	р>0 в уравнении 6);
в)	а2#=0 в уравнениях'7) и 8).
С этими оговорками уравнения 1) —9) называются каноническими уравнениями линий второго порядка.
§ 34.	ОПРЕДЕЛЕНИЕ КАНОНИЧЕСКОГО УРАВНЕНИЯ ЛИНИИ ВТОРОГО ПОРЯДКА ПО ИНВАРИАНТАМ
В предыдущем параграфе мы показали, что, переходя от одной прямоугольной системы координат к другой, можно от общего уравнения (28) линии второго порядка перейти к одному из трех видов (38), (40), (41). Соответственно на три группы разбиваются квадратичные функции, представленные общим многочленом Е(х, у) из уравнения (28) в исходной прямоугольной системе координат. Теперь мы хотим найти канонические представления квадратичных функций
I)	ацХ2 + «221/2+азз,
II)	«22г/2 + 2«1зХ,
III)	022У2 + а33
93
по их ортогональным инвариантам. Матрица А этих функций в канонической системе координат имеет соответственно вид
	ап	0	0
I) А =	0	а22	0
	0	О'	азз
	0	0	а13
II)	6	а22	0
	°13	0	0
	0	0	0
III) А =	0	а22	0
	0	0	азз
Рассмотрим случай I). Он характеризуется тем, что д#=0. При этом в канонической для квадратичной функции системе координат
6 = &ц#22» Д = ^11^22^33’	^'2===^22'
Поэтому уравнение (38) можно переписать следующим образом:
V + ^ + |=0.	(42)
О
Легко видеть, что следующая таблица характеризует линии второго порядка группы I в зависимости от знаков чисел М, ta, Д/б. 
Эллипс	Д sgn Xj = sgn /,2 =# sgn -О
Мнимый эллипс	А sgn = sgn Х2 = sgn — О
Мнимые пересекающиеся прямые	sgn = sgn Z2, Д = 0
Гипербола	sgn Xj =# sgn X2, Д =# 0
Пересекающиеся прямые	sgn	sgn X2, Д = 0
Случай II) характеризуется тем, что
6 = 0, Д=^0
*94
и описывает параболу. В канонической для квадратичной функции системе координат
А	—^22
Поэтому а13=±
Зу2±2
х=0.
и уравнение (40) принимает вид
(43)
Значит, каноническое уравнение параболы записывается следующим образом:
А
S3
х.
(44)
Осталось рассмотреть случай III)
6 = 0, А = 0.
34.1. Предложение. Если 6=А = 0, то К является ортогональным инвариантом.
Доказательство. Надо показать, что К не меняется при замене переменных, связывающих прямоугольные системы координат Оху и О'х'у'. Для этого введем две вспомогательные системы координат Ох"у" и О'х'"у"'. Система Ох"у" получается поворотом системы Оху на некоторый угол, а система О'х'"у"' получается параллельным переносом системы Ох"у" (рис. 38).
Из результатов § 32 следует, что при переходах Оху-+Ох"у" и О'х'"у'"-+О'х'у' число /С не меняется. Поэтому достаточно показать, что К не меняется при параллельном переносе Ох"у"->--+О'х"'у'". При этом мы вольны в выборе системы координат Ох"у". Мы ее получим из Оху поворотом на такой угол, когда коэффициент Л12 в общем уравнении (28) линии второго порядка
95
обращается в нуль (см. § 32). В этой системе координат матрица 31 квадратичной части диагональна
я = ап ° . . О й22
Значит, д = аца22. Поэтому одно из чисел 0ц и а22 равно нулю.
Считаем, что ац = 0. Тогда в системе Ох"у" матрица А имеет вид
#13
О
#22
#гз
#13
#23
#33
О
А = О
Но из А = 0 вытекает, что «13 = 0. Итак, в системе координат Ох"у" наша квадратичная функция представляется многочленом
С (X , У )z==#22^/ “Т” 2«оз£/ 1~ #33*
При параллельном переносе х' = х" + bt у=у" + с
получаем ,
G(x , у ) = d22Z/ Ц- 2 (^22^ г #2з) У I- #22^ “"Г 2^23^ "1"’#33’
Поэтому в системе О'х"'у'" число К имеет вид
гл, ।	#22	#23 Л" #22^
А = |	о .
I #23 Н- #22^ #33 “И 2tl23C #22^
Следовательно, К' — а.,2а33 + 2а22а23с + а2,.:с2 — а23 — 2а2,а23с — а22с2 = = а22азз—a2?J~K- Предложение доказано.
Уравнение (41) можно переписать в виде
Sy2 + A=0. •	(45)
Каноническое уравнение линии второго порядка группы III имеет вид
у2+ЛЛ==0.	(46)
J S2	\
Поэтому получаем при
Л<0 — параллельные прямые,
/С>0—мнимые параллельные прямые, /(=0 — совпадающие прямые.
96
§ 35. ДИРЕКТОРИАЛЬНОЕ СВОЙСТВО ЭЛЛИПСА, ГИПЕРБОЛЫ И ПАРАБОЛЫ
Пусть на плоскости даны прямая / и не принадлежащая ей точка F. Решим следующую задачу: найти на плоскости геометрическое место Г точек М, таких, что
р(М, F) р(М, /)
=е>0.
(47)
Рассмотрим отдельно три случая: е=1, е< 1, е>1.
I.	е= 1. Обозначим расстояние между точкой F и прямой / через р. Введем такую прямоугольную систему координат Оху на плоскости, что ось Ох перпендикулярна прямой I и проходит через точку F, а ось Оу делит пополам перпендикуляр, опущенный из точки F на прямую / (рис. 39). В этой системе координат точ-
ка F имеет координаты (р/2, 0), а прямая I описывается уравнением х=—р/2. Обозначим через (х, у) координаты произвольной точки М нашего множества Г. Тогда
Р(М, F) р(М, I)
(48)
Поскольку F&1, ни числитель, ни знаменатель в равенстве (47) в нуль не обращаются. Поэтому уравнение (48) эквивалентно уравнению
4 Зак. 283
97
которое после приведения подобных членов превращается в каноническое уравнение параболы
у2 = 2рх.	(49)
Итак, парабола (49) является геометрическим местом точек М, равноудаленных от точки F с координатами (р/2, 0) и прямой I, описываемой уравнением х+р/2 = 0. Точка F называется фокусом параболы, а прямая I ее директрисой. Расстояние р между фокусом и директрисой параболы называется фокальным параметром, или просто параметром параболы.
II.	е<1. Обозначим расстояние между точкой F и прямой I через d. Существует такое число а>0, что
< а d—------ае.
с
Поэтому можно ввести прямоугольную систему координат Охуг в которой точка F имеет координаты {ае, 0), а прямая I задается уравнением х-------=0 (рис. 40). Тогда уравнение (47) перепи-
е
сывается в виде
у +	(50>
I а I
X— — е I
Приводя равенство (50) к общему знаменателю и возводя обе части в квадрат, получаем эквивалентное уравнение
(х—ае)2 + у2={ех—а)2.
После приведения подобных членов имеем
(1—е2)х2 + у2=а2{1—е2).	(51)
98
Разделив равенство (51) на правую часть а2(1—е2)=Ь2, получаем каноническое уравнение эллипса
у 2
Л-+-?г=1-	(52)
а* Ь£
Итак, нашим геометрическим местом точек является эллипс (52), где
а=—-—,	е2‘.
1 — е*	г
Точка F(ae, 0) называется фокусом эллипса, прямая х=а/е — его директрисой, число е — эксцентриситетом.
Если эллипс задан каноническим уравнением (52) и не является окружностью (т. е. а>Ь), то, полагая
а
получаем, что этот эллипс является геометрическим местом точек, удовлетворяющих уравнению (47), где точка F(ae, 0) и прямая I (х=а/е) такие же, как и выше.
Окружность
х2 -|- у2 = а2
получается из эллипса (52) предельным переходом при Ь->а. При этом е->-0, фокус переходит в центр окружности, директриса уходит в бесконечность.
III. е>1. Как и в предыдущем случае, вводим такую прямоугольную систему координат Оху, в которой фокус F имеет координаты (ае, 0), а директриса I задается уравнением х-----=0
е
(рис. 41). Это можно сделать, потому что разрешимо уравнение
4*
99
(54)
Повторяя выкладки предыдущего случая для нашего геометрического места точек Г, получаем то же уравнение (51).
Но теперь 1—е2<0. Положив &2= (е2—1)а2 и разделив равенство (51) на правую часть, получаем каноническое уравнение гиперболы
— 1 а2 Ь2
Итак, геометрическим местом точек является гипербола (54), где
а=——, b=a'Ve2—l . е2 — 1
Точка F(ae, 0) называется фокусом гиперболы, прямая х = а/е — ее директрисой, число е — эксцентриситетом.
Если гипербола задана каноническим уравнением (54), то, полагая
„=	1	.	(55)
а
получаем, что эта гипербола является геометрическим местом точек, удовлетворяющих уравнению (47), где точка F имеет координаты (ае, 0), а прямая I — уравнение х=а)е.
Вернемся теперь к каноническому уравнению эллипса (52). Поскольку вместе с точкой (х, у) эллипсу принадлежат и точки (х,—у) и (—х, у), он является фигурой, симметричной относительно осей координат. Поэтому, отражая точку F и прямую I относительно оси Оу, получаем точку F'(—ае, 0) и прямую Г(х— =—а/е), которые также являются фокусом и директрисой эллипса, т. е. точкой и прямой, относительно которых эллипс обладает директориальным свойством (47). Таким образом, у эллипса (52)
100
(a>b) есть два фокуса: левый Ft и правый F2. Они расположены на оси Ох (рис. 42), которая называется фокальной осью эллипса. Поскольку эксцентриситет эллипса е<1, его директрисы — левая Zi и правая 12 — расположены от начала координат дальше, чем вершины эллипса (—а, 0) и (а, 0), расположенные на его фокальной оси. Поэтому директрисы лежат вне основного прямоугольника
—а<х<а, —b<y^.b,
(56)
в котором лежит эллипс.
Гипербола (54) также симметрична относительно осей канонической системы координат. Таким образом, у гиперболы также два фокуса Fi и F2 и две директрисы. Для гиперболы эксцентри
ситет е>\, поэтому ее директрисы Ц и 12 удалены от начала координат на расстояние, меньшее а, они пересекают основной прямоугольник (56) и проходят между центром и соответствующей вершиной гиперболы (—а, 0) или (а, 0) (рис. 43).
§ 36. ФОКАЛЬНОЕ СВОЙСТВО ЭЛЛИПСА И ГИПЕРБОЛЫ
36.1. Теорема. Эллипс (52) есть геометрическое место точек М плоскости, для которых
р(Я Л) + р(М, F2)=2a.	(57)
Здесь точки Fr и F2 имеют координаты (—ае, 0) и (ае, 0), где е=
= —-------< 1 и соответственно Ь=а у 1 —е .
а
Доказательство. Из уравнения (51) имеем
у2=(1-е2) (а2-*2).
101
Поэтому для произвольной точки М(х, у) эллипса имеем р (М, Fj) = V~(x + ае)2 + y2=Yx2 4- 2аех 4- а2е2 4- (1 —е2)(а2—х2)=-=р'гх24-2аех4-а2е24-а2—х2—е2а2-)-е2х2 — Уа2 + 2аех + е2/2 = \а + +ех{ =а-)-ех, поскольку а^|х|. Таким образом,
p(Af, Fi) =а+ех.
Аналогично получаем
р (Л1, F2) = а—ех.
Итак, всякая точка эллипса удовлетворяет уравнению (57). Наоборот, если точка М (х, у) удовлетворяет уравнению (57)
(х + ае)2 4- у2 + ]/(х — ае)2 + у2=2а,
то после переноса одного слагаемого в правую часть и возведения в квадрат получаем
(х 4- ае)2 4- у2=4а2—4а 1Л(х—ае)2 4- у2 4- (х—ае)2 4- у2,
или после очевидных преобразований
(х—ае)2 4- у2 — а—ех.
Еще раз возводя в квадрат, имеем
х2—2аех 4- а2е2 + у2 —а2—2аех 4- е2х2,
или
(1—е2)х2+у2 = а2(1—е2).
Таким образом, всякая точка М(х,у), удовлетворяющая уравнению (57), удовлетворяет и уравнению (51). Поскольку е<1, из уравнения (51) получается каноническое уравнение эллипса (52). Теорема доказана.
36.2. Теорема. Гипербола (54) есть геометрическое место точек М плоскости, для которых
|р(Л4, Fi)-p(M, F2)|=2a.	(58)
Здесь точки /4 и F2 имеют координаты (—ае, 0) и (ае, 0), где е— 6 4> 1 и соответственно Ь=а(/е2—1. а
Доказательство. Так же, как и в случае эллипса, получаем, что если точка М (х, у) принадлежит гиперболе, то
р(Л4, Ft)= |a4-ex|, р(Л4, F2)— |a —ех|.
102
Но теперь, в отличие от эллипса, ас|х|. Поэтому
( —а—ех, р(М Fi)=\
v v (	a + ex,
если x^—a;
если x^a,
p(M,
I a—ex, ^2)=]_	।
v--U сЛ,
если
если
—д; x^a,
откуда и вытекает равенство (58).
Наоборот, если точка Л4(х, у) удовлетворяет уравнению (58), то, преобразуя его так же, как уравнение (57) при доказательстве теоремы 36.1, получаем, что она удовлетворяет уравнению (51). Но е>1, поэтому уравнение (51) эквивалентно каноническому уравнению гиперболы (54). Теорема доказана.
§ 37. КРИВЫЕ ВТОРОГО ПОРЯДКА В ПОЛЯРНЫХ КООРДИНАТАХ
Парабола. Поместим полюс полярной системы координат в фокус параболы, заданной в прямоугольной системе координат Оху каноническим уравнением (49), а полярную ось направим в положительную сторону оси Ох (рис. 44).
В этой системе координат
г=FM=MN=N' F + FMr—р + г cos <р.
Следовательно, в выбранной нами полярной системе координат парабола описывается уравнением
Г=—р----.	.	(59)
1— COS ф
Эллипс. Поместим полюс полярной системы координат в левый фокус эллипса, заданного каноническим уравнением (52), а
103
полярную ось направим в положительную сторону оси Ох (рис. 45). В этой системе координат
x+ea=rcosq>, или x=rcos<p—еа.
Но при доказательстве теоремы 36.1 было показано, что г—а+ех.
Поэтому
r=a-|-e(r cos«p—еа)=а(1 —e2)4-ercos<p, откуда
.Л	(60)
1 — е cos <р
Гипербола. Поместим полюс полярной системы координат в правый фокус гиперболы, заданной каноническим уравнением (54), а полярную ось направим в положительную сторону оси Ох (рис. 46). В этой системе координат
х—ea=rcos<p, или x=rcos<p+ea.
Но при доказательстве теоремы 36.2 было показано, что для точек правой ветви гиперболы
г=—а+ех.
Поэтому
г= — а + е (г cos <р + еа)—а (е2— 1) -J- er cos <р, откуда получаем, что правая ветвь гиперболы описывается уравнением
r— fl (eg— 1)	(61)
1 — е cos q>
104
Фокальный параметр. Пусть Г — эллипс, гипербола или парабола. В канонической системе координат фокусы этих кривых второго порядка лежат на оси Ох, которая называется фокальной осью соответствующей кривой. Проведем через какой-нибудь фокус F кривой Г прямую, перпендикулярную к ее фокальной оси. Эта прямая пересечет кривую Г в двух точках N и N'. Длину полученной таким образом хорды NN' обозначим через 2р. Половина длины этой хорды называется фокальным параметром кривой Г.
Для параболы фокальный параметр совпадает с ее параметром. В самом деле, обозначив через I директрису параболы, имеем (см. рис. 44)
p(F, /)=р(Уь /) = (согласно директориальному свойству параболы) =р(М, F)
Теперь найдем фокальный параметр эллипса и гиперболы. Он равен ординате у точки N (см. рис. 45 и 46). Из уравнения (51).. имеем
у2= (1—е2) (а2—х2),
откуда при x = zk;ea получаем	’ ",
р2=(1_е2)2а2>
или
р= 11—е2|а.
' (62)
Учитывая, что для эллипса и гиперболы
Ь=аУ |1—е2!,
получаем
Равенство (62) позволяет переписать уравнения (60) и (61) единым образом:
. г=—р------.	(64)
1—ecos<p
Поскольку для параболы е=1, уравнение (64) совпадает с уравнением (59) параболы. Таким образом, кривые второго порядка — парабола, эллипс, гипербола (ее правая ветвь) — описываются одним уравнением (64) в полярной системе координат. Левую ветвь гиперболы также можно описать уравнением (64), поместив полюс в левый фокус гиперболы и направив полярную ось в отрицательную сторону оси Ох.
105
§ 38.	ПЕРЕСЕЧЕНИЕ ЛИНИИ ВТОРОГО ПОРЯДКА С ПРЯМОЙ
Рассмотрим линию второго порядка Г, заданную в некоторой аффинной системе координат Оху общим уравнением
F (х, у) = апх2 + 2акху + а22уа + 2а13х + 2а23у + а33=О,
и прямую I, заданную параметрическими уравнениями
Х=Х0 + «Л )
У=Уо + №- J
Найдем точки пересечения прямой I с линией Г. Для этого надо подставить координаты точек прямой I в уравнение, линии Г. Сделав это, получаем относительно параметра t уравнение не более чем второй степени
F2t*+2F{t+Fo=O,	(65)
где
F2=F2(a, P)=aua24-2a12aP4-a22P2,
Р, х0, yo)=a11ax()4-a12(ay()4-pxo)4-a22pyo4-a13a4-a23p, F0=F (х0, у0)=anx2 4- 2а12х0у0 4- a22y2 4- 2a13x0 4-	4- a33.
Скажем, что направляющий вектор а={а, р} прямой I имеет асимптотическое направление по отношению к линии Г, если
ana2 4- 2a12aP 4- a22P2=0.	-	(66)
Отметим, что это определение не зависит от аффинной системы координат, в которой задано уравнение линии Г. В самом деле,
F2(a, p)=(a, P)Sl||“||,
где 31 — матрица квадратичной части квадратичной функции f, представленной в системе координат Оху многочленом F(x, у). Пусть теперь О'х'у' — другая аффинная система координат; (С, а)—матрица перехода от системы Оху к системе О'х'у'-, G (х', у') — многочлен, представляющий функцию f в системе О'х'у'; {а', Р'} — координаты вектора а в новой системе координат. Тогда
“ 1=с|
3 1 I 3'
(а, 0)=(а', ₽')С\
и согласно § 28
31' = С* 31 С,
106
где 91' — матрица квадратичной части функции f в системе координат О'х'у'. Поэтому
G2(a', ₽')=« РЖ Г|=« ₽')С*Э1С|	1 =
I 0' II	I 3' I
=(а, ₽)9l II ° ||=F2(a, Р).
II Э II
Из исследования уравнения (65) для параметра t точек пересечения прямой I с линией Г вытекает
38.1.	Теорема. Если прямая I имеет неасимптотическое направление по отношению к линии второго порядка Г, то I пересекает линию Г в двух вещественных точках (различных или совпадающих) или в двух мнимых точках. Если же прямая I имеет асимптотическое направление, то она либо целиком содержится в линии Г, либо имеет с ней не более одной общей точки.
38.2.	Замечание о комплексной плоскости. В теоремах 38.1 и 33.1 мы говорим о мнимых точках, мнимых прямых, мнимом эллипсе, подразумевая под ними подмножества комплексной плоскости. Комплексной же плоскостью называем арифметическое двумерное комплексное пространство С2, где С — поле комплексных чисел. Таким образом, точками комплексной плоскости являются упорядоченные пары (zi,z2) комплексных чисел. Выбрав на обычной плоскости л аффинную систему координат Оху и отождествив точки Л4ел с упорядоченными парами (х, у) их координат, можем рассматривать вещественную плоскость как подмножество R2 комплексной плоскости С2. Точка (zi,z2) комплексной плоскости называется вещественной, если обе ее координаты Zi и z2— вещественные числа; в противном случае точка (zb22) называется мнимой.
По аналогии с вещественным случаем прямую на комплексной плоскости естественно определить как линию первого порядка, т. е. как множество решений уравнения первой степени
Ах+В у + С = 0.
Если среди всех пропорциональных уравнений
k(Ax+By + C) =0,
задающих прямую Z, имеется уравнение, коэффициенты kA, kB, kC которого вещественны, то прямую I называем вещественной.
Например, прямая
ix+iy = 0
является вещественной, так как она может быть задана уравнением
х+у=0.
107
Прямая
x+iy = O
-является мнимой.
Алгебраическая линия, заданная уравнением
F(x, J/)=0, называется вещественной, если можно найти такое комплексное число ^=/=0, что все коэффициенты многочлена XF(x, у) вещественны. Вещественная линия может не содержать ни одной вещественной точки. В качестве примера можно взять мнимый эллипс
Вещественная линия
_^+^_ = 0
а2 Ъг
имеет единственную вещественную точку (0,0). Эта линия распадается на пару мнимых прямых
X , . у	X	.у	п
—н —,---------1 — = о
a b	а b
и называется парой мнимых пересекающихся прямых.
Точно так же вещественная линия
у2+а2
при а>0 распадается на пару мнимых прямых
y+ia = 0, у—1а=0
и называется парой мнимых параллельных прямых.
38.3.	Предложение. Прямая Ах+Ву+С содержится в линии второго порядка F(x,y)=0 тогда и только тогда, когда многочлен F(x,y) делится на многочлен Ах+Ву+С без остатка.
Доказательство. Достаточность очевидна. Проверим необходимость. Предположим, что ВУ=0, и рассмотрим многочлен F(x, у) как многочлен от у. Тогда
F (х, у) = a22t/2+Ci (х) у+с2 (х),
где С\(х) = 2а12х+2а23, с2(х) = апх2Ч-2а1зх+азз. Положим
D(x, у) =Ах+Ву + С
и поделим F(x, у) на D(x, у) как многочлены от у. Тогда
F (х, у) = G (х, у) D (х, у) + R (х).
Степень многочлена R(x) как многочлена от у меньше степени D(x, у). Поэтому ₽(х) не зависит от у. Нам надо показать, что
108
/?(х)=0. Предположим, что /?(хо)У=О для некоторого х0. Поскольку В=/=0, существует такое у0, что D(x0, Уо) =0. Тогда точка (х0, Уо), будучи на прямой D(x,y)=0, принадлежит линии F(x,y) = = 0. Следовательно,
0 = F (х0, у о) = G (х0, уо) D (х0, у о) + R (х0) = R (х0) #=0.
Противоречие. Аналогично рассматривается случай А^О. Предложение доказано.
Вернемся теперь к асимптотическим направлениям линий второго порядка. Если прямая I имеет асимптотическое направление относительно линии второго порядка Г, то всякий ее направляющий вектор является вектором асимптотического направления. Асимптотическим направлением линии второго порядка Г назовем класс {а: р} всех ненулевых векторов, пропорциональных какому-нибудь вектору а={а, р} асимптотического направления. Такой класс однозначно определяется отношением координат а/р или p/а входящих в него векторов.
Из условия (66), определяющего асимптотические направления, вытекает, что всякая линия второго порядка имеет два асимптотических направления, которые могут быть вещественными и различными, вещественными и совпадающими или мнимыми. В самом деле, по крайней мере один из трех коэффициентов ап, ^12, 022 отличен от нуля. Если 011=^0, то, разделив уравнение (66) на р2, для определения асимптотических направлений {а : р} полу* чаем квадратное уравнение
0ц +2а12 (тг") 4"022=О>	(661)
\ р /	\ р /
откуда
а а12	а 1 2 а11а22
р	а11
Если 022#=О, то для определения отношения а: Р имеется уравнение
0ц + 2а12 (—4" 022	=0,	(662)
\ а /	\ а /
откуда
Р — «12 =t V* Л J 2	а11а12
а	«22
Наконец при 011=022=0 уравнение (66) превращается в
2Я12аР = 0,
откуда получаем
{а : р}= {0 : 1} и {а : р} = {1 : 0}.
109
38.4.	Замечание. Число
ап
Л12
а12
^22
= 1311,
являясь ортогональным, инвариантом квадратичной функции f, может изменяться при переходе от одной аффинной системы координат к другой. Но из формулы (16) вытекает, что при таких переходах не меняется знак этого числа. Более того, при умножении квадратичной функции f на k инвариант 6 умножается на й2. Таким образом, для данной линии второго порядка Г знак числа 6 не зависит ни от аффинной системы координат, ни от уравнения второй степени, с помощью которого она записывается (в § 39 будет доказано, что в общем случае линия второго порядка в данной аффинной системе координат описывается пропорциональными уравнениями), т. е. sgnd является инвариантом линии Г.
38.5.	Определение. Линию второго порядка называем линией эллиптического, гиперболического или параболического типа, если соответственно 6>0, 6<0 или 6 = 0.
38.6.	Теорема. Линии второго порядка характеризуются числом и видом асимптотических направлений:
1)	линии эллиптического типа имеют мнимые асимптотические направления;
2)	линии гиперболического типа имеют различные вещественные асимптотические направления;
3)	линии эллиптического типа имеют совпадающие асимптотические направления.
Эта теорема фактически была доказана при исследовании уравнения (66), поскольку дискриминант квадратного уравнения (661) или (662) есть а212—апа22 = — б, а в случае аи = а22 имеем два различных асимптотических направления и 6 = —<22i2<0.
38.7.	Предложение. Никакие три точки эллипса, гиперболы или параболы не лежат на одной прямой.
Доказательство. Если три точки линии второго порядка лежат на одной прямой /, то согласно 38.1 прямая I имеет асимптотическое направление и целиком содержится в Г. Поэтому эллипс отпадает, поскольку у него вообще нет асимптотических направлений. Асимптотические направления параболы у2 = 2рх определяются из уравнения р2 = 0 и имеют вид {1 : 0}. Прямая такого направления параллельна оси Ох, имеет уравнение у = с и пересекается с параболой по единственной точке (с2/2р, с).
Асимптотические направления гиперболы
х2 у2 __ .
а2	Ь2
определяются из уравнения
а2	Ь2
НО
и имеют вид {а: 0} = {а: ±6}. Прямые асимптотического направления записываются параметрическими уравнениями
x==Z, y=y0± — i. а
Для параметра t точки пересечения прямой и гиперболы получаем уравнение
/	Ь
[ у0 ± t) t* \	al  1
а2	Ь*	9
а после приведения подобных членов
Но это уравнение относительно t имеет не более одного решения, поскольку правая часть отлична от нуля. Предложение доказано.
§ 39.	ТЕОРЕМЫ ЕДИНСТВЕННОСТИ ДЛЯ ЛИНИЙ ВТОРОГО ПОРЯДКА
39.1.	Теорема. Если на плоскости даны пять различных точек t=l,..., 5, из которых никакие четыре не лежат на одной прямой, то существует единственная линия второго порядка, проходящая через эти точки.
Доказательство. Покажем, что для данной аффинной системы координат Оху существует единственный с точностью до пропорциональности такой многочлен F(x,y) второй степени, что координаты точек Mi, i=l, ..., 5, удовлетворяют уравнению F(x,y)=0. Обозначим неизвестные коэффициенты многочлена F следующим образом:
^11 = ^1, 2tl12 = Z2, #22 —2я13 = £4, 2(223 = £б, #33 = ^6’
Пусть точки Mi имеют координаты (х^ yi). Тогда для нахождения коэффициентов многочлена F получаем систему из пяти однородных уравнений с шестью неизвестными Z\,..., zQ
z^xj + z2 Х(У1 + z3t/2 4-ztxt 4- z6y{ + ze=0, i = 1, ..., 5.
Из курса высшей алгебры известно, что такая система имеет ненулевое решение. Более того, решение такой системы единственно с точностью до пропорциональности, если уравнения линейно независимы. Итак, надо показать, что в нашем случае система линейно независима.
Предположим, что это не так. Тогда одно из уравнений системы, например пятое, линейно выражается через остальные. Это означает, что всякая линия второго порядка, проходящая через точки Мь..., М4, проходит и через точку М5. Здесь логически возможны два случая:
111
I)	некоторые три точки из Mh...,M4 лежат на одной прямой;
2)	никакие три точки из Mi,..., М4 не лежат на одной прямой. Рассмотрим первый случай. Пусть точки Afb М2, М3 лежат на одной прямой I. По условию теоремы точки М4 и М$ не лежат на этой прямой. Через точку М4 можно провести прямую т, пересекающую прямую I и не проходящую через точку Л15 (рис. 47). Тогда линия второго порядка, состоящая из двух пересекающихся прямых I и т, проходит через точки Afb..., М4 и не проходит через Л15. Противоречие.
Рассмотрим второй случай. Обозначим через 1ц прямые, проходящие через точки Aft- и Mj. Тогда пара прямых Ц2 и /34 образует линию второго порядка Гь а пара прямых /ц и 12з образует линию второго порядка Гг. Из того, что никакие три точки среди точек М1,..., М4 не лежат на одной прямой, легко извлекается, что Г1ПГ2={Мь М2, М3, М4}. Но по предположению кривая Г,, содержа точки 2ИЬ..., М4, должна содержать и точку М3- Противоречие. Теорема доказана.
39.2.	Теорема. Пусть в некоторой аффинной системе координат Оху уравнения второй степени
F(x,y)=0 и G(x,y)=0
определяют одну линию второго порядка Г, содержащую более одной вещественной точки. Тогда многочлены F и G пропорциональны.
Доказательство. Легко видеть, что на эллипсе, гиперболе, параболе, паре пересекающихся и паре параллельных прямых существуют пять различных точек, никакие четыре из которых не лежат на одной прямой. Поэтому для этих линий второго порядка наша теорема единственности вытекает из теоремы 39.1.
Остается рассмотреть случай, когда Г является парой совпадающих прямых, поскольку остальные линии второго порядка содержат не более одной вещественной точки (см. § 33). Пусть прямая I, из точек которой состоит линия Г, задается уравнением
-J- В у -|- С=0.
112
Тогда согласно предложению 38.3
F(x, у)=(Ах + By + С)(4% + Вгу + Q,
6(х, у)==(Лх+В// + С)(Л2х + В2//4-С2).
Но, поскольку линия Г является парой совпадающих прямых» уравнения Ax + Bzy+Cz=0, Z=l,2, описывают ту же прямую Z. Следовательно, многочлен AiX+Biy+Ct пропорциональны многочлену Ах + Ву+С (см. § 15). Теорема доказана.
§ 40.	ЦЕНТРЫ ЛИНИЙ ВТОРОГО ПОРЯДКА
В этом параграфе, как и всюду в четвертой главе, рассматриваем плоские множества.
40.1.	Определение. Точки Ah и М2 называются симметричными относительно точки Мо (рис. 48), если

(67>
Рис. 48
Условие (67) эквивалентно тому, что точка Af0 делит отрезок М1М2 пополам. В самом деле, из (67) вытекает, что
Тогда
Л41Х=ЯЛ17+ Л^С= 2ЛЩ,,
откуда
М^=-^-М1М2.
Но это и означает, что Мо делит отрезок AfiAf2 пополам.
40.2.	Определение. Точка Af0 называется центром симметрии множества Г, если для всякой точки Ate Г точка М', симметричная точке М относительно точки Af0, также принадлежит Г.
40.3.	Замечание. Если множество Г пусто, то всякая точка является центром симметрии этого множества.
113
40.4.	Теорема. Если точка Мо(хо, Уо) является центром симметрии линии второго порядка Г, содержащей по крайней мере одну точку и определяемой в некоторой аффинной системе координат уравнением второго порядка
F	У) =«цХ24- 2«12ху + #22f/2+2«1зХ-}- 2«2зУ+«33=0,	(68)
то
«цХ0 + «12?/о + «1з=О» ] ,	1 а (	(69)
«12^0 4“ «22^0 + «23-0 • J
Доказательство. Перенесем начало координат в точку /0,;=Л1о(хо, Уо), т. е. перейдем к новым координатам х', у' по формулам
х = х' + хо, у — у' + уо-
Тогда в новой системе координат О'х'у'
«13=«цХ0 + Я12#п + «хз> |
«23 = «12хо + «22У0 + «23 • J
Таким образом, исходная задача сведена к следующей: если 0(0,0)—центр симметрии непустой линии второго порядка, то «13 ~ «23 = 0.
Возьмем произвольно точку	Тогда по определе-
нию центра симметрии имеем ЛГ2(—хь—У1)еГ. Следовательно, 0 = F(xi, r/i)— F(—xj, —t/i) =4а13х1 + 4«2з#1.
Следовательно, если «1з=/=0 или а2з¥=0, то вся линия Г лежит на прямой
«1зх+а2зУ = 0.
Тогда Г — либо пара совпадающих прямых, либо пара мнимых пересекающихся прямых. В первом случае согласно теореме 39.2
F(x,y) =й(«1зх+«2зУ)2.
Но это противоречит тому, что линейная часть «1зх+«2зУ многочлена F отлична от нуля.
Во втором случае точка 0(0,0) также принадлежит Г, значит, «зз = О. Пересечение оси Ох с линией Г описывается уравнением F(x, 0) =0, т. е.
«цХ2+2«1зХ = 0.	(71)
Из условия ОхПГ = {О(0,0)} вытекает, что уравнение (71) имеет единственное решение х = 0. Но пара мнимых пересекающихся прямых является линией эллиптического типа. Значит, в нашем случае 6>0, в частности «цУ=0. Следовательно, из единственности решения уравнения (71) вытекает, что «13 = 0. Аналогично показывается, что «23=0. Теорема доказана.
114
40.5.	Определение. Если координаты точки М0(х0,у0) удовлетворяют системе (69), то точка Af0 называется центром линии второго порядка (68).
Покажем, что это определение не зависит от аффинной системы координат, в которой рассматривается уравнение линии второго порядка. То, что точка М0(х0, Уо) удовлетворяет системе уравнений (69), в матричной форме можно переписать следующим образом:
0 0 d
(72>
где
flll °12 а13
012 О22
О1з о23 а33
d=а1?х3 4- а23у0 + а33.
Пусть теперь О'х'у' — другая аффинная система координат и переход от системы Оху к системе О'х'у’ осуществляется по формулам (2) из § 28. Пусть точка Мо имеет в системе О'х'у' координаты (х0', Уо') - Тогда
=(согласно (13))=D*t1D
Хо
Уо
= (согласно (Ю))=
Таким образом, если координаты (хо, Уо) точки Л1о в системе Оху удовлетворяли системе уравнений (69), то координаты (хо', Уо') лой же точки в системе О'х'у' удовлетворяют аналогичной системе уравнений
а 1Л + а 12У0 а 1 з ~ 0»
а12^0 ^22% “1“ ^23 = 0•
40.6.	Предложение. Всякий центр линии второго порядка является центром ее симметрии.
Доказательство. Пусть Mo(xo,Уо) — центр линии второго порядка Г, описываемой уравнением (68). Тогда, осуществив параллельный перенос начала координат в точку Л40, получаем согласно (70) и (69), что а/1з=а/2з = 0. Это означает, что для многочлена G(x',y'), соответствующего многочлену F(x,y) в системе О'х'у', имеем G(x',y') = G(—х',—у'), т. е. новое начало
115
координат является центром симметрии нашей линии Г. Предложение доказано.
Из определения центра вытекает, что линия второго порядка может:
I.	иметь один центр (система (69) имеет единственное решение) ;
II.	иметь прямую центром (уравнения системы (69) пропорциональны);
III.	не иметь центров (система (69) несовместна).
40.7.	Теорема. Вышеперечисленные варианты количества центров линии второго порядка характеризуются следующим образом:
I.	6=^0;
II.	б=.Д = О;
III.	6 = 0, Д=#0.	;
Доказательство. I. Согласно § 15 прямые
ЯцХ+ 012^ + 013 = 0 И <Z12X+fl!22l/ + a23 = 0
пересекаются по одной точке тогда и только тогда, когда
&12	а22
я это эквивалентно тому, что 6=Н=0.
II. Если уравнения системы (69) пропорциональны, то пропорциональны первые две строки матрицы А и, следовательно, 6 = 0 = А. Пусть теперь 6 = 0=А. Из условия 6 = 0 вытекает, что по крайней мере один из коэффициентов ап и а22‘отличен от нуля. Предположим, что ац*=£0. Тогда в силу пропорциональности строк матрицы 91 существует такое число k, что
ai2=^an, o22=ftai2.	(73)
Раскроем определитель А по третьей строке:
=(согласно (73) и 6=0)=(&а13—о23)
#12 #23
Тогда, если ka^—023 = 0, то в силу (73) уравнения системы (69) пропорциональны.
Если же
#п #1з
#12 #23
= 0,
то с учетом неравенства оц¥=0 вторая строчка этого определителя получается из первой умножением на некоторое число, которое согласно (73) равно k. Следовательно, снова а2з=^О1з.
116
III. Утверждение является следствием двух рассмотренных случаев. Теорема доказана.
§ 41. АСИМПТОТЫ И СОПРЯЖЕННЫЕ ДИАМЕТРЫ ЛИНИЙ
ВТОРОГО ПОРЯДКА
Асимптоты. 41.1. Определение. Асимптотой линии второго порядка Г называется всякая прямая асимптотического направления, проходящая через центр линии Г.
41.2. Пр едложение. 1) Гипербола и пара пересекающихся прямых имеют две асимптоты.
2) Параллельные прямые (различные, совпадающие и мнимые) имеют одну асимптоту.
3) Остальные линии второго порядка асимптот не имеют.
Доказательство. Утверждения 1) и 3) вытекают из классификации линии второго порядка по числу асимптотических направлений и центров (теоремы 38.6 •» 40.7). Утверждение 2 вытекает из того, что, как легко видеть, линия центров параллельных прямых у2 = с имеет асимптотическое направление.
Уравнение гиперболы в асимптотах. Рассмотрим гиперболу Г, заданную каноническим уравнением
х2 у2 _ |
а2 Ь2
в некоторой аффинной системе координат Оху. Асимптотические направления {а: р} этой гиперболы находятся из уравнения
а2 Ь2
откуда получаем два решения;
{а:р) = {а:6}, {а:р} = {а:—Ъ}.
Центр гиперболы находится в начале координат. Следовательно, асимптоты гиперболы имеют уравнения
——^-=0, а	b	— + ^-=0.	/	(74) a	b	I
Перейдем к новс , х У х'=	 а	b Тогда уравнение f_x	у_\ /_ \ а	b ) \	>й системе координат О'х'у', полагая , х . у	' у =—+-?-•	/ а	о	1 ; гиперболы	/ - +	= 1	/	(75) а	b )	/
в новых коорди х'/=1.	натах записывается следующим образом: /	(76)
117
Оси новой системы координат являются асимптотами гиперболы (рис. 49), а уравнение (76) называется уравнением гиперболы в асимптотах.
Асимптоты гиперболы на самом деле являются ее асимптотами в том смысле, что точка М гиперболы, перемещаясь по одной из ее ветвей в бесконечность, становится сколь угодной близкой к одной из ее асимптот. В самом деле, покажем, что, когда точка Af(*o, Уо) перемещается по верхней части правой ветви гиперболы в бесконечность, ее расстояние от асимптоты I
2L_JC=0
а b
стремится к нулю. Согласно § 20 имеем
р(Я /)
|&х0 —а//о|
У^+Т2 *
В то же время из (75) вытекает, что
Ьх0—ау0
а2Ь2 .
bxQ + ау9*
Поэтому, поскольку хб, Уо>О, расстояние
/Л/Г /\	а262
р(М, Г)= —7	_—\---------
У«2 + ь2 (Ь^ + ауь)
ОТ ТОЧКИ М (Хо, Уо) до прямой I стремится к нулю при Хо, Уо~*~ + °О.
Сопряженные диаметры и сопряженные направления. В § 38 мы выяснили, что пряма^ I неасимптотического направления пересекает линию второго поДядка Г в двух точках и М2 (различных, совпадающих или комплексно сопряженных). Пусть Мо — середина отрезка (хорды) МiM2. Решим задачу отыскания всех се
118	\
редин хорд, параллельных данному неасимптотическому направлению.
Пусть линия Г задана общим уравнением F(x,y)=0 в аффинной системе координат Оху, а прямая / неасимптотического направления задана параметрическими уравнениями
x = x0+af, y=yo+$t.	(77)
Предположим, что точка Af0(x0, уо) является серединой хорды Л41Л42, высекаемой линией Г на прямой I. Пусть координаты точек Л4, и М2 получаются из уравнений (77) при значениях параметра t=tt,t2 соответственно. Поскольку точка Мо является серединой хорды AliAb, а ее координаты (хо, уо) соответствуют значению параметра /=0, имеем
t\ -нь=о.
Но значения Л, t2 находятся из уравнения (65). Поэтому по теореме Виета
Л = Лиахо + Я12 (а«/о + ₽хо) + «22РУ0 + а1за + а23₽ = 0 •
Перегруппировывая члены этого уравнения, получаем, что всякая середина М (х, у) хорды неасимптотического направления {а : р) удовлетворяет уравнению
a (aux + а12у + a13) + Р (a12x+а22у + a23)=0.	(78)
Это есть уравнение первой степени. В самом деле, если
aau + Pa12=0, aa12 + Pa22=0,	(79)
то направление {а: р) асимптотическое, поскольку равенства (79) эквивалентны матричному равенству
(а, Р)
ап ап
а12 а22
=(0, 0).
Таким образом, нами доказано
41.3	. Предложение. Все середины М(х,у) хорд данного неасимптотического уравнения {а: р} лежат на прямой (78).
Эта прямая называется диаметром линци второго порядка Г, сопряженным данному неасимптотическомУ направлению {а: р). Прямая (78) согласно условию (69) проходит через все центры линии Г, поэтому она и называется диаметром этой линии. На рис. 50, 51 и 52 изображены диаметры эллипса, параболы и пары параллельных прямых.	/
Определение диаметра, сопряженного данному неасимптотическому направлению линии Г, не зависит от аффинной системы координат Оху, в которой мы рассматриваем уравнение этой
119
Рис. 51
Рис. 52
линии. В самом деле, уравнение (78) сопряженного диаметра в матричной форме можно записать следующим образом:
х
(а, Р, 0)4 у =0.
1
(80)
Для другой аффинной системы координат О'х'у', связанной с системой Оху формулами перехода (2), легко видеть, что
(а, ₽, 0) = (а', ₽', 0)Д*,
где D — матрица (11) из § 28. Поэтому, учитывая равенства (10) и (13) из § 28, получаем
х'
У' 1
Итак, условие (80) влечет выполнение аналогичного условия и в системе координат О'х'у'.
41.4	. Определение. Направления ai={ai, Pi) и а2= = {а2, Рг) называются сопряженными относительно линии второго порядка Г, заданной в аффинной системе координат Оху общим 'Уравнением F= (х, у) =0, если
аиаха2 + а12 (ахР2 + рха2) + а22р1р2=0.	(81)
120
Это уравнение в матричной форме можно записать следующим образом:
(«ь Pi) 81
а2
₽2
= 0.
(82)
Мы знаем, что при переходе к новой системе координат О'х'у' координаты векторов изменяются по правилу
(а, ₽) = (<₽') С*.
Поэтому согласно (16) условие (82) выполняется и в системе координат О'х'у'. Таким образом, определение сопряженности направлений а] и &2 не зависит от аффинной системы координат, в которой мы рассматриваем уравнение линии Г.
Асимптотические направления (§ 38) — это направления, которые сопряжены самим себе, т. е. самосопряженные направления. Направление, сопряженное любому направлению, называется особым направлением данной линии второго порядка.
41.5	. Предл оже н ие. Особые направления — это асимптотические направления параболических линий. Для остальных линий каждому направлению сопряжено ровно одно направление. Доказательство. Возьмем произвольное направление {cti : 01} и найдем все сопряженные ему направления {аг: 02} относительно данной линии второго порядка Г из уравнения (81). Оно является однородным уравнением первой степени относительно неизвестных а2 и 02. Поэтому согласно записи (82) этого уравнения оно имеет единственное с точностью до пропорциональности решение, если
(<*i, ₽1)Э1 #=(0, 0),	(83)
а в противном случае всякое направление является его решением. Но если 6=| 21 |^=0, то выполняется условие (83), поскольку в противном случае строки матрицы 21 линейно зависимы с коэффициентами си и 0ь Это нам доказывает вторую часть предложения 41.5.
Что касается первой части предложения 41.5, то в силу самосопряженности особого направления достаточно проверить, что асимптотическое направление {си : 0J параболической линии явь ляется особым. Поскольку условие сопряженности направлений не зависит от системы координат, достаточно рассмотреть уравнение параболической линии
У2=Я(х)
в канонической системе координат, где //(х)—многочлен степени <1. Тогда
0 0
0 1
, {cq :₽!>={!: 0}
121
и
(аь	О).
Предложение 41.5 доказано.
41.6	. Пр едложение. Направление диаметра, сопряженного направлению {а : р}, сопряжено этому направлению.
Доказательство. В качестве направляющего вектора прямой (78) можно взять вектор
е={аа12 + Ра22, — аап—ра]2}.
В то же время
(а, Р)Э1=(ааи + ра12, аа12 + ра22).
Поэтому согласно (82) вектор е сопряжен вектору {а, р}. Предложение 41.6 доказано.
41.7	. Предложение. Для центральной линии Г любая прямая неасимптотического направления, проходящая через центр, является диаметром, сопряженным некоторому направлению.
Доказательство. Пусть а — направляющий вектор данной прямой I неасимптотического направления. Согласно 41.5 существует единственный с точностью до пропорциональности вектор Ь, сопряженный вектору а. Вектор b не может быть асимптотического направления, поскольку в противном случае ему были бы сопряжены по крайней мере два различных направления: а и Ь. Рассмотрим существующий согласно 41.3 диаметр т, сопряженный направлению Ь. Тогда в силу 41.6 вектор а является направляющим для прямой т. Кроме того, диаметр т проходит через центр линии Г и, следовательно, совпадает с прямой /. Предложение 41.7 доказано.
§ 42.	ГЛАВНЫЕ НАПРАВЛЕНИЯ И ГЛАВНЫЕ ДИАМЕТРЫ ЛИНИЙ ВТОРОГО ПОРЯДКА. ОСИ СИММЕТРИИ
Главные направления. 42.1. Определение. Направление {а : р) называется главным направлением линии второго порядка Г, если оно перпендикулярно некоторому сопряженному ему направлению.
Примером главного направления является особое направление, поскольку оно сопряжено любому, в частности перпендикулярному, направлению.
Рассмотрим на плоскости прямоугольную систему координат и найдем все главные направления {а: р) линии Г, заданной общим уравнением F(x, «/) =0. Если вектор {а, р) имеет главное направление, то он сопряжен с перпендикулярным вектором {—р, а). Тогда условие (81) сопряженности направлений выглядит следующим образом:
ai2cc2+ (а22—fln)ccp—ai2p2=0.	(84)
122
Итак, все главные направления {а: р} линии Г в прямоугольной системе координат находятся из уравнения (84).
Назовем обобщенной окружностью линию, которая имеет каноническое уравнение
х*+у*=с.	(85)
Если с>0, то это окружность радиуса ]/с, если с=0 — окружность нулевого радиуса (в нашей терминологии — пара мнимых пересекающихся прямых), если с<0 — окружность мнимого радиуса (мнимая окружность).
В другой прямоугольной системе координат уравнение обобщенной окружности может отличаться от уравнения (85) только членами первой и нулевой степени. В самом деле, мы знаем, что матрица квадратичной части при переходе к новой системе координат изменяется по правилу
9Г=С*91С.
Но в нашем случае 31 =£, а С — ортогональная матрица как матрица перехода от одной прямоугольной системы координат к другой. Следовательно,
9('=С*£С=£.
Таким образом, в прямоугольной системе координат общее уравнение линии второго порядка является уравнением обобщенной окружности тогда и только тогда, когда
^11=:^22,	012=0.	(86)
Поэтому из (84) вытекает
42.2.	Предложение. Для обобщенной окружности любое направление является главным.
Наряду с этим имеет место
42.3.	Предложение. Если линия второго порядка Г не является обобщенной окружностью, то у нее существует ровно два взаимно перпендикулярных главных направления.
Доказательство. Если 012=0, то уравнение (84) имеет с точностью до пропорциональности два решения:
{а : р}={1 : 0), {а : ₽}={0 : 1}.	(87)
Если же П12=^0, то, разделив уравнение (84) на р2, получаем
а	«и — «22 ± V («и — «22)2 + 4а f2	й
Непосредственная проверка показывает, что скалярное произведение векторов
{«1, ₽1}={ац—ам + ]/\ап—а22)* + 4а212, 2а1г]
123
и
{а2, Р2} = {а11	#22	(#11-Л22)2Н"4Л|2» 2л12|
равно нулю, т. е. полученные главные направления перпендикулярны. Предложение 42.3 доказано.
Из (87) вытекает, что для линий, заданных каноническими уравнениями (Л12=0), главные направления — это направления, осей координат.
Главные диаметры и оси симметрии. 42.4. Определение. Диаметр линии второго порядка называется главным, если он сопряжен с перпендикулярным ему направлением.
Направление главного диаметра, очевидно, является главным. Обратное неверно: направление, перпендикулярное особомоу, является главным, но не есть направление главного диаметра.
В то же время имеет место
42.5.	Предложение. Для центральной линии Г всякое главное направление является направлением главного диаметра.
Доказательство. Согласно 41.7 достаточно убедиться в том, что главное направление не является асимптотическим. Но главному направлению сопряжено перпендикулярное направление, в tq время как в силу предложения 41.5 асимптотическому направлению центральной линии сопряжено оно само.
На главном диаметре согласно предложению 41.3 лежат все середины хорд перпендикулярного направления. Поэтому главный диаметр является осью симметрии линии второго порядка.
Решим теперь обратную задачу: найдем все оси симметрии линии второго порядка Г, содержащей более одной вещественной точки. Итак, пусть прямая I является осью симметрии такой линии Г. Предположим сначала, что перпендикулярное прямой I направление {а : р} не является асимптотическим. По условию все середины хорд направления {а : £} лежат на прямой /. С другой стороны, они лежат на диаметре пг, сопряженном направлению {а : р}. Поскольку линия Г содержит более одной точки, отсюда вытекает, что прямые I и пг совпадают.
Пусть теперь перпендикулярное к прямой I направление является асимптотическим. Линия Г не может целиком располагаться на прямой /, поскольку в этом случае линия Г была бы парой совпадающих прямых, а ее асимптотическое направление было бы параллельно прямой /. Возьмем точку М на линии Г, не лежащую на прямой I. Тогда симметричная ей относительно прямой I точка М' также принадлежит Г. Прямая пг, проходящая через точки М и М', целиком лежит в линии Г, поскольку она имеет асимптотическое направление и пересекается с Г по крайней мере в двух точках. Следовательно, линия Г распадается на две прямые пг и пг' — пересекающиеся, параллельные или совпадающие. Вторая прямая пг' не может быть наклонной к прямой I, так как в этом случае прямая I не может быть осью симметрии линии, составленной из двух прямых пг и пг'„ из которых одна перпендикулярна,
124
а другая наклонна к прямой /. Поэтому прямая пг' либо перпендикулярна к прямой Z, либо с ней совпадает. В первом случае линия Г состоит из двух параллельных (может быть, совпадающих) прямых (рис. 53). Тогда всякая прямая, перпендикулярная к этим прямым, является осью симметрии линии Г. Кроме того, осью симметрии линии Г является также единственный ее (главный) диаметр d — средняя прямая между прямыми т и т'.
Во втором случае линия Г представляет собой пару перпендикулярных прямых т и т'—1 (рис. 54). Каждая из этих прямых является осью симметрии линии Г. Кроме того, осями симметрии являются биссектрисы di и d% двух пар вертикальных прямых углов, образованных прямыми I и т. Эти биссектрисы являются взаимно сопряженными главными диаметрами.
Итак, нами доказана
42.6.	Те орема. Пусть линия второго порядка Г содержит более одной вещественной точки. Тогда
1)	если линия Г представляет собой пару параллельных или совпадающих прямых, то она имеет бесконечно много осей симметрии, из которых одна является главным диаметром;
2)	если линия Г представляет собой пару перпендикулярных прямых, то она имеет четыре оси симметрии, из которых две являются главными диаметрами;
3)	во всех остальных случаях главные диаметры и только они являются осями симметрии.
Ось параболы. Из теоремы 42.6 вытекает, что осью симметрии параболы является ее главный диаметр. В канонической системе*
125-
координат (012=0) главными направлениями являются направления осей координат, одно из них для параболы является асимптотическим, следовательно, ось Ох является единственным главным диаметром и единственной осью симметрии параболы.
Найдем теперь уравнение оси параболы в произвольной прямоугольной системе координат, считая, что а^О. Поскольку для параболы 6=0, имеем ацЯ22=0212. Следовательно,
(ап—а22)2 + 4а22=(аи—а22)2 + 4aua22=(an + а22)2.
Значит, уравнение (88)' принимает вид
Ct _ Лц-- #22 i (#11 4" #22)
Р	2tz12
Поэтому главными направлениями параболы являются {«1, ₽1}={^1Ь #12), {«2, Р2}={^22,-#12}-
Второе из этих направлений — асимптотическое. В самом деле,
(ос2, ₽2)31
а2
— 011^22	(	^22^12) 4“^22^ 1 2	^22(^11^22
Итак, остается найти диаметр, сопряженный направлению {ан, tZi2}. Уравнение (78) в нашем случае записывается так:
0Ц («11* + Я12У + Я1з) + 012 (012* + а22У + 02з) = °,
или
(0ц + а?2) Х + а12 (а11 + а22) У + 0Ц013 + 012023 = 0-
Заменяя а212 на аца22, получаем
0Ц (0Ц + 022) * + 012 (0Ц + 022) У + 0Ц013 + 012023= °-
В параболическом случае, ai 1 + a22=:*S=^=0. Таким образом, уравнение оси параболы можно записать в виде
аих + а12у + 011013 + а^3-=о.	(89)
а11 + а22
Что касается параллельных прямых, то для них главным диаметром является линия центров. Поэтому уравнение (89) в этом случае имеет более простой вид
йцх+с112^+01з=О.	(90)
§ 43.	РАСПОЛОЖЕНИЕ ЛИНИЙ ВТОРОГО ПОРЯДКА
Мы знаем, как по ортогональным инвариантам линии второго порядка, заданной в прямоугольной системе координат Оху произвольным уравнением, определить ее каноническое уравнение (§ 34). Для того чтобы иметь полную информацию о линии вто
126
рого порядка, надо научиться еще находить расположение осей канонической системы координат.
I.	Центральный случай (б¥=0). В этом случае каноническое уравнение пропорционально уравнению
V'2 + W2 + ^-=0.	(91).
Мы уже знаем (см. § 32), что при повороте осей координат на угол <р, для которого
tg ф=
а12	а12
квадратичная часть уравнения принимает вид
ЪлХ'^ + иу'2.
Далее, при переносе начала координат в центр линии, определяемой из системы
| ацХ+а121/+а13=0,
I а12х + а22г/ + а2з=0>
в уравнении исчезают члены первой степени и оно принимает вид. (91). Направления новых осей координат можно менять на противоположные. Поэтому остается только упорядочить корни Xi и %2 характеристического многочлена. Уравнение (91) пропорционально уравнению
Поэтому в эллиптическом случае должно выполняться неравенство
|Л1|<|*2|,	(92)
поскольку мы считаем, что фокусы лежат на оси О'х'. Для гиперболы
sgriA.i=sgnA.	(93)
Для пересекающихся прямых выбор 11 и не имеет существенного значения, хотя мы можем для определенности предположить, что для канонического уравнения
У2
а\ Ь2
пересекающихся прямых выполнено условие а2>Ь2. В этом случае можно воспользоваться условием (92).
127
Пример. Пусть линия второго порядка Г задана в прямоугольной системе координат Оху уравнением
бху + 8у2— 12х—26у + 11 =0.
Тогда
Имеем д=|91|=—9<0 (гиперболический случай), Д=|Л| = =81, 5=8. Характеристический многочлен
X2—8Х—9
имеет корни 9, —1. Согласно условию (93)
Л1=9,	—1.
Таким образом, каноническое уравнение гиперболы Г имеет вид
х'2—— =1.
9
Для угла ф наклона оси О'х' к оси Ох имеем
tg<₽=4=3-и
Центр находим из системы
( Зу— 6=0,
(Зх + 8у—13 = 0,
откуда новое начало О' имеет координаты (—I, 2).
Мы имеем всю необходимую информацию, чтобы изобразить гиперболу (см. рис. 55). Поскольку Ыа=3, асимптоты наклонены к оси О'х' под углом <р, для которого tg<p=3. Следовательно, одна из асимптот горизонтальна. Вершины гиперболы отстоят от нового начала О' на расстояние а=1.
II.	Параболический случай (6=0). Если линия Г представляет собой параллельные прямые (А=0), то она имеет каноническое уравнение
У Ч-----=0.
»	S2
Осью О'х' является прямая центров
aiix+ai2y+al3=0.
В качестве оси О'у' можно взять любую прямую, перпендикулярную прямой центров.
.128
Если же линия Г является параболой (Л=/=0), то она имеет каноническое уравнение
,2 о -»Г & , у = 2 Л/------х .
У S3
Осью О'х' является ось симметрии параболы
апх + аХ2у +	+ ?па2з_=о.
«11 + «22
Вершиной параболы и новым началом О' является точка пересечения оси с параболой. Осью О'у' является прямая, перпендикулярная оси параболы и проходящая через ее вершину. Ориентировать ось О'у' можно в любую сторону. Теперь остается только указать положительное направление оси О'х'. Имеются формулы, которые выражают координаты положительного вектора на оси О'х' через коэффициенты общего уравнения F(x, у)=0 параболы в прямоугольной системе координат. Но мы их приводить не станем. Вместо этого предложим способ, позволяющий преобразовать общее уравнение параболы в каноническое и найти формулы перехода к канонической системе координат. Для этого рассмотрим конкретный
Пример. Пусть линия Г задана уравнением
х2—4ху + 4у2 + 4х—Зу—7=0.	(94)
Квадратичная часть уравнения является полным квадратом, значит, мы имеем дело с линией параболического типа. Уравнение (89) ее оси имеет вид
( з \ 1-2 — 2 — —
х—2Z/H-------------~=х—2у+ 1=0.
5
5 Зак. 283
129
Ось симметрии является осью О'х', которая имеет уравнение
/=0.
Предположим, что формулы
X/:=CiiX + Ci2l/+ в],
/=С21Х+С22У + а2
выражают канонические координаты через исходные. Тогда прямая
^21^+ СччУ + ^2=0
является осью параболы. Следовательно, существует такой коэффициент пропорциональности k, что
С21Х+С22У+a2=k (х—2у + 1).
Поскольку матрица
£__ С11 С12
С21 С22
ортогональна, имеем c22i + c222=L откуда fc=±l/V5. Преобразуем наше уравнение (94), выделяя полный квадрат выражения
х —2у± 1
±У5 
Имеем
х2—4ху + 4у2 + 4х—Зу—7—
= 5 ( Х~2^- У~(2х—4у+1) + 4х—Зу—7=0, \	+ у 5	/
ИЛИ
5 ( х~2у+1 ?==_2x_t/ + 8. \ ±У5 )
Правая часть этого уравнения пропорциональна х', и коэффициент пропорциональности положителен. Из ортогональности матрицы С вытекает, что
,	— 2х — у + 8
Уб
Таким образом, уравнение (94) имеет вид
5 / X—2t/+l \2_,/д /—2х —у + 8\
к ±1/5 ) I У 5 Г
130
Переходим к новым прямоугольным координатам
2х — 2+8
V5 ’
Х-2//+Г
±1/5	’
В этих координатах парабола имеет уравнение
5у'*=1/5 х', или у'*=-^=-х'
Параметр параболы равен 1/2^5.
Теперь о расположении параболы. В столбцах матрицы С* или в строках матрицы С стоят координаты векторов ортонорми-рованного репера O'ei'e2', определяющего каноническую систему координат О'х'у'. Следовательно,
(	2	1 )	,	[ ,	1	_ 2 1
в1~ (	1/5 ’	1/5 Г е2—	1/5 ’	1/5 ) ‘
Расположение параболы изображено на рис. 56. Положительное направление оси О'у' можно выбрать произвольно.
5*
Глава V
АФФИННЫЕ ПРЕОБРАЗОВАНИЯ
§ 44.	ПРЕОБРАЗОВАНИЯ
44.1.	Определение. Преобразованием множества X в себя называется произвольная биекция f:	т. е. взаимно одно-
значное отображение множества X на себя. Множество всех преобразований множества X в себя обозначим через Тг(Х).
Преобразования конечного множества называются его подстановками или перестановками. Множество подстановок конечного множества, состоящего из п элементов, является группой, называемой симметрической группой Sn.
Если f и g — преобразования множества X, то их композиция g°f также является преобразованием. Преобразованием также будет и отображение f"1, обратное к преобразованию f. Поэтому множество Тг(Х) образует группу, операцией умножения в которой служит композиция преобразований, единицей является тождественное преобразование idx.
Пусть G — подгруппа группы Тг(Х). Скажем, что множества Уь Y2czX G-эквивалентны, если существует преобразование g^G, отображающее множество Yx на множество Y2.
44.2.	Пр едложение. Отношение G-эквивалентности является отношением эквивалентности на множестве Р(Х) всех подмножеств множества X.
Доказательство предоставляется читателю.
Таким образом, множество Р(Х) распадается на классы G-эквивалентных между собой подмножеств. При этом, чем больше группа G, тем больше классы G-эквивалентности, тем больше «похожих» между собой фигур.
В геометрии рассматриваются различные группы преобразований. Так, изучаемая в школе эвклидова геометрия исследует те свойства фигур, которые не меняются при движениях (изометриях); равными называются фигуры, которые можно перевести одну в другую движением.
В аналитической геометрии наряду с изометрическими преобразованиями рассматриваются также аффинные и проективные преобразования.
§ 45.	ОПРЕДЕЛЕНИЕ И СВОЙСТВА АФФИННЫХ ПРЕОБРАЗОВАНИЙ
45.1.	Определение. Преобразование f\En^En, л=1,2,3, прямой, плоскости или пространства называется аффинным, если существуют две аффинные системы координат Охх... хп и О'х/ ... ... Хп, такие, что координаты любой точки М^Еп в первой системе координат совпадают с координатами ее образа f(M) во второй системе координат (см. рис. 57). В этом случае говорим, что
132
аффинное преобразование f ассоциировано с двумя системами координат Oxi — хп и О'х\ ... Хп или с двумя реперами Oei... е„ и О'е/... е/.
Мы подробно исследуем аффинные преобразования плоскости л=£1 2. При этом мы в основном остановимся на свойствах аффинных преобразований, общих для прямой, плоскости и пространства, обсуждая иногда различия между плоским и пространственным случаями.
45.2.	Преобразование векторов, порожденное аффинным преобразованием. Пусть f — аффинное преобразование плоскости (пространства), ассоциированное с двумя системами координат Oxi... Хп (старой) и О'х/... хп' (новой).
Рассмотрим вектор МУ. Поскольку координаты вектора получаются вычитанием координат его начальной точки из координат его конца, координаты вектора	относительно нового
репера те же, что и координаты вектора MN относительно старого репера.
Таким образом, получаем отображение
/: Vect (п) ->• Vect (п), определяемое равенством
7(МУ)=/(М)/(У).	(1)
Отображение f определяется также равенством координат вектора а и его образа f(a) (в разных реперах). Поэтому определение
(1) не зависит от точки приложения вектора а=МУ.
Поскольку отображение f определяется равенством координат вектора и его образа, оно является изоморфизмом векторного пространства Vect(n) на себя. Более точно, отображение f является композицией двух изоморфизмов
g: Vect(n)->Rn и h: R"->- Vect (n).
Первый изоморфизм g ставит в соответствиэ вектору a=Vect(n) набор его координат в старом репере, а второй изоморфизм h
133
переводит набор чисел (xi.xn)eRn в вектор с координатами
Xi,хп в новом репере.
Изоморфизм / называется линейным отображением, порожденным аффинным отображением f.
45.3.	Предложение. Пусть f: Еп-^Еп — аффинное преобразование и Oei... еп — произвольный репер в Еп. Тогда f(O)fX X (ei) ... f(en) — это единственный репер, такой, что преобразование f ассоциировано с реперами Oti..en и f(O)f(ei) ...f(en).
Доказательство. Поскольку линейное отображение f, являясь изоморфизмом, переводит линейно независимую систему векторов в линейно независимую, f(O)f(ei) ... f(en) — репер. Пусть М — произвольная точка с координатами (хь..., хп) в репере Oei... е„. Это означает, что
OM=Xje,+ ... +хпе„.
В силу линейности отображения f имеем
/(О)/Й=7(ОМ)=х17(е1)+ ... +xj(en).
Но это равенство эквивалентно тому, что точка f(M) имеет координаты (xi..хп) в репере f(O)f(ei) ... f(e„).
Осталось проверить единственность репера О'е/... еп', такого, что преобразование f ассоциировано с реперами Oei... еп и О'е/ ... ... е/. Для точки М с координатами (хь ..., хп) в репере ... еп единственной точкой с теми же координатами в репере О'е/... е/ является точка f(M). Поэтому f(O), имея нулевые координаты, совпадает с О'. Далее, пусть ti—OMt. Тогда f(e0=/:(O)f(jWi) = = O'f(Mt). Но f(Mi) —единственная точка, все координаты которой в новом репере равны нулю, кроме i-й, которая равна 1. Следовательно, f(Mi)—это конец вектора е/, отложенного от точки О', т. е. f(e,)=e/. Предложение доказано.
45.4.	Предл о ж е н и е. Множество всех аффинных преобразований f:En-+En образует подгруппу группы Тг(Е"), называемую группой аффинных преобразований Еп.
Доказательство. Тождественное отображение ассоциировано с любой парой совпадающих реперов. Если преобразование f ассоциировано с реперами Ов!... еп и О'е/... еп', то обратное преобразование ассоциировано с реперами О'е/ ... е/ и Oti.. еп. Если f и g — аффинные преобразования, первое из которых ассоциировано с реперами Oei...en и О'е/...еп', то из 45.3 легко следует, что композиция g°f ассоциирована с парой Ое|...еи и ^(О')^(е/) ... £(еп'). Предложение доказано.
45.5.	Предложение. При аффинном преобразовании
а)	плоскость переходит в плоскость;
б)	сохраняется параллельность плоскостей;
в)	прямая переходит в прямую;
134
г)	сохраняется параллельность прямых;
д)	сохраняется деление отрезка в данном отношении.
Доказательство, а) Плоскость л есть множество всех точек пространства, задаваемых уравнением
Дх+Вг/+Сг+£>=0	(2)
в некоторой аффинной системе координат Oxyz. Пусть аффинное преобразование f ассоциировано с парой систем координат Oxyz и O'x'y'z'. Тогда образ плоскости f(n) описывается тем же уравнением (2) в системе координат O'x'y’z', т. е. является плоскостью.
б)	Параллельность плоскостей лил' равносильна тому, что они не пересекаются. Из биективности преобразования f вытекает, что плоскости /(л) и f(n') также не пересекаются.
в)	В случае аффинного преобразования плоскости рассуждение такое же, как и в пункте а). В пространстве прямая I является линией пересечения двух различных плоскостей Л1 и лг. Тогда f(/)c=f(ni)rif(n2). Переход к обратному преобразованию f~l с учетом а) показывает, что f (ni)f|f («2)-
г)	Для прямых на плоскости рассуждение такое же, как и в п. б). Прямые в пространстве параллельны, если они лежат в одной плоскости и не пересекаются. Поэтому утверждение вытекает из а), в) и биективности преобразования f.
д)	Точка Р делит отрезок MN в отношении А,, если
MP=M>N.
В силу линейности отображения f имеем
f (ALP)=AJ(pjv),
а это согласно (1) эквивалентно тому, что
f(M) f(P)=Kf(P)f(N).
Предложение доказано.
Условие д) является характеристическим для аффинных преобразований, т. е. имеет место
45.6.	Предложение. Преобразование f является аффинным тогда и только тогда, когда оно сохраняет деление отрезка в данном отношении.
Доказательство достаточности, отнюдь не тривиальное, предоставляется читателю в качестве задачи.
45.7.	Теорема. Существует единственное аффинное преобразование плоскости, переводящее данную тройку не лежащих на одной прямой точек О, М, N в другую тройку не лежащих на одной прямой точек О', М', N' той же плоскости.
Аналогичное утверждение верно для пространства и четверки точек, не лежащих в одной плоскости.
135
Доказательство проведем для плоскости. Для проверки существования достаточно взять аффинное преобразование f, ассоциированное с реперами Oeie2 и О'е/е/, где
ех=ОЛ4, e2=ON, ei=O'M', e'2=O'N'.
Для доказательства единственности достаточно проверить, что аффинное преобразование f, переводящее точки О, М, N в точки О', М', N', ассоциировано с описанными выше реперами Oeie2 и О'е/е/. Это непосредственно вытекает из предложения 45.3.
45.8.	Аналитическая запись аффинного преобразования. Пусть аффинное преобразование f плоскости ассоциировано с реперами Oeie2 и О'е/е/. Пусть
Q __ С11 С12
С21 С22
— матрица перехода от базиса еье2 к базису е/, е/. Пусть, кроме того, известны координаты (ц, а2 нового начала О' в исходной системе координат Оху. Тогда координаты (х, у) произвольной точки М и координаты (хг, у') ее образа	в исходном
репере связаны соотношениями
х'=сих+с12у-\-аъ г/'=с21х + с22г/-|-а2.
В самом деле, имеем
(3)
(4)
О'Л4' = (еь е2)
— (е1> ег)
У
У
Поэтому
ОМ'=ОО' + О'М'=(ъъ е2)
а2
х
У
Итак,
X' у'
= ОМ’
х
У
^2
Последнее равенство представляет собой векторную запись уравнений (3).
Аналогичные формулы
х' = спх + с12у + c13z + ах, у' = СцХ + с22у + С232 + й2> z' = с31х + с32у + c33z + а3
(5)
справедливы для аффинного преобразования пространства.
136
Наоборот, пусть на плоскости фиксирована система координат Оху, порожденная репером Oeie2. Пусть отображение f переводит точку М(х,у) в точку f(M)=M'(x',y'), где х',у' задаются равен-
С11 С12
С21 С22
ствами (3),
=/=0. Тогда отображение f является аффин
ным преобразованием, ассоциированным с репером Oeje2 и O'ef е/, где точка О' имеет координаты (аь а2) и
(е[, е2)=(е1, е2)С.
В самом деле, пусть произвольная точка N плоскости имеет координаты (I, т|) и (£', if) в реперах Oeie2 и O'ef е2' соответственно. Мы знаем (см. § 23), что в этом случае
£=Cn£' + <Wl' + ai, |
'П = С21Н'+С22'П' + О2- I
В качестве точки N возьмем точку f(Af), которая в репере Oeie2 имеет координаты (х',у'), определяемые соотношениями (3). Ее координаты (£', if) в репере O'efef удовлетворяют соотношениям (6):
х'=сп% 4-сг21Г + а1.
У'=с211' + с22г\’ + а2.
Сравнивая эти равенства с равенствами (3), получаем £'=х, if= =у. Итак, точка М с координатами (х, у) в репере Oeie2 отображением f переводится4 в точку f(M) с координатами (х, у) в репере O'ef е2', что и требовалось доказать.
45.9.	Замечание. Если соотношения (3) дают аналитическую запись аффинного преобразования f, то формулы
х'=спх + с12г/, 1
у’ = с21х + с22у )
представляют собой аналитическую запись (в базисе ei,e2) порожденного этим преобразованием линейного отображения f, т. е. вектор a=xei + i/e2 переходит в вектор f(a)=x'e1 + i//e2. В самом
деле, положив а=ОЛ4, имеем f(a)=O'M', а дальше надо воспользоваться равенством (4).
§ 46.	АФФИННАЯ КЛАССИФИКАЦИЯ ЛИНИЙ ВТОРОГО ПОРЯДКА
Из определения аффинного преобразования и предложения 45.3 вытекает
46.1.	Предложение. При аффинном преобразовании f плоскости линия второго порядка Г переходит в линию второго порядка. Более того, для любой аффинной системы координат Оху существует аффинная система координат О'х'у’, в которой
137
уравнение линии /(Г) совпадает с уравнением линии Г в системе Оху.
46.2.	Предложение. Инвариантами аффинных преобразований являются центры, асимптотические направления и асимптоты линий второго порядка.
Это означает, что если f: £2->£2 — аффинное преобразование; Г — линия второго порядка; точка Р, вектор а, прямая I являются соответственно центром, асимптотическим направлением, асимптотой линии Г, то f(P), f(a), f(l) будут соответственно центром, асимптотическим направлением, асимптотой линии f(T).
Предложение 46.2 непосредственно вытекает из 46.1, поскольку упомянутые элементы (центры, асимптотические направления, асимптоты) выражаются уравнениями, однозначно задаваемыми уравнением данной линии второго порядка.
46.3.	Теорема. Произвольная линия второго порядка посредством аффинного преобразования переводится в одну из следующих линий, заданных в некоторой прямоугольной системе координат уравнениями
1)	х2+ t/2=l;
2)	х24-у2= — 1,
3)	х2 + «/2=0;
4)	х2—у2=1;
5)	х2—z/2=0;
6)	г/2=х;
7)	у2=1;
8)	у2= —1;
9)	г/2=0.
Доказательство. Выписанные здесь уравнения представляют собой в простейшем виде канонические уравнения 1)—9) из теоремы 33.1. Поэтому достаточно указать аффинное преобразование, переводящее каждую из линий 1)—9) из 33.1 в линию с тем же номером из 46.3. Доказательство проведем для случая эллипса (уравнение 1)). Другие случаи рассматриваются аналогичным образом.
Итак, эллипс Г задан в некоторой прямоугольной системе координат О'х'у' уравнением
Нам надо перевести его в окружность S1, заданную в другой прямоугольной системе координат Оху уравнением x2+i/2=l (рис. 58). Искомое аффинное преобразование f мы построим как композицию аффинных преобразований ft и f%. Первое из них в системе координат О'х'у' имеет следующую аналитическую запись:
ft X	п у
X =----, и = —.
а	b
138
При этом эллипс Г перейдет в окружность S0I=f1(r), задаваемую в системе О'х'у' уравнением х'2 + г/'2=1 (рис. 59). Второе аффинное преобразование будет ассоциировано с парой систем координат О'х'у' и Оху. Поскольку окружности So1 и S1 имеют в этих системах одинаковые уравнения, одна из них перейдет в другую. Теорема доказана.
Рис. 58
Рис. 59
46.4.	Теорема. Линии второго порядка, имеющие различные названия, аффинно неэквивалентны.
Доказательство. Сначала различим между собой линии второго порядка, имеющие более одной вещественной точки. Линии, содержащие прямую, неэквивалентны эллипсу, гиперболе и параболе, поскольку никакие три точки любой из этих кривых не лежат на одной прямой (см. § 38). Предложение 46.2 позволяет различить между собой эллипс, гиперболу и параболу: парабола не имеет центра, эллипс не имеет асимптотических направлений. Линии, распадающиеся на прямые, можно различить по центрам симметрии. Пересекающиеся прямые имеют единственный центр симметрии, а параллельные и совпадающие прямые — линию центров. Любой центр симметрии совпадающих прямых лежит на них, а для параллельных прямых это не так.
139
Единственная линия, содержащая только одну вещественную точку (пара мнимых пересекающихся прямых) очевидно не может быть аффинным преобразованием переведена ни в какую другую линию. То же самое верно и относительно линий, не имеющих ни одной вещественной точки (мнимый эллипс и пара мнимых параллельных прямых). Остается только различить их между собой. С теоретико-множественной точки зрения эти линии, представляя собой одно и то же пустое подмножество вещественной плоскости, эквивалентны между собой относительно любой группы преобразований. Различить их можно на комплексной плоскости (см. 38.2). В этом случае любая вещественная прямая пересекает мнимый эллипс либо по одной, либо по двум комплексным точкам, в то время как прямая асимптотического направления у=0 совсем не пересекает пару мнимых параллельных прямых у2+1=0. Теорема доказана.
§ 47.	ОПРЕДЕЛЕНИЕ И СВОЙСТВА ИЗОМЕТРИЧЕСКИХ ПРЕОБРАЗОВАНИЙ
47.1.	Определение. Аффинное преобразование f\En-+En, л=1,2,3, называется изометрическим, если оно ассоциировано с двумя прямоугольными системами координат.
Изометрические преобразования называются также движениями. Если реперы, с которыми ассоциировано движение, одноимен-ны, то оно называется собственным, в противном случае — несобственным.
Обоснованием определения изометрического преобразования служит
47.2.	Теорема. Преобразование f : Еп-+Еп, п= 1,2,3, является изометрическим тогда и только тогда, когда оно сохраняет расстояние между точками, т. е. когда
Р(МЪ	(8)
для любых точек М1у М^Еп.
Доказательство проведем для случая плоскости. Пусть f — изометрическое преобразование, ассоциированное с прямоугольными системами координат Оху и О'х'у'. Пусть точки Alj и Af2 имеют в исходной системе координат Оху координаты (хь г/i) и (Х2, у2). В силу прямоугольное™ этой системы координат (см. § 13)
р(М1( М2)=У(Х1—х2)2+ (z/t—z/2)2.
Точки f(Afi) и f(M2) имеют те же координаты (xbi/i) и (х2,у2), но уже в новой системе координат О'х'у', которая также прямоугольна. Поэтому
pOWj), f (М2)) = У (хх—х2)2 + (у^)2
и равенство (8) проверено.
140
Пусть теперь преобразование f сохраняет расстояние между точками. Тогда оно, очевидно, сохраняет деление отрезка в данном отношении. Поэтому согласно 45.6 преобразование f является аффинным. Возьмем в плоскости какой-нибудь" ортонормирован-ный репер Oeie2. Для завершения доказательства остается в силу 45.3 показать, что репер f(O)f(ei)f(е2) также ортонормирован. Пусть концы векторов ei и е2, отложенных от точки О, находятся в точках Mi и М2. Тогда ортонормированность репера Oeie2 эквивалентна тому, что треугольник MiOM2 имеет стороны с длинами 1, 1, У2. Но такие же длины сторон будут и у треугольника f(Mi)f(O)f(M2), так как отображение f сохраняет расстояние между точками. Следовательно, репер f(O)f(ei)f(е2) ортонормирован. Теорема доказана.
47.3.	Замечание. При доказательстве теоремы 47.2 мы применили предложение 45.6, доказательство которого было предоставлено читателю. Но аффинность преобразования f, сохраняющего расстояние между точками, можно доказать и не опираясь на предложение 45.6. Для этого заметим сначала, что отображение f переводит равные векторы в равные. В самом деле, равенство векторов M{Ni и M2N2 эквивалентно тому, что четырехугольник MiNiN2M2 является параллелограммом. Но тогда параллелограммом будет и четырехугольник f(Mi)f(Nx)f(N2)f(M2). (Обратим внимание читателя на то, что, делая такое заключение, мы опираемся не только на сохранение длин сторон четырехугольника но и на сохранение длин его диагоналей.) Итак, преобразование f порождает отображение f : Vect (2) ->Vect (2). Отображение это линейно опять-таки в силу сохранения преобразованием f параллелограммов и деления отрезка в данном отношении. Поэтому для завершения проверки аффинности преобразования f достаточно доказать
47.4.	Предложение. Пусть преобразование f: Еп-+Еп переводит равные векторы в равные, и пусть порождаемое этим преобразованием отображение f: Vect(n)->Vect(n) линейно. Тогда преобразование f аффинно.
Доказательство. Отметим прежде всего, что, поскольку / — преобразование, отображение f также биективно. Поэтому оно является изоморфизмом и, в частности, базис переводит в базис. Пусть Oeie2 — какой-нибудь репер на плоскости. Тогда f(O)f(ei) f(e2) —тоже репер. Пусть произвольная точка М имеет в репере Oeie2 координаты (х, у). Это означает, что
OM=xei + ye2.
Тогда из линейности отображения f получаем
НО)/(М) = 7 (ОМ)=xf (ех) + у?(е2).
Но это равенство означает, что точка f(M) имеет в репере f(O)f(ei)f(е2) координаты (х,у). Таким образом, преобразование
141
f ассоциировано с парой реперов и, следовательно, аффинно. Предложение доказано.
47.5.	Замечание. Легко видеть, что рассуждения, приведенные в 47.3, и предложение 47.4 практически доказывают предложение 45.6. Надо проверить только, что если преобразование f сохраняет деление отрезка в данном отношении, то оно параллелограмм переводит в параллелограмм. Для этого надо заметить, что f переводит прямую в прямую, а параллельные прямые — в параллельные. Последнее утверждение в случае плоскости вытекает из того, что параллельные прямые — это те, которые не пересекаются. В случае пространства надо предварительно показать, что преобразование f плоскость переводит в плоскость.
Из теоремы 47.2 вытекает
47.6.	Предложение. Изометрические преобразования образуют подгруппу группы всех аффинных преобразований.
47.7.	Аналитическая запись изометрического преобразования. Аффинное преобразование f, записанное в прямоугольной системе координат Оху формулами
x'=d?iix+c12z/ + ai 1
у'—с21х + с22у + а2 J
является изометрическим тогда и только тогда, когда его матрица
С — С11 ^i2
^21 С22
ортогональна.
Доказательство. Пусть система координат Оху задает* ся ортонормированным репером Oeie2. Из 45.3 и 45.8 следует, что матрица С является матрицей перехода от базиса еь е2 к базису f(ei),f(e2). Поэтому ортогональность матрицы С равносильна ор-тонормированности базиса f(ej),f(e2) (см. § 30). С другой стороны, при доказательстве теоремы 47.2 мы показали, что изометрическое преобразование переводит ортонормированный репер в ор-тонормированный. Для завершения доказательства утверждения 47.7 остается вспомнить определение изометрического преобразования и еще раз обратиться к предложению 45.3.
§ 48.	КЛАССИФИКАЦИЯ ДВИЖЕНИЙ ПЛОСКОСТИ
48.1.	Теорема. Всякое собственное движение плоскости представляет собой либо параллельный перенос, либо поворот вокруг некоторой точки на определенный угол а. Всякое несобственное движение плоскости является отражением относительно некоторой прямой вместе с возможным сдвигом вдоль этой прямой.
142
При надлежащем выборе прямоугольной системы координат эти преобразования имеют соответственно следующую аналитическую запись:
y'=y + a2t J x'=xcosa—r/sin а, у’ = х sin а + У cos а,
(9)
(10)
(П)
у'==—у- J
Доказательство. Зафиксируем на плоскости положительное направление вращения, например, против часовой стрелки. Это дает нам ориентацию плоскости. Все реперы при этом разбиваются на положительные и отрицательные. Возьмем прямоугольную систему координат Оху, связанную с каким-нибудь ортонор-мированным положительным репером Oeie2. В этой системе координат наше движение записывается формулами
х’^Сцх + с^у + а^
у'=с21х + с^у + а2,
где матрица С ортогональна. Если С — единичная матрица, то формулы (3) превращаются в (9). Если С^Е, но f — собственное движение, то С как матрица перехода между одноименными реперами Oeie2 и f(O)f(ejf(е2) имеет положительный определитель. Мы знаем (см. § 29), что в этом случае
(3)
С =
cos а —sin а sin а cos а
Покажем, что существует точка Oi, которую преобразование оставляет на месте. Для этого надо показать совместность системы уравнений
+ c12?/i + ai,
или с учетом конкретного вида матрицы С
хх(1—cos а) + г/, sina=ax,
—x1sina + «/1(l —cosa)=a2.
Определитель этой системы равен (1—cosa)2+sin2a. Он отличен от нуля, так как cosa^l (С^Е).
Итак, движение f имеет неподвижную точку О\. Тогда в репере Oieie2 оно записывается формулами (10). В самом деле, в реперах Oeie2 и Ojeie2 аналитические записи преобразования f имеют одну и ту же матрицу С, поскольку согласно 45.9 посредством
143
этой матрицы в базисе еь е2 записывается линейное отображение f. С другой стороны, свободные члены и а2 в записи (3) движения f в репере Oieie2 равны нулю, поскольку согласно 45.8 (яь а2)—это координаты точки f(Oi)=Oi в репере О^ег.
Для завершения исследования собственных движений остается отметить, что формулы (10) и являются формулами поворота плоскости на угол а относительно начала координат. Это следует из того, что векторы еье2 при этом движении переходят в векторы eicosa+e2sina, —ejsina + e2cosa соответственно, т. е. поворачиваются на угол а (см. § 30).
Пусть f — несобственное движение. Тогда определитель матрицы С в записи (3) отрицателен. В этом случае (см. § 29)
С =
cos a sin a sin a —cos a
Покажем, что найдется ненулевой вектор е, который отображение f оставляет на месте. Аналитическая запись (7) отображения имеет вид
x'==xcosa + y sin a, 1 y'=xsina—ycosa. )
Нам надо найти ненулевое решение системы
x=xcos a + У sin a, | y=xsina—ycosa. J
или
х(1—cosa)—ysina=0, 1
— xsin a +r/(l+cosa)=0. I
Определитель этой системы равен (1—cosa) (1 + cosa)—sin2a=0. Следовательно, ненулевое решение она имеет.
Но если f(e)=e, то для любого пропорционального вектора е'=Хе имеем
i/(e')=7(Xe)-V(e)=Xe=e'.
Следовательно, существует такой единичный вектор е/, что f(ei')=ei'. Дополним его до ортонормированного базиса е/, е2'. Поскольку f — несобственное движение, ортонормированные базисы е/, е2' и /(е/), f(e2') разноименны. Но f(ei')=ei', значит, f(e/)=—е2'. Таким образом, матрица перехода от базиса е/, е2' к базису f (е/), t (е2') имеет вид
1 о
144
Поэтому из 45.3 и 45.8 вытекает, что в репере Ое/ег' движение f записывается формулами
х'=х + &ь	|	(12>
у’=—у+ь2, J
где числа &i, Ь2, вообще говоря, отличны от чисел ait а2 из первоначальной записи (3). Возьмем теперь точку О' с координатами (61/2, Ь2/2) в репере Ое/е/. Движение f переводит точку О' в точку f(O') с координатами	+	—Ь^2-\-Ь^=
т. е. сдвигает ее на вектор O'f(O')={blt 0}=61ei. Поэтому в репере О'е/е/ точка f(O') имеет координаты (bif 0). Следовательно, запись движения f в репере О'е/е/, отличающаяся от записи (12) этого движения в репере Ое/е/ только столбцом свободных членов, имеет вид (11), где a—bi. Теорема доказана.
Глава VI
ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА
§ 49.	ОСНОВНАЯ ТЕОРЕМА О ПОВЕРХНОСТЯХ ВТОРОГО ПОРЯДКА
49.1.	Определение. Поверхностью второго порядка называется всякое множество Ф точек пространства, которое в некоторой аффинной системе координат Oxyz может быть задано уравнением второй степени
anx2 + а22у* + a33z2 + 2а12ху + 2al3xz+2a23t/z +
+ 2a1x + 2aar/ + 2a3z + a()=0.	(1)
Как и в случае линий второго порядка, это определение нуждается в некоторых пояснениях.
1)	Если в какой-нибудь аффинной системе координат множество Ф описывается уравнением второй степени (1), то в Любой другой аффинной системе координат его также можно задать уравнением второй степени. Для этого достаточно вместо переменных х, у, г в уравнение (1) поставить их выражения через новые переменные x',y',z' (см. § 28).
2)	Всякая плоскость в пространстве может быть описана как уравнением первой степени
/1х Ч- By -f- Cz -f- D==z0,
так и уравнением второй степени
(Ax+By+Cz+D) 2=0.	(2)
Конечно же плоскость является поверхностью первого порядка, но в аналитической геометрии считают, что уравнение (2) описывает поверхность второго порядка, которая называется парой совпадающих или слившихся плоскостей.
3)	Наконец, принципиально различные уравнения могут описывать одно и то же множество. Например, каждое из уравнений х2+1=0 и х2 + у2 + 1 =0 описывает пустое множество в (вещественном) пространстве. Но если мы перейдем от вещественного к комплексному пространству по аналогии с тем, как в § 38 мы перешли к комплексной плоскости, то упомянутые выше уравнения будут иметь различные множества решений. Поэтому в аналитической геометрии считается, что эти уравнения описывают различные поверхности второго порядка.
49.2.	Теорема. Для любой поверхности второго порядка существует прямоугольная система координат Oxyz, в которой уравнение этой поверхности имеет один из следующих 17 видов:
146
1)	эллипсоид
у2	t/2	72
— +-^- +—=1;
а2	Ь2	с2
2)	мнимый эллипсоид у2	<»2	-г2
—+ ^-+ —= —1:
а2	62	с2
3)	однополостный гиперболоид
х2	у2	Z2 _р
а2 ‘ Ь2	с2	’
4)	двуполостный гиперболоид
х2 . у2 z2 _______р
а2	Ь2	ё2"-
5)	конус
х2	.	У2	z2
а2	"Г	Ь2	с2
6)	мнимый конус
7)	эллиптический параболоид у2	у/2
—+ ^- = 2z (р, <7>0);
Р	Я
8)	гиперболический параболоид
у2	/у2
------^-=2г (р, р>0);
Р	Я
9)	эллиптический цилиндр
xi	I	У2  р
а2	'	62
10)	мнимый эллиптический цилиндр
^2 , г/2 р
а2	&2
11)	гиперболический цилиндр
X2	у2 __р
"ё2	ё2”- ’
12)	параболический цилиндр у2=2рх;
147
13)	пара пересекающихся плоскостей
х2___^_ = о-
а2	Ь2
14)	пара мнимых пересекающихся плоскостей
Л!_+-_^ = 0;
а2 Ь2
15)	пара параллельных плоскостей
у2~а2 (л¥=0);
16)	пара мнимых параллельных плоскостей
у2+а2=0 (а¥=0);
17)	пара совпадающих плоскостей
У2=0.
Теорема эта будет доказана в § 44 второй части книги. Уравнения 1) —17) называются каноническими уравнениями поверхностей второго порядка.
(3)
§ 50.	ЭЛЛИПСОИДЫ
50.1.	Каноническое уравнение (вещественного) эллипсоида имеет вид
у2	«12	jr2
—=1.
|а2	Ь2	с2
Положительные числа а, Ь, с называются полуосями эллипсоида. Без ограничения общности (меняя, если нужно, оси координат) можно считать, что в каноническом уравнении (3)
Эллипсоид, изображенный на рис. 60, лежит в прямоугольном параллелепипеде
—а^-х^а, ——c^Zz^Zc.
Если а=Ь, то сечения эллипсоида плоскостями z==ft, — суть окружности
г=л,
а2 а2	с2
радиусом rh=—Ус2—h2, вырождающиеся в точки при h=±c. Поэтому такой эллипсоид называется эллипсоидом вращения. Его можно получить вращением эллипса + -у — 1, z/=0 вокруг оси г. Аналогичным образом при Ь=с имеем эллипсоид вра-
148
щения, который получается вращением эллипса у=0 вокруг оси х. Наконец, при а=Ь=с эллипсоид сферой радиусом а.
х2 г3
а2 + Ь2 ’
(3) является
Произвольный эллипсоид (3) получается из сферы x2+y2+z2=a2
посредством аффинного преобразования, являющегося композицией двух сжатий вдоль осей у и г. Это аффинное преобразование записывается следующим образом:
t	t b	г С
х=х, у ——у, z =—г. а	а
Прежде чем исследовать произвольные плоские сечения эллипсоида, выскажем одно общее утверждение.
50.2.	Предложение. Пересечением поверхности второго порядка плоскостью является лежащая в этой плоскости линия не более чем второго порядка.
Доказательство. Возьмем такую систему координат Oxyz, в которой данная плоскость имеет уравнение г=0. Получим уравнение линии пересечения в координатах х и у на этой плоскости, если в уравнении (1) переменную z заменим нулем, т. е.
anx2 + 2a12xy + a22y2 + Ъщх + 2а2у + а0=0.
Это, как мы знаем, общее уравнение линии второго порядка. Но в нашей ситуации возможен случай 0n=0i2=022=O. Тогда в пересечении получается прямая (0i2+a22>O), или оно задается уравнением ао=О, которое описывает либо пустое множество (ао^О), либо всю плоскость (ао=О). Предложение доказано.
,50.3. Пр едложение. Любое плоское сечение эллипсоида есть либо эллипс, либо мнимый эллипс, либо пара мнимых пересекающихся прямых.
149
Доказательство. Пусть эллипсоид задан каноническим уравнением (3). Что касается плоскости л, зададим ее параметрическими уравнениями
х=х0 + а1м + р1о,
г=£0+а3« + ₽3сГ“,
(4>
так, что векторы ffli={ai, «2, аз} и m2={pi, р2, Рз} образуют орто-нормированный базис в пространстве всех векторов, лежащих в этой плоскости. Тогда параметры и и v будут прямоугольными координатами переменной точки этой плоскости. При подстановке в уравнение (3) вместо переменных х, у, г из выражений через параметры и и v из (4) получим уравнение плоского сечения в координатах и, v. Простой подсчет показывает, что квадратичная часть этого уравнения будет иметь вид
2	2	2 \
j2_+.^3_)K2 + 2	+ +Д*М UV +
а\ Ь2 с2 J \ а2 Ь2 с2 /
(5)
Рассмотрим вспомогательные векторы
„ __ ( ai	a2	аз )	п ___ ( Pi	Рг	Рз ]
П1-- {	,	П2--- 1	’	I •
I а	b	с )	(a	b	с )
С их помощью многочлен (5) допускает более компактную запись nfu2 4-2(11!, n2)uo4-n^2.
Подсчитаем инвариант 6 уравнения нашего плоского сечения. Имеем
П? (П1( П2)
(П1, П2) п2
= П2П2—(ПЬ П2)2 =
= nJ112(l—COS2(p) = n2n2sin2(p,
где ф — угол между векторами ih и п2. Но векторы и п2 линейно независимы, поскольку их пропорциональность влекла бы пропорциональность перпендикулярных векторов nij и т2. Поэтому sin ф^О и, следовательно, S>0. Последнее же условие и характеризует нам три линии эллиптического типа (§ 34). Таким образом, никаких других линий в плоском сечении эллипсоида быть не может. В то же время сечение плоскостями z=h эллипсоида (3) показывает, что все три возможности реализуются. Предложение доказано.
50.4.	Задача. Доказать, что среди плоских сечений произвольного эллипсоида имеются окружности.
150
§ 51.	ГИПЕРБОЛОИДЫ
51.1.	Двуполостный гиперболоид имеет каноническое уравнение
где Изображен двуполостный гиперболоид на рис. 61.
Рис. 61
Если а=Ь, то сечения двуполостного гиперболоида плоскостями z=h, |/t|>c, суть окружности. Поэтому такой гиперболоид является гиперболоидом вращения. Его можно получить вращением 22
гиперболы —------— — — 1, у—О вокруг оси z.
Произвольный двуполостный гиперболоид (6) получается из гиперболоида вращения
х2 .у2	г2 1
а2	а2	с2
посредством аффинного преобразования, представляющего собой сжатие оси у с коэффициентом Ь/а.
151
51.2.	В плоских сечениях двуполостного гиперболоида кроме эллипсов и гипербол имеются и параболы. В самом деле, возьмем плоскость
сх—az+ac=Q.	(7)
Эта плоскость проходит через точку MQ (0, 0, с) и параллельна векторам
mi={0, 1, 0}, tn.,— I Д__, 0,
1 1	’ f 2 I /а2+с2 Уа2 + с2 /
Параметрически эту плоскость можно задать следующим образом:
(8)
Параметры и и v являются прямоугольными координатами на плоскости, так как векторы Ш! и т2 единичны и перпендикулярны между собой. Заменяя в уравнении (6) переменные х, у, z на их выражения через параметры и, v из (8), получаем
и2	2v ____q
Ь2	/а2 + с2 “ ’
или
Это есть каноническое уравнение параболы с параметром
н	Уа2 4-е2 ‘
51.3.	Определение. Прямая f называется прямолинейной образующей какой-нибудь поверхности Ф, если /сФ.
51.4.	Пр едложение. Двуполостный гиперболоид не имеет прямолинейных образующих.
Доказательство. Все прямые можно разделить на прямые, пересекающие плоскость 2=0, и прямые, параллельные этой плоскости. Прямые, пересекающие плоскость 2=0, не могут быть прямолинейными образующими, поскольку эта плоскость не пересекается с гиперболоидом (6). Остальные прямые лежат в плоскостях пересечение которых с гиперболоидом (6) либо пусто (|А|<с), либо состоит из одной точки (|А|=с), либо является эллипсом (|й|>с).
152
51.5.	Однополостный гиперболоид имеет каноническое уравнение
х2	. у2	22  
а2 Ь2	с2 ~
(9)
где Изображен однополостный гиперболоид на рис. 62.
Если а=Ь, то однополостный гиперболоид является гиперболоидом вращения, как и двуполостный. Произвольный однополостный .гиперболоид, как и двуполостный, получается из гиперболоида вращения посредством сжатия вдоль оси у.	1
51.6.	Сечения однополостного гиперболоида плоскостями z= =h являются эллипсами. Эллипс
х2 . у2 _______
а2 + Ь2 ~
1, 2 = 0,
являющийся пересечением однополостного гиперболоида (9) с плоскостью 2=0, называется горловым эллипсом, или эллипсом горлового сечения данного гиперболоида.
Сечения гиперболоида (9) плоскостями x=h и y=h являются гиперболами, кроме случаев х=±а, у=±Ь, когда эти гиперболы превращаются в пересекающиеся прямые.
В качестве задачи читателю предоставляется доказать, что при пересечении однополостного гиперболоида другими плоскостями набор аффинных типов плоских сечений пополняется только параболой и парой параллельных прямых.
Более конкретная часть этой задачи: доказать, что плоскость (7) пересекает гиперболоид (9) по параболе, а после параллельного переноса этой плоскости в начало координат — по паре параллельных прямых.
51.7.	Теорема. Через каждую точку однополостного гиперболоида (9) проходят ровно две прямолинейные образующие.
Доказательство. Сначала решим эту задачу для простейшего однополостного гиперболоида
х2+у2—22=1	(10)
и, более того, для конкретной точки Л40(1, 0, 0) на окружности горлового сечения. Пусть т={а, р, у} — направляющий вектор прямой I, проходящей через точку Af0. Переменная точка Mt этой прямой имеет координаты (H-ctf, р£, yt), где параметр t принимает произвольные вещественные значения. Точка Mt принадлежит гиперболоиду в том и только в том случае, когда
(1+а02+₽2*2—у2/2=1
или
(а2 + р2—у2К2+2а/=0.	(11)
153
Поэтому прямая I содержится в гиперболоиде (10) тогда и только тогда, когда левая часть уравнения (И) тождественно равна нулю, т. е.
а2 + Р2—у2=0,	а=0.
Отсюда получаем с точностью до пропорциональности только два направляющих вектора прямолинейных образующих:
m^O, 1, 1},	m2={0, 1, —1}.
Итак, для точки Мо (1, 0, 0) гиперболоида (10) утверждение теоремы доказано.
Теперь покажем, что точку Мо можно перевести в любую другую точку М гиперболоида (10) посредством аффинного преобразования, которое этот гиперболоид отображает на себя. Поскольку при аффинном преобразовании прямая переходит в прямую, отсюда будет вытекать, что через точку М проходит столько же прямолинейных образующих, сколько их проходит через точку А1о.
Гиперболоид (10) является гиперболоидом вращения. Следовательно, любая его точка может быть получена посредством вращения вокруг оси z точки, лежащей на гиперболе
Х2_г2==1>	у=0	'	(12)
Поэтому достаточно точку Af0 перевести в произвольную точку Л4(хо, 0, zQ) на этой гиперболе. Определим аффинное преобразование f формулами
х'=хох	+ V;
У' = У\ Zr — Z^C	+ Xoz,
(13)
Поскольку х02—z02=l согласно (12), определитель матрицы этого преобразования равен 1. Значит, матрицей обратного преобразования будет матрица
х0	0	z0
0	1	0
— 20	0	х0
(И)
Непосредственная подстановка показывает, что	Пока-
жем теперь, что отображение f переводит гиперболоид (10) в себя. Согласно (13) имеем
х'2 + /2—2'2 = (хох+z0z)2 + у2—(zQx + x0z)2=
= (х2—z2) х2 + у2—(х2—z2) z2=(согласно (12))=х2 + у2—z2 — 1.
Аналогично (с применением матрицы (14)) показывается, что обратное отображение также переводит гиперболоид (10) в себя.
154
Таким образом, преобразование f отображает гиперболоид (10) на себя.
Для завершения доказательства теоремы остается заметить, что аффинное преобразование, задаваемое формулами
, X	, у	, Z
X ——, у =—, z' =—, а	Ь	с
отображает гиперболоид (9) на гиперболоид (10).
§ 52. КОНИЧЕСКИЕ СЕЧЕНИЯ
52.1. Произвольный конус
х* . у2	z2 _0
а2 ’’’ Ь2	с2
где получается из конуса вращения или кругового конуса (а=Ь) сжатием вдоль оси у. Конус вращения удобнее записывать в виде
х2+у2—W=0.
(15)
Плоскость z=l пересекает этот конус по окружности радиусом R. В этом параграфе мы найдем все плоские сечения конуса (15). Для этого достаточно рассмотреть плоскости, параллельные оси у.
Произвольная плоскость, параллельная оси у, получается из горизонтальной плоскости z=h поворотом ее вокруг оси у на некоторый угол а. Такой поворот записывается следующим образом:
x'=xcosa	—zsina;
У' = У, z'=xsina	4-z cos a.
(16)
Это следует из того, что при преобразовании (16) вектор е2 остается на месте, а векторы ei, ез переходят в векторы ei cos a+ + e3sina, —в! sin a+e3 cos a соответственно, т. e. поворачиваются на угол а в плоскости Oxz (см. § 30). Плоскость z—h проходит через точку Л4о(О, 0, h) и параллельна векторам ei—{1, 0, 0} и е2={0, 1, 0}. Из формул (16) следует, что после поворота этой плоскости вокруг оси у на угол а получаем плоскость яа, проходящую через точку Af0'(—/i sin a, 0, /icosa) и параллельную векторам e/={cosa, 0, sin а} и е2. Запишем параметрические уравнения плоскости ла:
х— —hsin а + и cos a;
У=	v;
z= /г cos а 4-м sin a.
(17)
155
Параметры и и v будут прямоугольными координатами на этой плоскости, определяемыми ортонормированным репером M0'e/ez'. Подставив выражения (17) в уравнение (15) и приведя подобные члены, получаем уравнение
и2 (cos2 а—R2 sin2 а) + &2—2uh cos а sin а (1 + R2) +
+/i2(sin2a—/?2cos2a)=0	(18)
нашего плоского сечения в координатах и, V.
1) При cos2 a—7?2sin2a=0 имеем ^?=ctga и, следовательно,
cos a sin a (1 + 7?2)=cos a sin a —-—=ctg a==R.
sin2 a
Поэтому уравнение (18) принимает вид
v2=2hRu+h.2 (R2 cos2 a—sin2 a),
или после переноса начала системы координат и, v
v'2==2hRu'.	(19)
При Л>0 это есть каноническое уравнение параболы с параметром p=hR (рис. 63), который при изменении h может принимать
Рис. 63
все положительные значения. При Л=0 получаем пару совпадающих прямых.
Таким образом, мы доказали
52.2. Предложение. Плоским сечением конуса (15) может быть парабола любого параметра.
156
2) Пусть теперь cos2 а—/?2 sin2 а¥=0. Преобразуем уравнение (18), выделив полный квадрат с переменной и. Получаем
(cos2 a—/?2 sin2 а) Г и2— 2uh	+
[	cos2 а — /?2 sin2 а
 ^2 (1 + #2)2 cos2 а sin2 «. j .	_
(cos2 а — /?2 sin2 а)2 J
=Й2 (l+7?2)2cos2asin2<z ft2(sjn2а_£2cqs2а)	(20)
cos2 а — R2 sin2 а
Правая часть этого уравнения после очевидных преобразований принимает вид
Я2/?2
cos2 а — R2 sin2 а
После параллельного переноса системы координат и, v h U+Я2) cosasina cos2 а — /?2 sin2 а
v' =V
уравнение (20) превращается в
(cos2 а—7?2 sin2 а) и'2 + о'2
/г2#2
cos2 а — R2 sin2 а
или при h¥=0
/2
________________________
Г_________h2R2
[ (cos2 а — /?2sin2a)2
h2R2
cos2 а — R2 sin2 а
(21)
(22>
2э) Если cos2 а—7?2sin2a>0, то уравнение (22) есть каноническое уравнение эллипса, малая ось которого параллельна оси у (см. рис. 64).
При изменении угла а от 0 до arctg — отношение полуосей R
а ___________1________
b	cos2 a — R2 sin2 a
изменяется от 1 до +oo. Кроме того, при изменении h большая полуось
а=-------___________
cos2 a — R2 sin2 a
принимает все допустимые значения. Таким образом, нами доказано
52.3.	Предложение. Плоским сечением конуса (15) может быть эллипс любого размера.
157
Если в уравнении (21) й=0, то мы получаем пару мнимых пересекающихся прямых.
2г) При cos2 а—/?2sin2a<0 уравнение (22) является каноническим уравнением гиперболы, изображенной на рис. 65. Как и в случае эллипса, фокальная полуось а принимает все положительные значения, но для отношения полуосей имеется ограничение
Следовательно, не всякая гипербола является плоским сечением данного кругового конуса (15). Но изменяя R, можем получить сколь угодно малые отношения полуосей. Таким образом, мы доказали
52.4.	Предложение. Плоским сечением конуса (15) может быть любая гипербола с отношением полуосей alba'll R. Гипербола любого размера может быть плоским сечением какого-нибудь кругового конуса.
Если в уравнении (21) Л=0, то мы получаем пару пересекающихся прямых.
52.5.	Итак, коническими сечениями являются: эллипсы, гипер-•болы, параболы, пересекающиеся прямые, мнимые пересекающиеся прямые, совпадающие прямые.
158
§ 53. ПАРАБОЛОИДЫ
53.1.	Эллиптический параболоид имеет каноническое уравнение
—+ —=2z,	(23>
Р я
где р>9>0. Плоскость у=0 пересекает этот параболоид по параболе х2=2рг, у=0 параметра р. Плоскости x=h пересекают его по параболам y2=2qz—qh2/p, x=h параметра q. Поэтому эллиптический параболоид может быть получен параллельным перемещением одной подвижной параболы, когда ее вершина скользит по другой неподвижной параболе. При этом параболы находятся в перпендикулярных плоскостях, а их оси параллельны и направлены в одну сторону (см. рис. 66).
53.2.	Если p=q, то сечения параболоида (23) плоскостями г=й>0 являются окружностями. Такой параболоид есть параболоид вращения. Он может быть получен вращением параболы x2=2pz, z/=0 вокруг оси г. Произвольный же эллиптический параболоид получается из параболоида вращения сжатием вдоль какого-нибудь направления, перпендикулярного оси вращения.
53.3.	Прямолинейных образующих эллиптический параболоид не имеет. Доказательство такое же, как и для двуполостного гиперболоида (§ 51).
53.4.	Задача. Доказать, что любое вертикальное плоское сечение параболоида (23) является параболой параметра р', изменяющегося в пределах от q до р.
53.5.	Задача. Доказать, что любое невертикальное сечение параболоида (23) является эллипсом, мнимым эллипсом или парой мнимых пересекающихся прямых. При этом эллипс любого размера является плоским сечением данного параболоида (23).
159
53.6.	Гиперболический параболоид имеет каноническое уравнение
2^_^L=22>	(24)
Р Я
где р, <7>0. Плоскость у—О пересекает этот параболоид по параболе x2=2pz, у=0 параметра р. Плоскости пересекают его по параболам y2=—2qz+gh2lp, x=h параметра р. Но оси этих парабол, в отличие от параболы, лежащей в плоскости р=0, направлены в отрицательную сторону оси г. Гиперболический параболоид, как и эллиптический, может быть получен параллельным перемещением одной подвижной параболы, когда ее вершина скользит по другой неподвижной параболе. При этом параболы находятся в перпендикулярных плоскостях, их оси параллельны, но направлены в разные стороны (см. рис. 67). Из этого построения видно, что гиперболический параболоид имеет вид седла.
53.7.	Предложение. Любое не вертикальное плоское сечение гиперболоида (24) является гиперболой или парой пересекающихся прямых.
Доказательство. Произвольную невертикальную плоскость л можно записать в виде
Ax-\-By-\-z-]- С=0.
Эта плоскость проходит через точку О'(0, 0, —С) и параллельна векторам е/={1, О, —А} и е2'={0, 1, —В}. Параметрические уравнения этой плоскости
х=щ y=v,	—С—Ah—Bv
позволяют записать уравнение плоского сечения гиперболоида (24) в аффинных координатах и, v на плоскости л:
—----^- + 2(C + Au + Bv)=0.	(25)
р я
При фиксированных А и В и при изменении С (т. е. при параллельном перемещении плоскости л) уравнение (25) представляет собой уравнение гиперболы, которая лишь при одном значении С превращается в пару пересекающихся прямых.
53.8.	Пр едложение. Любое вертикальное плоское сечение гиперболоида (24) является параболой или прямой.
Доказательство. Произвольную вертикальную плоскость, л можно записать в виде	[
Ax+By+C=Q,	(26) i
где можно предполагать, что Л2 + В2=1 и В¥=0 (сечения плоскостями x=h мы уже исследовали). Эта плоскость проходит через точ
160
ку О'(0, —С/В, 0) и параллельна векторам е/={0, 0, 1} и е2'= ={—В, Л, 0}. Из параметрических уравнений плоскости
х-=
—Bv,
+ Av,
Z— и
мы получаем уравнение плоского сечения гиперболоида (24) в прямоугольных координатах и, v:
Если qB2—рА2=£0, то уравнение (27) является уравнением параболы, ось которой, совпадая с осью и, параллельна оси z и направлена вверх или вниз в зависимости от знака числа qB2—рА2. Если же qB2—рА2\ т. е.
(28)
то такая плоскость пересекает гиперболоид (24) по прямой. Предложение доказано.
53.9.	Теорема. Через любую точку гиперболического параболоида проходит ровно две прямолинейные образующие.
Доказательство. Возьмем произвольную точку Af0(x0, f/G, z0) на гиперболоиде (24). Через эту точку проходят ровно две плоскости лл и л2, задаваемые уравнением (26), удовлетворяющим условию (28). Эти плоскости пересекают гиперболоид (24) по прямым Zi и /2. Обе эти прямые проходят через точку Мо, поскольку вертикальная прямая х=х0, У=Уо пересекает гиперболо-
(2	2 \
qx^ — ру% \
х0, Уо, ---- • Других прямоли-
^РЧ /
нейных образующих, проходящих через точку 7И0, нет, так как любая прямая лежит в вертикальной плоскости, а если вертикальная плоскость (26) пересекает гиперболоид (24) по прямой, то ее уравнение удовлетворяет условию (28). Теорема доказана.
§ 54.	ЦИЛИНДРЫ
54.1.	Определение. Цилиндрической поверхностью или цилиндром называется поверхность, получающаяся в результате движения прямой (которая называется образующей этого цилиндра), перемещающейся параллельно себе и пересекающей данную линию (которая называется направляющей этого цилиндра).
54.2.	Теорема. Непустая поверхность Ф, заданная общим уравнением второй степени (1), является цилиндром, образующие
6 Зак. 283
161
которого параллельны оси z тогда и только тогда, когда уравнение (1) имеет вид
F(x, у)=0,
т. е. когда a33=ai3=a23=a3=0.
Доказательство. Достаточность очевидна. Для проверки необходимости возьмем какую-нибудь точку Af0(x0, у0, z0) на поверхности Ф. Тогда прямая
х=х0, У=Уо, Z=zo + t	(29)
целиком содержится в поверхности. Подставляя координаты ее точек (29) в уравнение (1) и учитывая, что ЛТоеФ, получим
<W2 + 2 (ЗДз + f/оЯгз + 20а3з + л3И = 0 •
Это равенство должно выполняться при всяком t. Следовательно, а33=0. Теперь уравнение (1) можно переписать в виде
Fix, y) + 2z(a13x + a23y + a3)=0.
Если условие а1з=й23=Яз=0 не выполняется, то можно найти такую пару чисел (хь у\), что ai3Xi + агзУ1 + ^з^О- Тогда, положив
z __F (*1, Уд
2 (а13Х1 + а23У1 + аз)
получим точку Mi (xlf yi, zj, принадлежащую поверхности Ф, в то время как никакая другая точка прямой
х=хь У=У\> z=Zi + t
поверхности Ф не принадлежит. Это противоречие и завершает доказательство.
54.3.	Итак, цилиндрическая поверхность второго порядка задается в некоторой канонической системе координат уравнением
F(x, у)=0,	(30)
где F(x, у) — многочлен второй степени от переменных х, у. Линия второго порядка, определенная уравнением (30) в плоскости z=0, является направляющей линией данной цилиндрической поверхности. Если эта линия является эллипсом, действительным или мнимым, гиперболой или параболой, то цилиндр над ней называется соответственно эллиптическим цилиндром (рис. 68), мнимым эллиптическим цилиндром, гиперболическим цилиндром (рис. 69) или параболическим цилиндром (рис. 70).
Если направляющая линия есть пара прямых, то цилиндрическая поверхность распадается на пару плоскостей (совпадающих, параллельных или пересекающихся, действительных или мнимых).
162
Рис. 70
54.4.	Предложение. Всякое не вертикальное плоское сечение цилиндра (30) является линией второго порядка, имеющей то же название, что и его направляющая.
Доказательство. Мы знаем (см. 53.7), что всякая невертикальная плоскость может быть задана параметрическими уравнениями
х=н,	-2=—С—Ли—Bv.
Подставляя эти выражения в уравнение (30), получаем уравнение
F(w, у)=0, выражающее плоское сечение в аффинных координатах и, v.
54.5.	Пр едложение. Произвольная вертикальная плоскость либо не пересекает цилиндр (30) (не имеет даже общих мнимых точек), либо целиком в нем содержится, либо пересекает его по паре параллельных прямых (действительных, мнимых или совпадающих).
Это утверждение вытекает из результатов § 38 о пересечении прямой с линией второго порядка и из следующего наблюдения.
Обозначим цилиндр (30) через Ф, вертикальную плоскость — через л, плоскость Оху — через л12, прямую лПл12 — через Z, линию ФПЛ12 — через Г. Тогда плоское сечение лПФ является (вертикальным) цилиндром над /ПГ.
§ 55.	АФФИННАЯ КЛАССИФИКАЦИЯ ПОВЕРХНОСТЕЙ ВТОРОГО ПОРЯДКА
55.1.	Пр едложение. Пусть аффинное преобразование переводит поверхность второго порядка Ф в поверхность второго порядка Ф', плоскость л — в плоскость л'. Тогда линии лрФ и л'ПФ' имеют одинаковые названия.
Доказательство. Возьмем в пространстве аффинную систему координат Oxyz, для которой плоскость л является координатной плоскостью Оху. Согласно 45.3 существует единственная аффинная система координат O'x'y'z', такая, что преобразование f ассоциировано с системами координат Oxyz и O'x'y'z'. Поскольку /(л)=л', плоскость л' будет координатной плоскостью О'х'у'. Пусть поверхность Ф в системе координат Oxyz задается уравнением второго порядка F(x, у, z)=0. Тогда поверхность Ф' в системе координат O'x'y'z' может быть задана тем же уравнением /7(х\ у', z')=0. Поэтому плоские сечения лрФ и л'ПФ' имеют одинаковые уравнения F(x, у, 0)=0 и F(x', у', 0)=0 в системах координат Оху и О'х'у' соответственно. Но мы знаем, что линии второго порядка, задаваемые одинаковыми уравнениями (в разных аффинных системах координат), аффинно эквивалентны и, следовательно (см. § 46), имеют одинаковые названия. Предложение доказано.
164
55.2.	Теорема. Произвольная поверхность второго порядка посредством аффинного преобразования может быть переведена в одну из следующих 17 поверхностей, заданных в некоторой прямоугольной системе координат уравнениями
1)	x2 + y2 + z2==l;
2)	x2 + y2 + z2=—1;
3)	х2 + у2—z2=l;
4)	х2+у2—z2=— 1;
5)	х2+у2—z2=0;
6)	x2+y2+z2=0;
7)	x2 + y2=z;
81	х2—f/2=z;
9)	x2 + y2=l;
10)	х2 + у2=—1;
11)	x2—y2=l;
12)	z/2=x;
13)	x2—r/2=0;
14)	x2+f/2=0;
15)	y2=l;
16)	y2+l=0;
17)	y2=0.
При этом поверхности, имеющие одинаковые названия (§ 49), аффинно эквивалентны, а поверхности разных названий аффинно неэквивалентны.
Доказательство. Первая часть этого утверждения доказывается так же, как соответствующая теорема 46.3 для линий второго порядка. Поверхность 1)—17) из 49.2 переводится в соответствующую поверхность 1) —17) из 55.2 посредством аффинного преобразования, являющегося композицией трех сжатий или растяжений вдоль осей канонической системы координат. Так, например, для поверхностей 1)—6) годится одно и то же преобразование с аналитической записью
. х г у t Z
х' =—, i/'=—, z' =—. а	Ь	с
Что касается второй части теоремы, то поверхности разных названий мы различим их плоскими сечениями, в частности наличием или отсутствием прямолинейных образующих. При этом мы будем опираться на предложение 55.1. Отметим с самого начала, что поверхности, не имеющие вещественных точек (мнимый эллипсоид, мнимый эллиптический цилиндр, пара мнимых параллельных плоскостей), можно различить только в комплексном пространстве. Все сечения мнимого эллипсоида (вещественными) плоскостями будут мнимыми эллипсами, среди плоских сечений мнимого эллиптического цилиндра имеются как мнимые эллипсы, так и мнимые параллельные прямые, а среди плоских сечений пары мнимых параллельных плоскостей мнимых эллипсов нет вообще.
165
Остальные поверхности различимы в вещественном пространстве. Мнимый конус — это единственная поверхность, имеющая одну вещественную точку. Пара мнимых пересекающихся плоскостей — это единственная поверхность, вещественные точки которой образуют прямую. Цилиндры различаются между собой своими направляющими. Шесть основных поверхностей (эллипсоид, гиперболоиды, конус, параболоиды) делятся на две равные группы отсутствием или наличием прямолинейных образующих. Эллипс, эллиптический параболоид и двуполостный гиперболоид различаются тем, что двуполостный гиперболоид имеет в плоском сечении гиперболу, а эллиптический параболоид — параболу. Во второй группе только гиперболический параболоид не имеет в плоском сечении эллипса, у однополостного гиперболоида есть параллельные прямолинейные образующие, а конуса нет. Оставшаяся часть задачи (отличить цилиндры от основных поверхностей) предоставляется читателю.
Глава VII
ПРОЕКТИВНАЯ ПЛОСКОСТЬ
§ 56.	ПОПОЛНЕННАЯ ПЛОСКОСТЬ И СВЯЗКА
56.1.	Инцидентность. Современная математика базируется на теории множеств. При теоретико-множественном подходе основным элементом геометрии считается точка. Что касается прямых, плоскостей, других геометрических фигур, то они являются множествами точек.
Но можно строить геометрию, в которой основными элементами являются прямые или по крайней мере прямые и точки равноправны. Для этого в первую очередь надо сделать симметричным бинарное отношение между точками и прямыми, состоящее в том, что точка принадлежит прямой. Этой цели можно добиться, если использовать вполне употребимое выражение: «точка лежит на прямой». Симметричное ему выражение: «прямая лежит на точке» — хотя и непривычно на слух, не противоречит наглядным представлениям. Обычно же в этом случае говорят, что прямая и точка инцидентны.
Одна из наиболее важных аксиом планиметрии гласит:
Пр Любые две различные точки плоскости инцидентны одной и только одной прямой.
Симметричное к ней утверждение:
П2. Любые две различные прямые плоскости инцидентны одной и только одной точке, — противоречит пятому постулату Эвклида. Поэтому, чтобы добиться равноправия между прямыми и точками, надо заставить параллельные прямые пересекаться. Сейчас мы сделаем это, построив пополненную плоскость.
56.2.	Пополненная плоскость. Чтобы в плоскости л не стало параллельных прямых, надо к каждой прямой добавить по крайней мере одну точку. Для данной прямой 1с.л обозначим через |7] несобственный пучок прямых, параллельных прямой I. Этот пучок [/] назовем несобственной точкой плоскости л. Обычные ее точки будем называть собственными.
Добавим к плоскости л все ее несобственные точки и обозначим это новое множество через л. Прямые I плоскости л, к каждой из которых добавлена несобственная^ точка [I], называются (собственными) прямыми в множестве л. Эти прямые обозначаются символами I или просто теми же буквами I. Несобственная точка [I] называется несобственной точкой прямой I. Легко проверить, что в новой (расширенной) плоскости л выполняется аксиома П2. Но при этом перестала выполняться аксиома Пь никакая прямая не проходит через две несобственные точки. Исправить положение можно, объявив множество л\л всех несобственных точек еще одной (несобственной) прямой.
167
Множество л с выделенными в ней собственными и несобственной прямыми и называется пополненной плоскостью. Несобственные точки пополненной плоскости называются также «бесконечно удаленными», несобственная прямая — «бесконечно удаленной» прямой.
56.3.	Общее определение проективной плоскости. Пополненная плоскость удовлетворяет аксиомам П! и П2. Кроме того, она очевидно удовлетворяет следующим двум аксиомам.
П3. Существуют три точки, не инцидентные одной прямой.
П4. Каждая прямая инцидентна по меньшей мере трем точкам.
Проективной плоскостью S называется произвольное множество, элементы которого именуются точками, и набор его подмножеств, именуемых прямыми, если при этом выполняются аксиомы П1—П4.
Задача. Доказать, что любая проективная плоскость содержит по меньшей мере семь точек. Построить проективную плоскость на семи точках.
56.4.	Вещественная проективная плоскость. Две проективные плоскости Sj и S2 называются изоморфными, если существует биекция f:Si-^S2, которая переводит точки в точки, прямые в прямые и сохраняет отношение инцидентности.
Вещественной проективной плоскостью называется проективная плоскость, изоморфная пополненной плоскости. Обычно вещественная проективная плоскость обозначается символом RP2.
В соответствии с этим пополненная плоскость называется (первой) моделью вещественной проективной плоскости. "
В дальнейшем вещественную проективную плоскость иногда называем просто проективной плоскостью.
56.5.	Связка. Множество всех прямых и плоскостей трехмерного пространства, проходящих через данную точку О, называется связкой с центром О или связкой О. Прямые связки называем лучами.
Назовем луч и плоскость связки О инцидентными между собой, если данный луч лежит в данной плоскости. Если назвать теперь лучи связки «точками», а ее плоскости — «прямыми», то легко видеть, что связка удовлетворяет аксиомам П1—П4, т. е. является проективной плоскостью.
56.6.	Перспективное соответствие. Возьмем какую-нибудь плоскость л, не проходящую через точку О. Тогда через каждую точку М плоскости л проходит единственная прямая (луч) пг=ОМ связки О. Таким образом, установлено соответствие, называемое перспективным соответствием, между всеми точками плоскости л и лучами связки О. При этом соответствии каждой прямой I, лежащей в плоскости л, сопоставляется принадлежащая связке О плоскость Х==О/, проходящая через точку О и прямую I (рис. 71).
Очевидно, что при перспективном соответствии между плоскостью л и связкой О сохраняется отношение инцидентности: если на плоскости л точка М инцидентна прямой /, то соответствующие 168
луч ОМ и плоскость 01 связки также будут инцидентны, и наоборот.
Но перспективное соответствие между плоскостью л и связкой О не является взаимно однозначным: лучи связки, параллельные плоскости л, не соответствуют никакой точке плоскости л, а плоскость связки, параллельная плоскости л, не соответствует никакой прямой плоскости л. Назовем особым лучом связки всякий луч, параллельный плоскости л, а особой плоскостью связки — ее плоскость, параллельную плоскости л.
Рассмотрим пучок плоскостей, проходящих через особый луч связки. Неособые плоскости этого пучка при перспективном соответствии переходят в несобственный пучок параллельных прямых на плоскости л, который задает (несобственную) точку пополненной плоскости л. Поставив в соответствие всякому несобственному пучку параллельных прямых, лежащих в плоскости л, параллельный этим прямым особый луч связки О, а несобственной прямой плоскости л — особую плоскость связки О, продолжаем перспективное соответствие до биекции между всеми точками и прямыми пополненной плоскости л и всеми лучами и плоскостями связки О. Эта биекция также называется перспективным соответствием. Очевидно, что это перспективное соответствие также сохраняет отношение инцидентности. Следовательно, оно является изоморфизмом проективных плоскостей.
Итак, связка изоморфна пополненной плоскости и является (второй) моделью вещественной проективной плоскости.
§ 57.	ОДНОРОДНЫЕ КООРДИНАТЫ НА ПРОЕКТИВНОЙ
ПЛОСКОСТИ. ТЕОРЕМА ДЕЗАРГА
57.1.	Однородные координаты в связке. Пусть дана связка О. Возьмем в пространстве какой-нибудь репер Ое^вз с началом в точке О. Для произвольного луча m связки тройку координат хь
169
х2, любого направляющего вектора этого луча назовем тройкой однородных координат луча пг (в данном репере Ое^ез). Обозначим класс всех пропорциональных данной тройке хь х2, %з ненулевых троек через (xi:x2:x3). Каждая тройка из класса (xi:x2:x3) также будет тройкой однородных координат луча пг. Весь же класс троек (х!:х2:х3) назовем однородными координатами луча пг (в репере Ое,е2е3).
Пусть теперь дана принадлежащая связке О плоскость %. В репере Ое^гвз она может быть записана уравнением
a1Xi + a2x2+a3x3=0.	(1)
Тройку аь а2, аз назовем тройкой однородных координат плоскости %. Тройки однородных координат плоскости также определены с точностью до пропорциональности. Класс всех пропорциональных данной тройке аь а2, а3 ненулевых троек обозначим через {ас.а^-.аз} и назовем однородными координатами плоскости X (в репере Ое^ез).
Любую ненулевую тройку Xi, х2, х3, удовлетворяющую уравнению (1), можно рассматривать и как тройку координат принадлежащей плоскости X точки М, и как тройку однородных координат инцидентного плоскости % луча пг=ОМ. Таким образом, уравнение (1) представляет собой условие инцидентности луча с однородными координатами (xi:x2:x3) и плоскости с однородными координатами {ai:a2:a3}.
57.2.	Однородные координаты на плоскости. Предположим, что на обычной плоскости л выбран репер oeie2. Пусть М — произвольная точка плоскости, х, у — ее координаты в этом репере. Тогда всякая ненулевая тройка чисел
Хъ х2, х3,
пропорциональная тройке
X, У, 1,
называется тройкой однородных координат точки М (в репере ое^г).
Ясно, что переход от тройки однородных координат Xi, х2, х3 точки М к ее аффинным координатам х, у осуществляется по формулам
х=^-, у=-^~.	(2)
*з	х3
Такой переход возможен, поскольку для ненулевой тройки хь х2, хз, пропорциональной тройке х, у, 1, всегда хз=#0.
Совокупность всех троек однородных координат хь х2, хз точки М обозначается через (xi:x2:x3) и называется однородными координатами точки М (в репере oeie2).
170
Возьмем теперь^ на плоскости л некоторую прямую Z, заданную (в репере oeie2) общим уравнением
Дх-h Ву-\- С—0.	(3)
Мы знаем, что коэффициенты уравнения (3) данной прямой I определены с точностью до пропорциональности, т. е. для любой ненулевой тройки аь 02, Дз, пропорциональной тройке А, В, Сг уравнение
«1* + ^2У + ^з=0	(4)
описывает ту же прямую Z. Совокупность всех ненулевых троек 01, 02, аз, пропорциональных тройке Л, В, С, обозначается через {ai:a2:a3} и называется однородными координатами прямой I (в репере oeie2).
Найдем теперь, как прямая I описывается в однородных координатах своих точек. Если аффинные координаты х, у точки М удовлетворяют уравнению (4), то ее однородные координаты хь х2, х3 согласно формулам (2) удовлетворяют уравнению
aj—)+оз=0,
или
ВД + а2х2 + 0з*з=О.	(5)
При этом ясно, что если х3¥=0, то тройка хь х2, х3, удовлетворяющая уравнению (5), является тройкой однородных координат точки М, принадлежащей прямой (4).
Но важно отметить, что уравнению (5) удовлетворяют не только ненулевые тройки хь х2, х3, являющиеся однородными координатами точек прямой (4). При х3=0 уравнению (5) удовлетворяют тройки, пропорциональные тройке 02, —0Ь 0. Естественно предположить, что совокупность (02:—0iiO) представляет собой однородные координаты бесконечно удаленной точки |7] прямой I. Сейчас мы убедимся, что это в самом деле так.
57.3.	Связь однородных координат в связке с однородными координатами на плоскости. Возьмем в пространстве какой-нибудь репер Oeie2e3. Конец вектора е3, отложенного от точки О, обозначим о. Проведем через точку о плоскость л параллельно векторам еь е2 (рис. 72).
В репере Oeie2e3 плоскость л, очевидно, имеет уравнение х3= = 1. Поэтому всякая точка М плоскости л, имеющая в репере oeie2 координаты х, у, в репере Ое{е2е3 имеет координаты х, у, 1, и наоборот.
Следовательно, всякий собственный (по отношению к плоскости л) луч связки О, проходящий через точку Л4(х, у), имеет в связке однородные координаты (х:у:1).
171
При перспективном соответствии всякой несобственной точке пополненной плоскости л (классу [/] параллельных прямых на плоскости л) ставится в соответствие луч связки, параллельный этим прямым [/]. Такой луч является несобственным и лежит в плоскости х3=0. Следовательно, несобственные точки пополненной плоскости соответствуют лучам связки с однородными координатами вида (xiix2-0).
Рис. 72
Пусть теперь прямая I в плоскости л имеет уравнение (4). Один из направляющих векторов этой прямой в базисе еь е2 на плоскости имеет координаты {а2, —aj. Тогда в пространстве в базисе еь е2, е3 этот вектор имеет координаты {а2, —аь 0}. Но это и есть направляющий вектор луча связки, соответствующего несобственной точке [/] прямой I. Таким образом, при перспективном соответствии несобственная точка [/] прямой /, заданной уравнением (4), переходит в луч связки с однородными координатами (а2:— :0).
Это подтверждает высказанное нами в конце пункта 57.2 предположение об однородных координатах несобственных точек и позволяет распространить определение однородных координат на несобственные точки:
совокупность ненулевых троек (а2:—является однородными координатами несобственной точки прямой (4) (в репере oeie2) на пополненной плоскости л.
При таком определении любое уравнение (5) первой степени относительно переменных х2, х3 можно рассматривать как уравнение прямой (на пополненной плоскости л) с однородными координатами {ai:а2:а3}. Собственные прямые характеризуются условием 0i2+022>O, несобственная прямая имеет уравнение
х3=0,
т. е. ее однородные координаты равны {0:0:1}.
Итак, мы определили однородные координаты точек и прямых на пополненной плоскости л. При этом перспективное соответствие определяется равенством однородных координат соответствующих друг другу точки и луча, прямой и плоскости. Уравнение (5) 172
(как и тождественное ему уравнение (1)) представляет собой условие инцидентности точки (%i:x2:x3) прямой {tij :а2:а3}.
57.4.	Арифметическая модель проективной плоскости. Предыдущие рассмотрения подводят нас к следующему определению. Арифметической проективной плоскостью называется множество Р элементов двух родов,, называемых соответственно «арифметическими точками» и «арифметическими прямыми». И те и другие суть классы пропорциональных между собой ненулевых троек вещественных чисел. Точки обозначаются, например, через (xi:x2: :х3), а прямые — через {«i :а2:а3). При этом между точками и прямыми установлено отношение инцидентности: точка (%i:x2:x3) и прямая {«1 :а2:л3} называются инцидентными между собой, если
й\Х\ + 6Z2X2-h С13Х3=0.	(5)
Замечание. Такое симметричное определение, в котором точки и прямые полностью равноправны, не совсем согласуется с определением 56.3 проективной плоскости, в котором прямыми назывались множества точек. Но это рассогласование легко ликвидировать, если арифметическую прямую {tXi:a2:a3} отождествить с множеством всех арифметических точек (х^ХгГХз), удовлетворяющих условию (5).
Ставя теперь в соответствие точкам (xi:x2:x3) и прямым {ai:a2:a3} арифметической проективной плоскости прямые и плоскости связки О (или точки и прямые пополненной плоскости л), имеющие в некотором фиксированном репере однородные координаты (%1 :х2:х3) и {ль:а2:а3} соответственно, получаем, очевидно, изоморфизм арифметической проективной плоскости предыдущим моделям проективной плоскости.
Таким образом, арифметическая проективная плоскость является еще одной (арифметической) моделью проективной плоскости.
57.5.	Принцип двойственности. Пусть верно какое-нибудь утверждение, касающееся точек и прямых на проективной плоскости и отношения инцидентности между ними. Тогда будет верно и двойственное утверждение, получаемое из данного утверждения заменой слов «прямая» на «точка» и наоборот.
В самом деле, числовое равенство (5), выражающее условие инцидентности точки (х{:х2:х3) и прямой {ах :а2:а3}, не зависит от того, какую из двух троек хь х2, х3 и аь а2, а3 мы заключаем в круглые, а какую — в фигурные скобки, т. е. не зависит от того, считаем ли мы тройки хь х2, х3 и ах, а2, а3 тройками однородных координат точки и прямой ил-и, наоборот, прямой и точки.
Принцип двойственности иллюстрирует равноправие точек и прямых на проективной плоскости. С таким же правом, как мы раньше считали первоначальным понятие точки, а прямую определяли как множество точек, удовлетворяющих уравнению (5), мы можем считать первоначальным понятие прямой и определять точку как множество инцидентных ей прямых (пучок прямых), удов
173
летворяющих тому же уравнению (1), в котором, правда, переменными уже являются аь а2, аз-
57.6.	Теорема Дезарга. Временно прямую, инцидентную точкам А и В, обозначаем через АВ, точку, инцидентную прямым а и Ь,— через (а-&). Треугольником называем совокупность трех точек, не инцидентных одной прямой. Сторонами треугольника называем прямые, инцидентные парам его вершин.
Теорема. Пусть на проективной плоскости даны два треугольника LMN и L'M'N' так, что не совпадают соответственные вершины и стороны этих треугольников. Тогда три прямые LL', ММ', NN' инцидентны одной и той же точке в том и только в том случае, когда три точки (MN -M'N'), (NL-N'L'), (LM, L'M') инцидентны одной и той же прямой (рис. 73).
Доказательство. Введя обозначения для прямых MN— =4, NL=m, LM=n, M'N'=l', N'L'=m', L'M'=n', читатель легко убедится в том, что прямое и обратное утверждения этой теоремы двойственны друг другу. Поэтому в силу принципа двойственности достаточно проверить необходимость условий этой теоремы.
Предположим, что на проективной плоскости введены однородные координаты. Обозначим какую-нибудь тройку однородных координат точек L, М9 N, L', М', N' соответственно через 1, m, n, 1', т', п'. По условию три прямые LL', ММ'9 NN' инцидентны одной точке Q. Пусть ш — какая-нибудь тройка однородных координат этой точки. Поскольку три точки L, L', Q коллинеарны, три тройки 1, 1', о линейно зависимы (это легко получить, например, если в качестве модели проективной плоскости взять связку). Но тройки 1 и !', будучи тройками координат различных точек L и L', не пропорциональны. Поэтому тройка оэ есть линейная комбинация троек 1 и 1'. По тем же соображениям тройка ш является линейной
174
комбинацией троек m и ш', а также п и п'. Следовательно, существуют такие ненулевые пары чисел (А, А'), (ц, р,'), (v, v'), что ©=Al+A'l'=p.ni-|-|i'ni'=vn-|-v'n', откуда получаем
цгп—vti=v'n'— ц'гп', vn—A1=AT—v'n', Al—pm=p'm'—AT.
(6)
(7)
(8)
Эти равенства являются, как легко видеть, равенствами ненулевых троек, которые обозначим через р, q, г соответственно. Обозначим через Р, Q, R точки, тройками однородных координат которых служат тройки р, q, г соответственно. Равенство (6) означает, что Р= (MN-M'N'). Аналогично Q=(NL-N'L'), R=(LM- L'M'). С другой стороны, складывая равенства (6), (7), (8), получаем
p + q + r=(O, 0, 0).
Следовательно, точки Р, Q, R инцидентны одной прямой. Теорема Дезарга доказана.
§ 58.	ПРОЕКТИВНЫЕ СИСТЕМЫ КООРДИНАТ
58.1.	Определение. Два репера Oeie2e3 и Oei'e2'e3' с общим началом О называются эквивалентными, если существует такое число А, что
е,'=Ае,, i=l, 2, 3.
58.2.	Предложение. Реперы. Ое^ез и Oe'je/es' эквивалентны тогда и только тогда, когда каждый луч связи О имеет одни и те же однородные координаты в этих реперах.
Доказательство. Необходимость очевидна. Предположим теперь, что однородные координаты каждого из лучей в этих реперах одинаковы. Тогда луч, несущий вектор е/, имеет в обоих реперах однородные координаты (А: 0:0), откуда е/=,Aiet для некоторого Ai^O. Аналогично е2'=А2е2, е3'=Азез. Осталось показать, что А1=А2=Аз. Луч с направляющим вектором е'=е/ + е2'+ез' имеет по предположению в обоих реперах однородные координаты (1:1:1), откуда е'=А(е1 + е2+ез) при некотором А=/=0. Но, с другой стороны, е'=А1е1-|-А2е2+Азез. Следовательно, A=Ai=A2=A3, что и требовалось доказать.
58.3.	Определение. Проективной системой координат в связке О называется класс эквивалентных между собой аффинных реперов (или, что то же самое, аффинных систем координат) с началом О.
Из доказательства предложения 58.2 вытекает, что проективная система координат в связке О однозначно определяется упорядоченной четверкой некомпланарных (никакие три не лежат в одной плоскости) лучей Xit Х2, Х3, Е этой связки. Лучи Х2, Х3 называются координатными, а луч Е — единичным. Коор-
175
динатлые лучи являются осями координат эквивалентных аффинных систем координат, а любая точка Е на единичном луче Е является концом диагонали ОЕ параллелепипеда, построенного на единичных векторах t\=OEb е2=ОЕ2, е3=ОЕ3 аффинной системы координат, принадлежащей данной проективной системе координат (рис. 74).
Рис. 74
Поэтому четверку Хь Х2, Х3, Е также можно назвать проективной системой координат, или, более точно, проективным репером, определяющим данную проективную систему координат.
58.4.	Определение. Тройки координат произвольного луча связки О в аффинном репере Oeie2e3, или, что то же самое, в любом аффинном репере, эквивалентном реперу Oeie2e3, называются тройками проективных координат этого луча в проективной системе ХхХ2Х3Ё.
58.5.	Однородные координаты как проективные. Таким образом, тройки однородных координат произвольного луча связки О в аффинном репере Oeie2e3 (см. 57.1) — это тройки проективных координат этого луча в проективной системе координат XiX2X3E, определяемой репером _Oeie2e3._
В частности, лучи Х2, Х3, Е имеют в этой системе следующие координаты
Х1=(1:0:0), х2=(0:1:0), Х3=(0:0:1), £=(1:1:1).
При описанных выше изоморфизмах моделей проективных плоскостей (связка — пополненная плоскость, связка — арифметическая проективная плоскость) проективные координаты в связке переносятся и на пополненную плоскость и на арифметическую проективную плоскость. Но в отличие от связки, где все проективные системы координат равноправны, на арифметической проективной плоскости имеется исходная привилегированная система координат. Что касается пополненной плоскости, то там имеется
176
целое семейство привилегированных проективных систем координат. Каждая из них определяется аффинной системой координат, задающей однородные координаты. Всякий аффинный репер ое^г на плоскости л, расположенной в пространстве, при фиксированной точке О^л, однозначно задает такой аффинный репер Oeie2e3, е3=Оо (см. рис. 72) в пространстве, что проективные координаты лучей связки О, определенные репером Oeie2e3, совпадают с однородными координатами соответствующих им точек пополненной плоскости л, определенными репером ое^.
58.6.	Переход от одной проективной системы координат к другой. Теперь основной моделью проективной плоскости считаем связку, хотя нагляднее представлять себе проективную плоскость в виде пополненной плоскости, а аналитические выкладки проще проводить в однородных координатах, т. е. фактически на арифметической проективной плоскости. Считая связку основной моделью проективной плоскости Р, мы, как правило, называем ее лучи точками, а плоскости — прямыми проективной плоскости Р, в соответствии с этим лучи Xb Х2, Х3, Е, определяющие проективную систему координат, обозначаем Хь Х2, Х3, Е. Точки Хь Х2, Х3, 5, задающие проективную систему координат XxX2X3Et называем ее фундаментальными точками.
Пусть на проективной плоскости Р даны две проективные системы координат — исходная X\X2X$E и «новая» система Х/Х/Х/Р'. Новая система задана какими-то тройками проективных координат ее фундаментальных точек относительно исходной системы:
Х1==(сц : с21 : £з1)>
— (^12 : С22 : С32)»
Х3=(С13 : с2з : сзз)>
E'=(ei: е2 : е3).
Надо найти формулы преобразования координат, выражающие координаты хь х2, любой точки М относительно исходной системы координат через координаты х/, х/, х3' той же точки в новой системе координат.
Предположим сначала, что тройки координат (9) точек X/, X/, Х3', Е' выбраны согласованными, т. е. подчинены условию
{^11, С21> С31}4"{^12» С22> СЗг}Н“{^13» С23» ^Зз} = {£1» 62> ез}-	(Ю)’
Тогда, возвращаясь к связке О и предполагая, что исходная проективная система Х^ХзР порождается аффинным репером Oeie2e3, видим, что векторы
е1=={С11» ^21, с31}> e2={C12> С22> сзг}» е3 = {С13> ^23> С3з}>	О О
177
заданные координатами в базисе еь е2, е3, линейно независимы, поскольку лучи X/, X/, Х3' не лежат в одной плоскости. Более того, равенство (10) гарантирует нам (см. доказательство предложения 58.2), что репер Ое/е/ез' порождает проективную систему координат Х/Хг'Хз'Е7.
Далее, каждая тройка хь х2, х3 проективных координат в системе Х]Х2Х3Е произвольного луча т есть согласно 58.4 тройка координат в репере Oeje2e3 некоторого направляющего вектора а этого луча. Аналогичным образом тройка координат г/, х/, х3' луча пг в системе Х/Х2'Хз'Е' есть тройка координат в репере Ое/е'2е3' какого-то направляющего вектора а7=Ха того же луча т. Поэтому из (11) и из формул преобразования аффинных координат (§ 23) получаем
X
Xi
Х3
£ц ^12 С13
С21 ^22 С23
С31 ^32 С33
X]
Х2 х'з
(12)
Это и есть формула перехода от проективной системы ХУХ2Х3Е к проективной системе Х/Х/Хз'Е'. Здесь X — вещественный множитель, принимающий все отличные от нуля значения.
Формула (12) получена в предположении (10) согласованности координат точек X/, Х2', Х3', Е. Но этого условия всегда можно добиться, заменив векторы е/, е2', е3' из (11) на пропорциональные векторы Xie/, Х2е/, Хзвз7. Для этого числа X/ надо найти из системы уравнений
з
£СА=8(, 8 = 1, 2, 3.	(13)
/=1
Матрица С этой системы не вырождена, поскольку столбцы ее состоят из координат векторов е/, е2', ез7, не лежащих в одной плоскости. Поэтому система (13) имеет единственное решение Xi, Х2, Х3. Ни одно из этих чисел не равно нулю. В самом деле, если бы, например, Xi=0, то лучи X/, Х3', Е' лежали бы в одной плоскости. Итак, переходя от векторов е/ к векторам Хгв/, можно добиться условия (10) и после этого пользоваться формулой перехода (12), в которой, разумеется, матрица С уже отлична от исходной.
58.7.	Замечание. Для данной проективной системы координат Х^ХзЕ и невырожденной матрицы С существует единственная проективная система координат Х/Х/Хз'Е', переход к которой от исходной системы осуществляется по формулам (12). Это вытекает из того, что матрица С с точностью до пропорциональности является матрицей перехода от репера Oeie2e3, задающего систему Х1Х2Х3Е, к реперу Ое/е/ез', задающему систему Х/Х/Х3'Е'.
178
§ 59.	ПРОЕКТИВНЫЕ ПРЕОБРАЗОВАНИЯ
59.1.	Определение. Отображение f:P-+P проективной плоскости называется ее проективным преобразованием, если существуют две такие проективные системы координат ХхХ2Х3Е и Хх'Х2Х3Е', что произвольная точка М<=Р имеет те же проективные координаты в системе ХхХ2Х3Е, что точка	в систе-
ме Х/Х2Х3Е'.
59.2.	Аналитическая запись проективного преобразования. Предположим, что проективное преобразование f задано двумя системами координат Х^Х2Х3Е и Х/Х2Х3Е', связанными между собой формулами перехода (12). Мы хотим найти, как связаны между собой координаты хь х2, *з произвольной точки М в системе Х^Х2Х3Е и координаты х/, х2, х3 ее образа	в той же
системе. Для этого обозначим координаты точки М' в системах ХхХ2Х3Е и Х/Х2Х3Е' через у2, у3 и у/, у2, у3 соответственно.-Тогда согласно (12) имеем
з
^Уг=^сцу', 1 = 1, 2, 3.	(14);
/=1
Но по определению проективного преобразования - yt=xi. Кроме того, в наших исходных обозначениях yt=Xi'. Следовательно, формулы (14) принимают вид
з
Ui'=£ suXj, /=1,2,3.	(15)
/=»
Это и есть аналитическая запись проективного преобразования в проективных координатах.
Наоборот, из 58.7 легко вытекает, что для невырожденной матрицы С и проективной системы координат ХгХ2Х3Е существует и единственно проективное преобразование, записываемое формулами (15).
59.3.	Группа проективных преобразований. Из матричной записи формул (15)
£ц f12 С13
С21 С22 С23 ^31 ^32 ^33
*1
х3
(15')
вытекает, что если в системе координат Х\Х2Х3Е проективное образование f задается матрицей С, а проективное преобразование g — матрицей D, то их композиция g°f задается матрицей DC и, следовательно, также является проективным преобразованием. Аналогично матрица С~1 задает преобразование f"1. Итак, преобразование, обратное к проективному, также будет проективным. Поскольку тождественное преобразование также проективно,. нами доказана
179
Теорема. Множество всех проективных преобразований проективной плоскости является группой (изоморфной группе всех невырожденных матриц третьего порядка).
59.4.	Пр едложение. При проективном преобразовании f с матрицей С прямая с координатами {ах: #2 • ^з} переходит в прямую с координатами {а{\а2'.а3}С^.
Доказательство. Итак, пусть проективное преобразование f ассоциировано с системой координат Х{Х2Х3Е и Х/Х2Х3Е' и прямая I задана в первой системе уравнением
alxi + а2х2 4- #3X3=0.
Тогда ее образ f(l) в новой системе координат задается таким же уравнением или (с учетом нового обозначения координат точек)
Из равенства (12) вытекает, что в исходной системе координат прямая f(l) задается уравнением
(#1, #2, #з)£
что и требовалось доказать.
59.5.	Проективно-аффинные преобразования. Проективная плоскость с выделенной на ней несобственной прямой называется проективно-аффинной плоскостью. Точки несобственной прямой называются несобственными, остальные точки — собственными.
Проективное преобразование проективно-аффинной плоскости называется проективно-аффинным, если оно отображает несобственную прямую на себя.
В качестве проективно-аффинной плоскости возьмем арифметическую проективную плоскость с несобственной прямой х3=0, или, что то же самое, пополненную плоскость с однородными координатами хь х2, Хз, порожденными аффинными координатами х, у.
59.6.	Теорема. 1) Для того чтобы проективное преобразование, заданное формулами (15), было проективно-аффинным, необходимо и достаточно, чтобы
с31 = с32=0:^=^33-	(16)
2) Всякое проективно-аффинное преобразование (15), рассматриваемое на множестве собственных точек плоскости, является аффинным преобразованием, имеющим аналитическую запись
180
х'=аих4-а12г/ + а13, У ^21"^ ”4“ ^аУ 4” ^23»
(17)
где ац=-----.
сзз
3) Всякое аффинное преобразование (17) продолжается до проективно-аффинного преобразования, имеющего аналитическую запись
А/%1--^Ц-^1 "4“ ^12^2 ”4“ ^13*^3 >
А,Х2--^21-^1 “4” ^22^2	^23*^3,
Хх3=	Х3.
(18)
Доказательство. 1) Необходимость. Точка (1:0:0) преобразованием (15) переводится в точку (%Сц : Xc2i: 2^31), которая является несобственной, если Сз1=0. Аналогично c2i=0. Из невырожденности матрицы С получаем с3з=А0. Достаточность очевидна.
2) Если первое и второе из равенств (15) разделить на третье, то с учетом условий (16) и равенств х =у=~^~ получим х3	х3
равенства (17). Эти равенства определяют аффинное преобразование, поскольку
I С11 С12 I
а11 а12 I с21 с22 I det С о ^22 21	22	с33	С33
3) Преобразование (18) проективно-аффинно, так как выполнены условия (16). Это преобразование является продолжением аффинного преобразования (17), поскольку равенства (17) получаются из первого и второго равенств (18) делением их на третье из равенств (18).
59.7. Следствие. Множество всех проективно-аффинных преобразований есть подгруппа группы всех проективных преобразований проективной плоскости, изоморфная группе аффинных преобразований аффинной плоскости.
59.8. Предложение. Любая пара Zb 12 пересекающихся прямых может быть посредством проективного преобразования переведена в любую другую пару пересекающихся прямых Ц', 12.
Доказательство. Пусть Х3 — точка пересечения прямых 1\ и Z2, Хь Х2 — точки на прямых Zb /2, не совпадающие с точкой Х3, и пусть точка Е не принадлежит ни одной из прямых /ь Z2, Х\Х2. Аналогично, отправляясь от прямых Z/, Z/, построим точки X/, Х2', X/, Е'. Тогда проективное преобразование, ассоциированное с проективными реперами XxX2XzE и Х/Х/Х'2?, очевидно, и будет искомым.
181
§ 60.	ЛИНИИ ВТОРОГО ПОРЯДКА В ОДНОРОДНЫХ КООРДИНАТАХ
60.1.	Если на плоскости с аффинными координатами х, у задана линия второго порядка Г общим уравнением
#нХ24- 2#i2xy+#22//24" 2#1зХ-|- 2a23f/ + #33=0,	(19)
то с переходом х =-----, у=---- от аффинных координат к одно-
хз	хз
родным уровнение (19) превращается в уравнение
апх2 + 2а12х1х2 + а22х2 + 2a13XiX3 + 2а23х2х3 + а33х2 = 0.	(20)
Это уравнение на множестве всех собственных точек плоскости (хз=^0), очевидно, эквивалентно уравнению (19). Если же рассматривать уравнение (20) на пополненной плоскости л, то ему кроме всех собственных точек, удовлетворяющих уравнению (19), т. е. точек линии Г, удовлетворяют несобственные точки, подчиненные условию
anxi + 2а12хл + «22хо = °>
т. е. асимптотические направления линии Г.
Таким образом, линия Г, заданная уравнением (20), получается из линии Г добавлением к ней ее асимптотических направлений (если таковые имеются).
60.2.	Определение. Линией второго порядка-на проективной плоскости называется множество Г точек, проективные координаты которых (в некоторой проективной системе координат) удовлетворяют однородному уравнению второй степени (20). .
Заметим, что в этом определении уже не предполагается выполнение условия
^l+«?2 + <*22^0-	(21>
60.3.	Линии второго порядка на проективно-аффинной плоскости. Мы знаем уже, что линия второго порядка на пополненной плоскости, удовлетворяющая условию (21), является пополнением линии второго порядка (19) на обычной плоскости ее асимптотическими направлениями. Какие же еще могут быть линии второго порядка на проективно-аффинной плоскости? Предположим, что 6Zn=a12=6Z22=0. Тогда уравнение (20) превращается в уравнение
х3 (2a13Xi -|- 2а23х2 а33х^)—0.	(22)
Это есть уравнение двух прямых
%з=0,	2а1зХ1 + 2а2зХ2 + ^зз^з==0.
Первая из этих прямых — несобственная, а вторая может быть как собственной, так и несобственной.
182
Таким образом, всякая линия второго порядка на проективноаффинной плоскости есть
1)	либо обычная линия второго порядка, пополненная асимптотическими направлениями;
2)	либо пара пересекающихся прямых, одна из которых несобственная;
3)	либо пара совпадающих несобственных прямых.
§ 61.	ПРОЕКТИВНАЯ И ПРОЕКТИВНО-АФФИННАЯ КЛАССИФИКАЦИИ ЛИНИЙ ВТОРОГО ПОРЯДКА
61.1.	Пр едложение. Эллипс, гипербола и парабола проек-тивно эквивалентны, т. е. переводятся друг в друга посредством проективного преобразования.
Доказательство. Отметим прежде всего, что эллипсом, гиперболой и параболой мы называем здесь обычные эллипс, гиперболу и параболу, пополненные своими асимптотическими направлениями, т. е. к гиперболе добавляется пара точек, а к параболе — одна. Покажем, что эти три линии проективно эквивалентны действительному овалу, т. е. линии, имеющей в некоторой проективной системе координат уравнение
Х!2+х22—х32=0.	(23)
В самом деле, эллипс в некоторой аффинной системе координат имеет уравнение
Х2+</2=1,
которое, будучи записано в однородных координатах, совпадает с уравнением (23). Гипербола может быть записана уравнением
X2—у2—1=0,
или в однородных координатах
х2—х2—х2=0.
Последнее уравнение эквивалентно уравнению
х24-х2—х2=0.	(24)
Очевидно, что проективное преобразование
ЛХ1 — х2,	।
лх;= х3, ।
%X3 = Xi	J
переводит линию (24) в действительный овал (23). Наконец, парабола может быть записана уравнением
х2—у=0,
183
или в однородных координатах
Xi2—Х2*з=0.	(25)
Проективное преобразование, обратное к которому записывается формулами
Xx1=x'it
кх2— —
Хх3==	Хг + ^з,
переводит линию (25) в линию (23). Предложение доказано.
61.2.	Теорема. Существует ровно 5 классов проективной эквивалентности линий второго порядка, а именно:
1)	Х12 + х22—*з2=0, действительный овал;
2)	х12 + Х22 + ^з2=0, мнимый овал;
3)	хх2—х22=0, пересекающиеся прямые;
4)	х124-х22==0, мнимые пересекающиеся прямые;
5)	Xi2=0, совпадающие прямые.
Доказательство. Будем рассматривать проективную плоскость как проективно-аффинную с несобственной прямой х3= =0. Тогда согласно 60.3 любая линия второго порядка (20) есть либо одна из девяти обычных линий второго порядка, пополненных асимптотическими направлениями; либо пара пересекающихся прямых, одна из которых несобственная; либо пара совпадающих несобственных прямых. Последние две линии согласно 59.8 проек-тивно эквивалентны соответствующим линиям, состоящим из собственных прямых. Таким образом, надо доказать, что каждая из девяти обычных пополненных линий второго порядка проективно эквивалентна одной из пяти перечисленных в формулировке тео* ремы линий.
Мы уже доказали (61.1), что эллипс, гипербола и парабола эквивалентны действительному овалу. Ясно также, что мнимый эллипс (х2+#24-1=0) эквивалентен мнимому овалу; пересекающиеся прямые (х2—г/2=0), мнимые пересекающиеся прямые (х2+ 4-у2=0) и совпадающие прямые (х2==0) соответственно проективно эквивалентны линиям 3), 4), 5). Параллельные прямые (х2—1 = =0) пересекаются в несобственной точке (0:1:0) ив однородных координатах записываются*уравнением хх2—х32=0, проективно не отличающимся от.уравнения 3). Наконец, мнимые параллельные прямые (х2+1=0) пересекаются в той же вещественной несобственной точке (0:1:0), а их уравнение в однородных координатах Х12+х32=0 проективно эквивалентно уравнению 4).
Остается показать, что линии 1)—5) попарно неэквивалентны. Мнимый овал — это единственная из пяти линий, не имеющая вещественных точек. Мнимые пересекающиеся прямые — это единственная линия, имеющая одну вещественную точку. Действительный овал проективно эквивалентен эллипсу, следовательно, никакие три его точки не лежат на одной прямой. Это отличает его от
184
линий 3) и 5). Наконец, любые три точки линии 5) лежат на одной прямой, а для линии 3) это не верно. Теорема доказана.
61.3.	Определение. Две линии второго порядка на проективно-аффинной плоскости назовем проективно-аффинно-эквивалентными, если одну можно перевести в другую посредством проективно-аффинного преобразования.
61.4.	Теорема. Существует ровно 11 классов проективно-аффинной эквивалентности линий второго порядка, а именно:
1)	девять обычных пополненных линий второго порядка',
2)	пара пересекающихся прямых, одна из которых несобственная',
3)	пара совпадающих несобственных прямых.
Доказательство. Из теоремы 59.6 вытекает, что аффинно эквивалентные линии будут проективно-аффинно эквивалентны. Далее, любые линии типа 2) согласно 59.8 проективным преобразованием переводятся одна в другую так, что несобственная прямая переходит в несобственную прямую, т. е. это проективное преобразование проективно-аффинно. Таким образом, из 60.3 вытекает, что существует не более одиннадцати перечисленных выше классов проективно-аффинной эквивалентности.
Остается показать, что линии из разных классов не эквивалентны. При этом мы уже можем пользоваться теоремой 61.2. Следовательно, надо различать только линии, попавшие в один из пяти классов проективной эквивалентности. Мнимым овалом являются эллипс, гипербола и парабола. Они проективно-аффинно неэквивалентны между собой, поскольку пересекаются с несобственной прямой по разному количеству точек: 0, 2, 1. Мнимому овалу принадлежит только мнимый эллипс. В пересекающиеся прямые попали три линии: собственные пересекающиеся прямые, па< раллельные прямые и пересекающиеся прямые, одна из которых несобственная. Эти линии также пересекаются с несобственной прямой по разному количеству точек: 2, 1, оо. Мнимые прямые могут пересекаться в собственной точке (мнимые пересекающиеся прямые) и в несобственной точке (мнимые параллельные прямые). Этим они и отличаются друг от друга. Наконец, совпадающие прямые могут быть собственные и несобственные. Ясно, что они проективно-аффинно различны. Теорема доказана.
ЧАСТЬ II
Линейная алгебра и геометрия
Глава I
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
§ 1.	ОПРЕДЕЛЕНИЕ ЛИНЕЙНОГО ПРОСТРАНСТВА
п.1. В первой части (§ 5, определение 5.4) фактически было дано определение линейного пространства. Сейчас мы его лишь напомним.
1.1.	Определение. Линейным (или векторным) пространством над полем К (как правило, полем R вещественных чисел и иногда полем С комплексных чисел) называется множество V, элементы которого называются векторами и в котором определены операция сложения’ (а, b)->a+b и операция умножения (а, а)->аа на числа а^К. При этом предполагается, что для любых векторов a, b, ceV и чисел a, ffeK выполнены аксиомы
1°. а + Ь=Ь + а;
2°. (а+Ь)+с=а+(Ь + с);
3°. Существует такой вектор (называемый нулевым вектором), что а-}-0=а;
4°. Для каждого вектора aeV существует такой вектор —ае (называемый вектором, противоположным вектору а или обратным к вектору а), что а+ (—а)=0;
5°. (а + Р)а=аа + ра;
6°. а(ра) = (сф)а;
7°. a(a-hb)=aa+ab;
8°. 1а=а.
Линейное пространство над полем R называется вещественным линейным пространством, а над полем С — комплексным линейным пространством.
п.2. Свойства операций. Поскольку линейное пространство является группой:
1)	правый нуль является левым нулем;
2)	правый обратный — левым обратным;
3)	нуль и вектор, обратный к данному, единственны;
4)	если а + Ь=а хотя бы для одного вектора aeV, то Ь=0.
Напомним некоторые свойства, которые мы отмечали в первой части (гл. 1, § 7):
5)	0а=0 для любого вектора а;
6)	а-0=0 для любого числа а;
7)	—а=(—1) - а для любого вектора а;
186
8)	если аа=О, то либо а=0, либо а=0.
Проверим одно из этих свойств, например 6).
Согласно аксиоме 7° имеем
а-0 + а-0=а(0 + 0)=а*0,
откуда а 0=0 в силу свойства 4).
В линейном пространстве наряду с суммой двух векторов а и b можно говорить и об их разности, считая по определению, что
а—Ь=а-Ь (—Ь).
При этом из аксиом 5° и 6° и свойства 7) вытекает
9)	(а—р)а=аа—ра.
Вектор можно переносить из одной части равенства в другую с изменением знака. В самом деле, если
а=Ь + с, то
а—с=а+ (—с) = (Ь + с) + (—с) = (согласно 2°) =
=b+(c+(— с))=Ь + О=Ь.
В первой части (гл. 1, § 7) мы отмечали, что по индукции можно определить сумму любого конечного числа векторов. Сейчас мы придадим этому точный смысл. Сумму трех векторов аь а2, а3 определяем следующим образом:
ai + а2+ а3= (ai + а2) + а3.
Если уже определена сумма п—1 векторов ai ..., an-i, то полагаем
ai +... + а и— 1 + an= (aj +... + а^—i) + ал.
Практически это означает, что для определения суммы упорядоченной последовательности векторов аь ..., ап надо к вектору aj прибавить вектор а2, затем к полученному вектору ai + a2 прибавить вектор а3, затем к полученной сумме (а! + а2)4-а3 прибавить вектор а4 и так далее, т. е.
аг + ... +ап—1 + ан= (. .. ((ах + аг) + аз) + • • • +ап—i) + an- (1 (п—2) скобок)
Так определенная нами стандартная сумма п векторов получается при стандартной последовательности суммирования (вектор afe прибавляется к сумме предыдущих векторов аь ..., а&-1), что соответствует стандартной расстановке скобок, указанной в равенстве (1). Но на практике часто возникают суммы векторов, в которых скобки расставлены по-другому.
1.2.	Предложение. В любом линейном пространстве имеет место обобщенный закон ассоциативности сложения векторов,
187
т. е. сумма векторов аь ап с произвольной расстановкой скобок равна стандартной сумме (1).
Доказательство. Индукция по л>3. При л=3 утверждение сводится к аксиоме 2°. Сделаем переход от п—1 к п. Складывая п векторов, при любой расстановке скобок производим п—1 сложений, одно из которых производим последним. Это означает, что наша сумма векторов аь ..., ап имеет вид
а+Ь,
где а — сумма векторов аь ..., а^ при некоторой расстановке скобок, а b — сумма векторов a^+i, ..., ап при некоторой расстановке скобок. Рассмотрим общий случай п—&>3, предоставив читателям рассмотреть более простые случаи п—&=1,2. По предположению индукции вектор b можно представить в виде
Ь=с + ап,
где с — стандартная сумма векторов afe+i, ..., an-i. Тогда по аксиоме 2°	*
a+b=a+ (с + а^) == (а+с) + ап-
Но по предположению индукции вектор а + с равен стандартной сумме векторов ab...,an_i, что и завершает доказательство.
В линейном пространстве имеет место и обобщенный закон коммутативности
ai + .. . + an=a0(i) + .. . + а0(П),	(2)
где о — произвольная подстановка множества {1, ..., л}. Доказательство, проводимое по индукции на основе аксиомы 1°, предоставляем читателю.
Таким образом, мы обосновали сделанное в первой части (§ 7) замечание о том, что с векторными равенствами можно поступать так же, как с числовыми.
п.З. Примеры. Мы уже отмечали в первой части, что линейными пространствами (над полем R) являются
1.	Пространства Vect(i), i==l, 2, 3, векторов на прямой на плоскости, в пространстве.
2.	Арифметическое л-мерное вещественное пространство R\ в частности R=R1.
3.	Пространство М т,п матриц размером тпу^п9 в частности М п~^п,п-
Приведем еще несколько примеров линейных пространств.
4.	Арифметическое л-мерное пространство Кп над полем К, в частности арифметическое л-мерное комплексное пространство О. Пространство Кп состоит из всех упорядоченных наборов (сц, ..., си) из л элементов аь ..., си поля К с операциями сложения
(с&1, . . . , cu) + (|31, . . . , рл) == («1 + Р1, . . . , си + р/г)
188
и умножения на число
Л(«1, . . . , CLn) = (Xctj, ..., Лал).
Нулем в этом пространстве является набор (0, ..., 0), противоположным к элементу (аь аЛ) является набор (—аь	—ал).
Из аксиом поля непосредственно вытекает, что множество Кй с так введенными операциями удовлетворяет аксиомам 1—8° линейного пространства.
Само поле К является линейным пространством: К^К1.
5.	Пространство Af(R, R) всех вещественных функций на числовой прямой с естественными операциями сложения и умножения на число.
Этот пример допускает далеко идущее обобщение. Линейным пространством над полем К будет множество Af(X, К) всех отображений
f:X-+K
произвольного множества X в поле К. Наличие в поле К операций сложения и умножения позволяет складывать отображения в К и умножать их на числа. А именно для f, g^M(Xf К), полагаем
(f+g) (x)=f(x)+g(x), (V) (х)=А(/(х)) для всех xf=X.
Аксиомы линейного пространства проверяются непосредственно.
6.	Линейным вещественным пространством является множество C(R, R) всех непрерывных вещественных функций на R. Это следует из того, что сумма непрерывных функций и произведение непрерывной функции на число являются непрерывными функциями.
7.	По аналогичной причине линейным вещественным пространством является множество Z)(R, R) всех дифференцируемых вещественных функций на R.
8.	Линейными вещественными пространствами являются множество P(R) всех многочленов от одной вещественной переменной х с вещественными коэффициентами и его подмножество Pn(R)r состоящее из всех многочленов степени
Ясно, что имеют место включения
P«(R)czP(R)czZ)(R, R)c=C(R, R)c=Af(R, R).
9.	Линейным вещественным пространством является множество R+ всех положительных вещественных чисел, в котором операции определены следующим нестандартным образом. Для a, b^R+ и A^R полагаем по определению
a + b==a-b,	^а=ак.
Роль нуля в пространстве R+ играет единица, а обратным к элементу а является число 1/а. Проверка аксиом линейного пространства предоставляется читателю.
18»
10.	Простейшим линейным пространством (над любым полем) •является (называемое нулевым) пространство, состоящее из одного нулевого вектора.
§	2. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ. БАЗИСЫ. РАЗМЕРНОСТЬ
п.1. Линейная зависимость. Линейная зависимость конечных систем векторов и связанные с ней понятия были определены в первой части (§ 7). Там же приведены некоторые элементарные утверждения, касающиеся линейной зависимости конечных систем векторов.
2.1.	Определение. Скажем, что произвольная система (множество) А векторов линейного пространства V линейно независима, если всякая ее конечная подсистема линейно независима.
Согласно (АГ, 1, предложение 7.3) это определение является обобщением определения линейной независимости конечной системы векторов.
Пусть теперь в линейном пространстве V даны две системы векторов А и В. Скажем, что система А линейно выражается через систему В, если каждый вектор системы А является линейной комбинацией некоторой (конечной) подсистемы векторов из В. Две системы векторов назовем линейно эквивалентными, если каждая из них линейно выражается через другую. Легко проверить, что отношение линейной эквивалентности является отношением эквивалентности на множестве всех подмножеств линейного пространства.
2.2.	Лемма (основная лемма о линейной зависимости). Пусть даны две конечные системы векторов А={аь ... ..., ат} и В={ЬЬ ..., Ьп}. Тогда если система А линейно выражается через систему В и т>п, то система А линейно зависима.
Доказательство. Представим векторы а/ в виде линейных комбинаций векторов Ь/:
/=1, /=1
Тогда в матрице
£ц • • • С1п
(3)
С =
Cmi ... cmn
число строк больше числа столбцов. Отсюда по теореме о ранге матрицы вытекает, что строки матрицы С линейно зависимы. Существуют такие числа аь ..., ат, не все равные нулю, что
£ агсо-=0, /=
(4)
190
Тогда из свойств операций в линейном пространстве получаем т	т	п
У «,0^=(согласно (3))=£ аг сиЬ^ =
i=l	i=l	7=1
п ™	п	СИС1С..Ц.
= Т (/£> aicii) Ь/=(согласно (4))=У O-L-г» Эквивалентна систе-/=1 \=1	..... .о и пространстве V существует
™	, .кйз п векторов. Он линейно выражается через
Таким образом,	вектора: Это противоречит
aiai +...+amam=0, .	° W доказан'4
т. е. система А линейно зависима. Лемма доказана.
2.3.	Следствие. Если две конечные системы векторов линейно эквивалентны и линейно независимы, то эти системы состоят из одинакового числа векторов.
2.4.	Предложение. Если линейно зависимая упорядоченная система векторов А={аь ..., а«} начинается с ненулевого вектора, то существует такое k, 1<&<л, что система {аь ..., а4 линейно независима, а вектор а*+1 через нее линейно выражается.
Доказательство. Для	положим Ai={&\, ..., ak}.
Имеем растущую цепочку
A^A^cz... .cz4n=4.
Она начинается с линейно независимой Системы Ai и кончается линейно зависимой системой Ап. Поэтому существует такое k, Icfecn—1, что система Ak линейно независима, а система A*+i линейно зависима. Отсюда согласно (АГ, 1, предложение 7.7) иг получаем, что вектор afe+1 линейно выражается через Аь. Предложение доказано.
2.5.	Предложение. Пусть
Д={Я1, ..., aw, a^i+i, ..., я«}
— такая линейно зависимая система, что подсистема {аь ..., ат} линейно независима. Тогда из системы А можно выкинуть вектор а/г при некотором	так, что полученная система Аг будет
линейно эквивалентна системе Я.
Доказательство. По предложению 2.4 существует такой вектор afe, что векторы аь а^-i линейно независимы, а вектор afe через них линейно выражается. В силу независимости векторов яь ..., ат обязательно &>т+1. Непосредственно из определения вытекает, что система А1==А\{а4 линейно эквивалентна системе А. Предложение доказано.
п.2. Базисы и размерность. Напомним (см. АГ, § 9), что базисом линейного пространства V называется всякое его линейно независимое подмножество Е, через которое пространство V линейно выражается.
2.6.	Теорема. Во всяком ненулевом линейном пространстве существует базис.
191
Эту теорему доказывать не будем. Ее доказательство существенно опирается на известный постулат теории множеств — аксиому выбора. В этой книге мы будем иметь дело только с пространствами, в которых существует базис и, более того, в которых существует конечный базис.
сил? Линейнакм а- Любые два базиса линейного пространства со-систем векторов и связй£лавекторов.
первой части (§ 7). Там ж^ЧГршеает^^Ео^вольного базиса утверждения, касающиеся линейной зависимости т<иСТЬЮ и обозна-векторов.
2.1.	Определен
/Мтг	а г
Согласно реме 2.7 это число не зависит от базиса и однозначно определяется пространством V. Размерность нулевого пространства по определению полагается равной нулю.
Если в пространстве V существует конечный базис (состоящий из п векторов), то оно называется конечномерным (и-мер-ным).
2.9.	Замечание. Утверждение теоремы 2.7 верно и для бесконечных базисов. При этом говорят, что два множества X и Y имеют одинаковое число элементов (имеют одинаковую мощность), если существует биекция f:X^Y. Докажем теорему 2.7 .лишь для конечного базиса, поскольку общий случай требует обращения к арифметике кардинальных чисел, что выходит за рамки нашей книги.
Доказательство теоремы 2.7 (конечномерный случай). Пусть в линейном пространстве V даны два базиса Е и Е' и базис Е состоит из п векторов. Если базис Е' состоит из конечного числа векторов, то это число равно п согласно следствию 2.3. Предположим теперь, что множество Е' бесконечно. Тогда в нем можно выбрать подмножество Е". состоящее из n+1 вектора. Множество Е" линейно выражается через Е и, следовательно, линейно зависимо по лемме 2.2. Но это противоречит линейной независимости базиса Е'. Теорема 2.7 доказана.
2.10.	Предложение. Для произвольного ненулевого линейного пространства V следующие условия эквивалентны:
a)	dim V=n;
б)	любые п линейно независимых векторов образуют базис-, в) любая полная система из п векторов является базисом. Доказательство. Начнем с импликации а)=^б). Пусть Е —базис, состоящий из п векторов, а Е' — произвольная линейно независимая система, состоящая из п векторов. Предположив, что Е' не является базисом, найдем вектор а, который линейно не выражается через векторы системы Е'. Тогда согласно (АГ, 1, предложение 7.7) система E'^E'Jfa} линейно независима. Но система Е" состоит из n+ 1 вектора и линейно выражается через базис Е, состоящий из п векторов. Это противоречит лемме 2.2.
Теперь импликация б)=>в). Из б) (в предположении, что п линейно независимых векторов существуют) непосредственно вы-
192
гекает а). Надо показать, что полная система Л, состоящая из п векторов, линейно независима. Предположим противное. Поскольку в пространстве V имеются ненулевые векторы, система А также содержит ненулевой вектор. Тогда А состоит не менее чем из двух векторов, и согласно (АГ, 1, предложение 7.5) некоторый вектор аеЛ линейно выражается через оставшиеся векторы системы А. Следовательно, система Л'=Л\{а} линейно эквивалентна системе Л и поэтому также полна. Но в пространстве V существует базис, состоящий из п векторов. Он линейно выражается через полную систему Л', состоящую из п—1 вектора: Это противоречит лемме 2.2.
Импликация в)=>а) очевидна. Предложение 2.10 доказано.
2.11.	Следствие. В п-мерном пространстве
а)	любая линейно независимая система содержит си векторов-,
б)	любая полная система содержит векторов.
2.12.	Теорема. В конечномерном ненулевом линейном пространстве любую линейно независимую систему векторов можно дополнить до базиса.
Доказательство. Пусть А={аь ..., а*} — линейно независимая система. Индукцией по k докажем, что ее можно дополнить до базиса n-мерного пространства V. Если k=0 (т. е. система Л пуста), то в качестве искомого базиса возьмем любой базис пространства V. Предположим, что мы уже доказали наше утверждение для всех &<Z, и пусть £=Z+1. Тогда  для системы {а}, ..., а/} по предположению индукции можно найти векторы Ьь ..., bn-/ так, что система £’={аь	а/, Ьь ..., Ьп-/} является
базисом пространства V. Прибавим к системе Е вектор а,+ь Полученная система
^'Наь ..., а/, а/sq, Ьь ..., Ьп-/}
будет полна, как и базис Е. Но содержащая л+1 вектор система Е' линейно зависима. Согласно предложению 2.5 (для m=Z-hl) из системы Е' можно выкинуть один из векторов bt так, что получившаяся система Е" будет линейно эквивалентна системе Е' и, следовательно, полна. Итак, мы построили полную систему =эЛ, состоящую из п векторов. По предложению 2.10 Е" — базис. Теорема доказана.
2.13.	Замечание. Напомним, что в первой части нами были определены координаты вектора в базисе (§ 9), матрица перехода от одного базиса к другому и получен закон изменения координат вектора при переходе от одного базиса к другому (§ 22). В дальнейшем пользуемся этим без дополнительных оговорок.
п.З. Примеры. 1. Из результатов § 8 первой части следует, что dim Vect (/)=/.
2.	dimRn=n. Стандартный базис этого пространства образуют строки единичной матрицы Е.
3.	dimPn(R)=n+1. В качестве базиса можно взять многочлены 1, х, ..., хп. Полнота этой системы очевидна, линейная неза
7 Зак. 283
193
висимость вытекает из того, что многочлен степени р имеет не более р корней.
4.	dimМт>п=тп. В качестве базиса можно взять систему матриц Eijf l<f<m, Ic/cn, где на месте г, / матрицы Д-/ стоит единица, а на остальных местах — нули.
5.	Примером бесконечномерного пространства является пространство всех многочленов. В этом пространстве имеется счетный базис, состоящий из одночленов
1, xt ..., хп, ... .
6. Другим примером бесконечномерного пространства является C(R, R) всех вещественных непрерывных функций. В этом пространстве нет счетного базиса. Более того, любой базис этого пространства имеет ту же мощность, что и множество всех точек на вещественной прямой, т. е. мощность континуума.
§ 3.	ПОДПРОСТРАНСТВА ЛИНЕЙНОГО ПРОСТРАНСТВА.
ОПЕРАЦИИ НАД НИМИ
п.1. Определение подпространства. Непустое подмножество М линейного пространства V (над полем К) называется линейным подпространством (или просто подпространством) пространства Vy если a+b^Af и аа^АТ для любых a, ЬеАТ и аеК.
Очевидно, что если М — подпространство линейного пространства Vy то любая линейная комбинация векторов из М принадлежит Af.
Ясно также, что подпространство Af линейного пространства Vy наделенное имеющимися в пространстве V операциями сложения и умножения на число, само является линейным пространством. В частности, нулевой вектор пространства V принадлежит любому его подпространству.
Пусть А — произвольное непустое подмножество линейного пространства V. Обозначим через Ls(?4) множество всех линейных комбинаций векторов, принадлежащих Л, и назовем это множество линейной оболочкой множества А в пространстве V, Линейной оболочкой пустого множества назовем множество, состоящее из одного нулевого вектора. Имеет место очевидное
3.1.	Предложение. Линейная оболочка любого множества AczV является линейным подпространством пространства V, содержащим А.
Пространство Ls(X) называется также линейным пространством, натянутым на множество А (или на векторы множества Л).
3.2.	Предложение. Для любого подпространства М конечномерного линейного пространства V имеем
dim Afcdim V.
При этом из равенства dimAf=dimV вытекает равенство Af=V.
Доказательство. Первое утверждение вытекает из теоремы 2.12. Если же dimAf=dimV, то, взяв базис Е={еь ..., еп}
194
в пространстве М, получаем согласно предложению 2.10, что £ является базисом и в пространстве V, откуда и вытекает включение VczAf. Предложение доказано.
п.2. Примеры. 1. Множество, состоящее из нулевого вектора, является наименьшим подпространством любого линейного пространства. Само линейное пространство V является своим наибольшим подпространством.
2.	Пространство Vect(l) векторов на прямой имеет два подпространства: нулевое и совпадающее со всем пространством.
3.	Пространство Vect(2) векторов на плоскости кроме тривиальных подпространств (нульмерного и двумерного) имеет одномерные подпространства, каждое из которых является пространством всех векторов, параллельных некоторой прямой.
4.	Читателю предоставляется доказать, что любое и-мерное пространство имеет подпространства всех промежуточных размерностей от 0 до п.
5.	Пространство Pn(R) многочленов степени является подпространством пространства P(R) всех многочленов.
6.	Подпространством пространства R" является пространство L(S) всех решений системы
[Ли*! + ...+01Л =0,
S ................
' ^ml^l + • • • + &тА == 0
однородных линейных уравнений от п неизвестных.
7.	Вопрос. Является ли подпространством пространства P/i(R) множество всех многочленов степени и?,
п.З. Пересечения и объединения подпространств. Напомним, что пересечением
П{Ха:аен4}
семейства подмножеств Ха данного фиксированного множества X называется множество
{х^Х:х^Ха для любого аеЛ}.
Объединением
11{Ха: аенД}
семейства подмножеств Ха данного множества X называется множество
{х(=Х: существует такое а^Л, что х^Ха}.
Имеют место следующие законы двойственности:
х \ п {Ха : а Л} = и {X \ Ха : а е= 4},	(5)
Х \ и {Ха : ае лн П {X\ ха :.ае 4	(6)
7*	195
Непосредственно из определений вытекает
3.3.	Предложение. Пересечение любого семейства подпространств Afa данного линейного пространства V является его подпространством.
Для данного множества AczV через Li (Л) обозначим пересечение всех линейных подпространств пространства V, содержащих это множество А. Согласно предложению,3.3 Li (Л) является (очевидно наименьшим) линейным подпространством пространства V, содержащим множество Л.
3.4.	Предложение. Для любого подмножества А линейного пространства V имеем
Li(4)=Ls(4).
Доказательство. Поскольку Li (Л) — наименьшее подпространство, содержащее множество Л, оно согласно предложению 3.1 содержится в Еб(Л). Покажем теперь, что Еэ(Л) лежит в любом подпространстве Af, содержащем Л. Если хеЬз(Л), то вектор х является линейной комбинацией векторов аь ..., еЛс=АГ. Но подпространство М вместе с векторами аь ..., а* содержит и все их линейные комбинации. Следовательно, х&М. Предложение доказано.
В то время как любое пересечение подпространств является подпространством, объединение подпространств почти никогда подпространством не является. Имеет место
3.5.	Предложение. . Если объединение Af1(jAf2 подпространств Afj и Af2 линейного пространства V является его подпространством, то одно из этих подпространств лежит в 'другом.
Доказательство. Предположив противное, возьмем вектор а^АГДАГг и вектор a2eAf2\Mb Тогда их сумма ai + a2 принадлежит Ai1(JAf2 и, следовательно, лежит в каком-нибудь из слагаемых Afj и Л12. Предположим, что ai + a2eAfb Поскольку Мх — подпространство, имеем
а2= (ai + а2)—aj geM i.
Но это противоречит тому, что a2eAf2\AI1f Предложение доказано.
п.4. Суммы подпространств. Пусть М и N — подпространства линейного пространства V. Назовем их суммой множество
Af-hA={a + b:a^Af, beAf}.	(7)
Ясно, что сумма подпространств является подпространством, содержащим и М и N. Более того, имеет место
3.6.	Предложение. Сумма подпространств M+N является линейной оболочкой их объединения Af|JA.
Доказательство. Включение
7W+AczLs(AfUA)	,	>
непосредственно вытекает из определений. С другой стороны, Af+ + А является подпространством, содержащим A4JA. Но Ls(AlU^) 196
является согласно 3.4 наименьшим подпространством, содержащим AfJAf, откуда и вытекает обратное включение. Предложение доказано.
, Пусть теперь дано некоторое семейство подпространств 7Иа, аеЛ, данного линейного пространства V. Их суммой
2{Л1а:аеЛ}
называется линейная оболочка их объединения. Это определение для двух слагаемых согласно предложению 3.6 эквивалентно определению (7). Сумма конечного числа подпространств ..., Ms обозначается также через
Mi +.. . + Л1$.
Ясно, что
Мх+ ... +^={3x4-... 4~а$: ее	(8)
3.7.	Теорема. Пусть М и N — подпространства линейного пространства V. Тогда
dim (М + N) = dim М + dim N—dim (Л4 fl N).	(9)
Доказательство. Пусть
dimM=m, dim#=n, dim(AfflN)=Z.
Нам надо найти базис пространств M + N, состоящий из т + п—I векторов. Пусть {аь ..., а/} — базис пространства AfflAf. Согласно теореме 2.12 его можно дополнить векторами bi, ..., bm-i до базиса пространства М и векторами сь ..., сп_/ до базиса пространства N. Покажем, что система
£={ах, ...» а^, Ьп ..., bm—/, q, ...» crt—/},
состоящая из т+п—I векторов, является базисом пространства M+N. Произвольный вектор из M+N имеет вид х+у, где хе/И, y^N. Поскольку системы
£,i={a1, ..., ап Ьь ..., bm_z},
•^2 = {а1> •••> а/» С1, •••, cn— i}	х
образуют базисы пространств М и N соответственно, поэтому векторы х и у могут быть представлены в виде
х=а1а1+ ... +a/a/ + a/-bib1+ ... + ambm—i, *
У = Р1а1+ • • • +Р/а/ +Р/4-1С1+ • • • + Pncn—b
Тогда
I	т—1	п—1
X + y=S (ai + Pi) ai + Jd + Pi+*Cft.
i=l	/=1	Л=1
197
Осталось проверить, что система Е линейно независима. Представим нулевой вектор в виде линейной комбинации векторов из Е:
I	т—1	п—1
£ “iai + S РА + £ TfcCft=0.	(10)
1=1	/=1	fe=l
Положим
х=а1а1 + • • • +a/H/+Pibi+ •..	/Ьт_/.	(11)
Вектор х, будучи линейной комбинацией векторов системы Е\9 принадлежит М. С другой стороны, из (10) следует, что
п—Z ' /г=1
Поэтому xG^ и, следовательно, хеТИрЛ^. Тогда вектор х можно представить в виде линейной комбинации базисных векторов аь ..., az пространства M(]N:
x=6iai + ... + б/аь
Это равенство можно переписать в виде
х=б1а1+ ... + fyaj + 0 • Ьх 4- • • • 4"0*bm—/.	(12)
Равенства (И) и (12) представляют собой разложения вектора х по векторам линейно независимой системы Ех. В силу единственности такого разложения ш=б/ и Р/=0. Поэтому равенство (10) принимает вид
aiax+ ... +а/а/ + у1с1+ ... +	(13)
откуда в силу линейной независимости системы Е2 получаем az=0 и у£=0. Таким образом, все коэффициенты линейной комбинации (10) равны нулю. Теорема доказана.
§ 4.	ПРЯМАЯ СУММА ПОДПРОСТРАНСТВ
4.1.	Определение. Сумма M+N подпространств линейного пространства V называется прямой, если их пересечение Л4рЛ7 состоит из нулевого вектора. В этом случае пишем М + N=M®N.
4.2.	Предложение. Для подпространств М и N, дающих в сумме линейное пространство V, эквивалентны следующие условия:
a)	V=M®N\
б)	всякий вектор а^У однозначно представляется в виде суммы Ь + с, где bsVf, ceAf;
в)	существует вектор ае!^ который однозначно представляется в виде суммы Ь + с, где Ь&И, ceAf;
198
г)	нулевой вектор однозначно представляется в виде суммы векторов из М и N;	4
д)	если Е\ — базис в М, а Е2 — базис в N, то E1UE2 является базисом в V;
е)	dim ]Z=dim Af+dimAf.
Доказательство. а)=>б). Предположим, что некоторый вектор а имеет два различных представления
a=bi + С1=Ьг+с2.
Тогда bi—Ь2=с2—сь Ненулевой вектор bi—b2 принадлежит М и, будучи равным вектору c2^ci, принадлежит N. Таким образом, пересечение МПА содержит ненулевой вектор bi—b2. Противоречие.
Импликация б)=>в) тривиальна. Проверим в)=>г). Предположим, что наряду с представлением 0=0 + 0 имеется нетривиальное представление 0=bi + ci. Тогда вектор а из п. в) наряду с представлением а=Ь + с допускает представление a=(b+bi) + + (c+ci). Противоречие.
Теперь импликация г)=>д). Пусть Ei={ai, ..., am} — базис в Af, a E2={bi, ..., bn) — базис в N. Поскольку V=M + N, система E=Ei(JE2 полна в пространстве V. Покажем, что она линейно независима. Пусть
смИ] + ... + атат+Pibi + ... +рлЬя=О.
Положим a=aiai+ ... + amam и b=0ibi+ ... + p„bn. Имеем а + + b=0, откуда согласно г) а=0 и Ь=0. Но из равенств
aiai+ ... + amam=0, Pib] + ... +рлЬя=О
в силу линейной независимости систем Ei и Е2 вытекает, что a( = 0, i= 1, ...., пг, и Р/=0, / = 1, ..., п.
Импликация д)=>е) тривиальна. Импликация е)=>а) вытекает из теоремы 3.7. Предложение 4.2 доказано.
Пусть Af — подпространство линейного пространства V. Подпространство NczV называется алгебраическим дополнением подпространства Af в пространстве V, если V=M®N.
4.3.	Предложение. Для любого подпространства М конечномерного линейного пространства V существует алгебраическое дополнение. При этом если 0<dimAf<dim V, то алгебраическое дополнение определено неоднозначно.
Доказательство. Возьмем базис eb ..., em в подпространстве Af и дополним его до базиса E={ei, ..., em, em+i, ..., ел} всего пространства V. Тогда согласно 4.2 подпространство N= =Ls(em+i, ..., еп) будет алгебраическим дополнением к AI. Теперь неоднозначность. Наряду с базисом Е рассмотрим систему
199
E'={ei, ew, ew+b e„_i, en4-ei}. Матрицей перехода от базиса Е к системе Е' являетёя матрица
В силу невырожденности матрицы С система Е' согласно (АГ, предложение 22.4) также будет базисом пространства V. Тогда подпространство M=Ls(em+b ..., e„—i, en4-ei) также будет алгебраическим дополнением к М. Дополнения N и различны, так как ei + eneAfi\AT. В самом деле, если бы ei + eneAf, то ei^ = (ei + en)—что противоречило бы равенству V=M®N. Предложение доказано.
4.4.	Определение. Пусть Mlf ..., Ms — подпространства линейного пространства V. Скажем, что V является прямой суммой этих подпространств, и пишем
1/=^® ...®MS,
если V==Afi+ ...+Afs и для всякого /=1, s
ЛТ/П (All + .. •	1+Л1/4-1 + ... +Af$) ={0}.	(14)
Это определение является обобщением определения 4.1 на случай s>3.
4.5.	Предложение. Для подпространств Afb ..., дающих в сумме линейное пространство V, эквивалентны следующие условия\
a)	у=Мх® ...®MS\
б)	всякий вектор аеУ однозначно представляется в виде суммы векторов
в)	существует ’ вектор аеК который однозначно представляется в виде суммы векторов
г)	нулевой вектор однозначно представляется в виде суммы векторов из
д)	если Et — базис в Mi, то £i(J...	— базис в V;
е)	dim V==dimAli+...+dimAls.
Доказательство проходит индукцией по числу слагаемых s с применением предложения 4.2.
4.6.	Примеры. 1. Квадратную матрицу А=||а//|| назовем симметрической, если
ац=ац,	,
и кососимметрической, если
ац=—ал.
200
Множество всех симметрических (кососимметрических) матриц А^Мп обозначим через Мпсим(Л!пкос). Ясно, что Мпсям и AfnK0C являются подпространствами пространства Мп и
Л4п=МпсимФЛ4„кос.
2. P(R) —РчетнН” Рнечетн*
Здесь через Рчетн (Рнечетн) обозначается множество всех многочленов, каждый из которых является суммой одночленов четной (нечетной) степени.
3. Если {еь ..., еп) — базис в пространстве V, то
V=Ls(ei)® ...®Ls(e„).
§ 5.	ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ И ИЗОМОРФИЗМЫ
5.1.	Определение. Напомним (АГ, определение 6.3), что отображение ф : V->-W линейных пространств над одним и тем же полем К называется линейным, если для любых а, ЬеУ и асК
1)	ф(а + Ь)=<р(а)+ф(Ь),
2)	ср (аа) =аср (а).
Линейное отображение ф : V-+W называется
а)	мономорфизмом, если оно разные 4 векторы переводит в разные;
б)	эпиморфизмом, если q(V)=W;
в)	изоморфизмом, если оно одновременно является мономорфизмом и эпиморфизмом, т. е. фиекцией.
Из определений непосредственно вытекает
5.2.	Предложение. Пусть <pi : 16-^V2 и ф2: V2->V3 — линейные отображения. Тогда их композиция ф2°ф1 : Vi-^Уз является линейным отображением, композиция мономорфизмов — мономорфизмом, композиция эпиморфизмов — эпиморфизмом, композиция изоморфизмов — изоморфизмом.
Если ф : V-+W — изоморфизм, то определено обратное отображение ф-1 : W^V, которое, очевидно, является линейным и, следовательно, изоморфизмом.
5.3.	Задание линейного отображения образом базиса. Всякое линейное отображение ф сохраняет линейные комбинации, т. е.
Ф(ctiai + ... +а^а^)=а1ф(а1) + ... + а^ф(а^).
Поэтому для задания линейного отображения ф : V-+W достаточно определить его на векторах еь ..., еп некоторого базиса пространства V. Зная векторы ф(е1), ..., ф(еп), для произвольного вектора
Х=Х1С1+ ... +хпеп
полагаем
ф(х)=Х1ф(е1) + ... 4-Хпф(еп).
201
Из сохранения линейным отображением линейных комбинаций вытекает
5.4.	Предложение. Всякое линейное отображение переводит линейно зависимую систему векторов в линейно зависимую.
Пусть <р : V-+W — линейное отображение. Множество
{хеУ : ф(х)=0}
называется его ядром и обозначается Кегф. Множество <р(У) (образ отображения ф) обозначается через Im ф. Легко видеть, что множества Кегф и 1шф являются линейными подпространствами пространств V и W соответственно.
Размерность пространства Im ф называется рангом отображения ф и обозначается г(ф).
5.5.	Предложение. Линейное отображение ф : V-+W является мономорфизмом тогда и только тогда, когда Кег ф={0}.
Доказательство. Из линейности отображения ф вытекает, что оно переводит векторы аь a2eV в один и тот же вектор тогда и только тогда, когда ai—а2^Кегф, откуда утверждение и следует.
5.6.	Лемма. Пусть ф : V-+W — линейное отображение, и Е={ъи ..., е«} — такой базис пространства V, что первые его m векторов еь ..., ет образуют базис ядра Кегф. Тогда система векторов 7?=={ф(е^+1), ..., ф(еп)} является базисом образа 1тф.
Доказательство. Сначала покажем, что система F полна в 1тф. Пусть belm ф. Существует такой вектор аеУ, что ф(а)=Ь. Разложим вектор а по векторам базиса Е:
а=+ ... + апвп.
Тогда, поскольку еь ..., етеКегф, имеем
п	п
Ь=<р(а) = У агф(е;)= £ а{ф(ег). f==l
Теперь проверим линейную независимость системы F. Пусть
йфСет+ОЧ-... +р„-тф(еп)=0.	(15)
Положим a=piem+1+ ... + pn_mem. Тогда согласно (15) имеем ф(а)=0, т. е. аеКегф. Значит, вектор а можно разложить по векторам базиса еь ет пространства Кегф:
a=ajei + .., + /
Сравнивая это равенство с определением вектора а, получаем
0161+	PlCm+1 ••• fJn—mCn=0.	О 6)
Поскольку Е — базис, все коэффициенты линейной комбинации (16) равны нулю, в частности, 01=... =pn-m=0. Таким образом, линейная комбинация (15) тривиальна. Лемма доказана.
202
Из этой леммы и теоремы 2.12 вытекает
5.7.	Теорем.а. Для всякого линейного отображения ср: V-+W справедлива формула
dim V=dim Ker <p+dim Im <p.	(17)
Теперь приведем некоторые характеристики изоморфизмов.
5.8.	Предложение. Линейное отображение <р : К->1Г является изоморфизмом тогда и только тогда, когда оно любой (какой-нибудь) базис пространства V переводит в базис пространства W.
Доказательство предоставляется читателю.
Из теоремы 5.7 и предложения 5.5 вытекает
5.9.	Предложение. Если dim V=dim W, то для линейного отображения <р : V->W эквивалентны следующие условия:
а)	ср — эпиморфизм;
б)	ф — мономорфизм;
в)	ф — изоморфизм.
5.10.	Теорема. Все п-мерные линейные пространства над одним и тем же полем изоморфны между собой.
Доказательство. Пусть V и W — два п-мерных пространства. Возьмем базис аь ..., ал в пространстве V и базис Ьь ..., Ьл в пространстве W. Зададим линейное отображение Ф: V-+W способом, предложенным в п. 5.3: положим ф(а;)=Ьг, i=l, ..., п, и продолжим по линейности отображение ф на все пространство V. Так построенное линейное отображение ф : У->-будет изоморфизмом в силу предложения 5.8. Теорема доказана.
5Л1. Примеры. 1. Простейшими примерами линейных отображений являются тождественное отображение е : V->-V и нулевое отображение со : V->-W.
2.	В (АГ, § 10) показано, что геометрические проектирования являются линейными отображениями векторных пространств Vect(2) и Vect(3).
3.	Для аффинного отображения f: Е->Е ассоциированное с ним линейное отображение f=Vect(3)->Vect (3) переводит базис в базис (АГ, § 45) и, следовательно, является изоморфизмом.
4.	Из' свойств производной вытекает, что дифференцирование d:Z)(R, R)->A1(R, R), ставящее в соответствие всякой дифференцируемой функции f ее производную	является линей-
ным отображением.
Глава II
СОПРЯЖЕННЫЕ ПРОСТРАНСТВА
§ 6. ОПРЕДЕЛЕНИЕ И ПРОСТЕЙШИЕ СВОЙСТВА СОПРЯЖЕННЫХ ПРОСТРАНСТВ
6.1. Определение. Выше мы отмечали (§ 1), что всякое поле К является линейным пространством над самим собой. Линейное отображение £: V->K линейного пространства V над полем К в это поле называется линейным функционалом (или просто функционалом) на пространстве V. Функционалы называются также ковекторами пространства V.
6.2. Примеры. 1. Простейшим функционалом является нулевой функционал to : V—>-К.
2.	Для фиксированного /eR функционалом является отображение	R)->R, ставящее в соответствие произвольной
(непрерывной) функции f ее значение f(t) в точке t.
1
3.	Положив S(f)= f(t)dt, получаем функционал на прост-6
ранстве С([0, 1], R) непрерывных функций на отрезке [0, 1].
4.	Функционалом является отображение <р : R"->R, задаваемое формулой
<р(х1...хп)=х1+ ... +хп.
6.3.	Определение. Множество всех функционалов на данном линейном пространстве V обозначается через V* и называется пространством, сопряженным к пространству V. Непосредственная проверка показывает, что сумма g+t] двух функционалов £ и т], определяемая равенством
(l+n)
и произведение ctg функционала g на произвольное число а, определяемое равенством
(«В) (х)=а-£(х),
являются функционалами. Ясно также, что эти операции удовлетворяют аксиомам линейного пространства. Роль нулевого элемента в V* играет нулевой функционал со : У->К. Таким образом, сопряженное пространство V* является линейным пространством.
6.4.	Определение. Пусть еь ..., ея — базис в пространстве V и Числа
ai=g(ei), ..., ап=£(ел)
называются коэффициентами функционала £ в базисе .....е«.
204
Для произвольного вектора x=x’ei + ... +хлеп в силу линейности функционала £ имеем
g(x)=x’ai + ... +хпап.	(1)
Из 5.3 вытекает, что всякий функционал g однозначно определяется своими коэффициентами в базисе еь ..., еп. Воспользуемся этим замечанием и для данного базиса еь е„ пространства V определим функционалы е1, ..., 8Л. Положим
8'(е/)=б/.	(2)
6.5.	Предложение. Функционалы е1, ..., е" образуют базис сопряженного пространства V*, который называется базисом, сопряженным к базису еь .... еп. Коэффициенты функционала g в базисе еь ..., ега являются его координатами в базисе е1, ... ..., е".
Доказательство. Покажем, что из (1) вытекает равен^-ство •
g=aie1+...+а„е".	(3)
Для произвольного вектора х имеем	... + апе”)(х)=(по опре-
п	п
делению операций в V*)=a181(x)+...+ап8п(х)=^ аг8г (х1е^ = 1 = 1	/-1
п	п	п	п	п
=(согласно линейности е‘)=^ x'&i (e/)=Sai2L х'б^^ агх' = i=i /=1	г=1 /=1	1=1
=x1at+... + хпап.
Таким образом, равенство (3) проверено. Из него, в частности, вытекает полнота системы е1, ..., е”. Для завершения доказательства остается проверить ее линейную независимость, для чего в свою очередь надо показать, что коэффициенты нулевого функционала со равны нулю. Итак, пусть w=ai8I+ ... +апеп. Тогда
п	п
О=со(е;)=£ аг8г(е;)=£агб-=а>. i=i	1=1
Предложение доказано.
6.6.	Следствие. Для конечномерного пространства V
dim V*=dim V.
6.7.	Следствие. Всякое конечномерное линейное пространство изоморфно своему сопряженному пространству.
§ 7.	ВТОРОЕ СОПРЯЖЕННОЕ ПРОСТРАНСТВО
7.1.	Определение. Пусть V — линейное пространство, V* — пространство, ему сопряженное, а (V*)* — пространство, сопряженное пространству V*. Линейное пространство (V*)* на
205
зывается вторым сопряженным пространством (по отношению к пространству V).
Для любого линейного пространства V существует естественное отображение
которое определяется следующим образом. Для произвольного вектора xgV линейный функционал с(х) : V*->K задается равенством
c(x)(g)=g(x)	(4)
для всякого geV*.
Чтобы проверить корректность этого определения, надо показать, что отображение с(х) линейно. Имеем c(x)(g+T]) = = (1+'П) (х) = (по определению операций в V*)=g(x)+г) (х) = =с(х)Ш + с(х)(т]). Аналогично проверяется и второе свойство линейности.
7.2.	Предложение. Для всякого линейного пространства V отображение с :	является мономорфизмом.
Доказательство. Сначала проверим, что отображение с линейно. Для вектора х, yeV надо проверить равенство
с(х+у)=с(х)+с(у),
т. е. показать, что два отображения с(х+у) и с(х)+с(у) пространства V* в поле К совпадают. Для этого надо доказать, что совпадают их значения на любом элементе g пространства V*. Имеем
(<?(х+у)) (g) = (no определению (4))=g(x + y)=g(x) +g(y)=* =с(х) (|) + c(y)(g) = (no определению операций в (У*)*) = (с(х) + +c(y))(g).
Аналогично проверяется и второе свойство линейности с(Хх)= =%с (х).
Теперь покажем, что Кегс={0}. Пусть asV — ненулевой вектор. Дополним его до базиса Е пространства V (см. § 2). Определим линейный функционал g :(/->-К, полагая g(a) = l, g(e)=O для ее£\{а} и продолжая его по линейности на все пространство V (см. 5.3). Таким образом, для всякого ненулевого вектора asF существует ковектор geV*, который на а принимает ненулевое значение. Поэтому, если для некоторого вектора xeV функционал с(х) : V*->K является нулевым (т. е. согласно (4) g(x)=O для всякого geV*), то х=0. Итак, Кегс={0). Предложение доказано.
7.3.	Замечание. Читателю следует обратить внимание на то, что при доказательстве предложения 7.2 мы применили теорему о дополнении линейно независимой системы до базиса, сформулированную нами в общем случае, но доказанную только в конечномерном.
206
Согласно следствию 6.6 для конечномерного пространства V имеем dim V=dim(V*)*. Поэтому из предложений 7.2 и 5.9 вытекает
7.4.	Предложение. Для конечномерного пространства V отображение с : ]/->(]/*)* является изоморфизмом.
7.5.	Замечание. Конечно сам факт изоморфности пространств V и (V*)* является тривиальным следствием совпадения их размерностей. Но основным содержанием предложения 7.4 является то, что указанный в нем изоморфизм с является «естественным», определяемым без какого-то ни было произвола. Пространства V и V* также изоморфны, но «естественного» изоморфизма между ними не существует. Мы проиллюстрируем этот факт в гл. VII.
Завершим этот параграф тем, что с помощью второго сопряженного пространства докажем
7.6.	Предложение. Для любого базиса (е) = (е!, ..., &п) сопряженного пространства V* в пространстве V существует единственный базис (е) = (еь ..., еп), которому сопряжен базис (е).
Доказательство. Предположим, что базис (е) сопряжен базису (еь е„). Положим х,=с(е1). Система (х) = (Хь .... х«) образует базис пространства (V*)*, так как отображение с является изоморфизмом согласно 7.4. Кроме того,
X/(e/)=c(e1) (г!) = (согласно (4))=е/(е,)=б<Л Таким образом, базис (х) сопряжен базису (е). Но такой базис в пространстве (V*)* определен единственным образом. Поэтому и базис (е) = =с-1(х) определен однозначно. Единственность доказана. Для проверки существования достаточно положить (е)=с-1(х)> где (х) — базис второго сопряженного пространства, сопряженный базису (е). Предложение доказано.
§ 8.	АННУЛЯТОРЫ И НУЛЕВЫЕ ПОДПРОСТРАНСТВА. СИСТЕМЫ ОДНОРОДНЫХ ЛИНЕЙНЫХ УРАВНЕНИЙ	/
п. 1. Аннуляторы. 8.1. Определение. Пусть S — произвольное подмножество линейного пространства V. Множество {geV*:g(x)=0 для всякого х<=5} называется аннулятором множества S и обозначается через Ann S или S0.
Ясно, что Ann S является линейным подпространством пространства V*. Легко проверить также формулу
Ann(U{Stt : ае Л})= П {AnnSa : ае Л},	(5)
из которой, в частности, вытекает
8.2.	Предложение. Если Sjc:S2, то AnnS2c:AnnSi.
8.3.	Предложение. Аннулятор любого множества совпадает с аннулятором его линейной оболочки.
207
Доказательство. В силу предложения 8.2 достаточно проверить включение
Ann SczAnn (Ls (S)).
Пусть AnnS и xeLs(S). Существуют такие векторы аь ... ..., a^eS, что x=aiai + . ..+<х*а*. Тогда
|(x)=ai£(ai) + ... + а*|(а*) = О,
т. е. geAnn(Ls(S)). Предложение 8.3 доказано.
8.4.	Предложение. Если М — подпространство конечномерного пространства V, то
dim М + dim (Ann М) =dim V.	(6)
Доказательство. Возьмем в пространстве V базис (еь ..-., еп), первые m векторов еь ..., ет которого образуют базис подпространства М. Пусть (е1, ..., е") — сопряженный базис. Достаточно проверить, что ковекторы ет+1, ..., еп образуют базис аннулятора AnnAf. Эти ковекторы линейно независимы и по определению сопряженного базиса лежат в Ann АТ. Покажем, что каждый ковектор geAnn М линейно через них выражается. Пусть 5=116'+ ... +%п&п. Поскольку e,-eAf для i^m, имеем
п
0=?(ег)=£ &е'(ег)=&.
/=1
Таким образом, g=gzn+1e"l+1+ ... 4-^en. Предложение доказано.
п. 2. Нулевые подпространства. Пусть теперь Т — произвольное подмножество пространства V*, сопряженного к линейному пространству V.
8.5.	Определение. Множество {xeV:g(x)=0 для всякого называется нулевым подпространством, соответствующим множеству Т, и обозначается символом То.
Очевидно, что любое нулевое подпространство является линейным подпространством V.
Читатель легко установит, что для нулевых подпространств справедливы такие же факты, как и для аннуляторов:
1)	(U{7\ : аеЛ})о=П{(Зпа)о: аеЛ};
2)	если T{czT2i то (Т2)о<= (Л)о;
3)	7o=(Ls(r))o;
4)	если NczV* — подпространство, то
dim Af 4- dim (Af0) =dim V.	(7)
Кроме того, имеет место
8.6.	Предложение. Если MczV и AfczV* — подпространства, то
(М°)о=А1 и (Af0)°=A/.
208
Доказательство. Проверим первое из этих равенств. Согласно (6) и (7)
dim A4=dim(Af°)0.
Поэтому достаточно проверить включение Л4с(Л4о)о. Но для любых хеЛ4 и и имеем |(х)=0, откуда по определению нулевого подпространства и вытекает, что №(М°)0.
Равенство	проверяется аналогично. Предложение
доказано.
8.7.	Замечание. Из предложения 8.6 вытекает, в частности, что всякое линейное подпространство М пространства V является нулевым подпространством, соответствующим единственному подпространству NczV*, а всякое линейное подпространство N пространства V* является аннулятором единственного подпространства MczV.
Связь между аннуляторами и нулевыми подпространствами можно проиллюстрировать еще одним способом.
8.8.	Предложение. Для конечномерного пространства V если MczV и — подпространства, то
(Мйу=с(М) и №=c(N0).
Доказательство. Согласно предложению 8.6 достаточно проверить одно из этих равенств, например первое, а для этого в силу совпадения размерностей в свою очередь достаточно проверить включение c(Af)cz (М0)0. Пусть хеМ и	Тогда
0=£(х) = (согласно (4))=с(х) (|).
Итак, функционал с(х) принимает нулевые значения на любом ковекторе £еЛ4°. Следовательно, с(х)е(Л10)0. Предложение доказано.
п. 3. Системы однородных линейных уравнений. Пусть Т= ={£!, ..., £т}сУ* — конечное множество ковекторов. Нулевое подпространство То,, соответствующее этому множеству Т, состоит из всех векторов х, удовлетворяющих системе уравнений:
|‘(х)=0, ..., Г(х)=0.	.	(8)
Зафиксируем в пространстве V базис еь ..., еп. Тогда оно отождествляется с арифметическим n-мерным пространством К", а векторы х отождествляются со строчками (х1, ..., х") своих координат.
Пусть (a,i, ..., ain) — коэффициенты ковектора & в базисе (еь ..., е„) (или, что то же самое, координаты в сопряженном базисе е1, ..., е"). Тогда система (8) переписывается в виде
йцХ1-^ ... +aJnxn—О,
ami^-b ... 4-atnnxn=0.
209
Таким образом, нулевое подпространство, соответствующее множеству 7, в арифметическом n-мерном пространстве является пространством решений системы (9) линейных однородных уравнений. Размерность этого пространства То согласно (7) равна
п—dim Ls(T).
Но размерность линейной оболочки множества Т равна макси^ мальному числу его линейно независимых ковекторов, т. е. максимальному числу линейно независимых уравнений системы (9), или, что то же самое, максимальному числу линейно независимых строк матрицы этой системы.
Итак, мы доказали
8.9.	Предложение. Множество решений системы (9) является подпространством пространства Кп размерности п—г, где г — ранг этой системы (—ранг матрицы этой системы).
Кроме того, из 8.7 вытекает
8.10.	Предложение. Всякое подпространство пространства Кп, имеющее размерность п—г, является пространством решений системы однородных линейных уравнений ранга г.
Глава III
ЛИНЕЙНЫЕ операторы в линейном ПРОСТРАНСТВЕ
§ 9.	МАТРИЦА ЛИНЕЙНОГО ОПЕРАТОРА
9.1.	Определение. Линейным оператором (или проста оператором) в линейном пространстве V называется всякое линейное отображение <р : V-*-V этого пространства в себя.
9.2.	Примеры. Кроме приведенных в § 5 примеров тождественного оператора е : V->V, нулевого оператора <о : V->-V и операторов в геометрических векторных пространствах Vect (2) и Vect(3) отметим следующие.
1.	Для фиксированного числа АеК линейным оператором является отображение Ае : V->-V, пропорциональное тождественному и переводящее произвольный вектор xeV в вектор Ах.
2.	Пусть пространство V представлено в виде прямой суммы своих подпространств М и N. Тогда любой вектор х пространства V однозначно представляется в виде
x=y+z,
(1)
где уеМ, z^N. Отображение <р :	переводящее вектор х
в вектор у из равенства (1), является оператором, называемым проектированием пространства V на подпространство М параллельно пространству N. Это отображение можно рассматривать и как линейное отображение из V в М. Этот пример обобщает рассмотренные в (АГ, § 10) примеры проектирований в Vect(3) и Vect (2).
3.	Отображение дифференцирования d будет оператором в пространстве P(R) всех вещественных многочленов.
4.	В пространстве С([0, 1], R) непрерывных вещественных функций линейным оператором будет интеграл I как функция верхнего предела интегрирования:
/(/)(x)=Jf(Odt
9.3.	Определение. Пусть в линейном пространстве V задан базис (е) = (еь ..., еп). Для оператора <р: V->-V пусть
<р(е/)=апе1+ ... + anfin, j=l, ..., п.
Матрица
«и • • • Ящ

aPi   • а,
(2)
(3)
211
в /-м столбце которой стоят координаты <р(е7), называется матри-, цей оператора ф в базисе (е). Иногда также обозначаем ее символами
Л	Ле‘”‘еп
71 ф > лф
Определение матрицы А оператора <р в базисе еь...,еп допускает следующую матричную запись:
(<p(ei),	<p(en)) = (eb еп)А.	(4)
9.4.	Предложение. Ранг г(ф) оператора ф совпадает с рангом его матрицы А в произвольном базисе.
Доказательство. Векторы ф(е[), ..., ф(е„) образуют полную систему в 1щф. Поэтому базис пространства Im ф можно выбрать из этой системы векторов. Следовательно, г(ф)=<11т1п1ф равно максимальному числу линейно независимых векторов в системе ф(в1)...ф(ел). Но линейная независимость произвольной
подсистемы векторов ф(в1), ..., ф(е„) эквивалентна линейной независимости соответствующих столбцов матрицы А. Предложение доказано.
9.5.	Предложение. Пусть оператор ф имеет в базисе (е) = = (еь ..., ега) матрицу А. Тогда вектор х с координатами (х\, ... ..., хп) в базисе (е) отображается вектор ф(х), координаты {х/, ..., хп') которого в базисе (е) находятся по формуле
(5)
Доказательство. Вектор при отображении ф в вектор
Ф (х) =Х1ф (е 1) + ... + хпф (е„).
x=xiei+ ... +хпеп переходит
(6)
В матричной форме равенство (6)
записывается в виде
ф(х)=(ф(ех).....ф(еп))
ъ с учетом (4)
<P(x)=(ei, е„)Д
Xi
Таким образом, столбец А
вектора ф(х) в базисе (е), что и
является столбцом координат
доказывает наше утверждение.

212
9.6.	Пр ед л о же ни е. Пусть С — матрица перехода от базиса (е) = (еь ..., еп) пространства V к базису (е') = (е/, ... ..., еп'). Тогда для произвольного оператора ср:	его матри-
цы в базисах (е) и (е') связаны соотношением
Л^СГ’Л^С.	(8)
Доказательство. По определению матрицы перехода от базиса к базису имеем
en)С.	(9)
Это означает, что
е:=сце1+ ... +cnJen) /=1, .... п.
Следовательно,
4’(ep=cIj<p(e1)+...+cnj<P(e»)» /=1,	(Ю)
Легко видеть, что система векторных равенств (10) эквивалентна матричному равенству
(ф(е'), ..., <р(е;))=(<р-(е1).ф(еп))С.
Применив к правой части этого равенства определение (4) матрицы оператора, получим
(Ф(ej), ..., ф(е^))=(е1, ..., еп)Л‘е)С.	(11)
Но согласно (9) имеем
(ех, ..еп)=(еь ..ert) С
Поэтому равенство (И) превращается в
(Ф(е('), ...,' ф(е^))=(в1', .... еп)С~1А^С, что равносильно доказываемой формуле (8).
9.7.	Определение. Две квадратные матрицы Л и В одного размера называются подобными, если существует такая невырожденная матрица С, что
В=С~1АС.
Читатель легко убедится в том, что отношение подобия является отношением эквивалентности на множестве Мп всех квадратных матриц размером п. Из предложения 9.6 и из того, что линейный оператор однозначно определяется своими значениями на векторах произвольного базиса, вытекает.
9.8.	Теорема. Две квадратные матрицы порядка п подобны тогда и только тогда, когда они являются матрицами одного и того же оператора, действующего в данном п-мерном линейном пространстве.
213
§ 10.	АЛГЕБРА ЛИНЕЙНЫХ ОПЕРАТОРОВ И АЛГЕБРА МАТРИЦ
В § 1 мы приводили в качестве примера линейного пространства множество М(Х, К) всех отображений множества X в поле К. Но для возможности складывать отображения и умножать их на числа достаточно, чтобы значения этих отображений принадлежали не полю, а линейному пространству. Поэтому линейным пространством будет и множество М (X, V) всех отображений из множества X в линейное пространство с естественно определенными операциями сложения и умножения на число:
(f+g) (x)=f(x)+g(x),
(af) (x)=a-f(x).
В частности, линейным пространством будет и множество M(V, V) всех отображений линейного пространства V в себя.
Линейным подпространством пространства M(V, V) является множество Op(V) всех линейных операторов, действующих на линейном пространстве V.
Нулем в линейном пространстве Op(V) служит нулевой оператор со: V^~V.
Операторы можно не только складывать, но и умножать. Произведением <р-ф операторов ф и ф называется их композиция qp°Tp, т. е.
(фф) (х)=ф(ф(х)).
Умножение операторов, как и умножение любых ртображенищ ассоциативно, т. е.
(фФ)х=ф(Ф%).
Кроме того, легко убедиться в том, что умножение операторов двояко дистрибутивно по отношению к сложению, т. е.
ф(Ф+х)=фФ+ф%,
(ф+Ф)х=фх+Фх-
Следовательно, множество Ор(У) с так определенным умножением является кольцом. Это кольцо обладает единицей, которой является тождественное отображение е : V-*-V.
Ясно также, что для любого аеК
(аф)ф=ф(аф)=а(фф).	(12)
Линейные пространства, которые являются кольцами, удовлетворяющими соотношению (12), называются алгебрами. Итак, множество Op(V) является алгеброй.
Из соотношения (12) и из равенства еф=ф8, верного для любого оператора ф, вытекает, в частности, что
(ае)ф=ф(ае)
214
для любого оператора <р. Таким образом, операторы вида аъ — они называются скалярными операторами — перестановочны со всеми операторами. Оказывается, что это свойство является характеристическим для скалярных операторов, а именно имеет место
10.1.	Предложение. Оператор <р:	перестановочен со
всяким оператором из Ор(У) тогда и только тогда, когда он ска-лярен.
Доказательство. Надо проверить только необходимость. Предположим сначала, что для некоторого вектора х вектор ф(х) ему непропорционален, следовательно, векторы х и <р(х) линейно независимы. Положим ei=x, е2=ф(х), и дополним систему (еь е2) до базиса (е) пространства V. Определим оператор 4':	задав его на векторах базиса следующим образом:
4(ег)=еь
Тогда (ei) =4(е2) =еь В то же время q>4(ei)=(₽(ei)=e2- Итак, оператор <р не перестановочен с оператором 4. Это противоречие показывает, что для каждого вектора xeV существует такое число а=ах, что <р(х)=ах.
Осталось показать, что эти числа ах одинаковы для всех ненулевых векторов хеК Заметим сначала, что если векторы х и у пропорциональны, то ах =ау. В самом деле, пусть у=0х. Тогда ф(у)=ф(рх)=0<р(х)=рахх=ах (0х)=аху.
Предположим теперь, что для линейно независимых векторов х и у числа ах и ау различны. Тогда для вектора z=x—у имеем <p(z)=az z, т. е.
Ф(х—y)=az (х—у).	(13)
С другой стороны,
Ф (х—у) =ф (х) —ф (у) =ax X—ау у.	(14)
Сравнивая (13) и (14), получаем
az (х—у) =ахх—ауу, или
(az—ах )х—(аг—ау )у=0.
Эта линейная комбинация линейно независимых векторов х и у нетривиальна, поскольку ax¥=ay. Полученное противоречие и завершает доказательство предложения 10.1.
10.2.	Замечание. Из предложения 10.1 вытекает, что если dim V^2, то алгебра Op(V) некоммутативна. Что касается нульмерного и одномерного пространств, то в них всякий оператор скалярен.
Легко проверить, что линейное пространство Мп квадратных матриц порядка п над полем К с естественной операцией умножения матриц также является алгеброй.
215
10.3.	Предложение. Пусть в п-мерном линейном пространстве V зафиксирован базис еь ..., еп. Тогда отображение, которое ставит в соответствие оператору ф : V-+V его матрицу Дф в базисе еь ..., е„, является изоморфизмом алгебры Op(V) на алгебру Мп.
Доказательство сводится к рутинной проверке. Наиболее интересным здесь представляется равенство
Его легко проверить, применив формулу (5).
Оператор ф называется невырожденным, если его матрица ДФ (в каком-нибудь базисе) имеет отличный от нуля определитель. Из формулы (8) вытекает, что это определение не зависит от базиса, в котором мы рассматриваем матрицу оператора. Оператор, не являющийся невырожденным, называется ‘вырожденным.
Оператор ф называется обратимым слева, если существует такой оператор ф, что
фф=е,
и обратимым справа, если существует такой оператор %, что
ФХ=е. .
Читатель легко проверит, что имеет место
10.4.	Пр едложение. Если оператор ф обратим слева, то он является мономорфизмом, а если обратим справа, то — эпиморфизмом.
10.5.	Задача. Доказать, что предложение 10.4- допускает обращение, т. е. если оператор ф — мономорфизм, то он обратим слева, а если — эпиморфизм, то обратим справа.
Оператор <р называется обратимым, если он обратим слева и справа. Из предложения 10.4 вытекает, что в этом случае отображение <р :	является биекцией, т. е. существует обратное
отображение ф-1 : V-+V — отображение, которое удовлетворяет соотношениям
ф~1ф=фф-1 = 8.
Из равенства (15) вытекает
Дф-^Иф)-1.	(16)
Предложения 5.8 и 5.9, характеризующие изоморфизмы между (вообще говоря) различными линейными пространствами, дополняет
10.6.	Пр едложение. Для линейного оператора ф, действующего в конечномерном пространстве, эквивалентны следующие условия:
а)	ф обратим слева;
б)	ф — мономорфизм;
в)	ф обратим справа;
216
г)	<р — эпиморфизм;
д)	ф обратим;
е)	ф невырожден.
Доказательство. Эквивалентность условий д) и е) вытекает из формулы 16. Условие д). тривиальным образом влечет все предыдущие. Импликации а)=>б)=>д) и в)=>г)=^д) вытекают из предложений 10.4 и 5.9. Предложение доказано.
§ 11.	ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА. ПРИВОДИМЫЕ ОПЕРАТОРЫ
11.1.	Определение. Линейное подпространство М пространства V называется инвариантным относительно оператора ф : V->-V, если ф(М)сзЛ1, или, что то же самое,
ф(х)еА1 для любого хеА'1.
11.2.	Примеры. 1. Нулевое подпространство и все пространство V инвариантны относительно любого оператора.
2.	Ядро Кег ф и образ Im ф всякого оператора ф инвариантны 'относительно этого оператора.
3.	Для оператора d: P(R)->P(R) дифференцирования в пространстве всех вещественных многочленов инвариантным будет подпространство Pn(R) всех многочленов степени не больше п.
Если MeV — инвариантное подпространство относительно оператора ф : V->V, то, рассмотрев ограничение (<р|Л1) отображения ф на множество М, получим, как легко видеть, линейный оператор
(ф|Л4) : М->-М,
действующий на пространстве М.
Из предложения 10.6 вытекает
11.3.	Предл ожение. Если MceV — инвариантное подпространство относительно невырожденного оператора ф : V->-V в конечномерном пространстве V, то оператор (ф|А1) также невырожден.
Непосредственно из определений читатель легко выведет
11.4	Предложение. Пусть AfczV — инвариантное подпространство относительно оператора ф : V—>V, и пусть (e) = (ei, ... ..., еп) — такой базис в пространстве V, первые пг векторов «1......ет которого образуют базис Подпространства М. Тогда
матрица ЛФ<е) оператора ф в базисе (е) является полураспавшей-ся матрицей вида
где В — квадратная матрица порядка т. При этом матрица В является матрицей оператора (ф|АГ) : М-+М в базисе eb ..., е^.
217
11.5.	Определение. Оператор ф : V-+V называется приводимым, если пространство V можно представить в виде прямой суммы двух ненулевых инвариантных подпространств Afi и М2.
В этом случае оператор <р однозначно восстанавливается своими ограничениями <pi= (<р | Afi) и ф2=(ф|Л12) на подпространства Mi и М2. А именно:
Ф(х)=ф1(х1)+ф2(х2),	(17)
где x=xi + x2 и
Эту ситуацию можно рассмотреть с другой стороны.
11.6.	Предложение. Пусть пространство V представлено в виде прямой суммы (ненулевых) подпространств Mi и М2. Пусть заданы операторы ф1 и ф2, действующие на пространствах Mi и М2 соответственно. Тогда существует такой единственный оператор ф : V-+V, называемый прямой суммой операторов ф1 и ф2 (ф=ф1®ф2)> ЧТО (ф|Л41)=фг, i=l, 2.
В самом деле, такой оператор обязательно должен задаваться формулой (17), а эта формула по линейным операторам ф1 и ф2 определяет линейный оператор ф.
11.7	Замечание. Предложение 11.6, очевидно, обобщается на случай, когда V является прямой суммой произвольного (конечного) числа слагаемых:
V=Afi® ...®MS.
В частности, имеет место
11.8.	Пр едложение. Пусть
У=М1Ф...ФЛ15,
где Mi, ..., Ms — инвариантные подпространства относительно оператора ф. Тогда
Ф= (ф | Mi) ф ... ф (ф | Afs).
Читатель легко убедится в том, что имеет место
11.9.	Пр едложение. Пусть пространство V является прямой суммой подпространств М\, ..., Ms, и пусть(&)=($\, ..е£.)— базис в Mt, f=l, ..., s. Пусть на каждом из слагаемых Mi действует оператор ф/, который в базисе (е‘) имеет матрицу Тогда матрицей оператора ф=ф1Ф ... Фф5 в базисе
(е)=(е}, .... ei,, ..., ef, .... eis)
служит блочно-диагональная матрица А вида
А =
О
А*
Оператор водимым.
ф, не являющийся приводимым, называется непри-
218
11.10.	Примеры. 1. В одномерном пространстве V всякий оператор неприводим, поскольку V нельзя представить в виде прямой суммы двух ненулевых подпространств.
2. Проектирование на подпространство М параллельно подпространству N (пример 9.2.2) является приводимым оператором.
3. Примером неприводимого оператора в двумерном пространстве V является оператор ср, который в некотором базисе еь е2 имеет матрицу
0 1
о о
—
Единственным одномерным инвариантным подпространством этого оператора является линейная оболочка первого базисного вектора Ls(ei).
§ 12.	СОБСТВЕННЫЕ ВЕКТОРЫ. СПЕКТР ОПЕРАТОРА.
ДИАГОНАЛИЗИРУЕМЫЕ ОПЕРАТОРЫ
12.1.	Определение. Ненулевой вектор xeV называется собственным вектором оператора <р : V-+V, если существует такое число Х<=К, что
ср (х) =Zx.
Число X называется собственным значением оператора ср, соответствующим собственному вектору х.
Множество всех собственных значений оператора <р называется спектром этого оператора и обозначается через Sp ср.
12.2.	Пр едложение. Пусть Zi, ..., Ks — попарно различные собственные значения оператора ср, соответствующие собственным векторам хь ..., xs. Тогда векторы хь xs линейно независимы.
Доказательство. Индукция по s. Для s=2 утверждение было проверено при доказательстве предложения 10.1. Совершим переход otsks+1. Рассмотрим линейную комбинацию
aiXi + .. . + asxs + as+ixs+i = 0.	(18)
Применив к ней оператор ср, получим
а1\х1+ • • • + as^sxs + «s+As+lXs-j-1 = 0.	(19)
Умножим равенство (18) на Xs+i и вычтем полученное из равенства (19). Тогда
ai(^i—^s-н)xi + .. • +«s (AzS—Xs+i)xs=0.	(20)
По предположению индукции линейная комбинация (20) тривиальна, откуда
ai = ... =a$=0,
219
поскольку —Vh^O. Поэтому равенство (18) принимает вид
Но по определению xs+i^0. Следовательно, a$+i=0. Предложение 12.2 Доказано.
Из предложения 12.2 вытекает
12.3.	Следствие. Спектр оператора <р, действующего в конечномерном пространстве V, конечен.
Для собственного значения Z оператора <р : V-+V положим
AU={xeV : ср(х)=Хх}.	(21)
Таким образом, множество Мх получается добавлением нулевого вектора к множеству всех собственных векторов оператора <р, отвечающих собственному значению X.
12.4.	Предложение. Множество Мк является подпространством пространства V, инвариантным относительно оператора <р.
Доказательство предоставляется читателю. Пространство Мк называется собственным подпространством оператора <р (отвечающим собственному значению X).
12.5.	Предложение. Пусть Л — собственное значение оператора <р и (е) = (еь ..., ет) — произвольный базис собственного подпространства Мх. Тогда матрица оператора (ср]Л1х) в этом базисе есть диагональная матрица ХЕ.
Доказательство предоставляется читателю.
12.6.	Предложение. Пусть М, ..., ks — попарно различные собственные значения оператора <р. Тогда сумма собственных подпространств
+ ... +
является прямой.	‘
Доказательство. Согласно предложению 4.5 надо показать, что если
хх+...+xs=0,	(22)
то Xi=0 для всех /=1, ..., s. Предположив, что это не так, оставим в сумме (22) только ненулевые слагаемые:
хч + ... 4-Xim=0.
Получим нетривиальную линейную комбинацию собственных векторов х*л, отвечающих различным собственным значениям. Это противоречит предложению 12.2. Предложение 12.6 доказано.
12.7.	Определение. Оператор ср :	называется диаго-
нализируемым, если в некотором базисе его матрица диагональ-на. Очевидно, что этот базис состоит из собственных векторов оператора <р.
220
12.8.	Предложение. Оператор феОр V диагонализируем тогда и только тогда, когда
где {Хь ...» Xs}=Sp ср.
Доказательство. Достаточность вытекает из предложения 12.5 и условия д) предложения 4.5. Пусть теперь оператор <р диагонализируем, т. е. пространство V имеет базис еь ..., ея, состоящий из собственных векторов оператора <р. Тогда каждый элемент этого базиса принадлежит некоторому собственному подпространству Л4х.. Следовательно,
У=Л4х1+ ... +^as-
Но эта сумма является прямой согласно предложению 12.6. Предложение 12.8 доказано.
Из предложения 12.8 и условия е) предложения 4.5 вытекает
12.9.	Следствие. Оператор ф : V-+V диагонализируем тогда и только тогда, когда
dim V=dim Л4хх + • • • + dim A4xs,
где {Хь ..., Х5)=8рф.
§ 13.	ХАРАКТЕРИСТИЧЕСКИЙ МНОГОЧЛЕН ОПЕРАТОРА.
АЛГЕБРАИЧЕСКАЯ И ГЕОМЕТРИЧЕСКАЯ КРАТНОСТИ ЕГО КОРНЕЙ
Попробуем решить следующую задачу. Пусть в пространстве V действует оператор ф. Как найти все его собственные векторы (или хотя бы один собственный вектор)?
Предположим, что х — собственный вектор оператора ф с собственным значением X, т. е. ф(х)=Хх. Тогда вектор х принадлежит ядру оператора ф—Хе, который, таким образом, согласно предложению 10.6 является вырожденным. Эти рассуждения можно обратить, т. е. имеет место
13.1.	Предложение, а) Число Хе К является собственным значением оператора ф тогда и только тогда, когда оператор Ф—Хе вырожден;
б)	вектор х является собственным вектором оператора ф, отвечающим собственному значению X тогда и только тогда, когда хеКег(ф—Хе).
Утверждение б) предложения 13.1 эквивалентно равенству
Л4х=Кег (ф—Хе).	(23)
Возьмем в пространстве V произвольный базис (е) = (еь ....
..., еп). Пусть
• • а1п
• • ^пп
221
— матрица оператора ср в этом базисе. Тогда согласно предложению 10.3 матрицей оператора <р—Ле в базисе (е) является матрица
II	Л ... а1п
............... .
I CLnl - • •
Поэтому согласно 13.1 а) имеем
13.2.	Предложение. Для Л^К условие ZeSp<p эквивалентно. тому, что
det(A<,e)—ЛЕ)=0.
Определитель det(A^}—ЛЕ) представляет собой многочлен степени п от переменной Л, который обозначим через /^е)(Л) и назовем характеристическим многочленом оператора <р (в базисе (е)).
Характеристический многочлен оператора не зависит от выбора базиса. В самом деле, пусть (e') = (ei',	е/) — другой
базис пространства V, и пусть С — матрица перехода от базиса (е) к базису (е'). Тогда согласно (8)
Л(*') л р____________ър_____________
Ф --/V-Lu--о /1ф О------О Г1ф С/--
—с-1хес=с~1 (4е)—ье)с.
Следовательно,
(X)=det0’>e') —XE)=det(C-1
= det (С-1)	(X) det C=f^ (X).
Поэтому многочлен det (4*—ХЕ) обозначаем символом f,(X).
В новых обозначениях предложение 13.2 можно переформулировать следующим образом:
13.3.	Предложение. Число Хое К является собственным -значением оператора'^ тогда и только тогда, когда оно является корнем его характеристического многочлена [Ф(Х).
В частности, для алгебраически замкнутого поля (например, для поля С комплексных чисел) спектр оператора совпадает с множеством корней его характеристического многочлена.
Таким образом, практический способ нахождения собственных векторов оператора <р основан на предложении 13.3 и состоит в следующем. Сначала находим все корни характеристического многочлена /Ф(Х), принадлежащего К. Затем для каждого такого корня X/, решая систему однородных линейных уравнений с матрицей 4е>—ХгЕ, находим координаты (в базисе (е)) всех собственных векторов с собственным значением X,-. Если при фиксированном базисе (е) мы отождествим пространство V с арифме-222
тическим n-мерным пространством К", то собственное подпространство М\. будет совпадать с пространством решений системы однородных линейных уравнений с матрицей Лфе)—ЛгЕ.
13.4.	Определение. Кратность собственного значения Ло оператора <р как корня его характеристического многочлена, т. е. такое число /п(Ло), что многочлен делится на (X—Ло)т(Хо), но не делится на (%—Л0)т(Х,)+1, называется алгебраической кратностью собственного значения Ло.
Его геометрической кратностью называется размерность dimTWx, собственного подпространства Л4л0.
13.5.	Предложение. Геометрическая кратность собственного значения Ло произвольного оператора ф не больше его алгебраической кратности.
Доказательство. Пусть dimMx0=m. Возьмем в пространстве V базис еь ..., еп, первые пг векторов которого образуют базис подпространства Тогда согласно 11.4 в этом базисе матрица оператора ф имеет вид
Поэтому
(Л)=det (Л—ЛЕ)= det (В—ЛЕ)  det (D—ЛЕ).
Но В является матрицей оператора
(ф|Л4^)=Лое.
Следовательно, В=‘к(1Е и det (В—ЛЕ) = (Ло—Л)"1. Таким образом, многочлен /„(Л) делится на (Л—Ло)”’, откуда /n=dim,Afx.,^т(Л0). Предложение доказано.
13.6.	Предложение. Оператор <р диагонализируем тогда и только тогда, когда любой корень характеристического многочлена принадлежит полю К и его геометрическая кратность совпадает с алгебраической.
Доказательство. Пусть 8рф={Ль ..., Лх}. Положим
n0 = dim Mt, +.....+dim Mks
Согласно 13.5 имеем dim М^. пг (Лг) и
ПоС»1=т(Л1) + ... +m(Xs).
При этом равенство по=п-, эквивалентно тому, что dimAfx.=m^i)> для всех 1=1, ..., s. Но если SpcpczK, то ni=dim V. Поэтому утверждение предложения 13.6 вытекает из следствия 12.9.
Из предложения 11.9 вытекает
13.7.	Предложение. Если Ф=ф1фф2, гпо /ф(Л)=/<Г1(Л)7ф2(Л>.
223
§ 14.	НИЛЬПОТЕНТНЫЕ ОПЕРАТОРЫ. ИХ ХАРАКТЕРИСТИЧЕСКИЕ МНОГОЧЛЕНЫ
Наделяя множество операторов Op(V) структурой алгебры (§ 10), мы стали называть композицию ф°ф операторов ф и ф их произведением фф. В соответствии с этим m-кратную композицию оператора ф называем его т-й степенью:
фо. . . о ф = фШч
I ---1
пг раз
Степени операторов перемножаются по тем же правилам, что и степени чисел. Так, для а, и натуральных Ш\ и т2 имеем
(сир)™1 (рф/"2=атфт*ф^-ИЧ	(24)
Для невырожденного оператора ф определен обратный оператор ф-"1 и
(фт)-1= (ф^1)	(25)
Если оператор ф невырожден, то для него имеет место формула (24) для любых mi и т2 и отличных от нуля а и 0, В частности, ф° = Е.
14.1.	Определение. Оператор ф называется нильпотентным, если некоторая его степень ф"1 является нулевым оператором. Отметим, что здесь всегд^ т^О.
Наименьшее число р, такое, что фр=со, называется высотой нильпотентного оператора ф. Ясно, что равенство фт=(о влечет равенство фт+1=со. Поэтому высота ненулевого нильпотентного оператора ф — это такое число р^2, что ф?-1^©, а фр=со.
14.2.	Пр едложение. Пусть р — высота нильпотентного операторами вектор aeV таков, что фР-1(а)¥=0. Тогда векторы
фР-*(а), фр~2(а), ..., ф(а), а
линейно независимы.
Доказательство. Рассмотрим равную нулю линейную комбинацию	।
<Х1фР-1 (а) + .. ^+ар-1ф(а)+ара=0.	(26)
Предположим, что среди ее коэффициентов си, ..., ар есть отличные от йуля. Существует такое что ар-л^О и ат=0
для всех т>р—k. Следовательно, равенство (26) имеет вид
сцфР-1 (а) + ... + ap-kMk (а) =0.
Применим к обеим частям этого равенства оператор фр-*-1. Поскольку фт=(о для всех т^р, получим
Ор-йфР-1 (а) =0.
224
Но по условию фр-1 (а)#=0. Следовательно, аР_£=0. Это противоречие и доказывает предложение 14.2.
Из этого предложения вытекает
14.3.	Следствие. Высота нильпотентного оператора eOp(V) не превосходит размерности пространства V.
Читателю предоставляется доказать, что имеет место
14.4.	Предложение. Всякое собственное значение нильпсг тентного оператора равно нулю.
Это утверждение можно усилить. Из того, что всякий корень характеристического многочлена /Ф(Л,), принадлежащий полю К, является собственным значением оператора ф, вытекает
14.5.	Предложение. Если нильпотентный оператор ф действует в пространстве V над алгебраически замкнутым полем К (в частности, над полем С), то все корни его характеристического многочлена равны нулю, т. е.
fv(x) = (—x)n.
(27)
14.6.	Предложение. Всякий оператор <р, действующий в ненулевом вещественном пространстве V, имеет одномерное или двумерное инвариантное подпространство.
Это предложенйе непосредственно вытекает из следующегб утверждения:
14.7.	Лемма. Пусть Х=а + ф — комплексный корень характеристического многочлена оператора <р, действующего в вещественном пространстве V. Тогда существуют такие линейно независимые векторы a, beV, что
<р (а)=аа—6Ь, )
Ф(Ь)=₽а+Л )	<28>
Доказательство. Зафиксируем в пространстве V какой-нибудь базис е]( ..., еп. Пусть А — матрица оператора <р в этом базисе. По условию матрица А—ХЕ имеет равный нулю определитель. Поэтому система однородных линейных уравнений с матрицей А—ХЕ имеет в поле С ненулевое решение z=(zb ..., zn). Пусть z*=Xfc + iz/*, k=l, ..., п. Положим
х=
» У=
Уп
Тогда
(А—ХЕ) (х-Ну) =0,
или
Л (x+ty) = (a-H‘₽) fx+iy).
(29)
225
8 Зак. 283
Равенство (29) двух комплексных матриц эквивалентно равенствам их вещественных и мнимых частей, т. е.
Лх=ах—By, )
ЛУ=₽Х+". I	<30>
Положим
a=%iei+...+х„е„, b=t/iei+ ... +упеп.
В силу эквивалентности условий (30) и (28) остается проверить линейную независимость столбцов х и у. Поскольку х-Н'у — ненулевое решение системы с матрицей А—ХЕ и р=#=0, нз второго равенства (30) вытекает, что столбец у ненулевой. Предположим теперь, что существует вещественное число у, для которого
х=уу.
Тогда система равенств (30) примет вид
уЛу=(ау—0)у,
Лу=(ру+а)у,
откуда (ау—₽)у=у(₽у+а)у. Отсюда в силу условия у=#0 получаем ау—₽=0у2+ау. Но 0¥=О, поэтому у2=—1. Противоречие. Лемма доказана.
14.8.	Предложение. Для нильпотентного оператора <р, действующего в вещественном пространстве, верна формула (27).
Доказательство. Надо проверить, что все корни характеристического многочлена равны нулю. Вещественные корни равны нулю согласно 14.4. Предположим, что имеется комплексный корень а+ф. Возьмем векторы а и b из леммы 14.7 и положим Af=Ls(a, Ь). Из условия (28) вытекает, что подпространство М инвариантно относительно оператора <р и <р(Л4)=А1, т. е. оператор (<р|А4) невырожден. Но тогда для всякого натурального m оператор (<pm|Af) невырожден, что противоречит нильпотентности ф. Предложение доказано.
14.9.	Пример. Стандартным нильпотентным оператором является циклический оператор, т. е. такой оператор <р, для которого в пространстве V существует базис еь ..., еп со свойством
<P(ei)=0, <р(е2)=ег..<p(en)=en-i.
В этом базисе, называемом циклическим, матрица оператора ф имеет вид
•• 1
0
о
226
14.10.	Предложение. Нильпотентный оператор <р является циклическим тогда и только тогда, когда его высота совпадает с размерностью пространства.
Доказательство. Необходимость вытекает из того, что для циклического базиса ср"-1 (en)=ei. Достаточность вытекает из предложения 14.2, так как векторы
Фп— ‘(а), фп~2(а), ... , ф(а), а образуют циклический фазис пространства.
§ 15.	РАЗЛОЖЕНИЕ ВЫРОЖДЕННОГО ОПЕРАТОРА В ПРЯМУЮ СУММУ НИЛЬПОТЕНТНОГО И НЕВЫРОЖДЕННОГО
15.1.	Теорема. Всякий вырожденный (не нильпотентный) оператор ф единственным образом может быть представлен в виде прямой суммы нильпотентного и невырожденного операторов ф1 И ф2.
Доказательство разобьем на ряд вспомогательных лемм. Для натурального числа m положим
Л4т=Кегф"!, Л^т=1ш фт.
1.	Лемма, а) Подпространство Мт инвариантно относительно оператора ф;
б)
в)	если Mm=Mm+l, то Mm+i=Mm+2.
Утверждения а) и б) вытекают из одного факта: если Фт(х)=0, то ф'й+1(х)=ф(фт(х))=0. Что касается утверждения в), то в силу б) достаточно проверить включение Mm+2czMm+l. Пусть xeAfm+2, т. е. фт+2(х)=0. Положим у=ф(х). Тогда <pm+1(y)=1(pm+2(x)==.Q> т е у^Мт+1=Мт. ЗдачИТ, фт(у)=0, Э ТОГ-да ф’п+1(х)=фт(у)=0, т. е. xeAfm+1.
2.	Лемма, а) Подпространство Nm инвариантно относительно оператора ф;
б)	Nm+'<=Nm\
в)	Nm=Nm+i равносильно тому, что
г)	если Nm—Nm+i, то Nm+X—Nm+2.
Утверждения а) и б) вытекают из равенств ф(фт(х)) = =фт+1(х)=ф'п(ф(х)). Утверждение в) вытекает из утверждений б) лемм 1 и 2 и из того, что согласно теореме 5.7 для любого натурального р имеем
dimAf»’+dimJW’=dim V.	(31)
Утверждение г), которое можно проверить и непосредственно, вытекает из утверждений в) лемм 1 и 2.
3.	Лемма. Если Mm=Mm+l, то V=Mm®Nm.
Доказательство. Согласно (31) достаточно проверить, что Afmn^m={0}. Пусть x^Mm(\Nm. Тогда фт(х)=0 и существует такой вектор yeV, что фт(у)=х. Следовательно, ф2т(у)=фт(х) = 8*	227
=0, т. е. уеЛ42т. Но согласно лемме 2 имеем Мт=М2т. Значит, уеЛ4т, т. е.
0=ф'”(у)=х.
4.	Лемма. Если	то оператор (<р|Л1т) нильпотен-
тен, а оператор (<р|Л^т) невырожден.
Доказательство. Оператор (<р|Л4т) по определению Мт нильпотентен для любого m^l, и его высота не превосходит tn. Чтобы проверить невырожденность оператора (ф достаточно показать, что его ядро нулевое. Пусть xeAfm и <р(х)=0. Тогда xgM'cM'’’-. Следовательно, хеМтПЛ1т, т. е. х=0 согласно лемме 3.
Из лемм 3 и 4 вытекает, что <р является прямой суммой нильпотентного оператора (ф|Мт) и невырожденного оператора (ф|Ут), если
5.	Единственность представления ф=ф1Ффг. Пусть К=Л1|фЛ12. оператор (ф|Л41) нильпотентен, а оператор (ф|ЛТ2) невырожден. Надо показать, что если Мт=Мт+1, то Afi=Afm, а Л42=Л’т. Пусть р — высбта оператора (ф|Л41). Тогда для любого вектора хеМ| имеем фр(х)=0, т. е. MiczMp. Но Мрс=Мт согласно лемме 1. Итак, М[<^Мт.
Пусть теперь хеЛ42. Из невырожденности оператора (ф|7И2) вытекает невырожденность любой его конечной степени, в частности (ф|Л12)”’. Поэтому существует такой вектор уеЛ12, что х=фт(у). Следовательно, M2czNm.
Таким образом,	dim Af2^dim Nm. Но
dim	+ dim M2=dim V=dim Mm + dim Nm.
Поэтому dim Mt=dim Mm, dimAf2=dimAT" и, следовательно, = = Mm, M2—Nm. Теорема доказана.
15.2.	Предложение. Если все корни характеристического многочлена оператора ф равны нулю, то он нильпотентен.
Доказательство. В противном случае согласно 15.1 имеем ф=ф1Фф2, где оператор ф2 невырожден. Тогда /Ф(Х)= =/ф,(Х)/фг(Х) в силу 13.7. Но ни один из корней характеристического многочлена ДрДХ) невырожденного оператора ф2 по определению не равен нулю. Противоречие.
§ >6. ЕДИНСТВЕННОСТЬ ЖОРДАНОВОИ ФОРМЫ
НИЛЬПОТЕНТНОГО ОПЕРАТОРА
16.1.	Определение. Квадратная матрица вида
X 1 0 .... 0 0X10. . . о О О % 1 ... о
(32)
О О .... X 1
0 0......X
228
,	„	„	,	.	,(<i)
называется жордановои клеткой, и обозначается символом А , где d — порядок матрицы.
Квадратная матрица А имеет жорданову форму, если она — прямая сумма жордановых клеток, т. е. является блочно-диагональной матрицей с жордановыми клетками на диагонали:
№
О
О
(33)
Базис еь ..., ел пространства V называется жордановым базисом для оператора <р, если матрица оператора <р в этом базисе имеет жорданову форму.
Примером жорданова базиса является 'циклический базис циклического нильпотентного оператора 14.5. Матрицей оператора в этом базисе служит жорданова клетка Jon\
16.2.	Предложение. Если матрица (33) является матрицей оператора <р в некотором базисе, то спектр Sp ф оператора ф совпадает с множеством {Ль ..., Л«), которое в свою очередь состоит из всех корней многочлена /Ф(Л).
Доказательство. Из треугольное™ матрицы (33) выте-
S
кает, что /ф(Л)=П(Лг—Лр. Следовательно, {Ль ..., Лх) — это г=1
множество всех корней характеристического многочлена оператора <р. В то же время всякое число Л/, являясь элементом матрицы оператора ф, принадлежит основному полю К. Для завершения доказательства остается применить предложение 13.3.
Из предложений 16.2 и 14.4 вытекает
16.3.	Следствие. Если матрица А нильпотентного оператора Ф имеет жорданову форму, то она является прямой суммой жордановых клеток вида .
Основным результатом этого параграфа является
16.4.	Теорема. Жорданова форма матрицы нильпотентного оператора определена однозначно с точностью до перестановки жордановых клеток.
Доказательство. Согласно 16.3 жордановы клетки матрицы А нильпотентного оператора ф, имеющей жррданову форму, отличаются друг от друга только их размером. Обозначим через md число жордановых клеток матрицы Л, имеющих порядок d. Теорема будет доказана, коль скоро мы докажем, что числа md не зависят от выбора жорданова базиса, а однозначно определяются оператором ф.
Пусть (е) = (еь ..., еп) — базце пространства V, в котором оператор ф имеет матрицу А. Пусть жорданова клетка /0(d) матрицы А стоит на пересечении строк и столбцов с номерами от Л+1 до k+d. Скажем, что вектор базиса (е),	стоит
229
над i-м столбцом этой жордановой клетки 70(d). По определению матрицы А оператора <р имеем
ф(е*+1)=0, ф(е*+2)=ей+1, ..., ф(ен-<*)=ей+<*-ь	(34)
Из соотношений (34) вытекает, что для l^i^d
ф‘(е*-н)=0, ф‘-1(е*+()=ел+1=^0.	(35)
Здесь по определению считаем ф°=е.
Скажем, что вектор имеет высоту i по отношению к оператору ф, если ф‘(х)=0, а ф‘-1(х)=#=0. Если ф — нильпотентный оператор высотой р, то каждый ненулевой вектор х имеет высоту и она не превосходит р. Более того, в любом базисе имеются векторы высоты р, поскольку всякая линейная комбинация векторов высоты <i имеет высоту ^i.
Обозначим через hi число векторов базиса (е), имеющих высоту i по отношению к оператору ф. Из соотношений (35) вытекает, что вектор е; базиса (е) имеет высоту i тогда и только тогда, когда он стоит над i-м столбцом соответствующей жордановой клетки, которая, таким образом, имеет порядок >i. Следовательно,
hi=mi+... +mp,
откуда
пи—hi—hi+i.	(36)
Таким образом, для завершения доказательства достаточно показать, что числа hi однозначно определяются оператором ф. Докажем, что
/1{=ШтКегф/—сНтКегф'-(37)
Формула (37) вытекает из того, что
ht + ... +ht=dim Ker <pz,	(38)
а для проверки формулы (38) достаточно показать, что векторы базиса (е), имеющие высоту =Ci, образуют базис в пространстве Кегф1. Обозначим систему этих векторов через (е1), а систему остальных векторов базиса (е) — через (е2). Поскольку каждый из векторов системы (е1) принадлежит Кегф‘, надо проверить только, что эта система полна в Кегф‘. Возьмем произвольный вектор хеКег ф‘ и разложим его по векторам базиса (е) всего пространства V. Тогда вектор х однозначно представляется в виде
Х=Х1 + Х2,
где Xi — линейная комбинация векторов из (е1), а х2 — линейная комбинация векторов из (е2):
ха=а1е/1+ ... + а9еiq.
230
Вектор х2=х—X] принадлежит Кег<р’, т. е. q>'(x2)=0. Следовательно,
О1Фг‘ (ед) + • • • + аафг’ (%)=0.	(39)
Но каждый вектор е/ из системы (е2) имеет высоту >i+L Поэтому из второй части соотношений (35) вытекает
Фг(е/)=в/-,-.	..............
Таким образом, равенство (39) принимает вид
aie/i-«+---+a9e/fl-‘=0’	...................
откуда ai=.. .=ао=*0. Итак, х2=0 и система , (е1) полна в Кег<р‘.
Формула (38), а вместе с ней и теорема 16.4 доказаны.
Из соотношений (36) и (37) вытекает формула
m£=2dimKer<p‘^dimKer<pi_1 — dimKer<p‘+1. . .	.	(40)
§ 17.	СУЩЕСТВОВАНИЕ ЖОРДАНОВА БАЗИСА ДЛЯ НИЛЬПОТЕНТНОГО ОПЕРАТОРА
В этом параграфе будет доказана теорема, сформулированная в заголовке.. Согласно 16.3 и 14.9 эта теорема может быть сформулирована следующим образом:
17.1.	Теорема. Всякий нильпотентный оператор разлагается в прямую сумму циклических операторов.
Доказательство. Пусть р — высота нильпотентного оператора <р. Как и в § 15, положим Л4”’=Кег <рт. Имеем растущую последовательность подпространств
Л41 <х М2 с ... ё	cz Л4Р=V.
Для 2^i^p положим Ki=q>i-1A4‘ и К1=ЛР. Покажем, что
КжсКь	(41)
Пусть хеКщ. Существует такой вектор уеЛР+1, что <р‘(у)=х. Положим г=ф(у). Тогда <p’(z)=q>'+1(y)=O, поскольку уеЛ4‘+1. Следовательно, zeAP и <pi-1 (z)=<p‘(y)=x, т. е. хеК». Таким образом, включение (41) проверено (включение	прове-
ряется аналогично). Итак, имеем следующую растущую последовательность подпространств:
Кр <= Kp-i с ... с К2 <=
Пусть векторы ef, ... , е£р образуют базис в подпространстве Кр, дополним его векторами ер—\ ... , до базиса подпространства Kp—i и так далее. Получим базис
{е‘.: 1	1 < /X tn{}
231
в подпространстве Ki=M\ По определению подпространств Ki для 1^2,	существуют такие векторы а;‘<=Л1‘, что
е|=<р/_| (а'.).	(42)
Рассмотрим таблицу векторов
। е^=ф°~* (ар), <рр~2(ар,	, ф(ар), ар;
е^=Фр->(а,рПр), фр~2(арр), ... , Ф(арр), арр;
е2=ф(а2), а2;	(43)
етг = Ф(ат2)>
е}=аь
k C/j1==:aW1.
Докажем, что система (е) всех векторов из таблицы (43) образует базис пространства V. Лля этого согласно 2.10 достаточно показать, что система (е) линейно независима и состоит из п— =dim V векторов.
Векторы, стоящие в первом столбце таблицы (43), образуют базис пространства	и, следовательно, являются вектора-
ми высотой 1. Векторы, стоящие в £-м столбце таблицы (43), при отображении ср переходят в (k—1)-й столбец, оставаясь в тех же строках, и, следовательно, имеют высоту k.
Возьмем равную нулю линейную комбинацию векторов системы (е) и покажем, что она тривиальна. Запишем ее в виде
С1+...+ср=0,	(44)
где через с, обозначена часть этой линейной комбинации, состоящая из всех векторов г-го столбца. Предположим, что линейная комбинация (44) нетривиальна, и пусть k — наибольший номер, для которого в линейной комбинации ck имеются ненулевые коэффициенты. Тогда равенство (44) принимает вид
ci + ... + с*=0.
Применим к этому равенству оператор ф*-1. Учитывая, что в комбинации ci стоят векторы высотой i, получим
Ф^(сл)=0.	(45)
Пусть
ск = а?(РР“’/г(а1>)+ • • • + (afp) + • • • +^1а?+ • • •
Тогда с учетом (42) равенство (45) принимает вид
232
и представляет из себя равенство нулю линейной комбинации части базисных векторов пространства М1. Поэтому все коэффициенты а/ равны нулю, что противоречит выбору номера k. Следовательно, система (е) линейно независима.
Из § 15 (лемма 1) мы знаем, что подпространства М1 инва>-риантны относительно оператора <р и, следовательно, относитель-но всех его степеней <р*. Поэтому
Очевидно, что Ker | Л1*) с Кег<р!—*. С другой стороны, если хеЛ4!-1, то хеЛ4‘ и <pi—1 (х)=0, т.' е. х е Ker (<pi—11 М'). Таким образом,
М’-^Кег^-ЧМ1).
Поэтому, считая Л4°={0}, согласно 5.7 имеем
dim/Ci + dimAf^^dimM4.	(46,}1
Сложив равенства (46,), i=l, ..., р, получим
dim/(i-|- • • • +dim/Cp=dimAf₽=dimV—n.
Но по построению векторов е/ и таблицы (43) видим, что число» ее векторов, стоящих в i-м столбце, равно	,
тр+ ... +mi=dimKJ.
Поэтому число всех векторов системы (е) равно
dim#!-!- ... +dimKp=n.
Таким образом, (е) — базис в пространстве V.
Осталось проверить, что это — жорданов базис. Положив
L‘=Ls{<pi-i(aj), ... , Ф(а}), а|},
видим, что
У=ЬГ ф... ф Lpmp ф ... ф L1 ф... ф Llmi.
Далее, подпространство L/ инвариантно относительно оператора! Ф, а соответствующая строчка таблицы (43) дает нам циклический базис оператора (ф|Л/)- Теорема доказана.
Из теоремы 17.1 и предложения 15.2 вытекает обобщающее предложения 14.5 и 14.8
17.2.	Пр едложение. Оператор ср, действующий в любом пространстве V, нилъпотентен тогда и только тогда, когда для него верна формула
№)=(-ь)п-
Отметим еще одно следствие теоремы 17.1.
233
17.3.	Предложение. Нильпотентный оператор <р неприводим тогда и только тогда, когда его высота равна п.
Для его доказательства нам потребуются следующие очевидные вспомогательные утверждения, имеющие тем не менее и са-мостоятельный интерес.
17.4.	Предложение. Если 7=Л41©Л42 и подпространства .Mi инвариантны относительно операторов <р и -ф, то
q)i|)=(<р | Мг) (ф | Ali) ф (ф | М2) (ф | М2).
17.5.	Следствие. Если Ф=ф1фф2, пго ф*=ф*фф*.
Доказательство предложения 17.3. Достаточность вытекает из 14.3 и 17.5. Необходимость вытекает из теоремы 17.1 и из того, что размер любой жордановой клетки нильпотентного оператора не превосходит его высоты, в силу неравенства (j0(d))d-iy=OE.
§ 18.	ЖОРДАНОВА ФОРМА ПРОИЗВОЛЬНОГО ОПЕРАТОРА
18.1.	Предложение. Если %0 — корень характеристического многочлена оператора ф и цеК, то Хо+ц — корень характеристического многочлена оператора ф + це.
В самом деле, если в некотором базисе Av—A, то
Лф+ие=Д + цЕ. Следовательно,
Дф =A KqE=А + рЕ (Хо [*)£=(^о”Ь откуда утверждение и вытекает.
Следующее утверждение очевидно.
18.2.	Предложение. Всякий жорданов базис для оператора ф будет жордановым базисом и для оператора ф+ре, где реК.
Из предложения 11.9 вытекает
18.3.	Предложение. Пусть пространство V разлагается в прямую сумму Л4,фЛ42 подпространств, инвариантных относительно оператора ф, и пусть ф,= (ф | Mt). Тогда если (е‘) — жорданов базис подпространства Mt для оператора ф(-, то (e) = (e1)(J . (J (е2) — жорданов базис для оператора ф.
18.4.	Теорема. Если все корни характеристического многочлена оператора ф принадлежат полю К, то в пространстве V существует жорданов базис для оператора ф. При этом жорданова форма матрицы оператора ф определена однозначно с точностью до перестановки жордановых клеток.
Доказательство. Индукция по числу s корней многочлена /ф(Х). Пусть Ai — единственный корень характеристического многочлена. Тогда согласно 18.1 единственный корень многочлена Jtp-x.eW — нуль. Согласно 15.2 оператор ф—%ie нильпотентен. Из теорем 16.4 и 17.1 вытекает единственность и существование .жордановой формы матрицы этого оператора. Тогда согласно
234
предложению 18.2 теорема существования и единственности жор-дановой формы будет верна и для оператора ф.
Совершим индуктивный переход от s к s+1. Пусть {V ..., V %s+1} — все корни многочлена /Ф(Л.). Тогда согласно 18.1 корнями характеристического многочлена оператора <р—V-ie будут числа %!—Xs+i,	—A.s+1, 0 и только они. Поскольку 0<=Sp(ф—Xs+ie),
оператор ф—A,s+ie вырожден и не нильпотентен согласно 14.4. По теореме 15.1 пространство V единственным образом представляется в виде прямой суммы Л4]фЛ12 инвариантных относительно Ф—Xs+ie подпространств так, что оператор <pi=(<p—%s+ie|Ali) нильпотентен, а оператор ф2=(ф—%s+ie|Af2) невырожден. Согласно 13.7 оператор <pi имеет одно собственное значение 0, а оператор <p2 s собственных значений kt—hs+i, i=l, • s. Тогда существование жорданова базиса оператора ф—Vue вытекает из предположения индукции и предложения 18.3.
Теперь единственность жордановой формы матрицы оператора Ф—A.s+ie. Пусть (е) — жорданов базис для этого оператора. Обозначим через (е1) множество всех векторов базиса (е), стоящих над жордановыми клетками матрицы	имеющими нули
на диагонали, и пусть (е2) = (е)\(е!). Положим Ai=Ls(e1), W2=Ls(e2). Тогда У=Л/\ФУ2, пространства А/ инвариантны относительно оператора ф—V-is, матрица оператора ф1=(ф— —%s+ie|A^i) в базисе (е1) имеет жорданову форму с нулями на диагонали, а матрица оператора фг=(ф—| Л72) имеет жорданову форму с числами —Vh, ..., A.s—ta+i на диагонали. Поэтому оператор ф1 нильпотентен, а ф2 невырожден. Тогда Л’1=Л4ь А2=Л42 согласно 15.1,' и из предположения индукции и предложения 18.3 вытекает единственность жордановой формы матрицы оператора ф—A.s+ie. Итак, теорема 18.4 для оператора ф—V-ie, а согласно 18.2 и для оператора ф доказана.
18.5.	Замечание. Из предложения 16.2 вытекает, что принадлежность корней многочлена /Ф(Х) полю К является необходимым условием существования жорданова базиса для оператора ф.
§ 19.	ТЕОРЕМА ГАМИЛЬТОНА—КЭЛИ
Пусть
f (^) ——
произвольный многочлен над полем К, и пусть ф — оператор, действующий в пространстве V над полем К. Тогда определен оператор /(ф)=аое + а1ф+ • • • + атФт>
называемый многочленом от оператора ф. Из теоремы об изоморфизме между алгеброй операторов и алгеброй их матриц (§ 10)
235
вытекает, что если А — матрица оператора <р в базисе (е), то-матрицей оператора f(<p) в этом же базисе является матрица
/ (А)=О0Е + Я1Л + • • • + От^т,
называемая многочленом от матрицы А.
Скажем, что оператор-<р (матрица А) является корнем многочлена f(X), если f((p)=<a (1И) — нулевая матрица). Имеет место очевидное
19.1.	Предложение. Оператор <р является корнем многочлена f(X) тогда и только тогда, когда корнем этого многочлена является матрица А оператора <р в произвольном (в каком-нибудь ) базисе.
Основным результатом параграфа является
19.2.	Теорема Гамильтона-Кэли. Всякий оператор является корнем своего характеристического многочлена, т. е. Мф)=(0.
Прежде чем доказывать эту теорему, выведем из теоремы о существовании жорданова базиса теорему об общем виде линейного оператора. Пусть (е) — жорданов базис оператора ф, в котором его матрица имеет жорданову форму
(33)
Пусть (е‘) — часть этого базиса, соответствующая" жордановой клетке . Положим Ali=Ls(e‘). Тогда подпространство Л1,-инвариантно относительно оператора ф, и оператор <pz= (<р | имеет в базисе (е<) матрицу
X,	1,	0	...	О
О	Хг	1	...	О
О	0	0	...	1
О	0	0	...	Хг
Тогда оператор <р(—Х,8 имеет в базисе (ez) матрицу
Следовательно, <р(—Х/е является циклическим оператором высоты di. Таким образом, нами доказана
236
19.3., Теорем а. Если матрица оператора ф имеет жорданову форму (33), то
Ф=Ф1Ф...®Ф$,	z	(47)
где ф,—— циклический оператор высотой di.
Доказательство теоремы Гамильтон а-К эли. Рассмотрим сначала случай, когда основное поле К алгебраически замкнуто. Тогда к оператору ф можно применить теорему 19.3. Пусть
V=AG®...©M£
— разложение пространства V, соответствующее представлению (47) оператора ф. Чтобы доказать, что оператор /Ф(ф) нулевой, достаточно доказать, что нулевым является его ограничение на каждое из инвариантных подпространств Л4Ь Ms. Поскольку матрица оператора ф имеет жорданову форму (33),
М*)=П(*ч-*Л
1—1
Следовательно,
М<р)=П<х*6—фА	<48>
!=1
Из формулы (48) вытекает, что оператор (ф—%ге)^ является делителем оператора /Ф(ф), т. е. существует многочлен gi(h), для которого
Мф)=ё.(ф)(ф—М)“£.
Поэтому для вектора хеЯ имеем
/ч> (ф) (x)=gz (ф) ((ф—М*' (*))•	(49)
Но согласно 19.3 оператор <р/—Л,8= (<р—Xte|Ali) является циклическим высотой di. Следовательно, (<р—X;e)d‘(x)=0, откуда /»(ф)(х)=0 согласно (49). Итак, (/ф(<р) |Л4/)=© и, значит, Д(<р) = =(1). ,
Пусть теперь поле К не является алгебраически замкнутым. Возьмем какой-нибудь базис (е) пространства V, и пусть А — матрица оператора q> в этом базисе. Согласно 19.1 достаточно доказать, что матрица fv(A) является нулевой.
Известно, что поле К можно вложить в алгебраически замкнутое полв/Ki (читатель может считать, что K=R, a Ki=C).
Возьмем какое-нибудь линейное пространство над полем Ki, имеющее ту же размерность п, что и пространство Vi (например, 1Л=К1"). В пространстве 1Л возьмем какой-нибудь базис
237
(е1) и определим оператор ф: Vj-^Vi так, чтобы в базисе (е1) он имел матрицу А. Ясно, что
(50)
При этом равенство (50) надо понимать как равенство соответствующих коэффициентов этих многочленов.
По уже доказанной теореме Гамильтона—Кэли для алгебраически замкнутого поля /*(ф)=®, следовательно, f^(A) — нулевая матрица. Применение равенства (50) завершает доказательство теоремы Гамильтона—Кэли в общем случае.
Глава IV
БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФУНКЦИИ
§ 20.	БИЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ИХ МАТРИЦЫ
В этой \главе предполагаем, что характеристика основного поля К равна нулю. Читатель может считать, что К равно К или С.
20	.1. Определение. Пусть V — линейное пространство над полем К. Отображение |:УхУ->К называется билинейным функционалом (или билинейной функцией) на пространстве V, если при каждом фиксированном значении одного аргумента оно» линейно по другому аргументу, т. е.
5(Xi + xa, у)=£(Х1, У) + £(х2, У)-
£(ах, у)=а£(х, у),
£(х, У1 + у2)=Ц(х, У1)+Н(х, у2),
|(х; ау)=а£(х, у)
для любых векторов х, х», у, y^V и для любого числа аеК.
20	.2. Примеры. 1. Скалярное произведение векторов (АГ, §11} является билинейным функционалом в Vect(n), л=1, 2, 3.
2.	Билинейным функционалом в Кп является отображение задаваемое равенством
^(х, у)=хуу1+.. .+хпуп.
3.	Билинейным функционалом в пространстве С([0, 1], R} непрерывных функций на отрезке является отображение g, зада* ваемое равенством
о
Как и всякие отображения в поле, билинейные функционалы £ и т] можно складывать и умножать на числа аеК:
(S+n) (х> У)=В(х, у)+т](х, У),	(1)
(а£) (х)=а(£(х)).	(2)
Ясно, что отображения Е + ц и ag, определенные равенствами (1) и (2), также будут билинейными функционалами.
Множество всех билинейных функционалов на пространстве V обозначим через Т2(У). Легко проверить, что множество Т2(У) с операциями сложения (1) и умножения на число (2) само будет линейным пространством над полем К. Нулем этого пространства является нулевой функционал <о : Ух У->К.
23»
20.3. Определение. Билинейный функционал g называется симметрическим, если
Ux, y)=Uy, х)
для любых векторов х, уеК
Если же
Если же g(x, у) =—g(y, х), то билинейный функционал g на^ зывается кососимметрическим.
Множество симметрических билинейных функционалов на пространстве V обозначим через Т2СИМ(У), а множество кососимметрических— через Т2КОС(У). Ясно, что множества Т2СИМ(У) и Т2КОС(У) являются линейными подпространствами пространства т2(Ю. Более того, имеет место
20.4.	Предложение.
т2 (У) ==Т2СИМ (У) ф Т2КОС (У).
В самом деле, для любого билинейного функционала g имеем ^ = gcHM + £кос, где симметрический функционал gCMM определяется равенством
М*. y)=Y^(x’ У) + Ну, X)],	4	(3)
А кососимметрический функционал gKOc — равенством
Uc(x, у)=у-[|(х, у)—В(у, х)].	(4)
20.5.	Определение. Пусть | — билинейный функционал «а пространстве V, и пусть (e) = (ei, .... еп) — базис этого пространства. Положим
Ьц=Цъ, е,).	(5)
Матрица
fen • * • fein
fenl • • • fenn
^называется матрицей билинейного функционала g в базисе (е). Эту матрицу обозначаем также символами
вЕ>в|е), #*•••*.
Элементы btj матрицы В называются коэффициентами функционала £ в базисе (е). Если
г=1	Z =1
240
то в силу билинейности функционала £ имеем
п	п	п	п
y)=l(E Xfy, £	0/1(еь е/) =
2=1	7=1	2=1 /=1
= £ bi/xtxh т. е. ь/=1 .
п
?(х> у)= £ bijXiXj.	(6)
2,7=1
Стоящее в правой части равенства (6) выражение называется билинейной формой от переменных хь ..., хп и уь ..., уп- Таким образом, всякий билинейный функционал выражается в базисе билинейной формой от координат. Наоборот, всякая билинейная форма задает равенством (6) некоторый билинейный функционал. Следовательно, при фиксированном базисе существует биекция между множеством билинейных функционалов и множеством билинейных форм. Поскольку билинейная форма однозначно определяется матрицей В своих коэффициентов Ьц, равенство (6) устанавливает биекцию между билинейными функционалами и их матрицами в фиксированном базисе. Эта биекция, очевидно, является линейным отображением, т. е.
Итак, нами доказано
20.6.	Предложение. При фиксированном базисе в пространстве V соответствие
является изоморфизмом между пространством T2(V) билинейных функционалов и пространством Мп квадратных матриц порядка n=dim V.
При этом ясно также, что симметрическому функционалу соответствует симметрическая матрица, а кососимметрическому функционалу — кососимметрическая матрица.
Равенство (6) можно переписать в виде
п п
В(Х, У)=Е*г(£ М/).
i=i /=1
откуда получаем, что
£(*> У)=(*1» ••• хп)Вг
У1
Уп
(7>
91 /2 Зак. 283
241
20.7.	Предложение. Пусть (е) = (еь	еп) и (е') =
= (е/, ..., е/) — два базиса в пространстве V, и пусть С — матрица перехода от базиса (е) к базису (е'). Тогда для любой билинейной функции g ее матрицы в этих базисах связаны соотношением
в£'}=с*вРс.
Доказательство. Пусть векторы х, (е') координаты (хь ... , хп), (уи ... , уп) и соответственно. Тогда согласно (АГ, §22)
(8) у имеют в базисах (е) и W.......О- tor >'.)
(xlf ... хп)—(Хр . •. , хп)С ,
У1
=С
y'l
(9)
Уп
Уп
Поэтому, применяя (7), имеем
У'г
to;........
=£(х, y)=(*i>  , *п)В1е}
У1
Уп
Уп
= (согласно (9))=(х', ... , х^)С*В^С
Сравнивая начало и конец этой цепочки равенств, мы и получаем формулу (8).
§ 21.	РАНГ БИЛИНЕЙНОГО ФУНКЦИОНАЛА. ЛЕВОЕ И ПРАВОЕ ЯДРА
21.1.	Определение. Рангом r(g) билинейного функционала называется ранг г(В5) его матрицы в каком-нибудь базисе. Из предложения 20.7 вытекает корректность этого определения.
Для билинейного функционала £ положим
Ker^eB={xeV : g(x, у)=0 для всех yeV},
Ker?P={xe=V : g(y, х) = 0 для всех yeV}
и назовем эти множества соответственно левым и правым ядром функционала £.
Из линейности функционала g по каждому из ‘аргументов вытекает, что его левое и правое ядра являются линейными подпространствами пространства V.
21.2.	Теорема. Для любого билинейного функционала g на п-мерном пространстве V имеем	х
dim Кег*ев=п—г (g)=d im Кег|Р.	(10
242
Доказательство. Проверим правое из равенств (10). Пусть (е) = (еь ел) — какой-нибудь базис пространства V. Легко проверить, что
Ker"P={xe V : £(е;, х)=0 для всех г = 1, ... , п}.
Тогда для вектора x=xiei + ... +хпеп условие принадлежности его Кег5пр состоит в том, что
|(ег, здЧ-... +xne„)=0, z = l....п.
Пользуясь линейностью £ по второму аргументу, получаем
п
£	е/)==0,	п,
/=1
или, учитывая (5),	1
' Ьих1+ ... +Ь1пхп = 0, .................... (И)
k W1 + • • • ""И	‘
Итак, вектор х принадлежит правому ядру Кег^р тогда и только тогда, когда его координаты удовлетворяют системе (11). Матрицей' этой системы служит матрица Bge) функционала § в базисе (е). Поэтому Кег£р, будучи отождествлено с пространством решений системы (11), имеет размерность п—r(B'^)=n—г(^). Аналогично проверяется левое из равенств (10). Теорема доказана.
Для некоторых функционалов равенство dimKer|eB=dim Кег$р можно усилить.
21.3.	Предложение. Если билинейный функционал g является симметрическим или кососимметрическим, то
Кег|ев=Кег?р.	(12)
Доказательство. Принадлежность хеЕКег^ев эквивалентна тому, что g(x, у)=0 для любого уеУ. Но в зависимости от симметричности или кососимметричности g имеем g(x, у)== = ±g(y, х), что в любом случае нам дает g(y, х)=0, а это означает принадлежность вектора х правому ядру функционала
Из предложения 21.3 вытекает, в частности, что если Ker^eB=?fe Ф Кег£р, то функционал g не является ни симметрическим, ни кососимметрическим.
2L4. Задачи. 1. Привести пример билинейного функционала левое ядро которого не совпадает с правым.
2. Привести пример билинейного функционала g, который удовлетворяет условию (12), но не является ни симметрическим, ни кососимметрическим.
91 /2*	243
§ 22.	КВАДРАТИЧНЫЕ ФУНКЦИИ И ПОЛЯРНЫЕ К НИМ БИЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ
22.1.	Определение. Отображение b : V-*K называется квадратичной функцией, если существует такой билинейный функционал I, что
b(x)=g(x, х) для любого вектора xeV.	(13)
Из этого определения непосредственно вытекает, что для любого xeV и любого аеК
&(%х)=Х2&(х).	'	(14)
22.2	Предложение. Для любой квадратичной функции b существует единственный симметрический билинейный функционал I, удовлетворяющий условию (13).
Доказательство. Единственность вытекает из того, что в силу симметричности функционала § и условия (13)
Ь(х + у)=£(х + у, х + у)=*(х, x) + 2g(x, у)-Н(у, у), откуда
В(*. у)=у[Ь(х + у)—Ь(х)—6(y)J.	(15)
Для доказательства существования надо проверить, что задаваемый формулой (15) функционал является симметрическим, билинейным и удовлетворяет условию (13). Симметричность очевидна, условие (13) вытекает из условия (14) для А=2. Наконец, билинейность. Поскольку Ь является квадратичной функцией, существует билинейный функционал g1, удовлетворяющий условию (13). Следовательно,
1(Х. У)=4"[^ (х + У’ х + у)—ВЧх, х)—?(у, у)]=
= -^-[11(х, х) + £х(х, уНВЧу, х) + ^(у, у)—V(x, х)—
—?(у. У)]=4~ Кх(х, у) + ?(у, х)],
откуда и вытекает билинейность функционала Предложение доказано.
22.3.	Определение. Билинейный симметрический функционал определяемый квадратичной функцией b в предложении 22.2, называется функционалом, полярным к квадратичной функции Ь, и обозначается символом '
Предложение 22.2 позволяет дать другое определение квадратичной функции. А именно имеет место
22.4.	Предложение. Отображение b : У->К является квадратичной функцией тогда и только тогда, когда оно удовлетворя-
ли
ет условию (14), и функционал, определенный формулой (15), билинеен и симметричен.
Доказательство этого предложения фактически содержится в доказательстве предложения 22.2.
Итак, формулы (13) и (15) устанавливают взаимно однозначное соответствие между квадратичными функциями и симметрическими билинейными функционалами. Поэтому любое утверждение о квадратичных функциях можно переформулировать как утверждение о симметрических билинейных функционалах, и наоборот. В этой главе будем изучать квадратичные функции, предоставив читателю переформулировку получаемых утверждений на язык симметрических билинейных функционалов.
Матрицей Вь квадратичной функции b в базисе (e) = (eb ... ..., еп) называется матрица В%ь полярного к ней симметрического билинейного функционала рангом г(Ь) квадратичной функции называется ранг билинейного функционала Если
(16)
то для вектора x=X]ei+ ... + хпеп имеем согласно (6)
п
6(х)=Цх, х)= £ bijXtXj.	(17)
i,/=l
Выражение, стоящее в правой части формулы (17), называется квадратичной формой от переменных хь ..., хп и обозначается «символом Ь(х\, ..., хп). Квадратичная форма является однородным многочленом второй степени. Симметрическая матрица (16) называется матрицей квадратичной формы Ь(х\, ..., хп). Рангом квадратичной формы называется ранг ее матрицы.
• Формула (17) означает, что квадратичная функция во всяком базисе записывается в виде квадратичной формы, и при фиксированном базисе мы можем отождествлять квадратичные функции с квадратичными формами.
Учитывая симметричность матрицы квадратичной формы (bij=bji), равенство (17) можно переписать в виде
п
(18)
Равенство (7) для квадратичных функций принимает вид
6(х)=(х1т .... хп)Вь
х,
хп I
(19)
9 Зак. 283
245
При переходе от одного базиса к другому матрица квадратичной функции преобразуется по формуле, с точностью до обозначений совпадающей с формулой (8), т. е.
вН=с*в£е)с.
(20)
§ 23.	ПРИВЕДЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ К КАНОНИЧЕСКОМУ ВИДУ МЕТОДОМ ЛАГРАНЖА
Базис (е) = (еь	е„) пространства V называется каноничес-
ким для квадратичной функции b : V->K, если матрица функции b в этом базисе диагональна:
*1 о
0 \
Запись квадратичной функции b в каноническом базисе
6(x)=Vi + ... +%ПХ2
(21)
называется канонической формой или каноническим видом данной квадратичной функции.
Привести квадратичную форму Ь(х\, хп) к каноническому виду означает найти каноническую форму соответствующей квадратичной функции.
23.1.	Теорема. Для каждой квадратичной функции существует канонический базис.
Доказательство. Индукция по размерности п пространства V, на котором определена квадратичная функция Ь. При л=1 любой базис является каноническим. Предположим, что мы уже доказали теорему для всех квадратичных функций, определенных на пространствах размерности —1, и пусть dim V=n. Возьмем какой-нибудь базис еь ..., еп в пространстве V. Пусть квадратичная функция b записывается в этом базисе квадратичной формой (18).
I.	Предположим, что &ц#=0. Положим
*1'=х1 + -^^+ ... +^ХП.	(22)
Ьц	Ьц
Тогда равенство (18) принимает вид
fe(x)=Ai«)2+ £ Ь'ихм,	(23)
г,/=2 где
Ь'ц=Ьи-^И-.	(24)
"и
246
Положим теперь х2'=х2, ..., хп'=хп. Учитывая (22), получаем формулы перехода к новой системе координат
(25)
Формулы (25) определяют переход от базиса (е) к новому базису (е') = (е1'.е„'):
• , е„)—(еп • • • , еп)
1 — ^12 6ц
bn о
(26)
О
1
Векторы
/	/	Ь-t 2 I	*
ei = ex, е2= —т^_е1 + е2....еп
^1П A J-e
-—Cj + en 0ц
Ьц
образуют базис в пространстве V, поскольку матрица перехода в формуле (25) имеет отличный от нуля (равный 1) определитель.
Из (23) и (25) вытекает, что в базисе (е') квадратичная функция b записывается в виде
б(х)=би(%;)2+ 2 b'uxixr
<./=2
(27)
где Ьц' определены равенствами (24).
Положим ]Zi=Ls(e2/,	е/). Тогда правое слагаемое в фор-
муле (27) можно рассматривать как квадратичную форму, представляющую в базисе е2', ..., еп' квадратичную функцию на пространстве Vi:
М*) = 2 b4XiXi-
По предположению индукции в пространстве Vt существует базис е2", ..., еп", канонический для квадратичной функции bt. Пусть в этом базисе функция &i записывается в виде
ьЛх)=Ь22(х2у+...+Ь"т(х"пГ.
9»
247
Тогда векторы e/=ei, е2",	е/' образуют базис пространства
V, и квадратичная функция b записывается в этом базисе в виде
fe(x) = &n(Xi)2 + &22(4)2+ • • • +Ьпп(хп)2,
что и завершает доказательство теоремы в случае &ц¥=0.
II.	Рассмотрим теперь случай, когда &ц=0, но существует такое iQ, что Ьгог0=/=0. Этот случай сводится к уже рассмотренному, если мы изменим нумерацию векторов базиса (е), поставив вектор вг0 на первое место.
III.	Предположим теперь, что все диагональные элементы Ь„ равны нулю. Если и остальные коэффициенты Ьц равны нулю, то базис (е) (как и любой другой) является каноническим. Если же имеется отличный от нуля коэффициент Ьц, то без ограничения общности (меняя в случае надобности нумерацию векторов базиса) можно считать, что /?12#=0.
Сделаем преобразование
Xi=x'—х'2,
х2=х{ + х'2,
х3—	х3;
Хп =	Х'п.
Определитель матрицы этого преобразования
(28)
1 — 1 0 ... О
1	1	о	...	О
О 0 1 ... о
О О 0 ... 1
равен 2 и, следовательно, отличен от нуля (мы пользуемся тем, что характеристика поля К отлична от двух). Следовательно, формулы (28) задают переход к новым координатам х/, ..., х/, соответствующим новому базису
®2== в1 + е2, ^3 = 63,	, &п = £п.
В этом базисе квадратичная функция b записывается следующим образом (мы исходим из записи (18) с учетом того, что Ьй=0):
Ь(х)=2&12(х;)2-2&12(х;)2 +
“Ь 2 У Ъц (х1 х2) х. 2 у* b2i (Xj + х2) х. 4~ i ==3	i =-3
2 Ьцх.х.= bijXtXj,
3^i<j	i,/=l
248
В этой записи коэффициент &}/==2bi2 отличен от нуля, и этот случай, таким образом, сводится к уже рассмотренному. Теорема доказана.
23.2.	Замечание. Фактически мы не только доказали теорему о существовании канонического базиса для квадратичной функции, но и указали алгоритм, позволяющий произвольный базис пространства V перевести в канонический. Алгоритм этот предложен в XVIII веке великим французским математиком Лаг-ранжем. Поэтому описанный выше метод приведения квадратичной функции к каноническому виду называется методом Лагранжа. Метод Лагранжа фактически сводится к методу выделения полных квадратов, описанному в разделе I доказательства. Если же процесс выделения полных квадратов останавливается на некотором этапе (может быть, первом) ввиду отсутствия ненулевых коэффициентов на диагонали, то применяется вспомогательное преобразование вида (28), после которого вновь можно применить метод выделения полных квадратов.
23.3.	Замечание. Теорема 23.1, называемая теоремой Лагранжа, на языке квадратичных форм утверждает, что для любой квадратичной формы b(xlf ..., хп) существует невырожденное преобразование переменных, приводящее эту форму к каноническому виду
%1(х17+...+лп(х;)а. -
При этом преобразование переменных
Х1=спх;+ ... +clnx^f
%п— Сп + • • • А'сппхп
называется невырожденным, если определитель его матрицы отличен от нуля.
В таком виде теорема Лагранжа полностью относится к алгебре и применима к абстрактным квадратичным формам, возникающим в любых вопросах, в том числе и не связанных с геометрией квадратичных функций.
23.4.	Замечание. Из доказательства теоремы Лагранжа вытекает, что за исключением перестановок координат переход к каноническому виду осуществляется посредством композиции преобразований вида (25) и (28). Поэтому если коэффициенты квадратичной формы принадлежат полю Ко<=К, то ее можно привести к каноническому виду посредством преобразования переменных, коэффициенты которого также лежат в поле Ко.
В частности, если коэффициенты квадратичной формы рациональны (вещественны), то ее можно привести к каноническому виду посредством рационального (вещественного) преобразования.
24а
§ 24.	НОРМАЛЬНЫЙ ВИД КВАДРАТИЧНОЙ ФОРМЫ. ЗАКОН ИНЕРЦИИ
п.	1. Нормальный вид квадратичной функции. Пусть квадратичная функция b приведена к каноническому виду
&(x)=A,xx2-b... +MS-
Если г — ранг этой квадратичной функции, то среди коэффициентов %], ..., Хп имеется ровно г отличных от нуля. Без ограничения общности можно считать, что отличны от нуля первые г коэффициентов. Тогда
b(x)=X1xl+...+Krx*.	(29)
I.	Предположим, что функция b задана на комплексном пространстве V. Перейдем к новым координатам посредством преобразования с комплексными коэффициентами, полагая
yt="|/Хг xit если i sC г;
yi== xt, если i>r.
Тогда квадратичная функция b представляется в виде
b(x)=yl+...+fr	(30)
где уь ...» уг, Уг+\, уп — новые координаты вектора х. Выражение (30) называется нормальным видом квадратичной функции Ь в комплексном пространстве. Итак, нами доказано
24.1	Предложение. Всякая квадратичная функция в комплексном пространстве может быть приведена к нормальному виду (30).
24.2.	Определение. Две квадратичные формы называются эквивалентными, если они представляют одну и ту же квадратичную функцию в разных базисах.
Согласно (20) в пространстве V над полем К две квадратичные формы эквивалентны, если для их матриц и В2 существует такая невырожденная матрица С с элементами из К, что
в2=с*в1с.
Из предложения 24.1 вытекает
24.3.	Предложение. В комплексном пространстве две квадратичные формы эквивалентны тогда и только тогда, когда совпадают их ранги.
II.	Рассмотрим теперь случай вещественного пространства. Среди коэффициентов X/ в записи (29 ) могут быть как положительные, так и отрицательные. Предположим, что первые р ко
250
эффициентов >0, а остальные <0. Перейдем к новым координатам посредством вещественного преобразования
уг = У |XJ Xi, если
t)i— xh если i>r.
Тогда
b(x-)=yl+ .+y2p—y2P+i— — У2-	(31)
Выражение (31) называется нормальным видом квадратичной функции Ь в вещественном пространстве. Итак, нами доказано
24.4.	Предложение. Всякая квадратичная функция в вещественном пространстве может быть приведена к нормальному виду (31).
п. 2. Закон инерции. Базис (е) = (еь ..., е«) вещественного пространства V, в котором квадратичная функция b принимает нормальный вид (31), назовем нормальным (для этой функции). Число р положительных членов в формуле (31) и число q=r—р называются соответственно положительным и отрицательным индексом инерции квадратичной функции Ь, их разность о=р—q называется ее сигнатурой.
24.5.	Теорема. Положительный и отрицательный индексы инерции вещественной квадратичной функции и, следовательно, ее сигнатура не зависят от выбора нормального базиса.
Доказательство. Пусть в нормальных базисах (е) = = (ei, ..., еп) и (e') = (ei', ..., е/) квадратичная функция Ь принимает нормальный вид (31) и
Ь(х)=4+ ... +22_22+1_ ... _Z2	(32)
соответственно. Предположим, что p=/=s и, например, p>s. Рассмотрим подпространства М{ и Л12 пространства V, натянутые на векторы еь ..., ер и e's+i, ..., еп' соответственно. Тогда
dimA414-dimM2=p + (n—s)>n.
Следовательно, существует ненулевой вектор х^Л41ПЛ42- Пусть в базисах (е) и (е') вектор х имеет координаты
(t/1,  ,Ур, о.0) и (0, ... , 0, Zs+1, .... z„)
соответственно. Тогда из (31) и (32) вытекает, что
У\+ • • • +^=&(х)= -4н~. • • -4	(33)
Правая часть в равенстве (33) не превосходит нуля, а левая часть положительна, так как х=?^0. Это противоречие и доказывает теорему.
Из предложения 24.4 вытекает, что всякая вещественная квадратичная форма b(xi, ..., хп) приводится к нормальному виду (31). Число р из формулы (31) называется положительным ин-
251
дексом инерции этой квадратичной формы. Из теоремы 24.5 вытекает корректность этого определения. Аналогично определяются отрицательный индекс инерции и сигнатура квадратичной формы.
Из 24.4 и 24.5 вытекает
24.6.	Предложение. В вещественном пространстве две квадратичные формы эквивалентны тогда и только тогда, когда совпадают их ранги и индексы инерции.
§ 25.	ТЕОРЕМА ЯКОБИ О ПРИВЕДЕНИИ КВАДРАТИЧНОЙ ФОРМЫ К КАНОНИЧЕСКОМУ ВИДУ
Пусть А — квадратичная матрица порядка п и	Обо-
значим через Ak матрицу, получающуюся вычеркиванием из матрицы А последних п—k строк и п—k столбцов. Определитель матрицы Ak назовем угловым минором порядка k матрицы А.
Квадратную матрицу называем треугольной, если все ее элементы, расположенные ниже главной диагонали, равны нулю. Невырожденность треугольной матрицы равносильна тому, что все элементы, стоящие на главной диагонали, отличны от нуля.
25.1.	Предложение. Квадратная матрица С треугольна и невырожденна тогда и только тогда, когда она является матрицей перехода между базисами (е) = (еь ..., еп) и (ez) = (ejz, ..., е/), связанными соотношениями
Ls(eb ..., e^)=Ls(e/, ..., efe'), #=1, ..., п.	(34)
Доказательство. Пусть невырожденная матрица С=||с;/!| треугольна и (е) = (еь ..., еп) — базис. Определим систему векторов (e') = (ei', ..., е/), полагая
(е/, ..., е/) = (еь ..., е«)С.
Тогда в силу невырожденности С система (е') также будет базисом. Далее, для любого k
£k=C\k£\ + ... 4- Ckk^ky
следовательно, e/eLs(ej, ..., е^). Поэтому
Ls(e/, ..., e/)c=Ls(eb ..., е*),
откуда и вытекают равенства (34), так как размерности пространств Ls(e/, ..., е/) и Ls(eb ..., е*) совпадают.
Наоборот, пусть С является матрицей перехода между базисами (е) и (е'), связанными соотношениями (34). Тогда е/е eLs(eb ..., е*), т. е. вектор е/ является линейной комбинацией векторов еь ..., е*. Поэтому все координаты вектора е/ в базисе (е) с номерами >#4-1 равны нулю, что и означает треуголь-ность матрицы С. Предложение доказано.
25.2.	Предложение. Пусть треугольная матрица С является матрицей перехода от базиса (е) к базису (е'), и пусть 252
квадратичная функция b имеет в базисах (е) и (е') матрицы В и В' соответственно. Тогда для любого &=1, ..п
B'k=ClBkCh.	(35>
Доказательство. Согласно 25.1 базисы (е) и (eQ удовлетворяют'соотношениям (34). Обозначим через bk ограничение квадратичной функции b на подпространство V/e==Ls(ei, ...,	=
—Ls(e/, ..., е/) пространства V. Тогда ясно, что функция Ь* имеет в базисах еь ..., е* и е/, ..., е/ пространства Vk матрицы Bk и Bk' соответственно. Поэтому для завершения доказательства остается отметить тот очевидный факт, что Ck является матрицей перехода от системы еь ..., к системе е/, ..., е/.
Треугольную матрицу С назовем единично треугольной, если все стоящие на ее главной диагонали элементы равны единице. Преобразование переменных
*1
=С
У1
Уп
назовем единично треугольным, если матрица С единично треугольна.
25.3.	Теорема Якоби. Пусть Ь(хь ..., хп) — квадратичная форма ранга г, и пусть &h— угловой минор порядка k ее матрицы В. Тогда эту форму можно привести к каноническому виду
^1У12+ . . . ~\-КгУг2
единично треугольным преобразованием в том и только в том случае, когда
Д1=^0, ..., Аг¥=0.	(36>
При этом Xfe=AjAfe-i, где Ао=1.
Доказательство. Необходимость. Пусть существует такая единично треугольная матрица С, что
Тогда согласно (35) для всякого k^r имеем
—CkBhCki
253
откуда с учетом очевидного равенства det С’я>=1 получаем Xi • . .. • Х^=Д^.
Достаточность. Индукция по г. Если г=1 и &h=Ai#=0, то квадратичная форма уже имеет канонический вид
&(хЬ Хгг)==&11Х12.
Это вытекает из того, что у симметрической матрицы ранга 1 имеется единственный отличный от нуля элемент и он расположен на ее главной диагонали.
Сделаем теперь переход от г—1 к г. Имеем &ц=Д1^0. Совершим основное преобразование из доказательства теоремы Лагранжа
—	Х/,	I	(37)
............................I
Хп=	хп- ]
В новых координатах матрица нашей квадратичной формы принимает вид
Ьп 0	...	0^
0 &22 • • • &2п
0 ЬП2 . . . Ьпп
(38)
Поскольку преобразование (37) единично треугольно, из 25.2 вытекает, что угловой минор порядка k матрицы В1 равен Д*, k= = 1, ..., п. Тогда из (38) вытекает, что для k=2, ..., п
Д/г = Ь 116/г—1 = Д 16/г—1, где б£ — угловой минор порядка i матрицы
Ьч2 • • • &2n
Ьп2 • • • bnn
Следовательно,
6i¥=0, ..., бг-1#=0.
Таким образом, В' является матрицей квадратичной формы ..., Хп) ранга г—1, удовлетворяющей условию (36) тео-
254
ремы Якоби. По предположению индукции существует единично треугольное преобразование
(39)
приводящее квадратичную форму Ь'(х?', ..., хп') к каноническому виду
А,2у2+ . . . +Лгу2. .
Равенство У1=х/ дополняет преобразование (39) до единично треугольного преобразования
Уг
Уп
(40)
Тогда композиция преобразований (37) и (40) будет, очевидно, единично треугольным преобразованием, приводящим квадратичную форму b(xi, хп) к каноническому виду
bny2i + Ky22+   - +Ку2г-
Теорема доказана.
§ 26.	ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННЫЕ КВАДРАТИЧНЫЕ ФУНКЦИИ. КРИТЕРИЙ СИЛЬВЕСТРА. ОПРЕДЕЛИТЕЛЬ ГРАМА. НЕРАВЕНСТВО КОШИ—БУНЯКОВСКОГО
В этом параграфе основным полем будет поле R.
26.1.	Определение. Квадратичная функция b называется положительно определенной, если Ь(х)>6 для любого вектора х=/=0.
Симметрический билинейный функционал называется положительно определенным, если он полярен к положительно определенной квадратичной функции.
Квадратичная форма Ь(х\, ..., хп) называется положительно определенной, если она представляет в некотором базисе положительно определенную квадратичную функцию, т. е. если Ь(х\, ... ..., Хп) >0 как только (хь ..., хп) (0, ..., 0).
Симметрическая матрица В называется положительно определенной, если она является матрицей положительно определенной квадратичной функции (формы).
26.2.	Предложение. Квадратичная функция b положительно определена тогда и только тогда, когда ее ранг и сигнатура
255
равны, п, или, что то же самое, когда она имеет следующий нормальный вид
&(х)=Х124- . . . 4-Хп2,
т. е. в некотором базисе ее матрица единична.
Доказательство. Достаточность очевидна. Для проверки необходимости приведем функцию b к нормальному виду согласно 24.4. Предположив, что ее положительный индекс инерции р<п, получим Ь(х)^Т), для х=(0, ..., О, 1).
Из 26.2 и из закона (20) изменения матрицы квадратичной функции при изменении базиса вытекает
26.3.	Предложение. Матрица В положительно определена тогда и только тогда, когда существует такая невырожденная матрица С, что
В=С*С.	(41)
26.4.	Следствие. Если матрица В положительно определена, то detB>0.
26.5.	Теорема (критерий Сильвестра). Матрица В положительно определена тогда и только тогда, когда все ее угловые положительны.
Доказательство. Считаем, что В — матрица квадратичной функции b в базисе еь ..., еп. Обозначим через bk ограничение функции b на подпространство Vfe=Ls(e1, ..., efe) пространства V. Для положительно определенной функции b функция bk будет положительно определенной квадратичной функцией на пространстве Vk, a Bk будет матрицей этой функции в базисе еь ..., еь Тогда из 26.4 вытекает, что A^=detBfe>0 для всех k=\, ..., п.
Наоборот, пусть теперь все угловые миноры А^ положительны. Тогда по теореме Якоби квадратичная функция b приводится к следующему каноническому виду:
А0	^п-1
откуда согласно 26.2 вытекает ее положительная определенность. Теорема доказана.
Пусть b — квадратичная функция, и хь ..., xk — конечный набор векторов. Положим
ВДхр ... ,xft)=
£(хъ xj ... g(xH xft)
g(xft, Xj) . . . |(xft, Xft)
где | — билинейный симметрический функционал, полярный функции b (см. § 22). Матрицу Вб(Х]......xft) назовем матрицей
256
Грама системы векторов хь х* относительно квадратичной •функции Ь. В частности, для базиса (е) = (е1э е„) имеем
Вь(е1( ...;еп)^вГ.	....
Определитель матрицы Вь(хь xti) называется определителем Грама системы векторов хь xk относительно b и обозначается через G&(xi, х*) (или G(xb xk)):
4 G6(xb ..., XAi)=detВь(хь ..., xk).
26.6.	Предложение. При перестановке векторов определитель Грама не меняется, т. е. для любой подстановки о : {1, ... ...,	k}
. G(xh ..., x*)=G(xa(1), ..., xaW).	(42)
В самом деле, достаточно проверить это утверждение для транспозиции о, меняющей местами числа i и /. Но в этом случае матрица ВДх0(1),	хо(^))’ получается из матрицы Вь(хь ...
..., xk) посредством двух элементарных преобразований: перестановки f-й и /-й строки и перестановки f-ro и /-го столбцов, при каждом из которых определитель меняет знак.
26.7.	Теорема. Пусть Ь — положительно определенная квадратичная функция. Тогда
G(xb ..., х*)>0.
При этом
G(xb ..., xfe)=0
тогда и только тогда, когда векторы хь ..., xk линейно зависимы.
Доказательство. Предположим, что векторы Xi, ..., х* линейно независимы. Положим Al=Ls(x1, ..., xk) и b\=(b\M). Тогда В&(хь ..., xk) является матрицей положительно определенной квадратичной функции Ь{ на линейном пространстве М в базисе Xi, ..., xk. Тогда G (хь ..., xk) >0 согласно 26.4.
Пусть теперь векторы хь ..., xk линейно зависимы. Согласно 26.6 их можно менять местами, не меняя определителя Грама. Поэтому можно считать, что вектор xk линейно выражается через векторы X), ..., xk-\\
xft=a1x1+ .. . H-a/e-iX*-!.
Тогда в силу линейности полярного к функции b функционала g по второму аргументу имеем
257
fe-1
Kxj, x1)...g(x1, xfc_i), £ а^(хь xt)
1=1
Вь(хъ ... ,xft)=
k-1
|(xft> Xi) . .. g(xft, Xft-i), £ a£(xh, Xi) z l
т. e. последний столбец матрицы Грама является линейной комбинацией предыдущих столбцов с коэффициентами	, а*-ь
Отсюда G(xh ха>)=0. Теорема доказана.
Из 26.5 и 26.7 вытекает
26.8.	Следствие. Матрица Грама любой линейно независимой системы векторов относительно положительно определенной квадратичной функции положительно определена.
26.9.	Неравенство Коши—Б у н я к о в с к о г о. Если g — положительно определенный симметрический билинейный функционал, то для любых векторов х и у
—Уе(х, x)g(y, уХВ(х, у)<УВ(х, х)|(у, у).
При этом равенство
y)=Vl(x, x)g(y, у)
(43)
(44)
имеет место тогда и только тогда, когда векторы х иу неотрицательно пропорциональны.
Доказательство. Согласно 26.7 имеем
|(х, х)|(х, у)
1(у, х)В(у, у)
>0,
т. е. g(x, x)g(y, у)> [g(x, у)]2, что равносильно неравенствам (43).
Если же Цх, у)=У^(х, х)|(у, у), то G(x, у)=0. Следовательно, согласно 26.7 векторы х и у линейно зависимы. Предположим, что х=А0 и у=ах. Тогда
|(х, у)=а£(х, х),
а с другой стороны
x)g(y, у)=У«2£(х, x)g(x, х)=|а||(х, х).
Отсюда согласно (44) имеем а= | а |, т. е. cl>0.
Наконец, из у=ах, равенство (44) вытекает тривиальным образом.
Глава V
ЭВКЛИДОВЫ ПРОСТРАНСТВА
§ 27.	ЭВКЛИДОВЫ И НОРМИРОВАННЫЕ ПРОСТРАНСТВА
27.1.	Определение. Пусть V — вещественное линейное пространство. Положительно определенный симметрический билинейный функционал g : VX V->R называется скалярным произведением на пространстве V. Пространство V с заданным на нем скалярным произведением называется эвклидовым пространством.
Поскольку в эвклидовом пространстве скалярное произведение фиксировано, символ g скалярного произведения опускается, и скалярное произведение векторов х и у обозначается через (х, у).
Из определения скалярного произведения (х, у) вытекает, что оно обладает следующими свойствами:
1)	(х, х)>0, причем (х, х)=0 тогда и только тогда, когда х=0;
2)	(х, у) — (у, х);
3)	(х+у, z) = (х, z) + (y, z);
4)	(ах, у)=а(х, у).
27.2.	Примеры. 1. В (АГ, § 11) было введено скалярное произведение в Vect(n) на основании метрики, имеющейся на прямой, на плоскости и в пространстве.
2.	Надо иметь в виду, что стандартное (геометрическое) скалярное произведение не является единственным в пространствах Vect(n), так как, в частности, любой функционал, получающийся умножением скалярного произведения на положительное число, будет положительно определен.
3.	Если в конечномерном пространстве V фиксирован базис еь ..., е«, то скалярное произведение (х, у) будет задано, коль скоро мы определим его на векторах базиса. При этом числа (ег, е;) можно задавать произвольно под единственным условием,, чтобы матрица
(ei> ех) ... (е1( еп)
(®П> ®1) • • • (вп> ®п)
была симметрической и положительно определенной.
В частности, в качестве матрицы В можно взять единичную матрицу Е. Поэтому в R" скалярное произведение можно определить, например, следующим образом:
(х, y)=xiyt + ...+xnyn.	(1)
259
4.	В бесконечномерном пространстве С ([0, 1], R) скалярное произведение можно задать так:
(A = О
5.	Гильбертово пространство Z2. Элементами этого пространства являются бесконечные последовательности вещественных чисел
х=(хь . .., X/, ...),
удовлетворяющие условию
(2)
i=l
Сложение и умножение на числа в этом пространстве определяются покоординатно, т. е.
(хь ... ,ХЬ .. .)+(уи ... ,yh.. .)=(x1 + i/1.Х( + уь . . .),
a(xlt ... ,xit .. ,)=(ax1, ... , axit ...).
При этом надо проверить, что последовательность
(xi + г/ь ...,	+	...)
удовлетворяет условию (2). Для этого согласно
Ё 4 + Ё^ + 2Ё^-
i=l	г=1 i=l	i=l
достаточно показать, что ряд
ГXiyi
1=1
сходится абсолютно. Но скалярное произведение (1) в пространстве R" удовлетворяет неравенству Коши—Буняковского 26.9. -Следовательно,
п	п	Г п	/" п
(4)
i=l	i=l	i=l	z=l
Переходя в неравенстве (4) к пределу при л->оо, получаем
оо	Г оо	Г
г= 1	i=l	г=1
откуда в сила условия (2) и вытекает абсолютная сходимость ряда (3).
260
Итак, операции в множестве I? определены корректно. Ясно, что эти операции превращают множество /2 в вещественное линейное пространство. Скалярное произведение в /2 определяется следующим образом. Для векторов
х=(хь ... ,xh ...), y=(z/t.....yh ...)
полагаем
(х, у)=х1у1+ • • • +Х(У1+ ....	(5)
Число (х, у) определено корректно согласно абсолютной сходимости ряда (3). Симметричность и положительная определенность функционала (5) очевидны, его билинейность вытекает из свойств абсолютно сходящихся рядов.
Линейное пространство /2 со скалярным произведением (5) называется (сепарабельным) гильбертовым пространством.
27.3.	Определение. Нормой в линейном пространстве V называется отображение || • || : V—>R+, ставящее в соответствие всякому вектору xeV неотрицательное число ||х|| и удовлетворяющее аксиомам
1)	если ||х[|=0, то х=0;
2)	||ах||=|а| • ||х||;
3)	||х+у1К1|х|| + llyll.
Линейное пространство V с заданной на нем нормой || - Ц называется нормированным пространством.
27. 4. Примеры. 1. Естественная норма на R определяется следующим образом:
Цх|| = |х|.
2. Одним из обобщений предыдущего примера является сле-дующа норма на Rn:
II (Xi..хп) ||=max{|xi|, ..., |х„|}.
3. Норма из примера 2 обобщается до нормы на С([0, 1], R):
||f||=sup{|f(O| : /е=[0, 1]}.
Важный пример нормированного пространства дает
27.5. Предложение. Если V — эвклидово пространство, то равенство
||х||=У(х, х)	.	(£)
определяет норму на V.
Доказательство. Аксиомы 1) и 2) цормы вытекают из свойств 1) и 4) скалярного произведения. Проверим неравенство Цх+у1К1|х|| +llyll. Имеем ч
261
1|х + у112=(х + у» х+у)=(х, х) + 2(х, у) + (у, уХ
(в силу неравенства Коши—БуняковскогоХ (х, х) +
+ 2/(х, х)(у, у) + (у, y)=i|x||2 + 2 ||х|| • ||у|| + ||у||2=(1И1 + !|уПЛ
Норма (6) называется нормой, порожденной скалярным произведением. Если норма порождена скалярным произведением, то ее квадрат является (положительно определенной) квадратичной функцией. Поэтому согласно равенству (15) из § 22 формула
(х. У)=-у[1!х + у112-Цх||2-||у||2]	(7)
задает единственное скалярное произведение, порожденное нормой.
Итак, всякое эвклидово пространство является нормированным. Обратное не верно.
27.6. Предложение. Норма
11(хь x2)ll=max{|xi|, |х2|}	.(8)
на пространстве R2 не порождается никаким скалярным произведением.
Доказательство. Предположим, что норма (8) порождается некоторым скалярным произведением. Возьмем в R2 векторы
Х=(1, 0), у=(/2-1, 1), х + у=С/2, 1).
Тогда согласно (7)
(х, У)=-у [IIх + УН2—Цх||2—||у||2] =-у [2— 1 — 1 ]=0,
откуда (X, —у) = (—1) (х, у)=0. Но х—у=(2—У 2, 1), следовательно, ||х—у|| = 1. Поэтому	'
(х, — y)=-J- [||Х — у||2—||х||2—||у||2]=4- [1 1 —= —7-
Полученное противоречие завершает доказательство.
§ 28. ДЛИНЫ И УГЛЫ. ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ВЕКТОРОВ.
ПРОЦЕСС ОРТОГОНАЛИЗАЦИИ
В (АГ, § И) мы определили это скалярное произведение векторов в Vect(n), отправляясь от длины векторов и угла между ними. Теперь, имея аксиоматически заданное скалярное произведение (положительно определенный симметрический билинейный функционал), Можем определить длины векторов и углы между ними.
Итак, пусть V — эвклидово пространство и x^V. Число (х, х) называется скалярным квадратом вектора х. Оно равно 262
нулю только для нулевого вектора. Норма ||х||=У(х, х) вектора х называется его длиной и обозначается через |х|.
В этих обозначениях неравенство Коши—Буняковского принимает такой же вид
— |х|-|у|<(х, у)^|х| • |у|,	(9)
какой оно имело для геометрического скалярного произведения в Vect(n).	,
Из неравенств (9) вытекает, что для ненулевых векторов х и у
|Х| • |у|
Это позволяет определить угол (х, у) между ненулевыми векторами х и у по формуле
(х, y)=arccos—.
*	|х| • 1У1
Таким образом, для ненулевых векторов х и у определен угол между ними, принимающий значение от 0 до л. Из 26.9 (равенство (44)) вытекает, что угол этот равен нулю тогда и только тогда, когда векторы х и у пропорциональны с положительным коэффициентом пропорциональности.
Для скалярного произведения в произвольном эвклидовом пространстве имеет место формула
(х, У)=|х! Jyl cos(xTy),	\	(10)
по которой оно определялось в (АГ, § 11).
Векторы х и у называются ортогональными, если (х, у)=0. Для ненулевых векторов их ортогональность означает, что угол между ними прямой.
28.1.	Определение. Система ненулевых векторов называется ортогональной, если она состоит из попарно ортогональных векторов. Ортогональная система векторов называется ортонор-мированной, если она состоит из единичных векторов, т. е. векторов единичной длины.
Непосредственно из определения вытекает
28.2.	Предложение. Система векторов хь хт ортогональна (ортонормирована) тогда, когда матрица Грама этой системы В(хь хт) диагоналъна и невырожденна (единична).
Из 28.2 и 26.7 вытекает
28.3.	Предложение. Всякая ортогональная система векторов линейно независима.
Из 28.2 и 26.2 вытекает
28.4.	Предложение. Во всяком конечномерном эвклидовом пространстве существует ортонормированный базис.
263
Пусть (e) = (ei, en) — произвольный базис в эвклидовом пространстве V. Тогда для векторов
согласно формуле (6) из § 20 скалярное произведение этих векторов в координатах записывается в виде
п
У)=Х xty}(et, еД
(П)
а длина вектора — в виде
XiXj(eh
(12)
Числа (е,-, е/) называются метрическими коэффициентами базиса (е) и обозначаются иногда (при фиксированном базисе) через gn. В этих обозначениях равенства (11) и (12) распространяют на случай произвольного «-мерного эвклидова пространства приведенные в (АГ, § 12) соответствующие формулы для пространств Vect (2) и Vect(3).
Для ортонормированного базиса (е) формулы (11) и (12) принимают вид
(х, у)=х1у1+ ...+хпуп,
|х|=/х2+...+х2(
откуда вытекает формула cos(x, у)=—  ~L_ ‘ ХпУп.	.
...+х^Уу1+ ... +1у2п
(13)
(14)
(15)
Из формулы (13) вытекает
28.5.	Предложение. Координатами произвольного вектора х в ортонормированном базисе ei, ..., ея являются скалярные произведения (х, ei)..(х, е«), т. е.
х=(х, ei)ei+ ... + (х, еп)е„.
(16)
Это утверждение обобщает предложение 12.1 из первой части.
Напомним, что вещественная матрица С называется ортогональной, если
С*С=£.
28.6.	Предложение. Матрица С порядка п ортогональна тогда и только тогда, когда она является матрицей перехода от
264
одного ортонормированного базиса в п-мерном эвклидовом пространстве к другому ортонормированному базису.
Фактически это утверждение было доказано навди в (АГ, § 30). Но формально там мы имели дело с не более чем трехмерными эвклидовыми пространствами. Поэтому для строгого доказательства надо заметить, что согласно 28.2 равенство
£=С*£С
выражает закон изменения матрицы скалярного произведения при переходе от одного ортонормированного базиса к другому.
28.7.	Теорема. Пусть в эвклидовом пространстве V дана линейно независимая система векторов (x) = (xi...хг). Тогда
существует единственная такая ортогональная система векторов
=	..., ег), которая получается из системы (х) посредством
преобразования с единично треугольной матрицей С, т. е.
(еь ..., ег) = (хь ..., хг)С.
Доказательство. Индукция по г. При г=1 утверждение очевидно, поскольку необходимо ei=xb Предположим, что мы уже преобразовали единственным образом векторы хь ..., x*-i в ортогональную систему еь ..., е*_! посредством единично треугольного преобразования. Нам надо показать, что существует единственный вектор е*., перпендикулярный всем векторам еь ..., e*-i и имеющий вид
eft=ад + ... + afe-i xfe._i + xft.
Вектор eft—xfe принадлежит линейной оболочке Ls(xi.....xfe_i),
которая совпадает с Ls(ei, ..., efe-i) в сцлу треугольности преобразования, переводящего векторы хь .... xk-i в векторы еь ... ..., е^-ь Поэтому вектор е* можно искать в виде
efe=Piei+ ••• + ₽*—1 Cfe—i + xft.	(17)
Умножив равенство (17) на вектор е,-, i=l, ..., k—1, в силу ортогональности векторов еь ..., е*, получим
О=₽г(ег, e£) + (xft, ег),	(18)
откуда
Ь= —.	(19)
(еь ег)
Таким образом, числа 0;, а вместо с ними и вектор eft определяются однозначно. В то же время уравнение (18) эквивалентно тому, что вектор eft ортогонален вектору е,. Теорема доказана.
28.8.	Замечание. Процесс построения векторов еь ...» ег, при котором ei=xi, вектор е* имеет вид (17), где числа 0,- определяются из уравнения (19), называется процессом ортогонализации векторов Хь ..., хг. Процесс ортогонализации можно приме
10 Зак. 283
265
нять и к линейно зависимым системам векторов. Только в этом случае некоторые из векторов е*, определяемые уравнениями (17) и (19), будут нулевыми.
Теорема 28.7 позволяет усилить предложение 28.4.
28.9.	Теорема. В конечномерном эвклидовом пространстве любую ортогональную (ортонормированную) систему векторов можно дополнить до ортогонального (ортонормированного) базиса.
Доказательство. Пусть xj, ..., xm — такая система. Согласно 28.3 она линейно независима. Дополним ее до какого-нибудь базиса (х) = (хь ..., хт..хп). Подвергнув его процессу
ортогонализации, получим ортогональную систему векторов (е) = = (еь ..., еп), которая в силу своей ..инейной независимости будет базисом. При этом е,=х; для i^m. В самом деле, это вытекает как из самого алгоритма ортогонализации, так и из условия единственности в теореме 28.7.
Итак, для ортогональной системы утверждение доказано. Если же система хь ..., хт ортонормирована, то для того, чтобы из уже построенного ортогонального базиса (е) получить орто-нормированный, достаточно положить
е/=е,7|е;| для i=m+1, ..., п.
28.10.	Замечание. Теорему 28.9 нельзя распространить на бесконечномерные пространства. В самом деле, в гильбертовом пространстве /2 (пример 27.2.5) рассмотрим систему векторов (е) = (е,-, i=l, ..., п, ...), где вектор е,= (0, ..., 0,1, 0, ...) имеет единственную ненулевую координату 1 с номером I. Система (е) ортонормирована, а всякий вектор х, ортогональный всем векторам системы (е), равен нулю. Поэтому систему (е) нельзя расширить ни до какой отличной от нее ортогональной системы. В то же время система (е) не является базисом в /2, так как ее линейная оболочка состоит из векторов, лишь конечное число координат которых отлично от нуля, не исчерпывающих всего пространства /2.
§ 29.	ОРТОГОНАЛЬНОЕ ДОПОЛНЕНИЕ. ОБЩИЙ ВИД ЛИНЕЙНОГО ФУНКЦИОНАЛА В ЭВКЛИДОВОМ ПРОСТРАНСТВЕ
Пусть S — произврльное подмножество эвклидова пространства V. Положим
5-*-={хеУ: (х, у)=0 для всякого y&S}
и назовем множество S-1- ортогональным дополнением множества S в эвклидовом пространстве V.
Из линейности скалярного произведения по первому аргументу вытекает
266
29.1.	Предложение. Ортогональное дополнение S1- произвольного множества SczV является линейным подпространством пространства V. Кроме того,
(20)
29.2.	Предложение. Пусть в эвклидовом пространстве V дано конечномерное пространство М. Тогда
Доказательство. Возьмем в пространстве М ортонорми-рованный базис еь ..., ет и для произвольного вектора x^V положим
у=(х, eOei + ...Ч- (х, em)em	(21)
и z=x—у. Тогда z^M\ В самом деле, для этого достаточно проверить, что вектор z перпендикулярен произвольному базисному вектору е, пространства М. Но
(z, ег) = (х—у, ez) = (x, et) — (у, ez)=0,
поскольку числа (х, et) согласно (21) являются координатами вектора у в базисе еь ..., ет, а согласно 28.5 эти координаты равны (у, et).
Итак, вектор х представляется в виде суммы вектора у^М и вектора z^M-1-, т. е. V=M+M±. В то же время в силу положительной определенности скалярного произведения пересечение MQM1- содержит только нулевой вектор, что и завершает доказательство.
Из этого предложения и формулы (20) вытекает
29.3.	Следствие. Для конечномерного подпространства М эвклидова пространства V имеем
В самом деле, достаточно проверить включение zd. Пусть хе(7И±)±. Представим вектор х в виде x=y + z, где у^М, z^M2-. Вектор х перпендикулярен любому вектору из Л4-1-, в частности вектору z. Тогда
0= (х, z) = (у, z) + (z, z) = (z, z).
Итак, z=0, a x=y^M.
29.4.	Замечание. Для бесконечномерного подпространства М ни предложение 29.2, ни эквивалентное ему следствие 29.3, вообще говоря, места не имеют. В самом деле, возьмем рассмотренную в 28.10 систему (е) векторов гильбертова пространства и положим AI=Ls(e). Тогда ясно, что ортогональное дополнение ЛН содержит только нулевой вектор, в то время как пространство М не исчерпывает всего гильбертова пространства /г.
10*
267
Из предложения 29.2 вытекает
29.5.	Предложение. Если dim V=n, то для любого подпространства MczV
dim М±=п—dim M.
29.6.	Определение. Если пространство V представлено в виде
V=M®M\
то согласно 9.2.2 определено проектирование пространства V на подпространство М параллельно его ортогональному дополнению М-1-. Это линейное отображение (оператор) назовем ортогональным проектированием пространства V на подпространство М и обозначим рГлг1--	<
Пусть в эвклидовом пространстве V зафиксирован вектор а. Определим отображение ga : V->R, полагая
ga(x) = (x, а).	•	(22)
Из линейности скалярного произведения по первому аргументу вытекает, что ga будет линейным функционалом на пространстве V. Имеет место и обратное.
29.7.	Теорема. В конечномерном эвклидовом пространстве V для всякого линейного функционала g существует такой единственный вектор а, что g=ga. Более того, соответствие a—>-ga является изоморфизмом между линейным пространством V и сопряженным к нему пространством V*.
Доказательство. Для нулевого функционала g=co надо взять а=0. Пусть теперь g — ненулевой функционал. Тогда dimlmg=l и, следовательно, согласно 5.7
dim Ker g=dim V—1.
В силу 29.5 пространство (Kerg)-1- одномерно. Возьмем в нем какой-нибудь единичный вектор е.
Если g=ga, то вектор а перпендикулярен всякому вектору xeKer g, значит, вёктор а пропорционален вектору е. Пусть а=ае. Тогда
g(e) = (e, а) = (е, ае)=а(е, е)=а. 
Следовательно, a=g(e)e. Покажем, что вектор а — искомый. Пусть xs V — произвольный вектор. Он однозначно представляется в виде
«
x=y+z, где yeKer g, z=₽e.
Тогда
(х, а) = (у, а) + (z, а) = (ре, g(e)e)=pg(e),
268
а с другой стороны
g(x)=g(y) + g(Z)=g(₽e)=₽?(e).
Единственность вектора а фактически доказана при его построении, но она вытекает и из того, что для любого другого вектора а' имеем
(а—а', а—а'^О,
а это равносильно условию
(х, а)=^(х, а') для х=а—а'.
Из уже доказанного вытекает, что отображение а->|а является биекцией между V и V*. Из линейности скалярного произведения по второму аргументу вытекает линейность этого отображения. Теорема доказана.
§ 30.	линейные отображения эвклидовых пространств. ИЗОМОРФИЗМЫ. СОПРЯЖЕННЫЕ ОПЕРАТОРЫ
30.1.	Определение. Пусть V и W — эвклидовы пространства. Отображение ф :	называется изоморфизмом, эвклидо-
вых пространств, если оно является изоморфизмом линейных пространств и сохраняет скалярное произведение, т. е.
(х, у) = (<р(х), ф(у))	(23)
для любых векторов х, уеК
30.2.	Предложение. Для отображения ф: V-+W эвклидова пространства V на эвклидово пространство W следующие условия эквивалентны:
1)	<р — изоморфизм;
2)	отображение ф линейно и сохраняет длину векторов;
3)	отображение ф линейно и сохраняет скалярное произведение;
4)	отображение ф сохраняет скалярное произведение.
Доказательство. Импликация 1)=>2) тривиальна, поскольку сохранение длины векторов равносильно сохранению их скалярных квадратов. Проверим импликацию 2)=>3). Если ф сохраняет длину векторов, то (ф(г), ф(г)) = (г, z) для всякого zeK Следовательно,	(
(ф(х+у), ф(х+у)) = (х+у, х+у).
В силу линейности отображения ф это равенство равносильно равенству
(ф(х), ф(х)) + (ф(у), ф(у)) + 2(ф(х), ф(у)) =
= (х, х) +(У, у)+2(х, у);
откуда и вытекает равенство (23), так как ф сохраняет скалярные квадраты.
269
Импликация 3) =>4) тривиальна. Остается проверить, что из 4) вытекает 1). Сначала покажем, что отображение <р линейно, т. е. <р(ах+ру)=а<р(х) Ч-’Р<р(у). Положим
z=<p (ах+ Ру) — а<р (х) —рф (у).
Надо показать, что z=0, для чего достаточно проверить равенство (z, z)=0. Имеем
(z, г) = (ф(ах+ру), ф(ах + ру))+а2(ф(х), ф(х)) +
+ Р2(Ф(У). Ф(У))— 2а(ф(ах + ру), ф(х)) —
—2р(ф(ах+(ру), ф(у))+2ар(ф(х), ф(у)).
В этом равенстве символ отображения ф всюду можно убрать, поскольку оно сохраняет скалярное произведение. Затем, воспользовавшись билинейностью скалярного произведения и приведя подобные члены в правой части, получаем, что она равна нулю.
Осталось показать, что ф — мономорфизм, т. е. Кегф={0}. Пусть ф(х)=0. Тогда 0=(ф(х), ф(х)) = (х, х), откуда х=0. Предложение доказано.
30.3.	Предложение. Конечномерные эвклидовы пространства изоморфны тогда и только тогда, когда их размерности совпадают.
Доказательство. Надо проверить только достаточность условий. Пусть dim V=dim W=n. Возьмем в пространствах V и W ортонормированные базисы (е) = (еь ...; еп) и (e') = (ei', ... ..., ел') и определим линейное отображение ф : V-+W, полагая ф(е()=е,', i=l, ..., п. Остается согласно 30.2 проверить, что отображение ф сохраняет длину векторов. Вектор
x=Xiei + .. .+хпеп
посредством отображения ф переходит в вектор
Ф(х)=х1е1'+ ... + хпе'п.
Поскольку базисы (е) и (е') ортонормированы, длина каждого из этих векторов согласно (14) равна 1/х2+ ... +х2. Предложение доказано.
Из 28.5 вытекает
30.4.	Предложение. Для матрицы Лф=||й(;|| оператора ф в ортонормированном базисе еь ..., е„ имеем
ац=(е1, Ф(е/)).	(24)
30.5.	Определение. Операторы ф и ф, действующие в эвклидовом пространстве V, называются сопряженными, если
(х, ф(у)) = (ф(х), у)	(25)
для любых векторов х, уеК
270
30.6.	Предложение. Операторы ф и ф сопряжены тогда и только тогда, когда для любого (какого-нибудь) ортонор мированного базиса еь ..., е„
Д,= (Л#)*.
Доказательство. Пусть для ортонормированного базиса еь ..., ега
Лф=11ам11» А»=1|ву11-
Согласно 30.4 это означает, что
аи=(ег, ф(е>)), ^=(6,-, ф(е,)).
Поэтому равенство ац=а'ц равносильно условию сопряженности (25), выполненному для базисных векторов е, и е/. Но если условие сопряженности выполнено для базисных векторов, то оно выполнено и для любых векторов. Предложение доказано.
Из предложения 30.6 непосредственно вытекает
30.7.	Предложение. Для любого оператора ф, действующего в конечномерном эвклидовом пространстве, существует единственный сопряженный к нему оператор ф.
Этот оператор ф обозначается через ф*. Из предложения 30.6 вытекает равенство
(Ф*)*=Ф.	(26)
30.8.	Предложение. Если подпространство MczV инвариантно относительно оператора ф, то его ортогональное дополнение NE- инвариантно относительно сопряженного оператора ф*.
Доказательство. Надо показать, что для любого вектора уеЛ!1- вектор ф*(у) перпендикулярен любому вектору хеЛ1. Но (ф*(у), х) = (у, ф(х))=0,
поскольку ф(х)еЛГ.
Завершим этот параграф двумя простыми свойствами операции сопряжения, вытекающими из предложения 30.6 и свойств операции транспонирования матриц.
30.9.	Предложение. Для любых операторов ф, феОр(У) (фоф) *=ф*оф*а
30.10.	Предл о жени е. Для любого невырожденного оператора ф сопряженный оператор также невырожден и
(ф-1)*=(ф*)-1.
§ 31.	САМОСОПРЯЖЕННЫЕ ОПЕРАТОРЫ
31.1.	Определение. Оператор ф называется самосопряженным, если он сопряжен самому себе, т. е. ф=ф*, или
(х, ф(у)) = (ф(х), у).	(27)
271
Из предложения 30.6. непосредственно вытекает
31.2.	Предл о ж е н и е. Оператор ср самосопряжен тогда и только тогда, когда для любого (какого-нибудь) ортонор миро данного базиса (е) = (еь ..., ел)
<>=(4>r.
Непосредственно из определений вытекает
31.3.	Предложение. Ограничение самосопряженного оператора на инвариантное подпространство, является самосопряженным оператором.
Из предложения 30.8 вытекает
31.4.	Предложение. Если подпространство MczV инвариантно относительно самосопряженного оператора ср, то его ортогональное дополнение также инвариантно относительно ср.
31.5.	Предложение. Все корни характеристического многочлена /Ф(Х) самосопряженного оператора <р вещественны.
Доказательство. Предположим, что характеристический многочлен /ф(Х) имеет комплексный корень a + i0. Тогда согласно лемме 14.7 существуют такие линейно независимые векторы х, y^V, что
Ф(х)=ах—Ру, 1	28)
ф(у)—Рх + аУ- I
Согласно (27) имеем
(х. Ф(У))=Ф(*. х) + а(х, у),
II
(ф(х), у)—а(х, у)—Р(У, у).
Сравнивая правые части этих равенств, получаем
р[(х, х) + (у, у)]=0,
откуда р=0, поскольку х и у — ненулевые векторы. Это противоречие и доказывает наше утверждение.
31.6.	Теорема. Для любого самосопряженного оператора <р, действующего в конечномерном пространстве V, существует ор-тонормированный базис, в котором матрица ойератора <р диагонально.
Доказательство. Индукция по размерности п пространства V. Надо найти ортонормированный базис из собственных векторов. При п=1 утверждение очевидно. Предположим, что мы его доказали для всех самосопряженных операторов, действующих в пространствах размерности —1, и пусть dim V=n. Возьмем какой-нибудь корень Xi характеристического многочлена Д>(А.). Согласно 31.5 число %i вещественно, следовательно, оно является собственным значением оператора <р. Пусть ei — собственный. вектор, отвечающий собственному значению Разделив
272
в случае необходимости вектор ei на его длину, можно считать» что |ei| = l.
Подпространство Af=Ls(ei) является одномерным и инвариантным относительно оператора ср. Тогда согласно 29.5, 31.3 и 31.4 ортогональное дополнение М1- будет (и—1)-мерным подпространством, инвариантным относительно ф, а оператор
ф=(ф 1Л41): Л4Х -> ML
— самосопряженным. По предположению индукции в пространстве М1- существует ортонормированный базис е2, ..., е« из собственных векторов оператора ф. Добавляя к этому базису вектор еь получим ортонормированный базис пространства V, состоящий из собственных векторов оператора ср. Теорема доказана.
§ 32.	ИЗОМЕТРИЧЕСКИЕ ОПЕРАТОРЫ. ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА. КОРНИ ХАРАКТЕРИСТИЧЕСКОГО МНОГОЧЛЕНА
32.1.	Определение. Оператор ф : V->V называется изометрическим, если он сохраняет скалярные произведения.
32.2.	Предложение. Для отображения <р :	конечно-
мерного эвклидова пространства V эквивалентны следующие условия:
1)	Ф — изоморфизм эвклидова пространства V на себя;
2)	ф — оператор, сохраняющий длины векторов;
3)	ф — изометрический оператор;
4)	ф сохраняет скалярные произведения.
Доказательство почти дословно повторяет доказательство предложения 30.2. При этом учитывается, что для операторов, действующих в конечномерных пространствах, мономорфность эквивалентна эпиморфности (см. § 10).
32.3.	Предложение. Для оператора ф в конечномерном пространстве следующие условия эквивалентны:
1)	ф изометричен;
2)	ф переводит любой (какой-нибудь) ортонормированный базис в ортонормированный базис;
3)	матрица оператора ф в любом (каком-нибудь) ортонормированием базисе ортогональна;
4)	ф^^ф-1.
Доказательство. Импликация 1)=>2) тривиальна. Импликация 2)=>3) вытекает из 28.6. Импликация 3)=>4) вытекает из 30.6 и определения ортогональной матрицы. Проверим импликацию 4)=>1). Имеем ф(х), ф(у)) = (х, ф*ф(у)) = (х, ф“1ф(у)) = = (х, у). Таким образом, оператор ф сохраняет скалярные произведения. Предложение доказано.
Ограничение изометрического оператора ф на инвариантное подпространство, очевидно, является изометрическим оператором.
32.4.	Предложение. Если конечномерное подпространство
273
MeV инвариантно относительно изометрического оператора ф, то его ортогональное дополнение М1- также инвариантно относительно <р.
Доказательство. Пусть хеЛН. Надо показать, что (ф(х), у)=0 для любого вектора уеЛ4. Но согласно 32.2 оператор (<p|Af) эпиморфен. Следовательно, существует такой вектор zeA!, что <p(z)=y. Поэтому (ф(х), у) = (ф(х), <p(z)) = (x, z)=0. Предложение доказано.
32.5.	Предложение. Если Хо — корень характеристического многочлена изометрического оператора ф, то | Хо| = 1.
Доказательство. Утверждение очевидно для вещественного корня %о- Пусть теперь Л.о=а-Нр. Тогда согласно 14.7 существуют ненулевые векторы х и у, удовлетворяющие условиям (28). Следовательно,
(х, х) = (<р(х), <р(х))=а2(х, х)—2а₽(х, у) + Р2(у, у),
(У, у) = (ф(у), ф(у))~Р2(х> х) + 2ар(х, у)+.а2(у, у).
Складывая эти равенства, получаем
(х, х) + (у, у) = (а2+ р2) [ (х, х) + (у, у) ],
откуда а2+р2=1. Предложение доказано.
Для изометрических операторов лемма 14.7 допускает следующее уточнение.
32.6.	Предложение. Пусть а-Н‘Р, р¥=0, — корень характеристического многочлена изометрического оператора ф. Тогда существует такая пара единичных перпендикулярных векторов et и е2, что
Ф(е1)=ае1-Реа, j
Ф(е2)=ре1-|-аеа. J
Доказательство. Возьмем существующие по лемме 14.7 векторы х и у, удовлетворяющие условиям (28). Покажем сначала, что они перпендикулярны. Имеем
Ф (ах + ру)=аф (х) + Рф (у)=(согласно (28))=
=а (ах—Ру) 4- р (Рх + ау)—(а2 + Р2) х=(согласно 32.5) = х.
Таким образом,
ф(ах + ру)=х.
Поэтому
|ах + ₽У1 = |ф(ах + Ру)1 = |х| = |ф(х)1 = 1ах—Ру|,
274
т. е.
а2(х,х) + Р2(у, у) + 2оф(х, у)=а2(х, х) + р2(у, у)—2сф(х, у), откуда ар(х, у)=0. Если а=^0, то (х, у)=0. Предположим теперь,, что а=0. Тогда условия (28) превращаются в
<р(х)=—₽у, <р(у)=рх,
откуда
(х, у)=(ф(х), ф(у))=(—Ру, ₽Х)=— Р2(х, у).
Следовательно, и в этом случае (х, у)=0.
Теперь покажем, что |х| = |у|. Имеем (х, х)=(<р(х), <р(х))= =(ах—Ру, ах—Ру)=(в силу (х, у)=0)=а2(х, х)+Р2(у, у), откуда (1—а2)(х, х)=Р2(у, у) или Р2(х, х)=Р2(у, у). Значит, (х, х)=(у,;у). Для завершения доказательства остается положить
§ 33.	КАНОНИЧЕСКИЙ ВИД ИЗОМЕТРИЧЕСКОГО ОПЕРАТОРА
33.1.	Примеры. 1. В одномерном пространстве имеется ровно два изометрических оператора: тождественный и противоположный ему. Это вытекает из того, что в этом случае согласно 32.6 собственное значение оператора равно ±1.
2.	В двумерном пространстве пример изометрического оператора дает оператор поворота на угол t, т. е. оператор, который в некотором орто нормированном базисе имеет матрицу
cos t —sin t sin t cos t
(29>
Если для изометрического оператора <р в двумерном пространстве число а-Н’Р является комплексным корнем характеристического многочлена, то согласно 32.6 оператор ср необходимо является оператором поворота на угол для которого cos£=a, sin t=—р.
3.	В произвольном конечномерном пространстве всякий изометрический оператор разлагается в прямую сумму операторов, указанных в п. 1, 2 (теорема 33.2).
33.2.	Теорема. Для любого изометрического оператора ср в конечномерном пространстве V существует ортонормированный базис, в котором матрица оператора имеет следующий канонический вид:
275
1
cos tx— sin tr
sin tx cos
cos ts —sin ts sin ts cos ts
(30)
Доказательство. Индукция по размерности п пространства V. Для и=1 утверждение вытекает из 33.1.1. Пусть теперь п^2, и для всех изометрических операторов в пространствах размерности —1 теорема доказана. Возьмем какой-нибудь корень Xi характеристического многочлена оператора <р. Предположим сначала, что он комплексный: Л1=а+ф. Для этого корня согласно 32.6 существует ортонормированная система еь е2, удовлетворяющая условиям (281). Тогда подпространство М= =Ls(eb е2) инвариантно относительно оператора <р. Согласно 32.4 ортогональное' дополнение АР- также инвариантно относительно оператора <р. По предположению индукции в пространстве Л1х существует ортонормированный базис е3.....еп, в котором мат-
рица оператора (<р|ЛР-) имеет канонический вид (30).' Тогда базис еь е2, e3, ..., е„ (после перестановки в случае необходимости векторов в! и е2) и будет согласно 33.1.2 каноническим для опе-•ратора <р.
Если же %i — вещественный корень, то берем единичный вектор еь являющийся собственным вектором оператора <р с собственным значением полагаем Af=Ls(ei) и далее рассуждаем, как в уже рассмотренном случае. Теорема доказана.
33.3.	Замечания. 1. Итак, теорема 33.2 утверждает, что для изометрического оператора <р пространство V разлагается в прямую сумму попарно перпендикулярных одномерных и друмерных инвариантных подпространств. На этих двумерных подпространствах, изометричных обычной эвклидовой плоскости, оператор <р является оператором поворота на угол t, для которого cos<— —i sin t является корнем характеристического многочлена. Стоит отметить, что направление положительного вращения в плоскости определяется ее ориентацией. Поэтому если в ортонормирован-ном базисе (еь е2) оператор <р имеет матрицу (29), т. е. является оператором поворота на угол t, то в базисе (еь —е2) оператор <р будет осуществлять поворот на угол —t. Этим объясняется, почему при определении двумерного инвариантного подпространства достаточно ограничиться одним из двух комплексно-сопряженных корней характеристического многочлена.
276
2.	Хотя канонический базис изометрического оператора определен далеко неоднозначно, канонический вид (30) его матрицы определен однозначно с точностью до перестановки двумерных клеток и замены клеток вида
II а —Р II
|| Р а ||
на сопряженные клетки вида
I а Р I
I —₽ а Г
Это вытекает из того, что каждая одномерная клетка матрицы (30) определяет вещественный корень характеристического многочлена, а каждая двумерная клетка — пару комплексно-сопряженных его корней.
§ 34.	НЕОТРИЦАТЕЛЬНЫЕ ОПЕРАТОРЫ
34.1.	Определение. Самосопряженный оператор ф называется неотрицательным (положительным), если
(ф(х),х)^0	((<р(х), х)>0)
для всякого ненулевого вектора х^У.
Мы знаем (теорема 31.6), что для самосопряженного оператора ф существует ортонормированный базис, состоящий из собственных векторов. В таком базисе еь ..., еп (ф(ег)=%гег) для вектора
Х=Х1в1 + . . . + XnQn
имеем
(ф(х), х) =Х1х12Ч~.. . + %«хЛ
Поэтому имеет место
34.2.	Предложение. Самосопряженный оператор ф неотрицателен (положителен) тогда и только тогда, когда все корни его характеристического многочлена неотрицательны (положительны), или, что то же самое, когда Зрф состоит из неотрицательных (положительных) чисел.
Отсюда же вытекает
3.43.	Предложение. Положительность оператора ф складывается из его неотрицательности и невырожденности.
34.4.	Предложение. Если оператор ф положителен, то обратный оператор ф-1 также положителен.
Доказательство. Существование ф-1 вытекает из 34.3, его самосопряженность — из 30.10, положительность — из следующего очевидного утверждения.
277
34.5.	Предложение. Если Sp <p={Ai, ..., Xs} для невырожденного оператора ф, то
5рф~М1Аь ...» 1ДЛ
34.6.	Предложение (единственность неотрицательного корня). Для любого неотрицательного оператора ср существует единственный неотрицательный оператор ф, такой, что ф2=ф.
Доказательство. Существование. Берем существующий согласно 31.6 ортонормированный базис еь еЛ, состоящий из собственных векторов оператора ф с собственными значениями ..., Ли, и Полагаем ф(е,)=У%:е/. Единственность. Пусть ф2=ф и оператор ф неотрицателен. Берем ортонормированный базис (е) = (еь ..., е«), состоящий из собственных векторов оператора ф с неотрицательными собственными значениями ..., рп. Тогда ф(е/)=ф2(ех)=цх2е/. Таким образом, базис (е) состоит из собственных векторов ф, и если в нем оператор ф имеет матрицу
О
то оператор ф имеет матрицу
Предложение доказано.
34.7.	Предложение. Для любого (невырожденного) оператора ф операторы
фоф* U ф*°ф
неотрицательны (положительны).
Доказательство. Сначала проверим самосопряженность оператора ф==ф°ф*. Применяя предложение 30.9 и формулу (26), получаем
ф*= (фОф*) *— (ф*) *оф*=фоф*=ф.
Теперь — неотрицательность ф:
(л|)(х), х) = (ф (ф*(х)), х) = (ф*(х), ф*(х))>0.
Для оператора ф*°ф доказательство такое же.
34.8.	Пр едложение. Изометрический неотрицательный оператор ф является тождественным.
Доказательство. Имеем ф=ф*=ф-1 в силу 32.3. Следовательно, ф2=ф“1ф=8. Итак, квадрат неотрицательного оператора Ф равен тождественному. Отсюда ф=8 согласно 34.6.
278
§ 35.	РАЗЛОЖЕНИЕ ПРОИЗВОЛЬНОГО ОПЕРАТОРА
В КОМПОЗИЦИЮ НЕОТРИЦАТЕЛЬНОГО И ИЗОМЕТРИЧЕСКОГО
35.1.	Т е о р е м а. Любой оператор ср в конечномерном эвклидовом пространстве может быть представлен в виде композиции
4>=X°t	(31)'
неотрицательного оператора г|) и изометрического оператора %. При этом для невырожденного оператора такое представление единственно.
Доказательство. Рассмотрим сначала случай невырожденного оператора ф. Докажем единственность представления (31). Имеем
<р*оф= (гр*о%*) ° (х°гр) =ip° (х*°х) °гр= (согласно 32.3) =
=гро (х~ 1ох) °гр=гр2.
Таким образом, оператор гр согласно 34.6 определяется однозначно, как неотрицательный квадратный корень из оператора ф*оф. После этого необходимо х=Ф°Ф-1-
Теперь докажем существование представления (31) в общем случае. Оператор ф*°ф неотрицателен согласно 34.7. Поэтому из него можно извлечь неотрицательный корень гр (34.6). Остается построить изометрический оператор х-
Для самосопряженного оператора гр существует ортонормированный базис еь ..., е„ из собственных векторов (31.6). При этом можно считать, что векторы еь ..., ет отвечают ненулевым собственным значениям, а остальные — нулевым. Положим М= =Ls(eb ..., em). Тогда подпространство М и его ортогональное дополнение М1- инвариантны относительно оператора гр, оператор гр1=(гр|Л1) невырожден, а оператор гр2= (гр|7И±) нулевой.
Положим ф1=(ф|Л4). Отображение ф1 является линейным отображением пространства М на пространство ф(А1). Определим линейное отображение Х1:-М->ф(Л1), полагая Xi=(Pi Покажем, что отображение xi сохраняет скалярные произведения векторов х, уеМ
(Xi(x), Х1(у))=(ср(фр1(х)), <р (чр—1 (у)))=
=('1Г1(х), <p’<p(V(y)))=(V(x)’ 1^(К,(у)))=
=('ФГ1(х), Ч)(у))=(’1’(’Рг| (х)), у)=(х, у).
Таким образом, отображение xi является изоморфизмом между эвклидовыми пространствами М и ф(А1). В частности, векторы Xi(ei)> • Xi(е™) образуют ортонормированный базис пространства ф(Л1). Дополним его до ортонормированного базиса всего пространства V векторами е^+1, ..., е^. Теперь определим изометрический оператор %:V-+V так, чтобы он переводил ортонор-
279
мированный базис еь е„ в ортонормированный базис Xi(ei), • • • ,Xi(em), е'т+1, т. е. положим
. ч ( Х,(ег), если
Х(е*)—<	'	Z , 1
( ег, если i^m+1-
Так определенное отображение % на множестве М совпадает с отображением хь
Остается проверить равенство (31). Произвольный вектор хе eV представим в виде x=y+z, где уеМ, zeAP-. Тогда
Х'1>(х)=ХФ(у)+ХФ(2)=Х1Ф1 (у) + х(0)=Ф1 СФГ'Ч’!(у))=Ф (у)—Ф (х), поскольку ф (z) =0. В самом деле, (ф(г), ф(г)) = (г, ф*<р(г)) = = (z, t|)2(z)) = (z, 0)=0. Теорема доказана.
35.2.	Замечание. Любой.оператор ф можно представить и в виде композиции
<Р=Ф°Х
изометрического оператора % и неотрицательного г|э. Это вытекает из доказанной теоремы, если мы представим сопряженный оператор ф* в виде композиции (31).
§ 36.	КВАДРАТИЧНЫЕ ФУНКЦИИ В ЭВКЛИДОВЫХ
ПРОСТРАНСТВАХ
Пусть в линейном пространстве V фиксирован базис (е) — = (еь ..., еп). Тогда согласно § 10 отображение
ставящее в соответствие оператору феОр(У) его матрицу в базисе (е), является изоморфизмом между линейными пространствами Ор(У) и Мп.
С другой стороны (§ 20), отображение	ставящее в со-
ответствие билинейному функционалу geT2(V) его матрицу Вф в базисе (е), является изоморфизмом между линейными пространствами Т2(У) и Мп. Таким образом, при фиксированном базисе (е) отображение
ф->&,
ставящее в соответствие оператору ф билинейный функционал £Ф, имеющий в базисе (е) ту же матрицу, что и оператор <р, является изоморфизмом между пространствами Ор(У) и T2(V).
Но изоморфизм этот зависит от выбора базиса (е) и не является естественным, поскольку при переходе к другому базису
280
(е') посредством матрицы С матрицы операторов и матрицы функционалов изменяются, подчиняясь разным законам:
4е')=СЛ4<,е)С,	(32)
В^=С*В^С.	(33)
Если же V — эвклидово пространство, то изоморфизм Op(V)->T2(V) можно определить, не прибегая к базисам. Такой естественный изоморфизм определяется равенством
(ф(х), У)=|(х, у).	(34)
В самом деле, равенство (34) по оператору <р непосредственно определяет функционал С другой стороны, по функционалу g и вектору х равенство (34) однозначно определяет вектор <р(х) (например, через его координаты (<р(х), ez) в каком-нибудь ортонормированном базисе еь ..., еп).
Более того, если мы ограничимся рассмотрением лишь ортонор-мированных базисов, то законы (32) и (33) изменения матриц операторов и функционалов будут одинаковы. Таким образом, имеется полная параллель между теорией операторов и теорией билинейных функционалов в эвклидовом пространстве. Поэтому утверждения об операторах в эвклидовом пространстве можно переформулировать на языке билинейных функционалов, квадратичных функций и квадратичных форм.
Поскольку соответствие (34) переводит самосопряженные операторы в симметрические функционалы, из теоремы 31.6 о диаго-нализируемости самосопряженного оператора вытекает
36.1.	Теорема. Для каждой квадратичной функции Ь в эвклидовом пространстве существует ортонормированный базис, в котором она имеет канонический вид,
36.2.	Теорема. Любую вещественную квадратичную форму п
&(%!,...,хп)= £ Ьц Х( Xj можно ортогональным преобразованием i. /=1
переменных привести к каноническому виду
^1У12+ • • . +^пУп2.
При этом коэффициенты ..., являются корнями характеристического многочлена
det|B—Х£|=0
и, следовательно, определены однозначно с точностью до порядка,
В основной своей части теорема 36.2 непосредственно вытекает из теоремы 36.1, если мы отождествим квадратичную форму &(хь ..., Хп) с квадратичной функцией b на пространстве Rn со стандартным скалярным прозведением. Что касается коэффициентов %], ..., Кп9 то они образуют спектр самосопряженного опе
'	281
ратора <p:Rn-*R", матрицей которого в стандартном для R" базисе является матрица В нашей квадратичной формы.
36.3.	Теорема. Пусть даны две вещественные квадратичные формы а(х\, ..., хп) и b(xi, ..., Хп), первая из которых положительно определена. Тогда существует преобразование переменных, приводящее первую форму к нормальному, а вторую к каноническому виду.
Доказательство. Пусть А и В — матрицы наших квадратичных форм а и b соответственно. Согласно 26.2 форму а можно привести к нормальному виду. Это означает существование невырожденной матрицы С, такой, что
С*АС=Е.
Матрица С осуществляет преобразование переменных (хь ..., хп) и переменные (у1г ..., уп), в которых форма b записывается с помощью матрицы
В'=С*ВС.
Далее, согласно теореме 36.2 существует ортогональная матрица D, преобразующая переменные (t/i, ..., уп) в переменные (zh ... ..., zn), в которых форма b записывается с помощью диагональной матрицы
B"=D*B'D.
Преобразование переменных с матрицей CD и будет искомым. В самом деле, согласно (33) в переменных (гь ..., г#) форма а записывается с помощью матрицы
(CD) *ACD=D* (C*AC)D=D*ED=E,
поскольку матрица D ортогональна.
Глава VI
ТОЧЕЧНЫЕ ПРОСТРАНСТВА <
§ 37.	АФФИННЫЕ И ТОЧЕЧНО-ЭВКЛИДОВЫ ПРОСТРАНСТВА
37.1.	Определение. Аффинным (или точечно-аффинным) пространством над векторным пространством V называется множество S, элементы которого называются точками, вместе с отображением v:SxS^-lZ, удовлетворяющим следующим аксиомам:
1) (аксиома суммы) для любых точек Р\, Рг, P^S имеем
V(P1, P2)+tr(P2, P3)=V(P1, Рз);	(1)
2) (аксиома откладывания вектора) для любой точки PeS и для любого вектора хек существует единственная точка QeS, такая, что
v(P, Q)=x.	(2)
Таким образом, всякой паре точек Р, Q аффинного пространства S ставится в соответствие вектор v(P, Q), который мы, как
• ►
правило, обозначаем через PQ. При этом
рХ+рХ=рХ.	(Г)
Что касается аксиомы откладывания вектора, то ее можно трактовать как наличие отображения + :SxV->S, ставящего в соответствие точке Р и вектору х точку
Q=P+x.
Последнее равенство равносильно тому, что x=PQ. При этом аксиома суммы принимает вид
(Р+х)+у=Р+(х+у)	(3)
для любой точки PeS и любых векторов х, у eV.
В любом аффинном пространстве S имеют место следующие свойства:
PQ=0 тогда и только тогда, когда P=Q;	(4)
PQ=-QP.	_	(5)
В самом деле, РР=0, поскольку РР+РР—РР согласно аксио-
ме суммы. С другой стороны, если PQ=0, то PQ=PP и по аксиоме откладывания вектора P—Q. Наконец, из
0=PP=PQ+QP
вытекает равенство (5).
2ва
37.2. Примеры. 1. Прямая, плоскость и пространство являются аффинными пространствами над векторными пространствами Vect(l), Vect(2) и Vect(3) соответственно.
2. Всякое векторное пространство V превращается в аффинное пространство над самим собой, если мы определим отображение v.VxV^V следующим образом:
У)=У—х.	(6)
Зафиксируем некоторую точку O^S и назовем ее началом. Тогда каждой точке P^S можно поставить в соответствие вектор ОР, называемый радиусом-вектором точки Р относительно начала О. Равенство
ho(P)=OP
задает нам отображение	которое естественным образом
отождествляет аффинное пространство S с аффинным (в смысле 37.2.2) пространством V. Более точно, имеет место
37.3. Предложение. Отображение ho: V является биекцией, сохраняющей операцию v аффинного пространства, т. е.
v(P, Q)=v(h0(P), h0(Q)).	(7)
В самом деле, биективность отображения h0 непосредственно вытекает из аксиомы откладывания вектора. Что касается равенства (7), то. согласно'определению (6) оно эквивалентно вытекающему из аксиомы суммы равенства
PQ=OQ—ОР.	(8)
Таким образом, предложение 37.3 позволяет в основном свести изучение аффинных пространств к изучению векторных пространств. Единственное существенное отличие аффинных пространств от векторных состоит в том, что в векторном пространстве имеется единственное естественное начало — нулевой вектор, в то время как в аффинном пространстве в качестве начаЛа можно взять произвольную точку.
, 37.4. Определение. Пусть в аффинном пространстве S зафиксировано начало О, а в векторном пространстве V зафиксирован базис еь ..., еп. Тогда мы говорим, что в пространстве S задан репер Oei.. еп. Всякий репер Oei • • #п определяет систему координат Ох\...хп в пространстве S, т. е. отображение
сопоставляющее точке Р ее координаты (хь ..., хп), т. е. координаты ее радиуса-вектора ОР в базисе еь ..., еЛ.
284
Размерностью аффинного пространства S над векторным пространством V называется размерность пространства V:
dimS=dimV.
37.5.	Замечание. Из равенства (8) вытекает, что если точки Р и Q имеют координаты (%i.хп) и (г/ь ..., уп) соответст-
венно, то
RQ={yr~ xi, ..., уп—хп}.
37.6.	Предложение. Пусть в аффинном пространстве S даны две системы координат Ох}. ,.хп и О'х/.. .хп', соответствующие двум реперам Ов]... еп и О'е/... еп'. Пусть С — матрица перехода от базиса еь ..., е„ к базису е/, ..., е/, а (аь ..., ап) — координаты начала О' в системе координат Ох\ ...хп. Тогда переход от координат (xi, ..., хп) к координатам (х/, ..., хп') произвольной точки P^S осуществляется по формуле
Щ
&П
(9)
Доказательство этого предложения совпадает с доказательством соответствующего утверждения из первой части (см. § 23).
37.7.	Определение. Аффинное пространство S над эвклидовым векторным пространством V называется точечно-эвклидовым (или просто эвклидовым) пространством.
Система координат Охх...хп точечно-эвклидова, пространства V называется прямоугольной, если она соответствует ортонормиро-ванному реперу Oei...en, т. е. реперу, для которого базис еь ... ..., еп ортонормирован.
37.8.	Предложение. Всякое точечно-эвклидово пространство S превращается в метрическое пространство, если мы определим расстояние р(Р, Q) между точками Р и Q по формуле
р(Р, Q) = \PQ\.	(10)
В самом деле, длина вектора является его нормой (см. § 28), а из аксиом нормированного пространства (см. § 27) непосредственно вытекают аксиомы метрического пространства:
1.	(аксиома тождества) р(Р, Q)=0<=>P=Q;
2.	(аксиома симметричности) р(Р, Q)=p(Q, Р);
3.	(аксиома треугольника) р(Р, Q)+p(Q, R)>p(P, R).
Из формулы ((14), § 28) для длины вектора, заданного координатами в ортонормированном базисе, вытекает, что в прямоугольной системе координат расстояние между точками Р(хь ... ..., Хп) и Q (yi, ..., уп) определяется по формуле
Р(Р, Q)=V(x1-y1)2+ ... + (хп—уп)2.	(Н)
285
§ 38.	ПЛОСКОСТИ В АФФИННЫХ ПРОСТРАНСТВАХ.
РАЗЛИЧНЫЕ СПОСОБЫ ИХ ЗАДАНИЯ
38.1.	Определение. Пусть S — аффинное пространство над векторным пространством V, P^S — некоторая точка, VoczV — подпространство. Множество
п(Р0, V0)={PeS:P?eV0)	(12>
назовем плоскостью в пространстве S, проходящей через точку Ро и параллельной подпространству Vo.
38.2.	Предложение. Если Р^п(Ро, Vo), то
л (Pi, Уо)=л(Ро, Vo).	(13)
В самом деле, P0PxeV0 согласно (12). Поэтому равенство (13) вытекает из равенства
Предложение 38.2 можно переформулировать следующим образом: плоскость, параллельная подпространству Vo, однозначно определяется любой из своих точек.
Всякая плоскость в аффинном пространстве сама является аффинным пространством. Более точно, имеет место
38.3.	Предложение. Пусть S0=n(P0, Vo) — “плоскость в аффинном пространстве S. Тогда отображение Уо=(у|5ох5о) задает на этой плоскости структуру аффинного пространства над векторным пространством V0-
Доказате-льство. В проверке нуждается только равенство
v (So X So) = Vo.
Если PQeS0, то Р0Р, PaQ^V0. Поэтому v(P, Q)=PQ—P0Q— -Р/е Vo.
Йаоборот, для вектора хеУ0 и для точки Ро согласно аксиоме откладывания вектора существует такая точка Q, что P0Q=x. Тогда QeS0 согласно (12), откуда х=у(Р0, Q)ea(SoxSo). Предложение доказано.
38.4.	Определение. Если Vo — подпространство векторного пространства V, a xoeV — некоторый вектор, то множество
*o+Vo={*o+y:yeVo}
называется линейным многообразием пространства V, проходящим через вектор х0 и параллельным подпространству Vo.
286
Читателю предоставляется доказать
38.5.	Предложение. Если векторное пространство V рас-сматривать в качестве аффинного, то
Хо+Уо=л(Хо, Уо).
Таким образом, всякое утверждение о плоскостях можно сформулировать на языке линейных многообразий, и наоборот. Этим мы в дальнейшем воспользуемся.
38.6.	Определение. Размерностью плоскости п(Ро, Уо) называется размерность подпространства Уо:
dim л (Ро, Уо) =dim Уо.
38.7.	Примеры. 1. Нульмерные плоскости — это одноточечные множества.
2.	Одномерные плоскости называются прямыми.
3.	Плоскости размерности п—1 называются гиперплоскостями.
4.	Единственной n-мерной плоскостью в n-мерном аффинном пространстве S является само это пространство.
38.8.	Векторное уравнение плоскости (линейного многообразия). Возьмем в подпространстве базис ei°, ..., е*°. Тогда произвольный вектор х из линейного многообразия х0+ Уо имеет вид
x=x0-Hie10+... + ffte*0,	(14)
Это и есть векторное уравнение линейного многообразия.
Если e?=P0Pi, то для плоскости п(Р0, У о) уравнение (14) можно переписать в виде
Р==Р0 + 4РЛ + ... + 4ЛА.	(15)
Это уравнение называется векторным уравнением плоскости.
38.9.	Параметрические уравнения плоскости в координатах. Пусть Oxi...хп — система координат в пространстве S, соответствующая реперу Oei...en. Пусть векторы P0Pt из уравнения (15) имеют в базисе ei...en координаты (сц, ..., сП1), а точка Ро имеет координаты (Xi°, ..., хп°). Тогда координаты (хь хп) произвольной точки Р плоскости п(Ро, Уо) согласно (15) получаются из уравнений
Xi=Xi -f- ^Cu + . . . + tkClk,
(16)
Xn— X? +^1+ . . . +thcnk.
Эти уравнения называются параметрическими уравнениями плоскости в координатах.
38.10.	Плоскость как пространство решений системы неоднородных линейных уравнений. Из результатов § 8 вытекает, что всякое подпространство Уо арифметического n-мерного пространст-
287
ва Кл является пространством решений L(S) системы S однородных линейных уравнений с матрицей
• • • £1п
Сщ1 • • • ^тп
Пусть х0=(Х10, ...,хп°)еКп. Тогда плоскость л(х0, V0)czKn является пространством решений L(Si) системы 21 неоднородных линейных уравнений
fllXl + • • • + с1пхп = ^Ъ
• • • "bGnn-^n —
где bi^=cnXi° + .. .4-СгпСп0* Размерность плоскости л(х0, Vo) согласно § 8 равна п—г, где г — ранг матрицы С. В частности, гиперплоскость всегда можно задать одним уравнением
«1X1+ ... +«пхп==«.	(17)
38.11.	Аффинная оболочка множества в аффинном пространстве. Пусть XczS — подмножество аффинного пространства. Положим Z,(X)=Ls{PQ: Р, Q^X}. Тогда для Pq^X плоскость л(Ро, ЦХ)) содержит X. При этом для разных точек Ро, Р\^Х согласно 38.2 имеем л(Ро, А(Х))=л(Р1, L(X)). Следовательно, плоскость л(Р0, L(X)) не зависит от выбора точки 'Р^=Х. Эта плоскость обозначается л(Х) и называется аффинной оболочкой множества X в аффинном пространстве S.
§ 39.	ПЕРЕСЕЧЕНИЕ ПЛОСКОСТЕЙ. ИХ ВЗАИМНОЕ РАСПОЛОЖЕНИЕ
39.1.	Предложение. Плоскость л (Pi, Vi) лежит в плоскости л(Р2, V2) тогда и только тогда, когда PtP2^V2 и V1cV2.
Доказательство. Если \ л(Рь Vi)c^(P2, V2), то л(Р2, V2)=n(Pi, V2) согласно 38.2, откуда Р±Р2^У2. Кроме того, для любого вектора xeVi существует такая точка Qe ел(Рь Vi), что PiQ=x. Но (?^л(Р2, V2)=^(Pi, V2), следовательно, х= PiQ е V2.
Достаточность. Пусть Qen(Pb Vi). Это означает, что PXQ е Vx cz V2. Тогда P2Q=P2Pi + PiQ V2, следовательно, Q<= ел(Р2, V2).
39.2.	Следствий. Плоскости л (Pi, Vi) и л(Р2, V2) совпади-
288
ют тогда и только тогда, когда V1 = V2 и РгР2^ Vx.
39.3.	Предложение. Пусть плоскости ла=л(Ра, Va), аеЛ, имеют общую точку Р. Тогда их пересечение также является плоскостью. Более того,
П{ла:аеЛ}=л(Р, А{^а:аеЛ}).	(18)
Доказательство. Надо проверить равенство (18). Включение zz> вытекает из 39.1. Пусть теперь <2еП{ла:а&/1}. Поскольку ла=л(Р, Va), имеем PQeVa для всякого аеА Следовательно, PQ^A{Va:a^X}, откуда Qen(P) А{Уа:аеЛ}.
39.4.	Предложение. Аффинная оболочка л(X) множества XczS является наименьшей из плоскостей nczS, содержащих множество X, т. е.
л(Х)=А{л:Х<=л}.
Доказательство. Пусть Хс=л(Р0, Vo). Надо показать, что л(Х)с=л(Ро, Vo). Согласно 38.2 можно считать, что Р^Х. Следовательно, надо проверить включение L(X)xzzVo, для чего достаточно показать, что если Р, QeX, то PQeV0. Но Р, Q^n(P0, Vo), следовательно, P(JP, P0Qe Vo, а тогда PQ—PqQ—PQP^VQ. Предложение доказано.
В то время как непустое пересечение плоскостей всегда является плоскостью, объединение плоскостей почти никогда плоскостью не является.
39.5.	Задача. Доказать, что если объединение Л11)Я2 плоскостей Hi и л2 есть плоскость, то одна из этих плоскостей лежит в Другой.
39.6.	Определение. Непересекающиеся плоскости л(Рь Vi) И л (Р2, V2) называются параллельными (соответственно скрещивающимися), если одно из подпространств Vi и V2 лежит в другом (соответственно VinV2={0}).
Легко заметить, что если две плоскости одновременно и параллельны и скрещиваются, то одна из них есть точка.
39.7.	Предложение. Две гиперплоскости ла и ль, заданные уравнениями
П1Х14-... + anXn—aQ,
+... + bnXn=bQ,
соответственно параллельны тогда и только тогда, когда
а1 ___ Д2 __	 аП / Др
^1	^2	Ьп Ьц
289
Доказательство. Если плоскости ла и ль параллельны, то параллельные им (п—1)-мерные подпространства Уа и Уь совпадают. Но эти подпространства задаются однородными уравнениями
«1X1+ .. , + anxn=Ot
6i%i +. . .+ &пХп=0,
откуда вытекает, что
&1	ьп
В то же время
bn
поскольку в противном случае уравнения, задающие гиперплоскости ла и ль, были бы пропорциональны, а сами эти плоскости совпадали бы. Проверка достаточности условий предоставляется читателю.	1
39.8.	Лемма. Аффинная оболочка	объединения пло-
скостей rti=n(Pi, Уг), /=1, 2, параллельна подпространству
г0=мад, ^+У2}.
I
Доказательство. Произвольная точка ф.ел, имеет вид
Qi=Pi+yi, где
Поэтому
О.\О.2~Р1^*2 У2 У1-
Отсюда для Х=л111л2 имеем L(X)<z:V0. Наоборот, всякий вектор вида
РА + У, + Уг, где у; ей Vh
соединяет точку Pi—У1^Л1 с точкой Рг+Уг^лг- Следовательно, V0<=L(X).
39.9.	Предложение. Пусть в аффинном пространстве даны две плоскости m—n(Pt, Vi), t=l,2. Пусть
dimn,=m/, сПт(У1Г)У2)=£-
Тогда
а)	если ЛтПлг^И, то
dim л (л^лг) =mi + m2—k;
б)	если Л1Пл2=0, то
dim n(niUtt2)=Wi + m2—&+1.
290
С учетом леммы 39.8 и формулы dim(Vi + V2) =nil + m2—k (см. § 3) предложение 39.9 будет доказано, коль скоро мы докажем
39.10.	П р е дл о ж е н и е. Плоскости л (Л, Vj) « я(Р2, V2) пе-
ресекаются тогда и только тогда, когда РгР2 е + У2.
Доказательство. Пусть Qen (Р(, К), 1=1, 2. Тогда
vx+v2.
Наоборот, пусть Р^^. V1-j-V2, т.е.
Л^2=Ух + У2> где у4еУг.
Положим Qi=Pi—У1, Q2=^2+y2. Тогда
<2А=-РЛ + Уг—(—У1)=0.
Следовательно, Qi=Q2 будет общей точкой наших плоскостей. Предложения 39.10 и 39.9 доказаны.
Из предложения 39.9 непосредственно вытекает
39.11.	Следствие. Для любых двух прямых в аффинном пространстве существует содержащая их плоскость я размерности dimnc3.
39.12.	Определение. 1. Вектор х перпендикулярен плоскости л(Ро, Vo), если он перпендикулярен подпространству Vo, т. е. хеУох. 2. Вектор х параллелен плоскости я(Ро, 1/0), если хек0.
39.13.	Пр едложение. Для того чтобы вектор х с координатами %1, ..., хп был параллелен гиперплоскости л, заданной уравнением
ct\X\ +... + апхп=а,
необходимо и достаточно, чтобы
Xia1 + ...4-xna„=0.	(19)
В самом деле, если л=л(Ро, Vo), то согласно 38.10 равенство (19) описывает подпространство Vo через координаты его векторов.
39.14.	Пр едложение. Для того чтобы вектор у был перпендикулярен гиперплоскости л, заданной в прямоугольных координатах уравнением
+ ... + апхп—а, необходимо и достаточно, чтобы вектор у был пропорционален вектору е={аь ..., ап}.
Доказательство. Равенство (19) в прямоугольных координатах означает перпендикулярность вектора е любому вектору x^V0, где л=л(Р0, Vo). Следовательно, eeVo1 и, поскольку
291
dimVo±=l, вектор e образует базис в подпространстве КД откуда наше утверждение и вытекает.
39.15.	Определение. Перпендикуляром* опущенным из точки Р на плоскость л, называется вектор PQ* перпендикулярный плоскости л и кончающийся в этой плоскости (фел).
39.16.	Предложение. Из данной точки Р на данную плоскость л можно опустить единственный перпендикуляр.
Доказательство. Пусть л=л(Ро, К>). Тогда вектор PPq однозначно представляется в виде
РР0=х + у, где xeV0, yeVo".
Точка Q=P+x и будет единственным концом перпендикуляра. В самом деле, PP0=PQ + QP0, PQ=x, следовательно, QP0 = y и, значит, Q^jt.
39.17.	Определение. Расстоянием р(Р, л) от точки Р до плоскости л называется длина перпендикуляра PQ, опущенного из точки Р на плоскость л. Из теоремы Пифагора вытекает, что это расстояние является наименьшим расстоянием между точкой Р и какой-либо точкой Рел.
39.18.	Предложение. Пусть в точечно-эвклидовом пространстве S выбрана какая-нибудь прямоугольная система координат. Тогда расстояние от точки P(xiQ* ..., Хп°) до гиперплоскости л
аххх + .. . + апхп=а
определяется по формуле
р(Р, л)=
|ахх?	—«I
1^а1 +... +«„
(20)
Формула эта с учетом предложения 39.14 выводится так же, как в первой части мы выводили соответствующую формулу для прямой на плоскости и для плоскости в пространстве.
§ 40.	ВЫПУКЛЫЕ МНОЖЕСТВА В АФФИННЫХ ПРОСТРАНСТВАХ
40.1.	Линейные комбинации точек. При выборе начала О в аффинном пространстве S мы можем отождествить точки P^S с их радиусами-векторами OP^V. Поэтому наряду с линейными комбинациями векторов можно попробовать определить и линейные комбинации точек. Пусть Pi* ... * Pk^S, Xi, ..., Положим
+ • • • + О + Л1ОР1+ ... -]-KkOPk.	(21)
292
Чтобы определение (21) не зависело от выбора начала, надо* иметь равенство
О Ч- XjOPj	. -J"	=Ort -I- • • • Ч~ ^*kQfPk»
которое, очевидно, эквивалентно тому, что
0=0* -I- XjO'O Ч- • • • Ч-Х^О'О.
Следовательно, для корректности определения линейной комбинации точек (21) надо, чтобы
(Х^ 4“ ... Ч* Х&) 0’0-= О’О,
т. е. чтобы
Xi Ч-.. .4- Afe=l.	(22)
Таким образом, линейная комбинация точек (21) определена корректно, если выполнено условие (22). Такие линейные комбинации будем называть аффинными.
С аффинными комбинациями точек мы во многом можем поступать так же, как с линейными комбинациями векторов. Так, очевидно, что элементы аффинной комбинации можно менять местами. Их можно также группировать в следующем смысле:
КР1Ч- • • • Ч- ХтРтЧ-Xm+iPm-|-i Ч- - • • Ч~
=(^ч-.. • ч-м (• ЛЧ-... ч-—^—) рт+
\ "Г • • - -Г Л т	"г • • • ~i^tn -/
Ч*Хт-|-1Рт4-1 Ч~ • • • ч-wv
Более общим образом, имеет место
40.2.	Предложение. Пусть
Р<=£^, i=\,...,k.
/=1
Тогда
k	k m(i)
Е м>«=Е Е к^цРи-	(23)
г—1	i=l /=1
Это равенство доказывается непосредственной проверкой на основе определения. Аффинность правой комбинации вытекает из того, что двойная сумма совпадает с повторной:
k m(i)	k	tn(l)
E S ^U=E м E
1=1 /=1	i=l /=1
293
40.3.	Предложение. Аффинная оболочка множества X
совпадает с множеством всех аффинных комбинаций точек из X. Доказательство. Возьмем в качестве начала точку О<= еХ. Аффинная комбинация точек из X имеет вид
О +	+ • • • + КАРк.
Ясно, что эта точка принадлежит л(Х). Далее, векторы вида ОР, где Р<=Х, образуют полную в L(X) систему. Поэтому произвольная точка Qen(X) имеет вид
Q=O + X,oK+ •
Но здесь уже числа X» не удовлетворяют условию (22). Положим Хо==1—Xi—...—X*. Тогда
Q=XoO+XiPi +.. .-\-KkPk,
т. е. Q является аффинной комбинацией точек из X. Предложение доказано.
Из того, что аффинная оболочка множества, состоящего из двух различных точек, одномерна, вытекает
40.4.	Предложение. Через две точки в аффинном пространстве можно провести единственную прямую.
Из предложения 40.3 вытекает
40.5.	Предложение. Прямая, проходящая через точки Ро и Pi, описывается уравнением
P^tP0+(l—t)Pi, /е=К.	(24)
Теперь будем рассматривать вещественные аффинные пространства.
40.6.	Определение. Отрезком, соединяющим точки Ро и Pi, называется множество PqPi точек Р вида
Р=/Ро+(1—t)Pi,	(25)
Точки Ро=1 -Po+O-Pi и Pi=O-Po+l-P! принадлежат отрезку Р0Р\ и называются его концевыми точками (концами).
40.7.	Опр еделение. Аффинная комбинация точек
XiPi +.. .+Х*Рk
называется выпуклой, если все ее коэффициенты X/ неотрицательны.
Таким образом, отрезок можно определить как множество выпуклых комбинаций его концов.
40.8.	Определение. Множество XcS называется выпуклым, если цместе с любыми своими точками Р и Q множество X содержит и весь отрезок PQ.
40.9.	Примеры. 1. Выпуклым множеством является отрезок PqPi- В самом деле, пусть Р, Q^P0Pi. Это означает, что точки Р
294
и Q являются выпуклыми комбинациями точек PQ и Но тогда их выпуклая комбинация tP+(l—i)Q согласно 40.2 будет выпуклой комбинацией точек Ро и Pi, т. е. будет принадлежать отрезку Р0Рь
2.	Из предложения 40.3 непосредственно вытекает, что выпуклой является всякая плоскость, в частности точка и все пространство S.
3.	Выпуклым является всякий шар в точечно-эвклидовом пространстве. В самом деле, пусть |OP|<r, [OQ| с г. Тогда \ЮР+ + (i-t)OQ\^t\OP\ + (l-t) |OQ|<r.
Читателю предоставляется доказать
40.10.	Предложение. Пересечение П{Ха:аеД} любого семейства выпуклых множеств выпукло.
40.11.	Определение. Пересечение всех выпуклых множеств, содержащих данное множество X, называется его выпуклой оболочкой и обозначается через convX. Таким образом, convX — наименьшее выпуклое множество, содержащее множество X.
40.12.	Предложение. Выпуклая оболочка множествах совпадает с множеством С(Х) всех выпуклых комбинаций точек из X.
Доказательство. Заметим сначала, что множество С(Х~) выпукло и содержит X. В самом деле, для Р^Х имеем Р=1-А=С(Х). Если же Р, QeeC(X), т. е.
Р=Х1Р1 + . . . + kmPm,	Pi^Xt
+ • • • 4" l^nQn9	QjG-zX)
то m	n
/p+(i-oq=S ад+У a-орд-i=l	/=1
и эта комбинация точек Pi и Q/ выпукла.
Остается показать, что если УоХ — выпуклое множество, то УоС(Х). Включение
Л1-РI 4- . . .4-Х^Р/г^У
доказывается индукцией по k. При &=1 утверждение равносильно тому, что Хс=У. Индуктивный переход k—вытекает из равенства
1 + . . . + ^k-\Pk^\ + ^kPk =
=(1-Л)	• • • +^-Pk-l} +
\ 1 — Ль	1 — Ль /
и выпуклости множества У. Предложение доказано.
295
40.13.	Полупространство. Пусть в аффинном пространстве S гиперплоскость л задана уравнением
+ . . . + апХп=а
в некоторой аффинной системе координат. Тогда множества
3-={Р(хь ..., xn)^S:a1Xi + .. . + апхп—а<0}
и
3+=={Р(хь	х„)ЕЗ:ад + .. . + апхп—а>0}
выпуклы. Называются множества S- и S+ полупространствами, ограниченными гиперплоскостью л. Выпуклость множеств 3~ и 3+ доказывается так же, как в первой части доказывались аналогичные утверждения для полуплоскости и полупространства (АГ, § 15 и 18).
§ 41.	ТОЧКИ ОБЩЕГО ПОЛОЖЕНИЯ. СИМПЛЕКСЫ.
БАРИЦЕНТРИЧЕСКИЕ КООРДИНАТЫ
41.1.	Пусть S — л-мерное аффинное пространство и пусть
Из векторного уравнения (15) плоскости вытекает, что для произвольных &+1 точек Ро, Pi, . Pk^S существует содержащая их плоскость л размерности Если же наименьшая содержащая их плоскость имеет размерность k, то будем говорить, что точки Ро, Pi, ..., Pk находятся в общем положении Или являются точками общего положения.
Более общим образом, (конечное) множество XczS называется множеством точек общего положения, если никакие &+1 точек из X при не лежат в плоскости размерности <k—1.
41.2.	Примеры (в трехмерном пространстве). 1. Две точки находятся в общем положении, если они различны.
2.	Три точки находятся в общем положении, если они не лежат на одной прямой.
3.	Четыре точки находятся в общем положении, если они не лежат в одной плоскости.
41.3.	Предложение. Точки Ро, ..., Pk, лежащие в п-мерном аффинном пространстве, Аси, находятся в общем положении тог-
да и только тогда, когда векторы Р^Рц ..., Р0Р& линейно независимы.
Доказательство. Аффинная оболочка л точек Ро, ..., Pk орисывается уравнением
P = Po + ^iPo^>i+• • •+^PoPfe-	(15)
Следовательно,	тогда и только тогда, когда векторы
—~—>•	—
P0Plt ..., P0Pft линейно независимы. Отсюда с учетом того, что
296
аффинная оболочка л является наименьшей плоскостью, содержащей точки Ро, •••> Pfe (см. 39.4), наше утверждение и вытекает.
Следующее предложение вытекает как из 41.3, так и из определения общего положения.
41.4.	Предложение. Любая подсистема точек общего положения находится в общем положении.
Еще одним критерием общего положения является
41.5.	Предложение. Точки Рх.....Р*, лежащие в п-мер-
ном аффинном пространстве, k^n—1, находятся в общем положении тогда и только тогда, когда существует единственная содержащая их плоскость л размерности k—1.
Доказательство. Если точки Рь ..., Pk находятся в общем положении, то наименьшая содержащая их плоскость (аффинная оболочка) и будет единственной содержащей их плоскостью размерности k—1. Наоборот, если точки Рь ..., Pk не находятся в общем положении, то согласно 41.3 линейная оболочка
Vo векторов Р1Р2, .. •, Pfe-iPfe имеет размерность	—2. Возьмем
базис е>, ..., ет в подпространстве Vo и дополним его до базиса еь ..., ето, em+i, ..., еп всего пространства V. Тогда
Л1=я(Р1, Ps(et, ..., e^-i)),
л2=л(Рь Ls(ei..е*_2, е„))
будут двумя различными (k—1)-мерными плоскостями, содержащими точки Pi, • •., Р&. Предложение доказано.
41.6.	Определение. Пусть в вещественном n-мерном пространстве S даны точки Ро, ..., Pk, k^.n, находящиеся в общем положении. Их выпуклая оболочка conv{P0, .. ., Pk} обозначается через о(Р0, ..., Pk} и называется k-мерным симплексом пространства S с вершинами Ро, ..., Pk-
Для подмножества {i0, ..., tr}cz{0, ..., k} симплекс а(Р , . .. ..., Ptr) называется r-мерной гранью симплекса о(Ро, ..., Pk}. В частности, вершины симплекса — это его нульмерные грани.
41.7.	Пр и м е р ы. 1. Нульмерный симплекс — точка.
2.	Одномерный симплекс — отрезок.
3.	Двумерный симплекс — треугольник.
4.	Трехмерный симплекс — тетраэдр.
41.8.	Согласно 40.12 симплекс о(Р0, Pk} является множеством выпуклых линейных комбинаций
Р=%оРо+• • .+ ^fePfe-	(26)
При этом
p?=^pX+ ... +ЛЙРЛ.
Но согласно 41.3 векторы P0Plt ---, Р<>Рь линейно независимы.
1 i Зак. 283
297
Поэтому числа %ь определены однозначно, а поскольку
Хо—1—Zi— ... —
все числа Ло, %ь* ...» в равенстве (26) однозначно определены точкой Р. Эти числа называются барицентрическими координатами точки Р в симплексе о (/%, • • •, Pk).
Физический смысл барицентрических координат состоит в следующем. Если в точках Ро, •••» Pk поместить массы Хо, .ta, то центр масс этой системы будет находиться в точке Р симплекса о(Р0, Pk) с барицентрическими координатами (Хо, hk).
В качестве легкого упражнения читателю предоставляется доказать
41.9.	Предложение. Произвольная r-мерная грань o(PiQt ..., Pir) симплекса о=о(Р0, ..., Pk) состоит из всех точек Р, барицентрические координаты Хо, ..., которых в симплексе о удовлетворяют системе уравнений
Л/==0 для всех	, ir.
В частности, для вершины P-t имеем Хг=1, а все остальные барицентрические координаты равны нулю.
§ 42.	АФФИННЫЕ ОТОБРАЖЕНИЯ АФФИННЫХ ПРОСТРАНСТВ.
РАЗЛОЖЕНИЕ АФФИННОГО ОТОБРАЖЕНИЯ ТОЧЕЧНО-ЭВКЛИДОВА ПРОСТРАНСТВА В КОМПОЗИЦИЮ ИЗОМЕТРИЧЕСКОГО
И НЕОТРИЦАТЕЛЬНОГО САМОСОПРЯЖЕННОГО
42.1.	Определение. Пусть Vi, V2 — векторные пространства над полем К, a Sb S2 — аффинные пространства над векторными пространствами Vb V2 соответственно. Отображение f:S1-^-S2 называется аффинным, если существует такое линейное отображение
D(f)'.V^V2, что
(27)
для любых Р,
Отображение D(f), однозначно определяемое равенством (27), называется дифференциалом, или линейной частью аффинного отображения f.
42.2.	Примерами аффинных отображений являются аффинные преобразования, изученные в (АГ, гл. V).
Большой запас аффинных отображений доставляют нам линейные Отображения векторных пространств, рассматриваемых в качестве аффинных в смысле 37.2.2.
298
42.3.	Предложение. Пусть /‘.З^Зг и g:S2^>-S3 — аффинные отображения. Тогда их композиция g°f:S\-+S3 также является аффинным отображением. При этом
D(g°f)=D(g)°D(f).
Доказательство предоставляется читателю.
42.4.	Пр едложение. Если для аффинного отображения f:S^S2 существует обратное отображение f~l:S2-^Slf то оно также аффинно.
Доказательство. Определим сначала отображение «prV^Vi. Зафиксируем точку O'^S2 и положим
ф (у)=/“‘	где Р'=О' + у.
Теперь покажем, что (poD(f)=id. Пусть О=/-1(О'). Для вектора возьмем такую точку P^Sb что х=ОР. Тогда
<Р ° D (/) (х)=Ф (D (/) (ОР))=ф (/(0)/(Р))=
- Ф	(О')/’1 (/(Р5)=ОР=Х.
Из определения (27) отображения D(f) и из эпиморфности отображения f вытекает, что D(f) — эпиморфизм. Поэтому из равенства фо£> (/) =id следует, что отображение ф является обратным к отображению D(f). Будучи обратным к линейному отображению, отображение ф также линейно. Оно и является дифференциалом отображения f-1. В самом деле, для этого надо проверить условие (27). Пусть Р', Q'(=S2. Тогда
ф(^7)=ф(О70Г— О7Р;) = ф(О;0Г)_ ф(О7Р') =
=гЧоТгЛёэ - r4o')r4^=r1(^)r1(QT
Предложение доказано.
42.5.	Определение. Аффинное отображение f'.S1-^S2 называется изоморфизмом аффинных пространств, или аффинным изоморфизмом, если для него определено обратное отображение f-1. Таким образом, аффинный изоморфизм — это аффинное отображение /, являющееся биекцией. В этом случае согласно 42.4 обратное отображение f-1 также будет изоморфизмом.
Напомним (см. § 37), что при зафиксированном начале OeS равенство hQ(P)=OP задает отображение hQ:S-^V. Переформулировкой предложения 37.3 является
42.6.	Предложение. Отображение hQ:S-+V является аффинным изоморфизмом. Дифференциалом этого отображения служит тождественное отображение idy.
11*
299
42.7.	Следствие. Все п-мерные аффинные пространства, определенные над одним и тем же полем К, аффинно изоморфны между собой.
Пусть теперь в аффинном пространстве S задана аффинная система координат Ох\,..хп. определяемая репером Ое]...еп. Мы хотим найти запись аффинного отображения f :S-пространства S в себя в этих координатах.
42.8.	Предложение. Всякое аффинное отображение f:S-> записывается в координатах формулой
аг
Хп
Хп
(28)

где (хь ..., хп) — координаты произвольной точки P^S. (х/, ... ..., Хп) — координаты ее образа f (Р), (аь ..., ап) — координаты образа начала f(O) и А — матрица дифференциала D(f) в базисе еь ..., еп.
Наоборот, всякое отображение, задаваемое равенством (28), будет аффинным, а матрицей его дифференциала будет матрица А.
Доказ.ательство. Имеем
ОЦР)=оГ(б) + f(O)f (P)==Of(P) + D (/) (OP),
т. e.
Ofl^)=D(f)(dP)+Of(p),
а формула (28) является записью этого векторного равенства в координатах.
Наоборот, отображение f, задаваемое равенством (28), переводит начало координат О в точку /(О) с координатами (аь...,ап). Поэтому равенство (28) эквивалентно равенству
ОЦР)^(рР) + ОЦО),	(29)
где <р — линейное отображение, матрицей которого в базисе еь ..., еп является матрица А. Но из равенства (29) получаем
ф (OP)=dfip)-dHp)=f (О) f (Я
т. е. ф=Р (/). Предложение доказано.
Иногда равенство (28) будем записывать в более простой форме
х'=Лх-|-а.
300
42.9.	Предложение. Если аффинные отображения f:S-*S и g:S-*-S записываются в координатах формулами
х'=Лх+а и х'=Вх+Ь
соответственно, то их композиция g°f записывается формулой
х'=ВДх+(Ва+Ь).	(30)
В самом деле, если f(x)=x' и g’(x')=x", то
х"=Вх'+Ь.
Поэтому gf (х) =х"=Вх'+Ь=В (Лх+а) + Ь=ВЛх+Ва+Ь, что и требовалось доказать.
42.10.	Определение. Аффинное отображение f:S-*S точечно-эвклидова пространства называется изометрическим, если его дифференциал D(f) является изометрическим оператором векторного эвклидова пространства V.
42.11.	Предложение. Для аффинного отображения ?:$->-точечно-эвклидова пространства следующие условия эквивалентны-.
a)	f — изометрическое отображение;
б)	f сохраняет расстояние между точками;
в)	£>(/) имеет ортогональную матрицу в любом ортонормированием базисе.
Это утверждение вытекает из свойств изометрических операторов и из того, что сохранение расстояний между точками отображением f равносильно сохранению длин векторов его дифференциалом.
42.12.	О п р е д е л е н и е. Аффинное отображение f:S-точечно-эвклидова пространства называется неотрицательным самосопряженным, если оно имеет неподвижную точку, а его дифференциал является неотрицательным самосопряженным оператором. При этом точка РеЗ называется неподвижной точкой отображения f:S-+S, если f(P)—P.
Несложно убедиться в том, что неотрицательное самосопряженное отображение представляет собой композицию сжатий или растяжений вдоль осей некоторой прямоугольной системы координат с началом в неподвижной точке.
42.13.	Теорема. Всякое аффинное отображение	то-
чечно-эвклидова пространства разлагается в композицию
f=g°h
изометрического отображения h и неотрицательного самосопряженного отображения g.
Доказательство. В пространстве S зафиксируем некоторую прямоугольную систему координат 0*1... хп, соответствующую ортонормированному реперу Oej... е„. Пусть отображение f записывается в этой системе координат формулой
f(x)=Ax+a.	(31)
301
Дифференциал этого отображения согласно теореме 35.1 представляется в виде композиции изометрического и неотрицательного самосопряженного операторов. Это согласно 42.8 соответствует представлению матрицы А в виде произведения ВС ортогональной матрицы С и симметричной неотрицательной матрицы В. Отображение Л, задаваемое формулой
Л(х)=Сх + а,
будет изометрическим, поскольку матрица С его дифференциала ортогональна.
Самосопряженное неотрицательное отображение g ищем в виде
£(х)=Вх + Ь.	(32)
Согласно 42.9 имеем
f(x)=g-A(x)=BCx+ (Ва + Ь).
Поэтому в силу (31)
Ь=а—Ва.	(33)
Осталось показать, что отображение g имеет неподвижную точку. Имеем
g(а) = (согласно (32))=Ва + Ь= (согласно (33)) =
=Ва+ (а—Ва)=а.
Теорема доказана.
§ 43.	КЛАССИФИКАЦИЯ ДВИЖЕНИЙ ПРОСТРАНСТВА
Изометрические отображения называются еще движениями.
43.1.	Теорема. Для произвольного движения f трехмерного пространства существует прямоугольная система координат Ох[Х2х^ в которой движение f описывается одним из следующих способов'.
1)	параллельный перенос
х'=Вх + а;
302
3)	вращение вокруг некоторой оси с отражением относительно плоскости, перпендикулярной к оси вращения
— 1 О
О cos а —sin а
О sin а cos а
х2
х3
4)	отражение относительно плоскости с параллельным переносом вдоль этой плоскости
— 10 0
+
О 1 О
(Го 1
х3
а2
а3
Доказательство. В координатной записи
х'=Лх+а
аффинного отображения f матрица А есть матрица дифференциала отображения f, который в нашем случае является изометрическим оператором. Поэтому согласно теореме о каноническом виде изометрического оператора (§ 33) существует ортонормирован-ный базис еь е2, е3, в котором матрица А оператора D(f) имеет один из четырех указанных в формулировке теоремы 43.1 видов. Следовательно, остается выбором начала координат добиться того, чтобы столбец а свободных членов имел простейший вид.
Выберем начало О произвольным образом. Пусть ортонорми-рованному реперу Oeie2e3 соответствует прямоугольная система координат Оу1У2у3, в которой движение f записывается в виде
у'=Лу+а.
(34)
Перенесем теперь начало в точку 0°, радиус-вектор 00° которой равен у°. Пусть хь х2, х3 — новые координаты точек. Тогда х,= —yt—ур или yt=xi+yp. Поэтому равенство (34) перейдет в равенство
х'+у°=Л (х+у°)+а,
или
х'=Лх+ (Лу°—у°+а).
Наша задача — выбрать у0 так, чтобы выражение Лу°—у°+а приняло простейший вид, по возможности нулевой. Последнее достижимо, если разрешимо уравнение
(Л—£)у°=—а.
(35)
303
Разрешимость этого уравнения гарантируется обратимостью матрицы А—Е, а это равносильно тому, что единица не является характеристическим корнем матрицы А. Этому условию удовлетворяет третий случай
А =
—1	0	0
0	cosa	—sin a
0	sin a	cosa
В первом случае (А=Е) имеем А у0—у° + а=а, т. е. столбец а свободных членов не меняется при изменении начала координат.
Во втором и четвертом случаях система уравнений (35) принимает соответственно вид:
2)
0=—«1,
(cosa—1)у°—sina-z/®= —a2, sin a • y% + (cosa— 1) y° = — a3;
—2y°=—alr
0 =—
0 = — a3,
т. e. становится, вообще говоря, несовместной. Но разрешая систему 2) относительно неизвестных у2°, Уз°, а систему 4) относительно неизвестной yi0 и перенося начало координат в точки (0, у2°, Уз°) и (У1°, 0, 0) соответственно, мы получаем требуемую нам в случаях 2) и 4) запись отображения f. Теорема доказана.
Анализ доказательства теоремы 43.1 показывает, что в многомерном случае имеет место
43.2.	Теорема. Если единица является корнем кратности k характеристического многочлена дифференциала D(f) изометрического отображения	то в некоторой прямоугольной системе
координат О%1... хп отображение f записывается следующим образом:
304
где
О
cos о&!—sinat
sin аг cos
cosas—sinas
sinas cosas
§ 44.	ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА В ТРЕХМЕРНОМ ПРОСТРАНСТВЕ
В этом параграфе докажем теорему, сформулированную в АГ, § 49.
44.1.	Теорема. Для любой поверхности второго порядка существует прямоугольная система координат Oxyz, в которой уравнение этой поверхности имеет один из следующих видов:
1)	эллипсоид
у2	,,2	j>2
—+—+—=1;
а2	Ь2	с2
2)	мнимый эллипсоид
----|__Е---—1;
а2 />2 с2
3)	однополостный гиперболоид
х2 . у2___
а2 Ь2 с2 ’
4)	двуполостный гиперболоид у2	ц2
+ -----—= —1;
а2	Ь2	с2
5)	конус
Z2	И2	* 7^
—	-----—=0;
а2	Ь2	с2
6)	мнимый конус
305
7)	эллиптический параболоид
2^ + JL = 2z (p'q>0); р я
8)	гиперболический параболоид
у2	«»2
------±-=2г (р, q>0)-,
Р	я
9)	эллиптический цилиндр
х2 . У2
а* Ь*
10)	мнимый эллиптический цилиндр
у 2	«>2
а2	Ь2
И) гиперболический цилиндр
х2	t/2	_ р
а2	Ь2	~	9
12)	параболический цилиндр
У2=2рх\
13)	пара пересекающихся плоскостей
х2 У2 ^р.
а2	Ь2
14)	пара мнимых пересекающихся плоскостей
а2	№
15)	пара параллельных плоскостей
У2=а2-,
16)	пара мнимых параллельных плоскостей
у2+а2=0;
17)	пара совпадающих плоскостей
У2=0.
Доказательство. Без ограничения общности можно считать, что поверхность Ф задана в некоторой прямоугольной системе координат dixies своим общим уравнением
&(хь х2, x3)+2a(xj, х2, Хз)+ао=О>	(36)
306
3
где b(xlt х2, х3) =	Ьц-XiXj—квадратичная форма от переменных х1(
!,/=!
х2, х3, а(хг, х2, х3)=а1х1 + а2х2 + а3х3—линейная форма от переменных Xi, х2, х3. Согласно теореме 36.2 существует такое ортогональное преобразование переменных
хх
х2 х3
У1
У2
Уз
(37)

где в новых переменных у^ у2, уз квадратичная форма b имеет канонический вид
Равенство (37) осуществляет переход от прямоугольной системы координат 0{Х1Х2Хз к прямоугольной системе координат 0{уху2уз. В этой системе координат уравнение поверхности (36) имеет вид
+ ^2^2	+ 2ду/2 + 2су/3 + ао=О.	(38)
Случай I. Ранг формы b равен 3, т. е. ЛДг^з^О. В этом случае после параллельного переноса осей координат в новое начало по формулам
Zi=yi + ~, * =	2, 3,
Ai
получаем, что в новой прямоугольной системе координат Oz^Zs уравнение (38) примет вид
М + М + М + ^о=°-	(39>
Уравнение (39) пропорционально одному из канонических уравнений 1)—6) после необходимого переименования координат.
Случай II. Ранг формы b равен 2. Пусть, например, =/=0. В этом случае после параллельного переноса осей координат в новое начало по формулам
ai
^i==yi~\ 7 , Z=l, 2, Z^ = y^y Xi
получаем, что в новой прямоугольной системе координат O22iZ2z3 уравнение (38) примет вид
^1г1 + ^2Z2 + 2a3z3 + а'о=0.
(40)
Теперь если аз'=0, то система O2zlz2z3 и будет после переименования осей координат канонической, а уравнение (40) будет про
307
порционально одному из уравнений 9)—11), 13), 14). Если же йз'^О, то после замены
получаем новую прямоугольную систему координат Oziz2z3', в которой уравнение (40) после переименования координат и возможного изменения направления одной из осей координат на противоположное будет пропорционально одному из канонических уравнений 7), 8).
Случай III. Ранг формы b равен 1. Пусть, например, Х2=/=0.
В этом случае после замены
а2 z2=y2 + —-Л2
получаем, что в новой прямоугольной системе координат O2t/iZ2f/3 уравнение (38) примет вид
Х^ + За'^ + га'уз + а^О.	(41)
Если здесь 4г/=аз,=О, то уравнение (41) после переименования координат пропорционально одному из канонических уравнений 15)—17). Если же а1'2+яз'2>0, то, производя замену
( , , 1 , а\У1 + °з!/8 + ао
х=-----------7===—,
sgn %2 У а'2 + а'32
! У=^
V<ai2 + a32
получаем прямоугольную систему координат Oxyz, в которой уравнение (41) пропорционально каноническому уравнению (12). Теорема доказана.
Глава VII
ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ
§ 45.	ТЕНЗОРЫ. ЗАПИСЬ В КООРДИНАТАХ
45.1.	Определение. Пусть V — векторное пространство над полем К, V* — сопряженное к нему пространство. Тензором типа (р, q), где р, </>0, на пространстве V называется произвольное отображение
7’:VX...XVXV*X...XW-*K
произведения р экземпляров пространства V и q экземпляров пространства V*, которое полилинейно, т. е. линейно по каждому аргументу при фиксированных значениях остальных.
45.2.	Примеры. 1. Ковекторы (элементы пространства V*) являются тензорами типа (1, 0).
2.	Векторы (после отождествления их с элементами второго сопряженного пространства) можно рассматривать как тензоры типа (0, 1). При этом для вектора х и ковектора £ по определению
х(Ю=£(х).
3.	Билинейные функционалы |:VxV->K — тензоры типа (2, 0).
4.	Линейный оператор tp:V->-V можно отождествить с тензором Г, типа (1, 1), который определяется следующим образом:
Гф(х, £)=£(ф(х)).	(1)
/
45.3.	Тензорные обозначения. Векторы обозначаем латинскими буквами, индексированными снизу, ковекторы — греческими буквами, индексированными сверху. В то же время индексы координат векторов пишем вверху, а индексы координат ковекторов — внизу. Вместо записи
п
х=х1е1 +... +хпеп, или х=]£ х’ег, i=i
пишем
х=х*ег.
Аналогично ковектор £ в сопряженном базисе записывается так: £=^'.
Вообще тензорные обозначения предполагают, что если в каком-то выражении один и тот же индекс, например i, встречается и вверху и внизу, то по этому индексу идет суммирование. При этом
309
пределы суммирования не указываются, их, как правило, можно легко определить по самому виду выражения.
Далее, если наряду с базисом еь .еп мы рассматриваем другой базис, то в общих рассуждениях его удобнее обозначать, ставя штрихи не у букв, а у индексов:
еГ.. ., еп'.
Формулы разложения векторов ер, еп* по базису еь еЛ в тензорных обозначениях имеют вид
er=c*,ef.	(2)
При этом матрица С перехода от базиса еь еп к базису ер, ...» еП' записывается следующим образом:
с\' ...
... Сп'
45.4.	Предложение. Пусть (е) = (еь ..., еп) и (е')=(ег, ... ..., еП')— базисы пространства V, а (е) = (е1, ..., &п) и е') =(elz, ..., еп')— сопряженные им базисы пространства V*. Тогда если С — матрица перехода от базиса (е) к базису (е')> то матрицей перехода от базиса (s) к базису (s') будет матрица (С-1)*.
Доказательство. Найдем сначала, как преобразуются координаты ковекторов. Пусть
Согласно предложению 6.5 имеем
Ь =	?г=1(ег).
Тогда
&'=Цег) ==(согласно 2)=| (с* ,е0=Л (е.)=с? Л f.
Итак, координаты ковекторов преобразуются по тому же закону (2), по которому преобразуются базисные векторы, т. е.
(5г, .... В,,')=&,	1п)С
Из этого равенства получаем
gi
=(С-*г
Вп'
(3)
Но согласно (АГ, § 22) равенство (3) и означает, что матрица (С-1)* есть матрица перехода от базиса (е) к базису (е'). Предложение доказано.
310
45.5.	Замечание. В§7 мы обещали проиллюстрировать отсутствие «естественного» изоморфизма между пространствами V и V*. У нас нет точного определения «естественного» изоморфизма. Но одна из естественных попыток построения такого изоморфизма состоит в том, что при фиксированном базисе еь ..., еп в пространстве V вектору х=х£ег ставится в соответствие ковектор |=х1е1 + .. . + хпеп. Однако из предложения 45.4 вытекает, что такая конструкция зависит от выбора базиса и не является «естественной».
45.6.	Запись тензора в координатах. Пусть Т — тензор типа (р, q). Пусть векторы и ковекторы заданы в координатах:
x»=xkhe4’
V=^il, 1=1,..., q.
Тогда, пользуясь полилинейностью тензора 7, получаем
Т(Х1..... Хр, I1,¥)=
.... X%ip, .... фЛ)=
=х|‘ ... х^), ... ^Т(ег„ .... eip, гй, .... 8^).
Здесь в нижней строке записана (p + q) -кратная сумма, суммирование идет по переменным индексам каждый из которы