Text
                    М.М.Постников
АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ
М.: 1973 «НАУКА», Главная редакция физико-математической литературы
СОДЕРЖАНИЕ
Предисловие 7
Глава 1. Векторное исчисление 11
§ 1*. Понятие вектора 11
1. Предварительное определение вектора 11
2. Отношения эквивалентности 13
3. Окончательное определение вектора 15
4. Векторы на прямой, на плоскости и в пространстве 19
§ 2*. Векторы на прямой 21
1. Ориентации прямой 21
2. Длина и величина вектора на прямой 25
3. Отношение векторов на прямой 26
4. Сложение векторов на прямой. Лемма Шаля 29
5. Алгебраические свойства линейных операций 30
6. Теорема об изоморфизме 32
§ 3*. Линейные операции над векторами на плоскости и в пространстве 34
1. Определение линейных операций 34
2. Алгебраические свойства линейных операций 37
3. Линейная зависимость 38
4. Геометрический смысл линейной зависимости 42
5. Базисы и координаты 46
6. Проекции и координаты 50
7. Преобразование координат при замене базиса 54
Дополнение. Теорема о ранге матрицы 58
§ 4*. Ориентации прямой, плоскости и пространства 63
1. Понятие ориентации 63
2. Правые и левые ориентации 67
3. Произведения ориентации 68
4. Стороны прямой на плоскости и плоскости в пространстве 70
5. Деформации базисов и ориентации 73
6. Резюме 79
Дополнение. О понятии угла 80
§ 5*. Метрическая теория векторов 82
1. Длина вектора и угол между векторами 82
2. Скалярное произведение векторов 86
3. Применение скалярного умножения к доказательству 88
геометрических теорем
4. Выражение скалярного произведения в координатах 90
5. Ортонормированные базисы 94
6. Ортогональные матрицы 98
§ 6. Поливекторы 105


1. Бивекторы 105 2. Линейные операции над бивекторами 110 3. Линейная теория бивекторов 116 4. Метрическая теория бивекторов 121 5. Тривекторы 126 6. Векторное и смешанное произведения 133 § 7. Линейные операторы 135 1. Отображения и преобразования 135 2. Кольцо линейных операторов 138 3. Описание линейных операторов 140 4. Обратимые линейные операторы 145 5. Операторы, действующие по равенству координат 149 6. Обратимые линейные операторы и ориентации 151 7. Изометричные операторы 155 8. Свойства изометричных операторов 157 Глава 2. Метод координат 164 § 1*. Координаты на прямой, в плоскости и в пространстве 164 1. Аффинные координаты 164 2. Замена аффинных координат 169 3. Деление отрезка в данном отношении 172 4. Прямоугольные координаты 173 5. Полярные, сферические и цилиндрические координаты 175 6. Однородные координаты 177 § 2. Уравнения линий и поверхностей 184 1. Задание линий и поверхностей уравнениями 184 2. Алгебраические линии 187 3. Параметрические уравнения линий и поверхностей 191 § 3. Координатно-аксиоматическое построение геометрии 195 1. Основные положения аксиоматического метода 195 2. Аксиоматика евклидовой геометрии 198 3. Аксиоматика аффинной геометрии 208 4. Афинная геометрия над полем комплексных чисел 217 5. Вещественно-комплексная геометрия 221 Дополнение. Аксиоматика Гильберта 226 Глава 3. Линии и поверхности первого порядка 239 § 1*. Прямая на плоскости 239 1. Прямая как линия первого порядка 239 2. Параметрические и канонические уравнения прямой 242 3. Взаимное расположение прямых на плоскости 247 4. Полуплоскости, на которые прямая разбивает плоскость 251 5. Прямая на евклидовой плоскости 253 § 2*. Плоскость в пространстве 258 1. Плоскость как поверхность первого порядка 258 2. Параметрические уравнения плоскости 260
3. Взаимное расположение плоскостей в пространстве 263 4. Полупространства, на которые плоскость разбивает пространство 266 5. Плоскость в евклидовом пространстве 268 § 3*. Прямая в пространстве 271 1. Прямая в аффинном пространстве 271 2. Взаимное расположение прямых и плоскостей 275 3. Прямая в евклидовом пространстве 278 4. Расстояние между двумя прямыми в пространстве 282 Глава 4. Геометрия прямых, плоскостей и окружностей 290 § 1. Геометрия прямых на плоскости 290 1*. Пучки прямых 290 2. Расширенная плоскость 294 3. Полнота и непротиворечивость аксиом геометрии расширенной 298 плоскости 4. Координаты на расширенной плоскости 302 5. Проективная плоскость 307 6. Интерпретации проективной геометрии и их применения 316 7. Конфигурационная геометрия 322 Дополнение. Трилинейные координаты 326 § 2. Геометрия плоскостей в пространстве 331 1*. Пучки плоскостей 332 2*. Связки плоскостей 333 3. Расширенное пространство 337 4. Проективное пространство 341 Дополнение. О геометрии прямых в пространстве 346 § 3. Геометрия окружностей на плоскости 349 1. Степень точки относительно окружности 349 2. Связки окружностей 353 3. Пучки окружностей 362 4. Пучки как пересечения связок 370 5. Прямые как окружности 377 6. Окружности на вещественно-комплексной плоскости 386 Дополнение. Геометрии параболической и гиперболической связок 396 Глава 5. Элементарная теория линий и поверхностей второго порядка 398 § 1*. Линии второго порядка 398 1. Параболы 398 2. Эллипсы 401 3. Гиперболы 411 4. Уравнения эллипса, параболы и гиперболы в полярных 423 координатах § 2. Некоторые дополнительные свойства линий второго порядка 426 1. Эллипс, парабола и гипербола как конические сечения 426 2. Взаимное расположение конических сечений и прямых 430 3. Прямые, касающиеся конических сечений 436
4. Семейства софокусных эллипсов и гипербол 443 5. Диаметры конических сечений 447 6. Теоремы Аполлония 455 § 3*. Поверхности второго порядка 460 1. Эллипсоиды 460 2. Двуполостные гиперболоиды 463 3. Однополостные гиперболоиды 466 4. Прямолинейные образующие однополостного гиперболоида 469 5. Гиперболические параболоиды 480 6. Эллиптические параболоиды 488 7. Конусы второго порядка 490 8. Цилиндры второго порядка 496 Глава 6. Общая теория линий второго порядка 499 § 1*. Классификация линий второго порядка 499 1. Линии второго порядка на евклидовой плоскости 499 2. Инварианты уравнений линий второго порядка 509 3. Определение вида линии второго порядка по инвариантам ее 513 уравнения 4. Линии второго порядка на аффинной плоскости. Теорема 519 единственности 5. Центры линий второго порядка 527 6. Асимптоты и диаметры линий второго порядка 533 7. Приведение уравнений линий второго порядка к простейшему 540 виду 8. Главные направления и диаметры линий второго порядка 544 Дополнение. Классификация поверхностей второго порядка 548 § 2. Проективная теория линий второго порядка 554 1. Линии второго порядка на аффинно-проективной и проективной 554 плоскостях 2. Пересечение прямой и линии второго порядка 558 3. Поляры и полюсы 563 Дополнение. Поляры в пространстве 568 4. Теорема Безу 569 Дополнение. Дифференциально-геометрическое истолкование 577 кратности точки пересечения § 3. Геометрия линий второго порядка 579 1. Пучки линий второго порядка 579 2. Описание пучков линий второго порядка 583 Дополнение. Еще раз о пучках окружностей 593 3. Линии второго порядка, проходящие через пять точек 594 Дополнение. Поверхности второго порядка, проходящие через 596 девять точек 4. Теорема Штурма 598 5. Теорема Паскаля 601
6. Квадратичные пучки прямых 603 7. Фокусы линий второго порядка 612 Глава 7. Геометрические преобразования 617 § 1. Аффинные, проективные и ортогональные преобразования 617 1. Аффинные преобразования 617 2. Линейный оператор, индуцированный аффинным 621 преобразованием 3. Общий вид афинных преобразований 628 4. Проективные преобразования 633 5. Ортогональные преобразования 637 § 2. Разложение аффинных и ортогональных преобразований в 644 композицию более простых 1. Аффинные и ортогональные преобразования прямой 644 2. Разложение аффинных преобразований плоскости и пространства 647 3. Разложение ортогональных преобразований плоскости 652 4. Разложение ортогональных преобразований пространства 658 5. Представление движений пространства с помощью кватернионов 665 § 3. Конформные преобразования 677 1. Инверсия относительно окружности 677 2. Пополненная плоскость 679 3. Свойства конформных преобразований 686 4. Конформные преобразования и ориентации 694 5. Конформная геометрия 704 § 4. Группы и геометрии 707 1. Геометрии с данной группой автоморфизмов 707 2. Простейшие геометрии аффинного типа 711 3. Геометрии Галилея и Пуансо 718 4. Геометрия Минковского 727 5. Комплексная евклидова геометрия 734 6. Унитарная геометрия 738 7. Геометрия Пуанкаре — Лобачевского 740
ПРЕДИСЛОВИЕ Эта книга отличается от традиционных учебников аналити- аналитической геометрии по крайней мере в двух отношениях. Во-пер- Во-первых, в ней сделана попытка привести изложение аналитической геометрии на уровень строгости и формализации, давно уже достигнутый в учебниках алгебры и анализа. Во-вторых, поми- помимо общеобязательных, стандартных вещей, в ней изложено до- довольно много материала либо никогда ранее в учебники не включавшегося, либо давно из учебников исключенного. В современной математике проективная геометрия, на кото- которую, собственно говоря, и ориентирован традиционный курс аналитической геометрии, потеряла уже свое ведущее значение. Поэтому роль «научной базы» курса аналитической геометрии перешла к линейной алгебре. Это ведет к все более тесному слиянию курса аналитической геометрии с курсом линейной ал- алгебры, слиянию, получившему уже организационные формы (чи- (читаются «объединенные курсы аналитической геометрии и линей- линейной алгебры» и издаются соответствующие учебники). Тем самым курс аналитической геометрии как курс геометрии фак- фактически ликвидируется, в результате чего студент университета может получить диплом математика, не имея, по существу, ни- никакого представления о комплексе идей и методов классической геометрии плоскости и пространства. Для преодоления этого необходимо заново насытить собственно курс аналитической геометрии (первый семестр) живым и ярким геометрическим материалом, перенеся из него весь, какой только возможно, ли- линейно-алгебраический материал в последующий «объединенный курс аналитической геометрии и линейной алгебры». Конечно, курс аналитической геометрии должен быть в первую очередь по силам студенту — бывшему школьнику. Вместе с тем он дол- должен иметь общематематическое значение, развивать математи- математическую культуру студента и подготавливать его к усвоению про- программ следующих семестров. Как бы ни была красива и ин- интересна та или иная геометрическая конструкция, если с точки зрения современной математики она ведет в тупик и не находит в ней дальнейшего широкого развития, тратить на нее драгоцен- йое лекционное время, конечно, нельзя.
Окончательное решение вопроса о том, что именно должно быть v включено в программу, чрезвычайно ответственно и, по- видимому, может быть принято только апостериори на основе тщательного анализа нескольких лет экспериментального пре- преподавания по меняющимся программам. Основная цель, кото- которую ставил перед собой автор при написании этой книги, и со- состояла в том, чтобы обеспечить такого рода преподавание учеб- учебным пособием. На основе этой книги можно составить много разнообразных программ различной степени трудности и по- разному ориентированных. Таким образом, настоящая книга не является учебником аналитической геометрии, следующим той или иной определен- определенной программе. Ни при каких условиях все содержание этой книги не может быть включено в один лекционный курс: ее объем слишком велик, а содержание слишком разнообразно. Она не предназначена также ни для первоначального изучения аналитической геометрии, ни для самообразования. Наиболь- Наибольшую пользу от нее получит способный и любознательный сту- студент, уже прослушавший курс аналитической геометрии и же- желающий углубить и систематизировать свои знания (а не за- заинтересованный только в сдаче экзамена). Можно надеяться также, что ее с пользой и интересом прочтут многочисленные любители геометрии. Тем не менее, те отделы книги, в которых излагается стан- стандартный обязательный материал, вполне доступны и «среднему» студенту. Эти отделы (отмеченные в оглавлении звездочками) изложены по возможности элементарно и со всеми подробно- подробностями. Отделы, посвященные факультативным вопросам, напи- написаны более сжато и предъявляют к читателю большие (хотя и вполне посильные) требования. Наиболее важные абстрактные понятия вводятся в книге постепенно-, часто сначала без названия и только после того, как подробно и -с различных точек зрения рассмотрены соот- соответствующие конкретные примеры. Грамотное изложение аналитической геометрии нуждается в простейшем алгебраическом аппарате: теории определителей и правилах действия над матрицами. Предполагается, что эти вещи читателю знакомы (их изложение было бы напрасным дуб- дублированием курса алгебры). К концу книги постепенно исполь- используются основные понятия теории групп. Предварительного зна- знакомства с группами от читателя формально не предполагается, но, конечно, оно по меньшей мере очень желательно. (Заметим, что все, что нам нужно из теории групп, обычно с избытком изла- излагается на первом семестре университета в курсе алгебры.) Как уже было сказано, особое внимание в книге уделено по-, вышению уровня строгости и формализации. Конечно, начи- начинать курс, скажем, с аксиом, а теорию кривых второго порядка
с самого начала строить в комплексной плоскости было бы не- неуместно. Однако изложить в своем месте аксиоматику и дать четкое определение комплексной плоскости представляется не- необходимым. В книге используется мелкий шрифт двух видов: в элемен- элементарных (в основном начальных) главах книги один из них упо- употребляется для выделения более трудного материала, другой используется с вспомогательными целями (упражнения и т. п.). Текст сопровождается «заданиями» (предназначенными ис- исключительно для самоконтроля читателя) и более трудными «упражнениями» (решение которых не обязательно). Особенностью книги является экономное использование чер- чертежей: они помещены, как правило, только в наиболее трудных местах и в тексте книги на них ссылок нет. Предполагается, что все остальные чертежи читатель должен восстановить самостоя- самостоятельно (что, в частности, может служить хорошим средством самоконтроля). Порядок изложения в книге не следует лекционному. Многие вопросы целесообразно излагать на лекциях значительно рань- раньше, чем это сделано в книге (а другие, наоборот, несколько позже). Содержание книги ясно из оглавления. Обратим все же вни- внимание на § 6 гл. 1, посвященный бивекторам и тривекторам. Обычно эти понятия изучаются в завуалированной форме под видом векторного и смешанного произведений векторов, что, в частности, полностью смазывает их аффинный характер. Не- Необходимость в их явном введении уже давно назрела и сдела- сделалась настоятельной после того, как в «объединенном курсе» по- появились поливекторы. Без предварительного знакомства с би- бивекторами и тривекторами в трехмерном пространстве общее понятие поливектора вызывает, как правило, большие труд- трудности. История повторяется: теперешнее сопротивление введе- введению в курс аналитической геометрии бивекторов полностью ана- аналогично тому, как пятьдесят лет назад сопротивлялись введению понятия вектора. В пп. 4, 5 § 3 гл. 2 тщательно проанализировано понятие комплексной плоскости (в аффинном и евклидовом вариантах). Этот материал — один из важнейших в книге. В той или иной форме он обязательно должен быть включен в лекционный курс. Существенным новшеством является подробное рассмотре- рассмотрение в § 3 гл. 4 геометрии окружностей на плоскости (пучки и связки окружностей). Хотя сама эта геометрия может быть и не очень интересна, она служит хорошим примером для иллюстрации общего принципа изоморфизма (она изоморфна геометрии точек пространства, лежащих вне некоторого парабо- параболоида вращения), а также обладает известной поучительностью ввиду дальнейшего развития некоторых из ее идей в рамках алгебраической геометрии. 9
В теории кривых второго порядка на проективной плоскости (§§ 2, 3 гл. 6) новшеством является изложение теории пересече- пересечений и теории пучков кривых второго порядка. Элементы этих теорий входили обязательной составной частью в курсы анали- аналитической геометрии лет сорок назад. В связи с общим возрож- возрождением в последнее время интереса к алгебраической геометрии восстановление этого материала в курсе аналитической геомет- геометрии представляется оправданным. Теория поверхностей второго порядка ограничена в книге, по существу, только исследованием их формы. Из теории при- приведения уравнений поверхностей к каноническому виду приве- приведены без доказательств лишь формулировки теорем. Подробное изложение этой теории было бы излишним дублированием кур- курса линейной алгебры, в рамках которого этот материал изла- излагается сразу для пространств любой размерности. Рукопись книги была дважды внимательно прочитана И. М. Ягломом, сделавшим большое число замечаний и пред- предложившим еще большее число усовершенствований. Я приношу И. М. Яглому свою сердечную благодарность (хотя и не всегда следовал его советам). Я искренне благодарен также редактору этой книги Ф. И. Кизнер за большую работу, ею проделанную, а также за выполнение всех чертежей. М. М. Постников 27 октября 1972 г.
Глава 1 ВЕКТОРНОЕ ИСЧИСЛЕНИЕ § 1. ПОНЯТИЕ ВЕКТОРА В школьном курсе математики понятие вектора вводится наглядным, не строгим образом. В этом вводном параграфе мы обсудим «школьное» опре- определение вектора и попытаемся сделать его по возможности строгим. 1. Предварительное определение вектора Пусть А и В — две точки (пока различные). Эти точки оп- определяют отрезок вместе с направлением на нем (а именно, направлением от Л к В), т. е. направленный отрезок с началом А и концом В. Этот направленный отрезок мы будем обозначать символом АВ. Направленные отрезки называются также векторами. О век- векторе АВ говорят, что он отложен от точки А (или приложен к этой точке). Векторы АВ и А\В\ называются равными, если один из них может быть получен из другого параллельным переносом, т. е. движением, при котором вектор АВ перемещается параллельно самому себе так, что точка А движется по отрезку АА\, а точка В — по отрезку BBi. Эти определения вполне наглядны, но с логической точки зрения мало удовлетворительны, поскольку они используют по- понятие «движения», относящееся скорее к механике, чем к гео- геометрии. Конечно, это понятие можно определить и чисто гео- геометрически (что мы в дальнейшем и сделаем), но при этом ока- оказывается, что строгое определение «движения» основывается на понятии вектора. Поэтому желательно дать определение равен- равенства векторов, не использующее «механических» понятий. Имея это в виду, заметим, что если равные векторы АВ и AiBt расположены на различных прямых, то при описанном вы- 11
ше движении вектор АВ заметает параллелограмм ABAiBi, в котором векторы АВ и AiBi являются противоположными сто- сторонами. Таким образом, векторы АВ и AiBu не лежащие на од- одной прямой, равны, если четырехугольник АВА^В^ является па- параллелограммом. Это определение уже вполне удовлетворительно, но, к со- сожалению, оно неприменимо к векторам, лежащим на одной пря- прямой. Поэтому равенство таких векторов нуждается в отдельном описании. Такое описание легко дать: например, векторы, лежащие на одной прямой, равны, если их длины одинаковы и они направ- направлены в одну сторону. Однако тогда мы получим, что равенство векторов будет по-разному определяться в случае, когда эти векторы лежат на разных прямых, и в случае, когда они лежат на одной и той же прямой. Это не очень удобно, потому что из-за этого во всех доказательствах придется рассматривать много частных случаев в зависимости от возможного располо- расположения соответствующих векторов. Поэтому хотелось бы иметь одно общее определение, пригодное во всех случаях взаимного расположения данных векторов. Чтобы дать такое определение, заметим, что четырехуголь- четырехугольник тогда и только тогда является параллелограммом, когда его диагонали делятся в их точке пересечения пополам. Сле- Следовательно, векторы АВ и А\Ви расположенные на различ- различных прямых, тогда и только тогда равны, когда середины отрезков ABi и А^В совпадают. С другой стороны, ясно, что это верно и для векторов, расположенных на одной прямой (при А = В\ серединой «отрезка» АВ\, по определению, счи- считается точка Л). Тем самым мы приходим к следующему опре- определению: Определение 1. Векторы АВ и AiBi называются равными, если середины отрезков ABi и А\В совпадают. В дальнейшем именно это определение равенства векторов мы будем рассматривать как основное. Замечание 1. Выше мы исключили из рассмотрения случай, когда А = В. В этом случае, мы, собственно говоря, уже не можем говорить об отрезке АВ. Однако, чтобы не допускать ис- исключений (что в математике всегда плохо), мы условимся гово- говорить, что при А = В мы имеем дело с вырожденным направ- направленным отрезком АА. Все вырожденные направленные отрезки (приложенные в различных точках) равны. Действительно, при А = В и Ai = Bi отрезки ABi и AtB совпадают, а потому и сов- совпадают их середины. Заметим еще, что никакой невырожденный направленный отрезок АВ не может быть равен вырожденному 12
отрезку СС, поскольку середины отрезков АС и ВС, где А и В различны, совпадать не могут. Вырожденный направленный отрезок называется также ну- нулевым вектором и обозначается символом 0. 2. Отношения эквивалентности Обратим внимание на то, что равенство векторов мы ввели специальным определением. Этим равенство векторов в прин- принципе отличается от «равенства в смысле тождественного совпа- совпадения», в специальном определении не нуждающегося. Чтобы иметь возможность обсудить возникающую здесь си- ситуацию, мы напомним в этом пункте основные общематемати- общематематические (логические) определения, связанные с различными ви- видами «равенств», рассматриваемыми в математике. При этом термин «равенство» мы будем пока понимать лишь в смысле тождественного совпадения. Общее понятие равенства тесно связано с понятием «свойства» Что та- такое «свойство», столь же трудно определить, как и что такое «множество». Проще всего считать его одним из основных, не определяемых, понятий ма- математики. Однако с некоторой точки зрения его все же можно свести к по- понятию множества (или, точнее, подмножества). Пусть X—произвольное множество и пусть 9* — некоторое свойство его элементов. Тогда в множестве X определено подмножество Хд>, состоящее из всех элементов этого множества, обладающих свойством 9*. Два свойства 0* и Q называются равнообъемными, если Хд, = Xq, т. е. если элемент мно- множества X тогда и только тогда обладает свойством 9*, когда он обладает свойством Q. Для всех практических целей равнообъемные свойства можно не различать. Поэтому в математике принято считать их совпадающими (тождественными). В силу этого соглашения, свойства элементов множе- множества X находятся в естественном биективном ') соответствии с его подмно- подмножествами (именно, свойству 9> соответствует подмножество Хд,, а подмно- подмножеству Y cz X — свойство «принадлежать У»). Ситуация, когда некоторые объекты одной природы находятся в есте- естественном биективном соответствии с некоторыми объектами другой природы, весьма часто возникает в математике (мы не будем здесь обсуждать смысл прилагательного «естественный»). Опыт конструирования математических тео- теорий показывает, что во всех таких ситуациях объекты, естественно соответ- соответствующие друг другу, целесообразно рассматривать как одинаковые. На основании этого общего принципа отождествления мы, в частно- частности, можем отождествлять свойства элементов множества X с подмноже- подмножествами этого множества. Таким образом, с этой точки зрения свойства эле- элементов множества — это не что иное как его подмножества. Поскольку для любых двух различных элементов множества X всегда существует подмножество, содержащее один из этих элементов и не содер- ]) Термин «биективный» мы употребляем как синоним термина «взаимно однозначный». 13
жащее другой, мы видим, таким образом, что два элемента множества X тогда и только тогда равны, когда все их свойства одинаковы. Однако весьма часто мы интересуемся только некоторыми свойствами элементов множества X, игнорируя все остальные возможные их свойства. В соответствии с этим возникает новое понятие ревенства, учитывающее лишь интересные для нас свойства. Формально это понятие может быть определено следующим образом. Пусть 5E—произвольный набор (или, как говорят, семейство) неко- некоторых свойств элементов множества X. Элементы а и Ь множества X назы- называются равными по отношению к свойствам семейства 5E, если для любого свойства !? из семейства 5C элемент а тогда и только тогда обладает свой- свойством 3>, когда им обладает элемент Ь. Если семейство 5E содержит все свойства, то это есть равенство в смысле тождественного совпадения. Если семейство 5E пусто, то любые два элемента множества X равны по отноше- отношению к свойствам этого семейства. Можно. сказать, что, фиксируя семейство свойств 5E, мы получаем из элементов множества X некоторые новые математические объекты, отличаю- отличающиеся от этих элементов игнорированием их свойств, не принадлежащих се- семейству 5E. Каждый такой объект а' определяется некоторым элементом оеХ, причем элементы оеХ и JeI тогда и только тогда определяют один и тот же объект а', когда они равны по отношению к свойствам се- семейства 5E. Каждый элемент ogJ[ определяет некоторое подмножество 5Eа, со- состоящее из всех элементов Ь, равных элементу а по отношению к свойствам семейства 5E. Ясно, что, введенные выше объекты а' находятся в естествен- естественном биективном соответствии с подмножествами Ща (объект а', определяе- определяемый элементом а, соответствует подмножеству tya, и обратно). В соответст- соответствии с объясненным выше принципом отождествления объекты а' отождеств- отождествляются поэтому с подмножествами ^а. Все это можно описать несколько иначе, если воспользоваться понятием «отношения». Наглядно, «отношение» между элементами множества А' — это некоторое их «взаимное свойство», т. е. свойство пар вида (а, Ь), где оеХ, 4е1 Другими словами, отношение на множестве X — это некоторое мно- множество R таких пар. Если (a, b) ej?, то пишут а^Ь (или просто а ~ Ь) к и говорят, что элементы а н Ь находятся в отношении R. Отношение назы- называется рефлексивным, если а ~ а для всех оеХ, симметричным, если для любых а, Ъ ее X из а ~ b следует b ~ а, и транзитивным, если для любых а, Ь, сеХ в o~d и i~c следует а ~ с. Рефлексивное, симметричное и транзитивное отношение называется отношением эквивалентности или просто эквивалентностью. Если множество X представлено в виде объединения не- непустых непересекающихся подмножеств, то на X возникает отношение экви- эквивалентности, в котором а ~ Ь тогда и только тогда, когда а и ft принадле- принадлежат одному и тому же из этих подмножеств. Обратно, задание на X неко- некоторого отношения эквивалентности определяет разбиение этого множества на непустые непересекающиеся подмножества {классы эквивалентности), состоя- состоящие из попарно эквивалентных элементов. Класс эквивалентности, содержа- содержащий данный элемент а, обозначается обычно символом {а}. Таким образом, {а} = {&} тогда и только тогда, когда а ~ Ъ. Множество всех классов экви*- 14
валентности называется фактормножеством множества X по данному отно- отношению эквивалентности R и обозначается символом X/R. ' Ясно, что для любого семейства свойств $ отношение «равны по отно- отношению к свойствам семейства $Р» является эквивалентностью. При этом со- соответствующие классы эквивалентности совпадают с введенными выше под- подмножествами $ра. Обратно, легко видеть, что для любого отношения эквива- эквивалентности существует такое семейство свойств $, что элементы тогда и только тогда эквивалентны, когда они равны по отношению к свойствам се- семейства $. Таким семейством является, например, семейство свойств &>а, занумерованных элементами множества X и определенных условием, что эле- элемент del тогда и только тогда обладает свойством &>п, когда b ~ а (за- (заметим, что свойство 0*а, рассматриваемое как подмножество множества X, является не чем иным, как классом эквивалентности {а} элемента а). Таким образом, каждое отношение эквивалентности на множестве X сво- сводится к тому, что мы фиксируем внимание лишь на некоторых свойствах элементов множества X и игнорируем все другие их свойства. Заметим, что различные семейства свойств могут определять одно и то же отношение эквивалентности. Такие «равнообъемные» семейства можно не различать. 3. Окончательное определение вектора При определении равенства векторов в п. 1 мы пренебрегли некоторыми свойствами направленных отрезков (например, свойством иметь начало в данной точке, поскольку векторы мо- могут быть равны и иметь начало в различных точках). Это озна- означает, что на самом деле мы имеем здесь дело с равенством по отношению к некоторому семейству свойств, т. е. с некоторым отношением эквивалентности. Чтобы не путать это отношение с «настоящим» (тождественным) равенством, мы будем назы- называть теперь его «эквиполлентностью». Таким образом, мы прини- принимаем следующие определения: Определение /.Направленные отрезки АВ и А\В\ называются эквиполлентными, если середины отрезков АВ\ и А\В совпадают. Определение 2. Класс эквиполлентных направленных отрез- отрезков называется вектором. В частности, нулевой вектор — это класс, содержащий все вырожденные отрезки. Таким образом, в теперешнем уточненном понимании термины «вектор» и «направленный отрезок» относятся к различным математическим понятиям. Поэтому, строго говоря, мы уже не можем обозначать векторы теми же символами АВ, что и напра- направленные отрезки. В соответствии с общими обозначениями п. 2 вектор, содержащий направленный отрезок АВ, следует обозна- обозначать символом {АВ}. Равенство векторов {АВ} = {АхВ{} (пони- (понимаемое в смысле тождественного совпадения) равносильно экви- эквиполлентности направленных отрезков АВ и AiBu 15
Впрочем, оказывается удобным упростить обозначения и употреблять для вектора {АВ} прежний символ АВ. Но при этом формула АВ — А\В\ становится двусмысленной: она либо.озна- либо.означает равенство (совпадение) направленных отрезков АВ и А\В\ (т. е. тот факт, что А = А\ и В = Si), либо равенство соответ- соответствующих векторов (эквиполлентность направленных отрезков —> —>¦ АВ и AiBi). В контексте каждый раз ясно, в каком смысле эта формула понимается, так что эта двусмысленность к недоразуме- недоразумениям не приводит. Конечно, если такое недоразумение возможно, необходимо сделать соответствующие оговорки или использовать более педантичное обозначение {АВ} = {AiBy}. В согласии с этим сокращенным обозначением термины «век- «вектор» и «направленный отрезок» вновь можно употреблять как синонимы. Таким образом, мы снова возвращаемся к обозначениям (и терминологии) из п. 1., но уже «на высшем уровне». Мы знаем, что они на самом деле означают, и можем каждый раз, когда это необходимо, вернуться к более четким и недвусмыс- недвусмысленным формулировкам. Обозначать векторы мы будем также жирными строчными буквами латинского алфавита: а, Ь, х, ... Внимательный читатель должен уже заметить, что изложенное «окончательное» определение вектора нуждается в обосновании. Действительно, чтобы иметь право говорить о классах эквипол- лентных направленных отрезков, необходимо предварительно доказать следующее Предложение 1. Отношение эквиполлентности является на множестве всех направленных отрезков отношением эквивалент- эквивалентности, т. е. оно рефлексивно, симметрично и транзитивно. Доказательство. Рефлексивность и симметричность эквиполлентности очевидны (если А = Ai и В — Ви то отрезки ABi и AiB совпадают и потому совпадают^и их середины; ана- аналогично, если середины отрезков ABi и AiB совпадают, то сере- середины отрезков AiB и ABi также совпадают). Для доказатель- доказательства же транзитивности нам будет нужна следующая элемен- элементарно-геометрическая Лемма. Пусть А, В, С и D — четыре произвольные точки и пусть М — середина отрезка АВ, N — середина отрезка CD, Р — середина отрезка AD, Q — середина отрезка ВС, Тогда середины R и S отрезков MN и PQ совпадают. 16
Доказательство. Если В = D, то АВ = AD и ВС — CD Поэтому Д1 = Р, N = Q и утверждение леммы очевидно. Случай А = С рассматри- рассматривается аналогично. Пусть В ф D и А ф С. Легко видеть, что тогда М ф Р (ибо если М = Р, то В = D). Аналогично, N ф Q, М ф Q и N ф Р. Поскольку М ф Р и В ф D, определены прямые МР и BD. Ясно, что эти прямые параллельны1)- Действительно, если точки Л, В, D не лежат на одной прямой, то МР — средняя линия треугольника ABD; если же точки Л, В, D лежат на одной прямой. то точки М и Р также лежат на этой прямой. Ана- Аналогично, прямая NQ также параллельна прямой BD A < Следовательно, прямые МР и NQ параллельны. Ана- Аналогично доказывается, что прямые MQ и NP также параллельны. Таким образом, если точки М, N, P, Q не ле- лежат на одной прямой, то они являются вершинами параллелограмма со сторонами PN, NQ, QM и МР. Отрезки MN и PQ, являясь диагоналями этого па- раллелограмма, делятся их точкой пересечения попо- \лам. Но это и означает, что середины этих отрезков fc' совпадают. Пусть теперь точки М, N, P, Q принадлежат одной прямой а. В этом ч случае (как и в предыдущем) длина \МР\ отрезка МР равна половине С длины |В?>| отрезка BD. Действительно, если точка А не лежит на прямой -.BD, то это очевидно, поскольку отрезок МР является средней линией тре- треугольника ABD. Если же точка А лежит на прямой BD, то для доказатель- доказательства следует поочередно рассмотреть пять случаев: точка В лежит между точками А и D; точка А лежит между точками В и D; точка D лежит между точками А и В; точка А совпадает с точкой В; точка А совпадает с точкой D. В каждом из этих случаев равенство \МР\ = xk\BD\ очевидно. Аналогично устанавливается, что \NQ\ = l/2\BD\. Следовательно, \MP\ = \NQ\. Точно так же доказывается, что имеет место и равенство \MQ\ = \NP\. Заметим теперь, что при М ф N эти равенства однозначно характери- характеризуют точку Q, т. е. если | МО' | = | NP \, | МР | = | NQ' \ для некоторой точки Q' прямой а, то Q = Q'. В самом деле, тогда \MQ\ = \MQ'\, \NQ\ = )NQ'\ и, следовательно, при Q ф Q' точки М и N обе являются серединами от- отрезка QQ', и значит, вопреки предположению, совпадают. Пусть Теперь Q' — такая точка, что точка R является серединой отрезка PQ'. Очевидно, что точка Q' лежит на прямой а. Так как относительно i точки R точки М к N, так же как и точки Р и Q', симметричны, то отрезок МР симметричен отрезку NQ', а отрезок MQ' симметричен отрезку NP. 1) Мы называем прямые параллельными, если они либо «параллельны в школьном смысле» (лежат в одной плоскости и не имеют общих точек), либо совпадают. Эта модификация терминологии оказывается очень удобной, по- поскольку только при таком понимании термина «параллельность» отношение параллельности прямых является отношением эквивалентности. Соответст- Соответствующие классы эквивалентности называются иногда направлениями. Аналогичное значение термин «параллельные» будет иметь у нас и по отношению к прямым и плоскостям в пространстве.
Поэтому | MQ' | = | NP |, | MP | = | NQ' | и значит,_по доказанному, Q = Q'. Таким образом, при М Ф N середина R отрезка MN является также и серединой S отрезка PQ. Случай Р Ф Q рассматривается аналогично. Предположим, наконец, что М = N и Р = Q. Так как точки А и В симметричны относительно точки М, точки С и D симметричны относительна точки N и N = М, то отрезки Л?) и ВС симметричны относительно точки М. Поскольку Р = Q, это возможно только тогда, когда все точки М, N, P, Q совпадают. Поэтому середины отрезков MN и PQ также совпадают. Тем самым лемма полностью доказана. Пусть теперь АВ, А^В^ и А2В2—такие направленные отрез- отрезки, что отрезок АВ эквиполлентен отрезку A^Bi, а отрезок AiBt эквиполлентен отрезку А2Вг. Нам надо доказать, что отре- отрезок АВ эквиполлентен отрезку Афъ, т. е. что сере- середина Р отрезка АВ2 совпадает с серединой Q отрезка А2В. Рас- „ смотрим с этой целью середину 2 R отрезка АВ. Пусть М — об- ¦„ ^^// тая середина отрезков ABt и А\В, a yv — общая середина от- отрезков AiBz'a A2B1. Применив к точкам А, В, А2 и В4 нашу лемму, мы немедленно полу- получим, что середины отрезков RN "и QM совпадают. Аналогич^ но, применив эту лемму к точ- точкам А, В, А\ и В2, мы полу- получим, что совпадают середины отрезков RN и РМ. Следова- Следовательно, середины отрезков QM и РМ совпадают. Кроме того, эти отрезки имеют общую кон- концевую точку М. Поэтому эти отрезки совпадают, а значит, и совпадают точки Q и Р. Тем самым предложение 1 доказано, и наше определение вектора полностью обосновано. На достигнутом нами сейчас уровне строгости мы обязаны доказывать утверждения, наглядно вполне очевидные. Напри- Например мы должны доказать, что каждый вектор можно единст- единственным образом отложить от произвольной точки. Другими словами, мы должны доказать следующее Предложение 2. Для любого направленного отрезка АВ и лю- любой точки А\ существует одна и только одна такая точка Ви что отрезок AiBi эквиполлентен отрезку АВ. 18
s Доказательство. Единственность точки В\ очевидна: если направленные отрезки А\В\ и А\В[ эквиполлентны, то сере- середина отрезка А\В[ совпадает с серединой отрезка А\В\ и потому эти отрезки (имея общую концевую точку А\) совпадают. Для доказательства существования точки Bi мы рассмотрим середину С отрезка AtB. Если С = А, то за точку Bj мы можем, очевидно, принять точку С. При С ф А мы рассмотрим на пря- прямой АС точку В и обладающую тем свойством, что точка С яв- является серединой отрезка ABi. Ясно, что направленный отрезок AiBi эквиполлентен направленному отрезку АВ. Наш анализ понятия вектора можно еще углубить, заметив, что лежащее в его основе понятие направленного отрезка опре- определено нами без должной четкости. Действительно, в этом оп- определении мы употребляем термин «направление», интуитивно ясный, но строго не определенный. Эту трудность можно пре- преодолеть, заметив, что направленный отрезок АВ однозначно определяется двумя точками А и В, взятыми в определенном по- порядке, т. е. упорядоченной парой точек. На этом основании мы имеем право принять следующее, уже формально безупречное Определение 3. Направленным отрезком называется упоря- упорядоченная пара точек. Первая из этих точек называется началом отрезка,'а вторая — его концом. Направленный отрезок с нача- началом А и концом В обозначается символом АВ. Заметим, что в этом определении вырожденные направлен- направленные отрезки ничем особым не выделяются. Окончательный вывод. Резюмируя, мы видим, что строгим образом векторы определяются в несколько этапов: 1) Сначала (определение 3) вводятся направленные отрезки. 2) Затем (определение 1) вводится отношение эквиполлент- эквиполлентности направленных отрезков. 3) Доказывается (предложение 1), что отношение эквипол- эквиполлентности является отношением эквивалентности. 4) Наконец (определение 2), вводятся векторы. 4. Векторы на прямой, на плоскости и в пространстве Обратим внимание, что во всем сказанном выше точки А, В и т. д. могли быть произвольными точками пространства. Чтобы подчеркнуть это обстоятельство, мы будем рассмотренные выше векторы называть векторами в пространстве. Множество всех векторов в пространстве будем обозначать символом VectC). С другой стороны, мы могли бы ограничиться рассмотрением лишь точек, принадлежащих некоторой фиксированной плос- плоскости П. Получающиеся в этом случае векторы называются 19
векторами на плоскости. Их множество мы будем обозначать символом Vect B) (или символом VectnB), когда нужно подчер- подчеркнуть его зависимость от плоскости П). Аналогично, можно ограничиться рассмотрением лишь точек некоторой фиксированной прямой а и получить векторы на прямой. Их множество мы будем обозначать символом Vect(l) (или символом Vecta A)). Если плоскость П рассматривать независимо от объемлюще- объемлющего пространства (как это делается в планиметрии), то множе- множества VectC) и Vect B) формально между собой никак не свя- связаны. Напротив, если считать, что плоскость П определенным образом вложена в пространство, то каждый направленный отрезок плоскости одновременно будет и направленным отрез- отрезком в пространстве. В плоскости этот отрезок определяет неко- некоторый вектор а, а в пространстве — некоторый вектор а' (век- (векторы а и а' различны хотя бы потому, что среди направленных отрезков, принадлежащих вектору а', заведомо имеются отрез- отрезки, не принадлежащие вектору а). С другой стороны, ясно, что если на плоскости направленные отрезки эквиполлентны, то они эквиполлентны и как направленные отрезки в пространстве. Это означает, что вектор а' зависит только от вектора а и не за- зависит от того, от какого направленного отрезка, принадлежа- принадлежащего вектору а, мы отправляемся. Тем самым возникает естест- естественное биективное соответствие а -*-»• а' между множеством Vectn B) и некоторым подмножеством множества VectC). По- Поэтому (в силу общего принципа отождествления; см. п. 2) мы ¦ можем векторы а и а' отождествлять и тем самым множество Vectn B) считать подмножеством множества VectC). Аналогич- Аналогично, для любой прямой а множество Vecta(l) можно считать под- подмножеством множества VectC), а также и подмножеством множества Vectn B) (в случае, когда прямая а принадлежит плоскости П). Эти вложения, очевидно, согласованы в том смыс- смысле, что если вектор aeVecta(l) рассматривать как вектор из VectnB), а потом как вектор из VectC), то получится тот же са- самый элемент множества VectC), как если вектор а с самого на- начала рассматривать как вектор из VectC). Определение 1. Направленный отрезок АВ называется па- параллельным плоскости П, если прямая, на которой он располо- расположен, параллельна этой плоскости. Вырожденный направленный отрезок, по определению, параллелен любой плоскости. Ясно, что если направленные отрезки АВ и AiBi эквипол- эквиполлентны и отрезок АВ параллелен плоскости П, то отрезок AiBi также параллелен этой плоскости1). Другими словами, для лю- ') Обратим внимание, что это верно только при обобщенном понимании термина «параллельны», — см. сноску на стр. 17. 20
бого вектора а (в пространстве) либо все направленные отрез- отрезки, составляющие этот вектор, параллельны плоскости П, либо ни один из них не параллелен этой плоскости. Когда имеет место^ первый случай, мы будем говорить, что вектор а параллелен плоскости П. Очевидно, что вектор а тогда и только тогда параллелен плоскости П, ког- когда, отложив его от произвольной точки плоскости П, мы полу- получим направленный отрезок, расположенный в этой плоскости. Это показывает, что множество всех векторов в пространстве, параллельных плос- плоскости П, совпадает с введенным выше подмножеством Vectn B) множества VectC). Аналогично определяется понятие вектора (в плоскости или в пространстве), параллельного данной прямой а. Множе- Множество всех таких векторов совпадает с множеством Vecta(l) (рассматриваемым как подмножество соответственно множеств VectB) или VectC)). Подмножества Vectn B) и Vectn'B) множества VectC), от- отвечающие двум различным плоскостям П и IT, вообще говоря, различны (они совпадают тогда и только тогда, когда плоско- плоскости ПиП' параллельны). Их пересечением (при непараллельных плоскостях П и IT) является множество Vecta(l), где а — пря- прямая пересечения плоскостей ПиП'. Аналогично, подмножества Vecta(l) и Vecta'(l), отвечающие двум прямым а и а', тогда и только тогда совпадают, когда пря- прямые а и а' параллельны. В противном случае эти подмножества пересекаются лишь по нулевому вектору 0. § 2. ВЕКТОРЫ НА ПРЯМОЙ Нашей основной целью является исследование векторов на плоскости и в пространстве. Однако оказывается, что для этого необходимо изучить предварительно векторы на прямой. Этому изучению и будет посвящен на- настоящий параграф. Результаты этого изучения послужат нам также образцом для обобщения на случай плоскости и пространства. Во всем этом параграфе мы будем считать фиксированной некоторую прямую а и все построения будем относить только к этой прямой. Когда нам придется рассматривать и другие прямые, это будет специально ого- оговорено. 1. Ориентации прямой На прямой а мы можем перемещаться в одном из двух про- противоположных направлений. Выбор одного из этих направлений: мы будем называть ориентацией прямой, а прямую с заданной на ней ориентацией мы будем называть ориентированной пря- прямой или осью. 21
;, Здесь мы опять пользуемся наглядным, но не строгим (пока) понятием .движения. Чтобы ввести понятие ориентации вполне строгим образом, нам понадобится общематематическое понятие «упорядоченного множества». Пусть X— произвольное множество (с элементами А, В, С...). Заданное на X отношение (обозначаемое символом <() называется отношением по- порядка, когда оно обладает следующими свойствами: 1) если Л -< В, то А ф В (свойство антирефлексивности), 2) если Л-< В и В-< С, то А <( С (свойство транзитивности), 3) если А ф В, то либо А <( В, либо В <С А (свойство полнот ы). Отношение порядка называется отношением предшествования, когда вы- выполнено следующее дополнительное свойство: 4) если А <( В, то существуют такие элементы С\, Сг и D, что С, < А < D < В < С2. По любому отношению порядка <( мы можем построить новое отношение порядка <(' (называемое отношением, противоположным данному), считая, по определению, что А <(' В тогда и только тогда, когда В <( Л. Ясно, что если <( — отношение предшествования, то <(' — также отношение предшествования. Мы принимаем в качестве аксиомы следующее утвер- утверждение. У. На любой прямой существуют два взаимно противопо- противоположных отношения предшествования. Наглядно, каждое из этих отношений определяется зада- заданием на прямой некоторого направления движения. Именно, Л<(В в одном из этих отношений, если точка В получается из точки А движением в данном направлении. Теперь мы уже можем дать вполне строгое определение. Определение 1. Каждое из предусмотренных аксиомой У от- отношений предшествования называется ориентацией прямой. Прямая с заданной на ней ориентацией называется ориентиро- ориентированной прямой или осью. Другие понятия, относящиеся к взаимному расположению точек на прямой, могут быть определены через понятие ориен- ориентации. Например, точка С называется лежащей между точками А и В, если Л<(С-<(В в той ориентации, в которой А -<^В. Мно- Множество точек, лежащих между точками А я В, пополненное са- самими этими точками, называется отрезком АВ с концевыми точками А и В. Согласно свойству 4) отношений предшествова- предшествования отрезок АВ при А ф В содержит точки, отличные от точек А я В (внутренние точки), и, как можно легко показать, содер- содержит даже бесконечно много таких точек. Поскольку сущест- существуют только две ориентации и эти ориентации противополож- противоположны, каждая точка, лежащая между точками А и В, лежит также между точками В и А, т. е. АВ = ВА, и т. д. .22
Определение 2. Невырожденные направленные отрезки АВ ,и А\ВХ прямой а называются одноименными, если А «< В в не- некоторой ориентации тогда и только тогда, когда Ai -^ Bi в той -же ориентации. Ясно, что это определение корректно (не зави- зависит от выбора ориентации). Очевидно, что отношение одноименности рефлексивно и сим- .метрично. Кроме того, из свойства 2) отношений порядка легко вытекает, что оно транзитивно. Таким образом, отношение одноименности направленных отрезков прямой является отношением эквивалентности. Ясно, что соответствующие классы эквивалентности нахо- находятся в естественном биективном соответствии с ориентациями прямой: класс, соответствующий данной ориентации, состоит из всех направленных отрезков АВ, для которых А «^ В в этой ориентации. Поэтому ориентации на прямой можно отождествить с классами од- одноименных направленных отрезков. Чтобы получить аналогичные результаты для векторов, не- необходимо предварительно доказать следующее Предложение 1. Эквиполлентные невырожденные направлен- направленные отрезки АВ и A^Bi прямой а одноименны. Доказательство этого предложения сводится к проверке его справедливости во всех возможных случаях взаимного распо- расположения точек А, В, А\ и В\. На наглядно геометрическом уровне эта проверка совершенно очевидна: достаточно сделать чертеж. Чтобы привести его формальное доказательство, мы примем в качестве аксиом следующие свойства середины отрезка: С1. Для любых точек А и В середина С отрезка АВ принадлежит этому отрезку и при А =?= В является его внутренней точкой. Иными словами, если А = В, то С = А = В. Если же А =^= В, то А <( С <С В в ориентации, в которой А <С В. С2. Пусть точка С является серединой отрезков АВ и AiBu Тогда если A<Ai<C, то С<54<В. В аксиоме С2 имеется в виду любая из двух возможных ориентации. СЗ. Для любых точек А и С существует одна и только одна точка В, об- обладающая тем свойством, что точка С является серединой отрезка АВ. Предложение 1 из этих аксиом выводится следующим образом. Пусть С — общая середина отрезков АВ\ и А\В. Случай 1. С-<^А (в ориентации,^ которой А -< В). В этом случае С < А -< В и потому к отрезкам ВАХ и ABt применима аксиома С2 (по отно- отношению к противоположной ориентации). Следовательно, согласно этой аксиоме Ai < Bt < С. В частности, Л, < В,. Случай 2. С = А. Тогда Л = В, (и C = Bi), но Ai ф В (ибо в про- противном случае оба отрезка АВ и AtBi были бы вырождены). Кроме того, ;¦¦,¦ ' 23-
легко видеть, что -4,«<В (в ориентации, в которой, Л«<В). Действительно, если В -< Аи то В -< С -< А\ и потому, вопреки выбору рассматриваемой ориен- ориентации, В < А (= С). Но если At <В, то /4,<<С-<В, т. е. Л,-<?,<? и, в частности, Л[ <( Si. С л у ч а й_За._Л < С и Л, < Л. В этом случае аксиома С2 применима к отрезкам АХВ, АВХ и потому С < В < В,, т. е. Л, -< Л < С < В,. Следо- Следовательно, Л) <( В\. Случай 36. Л < С и Л, = А В этом случае В, = В, и наше утвер- утверждение тривиально. Случай Зв'. А -<_С, Л < Л) и Л1 -< С. В этом случае аксиома С2 применима к отрезкам ЛВЬ А\В и потому С <( В <( Вь т. е. Л! <( С <( Вь и снова Л, -< В,. Случай Зв". Л < С, А < Л, и Л, = С. Тогда Л, = В, С = В и Л < В, (ср. случай 2). Поэтому А-^ С < Вь т. е. Л, -< В,. Случай Зв'". А < С, Л < Л! и С < Л,. Поскольку С-<. Аи то обяза- обязательно В -^С (аксиома С1). Следовательно, А < В -< С и аксиома С2 приме- применима к отрезкам ЛВ) и ВЛ,. Поэтому С<Л, <Bi и, в частности, Л]<В1. Теперь мы можем сформулировать наше основное Определение 3. Отличные от нуля векторы АВ и /li#f пря- прямой а называются одноименными, если одноименны направлен- направленные отрезки АВ и А\Ви т. е. если Ai-^Bi в ориентации, в кото- которой А < В. Согласно предложению 1 это определение корректно. Ясно, что, так же как и отношение одноименности направ- направленных отрезков, отношение одноименности отличных от нуля векторов пря- прямой является отношением эквивалентности. Отношение одноименности разбивает все множество отлич- отличных от нуля векторов прямой а на два класса, находящихся в естественном биективном соответствии с ориентациями этой прямой. Поэтому ориентации прямой можно отождествить с классами одно- одноименных отличных от нуля векторов этой прямой. Определение 4. Каждый отличный от нуля вектор прямой а называется базисом на этой прямой (или, точнее, базисом со- соответствующего множества Vecta(l)). Таким образом, мы можем сказать, что ориентациями прямой являются классы одноименных бази- базисов на этой прямой. Базис АВ называется положительно ориентированным (по отношению к данной ориентации прямой а), если он определяет эту ориентацию, т. е. если А -< В в данной ориентации. В про- противном случае базис АВ называется отрицательно ориентиро- ориентированным. -24
2. Длина и величина вектора на прямой Определение 1. Длиной \АВ\ направленного отрезка А В мы будем называть длину \АВ\ соответствующего ненаправленного отрезка АВ. (Здесь мы не будем вдаваться в подробности стро- строгого, аксиоматического, определения длины, поскольку это уве- уведет нас далеко в сторону; напомним только, что при определении длины предполагается выбранным некоторый фиксированный отрезок — эталон длины, длина которого, по определению, равна единице.) Нам будут нужны только следующие свойства длины, которые можно считать аксиомами: Д1. Если С — середина отрезка АВ, то \АС\ — \СВ\. Д2. Если А<С<В, то | АВ | = | АС | + I CB \. Величиной (или алгебраическим значением) направленного отрезка АВ на ориентированной прямой а мы будем на- называть его. длину, если этот отрезок ориентирован положитель- положительно, и его длину, взятую со знаком минус, если этот отрезок ориентирован отрицательно. Величину отрезка АВ мы будем обозначать символом (АВ). При А = В (и только при А = В) величина (АВ) равна нулю. Ясно, что (АВ) + (В А) = 0. Замечание 1. Обратим внимание на то, что о длине на- направленного отрезка имеет смысл говорить и в случае отрезков не на данной прямой, а в плоскости или в пространстве, тогда как величина направленного отрезка определена лишь для направленных отрезков прямой и притом ориентированной. Предложение 1. Величины эквиполлентных направленных отрезков АВ и AiBi совпадают. Доказательство. Ясно, что нам достаточно рассмотреть только случай, когда отрезки АВ и А\В\ невырождены. Но в этом случае совпа- совпадение знаков величин направленных отрезков АВ и АХВ\ непосредственно вытекает из предложения 1 п. 1. Поэтому нам нужно только доказать, что совпадают их длины. Пусть С — общая середина отрезков АВ\ и AtB. Тогда I АС | = | СВ] | и |Л]С| = |СВ|. Ясно, что без ограничения общности мы можем предполагать, что А < А1 в ориентации, в которой А < В (при А = А,, доказывать нечего, а при А\ <( А достаточно поменять местами отрезки АВ и AiBi, чтобы свести этот случай к случаю, когда А <( Ах). Но при А <( А\ возможны лишь следующие два случая: Случай 1. Л -< Л, < С < В < В,. В этом случае | АВ | = | АС | + | CB I и | AtB, |=| Л,С | +1 СВ, |. Следовательно, | АВ \-\ AtBy | = ( | АС |-| СВг \) + |Л,С|) = 0 + 0 = 0, т. е. \АВ\ = \А1В1\. 25
Случай 2. Л < Я < С < Л, < В,. В этом случае | АВ | = | АС | + | СВ \ и | AjBt | = | AtC I + I CBl |. Следовательно, | ЛВ | — | Л1В11=( | AC |—| CB, |)+ + (I CAt | - | ВС \) = 0, т. е. снова \АВ\ = \ АХВХ \. Определение 2. Величиной (соответственно, длиной) векто- вектора а = {АВ} называется величина (соответственно длина) на- лравленного отрезка АВ. Согласно предложению 1 это определение корректно. Величина вектора а обозначается символом (а), а длина — символом \а\. Замечание 2. Легко видеть, что векторы а и Ь (на прямой а) тогда и только тогда равны, когда их величины совпадают: (т. е. когда эти векторы одноименны и имеют равные длины). Это показывает, что, сопоставив каждому вектору aeVect(l) •его величину (а), мы получим биективное соответствие между множеством Vect(l) всех векторов на прямой и полем R ве- вещественных чисел. Однако было бы неосторожно воспользовать- воспользоваться этим соответствием и отождествить множества Vect(l) и R, поскольку это соответствие свойством естественности нег обла- обладает (оно зависит и от ориентации прямой и от выбора эталона длины). 3. Отношение векторов на прямой Пусть е = АйВо — произвольный отличный от нуля вектор прямой а (базис). Приняв отрезок ЛоВо за эталон длины и вы- выбрав ориентацию прямой а так, чтобы вектор е был положи- положительно ориентирован, мы согласно сказанному выше для любого —>- вектора а = АВ можем говорить о его величине (а) (в част- частности, (е) = 1). Определение 1. Величина (а) вектора а, получающаяся при указанном выборе эталона длины и ориентации, называется от- отношением векторов а и е и обозначается символом а : е (или Г ) При произвольном эталоне длины число а : е равно, очевид- очевидно, отношению величин (а) и (е): а:е = (а): (е). При этом ясно, что эта формула сохраняет свою силу и тогда, когда мы сменим ориентацию прямой а на противоположную. Следовательно, отношение а:е = (а): (е) не зависит ни от выбора эталона длины, ни от выбора ориентации прямой а (хотя от этого зависят величины (а) и (е)), т. е. определяется исключительно векторами а и е. 26
Очевидно, что а) если а : е = Ь : е, то а = Ь; б) для любого вектора е Ф 0 и любого числа aeR сущест- существует такой вектор а, что а : е = а. Определение 2. Если а : е = а, то мы будем говорить, что- вектор а получен умножением вектора е на число а и будем этот вектор обозначать символом ае. Свойства а) и б) означают, что операция умножения (от- (отличных от нуля) векторов на вещественные числа однозначно- определена, т. е. для любого вектора е Ф О и любого числа seR существует один и только один вектор а, обладающий тем свойством, что а = ае. Мы доопределим эту операцию при е = 0, полагая, по опре- определению, аО = О для любого числа aeR. Ясно, что (ае) = а(е). В частности, |ае| = |а|-|в|. Заметим, что при а > 0 (и при е Ф 0) векторы е и ае од- ноименны, а при а < 0 — разноименны. Отметим, что для любого вектора а 0а = 0, 1а = а. Вектор (—\)е обозначается также символом •—е и назы- называется вектором, противоположным вектору е. Очевидно, что- если е = АоВо, то —е = ВИо. Замечание 1. Определение вектора —е как вектора В0А0- имеет смысл и для векторов на плоскости или в пространстве1), тогда как вектор (—\)е определен у нас пока лишь для векто- векторов на прямой. Определение 3. Координатой вектора а в базисе е называет- называется отношение а.е. Другими словами, координата вектора а в ба- базисе е — это такое число а, что а = ае, или, по-другому, коор- координата вектора а в базисе е — это величина (а) вектора а при условии, что ориентация и эталон длины на прямой выбраны так, что (е) = 1. Сопоставление вектору а его координаты а = а:е опреде- определяет биективное соответствие между множеством Vect(l) век- векторов на прямой и полем R вещественных чисел. Это соответ- соответствие зависит от вектора е и потому не является естественным, ') Конечно, здесь следует проверить корректность, т. е. тот факт, что если направленные отрезки А0В<, и AiBi эквиполлентны, то направленные •Ирезки ВоАп и BiAi также эквиполлентны; но это очевидно. l .. 27
Оно по существу совпадает с соответствием, описанным в заме- замечании 2 п. 2, поскольку задание вектора е = А0В0 равносильно заданию эталона длины А0В0 и ориентации прямой а (а именно, ориентации, в которой вектор АоВо положительно ориенти- ориентирован). Легко видеть, что для любых трех векторов а ф О, 6 =? О и с имеет место равенство с:а = (с:Ь)-(Ь:а). A) Действительно, по определению, с '. а=*(с)'. (а), с '. Ъ = (с) : F) и Ь '. а = F): (а). Поэтому Пусть с '. b = k и Ь '. а = /, т. е. пусть c = kb и Ь — 1а. Тогда по доказанному с'.а = Ы, т. е. с — {Ы)а. В этой форме равен- равенство A) остается, очевидно, верным как при а = 0, так и при 6 = 0. Таким образом, для любого вектора а и любых чисел k и I имеет место равенство (kl) a = k (la) B) Пусть, в частности, а есть базис е. Обозначая вектор Ь (ос- (освободившимся теперь) символом а и замечая, что число / яв- является не чем иным, как координатой а вектора а в базисе е, а число Ы—координатой вектора с = ka, мы получаем, таким образом, что если в базисе е вектор а имеет координату а, то для любого числа k вектор* ka будет иметь координату ka. Другими словами, при умножении вектора на число его координата умно- умножается на это же число. Формулу B) (или, скорее, формулу A)) можно прочитать и по-иному, приняв за Ь некоторый базис е, а за а — некото- некоторый другой базис е'. Обозначая вектор с символом х, мы можем теперь переписать формулу A) (переставив множители) в сле- следующем виде: х : е' = (е : е')\х : е). Но число х: е' является координатой х' вектора х в базисе е% а число х:е — его координатой х в базисе е. Таким образом, при замене базиса е базисом е' координата х произвольно* го вектора х заменяется координатой х', связанной с координй* той х формулой . х' = сх, 28
с = е : е' — координата «старого» базиса е в «новом» ба- базисе е'. Обратим внимание на то, что все последние утверждения яв- являются просто тривиальными переформулировками одного и того же геометрического факта. 4. Сложение векторов на прямой. Лемма Шаля Пусть а = АВ и Ь = А'В' — произвольные векторы. Отло- Отложив вектор Ъ от точки В, т. е. построив направленный отрезок ВС, эквиполлентный отрезку А'В', мы получим некоторую точку С. _,. Определение 1. Вектор АС называется суммой векторов а='АВ и Ь = ВС и обозначается символом а -f- Ь. Это определение нуждается конечно, в проверке коррект- корректности, т. е. в доказательстве того факта, что вектор а -j- Ь не за- зависит от имеющегося в этом определении произвола (состояще- (состоящего в выборе точки А). Другими словами, нам нужно доказать следующее Предложение 1. Если направленный отрезок АВ эквипол- эквиполлентен направленному отрезку AiBi, а направленный отрезок ВС эквиполлентен направленному отрезку BiCu то направлен- направленный отрезок АС эквиполлентен направленному отрезку А\С\. Доказательство. Пусть Р и Q — середины отрезков ACi и А\С. Мы должны пока- показать, что Р = Q. Для этого мы воспользуемся леммой из п. 3 § 1. Пусть М — общая середина отрезков ABi и AiB, a Af — об- общая середина отрезков BCi и BiC. Кроме того, пусть R — сере- середина отрезка AAi. Применив указанную лемму к точкам Л, S,, Ai, мы немедленно получим, что середины отрезков MQ п совпадают. Аналогично, применив эту лемму к точкам Л, Си В, Аи мы получим, что совпадают середины отрезков МР и NR. Следовательно, середины отрезков MQ и МР также совпадают. Имея общую середину и общую концевую точку, эти отрезки Совпадают. Поэтому Р = Q. Замечание 1. Данное нами определение суммы векторов ¦Пригодно не только для векторов на прямой, но и для векторов в плоскости и в пространстве. То же самое справедливо, конеч- конечно, и по отношению к доказательству его корректности. 29
Покажем, что для суммы векторов (на прямой) имеет место следующее свойство дистрибутивности: для любых трех векторов а, Ь и е Ф О справедливо равен- равенство ¦ (а + Ь):е = а:е+Ь:е. (L Другими словами, координата суммы векторов (в произвольном базисе е) рав- равна сумме координат слагаемых (в том же базисе). Ясно, что для доказательства этого соотношения достаточно доказать, что (а + Ь) = (а) + F), т. е. что величина суммы двух векторов равна сумме величин слагаемых (конечно, в предположении, что прямая а ориенти- ориентирована и на ней выбран эталон длины; заметим, что формула A) в этом предположении не нуждалась). Пусть а = АВ и Ъ — ВС, так что а + Ь = АС. Тогда послед- последнее равенство может быть переписано в следующем виде: (АС) = (АВ) + (ВС). B) Таким образом, нам нужно показать, что для любых трех точек А, В и С прямой а имеет место равен- равенство B). В этой форме свойство дистрибутивности известно как л е м- м а Шаля. Если хотя бы две из точек А, В и С совпадают, то лемма Шаля очевидна (она сводится либо к тождеству (АВ) = {АВ),. либо к уже известному нам равенству (АВ) + (ВА) = 0). Пусть все точки А, В, С попарно различны. Ясно, что без огра- ограничения общности мы можем предполагать, что А -< С (в за- заданной на прямой а ориентации), так как в противном случае достаточно сменить на а ориентацию, отчего обе стороны ра- равенства B) умножатся на —1. Случай 1. В<А<С. В этом случае (ЛС) = |ЛС[ = = \ВС\ — \ВА |, тогда как (ВС) = \ВС\ и (АВ) = — \ВА\. Сле- Следовательно, (АС) = (АВ) + (ВС). Случай 2. А<В<С. В этом случае, (ЛС)=|ЛС| = = | АВ\ + \ВС\, тогда как (АВ) = \ АВ\ и (ВС) = \ВС\. Следо- Следовательно, (АС) == (АВ) + (ВС). Случай 3. Л<С<В. В этом случае (ЛС) = |ЛС| = = \АВ\ — \СВ\, тогда как (АВ) = \АВ\ и (ВС) =— |СВ\. Следо- Следовательно, (АС) — (АВ) + (ВС). Тем самым лемма Шаля полностью доказана. 5. Алгебраические свойства линейных операций Введенные операции над векторами (умножение на числа и сложение) называются линейными. Их основные алгебраиче- алгебраические свойства перечислены в следующей теореме: 30
Теорема 1. Для любых векторов а, Ъ и с и любых вещест- вещественных чисел k и I имеют место равенства 2. а + Ь = Ь + а, 3. а+О = а, 4. а+(-а) = О, 5. (k + l)a 6. (kl) a = k (la), 7. k{a+ b) = 8. 1а = а. Доказательство. 1. Отложим от произвольной точки ТА вектор а, от его конца В — вектор Ь, а от конца С вектора Ъ — вектор с. Пусть D — конец этого вектора. Согласно опреде- определению направленный отрезок АС определяет вектор а + Ь, на- направленный отрезок BD определяет вектор b-j-c, а направленный отрезок AD определяет, с одной стороны, вектор (а + &)+с, а с другой стороны, — вектор а -\- F-f-c)- Следовательно, (а + Ь) +с = а+ {Ь + с). 2. Отложим векторы а и & от произвольной точки О. Пусть А и В — концы этих векторов. От точки Л мы отложим вектор Ь, а от точки В — вектор а. Пусть С и D — концы этих векторов. По определению, направленные отрезки ОС и OD определяют соответственно векторы а-\-Ь и 6 + а. Таким образом, нам нуж- нужно только показать, что С = D. Но так как направленные от- отрезки ОА и BD эквиполлентны, то середины отрезков OD и АВ совпадают. Аналогично, так как направленные отрезки ОВ и АС эквиполлентны, то совпадают' и середины отрезков ОС и АВ. Следовательно, отрезки ОС и OD имеют общую концевую точку и общую середину. Поэтому эти отрезки совпадают и, в частности, С — D. 3. Очевидно. 4. Если а = АВ, то —а = ВА и поэтому а + (—а) = АА = 0. 5. При а = 0 это свойство очевидно. Пусть а Ф 0. Тогда, по определению, (k + l)a:a = k + l и ka'.a = k, la'. a = l, так что (k -f /) а: а = ka: a -f la: а, С другой стороны, согласно лемме Шаля (или, точнее, равен ству A) п. 4) {ka -{¦ la)'. а = ka '. а-\- la: a. 31
Следовательно, (k + l)a:a = (ka-\-la):a и потому (k + /) а = ka + la. 6. Это уже известно (см. п. 3). 7. Пусть е — произвольный базис. Тогда а — ае и b = be, где а я b — координаты векторов а и 6 в базисе е. Следователь- Следовательно, в силу уже доказанных свойств k(a + Ь) = k(ae + Ье) = k(a + Ь)е = (ka + kb)e = = (ka) e + (kb) e = k (ae) + k (be) = ka + kb. 8. Очевидно. Доказанная теорема означает, что к векторам применимы обычные вычислительные приемы арифметики: раскрытие ско- скобок, перенесение слагаемого из одной части равенства в дру- другую (с изменением знака), умножение обеих частей равенства на одно и то же (отличное от нуля) число и т. п. Чтобы облегчить ссылки, мы будем называть перечисленные в теореме 1 восемь свойств линейных операций над векторами их стандартными свойствами. Множества, в которых определены операции сложения и умножения на вещественные числа, обладающие стандартными свойствами 1—8, часто встречаются в математике. Они назы- называются линейными пространствами или, короче, линеалами. В этой терминологии доказанная теорема утверждает, что множество Vect(l) всех векторов на прямой является линеалом. Задание. Докажите, что в любом линеале для любых а и k имеют ме- место равенства Оа = 0, kO = 0. Упражнение. Докажите, что свойство 2 линейных операций вытекает из остальных семи стандартных свойств. "" 6. Теорема об изоморфизме Предполагая, что на прямой а выбран базис е, вернемся к биективному соответствию между множеством Vect(l) всех векторов на прямой а и полем R вещественных чисел, получаю- получающемуся при сопоставлении каждому вектору aeVect(l) его координаты а = а : е в базисе е (см. п. 3). Согласно результа- результатам пп. 3 и 4 при умножении вектора на число его координата умножается на то же число, а при сложении векторов их коор- координаты складываются. Чтобы описать эту ситуацию в общих терминах, удобно ввести понятие «изоморфизма». Понятие изоморфизма является одним из важнейших общематематиче- общематематических понятий. Грубо говоря," два множества, наделенные некоторым матема- математическим строением, называются изоморфными, если между ними можно 32
установить биективное соответствие, сохраняющее это строение (изомор- (изоморфизм). Чтобы придать этому определению точный смысл, необходимо, конеч- конечно, предварительно определить, что такое «математическое строение» и что понимается под отображением, «сохраняющим строение». Мы не будем этого делать, поскольку у нас сейчас нет ни места, ни времени, чтобы этим зани- заниматься. Вместо этого мы предпочтем в каждой конкретной ситуации каждый раз заново определять соответствующее понятие изоморфизма. Например, два множества X и Y, для которых определены операции сложения элементов и умножения элементов на веще- вещественные числа, мы будем называть изоморфными, если сущест- существует такое биективное отображение <р: X -> Y множества X на множество Y (изоморфизм), что Ф (*i + х2) = Ф (*i) + Ф (х2) для любых элементов хи х2 множества X и любого веществен- вещественного числа k. К множествам, для которых определены операция сложения элементов и операция их умножения на вещественные числа, принадлежат, в частности, множество векторов Vect(l) и поле вещественных чисел R. Поэтому высказывание об их изоморф- ности или неизоморфности имеет смысл. С другой стороны, если мы обозначим координату вектора х в базисе е символом ф(#), то тот факт, что координата суммы векторов является суммой координат слагаемых, запишется в виде формулы а тот факт, что при умножении вектора на число его координа- координата умножается на то же число, запишется в виде формулы Ф(/гд;) = Эти формулы означают, что биективное отображение ф яв- является изоморфизмом. Тем самым нами доказана следующая теорема об изоморфизме: Теорема 1. Множество Vect(I) векторов на прямой изо- изоморфно полю R вещественных чисел (по отношению к опера- операциям сложения и умножения на вещественные числа). Соответ-. ствующий изоморфизм определяется выбором некоторого бази- базиса е (и зависит от этого выбора). Изоморфизм Vect(l) ->- R, определенный базисом е, мы бу- будем называть координатным изоморфизмом. Значение понятия изоморфизма состоит в том, что все свой- свойства изоморфных множеств одинаковы (конечно, имеются в виду лишь свойства, относящиеся к рассматриваемому математиче- математическому строению, например, к операциям сложения и умножения. 2 Ма М. Постников 33
на вещественные числа). Таким образом, если некоторые свой- свойства уже доказаны для одного из изоморфных множеств, то мы можем быть уверены, что они выполнены и для другого. В частности, все свойства 1—8, перечисленные в теореме! п. 5 («стандартные свойства»), как известно, выполнены для вещественных чисел. Поэтому они выполнены и для операций над векторами. Таким образом, теорема 1 п. 5 является непосред- непосредственным следствием теоремы о изоморфизме. Мы все же предпочли дать ей прямое доказательство, чтобы четче выяснить геометрическую суть дела (впрочем, при доказательстве свой- свойства 7 мы на самом деле воспользовались координатным изо- изоморфизмом). Подчеркнем, что хотя изоморфные множества и обладают одинаковыми свойствами, отождествлять их целесообразно только тогда, когда между ними существует единственный (естественный) изоморфизм. В частности, как мы уже неодно- неоднократно подчеркивали, отождествление векторов на прямой с ве- вещественными числами неправомерно. § 3. ЛИНЕЙНЫЕ ОПЕРАЦИИ НАД ВЕКТОРАМИ НА ПЛОСКОСТИ И В ПРОСТРАНСТВЕ В этом параграфе мы определяем и изучаем линейные операции (сло- (сложение и умножение на числа) для векторов на плоскости или в пространстве. 1. Определение линейных операций Операция сложения векторов на плоскости и в пространстве у нас фактически уже определена, поскольку все сказанное в п. 4 § 2 пригодно без всяких изменений и для векторов на плос- плоскости и в пространстве. Таким образом, суммой а + Ь двух век- векторов а = АВ и Ъ = ВС называется вектор АС, и это опреде- определение корректно. В случае, когда векторы а и & не параллельны одной прямой, направленный отрезок АС представляет собой диагональ некоторого параллелограмма. Поэтому описанное правило сложения векторов называется часто «правилом парал- параллелограмма». С операцией умножения на число дело обстоит сложнее. Пусть а = АВ — произвольный вектор" (на плоскости или в пространстве), a k — произвольное вещественное число. При а = 0 мы, по определению, положим /г0 = 0. Пусть теперь а ф 0. Тогда определена прямая а = АВ (ибо А фВ), и вектор а мы можем рассматривать как вектор этой прямой (а е Vecta(l)). Поэтому согласно сказанному в пре- 34
дыдущем пункте определен вектор ka e Vecta A). Этот вектор, рассматриваемый как вектор на плоскости (или, соответствен- соответственно, в пространстве), мы и примем за произведение ka вектора а на число k. Другими словами, мы принимаем следующее Определение 1. Произведением ka вектора а = АВ, а Ф О, на число k называется вектор CD, удовлетворяющий следую- следующим двум условиям: а) точки С и D принадлежат прямой а = АВ; б) отношение CD : АВ (оно определено, поскольку направ- направленные отрезки CD и АВ принадлежат одной прямой и АВ Ф 0) равно k: CD: Это определение нуждается, конечно (при а Ф 0), в провер- проверке корректности, т. е. в доказательстве независимости вектора ka от выбора направленного отрезка АВ. Поскольку при k = 0 это очевидно, нам следует при этом рассмотреть лишь случай, когда k Ф 0" (и а ф 0). Другими словами, нужно доказать сле- следующее Предложение 1. Пусть АВ и AiBi — эквиполлентные невы- невырожденные направленные отрезки и пусть CD и CiDi — такие невырожденные направленные отрезки, что 1) отрезок CD расположен на той же прямой, что и отре- отрезок АВ (т. е. прямые АВ и CD совпадают; эти прямые опреде- определены, поскольку А ф В и С Ф D), а отрезок CiDi расположен на той же прямой, что и отрезок AiBu 2) имеет место числовое равенство ад : лД = сЪ: АВ. Тогда отрезки CD и CiDi эквиполлентны. Доказательство. Пусть а — прямая АВ и oci — прямая AiBi. Поскольку отрезки АВ и AiBi эквиполлентны, прямые а и at параллельны. Если они совпадают, то наше предложение сводится к уже известному нам утверждению о корректности умножения на число векторов данной прямой. Поэтому мы мо- можем предполагать, что а Ф ai (и, в частности, А ф Ai). Кроме того, мы без ограничения общности можем считать, что А = С и Ai = d. Поскольку направленные отрезки АВ и AiBi эквиполлентны (и расположены на различных прямых), четырехугольник 2* 35
является параллелограммом. Следовательно, прямые B параллельны. Нам надо доказать, что направленные отрезки CD = AD и CiZ>i = A1D1 эквиполлентны, т. е. что че- четырехугольник ADAiDi также является параллелограммом. Ясно, что для этого достаточно доказать, что прямая DDi па- параллельна прямой АА\. Рассмотрим с этой целью проектирование 8 прямой а на прямую ai параллельно прямой |3 = AAi. По определению,-это проектирование переводит произвольную точку М прямой а в точку М', по которой прямая at пересекается с прямой, парал- параллельной прямой р и проходящей через точку М. В частности, 9(Л) = Л, и 0(Д) = Д,. Заметим, что проектирование 8 определено и для непарал- непараллельных прямых а и cci (нужно лишь, чтобы прямая р не была параллельна ни прямой а, ни прямой ai). Мы будем пользоваться следующими известными свойствами параллельного проектирования (справедливыми и для непарал- непараллельных прямых а и ai): Ш. Если точка М лежит на прямой а между точками Р и Q, то точка M' = Q(M) лежит на прямой <ц между точками Р' = Q(P) uQ' = 0(Q). П2. Для любых четырех точек Р, Q, М и N Ф М прямой а имеет место равенство \P'Q'\:\M'N'\ = \PQ\:\MN\. Из свойств П1 и П2 немедленно вытекает, чтсг при параллельном проектировании отношение направленных отрезков инвариантно, т. е. для любых четырех точек Р, Q, М и N Ф М прямой а имеет место равенство Wo' :m7N' = pq: Ш, где Р/ = 9(Я), Q/ = 9(Q), M' = Q(M), N' = Q{N). Действительно, свойство-П2 обеспечивает сохранение абсо- абсолютной величины отношения, а из свойства Ш следует, что его знак также остается прежним. Вернемся теперь к доказательству предложения 1. Пусть D' — Q(D). По только что сказанному A^D': A~J3i = аЬ:АВ- Но по условию (напомним, что Л = С и А{ = С\). Следовательно, A\D:A\Bi = = AiDi'.AiBih потому A\D' = AiDu 36
Таким образом, D'= D] и, следовательно, прямая DD\ парал- параллельна прямой р = AAi. Тем самым корректность определения вектора ka полностью доказана. 2. Алгебраические свойства линейных операций Теорема 1. Теорема 1 п. 5 § 2 справедлива и для векторов на плоскости или в пространстве, т. е. перечисленные в этой теореме восемь стандартных свойств сложения и умножения на число имеют место и для векторов на плоскости или в про- пространстве. Доказательство. Изложенные в п. 5 § 2 доказательства свойств 1—4 сохраняются без каких-либо изменений. С другой стороны, все фигурирующие в свойствах 5—6 (а также в три- тривиальном свойстве 8) векторы параллельны одной и той же прямой, и потому, если эти свойства верны для векторов на пря- прямой, то они верны и для векторов на плоскости или в простран- пространстве. Таким образом, в доказательстве нуждается лишь свой- свойство 7 (и только для случая, когда векторы а и & не параллель- параллельны одной прямой, a k -ф 0). Пусть а = АВ, Ь = ВС и, следовательно, а + Ь = АС. Да- Далее, пусть ka = ABi (ясно, что без ограничения общности мы можем считать векторы а и ka отложенными от одной точки), kb = BiCi и k(a-\-b) = АС. Нам нужно доказать, что Ci = С Рассмотрим с этой целью проектирование 8 прямой а — АВ на прямую ai = АС параллельно прямой р = ВС (поскольку векторы а и & мы предполагаем не параллельными одной пря- прямой, прямые a, ai и р определены и прямая |3 не параллельна прямым а и ai). При этом проектировании точка А переходит сама в себя, а точка В переходит в точку С. Далее, тругольники ABC и AB\Ci подобны (их углы при вершинах В и Вх одинаковы и они имеют по паре пропорциональных сторон), и потому их углы при вершине А равны. Поскольку прямая АВ совпадает с прямой АВ[, этим доказано, что последние углы либо совпадают, либо являются вертикальными углами. В обоих случаях точка C принадлежит прямой АС. Поскольку, по построению, прямая d параллельна прямой р, это означает, что 8(#i)= Си Поэтому, согласно сказанному в предыдущем пункте, АС[: АС = АВ^ '¦ АВ = k. Но, по определению, 87
Следовательно, АСХ = АС', т. е. С' = СХ. Тем самым наша теорема полностью доказана. В терминологии, введенной в конце п. 5 § 2, теорема 1 озна- означает, что множества VectB) и VectC) векторов на плоскости и в про- пространстве являются линеалами. Замечание 1. Обратим внимание на тот важный факт, что описанные в п. 4 § 1 вложения Vecta(l) cr Vectn B) c=VectC) согласованы с линейными операциями, т. е. результат примене- применения линейных операций, скажем, к векторам из Vectn B) не за- зависит от того, рассматриваются ли эти векторы как векторы на плоскости или как векторы в пространстве. Для сложения этот факт вытекает ггЗ того, что оно определяется единым об- образом как для векторов на,прямой, так и для векторов на плос- плоскости или в пространстве, а для умножения на число — из того, что, по определению, оно сводится к умножению на число векто- векторов на прямой. Иначе этот факт можно выразить, сказав, что подмножества Vecta(l) и Vectn B) множества VectC) (а также подмножества Vecta(l) множества VectB)) замкнуты относительно линейных операций, действующих в множестве VectC) (соответствено, в множестве VectB)), т. е. если векторы а и Ь из VectC) (из VectB)) принадлежат, скажем, подмножеству Vecta(l) то их сумма а + Ь и произве- произведение ka вектора а на произвольное число k также принадле- принадлежат подмножеству Vecta(l). Еще иначе, мы можем сказать, что естественное биективное отображение, скажем, множества Vectn B) в множество Vect C) является изоморфизмом (по от- отношению к линейным операциям) множества Vectn B) на под- подмножество множества VectC), состоящее из векторов, парал- параллельных плоскости П. 3. Линейная зависимость Определение 1. Семейство {п\, ..., а^} векторов (произволь- (произвольного линеала) называется линейно зависимым, если суще- существуют такие числа k\, ..., kN, не все равные нулю, что Допуская определенную вольность речи, часто в этой ситуации говорят, что линейно зависимы векторы Oi, ..., а#. (Воль- 38
ность здесь состоит в том, что на самом деле линейно зависи- зависимы не векторы, а линейно зависимо их семейство, рассматривае- рассматриваемое как единый математический объект.) Выражение kicti -\- ... + kNaN называется линейной комби- комбинацией векторов fli, ..., fljv с коэффициентами ki, ..., kN. Если ki — . .. — kN = 0, то линейная комбинация называется тривиальной, в противном случае — нетривиальной. Таким обра- образом, векторы fli, ..., aN линейно зависимы, если существует не- нетривиальная линейная комбинация этих векторов, равная нулю. Если вектор а равен некоторой линейной комбинации векто- векторов fli, ..., aN, то говорят, что он линейно выражается через эти векторы, а также что он линейно зависит от этих векторов. В частности, нулевой вектор 0 линейно выражается через лю- любое семейство векторов, поскольку он равен тривиальной линей- линейной комбинации этих векторов. Очевидно, что если вектор а линейно выражается через векторы а\, ..., aN, а каждый из этих векторов линейно выражается через векторы Ъ\, ..., Ьм, то вектор а линейно выражается через векторы Ьи ..., Ъм. Несмотря на свою тривиальность, это свойство отношения «линейно выражается» играет очень важную роль. Оно назы- называется свойством транзитивности. Во избежание излишних оговорок, удобно ввести в рассмот- рассмотрение также пустое семейство векторов. По определению, от пустого семейства векторов линейно зависит только нулевой . вектор. Пустое семейство линейно независимо. Действительно, семейство векторов {а*} линейно независимо, если 2 i = 0 не существует такого индекса i, что kt Ф 0. Ясно, что эта формулировка сохраняет смысл (и верна) и тогда, когда мно- множество индексов i пусто. Легко видеть, что любое семейство {а,\, ..., aN), содержащее линейно зависи- зависимое подсемейство {а,- , ..., а,-п}, само линейно зависимо. Действительно, по условию, существует равная нулю линей- линейная комбинация векторов подсемейства, не исе коэффициенты которой равны нулю. Добавив к этой линейной комбинации остальные векторы семейства с нулевыми коэффициентами, мы, очевидно, и получим равную нулю нетривиальную линейную комбинацию векторов аи ..., aN. С другой стороны, ясно, что семейство, состоящее из одного вектора а, тогда и только тогда линейно зависимо, когда этот вектор равен нулю. 39
Следовательно, в частности, любое семейство, содержащее нулевой вектор, линейно за- зависимо. Далее, легко видеть, что векторы Oi, ..., ajv тогда и только тогда линейно зависимы, когда один из них линейно выражается через остальные. Действительно, если kxax + ••• +kNaN = 0 и, скажем, kx фО, то al = [ — ~ja2-{- ... + (— -~-^aN. Обратно, если «1 = /2«2 + • • • + lNaN> то (—!)«! + ка2 + • • • + haN = 0. при- причем — 1 Ф 0. Важным уточнением последнего утверждения является сле- следующее Предложение 1. Векторы аи ..., aN тогда и только тогда ли- линейно зависимы, когда один из них линейно выражается через векторы с меньшими номерами. Доказательство. Если а^ = 0, то этот вектор линейно выражается через пустое множество векторов с меньшими но- номерами. Поэтому в этом случае предложение справедливо. Пусть щ Ф 0. Если векторы аи ..., <Zn линейно зависимы (и аьфО), то существует такое число п>1, что векторы аи ..., ап линейно зависимы, а векторы аи ..., an_i уже ли- линейно независимы. Пусть ku ..., kn — такие числа, не все рав- равные нулю, что Поскольку векторы аг ап~\ линейно независимы, число должно быть отлично от нуля. Следовательно, так что вектор ап действительно является линейной комбина- комбинацией векторов ау, ..., on_i с меньшими номерами. Обратное утверждение очевидно. Следствие. Векторы аь ..., aN тогда и только тогда ли- линейно зависимы, когда либо линейно зависимы векторы аь ..., fliv-ь либо вектор aN линейно выражается через век- горы ai fljv-i. Предложение 2. Векторы аи ..,, aN тогда и только тогда линейно независимы, когда любой вектор а, линейно выражаю- выражающийся через эти векторы, выражается через них единственным образом. Доказательство. Если векторы а\ aN линейно за- зависимы, то, скажем, нулевой вектор двумя разными способами линейно выражается через эти векторы: в виде тривиальной и нетривиальной линейных комбинаций. 40
Обратно, если для некоторого вектора а имеют место ра- равенства где хотя бы для одного индекса i коэффициент &, отличен от коэффициента /,-, то (А,-/,)о,+ ... +(kN-lN)aN*=O и, следовательно, векторы аь ..., aN линейно зависимы. Докажем в заключение следующую трудную, но важную теорему о зависимости: Теорема 1. Пусть каждый вектор семейства аи ..., ov A) линейно выражается через векторы Ь1з...,Ьм. B) Тогда, если N > М, то векторы аи ..., aN линейно зависимы. Доказательство. Прежде чем доказывать эту теорему, мы докажем следующую вспомогательную лемму. Лемма. Если условия теоремы 1 выполнены и семейство A) линейно независимо, то для любого 5 = 0, ..., М суще- существует семейство векторов <f ,.-¦,<>, C) обладающее следующими свойствами: а) каждый вектор семейства A) линейно выражается че- через векторы C); б) первые s векторов семейства C) совпадают с первыми s векторами семейства A): Мы докажем эту лемму индукцией по числу s. При s = О она очевидна (за семейство C) можно принять семейство B)). Пусть она уже доказана для числа s. Рассмотрим семейство Это семейство линейно зависимо, ибо вектор as+i линейно вы- выражается через векторы c\s) с($. Поэтому согласно пред- предложению 1 один из векторов семейства D) линейно выра- выражается через предыдущие. Этим вектором не может быть век- вектор fls+1) ибо он по условию отличен от нуля (семейство A) линейно независимо). Им не может быть и ни один из векто- векторов c\s\ ..., с<5>, ибо это снова противоречит линейной неза- независимости векторов A) (см.- условие б)). Следовательно, не- 41
который вектор c[s\ i > s, линейно выражается через векторы as+v cis)> •••> C(-i- Удалим теперь из семейства D) вектор c\sK Полученное семейство обладает, очевидно, тем свойством, что через него линейно выражается любой вектор семейства C), а следовательно, в силу свойства транзитивности, и любой век- вектор семейства A). Другими словами, полученное семейство (состоящее из М векторов) обладает свойством а). Кроме того, оно содержит первые s+1 векторов семейства A) (ибо i>s), т. е. по отношению к числу s+1 оно обладает и свойством б) (после, конечно, соответствующей перестановки его членов). Тем самым по индукции лемма полностью до- доказана. Перейдем теперь непосредственно к доказательству теоремы 1. Предположим, что эта теорема неверна, т. е. что семейство A) линейно независимо. Тогда к этому семейству будет при- применима доказанная лемма. Но при s = М эта лемма дает, что каждый вектор семейства A) и, в частности, вектор aN ли- линейно выражается через векторы аи ..., ам. Поскольку N >¦ М, зто означает, что система A) линейно зависима. Полученное противоречие доказывает теорему. Замечание 1. Во всем этом пункте мы пользовались лишь восемью стандартными свойствами линейных операций. Поэтому все полученные здесь результаты справедливы для элементов любого линеала. 4. Геометрический смысл линейной зависимости Определение 1. Векторы на плоскости или в пространстве называются коллинеарными, если они параллельны (см. п. 4 § 1) одной и той же прямой. Все векторы на прямой колли- неарны по определению. Предложение 1. Два вектора а и Ь (на прямой, на пло- плоскости или в пространстве) тогда и только тогда коллианеарны, когда они линейно зависимы. Доказательство. В случае векторов на прямой для лю- любых векторов а ф 0 и Ъ определено их отношение Ь : а = k. Поэтому Ъ = ka и, следовательно, векторы а и Ь линейно за- зависимы. Если а = 0, то векторы а и Ь линейно зависимы по общим соображениям. Таким образом, любые два вектора на прямой линейно зависимы. С другой стороны, любые два век- вектора на прямой, по-определению, коллинеарны. Таким образом, для векторов на прямой наше предложение справедливо. Рассмотрим теперь случай плоскости или пространства. Если векторы а и Ъ параллельны некоторой прямой, то, как мы знаем, их можно отождествить с векторами на этой прямой. Следовательно, по доказанному, эти векторы линейно зависимы (на прямой, а потому, и на плоскости или, соответственно, в 42
пространстве). Обратно, если векторы а и Ъ линейно зависимы, то один из них (скажем, вектор 6) выражается через другой вектор (вектор а), т. е. существует такое число k, что Ь = ka. Пусть а¦— такая прямая, что aeVecta(l). Тогда, по определе- определению, &asVecta(l), т. е. 6sVecta(l). Таким образом, векторы а и Ъ параллельны одной и той же прямой а. Согласно общим результатам п. 3 доказанное предложение может быть сформулировано также в следующем виде: Векторы а и b тогда и только тогда коллинеарны, когда существует такое число k, что либо Ь = ka, либо а = kb. В частности, мы видим, что на прямой отношение линейной зависимости «вырождается», в том смысле, что любое семей- семейство векторов на прямой, состоящее более чем из одного век- вектора, линейно зависимо. Вместе с тем, на прямой существуют линейно независимые семейства, состоящие из одного вектора (таковыми являются семейства, состоящие из одного отлич- отличного от нуля вектора). Посмотрим теперь, как обстоит дело на плоскости. Во-пер- Во-первых, ясно, что на плоскости существуют линейно независимые семейства, состоящие из двух векторов. Действительно, чтобы построить такое семейство, достаточ- достаточно взять три точки О, А я В, не лежащие на одной прямой, и рассмотреть векторы а = О А и 6 = ОВ. По построению эти векторы не коллинеарны. Следовательно, они линейно незави- независимы. С другой стороны, легко видеть, что любое семейство векторов на плоскости, состоящее более чем из двух векторов, линейно зависимо. Согласно результатам п. 3 это утверждение достаточно до- доказать для семейства, состоящего из трех векторов. Пусть а, Ъ и с — произвольные векторы на плос- плоскости. Если векторы а и Ь коллинеар- коллинеарны, то они линейно зависимы и пото- потому линейно зависимы и векторы а, о, с. Следовательно, без ограничения общ- общности мы можем предполагать, что векторы а и Ь не коллинеарны (и, по аналогичным соображениям, что не коллинеарны векторы а и с, а также векторы бис). Пусть О — произвольная точка рассматриваемой плоскости и пусть а = О А, Ь = ОВ и с = ОС. Так как векторы а и 6 не коллинеарны, то точки О, А и В не расположены на одной пря- прямой, т. е. прямые a = О А и р = ОВ различны. Кроме того, точ- точка С не принадлежит ни одной из этих прямых (ибо в против- 43
ном случае вектор с был бы коллинеарен либо вектору а, либо вектору Ь). Пусть Pi — прямая, проходящая через точку С парал- параллельно прямой р, а А\ — ее точка пересечения с прямой а (ясно, что прямые а и Pi не параллельны). По определению, С другой стороны, поскольку точка А\ принадлежит прямой а, а вектор а отличен от нуля, существует такое число k, что OAi — ka. Аналогично, поскольку вектор А\С параллелен пря- прямой C, существует такое число /, что А{С = 1Ъ. Следовательно, и векторы а, Ь, с линейно зависимы. Определение 2. Векторы в пространстве называются ком- компланарными, если они параллельны одной и той же плоскости. Все векторы на прямой или на плоскости компланарны по опре- определению. Очевидно, что любые два вектора компланарны. Для трех векторов это уже не так. Предложение 2. Три вектора а, Ь и с (на прямой, на пло- плоскости или в пространстве) тогда и только тогда компланарны, когда они линейно зависимы. Доказательство. Тот факт, что три компланарных век- вектора линейно зависимы, непосредственно вытекает из того, что любые три вектора плоскости (или прямой) линейно зависимы. Поэтому нам нужно доказать лишь обратное, т. е. что три ли-, нейно зависимых вектора компланарны. При этом нам доста- достаточно рассмотреть лишь случай пространства. Итак, пусть а, Ь, с — три линейно зависимых вектора в про- пространстве. Один из этих векторов (скажем, вектор с) линейно выражается через другие (т. е. через векторы а и Ь). Таким образом, существуют такие числа k и /, что Для векторов а и b существует плоскость, которой они па- параллельны, т. е. такая плоскость П, что aeVectnB) и бе eVectnB). Но тогда йа е VectnB), /6eVectnB) и потому ka-\- lb e VectnB), т. е. ceVectnB). Следовательно, все три вектора а, Ь и с параллельны одной и той же плоскости П, т. е. эти векторы компланарны. Из предложения 2 немедленно вытекает, что в пространстве существуют линейно независимые семейства, состоящие из трех векторов. 44
Действительно, чтобы построить такое семейство, достаточно взять четыре точки О, А, В и С, не расположенные на одной плоскости, и рассмотреть векторы а — ОА, Ь — ОВ и с=ОС. Эти векторы не компланарны и потому, по доказанному, ли- линейно независимы. Вместе с тем, как мы сейчас покажем, любое семейство векторов в пространстве, состоящее более чем из трех векторов, линейно зависимо. Достаточно доказать это утверждение для семейства из че- четырех векторов а, Ь, с и d, никакие три из которых не компла- компланарны. Пусть а = ОА, Ь — ОВ, с = ОС и d = OD. Проведем через точку D прямую, параллельную вектору с. Эта прямая пересе- пересекает плоскость ОАВ в некоторой точке Сь По определению Вектор ОС\ расположен в плоскости ОАВ и потому согласно доказанному выше линейно выражается через неколлинеарные векторы а — ОА и 6 = ОВ. С другой стороны, вектор C\D па- реллелен прямой ОС и потому линейно выражается через век- вектор с = ОС. Следовательно, вектор d линейно выражается через векторы а, Ь, с, так что векторы а, Ъ, с, d линейно зависимы. Замечание 1. Доказанные результаты делают совершенно тривиальной теорему о зависимости из п. 3. Действительно, например, для векторов в пространстве эта теорема при М > 2 автоматически верна, ибо любая система векторов, состоящая более чем из трех векторов, линейно зависима. При М = 2 она утверждает (в не ограничивающем общности предположении ли- линейной независимости векторов Ъи . . . , Ьм), что любая система компланарных векторов, состоящая более чем из двух векторов, линейно зависима, а при М = 1, — что линейно зависима любая система коллинеарных векторов, состоящая более чем из одного вектора. Следует, однако, иметь в виду, что в п. 3 мы доказали тео- теорему о зависимости, пользуясь только стандартными свойст- свойствами 1—8 (и потому можем быть уверены в ее справедливо- справедливости для любого линеала), тогда как теперь мы существенно использовали геометрические соображения. Подводя итоги, мы можем сформулировать полученные ре- результаты в виде следующей окончательной теоремы: Теорема 1.В линеале Vect(n), л= 1, 2, 3,- существует п ли- линейно независимых векторов, тогда как любое семейство, со- состоящее из большего числа векторов, линейно зависимо. Здесь d=l в случае прямой, п — 2 в случае плоскости и 1 = 3 в случае пространства. 45
5. Базисы и координаты Определение 1. Семейство п линейно независимых векторов линеала Vect(n) называется базисом (соответственно — на пря- прямой, на плоскости или в пространстве) '). . Таким образом, на прямой (в Vect(l)) базис состоит из одного отличного от нуля вектора, на плоскости (в VectB))— из двух неколлинеарных векторов, а в пространстве (в VectC)) — из трех некомпланарных векторов. Определение 2. Семейство векторов некоторого линеала мы назовем полным, если любой вектор из этого линеала линейно выражается (вообще говоря, не единственным образом) через векторы этого семейства. Легко видеть, что любое полное семейство векторов из Vect(n) содержит не менее п векторов. Действительно, пусть аи ..., a,v ¦—данное полное семейство векторов и пусть еь ..., еп — произвольный базис в Vect(n). По условию, каждый вектор базиса в\, ..., еп линейно выражается через векторы аи...,а^. Поэтому, если N < п, то в силу теоремы о зависимости век- векторы еи ..., еп были бы линейно зависимы, что противоречит определению базиса. Следовательно, N ^п. Далее, легко видеть, что если полное семейство векторов «1 aN A) линейно зависимо, то из него можно удалить один вектор так, чтобы оставшееся семейство было также полно. Действительно, если семейство линейно зависимо, то хотя бы один вектор этого семейства линейно выражается через остальные. Пусть, для определенности, это — вектор aN. Тогда каждый вектор семейства A) будет линейно выражаться че- через векторы семейства - аь ..., а^. B) Поэтому в силу транзитивности свойства «линейно выражаться» (см. п. 3 § 3) любой вектор, линейно выражающийся через се- 4) Обратим внимание на то, что при п = 1 это определение формально отличается от принятого в п. 1 § 2, где базисом на прямой назывался произ- произвольный отличный от нуля вектор на этой прямой, тогда как теперь базисом называется семейство векторов на прямой, состоящее из одного отлич- отличного от нуля вектора. С точностью до этого формального различия наше общее определение базиса при п = 1 совпадает с определением ю п. 1 § 2. 46
мейство A), будет линейно выражаться и через семейство B). Следовательно, если семейство A) полно, то семейство B) также полно. Рассмотрим теперь следующие три свойства семейств век- векторов из Vect(rt): 1) семейство линейно независимо; 2) семейство полно; 3) семейство состоит из п векторов. Оказывается, что любые два из трех свойств 1), 2), 3) влекут за собой третье. Действительно, если выполнены свойства 1) и 2), то по тео- теореме из п. 4 число N векторов этого семейства не больше п (в силу линейной независимости), а по только что доказанному утверждению оно и не меньше N (в силу полноты). Следова- Следовательно, N = п. Пусть теперь выполнены свойства 1) и 3). Тогда для лю- любого вектора aeVect(n) семейство е,, ..., еп, а линейно за- зависимо и потому хотя бы один вектор этого семейства линейно выражается через векторы с меньшими номерами (предложе- (предложение 1 п. 3). Поскольку этим вектором не может быть ни один из векторов еь ..., еп (ибо векторы в\, ..., еп по условию ли- линейно независимы), то, следовательно, вектор а линейно выра- выражается через векторы г\, ..., е„. Таким образом, семейство еь ¦ • •, е„ полно. Наконец, если для семейства векторов выполнены свойства 2) и 3), то оно не может быть линейно зависимым, потому что в противном случае, удалив из этого семейства некоторый век- вектор, мы получим полное семейство, состоящее из п — 1 векто- векторов, что невозможно. По определению, семейство, обладающее свойствами 1) и 3), является базисом. Следовательно, доказанное утверждение можно переформулировать в виде следующего предложения: Предложение 1. Семейство векторов из Vect(n) является базисом, если оно либо а) линейно независимо и состоит из п векторов, либо б) полно и состоит из п векторов, либо в) линейно независимо и полно. Определение 3. Пусть еь ..., еп — произвольный базис в Vect(n). Координатами вектора aeVect(n) в этом базисе на- называются такие числа ') а1 ап, что a = a*el+ ... + апеп. ') Здесь верхние индексы являются номерами, но не показателями сте- степени. 47
Существование координат обеспечивается полнотой базиса, а их единственность — линейной независимостью 'базиса (пред- (предложение 2 п. 3). Таким образом, при п=1 а = а[еь при п = 2 а = ахех + а2е2, и при я = 3 а = а1ех + а2е2 + а3е3. Вектор а с координатами а1, ..., ап мы будем иногда обо- обозначать символом а(а{, ..., ап) или просто (а1, ..., а"). Подчеркнем, что это обозначение правомерно только при фиксированном (и явно указанном) базисе. Если а = (а1, .. ., ап) и Ь = (ft1, ..., Ьп), т. е. если д = а1е1+ ... +areem & = 6'е,+ ¦¦• +Ь'геп, то а _|_ Ь = а'е, + ... + а"в„ + ble{ + ... + Ъпеп = = (а> + 61)е1+ ••• +(«ra + ^)ere> и ?а = й(а'е, + ... + аЛв„) = Это показывает, что числа а1 + Ь{, ..., ап + Ьп являются ко- координатами вектора a -f- Ъ, а числа ka1, .... йап — координа- координатами вектора ka. Таким образом, при сложении векторов их координаты складываются, а при умножении вектора на число — умножаются на это число. Чтобы описать эту ситуацию в терминах изоморфизма (ср. п. 6 § 2), мы введем в рассмотрение множество Rn, элементами которого являются n-членные последовательности (а1, ..., а") вещественных чисел. Таким образом, множество R2 состоит из пар (а1, а2), а множество R3 — из троек (а1, а2, а3). Что же касается мно- множества R1, то оно состоит из одночленных последовательностей вида (а1). Но каждую такую последовательность мы можем отождествить с соответствующим числом а1 и, следовательно, множество R1 мы можем считать совпадающим с множеством R вещественных чисел. Мы введем в множестве Rn операции «покомпонентного сло- сложения» и «покомпонентного умножения на число»: (а1 ап) + (Ъ\ ..., 6ге) = (а1 + 61, ..., сп + П k(al an) = (ka\ ..., kan). 48
Легко видеть, что эти операции обладают всеми восемью стандартными свойствами линейных операций над векторами, т. е. относительно этих операций множество R" является ли- линеалом '). Замечание 1. Обратим внимание на то, что множество R" имеет смысл рассматривать при любом натуральном п, хотя нам здесь нужны только значения п = 1, 2 и 3. Линеал R" мы будем называть стандартным (или арифмети- арифметическим) линеалом. Он обладает естественным базисом, состоящим из последовательностей A, 0, 0, . . ., 0), @, 1, 0, ..., 0), . .. ..., @, 0, ..., 0, 1). Этот базис мы будем называть стандарт- стандартным базисом линеала R". Например, при п = 3 стандартный базис имеет вид A, 0, 0), @, 1, 0), @, 0, 1), а при п = 2 — вид О, о), (о, 1). При п = 1 стандартный базис состоит из одноэлементной по- последовательности A), т. е. из числа 1. Тот факт, что стандартный базис действительно является базисом, немедленно вытекает из очевидного соотношения (мы ограничиваемся случаем п = 3) (а1, а2, а*) = ах(\, 0, 0) + а2@, 1, 0) + а3@, 0, 1). Сопоставление произвольному вектору aeVect(n) последо- последовательности (а1, ..., ап) его координат (в некотором базисе еь ..., еп) определяет, очевидно, биективное отображение мно- множества Vect(rt) на множество Rn, переводящее, согласно ска- сказанному выше, сумму в сумму и произведение на число в про- произведение на то же число. Другими словами, это соответствие является изоморфизмом линеала Vect(n) на линеал Rn. Мы будем называть его координатным изоморфизмом, определен- определенным базисом е,, . . ., еп. Этот изоморфизм переводит базис еи ..., е„ линеала Vect(n) в стандартный базис линеала R". Таким образом, справедлива следующая т еор е м а об изо- изоморфизме, обобщающая аналогичную теорему из п. 6 § 2: ') Поэтому, в частности, для элементов множества Rn имеют смысл введенные в п. 3 понятия (линейной зависимости, независимости и т. п.), причем доказанные в п. 3 свойства этих понятий остаются справедливыми и Для элементов множества R" (при любом п). Это замечание будет нам полезно ниже при оперировании с матрицами, поскольку строки и столбцы матриц можно рассматривать как элементы из к (при соответствующем п). 49
Теорема 1. Для любого п = 1, 2, 3 линеал Vect (л) изо- изоморфен линеалу Rn. Соответствующий изоморфизм Vect (л) —> —> Rге определяется выбором в Vect (к) некоторого базиса еь ..., е„ (ы зависит от этого базиса). Поскольку координатный изоморфизм не является естествен- естественным (он зависит от выбора базиса), отождествлять с его по- помощью линеалы Vect (я) и R", вообще говоря, неправомерно. Однако, если базис фиксирован, такое отождествление иногда бывает удобно. Упражнение. Докажите, что любой изоморфизм линеала Vect(n) на ли- линеал Rn является координатным изоморфизмом, определенным некоторым базисом.¦ 6. Проекции и координаты Мы ввели координаты векторов довольно формальным алге- алгебраическим определением1). Дадим теперь их описание, имею- имеющее более геометрический характер. Рассмотрим сначала векторы на плоскости. Пусть а и р — две непараллельные прямые на плоскости. Для произвольного вектора а = АВ рассмотрим две пря- прямые, параллельные прямой C, одна из которых проходит через точку А, а другая — через точку В. Пусть А' и В' — точки пере- пересечения этих прямых с прямой а. Определение 1. Вектор А'В' называется проекцией вектора а на прямую а параллельно прямой р и обозначается симво- символом рг?а. Это определение нуждается, конечно, в проверке коррект- корректности, т. е. в доказательстве того, что вектор рг^а не зависит от выбора направленного отрезка АВ, представляющего вектор а. Мы докажем корректность определения 1 алгебраическим способом, что позволит нам, кроме того, связать проекции с ко- координатами. Упражнение. Докажите корректность определения 1 прямым геометри- геометрическим построением, аналогично тому, как в п. 1 была доказана коррект- корректность определения вектора ka. Как мы знаем, линеалы Vecta(l) и Vectp(l), рассматривае- рассматриваемые как подмножества линеала Vect B), пересекаются только по нулевому вектору (см. п. 4 § 1). Отсюда следует, что если некоторый вектор а разложен в сумму fl = o,+ о2, a,sVecta(l), a2eVectp(l), A) то это разложение единственно. ') Зато все результаты п. 5 справедливы для любого линеала, обла- обладающего (по отношению к данному числу п) свойством, описанным в тео- теореме 1 п. 4. 50
Действительно, если = а\ где йь a[eVecta(l), а a2, a2eVecta(l), то а\ — щ=а2 — а2. Но а[ — «1 е Vecta(l) и a2 — fl2 ^ Vectp(l). Таким образом, век- вектор ai —ai = a2 —иг принадлежит обоим линеалам Vecta(l) и Vectg(l) и потому равен нулю. Следовательно, a{ = ai, a,2 = a?. Вернемся теперь к вектору рг$а = А'В'. По определению суммы векторов а = ЛВ = А^В' + (Шв - ЛМ). B) Так как вектор А'В' = рг^а принадлежит линеалу Vecta(l), а вектор В'В — А'А — линеалу Vectp(l) (по построению, ли- линеалу Vectp A) принадлежат как вектор В'В, так и вектор А А), то разложение B) имеет вид A) и, следовательно, по доказан- доказанному, однозначно определено. В частности, вектор А'В' одно- .значно определен вектором а. Тем самым корректность определения 1 полностью доказана. Одновременно мы дока- доказали, что проекция рг^ а совпадает с вектором а.\ в разложе- разложении A). . Что же касается второго слагаемого а2, то по аналогичным соображениям этот вектор совпадает с проекцией рг^ а вектора a на прямую C параллельно прямой а. Таким образом, справед- справедливо следующее Предложение 1. Для любого вектора а е Vect B) имеет ме- место разложение a = prPa + pr«a. C) Проекция prga обладает тем свойством, что вектор параллелен прямой р. Этим свойством проекция рг| а характери- характеризуется однозначно. Замечание 1. Мы видим, в частности, что проекция pr^a зависит только от направления прямых а и р, т. е. не изме- изменится, если мы эти прямые заменим параллельными. Поэтому часто говорят о проекции не на прямую а, а на направление прямой а (см. сноску на стр. 17). Направление прямой а однозначно задается произвольным, базисом «1 линеала Vecta(l), т. е. произвольным отличным от 51
нуля вектором, параллельным этой прямой. Поэтому проекцию ргР а часто называют проекцией на направление вектора ех. Аналогично, направление прямой р однозначно, задается произвольным базисом е2 линеала Vect|j(l), и потому проекцию рг^а можно называть проекцией параллельно вектору е2 (или проекцией по направлению вектора е2). Введя в рассмотрение вместо прямых а и |3 векторы ех и е2, естественно обозначать проекцию pr^fl символом рг^2а. Векторы в\ и е2 составляют, очевидно, базис на плоскости (их два и они неколлинеарны, т. е. линейно независимы). Резюмируя все сказанное, мы получаем, что задание на плоскости произвольного базиса еи е2 позволяет сопоставить каждому вектору а два вектора (проекции этого вектора на направление одного из векторов базиса параллельно другому вектору), сумма которых равна данному вектору: e = prj;a + prj;a. D) Сопоставим теперь разложение D) с разложением a = a'ei + a2e2 E) вектора а по векторам базиса. Поскольку a'ej e Vecta A) и a2e2 e Vecto(l), разложения D) и E) должны совпадать: pr? a = a'e,, рг^; а = а2е2. Таким образом, координата а1 вектора а в базисе eit e2 равна отношению его проекции на направление вектора в\ параллельно вектору е2 к вектору в\. ' () Приняв вектор в\ за эталон длины (и направления) на пря- прямой а, мы можем это утверждение сформулировать также сле- следующим образом: координата а1 равна величине проекции вектора а на на- направление вектора в\ параллельно вектору е2. Конечно, аналогичные утверждения справедливы и для вто- второй координаты а2. В частности, В пространстве возможны два вида проекций: проекция на плоскость параллельно прямой и проекция на прямую парал- параллельно плоскости. 52
Пусть П и а,— плоскость и не параллельная ей прямая и пусть а = АВ — произвольный вектор в пространстве. Прове- Проведем через точки А я В плоскости, параллельные плоскости П. Пусть Ах и Bi—точки пересечения этих плоскостей с пря- прямой а. Определение 2. Вектор АХВ\ называется проекцией вектора а на прямую а параллельно плоскости П и обозначается сим- символом prja. Аналогично, если мы проведем через точки А и В прямые, параллельные прямой а, и рассмотрим точки пересечения Л2 и В2 этих прямых с плоскостью П, то мы получим вектор А2В2. Определение 3. Вектор А2В2 называется проекцией вектора а на плоскость П параллельно прямой а и обозначается симво- символом рг^а. Предложение 2. Для любого вектора aeVectC) имеет ме- место разложение a = prnfl + pr«fl. F) Проекция pr^a обладает тем свойством, что вектор а - pr° a параллелен плоскости П, а проекция рг^ а — тем свойством, что вектор параллелен прямой а. Этими свойствами проекции prJ а и pr^ a характеризуются однозначно. Доказательство этого предложения полностью аналогично доказательству предложения 1 и поэтому мы его опустим. Обратим внимание на то, что предложение 2 обеспечивает, в частности, корректность определений 2 и 3. Упражнение. Докажите корректность определений 2 и 3 прямым геомет- геометрическим построением. Проекции pr^a и pr^a зависят только от направлений прямой а и плоскости П, т. е. не меняются при замене этой прямой или этой плоскости параллельными прямой или пло- плоскостью. Поэтому вместо задания прямой а достаточно за- задать произвольный ее базис е\, а вместо задания плоскости П—произвольный ее базис е%, е3. В этом случае проекция prjfl обозначается символом рг?г- ез а, а проекция pr^a — сим- символом рг<;> 0 а. Для того чтобы проекции рг^2- е*а и тртр е а были определены, необходимо и достаточно, чтобы векторы еь е2, е3 образовы- образовывали базис. 53-
С координатами а1, а2, а3 вектора а в базисе еи е2, >екции рг%"е*а и рг*1' а связаны формулами проекции pr^ Таким образом, в частности, координата а1 вектора а в базисе eh e2, е3 равна отноше- отношению его проекции на направление вектора в\ параллельно век- векторам, е2 и е3 к вектору е{. Конечно, аналогичные формулы а2 = (рг *• •« й): е2, имеют место и для остальных двух координат. Из установленной связи между проекциями и координатами немедленно вытекают следующие свойства проекции: 1. Проекция суммы векторов равна сумме проекций сла- слагаемых: рг(а + &) — prfl + ргй. 2. Проекция произведения вектора на число равна произве- произведению его проекции на это число: pr (ka) = k prfl. В этих свойствах имеются в виду все три типа проекций Упражнение. Докажите свойства 1 и 2 прямым геометрическим построе- построением и затем выведите отсюда свойства координат. 7. Преобразование координат при замене базиса В заключение этого параграфа рассмотрим вопрос о том, как изменяются координаты векторов при изменении базиса. Пусть еи еп и еу, ..., еп> — два базиса ¦) в Vect (n) {где, как всегда, п = 1, 2 или 3). Поскольку еь . .., еп является базисом, каждый вектор из Vect (n) и, в частности, каждый вектор ей, ..., еп> линейно выражается (и притом единственным образом) через векторы еи ..., еп. ') Обратите внимание на положение штрихов-. -54
Это означает, что существуют такие (однозначно определен- определенные) числа с\„ i, /'= 1» • • •> п> что A) Таким образом, например, при п — 2 ev = с\,е1 + с\,е2, в2' == С2'в\ "Ь С2'б2- При фиксированном г'=1, ..., « числа cj, представляют собой координаты вектора ev в базисе еь ..., е„. Числа с1., мы будем записывать в виде матрицы располагая координаты векторов ev, ..., еп> в базисе е{...,еп по столбцам. Определение 1. Матрица С называется матрицей перехода от «старого» базиса еь ..., еп к «новому» базису ev, ¦¦-, еп'. При п = 1 матрица перехода сводится к одному числу с\, (ср. конец п. 3 § 2), при п = 2 имеет вид С = а при п = 3 — вид~ = Используя матрицу перехода С, можно формулы A) «пе- «перехода от старого базиса к новому» записать в компактном виде, если ввести в рассмотрение однострочечные матрицы е = (еи ..., еп), е' = (еу еп>), состоящие из векторов данных базисов. По правилу умножения матриц ') произведение еС матриц е и С совпадает, очевидно,. . с матрицей е'. Таким образом, е' = еС. *) Произведение матрицы с векторными элементами на обыкновенную Матрицу (с числовыми элементами) определяется той же (известной из ал- алгебры) формулой, что и произведение числовых матриц. : „ 55-
Отсюда сразу же вытекает, что для любых трех базисов '¦ (i) еь ..., еп, (ii) ev, .... еп' и (iii) ei» еП" матрица перехода С" от базиса A) к базису C) равна произ- произведению СС' матрицы перехода С от базиса A) к базису B) на матрицу перехода С от базиса B) к базису C). Действительно, так как е' = еС, е" = е'С, то е" = (еС) С = е (СС), и потому СС' — С", поскольку равенство е" = еС" однозначно определяет матрицу С". В частности, мы видим, что матрица С перехода от базиса еу, ..., еП' к базису е{, ..., еп связана с матрицей С перехода от базиса еь ..., еп к базису ер, ..., еп> формулой СС/^Е (поскольку единичная матрица Е является, очевидно, матри- матрицей перехода от базиса еь ..., е„ к самому себе). Аналогично показывается, что СС = Е. Это означает, что С является обратной матрицей С~'. Таким образом, матрицей перехода от базиса ev, . ¦ ., еП' к базису еу еп является матрица С~ , обратная к матрице перехода С от базиса еи ..., еп к базису ev, ..., еП'. Поскольку обратная матрица может существовать только у невырожденных матриц (имеющих отличный от нуля определи- определитель), тем самым, в частности, доказано, что любая матрица перехода от одного базиса к другому яв- является невырожденной матрицей. Является ли условие невырожденности достаточным для того, чтобы данная квадратная матрица С порядка п была бы мат- матрицей перехода между некоторыми базисами? Ответ на этот вопрос является утвердительным; более того, оказывается, что первый базис еь . .. , е„ можно при этом взять произвольно. Именно, легко видеть, что для любого базиса ei, ..., еп и любой невырожденной мат- матрицы С = {с\^ порядка п существует такой базис еу, ..., еП', что матрица С является матрицей перехода от базиса - eit ... .... еп к базису еу, ..., еп>. 56
Действительно, по данным векторам еь ..., еп и данной матрице С определим векторы еу, ..., еп> формулами A). До- Достаточно доказать, что полученные таким образом векторы линейно независимы. Но это ясно, поскольку в противном слу- случае столбцы матрицы С были ли линейно зависимы, что ввиду ее невырожденности невозможно. Замечание 1. В последнем рассуждении мы использовали тот известный из теории определителей факт, что определитель с линейно зависимыми столбцами {или строками) равен нулю. Обратим внимание на то, что теперь мы можем доказать и обратное утверждение, т. е. что определитель с линейно независимыми столбцами (или строками) отли- отличен от нуля. Действительно, пусть С = (с^) — матрица .данного определителя. Рас- Рассмотрим в Vect(n) произвольный базис еи ..., е„ и построим векторы еу. ..., eni по формулам A). По условию, эти векторы линейно незави- независимы. Следовательно, они образуют базис (их п). Таким образом, матрица С является матрицей перехода от одного базиса к другому и потому невы- невырождена. Конечно, это рассуждение годится лишь для «геометрических» значений п, т. е. при п = 1, 2, 3. Более подробно этот вопрос мы рассмотрим в дополнении к этому па- параграфу. Пользуясь матричным умножением, можно в компактном виде записать также формулу разложения х = х1е1 + ... + хпеп произвольного вектора х по векторам базиса. Действительно, эта формула равносильна, очевидно, формуле х = ех, где х — одностолбцовая матрица составленная из координат вектора х. Пусть теперь х' — одностолбцовая матрица, составленная из координат х1', ..., хп' вектора х в новом базисе еу, ..., еп>. Тогда х = е'х'. Но 67
Поэтому х = eCxf, т. е. ex = eCx'. Следовательно, х = Сх', или в развернутом виде B) хп = cjU1' + .. . + с",л;"'. Например, при п = 2 хх = с\,ху + с\,х2', Обратим внимание, что формулы B) выражают «старые» координаты через «новые», тогда как для векторов базиса си- ситуация была как раз обратной. Кроме того, в этих формулах координаты векторов ei>, ..., еп- в базисе еи ..., еп (столбцы матрицы С) оказались расположенными по строкам. С другой стороны, как в формуле A), так и в формуле B) суммирование происходит по индексам, один раз встречающим- встречающимся вверху, а один раз внизу. Замечание об обозначениях. Использованные обозначения (в частности, соглашение о положении штрихов и индексов), хо- хорошо приспособлены для рассмотрения случая произвольного п (и для доказательства общих утверждений). Поэтому естест- естественно, что при фиксированном п они не очень удобны. Они не- неудобны также и при конкретных вычислениях. Например, при п = 1 (случай прямой) проще всего не пи- писать вообще никаких индексов (как это мы делали в § 2). При п — 2 (случай плоскости) удобно координаты обозначать двумя различными буквами (скажем, х и у) и соответствующим обра- образом изменить обозначения элементов матрицы перехода. При п = 3 (случай пространства) для обозначения координат мож- можно пользоваться буквами х, у, z и т. п. Это замечание очень существенно, поскольку в дальнейшем мы без оговорок будем часто пользоваться не общими, а спе- специализированными обозначениями, и читатель должен это иметь в виду. Дополнение. Теорема о ранге матрицы Пусть / ап ... ащ \ • A) ^ «ml •• • атп 58
— произвольная (вообще говоря, прямоугольная) матрица. Выбрав произ- произвольно k строк и k столбцов и взяв элементы, расположенные на пересече- пересечении этих строк и столбцов, мы получим некоторый определитель ?-го поряд- порядка, называемый минором матрицы A), соответствующим данным строкам и столбцам. Рассмотрим значения k, обладающие тем свойством, что все ми- миноры k-то порядка матрицы A) равны нулю. В частности (в соответствие с общими правилами употребления в математике понятия пустого множе- множества), к этим значениям принадлежат все значения, для которых множества миноров k-то порядка пусто, т. е. значения, большие числа строк или столб- столбцов матрицы A). Легко видеть, что если все миноры k-го порядка матрицы A) равны нулю, то все миноры любого большего порядка также равны нулю. Действительно, достаточно доказать равенство нулю любого минора &+1-го порядка. Но каждый такой минор, будучи разложен по элементам некоторой его строки (или столбца), является линейной комбинацией мино- миноров k-vo порядка. Поскольку все последние миноры равны нулю, данный минор также равен нулю. Отсюда непосредственно вытекает, что для любой матрицы A) суще- существует такое число г ^ 0, что а) все миноры порядка, большего чем г, равны нулю; б) среди миноров любого фиксированного порядка, не превосходящего г, существует по крайней мере один отличный от нуля минор. Определение 1. Число г, обладающее свойствами а) и б), называется рангом матрицы A). Коротко его можно охарактеризовать как наивысший порядок отличных от нуля миноров матрицы A). Очевидно, что если любые р строк (или столбцов) матрицы линейно, зависимы, то ее ранг меньше р: г<р. Действительно, если некоторая система строк линейно зависима, то си- система «укороченных» строк, получающихся из данных выбрасыванием неко- некоторых компонент '(имеющих для всех строк одни и те же номера), также линейно зависима. Поэтому в каждом миноре порядка ^р любые р строк (столбцов) линейно зависимы и, следовательно, этот минор равен нулю. Одним из важнейших результатов линейной алгебры является тот факт, 'что справедливо и обратное утверждение, иными словами, справедлива сле- следующая теорема, известная как теорема о ранге матрицы: Теорема 1. Число р тогда и только тогда обладает тем свойством, что любые р строк матрицы линейно зависимы, когда р > г. Таким образом, в частности, любая матрица ранга г содержит г линейно независимых строк (столбцов). Доказательство теоремы о ранге матрицы отнюдь не элементарно и мы его здесь приводить не будем. Мы ограничимся лишь обсуждением некото- некоторых частных случаев этой'теоремы. ;) 59
Пусть нам дана квадратная матрица аи ... аы \ ««!••• апп' порядка п. Наивысшее возможное значение ее ранга равно п. При этом г = п тогда и только тогда, когда определитель аи ... ат а-п\ • • ¦ citin матрицы отличен от нуля, т. е. когда матрица невырождена. Таким обравом, частным случаем теоремы о ранге матрицы является следующая теорема о невырожденности: Теорема 2. Квадратная матрица тогда и только тогда невырождена, когда ее строки (столбцы) линейно независимы. В одну сторону («если матрица невырождена, то ее строки линейно не- независимы») эта теорема является тривиальным следствием известных элемен- элементарных свойств определителей. Доказательства требует лишь обратное утвер- утверждение («если строки матрицы линейно независимы, то матрица невырож- невырождена»). Для определителей первого порядка теорема о невырожденности сво- сводится к тавтологии. Для определителей второго порядка она утверждает, что определитель а2 тогда и только тогда равен пулю, когда что, очевидно, верно. Для определителей третьего порядка она нам известна из геометрических соображений (см. стр. 57). Резюмируя, мы, следовательно, можем сказать, что теорема о невырожденности заведомо справедлива для матриц порядка не большего трех. Весьма замечательно, что хотя теорема о невырожденности является довольно частным случаем теоремы о ранге матрицы, тем не менее послед- последняя теорема может быть без особого труда выведена из первой. Действи- Действительно, в силу теоремы о зависимости (см. п. 3) теорема о ранге матрицы может быть переформулирована в следующем виде: в любой матрице ранга г существует г линейно независимых строк (столбцов), через которые линейно выражается любая другая строка (любой другой столбец). Но, по условию, в матрице существует отличный от нуля минор Д по- порядка г. Пусть аи ..., а,г — строки матрицы, участвующие в этом миноре. Ясно, что эти строки линейно независимы. Таким образом, нам достаточно €0
лишь показать, что любая другая строка |5 матрицы линейно выражается через эти строки. (Для столбцов рассуждение вполне аналогично.) С этой целью рассмотрим в матрице минор А', получающийся добавле- добавлением к минору А строки |5 и некоторого (безразлично какого) столбца. Являясь минором порядка г+1, этот минор равен нулю. Следовательно, его строки линейно зависимы (здесь мы используем теорему о невырожденности). Но строки минора А линейно независимы. Поэтому строка |3 (или точнее, ее часть, участвующая в миноре А') линейно выражается через остальные строки этого минора. Это означает, что, вычтя из строки |3 некоторую ли- линейную комбинацию строк oti, . .., аг, мы получим строку (обозначим ее через р'). обладающую тем свойством, что из составляющих ее чисел по крайней мере г + 1 число равно нулю (именно, равны нулю числа, располо- расположенные в столбцах, участвующих в миноре А'). Для завершения доказа- доказательства остается лишь показать, что на самом деле строка |5' состоит толь- только из нулей. Пусть это не так, т. е. пусть строка |3' содержит некоторое отличное от нуля число Ъ. Пусть это число расположено на i-u месте. Рассмотрим ми- минор А", получающийся из минора А добавлением строки |3 и 1-го столбца. Являясь минором порядка г+1, минор А" равен нулю. Вычтя из его строки |3 ту же линейную комбинацию строк, что и выше, мы преобразуем минор А" в определитель вида О ... О b Следовательно, А6 = А" = 0. Но, по условию, А ф 0. Таким образом, во- вопреки предположению, 6 = 0. Тем самым полностью доказано, что из теоремы о невырожденности вытекает теорема о ранге матрицы. Более того, поскольку теорему о невырожденности мы использовали только один раз и только применительно к минорам порядка г+1. на са- самом деле доказано, что из теоремы о невырожденности для матриц порядка г + 1 вытекает тео- теорема о ранге для матриц ранга г, а также для матриц ранга г+1, число строк или столбцов которых равно г+1. В соответствии со сказанным выше мы имеем право, таким образом, считать, что теорема о ранге матрицы справедлива для матриц ранга, меньшего трех, о- также для матриц, число строк или столбцов которых не превосходит трех. Только для таких матриц эта теорема нам в дальнейшем и понадобится. Ранг 0 имеет только матрица, состоящая из одних нудей. Ранг 1 имеет Матрица, все строки (столбцы) которой пропорциональны. Заметим, что поскольку в формулировку теоремы о ранге матрицы стро- строки и столбцы входят совершенно равноправно, максимальное число линейно независимых строк равно максимальному числу линейно независимых столбцов (и равно рангу матрицы). 61
В частности, если строки матрицы пропорциональны, то ее столбцы также пропорцио- пропорциональны, и наоборот. В дальнейшем нам неоднократно придется рассматривать пару матриц, вторая из которых получается добавлением к первой матрице некоторого столбца (или строки). Пусть г — ранг первой, a R— ранг второй («расши- («расширенной») матрицы. Тогда Действительно, неравенство г ^ R очевидно. С другой стороны, каждый минор расширенной матрицы либо является минором исходной матрицы, ли- либо, будучи разложен по элементам дополнительного столбца, может быть представлен в виде линейной комбинации миноров исходной матрицы на еди- единицу меньшего порядка. Следовательно, все миноры расширенной матрицы порядка г -f- 2 равны нулю, и потому R ^ г + 1. Полезно также заметить, что равенство R = г имеет место тогда и только тогда, когда дополнитель- дополнительный столбец линейно выражается через столбцы исходной матрицы. Действительно, если дополнительный столбец линейно выражается через столбцы исходной матрицы, то все миноры порядка г + 1 расширенной мат- матрицы, не являющиеся минорами исходной матрицы, имеют линейно зависи- зависимые столбцы и потому равны нулю. Обратно, пусть R = г. Рассмотрим г линейно независимых столбцов исходной матрицы, через которые линейно выражаются все остальные ее столбцы. Поскольку R = г, то через эти столбцы должен выражаться и до- дополнительный столбец. Таким образом, при R = г дополнительный столбец линейно выражается через столбцы исходной матрицы. Обратим внимание, что в последнем рассуждении мы воспользовались теоремой о ранге матрицы. Замечание 1. Пусть . [ п\\ ... пщ \ ( п\\ . . . пщ — данные матрицы. Тот факт, что допелнительный столбец второй матрицы линейно вцражается через столбцы первой матрицы, означает, что система линейных уравнений <lm\x\ + • • • имеет хотя бы одно решение (совместна). Следовательно, доказанное выше утверждение может быть переформулировано в виде следующей теоремы, известной как теорема Кронекера — Капелл и: Теорема 3. Система линейных уравнений тогда и только тогда совмест- совместна, когда ранг матрицы ее коэффициентов не меняется при. добавлении столбца свободных членов. 62
§ 4. ОРИЕНТАЦИИ ПРЯМОЙ, ПЛОСКОСТИ И ПРОСТРАНСТВА 1. Понятие ориентации В п. 1 § 2 мы определили ориентацию прямой как выбор на ней определенного направления движения, т. е. одного из двух возможных отношений предшествования точек этой прямой. Затем мы показали, что ориентацию прямой можно с равным правом определить так же и как класс одноименных невы- невырожденных направленных отрезков или как класс одноименных отличных от нуля векторов (т. е. базисов). Ясно, что первое определение ориентации (выбор отношения предшествования) на плоскость и пространство непосредствен- непосредственно не переносится. Иначе обстоит дело с двумя другими опре- определениями. Определение 1. Два базиса аи .. ., ап и Ьи ..., Ьп на плоскости (я = 2) или в пространстве (я = 3) называются од- одноименными, если определитель \С\ матрицы перехода С от первого базиса ко второму (см. п. 7 § 3) положителен: I С | > 0. Если |С|>0, то базисы называются разноименными. Заметим, что при п = 1 это определение согласуется с оп- определением одноименных базисов на прямой. Поэтому в даль- дальнейшем мы случай я — 1 исключать не будем, хотя, конечно, ничего нового мы для этого случая не получим. В первую очередь мы покажем, что отношение одноименности базисов является отношением эк- эквивалентности. Матрицей перехода от произвольного базиса к нему самому является единичная матрица, определитель которой равен еди-' нице и потому положителен. Следовательно, отношение одно- одноименности рефлексивно. Если С — матрица перехода от базиса аи ..., ап к базису Ьи ..., Ьп, то, как мы знаем, обратная матрица С является матрицей перехода от базиса &,, ..., Ьп к базису аи ..., ап. Поэтому если | С \ > 0, то и |С~' | = | С Г > 0. Следовательно, отношение одноименности симметрично. Если С — матрица перехода от базиса аь ..., ап к базису &i, ..., Ьп, а С — матрица перехода от базиса Ъи ..., Ьп к базису си ..., с„, то, как мы знаем (п. 7 § 3), матрицей перехода от базиса аи ..., ап к базису сь ..., сп является матрица СС. Но по правилу умножения определителей, | СС | = = |С|-|С'|. Поэтому, если | С | >0 и | С \ > 0, то и | СС \ > 0. Следовательно, отношение одноименности транзитивно. Поскольку отношение одноименности является отношением эквивалентности, все базисы разбиваются на классы одноимен- одноименных базисов. 63
Определение 2. Классы одноименных базисов называются ориентациями (соответственно — прямой, плоскости и прост- пространства). Так как существуют базисы, связанные с данным базисом произвольной невырожденной матрицей перехода (см. п. 7 § 3), и, в частности, произвольной матрицей с отрицательным опре- определителем, мы видим, что на прямой, на плоскости и в пространстве существует точно две различные ориентации: базисы, принадлежащие одной и той же ориентации, одноименны, а базисы, принадлежащие раз- различным ориентациям, разноименны. Определение 3. Прямая, плоскость или пространство, для которой (ого) выбрана некоторая ориентация, называется ори- ориентированной (ым). Для каждой ориентации о другая возмож- возможная ориентация обозначается символом —о и называется про- противоположной ориентацией. О базисе, принадлежащем некото- некоторой ориентации, говорят, что он определяет эту ориентацию. Базис ориентированной (ого) прямой, плоскости или простран- пространства, определяющий данную ориентацию, называется положи- положительно ориентированным (по отношению к данной ориентации), а базис, определяющий противоположную ориентацию, назы- называется отрицательно ориентированным. На практике часто возникает вопрос об одноименности ба- базисов аи ..., а„ и Ъи ,.., Ь„, векторы которых заданы их координатами в некотором третьем базисе еъ ..., еп. Пусть Да — определитель, столбцами которого являются столбцы коор- координат векторов аи ..., ап. (Таким образом, Да— это не что иное, как определитель матрицы перехода от базиса elt ..., еп к базису аи ..., ап.) Аналогично строится определитель Дй. Матрица перехода С от базиса а,, ..., а„ к базису Ьи ..., Ъп является, как мы знаем, произведением матрицы перехода от базиса аь ..., ап к базису еи ..., еп (эта матрица обратна к матрице перехода от базиса еь ..., еп к базису аь ..., ап и потому ее определитель равен Д^1) на матрицу перехода от базиса еи ..., еп к базису Ъи ..., Ьп (имеющую, по определе- определению, определитель Д&). Поэтому согласно правилу умножения определителей Отсюда непосредственно вытекает, что базисы аи . .., ап и Ьи ...,&„ тогда и только тогда одно- одноименны, когда построенные для них определители Да и Д» имеют один и тот же знак. Определение ориентации как класса одноименных направ- направленных отрезков также можно перенести на случай плоскости и пространства. 64
Определение 4. Упорядоченная тройка (А, В, С) точек плос- плоскости (или пространства) называется неколлинеарной тройкой, если точки А, В, С не принадлежат одной прямой. Аналогично, упорядоченная четверка (А, В, С, D) точек пространства назы- называется некомпланарной четверкой, если точки А, В, С, D не принадлежат одной плоскости. Такие тройки и четверки на- называются также тройками и четверками точек общего поло- положения. Замечание 1. Введя, по аналогии, понятие пары (А, В) то- точек общего положения как упорядоченной пары, состоящей из различных точек А и В, мы немедленно получим, что это по- иятие в точности совпадает с понятием невырожденного на- направленного отрезка. Таким образом, понятия неколлинеарной тройки и некомпланарной четверки можно рассматривать как непосредственные обобщения на случай плоскости и простран- пространства понятия невырожденного направленного отрезка. Для любой неколлинеарной тройки (А, В, С) точек плос- плоскости векторы АВ и АС неколлинеарны (т. е. линейно незави- независимы) и потому образуют базис плоскости. Аналогично, для любой некомпланарной, четверки (А, В, С, D) точек простран- пространства векторы АВ, AC, AD образуют базис пространства. Определение 5. Две неколлинеарные тройки (А, В, С) и (А', В', С) точек плоскости (две некомпланарные четверки (А, В, С, D) и {А', В', С, D') точек пространства) называются одноименными, если соответствующие базисы АВ, АС и А'В', А^С' (базисы АВ, AC, AD и АТв', Л7*?', A^D') одноименны. Ясно, что отношение одноименности троек (четверок) яв- является отношением эквивалентности и что соответствующие классы эквивалентности находятся в естественном биективном соответствии с классами одноименных базисов, т. е. с ориента- циями плоскости (пространства). Это означает, что ориентации плоскости (пространства) можно отождествить с классами одноименных неколлинеарных троек (некомпланар- (некомпланарных четверок) точек этой плоскости (пространства). Упражнение. Определите одноименность троек и четверок точек общего положения элементарно-геометрически, не обращаясь к векторам. Наглядное определение ориентации как направления движения возможно, конечно, не только на прямой, но и на любой линии, например, на окружности. Однако ориентацию окружности нельзя формально охарактеризовать (в отличие от ориентации прямой) как некоторое отношение, в котором участвуют две точки. Это связано с тем, что окружность является замкнутой линией, а пря- прямая — нет. Аналогом отношения предшествования точек прямой являет- является на окружности отношение между тремя (попарно раз- 3 М5 М. Постников 55
личными) точками А, В, С, наглядно состоящее в том, что, передвигаясь по окружности в данном направлении и отправ- отправляясь от точки Л, мы не можем достичь точки С, не переходя через точку В. Можно без труда аксиоматически охарактеризовать это от- отношение между точками окружности, подобно тому как в п. 1 § 2 мы охарактеризовали отношение предшествования точек прямой, а затем перенести на случай окружности описание ориентации прямой как класса одноименных направленных от- отрезков (при этом роль направленных отрезков будут играть упорядоченные тройки (А, В, С) попарно различных точек ок- окружности, а их отношение одноименности будет наглядно озна- означать, что они определяют на окружности одно и то же направ- направление движения). Такое «независимое» рассмотрение ориентации окружности, возможно, само по себе и интересное, в достаточной степени громоздко, а с принципиальной стороны не дает ничего нового по сравнению со случаем прямой. Поэтому мы пред- предпочтем здесь описать ориентации окружности не независимо, а пользуясь тем, что она расположена в плоскости. С этой целью мы заметим, что на неформальном, *нагляд- ном, уровне ясно (например, из чертежа), что две тройки (А, В, С) и (А', В', С) точек окружности 2 тогда и только тог- тогда определяют на окружности одно и то же направление дви- движения, когда базисы АВ, АС и А'В', А'С плоскости, в которой расположена окружность 2, одноименны. Таким образом, мы приходим к следующему (уже формальному) определению ориен- ориентации окружности: Определение 6. Упорядоченные тройки (А, В, С) и (А', В', С) точек окружности 2 (состоящие каждая из попарно раз- различных точек) называются одноименными, если базисы АВ, АС и А'В', А'С плоскости, в которой расположена окружность 2, одноименны. Класс одноименных троек точек окружности на- называется ее ориентацией, а окружность, для которой выбрана некоторая ориентация, называется ориентированной. Сравнив это определение с определением 5 одноименности неколлинеарных точек плоскости, мы немедленно заметим, что они, по существу, совпадают. Это означает, что между ориентациями плоскости и ориентациями располо- расположенной в этой плоскости окружности существует естественное биективное соответствие. Иначе говоря, на ориентированной плоскости каждая окружность автома- автоматически ориентирована, н, обратно, задание на плоскости ори- ориентированной окружности однозначно определяет некоторую ориентацию плоскости. Различие между ориентациями плоскости и ориентациями расположенных в этой плоскости окружностей состоит только в 66
том, что ориентацией плоскости является класс одноименных всевозможных неколлинеарных троек точек плоскости, а ориен- ориентацией окружности — класс одноименных неколлинеарных троек точек, принадлежащих этой окружности. 2. Правые и левые ориентации Обратим внимание, что из двух возможных ориентации пря-. мой, плоскости или пространства чисто внутренним математи- математическим способом нельзя выделить какую-нибудь определенную, Для этого приходится обращаться к соображениям, матема- математике посторонним (скажем, к анатомии человека). Например, на прямой, изображенной на чертеже горизон- горизонтальной линией, можно выделить направление «слева направо». Это направление для человека наиболее привычно (в частности, большинство культурных народов пишут в этом направлении) и потому ему присвоено наименование «положительного направ- направления» («положительной ориентации»). Однако следует отчет- отчетливо понимать, что фиксация этого направления никакого ин- инвариантного (не зависящего от чертежа) смысла не имеет: по- поверните чертеж «вверх ногами», и «положительное» направление перейдет в «отрицательное». Не нужно также путать понятие «положительного направления» в этом смысле с понятием «поло- «положительного направления по отношению к данной ориентации», которое вполне инвариантно, но зависит от выбора ориентации. На вертикальных прямых принято «положительным» направ- направлением считать направление «снизу вверх». На плоскости задание ориентации равносильно, как мы знаем, заданию ориентации расположенных в этой плоскости окружностей, т. е. заданию некоторого «направления враще- вращения» этих окружностей. Наглядно это направление можно опи- описать как направление, в котором следует вращать первый век- вектор базиса, определяющего данную ориентацию плоскости, что- чтобы кратчайшим путем совместить его со вторым вектором этого базиса (в этой формулировке предполагается, что векторы ба- базиса имеют одинаковые длины и отложены от одной точки). При этом «положительной» ориентацией принято считать ориен- ориентацию, соответствующую вращению «против часовой стрелки». Это соглашение, конечно, также не инвариантно: посмотрите на плоскость с другой стороны, и «положительная» ориентация окажется «отрицательной». Если посмотреть на правую руку со стороны ладони, то боль- большой и указательный пальцы будут образовывать базис, ориенти- ориентированный «против часовой стрелки». На этом основании ориен- ориентация плоскости «против часовой стрелки» обычно называется правой ориентацией, а противоположная ее ориентация — левой. Аналогично, в пространстве правой ориентацией называется ориентация, определенная «базисом», состоящим из большого, 3» . \ 67
указательного и среднего пальцев правой руки, а противопо- противоположная ориентация называется левой. Здесь, к сожалению, нет общепринятого соглашения, какую ориентацию считать «поло- «положительной». Большинство авторов (и мы в том числе) считают «положительной» правую ориентацию. Однако во многих (осо- (особенно старых) учебниках за положительную ориентацию прини- принимается левая ориентация. Заметим, что термин «правая» и «левая» по отношению к ориентациям пространства имеют уже инвариантный смысл, поскольку «посмотреть на пространство с другой стороны» мы не можем. Тем не менее определить их внутренним математиче- математическим способом нельзя. 3. Произведения ориентации Пусть ai и а2— две ориентированные прямые на плоскости. Предполагая, что эти прямые не параллельны, выберем на каж- каждой из них положительно ориентированный базис. Пусть это будет вектор а4 на прямой ai и вектор йг на прямой а2- Так как векторы ai и а2 по условию не коллинеарны, они составляют не- некоторый базис на плоскости. Оказывается, что ориентация плоскости, определенная базисом ai, a2, не зави- зависит от выбора векторов ci, а2 и определяется исключительно ориентациями прямых а4 и а2 {взятых в данном порядке). Действительно, пусть а\ и а2 — другие положительно ориен- ориентированные базисы прямых czj и а2. Тогда a\ = k^al и a'2 = k2a2, где k\ > 0 и k2 > 0. Поэтому матрица перехода от базиса аи а2 к базису а[, а2 имеет вид lkx 0" \0 k2/ и ее определитель k\k2 положителен. Следовательно, базис а\, а2 определяет ту же ориентацию плоскости, что и базис аи а2. Таким образом, для задания ориентации плоскости достаточно задать ори- ориентации двух не параллельных прямых этой плоскости. Определение 1. Построенная ориентация плоскости назы- называется произведением данных ориентации прямых ai и а2 и обо- обозначается символом О\рг, где Oi — ориентация прямой ai, а Ог — ориентация прямой ось Очевидно, что и (— ol)o2 = ol(— о2) = — о{о2, т. е. при перестановке прямых ai и а2 или при смене ориентации одной из них результирующая ориентация плоскости переходит в противоположную.. 68
Отсюда, в частности, вытекает, что для любой ориентации о плоскости и любой ориентации о2 прямой а2 существует такая ориентация о1 прямой а\, что О = О\О2. Действительно, выберем произвольно некоторую ориента- ориентацию о\ прямой а! и построим ориентацию о\о2. Если окажется, что о = о\о2, то все в порядке: ol=o'l. Если же о\о2ф о, то обязательно о\о2= — о и потому О; = — о\. Пусть теперь а и П — ориентированные прямая и плоскость в пространстве (с ориентациями оа и Оц соответственно). Пред- Предполагая прямую и и плоскость П не параллельными, рассмот- рассмотрим ориентацию пространства, определенную базисом аи а2, аз, где ai — некоторый положительно ориентированный базис прямой a, a a2, а3 — некоторый положительно ориентированный базис плоскости П. Если a[ = klal — другой положительно ориентированный базис прямой а (так что kx > 0), а а2 = k2a2 + k2a3, a'3 = k3a2-{- + k3a3 — другой положительно ориентированный базис плоско- ! k2 k2 \ сти П так что ,, , > 0 , то базис а\, о', а3 пространства \ «з «з / связан с базисом аь а2, а3 матрицей перехода k\ 0 0 н 0 k k 0 2 k'2 з k3 k2 k'3 ). / и потому положителен. определитель которой равен Следовательно, ориентация пространства, определенная базисом а\, а2, аз, не зависит от выбора базисов at и а2, а3 и определяется исклю- исключительно данными ориентациями оа и ои. прямой а и плос- плоскости П. Таким образом, для задания ориентации пространства достаточно задать ориентации произвольной прямой и произвольной не парал- параллельной ей плоскости. Определение 2. Построенная ориентация пространства назы- называется произведением ориентации оа и оп и обозначается сим- символом ОаОи- Аналогично определяется ориентация опоа (задаваемая ба- базисом a2, a3, ai). Впрочем, ясно, что она совпадает с ориента- ориентацией оаоп: ОдОа = i 69
Далее, очевидно, что (— Оа) On = Оа (— Оп) = — ОаОп, откуда, как и выше, вытекает, что для любой ориентации о пространства и любой ориентации оа прямой а (любой ориентации on плоскости П) существует такая ориентация Оа плоскости П (ориентация оа прямой а), что о = оаоа- Аналогичным образом определяется произведение OiO2o3 ориентации трех прямых ai, аг, аз, обладающих тем свойством, что параллельные им прямые, проходящие через одну точку, не лежат в одной плоскости (такие прямые называются прямы- прямыми общего положения). Впрочем, это произведение сводится к уже определенным произведениям: Таким образом, для задания ориентации пространства достаточно задать ориентации трех прямых общего положения (взятых в данном порядке). Заметим, что при четной перестановке прямых а4, аг, аз ориентация ОФгОг не меняется, а при нечетной — переходит в противоположную. 4. Стороны прямой на плоскости и плоскости в пространстве Как известно, любая прямая а на плоскости разбивает эту плоскость на две полуплоскости: точки А я В плоскости, не принадлежащие прямой а, тогда и только тогда принадлежат одной полуплоскости, когда отрезок АВ не пересекает пря- прямую а. Аналогично,, любая плоскость П в пространстве разбивает пространство на два полупространства, причем две точки А, В, не принадлежащие плоскости, тогда и только_тогда принадле- принадлежат одному полупространству, когда отрезок АВ не пересекает плоскость. Определение 1. Говорят, что у прямой а в плоскости (или у плоскости П в пространстве) выбрана сторона, если выбрана одна из полуплоскостей, на которые прямая а разбивает плос- плоскость (соответственно, если выбрано одно из полупространств, на которые плоскость П разбивает пространство). Выбранная полуплоскость (полупространство) или соответствующая сто- сторона называется при этом положительной, а другая полуплос- полуплоскость (полупространство) — отрицательной. Пусть е — произвольный вектор, не параллельный прямой а (плоскости П). Выбрав на прямой а (плоскости П) произволь- 70
ную точку О, отложим от нее вектор е, т. е. построим направ- направленный отрезок ОЕ = е. Если точка Е окажется при этом в по- положительной полуплоскости (положительном полупростран- полупространстве) , то мы будем говорить, что вектор е направлен в поло- положительную сторону прямой а (плоскости П). Это определение нуждается, конечно, в проверке, корректности, т. е. в доказа- доказательстве независимости полуплоскости (полупространства), со- содержащей точку Е, от выбора точки О. Другими словами, мы должны доказать, что если для точек О и О' прямой а {плоскости П) и точек Е и Е', не принадлежащих этой прямой (этой плоскости), имеет место равенство ОЕ = О'Е', то точки Е и Е' принадлежат од- одной полуплоскости (одному полупространству). Пусть это не так, т. е. пусть отрезок ЕЕ' пересекается с пря- прямой а (плоскостью П). Ясно, что это возможно тогда и только тогда, когда прямые 00' и ЕЕ' пересекаются. С другой сто- стороны, поскольку векторы ОЕ и О'Е' равны, эти прямые должны быть параллельны (причем совпадать они не могут). Получен- Полученное противоречие доказывает, что точки Е и Е' принадлежат одной и той же полуплоскости (полупространству). Предложение 1. Пусть е и е' — два коллинеарных вектора, не параллельных прямой а (плоскости П), и пусть вектор е направлен в положительную сторону прямой а (плоскости П). Вектор е' тогда и только тогда обладает тем же свойством, ког- когда отношение е': е положительно. Доказательство. Пусть е = ОЕ и е' = ОЕ', где О — некоторая точка прямой а (плоскости П). Точки Е и Е' тогда и только тогда лежат в разных полуплоскостях (полупростран- (полупространствах), когда отрезок ЕЕ' пересекается с прямой а (плоскостью П). Но прямая ЕЕ' имеет с прямой а (плоскостью П) одну- единственную точку пересечения О. Следовательно, точки Е и Е' тогда и только тогда лежат в разных полуплоскостях (полу- (полупространствах), когда отрезок ЕЕ' содержит точку О, т. е. когда Е <^ О <С Е' (в ориентации прямой ЕЕ', в которой Е <( <(?'), Для завершения доказательства осталось заметить, что Е <( О <С Е' тогда и только тогда, когда отношение е': е отри- отрицательно. Определение 2. Мы будем говорить, что ориентированная прямая р направлена в положительную сторону прямой а (плоскости П), если ее положительно ориентированный вектор « направлен в положительную сторону прямой а (плоскости П). Согласно предложению 1 это определение корректно. Если в одной ориентации прямая р направлена в положи- положительную сторону прямой а (плоскости П), то в другой ориента- ориентации она будет направлена, очевидно, в отрицательную сторону. это означает, что 71
выбор на прямой а (плоскости П) положительной стороны определяет на каждой прямой [}, не параллельной прямой а (плоскости П), некоторую ориентацию, а именно, ориентацию, в которой эта прямая направлена в положительную сторону прямой а (плоскости П). Другими словами, ориентацию прямой на плоскости или в пространстве мож- можно определить как выбор стороны на некоторой прямой (плос- (плоскости), не параллельной данной прямой. Поскольку ориентации непараллельных прямых аир, ле- лежащих в одной плоскости, определяют (см. п. 3) некоторую ориентацию плоскости и поскольку, согласно только что ска- сказанному, ориентация прямой [} определяется заданием сторо- стороны прямой а, мы получаем, что для задания ориентации плоскости достаточно задать в этой плоскости ориентированную прямую и некоторую ее сто- сторону. Обратно, для задания ориентации прямой достаточно задать некото- некоторую ориентацию плоскости, содержащей эту прямую, и одну из сторон этой прямой в плоскости. Аналогично, для задания ориентации пространства достаточно задать ориентированную плоскость и некоторую ее сторону, а для за- задания ориентации плоскости достаточно задать ориентацию про- пространства и некоторую сторону этой плоскости. Рассмотрим в заключение интересный и тонкий вопрос (часто вызывающий недоразумения), о сравнении ориентации на двух различных прямых и плоскостях. Понимая ориентации как классы одноименных базисов, мы видим, что ориентации на прямой, в плоскости или в простран- пространстве определяются исключительно в терминах соответствующего линеала Vect(n) (так что, собственно говоря, следовало бы го- говорить об ориентациях именно этого линеала). Отсюда следует, что поскольку для параллельных прямых линеалы Vect(l) (рас- (рассматриваемые как подмножества линеалов VectB) или VectC)) совпадают, то задание ориентации на одной прямой автоматически опре- определяет ориентацию на любой другой параллельной прямой. Другими словами, это означает, что ориентации параллельных прямых можно сравнивать, т. е. можно говорить о том, совпадают они или нет. Конечно, аналогичные утверждения справедливы и для ориен- ориентации параллельных плоскостей. Совсем иначе дело обстоит со сравнением ориентации двух непараллельных прямых (или плоскостей). На первый взгляд кажется, что можно предложить следующую процедуру сравне- 72
ния ориентации, скажем, двух непараллельных прямых р4 и Рг на плоскости: Пересечем прямые Pi и р2 некоторой третьей прямой а. Как мы знаем, ориентации прямых р4 и ^ определяются заданием некоторых сторон прямой а. В соответствии с этим условимся называть данные ориентации прямых р4 и р2 «одинаковыми», если они определяются одной и той же стороной прямой а. Однако оказывается, что это определение некорректно (зависит от выбора прямой а). Задание. Покажите на примере, что при одном выборе прямой а дан- данные ориентации прямых |3i и |3г могут быть «одинаковыми», а при другом — «различными». Таким образом, сравнение ориентации на непараллельных прямых (а также на непараллельных плоскостях) невозможно. В этом отношении ориентации прямых в принципе отли- отличаются от ориентации окружностей, сравнение которых возмож- возможно (ориентации двух окружностей, расположенных в одной плоскости, считаются, по определению, «одинаковыми», если они определяют одну и ту же ориентацию плоскости). Причиной этого различия является то, что ориентация ок- окружности определяет ориентацию плоскости, в которой распо- расположена окружность, а ориентация прямой — нет (для того чтобы по ориентации прямой определить ориентацию содержа- содержащей ее плоскости, необходимо, как мы знаем, дополнительно задать сторону прямой в этой плоскости). Суть дела здесь в том, что две полуплоскости, на которые прямая разбивает плоскость, совершенно равноправны (и по- потому без дополнительной информации неотличимы друг от дру- друга), тогда как две области, на которые окружность разбивает плоскость («внешняя область» и «внутренняя область»), отли- отличаются друг от друга по их геометрическим свойствам: например, внешняя область содержит целые прямые, тогда как внутренняя область (ограниченный окружностью круг) ни одной прямой не содержит. К этому вопросу мы еще вернемся в п. 4 § 3 гл. 7. 5. Деформации базисов и ориентации В этом пункте мы изложим еще один подход к понятию ори- ориентации, отличающийся особой наглядностью. Рассмотрим произвольную вектор-функцию a(t) числовой переменной t (пробегающей, скажем, замкнутый интервал [0, 1] числовой оси R), т. е. отображение, сопоставляющее каждому t е [0, 1] некоторый вектор a(t) (на прямой, в плоскости или в пространстве). При заданном базисе ei, ..., еп (где, как всегда, п = 1, 2 или 3) вектор-функция a(t) однозначно опреде- определяется координатами al(t), •••, an(t) A) 73
вектора a(t) в базисе ей ..., еп, являющимися обыкновенными числовыми функциями переменной t. Таким образом, задание вектор-функции a(t) равносильно (при фиксированием базисе) заданию я обыкновенных (числовых) функций A). Определение 1. Вектор-функция a(t) называется непрерыв- непрерывной, если все функции A) непрерывны. Из формул преобразования координат при замене базиса (п. 7 § 3) немедленно вытекает, что это определение корректно (не зависит от выбора базиса), т. е. что если координаты A) вектор-функции a(t) непрерывны в одном базисе, то они непре- непрерывны и в любом другом базисе. Определение 2. Два базиса ai, ..., ап и Ьи ..., Ьп (пря- (прямой, плоскости или пространства) называются деформируемы- деформируемыми друг в друга, если существуют такие векторные функции ai(t), ..., an(t) числового параметра ^е[0,1], что: 1. Для любого i = 1, ..., п вектор a.i@) совпадает с векто- вектором о/, а вектор о(- A) — с вектором bi\ с,@) = с1, ..., с„@) = о„, 2. Для любого i— 1, ..., п вектор di(t) непрерывно зависит от t. 3. Для любого / е [0, 1] векторы щ (t), ..., an(t) линейно независимы, т. е. составляют базис. В этом случае о векторах ax{t), ..., an(t) говорят, что они составляют деформацию, связывающую базис аь ..., ап с ба- базисом Ьи ..., Ьп. Предложение 1. Отношение деформируемости базисов являет- является на множестве всех базисов отношением эквивалентности. Доказательство. Поскольку любой базис а, ап может быть продеформирован сам в себя (соответствующую деформацию можно, например, определить формулой а((/) = а,-, /= 1, ..., п), отношение деформируемости базисов рефлексивно; оно и симметрично, так как если базис аь ..., ап связан с ба- базисом Ьи ..., Ьп деформацией о, (t), ..., ап (t), то базис Ъх Ьп связан с базисом с,, ..., ап, например, деформацией b,(t) = — a^l—i), ..., bn(t) = an(l — t). Таким образом, нам нужно доказать только транзитивность, т. е. что если существует деформация о, (t), ..., an{t), связывающая базис аь .... ап с базисом Ьь ..., Ъп, и деформация b{ (t), ..., bn(t), связываю- связывающая базис Ьи ..., Ьп с базисом сх, ..ч, сп, то существует и деформация сг (t), ..., cn{t), связывающая базис аи ..., ап с базисом С], ..., с„. Но такую деформацию ничего не стоит •построить. Например, ее можно определить формулами 74 JM2*), если С UiBi—1), если
Тем самым предложение 1 полностью доказано. Из этого предложения следует, что множество всех базисов распадается на классы деформируемых друг в друга базисов. Оказывается, что эти классы совпадают с классами одноимен- одноименных базисов, т. е. другими словами, имеет место следующее Предложение 2. Два базиса ah ..., ап и Ьи .. ., Ъп тогда и только тогда одноименны, когда они деформируемы. друг в друга. Доказательство. Пусть базисы а,, ..., ап и Ъи ..., Ьп деформируемы друг в друга и пусть a{{t), .... ап(t) — дефор- деформация, связывающая базис аи .,., ап с базисом 6Ь ..., Ьп. Рассмотрим определитель А (О матрицы перехода от базиса аи ..., ап к базису а{ (О, ..., an(i). Он непрерывно зависит от t, нигде не обращается в нуль и равен единице при t = 0. Поэтому для всех значений t этот определитель положителен (ибо непрерывная функция не может сменить знак, не обра- обратившись в нуль). В частности, он положителен при t=\. Но определитель ДA) является как раз определителем матрицы перехода от базиса Ci, ..., ап к базису Ь\, ..., Ъп. Поэтому базисы аи ..., ап и Ьь ..., Ъп одноименны. Докажем теперь обратное утверждение (одноименные ба- базисы деформируемы). Пусть сначала п = 1 (случай прямой). Поскольку базисы а4 и Ъ\ одноименны, имеет место равен- равенство где k > 0 (см. п. 1 § 2). Определим вектор-функцию а{ (t), O^.t^.1, формулой а, @ = (/+ A Ясно, что а1@) = а1, а,A) = 61 и аг (t) непрерывно зависит от /. Кроме того, поскольку ^ + A—г))гфО при O^f^l, вектор О[ @ является базисом. Следовательно, вектор-функция al (t) является деформацией, связывающей базис а{ с базисом bt. При п > 1 нам понадобится следующая , Лемма. Пусть аь а2 — произвольный базис на плоскости. Тогда любой другой базис Ъь Ъ2 деформируем либо в базис аи а2, либо в базис оь — а2. Аналогично, пусть аь а2, а3 — произвольный базис в простран- пространстве. Тогда любой другой базис Ьь b2, b3 деформируем либо в базис аи а2, а3, либо в базис аи а2, —as. Предполагая эту лемму справедливой, мы можем без труда завершить доказательство предложения 2. Действительно, пусть базисы а, ап и Ьх, ..., Ъп одноименны (где п = 2, 3). Согласно лемме базис Ъь ..., Ьп деформируем либо в базис <*i> •.., ап, либо в базис аи ..., ап-и —ап. Пусть базис *i. ••-, Ьп деформируем в базис оь ..., an_b — an. Тогда по Уж доказанному, базис аи ..., а„_ь — ап одноименен с базисом 75
&„, а следовательно, и с базисом аи а„. Но это не- невозможно, поскольку матрица перехода от базиса аи — ап к базису аь ..., ап имеет вид an-i, 1 о 0 -1 и потому ее определитель отрицателен. Следовательно, базис Ьь ..., Ьп деформируем в базис аь ..., ап. Предложение 2 означает, что ориентации (прямой, плоскости или пространства) мы мо- можем отождествлять с классами деформируемых друг в друга базисов. Доказательство леммы. В первую очередь мы рас- рассмотрим случай плоскости. Отложив векторы Ci, а2 и Ъх, Ъ2 от некоторой точки О, мы можем написать, что Любой поворот вокруг точки О треугольника ОВ\В2 пред- представляет собой, очевидно, некоторую деформацию базиса Ьи Ь2 (вопрос здесь может возникнуть только в отношении непрерыв- непрерывности; интуитивно она очевидна, а для ее строгого доказатель- доказательства достаточно написать формулы, выражающие, как меняют- меняются при этом повороте векторы &4 и 62; такие формулы далее в своем месте мы получим, а пока мы предоставляем вывести их читателю). В то же время ясно, что таким поворотом мы мо- можем совместить прямую ОВХ с прямой OAi и, более того, пере- перевести вектор &i в вектор прямой ОА\, одноименный с векто- вектором d. Сделав это (и обозначив повернутые векторы прежними символами Ъ\ и 62). мы будем теперь, оставляя вектор Ъ\ не- неподвижным, вращать вокруг точки О лишь один вектор Ъ% = = ОВ2, следя за тем, чтобы траектория точки В2 не пересекала прямую OBi = OAi. Ясно, что при этом мы получаем дефор- деформацию базиса bi, Ъ% Столь же ясно, что этой деформацией мы можем перевести вектор 62 в вектор, коллинеарный вектору а2 и потому одноименный (как вектор прямой ОА2) либо вектору а2, либо вектору —а2. К получившимся векторам 64 и Ь2 остается теперь применить (к каждому отдельно) описанную выше (при рассмотрении 76
случая п=1) деформацию, переводящую их в векторы at и ±а%. Поскольку комбинация нескольких последовательно выпол- выполненных деформаций также является деформацией, наша лем« ма тем самым для случая плоскости полностью доказана. Случай пространства рассматривается аналогично. Пусть ОА 2, Вращая тетраэдр OBiB2B3 вокруг точки О, мы можем совме- совместить плоскость OBiB2 с плоскостью ОА\А% и, более того, пря- прямую OBi с прямой ОАу. Мы можем даже добиться того, чтобы вектор &i перешел в вектор, одноименный с вектором ait и что- чтобы векторы &i, &2 составляли базис плоскости ОА\А2, одноимен- одноименный с базисом Oi, а2. Проделав затем на плоскости OAiA2 опи- описанную выше (при п = 2) деформацию (и оставляя вектор Ь3 неподвижным), мы продеформируем базис Ъ\, b2, b3 в базис вида а\, а2, Ь3. Остается теперь, не трогая векторов at и аг, по- повернуть вектор &з так, чтобы он стал коллинеарным вектору а3, и затем применить уже известную нам деформацию на прямой. В результате всех этих деформаций мы и переведем базис &ь b2, b3 в базис вида аь а2, ±а3. Тем самым наша лемма пол- полностью доказана. Замечание 1. Изложенное доказательство .леммы может вызвать возражения по крайней мере по двум пунктам. Во-пер- Во-первых, оно использует «механические» понятия, которые мы в свое время (см. § 1) условились по возможности исключать. Во- вторых, хотя вся излагаемая здесь теория по существу не связана с понятием измерения (носит, как говорят, аффинный харак- характер; см. ниже), в этом доказательстве используются преобразо- преобразования (вращения), определение которых существенно опирается на понятие длины. Оба эти возражения можно снять, перестроив доказательство на алгебраический лад, для чего достаточно опи- описать все требуемые преобразования формулами, вообще не упо- упоминая об их геометрическом смысле. Впрочем, если уж стано- становиться на этот путь, то можно получить и более простые форму- формулы (но уже не имеющие столь прозрачного элементарно-геомет- элементарно-геометрического истолкования). Мы сделаем это для плоскости, остав- оставляя читателю аналогичную «алгебраизацию» доказательства на- нашей леммы для случая пространства. Пусть I — матрица перехода от базиса аь а2 к базису \Р2 <72/ Ьи Ь2. Таким образом, bi=plal+p2a2, b2 = q&i + ДОг- П
Рассмотрим определитель • Чр2 1\ этой матрицы. Как мы знаем, он отличен от нуля. Случай 1. Числа piq2 и p2<7i имеют разные знаки (и оба от- отличны от нуля). В этом случае для любого значения параметра t число очевидно, отлично от нуля. Но это число является определите- определителем матрицы р. 0-0^ — ОРг q2 Поэтому, положив 2(t) = (l — t)qa + qa ^ ^ мы получим деформацию базиса blt b2 в базис b'i = bl(l), b'2 = b2(l), с которым базис аи а2 связан диагональной матри- матрицей перехода /Р, \0 Случай 2. Числа p{q2 и p2qx имеют один и тот же знак (и одно из них, возможно, равно нулю). Если при этом Ipi^j > >|p2?i|, то будет, как легко видеть, применима та же самая деформация, что и выше, и мы снова сможем, продеформиро- вать базис Ьх, Ь2 в базис b\, b2, связанный с базисом а], а2 диа- диагональной матрицей перехода. Однако, если \p\q2\ <C \p2q\ \ (за- (заметим, что равенство |р1<7г| = |P2<7i| невозможно), то такую де- деформацию мы применить не сможем и вместо нее должны будем рассмотреть, скажем, деформацию МО" 0 — 0Pl«l+P2«2, переводящую базис Ьь Ъ2 в базис Ъ\, Ь2, с которым базис с^ а2 связан матрицей перехода /0 U 0, Тем не менее, применив еще дополнительную деформацию Ъ[@ = (cos±t)b\ + (- sin | t)b2, 78
мы и в этом случае продеформируем базис Ь\, Ъ2 в базис, с ко- которым базис Оь а2 связан диагональной матрицей перехода. Таким образом, мы без ограничения общности можем с са- самого начала считать, что базис Ъ\, Ь2 связан с базисом оь а2 диагональной матрицей перехода: Ь2 .= qa2 (мы здесь убрали уже ненужные индексы). Но в этом предпо- предположении мы можем к каждому из векторов Ъ\, Ь2 применить деформацию, использованную нами в случае п = 1. Например, при р > О мы можем для вектора Ъ\ рассмотреть деформацию (? + A — t)p)au а при р < 0 — деформацию (—t + (\ —t)p)a\ = = (t-{-{\—t) (—р)) (—ai). В результате мы продеформируем базис Ъ\, Ь2 в базис (векторы которого мы снова будем обозна- обозначать через Ь\, Ъ2), связанный с базисом аи а2 формулами Ь{ = ±аи Ъ2 = ± о2. Если Ьг = аи Ь2 — а2 или Ьх = аи Ь2 = —а% то все в порядке: лемма доказана. Пусть Ь1 = — аи 62 = а2 или Ьх = — аь Ь2— — а2. Тогда мы применим еще дополнительную деформа- деформацию by (t) = (cos nt) bx + (— sin nt) b2, b2 (t) = (sin nt) 6[ + (cos nt) b2. Ясно, что это действительно деформация и что она переводит базис Ь\, Ъ2 в базис — bu b2, т. е. при наших предположениях либо в базис аи а2, либо в базис а{, — а2. Тем самым лемма полностью доказана и этим методом (для случая плоскости). Задание. Выясните геометрический смысл деформаций, участвующих в «алгебраическом» доказательстве леммы. Упражнение. Аналогичным образом докажите лемму для случая про- пространства. 6. Резюме Подведем итоги. Наглядный смысл ориентации прямой состоит в выборе не- некоторого (из двух возможных) направления движения по этой прямой, а ориентации плоскости — в выборе направления вра- вращения в этой плоскости (т. е. задания направления движения по любой окружности в плоскости). Аналогично, в пространстве ориентации можно представлять себе как выбор одного из двух возможных типов винтового дви- движения («правовинтового» и ^левовинтового»). 79
Формально ориентацию прямой, плоскости или пространства можно определить тремя равносильными способами: 1) либо как класс одноименных базисов; 2) либо как класс одноименных упорядоченных систем точек общего положения, состоящих в случае прямой из двух точек, в случае плоскости — из трех точек и в случае пространства — из четырех точек; 3) либо как класс деформируемых друг в друга базисов. При этом 1) ориентация прямой в плоскости (в пространстве) одно- однозначно определяется заданием в этой плосквсти (в простран- пространстве) некоторой стороны произвольной прямой (плоскости), не параллельной данной прямой; 2) ориентация плоскости (пространства) однозначно определя- определяется заданием в плоскости (в пространстве) произвольной ориен- ориентированной прямой (плоскости) вместе с некоторой ее стороной; 3) обратно, ориентация прямой в плоскости (плоскости в пространстве) однозначно определяется заданием стороны этой прямой (плоскости) и некоторой ориентации плоскости (про- (пространства) ; 4) наконец, сторона прямой в плоскости (плоскости в про- пространстве) однозначно определяется заданием ориентации пря- прямой и плоскости (плоскости и пространства). Свойства 2), 3) и 4) можно объединить в следующей фор- формулировке: Из трех объектов: а) ориентация прямой в плоскости (плоскости в простран- пространстве), б) ориентация плоскости (пространства), в) сторона прямой в плоскости (плоскости в пространстве) любые два однозначно определяют третий. Дополнение. О понятии угла Известно, что понятие угла довольно трудно строго определить в доста- достаточно общем виде. Возникающие здесь трудности объясняются не только тем, что слово «угол» используется для обозначения целого ряда различных, хотя и связанных друг с другом понятий (фигура, образованная парой лучей с общим началом; часть плоскости, содержащаяся «между» двумя такими лучами; число, являющееся мерой поворота, на который нужно повернуть один луч до совпадения с другим; аргумент тригонометрических функций), но и реальной сложностью понятия угла. В этом дополнении мы обсудим понятие угла, оставаясь на наглядных, не формальных позициях. Термин угол' мы будем использовать в следующих двух основных зна- значениях: а) фигура, образованная парой лучей с общим началом; 80
б) число, измеряющее (в радианах) поворот, на который нужно повер- повернуть один луч до совпадения с другим. Как правило, это двойное понимание термина «угол» к недоразумениям не приводит. В случаях, когда такое недоразумение возможно, мы будем на- называть угол в смысле б) мерой угла. По определению, мера угла G заключена в пределах от 0 до я. Случаи, когда она равна 0 или я, не исключаются: О < 0 < я. При 6 = 0 угол называется вырожденным, а при 6 = я — развернутым. Пусть две прямые а и |3 лежат в одной плоскости и пересекаются в (единственной) точке О. Эта точка делит каждую прямую па два луча. Вы- Выбрав на каждой из прямых по такому лучу, мы получим некоторый угол. В зависимости от выбора лучей возникает, таким образом, четыре угла. Они называются (элементарно-геометрическими) углами между прямыми а и E. Эти углы попарно равны (вертикальные углы), так что фактически угол между прямыми имеет только два значения 6i и 0г. Сумма этих углов рав- равна я (смежные углы). В частности, равенство 0i = 02 возможно только при 61=92 = —, т. е. для перпендикулярных прямых. Если прямые сх и C параллельны (в частности, совпадают), углы 6i и G2. по определению, считаются равными 0 и я (подчеркнем, что здесь мы ну- нуждаемся в отдельном определении). Угол между прямыми, не лежащими в одной плоскости, равен, по опре- определению, углу между параллельными им прямыми, лежащими в одной пло- плоскости. Двузначность угла между прямыми, естественно, очень неудобна. Поло- Положение может быть исправлено, если предположить прямые ее и р ориентиро- ориентированными. В этом случае на каждой из этих прямых выделяется единствен- единственный луч с началом в точке О (так называемый положительный луч, точки А которого характеризуются требованием, чтобы вектор ОА был положительно ориентирован), и тем самым между прямыми возникает единственный угол 0. Этот угол называется углом между ориентированными прямыми а и |3. Для параллельных прямых, по определению, полагается 0 = 0, если прямые ориентированы одинаково (см. конец п. 4), и 0 = я, если их ориен- ориентации различны. По определению, О<0<я и потому угол 0 однозначно определен, если известен его косинус cos 0. Если плоскость П, в которой расположены (ориентированные) прямые а, и |3, также ориентирована, то определен так называемый ориентированный угол ф от прямой а к прямой |3. По определению, <Р= ± 6, причем (р = 9, если произведение ориентации прямых а и |5 (см. п. 3) сов- совпадает с ориентацией плоскости П, и ф = —6 в противном случае. Если прямые аир параллельны, то, по определению, ф = 9. 81
Таким образом, и угол ф однозначно определен, если известны его тригонометрические функ- функции sin ф и cos ф. Наглядно ф является углом, на который нужно в заданном на плоскости П направлении вращения повернуть прямую а так, чтобы она совпала с прямой р (и при этом совпали бы ориентации этих прямых). В отличие от угла 0 угол ф зависит от порядка, в котором рассматри- рассматриваются прямые аи^: при перестановке этих прямых он меняет знак (за исключением, правда, случая ф = я, когда угол ф остается — в силу приня- принятых выше определений — тем же самым). Во избежание исключений и утомительных оговорок иногда удобно счи- считать, что угол ф принимает значения из всей числовой оси: — оо< ф < -f оо, предполагая при этом, что значения, отличающиеся на 2я, выражают одну и ту же геометрическую ситуацию. Например, в силу этого соглашения утвер- утверждение об изменении знака угла ф при перестановке прямых аир будет верно уже без всяких исключений. § 5. МЕТРИЧЕСКАЯ ТЕОРИЯ ВЕКТОРОВ В предыдущих параграфах измерение длин играло чисто вспомогатель- вспомогательную роль (а измерение углов вообще не встречалось). Более того, при же- желании понятие длины можно было бы совсем исключить (правда, ценой не- некоторого усложнения теории). Часть геометрии, не опирающаяся па понятие длины (и величины угла), называется аффинной геометрией '). Таким обра- образом, можно сказать, что до сих пор мы занимались аффинной теорией векто- векторов. Теперь же мы перейдем к их метрической теории, существенно опираю- опирающейся на понятие измерения. Во всем этом параграфе мы будем предполагать выбранным и фиксиро- фиксированным некоторый эталон длины (один и тот же для всех прямых). 1. Длина вектора и угол между векторами Важнейшими метрическими понятиями являются понятия длины вектора и угла между двумя векторами. Длину \а\ вектора а = АВ мы определили в п. 2 § 2 для векторов на прямой посредством формулы \а\ = \АВ\. То же самое определение мы сохраним и для векторов на пло- плоскости или в пространстве. Оно, конечно, нуждается в проверке корректности, т. е. в доказательстве того, что ') Более четкое определение аффинной геометрии мы дадим ниже, когда у нас будет подготовлен необходимый для этого материал. 82
эквиполлентные направленные отрезки АВ и А^В{ имеют равные длины. Но это очевидно. Действительно, если отрезки АВ и АхВх расположены на одной прямой, то равенство их длин уже до- доказано в п. 2 § 2. Если же эти отрезки расположены на раз- различных прямых (и потому, в частности, невырождены), то они являются противоположными сторонами некоторого параллело- параллелограмма и потому их длины одинаковы. Заметим, что длина \а\ вектора а тогда и только тогда равна нулю, когда й = 0. Перейдем теперь к углу между векторами. Пусть а и Ь — два отличных от нуля вектора на плоскости. Отложив их от некоторой точки О, мы можем написать, что а = О А и Ъ = ОВ. Рассмотрим прямые а = О А и р = ОВ, ориентированные таким образом, чтобы векторы а и Ъ (рассмат- (рассматриваемые как векторы на прямых) были положительно ориенти- ориентированными (см. п. 1 § 2). ' ' Определение 1. Угол 8 между ориентированными прямыми аир (см. дополнение к § 4) называется углом между векто- векторами а и Ъ и обозначается символом (а,Ь). Это определение нуждается, конечно, в проверке коррект- корректности, т. е. в доказательстве того, что угол (а, Ь) не зависит от выбора точки О. Мы докажем корректность, выразив этот угол через величины, от точки О заведомо не зависящие. Рассмотрим с этой целью проекцию ргв& = ОВ' вектора Ь на прямую а (на направление вектора а) параллельно прямой, перпендикулярной прямой а. (Такого рода проекции назы- называются ортогональными или прямоугольными проекциями; они должны быть знакомы читателю из школьного курса* геомет- геометрии. В этом параграфе никаких проекций, кроме ортогональных, мы рассматривать не будем.) Предположим сначала, что прямые а и C не параллельны и не перпендикулярны. Тогда среди двух элементарно-геомет- элементарно-геометрических углов 0i и б2 между этими прямыми можно выделить наименьший (острый) угол! Обозначим этот угол символом 8'. Угол 0' является не чем иным, как углом при вершине О в прямоугольном треугольнике ОВВ', и потому cos и — | ол 1 — | ft | • С углом 8 угол 8' связан, очевидно, соотношениями 0', если угол 0 острый, 83 0 = ¦ \п — 0', если угол 0 тупой.
Следовательно, cos 8', если угол 8 острый, \ — cos 6', если угол 6 тупой. С другой стороны, ясно, что если угол 8 острый, то базисы а и рга Ь прямой а одноименны, а если угол 6 тупой, то эти базисы разноименны. (Наглядно этот факт очевиден— доста- достаточно сделать чертеж; формальное доказательство мы опу- опустим.) Другими словами, для величины (рга Ь) вектора рга Ь (см. п. 2 § 2) на ориентированной указанным выше образом прямой а имеют место равенства / | рга 6 |, если угол б острый, \ — | рг« 6 |, если угол 8 тупой. Сопоставляя все сказанное, мы немедленно получаем, что как при тупом, так и при остром угле 0 справедливо равенство A) Эта формула остается справедливой и тогда, когда прямые а и C перпендикулярны 10 = -^- , поскольку в этом случае обе ее стороны равны нулю, а также когда прямые аир парал- параллельны (8 = 0 или я), поскольку при 8 = 0 обе ее стороны равны, очевидно, +1, а при 0 = я равны —1. Таким образом, мы доказали, что для угла 8 между любыми двумя {отличными от нуля) век- векторами а и Ъ справедлива формула A). Поскольку, по определению, 0 ^С 8 <^ л, косинус cos 8 одно- однозначно определяет угол 6, и следовательно, формула A) однозначно определяет угол между векторами. В частности, это доказывает корректность определения угла 0, поскольку величина (») не зависит от выбора точки О. Замечание 1. Можно «обратить» предыдущие рассуждения и принять формулу A) за определение угла 0 между векторами. После этого можно определить угол между двумя ориентированными прямыми как угол между их любыми положительно ориентированными базисами (это опреде- определение нуждается, конечно, в проверке корректности). Это доставляет <нам~ уже вполне строгое определение угла между прямыми. 84
Угол можно определить и между векторами на прямой. Именно, угол 8 = (а, Ь) считается, по определению, равным нулю, если векторы а и Ь одноименны (см. п. 1 § 2), и равным л; в противном случае. Формула A) сохраняется и для векто- векторов на прямой, если под вектором (рго6) понимать вектор Ь. Таким образом, угол между двумя коллинеарными векторами на пло- плоскости, т. е. векторами,, параллельными некоторой прямой а, не зависит от того, рассматриваем ли мы эти векторы как векторы на плоскости или как векторы на прямой а. В обоих случаях этот угол равен нулю, если векторы «одинаково направлены» (их отношение положительно), и равен я, если они «противоположно направлены» (их отношение отрицательно). Наконец, угол между векторами в пространстве сводится к углу между векторами на плоскости, поскольку любые два вектора параллельны некоторой плоскости. (Независимость этого угла от выбора плоскости очевидна, поскольку для не- коллинеарных векторов эта плоскость определена — с точностью до параллельности — единственным образом, а угол между кол- линеарными векторами сводится к углу между векторами на прямой.) Для угла между векторами в пространстве формула A) также сохраняется (только, конечно, под рг« Ь следует те- теперь понимать проекцию параллельно плоскости, перпендику- перпендикулярной прямой а = О А). По самому определению, угол между двумя векторами в пространстве не зависит от того, рассматриваем ли мы эти век- векторы как векторы в пространстве или как векторы в соответ- соответствующей плоскости. Угол между векторами, среди которых хотя бы один равен нулю, не определяется. На ориентированной плоскости наряду с - углом 9 между векторами а = ОА и Ь = ОВ можно рассматривать также угол ф от вектора а к вектору Ъ. По определению, он равен (ориентированному) углу от прямой а = ОА к прямой р = ОВ. С углом Q при (X0<jt этот угол связан соотношениями Ф= ± 6; при 6 = п имеем ф = я. Угол ф однозначно определен, если известны его тригонометрические функции соэф и sin ср. Пусть а — ориентированная прямая и Ъ — произвольный от- отличный от нуля вектор. Ясно, что для любого положительно ориентированного вектора а прямой а угол от а к 6 не зави- зависит от выбора вектора а, т. е. определяется исключительно пря- прямой а и вектором 6. Этот угол называется наклоном вектора Ь к прямой а. 85
2. Скалярное произведение векторов По самому определению угол между векторами а и 6 не за- зависит от их порядка, т. е. равен углу между векторами b и а. Сопоставляя это замечание с формулой A) предыдущего пункта, мы немедленно получаем, что для любых двух отлич- отличных от нуля векторов а и Ь (на прямой, в плоскости или в про- пространстве) имеет место соотношение Умножив это равенство на произведение |а[-|6| длин данных векторов, мы получим соотношение |«1 - (рг«6) = | 6| • (prfta). A) Предположим теперь, что один из рассматриваемых векто- векторов (скажем, вектор а) равен нулю, тогда как другой вектор (вектор Ъ) по-прежнему отличен от нуля. В этом случае имеет смысл только выражение | 6 | - (рг& а) (причем оно равно нулю), тогда как выражение | а \ ¦ (рга Ь) смысла не имеет (ибо вектор ргаЬ при а = 0 не определен). В связи с этим удобно принять следующее общее Соглашение. Произведение двух величин, одна из которых равна нулю, а другая не определена, считается, по определению, равным нулю. Это соглашение оправдывается тем, что как бы мы не до- доопределили второй множитель, произведение все равно будет равно нулю (за счет равенства нулю первого множителя). В соответствии с этим соглашением мы можем теперь утвер- утверждать, что равенство A) справедливо для любых двух векторов а и Ъ. Определение 1. Число | а | • (рг« Ь) (или | b \ • (рг& а)) назы- называется скалярным произведением векторов а и 6 и обозначается символом ab (а также символом (а,Ъ))\ аЪ = | а | • (рг« Ь) = | Ь \ ¦ (рг& а). Замечание 1. Эпитет «скалярное» обязан своим происхожде- происхождением тому, что числа (а значение скалярного произведения, по определению, является числом) часто называются скалярами. Пользуясь формулой A) предыдущего пункта, мы можем формулу для скалярного произведения записать в следующем более симметричном виде: аб = | а |. | 6 | - cos (аГ&). B) В соответствии с принятым выше общим соглашением эта фор- формула справедлива для любых векторов а и Ь. -86
Таким образом, скалярное произведение векторов равно произведению ихг длин на косинус угла между ними. Если а== Ъ, то (а, Ь) = О, и потому аа = а2 = |а|2. C) Таким образом, скалярный квадрат вектора равен квадрату его длины. Эту формулу удобно писать «наоборот»: \a\=Va2. C') Таким образом, длина вектора равна корню квадратному из его скалярного квадрата. Аналогично, написав «наоборот» формулу B), мы получим для угла 8 = (а, Ь) формулу Таким образом, косинус угла между (отличными от нуля) векторами равен их скалярному произведению, деленному на произведение их длин. Замечание 2. Мы видим, что через скалярное произведение выражаются обе основные метрические характеристики век- векторов (длина и угол). Векторы а и Ь называются ортогональными, если их скаляр- скалярное произведение равно нулю: Таким образом, векторы ортогональны, если хотя бы один из них равен нулю или если эти векторы перпендикулярны (угол между ними равен я/2). Докажем теперь следующую важную теорему: Теорема 1. Для любых векторов а, Ъ, с и любого числа k имеют место соотношения 1. ab — Ьа, 2. (а + Ь)с = ас+Ьс, 3. (ka)b = k(ab), 4. а2 ^ 0, причем а2 = 0 тогда и только тогда, когда а = 0. Доказательство. Свойство 1 очевидно. Свойство 2 не- непосредственно вытекает из соответствующего свойства величин проекций: (с + 6) с == | с | (ргс(а + Ь)) = | с | ((piya) + (pre Ъ)) = = | с |(ргеа) +1 с |(рге 6) = ас + Ъс. 87
Свойство 3 доказывается аналогично: (ka)Ь = \Ь\(pr& ka) — k\b\prba = k (ab). Наконец, свойство 4 непосредственно вытекает из формулы C). Свойство 1 — это свойство коммутативности, свой- свойство 2 — свойство дистрибутивности, свойство 3 — !свойство однородности, а свойство 4 — свойство положительной определенности. Вместе свойства 2 • и 3 называются свойством линейности. Свойства ком- коммутативности и линейности показывают, что вычисления со ска- скалярным произведением подчиняются обычным правилам арифме- арифметики (раскрытие скобок и т. п.). В дальнейшем мы постараемся (когда это возможно) поль- пользоваться только доказанными четырьмя свойствами скалярного умножения и не будем обращаться к его определению B). 3. Применение скалярного умножения к доказательству геометрических теорем Пользуясь скалярным умножением, можно чисто алгебраи- алгебраически доказывать разнообразные теоремы геометрии, связанные с понятиями длины и угла. Пример 1. Пусть ABC — произвольный прямоугольный тре- треугольник (с прямым углом в вершине С). Рассмотрим векторы а = СВ, 6 = ЛСи с = АВ. Так как с = а + Ь и а6 = 0, то | с |2=(а + 6J=а2 + 2аЪ + 62=а2 + Ъ2 = \ a f +1 Ъ |2, т. е. | АВ |2== = | СВ |2 + I АС |2. Тем самым мы доказали теорему Пифа- Пифагора (квадрат гипотенузы равен сумме квадратов катетов). Заметим, что «в векторной форме» теорему Пифагора мож- .но, таким образом, сформулировать в следующем виде: для любых двух ортогональных векторов а и Ъ имеет место равенство |a+6|2 = !a|2 + |6f. В этой форме она, очевидно, справедлива и в случае, когда хотя бы один из векторов а или Ъ равен нулю. Пример 2. Пусть ABCD — произвольный параллелограмм. Рассмотрим векторы а = АВ, Ъ = BD ис = АС и d = AD. Ясно, что d = a-\-b и c = d + о. Поэтому | Ь р = Ь2 = (d - аJ = d2 - 2 da + a2, и следовательно, | BD p + \АС Р = | AD р +1 ВС р +1 АВ Р +1 CD p.
Тем самым мы доказали известную теорему о диагона- диагоналях параллелограмма (сумма квадратов диагоналей параллелограмма равна сумме квадратов его сторон). Заметим, что в «векторной форме» эта теорема сводится к тривиальному алгебраическому тождеству (d — eJ-f- + (* + J 2(d2 + 2) ( ) ( ) Пример 3. Рассмотрим два произвольных вектора а и Ь. Возводя равенство B) п. 2 в квадрат и учитывая, что cos2 0^1, мы немедленно получим, что (аЪУ^\а?-\Ъ\\ т. е. что |a6KI«l-|H или иначе — что (a&J<a262. A) Это важное неравенство называется неравенством Коши — Буняковского. Легко видеть, что неравенство Коши — Буняковского тогда и только тогда вы- вырождается в равенство, когда векторы а и Ь коллинеарны. Замечание 1. Мы доказали неравенство Коши — Буняков- Буняковского, пользуясь определением скалярного произведения. Од- Однако его можно легко доказать и лишь на основе перечислен- перечисленных в теореме 1 п. 2 свойств. Действительно, рассмотрим вектор a -f- tb, где / — произвольное вещественное число. Согласно свойству 4 для любого / имеет место неравенство (a + /ftJ^0, т. е. неравенство а2 + 2 (аЬ) t + ЬЧ2 > 0. Но из алгебры известно, что если квадратный трехчлен прини- принимает лишь неотрицательные значения, то его дискриминант (подкоренное выражение в формуле для корней квадратного уравнения) не положителен. В нашем случае этот дискрими- дискриминант равен (abJ — a2b2, так что {abf — a2b2 s^ 0, т.'е. {abf s^ a2b2. Из неравенства Коши — Буняковского вытекает, что и аналогично Извлекая квадратный корень, мы получаем, что для любых векторов а и Ь имеют место неравенства ||a|-|6||<|a + 6|<|a| + |ft|. B) При этом легко видеть, что для неколлинеарных векторов оба неравенства B) — строгие. Неравенства B) выражают (для неколлинеарных векто- векторов) известную теорему о сторонах треугольника (длина сто- стороны треугольника меньше суммы длин других его сторон и 89
больше их разности). Поэтому неравенство B) называется обычно неравенством треугольника (даже и в слу- случае коллинеарных векторов а и Ь). Для векторов на прямой неравенство B) равносильно из- известному неравенству для абсолютной величины суммы двух вещественных чисел. 4. Выражение скалярного произведения в координатах Определение /.Пусть еи ..., е„ — произвольный базис (на прямой, в плоскости или в пространстве). Попарные скалярные произведения ёа = eiet векторов этого базиса называются его метрическими коэффи- коэффициентами. Таким образом, при п = 1 (случай прямой) имеется только один метрический коэффициент gn, равный квадрату длины единственного базисного вектора еи при п = 2 (случай пло- плоскости) имеется четыре метрических коэффициента ?ц= ei» ¦ё\2==е1ег' ёг21==е2е1> ёг22==е2> которые мы будем записывать в виде матрицы 'ёи , ё2\ §22 / ' и, наконец, при п = 3 (случай пространства) имеется девять метрических коэффициентов, составляющих матрицу ' ёи ё\2 #23 Эти метрические коэффициенты не независимы. Именно, во- первых, ясно, что они симметрично зависят от индексов, т. е. ёи = ён> i> /=1. •••> п- Таким образом, при. п = 2 имеется на самом деле только три метрических коэффициента: gn, gw и gi2 = g2i, а при п = 3 — только шесть: gn, g22, ?зз и g12 = g2l, g23 = e32, gi3 = ёГз1- Во-вторых, метрические коэффициенты должны удовлетво- удовлетворять некоторым неравенствам, вытекающим из положительной определенности скалярного произведения. Например, поскольку gn = e\, то ?и>0. A) Далее, согласно неравенству Коши — Буняковского < е\е\, т. е. SO
Это условие можно переписать также в следующем «детерми- нантном» виде: gll g\2 О Z1 О ?.?. B)- Можно показать (мы это сделаем позже; см. п. 5 § 6), что при п = 3 выполняется аналогичное неравенство gu ё\2 gi3 §21 <§22 <§23 C) Оказывается, что этих условий уже достаточно, т. е. для любой квадратной симметрической матрицы (ga) по- порядка ns^.3, удовлетворяющей условию A) при п=1, усло- условиям A) и B) при п = 2 и условиям A), B) и C) при п = Н,. существует базис (соответственно на прямой, в плоскости или в пространстве), матрицей метрических коэффициентов кото- которого эта матрица является. Упражнение. Докажите это утверждение. Над матрицами с векторными элементами мы можем про- производить те же действия, что и над векторами. В частности,, умея перемножать векторы, мы можем перемножать и мат- матрицы с векторными элементами. Рассмотрим, например, матрицу-строку р — (о. р \ составленную из векторов данного базиса еь понированную матрицу-столбец ., еп, и транс- трансУмножая «скалярно» матрицу ет на матрицу е, мы, очевидно,, как раз и получим матрицу метрических коэффициентов G= (gij). Таким образом, мы можем написать, что G = eTe. Пользуясь этой записью матрицы G, можно сразу же по- получить ответ на вопрос, как меняется эта матрица при измене- изменении базиса.
Пусть ех, ..., еп и еу еп- — два базиса (на прямой, в плоскости или в пространстве) и пусть G — матрица метри- метрических коэффициентов базиса еь ..., еп, а С— матрица метри- метрических коэффициентов базиса еу, ..., еп>. Кроме того, пусть С — матрица перехода от базиса е,, .... еп к базису е,', ..., еп'. Тогда и е' = еС, где е = (е,, е„), е' = (е,', ..., еп'). Поэтому G' = (еС)т (еС) = (Стет) (еС) = Ст (ете) С = CTGC. Таким образом, G' = CTGC. Это и есть формула преобразования матрицы G при измене- изменении базиса. Пусть е, — базис на прямой, a g^ — его метрический коэф- коэффициент. Тогда для любых двух векторов х = х{еу и у = у1е1 ху = (х'е,) (г/'е,) = e\xly{ = gnxlyl. Аналогично, если е,, е2 — базис на плоскости и gu, g22, gn = g2i — ег0 метрические коэффициенты, то для любых век- векторов л; = я'е, + х2е2 иу = ylet + у2е2 ху = (х'е, + х2е2) (у1ех + у2е2)' = = (х'в.) (у'в,) + (х!е1) (г/2е2) + (х2е2) (у'в,) + (х2е2) (у2е2) = = ^11-^' У1 + Я12(Х1У2 + Х2У1) + ё22*?\ Наконец, если еь е2, еъ — базис в пространстве, то в ана- аналогичных обозначениях ху = (лг'вх + х2е2 + х3е3) (г/'е, + у2е2 + у3е3) = Таким образом, скалярное произведение выражается в координатах следую- следующими формулами: xy = gnxlyl {на прямой), ху = gi^y1 + gl2 (xly2 + x2yl) + g22x2y2 (на плоскости), ХУ = ?ц*У + g22*V + g&XZy3 +.gl2 (Х1У2 + Х2У1) + + ffis (xly3 + хУ) + g23 (x2y3 + x3y2) (в пространстве). 92
Эти формулы можно- переписать также в следующем более симметричном виде: xy = Пользуясь знаком 2 суммы, последние формулы можно записать совсем коротко: Можно также (как и в п. 7 § 3) ввести в рассмотрение одно- столбцовые матрицы состоящие из координат данных векторов. Тогда предыдущую формулу можно с помощью матричного умножения записать в следующем компактном виде: xy где G — матрица метрических коэффициентов, а хт — одно- строчечная матрица, полученная транспонированием матрицы х. В этом виде формула для ху доказывается (для любого п) одной строчкой вычислений: ху = (ех) (еу) = (ех)т (еу) = (хтет) (еу) = хт (втв) y = (здесь мы воспользовались тем, что для матрицы ех первого порядка справедливо равенство (ех) т = ех). Умея вычислять через координаты скалярное произведение, мы, используя формулы C') и B') п. 2, можем вычислять че- через координаты длины векторов и углы между ними. Напри- Например, в матричной записи формула для длины вектора имеет вид (имеется в виду арифметический корень), а формула для угла между векторами — вид 93
В развернутом виде мы напишем эти формулы только для случая плоскости: \x\=Vgn(x1f + 2gl2xlx2 + g22( cos 0 = gn*'y' + gi2(* У +х2у1)- 5. Ортонормированные базисы Формулы для скалярного произведения приобретают особен- особенно простой вид, когда для рассматриваемого базиса матрица метрических коэффициентов является единичной матрицей, т. е. когда 1, если i = j, 8" \ О, если 1ф\. Определение 1. Базис, матрица метрических коэффициентов которого является единичной, называется ортонормированным. Ясно, что базис е\, ..., еп тогда и только тогда ортонормирован, когда каждый его вектор имеет длину, равную единице, и любые два (различных) его вектора ортогональны. Векторы, длина которых равна единице, называются единич- единичными векторами или ортами. Таким образом, каждый ортонор- мированный базис состоит из п попарно ортогональных ортоб. Для обозначения векторов ортонормированного базиса при- принято использовать символы it, ..., /„. В частности, ортонорми- рованный базис на прямой (т. е. некоторый орт) обозначается символом «1 или просто /. (Заметим, что на прямой существует только два ортонормированных базиса i и —i.) Аналогично, векторы ортонормированного базиса на плоскости (т. е. два ортогональных орта) обозначаются символами i\ и »2 (иногда используются также обозначения in /), а векторы ортонор- ортонормированного базиса в пространстве (три ортогональных орта) — символами <i, *2 и н (или же символами i, ), k). Координаты вектора в ортонормированием базисе принято обозначать, помещая индекс внизу (т. е. принято писать не хх, ..., хп, как в общем случае, а х\ хп). Более того, ча- часто пользуются и безындексным обозначением координат (на- (например, символом х на прямой, символами х, у на плоскости и символами х, у, z в пространстве). Так, например, в простран- пространстве разложение вектора х по векторам ортонормированного ба- базиса обычно пишется в следующем виде: х = xxi -f ду + x3k или (впрочем, последняя форма записи редко бывает удобна). 94
Формула для скалярного произведения в ортонормированием базисе имеет, очевидно, вид *y = -*i#i+ ••• + ХпУп (я =1,2,3). Для длины вектора и угла между двумя векторами полу- получаем формулы cos 8-= Например, на плоскости 1*1= Ортонормированные базисы обладают тем. приятным свой- свойством, что координаты х\, ..., хп произвольного вектора в яв- явном виде выражаются через этот вектор. Именно, легко ви- видеть, что справедливо следующее - Предложение 1. Для любого ортонормированного базиса i\, ..., in {на прямой, в плоскости или в пространстве) коорди- координаты хи ..., хп произвольного вектора х равны скалярным про- произведениям этого вектора на векторы базиса: Доказательство. Скалярно умножая равенство л; = = Xiii + ... + xnin, скажем, на ix и учитывая, что ^=1 и *1*а = 0 ПРИ k>\, мы немедленно получим, что x^=xii. Определение 2. Пусть х — произвольный отличный от нуля вектор (на прямой, в плоскости или в пространстве) и пусть «1, ..., ап — углы, образованные этим вектором с ортами «1, ..., in некоторого ортонормированного базиса. Косинусы cosci!, .. ., cosara этих углов называются направляющими косинусами вектора х. Впрочем, рассмотрение этих косинусов по существу инте- интересно только в пространстве (т. е. при л = 3). Действительно, на прямой единственный направляющий косинус равен ±1, а на плоскости имеют место равенства = cosa, cos a2 = sin a, ' 95
где а — угол от вектора i\ = i к вектору ж (здесь имеется в виду, что на плоскости выбрана ориентация, определяемая дан- данным базисом »ь /г)- В пространстве направляющие косинусы обычно обозна- обозначаются символами cos a, cosfJ, cosy- ПОСКОЛЬКУ «ift =| Ж |COSctft, k—l, ..., П, МЫ ВИДИМ, ЧТО координаты Х\, ..., хп вектора х в ортонормированием ба- базисе выражаются через его длину и через его направляющие косинусы по формулам #! = | ж |cos<X[, ..., хп = | ж | cos а„. Таким образом, на плоскости, х1 = |ж|соза, х2 = | х | sin а, а в пространстве Л1 = |ж|соза, х2 = | ж | cos р, л;3 = | jc | cos у. Два вектора тогда и только тогда имеют одинаковые на- направляющие косинусы, когда они отличаются положительным множителем. Для орта (единичного вектора) направляющие косинусы совпадают с его координатами. Поскольку для любого вектора х имеет место формула |*Р = *?+ ... + х2, то cos2 01]+ ... +cos2an=l. При п = 1 это соотношение тривиально, при п — 2 оно сво- сводится к известному тригонометрическому тождеству cos2 a + sin2 a = 1, а при п = 3 имеет вид cos2 a + cos2 p + cos2 у = 1. Подставив в формулу для косинуса угла между двумя век- векторами выражения их координат через направляющие коси- косинусы, мы немедленно получим, что угол 0 между векторами х и у с направляющими косинусами cos ai, ..-, cos <хп и cos pi, ..., cos pn удовлетворяет соотноше- соотношению COS0 = COS(XiCOS р! + ... + COS а„ COS Рга. В частности, в пространстве (обозначив направляющие ко- косинусы вектора х через cos ai, cospi, cosyi, а направляющие косинусы вектора у через cos a2> cos p2, cos y2) мы получаем формулу cos G = cos a! cos a2 + cos pt cos p2 + cos Yi cos Y2» 96
а на плоскости (в аналогичных обозначениях) — формулу cos 6 = cos Oj cos a2 + sin ai sin a2 = cos (a2 — a,). Впрочем, последняя формула нам не дает ничего нового, по- поскольку угол а2 — - cci равен, очевидно, углу ф от вектора х к вектору у (в ориентации плоскости, определенной базисом i], i2) и потому либо он совпадает с углом 8, либо отличается от него знаком. Тот факт, что ф = а2— ai, позволяет без труда найти фор- формулы для вычисления угла ф по координатам векторов х и У- Действительно, sin ф = sin (a2 — aO = cos a2 sin a, — sin a2 cos a! = Xl?2. ,*2?' ¦. Поскольку COS ф = COS 6=-]^^., тем самым доказано, что для угла ф от вектора x(xi,x2) к вектору у(у\,у2) (в ориен- ориентации, задаваемой базисом iu i2) имеют место формулы x1ij2-x.2y1 _ cos _ *i0i + хф_ > ом/о П ' "l/o о-*/'*-* Напомним, что величины sin ф и cos ф однозначно опреде- определяют угол ф. Пусть X — произвольная ориентированная прямая (для опре- определенности, в пространстве). Ее направляющими косинусами cos a, cos C, cosy называются направляющие косинусы ее произвольного поло- положительно ориентированного вектора а. (Очевидно, что это опре- определение корректно.) По определению, для величины (рт^х) ортогональной про- проекции рг^дс произвольного вектора х(хи х2, х$) на прямую X имеют место равенства = Xi cos a + х2 cos р + х3 cos у. Таким образом, величина (рг^дс) ортогональной проекции произвольного век- вектора х(Х[,х2,х3) на ориентированную прямую X с направляю- направляющими косинусами cos a, cos p, cosy выражается формулой (рг^х) = xl cos'a + х2cos р + х3cos y. Аналогичная формула на плоскости имеет вид (ргя х) = Ху cos a + х2 sin a. 4 М, М. Постников 97
6. Ортогональные матрицы Пусть ?,, ..., in и i\, ..., i'n— два ортонормированных ба- базиса (на прямой, в плоскости или в пространстве) и пусть С — матрица перехода от первого базиса ко второму. Как мы знаем (п. 4), матрицы метрических коэффициентов преобразуются при изменении базиса по формуле Но в нашем случае С == G = Е. Следовательно, матрица С перехода от одного ортонормированного базиса к другому удовлетворяет соотношению СТС = Е. A) Определение 1. Матрицы, з'довлетворяющие соотношению A), называются ортогональными. Таким образом, мы показали, что матрица перехода от одного ортонормированного базиса к другому является ортогональной матрицей. Легко видеть, что верно и обратное: если матрица С перехода от одного базиса к другому орто- ортогональна и если первый базис ортонормирован, то второй ба- базис также^ортонормирован. Действительно, матрица метрических коэффициентов второго базиса имеет вид CTGC, где G — матрица метрических коэффи- коэффициентов первого базиса. Но по условию G = Е и СТС = Е. Поэтому эта матрица является единичной матрицей Е, и сле- следовательно, второй базис также ортонормирован. Перейдя в равенстве A), определяющем ортогональные матрицы, к определителям и вспомнив, что |СТ| = |С| (при транспонировании определитель не меняется), мы немедленно получим, что определитель произвольной ортогональной матрицы С ра- равен ±1: \С\=± 1. Определение 2. Ортогональные матрицы С, для которых |С|=1, называются собственными ортогональными матри- матрицами (а матрицы с |С|=—1 соответственно — несобствен- ¦ ными). Вспоминая определение одноименных базисов, мы немед- немедленно получаем, что собственные ортогональные матрицы (и только они) яв- являются матрицами перехода между одноименными ортонорми- рованными базисами. S8
Умножив равенство A) справа на С, мы немедленно по- 'лучим, что СТ=С'К Обратно, если Ст=С-\ то СТС = Е и, следовательно, матрица С ортогональна. Таким образом, матрица С тогда и только тогда ортогональна, когда транс- транспонированная матрица Ст является обратной матрицей С~1: Ст =С~1. B) Умножив равенство B) слева на С, мы получим, что ССТ = Е. Обратно, если ССТ — Е, то Ст = С" и, следова- следовательно, матрица С ортогональна. Таким образом, матрица С тогда и только тогда ортогональна, когда она удовлетворяет соотношению ССТ = Е. C) В развернутом виде соотношение A) означает, что сумма квадратов элементов каждого столбца матрицы С равна еди- единице, а сумма попарных произведений соответственных элемен- элементов двух любых столбцов равна нулю. Соотношение C) озна- означает, что тем же свойством обладают и строки матрицы С. Ясно, что для любой ортогональной матрицы С обратная матрица С~х также является ортогональной матрицей. Действительно, если матрица С была матрицей перехода от одного ортонормированного базиса к другому, то матрица С~1 будет матрицей перехода от второго базиса к первому. Аналогично показывается, что произведение CiC2 двух ортогональных матриц С\ и С2 так- также являемся ортогональной матрицей. Последние два утверждения означают, что совокупность О (л) всех ортогональных матриц порядка п является груп- группой по умножению. Замечание 1. Это утверждение можно доказать и чисто алгебраически, пользуясь лишь определением ортогональной матрицы как такой матрицы, для которой СТС = Е. Действительно, из курса алгебры известно, что Поэтому," если jE, CjC2-=E, то (С^ (С&) = CJ {CJC,) С2 - CjC2 = Е. Аналогично, если **~ 99
то СТ(СТ)Т = ?, и, следовательно, матрица Ст = С ортогональна. Это доказательство проходит для любого п (в том числе и при п > 3). Поскольку определитель произведения двух матриц равен произведению определителей сомножителей, то произведение двух ортогональных матриц тогда и только тогда является собственной ортогональной матрицей, рогда оба сомножителя являются одновременно либо собственными, либо несобственными ортогональными матрицами. В частности, мы видим, что совокупность О* (п) всех собственных ортогональных матриц является подгруппой группы О(п). Эта подгруппа обозначается также символом SO (я). Замечание 2 (для читателей, знакомых с теорией групп). Очевидно, что группа SO (гс) является не только подгруппой, но даже и нормальным дели- делителем группы О(п). Что же касается совокупности О'(п) всех несобственных ортогональных матриц, то она обладает тем свойством, что для любых ее элементов С, и Сг матрицы С]~!С2 и СХС^Х принадлежат группе SO(«) = О*(п). На языке теории групп это означает, что множество О~(п) всех несобственных ортогональных матриц порядка п является двусторонним смежным классом группы О (я) по подгруппе О+(я). Пусть сц — элементы ортогональной матрицы С. При п=1 условие ортогональности сводится к равенству Следовательно, единственными ортогональными матрицами пер- первого порядка являются числа ±1. Это вполне согласуется с тем, что на прямой существует только два ортонормированных базиса: i и —L Числа +1 и —1 составляют группу по умножению. Обозначая эту груп- группу символом S0, мы можем, следовательно, сказать, что группа 0A) изоморфна группе S0. В частности, мы видим, что единственной собственной орто- ортогональной матрицей первого порядка является единичная мат- матрица 1. При п = 2 условия ортогональности имеют вид г2 -4- г2 = 1 12 + С21С22 = О, 100
Общее решение первого уравнения выражается, очевидно, формулами cn = cosa, c2i i где ос — некоторый угол, —л <о<п, а общее решение треть- третьего уравнения — аналогичными формулами C\2 — COS p, C22 — Slfl |jj Подставляя эти выражения во второе уравнение, мы полу- получим, что cos(P — а) = 0. Следовательно, р = а±у и потому либо cos P = — sin а, sin p = cos а, либо cos p = sin а, sin Р = — cos а. В первом слу- случае определитель матрицы С равен cos2 а + sin2 а = 1, а во втором — равен — cos2a — sin2a = —1. Таким образом, произвольная ортогональная матрица второго порядка имеет либо вид /cosa —sin a1 \sina cos a, и в этом случае она — собственная, либо вид /cosa sin a\ \sina —cos a/' и тогда она несобственная. Если матрица С является матрицей перехода от базиса i, / к базису /', /', то угол а является не чем иным, как углом ер от вектора i к вектору V (в ориентации, определенной бази- базисом i, ]'). Действительно, по определению i' — i cos a + /sin a и потому для угла ср от вектора i к вектору У имеют место фор- формулы (см. конец п. 5) sin ср = 1 • sin a — 0 • cos a == sin a, cos ф = 1 • cos a + 0 • sin a = cos a, и, следовательно, ср = a. При вращении плоскости на угол а (в положительном направлении) вектор t переходит, таким образом, в вектор i', а вектор / — в вектор /', если базисы », / и «', /' одноименны, и в вектор —/', если эти базисы разно- именны. В частности, мы видим, что любые два одноименных базиса плоскости мы можем перевести друг в друга некоторым вращением. 101
По формуле умножения матриц / cos а — sin а \ / cos р — sin p \ \sina cos а/\ sin p cosp/ / cos a cos p — sin a sin p — cos a sin p — sin a cos V sin a cos p + cos a sin p — sin a sin p + cos a cos ' cos (a + p) — sin (a + p)' Таким образом, при умножении собственных ортогональных матриц второго порядка соответствующие углы складываются. Рассмотрим множество S1 всех комплексных чисел z = eia, по модулю равных единице. Это множество является группой по умножению, причем Это показывает, что соответствие (cos a — sin a \ ,•„ h->eia sin a cos a / представляет собой изоморфизм группы SO B) на группу S1. В частности мы видим, что группа SOB) —абелева. При п = 3 условия ортогональности имеют вид с2 A cn -1 С — 12 C2 I Yc\A Vc\2A Vc%A Vc\2=: Ь сзз = ¦ 1 с с А '' t'll''13" 1 г г —\ l> L121'13 ~ h c2lc22 A Г С21С23 ~ Ь С31С32 Ь С31С33 I" C32C33 = 0, = o, = 0. Аналитическое исследование этой системы уравнений, хотя и возможно, но крайне канительно. Поэтому мы воспользуемся наглядными геометрическими соображениями. При этом мы бу- будем для простоты считать, что рассматриваемая ортогональная матрица С — собственная, т. е. осуществляет переход от неко- некоторого ортонормированного базиса i, /, k к одноименному ортонормированному базису /', /"', k'. Более формальное (и более изящное) исследование этой си- системы уравнений мы проведем в п. 4 § 2 гл. 7. Будем считать, что все векторы i, /, k, i', /', kr отложены от некоторой точки О: % j' = OQ', k' = ORr. Пусть орты k и k' неколлинеарны (kr -ф ± k). Тогда пло- плоскости OPQ и OP'Q' различны и потому пересекаются по не- некоторой прямой А. Пусть 1" = ОР"— *орт этой прямой. Он 102 ,
"ортогонален ортам ft и ft' и потому им не компланарен, т. е. орты k, k', i" составляют некоторый базис пространства (неортонормированный). С равным правом вместо орта- i" мы могли бы взять орт — i". Чтобы устранить эту неопределен- неопределенность, мы потребуем, чтобы базис k, k', i" был одноименен с базисом *,-/, k. Тогда орт i" будет однозначно определен. В случае, когда орты k и k' коллинеарны, мы за орт i" лримем орт i''. Пусть ф — угол от орта i до орта i" в плоскости OPQ (ориентация кото- которой определяется базисом i, j) и пусть j" = OQ" — такой орт плоскости OPQ, что угол от орта / до орта /" также равен ф. Иными словами, /" — это такой орт плоскости OPQ, что ба- базис i", j" этой плоскости получается из базиса i, j вращением плоскости (вокруг точки О) в поло- положительном направлении на угол ф. Согласно сказанному выше отсюда следует, что матрица перехода от базиса i, j к базису г", j" имеет вид /cosi|) — sin ф V sin гр cos i|) Поэтому в пространстве матрица Сх перехода от базиса i, /, k к базису i", j", k выражается формулой /cosi|) — sin ф 0 Cj = I sin ф cos -ф 0 ¦ V 0 0 1 Заметим, что базис i", j", k получается из базиса i, j, k вращением пространства на угол ф вокруг прямой О./?. Рассмотрим теперь плоскость ORR', перпендикулярную прямой Я. Пусть Э — угол между векторами к и k' этой пло- плоскости @ ^ Э <; я). Поворот на угол 9 плоскости О./?./?' (вокруг точки О), совмещающий вектор k с вектором k', переводит вектор /" (также принадлежащий плоскости ORR') в некоторый вектор /"'. Отсюда, как и выше, следует, что матрица С2 перехода от базиса i", j", k к базису i", j'", k' выражается формулой 1 0 0 0 cos0 ,0 sine — sin Э cos Э При этом базис i", j"', k' получается из базиса i", /", Вращением пространства вокруг прямой К на угол 0. .103
Чтобы теперь перейти от базиса г", /"", k' к нужному нам базису V, j', k', достаточно в плоскости OP'Q' перейти от 'ба- 'базиса i", j'" к (очевидно, одноименному) базису V, /'. Это означает, что переход от базиса i", j'", k' к базису Г, /', kr описывается -матрицей / cos ф — sin ф С3 = ( sin ф соэф 0 ), — я<ф<я, \ О О где ф — угол от вектора *" к вектору i' в ориентированной плоскости OP'Q'. При этом базис i', /', k' получается из ба- базиса i", j'", k' вращением пространства вокруг прямой OR' на угол ф. Таким образом, мы видим, что базис *", /', k' получается из базиса i, j, k тремя последовательными вращениями. Сле- Следовательно, переход от базиса i, /, k к базису i', j', k' описы- описывается произведением CiC2C3 матриц перехода Сь С2 и Сл. Тем самым доказано следующее Предложение 1. Любая собственная ортогональная матрица С третьего порядка допускает разложение вида (cos ty —sin i|j 0 \ / 1 0 0\/ cos Ф ~"s'n Ф 0 \ sin ty cos 1M О I 0 cos 0 •— sin 0 I sin ф cos <p 0 , D) 0 0 1 / \0 sin0 cos9/ \ 0 0 1/ где —я <i|5<n, О-<0^я, —я < ф ¦< п. Углы 1]з, 0, ф называются углами Эйлера ортогональной мат- матрицы С (или базиса i, j, k относительно базиса г', /', k'). Они «независимы» в том смысле, что любым их значениям (в ука- указанных пределах,) отвечает некоторая (однозначно определен- определенная) ортогональная матрица. Вообще говоря, нельзя утверждать, что углы г|э, 0, ф одно- однозначно определены матрицей С. Это верно лишь тогда, когда угол 8 отличен от нуля и от к. Если же 0 = 0 или 0 = л, то матрица С однозначно определяет соответственно либо сумму Ф + 1|з, либо разность ф — гр. Поэтому при 0 = 0 или 0 = я один из углов ф или -ф может иметь (для данной матрицы С) произвольное значение. Конечно, в формуле D) можно фактически осуществить умножение матриц и тем самым получить в явном виде выра- выражение элементов матрицы С через углы Эйлера. Мы этого де- делать не будем, поскольку получающиеся формулы в достаточ- достаточной мере громоздки и практически не запоминаемы. Чтобы получить аналогичное описание несобственных орто- ортогональных матриц, достаточно в разложении A) один из столб- цов какой-нибудь матрицы умножить на — 1. 104
§ 6. ПОЛИВЕКТОРЫ 1. Бивекторы Как мы знаем, направленные отрезки АВ и А'В' эквипол- лентны, если либо 1) А = 5 и А' = В', либо 2) А Ф В, А' Ф В' и а) прямая АВ параллельна прямой А'В', б) ориентация прямой АВ, определенная направленным от- отрезком АВ, совпадает (см. конец п. 4 § 4) с ориентацией пря- мой А'В', определенной направленным отрезком А'В', в) длина отрезка АВ равна длине отрезка А'В'. Поскольку направленный отрезок АВ является, по опреде- определению, не чем иным, как упорядоченной парой точек (А, В), мы можем, по аналогии, ввести следующее Определение 1. Две упорядоченные тройки точек (А, В, С) и (А', В', С") называются экеиполлентными, если либо 1) обе тройки коллинеарны, либо 2) обе тройки неколлинеарны и а) плоскость ABC (проходящая через точки А, В, С) па- параллельна плоскости А В'С (проходящей через точки А', В', С), б) ориентация плоскости ABC, определенная тройкой {А, В, С) (см. п. 1 § 4), совпадает с ориентацией плоскости А'В'С', определенной тройкой {А1, В', С), в) площадь треугольника ABC равна площади треугольника А'В'С. Ясно, что отношение эквиполлентности упорядоченных троек точек яв- является отношением эквивалентности. Определение 2. Классы эквиполлентных упорядоченных троек точек называются бивекторами. Бивектор, определенный трой- тройкой (А, В, С) (содержащий эту тройку), обозначается симво- символом ABC. По определению, все коллинеарные тройки точек составляют один бивектор. Этот бивектор называется нулевым и обозна- обозначается символом о. Замечание 1. В изложенных определениях мы неявно счи- считали, что все рассматриваемые точки являются произвольными точками пространства.. Получающиеся бивекторы естественно называть поэтому бивекторами в пространстве. Множество всех таких бивекторов мы будем обозначать символом BivC). Вместе с тем мы можем органичиться точками лишь неко- некоторой плоскости П. Тогда мы получим бивекторы в плоскости. 105
Их множество мы будем обозначать символом BivnB) или про- просто BivB). Аналогично можно, конечно, определить множество Biv(l) бивекторов на прямой. Однако этот случай неинтересен, по- поскольку множество Biv(l) состоит, очевидно, только из нуле- нулевого бивектора е. Так же, как и для векторов (см. п. 4 § 1), каждый бивектор на плоскости естественным образом отождествляется с некото- некоторым бивектором в пространстве, так что мы можем считать,. что для любой плоскости П имеет место естественное вложе- вложение BivnB) cr BivC). Конечно, подмножества BivnB), соответствующие различ- различным плоскостям П, вообще говоря, различны. Они совпадают тогда, когда плоскости параллельны (а в противном случае они имеют только один общий бивектор с). Пусть нам даны два вектора а и Ь (на прямой, в плоскости или в пространстве). Отложив их от одной точки О, т. е. по- положив а = ОА, Ь = ОВ, мы можем рассмотреть бивектор ОАВ. Определение 3. Бивектор ОАВ называется внешним произ- произведением векторов а, Ь и обозначается символом а А Ь: а Л Ъ = ОАВ. Конечно, это определение нуждается в проверке корректно- корректности, т. е. в доказательстве того, что бивектор а Л Ь опреде- определяется исключительно векторами а, Ь (взятыми в данном по- порядке) и не зависит от выбора точки О. Другими словами, нам нужно доказать, что если для двух упорядоченных троек точек {О, А, В) и (О', А', В') имеют место равенства ОА = ОМ', ОВ = (УВГ, то ОАВ = О'А'В'. Задание. Докажите корректность определения внешнего произведения. Ясно, что векторы а и Ь тогда и только тогда линейно зависимы (кол- линеарны), когда их внешнее произведение равно нулю: а Л Ъ = о. .106 .
Замечание 2. Очевидно, что любой бивектор ABC является внешним произведением некоторых векторов (например, векто- векторов АВ и АС). Другими словами, любой бивектор определяется заданием некоторых двух векторов (этим и объясняется тер- термин «бивектор»). Определение 4. Две упорядоченные пары векторов (а, Ь) и (а', Ь') называются эквиполлентными, если внешние произве- произведения векторов этих пар совпадают: а/\Ь = а' /\Ъ'. Ясно, что отношение эквиполлентности пар векторов яв- является отношением эквивалентности. Столь же ясно, что пары (а, Ь) и (а', Ь') тогда и только тогда эквиполлентны, когда либо 1) векторы а, Ь и векторы а', Ь' линейно зависимы, либо 2) векторы а, Ь и векторы а', Ь' линейно независимы и а) векторы а, Ь и а', Ь' параллельны одной и той же пло- плоскости, б) базисы а, Ъ и а', Ь' этой плоскости одноименны, в) площадь параллелограмма, построенного на векторах а, Ь, равна площади параллелограмма, построенного на векторах а', Ь'. Замечание 3. Это утверждение можно принять за определе- определение отношения эквиполлентности пар векторов и после этого определить бивекторы как классы эквиполлентных упоря- упорядоченных пар векторов. Определение 5. Мы будем говорить, что отличный от нуля ¦бивектор в пространстве а = а А Ь параллелен плоскости П, если векторы а и Ь параллельны этой плоскости. Согласно усло- условию а) предыдущего утверждения это определение корректно, т. е. не зависит от выбора векторов а и Ь. С точностью до па- параллельности плоскость П определена бивектором а однознач- однозначно, а векторы а и Ь составляют ее базис. Ее ориентация, опре- определенная базисом а, Ь, также не зависит от выбора векторов а и Ь. Мы будем говорить, что эта ориентация определена би- бивектором а. "" Ясно, что бивектор а тогда и только тогда параллелен пло- плоскости П, когда он принадлежит множеству Bivn B) (рассмат- (рассматриваемому как Подмножество множества BivC)). Площадь параллелограмма, построенного на векторах а и Ь, называется Площадью (или мерой) бивектора а и обозна- обозначается символом |а|. Она также зависит только от а. Для нулевого бивектора, по определению, полагается |<х| —0. ; 107
Таким образом, |а| = 0 тогда и только тогда, когда а = о. По определению, нулевой бивектор считается параллельным любой плоскости. Никакой ориентации он на этой плоскости не определяет. Ясно, что бивектор а однозначно определен, если известна его пло- площадь и (при |а|=т^0) известно, какой плоскости он параллелен и какую ориентацию на этой плоскости определяет. Наши определения эквиполлентности упорядоченных троек точек или упорядоченных пар векторов используют метрические понятия (площадь). Однако на самом деле можно показать, что отношение эквиполлентности имеет чисто аффинный ха- характер. Покажем это. Определение 6. Будем говорить, что пара векторов (а', Ь') получена из пары (а, Ь) элементарным преобразованием, если выполнено одно из следующих двух условий: 1) существует такое число 1гФ0, что a' = ka и Ь'' = —Ь, 2) существует такое число k, что либо a' = a-\-kb и Ъ' = Ь, либо а' = а и Ь' = Ъ + ka. Ясно, что при применении элементарного преобразования к паре (а, Ь) ни площадь бивектора а = а Л Ь, ни (при а Л Ь Ф с) плоскость, которой он параллелен, ни ориентация этой плоскости, им определенная, не меняются. Другими сло- словами, этот бивектор переходит в равный бивектор. Будучи верным для одного элементарного преобразования, это верно и для любой последовательности элементарных преобразований. Таким образом, если пара (а', Ь') получается из пары [а, Ь) последователь- последовательностью элементарных преобразований, то а' ЛЬ' = а/\Ь, т. е. пары (а, Ь) и (а', Ь') эквиполлентны. Далее, легко видеть, что каков бы ни был отличный от нуля вектор е, компланарный с линейно независимыми векторами а и Ь, пару (а, Ь) можно последовательностью элементарных преобразований перевести в пару (е, с), первый вектор которой совпадает с данным век- вектором е. Действительно, пусть e = ka + lb. Если k Ф 0, то (а, Ь) ~ [ka, \ Ъ) ~ [ka + lb, j b) ~ (е, 1 Ь). 108
(Знаком ~ мы обозначаем здесь элементарное преобразова- преобразование.) Аналогично, если k = 0, то . (а, Ь)~{а-Ь, Ъ)~{а-Ъ, Ь + (а — 6))~ ~{a-b,a)~{-b,a)~(lb, -jft)~(e, -у б). Кроме того, нетрудно показать, что если отличные от нуля бивекторы а/\Ь и а/\Ь' с одина- одинаковым первым вектором а равны, то пару (а, Ь) можно пере- перевести в пару (а, Ь') некоторым элементарным преобразованием. —> —-* —> Действительно, пусть а = О А, Ь = ОВ и Ь' = ОВ'. Поскольку базисы а, Ь и а, Ь' плоскости ОАВ одноименны, точки В в. В' лежат в этой плоскости по одну сторону прямой О А. Поскольку площадь параллелограмма, построенного на отрезках б~А и Eв, равна площади параллелограмма, построенного на отрезках О А и ОВ', точки В и В' лежат поэтому на прямой, параллельной прямой О А. Следовательно, вектор ВВ'^Ь' — Ь параллелен прямой О А и потому существует такое число k, что Ь'—b = ka. Таким образом, пара (а, Ъ') получается из пары (а, Ь) элемен- элементарным преобразованием. Полезно доказанное утверждение переформулировать сле- следующим образом: Предложение 1. Если для вектора а =^= 0 и векторов Ь и Ьг имеет место равенство а/\Ъ = а/\Ъ', то существует такое число k, что Ъ'-Ь = ka. Заметим, что это предложение справедливо и тогда, когда аЛЬ = аЛЬ' — о (нужно лишь, чтобы аф§). Теперь уже легко доказать, что • если отличные от нуля бивекторы а ЛЬ и а' /\Ь' равны (т. с. пары (а, Ь) и {а'', Ь') эквиполлентны и линейно независимы), то пару (а', Ь') можно получить из пары (а, Ъ) последователь- ш стью элементарных преобразований. Действительно, согласно доказанному, мы можем пару (а, Ь) элементарными преобразованиями перевести в пару вида (а',Ь"). При этом будет иметь место равенство а' Л Ь' = = а' Л Ь" и потому еще одним элементарным преобразованием мы сможем пару (а',Ь") перевести в нужную нам пару {а\Ь'). Мы видим, таким образом, что нами доказано следующее предложение, дающее чисто аффинную характеристику равен- равенства бивекторов: Предложение 2. Два отличных от нуля бивектора а Л Ь и а' Л Ь' тогда и только тогда равны, когда пару (а, Ь) можно последовательностью элементарных преобразований перевести в пару (а', Ь'). 109
'¦- Резюмируя, мы получаем, что 1) бивекторы можно определять либо как классы эквипол- лентных троек точек (определения 1 и 2), либо как классы экви- поллентных пар векторов (определение 4 и замечание 3); . 2) при этом эквиполлентность пар неколлинеарных векторов (единственный интересный случай) равносильна тому, что одну пару можно последовательностью элементарных преобразований перевести в другую (предложение 2). 2. Линейные операции над бивекторами Определение 1. Пусть а — произвольный бивектор, a k—¦ произвольное вещественное число. Предполаггя сначала, что а ф с и k Ф О, мы определим произведение ka бивектора а на число k как бивектор, удовлетворяющий следующим условиям: а) бивектор ka параллелен той же плоскости, что и бивек- бивектор а; б) ориентация этой плоскости, определенная бивектором ka, совпадает с ориентацией, определенной бивектором а, если k > 0, и противоположна этой ориентации, если k -< 0; в) площадь бивектора ka выражается формулой При & = 0 или а = о мы, по определению, положим 0 • а = ko = o. Замечание 1. Строго говоря, это определение относился к би- бивекторам в пространстве. Для бивекторов на плоскости усло- условие а) излишне. Из определения 1 непосредственно вытекает, что при умно- умножении одного из векторов, составляющих бивектор, на некото- некоторое число весь бивектор умножается на это число, т. е. для любых векторов a, b и любого числа k имеют место формулы (kYb (свойство однородности внешнего умножения). Для доказательства достаточно заметить, что (при k Ф 0 и а А Ь Ф с) бивектор k(aAb) и, скажем, бивектор (ka)ЛЬ имеют одну и ту же площадь, параллельны одной и той же плоскости и определяют на этой плоскости одну и ту же ориен- ориентацию. При k = 0 или а Л Ь = о эта формула очевидна. Замечание 2. Формулу k(a Л 6) = (ka) Л Ь можно принять за определение произведения k(aAb). Такое определение де- делает непосредственно очевидным аффинный характер операции ka. Зато оно требует проверки корректности. По определению, бивектор —а = (—1)^ имеет ту же пло- площадь и параллелен той же плоскости (при афо), что и бивек- бивектор а, но определяет на этой плоскости противоположную ориен- .110
тацию. Но- при а = а ЛЬ теми же свойствами обладает и би- бивектор Ь Л а. Поэтому 6Л«=- а/\Ъ, т. е. при перестановке множителей внешнее произведение ме- меняет знак. Это свойство внешнего умножения называется его анти- антикоммутативностью. Определение 2. Бивекторы а и Ь в пространстве называются коллинеарными, если они параллельны одной и той же плоско- плоскости. Все бивекторы на плоскости, по определению, коллинеарны. В частности, бивекторы коллинеарны, если хотя бы один из них равен нулю. Ясно, что аналогично векторам бивекторы а и Ь тогда и только тогда коллинеарны, когда существует такое число k, что либо а = kb, либо Ь = ka. Для определения операции сложения бивекторов нам пона- понадобятся следующие две леммы. Лемма 1. Для вектора е и бивектора а тогда и только тогда существует такой вектор а, что а == е Л а, когда либо бивектор а равен нулю, либо вектор е отличен от нуля и параллелен плоскости бивектора а. Доказательство. Если а = е Л а, то (при а Ф с) век- вектор е параллелен, по определению, плоскости бивектора а. Об- Обратно, пусть вектор е параллелен плоскости бивектора а (мы можем считать, что а Ф с, поскольку при а — о за вектор а можно принять вектор с). Искомый вектор а должен удовлет- удовлетворять следующим условиям: а) он параллелен плоскости бивектора а; б) векторы е, а составляют положительно ориентированный базис этой плоскости (по отношению к ориентации, определен- определенной бивектором а); в) площадь параллелограмма, построенного на векторах е, 'а, равна площади \а\ бивектора а. Ясно, что вектор а, удовлетворяющий этим условиям, всегда можно найти (и даже с большим произволом). Замечание 3. Воспользовавшись произволом в выборе век- вектора а, мы можем его выбрать ортогональным вектору е. Тогда он будет однозначно определен (вектором е и бивектором а). Но эта нормализация выбора вектора а уже не будет иметь аффинного характера. Лемма 2. Для любых двух бивекторов а и Ь существуют такие векторы е, а и Ь, что а = еЛ«> 6 = е Л fr- frill
Доказательство. Если один из данных бивекторов, ска- скажем, бивектор Ь равен нулю, то за векторы е и а можно взять произвольные векторы, обладающие тем свойством, что а = = е Л а, а за вектор Ь принять, например, вектор е. Если же а Ф о и Ь ф с, то за вектор е следует принять отличный от нуля вектор, параллельный плоскостям бивекторов а и Ь. При таком выборе вектора е возможность требуемого представле- представления бивекторов а и Ь немедленно обеспечивается леммой 1. Замечание 4. Ясно, что векторы е, а, Ь мы всегда можем выбрать так, чтобы вектор с был ортогонален векторам а и Ь (ср. замечание 3). Определение 3. Суммой бивекторов а и Ь, представленных в виде е Л а и е Л Ь, называется бивектор а + Ь = е Л (а + Ь). Это определение нуждается, конечно, в проверке коррект- корректности, т. е. в доказательстве независимости бивектора от вы- выбора векторов е, а и Ь. Случай 1. Бивекторы а и b неколлинеарны (и, в частно- частности, отличны от нуля). В этом случае, вектор е определен одно- однозначно с точностью до коллинеарности (поскольку он должен быть параллелен плоскостям обоих бивекторов). Другими сло- словами, если а = е' Д а', Ь = е' Л Ь\ то е' = /с, где / — некоторое отличное от нуля число. По условию, е' А а' = е А «• В то же время е' А а' = Aе) Лв' = 1(еЛв') = еЛ (to'). Таким образом, е А а == е Л {1а'). С другой стороны, в п. 1 было доказано (предложение 1), что при е ф 0 такого рода равенство возможно только тогда, когда 1а' — а = ke, где k — некоторое вещественное число. Аналогично показывается, что существует такое число что lb' — b = kle. Поэтому 112
(Последнее равенство имеет место потому, что переход от пары (е, (а -f- b)-\-(k -f- k\)e) к паре (е, а-\-Ь) является элементар- элементарным преобразованием.) Таким образом, в рассматриваемом случае бивектор а-\-Ъ определен корректно. С л у ч a ft 2. Бивекторы а и b коллинеарны, т. е. существует такое число I, что, скажем, Ь = la. В этом случае и потому la — Ь = ke, где k — некоторое вещественное число. Следовательно, е Л (а + Ь) = е Л (A + I) а - ke) = е Л (A + /) а) = = A + /)(вЛо) = A +1)а. Таким образом, при Ь = /а а + Ь = A+/)а. A) Поскольку правая часть этой формулы не зависит от выбора векторов е, а и 6, корректность определения бивектора а + Ь доказана и в этом случае. Определение суммы двух бивекторов можно (несколько ме- меняя обозначения) записать в виде равенства а/\(Ь-\-с) — а/\Ь-\-а/\с, показывающего, что внешнее умножение обладает по отноше- отношению к сложению свойством дистрибутивности. Замечание 5. Все сказанное (с соответствующими незначи- незначительными изменениями) годится, конечно, и для бивекторов на плоскости. Впрочем, в этом случае проще всего определять сумму бивекторов непосредственно формулой A). Из этого замечания вытекает, в частности, что для любой плоскости П вложение множества BivnB) в множество BivC) согласовано с операциями над бивекторами, т. е„ например, сумма двух бивекторов из BivnB) не за- зависит «т того, рассматриваем ли мы их как бивекторы на плоскости (из BivnB)) или в пространстве (изВ!уC)) (ср. для векторов аналогичное за- замечание 1 в п. 2 § 3). Теорема 1. Построенные операции над бивекторами (на пло- плоскости или в пространстве) обладают всеми восемью стандарт- стандартными свойствами линейных операций над векторами, т. е. мно- множества бивекторов BivB) и BivC) являются линеалами. Доказательство этой теоремы сводится к серии триви- тривиальных проверок, за исключением доказательства ассоциатив- ассоциативности сложения (свойство 1) бивекторов в пространстве, кото- которое требует достаточно канительных и сложных геометрических рассуждений. Мы предлагаем читателю самостоятельно найти ИЗ
это доказательство. Мы же докажем эту теорему косвенным спо- способом, связав бивекторы с векторами. К сожалению, этот кос- косвенный способ будет существенно использовать метрические со- соображения, хотя сама теорема имеет чисто аффинный характер. Однако, ради простоты изложения, мы за чистотой метода гнаться здесь не будем. Пусть е = ОЕ— произвольный единичный вектор в простран- пространстве. Предполагая, что пространство ориентировано, мы каж- каждому вектору а Ф 0, ортогональному вектору е, сопоставим век- вектор е(а), обладающий следующими свойствами: 1) длина вектора е(а) равна длине вектора а: 2) вектор е(а) ортогонален как вектору с, так и вектору а; 3) базис е, а, е(а) пространства положительно ориенти- ориентирован. Для нулевого вектора мы положим е@) = 0. Ясно, что эти условия однозначно определяют вектор е(а). Наглядно вектор е(а) можно описать как вектор, получаю- получающийся вращением вектора а вокруг прямой ОЕ на угол п/2 в направлении, положительном относительно данной ориентации пространства. Очевидно, что для любых векторов а, Ь, ортогональных вектору е, и лю- любого числа k имеют место равенства е(а + Ь) = е(а) + е (Ь), е (ka) = ke (a). Пусть а — произвольный бивектор (в пространстве). Соглас- Согласно лемме 1 и замечанию 3 мы можем (вообще говоря, многими способами) представить этот бивектор в виде а = еЛа, где е — некоторый единичный вектор, a a — вектор, ортогональ- ортогональный вектору е. Сделав это, мы сопоставим бивектору а вектор а1, определенный формулой а1 = е (а). Определение 4. Вектор а1 называется вектором, ассоцииро- ассоциированным с бивектором а (по отношению к данной ориентации пространства). Здесь, конечно, нужно проверить корректность определения, т. е. независимость вектора а1 от выбора векторов е и а. Но, как легко видеть, o-L^O, а при а^=о вектор ах обладает следующими свойствами: 1) длина |а11 вектора а1 равна площади | а| бивектора а; 1а11 = 1 а I; 114
2) вектор а1 перпендикулярен каждой плоскости, которой параллелен бивектор а; 3) произведение ориентации, определенной бивектором а, на ориентацию, определенную вектором ах (это произведение опре- определено, поскольку соответствующие плоскость и прямая не па- параллельны), совпадает с данной ориентацией пространства. Поскольку эти свойства, очевидно, однозначно определяют вектор ах (вне зависимости от выбора векторов е и а), коррект- корректность определения вектора а1 тем самым полностью доказана. Кроме того, из этих свойств немедленно вытекает, что, сопоставив произвольному бивектору а ассоциированный вектор а1, мы получим биективное отображение множества всех бивекторов BivC) на множество VectC) всех векторов. Более того, оказывается, что это отображение является изоморфизмом, т. е. для любых , бивекторов а, Ь и любого числа k имеют место соотношения Действительно, согласно лемме 2 и замечанию 4 существует такой единичный вектор е и такие векторы а и Ь, ортогональ- ортогональные вектору с, что а = е Аа, Ь = е Л 6 и потому ^ a + Ъ = е Л (а + Ь), где вектор а + Ь также ортогонален вектору с. Следовательно, (а + бI = е (а + Ъ) = е (а) + е (Ь) = а1 + Ь1. Аналогично, ka = eA(ka) и потому (/ea)J- = e (ka) = ke (a) = /гот-Ч Таким образом, мы доказали следующую теорему об изоморфизме: Теорема 2. Линеал BivC) изоморфен линеалу VectC). Заметим, что построенный изоморфизм не является естественным: он зависит от выбора ориентации пространства (при переходе к противоположной ориентации ассоциированный вектор ах умножается на —1). Кроме того, он имеет суще- существенно метрический характер. Однако, как бы то ни было, из теоремы об изоморфизме следует, что линейные операции над бивекторами обладают все- всеми алгебраическими свойствами линейных операций над векто- векторами. В частности, они обладают и интересующими нас восемью, свойствами. Тем самым теорему 1 мы можем считать полностью доказанной. 115
Подчеркнем еще раз, что хотя мы доказали эту теорему, пользуясь метрическими соображениями, по существу она имеет чисто аффинный характер. Замечание 6. Для бивекторов на плоскости теорема об изо- изоморфизме имеет вид: Линеал BivB) изоморфен линеалу Vect(l). Для доказательства достаточно заметить, что - построен- построенный выше изоморфизм (ti—> а1 переводит бивекторы, параллель- параллельные некоторой плоскости, в векторы, параллельные перпендику- перпендикуляру к этой плоскости. 3. Линейная теория бивекторов Понятия линейной комбинации и линейной зависимости (не- (независимости) определяются для бивекторов точно так же, как для векторов. Все свойства этих понятий, доказанные в п. 3 § 3, сохраняются и для бивекторов, поскольку в их доказатель- доказательствах мы пользовались лишь стандартными свойствами линей- линейных операций. Замечание 1. Все это, конечно, еще проще вытекает из тео- теоремы об изоморфизме. Однако мы предпочли сослаться на тео- теорему 1, чтобы подчеркнуть аффинный характер этих утверждений. Напомним (определение 3 п. 2), что бивекторы называются коллинеарными, если они параллельны одной и той же плоскости. Выше фактически уже доказано следующее Предложение 1. Два бивектора тогда и только тогда кол- линеарны, когда они линейно зависимы. Определение 1. Бивекторы называются компланарными, если они параллельны одной и той же прямой (т. е. этой прямой параллельна каждая плоскость, параллельная хотя бы одному из этих бивекторов). Ясно, что бивекторы а, Ь и с тогда и только тогда компланарны, когда существует такой отличный от нуля вектор е, что а = е Аа, b = е Л Ь, г = е /\с, где а, Ь и с — некоторые векторы. Покажем, что справедливо следующее Предложение 2. Три бивектора тогда и только тогда ком- компланарны, когда они линейно зависима. Доказательство. Пусть а = еЛа, Ъ = е /\Ь, с = е Л с Четыре вектора е, а, Ь и с пространства обязательно линейно зависимы, т. е. существуют такие числа k0, ku k2, ks, не все рав- равные нулю, что koe +k{a +k2b +k,c = 0. (I) 116
При этом числа ki, k2, k3 не могут быть все равны нулю, по- поскольку в противном случае k0 =И= 0 и koe = 0, что при е Ф- (У невозможно. Умножив равенство A) внешним образом на вектор е и воспользовавшись свойствами однородности и дистрибутивности внешнего умножения (а также тем, что е Л (koe) =0), мы не- немедленно получим равенство ^ (е Л а) + k2(e Ab) + k3(eAc) = о, т. е. равенство k{a. + k2b + &зс = °- Следовательно, бивекторы а, Ь и с линейно зависимы. Обратно, пусть бивекторы а, Ь и с линейно зависимы. Тогда один из них (скажем, бивектор с) линейно выражается через другие: с = kfi + k2b. Пусть е, а и Ь — такие векторы, что <х = е /\а, Ь = е /\ Ь. Тогда с = е Л (М + /е2&). Следовательно, бивекторы а, Ъ и с компланарны. Замечание 2. Легко видеть, что бивекторы а, Ъ и с тогда « только тогда компланарны, когда компланарны ассоциированные с ними векторы а1, Ьх, с1. Геометрически это легко усмотреть, заметив, что бивектор а тогда и только тогда может быть приложен к вектору е (т. е. представлен в виде еЛа), когда вектор ах ортогонален векто- вектору е. Более формально это вытекает в силу теоремы об изомор- изоморфизме из того, что как для векторов, так и для бивекторов компланарность равносильна линейной зависимости. Очевидно, что. аналогичное замечание справедливо и по от- отношению к коллинеарности. Аналогично случаю векторов, семейство ei, ег, ез трех не- некомпланарных' (т. е. линейно независимых) бивекторов яв- является базисом линеала BivC). Мы будем его называть бивек- торным базисом в пространстве. Из теоремы об изоморфизме немедленно вытекает, что любой бивектор а линейно выражается через базис ei, ег, ез, т. е. существуют такие (однозначно определенные) числа а1, а2, а3, что ч а = й'е, + аЧ2 + аЧ3. Чтобы подчеркнуть аффинный характер этого утверждения1 (и выяснить его геометрический смысл), мы дадим сейчас ему доказательство, не упирающееся на теорему об изоморфизме. иг
Сначала мы докажем его для бивекторных базисов некото- некоторого специального вида. Пусть еи в2, е3 — произвольный векторный базис. Ясно, что бивекторы') ^ е2Ле3, е3Ле,, ех Л е2 не компланарны и потому составляют некоторый бивекторный базис. Мы будем называть его бивекторным базисом, соответ- соответствующим данному векторному базису eit е2, е3. Представив про- произвольный бивектор а в виде а Л Ь, разложив векторы а и 6 по векторам базиса ei, е2, е3 и воспользовавшись свойствами анти- антикоммутативности, однородности и дистрибутивности внешнего умножения, мы немедленно получим, что а = (a2b3 - аЩ (е2 Л е3) + (a3bl - alb3) (e3 Л е,) + т. а е Л • Ъ что = а2 Ь2 а3 Ь3 (е2 Л е3) — а1 а-1 Ъх Ь3 Ь2 (в, Л в2), B) где а1, а2, а3 и Ь1, Ь2, Ь3 — координаты векторов а и Ь в ба- базисе еь е2, е3. Таким образом, для бивекторных базисов, соответствующих векторным базисам, наше утверждение доказано. Чтобы дока- доказать его в полном объеме, достаточно теперь попытаться дока- доказать, что любой бивекторный базис еь е2, с3 соответствует неко- некоторому векторному базису eb c2, е3. Попробуем это сделать. Пусть Пь Пг и Пз — плоскости, параллельные бивекторам еи е2 и с3. Эти плоскости попарно не параллельны и потому определены прямая at пересечения плоскостей П2 и П3, прямая а2 пересечения плоскостей И, и П3 и прямая а3 пересечения плоскостей П] и П2. Пусть аь а2 и а3 — произвольные базисы на прямых аь а2 и а3 соответственно. Ясно, что векторы а,, а2, а3 не компланарны (в противном слу- случае были бы компланарны бивекторы еь ег, ез) и потому состав- составляют базис пространства. Кроме того, векторы 0% и а3 соста- составляют базис плоскости Иь векторы щ и а3 — базис плоскости П2, а векторы а{ и а2 — базис плоскости П3. Поскольку вектор а2 параллелен плоскости П^ мы можем представить бивектор ei в виде внешнего произведения ci = а2 Л а' вектора а2 и некоторого вектора а', параллельного плоскости П^ и потому выражающегося через векторы а2 и а3: а' = + ') Обратите внимание на порядок индексов. 118
Пользуясь свойствами внешнего умножения, мы находим отсюда, что ei = а2 Л (Pi«2 + <71«з) = Ц\ (а2 Л а3). Аналогично показывается, что существуют такие числа q2 и <7з, что е2 = q2 (а{ Л а3), е3 = <73 («i Л а2). Постараемся теперь подобрать такие числа ku k2, h, чтобы бивекторный базис, соответствующий векторному базису ex = klau e2 = k2a2, е3 = &3а3, совпал с базисом ei, е2, ез. Ясно, что для этого необходимо и до- достаточно, чтобы ql = k2ki, q2—— kxki,, q3 = kxk2. Решая эту систему уравнений, мы получим, что у У — <?1<Мз у _ К\ , Ко 1 7 <72 ' <7з Эти формулы показывают, что наше построение приводит к цели только тогда, когда произведение Ц\Ц2Цъ отрицательно (в противном случае для чисел ku k2, k3 получаются мнимые значе- значения). Таким образом, наше предположение, что любой бивек- бивекторный базис соответствует некоторому векторному базису, вообще говоря, ошибочно (или, по крайней мере, не может быть доказано изложенным методом). Тем не менее наши рассужде- рассуждения показывают, что какой бы бивекторный базис еь е2> ез мы ни взяли, либо он, либо базис сь е2, —е3 соответствует некоторому векторному базису. Действительно, если для данного базиса еь е2, е3 произведе- произведение #1<7г?з оказалось положительным, то для базиса «1,-е2, —с3 аналогичное произведение будет отрицательным (ибо множи- множитель q3 сменит знак). Но этого утверждения нам достаточно, поскольку бивектор, выражающийся через базис t\, e2, —е3, выражается и через ба- базис еь ^2, ез- Таким образом, любой бивектор действительно можно выразить через базис t\, e2) е3. Коэффициенты а1, а2, а3 линейного выражения бивектора а через базис tu e2, е3, естественно, называются координатами бивектора а. Так же, как для векторов, доказывается, что координаты суммы бивекторов равны суммам координат слагаемых, а координаты произведения бивектора на число рав- равны произведениям координат бивектора на это число. - Другими словами, выбор базиса ei, в2, ез определяет, как и полагается, изоморфизм линеала BivC) всех бивекторов в про- пространстве на стандартный линеал R3 троек вещественных чисел. 119
Замечание 3. На практике часто встает вопрос о вычислении координат внешнего произведения а Л 6 по координатам векто- векторов а и Ь в некотором базисе еи е2, е3. При этом, конечно, имеются в виду координаты бивектора а Л & в базисе е2 Л е3> e3Aci, е\Ле2, соответствующем базису еи е2, с3. Ответ на этот вопрос у нас фактически уже получен: он дается формулой B). Для запоминания этой формулы полезно заметить, что уча- участвующие в ней определители являются минорами второго по- порядка матрицы b3 составленной из координат данных векторов. Вспомнив формулу разложения определителя третьего по- порядка по элементам строки (и учтя антикоммутативность внеш- внешнего умножения), мы можем формулу B) переписать в сле- следующем «детерминантном» виде: аЛЬ = е2 Л е3 е3 Л ех е, Л е2 а' б1 Ь2 В частности, если нам дан некоторый другой векторный базис в,,, е2,, еу, связанный с базисом г{, е?, е3 соотношениями то для соответствующего бивекторного базиса е2, Л ev, ev Л ех,- •ev Л ег будут иметь место равенства ey ev A Л Л ез- = «i' = e2,= е2Ле3 с1 с1 с3, Су е-2 Л в3 с1 с1. с\, е2А е3 е3 Ле, с2 г2 Су Ле, с2 С3' с2 4 Ле, е,Л с3 с], с\, в, Л с3 с?' 4 в, Л е2 е2 е2 i20
Отсюда вытекает, что если некоторый бивектор х имел в базисе е2 Л е3, е3 Л еь е{ А е? координаты х\ х2, х3, то в базисе е2, Л е3,, е3, Л ev, ex, Л е2, он. будет иметь координаты х1', х2', х3', связанные с координа- ¦Xх' С], х'1' с\, л су г3 Су 4 4 Х2 = с\. cl cl Xх' X2' X3' 4 4 4 хъ — с\. с\. 4 4 4 л1' X2' тами х!, х2, х3 соотношениями х — Замечание 4. Конечно, аналогичные (только более простые) результаты имеют место и для бивекторов на плоскости. Например, бивекторный базис на плоскости — это просто произвольный отличный от нуля бивектор. Каждый векторный базис в\, е.2 на плоскости определяет бивекторпый базис eiA#2, причем для любых векторов а и Ь на плоскости координатой бивектора а ЛЬ в базисе ех Л е2 является опре- определитель Ь[ где а1, а2 и Ь1, Ь2 — координаты векторов а и Ь в базисе е\, е2- При переходе от базиса е{, е, к другому базису е,,, е,, эта координата умножается, очевидно, на ветствующей матрицы перехода С. определитель \С\ со 4. Метрическая теория бивекторов Метрическая теория бивекторов изучает вопросы, связан- связанные с площадью бивектора и с углом между бивекторами. Площадь бивектора мы уже определили. Займемся теперь углом между двумя (отличными от нуля) бивекторами. Ясно, что это понятие (аналогично случаю векторов) сводится к по- понятию угла между плоскостями. Здесь мы также сталкиваемся с вопросом, какой из двух вертикальных углов между плоско- плоскостями мы должны выбрать. Для случая векторов мы преодолели аналогичную трудность, введя в рассмотрение угол между ори- ориентированными прямыми. Сделаем то же самое и для пло- плоскостей. Пусть IIi и П.2 — две ориентированные плоскости в простран- пространстве. Выбрав единичный вектор еи параллельный обеим пло- плоскостям, подберем векторы cti и а2 так, чтобы векторы е, di составляли положительно ориентированный ортонормированный базис плоскости Пь а векторы е, а2 — положительно ориентиро- ориентированный ортонормированный базис плоскости ГЬ- Угол 0 между 121
векторами fli и а2 мы и объявим углом между ориентированны- ориентированными плоскостями IIi и Щ. Корректность этого определения оче- очевидна: единственный произвол состоит в выборе орта е, но при 6 ф о его можно заменить только ортом —е и тогда векторы а{ и а2 перейдут в векторы —«i и —а2. Угол же между векторами —«1 и —а% равен углу между векторами «i и а2. При 8 = 0 век- векторы а4 и а2 совпадают при любом выборе вектора е. Несколько иначе угол между плоскостями IIi и Щ можно определить, выбрав в пространстве некоторую ориентацию (от которой окончательный результат не будет зависеть) и сопо- сопоставив каждой ориентированной плоскости П перпендикулярный ей вектор п, направленный в положительную сторону, т. е. в такую, что произведение ориентации плоскости П на ориента- ориентацию перпендикулярной прямой, определенной вектором и, сов- совпадает с данной ориентацией пространства (о таком векторе п принято говорить, что он является вектором положительной нормали к ориентированной плоскости в ориентированном про- пространстве). Тогда углом между ориентированными плоскостями IIi и Пг называется, по определению, угол между соответствую- соответствующими векторами щ и п2. Чтобы сравнить это определение с предыдущим, достаточно заметить, что в обозначениях, введенных в п. 2, вектор П\ яв- является вектором е («i), а вектор п2 — вектором е (а%), и, следо- следовательно, угол между векторами «i и а2 совпадает с углом меж- между векторами и4 и п2. Определение 1. Пусть а и Ь — произвольные отличные от нуля бивекторы. Рассмотрим произвольную плоскость Пь кото- которой параллелен бивектор а, и произвольную плоскость Пг, кото- которой параллелен бивектор Ь. Будем считать эти плоскости снаб- снабженными ориентациями, определенными соответственно бивек- бивекторами а и Ь. Тогда угол в между этими плоскостями мы будем называть углом между бивекторами а и Ь. Очевидйо, что определение 1 корректно (не зависит от вы- выбора плоскостей IIi и Пг). Теперь мы можем определить скалярное произведение ab би- бивекторов а и Ь той же формулой, что и для векторов: аЬ ==| а || b Icos9. Можно без особого труда доказать, что это скалярное про- произведение обладает всеми алгебраическими свойствами ска- скалярного произведения векторов, перечисленными в теореме п. 2 § 5 (не совсем тривиально лишь доказательство свойства дистри- дистрибутивности). После этого весь материал § 5 (по крайней мере с формальной стороны) полностью может быть повторен для бивекторов. В частности, ясно, что понимать под ортонормиро- ванным бивекторным базисом. Все формулы, связанные с ор- тонормированнымй базисами, конечно, также остаются справед- справедливыми. Например, квадрат площади бивектора а (совпадаю- 122
щий с его скалярным квадратом) равен сумме квадратов его координат at, a2, а3 в произвольном ортонормированном базисе: Впрочем, все это можно установить значительно проще, если заметить, что построенный в п. 2 изоморфизм сч—^а-1 сохраняет скалярное произведение (является изоморфизмом и по отноше- отношению к скалярному умножению), т. е. что для любых бивекторов а и Ь имеет место равенство Замечание 1. На первый взгляд это дискредитирует всю теорию бивекторов: зачем ее строить, если она изоморфна тео- теории векторов? На самом же деле все обстоит как раз наобо- наоборот: установление изоморфизма двух математических теорий не устраняет одну из них, а лишь ликвидирует неприятную необхо- необходимость доказывать ее результаты. При этом формально одина- одинаковые выражения могут иметь совершенно различное содержа- содержание. Рассмотрим, например, формулу для скалярного квадрата в ортонормированном базисе. Для векторов — это формула дли- длины, а для бивекторов — это формула площади. Очевидно, что для любого ортонормированного векторного базиса ii, i2, i3 соответ- соответствующий бивекторный базис также ортонормирован. Отсюда и из формулы для скалярного квадрата бивектора мы немедлен- немедленно получаем (вспомнив формулу для координат бивектора а Л & в базисе е2 Л es, е3 Л еи е\ Л е2), что квадрат площади s параллелограмма, построенного на век- векторах a(ai,a2,a3) и b(bub2,b3), выражается формулой a2 a$ b2 b3 \ a, by a3 2 a, b\ a2 h Аналогичное утверждение для плоскости гласит, что площадь ' s параллелограмма, построенного на векторах и b(b\,b2), равна абсолютной величине определителя а, а2 Ь\ Ь2 Хотя в этих утверждениях бивекторы явно не упоминаются, по существу любые их доказательства так или иначе должны использовать бивекторы (быть может, в завуалированном виде). При этом каждое такое «искусственное» доказательство волей- неволей будет в достаточной мере длинным и утомительным, тогда как в рамках теории бивекторов это утверждение полу- получается «бесплатно», как изоморфный вариант уже известного факта о векторах. 123
Однако метрическая теория бивекторов имеет и свои специ- специфические особенности, не имеющие аналогов"в теории векторов. Мы имеем в виду, например, формулы, выражающие скалярное произведение бивекторов а Л Ъ и с Л d через векторы а, Ь, с, d. Прежде чем выводить эти формулы, мы рассмотрим некоторые необходимые для этого понятия. Определение 2. Пусть (а, Ь) и (с, d) — две пары векторов. Их взаимным определителем Грама называется определитель ас ad = {ac){bd)-{ad){bc). A) be bd Соответствующую матрицу ас ad \ be bd) полезно представлять себе как «скалярное» произведение одностолбцовой матрицы I . I и однострочечной матрицы (с, d). В случае, когда пары (а, Ь) и (с, d) совпадают, соответ- соответствующий определитель 2 ab Ьа обозначается символом Г (а, Ь) и называется определителем Грама векторов а, Ь. В случае, когда векторы а и b линейно независимы, т. е. со- составляют базис соответствующей плоскости, элементами опре- определителя Грама Г (а, Ь) являются метрические коэффициенты этого базиса. Основное свойство определителя Грама выражается следую- следующим предложением: Предложение 1. Определитель Грама A) зависит только от бивекторов а Л 6 и с Ad. Доказательство. Достаточно заметить, что при элемен- элементарных преобразованиях, скажем, пары (а, Ь) определитель A) не меняется (при элементарном преобразовании (а, 6)~ ~ika, -yb\ его первая строка умножается на k, а вторая на 1 «it -г, так что весь определитель умножается на k--^=\, a при элементарном преобразовании (а, 6)~(а + kb, b) к его первой строке прибавляется вторая, умноженная на k, отчего, как известно, определитель не меняется). Кроме того, если 124
пара (а, Ь) линейно зависима, то определитель A), очевидно, равен нулю. Таким образом, определитель Грама A) является некоторой функцией бивекторов а Л Ь и с Л й. Оказывается, что он совпа- совпадает с их скалярным произведением, так что для любых векторов а, Ъ, с и d имеет место формула {а Л Ъ) (с Л й) = ас be ad bd B) Поскольку обе части формулы B) зависят только от бивек- бивекторов а ЛЬ и с Ad, мы можем в доказательстве этой формулы, без ограничения общности, предполагать, что векторы с и d ор- ортогональны. Кроме того, поскольку при умножении одного из векторов на произвольное число формула B) также остается справедливой, нам достаточно ее доказать лишь для случая, когда векторы end единичны (и ортогональны). Обозначив эти векторы символами i и /, дополним их третьим вектором k до ортонормированного базиса пространства. Пусть О], а2, аг и Ь\, b2, b\ — координаты векторов а и 6 в этом базисе. Тогда, как мы знаем, бивектор а /\Ь в базисе / Л k, k /\ i, i Л / будет иметь координаты a2 a3 b2 b3 , — Ьу 63 ay a2 а бивектор с Ad = i Л/ — координаты О, 0, 1. Следовательно, их скалярное произведение будет равно опре- определителю а, а., C) (напомним, что бивекторный базис j Л k, k Л i, i Л / ортонор- мирован). С другой стороны, в нашем случае так что определитель Грама A) также равен определителю C). Тем самым формула B) полностью доказана. Замечание 2. В случае коллинеарных бивекторов формула B) сводится к формуле умножения определителей. Для некол- линеарных, бивекторов она представляет собой некоторое ал- алгебраическое тождество (для координат векторов а, Ь, с, d в ортонормированием базисе), являющееся обобщением на пря- прямоугольные матрицы формулы умножения определителей. ,125
В этой форме оно, ;конечно, немедленно доказывается прямым вычислением. Мы предпочли дать более геометрическое дока- доказательство, чтобы проиллюстрировать на этом простом примере ряд полезных приемов математического доказательства. В частности, мы видим, что определитель Г рама Г (a, ft) пары векторов равен квадрату площади параллелограмма, построенного на этих векторах: Г (а, Ь) = s2. Поскольку s2 ^ 0, отсюда вытекает, что для любых векторов а и Ь имеет место неравенство Г(а, &)>0, причем Г {а, Ь) = О тогда и только тогда, когда векторы а и Ь линейно зависимы. Это неравенство совпадает, очевидно, с неравенством Коши — Буняковского (см. п. 3 § 5). Таким образом, мы зано- заново его доказали. Одновременно мы выяснили его геометриче- геометрический смысл. 5. Тривекторы По аналогии с векторами и бивекторами вы вводим сле- следующее Определение 1. Две упорядоченные четверки точек (А, В, С, D) и (А', В', С', D') называются эквиполлентными, если либо 1) обе четверки компланарны, либо 2) обе четверки некомпланарны и а) определяют одну и ту же ориентацию пространства, б) объем - тетраэдра ABCD равен объему тетраэдра А'В'CD'. Ясно, что отношение эквиполлентности четверок является отношением эквивалентности. Соответствующие классы эквива- эквивалентности называются тривекторами. Тривектор, содержащий четверку (А, В, С, D), обозначается символом ABCD. По определению, все. компланарные четверки составляют один тривектор. Этот тривектор называется нулевым и обозна- обозначается символом О. Замечание 1. Тривекторы имеет смысл рассматривать только в пространстве, поскольку на плоскости (и тем более на пря- прямой) имеется только один тривектор — нулевой. Множество всех тривекторов в пространстве мы будем обозначать символом TrivC). 126
Любой упорядоченной тройке векторов (а,Ь,с) мы можем отнести некоторый тривектор а А Ь А с, отложив векторы от одной точки: а = ОА, Ь = ОВ, с = ОС я положив Определение 2. Тривектор а А Ь А с называется внешним произведением векторов а, Ъ и с. Легко видеть, что внешнее произведение трех векторов опре- определено корректно, т. е. не зависит от выбора точки О. Ясно, что векторы а, Ь, с тогда и только тогда линейно зависимы (компланарны), когда их внешнее произведение равно нулю: я А Ь А с = О. Подобно тому, как бивекторы можно отождествить с клас- классами эквиполлентных пар векторов, тривекторы можно считать не классами упорядоченных четверок точек, а классами упоря- упорядоченных троек векторов. При этом две тройки (а, Ь, с) и (а', Ъ', с') тогда и только тогда определяют один-тривектор (эк- еиполлентны), когда либо 1) они обе компланарны, либо 2) они обе некомпланарны и а) базисы а, Ь, с и а', Ь', с' одноименны, б) объем параллелепипеда, построенного на векторах а, Ь, с, равен объему параллелепипеда, построенного на векто- векторах а', Ь', с'. Об ориентации, определенной базисом а, Ъ, с, говорят, что она определяется тривектором а А Ъ А с, а объем параллелепи- параллелепипеда, построенного на векторах а, Ь, с, называется объемом (или мерой) тривектора а АЬ А с. Ввиду условий а) и б) эти определения корректны. Объем тривектора 91 обозначается сим- символом | % |. Объем нулевого тривектора, по определению, считается рав- равным нулю. Никакой ориентации нулевой тривектор не опре- определяет. Ясно, что тривектор 51 однозначно определен, если известны его объем | и (при \%\=?0) определяемая им ориентация-^ Упражнение. Дайте «аффинное» определение равенства тривекторов, вводя для этого соответствующие элементарные преобразования (ср. § б, п. 1, опре- определение 4 и замечание 3). Определение 3. Произведением k% тривектора % на число k называется тривектор, имеющий объем |&|-|9t| и (при \k\ • j% 1=7^0) определяющий ту же ориентацию, что и тривектор 127
91, когда k > 0, и противоположную ориентацию, когда k <. 0. Тривектор (—1) 91 обозначается символом —91 и называется противоположным тривектором (к тривектору 91). Он имеет тог же объем, что и тривектор 91; но (при | 911 =й= 0) определяет про- противоположную ориентацию. Ясно, что для любых двух тривекторов 91 и 53 существует такое число k, что либо 91 = МЗ, либо 33 = &91. Другими словами, можно сказать, что любые два тривекто- тривектора «коллинеарны». Без труда проверяется, что для любых трех векторов а, Ъ, с и любого числа k имеют место равенства (ka) /\Ь /\с = а/\ (kb) Ас = аЛЬ /\ (kc) = k (а А Ъ А с) (свойство однородности внешнего умножения). Так как при транспозиции векторов базиса его ориентация меняется на противоположную, а объем построенного на них параллелепипеда остается прежним, то для любых трех векторов а, Ь, с имеют место равенства (свойство антикоммутативности внешнего умноже- умножения) Определение 4. Пусть а,= аЛЬ ас — произвольные би- бивектор и вектор. Их внешним произведением а /\с мы будем называть тривектор а Ас = аАЬ Ас. Кроме того, по определению, мы положим с А& = аАс. Необходимо, конечно, проверить корректность определения тривектора а А с, т. е. его независимость от выбора векторов а и ft. С этой целью мы заметим, что тривектор а Л с обладает, очевидно, следующими свойствами: 1) его объем выражается формулой I n Л с | = | а | • h, где | ее |—площадь бивектора a, a h — длина проекции вектора с параллельно плоскости бивектора а на прямую, перпендику- перпендикулярную этой плоскости; 2) определяемая им ориентация (при |аЛс|=^0) является произведением ориентации, определяемой бивектором а, и ори- ориентации, определяемой вектором- с. 128
Поскольку эти свойства однозначно характеризуют тривек- тривектор «Леи поскольку они не зависят от выбора векторов а и ft, определение тривектора а Ас корректно. Из этого определения непосредственно вытекает следующее предложение, аналогичное предложению 1 п. 1: Предложение 1. Равенство а Л с = а Л с' (при <х ф с) имеет место тогда и только тогда, когда вектор с' — с параллелен плоскости бивектора а. Кроме того, ясно, что аналог леммы 1 из п. 2 также спра- справедлив, т. е. для любого тривектора 51 и любого -отличного от нуля бивек- бивектора а существует такой вектор с, что Обратим внимание, что для операции внешнего умножения бивектора на вектор свойство однородности также, очевидно, выполнено, т. е. для любого числа k имеют место равенства (ka) Ас = аЛ (kc) = k(aA с). Формулу, определяющую тривектор а Ас, запишем в виде: (а А Ъ) Л с = а А Ь А с. Кроме того, поскольку а АЪ Ас = Ь Ас Аа и а А (Ь А с) = F Л с) А а = Ь А с А а, то a A(b Ac) = a Ab Ас Таким образом, для любых трех векторов а, Ь, с имеют место равенства {а АЬ) Ас = а А(Ъ Ас) = а АЪ Ас (свойство ассоциативности внешнего умножения). Заметим, что в последней формуле [знак Л употребляется в трех различных смыслах. Определение 5. Пусть 21 и 23 — произвольные тривекторы. Выбрав некоторый отличный от нуля бивектор е, положим % = е Л а, 23 = е Л Ь, где а и Ь — некоторые векторы. Мы определим сумму %-\-Ъ тривекторов % и 23 формулой И + 23 = е Л (а + Ъ) (ср. аналогичное определение для бивекторов в п. 2). Чтобы доказать корректность этого определения, мы вспом- вспомним, что существует такое число k, что, скажем 93 = kW 5 М. М. Постников < J2Q
(причем за исключением случая, когда 91 = О и 93 = С), это число однозначно определено). Тогда и потому вектор ka — b = (k + \)а—(а + Ь) параллелен плос- плоскости бивектора е. Следовательно, '' Заметив, наконец, что еЛ(А+1)а = (Л + 1)(еЛа) = (А+1)И, мы окончательно получим, что при 23 = &9t Щ+Я5 = (*+1)Я. A) Следовательно, определение тривектора 31 + 33 корректно. Очевидным образом проверяется (с использованием фор-, мулы A)), что построенные линейные операции над тривекторами обла- обладают всеми восемью стандартными свойствами линейных опера- операций над векторами, т. е. что множество TrivC) всех тривекторов является линеалом. Поэтому, в частности, для тривекторов сохраняется вся тео- теория линейной зависимости, построенная в п. 3 § 3. Впрочем, как уже отмечалось, эта теория для тривекторов вырождается в тривиальность, поскольку любые два тривектора линейно за- зависимы. Произвольный отличный от нуля тривектор Ш называется (тривекторным) базисом. Ясно, что любой другой тривектор % единственным образом представляется в виде % = аи. Число а называется, естественно, координатой тривектора % в базисе Л. Ясно, что соответствие % г—> а определяет изоморфизм линеала TrivC) на стандартный линеал R = R1. Заметим, что по определению внешнее произведение а ЛЬ Л с обладает свойством дистрибутивности по отношению к последнему множителю: a A b A (ct + с2) == a A b A ct + а А Ь А с2. Однако, поскольку это произведние антикоммутативно, оно бу- будет обладать этим свойством и по отношению к первым двум множителям: (ах + а2) А Ь А с = ах А Ъ А с + а2 А Ь А с, а Л Фх + Ь2) А с = а А Ьх Л с -f- а Л Ь2 Л с. Отсюда, в частности, следует, что (Ч + «г) Л с = ах Л с + а2 Л с. 130
Для любого векторного базиса eit е% е3 тривектор е\ Л ег А1 'Л е3 отличен от нуля, т. е. является тривекторным базисом. Очевидное вычисление (использующее свойства однородности, дистрибутивности и антикоммутативности внешнего умноже- умножения) показывает, что для любых трех векторов а = а'е, + а2е2 + а3е3, 6 = &'ei + + b2e2 + b3e3 и с — clex + с2е2 + с3е3 имеет место равенство а /\Ь Л с — а1 Ь1 а* а6 Ьг Ь3 (ех Л е2 Л е3). Из этой связи между тривекторами и определителями мож- можно без труда вывести все основные свойства определителей (только свойство равноправности строк и столбцов получить на этом пути трудно). Если базис е1; е2, е3 ортонормирован, то объем тривектора «1 Л е2 Л е3 равен единице. Отсюда вытекает, что объем параллелепипеда, построенного на векторах а(аи «2, из), b(bi, Ь2, Ь3) и с(си сч, с3), равен абсолютной величи- величине определителя а, а2 а3 Ъ\ Ъ2 Ь3 с, с2 с3 B) Заметим, что в этом утверждении понятие тривектора в яв- явном виде не фигурирует. Определитель B) (с точностью до транспонировании) пред- представляет собой определитель матрицы перехода от ортонорми- ортонормированного базиса в\, е2, е3 к базису а, Ь, с. Таким образом, спра- справедливо следующее Предложение 2. Объем параллелепипеда, построенного на векторах некоторого базиса, равен абсолютной величине опре- определителя | С | матрицы перехода к данному базису от некото- некоторого ортонормированного базиса. Определение 6. Пусть (а, Ь, с) и (аи bit й) — произвольные упорядоченные тройки-векторов. Их взаимным определителем Грама называется определитель вида Матрицу aax bax cax (aai bax \cax abx bbx cbx abi bbx » cbx acx bcx ccx acx bcx ccx 5* щ
этого' определителя полезно представлять себе в виде «скаляр- «скалярного» произведения одностолбцовой матрицы на однострочечную матрицу {аь Ъь с,). В случае, когда тройки (а, Ь, с) и (аи Ьи с{) совпадают, соответствующий определитель а2 аЪ ас Ъа Ъ2 be са cb с2 называется определителем Г рама тройки (а, Ь, с) и обозна- обозначается символом Г(а, Ь, с). Его матрица для линейно независи- независимой тройки (базиса) а, Ь, с является не чем иным, как матрицей метрических коэффициентов этого базиса. Определение 7. Скалярным произведением 9123 двух тривек- тривекторов называется произведение их длин, взятое со знаком плюс, если эти тривекторы определяют одну и ту же ориентацию про- пространства, и со знаком минус —в противном случае. Точно так же, как для бивекторов, доказывается, что скалярное произведение тривекторов а АЬ Ас и ai Л Л&1 Л С\ равно взаимному определителю Г рама троек (а, Ь, с) и (ai, bi, Ci): aal ab\ ac{ {а Л b Л с) (а, Л by Л с,) = bax bbx bcx CCL\ CO\ CC[ Впрочем, быть может, это проще доказать, заметив, что скалярное произведение тривекторов, выраженное через коор- координаты в ортонормированном базисе, сводится к умножению определителей. Применив это предложение к случаю одинаковых тривекто- тривекторов, мы немедленно получим, что для любых трех векторов а, Ь, с квадрат v% объема паралле- параллелепипеда, построенного на этих векторах, равен их определите- определителю Г рама: v2 = Г (а, Ь, с). Отсюда вытекает, что для любых трех векторе a, b и с имеет место неравенство Г(а,6,<с»0, 132
вырождающееся в равенство тогда и только тогда, когда век- векторы а, Ь, с линейно зависимы. В частности, мы видим, что для любого базиса пространства определитель матрицы его метрических коэффициентов положителен: g\l 812 #13 g21 g22 g23 §31 Й32 ё'зз Об этом факте мы уже имели случай упомянуть в п. 4 § 5. 6. Векторное и смешанное произведения Воспользовавшись изоморфизмом между бивекторами и век- векторами, мы при желании можем вообще исключить какое-ли- какое-либо упоминание о бивекторах, заменяя их всюду ассоциирован- ассоциированными векторами. Например, вместо того чтобы говорить о би- бивекторе а ЛЬ, мы можем говорить о векторе (а Л Ь)х. Определение 1. Вектор (аЛ6)х называется векторным про- произведением векторов а и Ь и обозначается символом а X Ь. Таким образом, векторное произведение линейно зависимых (коллинеарных) векторов равно нулю; если векторы а и & не коллинеарны, векторное произведение а X Ь отлично от нуля и определяется следующими условиями: 1) его длина равна площади параллелограмма, построенно- построенного на векторах а и Ь; 2) он перпендикулярен плоскости векторов а и Ь; 3) базис а, Ь, аУСЬ положительно ориентирован (по отно- отношению к данной ориентации пространства). Свойства векторного умножения немедленно вытекают из соответствующих свойств внешнего умножения. В частности, векторное умножение антикоммутативно и дистрибутивно относительно сложения. Для любого положительно ориентированного ортонормиро- ванного базиса i, }, k имеют место, очевидно, формулы Поэтому в положительно ориентированном ортонормированном базисе вектор «Xi имеет координаты а2 а3 h Ьъ , — а1 аЗ У п[ а2 &л Ь2 %де аи а2, а3 — координаты вектора a, a &i, 62, Ь3 — координаты ёектора Ь. 133
Воспользовавшись формулой разложения определителя по элементам строки, мы можем этот факт записать в виде сле- следующей компактной формулы: i i k «i a2 a3 Ь\ bo bo Полезно также иметь в виду, что квадрат |аХ&|2 длины |а X &| векторного произведения аХ& равен определителю Г рама Т(а,Ь) векторов а, Ь. Векторное произведение имеет то преимущество, что оно оставляет нас в рамках чистой теории векторов. Однако его смысл и значение могут быть полностью выяснены лишь с «бивекторных» позиций. (В частности, прямое доказательство его свойств по существу использует бивекторы, хотя и в неяв- неявном виде.) Кроме того, его определение имеет тот неустранимый недостаток, что оно содержит элемент произвола (выбор ори- ориентации пространства). Мы не говорим уже о его сугубо мет- метрическом характере, скрадывающем аффинный характер поня- понятия бивектора *). Аналогично, воспользовавшись изоморфизмом между ли- линеалами TrivC) и R, мы можем всюду заменить тривекторы соответствующими числами (координатами). При этом, конеч- конечно, возникает элем-ент произвола, связанный с выбором трпвек- торного базиса ©, определяющего данный изоморфизм, т. е. с выбором эталона объема и, что более существенно, ориентации пространства. Определение 2. Координата тривектора а ЛЬ Ас назы- называется смешанным (или тройным) произведением векторов а, 6, с и обозначается символом аЬс. Смешанное произведение является таким же заменителем внешнего произведения а А Ъ Ас, каким векторное произведе- произведение а X Ь является по отношению к внешнему произведению а А Ь. Его свойства немедленно вытекают из соответствующих свойств внешнего произведения. В частности, . смешанное произведение антикоммутативно и дистрибутив- дистрибутивно по каждому сомножителю. В положительно ориентированном ортонормированием ба- базисе смешанное произведение выражается формулой а\ а2 а3 Ь\ Ъ2 Ъ3 С\ С3 ') Не последнюю роль играет и тот факт, что в я-мерных пространствах при п > 3 векторное произведение двух векторов вообще нельзя определить, тогда как теория бивекторов полностью сохраняется. 134
впрочем, для справедливости этой формулы ортонормиро- ванность базиса является, очевидно, слишком сильным требова- требованием: достаточно, чтобы объем параллелепипеда, построенного на векторах базиса, был бы равен единице. Упражнение. Докажите, что смешанное произведение следующим образом выражается через векторное и скалярное произведения: аЬс = а{ЬХс). {Этим и объясняется термин «смешанное произведение».) Подчеркнем, что смешанное произведение зависит от выбора ориентации пространства: при смене ориентации оно меняет знак. § 7. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 1. Отображения и преобразования В этом вводном пункте мы напоминаем некоторые общема- общематематические факты, связанные с понятием отображения. Эти факты читателю почти наверняка известны, но мы все же их вкратце изложим, хотя бы для того, чтобы уточнить термино- терминологию. Определение 1. Пусть X и У — произвольные непустые множества. Ото- Отображением ф: X -*¦ У множества X в множество У называется ') произволь- произвольное правило, позволяющее каждому элементу ле,? сопоставить некоторый однозначно определенный элемент у е У. Элемент у называется образом эле- элемента х при отображении ф и обозначается символом ц>(х). Для отображений ср: X -*¦ Y и ilp: Y->¦ Z определена их композиция ¦ф ° ф: X -> Z (иногда называемая также их произведением), задаваемая формулой Без труда проверяется, что композиция 'бтображений ассоциативна, т. е. для любых трех отображений ф: X -> У, г|з: У -> Z и %: Z->U отображения (^о-ф)оф и %°(ф°ф) совпадают: (Хоф)оф=Хо(фоф). Поэтому обычно скобки опускают и пишут просто х°ф°ф- Определение 2. Множество всех элементов у s У, для которых суще- существует такой элемент х е X, что ц>(х) = у, называется образом отображе- отображения ф и обозначается символом ф(^). Если ц>(Х) — У, то отображение ф называется надъективным. Если для любых двух различных элементов х\, хге.Х элементы <$(х2) е У также различны, отображение ф называется инъективным. ') Эт,й, конечно, не определение, а скорее описание. Дать строгое опре- определение понятию отображения по существу так же трудно, как и понятию множества. 135
Отображение ф называется биективным (или взаимно однозначным), если оно одновременно инъективно и надъективно. В этом случае для лю- любого элемента уеУ существует единственный элемент хеX, обладающий тем свойством, что ф (х) = у. Поэтому формула определяет некоторое отображение ф-1: Y-+X, называемое отображением, обратным к отображению tp: X-*-Y. Обратное отображение также биективно, причем отображением, обрат- обратным к нему, служит отображение ф: Примером биективного отображения может служить тождественное ото- отображение 1х (или просто 1) множества X на себя, определяемое формулой Определение 3. Отображение ф: Л"-»-У называется обратимым слева (со- (соответственно обратимым справа), если существует такое отображение ф': Y-*-X (такое отображение ф": Y-*-X), что ф'«ф= 1Х (соответственно фоф"= \у). Отображение называется обратимым, если оно обратимо слева и справа. • Легко видеть, что отображение ф: X -*¦ Y тогда и только тогда обратимо слева (справа). когда оно инъективно (надъективно). Действительно, пусть отображение ф обратимо слева, т. е. пусть суще- существует такое отображение ф': Y -*¦ X, что ф'°Ф= 1Х, и пусть xi, Хг — такие элементы множества X, что Применяя к обеим частям этого равенства отображение ф' и учитывая, что, во определению, для любого элемента хеХ (ф'оф) (Х)~ 1х(х)~Х, мы немедленно получаем, что Xj = Xi. Следовательно, отображение ф инъективно. Обратно, пусть отображение ф инъективно. Тогда для любого элемента уеф(Х) существует единственный элемент ху, для которого <р(ху)=.у. Выбрав в X произвольный элемент хо, мы определим отображение, ф': У -> X 136
формулой ф если Тогда (р'о ф = ljr, так что отображение ср обратимо слева. , Пусть теперь отображение <р обратимо справа, т. е. пусть существует такое отображение ф": Y-*-X, что фоф"=1к. Тогда для любого элемента jeF элемент и = f"(i/) e X будет обладать тем свойством, что ф(*) = у, и следовательно, отображение ф надъективно. Наконец, пусть отображение ф надъективно. Тогда для любого элемента у е У существует (вообще говоря, не один) элемент х е X, обладающий тем свойством, что.ф(л;) = у. Выбрав (произвольно) один такой элемент, обозна- обозначим его символом <р"(у). Тем самым мы получим некоторое отображение ф": У->Х, обладающее тем свойством, что ф°ф" = 1у. В частности, мы видим, что отображение ф: X -*¦ Y тогда и только тогда обратимо, когда оно биек* тивно. При этом для биективного отображения ф отображения ф' и ф" опреде- определяются единственным образом н совпадают с обратным отображением ф~*. Таким образом, биективное отображение ф: X -*¦ У можно определить как такое етображение, для которого существует отображение ф: Y~*-X, удо- удовлетворяющее соотношениям Легко видеть, что композиция двух надъективных (инъективных) ото- отображений также надъективна (инъективна). Следовательно, композиция -ф°ф двух биективных отображений является биективным отображением. При этом Определение 4. Биективные отображения множества X на себя называ- называются его преобразованиями. Непустое множество преобразований называется группой преобразова- преобразований, если 1) вместе с двумя преобразованиями ф и ф оно содержит и их компо- композицию ф о ф; 2) вместе с преобразованием ф оно содержит и обратное преобразова- преобразование ф. Поскольку группа преобразований непуста, из условия 2) вытекает, что она обязательно содержит тождественное преобразование \х- Замечание 1. Группы преобразований являются частным случаем извест- известного из алгебры общего понятия (абстрактной) группы. В отличие от опре- определения абстрактных групп, в определение групп преобразований включать •требование ассоциативности не нужно, поскольку для умножения преобразо- преобразований оно выполнено автоматически. ; 137
Замечание 2. В дальнейшем (например, в гл. 7) мы изредка будем пользоваться некоторыми простейшими понятиями абстрактной теории групп. Напомним их определения, отсылая за подробностями к курсу высшей ал- алгебры. Определение группы мы будем считать известным. Подмножество Н группы G называется а) подгруппой, если кхкг eff и A-1 e H для любых элементов А,, кг, кеН; б) нормальным делителем, если Н — подгруппа и если ghg~l e H для любых элементов h s Н, g e G; в) смежным классом (левым) по подгруппе К, если Af'A2e/C для любых элементов fti, A2 е Я. Отображение одной группы в другую называется гомоморфизмом, если (g!) для любых gu g2e=G. Инъективный гомоморфизм называется мономорфизмом, надъективный — эпиморфизмом, а биективный — изоморфизмом. Пусть е' — единица группы G'. Множество всех элементов g e G, для которых ф (g) = е', называется ядром гомоморфизма ф. Оно всегда являет- является нормальным делителем. Гомоморфизм тогда и только тогда инъективен (является мономорфизмом), когда его ядро состоит только из единицы е группы G. Множество смежных классов группы G по подгруппе Н обозначается символом G/H. В случае, когда Н является нормальным делителем, умноже- умножение смежных классов «по представителям» корректно определено и превра- превращает множество G/H в группу. Эта группа называется факторгруппой груп- группы G по нормальному делителю Н. Теорема о гомоморфизмах утверждает, что если существует эпиморфизм ф: G-*-G', то группа G' изоморфна факторгруппе группы G по ядру эпиморфизма ф. 2. Кольцо линейных операторов Определение 1. Отображения линеала Vect(n) в себя (где, как всегда, п — 1, 2, 3) принято называть операторами. Опера- Оператор А, переводящий вектор х в вектор Ах, называется линей- линейным, если А(х + у) = Ах + Ау для любых векторов х, у (это свойство иногда называют с в о й- ством аддитивности),и для любого вектора х и любого числа k (это свойство назы- называется свойством однородноети). 138 •
Примером линейного оператора является тождественный оператор Е, оставляющий каждый вектор на месте: а также нулевой оператор О, переводящий каждый вектор в ну- нулевой вектор: Ох = 0. Более общий пример мы получим, рассмотрев для произ- произвольного вещественного числа k оператор kE, действующий по формуле т. е. умножающий каждый вектор на число k. Этот оператор, очевидно, линеен. При k = 1 он превращается в тождественный оператор Е, а при k = 0 — в нулевой оператор О. Множество всех линейных операторов, действующих в Vect(n), мы будем обозначать символом Lin(n). Композиция операторов обычно называется их произведе- произведением и в ее обозначении опускается знак о. Таким образом, если А и В — операторы, то их произведение АВ действует на любом векторе х по формуле (АВ)х = А(Вх). Тождественный оператор является единицей этого умноже- умножения, т. е. для любого оператора А. Ясно, что произведение АВ двух линейных операторов А и В также является линейным дператором. Действительно, АВ(х + у) = А(В(х + »)) = А(Вх + By) = А(Вх) + А(Ву)=* = (АВ)х + (АВ)у и АВ (kx) = А(В (**)) = A (kBx) = kA (Bx) = k (АВ) х. В отличие от отображений произвольных множеств для опе- операторов определена также операция сложения. Определение 2. Суммой А + В двух операторов А и В назы- называется оператор, определенный формулой (Л + В) х = Ах + Вх. Легко видеть, что сумма A-f- В двух линейных операторов Аи В также является линейным оператором. 139
Действительно, и (А + В) (kx) = A (kx) + В (kx) = kAx + kBx = = k (Ax + Bx) = k(A + B)x. Эта операция сложения,очевидно, ассоциативна ((А-{-В)-{-С~ = А + (В + С)), коммутативна (А-\- В = В -\- А), обладает нулем (которым служит нулевой оператор О) и для любого опера- оператора А существует противоположный оператор — А (опреде- (определяемый формулой (— Л)дс= — Ах). Кроме того, легко видеть, что сложение операторов дистрибутивно относительно умноже- умножения ((А + В)С = АС + ВС и С(А + В) = СА + СВ для любых операторов А, В, С). Поскольку умножение операторов ассо- ассоциативно ((АВ) С = А(ВС)), все это на языке алгебры, означает что справедливо следующее Предложение 1. Совокупность Lin (n) всех линейных опера- операторов в Vect (n) является кольцом с единицей. Подчеркнем, что это кольцо некоммутативно (т. е., вообще говоря, АВ Ф ВА). 3. Описание линейных операторов Пусть е\ еп — произвольный базис линеала Vect(n). Линейный оператор А переводит векторы этого базиса в некоторые векторы Легко видеть, что векторы е\, ..., е'п однозначно определяют линейный опера- оператор А. Действительно, любой вектор х однозначно разлагается по векторам базиса: Л Применив к этому равенству оператор А и воспользовавшись линейностью, мы немедленно поручим, что А* = х'<+ ... +хпе'п. Таким образом, зная векторы е\, ..., е'п, мы можем вычислить вектор Ах для любого вектора х. Но это и означает, что век- векторы е[, ..., е'п однозначно определяют оператор А. 140
Столь же легко показывается, что для любой системы векторов о' е' существует {по доказанному, единственный) линейный оператор А, для которого [ A ' Действительно, рассмотрим оператор А, определенный для любого вектора х = х1е1+ ... +хпеп формулой Ах = х1е[ + ... +хпе'п. В силу единственности разложения векторов по векторам ба- базиса это определение корректно. Кроме того, ясно, что так по- построенный оператор обладает тем свойством, что Поэтому для завершения доказательства нужно только пока- показать, что построенный оператор А линеен, т. е. для него спра- справедливы соотношения Но проверка этих соотношений производится совершенно авто- автоматически: если х = ххех + ... + хпеп, у = г/'е, + ... + упеп, то и потому Аналогично, так как kx=~(k?)ei+ ... +{kxn)en, то Резюмируя, мы получаем следующее Предложение 1. Выбор базиса 141
устанавливает биективное соответствие между линейными опе- операторами и произвольными системами из п векторов Линейный оператор А, соответствующий такой системе, опреде- определяется формулой Ах=*х1е[+ ... + хпе'п, * = *'«,+ ... + хпеп, а система, соответствующая линейному оператору А, состоит из векторов < 4<4 Системе п векторов е' мы сопоставим квадратную матрицу порядка п, столбцы кото- которой состоят из координат этих векторов (в базисе ех «„). Поскольку это соответствие между системами векторов и мат- матрицами, очевидно, биективно, мы получаем, что линейные операторы и квадратные матрицы находятся в би- биективном соответствии. Определение 1. Матрица А, соответствующая указанным об- образом линейному оператору А, называется матрицей оператора А в базисе ег, ..., еп. По определению, если Аеу = а'в, + • • • + а?«п, A) Аеп==апе1+ ••• +апеп> ТО (а\ ... а А= • • • • \ а" ... а" Подчеркнем, что координаты векторов Ав\, ,.., Аеп распо- расположены по столбцам этой матрицы. Введя в рассмотрение векторные матрицы-строки Ае = (Аеи .... Аеп), мы можем формулы A) записать в следующем удобном для запоминания виде; Ае*=еА. (V) 142
Легко видеть, что для любых двух линейных операторов А и В матрицей опв' ратора АВ является произведение АВ матриц А и В операто- операторов А и В, а матрицей оператора А-\-В — сумма А + В мат-> риц А и В. Действительно, ввиду линейности оператора А А (еВ) = (Ае) В. Поэтому (АВ) е = А (Be) = А (еВ) = (Ае) В = е (АВ). Аналогично, Доказанное утверждение означает, .что справедлива сле- следующая Теорема 1. Соответствие «линейный оператор»*-^- «его матрица» устанавливает изоморфизм кольца Lin(n) линейных операто- операторов на кольцо всех квадратных матриц порядка п. В частности, тождественному оператору Е соответствует единичная матрица Е, а нулевому оператору О — нулевая мат- матрица О. Вообще, оператору kE умножения на число k соот- соответствует скалярная матрица k О \ 0 Замечание 1. Мы видим, что матрица оператора kE — одна и та же во всех базисах. Упражнение. Покажите, что операторы вида kE являются единственными операторами, обладающими тем свойством, что матрица такого оператора — одна и та же во всех базисах. Формула разложения x = xlei+ ... +хпеп произвольного вектора х по векторам базиса имеет в матрич- матричной записи вид х — ех, где х — матрица-столбец х = 143
Аналогично, формула Ах — х1Ае{ + ... + хпАеп может быть записана в следующем виде: Ах = (Ае) х. Подставив сюда из формулы A') выражение для Ае, мы не- немедленно получим, что Ах = еАх. Сравнив эту формулу с формулой разложения У = еу вектора У = Ах, мы получим, далее, что У = Ах, B) или, в развернутом виде, что yl=a\xl + ... +*?*", B0 уп = а?х1+ ... +а«хп. Таким образом, мы видим, что координаты преобразован- преобразованного вектора у = Ах линейно выражаются через координаты исходного вектора х с матрицей коэффициентов А. Подчеркнем, что коэффициентами выражения t'-й коорди- координаты являются элементы t-й строки матрицы А. Резюмируя, мы видим, что предложение 1 может быть пе- переформулировано в следующем виде: Предложение 2. Выбор базиса устанавливает изоморфизм кольца линейных операторов на кольцо квадратных матриц порядка п. Столбцы матрицы. А, со- соответствующей при этом изоморфизме линейному оператору А, состоят из координат векторов Аеъ ..., Аеп. Линейный оператор А, соответствующий матрице А, переводит произвольный вектор х = x1ei -\-,.. -f- xnen в вектор у = = ухе\ + ... +упеп с координатами {2'). При п = 1 мы получаем отсюда, что линейные операторы на прямой (т. е. в линеале Vect(l)) исчерпываются операторами kE умножения на числа. Построенный изоморфизм между кольцами линейных опе- операторов и квадратных матриц зависит от выбора базиса. Най- Найдем, как меняется матрица оператора при изменении базиса, 444
Пусть /i» • • •. fn — другой базис в Vect(n) и пусть С — матрица перехода от ба- базиса еи ..., еп к базису fu ..., fn. По определению (см. п. 7 § 3) это означает, что векторные матрицы-строки « = («!, ..., еп), f = (fl, .... fn) связаны формулой / = еС. Применив к этой формуле линейный оператор А и заметив, что в силу линейности мы получим, что т. е. что где Л' —матрица оператора А в базисе /ь •••, fn, а А, как и выше, — матрица оператора А в базисе е\, ..., еп. Подставив сюда выражение для f, мы получим, далее, что откуда следует, что СА' = АС, т. е. что Таким образом, мы доказали следующее Предложение 3. Если в базисе еи ..., еп линейный оператор А. имеет матрицу А, то в базисе fb • • •. fn его матрицей будет матрица С~1АС, где С — матрица перехода от базиса еи ..., еп к базису fb • • • . fn- > 4. Обратимые линейные операторы Определение 1. Линейный оператор А называется обрати- обратимым слева (справа), если существует такой линейный опера- оператор В (линейный оператор С), что ВА = Е (соответственно, АС = Е). Оператор А называется обратимым, если он обратим й слева, и справа, ,_--- 145
Обратим внимание на то, что несмотря на полное внешнее сходство определений, это понятие обратимости отличается априори от обратимости в смысле п. 1. Дело здесь в том, что оператор А обратим, например, слева в смысле п. 1 (т. е. инъ- ективен), если существует какой-то оператор В, удовлетво- удовлетворяющий соотношению ВА = Е, тогда как теперь мы требуем, чтобы этот оператор был линейным. Таким образом, если оператор обратим в нашем теперешнем смысле, то он заведомо обратим в смысле п. 1, но обратное пока неясно. Замечательным фактом теории линейных операторов яв- является то обстоятельство, что на самом деле оба понятия об- обратимости совпадают. Еще более удивительно то, что для ли- линейных операторов из обратимости слева или справа вытекает обратимость (т. е. обратимость и слева, и справа). Другими словами,справедлива Теорема 1. Следующие свойства линейного оператора А рав- равносильны: 1°. Оператор А обратим слева. 2°. Оператор А инъективен. 3°. Оператор А обратим справа. 4°. Оператор А надъективен. 5°. Оператор А обратим. 6°. Оператор А биективен. Доказательство. Пусть — произвольный базис линеала Vect(n) и пусть, как и в пре- предыдущем пункте, Мы добавим к свойствам Г—6° еще следующее свойство: 7°. Векторы е\, ..., е'п образуют базис. Ясно, что теорема будет доказана, если мы докажем сле- следующую систему импликаций: Импликация 1°=т>2°. Эта импликация имеет общий ха- характер (справедлива для любых отображений, см. п. 1). Импликация 2°=^ 7°. Предположим, что векторы е\ е'п не образуют базиса. Тогда они линейно зависимы и потому существуют такие числа ku ..., kn (не все равные ну- нулю), что 146
Рассмотрим вектор ... +knen. В силу линейности оператора А этот вектор обладает тем свой- свойством, что Ak = 0. Но ясно, что АО = 0. Поэтому в силу инъективности оператора А должно иметь место равенство k = 0, что невозможно, по- поскольку векторы еь ..., е„ линейно независимы. Полученное противоречие доказывает, что 2° =^7°. Импликация 7°=#>Г. Определим линейный оператор В требованием, чтобы векторы е\, ..., е'п он переводил соответ- соответственно в векторы еи ..., е„. Поскольку векторы е[, ..., е'п образуют базис, такой оператор В существует и однозначно определен (см. п. 3). Тогда оператор ВА будет переводить ба- базис е\, ..., еп в сабя и потому будет совпадать с тождествен- тождественным оператором Е. Импликация 3°=ф4°. Подобно импликации 1°=>2° эта импликация справедлива из общих соображений (см. п. 1). Импликация 4°=>7°. По условию, для любого вектора у существует такой вектор х, что Ах = у. Разложим вектор х по векторам базиса: х = х1е{ + ... + хпеп. Применив к этому "равенству оператор А, мы немедленно полу- получим, что Это показывает, что семейство векторов е\, ..., е'п полно. Так как оно содержит п векторов, то, следовательно, оно является базисом. Импликация 7О=#>3°. Положим С = В, где В — линей- линейный оператор, построенный при доказательстве импликации 76 =5> 1°. Ясно, что АС = Е. Тем самым теорема 1 полностью доказана. Заметим, что одновременно мы также доказали, что линейный оператор А тогда и только тогда обратим, когда он обладает свойством Т. Поскольку столбцы матрицы оператора А состоят, по опре- определению, из координат векторов е[, ..., е'п, свойство 7° рав- равносильно следующему свойству: 8°. Матрица оператора А невырождена. Таким образом, линейный оператор А тогда и только тогда обратим, когда его матрица (в произвольном базисе) невырождена. 147
Поскольку обратимый оператор А биективен, для него су- существует обратный оператор А~1. Легко видеть, что обратный оператор А~х линеен. Действительно, по условию существует такой линейный оператор В, что ВА = Е. Следовательно, Л = ЕА~1 = {ВА) А'1 = В (АЛ'1) = BE = В. Поэтому оператор Л" линеен. Впрочем, линейность оператора А~1 непосредственно выте- вытекает и из определений. На самом деле, если Ахх = yi и Ах2 — у2, то A (Xj + х2) = ух + у2 и потому A~l(yi + У2) = Х\ +х2, т. е. если А = ft*, т. е. Аналогично, если Ах = у, то A(kx) = ky, и потому Л (ky) = ft Матрицей оператора А~1 является, очевидно, матрица А~1, обратная к матрице А оператора А. Тот факт, что оператор А~1 линеен, означает, что обратимые линейные операторы (действующие в Vect (n) при данном п) образуют группу. Мы будем обозначать эту группу символом Ор(я). Из сказанного выше о соответствии между линейными опе- операторами и их матрицами непосредственно вытекает, что соответствие «линейный оператор» ь-> «его матрица» определяет изоморфизм группы Ор(п) обратимых линейных операторов на группу GL(n) всех невырожденных квадратных матриц порядка п. Заметим, что хотя группы операторов и матриц изоморфны, отождествлять их нельзя, поскольку никакого естественного (не зависящего от выбора базиса) изоморфизма между ними не имеется. Докажем в заключение следующее предложение, часто по- полезное при доказательстве необратимости конкретных опера- операторов. Предложение 1. Линейный оператор А тогда и только тогда необратим, когда существует такой отличный от нуля вектор х0, что Л*0 = 0. A) 148 -
Доказательство. Если оператор А обратим, то, приме- з к равенству A) оператор А-1, мы получим, что нив (поскольку оператор А~1 линеен, то Л~10 = 0). Следовательно,, если вектор «о Ф О, удовлетворяющий соотношению A), суще- ствует, то оператор А необратим. Обратно, пусть оператор А необратим. Тогда согласно до- доказанному выше он обязательно неинъективен, т. е. существуют такие различные векторы Х\ и х2, что Ахх = Ах2. Положив мы и получим вектор Хо ф 0, удовлетворяющий соотноше- соотношению A). 5. Операторы, действующие по равенству координат Обратим внимание на то, что равенства выражающие векторы через векторы базиса «1. лишь обозначениями отличаются от формул A) п. 7 § 3, вы- выражающих векторы базиса ev, .... v через векторы базиса еи ..., еп. Таким образом, на эти формулы (при невырожденной мат- матрице А) возможны две «сопряженные» точки зрения: их можно» рассматривать либо как формулы перехода от одного («ста- («старого») базиса к другому («новому»), либо как формулы, опи- описывающее действие некоторого обратимого линейного оператора на векторах данного базиса. Аналогично, формулы 14»
также можно истолковывать двояко в зависимости от того, что понимается под величинами х1 хп и уК ..., уп. При одном истолковании величины х1, ..., хп являются координатами произвольного вектора х в базисе в\, ..., еп, а величины у1, ..., уп — координатами в том же базисе преобразован- преобразованного вектора у = Ах. При другом истолковании величины х1, ..., хп являются координатами произвольного вектора х в «новом» базисе ех„ ..., еп,, а величины у1, ..., уп — коорди- координатами того же вектора дс в «старом» базисе е\, ..., еп. Замечание 1. Подчеркнем, что при первом истолковании ве- величины х\ ..., хп являются координатами вектора х в базисе ей ..., е„, а при втором — в базисе ev, ..., еп,. Таким образом, одна и Та же алгебраическая конструкция (линейное преобразование неизвестных) имеет два различных (хотя и тесно между собой связанных) геометрических истол- истолкования. Объяснение этого факта можно получить, сравнив формулу •с формулой +хпе'п. п. Мы видим, что преобразованный вектор Ах имеет в преобразованном ба- базисе е[, ..., е'п те же координаты, что и исходный вектор х в базисе е\, ..., еп. Чтобы описать это явление, введем следующее Определение 1. Пусть ev ..., еп и ev, ..., еп, — два ба- базиса в Vect(n). Говорят, что оператор А действует по равен- равенству координат (в данных базисах), если произвольному век- вектору х он сопоставляет вектор у = Ах, имеющий в базисе ev, ..., еп,те же координаты, что и вектор х в базисе eit..., еп- В этой терминологии доказанное выше утверждение озна- означает, что любой обратимый линейный оператор действует по равен- равенству координат в некоторых базисах. Замечание 2. Легко видеть, что и, обратно, любой оператор, действующий по равенству координат, яв- является, во-первых, линейным, а во-вторых, обратимым опера- оператором. Задание. Докажите это утверждение. N Если мы теперь хотим найти координаты вектора у = Ах «е в базисе ev, ..., еп„ а в исходном базисе е±, ..., еп, нам достаточно воспользоваться формулами преобразования коор- координат при переходе.от базиса еу, .... еп, к базису еь ..., еп. Это и объясняет, почему линейные преобразования -координат J50 • ./
могут быть истолкованы и как преобразования, описывающие действие линейных операторов. Замечание 3. Подчеркнем, что такого рода «двойное» истол- истолкование возможно лишь для линейных преобразований неиз- неизвестных с невырожденной матрицей А. Линейные преобразова- преобразования с вырожденной матрицей А описывают в координатах действия необратимых линейных операторов, но никакого отно- отношения к замене базисов не имеют. 6. Обратимые линейные операторы и ориентации Пусть е,, ..., еп и /ь • • • > in — два базиса в Vect(n) и пусть С — матрица перехода от пер- первого базиса ко второму. По определению, это означает, что для. векторных матриц-строк е = (еи .... еп) имеет место равенство f = eC. Применив к этому равенству линейный оператор А, мы по- получим равенство где > Г = Щъ .-., Afn), е' = {Аех Аеп). Если оператор А обратим, то семейства Afi Afn » Ае\, ..., Аеп также являются базисами, и доказанная формула означает, что эти базисы связаны той же самой матрицей пе- перехода С. ., Таким образом, мы доказали, что если два базиса связаны матрицей перехода С, то базисы, получающиеся из данных воздействием некоторого обратимого- линейного оператора А, также связаны матрицей перехода С. Вспомним теперь, что два базиса называются одноименными- (определяющими одну и ту же. ориентацию), если определи- определитель, связывающий их матрицы перехода, положителен. Отсюда и из только что доказанного утверждения непосредственно вы- вытекает, что обратимые линейные операторы переводят одноименные ба- базисы в одноименные, а разноименные — в разноименные. ; 15L
Это означает, что, сопоставив ориентации о, задаваемой ба- базисом еи ..., еп, ориентацию о', задаваемую базисом мы получим корректно определенное соответствие между ори- ентациями. Мы будем говорить, что это соответствие индуциро- индуцировано обратимым линейным оператором А. Ориентацию о' мы будем обозначать символом А(о). Поскольку обратимый линейный оператор переводит разно- разноименные базисы в разноименные, то противоположные ориента- дии линейный оператор переводит в противоположные: А(-о) = -А(о). Отсюда вытекает, что либо А(о) = о для любой ориентации о, либо А(о)=-о также для любой ориентации о. В первом случае говорят, что обратимый линейный опера- оператор сохраняет ориентации, а во втором — что он обращает ори- ориентации. Множество всех обратимых линейных операторов, сохраняю- сохраняющих ориентации, мы будем обозначать символом Ор+(п), а до- дополнительное множество обратимых линейных операторов, об- обращающих ориентации, — символом Ор~(п). Ясно, что 1) если обратимые линейные операторы А и В оба сохра- сохраняют или обращают ориентации, то их произведение АВ со- сохраняет ориентации, а если один из операторов А или В со- сохраняет ориентации, а другой обращает, то оператор АВ обращает ориентации; 2) если обратимый линейный оператор А сохраняет (обра- (обращает) ориентации, то обратный оператор А~1 также сохраняет (соответственно обращает) ориентации. На языке теории групп это означает, что множество Ор+(п) обратимых линейных операторов, сохра- сохраняющих ориентации, является подгруппой (даже нормальным -делителем) группы Ор(га), а множество Ор~(п) является смеж- смежным классом группы Ор(п) по подгруппе Ор+(п). Тот факт, что обратимый линейный оператор А сохраняет (обращает) ориентации, означает, что произвольный базис .¦¦-«,,... е„ , 152 "
он переводит в одноименный (разноименный) базис Но, как мы знаем, матрицей перехода от базиса еи ..., еп к ба- базису е\, ..., е'п служит матрица А оператора А в базисе в\, ... , еп. Следовательно, обратимый линейный оператор тогда и только тогда сохра- сохраняет (обращает) ориентации, когда в произвольном базисе его матрица имеет положительный (соответственно отрицательный) определитель. Пусть GL+(n) — совокупность всех квадратных матриц по- порядка п с положительным определителем, a GL-(*) — совокуп- совокупность всех квадратных матриц порядка п с отрицательным определителем. Из того, что при умножении матриц их опре- определители перемножаются, непосредственно вытекает, что по отношению к умножению матриц множество GL+(n) яв- является подгруппой (даже нормальным делителем) группы GL(n), а множество GL~(n)—смежным классом по этой под- подгруппе. При этом согласно сказанному выше справедлива следу- следующая Теорема 1. Соответствие «линейный оператор» у—> «его матрица» определяет изоморфизм группы Ор+(п) на группу GL+(n). Семейство матриц A(t), зависящих от числового параметра t, называется непрерывным семейством, если каждый элемент- матрицы A (t) является непрерывной функцией параметра t. В соответствии с этим семейство A(t) линейных операторов называется непрерывным семейством, если матрицы A (t) опе- операторов A(t) (в некотором базисе еь ..., е„) образуют непре- непрерывное семейство. Поскольку при изменении базиса матрицы A(t) переходят (см. п. 2) в матрицы C~lA(t)C и поскольку се- семейство матриц C~lA(t)C непрерывно тогда и только тогда,, когда непрерывно семейство A(t), то свойство непрерывности семейства линейных операторов определено корректно (не за- зависит от выбора базиса). Пусть, для определенности, числовой параметр t пробегает отрезок [0, 1]. . _ Определение 1. Если , А@) = А, АA) = В, то непрерывное семейство обратимых линейных операторов- A(t) мы будем называть деформацией, связывающей обрати- обратимый линейный оператор Ас обратимым линейным оператором В. Обратимые линейные операторы Л и В мы будем называть- 15а
деформируемыми друг в друга, если существует хотя бы ^ одна деформация, связывающая один оператор с другим. Понятие деформации обратимых линейных операторов тесно связано с введенным в п. 1 § 4 понятием деформации базисов. Действительно, легко видеть, что семейство A(t) обратимых линейных операторов тогда и только тогда является деформацией, связывающей оператор А с оператором В, когда для любого базиса еи ..., еп вектор- функции а,(*) = Л(*)е, an(t) = A(t)en составляют деформацию, связывающую базис ах = Аех ап-=Аеп с базисом Но, как было показано в п. 1 § 4, два базиса тогда и только тогда деформируемы друг в друга, когда они одноименны. Сле- Следовательно, обратимые линейные операторы А и В тогда и только тогда деформируемы друг в друга, когда для любого базиса ех, ¦.., еп базисы Аеь ..., Аеп и Be, Веп одноименны. Последнее условие, очевидно, означает, что операторы А и В одновременно либо сохраняют, либо обращают ориентации. Тем самым мы доказали следующее Предложение 1. .Обратимые линейные операторы тогда и только тогда деформируемы друг в друга, когда они оба либо сохраняют, либо обращают ориентации. Другими словами, обратимые линейные операторы, принадлежащие одновре- одновременно либо подгруппе Ор+(«), либо смежному классу Ор-(п), деформируемы друг в друга, а обратимые линейные операторы, один из которых принадлежит подгруппе Ор+(п), а другой — смежному классу Ор-(п), друг в друга не деформируемы. В частности, мы видим, что обратимый линейный оператор тогда и только тогда сохра- сохраняет ориентации (принадлежат подгруппе Ор+(п)), когда он может быть продеформирован в тождественный оператор Е. Для матриц доказанные утверждения означают, что две квадратные невырожденные матрицы тогда и только тогда могут быть продеформированы друг в- друга, когда их определители имеют один и тот же знак. 154
. В частности, квадратная невырожденная матрица тогда и только тогда может быть продеформирована в единичную матрицу, когда ее определитель положителен. 7. Изометричные операторы Определение 1. Линейный оператор U называется изомет- ричным, если он сохраняет скалярное произведение, т. е. для любых двух векторов х и у имеет место равенство UxUy = xy. Предложение 1. Линейный оператор U тогда и только тогда изометричен, когда он сохраняет длины векторов, т. е. \Ux\=\x\ для любого вектора х. Доказательство. Если оператор изометричен, то, в частности, (UxJ = x2 для любого вектора х, т. е. Заметим, что линейностью оператора U мы здесь не пользо- пользовались. Обратно, пусть оператор U сохраняет длины векторов. Тогда для любых векторов хну \Vx\ = \x\, \Uy\ = \y\, \V{x + y)\ = \x + yU Но в силу линейности " ' U(x + y) = Ux + Uy, и потому (U (x + у)J = (UxJ + 2Vx ¦ Uy + {Uyf. , С другой стороны, (U (x + у)J = (x + yf = x2 + 2xy + y2 = (UxJ + 2xy + (UyJ. Поэтому UxUy = xy, так что оператор U изометричен. Из этого предложения непосредственно вытекает, что любой изометричный оператор U обратим. Действительно, если C/*0 = 0, то | *0| = I Uxo\ — I 0 | = 0, и Детому х0 —О- f ' . .165
Далее, ясно, что для любого изометричного оператора U и любого ортонор- мированного базиса еи ..., еп векторы ¦составляют ортонормированный базис. Обратно, если для линейного оператора U и некоторого ортонормиро- ¦ванного базиса ех, ..., еп векторы е' =^Ue е' = Ue ех иех, . .., еп— иеп ¦составляют ортонормированный базис, то оператор U изо- изометричен. Действительно, для любого вектора вектор Ux выражается формулой Ux = xle[+ ... + хпе'п. Поскольку векторы е[, ..., е'п составляют ортонормированный базис, отсюда следует, что и, следовательно, оператор U изометричен. Оба последних утверждения мы можем объединить в- сле- следующем предложении: Предложение 2. Оператор U тогда и только тогда изомет- изометричен, когда он действует по равенству координат в двух орто- нормированных базисах. Как мы знаем, матрица оператора U является матрицей пе- перехода от базиса ev ..., еп к базису е\, ..., е'п. Но (см. п. 6 § 5) матрица тогда и только тогда является матрицей перехода от одного ортонормированного базиса к другому, когда она ортогональна. Следовательно, имеет место следующее Предложение 3. Линейный оператор тогда и только тогда изометричен, $огда в некотором (а потому и в любом) орто- нормированном базисе его матрица ортогональна. Ясно, что произведение двух изометричных операторов, а также оператор, обратный к изометричному оператору, яв- являются изометричными операторами. Это означает, что совокупность Iso(n) всех изометричных операторов является группой. Любой линейный изометричный оператор либо сохраняет ориентации, либо их обращает. Ясно, что совокупность Iso+(n) всех линейных изометричных опера- операторов, сохраняющих ориентации, является подгруппой (даже .нормальным делителем) группы Iso(ra), а совокупность 156 -
Iso-(n) всех линейных изометричных операторов, обращающих ориентации, является смежным классом группы Iso(n) no этой подгруппе. Выбор ортонормированного базиса устанавливает изомор- изоморфизм группы Iso(n) на группу О(п) всех ортогональных мат- матриц порядка п. Подгруппе Iso+(n) соответствует при этом изо- изоморфизме подгруппа О+(п) = SO(n) всех собственных ортого- ортогональных матриц. 8. Свойства изометричных операторов В этом пункте мы докажем несколько лемм об изометрич- изометричных операторах, которые нам понадобятся в гл. 7. Сначала мы рассмотрим изометричные операторы на пло- плоскости. Лемма 1. Для любого нетождественного сохраняющего ориентации изометричного оператора V на плоскости (т. е. в Vect B)) оператор Е — U обратим. Доказательство. Выбрав на плоскости ортонормирован- ный базис, рассмотрим матрицу оператора U. Как мы знаем, эта матрица является собственной ортогональной матрицей, и потому (см. п, 6 § 5) имеет вид /cos a —sina\ \sina cosa/ При этом а^О (поскольку по условию U фЕ). Следовательно, матрица оператора Е — U имеет вид /1 — cosa sin a \ V — sin a 1 — cosa/ и ее определитель A—cosaJ + sin2 a = 2A—cosa) отличен от нуля. Таким образом, матрица оператора Е — U невырож- невырождена и потому этот оператор обратим. Лемма 2. Для любого обращающего ориентации изометрич- изометричного оператора U на плоскости (в Vect B)) оператор E — U необратим. Доказательство. В произвольном ортонормированном базисе матрица оператора U, являясь несобственной ортого- ортогональной матрицей, имеет вид /cosa sin a' \sina —cos и потому матрица оператора E — U имеет вид 1 —cosa — sin a \ — sin a 1 + cosa/' 157
Поскольку 1 — cos a — sin а , , = 1 — cos2 а — sin2 а = О, — sin а 1 + cosa ' оператор Е—V необратим. Замечание 1. Тот факт, что оператор Е — U необратим, озна- означает (см. п. 4), что существует такой вектор е\ ФЪ, что т. е. такой, что Ясно, что этот вектор мы можем считать единичным (при («И^ 1 достаточно разделить его на |fii|). Дополнив этот вектор ортогональным единичным вектором «2 до базиса, мы получим ортонормированныи базис в\, е% в ко- котором первый столбец матрицы оператора U имеет вид 1 О Следовательно, в этом базисе а = 0, так что матрицей опера- оператора U является матрица 1 (Г ,0 -1 Тем самым мы доказали Следствие. Для любого обращающего ориентации изомет- ричного оператора U на плоскости существует ортонормирован- ортонормированныи базис, в котором матрица оператора U имеет вид 1 0 0 -1 Перейдем теперь к операторам в пространстве. Начнем с леммы, справедливой для любых (не обязательно изометрич- ных) операторов. Лемма 3. Для любого линейного оператора А в простран- пространстве (в Vect C)) существует отличный от нуля вектор х0, кол- линеарный вектору Axq, т. е. такой, что Axq == Ядс0, ¦ A) где Я — некоторое число (возможно, равное нулю). Доказательство. Вводя оператор КЕ умножения век- векторов на число К, мы можем соотношение A) переписать в сле- следующем «операторном» виде: (А — %Е) х0 = 0. B) 158
Существование вектора х0 ф 0, удовлетворяющего этому урав- уравнению, означает, что оператор А — ХЕ, необратим (см. п. 3), т. е. что его матрица (в некотором базисе еи е2, е3) вырождена. Но мы знаем, что матрицей этого оператора является матрица А — ХЕ, где ' а' а — матрица оператора А, а О — матрица оператора ХЕ. Поэтому векторное уравнение B) тогда и только тогда имеет нетривиальное (отличное от нуля) решение лг0, когда число X таково, что определитель \А—ХЕ\ матрицы А — ХЕ ра- равен нулю. Равенство |Л-Л?| = 0, т. е. равенство а\ — к а\ а. а„ — а\ = 0 является относительно К уравнением третьей степени с веще- вещественными коэффициентами и потому имеет хотя бы один ве- вещественный корень. Принимая в соотношении B) за А, этот корень, мы полу- получим, следовательно, уравнение, имеющее нетривиальное реше- решение. Это решение и является искомым вектором дсо- Следствие. Для любого изометричного линейного оператора U в VectC) существует такой отличный от нуля вектор х0, что UxQ = xQ или Ux0 — — х0. Доказательство. Достаточно заметить, что в силу изо- метричности оператора V векторы Uxq и х0 должны иметь одну и ту же длину, и потому число К в равенстве A) должно быть равно ±1. Оказывается, что для изометричных операторов справедлива даже следующая более сильная 159
Лемма 4. Для любого изометричного линейного оператора V в VectC) существует такой отличный от нуля вектор е, что если V сохраняет ориентации, Uе- если U обращает ориентации. Доказательство. Рассмотрим произвольную плоскость П, перпендикулярную вектору х0. Линеал VectnB) векторов, па- параллельных этой плоскости, состоит, таким образом, из всех векторов, ортогональных вектору х0, т. е. из векторов х е eVectC), удовлетворяющих соотношению дсдс0 = 0. Поскольку оператор U изометричен и Uxq — ±дсо, для любого такого вектора х будет иметь место равенство Ux ¦ х0 = ± Ux • Ux0 = ± хха = 0, показывающее, что если х е Vectn B), то Ux «= Vectn B). Это позволяет нам построить в VectnB) индуцированный оператор V, определяющийся формулой U'x = Ux, же Vectn B) (его отличие от оператора U состоит только в том, что он дей- действует в Vectn B), а не в VectC)). Ясно, что оператор U' также изометричен. Рассмотрим теперь произвольный ортонормированныи базис «1» «2. «3. последний вектор е3 которого коллинеарен вектору *0. Векторы ¦ еь е2 образуют ортонормированныи базис линеала VectnB) и в этом базисе оператор U' имеет некоторую матрицу V. Что же касается вектора е%, то в силу линейности оператора U он будет обладать тем же свойством, что и коллинеарный ему вектор х0, т. е. для него будет справедливо равенство Ue3 = Яе3, где 1= ±1. Отсюда непосредственно вытекает, что матрица U опера- оператора U в базисе еи e%, e3 имеет вид 160
Следовательно, \U\= \U'\-l, и потому (напомним, что Я = ±1 и, следовательно, Л~1==Л). Случай 1. |?/'|=1. В этом случае %=1, если оператор U сохраняет ориентации (|?/|=1), и к = —1, если оператор U обращает ориентации (|?/|=—1). Поэтому за вектор е мы можем принять вектор х0 (или любой вектор, ему коллинеар- ный, скажем, вектор е3). Случай 2. |L/'| = —1. В этом случае оператор V является линейным изометричным оператором на плоскости, обращаю- обращающим ориентации. Поэтому (см. выше следствие к лемме 2) & Vectn B) существует ортонормированный базис /i, /2, в кото- котором матрица этого оператора имеет вид 1 ,0 -1 т. е. такой, что tf7i = /i, Для завершения доказательства остается за вектор е при- принять вектор /i, если оператор U сохраняет ориентации, и век- вектор /г, если оператор U обращает ориентации. Тем самым лемма 4 полностью доказана. Если мы теперь рассмотрим ортонормированный базис «it e2, е3, последний вектор е3 которого коллинеарен вектору е, то, по ска- сказанному выше, матрица оператора U в этом базисе будет иметь вид V 0 0 0 1 если оператор U сохраняет ориентации, и вид U' если оператор U обращает ориентации, где U' — матрица неко- некоторого сохраняющего ориентации изометричного оператора в 6 М. М. Постников 161
cos a sin a 0 — sin a cos a 0 0 0 1 VectnB), т. e/ некоторая собственная ортогональная матрица f , I cos a — sin a \ \sina cosa/ Тем самым мы доказали Следствие, Для любого линейного изометричного оператора V в VectC) существует ортонормированныи базис, в котором матрица оператора имеет вид ¦ л < a ^ я, если- оператор сохраняет ориентации, и вид cosa —sin a 0 sin a cosa 0 0 a -I если оператор обращает ориентации. Из этого следствия непосредственно вытекает Лемма 5. Для любого сохраняющего ориентации изометрич- изометричного оператора U в пространстве оператор Е — U необратим. Доказательство. Согласно следствию существует ор- ортонормированныи базис, в котором матрица оператора U имеет вид cosa —sin a 0' cosa 0 0 1 Поэтому оператор Е — U будет иметь в этом базисе матрицу 1 — cosa sin a 0' — sin a 1 — cosa 0 0 0 0. и, следовательно, будет необратим. Обратим внимание на аналогию между леммами 5 и 2: отли- отличие состоит только в том, что лемма 2 относится к операторам, обращающим ориентации, а лемма 5 — к операторам, сохраняю- сохраняющим ориентации. Естественно ожидать, что в пространстве справедлива и лемма, аналогичная лемме 1 (и относящаяся, ко- конечно, к изометричным операторам., обращающим ориентации). Тем не менее оказывается, что такая лемма неверна: в прост- 162
ранстве существуют обращающие ориентации изометричные операторы U, для которых оператор Е — U необратим. Приме- Примером может служить оператор, имеющий в некотором ортонорми- ортонормированием базисе матрицу вида 1 0 0\ 0 10., C) ,0 0 -1/ Однако оказывается, что такого рода операторы являются един- единственными исключениями. Лемма 6. Для любого обращающего ориентации изометрич- ного оператора U в VectC), обладающего тем свойством, что ни в одном ортонормированном базисе его матрица не имеет вида C), оператор Е — U обратим. Доказательство. Согласно следствию к лемме 4 су- существует ортонормированный базис, в котором оператор U имеет матрицу 'coses —sines 0' и, следовательно, оператор Е — U — матрицу 1 —cos a sin а 0\ — sin а I — cos а 0 1. 0 0 2/ Поскольку 1 — cos а sin а 0 — sin а 1 — cos а О 0 0 2 = 4A —cos а) и поскольку, согласно условию, а ф_ 0, лемма 6 тем самым пол- полностью доказана.
Глава 2 МЕТОД КООРДИНАТ § 1. КООРДИНАТЫ НА ПРЯМОЙ, В ПЛОСКОСТИ И В ПРОСТРАНСТВЕ 1. Аффинные координаты Пусть на прямой, в плоскости или в пространстве задана не- некоторая точка О. Определение 1. Для любой точки А вектор ОА называется ее радиус-вектором (относительно точки О). Сама точка О на- называется при этом начальной (или нулевой) точкой. Ясно, что, сопоставив каждой точке ее радиус-вектор, мы лолучим биективное соответствие точка А I—»-ее радиус-вектор гА A) между множеством всех точек (прямой, плоскости или про- пространства) и множеством всех векторов (т. е. соответствующим линеалом Vect(n), где, как всегда, п = 1, 2 или 3). Подчеркнем, что соответствие A) зависит от выбора точ- точки О. Это соответствие обладает, очевидно, тем свойством, что произвольный вектор х = АВ является разностью радиус-век- радиус-вектора гв его конца В и радиуса-вектора гА его начала А: х = гв — гА. B) Действительно, ав = 6в~6а. Определение 2. Упорядоченная система п + 1 точек ±..Еп общего положения (л=1, 2, 3) называется аффинным координатным репером (на прямой, на плоскости или в про- пространстве) . Таким образом, на прямой репером является пара О?4 различных точек, на плоскости — тройка OEiE2 неколлинеарных точек, в пространстве — четверка OEiE2E3 некомпланарных точек. Замечание об обозначениях. Реперы принято записывать, не разделяя точки никакими знаками препинания (и без скобок). 164
Так, например, хотя стандартным обозначением упорядоченной тройки точек является запись вида (О, Е\, Е2), но когда мы эту тройку рассматриваем как репер, она обозначается символом OEiE2. Заметим, что тем же символом OEtE2 мы обозначаем плос- плоскость, проходящую через точки О, Ei и Е2- Эта двусмысленность обозначений ни к каким недоразумениям, как правило, не при- приводит. Каждый репер OEi... Еп однозначно определяет некоторый базис линеала Vect (n), а именно, базис, состоящий из векторов е, = О?„ ..., еп=О%. C) Обратно, задание точки О и произвольного базиса ей ¦¦., е„ линеала Vect (л) однозначно определяет некоторый репер (а именно, репер OEi... Еп, связанный с векторами eit ..., е„ формулами C)). На этом основании аффинными координатными реперами называются также системы вида Ое4. .. е„, состоящие из неко- некоторой точки О и базиса еь .. ., еп линеала Vect (n). Понимаемые в этом смысле реперы имеют на прямой вид Оеи на плоскости — вид Ое^ и в пространстве — вид О Пусть нам задан произвольный репер Oet:.. еп. Тогда ра- радиус-вектор ОА каждой точки А мы можем разложить по ба- базису еи ..., еп: О~2 = *'«,+ •¦• +*Ч. D) Определение 3. Определяемые формулой D) числа Xх, ..., хп называются (аффинными) координатами точки А в репере Оех ... еп. Для любого вектора х его координатами в репере Ое, ... еп называются его координаты в базисе еи ..., еп. Согласно формуле B) координаты х\ ..., х" вектора х = АВ выражаются через координаты его концов по формулам у\ yl у\ Yn ytt Vtl (K\ Л Лд Лр . . . , Л Ag Л| , \О) где х\, ..., х^ — координаты точки А, а х\, ..., х% — коорди- координаты точки В. Строчка (х1,...,хп) координат произвольной точки пред- представляет собой элемент множества Rn, состоящего из л-член- ных последовательностей вещественных чисел. Таким образом, задание репера Ое\ ... еп определяет некоторое (очевидно, биективное) отображение «точка» ^—» «строчка ее координат» F) прямой, плоскости или пространства на множество R" (с со- соответствующим п = 1, 2, 3) i 165
Определение 4. Биективное отображение F) называется аффинной координатной системой, определенной репером Ое\ ... е„. Эту систему принято обозначать символом yJXi . .. хп. На прямой имеется только одна координата х1, на плос- плоскости — две координаты х1, х2 и в пространстве — три коорди- координаты х1, х2, х3. Координата х1 обычно обозначается (во всех трех случаях) символом х и называется абсциссой точки А. Анало- Аналогично, координата х2 обозначается символом у и называется ор- ординатой, а координата х3 — символом z и называется аппли- аппликатой. Когда координатная система фиксирована, точку А с коор- координатами х1, . .., хп бывает удобно обозначать символом А (х1, ..., хп) (на прямой — символом А(х), на плоскости — А (х, у), в пространстве — А(х, у, z)). Прямая, на которой задана аффинная координатная сис- система Ох, часто обозначается тем же символом Ох. Аналогично, символ Оху может обозначать как аффинную координатную систему на плоскости, так и саму эту плоскость, а символ Oxyz — как аффинную координатную систему в пространстве, так и само это пространство (с заданной в нем аффинной коор- координатной системой). Обратим внимание на то, что прямая, плоскость или пространство, для которых задана аффинная координатная система, автоматически ориентиро- ориентированы. Именно, ориентация в них задается базисом еи ..., еп. В частности, мы видим, что прямая, на которой задана аф- аффинная координатная система, является осью. Определение 5. Две аффинные координатные системы назы- называются одноименными, если одноименны (в смысле определе- определения 4 п. 1 § 4 гл. 1) их реперы ОЕ\ ... Еп и О'Еу ... Еп или (что равносильно) если одноименны базисы е,, ..., е и еу, .... еп,. Ясно, что отношение одноименности аффинных координатных систем является отношением эквивалентности, и соответствующие клас- классы эквивалентности естественным образом отождествляются с ориентациями (прямой, плоскости или пространства). Определение 6. Начальная точка О аффинной координат- координатной системы Ох на прямой разбивает эту прямую на две полу- полупрямые, называемые полуосями. Точки одной полуоси характе- характеризуются условием х > 0 (и эта полуось называется положи- положительной) , а точки другой полуоси — условием х < 0 (и эта по- полуось называется отрицательной). Сама точка О характери- характеризуется равенством х = 0. 166
Пусть на плоскости задана аффинная координатная систе- система Оху с репером ей е2. Точка О и вектор е^ составляют, оче- очевидно, координатный репер Ое4 прямой, проходящей через точ- точку О параллельно вектору ci. Эта прямая, снабженная соответ- соответствующей ориентацией, называется первой координатной осью или осью абсцисс рассматриваемой аффинной координатной системы. Аналогично определяется вторая координатная ось (или ось ординат) с координатным репером Ое2. Координата х является координатой на оси абсцисс в ре- репере Оеи а координата у— координатой на оси ординат в ре- репере Ое2. Поэтому, в соответствии с введенными выше обозна- обозначениями, ось абсцисс обычно обозначается символом Ох, а ось ординат — символом Оу. Ось абсцисс разбивает плоскость на две полуплоскости. Точ- Точки одной полуплоскости характеризуются условием у > 0, а другой — условием у < 0. Принято полуплоскость у > 0 назы- называть верхней полуплоскостью, а полуплоскость у < 0 — нижней полуплоскостью. Для точек оси абсцисс у = 0. Аналогично, ось ординат разбивает плоскость на правую по- полуплоскость, для которой х > 0, и левую полуплоскость, для которой х < 0. Для точек самой оси ординат х = 0. Координатные оси вместе разбивают плоскость на четыре части, называемые квадрантами. Точки одного квадранта, назы- называемого первым, характеризуются условиями х > 0, у > 0, точ- точки следующего квадранта, называемого вторым, — условиями» х < 0, у > 0, точки третьего квадранта-—условиями jc < 0, у <. 0 и, наконец, точки четвертого квадранта— условиями х > 0, у < 0: N. КООрД. квадр. \. I II III IV X + — — + У + + — — Аналогично, в пространстве определяются (по отношению к заданной аффинной координатной системе Oxyz с репером Ое^вз) ось абсцисс Ох с репером Oeit ось ординат Оу с репе- репером Ое2 и ось аппликат (или третья координатная ось) Oz с ре- репером Ое3. Координата х является координатой на оси Ох в репере Оеи координата у — координатой на оси Оу в репере Ое2, а коорди- координата z — координатой на оси Oz в репере Ое3. 167
Плоскости, проходящие через пары координатных осей, на- называются координатными плоскостями. Всего имеются три ко- координатные плоскости Оху, Oxz и Oyz. Репер Oeie2 является координатным репером на плоскости Оху, репер Ое&3 — коорди- координатным репером на плоскости Oxz и репер Ое2е3 — координат- координатным репером на плоскости Oyz. Плоскость Оху разбивает пространство на два полупрост- полупространства. Точки одного полупространства характеризуются ус- условием z >¦ 0, а точки другого — условием z < 0. Точки самой плоскости Оху характеризуются условием z = 0. . Аналогично, плоскость Oxz разбивает пространство на два полупространства у > 0 и j < 0, а плоскость Oyz — на полу- полупространства х > 0 и х <. 0. Для точек первой плоскости у = 0, а для точек второй плоскости х = 0. Координатные плоскости вместе разбивают пространство на восемь частей, называемых октантами. Две точки тогда и только тогда принадлежат одному октанту, когда все три их координаты имеют одинаковые знаки. Октанты нумеруются в соответствии со следующим распределением знаков координат: N. КООрД. окт. \^ I II III IV V. VI VII VIII X + — — + + — —' + V + + — — + + — г + + + + — — — Замечание 1. Обратим внимание на то, что, например, коор- координата х является координатой не только на оси Ох, но и на любой прямой, параллельной этой оси. Соответствующий репер имеет вид О'еи где О' — точка пересечения этой прямой с осью Оу (на плоскости) или с плоскостью Oyz (в пространстве). Более того, легко видеть, что координата х является коор- координатой и на любой прямой, не параллельной оси Оу (или плос- плоскости Oyz). Соответствующий репер имеет вид О'е\, где е\ — проекция вектора в\ на рассматриваемую прямую параллельно оси Оу (плоскости Oyz). Аналогичные утверждения справедливы, конечно, и для ко- координат у и z. В пространстве, скажем, координаты х, у являются коорди- координатами на любой плоскости, параллельной координатной плос- 168
кости Оху, и вообще на любой плоскости, не параллельной оси Oz. Введем еще одно полезное определение: Определение 7. Точка Е координатного репера ОЕ на пря- прямой называется его единичной точкой (она имеет координату х— 1). В соответствии с этим точки Еи Е2 (и Е3) координат- координатного репера OEiE2 (репера OEiE2E3) на плоскости (в простран- пространстве) называются единичными точками его координатных осей. Таким образом, Et — единичная точка оси абсцисс, ?г — единичная точка оси ординат, Е3 — единичная точка оси аппликат. Точка О называется (на прямой, в плоскости и в простран- пространстве) нулевой (или начальной) точкой координатного репера (ср. определение 1). 2. Замена аффинных координат Пусть Ое1 ... еп и О'е,, ... еп, — два координатных репера {п—\, 2, 3) и пусть Xх, ..., х11 — координаты относительно ре- репера Ое{ ... еп, а х1', ..., я"'—координаты относительно репера О'ех,...еп,. В этом пункте мы найдем формулы, выражающие коорди- координаты х1' хп' через координаты х\ ..., х4. Сначала мы рассмотрим частный случай, когда О' = О, т. е. когда рассматриваемые реперы имеют одну и ту же начальную точку и отличаются только векторными базисами. В этом случае каждая точка А имеет в обоих реперах один и тот же радиус-вектор О А и потому ее координаты х1, ..., хп и xv, ..., хп' являются не чем иным, как координатами од- одного и того же вектора х = ОА в двух различных базисах. Поэтому (см. п. 7 § 3 гл. 1) эти координаты связаны соотноше- соотношениями вида х*' = с<1'хх+ ... +спп'хп или в матричной записи хг = Сх, где С =(cf)—матрица перехода от «нового» базиса ev, ..., еп, к «старому» базису еи ..., еп, а х' и х — одностолбцовые ма- матрицы, составленные из координат х1', .... хп' и х\ ..., хп соответственно. (Заметим, что в п. 7 § 3 гл. 1 символом С обозначалась не эта, а обратная матрица.) , 169
Пусть теперь, наоборот, реперы Ое1 ... еп и O'ev ... еп, отличаются лишь точками О и О'(так что в,, = в,, ..., еп, = е). Тогда для любой точки А и потому ее координаты х\ ..., хп в репере Ое1 ... еп связаны с ее координатами х1' хп> в репере О'ех ... еп соотно- соотношениями хп' — х11 -f- an, где а1, ..., а™ — координаты «старого» начала О в «новом» координатном репере O'ei.. .еп. В матричной форме эти соот- соотношения имеют вид лг' — х + а, где а — одностолбцовая матрица а = В общем случае переход от репера Оех ... еп к реперу O'ev . .. еп, может быть осуществлен в два этапа: сначала мы меняем базис, т. е. переходим от репера Ое{ ... еп к реперу Ое,, ... еп,, а затем меняем точку О, т. е. переходим от ре- репера Ое{, ... еп, к реперу О'еу ... еп,. Ясно, что соответствую- соответствующие формулы перехода являются комбинациями полученных выше формул перехода и имеют вид A) хп'=с1'х1+ ... + с^хп + ап', или в матричной записи — х' = Сх+а, (Г) где С = (с{')—матрица перехода от базиса е,„ ••-,еп, к базису еь ..., еп, а а = (а1') — одностолбцовая матрица, составленная из координат «старого» начала О в «новом» репере O'ev ... еп,. На языке алгебры это означает, что переход от одной аффинной координатной системы к дру- другой выражается неоднородным линейным преобразованием ко~ ординат* 170
Замечание 1. Для конкретных значений п формулы A) обычно пишутся в более наглядных обозначениях. Например, при п == 2 (случай плоскости) можно писать у' = а2х + Ъ2у + с2 (здесь, естественно, х, у —• координаты в «старом» репере, а х'\ у' — в «новом»). Определение 1. Прямоугольную матрицу (С, а), получаю- получающуюся приписыванием к матрице С столбца а, мы будем назы- называть матрицей перехода от аффинной координатной системы с репером Oei... е„ к аффинной координатной системе с репером O'ev ... еп,. Ясно, что прямоугольная матрица (размера пХ(п+ 1)) тогда и толь- только'тогда является матрицей перехода от одной аффинной ко- координатной системы к другой, когда квадратная матрица, полу- получающаяся вычеркиванием ее последнего столбца, невырождена. Пусть нам даны три системы аффинных координат (О х\ .... х\ (ii) xv, ..., х"', (ш) х1", .... ха" и пусть / = Сх + а, х" = С V + а' — формулы перехода от первой системы ко второй и от второй к третьей. Тогда х" = с' (Сх + а) + а' = С'Сх + (С а + а'). Тем самым доказано следующее Предложение 1. Если переход от координатной системы (i) к координатной системе (п) описывается матрицей (С, а), а пе- переход от координатной системы (п) к координатной системе (ш)описывается матрицей (С,а'), то переход от координатной системы (j)k координатной системе (ш) описывается матрицей (СС, С'а + а'). В частности, отсюда вытекает Следствие. Если переход от координатной системы х1, ..., хп к координатной системе х1', ..., хп' описывается матрицей (С, а), то обратный переход от координатной системы х1', ..., хп' к координатной системе х1, ...> хп описывается матрицей (С~\ -С-1а). Действительно, пусть (С, аг) — матрица, описывающая пе- переход от координатной системы х1', ..., хп' к координатной 171
системе xi хп. Тогда согласно предложению 1 переход от системы х1, ..., хп к самой себе будет описываться матрицей (С'С, С'а-\- а'). Но, с другой стороны, этот переход описывает- описывается матрицей (Е, 0). Следовательно, С С = Е, С а + а' = 0. Поэтому С' = С~\ а =-С'а=-С-1а. 3. Деление отрезка в данном отношении Используя координатные системы, мы можем задавать точ- точки числами и любое геометрическое построение свести к вычис- вычислению над этими числами. Рассмотрим, например, так называемую задачу о деле- делении отрезка в данном отношении. Пусть АОАХ — произвольный отрезок прямой а. В элемен- элементарной геометрии говорят, что точка А отрезка АОАХ делит его в отношении k, если отношение длин отрезков А0А и ААХ равно к. Таким образом, 0 < k < оо. Заметим, что фактически отрезок АйАх считается здесь направленным (ибо при перестановке точек Ао и Ах отноше- отношение k перейдет в отношение l/k). Таким образом, речь здесь на самом деле идет, о делении в данном отношении напра- направленного отрезка А0А1 (предполагаемого невырожденным). С другой стороны, поскольку векторы А0А и ААХ одно- именны (для точек А отрезка АОАХ), отношение их длин k сов- совпадает с их отношением AoA:AAi. Поскольку это отношение оп- определено для любой точки А прямой а (отличной от точки Ai), оказывается удобным ввести следующее общее Определение 1. Говорят, что точка А'Ф А4 прямой а делит невырожденный направленный отрезок АОАХ в отношении к, если A^A\A~Ax = k. A) При этом по-прежнему для точек А отрезка АОАХ имеет место соотношение 0 < k < оо. В то же время соотношение k < 0 характеризует точки А, лежащие вне отрезка АйА\, для точек Л, предшествующих точке Ло (в ориентации, в которой Лб < Л,), имеют место неравенства — 1 < k < 0, а для точек Л, следую- следующих за точкой Аь — неравенства — оо < k < — 1. При приближении точки Л к точке Ах по отрезку АйАх (т. е. так, что все время Л <^ Ах) отношение k стремится к -+¦ оо, а при приближении точки Л к точке Ах с другой стороны отношение k стремится к — оо. Можно поэтому условно гово- 172
рить, что точка Ах делит отрезок АаАх в отношении оо (без знака!). При А — Ао отношение k равно нулю. Поставим задачу о вычислении аффинных координат точки А по известным координатам точек Ло и Ах (и числу k). Пусть О — начальная точка координатного репера. Тогда АИ = ОА — ОАа, ААх = ОЛ, — ОА, т. е. где r = OA, r0 = OAQ, r, = О~Л,. Поэтому соотношение A), определяющее точку А, мы можем записать в следующем виде: (г - г0): (г, — r) = k. Отсюда Переходя от векторов к их координатам и считая, что А — А(х, у, z), Ао= А0(х0, у о, 2о)> 4i = А(*ь Уь ^i). мы полу- получаем (для случая пространства) следующие окончательные формулы, дающие решение нашей задачи: Х~~ l+k ' ^~ 1+* ' Z~ l+k ' W В случае плоскости следует сохранить лишь две первые формулы B), а для случая прямой — только первую. По определению, для середины отрезка AaAi мы имеем k = 1. Поэтому середина отрезка с концами Ао (х0, г/о, г0) ы <4i(jct, уи ^i> имеет координаты Z ——g—. На плоскости сохраняются лишь две первые формулы, а на прямой — только первая. 4. Прямоугольные координаты Определение 1. Аффинный координатный репер Об] ... еп, называется евклидовым, если базис ортонормирован. Аффинная координатная система, определен- определенная прямоугольным редером, называется евклидовой коорди- 17»
натной системой, а соответствующие координаты х1, ..., хп — евклидовыми. При п > 1 евклидов репер обычно называется прямоуголь- прямоугольным репером, евклидовы координаты — прямоугольными коор^ динатами, а евклидовы координатные системы — системами прямоугольных координат. Евклидовы координаты должны быть известны читателю (по крайней мере на прямой и плоскости) из школьного курса. Поэтому мы на них подробно останавливаться не будем и огра- ограничимся некоторыми замечаниями принципиального характера. Поскольку евклидовы координаты являются частным слу- случаем аффинных, все сказанное выше (в п. 1—3) автоматически применимо и к евклидовым координатам. Следует только отме- отметить, что если, скажем, в пространстве заданы евклидовы коор- координаты х, у, z, то, например, координаты х, у также будут ев- евклидовыми координатами лишь на плоскостях, параллельных координатной плоскости Оху (на любой другой плоскости, не перпендикулярной оси Oz, они будут лишь аффинными координатами). Переход от одной евклидовой координатной системы к дру- другой описывается формулами вида х' = Сх-\- а, где С — произвольная ортогональная матрица. Эта матри- матрица тогда и только тогда является собственной ортогональной матрицей, когда рассматриваемые координатные системы одно- именны. При п = 1 (случай прямой) одноименные евклидовы коор- координатные системы могут отличаться лишь выбором точки О, так что переход от одной такой системы к другой описывается формулой х'—.х-\-а. При п = 2 (случай плоскости) переход от евклидовой ко- координатной системы х, у к одноименной евклидовой системе х', у' описывается формулами xf = х cos a — у sin а -\- х0, у' = х sin а + у cos а -f yQ, где а — угол от оси Ох к оси Ох'. Прямоугольные • координатные системы особенно удобны для решения метрических .задач. Например, в любой такой сис- системе расстояние d (в пространстве) между точками Ai{xi, yi, Zi) и А2(х2, у2, z2) выражается формулой d = У(ь - ХХУ + (У2 - y,f + B2 - 174
Действительно, как мы знаем, эта формула дает длину вектора А\Аг, равную, по определению, расстоянию между точками А% и Л2. На плоскости соответствующая формула имеет вид а на прямой — вид В произвольных аффинных координатах формулы для расстояния имеют существенно более сложный вид. Например, на плоскости d = VSn (*2 — *iJ + 2g-12 {x2 — xt) (г/2 — Hi) + ?22 (г/г — У\J (ср. формулы для длины вектора в п. 4 § 5 гл. 1). 5. Полярные, сферические и цилиндрические координаты В ряде задач евклидовой геометрии (характеризующихся «круговой» или «сферической» симметрией) удобно вместо пря- прямоугольных координат использовать так называемые «полярные координаты». Определение 1. Пусть на плоскости заданы а) некоторая ориентация, б) некоторая точка О, в) некоторая ориентированная прямая а, проходящая че- через точку О. Тогда любой вектор г однозначно характеризуется его длиной г и (ориентированным) углом ф от прямой а до вектора г. Числа г и ф, построенные для радиус-вектора г = ОА произ- произвольной точки А плоскости, называются полярными координа- координатами точки А (координата г — полярным радиусом, а коорди- координата ф — полярным углом). Точка О называется полюсом сис- системы полярных координат, а прямая а — ее полярной ось/о. Подчеркнем, что для задания полярных координат нужно, кроме полюса О и полярной оси а, задать также ориентацию плоскости. Полярные координаты однозначно определены для любой точки А Ф 0. Для точки О, по определению, считается, что по- полярный радиус г равен нулю. Полярного угла ф точка О, по оп- определению, не имеет (впрочем, иногда удобно считать, что этот угол существует, но может принимать любое значение). Таким образом, 0<г< оо и — я < ф^я (впрочем, часто удобно считать полярный угол ф принимаю- принимающим любые вещественные значения, но определенным только с точностью до слагаемых, кратных 2п): • 175
Систему прямоугольных координат х, у и систему полярных 'координат г, ф мы будем называть согласованными, если коор- координатная система Оху определяет данную ориентацию плос- плоскости, точки О для обеих систем совпадают и полярная ось совпадает с осью абсцисс Ох. Ясно, что согласованные системы Друг друга однозначно определяют. При этом COS ф = Г , 5Шф= , V2 + 2 V и обратно, X = Г COS ф, У = Г ЭШф. Это и есть формулы перехода от прямоугольных коорди- координат к полярным и обратно. Чтобы перейти от полярной системы координат к несогласо- несогласованной с ней прямоугольной (или произвольной аффинной) координатной системе, следует сначала перейти к согласован- согласованной прямоугольной системе, а затем воспользоваться форму- формулами перехода от одной прямоугольной системы к другой такой системе. В пространстве аналогом полярных координат являются так называемые «сферические координаты». Определение 2. Пусть в пространстве задана а) некоторая ориентация, б) некоторая ориентированная плоскость П, в) на плоскости П — некоторая система полярных коорди- координат (т. е. полюс О и полярная ось а). Сферическими координатами произвольной точки А называются 1) ее полярный радиус г, т. е. длина радиус-вектора О А (расстояние точки А от 1очки О); всегда г^О и г = 0 только при А = 0; 2) ее долгота ф, т. е. полярный угол ортогональной проекции Ао точки А на плоскость П относительно заданной в этой плос- плоскости системы полярных координат; по определению, —я < < Ф sg: я; 3) ее широта г|з, т. е. угол между вектором ОА и его проек- проекцией ОЛ0 на плоскость П, считаемый положительным, 0 < <1|э<^-5-, если вектор ОА направлен в положительное полу- полупространство (т. е. если произведение данной ориентации плос- плоскости П и определяемой этим вектором ориентации прямой ОА совпадает с данной ориентацией пространства), и отрицатель- отрицательным, —5" ^ i]) <• 0, — в противном случае (здесь, конечно, 176 /
предполагается, что точка А не принадлежит плоскости П; если же это условие не выполнено, то угол ip равен нулю и разговор о его знаке смысла не имеет). Таким образом, —^-^al)^-^-. Сферические координаты однозначно определены для всех точек, не принадлежащих прямой Oz, проходящей через точку О перпендикулярно плоскости П. Для точек же этой прямой ко- координата ф смысла не имеет. Система сферических координат определяет согласованную с ней систему прямоугольных координат х, у, z, для которой плоскость Оху совпадает с плоскостью П, прямоугольные коор- координаты х, у на этой плоскости согласованы с имеющимися на ней полярными координатами, и которая определяет данную ориентацию пространства. Легко видеть, что эти координаты х, у, z выражаются через координаты г, ср, а|з по формулам x = r coscpcos\|), y = r sin ф cos г|з, z = r sin гM. Очевидно, что эти формулы позволяют и, обратно, выразить координаты г, <р, \р через координаты х, у, z. Со сферическими координатами тесно связаны цилиндриче- цилиндрические координаты р, ф, г, где ф и z имеют прежний смысл, а р представляет собой полярный радиус проекции Ао точки А на плоскость П. С координатами х, у, z цилиндрические координа- координаты связаны формулами х *= р cos ф, # = psin<p, z = z, а со сферическими координатами — формулами Ф = ф. ip = arctg -|. 6. Однородные координаты Отношение k, в котором точка А прямой а, = A0Ai делит от- отрезок AqAi (см. п. 3), однозначно определяет эту точку. Поэтому б й р ( ) р у у у его можно рассматривать как своеобразную координату этой точки. Эта координата называется барицентрической координа- координатой точки А. Это название объясняется тем, что, как показывается в механике, центром тяжести («барицентром») двух масс т0 и ти помещенных в точках До и Аь является точка А, делящая отрезок AoAi в отношении k = Ш\1та. 177
Если на прямой а введена аффинная координатная система Ох, то, как было показано в п. 3, х l + k • Это есть формула перехода от барицентрической коор- координаты к аффинной координате х. Подчеркнем, что в точке Л( барицентрическая координата k не имеет определенного числового значения (в этой точке k = оо; см. п. 3). Вместе с тем значению k = —1 не отвечает никакая точка прямой. Чтобы избежать значения k = оо барицентрической коорди- координаты, удобно ввести следующее. Определение 1. Числа Хо, Хи связанные с барицентрической координатой k соотношением k — Х\/Хо, называются однород- однородными барицентрическими координатами на прямой а. Координаты Хо, Xi определены только с точностью до про- пропорциональности. Другими словами, вместе с числами Хо, Xi однородными координатами той же точки будут и любые числа вида рХо, р^ь где р — произвольное отличное от нуля число. Чтобы подчеркнуть последнее обстоятельство, тот факт, что числа Xq, Ху являются однородными барицентрическими ко- координатами точки А, обычно записывается формулой А (Хо: Х^. Так, например, ЛоA : 0). Однородными барицентрическими координатами точки Аи по определению, считаются числа 0, 1 (и любые числа, им пропор- пропорциональные). Таким образом, Ai@: 1). Для точки В, являющейся серединой отрезка А0А, мы имеем ) Заметим, что обе координаты Хо, Xi нулю одновременно ни- никогда не равны. Кроме того, на прямой нет точки с координа- координатами (—1 : 1) (поскольку нет точки с k = —1). С аффинной координатой х однородные барицентрические координаты связаны, очевидно, формулой ** хаХй + XiX, Х Для общего описания возникшей ситуации удобно ввести Определение 2. Рассмотрим (для некоторого я > 0) множество Rn+l\{@ 0)} всех п + 1-членных последовательностей (Хо, Xit ..., Хп) t вещественных чисел, отличных от нулевой последовательности @, 0 ... 0). Два элемента (Яо, Xt Хп) и (Yo, Yi Yn) этого множества назы- 178
ваются р, что В этом или да; пропорциональными, если случае мы будем писать Уа : Хо = Y •ке Хо существует ,:*,*» ... К, такое ., У„ = у . Yn Хп ' (отличное от п нуля) число О) B) Если все числа Хо, ..., Х„ отличны от нуля, то формулы B) являются обычными равенствами между числами. Однако, если среди чисел Хо, ..., -^п имеются равные нулю, то эти формулы уже не являются равенствами между числами и представляют собой лишь условную запись соотношений A). Заметим, что если в формулах B) некоторый «знаменатель» X, равен нулю, то обязательно равен нулю и соответствующий «числитель» У*. Об- Обратно, если Yi = 0, то Хг = 0. Ясно, что отношение пропорциональности является на множестве Rra+I\{@, ..., 0)} отношением эквивалентности, так что это множество разбивается на классы пропорциональных последовательностей. Класс, со- содержащий последовательность (Хо, Xt Хп), мы будем обозначать сим- символом (Хо : Xt: ... : Хп), а множество всех таких классов (т. е. фактормножество множества Krt+1 \{@, ..., 0)} по отношению пропорциональности) — символом RP". Нас будут интересовать в основном множества RP1, RP2 и RP3. По причинам, которые будут ясны в дальнейшем, множество RP1 называется стандартной (или арифметической) проективной прямой, множество RP2 — стандартной (арифметической) проективной плоскостью, а множество RP3 — стандартным (арифметическим) проективным пространством. Множества RP" устроены очень интересным и поучительным образом. Мы лишены здесь возможности исследовать их сколько-нибудь подробно. Скажем лишь несколько слов о множестве RP1 классов (Х0:Х,) пропор- пропорциональных пар чисел. Все пары вида @, Х^, Х1 =? 0, очевидно, пропорциональны (скажем, паре @, 1)), т. е. определяют один элемент @:1) множества RP1. Анало- Аналогично, (Х0:0) = A :0). у Любой паре (Хо. Xi) с Хо ф 0 мы можем сопоставить число х = —~. ла Ясно, что это число зависит только от класса (Хо: Xt) пары (Хо, Xt), так X что соответствие (X0:Xi)\—>-г~ корректно определено. Оно является биек- л0 тивным соответствием между множеством RP'\{@:l)} всех элементов множества RP1, отличных от элемента @:1), и множеством R всех веще- 1 X ственных чисел. Отождествив элемент {Х0:Х\) с числом -^т~, мы можем, таким образом, считать, что множество RP1 получено из множества R присоединением еще одного элемента @:1) (играющего роль «бесконеч- «бесконечности»), \ 179
у Впрочем, элемент (Хо: Xi) можно отождествить и с числом -т^- (если, конечно, Xi Ф 0). Тогда RP1 будет получаться из R присоединением эле- элемента A : 0). Вообще, удалив из RP1 произвольный элемент (Ао : Аг), мы можем множество всех остальных элементов отождествить с множеством R, сопоставив элементу (Хй:Х{) число А0Х1 - А,Х0 • Таким образом, все элементы множества RP1 по. существу совершенно равноправны. Наглядно множество RP1 можно представлять себе в виде замкнутой линии (наподобие окружности), получающейся из прямой линии ее «замыка- «замыканием в бесконечности». Возвращаясь к барицентрическим координатам, мы теперь можем сказать, что соответствие «точка» i—> «ее однородные барицентрические координаты» определяет биективное отображение прямой а на множество RP1, из которого удален элемент (—1 : 1). Тот факт, что элемент (—1 : 1) играет исключительную риль, весьма затрудняет использование барицентрических координат, вынуждая к многочисленным оговоркам. Чтобы избежать этих оговорок, целесообразно «расширить» прямую, присоединив к ней некоторую фиктивную «несобственную точку» с барицентри- барицентрическими координатами (—1 : 1) (эту точку следует мыслить рас- расположенной на прямой «в бесконечности», причем следует счи- считать, что мы получаем одну и ту же несобственную точку при удалении по прямой как в одном, так и в другом направлении). К вопросу о несобственной точке возможны три различных подхода, которые мы рассмотрим по степени их «решительности». 1°. Можно считать, что введение несобственной точки носит чисто «линг- «лингвистический» характер, способствуя лишь упрощению и облегчению форму- формулировок. При этом, если при решении какой-нибудь задачи возникла в каче- качестве ответа несобственная точка (например, при вычислении в барицентриче- барицентрических координатах получились координаты (—1 : 1)), то это попросту озна- означает, что задача решения не имеет. 2°. Более решительная точка зрения состоит в том, что мы считаем не- несобственные точки столь же «законными», как и обыкновенные (собствен- (собственные) точки. Конечно, это будет уже означать изменение предмета исследо- исследования: вместо обыкновенной прямой мы будем фактически изучать новый геометрический объект — расширенную прямую, существенно отличающийся по своим свойствам от привычной прямой. (Например, расширенная пря- прямая, в отличие от обычной прямой, является замкнутой линией.) Другими словами, мы будем иметь дело уже с совсем другой «геометрией». 180 . ¦
3°. Наконец, самая радикальная точка зрения состоит в том, что несоб- несобственная точка не только добавляется к обыкновенным точкам, но она счи- считается совершенно равноправной с обыкновенными' точками, так что сам термин «несобственная точка» теряет смысл. В этом случае расширенная прямая называется проективной прямой, а ее геометрия — проективной гео- геометрией. В дальнейшем мы еще раз будем возвращаться к затронутым здесь идеям и разовьем их более полно и систематично. Наиболее общим образом «однородные» координаты (Хо: Xt) на прямой вводятся формулами вида ° 1а°л + С> C) где х — некоторая аффинная координата на прямой; а0, b0, ait bi — такие числа, что aQ Ъ ах b (это условие необходимо, чтобы по координатам Хо, Xi можно было обратно найти координату х); р — произвольный отлич- отличный от нуля множитель пропорциональности (мы его пишем, чтобы подчеркнуть однородный характер координат Хо, Хи т. е. тот факт, что они определены только с точностью до пропор- пропорциональности). Определение 3. Координаты Хо, Хи связанные с аффинной координатой х формулами C), называются (общими) однород- однородными проективными координатами на прямой. Аффинная координата х выражается, очевидно, через коор- координаты (Хо: Xi) по формуле В частности, мы видим, что в координатах C) несобствен- несобственная точка имеет координаты (а0: а4) (т. е. что координатам а0: ai не отвечает никакая собственная точка прямой). Однородные барицентрические координаты являются част- частным случаем проективных координат, получающимся при О] = 1, Ъх = — х0. Другой важный частный случай проективных координат по- получается при с0 = 0, Ьо = 1, а, = 1. &, = 1. 181.
Эти координаты называются, однородными аффинными коорди- матами. Они связаны с обыкновенной (неоднородной) аффин- лой координатой х формулой х = В этих координатах несобственная точка имеет координаты @:1). Все сказанное выше непосредственно обобщается на случай плоскости и пространства. Мы рассмотрим только случай плоскости, предоставляя слу- случай пространства инициативе читателя. Пусть х, у— аффинные координаты на плоскости. По про- произвольной невырожденной матрице «составим числа 0 = аох + Ьоу + с0, D) рХ2 — а2х + Ь2у + с2, :где р — произвольный множитель пропорциональности. Определение 4. Числа Хо, Xi, X2, определенные (с точностью до пропорциональности) формулами D), называются (общими) однородными проективными координатами на плоскости. Аффинные координаты х, у выражаются через проективные координаты (Хо: Xi: X2) по формулам -где Po=- J82 а2А'2 УоХо b\ b<< — a a C\ c2 * I «I Ci a2 c2 2 Ь2 - P,= a. * bo b2 > c2 a0 a2 Co c2 • bo b2 ' °2. P2 = _ be ¦bi — a a co a. ) b0 i 6i 1 Co Cl E)
Задание. Докажите формулы E). Указание: запишите эти формульп в следующем виде: Ло Оо Cq CCq Xq С а} Xi с х = ха х2 ао а\ аг Ьо 61 62 bB bi b2 Co C\ сг Xo x, X2 0,2 Х2 a0 bo Xo ax bx Xx a2 62 X2 Однородные проективные координаты D) осуществляют би- биективное отображение плоскости на множество RP2, из кото- которого удалены все элементы (Хо: Xi: X2), для которых Yo^o -т- Yi^i + Y2^2 = О (этим элементам соответствуют «несобственные точки» плос- плоскости). Определение 5. Пусть А0(х0, г/0), А1(хи г/;), А2(х2, у2) — неколлинеарная тройка точек плоскости. Числа XQ, Xlt X2,. связанные с аффинными координатами х, у формулами X =• о ~г называются однородными барицентрическими координатами на< плоскости. Они являются частным случаем однородных проек- проективных координат. Для них Механический смысл барицентрических координат (объясняющий их на- название) состоит в следующем: точка А с координатами Xo: ^i: Хг является центром тяжести трех масс Хо, Xi: Хг, помещенных соответственно в точках Ао, Ai, Л2. Несобственные точки плоскости характеризуются в бари- барицентрических координатах соотношением Определение 6. Однородными аффинными координатами- называются однородные проективные' координаты, для кото- которых ао = 0, <xi = l, а2 = 0, Ро==О> Pi = 0, Рг =1, Yo=l. Yi = O. Yo = O. 183.
Они связаны с аффинными координатами формулами Хо ' У Хв' Несобственные точки характеризуются в этих координатах со- соотношением Хо = 0. § 2. УРАВНЕНИЯ ЛИНИЙ И ПОВЕРХНОСТЕЙ 1. Задание линий и поверхностей уравнениями Интуитивно понятие линии знакомо каждому человеку, даже не изучавшему геометрию. Например, линиями на плоскости яв- являются прямые и окружности, а в пространстве, скажем, — вин- винтовые линии. С другой стороны, например, область, ограничен- ограниченная окружностью («круг»), линией не является. Однако задача дать строгое определение понятию линии (или, как говорят, дать его экспликацию) оказалась неожидан- неожиданно очень трудной и, по-видимому, вполне удовлетворительного решения не имеющей. Наиболее удачную экспликацию понятия линии предложил замечатель- замечательный советский математик П. С. Урысон. Грубо говоря, множество точек является линией в смысле Урысона, если в окрестности любой его точки М все его точки, отличные от точки М, составляют несвязное множество (со- (состоящее из нескольких «частей»). Однако под это определение подпадают некоторые весьма сложно устроенные множества, которые наша интуиция может считать линиями лишь с большой натяжкой. Читатель, интересующийся этим вопросом, найдет подробности в книжке А. С. Пархоменко, Что такое линия, Гостехиздат, 1954. Как бы то ни было, каждая линия на плоскости представ- представляет собой множество («геометрическое место») точек, удовлет- удовлетворяющих некоторому условию. В координатах х, у это усло- условие может быть записано в виде равенства f(x,y) = O, где f(x,y)—некоторая функция двух переменных. Это равен- равенство называется уравнением данной линии (в данной коорди- координатной системе Оху). Например, ось абсцисс определяется уравнением У-0, а ось ординат — уравнением х = 0. В прямоугольной системе координат биссектриса первого и третьего квадрантов имеет уравнение х = у, т. е. уравнение х — у = 0, .184
а биссектриса второго и четвертого квадрантов — уравнение Окружность радиуса R с центром в точке (а, Ь) имеет (в прямоугольных координатах) уравнение В частности, окружность с центром в точке 0@,0) имеет урав- уравнение Х2 + у2 = #2. Линии задаются уравнениями не только в аффинных, но и в любых других (например, в полярных) координатах. Так, в полярных координатах г, ф уравнение окружности с центром в точке О имеет особенно простой вид: r = R. Аналогично, поверхность в пространстве определяется од- одним уравнением вида / (х, у, г) = 0. Например, сфера радиуса R с центром в точке (а, Ь, с) имеет уравнение (х- аJ + (у - bf + (z- cf = R2. Линия в пространстве задается двумя условиями, аналити- аналитически записываемыми в виде двух уравнений: f(x, у, г) = О, * g(x, у, г) = 0. Иными словами, линия в пространстве задается как линия пе- пересечения двух поверхностей f(x,y,z) =0 и g(x,y,z) = 0. Заметим, что (для данной линии) поверхности f(x,y,z)—0 и g(x, у, г) = 0 можно выбирать с большой степенью произвола. Именно, за эти поверхности можно принять произвольные поверхности, содержащие дан- данную линию и не имеющие более никаких общих точек. Аналогом линий в пространстве являются на плоскости (не- (неупорядоченные) наборы изолированных точек. Каждый такой набор может быть представлен как пересечение двух линий, т. е. может быть задан двумя уравнениями вида f(x, у) = 0, Конечно, выбор этих уравнений также может быть осуществлен с большим произволом. Замечание 1. Пусть нам дана некоторая поверхность Цх, у, z) = 0 185
ги некоторая плоскость П, Вообще говоря, плоскость П пересе- пересекает данную поверхность по некоторой линии. Поставим вопрос: -как найти уравнение этой линии? Конечно, чтобы этот вопрос имел смысл, необходимо задать на плоскости П некоторую систему координат х', у', а чтобы на этот вопрос можно было" ответить, необходимо как-то связать координаты х, у, г в пространстве и координаты х', у' на плос- плоскости. Наиболее простой случай возникает, когда плоскость П яв- .ляется одной из координатных плоскостей, скажем, плоскостью 2 = 0. На этой плоскости величины х, у являются координатами и и этих координатах уравнение линии пересечения имеет, очевид- очевидно, вид f(x, у, 0) = 0. Общий случай сводится к этому простейшему преобразова- преобразованием координат. Именно, нужно ввести в пространстве новые координаты х', у', z', в которых уравнение данной плоскости имеет вид z' = 0, и затем, пользуясь формулами преобразования координат, най- найти уравнение данной поверхности в координатах х', у', z'. После этого останется положить в этом уравнении z' = 0. Получится уравнение от х', у', являющееся уравнением искомой линии пе- пересечения (в координатах х', у'). Замечание 2. Во многих курсах аналитической геометрии утверждается (иногда явно, иногда неявно), что не только лю- любая линия на плоскости выражается (в аффинных координатах) некоторым уравнением вида f(x,y) = 0, но и обратно, каждое такое уравнение определяет некоторую линию. Несмотря на распространенность (и кажущуюся очевидность) этого утверж- утверждения, более внимательное рассмотрение показывает, что оно неверно. Действительно, пусть X — произвольное множество точек плоскости (например, полуплоскость). Определим функцию f(x,y) (так называемую характеристическую функцию множест- множества X), считая, что f(x,y) = 0, если точка А (х,у) принадлежит множеству X, и что f(x,y) = 1 в противном случае. Тогда мно- множество X будет определяться уравнением f(x,y) = 0. Таким об- образом, уравнениями вида f(x,y)—Q можно задать любое множество на плоскости (а не только линии). Следовательно, чтобы сохранить утверждение о том, что .любое уравнение f(x,y) = 0 определяет некоторую линию, мы .должны как-то ограничить класс рассматриваемых функций f(x,y), причем это мы должны сделать так, чтобы «вместе с A8Q
водой не выплеснуть и ребенка», т. е. так, чтобы любую линию» по-прежнему можно было бы выразить уравнением f(x,y) — CL Эта задача по существу равносильна задаче об экспликации по- понятия линии. Мы не будем здесь ею заниматься и ограничимся- лишь указанием двух примеров (чтобы хотя бы намекнуть на характер возникающих здесь трудностей). Пример 1. Рассмотрим функцию f(x,y), определенную усло-: виями: {О, если х^О, е *\ если х<0. Без труда проверяется, что эта функция непрерывна и, более того, имеет непрерывные частные производные всех порядков. Вместе с тем уравнение f(x,y) = О определяет, очевидно, по- полуплоскость х ^ 0. Пример 2. Уравнение также определяет полуплоскость х ^э= 0. Таким образом, ни наложение условий гладкости (дифферен- (дифференцируемое™), ни ограничение «элементарными функциями» не позволяет нам исключить «частей плоскости». 2. Алгебраические линии Тем не менее, существуют, конечно, достаточно обширные классы функций f(x,y), обладающие тем свойством, что урав- уравнения f(x,y) =0 определяют «настоящие» линии (не содер- содержащие «плоскостных» кусков). Простейшим (и, по-видимому, важнейшим) таким классом является класс всех многочленов. Напомним, что многочленом от переменных х, у называется сумма одно- одночленов вида ахруя, где а — некоторое число (отличное от нуля), а р и q— целые неотрицательные числа. Число п = р + q называется степенью одно- одночлена ахРуч. Наибольшая степень одночленов, из которых состоит данный многочлен, называется степенью этого многочлена. Многочлен называется формой (или однородным многочленом), если все его одночлены имеют одну и ту же степень. Ясно, что любой многочлен является суммой форм. Много- Многочленами нулевой степени являются отличные от нуля числа и только они. Во избежание излишних оговорок, к многочленам причисляется также и чис- число 0. Этот нулевой многочлен никакой степени не имеет (или, если угодно,/ имеет ту степень, которую мы желаем в данный момент ему приписать). Два многочлена fug называются пропорциональными, если существует такое число k ф 0, что / = kg. Ясно, что пропорциональные многочлены, имеют одну и ту же степень. Определение 1. Множество точек плоскости, аффинные коор- координаты х, у которых удовлетворяют уравнению f(x,y) = 0, где- 18Г
f(x,y)—некоторый многочлен положительной степени, назы- называется алгебраической линией. Степень многочлена f{x,y) назы- называется при этом порядком линии. Изучение алгебраических линий является предметом так на- называемой алгебраической геометрии. В аналитиче- аналитической геометрии ограничиваются изучением линий лишь первого и второго порядков. Чтобы оправдать введенную терминологию, следует, конечно, показать, что алгебраические линии соответствуют интуитивному понятию о линиях: например, не содержат «частей плоскости». Для линий первого и второго порядка мы сделаем это ниже, в явном виде построив все возможные такие линии. Для линий высших порядков соответствующее утверждение доказы- доказывается в курсах алгебраической геометрии. Однако, понятие алгебраической линии все же не полностью соответствует интуитивному понятию линии. Например, урав- уравнению не удовлетворяет ни одна точка плоскости, т. е. это уравнение определяет пустое множество. Аналогично, уравнению удовлетворяет только точка О @, 0), так что соответствующая алгебраическая линия состоит только из одной этой точки. Та- Таким образом, вводя алгебраические линии, мы включаем в по- понятие линии пустое множество и множества, состоящие из отдельных точек. Это «насилие над интуицией» не столь велико, чтобы с ним нельзя было примириться, с другой стороны, вклю- включение в рассмотрение такого рода «особых» алгебраических ли- линий существенно унифицирует и упрощает теорию. В связи с понятием алгебраической линии, в первую очередь, встает вопрос о корректности его определения, т. е. об его независимости от выбора аффинной координатной системы. Соответствующее доказательство проводится без особого труда. Действительно, пусть к', у' — другая аффинная координат- координатная система. Чтобы получить в координатах х', у' уравнение') f'(x',y') = 0 линии, имеющей в координатах х, у уравнение f(x,y) = 0, достаточно, очевидно, в функцию f(x,y) подставить выражения координат х, у через координаты х', у'. Но, как мы знаем, координаты х, у линейно выражаются через коорди- координаты х', у', а при подстановке в многочлен f(x,y) вместо х, у произвольных линейных функций переменных х', у' снова, оче- очевидно, получится многочлен (уже от х', у'). Следовательно, ли- линия, алгебраическая в координатах х, у, будет алгебраической ') Здесь, конечно, символ /' никакого отношения к производным ие имеет. 188
линией и в координатах х', у'. Тем самым корректность понятия- алгебраической линии полностью доказана. Правду сказать, в приведенном доказательстве допущена некоторая неточность (попытайтесь найти ее сами). Именно, многочлен, определяющий алгебраическую линию, должен иметь положительную степень, но априори не ясно, не перейдет ли при замене координат многочлен положительной степени в многочлен нулевой степени. Таким образом, нужно доказать, что это невозможно. Вместо этого мы докажем большее, а именно, что при замене координат степень многочлена f(x,y) вообще не меняется. С этой целью заметим, что при линейной замене переменных степень многочлена может только уменьшиться. Таким обра- образом, если многочлен f(x,y) имеет степень п, а получающийся из него в результате линейной замены переменных многочлен f'(x',y') имеет степень п', то п'^Ln. Но многочлен f'(x',y') в свою очередь получается из многочлена f(x,y) линейной за- заменой переменных (обратной к предыдущей). Поэтому, по ана- аналогичным соображениям, п ^ га'. Следовательно, п = п'. Замечание 1. Доказательство равенства п — п' можно рас- рассматривать как доказательство корректности определения по- порядка алгебраической линии. Однако ситуация здесь несколько более сложная, чем это кажется на первый взгляд. Действи- Действительно, одна и та же алгебраическая линия (в одной и той же аффинной координатной системе) может, вообще говоря, выра- выражаться различными уравнениями f(x,y) = 0 и g(x,y) = 0. На- Например, если многочлены f(x,y) и g(x,y) пропорциональны, то линии f(x,y) = 0 и g(x,y) = 0, очевидно, совпадают. Посколь- Поскольку пропорциональные многочлены имеют одну и ту же степень, корректность определения порядка алгебраической линии будет установлена, если мы докажем, что справедливо и обратное ут- утверждение, т. е. что справедлива следующая теорема един- единственности: Алгебраические линии f(x,y) =0 и g(x,y) = 0 тогда и только тогда совпадают, когда многочлены f(x,y) и g(x,y) пропорциональны. Однако, к сожалению, в таком виде теорема неверна. Тому имеются две причины. Во-первых, если мы умножим мно- многочлен f (x, у) на произвольный многочлен положительной сте- степени, ни при каких вещественных х, у не обращающийся в нуль (например, на многочлен х2-\-у2-\-\), то мы получим много- многочлен, определяющий ту же самую алгебраическую линию, что и многочлен f(x,y). Например, уравнения х(х2 + У2 + 1) =0 и х = 0 определяют одну и ту же прямую (ось ординат). В то же время эти многочлены не пропорциональны (и имеют различ- различные степени). Чтобы преодолеть эту трудность, следует соответ- соответствующим образом определить отношение «две алгебраические линии совпадают». Например, можно считать, что две алгебраи- 189
ческие линии f(x, у) =0 и g(x, у) = 0 совпадают, если равен- равенства f(x,y) =0 и g(x,y) = 0 равносильны не только для веще- вещественных переменных х и у, но и в случае, когда мы допускаем для этих переменных любые комплексные значения. Можно сказать, что, таким образом, мы вводим в рассмотрение «точки» с комплексными координатами (такие точки не имеют никакого геометрического смысла и представляют собой — при фиксиро- фиксированной аффинной координатной системе — просто пары (х, у) комплексных чисел) и определяем алгебраические линии как со- совокупности всех (в том числе и комплексных) точек, удовлет- удовлетворяющих уравнениям вида f(x,y) =0, где f(x,y) —произволь- —произвольный многочлен положительной степени. Из алгебры известно, что для любого многочлена положительной степени существуют комплексные точки (х,у), в которых он обращается в нуль. По- Поэтому после введения комплексных точек получить контрпри- контрпримеры к теореме единственности описанным выше способом мы уже не можем. Однако такие контрпримеры можно получить и по-другому, заметив, что уравнения f(x,y) = 0 и f(x,y)P — 0, где р— про- произвольное натуральное число, определяют одну и ту же алге- алгебраическую линию (безразлично, допускаются или нет точки с комплексными координатами). Например, оба уравнения х — 0 и х2 = 0 определяют одну и ту же ось ординат. Эту трудность можно преодолеть, введя понятие «кратной точки» и считая, например, что уравнение х2 — 0 определяет «дважды взятую» ось ординат. На этом пути возникают значительные трудности в связи с аккуратным обращением с кратными точками (даже строгое и «рабочее» определение понятия «кратности» дать не так-то просто). Тем не менее все эти трудности можно успешно преодолеть (что, кстати сказать, требует довольно изощренной алгебраической техники), после чего теорему единственности уже удается строго доказать. Описанный путь обоснования теоремы единственности слиш- слишком труден, чтобы мы могли им здесь воспользоваться. Однако мы можем совершить «обходный маневр», заметив, что введе- введение комплексных и кратных точек по существу лишает нашу теорию геометрической наглядности и переводит ее в область алгебры. Воспользовавшись принципом «снявши голову, по во- волосам не плачут», мы можем полностью «алгебраизироваться» и определить алгебраическую линию (в данной аффинной координатной системе х, у) просто как класс пропорциональ- пропорциональных друг другу многочленов f(x,y). Теорема единственности бу- будет тогда автоматически справедлива. Мы, однако, не будем настаивать на этом определении, желая остаться в рамках на- наглядно геометрических понятий, хотя иногда оно и найдет от- отражение в нашей терминологии (аналогично тому, как мы по- позволим себе говорить, например, о «дважды взятых прямых», не давая общего определения кратных точек). 190
Мы можем надеяться сохранить (при первоначальном опре- определении алгебраической линии) теорему единственности в не- несколько ослабленном виде, заметив, что во всех указанных выше контрпримерах многочлены f(x,y) = Q и g(x,у) = 0, опре- определяющие одну и ту же алгебраическую линию, имеют различ- различные степени. Это -наводит на мысль, не будет ли справедлива следующая теорема единственности для алгеб- алгебраических линий фиксированного порядка: Алгебраические линии f(x,y) =0 и g(x,y) = 0, определяе- определяемые многочленами одной и той же степени п, тогда и только тогда совпадают, когда эти многочлены пропорциональны. Однако и в этой ослабленной форме теорема единственности неверна, как показывает пример непропорциональных многочле- многочленов х2 + У2 + 1 и х2 -\- у2 + 2, определяющих одну и ту же ал- алгебраическую линию (пустое множество). Тем не менее, эта теорема оказывается справедливой, если рассматривае- рассматриваемые линии имеют достаточно много точек. Напри- Например, как мы докажем ниже (см. п. 3 § 1 гл. 3 и п. 4 § 1 гл. 6), она справедлива для любых линий первого порядка (которые заведомо имеют много точек)-и для линий второго порядка, со- состоящих более чем из одной точки. Поскольку наша цель здесь состояла лишь в указании под- подводных камней в этих, казалось бы, спокойных и безопасных водах, мы ограничимся сказанным. Конечно, аналогичные трудности (в осложненном виде) имеют место и для поверхностей (и линий) в пространстве. 3. Параметрические уравнения линий и поверхностей Аналитическое задание линий уравнениями вида f(x,y) = 0 не является единственно возможным. Например, представляя данную линию как траекторию движущейся точки, мы получим (по-прежнему предполагая заданной систему аффинных коорди- координат х, у), что координаты х, у точек линии являются некоторы- некоторыми функциями (t) параметра t («времени»), меняющегося в некоторых определен- определенных пределах а ^ / ^ Ь, где а и b — вещественные числа или символы ±°°. Такого рода задание линии называется заданием посредством параметрических уравнений. Например, уравнения х = R cos t, п . , -я<*<я, B) y = Rsmt, . ^ w являются (в прямоугольных координатах х, у) параметрическими уравнениями окружности радиуса R с центром в точке 0@,0). - - 191
Действительно, каждая точка А (х, у) с координатами, выражающимися формулами B), удовлетворяет уравнению окружности и обратно, если числа х, у удовлетворяют этому уравнению, то существует такое /, что выполнены уравнения B). Параметр t в уравнениях B) имеет очевидный геометриче- геометрический смысл: он равен углу от оси Ох к радиус-вектору 0.4 точ- точки А (х, у). Замечание 1. Одну и ту же линию можно задавать различ- различными параметрическими уравнениями. Например, ту же окруж- окружность радиуса R с центром в точке О можно задать параметри- параметрическими уравнениями — оо < / < -f- со t2 ' (строго говоря, мы здесь получим окружность без точки (R, 0), соответствующей бесконечному значению параметра t). Конеч- Конечно, здесь параметр t имеет уже совсем другое геометрическое истолкование (найдите его сами).. Каждому значению to параметра t соответствует некоторая определенная точка Ао рассматриваемой линии, имеющая ко- координаты х(t0), у(t0). Однако одна и та же точка может, вооб- вообще говоря, соответствовать многим различным значениям пара- параметра. Например, для уравнений B) значения параметра / = ±я определяют одну и ту же точку окружности. Чтобы от уравнения f(x,y) = О перейти к параметрическим уравнениям, следует в функцию f(x,y) вместо х подставить не- некоторую функцию х(t) и решить уравнение f(x(t),y) = O C) относительно у. При этом функцию x(t) следует выбрать так, чтобы уравнение C) имело однозначное решение у = y(t). При неудачном выборе функции x(t) уравнение C) может вообще не иметь однозначного решения или иметь такое решение толь- только на небольшом отрезке изменения параметра / (что даст нам только некоторую часть исследуемой линии). Детальное рас- рассмотрение всех этих вопросов принадлежит, по существу, тео- теории неявных функций, и мы здесь ими заниматься не будем. Важный класс параметрических уравнений возникает, когда за параметр t принята координата х. В этом случае мы на са- самом деле имеем только одно уравнение вида У = У(х). . D) Такое уравнение линии называется уравнением, разрешенным относительно х. В случае, когда координаты х, у прямоугольны, 192
наша линия представляет собой в этом.случае не что иное, как график функции у = у{х). Для того чтобы линию можно было задать уравнением вида D), необходимо и достаточно, чтобы каждая прямая, парал- параллельная оси ординат, пересекала эту линию не более чем в од- одной точке. Например, окружность х2 + у2 = R2 задать уравне- уравнением вида D) нельзя. Однако ее «верхнюю» полуокружность х2 -\- у2 = R2, у rg- О, так задать можно: у = ]/#2 _ Аналогично, уравнение определяет «нижнюю» полуокружность х2 + у2 = R2, у ^ 0. В пространстве параметрические уравнения линий имеют вид x = x(t), y = y(t), a<^<6. Все сказанное выше применимо, конечно (с соответствующими тривиальными изменениями), и в этом случае. Вводя векторную функцию (на плоскости — векторную функцию r(t) = x{t)e\ + y{t)e2), мы можем параметрические уравнения линии записать в виде одного векторного параметрического уравнения r = r(t), где г — радиус-вектор произвольной точки линии. Это уравнение имеет, формально, один и тот же вид как в плоскости, так и в пространстве. Поверхности в пространстве также можно задавать пара- параметрическими уравнениями (содержащими уже два независи- независимых параметра). В векторной форме они имеют вид г = г (и, v). Поскольку общей теорией поверхностей мы по существу за- заниматься не будем, такого рода уравнения будут у нас возни- возникать только мимоходом. Обратим внимание на то, что интуитивное геометрическое различие меж- между линиями и поверхностями, состоящее в том, что линии «одномерны», а поверхности «двумерны», находит свое аналитическое отражение в том, что линии определяются уравнениями, зависящими от одного параметра, а 7 М. М. Постников 193
поверхности — уравнениями, зависящими от двух параметров. Иначе говоря, линии представляют собой «однопараметрические семейства» точек, а по- поверхности — «двупараметрические семейства». Владея параметрическими уравнениями линий, мы можем попытаться определить линию (на плоскости) как множество точек, координаты которых выражаются уравнениями вида A), где функции x(t) и y(t) удовлетворяют определенным условиям (которые мы и должны найти). Само собой напрашивающееся условие состоит в требовании непрерывности этих функций. Та- Такое определение линии предложил в прошлом веке французский математик Жордан, и потому линии в этом смысле называются «жордановыми кривыми». Однако вскоре после того, как Жор- Жордан предложил свое определение, итальянский математик Пеано построил пример жордановой кривой, проходящей через любую (!) точку некоторого квадрата. Пример Пеано показы- показывает, таким образом, что понятие жордановой кривой оказы- оказывается слишком широким. Это понятие можно сузить, потребовав, чтобы функции x(t) и y(t) были дифференцируемыми. Получающиеся так называе- называемые «гладкие кривые» уже не могут заполнять никакой плос- плоской области и вполне удовлетворяют интуитивному представле- представлению о кривой линии. Однако вне рамок гладких кривых оказы- оказываются, например, все ломаные. Чтобы включить и их, следует допустить функции, обладающие конечным числом разрывов (первого рода). Соответствующие «кусочно гладкие кривые» уже охватывают по существу все интересные для математиче- математической практики кривые и, по-видимому, представляют (на совре- современном уровне развития математики) наиболее удачный ана- аналитический вариант строгого определения понятия «линий». Од- Однако-их определение содержит чуждое геометрии требование дифференцируемое™, и потому с точки зрения «чистой геомет- геометрии» класс кусочно гладких кривых определен плохо. Кроме того, все определения «по Жордану» (включающие или нет требования дифференцируемое™) имеют еще и тот прин- принципиальный недостаток, что они описывают линию не только как множество точек, но и включают в себя определенный «спо- «способ пробегания» этого множества. Это находит отражение в том, что две разные пары функций x(t) и y(t) могут определять одну и ту же линию (см. выше в п. 3 пример двух разных пара- параметрических уравнений окружности). Строгое описание этого феномена возможно, но оказывается весьма длинным и утоми- утомительным . (следует, например, учесть возможность того, что при изменении параметра t точка (x(t), y(t)) может «стоять на месте»). Впрочем, все это имеет для нас чисто «академический» ин- интерес, поскольку мы будем интересоваться лишь алгебраиче- алгебраическими линиями первого и второго порядков, в связи с которыми 194 ^
никаких трудностей с определением не возникает \мы не го- говорим сейчас о трудностях, о которых шла речь в конце п. 2). Мы коснулись этих вопросов лишь для того, чтобы читатель не думал, что здесь дело обстоит так просто, как это на первый взгляд кажется. § 3. КООРДИНАТНО-АКСИОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ГЕОМЕТРИИ 1. Основные положения аксиоматического метода Общеизвестен дедуктивный характер математики, т. е. тот факт, что истинность математических утверждений (в отличие от утверждений есте- естественных наук) не устанавливается на основании опыта и наблюдения, а выводится (дедуцируется) из небольшого числа исходных утверждении (аксиом). Истинность аксиом принимается без доказательства; все остальные утверждения (теоремы) с помощью логических рассуждений выводятся из аксиом. Понятия, участвующие в утверждениях, также разделяются на два типа — основные (исходные) понятия, принимающиеся без определений, и производные понятия, которые должны быть определены через исходные. Эти требования к дедуктивной науке были выработаны еще древнегре- древнегреческими математиками и обычно связываются с именем Аристотеля. Осно- Основывающееся на них изложение геометрии, предпринятое Евклидом в его «Началах», в течение двух тысяч лет считалось основным и безупречным примером дедуктивного построения знания. Однако постепенно выяснилось, что изложение Евклида (на котором до сих пор во многом базируется пре- преподавание математики в школе) не вполне удовлетворяет указанным требо- требованиям. Например, Евклид делает попытки определения основных понятий (скажем, он пишет: «точка есть то, что не имеет частей») и, кроме того, его аксиомы недостаточны для доказательства всех теорем геометрии (не- (необходимы дополнительные утверждения, Евклидом нигде явно не сформули- сформулированные). Конечно, эти недостатки вполне исправимы и были действительно исправ- исправлены в конце XIX в., когда математическая мысль после многовекового пе- •, рерыва опять обратилась к представлению геометрии (и других областей математики) в строгой форме, соответствующей древнегреческому идеалу аксиоматико-дедуктивной науки. Во многом это было стимулировано откры- открытием Лобачевским его неевклидовой геометрии. На первых порах геометры XIX в. исправляли Евклида, оставаясь в во- вопросе об истинности геометрии по существу на позициях Аристотеля, т. е. они считали, что: 1°. Исходные положения (аксиомы и основные понятия) имеют вполне определенный содержательный смысл; аксиомы истинны в силу своей оче- очевидности. 2°. Теоремы истинны, так как они выводятся правильными логическими рассуждениями из истинных аксиом. Эта точка зрения называется содержательной. Развитие математики в XIX и XX вв. привело к некоторому новому уровню дедуктивно-аксиомати- дедуктивно-аксиоматических построений, который принято называть формальным. Этот уровень 7* 195
стал необходимым в связи с созданием новых отделов математики, имеющих дело с очень отвлеченными и мало наглядными конструкциями. Наглядность я очевидность исходных утверждений перестала, тем самым, быть критерием правильности (и полезности) математических построений. Вперед выдвину- выдвинулась логическая строгость математических теорий. Явная формулировка всех аксиом и посылок стала насущно необходимой. При формально-аксиоматическом построении теории намеренно отвле- отвлекаются от содержательного понимания и вопрос об истинности или очевид- очевидности аксиом уже больше не ставится. Аксиоматически построенная мате- математическая теория занимается изучением лишь логических следствий из ¦принятых аксиом. Таким образом, формально-аксиоматический подход преодо- преодолевает аристотелевский тезис 1°. Дальнейшее углубление дедуктивного метода, связанное с преодолением тезиса 2°, возникает при анализе понятия правильного логического вывода. Оказывается, что для логики также возможно чисто формальное построение, отвлекающееся от ее содержательного понимания. Последовательное прове- проведение этой точки зрения увело бы нас слишком далеко и потому мы оста- остановимся на полпути и будем рассматривать «формальные аксиоматики в не- неформальной логике». Нашей основной целью будет дедуктивно-аксиоматическое построение геометрии (в первую очередь обыкновенной школьной, евклидовой геометрии, а затем аффинной и проективной). При этом для простоты мы ограничимся случаем плоскости. Переход к случаю пространства совершенно тривиален, и мы его оставим читателю. Формально-аксиоматическое построение геометрии (как и любой другой математической теории) начинается с перечисления, во-первых, основных объ- объектов, во-вторых, основных отношений между этими объектами и, в-третьих, .аксиом. Основные объекты и основные отношения никак не определяются, не поясняются и не описываются, а только называются. От них лишь требуется, ¦чтобы они подчинялись аксиомам. Все другие объекты и отношения, рассматриваемые в геометрии, должны •определяться через основные. Именно потому, что цепь определений должна иметь начало, необходимы основные неопределяемые объекты и отношения. Подчеркнем, что основными объектами данной аксиоматики можно счи- считать объекты любой природы, а основным отношениям между ними можно придать любой конкретный смысл, лишь бы удовлетворялись все аксиомы. Тогда любая теорема, выведенная из аксиом, будет выражать определенный ¦факт, относящийся к этим объектам, точнее, к тем их свойствам, которые •фигурируют в аксиомах. Любой конкретный выбор объектов и их отношений, удовлетворяющий аксиомам, называется реализацией, интерпретацией _ или моделью данной аксиоматики. Впрочем, эта терминология постепенно выходит из употребления. Теперь предпочитают называть, скажем, модель аксиоматики плоской евклидовой геометрии «евклидовой плоскостью», а например, модель аксиоматики пло- плоской аффинной геометрии — «аффинной плоскостью» и т. п. 196
Две модели называются изоморфными, если между ними может быть установлен изоморфизм, т. е. взаимно однозначное соответствие, сохраняю- сохраняющее все основные отношения (ср. п. 6 § 2 гл." 1). Вообще говоря, основные объекты и отношения (а также связывающие их аксиомы) можно выбирать довольно свободно: их выбор диктуется темя целями, которые ставит перед собой автор аксиоматики. Нужно лишь сле- следить, чтобы все рассматриваемые аксиоматики были друг другу равносильны, т. е. чтобы они описывали одну и ту же математическую теорию. Что, собственно говоря, означает, что две аксиоматики «описывают одну и ту же математическую теорию»? Если обе аксиоматики имеют одни и те же основные объекты и основные отношения, ответ тривиален: каждая аксиома одной аксиоматики должна быть теоремой в другой и наоборот. Если же основные объекты и основные отношения двух рассматриваемых аксиоматик различны, то их равносильность означает, что в каждой из них можно соответствующими определениями ввести основные объекты и основ- основные отношения другой аксиоматики так, чтобы для этих объектов и отноше- отношений были выполнены соответствующие аксиомы, т. е. чтобы эти аксиомы оказывались теоремами. Другими словами, это означает, что данные аксио- аксиоматики должны быть интерпретируемыми друг в друге. Если мы, выбрав основные объекты и отношения, произвольно напишем ряд аксиом, то, вообще говоря, мы можем и не получить аксиоматики, опи- описывающей какую-либо математическую теорию. Необходимо еще, чтобы эти аксиомы были непротиворечивы., т. е. чтобы из них нельзя было вывести некоторого утверждения вместе с его отрицанием. Противоречивые системы аксиом совершенно бесполезны, поскольку из любой такой системы можно по законам логики вывести произвольное утверждение. Как доказать непротиворечивость данной системы аксиом? Для этого возможны два способа: «абсолютный» и «относительный». «Абсолютный» способ основывается на тщательном исследовании фор- формального строения всех предложений, выводимых в данной аксиоматике (ее «теорем»). Если такое исследование продвинуто достаточно далеко и, в част- частности, найдены формальные признаки, характеризующие выводимые предло- предложения, то для доказательства непротиворечивости аксиоматики остается лишь доказать, что не существует предложения, обладающего этими при- признаками одновременно с его отрицанием. Однако «абсолютный» способ для мало-мальски сложных систем аксиом (например, для аксиом арифметики, не говоря уже об аксиомах геомет- геометрии) наталкивается на принципиальные трудности и приводит к пороч- порочному кругу. Поэтому нам остается лишь «относительный» способ, заключающийся в том, что для данной аксиоматики строится модель в некоторой другой аксио- аксиоматике, непротиворечивость которой уже известна. Возможность построения такой модели обеспечивает, очевидно, непротиворечивость и данной аксиома- аксиоматики. Конечно, пользуясь «относительным» способом, мы рано или поздно придем к аксиоматике, которую «негде» интерпретировать и к которой, сле- следовательно, необходимо применять «абсолютный» способ. Выяснением и ре- решением возникающих здесь принципиальных проблем занимается математи- математическая логика, лежащая вне рамок нашего изложения. 197
Мы будем предполагать, что непротиворечивость теории вещественных чисел нам уже известна, и будем доказывать непротиворечивость наших аксиоматик построением их «числовых моделей». Кроме непротиворечивости, аксиоматики геометрии должны обладать также свойством «полноты». В наиболее сильной форме требование полноты означает, что любое утверждение, которое осмысленно может быть сформу- сформулировано в этой аксиоматике, может быть либо выведено из аксиом, либо опровергнуто (с помощью этих аксиом). Однако в математической логике доказывается, что никакая достаточно мощная аксиоматика (в частности, никакая аксиоматика геометрии) таким свойством обладать не может. Это утверждение известно как теорема Гёделя о неполноте. Поэтому мы вынуждены принять следующее определение полноты, впол- вполне достаточное для всех практических целей: аксиоматика называется пол- полной, если любые две ее интерпретации изоморфны. Конечно, в математике встречаются (и далее играют большую роль) и неполные аксиоматики. Примером неполной аксиоматики может служить си- система аксиом группы: она неполна, потому что существуют неизоморфные группы. Неполные аксиоматики служат для совершенно иных целей, чем полные, и мы ими здесь заниматься не будем. На аксиоматику часто накладывается еще требование минимальности: в список аксиом не должны входить «лишние» аксиомы, которые могут быть выведены из остальных аксиом. Требование минимальности очень существен- существенно, когда мы интересуемся внутренним логическим строением геометрии. Од- Однако, если аксиомы нам нужны только для строгости изложения и мы инте- интересуемся не столько логической структурой теории, сколько фактами, кото- которые в ней могут быть доказаны, требование минимальности оказывается чрезвычайно стеснительным и порой просто вредным. Поэтому за минималь- минимальностью мы, как правило, следить не будем. Наконец, обычно считается (точнее, считалось) необходимым, чтобы ак- аксиоматика геометрии была независимой, т. е. чтобы в ней не участвовали понятия из других отделов математики. Это приводит к, по существу, не- неоправданному усложнению аксиоматики, поскольку, скажем, аксиомы, опи- описывающие расположение точек на прямой, на самом деле ничем не отли- отличаются от соответствующих аксиом теории вещественных чисел, так что в рамках независимой аксиоматики геометрии приходится заново строить боль- большой фрагмент теории вещественных чисел. Кроме того, требование незави- независимости запрещает использовать даже простейшие понятия теории множеств, что, естественно, также вносит определенные трудности. По этим основаниям в последнее время требование независимости не стали считать так уж обязательным и все шире начали использовать аксио- аксиоматики геометрии, базирующиеся на теории вещественных чисел и теории множеств. Наша аксиоматика также будет основываться на этих теориях. 2. Аксиоматика евклидовой геометрии В основу нашей аксиоматики геометрии мы положим поня- понятие евклидовой координатной системы. Рассмотрим прежде всего, какими свойствами это понятие обладает с содержатель- содержательной точки зрения. 198
По определению, каждая евклидова координатная система является некоторым биективным отображением а плоскости на множество R2 всех пар вещественных чисел: для любой точки А пара а (Л) состоит из координат х, у этой точки. Пусть нам даны две евклидовы координатные системы а и а'. Отображение а~\ обратное координатной системе а, каждой паре (х, i/)eR2 сопоставляет некоторую точку А, а координат- координатная система а' сопоставляет этой точке пару чисел (х\ у'). Сле- Следовательно, отображение а'°а"' представляет собой отображе- отображение R2->-R2, переводящее пару (х, у) в пару (х',у). При этом (см. п. 4 § 1) числа х, у и х', у связаны формулами перехода вида (ЯОС) <¦» где С — некоторая ортогональная матрица (второго порядка), а а я Ь — числа. Таким образом, Для любых двух евклидовых координатных систем а и а' композиция а'о а представляет собой отображение R2->R2, задаваемое формулой вида A). Далее, пусть а— произвольная евклидова координатная система и пусть ф — произвольное отображение 'R2—>R2, зада- задаваемое формулой вида A). Тогда величины х', у' также будут евклидовыми координатами на плоскости, т. е. отображение АI—э- (х\ у') будет евклидовой координатной системой. Но, по определению, это отображение является не чем иным, как ото- отображением ф°а. Таким образом, Для любой евклидовой координатной системы а и любого отображения qp: R2—>R2, задаваемого формулой вида A), ото- отображение ф о а также является евклидовой координатной сис- системой. Как мы ниже покажем, из этих свойств евклидовых коорди- координатных систем можно вывести всю евклидову геометрию плос- плоскости. Другими словами, их можно принять за аксиомы евкли- евклидовой геометрии плоскости. Перейдем теперь к формальному описанию аксиом. Мы будем рассматривать всевозможные преобразования задаваемые формулами вида A). Определение 1. Множество всех преобразований вида A) мы будем обозначать символом Ort(R2). Из содержательного смысла этих преобразований немедлен- немедленно вытекает, что множество Ort(R2) является группой преобразований. 199
Формальное доказательство сводится к тривиальным про- проверкам: если b' " то 'x\_n-i{ x'\ n~x(a -У Поскольку для ортогональных матриц С и С матрицы С и С'С ортогональны (п. 6 § 5 гл. 1), тем самым доказано, что если преобразования а и а' выражаются формулой вида A), то преобразования а и а'°а также обладают этим свойством. Но это, по определению, и означает, что Ort(R2) является группой. Теперь мы уже можем сформулировать наше основное опре- определение. Пусть нам дано некоторое множество ЗЯ вместе' с непустым семейством Соог(ЗЙ) биективных отображений этого множества на множество R2 и пусть выполнены следующие две аксиомы: Аксиома 1. Для любого отображения а: Ж—^R2, принадле- принадлежащего семейству Соог (Ш), и любого преобразования qp: R2—>-R2, принадлежащего группе Ort (R2), отображение цюа: Ж —> R2 при- принадлежит семейству Соог (Ж). Аксиома 2. Для любых двух отображений a, a': 2ft->R2, принадлежащих семейству Соог (Ш), отображение а' о а~и. R2->R2 принадлежит группе Ort (R2). Наглядно ситуацию, описываемую аксиомой 2, можно изо- изобразить следующей диаграммой: Определение 2. При выполнении аксиом 1 и 2 мы будем мно- множество ЗЙ называть евклидовой плоскостью, его элементы — точками, отображения, принадлежащие семейству Соог(ЗЙ),— евклидовыми координатными системами на плоскости Ш, и для любой евклидовой координатной системы а: Ш —>• R2 и любой, точки М е ЗЙ числа х, у, составляющие пару а(М) е ЗЙ — евк- евклидовыми координатами точки М в координатной системе а. (число х — абсциссой, а число у — ординатой). 200
Из сказанного в начале этого пункта непосредственно выте- вытекает, что содержательно рассматриваемая обычная плоскость является в смысле этого определения евклидовой плоскостью. Замечание 1. Совершенно ясно, как можно аналогичным образом формально определить евклидово пространство (до- (достаточно во всем вышесказанном вместо множества R2 рассмат- рассматривать множество R3 троек (х, у, z) вещественных чисел). Более того, ясно, что мы можем на п = 3 не останавливаться: совер- совершенно аналогичным образом можно для любого п определить п-мерное ев- евклидово пространство. Докажем теперь непротиворечивость и полноту нашей ак- аксиоматики. Чтобы доказать непротиворечивость, достаточно указать конкретный пример множества Ш с семейством отображений Соог(9И), для которого справедливы аксиомы 1 и 2. Примем за Ж множество R2, а за семейство Соог(9И)—группу Ort(R2). Тогда аксиомы 1 и 2 будут в точности означать, что семейство преобразований Ort(R2) является группой, и потому будут вы- выполнены. Тем самым непротиворечивость наших аксиом пол- полностью доказана. Вместе с тем доказано, что множество R2, рассматриваемое вместе с группой Ort(R2) в качестве семейства евклидовых координатных систем, является евклидовой плоскостью, j. Эту плоскость мы будем называть стандартной (или ариф- арифметической) евклидовой плоскостью. Чтобы доказать полноту, мы сначала должны определить, что значит, что две евклидовы плоскости изоморфны. Определение 3. Пусть Ш и ЭДГ — две евклидовы плоскости. Отображение ц: ЗЯ-*ЗЙ' плоскости Ш на плоскость Ш' мы будем называть изоморфным отображением (или просто изоморфизмом), если 1) оно биективно; 2) для любой евклидовой крординатной системы а': Ш' —* R2 на плоскости Ш' отображение а'оц: TI-+R2 является евклидовой координатной системой на плоскости 5??; 3) для любой евклидовой координатной системы a: 3№->-R2 на плоскости Ш существует такая (очевидно, единственная) евклидова координатная система a': 3№'->R2 на плоскости W, что а = а' о (j,. Короче можно сказать, что биективное отображение р: Ж -*¦ ЗЙ' является изоморфизмом, если оно устанавливает 201
биективное соответствие между евклидовыми координатными системами на плоскостях Ш и W. Заметим, что условие 1) определения изоморфизма вытекает из условия 2) или 3). Мы его включили в определение только для большей-ясности. Задание. Докажите, что тождественное отображение 1 и: ЯК -> ЯК, а также композиция Ц.'°ц: 2К->9Л" двух изоморфизмов ц: 9К->2К' и ц': 2К'->ЯК" являются изоморфизмами. Две плоскости 2Я и 2)Т называются изоморфными, если меж- между ними существует хотя бы один изоморфизм. Из только что сделанных замечаний непосредственно вытекает, что отношение изоморфности является отношением эквивалентности, так что совокупность всех евклидовых плоскостей распадается на клас- классы изоморфных плоскостей. Утверждение о полноте нашей аксиоматики означает, чго на самом деле существует только один класс изоморфных плоско- плоскостей, т. е., иными словами, что любые две евклидовы плоскости изоморфны. Ясно, что для этого достаточно доказать, что любая плоскость Ш изоморфна стандартной плоскости R2. В свою очередь это непосредственно вытекает из того, что каждая евклидова координатная система а: 2Л. —*- R2 пред- представляет собой изоморфизм плоскости Ш на плоскость R2. Для доказательства же последнего утверждения достаточно заметить, что условие 2) определения изоморфизма равносиль- равносильно для отображения а: Ш—>R2 аксиоме 1, а условие 3) —ак- —аксиоме 2. Тем самым полнота аксиом 1 и 2 полностью доказана. Заметим, что не только любая евклидова координатная сис- система a: 3R -*¦ R2 является изоморфизмом, но и наоборот, каждый изоморфизм является евклидовой координатной системой на плоскости Ш. Действительно, по определению, одной из евклидовых коор- координатных систем на плоскости R2 является тождественное ото- отображение Irj: R2-*R2. Поэтому согласно условию 2) опреде- определения изоморфизма отображение 1r2o(j, = h является евклидо- евклидовой координатной системой на плоскости 2Я. Замечание 2. Несмотря на то, что любые две евклидовы плоскости изоморфны, отождествлять их не очень удобно, по- поскольку никакого естественного однозначно определенного изо- изоморфизма между ними установить, вообще говоря, нельзя. Пусть 3R и 2Я' — две евклидовы плоскости и пусть a: WI-+R2, а': Ж-*R2 202
— произвольные евклидовы координатные системы на этих плоскостях. Поскольку отображение, обратное к изоморфизму, является изоморфизмом, и композиция двух изоморфизмов так- также представляет собой изоморфизм, отображение \i — a~l о а' плоскости 2)Г на плоскость 2Я является изоморфизмом. Так как а о ц = а', то для любой точки М' <= Ш' равенство М = ц(М') равносиль- равносильно равенству а(М) = а'(М'). B) Но, по определению, а(М) является парой (jt,i/)eR2, состоя- состоящей из координат точки М в координатной системе a, a a'(M') — .парой (л/, г/')<= R2, состоящей из координат точки М' в коорди- координатной системе а'. Следовательно, равенство B) означает, что точки МиМ' имеют одни и те же координаты (в координатных системах а и а' соответственно). На этом основании говорят, что изоморфизм [I действует по равенству координат в коорди- координатных системах а и а'. Легко видеть, что любой изоморфизм действует по равенству координат в некоторых координатных системах а и а', причем одну из этих систем можно задать про- произвольно. Действительно, пусть, например, нам задана координатная система a: m->R2. Рассмотрим отображение Будучи композицией изоморфизмов, это отображение пред- представляет собой изоморфизм, т. е. является евклидовой коорди- координатной системой на плоскости 2Я'. Для завершения доказатель- доказательства остается заметить, что ц, = а~'о а'. Собирая вместе доказанные утверждения, мы получаем сле- следующее предложение, описывающее взаимоотношения между изоморфизмами и координатными системами. Предложение 1. Отображение a: 2K->R2 203-
тогда и только тогда является евклидовой координатной систе- системой, когда оно представляет собой изоморфизм. Отображение тогда и только тогда является изоморфизмом, когда существуют такие евклидовы координатные системы a: 3R-+R2, а': ЭГ-^R2, что ц действует по равенству координат в этих системах: ц = а о а'. Особое значение имеют автоморфизмы евклидовой плос- плоскости ЗЯ, т. е. ее изоморфизмы на себя: Автоморфизмами стандартной плоскости R2 являются ее евклидовы координатные системы и только они (напомним, что, по определению, Coor (R2) = = Ort (R2)). Другими словами, преобразование плоскости R2 тогда и только тогда является автоморфизмом, когда оно принадлежит группе Ort(R2). Автоморфизмы любой евклидовой плоскости Ш составляют, очевидно, группу. Эту группу мы будем обозначать символом Ort (Эй). Легко видеть, что для любых двух плоскостей 3R и Ti' группы Ort(99?) и Ort(SW') изоморфны. Действительно, выбрав некоторый изоморфизм мы получим, очевидно, изоморфизм Ort(aR)->Ort(Sr), сопоставив произвольному преобразованию ФеОй(ЗЙ) пре- преобразование цофоц-'е Ort (ЭГ). Об изоморфизме Фн»Цофоц-1 - мы будем говорить, что он индуцирован изоморфизмом ц. В частности, любая евклидова координатная система a: Tt-^R2 204
индуцирует изоморфизм группы OrtBft) на группу Ort(R2). Это означает, что координа- координаты х, у произвольной точки М е Ш (в координатной системе а) связаны с координатами х', у' преобразованной точки М' = = Ф(М) (в той же координатной системе а) формулой ви- вида A). Принято говорить, что формула A) выражает автоморфизм Ф в координатной системе а. Мы видим, таким образом, что, рассматриваемая как абстракт- абстрактная группа (т. е. «с точностью до изоморфизма»), группа Ort(S$) не зависит от выбора плоскости Зй. Значение группы Ort(Sft) определяется тем, что она позво- позволяет обозреть всю совокупность изоморфизмов плоскости 2Я на любую другую плоскость Ш'. Точнее, это означает сле- следующее. Пусть нам задан некоторый изоморфизм ц0: Tt-*Ttr. Тогда для любого автоморфизма ФеОгЦЯИ) отображение также является изоморфизмом плоскости 5Ш на плоскость 50?'.. Тем самым мы получаем некоторое отображение Ф н-> Ц C) группы От1(Ш) в множество всех изоморфизмов Ш -> Эй'. Задание. Докажите, что отображение C) биективно. Таким образом, грубо говоря, изоморфизмов 5Ш->5Ш' суще- существует «столько же», сколько автоморфизмов ЗЙ->ЗЙ. Определение 4. Пусть X и X'—некоторые множества точек евклидовой плоскости Ш («фигуры»). Эти множества назы- называются (евклидово) эквивалентными, если существует автомор- автоморфизм плоскости Ш, переводящий одно множество в другое. Свойство SP множеств плоскости Ш называется (евклидово) инвариантным (или геометрическим), если одновременно с мно- множеством X свойством & обладает и любое множество X', ему евклидово эквивалентное. Класс (множество) фигур называется инвариантно опреде- определенным, если он характеризуется (см. п. 2 § 1 гл. 1) семейством инвариантных свойств. Числовая функция d(X), заданная на инвариантно опреде- определенном классе, называется инвариантной функцией (или просто инвариантом), если для любого числа d свойство «d{X) = d» 205
фигур X инвариантно, т. е. если для любых евклидово эквива- эквивалентных фигур X и X' имеет место равенство Пусть 2Я и Ш' — две евклидовы плоскости и пусть 9> — не- некоторое инвариантное свойство фигур на плоскости Ж. Тогда мы можем определить некоторое (тоже инвариантное) свойство • &' фигур на плоскости Ш'. Именно, выбрав произвольный изо- изоморфизм и0: аи-а*', мы условимся, что фигура X' на плоскости Ti' тогда и только тогда обладает свойством SP', когда свойством 5s обладает фи- фигура Хо на плоскости Ш, переходящая при изоморфизме (х0 в фигуру X'. Это определение нуждается, конечно, в проверке коррект- корректности, т. е. в доказательстве того, что при другом выборе изо- изоморфизма (Хо получается то же самое свойство &'. Но, как мы знаем, любой изоморфизм (х: Ж —> 5Ш' имеет вид . Ц = Ц0 о ф, где Ф — некоторый автоморфизм плоскости Ж. Следовательно, фигурой X, переходящей при изоморфизме (х в фигуру X', яв- является фигура, переходящая в фигуру Хо при автоморфизме Ф: X \ / Для завершения доказательства остается заметить, что в силу инвариантности свойства 9* фигура X тогда и только тогда об- обладает этим свойством, когда им обладает фигура Хо, Задание. Докажите, что свойство &' инвариантно. Ясно, что изложенное построение устанавливает естествен- естественное биективное соответствие между инвариантными свойствами фигур на различных евклидовых плоскостях. Следовательно, изучение инвариантных свойств мы можем, как и следовало ожидать, производить на любой конкретной евклидовой плос- плоскости. Результаты будут автоматически применимы к любой другой плоскости. Определение 5. Предметом евклидовой геометрии (точнее, евклидовой планиметрии) является изучение евклидово инва- инвариантных свойств фигур на евклидовых плоскостях. Таким образом, согласно этому определению, «геометриче- «геометрический смысл» имеют только инвариантные свойства (и значит, в частности, инвариантные классы и инвариантные функции). По определению, все евклидово инвариантные свойства евкли- евклидово эквивалентных фигур одинаковы. Поэтому можно сказать 206
(ср. п. 2 § 1 гл. 1), что в евклидовой геометрии эквивалентные фигуры рассматриваются как «одинаковые». Определение 5 является формальным уточнением несколько туманной идеи об евклидовой геометрии как науке, изучающей свойства «абстрактной евклидовой плоскости», конкретными воплощениями которой являются евкли- евклидовы плоскости в смысле определения 2. Оно согласуется с содержательным представлением об евклидовой геометрии как науке, изучающей свойства, общие у всех конгруэнтных фигур (переводящихся друг в друга некоторым движением), поскольку, как мы покажем в гл. 7, автоморфизмы евклидовой плоскости содержательно интерпретируются как движения (сопровождаемые, возможно, симметрией). С описываемой точки зрения аналитическая геометрия мо- может быть охарактеризована как наука, занимающаяся изуче- изучением евклидовой геометрии на ее стандартной модели R2. Пе- Переход от произвольной евклидовой плоскости Ш к стандартной плоскости R2 осуществляется при этом выбором некоторой ев- евклидовой координатной системы a: m~>R2. Таким образом, вместо того чтобы изучать инвариантные свой- свойства фигур на плоскости Ш, в аналитической геометрии изу- изучают инвариантные свойства соответствующих фигур на пло- плоскости R2. Можно сказать, что аналитическая геометрия осно- основывается на отождествлении плоскости SR с плоскостью R2 посредством координатной системы а. Само собой разумеется, что при этом нужно быть очень вни- внимательным и рассматривать только инвариантные свойства фи- фигур плоскости R2, т. е. (см. выше) свойства, перенесение кото- которых на плоскость 50? не зависит от выбора координатной си- системы а. Пример 1. Свойство «координаты точки равны» неинва- неинвариантно. Например, при автоморфизме х?' = х, у' = у+\ точка (х,у), для которой х = у, переходит в точку (х',уг), для которой х' -ф у'. Таким образом, это свойство никакого «гео- «геометрического» (не зависящего от выбора координатной систе- системы) смысла не имеет. Можно показать, что вообще точка (т. е. фигура, состоящая из одной точки) никаких инвариантных свойств не имеет. Это связано с тем, что любую точку можно перевести в любую другую некоторым автоморфизмом (движением). Пример 2. Расстоянием d = d{AuA2) между точками А\(х.и У\) и А2(х2, у2) называется число 207
Покажем, что это число, инвариантно (т. е. что расстояние d имеет «геометрический смысл»). Для этого мы должны дока- доказать, что вычисленное в любой другой евклидовой координатной системе число d остается тем же самым. Но, по определению, переход к другой координатной системе описывается формулами вида тде С — ортогональная матрица, а а и Ь—числа. В частности, если матрица С — собственная, т. е. если ТО / cos 8 — sinG \ V sin e cose/' х = х cos 9 — у sin 8 -f- a, у' = x sin 9 + у cos 8 + 6, и потому x'2 — x[ = {x2 — *,) cos 8 — (z/2 — z/,) sin 9, УГ2-У\ = (X2 - xi)sin e + (Уг - Уд cos e- Следовательно, D - x\f + (y'2 - y\f - (x2 - xtf + (ys - yxf. Аналогично инвариантность числа d доказывается и для случая, когда матрица С несобственная. Таким образом, фигура, состоящая из двух точек, обладает инвариан- инвариантом d. Можно показать, что любой другой инвариант двух точек имеет вид l(d), где / — некоторая функция. Это связано с тем, что пару точек At, Аг можно автоморфизмом перевести в пару точек Ау, А2 тогда и только тогда, когда d^A\, A'^ = di^Al, Л2), Замечание 3. Пример 2 иллюстрирует общий метод введения ¦основных геометрических понятий при формально-аксиоматиче- формально-аксиоматическом построении евклидовой геометрии: берется формула, из- известная из содержательных рассмотрений, и принимается за определение соответствующего понятия. Корректность обес- обеспечивается содержательным смыслом, но, конечно, должна быть формально проверена. Дальнейшие примеры такого рода введе- введения геометрических понятий мы рассмотрим после того, как аналогичным образом аксиоматизируем аффинную геометрию. 3. Аксиоматика аффинной геометрии Мы пришли к аксиоматике евклидовой геометрии, дав фор- формальное описание евклидовых координатных систем. Чтобы по- построить аффинную геометрию, достаточно аналогичным образом описать аффинные координатные системы. 208
В соответствии со сказанным в п. 2 § 1 о формулах пере- перехода от одной аффинной координатной системы к другой, мы будем основываться на преобразованиях ф: lr=r —> кг, задаваемых формулами вида ,.y! ' \b где a, b — числа, а a, b2 — произвольная невырожденная матрица, т. е. формулами х'= aiX-\-а9и 4-а, а, а2 / и Т,. , «. «. *. ^=о. A) г/ = О;Л; + Ь2У + *> bx b2 Определение I. Множество всех преобразований вида A) мы будем обозначать символом Aff(R2). Та же выкладка, что и для группы Ort (R2), показывает, что множество Aff(R2) является группой преобразований. Пусть теперь нам дано некоторое множество Ш вместе с не- непустым семейством Соог(ЗЙ) биективных отображений этого множества на множество R2 и пусть выполнены следующие две аксиомы: Аксиома 1. Для любого отображения a: 2J?-»-R2, принадле- принадлежащего семейству Соог [Ж), и любого преобразования ф: R2-*R2, принадлежащего группе Aff (R2), отображение ф»а: Ш -*¦ R2 при- принадлежит семейству Соог (Ж). Аксиома 2. Для любых двух отображений a, a': 9№-*R2, принадлежащих семейству Соог (Ш), отображение а' о a: R2 -> R2 принадлежит группе Aff (R2). Содержательно аксиома 1 означает, что для любых аффин- аффинных координат х, у величины х', у', выражающиеся формулами A), также являются аффинными координатами, а аксиома 2 означает, что любые две системы аффинных координат х, у и х', у' связаны формулами A). Определение 2. При выполнении аксиом 1 и 2 мы будем множество 5Ш называть аффинной плоскостью, его элементы — точками, отображения, принадлежащие семейству Соог(ЗК),— аффинными координатными системами на плоскости Ш, и для любой аффинной координатной системы аеСоог(ЗЙ) и любой точки М е Ш числа х, у, составляющие пару a(M)eR2, — аф- аффинными координатами точки М в координатной системе а (ч-исло х — абсциссой, а число у — ординатой). 209
Замечание 1. Совершенно аналогично определяется аффин- аффинное пространство. Мы видим, что аксиомы аффинной геометрии вполне анало- аналогичны аксиомам евклидовой геометрии из п. 2. Поэтому всё сказанное в п. 2 автоматически переносится (с незначительными изменениями) и на рассматриваемую сейчас ситуацию. Например, для доказательства непротиворечивости наших аксиом достаточно заметить (ср. п. 2), что множество R2 будет аффинной плоскостью в смысле опре- определения 2, если за семейство Coor(R2) принять группу Aff(R2). Эту плоскость мы будем называть стандартной (или арифме- арифметической) аффинной плоскостью. Замечание 2. Таким образом, одно и то же множество R2 мы можем рассматривать и как аффинную и как евклидову плоскости — в зависимости от того, что мы принимаем за се- семейство Coor (R2). Вообще говоря, во избежание путаницы, це- целесообразно отразить это в обозначениях (например, можно ПИСаТЬ RoPt И Рафф). Изоморфизм аффинных плоскостей определяется дословно так же, как изоморфизм евклидовых плоскостей (см. определе- определение 3 п. 2), после чего мы немедленно получаем (ср. п. 2), что каждая аффинная координатная система а: Ш —¦ R2 пред- представляет собой изоморфизм плоскости Ш на плоскость R2. Доказанное в п. 2 предложение 1 также, конечно, сохра- сохраняется (вместе с доказательством) и для аффинных плоскостей. В частности, отображение \.v. Ш'—*Ш одной аффинной плоскости на дру- другую тогда и только тогда является изоморфизмом, когда оно действует по равенству координат в двух аффинных координат- координатных системах а и а' (т. е. когда [х = а~1 о а'). В частности, это верно и для автоморфизмов произвольной аффинной плоскости (т. е. для ее изоморфизмов на себя). Автоморфизмами стандартной плоскости R2 являются пре- преобразования из группы Aff (R2) и только они. Для любой аффинной плоскости Ж группу всех ее автомор- автоморфизмов мы будем обозначать символом Aff (ЭЙ). Так же, как в п. 2, немедленно доказывается, что любой изоморфизм [х: ЗИ —*ШГ индуцирует некоторый изо- изоморфизм групп AffC№)->AffCW)- В частности, любая формула вида A) выражает некоторый автоморфизм Ф (в данной аффинной координатной системе a: 0K-*R2). Задание произвольного изоморфизма Но: ЗЛ->Ж 210
двух аффинных плоскостей определяет по формуле Ф н-»• ц0 о ф биективно отображение группы AffBft) на множество всех изо- изоморфизмов 9Й->2Л'. Определение 3. Две фигуры на аффинной плоскости 3R назы- называются аффинно эквивалентными, если одну можно нолучить из другой некоторым автоморфизмом Ф: 2Я —*Ш. Свойство фи- фигур на аффинной плоскости называется аффинно инвариантным, если одновременно с фигурой X этим свойством обладает и лю- любая фигура X', ей аффинно эквивалентная. Аналогично опре- определяются аффинно инвариантные функции (ср. определение 4 п. 2). Подобно евклидово инвариантным свойствам (см. п. 2) аф- аффинно инвариантные свойства фигур на двух различных аффин- аффинных плоскостях находятся в естественном биективном соот- соответствии. Это позволяет формально определить аффинную гео- геометрию как науку о таких свойствах. Иначе можно сказать, что аффинная геометрия — это наука, в которой аффинно эквива- эквивалентные фигуры считаются «одинаковыми». Мы не будем здесь детально развивать аффинную геомет- геометрию на основе этого определения, поскольку это без труда де- делается, исходя из ее содержательного представления на основе общего принципа, изложенного в замечании 4 п. 2. Мы ограни- ограничимся для примера только некоторыми замечаниями, касаю- касающимися понятия вектора. Направленные отрезки определяются в формальной теории точно так же, как в содержательной, т. е. как пары, состоящие из двух точек рассматриваемой аффинной плоскости Ж. Два направленных отрезка А\Аъ и А\А\ называются эквиполлент- ными, если в некоторой аффинной координатной системе а: Ш —* R2 имеют место равенства где (jt,, г/,) и (х2, г/2) — координаты точек Ах и А2, а (х\, у\) и {х*2, г/0 — координаты точек А\ и А*2. Конечно, здесь следует проверить корректность этого опре- определения, т. е. независимость его от выбора аффинной коорди- координатной системы. Но это делается без труда. Действительно, пусть x[ = alxl + a2yl + a, x'2 = axx2 + a2y2 + a, **' = а{х\ + а2у\ + а, х2 = ахх*2 + а2у\ + а, 211
— координаты точек Аи Аг, А*, А\ в некоторой другой аффин- аффинной координатной системе. Тогда Х2 - х'\ = а\ {Х2 — х\) + а2 {У2 ~ Ух), У2 У\ — 1 (Х2 Х\) ' 2 w2 — УI) И v*' —v*' — п (х* — лЛ 4- а (и' — и < - у;'=*i (х; - х\) + *2 (у; - у;). Следовательно, если х2 — х{ = х*2 — х* и г/2 — г/х == г/* — у', то х'2 — х\ = х2 — х]' и у'2 — у\ = у2 — if'. Ясно, что отношение эквиполлентности направленных отрез- отрезков является отношением эквивалентности, так что определены классы эквиполлентных направленных отрезков. Эти классы и называются векторами. Допуская вольность, мы будем (как и в содержательной тео- теории) вектор, определенный направленным отрезком AiA2, обо- обозначать тем же символом AiA%. Поскольку, по определению, числа *г — хи Уг — У\ ¦— одни и те же для всех эквиполлентных направленных отрез- отрезков AiAz, они однозначно определяются данным вектором Л4Лг. Эти числа называются координатами вектора А^Аг в рассмат- рассматриваемой аффинной координатной системе. Ясно, что соответствие «вектор» н-* «его координаты» является биективным соответствием между множеством всех векторов на плоскости Ш и множеством R2 всех пар (х, у). Согласно полученным выше формулам B) при переходе к другой аффинной координатной системе координаты векторов преобразуются по формулам Ф 0. B) Подчеркнем, что это преобразование однородно (не содержит свободных членов), тогда как преобразования координат точек неоднородны. Теперь уже ясно, что следует называть суммой векторов, произведением вектора на число и т. п. Легко видеть, что вся развитая в гл. 1 теория векторов (в ее аффинной части) пол- полностью при этом сохраняется. Репером произвольной аффинной координатной системы а: Э№—>Ы2 называется тройка точек (О, Eit Е2), переходящих 212
соответственно в пары @, 0), A, 0) и @, 1). Репер однозначно определен, если задана точка О — начало координатной систе- системы и векторы е\ = OEi и е2 = ОЕ2. Поэтому репером можно называть и тройку Ое&ъ Радиус-вектор ОА произвольной точки А (х, у) имеет коор- координаты (х, у) и потому представляется в виде О А = хе{ + уе2. Следовательно, зная репер аффинной координатной системы, мы можем найти координаты любой точки плоскости, т.е. пол- полностью восстановить эту координатную систему. Иными словами, аффинная координатная система однозначно определяется своим репером. Покажем теперь, что любая тройка Oe^e-i, состоящая из произвольной точки О и двух линейно независимых векторов е4 и е2, является репером некоторой (однозначно определенной) аффинной координатной системы. Действительно, поскольку точка О дана, каждой точке А от- отвечает ее радиус-вектор ОА. Поскольку векторы et и е2 линейно независимы, вектор ОА однозначно по ним раскладывается: ОА = хеу-{- уе2. C) Сопоставив точке А полученную таким образом пару (х, у), мы построим, следовательно, некоторое отображение а: Зй —»¦ R2. Ясно, что при этом отображении точка О переходит в пару @, 0), а концы Ei и Е2 векторов et и е2, отложенных от точки О,-—в пары A,0) и @, 1). Нам остается только доказать, что построенное отображение а: Т1 —> R2 является аффинной коор- координатной системой. Рассмотрим с этой целью произвольную аффинную коорди- координатную систему а0: 3№->R2. Пусть в этой системе векторы е4 и е2 имеют координаты (аь &4) и (а2, Ь2). Тогда ввиду равенства C) вектор ОА будет иметь координаты Далее, пусть (а, Ь) — координаты точки О в координатной сис- системе ао. Тогда координаты точки А будут иметь вид а2у + а, Ьхх-\-Ь2у + Ь). Это означает, что если мы введем в рассмотрение отображе- отображение <р: R2->R2, 213-
-определенное формулами х' == агх + а2у + а, у' = Ь1х + Ь2у + Ь, то отображение ф°а будет совпадать с отображением ао- Но поскольку векторы ei и ег линейно независимы, определи- определитель х а2 отличен от нуля, и потому отображение гр принадлежит группе Aff(R2). Следовательно, это отображение биективно и обратное к нему отображение ф также принадлежит группе AH(R2). Таким образом, где qr'eAffCR2). Но согласно аксиоме 1 отображение qr'octo является аффинной координатной системой. Следовательно, аф- аффинной координатной системой является и отображение а. Таким образом, мы видим, что и в формально-аксиоматиче- формально-аксиоматической теории аффинные координатные системы могут быть опи- описаны точно так же, как и в содержательной теории. Рассмотрим теперь с формально-аксиоматической точки зре- зрения вопрос о соотношении между евклидовой и аффинной гео- геометриями. Пусть Ш — произвольная евклидова плоскость (чтобы подчеркнуть евклидовость, мы будем эту плоскость иногда обо- обозначать символом ЙЯевкл)- Выбрав некоторую евклидову коорди- координатную систему а0: Ж->Е2, рассмотрим всевозможные отображения a: 2ft->R2, имеющие вид а == ф о а0, D) где ф — произвольное преобразование из группы Aff(R2). Задание. Докажите, что семейство всех преобразований вида D) удо- удовлетворяет аксиомам 1 и 2 определения аффинной плоскости. Определение 4. Плоскость 2Я, снабженную семейством аф- аффинных координатных систем вида D), мы будем называть аф- аффинной плоскостью, определенной евклидовой плоскостью ЯЯл, и будем обозначать ее символом Зйафф- Упражнение. Докажите корректность определения D), г. е. тот факт, что ••семейство Соог(ЭКафф) аффинных координатных систем виДа D) ие зависит ¦от выбора евклидовой координатной системы Оо. Указание: воспользуй- воспользуйтесь тем, что группа Ort(R2) является подгруппой группы Aff(R2): Ort (R2) с Aff (R2), E) 214
и, следовательно, среди координатных систем вида D) содержатся все ев- евклидовы координатные системы на плоскости ЯНевкл- Замечание 3. Обратим внимание на то, что возможен и «об- «обратный» процесс построения по произвольной аффинной плос- плоскости Зйафф Некоторой еВКЛИДОВОЙ ПЛОСКОСТИ ЗИевкл- ДЛЯ ЭТОГО достаточно воспользоваться той же формулой D), принимая за ао некоторую фиксированную аффинную координатную систему,, а за ф — произвольное преобразование из группы Ort (R2). Од- Однако получающаяся евклидова плоскость ЙЯевкл зависит от выбора координатной системы ао. Чтобы получить вполне опре- определенную евклидову плоскость, необходимо как-то ограничить выбор системы ао. Обычно это делается посредством введения в аффинную плоскость некоторой метрики. Все эти вопросы под- подробно разбираются (сразу для любого п) в курсе линейной алгебры. Здесь же для нас достаточно иметь в виду, что одна и та же аффинная плоскость Зйафф может определяться различ- различными (хотя, конечно, и изоморфными) евклидовыми плоскос- плоскостями Зйевкл- Поскольку плоскость 2Яафф однозначно определяется плос- плоскостью Зйевкл, можно (и удобно) несколько сократить термино- терминологию, называя, например, автоморфизмы плоскости 2Яафф аф- аффинными автоморфизмами плоскости ЗИевкл = ЭК (и в соответ- соответствии с этим заменяя обозначение АН(9йафф) обозначением Aff(JW)). Из включения E) немедленно вытекает соответствующее- включение Ort (ЭИ) cz Aff (Зй) для автоморфизмов плоскости ffl, означающее, что любой евклидов автоморфизм является аффинным автомор- автоморфизмом. Поэтому любое аффинно инвариантное свойство фигур на плоскости 9Й (точнее, на плоскости 2Яафф) будет и евклидово инвариантным. Другими словами, любое утверждение аффинной геометрии справедливо и в евклидовой геометрии. В этом смыс- смысле аффинная геометрия является «частью» евклидовой гео- геометрии. Например, все сказанное выше о векторах в аффинной гео- геометрии (на аффинной плоскости) автоматически справедливо и в евклидовой геометрии (на евклидовой плоскости). Но, ко- конечно, на евклидовой плоскости можно пойти значительна дальше (построить метрическую теорию векторов). Для этого в первую очередь необходимо определить ска- скалярное произведение щаг двух векторов а4 и аг. Пусть в некоторой евклидовой координатной системе а вектор at имеет координаты (хи z/4), а вектор аг— координа- координаты (х2, уг). Тогда мы, по определению, положим 215-
В любой другой евклидовой координатной системе а' коор- координаты х', у' векторов связаны с их координатами х, у в систе- системе а формулами вида B), где теперь { а2 — произвольная ортогональная матрица, т. е. такая (см. п. 6 § 5 гл. 1), что a\ + b\=\, ala2 + blb2^=Q, а\ + Ь\=\. Следовательно, вычисляя скалярное произведение в координат- координатной системе а', мы получим + (Р Л + ЗД (Ь\Ч + Ь2У2) = («1 + Щ Х\Ч + + (а,а2 + Ь,62) (л:,г/2 + х2ух) + (а| + ^) уху2 = ххх2 т. е. тот же результат, что и в координатной системе а. Это означает, что наше определение скалярного произведе- произведения корректно. Определив скалярное произведение, мы можем теперь опре- определить длину \а\ вектора а и угол \а,Ь\ между векторами а и Ъ известными формулами ^ Г а|^й| . F) Задание. Докажите, что а2 ^ 0 и ab ^ |а|«|6| (неравенство Коши — Буняковского), т. е. что формулы F) действительно определяют некоторые числа. Обратим внимание на то, что длина вектора а = А{А2 сов- совпадает с расстоянием d(Ai,A2) между точками Ах и А%, как оно было определено в примере 2 п. 2. Тот факт, что аффинная геометрия является частью евклидо- евклидовой геометрии, позволяет доказывать теоремы аффинной гео- геометрии «евклидовыми методами», т. е. с использованием мет- метрических понятий. Формально это означает, что от аффинной плоскости Зйафф мы переходим к одной из евклидовых плоско- плоскостей Зйевкл, определяющих плоскость ЯКафф. Конечно, мы долж- должны при- этом проследить, чтобы окончательный результат был аффинно инвариантен (не зависел от выбора евклидовой плос- плоскости Зйевкл)- Например, данное в начале п. 1 § 6 определение бивектора использует метрические понятия (площадь). Чтобы установить его аффинный характер, мы были вынуждены доказать его равносильность с другим, уже чисто аффинным определением (основывающимся на понятии элементарного преобразования). 216
4. Аффинная геометрия над полем комплексных чисел При обсуждении в п. 2 § 2 теоремы единственности для ал- алгебраических линий мы столкнулись с желательностью введе- введения точек с комплексными координатами. Как мы увидим в гл. 6, уже в теории линий второго порядка такие точки оказы- оказываются совершенно необходимыми. Конечно, введение в рассмотрение подобного рода «точек» означает окончательный переход к алгебре, лишь излагаемой в геометрических терминах. Все то же самое можно сделать, вообще не пользуясь геометрической терминологией. Однако опыт показывает, что даже чисто алгебраические вещи, изло- изложенные на геометрическом языке, приобретают особую четкость и выразительность, и их «геометризация» оказывается не просто игрой в определения, а мощным орудием исследования, позво- позволяющим привлечь к изучению алгебраических объектов геомет- геометрические методы и геометрическую интуицию. Как же можно ввести «комплексные точки»? Если на плос- плоскости выбрана аффинная система координат, то ее (обычные) точки находятся во взаимно однозначном соответствии с парами (х, у) вещественных чисел и могут быть с такими парами отож- отождествлены. Поэтому мы можем ввести комплексные точки прос- просто как пары (х, у) произвольных комплексных чисел. Так во многих учебниках аналитической геометрии и делается. Однако эта конструкция комплексной плоскости зависит от выбора в обычной плоскости некоторой аффинной координатной системы, так что, строго говоря, мы получаем не одну комплек- комплексную плоскость, а столько, сколько существует различных аф- аффинных координатных систем. Хотя, пользуясь формулами пре- преобразования аффинных координат, эти комплексные плоскости можно друг с другом отождествить, все же значительно удоб- удобнее и изящнее дать определение комплексной плоскости, не за- зависящее от выбора в обычной плоскости аффинной системы координат. С этой целью мы заметим, что в аксиомах аффинной гео- геометрии, рассмотренных в предыдущем пункте, специфика поля R никак по существу не используется. Поэтому их можно пере- переформулировать, заменяя всюду поле R полем комплексных чи- чисел С. В результате мы и получим аксиомы аффинной геомет- геометрии на комплексной плоскости. Более того, эти аксиомы можно формулировать и для слу- случая, когда поле R заменено произвольным полем К. Тогда мы получим аффинную геометрию плоскости над полем К. Замечание L Очень любопытные «геометрии» получаются, когда поле К конечно. Например, для простейшего поля, состоящего из двух элементов, мы получаем геометрию, в которой имеется только четыре (!) точки. Мы такими геометриями здесь заниматься не будем (хотя они сами по себе очень 217
аинтересны и в последнее время получили совершенно неожиданные примене- применения, например, в теории кодирования). Поскольку аффинную геометрию, как выясняется, можно строить над произвольным полем К, мы пока его специализиро- специализировать не будем (только потом, когда мы перейдем к более глу- глубоким вопросам, где специфика поля будет играть роль, мы бу- будем считать, что им является интересующее нас сейчас в пер- первую очередь поле С). Итак, мы будем считать данным некоторое (пока произволь- произвольное) поле К. Элементы этого поля мы будем называть числами. Определение 1. Пусть К2 — множество всех пар (х, у) чисел поля К; обозначим через Aff (К2) совокупность всех преобразо- преобразований <р: К2-*К2, залаваемых формулами вида х' = ахх + а2у + а, Ь2 y> = blX + b2y + b, * ? *°- 0) 'Ясно, что множество Aff (К2) является группой преобразований. Определение 2. Пусть Ж — произвольное множество, для которого задано некоторое семейство Соог(ЗЙ) его биективных отображений а: ЗЯ-* К2 на множество К2. Мы будем называть Ж аффинной плоскостью над полем К, а отображение а <= Соог(9№) —аффинными коор- •динатными системами на этой плоскости, если (ср. п. 3) выпол- выполнены следующие две аксиомы: Аксиома 1. Если а е Соог (Ш) и фе Aff (К2), то Ф о а е Соог (ЭК).' Аксиома 2. Если а, а' е Соог (Ж), то а' о а е= Aff (К2). При К = R мы получаем уже известное нам определение ¦обычной аффинной плоскости. Плоскость над полем R назы- называется вещественной плоскостью. Аналогично, плоскость над полем С (случай, для нас сейчас наиболее интересный) назы- называется комплексной плоскостью. Ясно, что, положив Соог (К2) = Aff (К2), мы определим К2 жак аффинную плоскость. Эта плоскость называется стандарт- стандартной (или арифметической) плоскостью над полем К. Следовательно, аксиомы 1 и 2 непротиворечивы (поскольку непротиворечивы аксиомы, определяющие поле К).
Определение 3. Биективное отображение одной плоскости над полем К на другую (или ту же са- самую) плоскость называется изоморфизмом, если отображение- а': Ш' —* К2 тогда и только тогда является координатной систе- системой на плоскости W, когда отображение а' ° \х является коор- координатной системой на плоскости SR (ср. определение 3 п. 2). Ясно, что отображение [х: SR —*¦. К2 тогда и только тогда является изо- изоморфизмом, когда оно является аффинной координатной систе- системой. Кроме того, отображение ц: 3R'—* Ш тогда и только тогда является изо- изоморфизмом, когда оно действует по равенству координат в двух аффинных координатных системах а и а', т. е. когда ц = а~' о а'. Как и в вещественном случае, группу всех автоморфизмов- Ф: Ш -+ Ш аффинной плоскости SR мы будем обозначать сим- символом AffBR). Ясно (ср. пп. 2 и 3), что любой изоморфизм [i: Ш -* Ш' индуцирует некоторый изо- изоморфизм групп At f (a») -»> Af f (sreo- Понятие аффинно инвариантного свойства фигур на плос- плоскостях над полем К вводится точно так же, как и в случае поля R. Аффинная геометрия над полем К является, по определению,, наукой о таких свойствах. В этой геометрии понятия «направленного отрезка», «векто- «вектора» и т. п. вводятся дословно так же, как в геометрии над по- полем R (см. п. 3). В частности, все сказанное в п. 3 о связи между аффинными координатными системами и реперами пол- полностью остается в силе. Поэтому еще раз повторять это мы здесь не будем. Задание. Проверьте, что вся аффинная теория векторов сохраняется и над. любым полем К. Замечание 2 (очень важное!). Поскольку в произвольном поле нет понятий «положительное — отрицательное», все свя- связанное с понятием ориентации не переносится на случай произвольного поля К, и в частности, на случай поля С. На- Например, не переносится понятие полуплоскости, так что гово- говорить, скажем, о «полуплоскости комплексной плоскости» бес- бессмысленно. Понятие бивектора, тем не менее, имеет смысл над любым полем К, поскольку сохраняется понятие элементарного преоб- преобразования. 21»
Замечание 3. Поскольку понятие ортогональной матрицы (как матрицы, удовлетворяющей соотношению С'С = Е) имеет смысл над любым полем К, мы можем ввести группу Ort(K2) и уже известным нам способом опреде- определить евклидову геометрию над полем К. Однако, в отличие от аффинной геометрии, эта геометрия даже формально резко отличается от евклидовой геометрии над полем R. Например, в ней нельзя, вообще говоря, ввести понятие длины отрезка (поскольку в поле могут не существовать квадрат- квадратные корни), не говоря уже об угле между отрезками. При К =С длину и угол ввести, конечно, можно, но, например, длина будет комплексным числом и может быть равна нулю даже тогда, когда отрезок невырожден. Все сказанное выше можно, конечно, повторить (с незначи- незначительными, само собой разумеющимися изменениями) и для лю- любого п. В частности, при п = 1 и К = С мы получаем понятие комплексной прямой. На такой прямой имеется одна комплекс- комплексная координата г и переход от одной такой координаты к другой описывается формулой вида г' -_= az + b, где а и b — произвольные комплексные числа, причем а Ф 0. Поскольку z = х + iy, точки комплексной прямой задаются двумя вещественными числами хну, так что геометрически комплексная прямая пред- представляет собой плоскость. Однако отождествлять комплексную прямую с вещественной аффинной плоскостью нельзя, поскольку формулы преобра- преобразования координат в них различны. Действительно, положив a — al-\-ia2, b = b{ + ib2, мы можем формулу A) переписать в координатах х и у в сле- следующем виде: х' =alx — a2y + bu B) у' = а2х + аху + Ь2, — ясно, что не любое преобразование из группы Aff (R2) можно так записать. Иначе говоря, группа Aff (С1) преобразований A), записан- записанных в виде B), является лишь подгруппой группы Aff (R2). Это показывает, что геометрия комплексной прямой (рас- (рассматриваемая как геометрия плоскости) богаче аффинной геометрии плоскости. Ниже, в п. 2 § 4 гл. 7, мы идентифицируем эту геометрию с одной из плоских геометрий, читателю по существу известных. 220
5. Вещественно-комплексная геометрия В построенной в предыдущем пункте (при К = С) аффин- аффинной геометрии нет места понятию «вещественная точка», по- поскольку точка, имеющая вещественные координаты в одной аффинной координатной системе, вполне может иметь невещест- невещественные координаты в другой. Это означает, что в нашем стрем- стремлении ввести комплексные точки мы зашли слишком далеко и потеряли по дороге контакт с обычной вещественной плос- плоскостью. Хотелось бы остановиться «на полпути» и устроить комплексную плоскость так, чтобы она содержала обычную ве- вещественную комплексную плоскость в качестве подмножества. Тогда мы могли бы работать, пока это возможно, в этой веще- вещественной плоскости (сохраняя, тем самым, геометрическую на- наглядность) и выходить в объемлющую комплексную плоскость только тогда, когда это сделается совершенно необходимым. Аксиоматическое построение такой «вещественно-комплекс- «вещественно-комплексной» плоскости можно осуществить, заметив, что любое преоб- преобразование ср: R2-»R2 из группы Aff (R2) однозначно опреде- определяет некоторое преобразование ф: С2-»С2 из группы Aff (С2), а именно, преобразование, задаваемое теми "же формулами х' = ахх + а2у + а, (Таким образом, различие между преобразованиями ср и ф сос- состоит лишь в том, что в случае преобразования ср величины х и у могут принимать лишь вещественные значения, тогда как для преобразования <р они могут иметь любые комплексные значения.) Поскольку соответствие ср н-* ф строится без какого-либо произвола (является «естественным» соответствием), мы мо- можем преобразования ср и ф отождествлять или хотя бы обозна- обозначать одним и тем же символом. Ни к каким неудобствам это привести не может Отождествив преобразования ср и ф, мы можем, следова- следовательно, считать, что группа Aff (R2) вложена в группу Aff (С2). По определению, преобразование ср е Aff (С2) тогда и только тогда принадлежит Aff(R2), когда все коэффициенты этого пре- преобразования являются вещественными числами. Ясно, что если преобразование ере Aff (С2) принадлежит подмножеству Aff(R2), то преобразование ср также принад- принадлежит этому подмножеству, и если cpi <= Aff (R2) и ср2 <= Aff (R2), то ф[ о ф2 е Aff (R2). По определению, это означает, что подмножество Aff (R2) группы Aff (С2) является ее подгруппой. Пусть теперь нам дано некоторое множество Tt вместе с непустым семейством Соог (Ж) его биективных отображений на множество С2 и пусть выполнены следующие две аксиомы: 221
Аксиома 1. Для любого отображения а: 9№-*С2, принадле- принадлежащего семейству СоогC№), и любого преобразования ср: С2->С2* принадлежащего подгруппе Aff (R2) группы Aff (С2), отображе- « г Ф»а принадлежит семейству СоогC№). „ Аксиома 2. Для любых двух отображений а, а': 9№->С2, принадлежащих семейству Соог (ЗЯ), отображение а' ° а: С2-*С2 принадлежит подгруппе Aff (iR2). Эти аксиомы полностью аналогичны аксиомам 1 и 2 для комплексной плоскости и отличаются от них только тем, что> преобразования ср предполагаются теперь принадлежащими подгруппе Aff(R2), т. е. имеющими вещественные коэффи- коэффициенты. Определение 1. При выполнении аксиом 1 и 2 мы будем множество ЗЯ. называть (аффинной) вещественно-комплексной плоскостью, его элементы — точками, отображения, принадле- принадлежащие семейству Соог(ЗЯ), — аффинными координатными сис- системами, и для любой аффинной координатной системы а: Ш —»¦ С2 и любой точки М е 9JJ числа х, у, составляющие пару а{М) е С2, — координатами точки М в координатной сис- системе а. Таким образом, вещественно-комплексная плоскость содер- содержит точки с произвольными комплексными координатами, но преобразования координат в ней допускаются только с вещест- вещественными коэффициентами. Ясно, что в такой плоскости уже имеет смысл говорить о ве- вещественных точках, поскольку при любом преобразовании ко- координат вещественные координаты переходят в вещественные. Непротиворечивость и полнота аксиом 1 и 2 доказываются по уже известному нам образцу: положив Соог (С2) = = Aff(R2), мы превращаем множество С2 в вещественно- комплексную плоскость (называемую стандартной или арифме- арифметической вещественно-комплексной плоскостью), и любая ве- вещественно-комплексная плоскость 9JJ изоморфна плоскости С2 (причем изоморфизмами 9JJ —> С2 являются координатные сис- системы и только они). Задание. Сформулируйте определение изоморфизма двух вещественно- комплексных плоскостей. Замечание 1. Обратим внимание на то, что одно и то же множество С2 является областью действия различных геомет- геометрий: вещественно-комплексной и чисто комплексной. Все зави- зависит от того, какие отображения мы считаем координатными системами. Пусть 2ЯВИЦ — совокупность всех вещественных точек веще- вещественно-комплексной плоскости Ш. По определению, каждая координатная система а: 9№->С2 отображает множество 9№вещ в подмножество R2 множества С2, состоящее из пар (х, у) веще- вещественных чисел. Поэтому, если мы будем ее рассматривать 222
только на этом множестве, она будет некоторым отображением (очевидно, биективным) множества 2ЯвеЩ на множество R2. Очевидным образом проверяется, что полученное семейство СоогBЯвещ) биективных отображений 5ЯвеЩ—«-R2 удовлетворяет аксиомам 1 и 2 определения плоскости над полем R. Тем самым доказано, что совокупность Швсщ всех вещественных точек вещественно- комплексной плоскости Ш естественным образом определяется как вещественная плоскость. С другой стороны, пользуясь тем, что Aff(R2) с: Aff (С2), мы можем произвольной вещественно-комплексной плоскости Ш сопоставить комплексную плоскость %1комал, точками кото- которой являются точки плоскости 5Я (т. е. которая как множество совпадает с 9JJ), а семейство Соог(ЗИкомпл) аффинных коорди- координатных систем которой состоит из всевозможных отображений ЗЙ-»С2, имеющих вид ф°а, где аеСоогEЯ) и (peAff(C2). Тот факт, что 2йкомпл действительно является комплексной плос- плоскостью, т. е. что семейство Соог(ЗИК0МПЛ) удовлетворяет аксио- аксиомам 1 и 2 из п. 4 (при К = .С), проверяется автоматически. Таким образом, любую вещественно-комплексную плоскость 5И мы можем превратить в комплексную плоскость 2ИКОМПЛ, приняв за ее аф- аффинные координатные системы всевозможные отображения вида Ф о а, где а е Соог (9JJ) и ф е Aff (С2). Замечание 2. Переход от плоскости Ш к плоскости ЗДОк°мпл вполне ана. логичен описанному в п. 3 переходу от евклидовой плоскости Ш к аффин- аффинной плоскости ЯЛафф> обязанному своей возможностью тому, что группа Ort (R2) является подгруппой группы Aff (R2). Поскольку вещественно-комплексная плоскость получается из комплексной плоскости сужением семейства допустимых аф- аффинных координатных систем, любое понятие, имеющее смысл в комплексной плоскости («вектор», «репер» и т. п.), будет иметь смысл и в вещественно-комплексной плоскости. При этом каждое утверждение, верное в комплексной плоскости, будет верно и в вещественно-комплексной плоскости. Однако в вещественно-комплексной плоскости могут иметь смысл и понятия, бессмысленные в комплексной плоскости. На- Например, в вещественно-комплексной плоскости 5Я можно гово- говорить о вещественных векторах, т. е. о векторах с вещественными координатами. Такие векторы естественным образом отождест- отождествляются с векторами на вещественной плоскости ЗЯВОЩ. Замечание 3. Строго говоря, векторы на вещественной плоскости и ве- вещественные векторы представляют собой различные математические объекты: первые являются классами эквиполлентных направленных отрезков АВ с ве- вещественными концевыми точками А и В, тогда как вторые являются клас- классами эквиполлентных направленных отрезков АВ, обладающих тем свой- свойством, что координаты точек А и В отличаются на вещественные числа. Тем 223
не менее, поскольку эти классы находятся в естественном биективном соот- соответствии, их можно безболезненно отождествлять. Аналогично, для любой точки (вектора) на вещественно- комплексной плоскости можно говорить о комплексно-сопряжен- комплексно-сопряженной точке (векторе). Точка (вектор) тогда и только тогда веще- вещественна, когда она (он) совпадает с комплексно-сопряженной точкой. Специфика вещественно-комплексной плоскости отражается также и в том, что для нее не любая тройка, состоящая из не- некоторой точки О и двух линейно независимых векторов et и е2, является репером аффинной координатной системы (хотя по- прежнему любая аффинная координатная система однозначно определяется своим репером). Действительно, ясно, что для этого необходимо, чтобы точка О и векторы е4 и е2 были веще- вещественны. Верно и обратное, т. е. любая тройка Ое^г, состоящая из вещественной точки О и двух вещественных линейно независимых векторов е^ и е->, яв- является репером некоторой (однозначно определенной) аффин- аффинной координатной системы на вещественно-комплексной плос- плоскости. Доказательство по существу дословно совпадает с доказа- доказательством соответствующего утверждения из п. 3 и потому мы его опустим. Поскольку мы не владеем формальным определением поня- понятия линии (см. п. 4 § 2), определить, что такое линии на плос- плоскости над произвольным полем К, мы не можем. Однако поня- понятие алгебраической линии (вполне достаточное для наших целей) имеет, очевидно, смысл над любым полем (поскольку по- понятие многочлена определено над любым полем и при линейной замене неизвестных многочлен переходит в многочлен). При этом понятие порядка алгебраической линии встречает те же трудности, что и в случае поля R (см. п. 2 § 2), усугубляющиеся для полей конечной характеристики еще и тем, что над таким полем многочлен может быть тождественно равен нулю даже тогда, когда его коэффициенты отличны от нуля. Над полем С. комплексных чисел по крайней мере часть из этих трудностей исчезает (см. п. 2 § 2). Это и является основной причиной, почему мы ввели в рассмотрение комплексные плос- плоскости. Определение 2. Линия (алгебраическая) на вещественно- комплексной плоскости Ж называется вещественной, если в не- некоторой аффинной координатной системе она выражается урав- уравнением с вещественными коэффициентами. Ясно, что это определение корректно (линия, имеющая урав- уравнение с вещественными коэффициентами в одной аффинной ко- координатной системе, будет иметь уравнение с вещественными 224
коэффициентами и в любой другой аффинной координатной системе). Каждая такая линия Г определяет некоторую линию у (того- же порядка) на вещественной плоскости Штш-. Подчеркнем, что как множества точек линии Г и у различ- различны: линия у является пересечением линии Г с вещественной плоскостью Швсщ, так что в общепринятых теоретико-множе- теоретико-множественных обозначениях: Y = Г Л Швеш. Тем не менее, по традиции принято называть точки линии Г, не принадлежащие линии у, мнимыми точками линии у. Из того, что поле .С, комплексных чисел алгебраически замкнуто (любой многочлен положительной степени от одной переменной имеет в нем корень), непосредственно вытекает, что на вещественно-комплексной плоскости (так же, как и на комп- комплексной плоскости) любая алгебраическая линия имеет точки (не является пустым множеством). Конечно, ее пересечение у с вещественной плоскостью тем не менее может быть пустым (в этом случае она называется нулевой линией). Подчеркнем, что хотя линии на вещественно-комплексной (и комплекс- комплексной) плоскости определяются формально так же, как линии (алгебраиче- (алгебраические) на вещественной плоскости, с наглядно геометрической точки зрения они глубоко различны. Действительно, положение точки на линии в веще- вещественной плоскости определяется, вообще говоря, значением одного веще- вещественного параметра, и в этом смысле эти линии одномерны, тогда как положение точки на линии в комплексной (или вещественно-комплексной) плоскости определяется значением одного комплексного параметра, т. е. зна- значениями двух вещественных параметров (действительной и мнимой частью комплексного параметра), так что эти линии двумерны. Иными словами, ли- линии в комплексной (или вещественно-комплексной) плоскости представляют собой с наглядной точки зрения поверхности. Сама комплексная (или вещественно-комплексная) плоскость описывается четырьмя вещественными параметрами и потому является четырехмерным образованием, наглядно геометрически не описываемым. Мы видим, в частности, что основную массу точек каждой линии на вещественно-комплексной плоскости составляют мнимые точки (если пред- представлять себе эту линию как поверхность, то ее вещественные точки будут изображаться на этой поверхности точками некоторой линии). Очень важно иметь также в виду, что алгебраические линии на ком- комплексной плоскости являются весьма специальным частным случаем двумер- двумерных образований, которые можно на этой плоскости рассматривать. Напри- Например, вещественная плоскость ЗМвещ (также являющаяся двумерной поверх- поверхностью) алгебраической линией заведомо не является, т. е. условие веще- вещественности координат х и у нельзя записать в виде равенства f(x, у) = О, где f(x,y)—некоторый многочлен (этот факт мы докажем ниже, в качестве простого следствия некоторых общих теорем; см. п. 2 § 1 гл. 3). 8 М. М. Постников 225
Так как Ort (R2) с Aff (R2) с Aff (С2), то группа Ort(R2) является подгруппой группы Aff (С2). Это позволяет нам повторить определение вещественно- комплексной плоскости с заменой группы Aff(R2) группой Ort(R2). В результате мы получим определение евклидовой вещественно-комплексной плоскости. Так же, как и выше, показывается, что множество .С2, рассматриваемое вместе с семейством преоб- преобразований Ort(R2) (считаемых теперь преобразованиями С2—*С2), является евклидовой вещественно-комплексной плос- плоскостью, и что ч любая евклидова вещественно-комплексная плоскость изо- изоморфна стандартной евклидовой вещественно-комплексной плос- плоскости С2. Следовательно, аксиомы евклидовой вещественно-комплекс- вещественно-комплексной геометрии непротиворечивы и полны. Ясно, что вещественная плоскость Швсш- евклидовой вещественно-комп- вещественно-комплексной плоскости Ж естественным образом определяется как евклидова плоскость в смысле п. 2. Это означает, что для вещественных точек евклидовой ве- вещественно-комплексной плоскости сохраняется вся обычная евклидова геометрия. Обратим еще раз внимание на тот замечательный факт, что разнообразные геометрии мы строили в этом параграфе по су- существу одним и тем же способом. Возможности этого способа отнюдь не исчерпываются построенными геометриями. Мы к этому вопросу еще вернемся в § 4 гл. 7. Дополнение. Аксиоматика Гильберта 1. Формулировка аксиом Аксиоматика Гильберта была первой формальной аксиоматикой геомет- геометрии, получившей широкое распространение. Мы приведем эту аксиоматику в чуть-чуть модифицированном виде. В аксиоматике Гильберта имеется три рода основных объектов: «точки», «прямые», «плоскости», и три основные отношения: «принадлежать», «между», «конгруэнтность». Отношение «принадлежать» связывает точки с прямыми и плоскостями: «точка принадлежит прямой», «точка принадлежит плоскости». Таким образом, 226
собственно говоря, имеется два отношения принадлежности: для точек и прямых и для точек и плоскостей. Вместо термина «принадлежит» употреб- употребляются также (исключительно для упрощения формулировок) такие термины, как «лежит на», «проходит через», «инцидентны» и т, п. Например, высказы- высказывания «точка Л принадлежит прямой а», «прямая а проходит через точку Л», «прямая а инцидентна точке А», «точка А инцидентна прямой а» озна- означают, по определению, одно и то же. Вместо «точки А и В принадлежат прямой а» можно говорить «прямая а соединяет точки А и В», а вместо «точка А принадлежит прямым а и |3» — «прямые аир пересекаются в точ- точке Л» и т. д. Вводится также неосновное отношение «прямая а принадлежит плоско- плоскости П», по определению, означающее, что любая точка, принадлежащая пря- прямой а, принадлежит также и плоскости П. Отношение «между» является отношением, связывающим три (различ- (различные) точки А, В, С, принадлежащие одной прямой. Если точки А, В, С связаны этим отношением, то говорят, что «точка В лежит между точка- точками Л и С». Отношение «конгруэнтность» связывает некоторые неосновные объекты, называемые «отрезками» и «углами». Эти объекты мы определим ниже. Та- Таким образом, на самом деле имеется два отношения конгруэнтности: одно — связывающее отрезки, а-другое—углы. Аксиомы Гильберта довольно сложны и их неудобно формулировать не- непосредственно для основных объектов и отношений (хотя конечно, это воз- возможно). Целесообразнее вводить эти аксиомы постепенно (группами), пере- перемежая их теоремами и определениями, необходимыми для формулировки следующих аксиом. Принято разбивать аксиомы Гильберта на пять групп. Первая группа аксиом (аксиомы принадлежности) IV Для любых двух точек А и В существует прямая, проходящая через эти точки. Ь. Если точки А и В различны, то проходящая через них прямая един- единственна. Ь. На каждой прямой существуют по крайней мере две точки. U. Существуют по крайней мере три точки, не лежащие на одной прямой. U. Для любых трех точек А, В, С существует проходящая через эти точки плоскость. Ь. Если точки А, В, С не лежат на одной прямой, то проходящая через них плоскость единственна. 17. На каждой плоскости существует по крайней мере одна точка. 18. Если две различные точки А и В прямой а принадлежат плоскости П, то прямая а принадлежит плоскости П. Ь.- Если две плоскости имеют общую точку, то они имеют по 'крайней мере еще одну общую точку. Г 1ю. Существует по крайней мере четыре точки, не принадлежащие одной плоскости. 8* 227
С помощью этих аксиом могут быть уже доказаны некоторые теоремы. Например, можно доказать, что 1) две (различные) прямые имеют не более одной* общей точки; 2) две (различные) плоскости либо не имеют общих точек, либо имеют общую прямую, на которой лежат все общие точки этих плоскостей; 3) плоскость и не лежащая на ней прямая имеют не более одной общей точки; 4) через прямую и не лежаи'ую на ней точку проходит одна и только одна плоскость; 5) через две пересекающиеся (но не совпадающие) прямые проходит одна и только одна плоскость; 6) каждая плоскость содержит по крайней мере три различные точки. Докажем, для примера, утверждение 6). По аксиоме Ь каждая плоскость. П содержит по крайней мере одну точку А. По аксиоме 1H существует точка В, не принадлежащая плоско- плоскости П. По аксиомам Ь и Ь существует единственная прямая АВ, проходя- проходящая через точки А и В. По аксиоме U существует точка С, не принадлежа- принадлежащая прямой АВ. По аксиомам Ь и Ь существует единственная плоскость ABC, проходящая через точки А, В, С. Плоскость ABC и данная плоскость П имеют общую точку А. Поэтому по аксиоме Ь они имеют еще одну общую точку D. Точки А, В, D не принадлежат одной прямой (ибо в противном случае точка В принадлежала бы в силу аксиомы 1а плоскости П) и потому через них проходит единственная плоскость ABD (аксиомы 15 и 16). По аксиоме 1ю существует точка Е, не принадлежащая плоскости ABD, Точки А, В, Е не принадлежат одной прямой и потому содержатся в единственной плоскости ABE (аксиомы Is и Ь), отличной от плоскости ABD. Плоскости ABE и П имеют общую точку А и потому (аксиома I») они имеют еще одну общую точку F (не принадлежащую прямой АВ). Так как точки D и F не принадлежат прямой АВ, то (утверждение 2)) они не являются общими точ- точками плоскостей ABD и ABF и, следовательно, различны. Таким образом, плоскость П содержит три различные точки A, D, F. Задание. Докажите утверждения 1)—5). Вторая группа аксиом (аксиомы порядка) \ Hi. Каждая точка, лежащая между точками А и С, лежит также между точками С и А. П2. Для любых (различных) точек А и В на прямой АВ существует такая точка С, что точка В лежит между точками А и С. Из. Среди любых трех точек произвольной прямой не более одной точки лежит между двумя другими. Эти аксиомы называются линейными аксиомами порядка. Кроме них группа II содержит еще так называемую аксиому Паша 1Г4, которую мы сформулируем ниже. Пара (неупорядоченная) различных точек А и В называется отрезком прямой АВ с концами А, В и обозначается символом АВ. Любая точка С, 228
лежащая между точками А и В, называется внутренней точкой отрезка АВ (заметим, что существование таких точек аксиомами не утверждается). В силу аксиомы Hi это определение корректно. Точка С называется точкой, принадлежащей отрезку АВ, если она либо является его внутренней точкой, либо совпадает с одной из точек А или В. Все точки прямой АВ, не принадлежащие отрезку АВ, называются внешними к отрезку АВ (существование таких точек обеспечивается аксиомой 1Ь). Го- Говорят, что прямая а пересекает отрезок АВ, если существует внутренняя точка отрезка АВ, принадлежащая прямой а. lit Пусть А, В, С — три точки, не лежащие на одной прямой, и пусть а, — некоторая прямая, в плоскости ABC, не проходящая через точки А, В, С. Тогда, если прямая а, пересекает отрезок АВ, то она пересекает также либо отрезок АС, либо отрезок ВС. Из аксиом принадлежности и порядка уже можно вывести много важ- важных фактов геометрии. Например, в порядке дополнения к аксиомам груп- группы II можно показать, что 1) любой отрезок АВ содержит бесконечно много точек; 2) среди любых трех точек прямой одна и только одна точка лежит между двумя другими; 3) если в аксиоме Паша прямая а пересекает отрезок АС, то она не пересекает отрезок ВС. Упражнение. Докажите утверждения 1), 2), 3). Пусть О — точка прямой а. Введем на множестве а \ О всех точек пря- прямой а, отличных от точки О, отношение ~, считая, что А ~ В тогда и только тогда, когда либо А = В, либо отрезок АВ не содержит точки О. Аналогично, пусть а — прямая плоскости П. Введем на множестве П\<х всех точек плоскости II, не принадлежащих прямой а, отношение ~, считая, что А ~ В тогда и только тогда, когда либо А = В, либо пря- прямая а не пересекает отрезок АВ. Оказывается, что в обоих случаях отношение ~ является отношением эквивалентности, причем существует точно два класса эквивалентности. В первом случае эти классы называются лучами (или полупрямыми), определенными точкой О (или имеющими начало в этой точке), а во втором случае — полуплоскостями, определенными прямой ее. Рассмотрим случай прямой на плоскости. По определению, отношение ~ рефлексивно (А ~ А). Кроме того, оно, очевидно, симметрично (если А ~ В, то В ~ А). Покажем, что оно транзитивно (если А ~ В и В~С, то А~С). Если среди точек А, В, С есть одинаковые, то транзитивность очевидна. Предположим, что все точки А, В, С различны и не принадлежат одной прямой. Если бы отношение А ~ С места не имело, то прямая а пересекала бы отрезок АС. Но тогда по аксиоме Паша 1Ц она пересекала бы вопреки условию и один из отрезков АВ или ВС. Следовательно, А ~ С. Случай, когда точки А, В, С принадлежат одной прямой, мы предоставим читателю разобрать самостоятельно. 2??
Таким образом, отношение — является отношением эквивалентности и потому все множество П\а разбивается на соответствующие классы экви- эквивалентности. Осталось доказать, что этих классов ровно два. Пусть А — произвольная точка из П\а н пусть В — произвольная точка прямой а. По аксиоме 1Ь на прямой АВ существует такая точка С, что точка В лежит между точками Л и С, т. е. такая, что прямая а пересекает отрезок АС (в точке В). Следовательно, точки Л и С не эквивалентны, так что существует по крайней мере два класса. Покажем теперь, что более двух классов существовать не может, т. е. что любая точка М из П\а эквивалентна либо точке А, либо точке С. Но это немедленно вытекает из дополнения 3) к аксиоме Паша, поскольку пря- прямая а, по условию, пересекает отрезок АС и, следовательно, пересекает один и только один из отрезков AM и МС. Задание. Дайте доказательство для случая точки на прямой. Задание. Аналогично, вводя понятие полупространства, определенного данной плоскостью П, докажите, что совокупность всех точек, не принадле- принадлежащих этой плоскости, разбивается точно на два полупространства. О точках прямой, принадлежащих одному лучу с началом в точке О, говорят также, что они расположены по одну сторону от точки О. Аналогич- Аналогично о точках, принадлежащих одной полуплоскости (одному полупростран- полупространству), говорят, что они расположены по одну сторону от соответствующей прямой (плоскости). Два луча одной и той же прямой мы назовем одинаково направленны- направленными, если один из них целиком содержится в другом. Задание. Докажите, что: 1) отношение одинаковой направленности является на множестве всех лучей данной прямой отношением эквивалентности; 2) два луча с началом в произвольной точке О неодинаково направлены, но любой другой луч одинаково направлен с одним (и только одним) из этих лучей. Утверждение 2) означает, что на рассматриваемой прямой имеется точно два класса одинаково направленных лучей. Эти классы называются ориен- тациями прямой. Пусть о — произвольная ориентация прямой а, А и В — две точки этой прямой, и aj, ctg — лучи прямой а, принадлежащие ориентации о и опреде- определенные соответственно точками А и В. Мы скажем, что А -<[ В в ориента- ориентации о, если луч <Хд целиком содержится в луче aj. Таким образом, каждая ориентация прямой а определяет на множестве точек этой прямой некоторое отношение А <^ В. Задание. Докажите, что это отношение является отношением пред- предшествования, так что ориентации, как они сейчас определены, по существу совпадают с ориентациями в смысле п. 1 § 2 гл. 1. Пусть П — произвольная плоскость, a — прямая на плоскости П и О — точка на прямой а. Фигура (О, а+, П+), состоящая из точки О, некоторого луча а+ прямой а с началом в точке О и некоторой полуплоскости П+, опре- определенной прямой а, называется флагом на плоскости П. Аналогично опреде- 2за
ляется флаг в пространстве (добавляется еще одно из полупространств, опре- определенных плоскостью П) и флаг (О, а+) на прямой (последнее понятие, впрочем, совпадает по существу с понятием луча). Пара h, k лучей, выходящих из одной точки О и не принадлежащих одной прямой, называется углом и обозначается символом Z(h,k). Если А к В — точки лучей h и k, то угол Z (h, k) обозначается также символом ZAOB. Говорят, что угол Z(h,k) примыкает к флагу (О, а+, ГГ), если луч h совпадает с лучом а1", а луч k лежит в полуплоскости II+. Аналогично, говорят, что отрезок АВ примыкает к флагу (О, <х+), если точка А совпадает с точкой О, а точка В принадлежит лучу а\ Как уже было сказано, в аксиоматике Гильберта для отрезков и углов определено отношение «конгруэнтности». Мы скажем, что угол Z(h,k) может быть отложен от флага (О, а+, П+), если существует конгруэнтный ему угол, примыкающий к этому флагу. Ана- Аналогично, мы скажем, что отрезок АВ может быть отложен от флага (О, а*), если существует конгруэнтный ему отрезок, примыкающий к этому флагу. Третья группа аксиом ' (аксиомы конгруэнтности) IIIi. Любой отрезок можно отложить от любого флага. 1П2. Если отрезки АВ и А"В" конгруэнтны одному и тому же отрезку А'В', то отрезки АВ и А"В" также конгруэнтны. Шз. Для любой точки В, лежащей между точками А и С, и любой точки В', лежащей между точками А' и С, из того, что отрезок АВ кон- конгруэнтен отрезку А'В', а отрезок ВС конгруэнтен отрезку В'С, следует, что отрезок АС конгруэнтен отрезку А'С. IIU. Любой угол можно единственным образом отложить от любого флага. Ills. Каждый угол конгруэнтен самому себе. 11 Is. Пусть А, В, С — три точки, не лежащие на одной прямой, и А', В', С — три точки, также не лежащие на одной прямой. Тогда, если отрезок АВ конгруэнтен отрезку А'В', отрезок АС конгруэнтен отрезку А'С, а угол Z.BAC конгруэнтен углу ZB'A'C, то угол ZABC конгруэнтен углу ZA'B'C. Обратим внимание на то, что единственность откладывания углов тре- требуется, а единственность откладывания отрезков — нет (она может быть до- доказана). Из этих аксиом вытекает следующее утверждение, их существенно до- дополняющее: отношения конгруэнтности отрезков и углов являются отношениями экви- эквивалентности. ^ Действительно, пусть АВ — произвольный отрезок. Отложив его от про- произвольного флага, мы получим некоторый отрезок А'В', которому конгруэн- конгруэнтен отрезок АВ (аксиома IHi). Принимая теперь в аксиоме Ша за отрезок 231
А"В" отрезок АВ, мы видим, что все условия этой аксиомы выполнены и, следовательно, отрезок АВ конгруэнтен отрезку А"В", т. е. конгруэнтен са- самому себе. Следовательно, отношение конгруэнтности отрезков рефлексивно. Его симметричность и транзитивность непосредственно вытекают теперь, из аксиомы IIЬ. Что же касается углов, то рефлексивность конгруэнтности для них тре- требуется специальной аксиомой ПЬ, а симметричность и транзитивность без труда выводятся из симметричности и транзитивности конгруэнтности отрез- отрезков с помощью аксиомы III е. , Упражнение. Докажите симметричность и транзитивность отношения кон- конгруэнтности для углов. Из аксиом групп I—III можно уже вывести довольно много теорем гео- геометрии (все, для которых не нужна единственность параллельных и теория измерения). Например, можно доказать признаки равенства (конгруэнтности) треугольников, теорему о внешнем угле треугольника, теорему о перпенди- перпендикуляре и наклонной и т. д. В частности, можно доказать, что через любую точку А, не принадлежащую прямой а, проходит прямая, параллельная этой прямой (т. е. содержащаяся в плоскости, определенной прямой а и точкой Л,, но не пересекающаяся с прямой а). Чтобы построить такую прямую, доста- достаточно опустить нз точки А на прямую а перпендикуляр (что это такое — опре- определяется обычным образом) и затем восставить к нему перпендикуляр в. точке А (конечно, нужно доказать, что все эти построения выполнимы). Последние две группы аксиом состоят каждая из одной аксиомы. Четвертая группа аксиом (аксиома непрерывности) IV. Если все точки прямой распределены на два непустых класса так,. что в некоторой ориентации каждая точка одного класса предшествует каж- каждой точке другого класса, то либо в первом классе существует точка, кото- которой предшествуют все остальные точки этого класса, либо во втором классе- существует точка, которая предшествует остальным точкам этого класса. Аксиома IV известна как аксиома Дедекинда. Ее можно заме- заменить двумя аксиомами: известной аксиомой Архимеда и аксиомой. Кантора (принципом стягивающихся отрезков). Пятая группа аксиом (аксиома параллельности) V. Через любую точку А, не принадлежащую данной прямой а, прохо- проходит не более одной прямой, параллельной прямой а. Перечисленных аксиом оказывается достаточно для построения всей гео- геометрии. В частности, они позволяют определить понятие координатной систе- системы (евклидовой), что доказывает как их непротиворечивость, так и их пол- полноту. Доказательство этого мы опустим. 232
Замечание 1. Аксиоматика Гильберта является аксиоматикой геометрии в пространстве (стереометрии). Чтобы получить аналогичную аксиоматику планиметрии, достаточно исключить плоскости из списка основных объектов и оставить в группе I аксиом принадлежности только первые четыре аксио- аксиомы. Ясно, что аксиоматика планиметрии интерпретируется на любой плоскости П. Это утверждение и является точной формулировкой того факта, что аксиомы планиметрии описывают геометрию на любой плоскости. 2. Обсуждение аксиом Популярность аксиоматики Гильберта объясняется не только тем, что она была первой, получившей широкое признание аксиоматикой геометрии, но.и ее близостью к традиционной школьной геометрии. Основные объекты и основные отношения этой аксиоматики известны из школы, а ее аксиомы либо очевидны, либо являются теоремами школьного курса (например, ак- аксиома ЛЬ — это, по существу, первый признак равенства треугольников). Аксиоматика Гильберта обладает также рядом принципиальных до- достоинств. Во-первых, можно показать, что аксиоматика Гильберта минимальна: из нее не только нельзя удалить ни одной аксиомы, но и нельзя даже ослабить их формулировки. Впрочем, на практике это методологическое достоинство оборачивается недостатком: прежде чем дойти до действительно интересных геометрических фактов, приходится доказывать массу утверждений, триви- тривиально дополняющих аксиомы (но доказательства которых часто совсем не тривиальны). Если не гнаться за минимальностью, то все эти утверждения естественно с самого начала включить в аксиомы. Второе методологическое достоинство аксиоматики Гильберта состоит в ее независимости от каких-либо других математических теорий. Она в прин- принципе независима даже от теории множеств. Действительно, по Гильберту, скажем, прямая отнюдь не является множеством точек, а отношение при- принадлежности не является теоретико-множественным отношением принадлеж- принадлежности элемента к множеству. Однако эта независимость от теории множеств на самом деле эфемерна. Уже полупрямая вводится по Гильберту по суще- существу как множество точек. Еще хуже дело обстоит с аксиомой непрерывно- непрерывности Дедекинда, в которой понятие множества (класса) играет основную роль. (Правда, у самого Гильберта аксиомы Дедекинда нет: ее заменяет не- некая аксиома полноты, формально от теории множеств независимая.) Как бы то ни было, в духе современных теоретико-множесгвенных кон- концепций, придавать большое значение этой особенности аксиоматики Гиль- Гильберта не стоит. Более того, переходя на теоретико-множественную точку зре- зрения, целесообразно видоизменить эту аксиоматику и считать прямую множе- множеством принадлежащих ей точек. По существу мы выше так и поступали (по крайней мере в терминологическом аспекте). При таком видоизменении поня- понятия прямой, мы, конечно, несколько сузим класс возможных интерпретаций: те интерпретации, в которых принадлежность не является теоретико-множе- теоретико-множественной, будут уже невозможны. Однако много мы при этом не потеряем, поскольку от любой такой интерпретации возможен, по существу 23.4
автоматический переход к интерпретации с теоретико-множественным отноше- отношением принадлежности. Выиграем же мы не только в наглядности, но и в умень- уменьшении списка основных отношений. Если не заботиться о минимальности, то аксиомы принадлежности мож- можно теперь сформулировать следующим образом (удобнее называть их теперь «аксиомами прямых и плоскостей»): Аксиомы прямых и плоскостей Пр. 1. Любая прямая является бесконечным (несчетным) множеством точек. Пр. 2. Любые две (различные) точки содержатся в одной и только од- одной прямой. Пр. 3. Вне любой данной прямой существуют точки. Пл. 1. Любая плоскость является бесконечным (несчетным) множеством точек. Пл. 2. Любые три точки, не принадлежащие одной прямой, содержатся в одной и только одной плоскости. Пл. 3. Если две различные точки прямой принадлежат плоскости, то вся прямая лежит в этой плоскости. Пл. А. Пересечение двух плоскостей либо пусто, либо является прямой. Пл. 5. Вне любой плоскости существуют точки. Ступив раз на «теоретико-множественный» путь, мы можем пойти и дальше, убрав из списка основных отношений также и отношение коллинеар- коллинеарности и заменив его новым основным объектом — «движением». В рамках аксиоматики Гильберта движения определяются как (биективные) преобра- преобразования множества точек, переводящие конгруэнтные отрезки в конгруэнт- конгруэнтные. С содержательной точки зрения «движением» является либо результат «перемещения» всего пространства по себе как твердого тела, либо результат такого перемещения, сопровождаемый некоторой симметрией (относительно плоскости). Аксиомы движения Дв. 1. Любое движение является биективным отображением множества всех точек на себя (преобразованием), переводящим прямые в прямые. Дв. 2. Для любых двух (пространственных) флагов существует един- единственное движение, переводящее первый флаг во второй. Упражнение. Выведите Дв. 1 и Дв. 2 из аксиоматики Гильберта. Обратно, исходя из движений, удовлетворяющих аксиомам Дв. 1 и Дв. 2, определите обычным образом конгруэнтность (как совмещаемость при некотором движе- движении) и проверьте, что все аксиомы конгруэнтности будут выполнены. Можно показать (см. ниже, § 1 гл. 7), что аксиома Дв. 1 влечет за собой сохранение при движениях отношения «между». Поэтому любое дви- движение переводит луч в луч, полуплоскость в полуплоскость, полупростран- полупространство в полупространство, а следовательно, флаг во флаг. Это делает осмыс- осмысленной формулировку аксиомы Дв. 2. Заметим еще, что из аксиомы Дв. 2 без труда вытекает, что все движе- движения составляют, как и полагается, группу. 234
Читатель может сравнить сложные и в достаточной мере неуклюжие аксиомы Гильберта lilt—III» с простыми и наглядными аксиомами Дв. 1 и Дв. 2. Это не означает, конечно, что Гильберт не понимал преимуществ аксиом Дв. 1 и Дв. 2. Просто они для него были неприемлемы. из-за его «антитеоретико-множественной» установки. Можно считать, что в аксиоматике Гильберта неудачен и выбор в каче- качестве одного из основных отношений отношения «между». Значительно удоб- удобнее (как по методическим, так и по принципиальным соображениям) прини- принимать за основное отношение отношение одноименности направленных отрез- отрезков (вводимое обычным образом: см. п. 1 § 2 гл. 1), или (что равносильно, но означает переход на теоретико-множественные позиции) ввести новый основной объект — «ориентацию», подчинив его соответствующим аксиомам (перечисленным в п. 1 § 2 гл. 1). Введение в аксиоматику ориентации устра- устраняет последнее из оставшихся основных отношений (отношение «между»). Это, конечно, не означает, что в получающейся аксиоматике нет никаких отношений: просто этими отношениями будут стандартные отношения теории множеств. Независимость аксиоматики Гильберта проявляется также и в том, что она не опирается на теорию вещественных чисел, из-за чего большой фраг- фрагмент теории чисел по существу заново строится в недрах этой аксиоматики (достаточно чуть-чуть переформулировать линейные аксиомы порядка и ак- аксиому непрерывности, чтобы получить аксиоматику, описывающую множество вещественных чисел1)). Но если мы уже решили отказаться от этой незави- независимости, то естественно сделать следующий шаг и построить геометрию, явно опираясь на арифметику вещественных чисел. Проще всего это сделать, ак- аксиоматизировав понятие «координатной системы на прямой». Аксиомы координатных систем К.С1. Любая координатная система х на прямой а представляет собой биективное отображение этой прямой ца множество R вещественных чисел. К.С2. Для любого направленного отрезка АВ прямой а существует на этой прямой единственная координатная система х, для которой х (А) = О, х (В) = 1. КСЗ. Координатные системы х и у, отвечающие направленным отрезкам АВ и CD прямой а, связаны соотношением у = ах + Ъ, где а = у {В) -у (А), 6 = у (А). Эти аксиомы равносильны аксиоме непрерывности IV и линейным аксио- аксиомам порядка Hi—И»: достаточно определить отношение «между», считая, что точка В тогда и только тогда находится между точками Л и С, когда в координатной системе *, отвечающей (в силу аксиомы КС2) направленному отрезку АС, имеет место неравенство ') Строго говоря, нужна еще аксиома IIIi, позволяющая переносить от- отрезки по прямой. 235
Резюмируя все сказанное, мы получаем следующее Предложение 1. Евклидова геометрия может быть задана аксиоматикой^ основными объектами которой являются «точки», «прямые», «плоскости», «движения», «координатные системы», удовлетворяющие аксиомам Пр. 1 — Пр. 3, Пл. 1 — Пл. 5, К.С1 — КСЗ, Дв. 1 — Дв. 2, аксиоме Паша III4 и аксиоме параллельности V. Эта аксиоматика в достаточной степени наглядна и проста. Вместе с тем она не слишком отходит от традиционных «школьных» понятий (представле- (представление о прямой как о числовой оси в школе известно). Чтобы получить из этой аксиоматики аксиоматику планиметрии, доста- достаточно удалить аксиомы Пл. 1 — Пл. 5 (а аксиому Дв. 2 сформулировать для флагов на плоскости). При желании можно, конечно, пойти и дальше, зааксиоматизировав по- понятие координатной системы в пространстве (для планиметрии — понятие координатной системы на плоскости). В результате мы придем к аксиома- аксиоматике, рассмотренной в § 3 гл. 2 и содержащей только две аксиомы. Однако такая аксиоматика уже совершенно порывает со школьной традицией. С другой стороны, можно несколько вернуться назад и заменить аксио- аксиомы КС1 — КСЗ аксиомой ориентации У (см. п. 1 § 2 гл. 1) и аксиомой Де- декинда IV. Как уже отмечалось, при этом придется заново построить прак- практически всю теорию вещественных чисел (в части, не связанной с ариф- арифметическими операциями). Особенностью аксиоматики Гильберта является также специальная роль, которую в ней играет аксиома параллельности V. Исключение этой аксиомы из группы I (где ей естественное место) и выделение ее в специальную (по- (последнюю!) группу V позволяет отделить теоремы геометрии, не зависящие от аксиомы параллельности, от теорем, от этой аксиомы зависящих. Это играет существенную роль, когда мы хотим сравнить евклидову геометрию- с геометрией Лобачевского, которая удовлетворяет всем аксиомам Гильберта,, за исключением аксиомы параллельности, заменяемой следующей аксиомой: Аксиома параллельности Лобачевского V'. В любой плоскости, содержащей произвольную прямую а, через лю- любую точку, не принадлежащую прямой а, проходят по крайней мере две прямые, не пересекающие прямую а. Революционная идея Лобачевского о возможности многих геометрий, произведшая глубочайший переворот в понимании сути и значения не только геометрии, но и всей математики, была признана не сразу. Одной из целей Гильберта было показать, что геометрия Лобачевского с принципиальной, формально-логической, стороны ничем не хуже и не лучше евклидовой гео- геометрии: каждая из этих геометрий может быть описана системами аксиом, .отличающихся лишь одной аксиомой. 236
Однако, с современных позиций, геометрия Лобачевского является лишь одной из многих неевклидовых геометрий (хотя, возможно, и самой важной). Поэтому выделять аксиому параллельности нет сейчас никаких оснований. С современной точки зрения представляется более важным отделить в аксиоматике не аксиому параллельности, а аксиомы, описывающие афинную геометрию. В аксиоматике Гильберта аффинный характер имеют все аксиомы, за исключением аксиом конгруэнтности III. Однако из этих аксиом не вытекает существование параллельных прямых. Поэтому аксиому параллельности V целесообразно соответствующим образом усилить. Усиленная аксиома параллельности V*. Через любую точку, не принадлежащую прямой а, можно провести единственную прямую, параллельную прямой а. Оказывается, что аксиомы Ij—Iio, 111—114, IV и V* (или аксиомы Пр. 1 — Пр. 3, Пл. 1 — Пл. 5, КС1 — КСЗ, Hi и V*) составляют полную систему аксиом афинной геометрии в пространстве. Доказательство мы приводить не будем. Замечательно, что, опустив в этом списке пространственные аксиомы Ii — Iio (или соответствующие аксиомы Пл. 1 — Пл. 5), мы не получим полной системы аксиом афинной планиметрии: необходима некоторая допол- дополнительная аксиома, связывающая точки различных прямых. Пусть на плоскости заданы три прямые ссо, аир, причем прямые аир не параллельны прямой ссо. Тогда для любой точки А прямой р прямая, па- параллельная прямой ссо и проходящая через точку А, пересекает прямую а в единственной точке В. Построенное таким образом отображение 9: прямой Р на прямую а называется, как мы знаем, проектированием парал- параллельно прямой «о. Дополнительная аксиома координатных систем КС4. Для любой координатной системы х на прямой а. и любого проек- проектирования 9 прямой р на прямую а композиция x°Q: p->R является координатной системой на прямой р. Аксиома Паппа Пп. Если шесть различных точек А, В, С, А', В', С одной плоскости, таковы, что а) точка С принадлежит прямой АВ, а точка С — прямой А'В'; б) ни одна из точек А, В, С, А', В', С'~не является общей точкой пря- прямых АВ и А'В'; в) прямая В'С параллельная прямой ВС, а прямая А'С параллельна прямой СА', то прямая А'В параллельна прямой АС. 237
Аксиома Дезарга Дез. Если шесть различных точек А, В, С, А', В', С таковы, что а) прямые АА', ВВ' и СС либо параллельны, либо пересекаются в од- одной точке, отличной от точек А, В, С, А', В', С, б) прямая АВ параллельна прямой А'В', а прямая ВС параллельна пря- прямой В'С, то прямая АС параллельна прямой А'С. Можно показать (мы этого делать не будем), что при добавлении к аксиомам Ii — U, II, IV и V* {или к аксиомам Пр. 1— Пр. 3, КС1 — КСЗ, lh и V*) любой из аксиом КС4, Пп или Дез. получается полная система аксиом аффинной геометрии на плоскости. Все эти аксиомы имеют «элементарно-геометрический» характер. С пози- позиций аналитической геометрии наиболее приемлема, конечно, аксиоматика аффинной геометрии, изложенная в § 3 гл. 2 (и состоящая только из двух аксиом). Помимо всего прочего, последняя аксиоматика имеет и то преиму- преимущество, что она немедленно обобщается на случай любого поля К и на лю- любое число измерений п. ~~ Возможны, впрочем, и другие (часто более удобные) аксиоматики аффин- аффинной геометрии, обобщаемые на случай любых Кип. Наиболее известной из них является аксиоматика, предложенная немецким математиком Г. Вейлем. В аксиоматике Вейля имеется два рода основных объектов: «точки» и «векторы». Предполагается, что для векторов определены операции сложения и умноже- умножения на вещественные числа, обладающие всеми восемью стандартными свой- свойствами из п. 5 § 2 гл. 1 (т. е. превращающие множество всех векторов в ли- линеал) . Кроме того, предполагается, что любые четыре вектора линейно зави- зависимы (если мы строим аффинную геометрию плоскости, то число «четыре» за- заменяется, естественно, числом «три»). Далее, предполагается, что любым двум точкам А и В сопоставлен не- некоторый вектор АВ, причем 1) для любой точки А и любого вектора а существует единственная точ- точка В такая, что 2) для любых трех точек А, В, С имеет место равенство АС = АВ + ВС. Оказывается, что этих аксиом уже достаточно для построения всей аффинной геометрии. Эта аксиоматика немедленно обобщается на случай любого поля К (до- (достаточно потребовать, чтобы векторы умножались не на вещественные числа, а на элементы поля К), а также на случай любого числа измерений (доста- (достаточно число «4» заменить любым фиксированным числом «/г»), Более того, ясно, что эти аксиомы имеют смысл и тогда, когда К является произволь- произвольным телом (полем с некоммутативным умножением), Они определяют в этом случае аффинную геометрию над телом К.
Глава 3 ЛИНИИ И ПОВЕРХЙОСТИ ПЕРВОГО ПОРЯДКА § 1. ПРЯМАЯ НА ПЛОСКОСТИ 1. Прямая как линия первого порядка Рассмотрим плоскость с заданной на ней аффинной коорди- координатной системой Оху и в ней произвольную прямую. Мы всегда можем найти (и даже многими способами) аффинную систему координат О'х'у'', для которой данная прямая является осью ор- ординат и потому определяется уравнением х' == 0. Но как мы знаем (п. 2 § 1 гл. 2), координата х' выражается через исход- исходные координаты х, у по формуле где А, В и С — некоторые вещественные числа, причем хотя бы одно из чисел А или В отлично от нуля (в обозначениях п. 2 § 1 гл. 2, А = с\', В = с\', С = а1). Тем самым доказано, что любая прямая на плоскости имеет уравнение вида у + С = 0, A) где хотя бы одно из чисел А или В отлично от нуля. Уравнение прямой вида A) называется ее общим уравне- уравнением. В терминологии, введенной в п. 2 § 2 гл. 2, доказанное ут- утверждение означает, что каждая прямая на плоскости является линией первого по- порядка. ' Покажем, что верно и обратное, т. е. что любая линия первого порядка является прямой. Действительно, пусть Ах + Ву + С = 0 —уравнение произвольной линии первого порядка. Подберем, числа Аи Bi и Ci так, чтобы определитель А В * в, 239
был отличен от нуля (например, можно положить Ai = —В, Bi = А). На число С{ мы не накладываем никаких условий (на- (например, можно считать, что Ci = 0). Поскольку определитель B) отличен .от нуля, формулы х' = Ах + By + С, описывают переход от координат х, у к некоторым новым коор- координатам х', у'. В координатах х', у' данная линия выражается уравнением х' — О и, следовательно, является осью ординат, т. е. прямой. Поскольку тот факт, что данная линия является прямой, не зависит от системы координат, наше утверждение, тем самым, полиостью доказано. Собирая вместе оба доказанных утверждения, мы получаем следующую теорему: Теорема 1. Линия на плоскости тогда и только тогда пред- представляет собой прямую, когда она является алгебраической ли- линией первого порядка. Замечание 1. При формально-аксиоматическом построении геометрии (см. § 3 гл. 2) следует, как всегда, «обратить» полученный содержательный ре- результат и принять его за определение. Таким образом, на произвольной аффинной плоскости Ш прямые опреде- определяются как алгебраические линии первого порядка, т. е. как множества то- точек, координаты х, у которых в произвольной аффинной координатной систе- системе а: 501 -> R2 удовлетворяют уравнению вида Ах + By + С = 0, где либо А, либо В не равно нулю. Это определение корректно, поскольку любое преобразование из группы Aff (R2) линейное уравнение переводит снова в линейное уравнение. Заметим, что это определение применимо к аффинным (а потому и к ев- евклидовым) плоскостям над любым полем К (в частности, к комплексным и вещественно-комплексным плоскостям). При этом среди прямых на веще- вещественно-комплексной плоскости выделяются вещественные прямые, имеющие уравнения с вещественными коэффициентами, а остальные прямые распа- распадаются на пары комплексно-сопряженных прямых, уравнения которых имеют комплексно-сопряженные коэффициенты. Соглашение об обозначениях. В дальнейшем символ % бу- будет обозначать прямую с уравнением A). В случае, когда нам "придется рассматривать несколько прямых, мы будем снабжать символ Я индексами. При этом мы всегда будем молчаливо под- подразумевать, что коэффициенты уравнения A) снабжены соот- соответствующими индексами. Так, например, прямая hi будет иметь уравнение и т. п. 240
Символ О мы будем использовать для обозначения экви- эквивалентности (равносильности) двух утверждений. Символ [| будет обозначать параллельность прямых, а сим- символ А. — их перпендикулярность. Равенство нулю одного (или двух) из коэффициентов А, В, С уравнения прямой указывает на специальное положение пря- прямой относительно координатных осей. Задание. Докажите, что А = О 4Ф Я || Ох; В = 0 4=> Я || Оу; С = О Ф^ Я проходит через О @, 0). Если В Ф 0, т. е. если прямая не параллельна оси ординат, ее уравнение .может быть записано в виде y = kx-j- b, А С где k = —в", Ь = —„-. Это уравнение называется уравне- уравнением с угловым коэффициентом, а число k называется угловым коэффициентом прямой. Число Ь называется свободным членом. Оно равно величине направленного отрезка ОВ, отсекаемого прямой на оси ординат, т. е. равно ординате точки В пересече- пересечения прямой с осью ординат. Замечание 2. Уравнение с угловым коэффициентом показы- показывает (если мы пользуемся прямоугольными координатами), что прямая (не параллельная оси ординат) является графиком линейной функции у = kx + Ь. Задание. Докажите, что две прямые с угловыми коэффициентами kt и k2 тогда и только тогда параллельны, когда ki = k.2. При k = 0 (т. е. при А = 0) прямая имеет уравнение вида и параллельна оси абсцисс. При В = 0 уравнение с угловым коэффициентом написать невозможно. Вместо него можно рассматривать уравнение х = а, с —*¦ где а = -д—величина направленного отрезка ОА, отсекае- отсекаемого прямой на оси абсцисс, т. е. абсцисса точки А пересечения прямой с осью абсцисс. В этом случае удобно условно считать, что k = оо. . 241
2. Параметрические и канонические уравнения прямой Определение 1. Направляющим вектором прямой на плос- плоскости (или в пространстве) называется произвольный отличный от нуля вектор, параллельный этой прямой, т. е. принадлежа- принадлежащий соответствующему линеалу Vect(l). Этот вектор опреде- определен с точностью до коллинеарности (и представляет собой не что иное, как базис линеала Vect(l)). Предложение 1. Отличный от нуля вектор a(l,m) тогда и только тогда является направляющим вектором прямой X, когда А1 + Впг = 0. A) Доказательство. Пусть Мо (хо, у0) — произвольная точ- точка прямой Я и пусть а — МоМ^ Ясно, что вектор а тогда и толь- только тогда является направляющим вектором прямой Я, когда точка Mi(xo + /, г/о + tn) принадлежит этой прямой, т. е. когда А(хо + I) + В(уо + пг) + С = 0. Для завершения доказательства остается раскрыть скобки и учесть равенство Ах0 + Ву0 + С = О (выражающее принадлежность точки Мо прямой). Условие A), очевидно, выполнено при 1 — В и m = —А. Таким образом, имеет место Следствие. Вектор а = (В, —А) является направляющим вектором прямой Ах + By + С = 0. Замечание 1. Это следствие можно доказать и иначе, рас- рассмотрев координаты х' = Ах + By + С, в которых прямая Я является осью ординат (см. предыдущий пункт). В этой координатной системе вектор а имеет коор- координаты А ¦ В + В ¦ {— А) = 0, Л, • В + В, • (- А) Ф 0. Следовательно, он параллелен оси ординат х' = 0, т. е. пря- прямой Я. Пусть прямая с направляющим вектором а проходит через точку Мо. Ясно, что точка М тогда и только тогда принадлежит этой прямой, когда вектор М0М коллинеарен вектору а. !По- 242 '
скольку а ф О, это означает, что существует такое число t, что Пусть Го — радиус-вектор точки MQ, a r — радиус-вектор точ- точки М. Тогда предыдущее равенство может быть записано в виде г = r0 + ta. Это — параметрическое уравнение прямой в векторной форме. При любом t вектор г, выражаемый этим уравнением, является радиус-вектором некоторой точки прямой, и обратно, радиус- вектор любой точки прямой имеет такой вид. Заметим, что здесь мы нигде не пользовались тем, что пря- прямая лежит в плоскости. Поэтому доказанное утверждение спра- справедливо и для прямых в пространстве. Записав векторное параметрическое уравнение прямой в координатах, мы получим параметрические уравнения прямой в координатной форме. На плоскости они имеют вид где хо, уа — координаты точки Мо и /, m — координаты направ- направляющего вектора а, а в пространстве — вид У=Уо-\- tnt, z = z0 + nt. Точка Мо и вектор а составляют некоторый аффинный ко- координатный репер на рассматриваемой прямой. Ясно, что параметр t является аффинной координатой на прямой от- относительно репера Коллинеарность векторов ММ0 = г — г0 и а означает также, что их координаты пропорциональны: х — х0 у— г/0 / ~ m (мы снова рассматриваем лишь прямые на плоскости). Следо- Следовательно, это равенство является уравнением прямой, проходя- проходящей через точку М0(х0, у0) и имеющей направляющий вектор a(l,m). Уравнение прямой, записанное в таком виде, называет- называется ее каноническим уравнением. Чтобы по общему уравнению прямой на плоскости 243
написать ее каноническое уравнение (или, что равносильно, ее параметрические уравнения), следует найти хотя бы одну ее точку М0(х0, у о) (например, при АФО можно положить х0 — = -г, Уо = О, а при В^О можно положить хо = 0, у0 ——тг) и хотя бы один направляющий вектор а (например, можно взять а == (—В, А)). Замечание 2. Каноническое уравнение является, собственно говоря, не равенством, а пропорцией и должно пониматься именно в этом смысле. Например, при / = 0 оно означает, что X = Хо. Полагая А = т и В = —/, мы можем каноническое уравне- уравнение записать в следующем виде: А (х — х0) + В (у — у0) = 0. Это — общее уравнение прямой, проходящей через данную точку. Если на прямой даны две различные точки Мо(хо, уо) к Mi(Xi,yi), то за направляющий вектор этой прямой мы можем принять вектор M0Mt с координатами Xi — Хо, у\. — уо- Следова- Следовательно, прямая, проходящая через точки > Мо(хо,уо) и Mi(xi,yi), имеет уравнение х — х0 __ у — г/о х\ — х0 г/i — г/о В детерминантной форме это уравнение имеет вид — х0 у — у о = 0. — Ч У\ — Уо Иногда его удобно записывать в более симметричном виде: х у 1 л0 t/o 1=0 Xi У\ 1 (для доказательства равносильности этих уравнений достаточ- достаточно вторую строку последнего определителя вычесть из его пер- первой и третьей строк). Параметрические уравнения рассматриваемой прямой имеют, очевидно, вид X = Xq -\- \Ху — Xq) I, X = A t) Xq -f- IXi, 244
Сравнивая эти уравнения с формулами определяющими координаты точки, делящей отрезок M0Mi в данном отношении & Ф —1 (см. п. 3 § 1 гл. 2), мы немедленно получаем, что точка М прямой, отвечающая значению параметра t, делит отрезок М0М\ в отношении //A — t). Иными словами (см. п. 6 § 1 гл. 2), числа 1 •— t, t являются однородными барицентрическими ко- координатами на прямой. Полезно сравнить это истолкование параметра t с его истол- истолкованием как аффинной координаты на прямой (см. выше). Из обоих истолкований немедленно вытекает, в частности, что точки отрезка MoMi характеризуются неравенствами (значению t = 0 отвечает точка Мо, а значению t = 1 — точ- точка Mi). Заметим, что это утверждение остается справедливым и для прямой в пространстве. Параметрические уравнения прямой X—Xq + It, ^ ' особенно полезны в задаче о вычислении точек пересечения этой прямой с произвольной линией F(x, y) = 0. C) Действительно, чтобы найти эти точки, достаточно решить (относительно t) уравнение F(xo + U, yo + mt) = O. D) Каждый корень /4 этого уравнения дает нам точку с координа- координатами xi — хо + Ни У\ = Уо + ши; . ' ' принадлежащую одновременно прямой B) и линии C), т. е. являющуюся точкой пересечения прямой B) и линии C). Об- Обратно, если точка (xi, yi) является точкой пересечения прямой 245
и линии C), то поскольку она принадлежит прямой B), су- существует такое tu что имеют место равенства E), а поскольку юна принадлежит линии C), это ti является корнем уравне- уравнения D). Замечание 3. Обратим внимание на то, что описанный метод имеет об- общий характер и применим к случаю, когда вместо прямой B) мы рассматри- рассматриваем произвольную (параметрически заданную) линию. В частном случае, когда C) является алгебраической линией порядка п, т. е. функция F(x,y) —многочленом от х, у степени л, уравнение D) имеет вид ф/Чф,/п-Ч ... +Ф„_,г + Ф„ = о, F) где Фо, Фь ..., Фп-ь Фп — некоторые числа, т. е. является уравнением степени, не большей п (некоторые из чисел Фо, Фь ... могут быть равны нулю). Упражнение. Докажите, что . Фо = Fo (/, т.), Фп = Г (х0, г/о), где F0(x,y)—сумма всех старших (имеющих точно степень п) членов много- многочлена F(x, у). Поскольку уравнение степени, не большей л, имеет не бо- более п корней (или удовлетворяется тождественно), тем самым доказано следующее Предложение 2. Произвольную алгебраическую линию по- порядка п каждая прямая (не принадлежащая целиком этой ли- линии) пересекает не более чем в п точках. Замечание 4. Ясно, что все вышесказанное без каких-либо изменений справедливо и в (аксиоматически построенной) аффинной геометрии над лю- любым полем К (конечно, в соответствии с общими правилами, направляющий вектор следует при этом определять как вектор, координаты которого удо- удовлетворяют уравнению A) 4). В частности, предложение 2 также остается справедливым. Заметим, однако, что не только в случае вещественной геометрии, но даже и в случае комплексной (или вещественно-комплексной) геометрии утверждать существование точно п точек пересечения было бы неосторожно, поскольку уравнение F) может, во-первых, иметь кратные корни, а во-вто- во-вторых, быть уравнением степени, меньшей п. Поскольку каждая вещественная прямая в вещественно-комплексной плоскости ЭД1 пересекается с вещественной плоскостью ЭД1вещ с: 501 по бес- бесконечному числу точек (по всем ее вещественным точкам), а вместе о Тем не содержится в этой плоскости (имеет невещественные точки), мы видим, что предположение о том, что ЭД1веп< является алгебраической линией, проти- противоречит предложению 2 (см. п. 5 § 3 гл. 2, стр. 225). ') Само собой разумеется, что при этом следует не забыть проверить" корректность этого определения. 246
3. Взаимное расположение прямых на плоскости Ясно, что две прямые тогда и только тогда параллельны1), когда их направляющие векторы коллинеарны. Отсюда (и из следствия к предложению 1 п. 2) непосредственно вытекает сле- следующее Предложение 1. А В В /—*> В, = 0. Параллельные прямые совпадают, если они имеют хотя бы одну общую точку Мо(хо,уо), т. е. если существуют такие числа х0, г/о, что Пусть А = pAi, В = р/?ь Вычитая из первого из равенств A) второе, умноженное на р, мы немедленно получим, что» С — pCi = 0, т. е. что С = рСь Ясно, что обратное также вер- верно: если С — pd, то рассматриваемые прямые совпадают. Та- Таким образом, справедливо следующее Предложение 2. •X 1 АА А В С Это — теорема единственности для линий пер- первого порядка (см. п. 2 § 2 гл. 2). Предложения 1 и 2 можно объединить в следующую тео- теорему о взаимном расположении двух прямых наплоскости: Теорема 1. а) прямые К и %х пересекаются Ф^ -j- ф -=-; О) А А[, НО А =?= К\ V-/ —. = ~5 =7= ~7^~ > А ВС1 ' В) Я-А, <^ -5-__ = _. Если ввести в рассмотрение матрицы Л Б \ /Л ? С Л, fijf \Al В, С! и обозначить ранг первой матрицы символом г, а второй — сим- символом R, то эту теорему можно будет переформулировать сле- следующим образом: J) Напомним, что совпадающие прямые мы считаем параллельными. 247"
Теорема Г. а) прямые к и А) пересекаются ^ г = 2; б) Л||Л, ?ф r=l, Я = 2; в) Я = Я, ?ф r = tf=l. В частности, прямые К и Ai имеют хотя бы одну общую точку ?$ г = R. Это — специальный случай теоремы Кронекера — Капелли о совместности систем линейных уравнений (см. дополнение к § 3 гл. 1). Для трех прямых A, Ki, Я2 на плоскости возможны семь су- существенно различных типов их взаимного расположения: Тип1. Прямые попарно не параллельны и не проходят че- через одну точку, т. е. образуют треугольник; это — общий тип. Тип 2. Две прямые параллельны, но не совпадают, а третья их пересекает (в этом случае иногда говорят, что прямые об- образуют «открытый треугольник»). Тип 3. Прямые не параллельны и проходят через одну точку. Тип 4. Две прямые совпадают, а третья их пересекает. Тип 5. Все три прямые попарно параллельны, но попарно не совпадают. Тип 6. Две прямые совпадают, а третья им параллельна, но от них отлична. Т и п 7. Все три прямые совпадают. Эти типы расположения можно схематически изобразить следующим образом: \ . Тип 4 Тип 1 Тип 5 Тип 6 Тип 7 Для исследования этих типов удобно рассмотреть следую- следующие четыре случая: Случай 1 (типы 1 и 2): прямые не имеют ни одной общей точки и среди них имеются хотя бы две не параллельные (и не совпадающие) прямые. ( Случай 2 (типы 3 и 4): прямые имеют единственную об- общую точку и среди них имеются хотя бы две не параллельные (и не совпадающие) прямые. Случай 3 (типы 5 и 6): прямые не имеют ни одной об- общей точки и любы* две из них параллельны или совпадают. Случай 4 (тип 7): все три прямые совпадают. 248
Пусть г— ранг матрицы B) a R — ранг матрицы C) Тогда справедлива следующая теорема о взаимном расположении трех прямых на плоскости: Теорема 2. Случай 1 ФФ г =2, R = S] случай 2 4$ г =2, Я = 2; случай 3 ФФ г=\, /? = 2; случай 4 ФФ г = 1, /?—1. Доказательство. Предположим сначала, что среди на- наших прямых имеется хотя бы одна пара непараллельных пря- прямых (случаи 1 и 2). Пусть, для определенности, это — прямые "к и Х{. Тогда А В Л, В, и потому г = 2. Кроме того, поскольку прямые Я и Я4 не па- параллельны (и в частности, не совпадают), они имеют единст- единственную общую точку Мо(хй,уо), т. е. существуют такие числа х0, уо, что Ах0 + Ву0 + С = О, А1х0-\-В1у0 + С1 = 0. Поэтому, прибавив к третьему столбцу матрицы C) первый столбец, умноженный на х0, и второй столбец, умноженный на Уо, мы получим матрицу где С2 — А2х0 + В2у0 -f- C2. Поскольку при этом преобразова- преобразовании определитель матрицы C) не меняется, этим доказано, что он равен произведению А В Л, В, С*. 249
Следовательно, если Сг =?М), т. е. если третья прямая не про- аодит через точку пересечения первых двух (случай 1), то оп- определитель матрицы C) отличен от нуля, и потому R = 3. Если же Сг = О (случай 2), то определитель матрицы C) равен нулю и потому R^C2, т. е. R = 2 (ибо всегда г</?, а как мы уже знаем, в рассматриваемом случае г = 2). Таким образом, в хлучае 1 имеют место равенства R ~ 3 и г = 2, а в случае 2 — равенства R = 2 и г = 2. , Пусть теперь любые две из прямых X, Х\ и Х% параллельны (случаи 3 и 4). Тогда _Л___б_ j4i___fii_ A _ В Ai~~ Bi ' А2 ~ Вг ' А2 ~~ В2 и потому г = 1. Следовательно, R ^ 2 (ибо всегда R ^ г + 1). В случае 3 существуют хотя бы две параллельные, но не совпа- совпадающие, прямые. Пусть, для определенности, это — прямые X и Xi. Тогда в, ^ с, и потому минор В С By С, матрицы C) отличен от нуля. Поэтому в этом случае R = 2. В случае 4 все миноры второго порядка матрицы C) равны нулю и потому R—\. Таким образом, в случае 3 имеют место равенства /? = 2«г=1, а в случае 4 — равенства R = 1 иг=\. На первый взгляд кажется, что тем самым теорема уже полностью доказана. Однако это не совсем- так, поскольку, кроме доказанных утверждений (выделенных выше курсивом), нужно также доказать и обратные утверждения. Для этого мы воспользуемся общим логическим принципом обраще- обращения, утверждающим, что если у нас имеется два ряда ут- утверждений s&i, $4-2, ... и g&i, J?2, • •., причем утверждения М-и ¦s&i, ¦ ¦ ¦ друг друга взаимно исключают, а утверждения J?b ^?2, • • • исчерпывают все возможности, и если доказано, что из каждого утверждения s^x вытекает соответствующее утвержде- утверждение <%i, то и обратно, из каждого утверждения 3§г вытекает со- соответствующее утверждение s4-i. В нашем случае утверждения 1Йг — это четыре комбинации чисел R и г, а утверждения s^% —• это четыре,случая взаимного расположения прямых. Поскольку различные случаи взаимного расположения прямых друг друга взаимно исключают, а рассмотренные комбинации значений R и г исчерпывают все возможности, этот принцип применим. Тем самым наша теорема полностью доказана. Замечание 1. Чтобы в каждом из рассмотренных случаев различить соответствующие типы (например, при R = 3 и 250
г = 2 узнать, имеет ли место тип 1 или тип 2) проще всего вос- воспользоваться теоремой о взаимном расположении двух прямых. Например, при R = 3 и г = 2 имеет место тип 1, если все ми- миноры второго порядка матрицы B) отличны от нуля, и тип 2V если один (и только один) из этих миноров равен нулю. Из доказанной теоремы, в частности, вытекает, что три прямые тогда и только тогда имеют хотя бы одну об- общую точку, когда г = R. Это — снова частный случай теоремы Кронекера — Капелли. Упражнение. Рассмотрите взаимное расположение четырех прямых на плоскости (должно получиться семнадцать типов, группирующихся в четыре случая) и проверьте для четырех прямых справедливость теоремы Кронеке- Кронекера — Капелли. 4. Полуплоскости, на которые прямая разбивает плоскость Пусть F(x, y) = Ax + By + C = 0 — произвольная прямая на плоскости. Как известно, эта пря- прямая разбивает плоскость на две полуплоскости: точки Mi и Мг' (не принадлежащие прямой) тогда и только тогда принадле- принадлежат одной полуплоскости, когда отрезок MiM2 не пересекает прямую. Предложение 1. Точки Mi(xi,yi) и М2(х%у2) тогда и толь- только тогда принадлежат одной полуплоскости, определяемой дан- данной прямой, когда величины F(xj,yi) и F(x2,y2) имеют один и тот же знак. .Доказательство. Рассмотрим прямую, проходящую че- через точки Mi и М2. Как было показано в п. 2, ее параметриче- параметрические уравнения имеют вид причем точкам отрезка MiM2 отвечают значения параметра, удовлетворяющие неравенствам 0 ^ / ^ 1. Найдем точку пересечения этой прямой с прямой F(x,y)= О (если эта точка существует). Как мы знаем (см. п. 2), для этого- нужно подставить выражения A) в уравнение прямой: Л (A -/)*,+ tx2) + B((l-t)yi-\- ty2) + С = 0 B) и решить получившееся уравнение относительно t. Переписав уравнение B) в виде (l-t)F(xlt yx) + tF(x2, #2) = 0, мы немедленно получим, что оно имеет корень 251
Но, по определению, точки Mi и М2 тогда и только тогда ле- лежат в разных полуплоскостях, определяемых прямой F(x,y) = = О, когда точка пересечения существует и принадлежит от- отрезку М{М2, т. е. когда t0 определено (F(xuyi) ?=F(x2,y2)) и О < fo < 1. Для завершения доказательства остается заметить, что в силу формулы C) условие ,0 < t0 < 1 в точности равно- равносильно тому, что числа F(xx,y{) и F(x2,y2) имеют разные знаки. •Таким образом, при данном уравнении прямой Я: Ах + Ву + С = 0 точки одной полуплоскости, на которые эта прямая делит плос- плоскость, характеризуются неравенством Ах + By + С > 0 (эту полуплоскость можно назвать положительной), а точки дру- другой — неравенством Ах -\- By -\- С < 0 (эту полуплоскость можно назвать отрицательной). Заметим, однако, что при дру- другом выборе уравнения прямой положительная полуплоскость может стать отрицательной, а отрицательная —¦ положительной (достаточно данное уравнение умножить на отрицательное чис- число). Таким образом, правильнее говорить о положительной (или отрицательной) полуплоскости относительно данного уравнения прямой. В случае, когда прямая X не проходит через начало коорди- координат, т. е. при СФО, мы без ограничения общности можем счи- считать, что С < 0. Тогда положительная полуплоскость будет по- полуплоскостью, не содержащей точки О, а отрицательная — по- полуплоскостью, содержащей эту точку. Используя терминологию, введенную в п. 4 § 4 гл. 1, мы мо- можем, следовательно, сказать, что задание уравнения прямой оп- определяет некоторую сторону этой прямой. Но поскольку у нас на плоскости задана аффинная координатная система, эта плоскость ориентирована, а задание на ориентированной плос- плоскости некоторой стороны прямой равносильно заданию ориента- ориентации этой прямой (п. 4 § 4 гл. 1). Таким образом, каждое уравнение прямой задает некоторую ориентацию этой прямой; при умножении уравнения на положительное чис- число эта ориентация не меняется, а при умножении на отрица- отрицательное число — переходит в противоположную. Ориентация прямой, соответствующая уравнению Ах + Н-5г/+С = 0, задается ее направляющим вектором а, об- обладающим тем свойством, что базис а, га плоскости, состоя- состоящий из вектора а и некоторого вектора га, направленного в по- положительную сторону прямой, одноименен с координатным базисом. Чтобы найти этот вектор а, заметим сначала, что вектор п(А,В) направлен в положительную сторону пря- прямой %. 252
Действительно, пусть Mo (х0, Уа) — произвольная точка пря- прямой и пусть га = МоМ\. Тогда точка Mi имеет координаты хй-\- А и z/o + В. Остается заметить, что А (х0 + А) + В (у0 + В) + С = Л2 + В2 > 0. Отсюда немедлено вытекает, что описанная выше ориентация прямой X задается направляю- направляющим вектором а (В,—А). Действительно, В - А А В и потому базис а(В,—А), п(А,В) одноименен с координатным базисом. Замечание 1. Обратим внимание, что в то время как все сказанное в предыдущих пунктах справедливо в аффинной гео- геометрии над любым полем К, утверждения, доказанные в этом пункте, справедливы (и имеют смысл) только над полем веще- вещественных чисел R (или, точнее, над любым полем, в котором оп- определены понятия положительного и отрицательного числа, об- обладающие обычными свойствами1)). 5. Прямая на евклидовой плоскости До сих пор мы занимались изучением аффинных свойств прямых (принад- (принадлежащих аффинной геометрии). Теперь мы рассмотрим их метрические свой- свойства (принадлежащие собственно евклидовой геометрии). В соответствии с этим мы будем впредь считать наши координаты х, у прямоугольными. На евклидовой плоскости каждую прямую можно задать ее произвольной точкой М0(х0, г/о) и некоторым (отличным от нуля) вектором га, перпендикулярным этой прямой. Для любой точки М(х, у) рассматриваемой прямой вектор МоМ ортогона- ортогонален вектору га и потому скалярное произведение этих векторов равно нулю: Обозначая радиус-вектор точки Мо через г0, а радиус-вектор точки М — через г, мы можем это равенство записать в следую- следующем виде: п(г-га) = 0 A) или, раскрывая скобки, в виде пг-р = 0, B) d) В алгебре такие поля называются упорядоченными. Кроме поля веще- вещественных чисел, к ним принадлежит, например, поле рациональных чисел. Подчеркнем, что поле С не является упорядоченным полем, 253
где р = пг0. Таким образом, радиус-вектор каждой точки на- нашей прямой удовлетворяет уравнениям A) или B). Ясно, что и обратно, если радиус-вектор некоторой точки М удовлетворяет уравнению A) или B), то эта точка принадлежит рассматри- рассматриваемой прямой. В соответствии с этим уравнения A) и B) на- называются уравнениями прямой в векторной форме. Обозначая координаты вектора п через Л, В и полагая С = —р, мы можем уравнение B) переписать в уже известной нам координатной форме Аналогично, уравнение A) дает нам общее уравнение прямой, проходящей через данную точку: Замечание 1, Изложенные соображения еще раз независимо показывают (правда, только для евклидовой плоскости), что любую прямую можно за- задать уравнением первого порядка. Кроме того, мы видим, что вектор п(А,В) перпендикулярен прямой Ах + Ву + С = 0. Уравнение B) особо интересно в случае, когда вектор га яв- является ортом (единичным вектором). Обозначая координаты этого орта через cos a, sin а (это — его направляющие косину- косинусы; см. п. 5 § 5 гл. 1), мы получаем в этом случае для рассмат- рассматриваемой прямой уравнение х cos а + у sin а — р = 0. При р ^ 0 (а этого всегда можно добиться, заменив, в случае необходимости, вектор га противоположным вектором —п) это уравнение называется нормальным уравнением прямой (конеч- (конечно, лучше было бы говорить — «нормированным»). Таким обра- образом, уравнение Ах-\-Ву-\-С = 0 является нормальным уравнением, если А2 + В2 = 1 и С < 0. Чтобы из общего уравнения прямой получить нормальное уравнение, достаточно умножить его на «нормирующий мно- множитель» 1 VA2 + В1 (т. е. разделить на длину вектора п(А,В), взятую с некоторым знаком). Знак нормирующего множителя следует выбирать про- противоположным знаку свободного члена С (если С Ф 0; при С = 0 можно взять любой знак). 264
Заметим, .что при С ф 0 нормальное уравнение однозначно определено прямой, а при С = О (т. е. в случае, когда прямая проходит через начало координат) прямая имеет два нормаль- нормальных уравнения, получающихся друг из друга умножением на —1. Если в нормальном уравнении свободный член отличен от нуля (и следовательно, отрицателен), то начало координат О находится в отрицательной полуплоскости, определяемой дан- данной прямой, т. е. вектор га (cos a, sin а) направлен в сторону, противоположную стороне, в которой находится точка О (СМ. П; 4). Предложение 1. Расстояние d произвольной точки М(х,у) от прямой с нормальным уравнением х cos а + у sin а — р = О равно абсолютной величине числа, получающегося при подста- подстановке координат этой точки в уравнение прямой: d = | л: cos а + г/sin а — р | C) (как мы уже знаем, число х cos а -f- у sin а — р отрицательно, если точка М расположена по ту же сторону от прямой, что и начало координат, и положительно в противном случае). Доказательство. В векторной форме формула C) имеет вид d = | гаг — р |, где г — радиус-вектор точки М. В этом виде мы и будем ее до- доказывать. Пусть Мо— основание перпендикуляра, опущенного из точки М на нашу прямую. По определению, расстояние d точки М от прямой равно длине отрезка М0М, т. е. равно длине век- вектора М0М: d= Иными словами, где г — радиус-вектор точки М, а г0 — радиус-вектор точки Мо. Но вектор га перпендикулярен прямой и потому коллинеарен вектору М0М = г — г0. Следовательно, поскольку зтот вектор является ортом, длина вектора г — г0 равна абсолютной вели- величине его скалярного произведения на вектор я: d = | п (г — г о) | = | пг — пг01. Для завершения доказательства остается заметить, что пг0 = р, ибо точка Мо принадлежит прямой гаг — р = О ' 255
Следствие. Число р равно расстоянию точки О от прямой, т. е. длине перпендикуляра, опущенного из точки О на прямую. Один из двух (элементарно-геометрических) углов, образо- образованных пересекающимися прямыми Я4 и Яг, равен углу 8 между их направляющими векторами ai(Bi,—А\) и а2(В2,—А2) и по- потому определяется формулой Va\+a\Vb\ При AiA2 + BiB2 > 0 этот угол — острый, а при А\Аг + + BiB2 < 0 — тупой. При AiA2 + BiB2 = 0 этот угол равен л/2. Таким образом, Я, 1 Я2 фф Л1Л2 + Б1Б2 = 0. Чтобы получить острый (точнее, не тупой) угол между пря- прямыми, следует правую часть формулы D) взять по абсолютной величине. Если прямые Ki и Я2 заданы нормальными уравнениями х cos а{-\- у sin СЦ — рх = О и л cos а2 + у sin а2 — р2 == О, то угол 0 между ними определяется формулой cos 8 = cos ctj cos а2 + sin a] sin а2 = cos (а2 — aj). Следовательно, Q = \a2 — ax\. В частности, Замечание 2. Согласно п. 4 прямые Xi и Яг естественным об- образом ориентированы. Ясно, что определенный формулой D) угол Э является не чем иным, как углом между так ориентиро- ориентированными прямыми. Это замечание можно развить, вспомнив, что наша плос- плоскость также ориентирована (поскольку на ней фиксирована не- некоторая координатная система). Поэтому (см. дополнение к § 4 гл. 1) определен угол ср от прямой hi к прямой Я2- По определе- определению, —п < ф ^ я, причем ф = 8, если 0 ^ ф < я, и <р = —8, если — я < ф ^ 0. Угол ф однозначно определен, если извест- известны его тригонометрические функции cos ф = cos 8 и sin ф. Чтобы найти угол ф, мы рассмотрим ^наряду с направляю- направляющими векторами аг(Ви — Ах) и а2(В2, — А2) ортогональные им векторы пх(Аь В,) и п2(А2, В2). Поскольку вектор п2 направлен в положительную сторону прямой Яь угол от вектора а2 к век- 256
тору п2 равен я/2. Следовательно, угол ср' от вектора ах к вектору п2 равен ф + у и потому cosq/= — этф. Но угол ф' и угол между векторами а{ и п2 имеют один и тот же коси- косинус, так что косинус этого угла мы можем вычислить по из- известной формуле: СОЗФ'- b\Va\ Таким образом, для угла ф имеют место формулы - A2Bt 2 Va\+a\Vb\ однозначно этот угол определяющие. В частности, мы видим, что А,В2 - А2 Вернемся теперь к элементарно-геометрическим углам меж- между неориентированными прямыми. Легко видеть, что один из этих смежных углов (обозначим его через 8') имеет тот же тан- тангенс, что и угол ф: tg 9' = tg Ф, так что (угол 8' совпадает с углом 8, если 0 ^ ф ^ я, и равен л — 0, если —я < ф ^ 0; в частности, угол 6' — острый, если числа AiB2 —A2Bi и AiA2 + BiB2 имеют одинаковые знаки, и тупой, если знаки этих чисел различны). Через угловые коэффициенты ^\c=~~w~ и ^2——в^~ данных прямых формула для tg 8' записывается следующим образом: В частности, мы видим, что прямые с угловыми коэффициентами ki и k2 тогда и только тогда перпендикулярны, когда 9 М. М. Постников 257
Применяя формулу F) к оси абсцисс (имеющей угловой коэффициент ki = 0) и к произвольной прямой (с угловым ко- коэффициентом k2 — k), мы немедленно получаем, что угловой коэффициент k произвольной прямой равен танген- тангенсу угла 0', образованного этой прямой с осью абсцисс: k = tg 0'. Этот угол 8' часто называют поэтому углом наклона рассматри- рассматриваемой прямой. Предупреждение. Подчеркнем, что угол между прямыми мы рассматриваем по крайней мере в трех различных смыслах (9, ф и 6'). Углы 0 и 6' оба — элементарно-геометрические, но, вообще говоря, различные. Каждый раз, когда речь идет об угле между прямыми, необходимо четко отдавать себе отчет, в каком именно смысле этот угол понимается. § 2. ПЛОСКОСТЬ В ПРОСТРАНСТВЕ Плоскость в пространстве рассматривается почти дословно так же, как прямая на плоскости. 1. Плоскость как поверхность первого порядка Пусть в пространстве задана аффинная координатная систе- система Oxyz. Для любой плоскости П существует (отнюдь не един- единственная) аффиная координатная система O'x'y'z', в которой эта плоскость определяется уравнением х' = 0. Но, как мы знаем (п. 2 § 1 гл. 2), координата х' выражается через коорди- координаты х, у, z по формуле x' = Ax + By + Cz + D, где А, В, С и D — некоторые вещественные числа, причем хотя бы одно из чисел А, В или С отлично от нуля- (в обозначениях п. 2 § 1 гл. 2 А = с\, В = с\, С = с}{ и D = al). Тем самым до- доказано, что любая плоскость определяется уравнением вида Ax+By + Cz + D = 0, A) где хотя бы одно из чисел А, В или С отлично от нуля. Уравнение плоскости, имеющее вид A), называется ее об- общим уравнением. Доказанное утверждение означает, что любая плоскость является поверхностью первого порядка. Покажем, что верно и обратное, т. е. что . любая поверхность первого порядка является плоскостью, 258
Действительно, пусть Ах + By + Cz + D = О — уравнение произвольной поверхности первого порядка. Под* берем числа Ль В\, Ci и Л2, В2, С2 так, чтобы определитель [ В С , В, С] л2 в2 с2 был отличен от нуля (например, при Л2 + В2 ф О можно поло- положить Л1 = —В, В\ = A, Cj = 0 и Л2 = В2 = О, С2 = 1, а при Л = В = 0 можно положить Л] = С\ = 0, Bi = 1 и Л2 = 1, В2 = С2 = 0). Тогда формулы х? = Лл: -f By + Cz + ?>, В2у где D\ и D2 — произвольные числа (например, можно считать, что Di —?>2 = 0), описывают переход от координат х, у, z к некоторым новым координатам х', у', z'. В координатах х', у', z' данная поверхность выражается, очевидно, уравнением х'=0 и, следовательно, является плоскостью. Поскольку тот факт, что данная поверхность является плоскостью, не зависит от системы координат, наше утверждение полностью доказано. Собирая вместе доказанные утверждения, мы получаем сле- следующую теорему: Теорема 1. Поверхность в пространстве тогда и только тог- тогда представляет собой плоскость, когда она является алгеб- алгебраической поверхностью первого порядка. Соглашение об обозначениях. В дальнейшем символом П мы будем обозначать плоскость с уравнением A). В случае, когда нам придется рассматривать несколько прямых, мы бу- будем снабжать символ П индексами и будем предполагать, что соответствующими индексами снабжены и коэффициенты урав- уравнения A) (ср. соглашение для прямых в п. 1 § 1). Равенство нулю одного (или нескольких) коэффициентов А, В, С, D указывает на специальное положение плоскости от- относительно координатных осей. Задание. Докажите, что Л = 0 4$ ЩОх, В = 0 фф ЩОу, С = 0 ?ф Щ\Ог, D = 0 ФФ П преходи? через точку О @, 0, 0). 9* . 2§9
2. Параметрические уравнения плоскости Определение 1. Направляющим бивектором плоскости П на- называется произвольный отличный от нуля бивектор, параллель- параллельный этой плоскости, т. е. принадлежащий соответствующему линеалу BivB). Этот бивектор определен с точностью до кол- коллинеарности (и представляет собой не что иное, как базис линеала BivB)). Предложение 1. Вектор а (/, /п, п) тогда и только тогда па- параллелен плоскости П (принадлежит соответствующему линеа- линеалу Vectn B)), когда А1 + Вш-\-Сп = 0. A) Доказательство этого предложения аналогично доказатель- доказательству предложения 1 из п. 1 § 1, и мы его опустим. Задание. Докажите предложение 1. Следствие. Бивектор а(А,В,С) является направляющим би- бивектором плоскости П. Здесь запись <х(А,В,С) означает, что бивектор а имеет ко- координаты А, В, С в бивекторном базисе е2 Л е3, е3 Л е{, е\ Л е2, соответствующем данному базису еь е2, е3 пространства. Доказательство. В отличие от случая прямой (когда соответствующий вывод тривиален), для доказательства этого следствия требуется некоторая алгебраическая техника. Проще всего (хотя и несколько искусственно) это доказательство мож- можно провести следующим образом. Ясно, что уравнение A) будет удовлетворено при 1= — В, ш = А, п = 0. Обозначим вектор с этими координатами через а\. С другой стороны, уравнение A) удовлетворяется также и при 1 = 0, гп = — С, п = В. Обозначим вектор с этими координатами через а2. Если В Ф О, то векторы а\ и а2 не коллинеарны, и потому их внешнее про- произведение а{ Л а2 отлично от нуля. Поскольку векторы а{ и а2 параллельны согласно предложению 1 рассматриваемой пло- плоскости, это внешнее произведение будет, поэтому, направляю- направляющим бивектором этой плоскости. Но тогда направляющим би- бивектором будет и бивектор а = -?-(«>! Л а2). Для завершения доказательства остается заметить, что соглас- согласно общей формуле для внешнего произведения двух векторов 260-
(п. а = з§ 1 6 е гл. 1) 2Ле3 < — В 0 *эЛе, А -С 0 В «2 = А (е2 Л вз) + В (<?з Л в,) + С (в! Л ва). При В = О, Л =/= О доказательство проводится аналогично, только за вектор а2 следует принять вектор с координатами I — L*, Til U, II /1. При А = В = 0 (тогда обязательно С =^= 0) следует за век- вектор ах принять вектор с координатами l= — C, m = 0, « = 0 ( = Л). Замечание 1. Это следствие можно доказать и по-иному, рассмотрев ко- срдинаты х' = Ах + By + Сг + D, г' = Агх + Вгу + C2z + ?>2, в которых данная плоскость П является плоскостью х' = 0 (см. выше). Со- Согласно формулам преобразования координат бивекторов (п. 3 § 6 гл. 1) би- бивектор а в этой координатной системе имеет координаты в. С С, С, Ф0, А В С А В С А2 В2 С2 = 0, А В С А, в, с, А В С и потому коллинеарен бивектору е'2 А е'ъ. Для завершения доказательства остается заметить, что последний бивектор, очевидно, параллелен рассматри- рассматриваемой плоскости. Пусть плоскость П с направляющим бивектором а проходит через точку Мо (х0, у о, го). Представим бивектор а в виде внеш- внешнего произведения а Л b каких-то двух векторов а и Ь. По- Поскольку векторы а, Ь составляют, очевидно, базис линеала Vectn B), точка М(х,у,г) тогда и только тогда принадлежит плоскости, когда вектор М0М линейно выражается через век- векторы а и 6, т. е. когда существуют такие числа и и у, что М0М = ua-\-vb. Пусть г0 — радиус-вектор точки Мо, а г — радиус-вектор точки М. Тогда предыдущее равенство может быть записано в виде г = rQ-\-ua-\- vb. 261
Это — параметрическое уравнение плоскости в векторной фор- форме. Записав его в координатах, мы получим параметрические уравнения плоскости в координатной форме; x = xo-\-uax-\-vbu У = Уо + иа2 + vb2, z = z0 + иа3 + vb3, где tfi, а2, а3 — координаты вектора а, а Ьи Ь2, Ь3— координаты вектора Ь. Точка Мо и векторы а, Ь определяют на плоскости аффин- аффинную координатную систему с репесом Moab. Очевидно, что параметры и и v являются аффинными координатами на плоскости относительно репера Moab. Поскольку векторы а и Не коллинеарны, тот факт, что вектор М0М1 линейно через них выражается, равносилен тому, что векторы МоМ, а и Ь линейно зависимы (компланарны), т.е. тому, что составленный из их координат определитель равен нулю: •х — х0 у — г/0 z — z0 а2 а3 Ь2 Ь3 = 0. B) Это равенство выражает необходимое и достаточное условие того, что данная точка принадлежит рассматриваемой плоско- плоскости, т. е. является ее уравнением. Это уравнение плоскости иногда называется уравнением в детерминантной форме. Обозначив алгебраические дополнения элементов первой строки определителя B) через А, В и С и разложив определи- определитель по этой строке, мы получим уравнение А (х - хо) + В (у - г/о) + .С B - 2о) = 0. Это — общее уравнение плоскости, проходящей через данную точку. Плоскость полностью определена, если на ней заданы три точки Мо(х0, уо, 20), Mi(xuyuzi) и M2(x2,y2,z2), не лежащие на одной прямой. Рассмотрим векторы а = М0Мъ (*, — хо, Ух — г/о. г, — г0), Ъ = М0М2 (Х2 — Хо, г/2 — Уо, z2 — Zq). Эти векторы не коллинеарны, и потому их внешнее произведе- произведение а А Ь отлично от нуля. Оно, очевидно, является направляю- направляющим бивектором данной плоскости. 262-
.В соответствии со сказанным выше отсюда вытекает, что плоскость, проходящая через точки Mo(xo,yo,zo), Mi(xuynZi) и М2(х2, г/г, 2г), имеет уравнение . ' . •* хо У У о z Х\ Xq уj z/q Z\ i X2 XO У 2 Уо Z2 ¦ = 0. C) Замечание 2. Уравнение C) иногда удобно записывать в следующем более симметричном виде: У z Уо zo У\ Zi г/2 2?г 1 1 1 1 = 0. D) Для доказательства равносильности уравнений C) и D) до- достаточно вторую строку определителя D) вычесть последова- последовательно из всех остальных строк и после этого разложить опре- определитель по последнему столбцу. Параметрические уравнения рассматриваемой плоскости имеют, очевидно, вид X = Xq -\- U (Х\ — Xq) -j- V (Х2 — Хо), У = г/о "т~и \У\ У о) т v (г/2 — г/о). Z = Z0 + U B, — 20) + V B2 — Zq), т. е. вид X=(l —U — V) Xq + «*1 + VX2, У = A — и — о) г/о + «г/i + f г/г. 2 = A — И — у) 20 + UZy + О22. Следовательно (см. п. 6 § 1 гл. 2), числа 1 — и — v, и, v являются однородными барицентри- барицентрическими координатами на плоскости. 3. Взаимное расположение плоскостей в пространстве Ясно, что две плоскости П и П] тогда и только тогда па- параллельны1), когда их направляющие бивекторы коллинеарны. Следовательно, справедливо следующее Предложение 1. пнп, & 4-=4-=-Я- & г=\. ') Как и для случая прямых, совпадающие плоскости мы считаем парал- лелышми. 263
Здесь г—ранг матрицы ABC .Ах В{ С, Замечание 1. Вместо направляющих бивекторов в в этом рассуждении можно было бы рассматривать ассоциированные с ними векторы а , перпен- перпендикулярные данным плоскостям (см. п. 3 § 6 гл. 1). Однако это означает использование метрических понятий. Если оставаться в рамках аффинной гео- геометрии, то использование бивекторов неизбежно (быть может, в завуалиро- завуалированной форме). Параллельные плоскости совпадают, если они имеют хотя бы одну общую точку М0(х0, уо,го), т. е. если существуют такие числа х0, г/о, z0, что Ах0 + Ву0 + Сг0 + D = О, 1z0 + Dl = 0. Пусть А = рАи В = рВь С = pCi. Вычитая из первого из ра- равенств A) второе, умноженное на р, мы немедленно получим, что D — pD[ = о, т. е. что D = pD\. Ясно, что обратное также верно: если D = pDb то рассматриваемые плоскости совпадают. Тем самым доказано следующее Предложение 2. Здесь R — ранг матрицы А В С D .Л, Вх С, Я, Это — теорема единственности для поверхно- поверхностей первого порядка. Оба доказанных утверждения можно объединить в следую- следующую теорему о взаимном расположении двух плоскостей: Теорема 1. а) плоскости П и П] пересекаются (по прямой) ^ г = 2; б) П||III, но П^П, 4? r=l, R = 2; в) П = П, <##¦ R=l. В частности, плоскости П и III тогда и только тогда имеют хотя бы одну общую точку, когда г = R. Это — снова специальный случай теоремы Кронекера — Ка- пелли. Для трех плоскостей П, Щ, Щ в пространстве возможны во- восемь существенно различных типов их взаимного расположения: 264
Тип 1. Плоскости попарно не параллельны и имеют одну и только одну общую точку; это — общий тип. Т и п 2. Плоскости попарно не параллельны, но прямые, по которым они попарно пересекаются, параллельны между собой и не совпадают (в этом случае плоскости не имеют ни одной об- общей точки и вырезают из пространства бесконечную треуголь- треугольную призму). Т и п 3. Две из плоскостей параллельны, но не совпадают, а третья их пересекает. Тип 4. Плоскости попарно не параллельны и имеют об- общую прямую. Тип 5. Две плоскости совпадают, а третья их пересекает. Тип 6. Все три плоскости параллельны, но никакие две из них не совпадают. Тип 7. Две плоскости совпадают, а третья им параллель- параллельна, но от них отлична. Тип 8. Все три плоскости совпадают. Схематически: Тип 1 Тип 2 Тип 3 Тип 4 Тип 5 Тип 6 Тип. 7 Тип 8 Для исследования этих типов взаимного расположения удобно рассмотреть следующие пять случаев: Случай 1 (тип 1): имеется хотя бы одна пара непарал- непараллельных плоскостей и прямая их пересечения пересекает тре- третью плоскость. Случай 2 (типы 2 и 3): имеется хотя бы одна пара не- непараллельных плоскостей и прямая их пересечения параллель- параллельна третьей плоскости (но в ней не содержится). Случай 3 (типы 4 и 5): имеется хотя бы одна пара не- непараллельных плоскостей и прямая их пересечения содер- содержится в третьей плоскости. 265
Случай 4 (типы 6 и 7): все плоскости параллельны и среди них по крайней мере две не совпадают. . Случай 5 (тип 8): все плоскости совпадают. Пусть г —ранг матрицы ABC Л, В, С, . А 2 В2 С 2• a R — ранг матрицы А2 В2 С2 и ^ ¦ Оказывается, что справедлива следующая теорема о вза- взаимном расположении трех плоскостей в про- пространстве: Теорема 2. Случай 1 <=$> r = 3, R = 3; случай 2 4Ф г = 2, /? = 3; случай 3 ^Ф r = 2, R = 2; случай 4 ФФ г=1, /? = 2; случай 5 4Ф г=1, 7?=1. Доказательство этой теоремы вполне аналогично до- доказательству теоремы 2 из п. 3 § 1, и мы его опустим. Упражнение. Докажите теорему 2. Из теоремы 2 снова вытекает соответствующий частный слу- случай теоремы Кронекера — Капелли: три плоскости тогда и только тогда имеют хотя бы одну общую точку, когда г = R. 4. Полупространства, на которые плоскость разбивает пространство Подобно тому как прямая разбивает плоскость на две полу- полуплоскости, плоскость разбивает пространство на два полупро- полупространства:, точки М{ и М2 (не принадлежащие плоскости) тогда и только тогда принадлежат одному полупространству, когда отрезок М\М2 не пересекает плоскость. Пусть рассматриваемая плоскость задана уравнением F (х, у, z) = Ах + By + Cz + D = 0. Предложение 1. Точки Mi(xu yi,Zi) и M2(x2,y2,z2) тогда и только тогда принадлежат одному полупространству, когда числа F(xi,yi,Zi) и F(x2,y2,z2) имеют один и.тот же знак. 266
Доказательство (вполне аналогичное доказательству предложения 1 из п. 4 § 1). Рассмотрим прямую, проходящую через точки Mi и М2. Как было показано в п. 2 § 1, ее пара- параметрические уравнения имеют вид A) причем точкам отрезка М\М2 отвечают значения параметра, удовлетворяющие неравенствам 0 ^ t ^ 1. Чтобы найти точку пересечения этой прямой с нашей пло- плоскостью (когда эта точка существует), следует подставить вы- выражения A) в уравнение плоскости и решить получающееся уравнение относительно t. Сделав это, мы немедленно полу- получим, что точке пересечения отвечает значение параметра / F(xu i/i, zi) ,„. 0 F (*„ уи г,) - F (x2, y2, z2) ' W Но, по определению, точки Mi и М2 тогда и только тогда лежат в разных полупространствах, когда точка пересечения существует и принадлежит отрезку MiM2, т. е. когда t0 опре- определено и О<;^о<1- Для завершения доказательства остается заметить, что в силу формулы B) условие 0 <; ^о < 1 равно- равносильно тому, что числа F(xlt-yi,Zi) и F(x2,y2,z2) имеют разные знаки. Таким образом, при данном уравнении плоскости Ш Ах + By + Cz + D = О точки одного полупространства, на которые эта плоскость де- делит пространство, характеризуются неравенством Ах -\- By -\- + Cz -j- D > 0, а точки другого полупространства — неравен- неравенством Ах -f- By + Cz -f- D <; 0. В соответствии с этим первое полупространство называется положительным (относительно данного уравнения плоскости), а второе — отрицательным. Используя терминологию, введенную в п. 4 § 4 гл. 1, мы можем сказать, что задание уравнения плоскости определяет некоторую сторону этой плоскости. Но поскольку у нас в про- пространстве задана аффинная координатная система, простран- пространство ориентировано, а задание в ориентированном простран- пространстве некоторой стороны плоскости равносильно заданию ориен- ориентации этой плоскости (П. 4 § 4 гл. 1). Таким образом, каждое уравнение плоскости задает некоторую ориентацию этой плоскости; при умножении уравнения на положительное число эта ориентация не меняется, а при умножений на от- отрицательное число — переходит в противоположную. Ориентация плоскости, соответствующая уравнению Ах-\- -f- By -j- Сц -f- D — 0, задается ее направляющим бивектором а, 267
обладающим тем свойством, что внешнее произведение аЛя бивектора а и некоторого вектора п, направленного в положи- положительную сторону плоскости, определяет ту же ориентацию про- пространства, что и внешнее произведение в\ Л е2 Л е3 векторов координатного базиса. Чтобы найти этот бивектор, мы заметим сначала, что вектор п(А,В,С) направлен в положительную сторону пло- плоскости П. Действительно, пусть Мо (х0, у0, г0) — произвольная точка плоскости и пусть п = М0М\. Тогда точка Mi имеет коорди- координаты хо-\-А, Уо-\-В и Zq-\-C. Остается заметить, что А (х0 + А) + В (у0 + В) + С B0 + С) + D = А2 + В2 + С2 > 0. Отсюда немедленно вытекает, что описанная выше ориентация плоскости П задается направ- направляющим бивектором а(А,В,С). Действительно, а Л п = (А (е2 А е3) + В (е3 Ае{) + С (е, Л е2)) Л (Ае{ + Ве2 + Се3) = Поскольку А2 + В2 + С2 > 0, ориентации тривекторов «Ли и ?i Л е2 Л е3 совпадают. 5. Плоскость в евклидовом пространстве Мы переходим теперь к изучению евклидовых (метрических) свойств плоскостей в пространстве. В соответствии с этим мы будем впредь считать наши координаты х, у, z прямоугольными. В евклидовом пространстве каждую плоскость можно за- задать ее произвольной точкой Мо(х0, у0, z0) и некоторым (отлич- (отличным от нуля) вектором я, перпендикулярным этой плоскости. Для любой точки М(х, у, г) рассматриваемой плоскости вектор МоМ ортогонален вектору п и потому скалярное произведение этих векторов равно нулю: Обозначая радиус-вектор точки Мо через г0, а радиус-вектор точки М — через г, мы можем это равенство записать в сле- следующем виде: n(r-ro) = O A) или, раскрывая скобки, — в виде яг-р = 0, B) где р — пг0. Таким образом, радиус-вектор каждой точки нашей плоскости удовлетворяет уравнениям A) или B). Ясно, что и 268
обратно, если радиус-вектор некоторой точки М удовлетворяет уравнениям A) или B), то эта точка принадлежит рассматри- рассматриваемой плоскости. В соответствии с этим уравнения A) и B) называются уравнениями плоскости в векторной форме. Обозначая координаты вектора п через А, В, С и полагая D = —р, мы можем уравнение B) переписать в уже известной нам координатной форме Аналогично, уравнение A) дает нам общее уравнение плос- плоскости, проходящей через данную точку: Замечание 1. Изложенные соображения еще раз независимо показывают (правда, только для евклидова пространства), что любую плоскость можно задать уравнением первого порядка. Кроме того, мы видим, что вектор п(А,В,С) перпендикулярен плоскости Замечание 2. Таким образом, вектор a(l,m,n) тогда и толь- только тогда параллелен плоскости, когда он ортогонален вектору я (Л, В, С), т. е. когда А1 + Вт + Сп = 0. Это — уже известная нам формула A) из п. 1. Подчеркнем, что согласно п. 1 она имеет место в любых аффинных координатах, когда вектор п(А,В,С) уже не перпендикулярен плоскости (а скалярное произведение двух векторов не является суммой про- произведений одноименных координат). Рассмотрим случай, когда вектор п является ортом (единич- (единичным вектором). Обозначая координаты этого орта через cos а, cos p, cosy (это —его направляющие косинусы; см. п. 5 § 5 гл. 1) мы получаем в этом случае для рассматриваемой плос- плоскости уравнение х cos а + у cos Р + z cos у — р — 0. При р ^ 0 (чего всегда можно добиться заменой, в случае не- необходимости, вектора п противоположным вектором —п) это уравнение называется нормальным уравнением плоскости. Та- Таким образом, уравнение является нормальным уравнением, если Л2 + 52 + С2=1 и ?><0. 269
Чтобы из общего уравнения плоскости получить ее нормальное уравнение, достаточно умножить его на «нормирующий мно- множитель» Знак нормирующего множителя следует выбирать противопо- противоположным знаку свободного члена D (если D ф 0; при D = 0 можно взять любой знак). Заметим, что при D Ф 0 нормальное уравнение однозначно определено плоскостью, а при D = 0 (т. е. в случае, когда плоскость проходит через начало координат) имеется два нор- нормальных уравнения, получающихся друг из друга умножением на —1. Предложение 1. Расстояние d произвольной точки M(x,y,z) от плоскости с нормальным уравнением х cos а + У cos Р + 2 cos Y — р = 0 равно абсолютной величине числа, получающегося при подста- подстановке координат этой точки в уравнение плоскости: d = \ xcosa-\- ycos$-\- zcosy — р\ C) (как мы уже знаем, число х cos а + у cos p + z cos у — р отри- отрицательно, если точка М расположена по ту же сторону плос- плоскости, что и начало координат, и положительно в противном случае). Доказательство этого предложения по существу дословно совпадает с доказательством соответствующего предложения 1 из п. 5 § 1, и мы его опустим. Задание. Докажите предложение 1. В частности, мы видим, что коэффициент р равен расстоянию от начала координат до плоскости, т. е. равен длине перпендикуляра, опущенного из точки О на плоскость. Две (пересекающиеся) плоскости Щ и Пг образуют два смежных угла, сумма которых равна я. Если плоскости парал- параллельны или совпадают, то угол между ними, по определению, считается равным 0 (или л). Один из углов между плоскостями IIi и П2 (обозначим его символом 6) совпадает с углом между векторами tii(Ai, Bit Ci) и tt2(A2, B2, C2), перпендикулярными этим плоскостям. Поэтому Л^ + ВЛ + С^ VaI + b\ + c\VaI + bI+<% 270
При /4И2 + BiB2 + CiC2 > 0 угол 9 — острый, а при ЛИгЦ-1 + BtB2 + CiC2 < 0 — тупой. При AtA2 + 5i?2 + CiC2 = 0 этот угол равен я/2. Таким образом, ii! i п2 «Ф л, л2 + ад + с а = о. Чтобы получить острый (точнее — не тупой) угол между плоскостями, следует правую часть формулы D) взять по абсо- абсолютной величине. В случае, когда плоскости Щ и П2 заданы нормальными уравнениями xcosct! + у cos $i + 2 cos Yi — Pi =0 и x cos a2 -f- у cos P2 + z cos y2 — P2 = 0, угол 9 между ними определяется формулой cos 9 = cos a, cos a2 + cos ^! cos p2 + cos Yi cos y2. В частности, III -L П2 ^Ф cos aj cos a2 + cos ^j cos p2 + cos Yi cos y2 = 0. Далее можно продолжать так же, как и для прямых (ввести углы ф и 9' и получить для них соответствующие формулы). Без сомнения, читатель может теперь это сделать самостоятельно и потому мы этим заниматься здесь не будем. § 3. ПРЯМАЯ В ПРОСТРАНСТВЕ 1. Прямая в аффинном пространстве Любая прямая в пространстве является пересечением двух непараллельных плоскостей и потому задается (в фиксирован- фиксированной аффинной координатной системе Oxyz) двумя уравнениями первой степени А2х + В2у + C2z + D2 = 0. Для того чтобы такие уравнения являлись уравнениями не- некоторой прямой, необходимо и достаточно, чтобы соответствую- соответствующие плоскости были не параллельны, т. е. чтобы ранг матрицы , ву с 2 В2 С2 был равен двум. Прямую в пространстве можно задавать также ее произ- произвольной точкой Mo (xo, yo, z0) и некоторым отличным от нуля 271-
вектором аA,т,п), параллельным этой прямой (т. е. ее направ- направляющим вектором; ср. п. 2 § 1). На этом пути мы приходим к параметрическим уравнениям х = х0 + U, z = zo-\- tn прямой и к ее каноническим уравнениям х — х0 у — уд . г — г0 I ~~ m ~ n ' двумя разными способами выражающим тот факт, что точка M(x,y,z) тогда и только тогда принадлежит прямой, когда век- вектор М0М коллинеарен вектору а (ср. п. 2 § 1). Заметим, что хотя канонических уравнений формально» три: х— х0 __ у — уд х — х0 __ z — г0 У — Но _ z — Zp I m ' I n ' m n ' но каждое из них является следствием двух других, так что на самом деле мы имеем, как и полагается, только два независи- независимых уравнения. Чтобы от общих уравнений ДО, А2х + В2у + C2z + D2 = 0 "' перейти к каноническим уравнениям, нужно найти 1) хотя бы одну точку Мо (хо, г/о.'^о) прямой B); 2) некоторый ее направляющий вектор a(l, m, п). Для нахождения точки М0(х0, yo,zo) следует одному из не- неизвестных х, у, z в уравнениях B) придать произвольное зна- значение (скажем, 0) и решить получающуюся систему двух линей- линейных уравнений с двумя неизвестными. Чтобы обеспечить суще- существование решения, нужно при этом «свободную» неизвестную (которой мы придаем произвольное значение) выбрать так, чтобы определитель, составленный из коэффициентов при дру- других двух неизвестных, был отличен от нуля (это всегда можно сделать, поскольку ранг матрицы A) по условию равен двум). Чтобы найти направляющий вектор, можно, например, най- найти на данной прямой вторую точку Mi{xy, yu 2t), отличную от точки Mo{xo,yo,Zo) (для этого достаточно дать свободной неиз- неизвестной иное значение) и принять за вектор а вектор M0Mi. Можно поступить и более «инвариантным» образом, заметив, что вектор а тогда и только тогда является направляющим век- вектором прямой, когда он параллелен обеим плоскостям, пересе- 272
чением которых является эта прямая, т. е. (см. п. 2 § 2) когда его координаты /, т, п удовлетворяют уравнениям Ах Л2 с, с2 At А2 5, 52 Тривиальное вычисление показывает, что этим уравнениям удовлетворяют, например, числа 5, С в2 с (среди которых хотя бы одно не равно нулю). Таким образом, эти числа можно принять за координаты вектора а. Этот направляющий вектор можно записать в следующем виде: е, е2 е3 а= А{ В, С, Л2 В2 С2 удобном для запоминания. Замечание 1. В случае прямоугольных координат (и только в этом слу- случае!)— т. е. в случае, когда базис е\, ег, е$ ортонормирован—вектор а яв- является векторным произведением векторов п\(А\,В\,С]) и п2(А2, В2,С2), пер- перпендикулярных рассматриваемым плоскостям. Из полученных формул для направляющего вектора а не- немедленно вытекает, в частности, что для прямой К- А2х + В2у + C2z + D2 = 0 имеют место следующие эквивалентности: а) КЦОху 4#> б) А || 0*2 #ф в) \\\Оуг <##¦ Ах А2 Ах Л2 Вх 52 Вх 52 Сх с, Сх С2 = 0 = 0, = 0. Замечание 2. Мы видим, таким образом, что равенство нулю какого-либо минора матрицы 'Ах Вх C . л2 в2 с21 имеет (при фиксированной координатной системе) инвариант- инвариантный геометрический смысл, т. е. сохраняется при любом 273
другом выборе пары плоскостей, определяющих данную прямую. В дополнении к § 2 гл. 4 мы выясним причины этого. В случае, когда А В, =7^=0, т. е. когда рассматриваемая А2 В2 прямая не параллельна координатной плоскости Оху, мы мо- можем решить уравнения этой прямой относительно х и у,-т. е. привести их к виду x — az -\- р, C) Такие уравнения прямой называются ее приведенными уравне- уравнениями. Задание прямой приведенными уравнениями означает ее представление в виде пересечения двух плоскостей, одна из которых параллельна оси ординат Оу (плоскость х = az-\- p), a другая — оси абсцисс Ох (плоскость y = bz-\-q). Первое из уравнений C) (уравнение х = az -+- p) является одновременно уравнением проекции данной прямой (параллельно оси Оу) на плоскость Oxz (в имеющихся на этой плоскости координа- координатах х, z), а второе (уравнение у — bz-\-q)—уравнением про- проекции данной прямой (параллельно оси Ох) на плоскость Oyz (в имеющихся на этой плоскости координатах у, г). Чтобы помочь читателю освоиться с уравнениями прямой, решим для примера две простые задачи на прямую и плос- плоскость. Задача 1. Найти плоскость, проходящую через прямую х — х0 у — г/о __ г — г0 m n I и точку M\{Xi, г/ь Zi), не лежащую на этой прямой. Ясно, что точка M(x,y,z) тогда и только тогда принадле- принадлежит искомой плоскости, когда векторы МйМ (х — х0, у — г/0, z — z0), — х0, — у0, zx — z0) а (/, т, п) компланарны. Поэтому уравнение этой плоскости имеет вид х — х0 у — г/0 z — z0 х0 I У\ — г/о 2, — zQ m п = 0. Это действительно уравнение первой степени (т. е. хотя бы один из коэффициентов при х, г/, z отличен от нуля), поскольку векторы MqM 1 (xi — хо, yt — уо, zt — z0) и a(t,m,n) не кол- линеарны. 274
: Задача 2. Найти плоскость, проходящую через прямую х параллельно прямой х— лг8 _ у — уо г —. I m n х — хх _ у — у\ z — Zi 1\ ~ mi пх ' в предположении, что эти прямые не параллельны (иначе за- задача была бы. неопределенной). Искомая плоскость может быть рассматриваема как плос- плоскость, проходящая через точку М0(х0, г/о, ?<>) параллельно некол- линеарным векторам аA,пг,п) и fli(/i, mi, n%). Следовательно (п. 2 § 2), ее уравнение имеет вид — Ч у — у a z — z0 I га п = 0. 2. Взаимное расположение прямых и плоскостей Две прямые Ki и h. в пространстве могут а) скрещиваться (т. е. не принадлежать одной плоскости); это — общий тип расположения двух прямых в пространстве; б) пересекаться (и потому лежать в одной плоскости); в) быть параллельными (и потому также лежать в одной плоскости), но не совпадать; г) совпадать. Пусть прямые ?ц и fa заданы их каноническими уравнениями х — xi __ у — у\ __ z — Zj х — х2 ___ у — у2 _z — z2 h ' m2 «2 Рассмотрим направляющие векторы ui(h, mt, nt), fl2D, mz, n%) этих прямых и вектор г = MMi(x% — хи у2 — Уи ^ — г4). Оче- Очевидно, что прямые тогда и только тогда скрещиваются, когда векторы аи а2 и г не компланарны. Если эти векторы компланар- компланарны, но векторы «1 и a<i не коллинеарны, то прямые пересекают- пересекаются. Если векторы а4 и а2 коллинеарны, но не коллинеарны век- вектору г, то прямые параллельны, но не совпадают. Если все три вектора аи а2 и г попарно коллинеарны, то прямые совпадают. Вспоминая условия компланарности и коллинеарности векторов и обозначая через г ранг матрицы J2 tn2 n2l 275
а через R — ранг матрицы у2 — г/, z2 — тх я, J, A) т2 п2 мы немедленно получаек отсюда, что прямые Xi и Х2 а) скрещиваются О R = 3; б) пересекаются фф г = 2, R — 2; в) параллельны 4=$ r=l, R — 2; г) совпадают €$ r—l, R=l. В частности, прямые Х\ и Х2 тогда и только тогда компланарны {лежат в одной плоскости), когда определитель матрицы A) равен нулю. Прямая Я и плоскость П в пространстве могут а) пересекаться в единственной точке; это ¦—общий тип рас- расположения прямой и плоскости в пространстве; б) не иметь ни одной общей точки (прямая параллельна плоскости, но в ней не содержится); в) быть инцидентными (по определению, это означает, что- прямая содержится в плоскости). Пусть прямая X задана каноническими уравнениями х — х0 а плоскость П — общим уравнением Прямая тогда и только тогда пересекает плоскость в един- единственной точке, когда ее направляющий вектор a(l,m,n) не па- параллелен этой плоскости, т. е. (п. 2 § 2) когда А1 + Вт + Сп ф 0. Если А1 + Вт -f- Сп = 0, но ни одна точка прямой, и, в част- частности, точка М0(хо,уо,г0), не принадлежит плоскости, то прямая и плоскость параллельны, но не инцидентны. Наконец, если А1 + Вт -\- Сп = 0 и точка Мо принадлежит плоскости (Ах0 -f- + Ву0 + Cz0 + D = 0), то прямая инцидентна плоскости. Та- Таким образом, прямая X и плоскость П а) пересекаются 4^ А1 + Вт + СпфО; б) параллельны, но не инцидентны фф А1 + Вт + Сп = 0, на Axo + Byo + Czo+D^O; в) инцидентны ФФ Al -f- Вт -f- Сп = 0 и Ах0 + Ву0 -f- Cz0 -J- + D = 0. 276
Это утверждение можно доказать и по-иному, если поставить- задачу о разыскании точек пересечения (общих точек) прямой и плоскости. Параметрические уравнения нашей прямой имеют вид x = Xq+U, y = yo+-mt, z = z0 + nt, и потому значения параметра t, соответствующие точкам пе- пересечения, определяются из уравнения А (*„+«) + В(у0 + mt) + С (z0 + nt) + D = 0, т. е. из уравнения (Л/ + Bra + Сп) t + (Лл:0 + Ву0 + Cz0 + ?>) = 0. При А1-\-Вт-\-СпФ® это уравнение имеет единственное ре- решение (и, следовательно, имеет место случай а)), при А1 + Вт + -)- Сп = 0 и Ахо-\-Вуо4-Czo-\-D Ф 0 это уравнение не имеет решений (случай б)), а при АI + Вт -\- Сп — 0 и Лл;0 + Вуо + + Сг0 + D = 0 оно удовлетворяется тождественно (случай в)). Вопрос о взаимном расположении прямой и плоскости мож- можно ставить и тогда, когда прямая к задана своими общими уравнениями Л2* + В2у + C2z + D2 = 0. В этом случае все сводится к теореме 2 п. 3 § 2 о взаимном рас- расположении трех плоскостей. Пусть г — ранг матрицы \А2 a R — ранг матрицы Согласно теореме 2 п. 3 § 2 прямая X и плоскость П а) пересекаются в одной точке 4Ф г = 3, 7? = 3; б) параллельны, но не инцидентны 4^ г = 2, 7? = 3; в) инцидентны ФФ f — 2, R = 2. 277'
Действительно, случай а) имеет место тогда и только тогда, когда все три рассматриваемые плоскости расположены по типу 1, случай б) —когда они расположены по типу 2 или 3, а случай в) — когда они расположены по типу 4 или 5. (Заме- (Заметим, что типы расположения 6, 7 и 8 в рассматриваемом случае невозможны.) 3. Прямая в евклидовом пространстве Напомним, что расстоянием точки от прямой называется длина перпендикуляра, опущенного из этой точки на прямую. Пусть х — х0 __ у — t/o _ г — г0 ,., I т п * ' — канонические уравнения произвольной прямой. Для любой точки М(х, у, г) (с радиус-вектором г), не принадлежащей этой прямой, рассмотрим параллелограмм, построенный на век- векторах МоМ = г — г0 и аA,т,п) (имеется в виду, что эти век- векторы отложены от точки М0(х0, у0, z0). Высота этого паралле- параллелограмма равна, по определению, расстоянию d точки М от прямой A). Поэтому его площадь равна произведению расстоя- расстояния d на длину \а\ вектора а. Но эта площадь равна площади бивектора (г — Го)Лп (т. е. длине \г—го)Ха| векторного про- произведения ') (г — г0) X а). Следовательно, расстояние d точки М(х,у,г) от прямой A) выражается формулой Л = К*--го)Ха| B) \а\ к ' В координатах эта формула имеет вид х — х0 у — у о I m 2 х — х0 г — zu |2 п У — У о z — m n Формулу B) можно получить и иначе, заметив, что по известной теореме о перпендикуляре и наклонной, расстояние d точки М от прямой является минимумом расстояний от этой точки до произвольной точки рассматривае- рассматриваемой прямой. Поскольку каждая точка нашей прямой имеет радиус-вектор Го-{-at, где t — некоторое число, мы, обозначая расстояние от точки М до этой точки символом (o(t), можем поэтому написать, что d = min (o(t), где минимум берется по всем вещественным t. Для вычислений удобнее эту формулу возвести в квадрат: d2 «= min ш2 (t). J) Поскольку наши рассуждения имеют сугубо метрический характер, пе- переход от бивекторов к ассоциированным векторам вполне оправдан. 278
Согласно формуле для расстояния между двумя точками где г, как и выше, — радиус-вектор точки М. Дифференцируя эту формулу по t (легко видеть, что обычные правила дифференцирования суммы и про- произведения остаются справедливыми и для векторов1)), мы немедленно на- находим, что -2 (г — г0 — at) a, —J(Y— = 2а2 > 0. dt d2a2(t) „ , da>2(t) n Поскольку —. з >0, значение /, при котором —-г— = 0, соответствует минимуму функции со2 (t). Это значение, очевидно, равно (г — Гр) а {°^ ? • Следовательно, ((г-г0) аJ ((г-г,) а) + -2 -С "Го) a' a Полученную формулу можно переписать в более симметричном виде: ч [г — г0J а (г — го) м _ (г- Го) а а2 Определитель в числителе является не чем иным, как определителем Грама Г (г—Го, а) векторов г — г0 и а (см. п. 4 § б гл. 1), и потому он равен квадрату площади их внешнего произведения. Следовательно, окончательно, [(г-г0) Л а! а — г—i , что совпадает с полученным выше результатом. Заметим, что мы не только вычислили минимум, но и доказали его су- существование. Кроме того, мы теперь без особого труда можем написать параметриче- параметрические (или. что равносильно, канонические) уравнения перпендикуляра, опу- опущенного из произвольной точки M,(xi, г/i, zi) на прямую A). Действительно, как мы видели, основанию этого перпендикуляра соответ- соответствует значение о {Г\ — го) а параметра /. Поэтому, его радиус-вектор равен , (п — г0) д го + -2 а, откуда после тривиальных алгебраических преобразований получается, что перпендикуляр, опущенный из точки Mt (r\) на прямую г = го + at, ') Проще всего это проверить, написав соответствующие формулы в ко- координатах. 279
задается параметрическим уравнением l-O'o + 'r, (l-t)a г = ад2 С C) Напомним, что углом между двумя прямыми в простран- пространстве называется угол между параллельными им прямыми, про- проходящими через произвольную точку (и потому лежащими в одной плоскости). Очевидно, что это определение корректно (не зависит от выбора точки). Оно дает для угла между прямыми два значения, дополняющие друг друга до я. Один из этих дополнительных углов равен, очевидно, углу 0 между направляющими векторами рассматриваемых прямых. Поэтому для угла 0 между прямыми ^ . х — х2 __ у — у2 _ z — z2 2' 12 т2 п2 справедлива формула cos 9 = /1Z2 + от,от2 + пхп2 ^ .^ Угол 0 — тупой, если lLl2 + т^гпъ -f- тп2 < 0, острый, — если hh + Ш\ггц + «i«2 > 0, и равен я/2, если kk + т^Шг + П\Пг = = 0. Чтобы получить острый (точнее — не тупой) угол между пря- прямыми, следует правую часть формулы D) взять по абсолютной величине. В частности, мы видим, что Xi ± К2 Ф^ hh + Щт2 + Пуп2 = 0. Угол между прямой и плоскостью, подобно углу между дву- двумя прямыми, принимает, вообще говоря, два значения, допол- дополняющие друг друга до п. Мы будем интересоваться только острым (точнее — не тупым) из этих двух углов. Обозначим его через 0. Этот угол можно определить как дополнение до я/2 нетупого угла qp между данной прямой и перпендикуляром к данной плоскости: При ф ф 0, т. е. в случае когда прямая и плоскость не перпен- перпендикулярны, угол 9 можно также определить как острый угол между прямой и ее ортогональной проекцией на плоскость. .280
Пусть прямая Я задана ее каноническими уравнениями / т п а плоскость П — ее общим уравнением Ах + By + Cz + D = 0. По определению, угол ф является либо углом между векторами аA,т,п) и п(А, В, С), либо представляет собой дополнение этого угла до я. Поэтому А1 + Вт + Сп cosq> = В2 + С2 Vl2 Ho cos ф = sin 9, ибо 9 = -j — Ф- Следовательно, Sin9= _7==At±Bm+Cn + т2 + л2 В частности, мы снова получаем, что АЦП 4^ А1 E) Из формулы E) довольно трудно получить условие, когда 8 = я/2, т. е. когда Я-LII. Проще, не пользуясь этой форму- формулой, непосредственно воспользоваться тем, что вектор аA,т,п) параллелен прямой К, а вектор п(А,В, С) перпендикулярен плоскости П. Поэтому Отсюда, в частности, непосредственно вытекает, что уравнения прямой, проходящей через точку М0(х0, yo,zo) перпендикулярно плоскости y , имеют вид х — х0 у — г/о z — z0 А ~ В ~ С ' а уравнение плоскости, проходящей через точку Мо (х$, у0, z0) перпендикулярно прямой х — х{ у — ух z — zi I ~ m ~ n ' имеет вид I (х — х0) + га (у — г/о) + п (г — z0) = 0. Плоскость, проходящая через прямую К перпендикулярно плоскости П, может быть охарактеризована как плоскость, проходящая через точку Мо (хо, г/о, 20) параллельно двум векто- векторам a(l,m,n) и п(А,В, С) (мы предполагаем, что эти векторы 281
не коллинеарны, т. е. что прямая X и плоскость П не перпенди- перпендикулярны, ибо, в противном случае, искомая плоскость не была бы однозначно определена). Поэтому уравнение плоскости, проходящей через прямую X перпен- перпендикулярно плоскости П, имеет вид x xo У У о z — zo I m n ABC = 0. Аналогично, перпендикуляр, опущенный из точки Mi(xu уи z±) на прямую X, является пересечением двух плоскостей: одной, проходящей через точку Mi перпендикулярно прямой X, и дру- другой, проходящей через точку Mi и прямую X (см. задачу 1 в п. 1). Поэтому перпендикуляр, опущенный из точки Mi(xi,yi,z1) на прямую X, может быть задан уравнениями Цх— х xo — Xo I m(y — yt У1 — У0 m 2,— n = 0. F) Упражнение. Сравните уравнения F) с полученными выше параметриче- параметрическими уравнениями этого перпендикуляра (см. формулы C)). 4. Расстояние между двумя прямыми в пространстве По определению, расстояние между двумя прямыми равно минимуму расстояний точек одной прямой до точек другой. Если прямые пересекаются (или совпадают), то этот мини- минимум равен нулю. Если прямые параллельны, то этот минимум равен расстоянию о произвольной точки одной прямой до дру- другой прямой и может быть вычислен по формуле B) предыду- предыдущего пункта. Поэтому вопрос о вычислении расстояния между двумя прямыми интересен лишь для скрещивающихся прямых. Пусть х— X— Х2 У ~ У 2 Z — Z2 h m2 «2 — канонические уравнения двух скрещивающихся прямых Xi и Аг. Радиус-векторы точек прямой Xt имеют вид г4 ¦+- arfi, а пря- прямой Аг — вид r2 + a,ih, где„ г4 и г% — радиус-векторы точек Mi (xi, yi, 2i) и М2(х2, yz, z2), at и а2 — направляющие векторы (fi/ mu tii) и (k, m%, пг), a U m h — числовые параметры. По- 282
этому расстояние между точкой прямой Я1; отвечающей значе- значению параметра U, и точней прямой Лг, отвечающей значению па- параметра ti, равно «>('i> ti) = 1 г2 — г, + с2/2 — а,*! |, а квадрат этого расстояния равен По определению, расстояние d между рассматриваемыми прямыми выражается формулой d = mi и, , t2), а квадрат этого расстояния — формулой i2 tnin (i% (j- j \ п. и где минимум берется по всем вещественным^ и t2. Чтобы найти этот минимум, вычислим ') частные производ- производные функции о»2^!, t2) no tl и t2. Имеем: да It' h = ~ 2 (г2 — Г! + а2^2 — '*\h)au dv>2(tut2) о, , . —^ = 2 (г2 — г, + а2г2 — а, ¦=-2а,а2, : 2а\. Таким образом, где <Э2и2 I *2 Л2 = 4Г(а„ а2)>0, Г(а„ а2) = — определитель Грама векторов ai и а?,. Поэтому значения ti и ti, при которых ^1 = 0, ') Читатель, не знакомый с аналитическими методами отыскания экстре- экстремумов функций двух переменных, найде* геометрический вывод формулы Для расстояния d в конце этого пункта. 283
соответствуют минимуму функции со2(^ь t2), т. е. при этих значе- значениях функция afi{tut2) равна квадрату Ф искомого расстояния й. Эти значения являются решениями системы двух уравнений с двумя неизвестными {г 2 — тх + a2t2 — = О, = О, A) т. е. системы a2tl-a1a2t2 = (r2-rl)ai, a2alt1-a2t2 = (r2-rl)a2 с определителем —r(fli,a2) Ф 0, и потому выражаются фор- формулами (Г2 — П) 0.1 (r2 — rl) a2 to = а] Г (аь а2 (Г2~ (г,- Г(а,,а2) Подставив эти значения в формулу для что 4). мы получим, - П) « Г(аь а2) Г(а,, а2) а, Используя формулу разложения определителя третьего порядка по элементам первой строки и учитывая, что T(alta2) = аха2 al , эту формулу можно записать в более сим- симметричном виде: !— Г\ aia2 (r2~ri)a2 al Г (а„ B) Формулу B) можно привести к более простому виду. Мы не будем это делать прямым вычислением, а предпочтем обходной путь, не требующий почти никаких выкладок. Пусть Ni я Nz — точки наших прямых; соответствующие най- найденным значениям параметров t\ и t%- Тогда 284
причем, по доказанному, = г2 — Т\-\- o.2t2 — *Mi = n C-2 ('2 ~rx -л) «1 п2 a\ «1*2 a2 aia2 4 Г (а,, а2) Заметим теперь, что уравнения A) могут быть переписаны в следующем виде: C) означающем, что вектор этому ортогонален векторам ai и а2- По- ПоНо умножение определителя, одна строка которого состоит из векторов, на некоторый вектор можно, очевидно1), произвести, умножая эту строку на данный вектор. Поэтому (r2 (Г2 C-2 -r,)« ~Гх)п2 a, (r2 - 9 a{ 2 n) a2( r2 — n) a2a, Г(аь а2) Числитель этой формулы является определителем Грама Г(г2 —г и а\, а2) векторов г2 — ru «i и а2. Тем самым нами до- доказано, что квадрат d2 расстояния d между прямыми г = ri-\-a\t и г — == r2 + a2^ выражается формулой ,2 Г (г2 — Г\, пи а2) Г (a,, a2) D) Поскольку определитель Грама трех векторов равен квадра- квадрату их смешанного произведения, а определитель Грама двух векторов равен квадрату длины их векторного произведения, формулу D) можно переписать (извлекая квадратный корень) в следующем виде: I «i X й2 I *) Достаточно разложить определитель по элементам «векторной» строки. 285
В координатах формула E) (до извлечения корня) имеет вид h h x2 — h h m, m2 2 + г/2 — m2 i t У\ ii 12 2 Z2 1 + — 2i m, tn2 2 «1 Подчеркнем, что мы не только нашли расстояние d, но и до- доказали, что оно существует, т. е. что соответствующий минимум достигается. Замечание 1. Поскольку векторы r2— ru at и а2 могут быть произвольными (не компланарными) векторами пространства, сравнение формул B) и D) показывает, что для любых трех векторов а, Ь и с справедлива формула аб б2 cb ac be c2 = Г (а, Ь, с) Г F, с). Упражнение. Докажите эту формулу прямым вычислением и выясните ее геометрический смысл. Напишите (и докажите) аналог этой формулы для двух векторов. Как известно, общим перпендикуляром двух прямых Ki и Аз называется прямая, пересекающая каждую из прямых и им перпендикулярная. Из только что полученных результатов не- непосредственно вытекает, что для любых двух скрещивающихся прямых существует един- единственный общий перпендикуляр. Действительно, пусть Af4 и N2 — построенные выше точки прямых Xi и Я2. Рассмотрим прямую N1N2. Согласно формулам C) направляющий вектор N1N2 этой прямой ортогонален на- направляющим векторам а4 и а2 прямых Ai и А2, т. е. прямая NiN2 перпендикулярна этим прямым. Кроме того, она пересекает обе прямые Xi и А2. Следовательно, прямая NiNz является их общим перпендикуляром. Рассмотрим теперь произвольный общий перпендикуляр N\Nr2, проходящий через некоторые точки N\ и N'z прямых Ai и %2- Единственность общего перпендикуляра будет доказана, если мы покажем,'что N\ = N\ и N2 = Nr2. С этой целью заме- заметим, что поскольку прямая NiNi перпендикулярна прямым Ai и %2, ее направляющий вектор N\Nr2 ортогонален направляю- направляющим векторам а\ и а2, т. е. для него имеют место равенства C). Но эти равенства равносильны уравнениям A), т. е. тому, что при соответствующих значениях параметров U и /2 обращаются 5ш2 (t, /,) (Эш2(Л, to) тт в нуль частные производные ^ и —-^——. Но мы уже видели, что эти частные производные обращаются в нуль только 286
для одних вполне определенных значений t\ и t2, которым со- соответствуют точки Ni и N2. Следовательно, N'i=Nl и N2 — N2. Тем самым существование и единственность общего перпенди- перпендикуляра полностью доказаны. Для пересекающихся прямых также существует единствен- единственный общий перпендикуляр (проходящий через точку их пересе- пересечения перпендикулярно плоскости, в которой эти прямые содер- содержатся). Для параллельных (или совпадающих) прямых суще- существует бесчисленное множество общих перпендикуляров. Пользуясь полученными выше формулами, можно также без труда написать и уравнения общего перпендикуляра. Поскольку нам известна его точка Ni с радиус-вектором и направляющий вектор 4 Г (а,, а2) гг — (r2~rl)a2 "i- Г(а„ «,) проще всего написать его параметрические (или канонические) уравнения. Сделав это, мы после тривиальных алгебраических преобразований получим, что векторное параметрическое уравнение общего перпендику- перпендикуляра к двум скрещивающимся прямым г = rx -\- axt и г = = Гг -f- a2t может быть записано в следующем виде: F) A -*) (Г2~ (Г2~ r( + tr2 fl)«l rl)u2 -A а — ia t) 2 ta-2 «2«1 4 Г (а,, а2) Чтобы получить общие уравнения общего перпендикуляра, т. е. представить этот перпендикуляр в виде пересечения двух плоскостей, удобнее всего рассмотреть плоскости, содержащие этот перпендикуляр и одну из данных прямых. Первую из этих плоскостей можно определить как плоскость, проходящую че- через точку Mi параллельно неколлинеарным векторам А^А^ и а.\, а вторую — как плоскость, проходящую через точку М2 парал- параллельно неколлинеарным векторам NiN2 и а2. Получающиеся формулы можно упростить, заметив, что вектор Л^Л^2, будучи ортогональным неколлинеарным векторам ai, a%, коллинеарен их 287
векторному произведению ai X &г и потому может быть им за- заменен. Переходя к координатам, мы получаем, что общий перпендикуляр к двум скрещивающимся прямым, 1\ ТП\ fl\ '2 ^2 может быть задан уравнениями «2 х — х^ У h nti щ пг2 п2 1 1 — У\ z - mx i 1 «1 2 «2 и h h mx m2 = 0, X — h mx m2 x2 У Щ n2 h h — yi z- m2 «1 n2 h h -z2 n2 mx m2 G) r\ Замечание 2. Тот факт, что векторное произведение ai X #2 коллинеарно вектору NiN2, означает, что для любых трех век- векторов а = аи Ъ = &i и г = г2 — г± вектор г га гЬ а а2 аЬ о Ъа Ь2 с точностью до коллинеарности не зависит от вектора г. Это по- показывает, что должна иметь место формула г а га а2 гЪ аЬ Ьа Ь2 = С (а X Ь), (8) где С — некоторый числовой коэффициент (зависящий от век- векторов а, 6 и г). Упражнение. Докажите формулу (8) прямым вычислением и найдите коэффициент С. Допуская определенную вольность речи, принято называть длиной общего перпендикуляра двух скрещивающихся прямых длину его отрезка Л^2. Но, как мы знаем, длина этого отрезка равна расстоянию d между прямыми. Следовательно, длина общего перпендикуляра двух скрещивающихся пря- прямых равна расстоянию между этими прямыми. 288
Это открывает возможности для воспроизведения полученных выше ре- результатов более геометрическим образом. Для этого следует, в первую оче- очередь, определить расстояние между двумя скрещивающимися прямыми ki и Хг как длину их общего перпендикуляра, предварительно доказав, ко- конечно, его существование и единственность (что без труда делается на ос- основе стандартных элементарно-геометрических соображений). Затем можно рассуждать, например, следующим образом. Рассмотрим параллелепипед, построенный на векторах М\Мг% «i и пг (отложенных от точки Mi). Высота этого параллелепипеда равна, очевидно, длине d общего перпендикуляра прямых Ai и А2, а его основание является параллелограммом, построенным на векторах ai и а2. Поэтому длина d рав- равна отношению объема параллелепипеда (т. е. абсолютного значения вели- величины смешанного произведения (г2— ri)aiO2 векторов гг — »Ч, а.\ и а2) к пло- площади его основания (т. е. к длине векторного произведения а,\ X аг векторов at и а2): d ... l(r2 — ri)aia2\ I «i X «2 I Тем самым мы заново получили формулу E). 'Можно поступить и иначе, заметив, что для точек пересечения iVi и JV* общего перпендикуляра с прямыми Xi и Х2 должны иметь место формулы C) (уже не как раньше — в силу равенства нулю частных производных, а по- потому, что прямая NiNz перпендикулярна прямым %i и Л2). Из этих уравне- уравнений (написанных в форме A)) мы, как и раньше, найдем соответствующие значения параметров tt и fa, т. е. найдем радиус-векторы точек Ni и Л/2, а значит, и величину d2. Имея выражения для радиус-векторов точек JVi и Л'2, мы точно так же, как и выше, можем написать параметрические уравнения F) общего пер- перпендикуляра NiNz. Что же касается его общих уравнений (в форме G)), то для их вывода предварительное вычисление точек JVi и Л/2 даже и не тре- требуется.
Глава 4 ГЕОМЕТРИИ ПРЯМЫХ, ПЛОСКОСТЕЙ И ОКРУЖНОСТЕЙ § 1. ГЕОМЕТРИЯ ПРЯМЫХ НА ПЛОСКОСТИ В обычной «школьной» геометрии основными геометрически- геометрическими элементами считаются точки, а линии и поверхности (рас- (рассматриваются как семейства («геометрические места») этих то- точек. Однако можно развить «геометрию», в которой основными элементами («точками») являются, скажем, прямые и в кото- которой изучаются семейства прямых, зависящие от одного или нескольких параметров (семейства, зависящие от. одного пара- параметра, аналогичны линиям, а зависящие от двух параметров — поверхностям). Отдел геометрии, занимающийся этими вопро- вопросами, называют часто высшей геометрией прямых. Точно так же можно говорить о высшей геометрии плоскостей, окружностей, сфер и т. п. Впрочем, в сочинениях последнего времени эпитет «высшая» принято опускать. Наиболее простой из этих «неточечных» геометрий является геометрия прямых на плоскости. Поэтому мы в первую очередь ею и займемся. 1. Пучки прямых Для применения аналитических методов необходимо на- научиться задавать прямые некоторыми наборами чисел (коорди- (координатами) . Проще всего принять за эти «координаты» коэффи- коэффициенты А, В, С общего уравнения Ах + Ву + С = 0 A) прямой в данной аффинной системе координат. Тем самым мы приходим к следующему определению: Определение 1. Координатами прямой A) в данной аффин- аффинной координатной системе Оху называются коэффициенты А, В, С ее-общего уравнения. Координаты вполне^ определяют прямую. Вместе с тем пря- прямая определяет координаты только с точностью до пропорцио- пропорциональности. Это означает, что координаты А, В, С являются од- однородными координатами (ср. п. 9 § 1 гл. 2). В соответствии с ?тим мы будем обозначать прямую с координатами А, В, С сим- символом (А : В : С). 290 '
Обратим внимание на то, что координаты прямых не могут быть выбраны произвольно: чтобы тройка (Л, В, С) являлась тройкой координат некоторой прямой, необходимо и доста- достаточно, чтобы хотя бы одно из чисел А, В было отлично от нуля. Замечание 1. Можно ввести и неоднородные координаты прямых. Та- Такими координатами являются, например, числа k = к- и 6 = д-. Од- • нако оии определены лишь для прямых, не параллельных оси ординат. Мож- Можно показать (см. ниже замечание 2 п. 6); что неоднородных координат, пригодных для всех прямых плоскости, существовать не может. Этим гео- геометрия прямых принципиально отличается от геометрии точек. Аналогом прямой линии в геометрии прямых является семей- семейство прямых (Л : В : С), задаваемое формулами ') A = p.A0 + vAu B = ixBo + vBi, B) Здесь (Ло, Во, Со) и (Аи В4, C4) — произвольные непропорцио- непропорциональные тройки чисел, a fi и v — параметры, одновременно не равные нулю. Определение 2. Семейство прямых, задаваемое уравнениями вида B), называется пучком. Предположим сначала, что в уравнениях B) хотя бы один из коэффициентов Ло, Во отличен от нуля и хотя бы один из коэффициентов Аи Bi также отличен от нуля. Тогда определены прямые А Говорят, что пучок B) проходит через эти прямые (или им ин- инцидентен) . Обозначив левые части уравнений C) символами / и g, мы можем сказать, что пучок B) состоит из всех прямых,1 имею- имеющих уравнения вида n/ + vg = 0. Поскольку тройки (Ло, Во, Со) и (Аи Ви d), по условию, не пропорциональны, прямые C) различны. *) Действительно, перейдя в параметрических уравнениях прямой х = Хо + It, у = (/о + tnt к однородным координатам (например, приняв Xi Х2\ . v х = —г==-% У=~1Г~) и положив г = —, мы получим уравнения Ло Ло/ (X лишь обозначениями отличающиеся от уравнений B). 10* 29L
Определение 3. Если прямые C) не параллельны, пучок B) называется собственным, а если они параллельны, — то несоб- несобственным. Пучок, для которого одна из пар (Ло, Во) или (Ль Bt) равна нулю, мы также будем считать несобственным (заметим, что обе эти пары равны .нулю быть не могут, потому что тогда тройки (Ло, Во, Со) и (Ль В\, Ci) были бы пропорциональны). Собственные пучки характеризуются тем, что для них опре- определитель Ао Во л, я, отличен от нуля, а несобственные — тем, что этот определитель равен нулю. Пусть пучок B) — собственный. Поскольку прямые C) не параллельны, они пересекаются в единственной точке Мо(хо,уо), координаты которой удовлетворяют системе двух линейных уравнений Аох0 + Воуо + Со = О, D) Определение 4. Точка Мо(хо,уо) назызается центром собст- собственного пучка. Предложение 1. Собственный пучок состоит из всех прямых, проходящих через его центр. Доказательство. Любая прямая пучка имеет вид II (Аох + Воу + Со) + v (AiX + Вху + С,) = 0. Так как ввиду соотношений D) < координаты х0, у0 удовлетво- удовлетворяют этому уравнению, то следовательно, любая прямая пучка проходит через его центр. Обратно, пусть Ах + Ву + С = 0 E) — произвольная прямая, проходящая через точку Мй(хо,Уо). Выбрав на этой прямой произвольную точку Mi(xuyi), отлич- отличную от точки Мо(хо,Уо), рассмотрим числа — v0 = AQx{ + Boyi + Со. Ясно, что хэтя бы одно из этих чисел отлично от нуля. Поэтому определена прямая f + = 0. F) Являясь прямой рассматриваемого пучка, эта прямая проходит через точку Ма(хо,уо)- Кроме того, она проходит и через точку '-Mi(xi,yi), ибо ' со) + vo(^i^1 + Вху{ + Ci) = n0 (- v0) 292
Поскольку через две различные точки плоскости проходит только одна прямая, тем самым доказано, что прямая E) сов- совпадает с прямой F), г. е. принадлежит нашему пучку. Тем самым предложение 1 полностью доказано. Замечание 2. Тот факт, что прямая E) принадлежит пучку B), непосредственно вытекает также из теоремы 2 п. 3 § 1 гл. 3. Действительно, так как прямые C) и E) проходят через одну и ту ж точку, ранг R матрицы о Во х Вх \а в равен двум. Поэтому (здесь используется теорема о ранге мат- матрицы) ее строки линейно зависимы. С другой стороны, первые две строки этой матрицы, по условию, линейно независимы (не пропорциональны). Это возможно тогда и только тогда, когда последняя строка этой матрицы является линейной комбинацией ее первых строк, т. е. когда прямая E) имеет вид F). Задание. Докажите, что значения параметров ц и v, дающие прямую E), •определены этой прямой с точностью до пропорциональности однозначно. Заметим, что ¦ любая точка Мо(хо,уо) плоскости является центром (един- (единственного) собственного пучщ. Действительно, достаточно взять две прямые C), проходя- проходящие через точку Мо, и построить по ним пучок B). Это простое наблюдение дальше будет играть весьма важ- важную роль. Пусть теперь пучок B) — несобственный, т. е. пусть либо прямые C) параллельны (At : Ао = Bi : Во), либо одна из пар (Ло, Во) или (Аи Bt) равна нулю (пусть, для определенности, равна нулю пара (Ait В4) и, значит, отлична от нуля пара (Ло, Во)). Рассмотрим отношение Л^Ло (при Ло = 0 — отно- отношение Bt\Bo). Если числа ц и v обладают тем свойством, что IX : v = —Ay : Ао, то МЛО и потому при этих ц и v мы не получаем никакой прямой. На- Напротив, если ц : v Ф —Л4 : Ло, то, во-первых, хотя бы одно из чисел |дЛ0 + vЛl и ц,В0 + vB4 отлично от нуля, и, во-вторых, имеет место пропорция Ао ~ Во ¦ Следовательно, при этих ц, и v мы получаем прямую, парал- параллельную прямой A B Co^O. G) 293
Обратно, пусть Ах + By + С = 0 (8) •—произвольная прямая, параллельная прямой G). Выбрав на ней произвольную точку Mi(x\, yi), рассмотрим числа — vo= (см. выше). Хотя бы одно из этих чисел отлично от нуля и по- потому определена прямая fJ-o/ + vog = 0. Эта прямая параллельна прямой G) (поскольку она принадле- принадлежит рассматриваемому пучку) и проходит через точку Mi(xi, г/i). Следовательно, она совпадает с прямой (8). Тем самым доказано следующее Предложение 2. Несобственный пучок состоит из всех пря- прямых, параллельных некоторой фиксированной прямой. При этом ясно, что совокупность всех прямых, параллельных произвольной фик- фиксированной прямой, является несобственным пучком. Таким образом, термин «несобственный пучок» является си- нонином термина «направление» (см. сноску на стр. 17). 2. Расширенная плоскость Как было объяснено в п. 6 § 1 гл. 2, удобно считать, что кроме обыкновенных («собственных») точек каждая прямая со- содержит некоторую фиктивную «несобственную» точку, лежа- лежащую, так сказать, «в бесконечности». Мы теперь дополни- дополнительно условимся, что несобственные точки параллельных прямых совпадают (а непараллельных — различны). Это со- согласуется с интуитивным представлением параллельных прямых как прямых, «пересекающихся в бесконечности». Таким образом, все прямые каждого несобственного пучка будут иметь теперь некоторую общую несобственную точку — его центр, а сам пучок будет состоять из всех прямых, проходя- проходящих через эту точку. Другими словами, мы теперь можем ска- сказать, что любой пучок является множеством всех прямых, проходя- проходящих через некоторую фиксированную точку. Эта точка (центр пучка)—собственная, если пучок — соб- собственный, и несобственная, если пучок — несобственный. При этом любая точка (собственная или несобственная) является центром некоторого (единственного) пучка . 294
Введение несобственных точек позволяет, таким образом, да- давать единые' формулировки, пригодные как для собственных, так и для несобственных пучков. При этом следует отчетливо понимать, что это усовершен- усовершенствование носит пока чисто «лингвистический» характер, по- поскольку несобственные точки на аффинной плоскости не суще- существуют и участвуют лишь в выражениях типа «прямые пересе- пересекаются в несобственной точке», а такое выражение является лишь синонимом выражения «прямые параллельны». Однако можно сделать и следующий шаг: расширить нашу плоскость П и считать ее подмножеством некоторого большего множества — расширенной плоскости П+. Элементы множества П+ мы по-прежнему будем называть точками (собственными, ¦если они принадлежат П, и несобственными — в противном слу- случае). При этом мы будем считать, что нам задано-некоторое соответствие, сопоставляющее каждой прямой а на плоскости П некоторую несобственную точку плоскости П+ и обладающее тем свойством, что двум прямым тогда и только тогда сопостав- сопоставлена одна и та же несобственная точка, когда эти прямые па- параллельны, и что любая несобственная точка соответствует хотя ¦бы одной прямой. Несобственную точку, сопоставленную пря- прямой, мы будем называть несобственной точкой этой прямой. Множество а+, получающееся из прямой а присоединением ее несобственной точки, мы будем называть прямой на расширен- расширенной плоскости. Таким образом, любые две (различные) прямые а+ и р+ на расширенной плоскости будут обязательно пересе- пересекаться в единственной точке (являющейся точкой пересечения лрямых аир, если эти прямые не параллельны, и являющейся их общей несобственной точкой в противном случае). Переход от аффинной плоскости П к расширенной плос- плоскости П+ означает, что от аффинной геометрии мы переходим к принципиально новой геометрии — геометрии расширенной плоскости. Подчеркнем, что одно только использование несобственных точек еще не означает переход от аффинной геометрии к гео- геометрии расширенной плоскости: если мы используем несобст- несобственные точки только как удобное средство для унификации формулировок, мы остаемся в рамках аффинной геометрии. Геометрия расширенной плоскости возникает тогда, когда мы фактически присоединяем к плоскости несобственные точки и считаем их равноправными с собственными точками. Множество всех несобственных точек расширенной плос- плоскости мы также будем считать прямой на этой плоскости и бу- будем называть его несобственной прямой. Это оправдывается тем, что с любой «настоящей» прямой оно пересекается в един- единственной точке (а именно, в несобственной точке этой прямой). Таким образом, можно сказать,~"что расширенная плоскость 295
получается из аффинной присоединением одной дополнительной прямой. Пучком прямых на расширенной плоскости мы будем назы- называть совокупность всех прямых, проходящих через некоторую фиксированную точку — центр пучка. Пучок называется собст- собственным, если его центр является собственной точкой. Такому пучку соответствует собственный пучок на аффинной плоскости, состоящий из тех же прямых (а точнее, из тех же прямых, но рассматриваемых без их несобственных точек). Пучок назы- называется несобственным, если его центр является несобственной точкой. Такой пучок получается из несобственного пучка на аф- аффинной плоскости присоединением несобственной прямой (и, ко- конечно, добавлением к каждой прямой пучка ее несобственной точки). Так же как и на аффинной плоскости, любые две различные прямые содержатся в единственном пучке. С другой стороны, на расширенной плоскости любые два {различных) пучка содержат единственную об- общую прямую. Последнее утверждение на аффинной плоскости уже места не имеет. Основное отличие геометрии расширенной плоскости от аф- аффинной геометрии состоит в том, что, как уже отмечалось, любые две различные прямые расширенной плоскости пере- пересекаются в единственной точке. Вместе с тем, так же как в аффинной геометрии плос- плоскости, через любые две различные точки расширенной плоскости проходит единственная прямая. Заметим, что хотя последнее утверждение формально совпа- совпадает с соответствующим утверждением в аффинной геометрии, его геометрическое содержание шире: оно содержит не только утверждение «через любые две различные точки аффинной плос- плоскости проходит единственная прямая», но и утверждение «через любую точку аффинной плоскости проходит единственная пря- прямая, параллельная данной прямой». Более того, оно не исчер- исчерпывается даже этими двумя утверждениями, поскольку а нем не исключен случай, когда обе данные точки несобственные — случай, «аффинными формулировками» не охватываемый. Все же, если отвлечься от такого рода исключительных случаев,' можно сказать, что каждое утверждение геометрии расширенной плоскости эквивалентно нескольким (вообще говоря, многим) утверждениям аффинной геометрии. Внутреннее родство этих утверждений, проявляющееся в геометрии расширенной плос- плоскости, остается в аффинной геометрии скрытым. Резюмируя, мы можем сказать, что по сравнению с аффин- аффинной геометрией геометрия расширенной плоскости логически бо- 296
лее стройна: ее утверждения имеют более общий характер и не ¦сопровождаются исключениями. Сказанное выше является содержательным (не формаль- формальным) обсуждением понятия «расширенная плоскость». Формаль- Формально-аксиоматически, это понятие вводится следующим образом. Определение 1. Множество Ш+ называется расширенной плоскостью, если 1) оно содержит некоторую аффинную плоскость ЗЯ (в смысле п. 3 § 3 гл. 2); 2) каждой прямой а в плоскости 9Й (см. замечание 1 в п. 1 ¦§ 1 гл. 3) сопоставлен некоторый элемент 3) элементы ах и р,*,, сопоставленные двум прямым а и р, тогда и только тогда совпадают, когда прямые аир парал- параллельны; 4) любой элемент из 9Й+\5Ш имеет вид ас» для некоторой прямой а. Элементы множества 9Й+\5Ш называются несобственными точками плоскости S9J+ (или плоскости 99?). Несобственная точка ах называется при этом несобственной точкой прямой а (гово- (говорят также, что точка а» инцидентна прямой а). Точки плоскости Ш называются собственными точками плоскости Ш+. Замечание 1 (очень важное!). Данное определение пол- полностью пригодно и в случае, когда Ш является плоскостью над произвольным полем К. В этом случае 5Я+ называется расши- расширенной плоскостью над полем К. В частности, при К = 'CJ мы получаем комплексную расширенную плоскость. Если 9Я яв- является вещественно-комплексной плоскостью (см. п. 5 § 3 гл. 2), то Ш+ называется вещественно-комплексной расширенной плос- плоскостью. Более того, в определении 1 нет нужды обязательно считать плоскость WI аффинной, она вполне может быть евклидовой. В этом случае мы получаем евклидову расширенную плоскость (вещественную, вещественно-комплексную или плоскость над любым полем К). Аффинная расширенная плоскость называется часто аффин- но-проективной плоскостью, а евклидова расширенная плос- плоскость — евклидово-проективной плоскостью. Таким образом, мы получаем целый букет различных плос- плоскостей (который в дальнейшем мы еще пополним), и следо- следовательно, различных «геометрий». Относительно каждой геометрической конструкции или теоремы (безразлично, в со- содержательном или формально-аксиоматическом построении) следует отчетливо представлять себе, к какой собственно гео- геометрии она относится, т. е. какой «плоскости» выполняется. Соответствующие указания мы будем часто опускать, поскольку 297
принадлежность теоремы или конструкции к той или иной гео- геометрии, как правило, ясна из контекста. Например, если упо- упоминаются несобственные точки, то мы находимся в расширен- расширенной плоскости, а если упоминаются расстояния или углы — то в- евклидовой'). В каждом случае, когда возможны недоразуме- недоразумения, мы, конечно, будем явно указывать, какой именно геомет- геометрией мы в данный момент занимаемся. 3. Полнота и непротиворечивость аксиом геометрии расширенной плоскости Определение 1. Отображение одной расширенной плоскости на другую называется изомор- изоморфизмом, если а) отображение ц+ переводит собственные точки в собствен- собственные, а несобственные — в несобственные; б) получающееся отображение нерасширенных плоскостей является изоморфизмом; <¦ в) отображение г\+ сохраняет отношение «несобственная точка инцидентна собственной прямой», т. е. для любой прямой а плоскости Tli ее несобственная точка а» переходит при ото- отображении т)+ в несобственную точку Роо прямой р плоскости ЗЯ2> являющейся образом при изоморфизме г\ прямой а: Замечание 1. На самом деле здесь дано не одно определе- определение изоморфизма, а несколько (в зависимости от того, какими считаются нерасширенные плоскости — аффинными или евкли- евклидовыми, вещественными или комплексными и т. п.). Формальна это находит отражение в возможности различного понимания термина «изоморфизм» в условии б). Согласно определению 1 каждый изоморфизм индуцирует некоторый изоморфизм л: ак,->ак8. ') Следует иметь в виду, что на евклндово-проективной плоскости углы и расстояния определяются только для собственных элементов (например, об угле между собственной и несобственной прямой говорить бессмыслен'но). 298
Оказывается, что это устанавливает биективное соответствие между изоморфизмами, т. е. любой изоморфизм т): ЗК, -+Ш2 индуцируется некоторым (единственным) изоморфизмом Действительно, пусть а — произвольная прямая плоскости Mi и «оо — ее несобственная точка. Изоморфизм ц переводит прямую а в некоторую прямую р плоскости JWi. Пусть р» — не- несобственная точка прямой р. Мы положим, по определению, Очевидно, что это определение корректно (точка $х зависит только от точки а», но не от'прямой а). Для собственных точек М е 9№i мы, естественно, положим Ясно, что построенное отображение я является искомым изоморфизмом. Мы будем говорить, что изоморфизм ц+ является продолже- продолжением изоморфизма т). Поскольку любые две нерасширенные плоскости изоморфны, из доказанного утверждения непосредственно вытекает, что любые две расширенные плоскости изоморфны. Другими словами, аксиоматика геометрии расширенной плоскости полна. Чтобы доказать непротиворечивость этой аксиоматики, нам нужно построить некоторую ее модель, т. е. проинтерпретиро- проинтерпретировать ее в рамках другой аксиоматики, непротиворечивость которой уже известна. Такая модель не только докажет не- непротиворечивость, но и даст более наглядное представление о (несколько абстрактной) геометрии расширенной плоскости. По- Поэтому мы укажем не одну, а четыре различных модели, по-раз- по-разному интерпретирующие расширенную плоскость. Пусть 2R' — произвольная нерасширенная плоскость (ска- (скажем, для определенности, аффинная и вещественная). Рассмот- Рассмотрим множество 5Ш+ всех пучков прямых на плоскости Ш' и его подмножество Ш, состоящее из собственных пучков. Как мы знаем, соответствие ¦ «собственный пучок» *—»¦ «его центр» . (I) 299
является биективным соответствием между всевозможными собственными пучками и точками плоскости 2R'. Поэтому это соответствие позволяет определить множество Ш как аффинную плоскость. «Точками» этой плоскости являются собственные пучки плоскости 50Т, а, например, «прямыми» — семейства пуч- пучков, обладающие тем свойством, что их центры лежат на одной прямой плоскости Ш'. Можно сказать, что плоскость $Ш' мы отождествляем с множеством Ш. В силу этого отождествления для множества 5Й+ оказывается выполненным условие 1) определения 1 п. 2. Пусть теперь а — некоторая прямая на плоскости 3W. Как только что было сказано, эта прямая состоит из всех пучков, центры которых принадлежат некоторой прямой а' плоскости Ш'. Пусть а,*, — несобственный пучок прямых плоскости Ш', со- состоящий из всех прямых, параллельных прямой а'. Тем са- самым мы построили отображение а*—>а<х>, предусмотренное усло- условием 2) определения 1. Ясно, что это отображение обладает свойствами 3) и 4). Та- Таким образом, множество Ш+ всех пучков аффинной плоскости 3R' является аффинной расширенной плоскостью. Если мы за ЗИ' возьмем плоскость над полем К, то Ш+ будет расширенной плоскостью над полем К, а если 9W будет евкли- евклидовой плоскостью, то 5М+ будет евклидовой расширенной плос- плоскостью. Построенная «пучковая» модель позволяет любое утвержде- утверждение геометрии расширенной плоскости истолковать как неко- некоторое утверждение (плоской) аффинной геометрии. фднако, как правило, это истолкование не очень наглядно. Более наглядную интерпретацию мы получим, «выйдя в пространство». Для прос- простоты мы станем при этом на содержательную, наглядно геомет- геометрическую, точку зрения (и, в частности, ограничимся интерпре- интерпретацией вещественной расширенной плоскости). Более формаль- формальное построение читатель, без сомнения, может провести само- самостоятельно. Пусть в пространстве задана некоторая аффинная коорди- координатная система Oxyz. Рассмотрим координатную плоскость Оху и координаты х, у на этой плоскости. Каждой прямой Ах + Ву + С=Ь на плоскости Оху мы сопоставим вектор в пространстве, имею- имеющий координаты А, В, С. Тем самым каждому вектору а{А,В,С), для котор'ого А ф 0 или В Ф 0, т. е. каждому век- вектору, не параллельному оси Oz, будет соответствовать неко- некоторая прямая на плоскости, а каждой прямой будет соответ- соответствовать семейство отличных от нуля коллинеарных векторов (не параллельных оси Oz), т. е., другими словами, семейство от- 300
личных от нуля векторов, параллельных некоторой прямой (ко- (которую, для определенности, мы можем считать проходящей че- через точку О). Таким образом, мы получаем биективное соответствие между прямыми на плоскости и прямыми в пространстве, проходящими через точку О и отличными от оси Oz. В этом соответствии пря- прямой (А : В : С) отвечает прямая х = At, z = Ct. Пусть теперь — произвольный пучок прямых на плоскости Оху. Прямым этого пучка отвечают отличные от нуля векторы а(А, В, С), имеющие вид a = nao + vau A) где ао(Ао, Во, Со) и ai(Au В и Ci), т. е. отличные от нуля векторы, компланарные векторам Ci и а% Поскольку векторы п\ и а2, по условию, линейно независимы, векторы A) могут быть охарак- охарактеризованы как отличные от нуля векторы, параллельные неко- некоторой плоскости (проходящей через точку О). Тем самым мы получили биективное соответствие между пучками прямых на плоскости Оху и всевозможными плоскостями в пространстве, проходящими через точку О. Рассматриваемый пучок — собственный тогда и только тогда, когда среди векторов A) не содержится ни одного век- вектора, параллельного оси Oz, т. е. когда соответствующая плос- плоскость не параллельна этой оси. Комбинируя построенное биективное соответствие «пучок» i—> «плоскость* с биективным соответствием «собственный пучок» >—> «его центр», мы получим биективное соответствие между точками плоскости Оху и плоскостями в пространстве, проходящими через точку О и не параллельными оси Oz. Следовательно, объявив последние плоскости «точками», мы снова получим модель аффинной плоскости. В этой модели «прямыми» являются множества плоскостей, проходящих через фиксированную прямую пространства (проходящую через точ- точку О и отличную от оси Oz). Как получить из этой модели модель расширенной плоскости, тепер уже совершенно ясно: нужно откинуть условие, что> 30L
плоскости не параллельны оси Oz. Таким образом, «точками» этой модели являются всевозможные плоскости пространства, проходящие через точку О, а «прямыми» — множества таких плоскостей, проходящих через фиксированную прямую простран- пространства (проходящую через точку О, но уже может быть совпа- совпадающую с осью Oz). Несобственными точками этой модели яв- являются плоскости, проходящие через ось Oz. «Прямые» построенной модели естественным образом отож- отождествляются с проходящими через точку О прямыми простран- пространства. В частности, несобственная прямая отождествляется с осью Oz. Построенная модель позволяет любое утверждение геомет- геометрии расширенной плоскости переформулировать в виде некото- некоторого утверждения о прямых и плоскостях в пространстве. На- Например, утверждение, что через любые две различные точки рас- расширенной плоскости проходит единственная прямая, переходит при таком переформулировании в утверждение, что любые две различные плоскости, проходящие через точку О, пересекаются по единственной прямой. Эта модель нагляднее предыдущей «пучковой» модели. Од- Однако, последняя модель обладает свойством естественности, т. е. лежащее в ее основе соответствие «пучок»^^«точка» стро- строится без всякого произвола. В то же время соответствие «пу- «пучок»!—*¦ «плоскость», на котором основана рассматриваемая сей- сейчас модель, существенно зависит от выбора системы координат Oxyz и естественным инвариантным способом построено быть не может. 4. Координаты на расширенной плоскости Еще одну полезную модель расширенной плоскости мы полу- получим, привлекая вещественные числа. Построение такой «число- «числовой модели» с содержательной точки зрения равносильно вве- введению в расширенную плоскость координат. Поэтому мы в пер- первую очередь рассмотрим (пока с содержательных позиций), как в геометрии расширенной плоскости могут быть введены коор- координаты. Ясно, что распространить на несобственные точки аффин- аффинные координаты х, у невозможно, поскольку каждая пара (х, у) определяет некоторую собственную точку и для несобственных точек «не остается координат». По-иному дело обстоит с однородными координатами, по- поскольку для них имеются системы значений, не отвечающие ни- никакой- собственной точке, и можно надеяться, что эти «запре- «запрещенные» значения можно сопоставить несобственным точкам. Однородные координаты в расширенной плоскости проще всего ввести, воспользовавшись установленным выше биектив- биективным соответствием между точками расширенной плоскости и 302
плоскостями в пространстве, проходящими через начало коор- координат О. Уравнение произвольной такой плоскости имеет вид Xx + Yy + Zz = О, где хотя бы один из коэффициентов X, Y, Z отличен от нуля. При этом плоскость однозначно определяется этими коэффи- коэффициентами и, обратно, однозначно с точностью до пропорциональ- пропорциональности их определяет. Следовательно, комбинируя биективные соответствия «точка расширенной плоскости» н-> «плоскость в пространстве» и «плоскость в пространстве» н-*¦ «класс (X : Y : Z) пропорциональности коэффициентов ее уравнения», мы получим биективное соответствие между точками расширен- расширенной плоскости и классами (X : Y : Z) пропорциональных троек (X, Y, Z) Ф @, 0, 0). Числа X, Y, Z мы и будем называть (однородными) коорди- координатами на расширенной плоскости. Они определены с точ- точностью до пропорциональности. Чтобы найти для этих координат явные формулы, мы долж- должны выразить в координатах построенное соответствие. Пусть М0(х0, уо)—произвольная собственная точка плос- плоскости. Любая прямая, проходящая через точку Мй(х<цуа), имеет уравнение вида А(х~хо) + В(у- г/о) = 0, где А и В— некоторые числа, одновременно не равные нулю (а в остальном — произвольные). Это показывает, что прямым собственного пучка с центром в точке М0(х0, г/о) отвечают в про- пространстве векторы вида (А, В, — Ах0 — Ву0). Но ясно, что вектор в пространстве тогда и только тогда имеет такой вид, когда он параллелен плоскости *о* + УоУ + г = 0. A) Таким образом, Собственная точка Мо(*о, г/о) изображается в пространстве плоскостью A). По определению, это означает, что точка Мо(хо,уо) имеет однородные координаты Хо '¦ Yo: Zo = я0: г/о: 1 • Замечание 1. Таким образом, построенные координаты Хо: Ко: Zo явля- являются (с точностью до перестановки) однородными аффинными координатами в смысле п. 6 § 1 гл. 2. 303
Рассмотрим теперь произвольную несобственную точку. Пусть эта точка является несобственной точкой прямой Аох + Воу + Со = О. B) Тогда все прямые соответствующего несобственного пучка бу- будут иметь вид где С — произвольное число, т. е. этим прямым будут отвечать в пространстве векторы вида (А), Во- С) (и все векторы, им коллинеарные). Но ясно, что вектор в про- пространстве тогда и только тогда имеет такой вид, когда он па- параллелен плоскости -BQx+ Аоу = О. C) Таким образом, несобственная точка прямой B) изображается в простран- пространстве плоскостью C). По определению, это означает, что несобственная точка прямой B) имеет однородные коорди- координаты Хо :YQ: Zo = — Во: Ао: 0. Мы видим, в частности, что координаты X: Y : Z собственных точек характеризуются условием Z ф 0, а координаты несоб- несобственных точек — условием Z = 0. Другими словами, уравнение Z = 0 является s координатах X : Y : Z уравнением несобственной прямой. Аффинные координаты собственных точек выражаются через координаты X : Y : Z по формулам X _Y_ У — 2 ' Подставив эти выражения в уравнение Ах + By + С = 0 . D) произвольной прямой, мы получим (после умножения на Z) уравнение AX + BY + CZ = 0. E) Координаты X:Y:Z собственной точки М(х,у) тогда и только тогда удовлетворяют этому уравнению, когда эта точка при- принадлежит прямой D). Что же касается несобственных точек, то, 304
полагая в уравнении E) Z = О, мы для координат X и Y полу- получим пропорцию X:Y=-B: A. Следовательно, уравнению E) удовлетворяют координаты един- единственной несобственной точки, а именно, несобственной точки (—В:А:0) прямой D). Тем самым доказано, что уравнение E) выражает прямую D), пополненную несоб- несобственной точкой. Резюмируя, мы получаем следующее Предложение 1. Любое уравнение вида AX + BY + CZ = 0 (хотя бы один из коэффициентов А, В, С которого отличен от нуля) выражает в координатах X : Y : Z некоторую прямую рас- расширенной плоскости, собственную, если А ф 0 или В ф О, и не- несобственную, если А = В = 0. Теперь ясно, как построить числовую модель расширенной (аффинно-проективной) плоскости. Точками этой модели яв- являются классы (X:Y:Z), т. е. элементы множества RP2 (см. п. 6 § 1 гл. 2). Точка называется несобственной, если Z = 0. Формулы _Х_ _Y_ х~z ' у~ Z определяют естественное биективное соответствие между мно- множеством всех собственных точек из RP2 и стандартной аффи <- ной плоскостью R2 пар (х, у). Тем самым это множество опреде- определяется как аффинная плоскость. Прямыми на этой плоскости являются множества собственных точек (X:Y:Z), удовлет- удовлетворяющих уравнениям вида AX + BY + CZ = 0, где либо А ф 0, либо В Ф 0. Ясно, что все условия определе- определения 1 из п. 2 выполнены, так что RP2 действительно является расширенной плоскостью. Определение 1. Построенная плоскость RP2 называется стандартной (или арифметической) аффинно-проективной плос- плоскостью. Замечание 2. Ясно, что все сказанное выше сохраняется над любым по- полем К (конечно, вместо RP2 нужно рассматривать множество КР2 классов пропорциональных троек (X,Y, Z) ф @, 0, 0) элементов поля К). Различных систем однородных аффинных координат X: У: Z на расширенной плоскости может быть много (а имен- именно, «столько же», сколько имеется различных систем аффинных 305
координат х, у на нерасширенной плоскости). При этом пере- переход, от одних координат X: У: Z к другим координатам X': У: Z' описывается, как легко видеть, формулами вида Z' = Z, где fli (In (см. формулы перехода от координат х, у к координатам -v', г/Л в п. 2 § 1 гл. 2). Задание. Докажите формулы F). Это наводит на мысль о возможности независимого оп- определения понятия аффинно-проективной плоскости, не опираю- опирающегося как определение 1 из п. 2 на понятие аффинной плос- плоскости, а повторяющее (с соответствующими изменениями) опре- определения из § 3 гл. 2. Введем с этой целью группу Aff(RP2) всех преобразований стандартной плоскости RP2, выражающихся формулами F) (обратим внимание на то, что эта группа естественно изоморф- изоморфна группе Aff(R2)), и затем определим аффинно-проектив- ную плоскость как произвольное множество ЯЯ+, для которого задано семейство СоогBЯ+) биективных отображений a: 3№+->RP2, удовлетворяющее (по отношению к группе Aff(RP2)) извест- известным нам аксиомам 1 и 2 (см. § 3). Сказанное выше об однородных аффинных координатах по- показывает, что любая расширенная (аффинно-проективная) плоскость в смысле определения 1 из п. 3 является аффинно- проективной плоскостью и в смысле этого нового определения. Обратно, аффинно-проективная плоскость в новом смысле будет, очевидно, аффинно-проективной плоскостью в смысле оп- определения 1 п. 3, если мы определим ее несобственные точки как точки, координата Z которых в любой координатной системе a: 3№+->RP2 равна нулю (ясно, что это_ определение кор- корректно, т. е. не зависит от выбора системы а). Чтобы получить'аналогичное определение евклидовой рас- расширенной (в другой терминологии — евклидово-проективной) плоскости, достаточно потребовать, чтобы для преобразований F) матрица «2) 306
была ортогональной матрицей (такие преобразования состав- составляют группу Ort(RP2), изоморфную группе Ort(R2)). С со- содержательной точки зрения координатами X:Y:Z на евкли- дово-проективной плоскости являются однородные евклидовы координаты, получающиеся из евклидовых (прямоугольных) ко- координат х, у точно так же, как однородные аффинные координа- координаты получались выше из аффинных. Поскольку группа Ort(RP2) является подгруппой группы !Aff(RP2), мы можем любую евклидово-проективную плоскость единственным образом превратить в аффинно-проектизную плоскость; ср. п. 3 § 3 гл. 2, где подробно обсужден аналогичный вопрос для евклидовых и аффинных плоскостей (см., в част- частности, определение 5 п. 3 § 3 гл. 2). Аналогично, чтобы получить определение аффинно-ироек- тивной плоскости над произвольным полем К, достаточно заменить RP2 на КР2 (и, конечно, считать, что все коэффи- коэффициенты преобразования F) принадлежат полю К). Например, комплексная аффинно-проекивная плоскость по- получается, когда преобразования F) имеют комплексные коэф- коэффициенты и являются преобразованиями в СР2. Вещественно-комплексная аффинно-проективная плоскость получается, когда преобразования F) с вещественными коэф- коэффициентами рассматриваются как преобразования в комплек- комплексной стандартной* плоскости СР2. 5. Проективная плоскость В расширенной плоскости мы сохраняем определенное раз- различие между собственными и несобственными точками. Можно, однако, сделать следующий шаг и считать собственные и не- несобственные точки абсолютно равноправными и неотличимыми друг от друга. Расширенная плоскость, в которой различие меж- между собственными и несобственными точками игнорируется, назы- называется проективной плоскостью, а ее геометрия — проективной геометрией (более точное, формальное определение см. ниже). Чтобы получить наглядную интерпретацию проективной гео- геометрии, мы рассмотрим еще одну модель расширенной (аф- финно-проективной) плоскости. Пусть О — произвольная точка пространства и П — неко- некоторая плоскость, не проходящая через точку О. Тогда любая точка М плоскости П будет однозначно определять в простран- пространстве прямую ОМ, причем соответствие «точка О» ь-?• «прямая ОМ» будет" биективным соответствием между точками плоскости П и прямыми в пространстве, проходящими через точку О и не па- параллельными плоскости П. Тем самым получили некоторую 307
интерпретацию аффинной плоскости, «точками» которой яв- являются прямые в пространстве. Ясно, как эту интерпретацию можно распространить до ин- интерпретации всей расширенной плоскости: достаточно включить в рассмотрение и прямые, параллельные плоскости П (про- (проходящие через точку О), считая, что каждая такая прямая изображает несобственную точку всех прямых плоскости П, па- параллельных этой прямой. В этой интерпретации прямые плоскости II будут, очевидно, изображаться плоскостями в пространстве (проходящими че- через точку О) или, точнее, множествами всех прямых (проходя- (проходящих через точку О), содержащихся в таких плоскостях. Если плоскость пересекает плоскость П, то она изображает собст- собственную прямую (линию пересечения). Плоскость, параллельная плоскости П (и проходящая через точку О), изображает несоб- несобственную прямую плоскости П. Теперь ясно, как от этой интерпретации аффинно-проектив- ной плоскости перейти к интерпретации проективной плоскости: нужно «забыть» о плоскости П и об особом положении, которое имеют прямые, параллельные этой плоскости. Построенную таким образом модель проективной плоскости мы будем обозначать символом Шо. По определению, точками этой модели являются прямые в пространстве, проходящие; че- через точку О, а прямыми — плоскости в пространстве (также проходящие через точку О). Пусть Oeie2e3 — произвольный аффинный репер в простран- пространстве (с началом в точке О) и пусть А — произвольная точка проективной плоскости Шо, т. е. прямая в пространстве, прохо- проходящая через точку О. Параметрические уравнения этой прямой имеют вид x = Xt, z = Zt, где X, Y, Z — координаты (в репере Oeieze3) некоторой точки прямой А (отличной от точки О). Ясно, что числа X, Y, Z од- однозначно определяют прямую Л и, с точностью до пропорцио- пропорциональности, однозначно этой прямой определены. Определение /.Числа X, У, Z мы будем называть проектив- проективными координатами рассматриваемой точки проективной плос- плоскости Т10, ассоциированными с данным репером Ов\е2еъ. 'Вообще говоря, разные реперы Ое^ез и Oeirez,e3' могут при- приводить к одним и тем же координатам X: Y: Z. Например, это заведомо так, если реперы гомотетичны, т. е. если существует такое число h ф 0, что е\> = hex, e2' = he2, еу = he3. 308
Покажем, что этим исчерпываются все возможности, т. е. если для любой точки проективной плоскости Шо координа- координаты X: Y: Z, ассоциированные с реперами Oese2e3 и Овуе^еу, совпадают, то эти. реперы 'гомотетичны. Действительно, рассмотрим, например, прямую Еи проходя- проходящую через точку О параллельно вектору et. Эта точка плос- плоскости Шо имеет в координатной системе, ассоциированной с ре- репером Oeie2e3, проективные координаты 1:0:0. По условию те же координаты она имеет и в координатной системе, ассоцииро- ассоциированной с репером Оеуе2>еу, а это означает, что вектор еу па- параллелен прямой Ei. Следовательно, векторы е{ и еу колли- неарны, т. е. существует такое число 1ги что Аналогично доказывается, что е2- = h2e2, еу = А3е3. Рассмотрим теперь прямую Ео, проходящую через точку О параллельно вектору 'Ассоциированные с репером Oeie2e3 координаты этой точки про- проективной плоскости Шо равны 1:1:1, а ассоциированные с ре- ^ 111 _. пером иегвгеу равны т- : т- : -г- ¦ 1 ак как эти координаты п\ П-2 п$ должны совпадать, то, следовательно, Таким образом, реперы Ое^^з и Оеуе2>еу гомотетичны. Чтобы указать удобные условия гомотетичности реперов,, мы произвольный репер Оехе2ег пополнимчвектором ео = ei + е2 + е3. Легко видеть, что реперы Ое{е2е^ и Оеуе^еу тогда и только тогда гомотетич- гомотетичны, когда для любого i = 0, 1, 2, 3 вектор е? коллинеарен век- вектору е{. Действительно, если реперы гомотетичны: ev = heu e2' = he2, еу = he3, то е2 + е3) = he0, так что для любого 1 = 0, 1, 2, 3 вектор е^ коллинеарен ве- вектору е,-. Обратно, пусть для любого i = 0, 1, 2, 3 вектор ei> колли- коллинеарен вектору е{, т. е. пусть существуют такие числа hQ, hu h2 и /г3, что во' = hoeo, е\> = fifa, е2' == /г2е2, еу = h3e3. 309
Тогда ho(ei + е2 + e3) = h(fi0 == *v = ev + er + ev = hxex + h&2 + h3e3, и потому ho = hl = h2 = h3. Следовательно, реперы Oexe2e3 и Оеугуеу гомотетичны. Ясно, что любые три из четырех векторов еа = ех + е2 + е3, еь еъ е3 линейно независимы. Это означает, что проходящие через точ- точку О прямые Еа, Еи Ez, E3 с направляющими векторами е0, еи е2, е3 составляют в проективной плоскости Tlo четверку точек, обладающую тем свойством, что никакие три из них не при- принадлежат одной прямой. Обратно, пусть в проективной плоскости 9Л0 нам дана чет- четверка Еа, Ei, E2, Е3 точек, никакие три из которых не лежат на одной прямой. Мы всегда можем выбрать направляющие векторы е0, «1, е2, е3 этих прямых так, чтобы имело место ра- равенство е0 = ei + е2 + «з- Задание. Докажите возможность такого выбора векторов во, е,, ег, е3. Согласно доказанному выше утверждению, этим условием векторы е0, еи е2, е3 однозначно определены при данных прямых Ео, Еи Е2, Е3 с точностью до общего множителя, т. е. репер Oeie2e3 однозначно определен с точностью до гомотетии. Сле- Следовательно, однозначно определены и ассоциированные проек- проективные координаты. Определение 2. Четыре точки проективной плоскости, из ко- которых никакие три не лежат на одной прямой, называются точ- точками общего положения. Определение 3. О точках, имеющих в данной проективной координатной системе координаты 1:1:1, 1:0:0, 0:1:0, 0:0:1, говорят, что они составляют проективный координатный репер этой координатной дистемы. В силу этих определений доказанные выше утверждения мы можем суммировать в следующем предложении: Предложение 1. Проективная координатная система одно- однозначно определяется своим проективным координатным репе- репером. Точки Ео, Ei, E2, Е3 тогда и только тогда составляют про- проективный координатный репер, когда они являются точками об- общего положения. Определение 4. Прямые Е2Е3, EiE3, ¦. ЕХЕ2 A) 310
\ называются координатными прямыми данного репера (или со- соответствующей проективной координатной системы), а точка ¦Со — его единичной точкой. Тройка прямых A) называется ко- координатным треугольником репера (проективной координатной системы). Поскольку этот треугольник однозначно определяет точки Еи Ez, Е3, проективная координатная система однозначно опреде- определяется ее координатным треугольником и единичной точкой. Поскольку прямая Е2Е3 изображается в пространстве плос- плоскостью, проходящей через прямые Е2 и Е3 с направляющими векторами е2 и е3, то для всех точек этой плоскости их абсцисса (в репере Oeie2e3) равна нулю. Это показывает, что в проективных координатах X : Y \Z с репером Ео, Еи Е2, Е3 точки координатной прямой Е2Е3 характеризуются условием Х = 0. Аналогично показывается, что точки координатной прямой Е\Е3 характеризуются условием Y = 0, а точки координатной прямой Е^Ег — условием Z = 0. Это позволяет переформулировать предложение 1 в сле- следующем виде: Предложение 2. Проективная координатная система одно- однозначно определяется координатными прямыми X = О, Y = О, Z = 0 и единичной точкой ЕоA : 1 : 1). Чтобы тройка прямых была тройкой координатных прямых некоторой проективной ко- ординатнвй системы, необходимо и достаточно, чтобы эти пря- прямые не проходили через одну точку. Единичной точкой может служить любая точка, не принадлежащая этим прямым. Рассмотрим теперь вопрос -о формулах перехода от одной проективной координатной системы к другой. Поскольку проективные координаты (на проективной плос- плоскости Т10) являются не чем иным, как аффинными координа- координатами в пространстве, переход от одних проективных коорди- координат к другим сводится к переходу от одних аффинных коорди- координат в пространстве к другим аффинным координатам (с тем же началом О), т. е. к переходу, описывать который мы умеем (см. п. 2 § 1 гл. 2). . Таким образом, переход от одних проективных координат X : Y : Z к другим проективным координатам X': У : Z' описывается формулами вида f>X' = atX + a2Y + a3Z, рУ' = МЧ-62У + 632, " B) 311
где ах а2 а3 ft, Ь2 Ь3 г, с2 с3 Здесь р — произвольный множитель (подчеркивающий, что проективные координаты определены только с точностью до пропорциональности). Сказанное выше представляет собой содержательное об- обсуждение понятий проективной плоскости и проективной коор- координатной системы. Теперь мы можем (по уже известному об- образцу) дать этим понятиям и формально-аксиоматическое опре- определение. С этой целью мы введем в рассмотрение всевозможные пре- преобразования множества RP2, задаваемые формулами вида B). Ясно, что совокупность Proj(RP2) всех таких преобразований образует .группу. Определение 5. Множество ffl называется проективной плоскостью, если задано семейство СоогBЯ) биективных ото- отображений a: Tt->RP2 (называемых проективными координатными системами) и вы- выполнены следующие (уже привычные для нас) аксиомы: Аксиома 1. Если а е Соог (9№) кф? Proj (RP2), то фоае Соог (Ш). Аксиома 2. Если а, а' е Соог (Tt), то а' о а е= Proj (RP2). Примером проективной плоскости (доказывающим непро- непротиворечивость аксиом) является стандартная (или арифметиче- арифметическая) проективная плоскость RP2, для которой, по определению, Соог (RP2) = Proj (RP2) (а также, конечно, рассмотренная выше плоскость Шо). Понятие изоморфизма проективных плоскостей вводится точно так же, как, скажем, для евклидовых плоскостей (см. п. 2 § 3 гл. 2), причем все перечисленные в п. 2 § 3 гл. 2 свойства изоморфизмов полностью сохраняются (например, любой изо- изоморфизм является отображением по равенству координат и отображение а: 5№—>RP2 тогда и только тогда является изо- изоморфизмом, когда оно представляет собой проективную коор- координатную систему из Соог(ЯЯ)). В частности, мы видим, что любая проективная плоскость Ш изоморфна стандартной проективной плоскости RP2. Следовательно, аксиомы 1 и 2 полны. 312
Замечание 1. Совершенно аналогичным образом опреде- определяется проективная плоскость над любым полем К, в частности, комплексная проективная плоскость. Чтобы получить веществен- вещественно-комплексную проективную плоскость, следует группу Proj(RP2) рассматривать как группу преобразований множе- множества СР2 Конечно, можно, не ограничиваясь случаем п = 2, аналогично опреде- определить проективное пространство (над любым полем). Покажем, что и с формально-аксиоматической точки зрения проективные плоскости можно рассматривать как расширен- расширенные плоскости, в которых игнорировано различие между соб- собственными и несобственными точками. С этой целью заметим, что группа Aff(RP2) (см. предыду- предыдущий пункт) является, очевидно, подгруппой группы Proj(RP2). Поэтому (ср. п. 3 § 3 гл. 2) каждой аффинно-проективной плос- плоскости 5№+ мы можем сопоставить вполне определенную проек- проективную плоскость ЗЯпроект, состоящую из тех же точек, проек- проективными координатными системами которой являются отобра- отображения вида ф°а, где а — произвольная однородная аффинная координатная система на плоскости Ш+, а <р — произвольное преобразование из группы Pro^RP2"). Это означает, что проективная геометрия находится по от- отношению к аффинно-проективной геометрии в положении, сход- сходном с положением аффинной геометрии по отношению к евкли- евклидовой (первая является «частью» второй или, что то же самое, вторая «богаче» первой). Замечание 2. Тот факт, что проективные координатные системы имеют вид ф°а, где а е Соог (9Л+), ф eProj (RP2), означает, что соответствую- соответствующие координаты X' : У : Z' связаны с некоторыми однородными аффинными координатами X-.Y-.Z формулами вида A). Заменив в этих формулах одно- однородные координаты соответствующими неоднородными аффинными координа- координатами х, у, мы получим формулы, только обозначениями отличающиеся от формул D) п. 6 § 1 гл. 2. Это показывает, что теперешняя концепция «про- «проективных координат» совпадает с концепцией «однородных проективных ко- координат» в смысле п. 6 § 1, гл. 2. Чтобы, обратно, получить из проективной плоскости ?$ = 5ЮПроект аффинно-проективную плоскость, нужно выбрать некоторую проективную координатную систему а0: 3№->RP2 и принять за однородные аффинные координатные системы ото- отображения вида ф°ао, где ср е Aff (RP2). Получающаяся аффин- но-проективная плоскость Ttaa зависит от выбора системы ао. Задание. Докажите, что плоскости Ша^ и Шп1, отвечающие двум координатным системам по'- Wt~>RP2 и ai. Ш1->КР2, тогда и только тогда совпадают, когда ctjoa^e Aff(RP2). C) 313
Пусть теперь к0— прямая на плоскости 3№, определяемая уравнением Z = 0 D) в координатной системе сю, a Xt — прямая, определяемая тем же уравнением, но в координатной системе ocj. Покажем, что соотношение C) имеет место тогда и только тогда, когда прямые 10 и Ki совпадают. Действительно, пусть X : Y : Z — координаты в системе ао, а X': У" : Z'— координаты в системе а\. Если выполнено C), то эти координаты связаны формулами F) п. 4, и, в частности, Z' = Z. Поэтому Z' = О тогда и только тогда, когда Z = 0. Обратно, пусть прямые Хо и Х( совпадают, т. е. Z = 0 тогда и только тогда, когда Z' = 0. Согласно аксиоме 2, ct( о а-1 е= Proj (RP2), т. е. координаты X : Y : Z и X': У : Z' свя- связаны формулами B), и, в частности, Рассмотрим точку, для которой X : Y : Z = 1 : 0 : 0. Для этой точки Z' — С\, а, с другой стороны, по условию Z = 0. Следо- Следовательно, ci = 0. Рассмотрев точку X : Y : Z = 0 : 1 : 0, мы ана- аналогично получим, что с2 = 0. Кроме того, поскольку все наши координаты заданы только с точностью до пропорциональ- пропорциональности, мы без ограничения общности можем предполагать, что с3 = 1 (вопрос: почему с3=т^0?). Таким образом, формулы B) совпадают в рассматриваемом случае с формулами F) п. 4, т. е. имеет место соотношение C). Поскольку прямая D) является в плоскости Ша,, несобствен- несобственной прямой, мы видим, таким образом,.что переход от проективной плоскости к аффинно-проективной сводится к выбору некоторой (совершенно произвольной), пря- прямой в качестве несобственной прямой. Другими словами, две аффинно-проективные плоскости, определяющие одну и ту же проективную плоскость, отличаются друг от друга толь- только тем, какая прямая является несобственной прямой. Это и является точным формальным выражением утвержде- утверждения, что* проективная плоскость получается из аффинно-проек- аффинно-проективной плоскости игнорированием различия между собственны- собственными и несобственными точками. Упражнение. Докажите, что, аналогичным образом, вещественно-ком- вещественно-комплексные плоскости Ж, определяющие одну и ту же комплексную плоскость Цдкомпл (см. п. 5 § 3 гл. 2), отличаются только тем, какое подмножество является вещественной плоскостью Ю1веш. Мы ввели, таким образом, целую иерархию различных плос- плоскостей и соответствующих геометрий. В некотором смысле наи- наиболее общей (наиболее «бедной») является проективная гео- 314
метрия. Чтобы получить более «богатую» аффинно-проективную геометрию, нужно в проективной плоскости фиксировать неко- некоторую прямую. Это отражается в том, что от группы Proj(RP2) мы переходим к «меньшей» группе Aff(RP2). Чтобы затем получить аффинную геометрию, надо эту фикси- фиксированную прямую удалить. Группа Aff(RP2) при этом не меняет- меняется (точнее, заменяется изоморфной группой Aff(R2)), а геомет- геометрия несколько «обедняется» (ее «поле действия» уменьшается). Переход от аффинной геометрии к евклидовой, связанный с уменьшением группы Aff(R2) до ее подгруппы Ort(R2), снова существенно обогащает геометрию. Вместо того чтобы переходить от аффинно-проективной гео- геометрии к аффинной, мы можем перейти к евклидово-проектив- ной геометрии, сузив группу Proj(RP2) до ее подгруппы Ort(RP2), и лишь затем получить евклидову геометрию, пе- перейдя к изоморфной группе Ort(R2) (и удалив несобственную прямую). Эти взаимоотношения между геометриями можно изобра- изобразить следующей схемой: проективная аффинная аффинно- проективная евклидово- проективная евклидова Сплошные стрелки здесь означают переход к меньшей группе, а пунктирные — удаление несобственной прямой. Конечно, аналогичная схема имеет место для любого поля К, а для случая поля .С, даже в двух вариантах — «чисто комп- комплексном» и «вещественно-комплексном». Кроме того, все эти геометрии можно строить, например, при п = 1. В результате мы получаем понятия проективной пря- прямой, аффинно-проективной прямой и т. д. Задание. Опишите все соответствующие группы преобразований (Proj(RP'), Aff (RP1) и т. д.). Конечно, такого рода «одномерные» геометрии весьма прос- просты и потому большого интереса не представляют (см., впрочем, конец п. 4 § 3 гл. 2). Замечание 3 (очень важное!). Ясно, что любая прямая ев- евклидовой или аффинной плоскости автоматически является ев- евклидовой или, соответственно, аффинной прямой. То же самое верно и для прямых на проективной Плоскости. Интересно, что для прямых на аффинно-проективной плоскости это, вообще " 315
говоря, не верно. Действительно, для несобственной прямой у нас нет никакого естественного способа определить ее как аф- финно-проективную прямую, т. е. выделить на ней некоторую особую («несобственную») точку. Напротив, собственные пря- прямые аффинно-проективной плоскости естественным образом оп- определяются как аффинно-проективные прямые.' Таким образом, несобственную прямую аффинно-проектив-- ней плоскости мы можем определить только как проективную прямую. Аналитически это отражается в том, что на ней могут быть заданы однородные координаты, осуществляющие ее изо- изоморфное отображение на стандартную проективную прямую RP1. Такие координаты мы, например, получим, сопоставив каждой несобственной точке плоскости координаты / : m на- направляющего вектора произвольной собственной прямой, про- проходящей через эгу несобственную точку. Как уже отмечалось, нужно всегда отчетливо понимать, в какой именно геометрии справедливо то или иное утверждение. Помощь в этом может оказать тот факт, что для каждой гео- геометрии существуют предпочитаемые координатные системы, наиболее приспособленные для ее изучения. Для проективной геометрии это — проективные координатные системы, для аф- аффинно-проективной — однородные аффинные координатные системы и т. д. Поэтому использование, скажем, проективных координат, как правило, указывает, что соответствующее ут- утверждение относится к проективной геометрии. Конечно, любую геометрию можно изучать и в «чужих» координатах. Однако это всегда приводит к дополнительным осложнениям. Например, формулы евклидовой геометрии в аф- аффинных координатах получаются существенно более сложными, чем в евклидовых (прямоугольных) координатах (появляются метрические коэффициенты базиса) и т. д. 6, Интерпретации проективной геометрии и их применения Поскольку проективную плоскость можно получить из аф- аффинно-проективной плоскости игнорированием различия между собственными и несобственными точками, построенные в п. 3 модели аффинно-проективной геометрии («пучковая» и «про- «пространственная») являются одновременно и моделями проектив- проективной геометрии (только, конечно, в первой модели следует не различать собственные и несобственные пучки, а во второй —¦ не обращать внимания на расположение прямых и плоскостей по отношению "К оси Ог). Это позволяет проинтерпретировать любое утверждение проективной геометрии как некоторое высказывание, скажем, о прямых и плоскостях в пространстве и потому применить к его доказательству стереометрические соображения. - 316
Впрочем, на практике более удобно интерпретировать, ска- скажем, прямые на проективной плоскости не прямыми в прост- пространстве, а их направляющими векторами (как, по существу, мы и делали в п. 3), что позволяет применить к доказательству тео- теорем проективной геометрии разработанный аппарат векторного исчисления. Предупреждение. Следует всегда помнить, что прямой соот- соответствует не один вектор, а целое семейство коллинеарных век- векторов. Нужно также не забывать, что нулевой вектор не соот- соответствует никакой прямой. Проиллюстрируем эти общие соображения на примере до- доказательства знаменитой теоремы Паппа — Брианшона. Пусть на проективной плоскости даны шесть попарно различ- различных прямых. Будем обозначать эти прямые цифрами 1, 2, 3, 4, 5, 6. Точку пересечения прямых п и т мы обозначим символом пт, а %Г/. прямую, проходящую через точки пт и П\т\ (при условии, что пт Ф Фп\т{)% — символом птп\тх. Теорема Паппа —Брианшона. Если прямые 1, 3, 5 пересекаются в одной точке A3 = 15 = 35), а / ""^^^Г—"^ 2 прямые 2, 4, 6 также пересекаются У|\\г ' 3 в одной точке B4 = 26 = 46), при- причем 13 ф 24 и ни одна из данных прямых не совпадает с пря- прямой 13-24, то прямые 14-23, 25-16, 36-45 также пересекаются в одной точке. Замечание 1. Являясь теоремой проективной геометрии, эта теорема" справедлива и в аффинно-проективной геометрии. Од- Однако на аффинно-проективной плоскости она распадается на не- несколько утверждений, в зависи- зависимости от того, сколько точек, ~^^" ->^^^- явно или не явно участвующих в -^^^^^^----^^rir^,*^! теореме, являются собственными, ^ ^~~~—~b^*~^~~~~yiZL 2 а сколько — несобственными. При s^~ 6 ^^4 соответствующей переформули- переформулировке эти утверждения становятся теоремами аффинной гео- геометрии. Одним из таких частных случаев теоремы Паппа—Бри- Паппа—Брианшона на аффинной плоскости является, например, следующее утверждение: если прямые 1, 3, 5 параллельны и прямые 2, 4, 6 также параллельны (но не параллельны прямым 1, 3, 5) и если, кроме того, прямые 14-23 и 25-16 параллельны, то прямая 36-45 параллельна прямым 14-23 и 25-16. Задание. Составьте полный список утверждений аффинной геометрии, являющихся частными случаями теоремы Паппа — Брианшона (и сделайте соответствующие чертежи). 317
Для доказательства теоремы Паппа — Брианшона мы пере- переформулируем ее на языке векторного исчисления. Пусть аи а2, а3, а4, (k, a6 — векторы, соответствующие пря- прямым 1, 2, 3, 4, 5, 6, а а7, а8, Оэ— векторы, соответствующие пря- прямым 14-23, 25-16, 36-45. Каждой прямой, проходящей через точку 14, соответствует вектор вида jmai + ц4а4, а каждой пря- прямой, проходящей через точку 23, — вектор вида v2fl2 + v3a3. Сле- Следовательно, вектор п7 обладает тем свойством, что он может быть представлен как в виде ja^ai -f- ja,4a4, так и в виде v2«2 + + V3fl3. Аналогично, вектор as может быть представлен как в виде ja,2a2 + Ц5Д5, так и в виде viai -f- V6fle, а вектор а9 — как в виде цзДз + \хвпв, так и в виде v4fl4 + vsfls- Далее, тот факт, что прямые 1, 3, 5 проходят через одну точку (принадлежат одному пучку), означает, что векторы аи а3, а5 компланарны. Аналогич- Аналогично, тот факт, что прямые 2, 4, 6 проходят через одну точку, оз- означает, что векторы а2, а4, ав компланарны. Наконец, условие, что 13 Ф 24 и что ни одна из прямых 1, 2, 3, 4, 5, 6 не совпа- совпадает с прямой 13-24, означает, что ни один из векторов аи а3, as не компланарен векторам а2, а4, а6 и, обратно, ни один из век- векторов а2, а4, а6 не компланарен векторам аь а3, а5. Это означает, что теорема Паппа — Брианйюна может быть переформулирована следующим образом: если а) векторы ait аг, а3, а4, а5, а6 попарно не коллинеарны; б) векторы аи а3, а5> а также векторы а2, а4, а6, компланарны; в) ни один из векторов аи а3, а5 не компланарен векторам а2, а4, а6 и ни один из векторов а2, а4, а6 не компланарен векто- векторам аи а3, а5, то векторы а7, fle, аэ, удовлетворяющие соотношениям а7 = а8 = \i2a2 + p5as = v,a, + v6a6, A) a9 = ji3a3 + ц6а6 = v4a4 + v5a5, р В этом виде мы и будем ее доказывать. Поскольку векторы a4, a3, a5 компланарны, они параллель- параллельны некоторой плоскости Ш. Аналогично, векторы а2, а4, Ло па- параллельны некоторой плоскости П2. Плоскости П1 и П2 не параллельны, и потому существует единственная прямая, парал- параллельная обеим этим плоскостям. Пусть во — некоторый направ- направляющий вектор этой прямой. Пусть, далее, е4 — произвольный вектор, параллельный плоскости Пь но не коллинеарный век- вектору е0, а е2 — произвольный вектор, параллельный плоскости П2 и также не коллинеарный вектору е0. Из условий, наложен- наложенных на векторы at> ..., ав, немедленно следует, что векторы е0, еи е2 линейно независимы (составляют базис пространства) и что^ни один из векторов аи .... а6 не коллинеарен вектору е0. 318
При этом векторы аи а3, а5 выражаются через векторы е0, еи а векторы а2, а4, Ов — через векторы е0, ег- Заметим теперь, что векторы ait ..., а* нам заданы лишь с точностью до коллинеарности. Поэтому, без потери общности, мы можем предполагать, что ai = kxe0-\- eu а2 = k2e0 + е2, а3 = къей-\- еь а4 = k4e0-{- е2, ab = kbeQ-\- еь с6 = k6e0 + е2, , где ki, k2, кг, kit k5, h — некоторые числа. Подставив эти выражения в первое из равенств A), мы немедленно получим, что а7 = (цА + йА) е0 + (я1е1 + ц4е2 — (v2k2 + v3k3) e0 Так как векторы е0, еи e-i линейно независимы, это равенство мо- жрт иметь место только тогда, когда Hi = v3, 1^4 = v2 и Hlkl + yuki = v2k2 + v3k3. Следовательно, Поскольку вектор а7 нам задан также лишь с точностью до коллинеарности, мы без ограничения общности можем считать, что ni= kz — 64 (заметим, что кч ф kit ибо в противном случае векторы ач и а4 совпадают). Тогда ^м == ^i — k% и, следова- следовательно, «7 = Рг — 64) fti + (ki — кз) к*\ ео + (k2 ~ ki) ei + (h — h) e2 = = {kik2 — k%k4) еИ~ (k2 — ^4) «i + №1 — k3) e2. Аналогично показывается, что a8 = (kxk2 — ksk6) e0 + (k2 — k6) ex + F, — k5) e2, a9 == (k3k4 — k5k6) e0 + (k4 — k6) ex + (k3 — k5) e2. Но теперь ясно, что «7 + 09 = a8 и, следовательно, векторы a7, fls, Яэ компланарны. Тем самым теорема Паппа — Брианшона полностью доказана. Вспомним теперь, .что наряду с «пространственной» интер- интерпретацией, которой мы воспользовались для доказательства теоремы Паппа — Брианшона (и в которой точки изображаются 319
плоскостями, а прямые — прямыми), у нас есть также и рас- рассмотренная в п. 4 интерпретация Шо (в которой точки изобра- изображаются прямыми, а прямые — плоскостями), которую мы с равным правом можем использовать для доказательства теорем проективной геометрии. Поэтому одно и то же стереомет- стереометрическое рассуждение даст нам две (как правило, различ- различные) теоремы проективной геометрии: одну, когда мы восполь- воспользуемся первой интерпретацией, и другую, когда мы воспользуем- воспользуемся второй интерпретацией. Чтобы сравнить друг с другом эти теоремы, нам удобно усовершенствовать терминологию (впро- (впрочем, этой усовершенствованной терминологией мы уже иногда пользовались, так что читателю она должна быть знакома). Именно, вместо того чтобы говорить «прямая проходит через точку», т. е. что «точка лежит на прямой», мы будем говорить, что прямая и точка инцидентны. Аналогично, мы будем гово- говорить, что прямая и плоскость инцидентны, если прямая содер- содержится в плоскости. Теорему, в которой говорится только о точках и прямых (или прямых и плоскостях) и об отношении инцидентности меж- между ними, мы будем называть конфигурационной теоремой. Обратим теперь внимание на то, что обе построенные выше интерпретации сохраняют отношение инцидентности, т. е. если точка и прямая инцидентны на проективной плоскости, то со- соответствующие прямая и плоскость в пространстве также ин- инцидентны (и наоборот). Поэтому любая верная конфигурацион- конфигурационная теорема s4- на проективной плоскости переходит при каждой интерпретации в верную конфигурационную теорему в простран- пространстве. Пусть это будет теорема s&i для первой интерпретации и теорема б&2 для второй интерпретации. Формально переход от теоремы s4>, скажем, к теореме s4-u состоит в том, что слово «точка» всюду заменяется словом «плоскость». Аналогично, чтобы из теоремы «я? получить теорему ^2. нужно слово «точка» заменить словом «прямая», а слово «прямая» — словом «плос- «плоскость». Поэтому теоремы s&i и s?2 (вообще говоря, различные) переходят друг в друга при замене слова «плоскость» словом «прямая», а слова «прямая» словом «плоскость». Например, если мы примем за s4- теорему «любые дзе раз- различные точки инцидентны единственной прямой», то теоремой s&i будет высказывание «любые две различные плоскости ин- инцидентны единственной прямой», а теоремой зФг — высказыва- высказывание «любые две различные прямые инцидентны единственной плоскости» (напомним, что мы рассматриваем лишь прямые и плоскости пространства, проходящие через фиксированную точку О). Определение 6. Две конфигурационные теоремы $4> и $4-' на проективной плоскости называются двойственными, если од- одна из них получается из второй заменой (всюду) слова «точка» словом «прямая» и слова «прямая» — словом «точка», 320 •
Из сказанного выше непосредственно вытекает, что теоремы s4- и s4-' тогда и только тогда двойственны, когда теорема s&u отвечающая теореме зФ в первой интерпретации, совпадает с теоремой зФ'ъ, отвечающей теореме s4<' во второй интерпретации: Но мы знаем, что теоремы s4< и s^± (а также теоремы s4-r ¦ и зФъ) одновременно верны или неверны. Поэтому справедлив следующий общий принцип: Принцип двойственности. Конфигурационная теорема, двой- двойственная верной теореме, также верна. Например, верной теореме «любые две различные точки ин- инцидентны единственной прямой» двойственна верная (на про- проективной плоскости!) теорема «любые две различные прямые инцидентны единственной точке». Замечание 2. Подчеркнем, что принцип двойственности не является теоремой проективной геометрии, поскольку он говорит не о точках и пря- прямых, а о теоремах. Он принадлежит науке, изучающей теоремы проективной геометрии (эту науку можне, если угодно, назвать метагеометрией). Принцип двойственности позволяет «бесплатно» получать из доказанных теорем новые верные утверждения (правда, иногда теорема может оказаться «самодвойственной» и тогда никакой новой теоремы мы не получим). Например, теореме Паппа— Брианшона двойственна сле- следующая Теорема Паппа—Паскаля. Если из шести точек 1, 2, 3, 4, 5, 6 точки 1, 3, 5 расположены на одной прямой и точки 2, 4, 6 также расположены на одной прямой (отличной от первой), причем ни одна из точек 1, ..., 6 не совпадает с точкой пересе- пересечения этих прямых, то точка пересечения прямой 14 с прямой 23, точка пересечения прямой 25 с прямой 16 и точка пересече- пересечения прямой 36 с прямой 45 расположены на одной прямой 4). Чтобы полнее уяснить содержание этой теоремы, мы заме- заметим, что в ней участвуют девять точек: данные точки 1, 2, 3, 4, 5, 6 и три точки пересечения (точка 7 пересечения прямых 14 и 23, точка 8 пересечения прямых 25 и 16, точка 9 пересечения прямых 36 и 45), а также девять прямых 13, 14, 25, 27, 39, 46, 59, 68, 79. Обозначив эти прямые (в указанном порядке) цифрами 5, 7, 8, 3, 6, 2, 4, 1, 9, мы можем теорему Паппа — Паскаля переформулировать сле- следующим образом: ') Обратим внимание на то, что аксиома Паппа аффинной планиметрии (см. дополнение к § 3 гл. 2) является одним из аффинных частных случаев этой теоремы. И М. М. Постников 321
(«¦) если каждая из точек 1—8 инцидентна с прямой, обозна- обозначенной той же цифрой, то точка 9 также инцидентна с прямой 9. Конфигурация, состоящая из точек 1—9 и прямых 1—9? на- называется конфигурацией Паппа. В ней каждая^ прямая-, инци- инцидентна трем точкам и каждая точка инцидентна трем прямым. Эта конфигурация обладает замечательным свойством сим- симметрии, состоящим в том, что если мы выберем в ней две трой- тройки коллинеарных точек и будем по ним строить (указанным выше образом) конфигурацию Паппа, то в результате получим ту же конфигурацию. Другими словами, конфигурация Паппа не зависит от того, какие составляющие ее точки мы обозна- обозначаем цифрами 1—6. Еще иначе, можно сказать, что все точки конфигурации Паппа совершенно равноправны. Двойственная теорема Паппа — Брианшона аналогичным образом может рассматриваться как теорема, обеспечивающая возможность построения некоторой конфигурации точек и пря- прямых, исходя из двух троек прямых, проходящих через одну точку. Замечательно, что при этом получается та же конфигурация Паппа. Действительно, переформулировав теорему Паппа— Брианшона, подобно тому как мы выше переформулировали тео- теорему Паппа—Паскаля, как легко видеть, получим ту же фор- формулировку (*) (достаточно заметить, что формулировка (*) сама себе двойственна). Таким образом, обе теоремы Паппа— Паскаля и Паппа ¦— Брианшона выражают в сущности, один и тот же математический факт — существование конфигурации Паппа; только теорема Паппа — Паскаля обеспечивает возмож- возможность построения этой конфигурации, «исходя из точек», а тео- теорема Паппа — Брианшона — «исходя из прямых». Заметим, что теорема Паппа — Брианшона обеспечивает также полную симметричность конфигурации Паппа и в отно- отношении прямых. 7. Конфигурационная геометрия При исследовании отношения инцидентности точек и пря- прямых на проективной плоскости целесообразно несколько изме- изменить точку зрения и рассматривать прямые не как множества точек, а как некие новые объекты, связанные с точками отноше- отношением инцидентности. Формализуя этот подход, мы приходим к1 следующему определению: Определение 1. Пусть $ — множество элементов двух сор- сортов, одни из которых называются точками, а другие — прямыми. Предположим, что на множестве $ задано некоторое отноше- отношение, связывающее точки и прямые и называемое отношением инцидентности. Такое множество $ называется конфигурацион- конфигурационной плоскостью, если выполнены следующие аксиомы: Инц. 1. Любые две различные точки инцидентны одной и только одной прямой. 322
Инц. 2. Любые две различные прямые инцидентны одной и только одной точке. \ Инц. 3. Любая прямая инцидентна по крайней мере трем различным точкам. Инц. 4. Любая точка инцидентна по крайней мере трем раз- различным прямым. Замечание 1. Термин «конфигурационная плоскость» мало употребителен. Обычно предпочитают говорить о «проективной плоскости». Однако это для нас неприемлемо, поскольку тер- термин «проективная плоскость» мы уже употребляем в другом смысле (см. определение 1 п. 5). Конечно, каждая проективная плоскость является конфигурационной плоскостью (точнее, мно- множество ее точек и прямых составляют конфигурационную плос- плоскость), но (как показывают простые примеры) обратное не- неверно. Трудно ожидать, чтобы из тощих аксиом Инц. 1—4 можно было извлечь интересные следствия. Поэтому обычно к этим аксиомам добавляют еще другие дополнительные аксиомы. Наи- Наиболее важной из них является следующая аксиома Паппа: Инц. 5. Возможно построение конфигураций Паппа, т. е. вы- выполнены теоремы Паппа — Паскаля и Паппа — Брианшона. Определение 2. Конфигурационная плоскость, в которой вы- выполнена аксиома Паппа, называется папповой плоскостью. Поскольку доказательство теоремы Паппа — Брианшона, из- изложенное в предыдущем пункте, проходит, очевидно, в проек- проективной геометрии над любым полем К, то проективная плоскость над любым полем К является паппо- папповой плоскостью. Замечательно, что обратное утверждение также справедливо. Теорема 1. Любая паппова плоскость изоморфна проектив- проективной плоскости над некоторым полем К. Термин «изоморфна» понимается здесь в естественном смыс- смысле: существует биективное отображение, переводящее точки в точки, прямые в прямые и сохраняющее отношение инцидент- инцидентности. Доказательство теоремы 1 в достаточной мере трудно и мы его опустим {). Из теоремы 1 следует, что аксиомы Инц. 1—5 полны, в том (новом для нас) смысле, что каждая конфигурационная тео- теорема, верная в проективной геометрии над любым полем К, может быть выведена из этих аксиом. Это не мешает, конечно, существованию конфигурационных теорем, не вытекающих из аксиом Инц. 1—5. Примером яв- является следующая теорема: ') Доказательство можно найти в книжке Р. Хартсхорна, Основы проективной геометрии, Мир, 1970 г. (а также в книжке Э. А р т и н а, Гео- Геометрическая алгебра, Наука, 1969 г.). ¦11* 323
Теорема Фано. Для любой четверки точек 1, 2, 3, 4, любые три из которых неколлинеарны, точки 12-34, 13-24, 14-23 не коллинеарны. ' Упражнение. Докажите, что в проективной геометрии над полем К тогда и только тогда справедлива теорема Фано, когда характеристика поля К отлична от двух. Указание: рассмотрите проективную координатную систему, в кото- которой точки 1, 2, 3, 4 имеют координаты A:0:0), @:1:0), @:0:1) и A:1:1). Примером теоремы, вытекающей из аксиом Инц. 1—5, яв- является следующая Теорема Дезарга. Пусть 1, 2, 3, 4, 5, 6 — такие (попарно раз- яичные) точки, что прямые 14, 25 и 36 инцидентны одной точке (отличной от точек 1—6). Тогда точки 12-45, 13-46, 23-56 коллинеарны 1). Упражнение. Докажите, что теорема Дезарга справедлива в проективной геометрии над любым полем К. Затем выведите ее из аксиом Инц. 1—5, т. е. покажите, что она справедлива в любой папповой плоскости. Задание. Сформулируйте теорему, обратную к теореме Дезарга, и тео- теорему, двойственную теореме Дезарга. Установите, что обе эти теоремы равно- равносильны теореме Дезарга (обеспечивают возможность построения одной и той же конфигурации). К вопросу о роли теоремы Дезарга в геометрии плоскости мы еще вернемся в п. 4 § 2. «Конфигурационная» точка зрения проливает также новый свет на принцип двойственности (см. п. 6). Действительно, оче- очевидно, что аксиомы Инц. 1 —4 попарно двойственны. Кроме того, аксиома Инц. 5, как мы знаем, сама себе двойственна. Поэтому, если мы возьмем произвольную конфигурационную теорему, вытекающую из аксиом Инц. 1—5, и в ее выводе всю- всюду поменяем местами слова «точка» и «прямая», то получим правильный вывод двойственной теоремы из двойственных (т. е. тех же) аксиом. Это доказывает, что в любой папповой плоскости ^справедлив принцип двойствен- двойственности. Поскольку любая проективная плоскость (над произволь- произвольным полем К) является папповой плоскостью, отсюда, казалось бы, вытекает принцип двойственности и для проективных плос- плоскостей (и притом над произвольным полем К). Однако это не совсем так: таким способом принцип двойственности обосновы- обосновывается лишь для теорем, вытекающих из аксиом Инц. 1—5 (т. е. справедливых над любым полем К). Применим ли принцип *) Аффинным частным случаем этой теоремы является аксиома Дезарга из дополнения к § 3 гл. 2. 324
двойственности, например, к теореме Фано, остается при этом совершенно неясным. Чтобы «конфигурационными» рассуждениями доказать прин- принцип двойственности в полном объеме (и над любым полем К), можно поступить, например, следующим образом. Определение 3. Антиавтоморфизмом (употребителен также термин коррелятивное преобразование) конфигурационной плос- плоскости ty называется ее биективное отображение на себя (преоб- (преобразование), переводящее точки в прямые, прямые в точки и сохраняющее отношение инцидентности (т. е. обладающее тем свойством, что точка А и прямая а тогда и только тогда инци- инцидентны, когда прямая, соответствующая точке А, инцидентна точке, соответствующей прямой а). Ясно, что если конфигурационная плоскость обладает хотя бы одним антиавтоморфизмом, то на ней выполнен принцип двойствен- двойственности. Поэтому для доказательства принципа двойственности в про- проективной геометрии над полем К достаточно доказать, что проективная плоскость над полем К обладает хотя бы од- одним антиавтоморфизмом. Но какой-нибудь антиавтоморфизм проективной плоскости строится очень легко: достаточно выбрать на плоскости произ- произвольную проективную координатную систему и сопоставить каж- каждой точке (X: Y: Z) прямую с теми же координатами (т. е. имеющую числа X, Y, Z коэффициентами ее общего уравнения). Ясно, что это соответствие биективно. Покажем, что оно сохра- сохраняет отношение инцидентности. Пусть точка (X : Y : Z) и прямая (А : В : С) инцидентны. Это означает, что АХ + BY + CZ = 0. A) При нашем соответствии точка (X : У : Z) переходит в прямую (X:Y:Z), а прямая (А: В: С) — в точку (А: В: С). Поскольку инцидентность прямой (X : Y : Z) и точки (А : В : С) выражает- выражается тем же уравнением A), наше утверждение, тем самым, пол- полностью доказано. Факт существования антиавтоморфизма означает, что проективную плоскость можно проинтерпретировать в себе так, чтобы точкам соответствовали прямые, а прямым — точки. В этом смысле геометрия прямых на проективной плоскости полностью эквивалентна геометрии точек. Именно это обстоятельство и определяет красоту и изяще- изящество проективной геометрии (по сравнению с аффинной). Замечание 2. Теперь мы можем объяснить, почему прямые_ йа аффинной плоскости нельзя описывать неоднородными (всюду определенными) координатами (см. замечание 1 п. 1). Действительно, множество всех прямых аффинной плоскости 325
получается из множества всех прямых проективной плоскости удалением одной прямой. Поэтому любой антиавтоморфизм про- проективной плоскости переводит это множество в множество всех точек проективной плоскости, за исключением одной точки. Если бы в множество всех прямых аффинной плоскости можно было ввести неоднородные координаты, то неоднородные коор- координаты можно было бы ввести ив множество точек проектив- проективной плоскости, получающееся удалением одной точки. Но это, как мы знаем, сделать нельзя (нужно удалить целую прямую). Дополнение. Трилинейные координаты Определение 1. Пусть на евклидовой плоскости дана некоторая прямая X и точка Мо, не принадлежащая прямой X. Для любой точки М плоскости отношение г расстояния от точки М до прямой X к расстоянию от Мо до X, взятое со знаком «плюс», если точки М и Мо находятся по одну сторону от X, и со знаком «минус» в противном случае, мы будем называть рас- расстоянием точки М до прямой X по отношению к точке Мо. Пусть х, у — прямоугольные координаты на плоскости, Ах + By + С = О — уравнение прямой X в этих координатах и (х0, Уо) —координаты точки Мо. В силу результатов п. 5 § 1 гл. 3 расстояние г произвольной точки М(х, у) до прямой X по отношению к точке Мо выражается формулой Ах + Ву + С . Ах0 + Ву0 + С ' w Несмотря на то, что в определении расстояния г участвуют метрические понятия, оказывается, что это расстояние аффинно-инвариантно (т. ё. принад- принадлежит аффинной геометрии). Упражнение. Покажите, что формула A) остается верной в любых аффинных координатах х, у, дайте также геометрическое определение вели- величины г в терминах, имеющих афинно-инвариантный смысл. Предположим теперь, что на (аффинной) плоскости нам даны три пря- прямые общего положения и некоторая точка Е, не принадлежащая ни одной из этих прямых. Тогда для любой точки М будут определены три числа: Xi — расстояние точки М до прямой Xi по отношению к точке Е; Х2 — расстбяние точки М до прямой Хг по отношению к точке Е; х3 ¦— расстояние точки М до прямой Лз по отношению к точке Е. Определение 2. Числа xi, хг, Хз называются трилинейными координатами точки М, определенными прямыми Ai, X2, Х3 и точкой Е. Основной целью этого дополнения является доказательство следующего предложения: Предложение 1. Пусть 5Ш+ — аффинно-проективная плоскость, полученная расширением аффинной плоскости Ш. Рассмотрим на плоскости 5Ш+ проекте- 326
ную координатную систему с репером Ео, Ei, Е2, Ез, состоящим из собствен- собственных точек (т. е. из точек плоскости Ш?). Пусть — соответствующие координатные прямые. Тогда для любой собственной ' точки М ее проективные координаты X : Y: Z пропорциональны ее трилиней- трилинейным координатам х\, х2, хъ< определенным, прямыми A,i, К2, ^з и точкой Ео. Короче: проективные координаты пропорциональны трилинейным. Это предложение дает вполне удовлетворительное наглядное описание проективных координат любых собственных точек. Доказательство. Поскольку все аффинно-проективные плоскости изоморфны, мы без ограничения общности можем считать, что плоскостью Ш+ является рассмотренная в начале п. 5 аффинно-проективная плоскость, точками которой являются прямые в пространстве, проходящие через фик- фиксированную точку О. По определению, точка этой плоскости является соб- собственной точкой, если как прямая в пространстве она не параллельна неко- некоторой фиксированной плоскости П, не проходящей через точку О. Следова- Следовательно, сопоставив такой прямой ее точку пересечения с плоскостью П, мы можем аффинную плоскость Эй с; SOJ+ отождествить с плоскостью П. В част- частности, точки Ео, Eit ?2, Ез мы можем считать точками плоскости П. Согласно п. 5 для построения проективной координатной системы с ре- репером Ео, Ei, Ег, Ез мы должны рассмотреть в пространстве прямые ОЕй, ОЕЬ ОЕг, ОЕъ и найти такие направляющие векторы еи ег, ез прямых OEit OE2, ОЕз, чтобы вектор во = ех + е2 + е3 был направляющим вектором прямой ОЕ0. Тогда для любой собственной точки плоскости Ш?+ (т. е. некоторой точки М плоскости П) ее проективные координаты X : Y: Z в координатной системе с репером Ео, Eit E2, Е3 будут пропорциональны ее аффинным координатам х, у, z (как точки пространства) в репере Ое^ез- Таким образом, для доказательства предложения -1 нам ьужно только доказать, что х : у : г = хх : х2 : х3 для любой точки плоскости П. Пусть ОЕ0 = ?оео> ОЕ\ = к\в\, ОЕ2 — Тогда точки Ео, Еь Е2> ?з будут иметь в пространстве (относительно репера Oeie2e3) аффинные координаты Ео (fto, k0, fto), ?, (*„ 0, 0), Е2 @, klt 0), ?3 @, 0, *,), причем будет иметь место равенство J—L + -L + J-. - 327
Рассмотрим теперь в пространстве новый аффинный координатный репер О е1е2ез> для КОТОРОГО О'=?„ е\==ОЕ1, е2 = ?,?2, вз = ?,?3- Так как e'l=OEl =klel, е2 = — ОЕХ -)- ОЕ2 = — klel + k2e2, ез = - 0Ei + 0Ез = — k\e\ + *звз и OO' = OEl =k,eu то формулы перехода от координат х , у , г' ъ репере О'е[е'2е'г к коорди- координатам я, у, г в репере Ое^ез имеют вид х = k\%' — k\y' — kxz' + k\, V= k2y', г = k&\ а потому формулы перехода от координат х, у, z к координатам х', у', г' — вид «1 «2 «3 При этом уравнение плоскости П в координатах х', у', г' будет иметь вид х'=0, а величины будут аффинными координатами на плоскости П, определенными репером В координатах %, г\ точки Ео, Еи Е2, Е3 плоскости П имеют, очевидно» координаты: -, -J-), Е,@, 0), ?2A, 0), ?3@, 1). Поэтому координатная прямая к\ = Е-гЕъ будет иметь уравнение \ + п - 1 = 0, координатная прямая А.2 = EiE3 — уравнение (т. е. будет осью ординат), а координатная прямая Аз = ЕхЕг будет осью абсцисс 4 = 0. 328
Следовательно, для любой точки Af(|, ri) плоскости П ее трилинейные •координаты Х\, х% х3, определенные прямыми Х\, Х2, Х3 и точкой ?о, будут выражаться формулами k-2 k3 х —^- 2 ~ ka т. е. формулами 1 &о ka k0 ^3 r Z «0 *0 (в первом преобразовании мы воспользовались тем, что х' = 0 для точек плоскости П). Таким образом, действительно х \ у : z = х\ : хг: х3. Пусть х, у—"произвольные аффинные координаты на плоскости П и пусть (х0, у0), (*ь (/0, (*2> Уг). (-«з. Уз) — координаты точек ?о, ?i, ?2, ?з в этой координатной системе. Тогда урав- уравнения прямых Яь Xi, Хз будут иметь вид (Уз — У2)(х — х2) — (х3 — х.2)(у — уг)<=0, (Уз — У\) (х — х^ — (х3 — *,) (у — (/,) = О, (г/2 — «/i) (* — Хх) — (*2 — хх) (у — г/j) = О, я, следовательно, трилинейные координаты хи х2, х3 произвольной точки ЛЦх,у) будут выражаться формулами х __ . (Уз — Уг) {х — х2) ~ (х3 — х2) {у — уг) ' (Уъ — Vi) (х0 — х2) — (х3 — х2) (г/о — Уг) ' х _ (Уз — yi)(x— -У1) — (х3 — Xj) (у — уО 2 (Уз — yi) (*о — xi) — (х3 — х,) (г/0 — г/,) ' 3 (У2 — У\) (Ч — Xi) — (х2 — х^ (г/о — У\) ' . Тем самым доказано, что проективные координаты X: Y: Z произвольной (собственной) точки М (х, у) в проективной системе координат с репером Еа (*о> Уо), ?i (x\, yi), E2 (х2, у2). Е3 (хъ, уз) 329
выражаются формулами х _ (Уз — у2)(х — х2) — {хъ — х2)(у — у2) (Уз — Уг) (*о — х2) — (х3. — х2) ((/о — Уг) ' у _ (Уз — У г) (х — х{) — (лг3 — *i) (у — j/i) „. (Уз — У\) (х0 — xi) — (х3 — х{) (г/о — Ух) ' р7_ (Уг — У\)(х — -УД) — {х2 — xt)(y — y{) (У2 — У\) (х0 — хх) — (х2 — Xj) (г/о — У\) ' где р — произвольный множитель пропорциональности. Формулы A) представляют собой формулы перехода от аффинных ко- координат х, у к проективным координатам X: Y: Z. Формулы A) можно разрешить относительно х, у, т. е. выразить коор- координаты х, у через координаты X : Y: Z. В общем случае мы этого делать не будем, а ограничимся только случаем, когда точки Eit Ei, E3 имеют коорди- координаты A,0), @,1), @,0) (заметим, что для любых трех неколлинеарных точек Ей Е2, Ез всегда су- существует, и притом единственная, аффинная координатная система, в кото- которой точки Ei, E2, Е3 имеют эти координаты). В этом случае формулы A) приобретают вид Х + У-I Xo + Уо — 1 Находя из этих формул х, у, мы получаем Хх0 Xxo4-Yyo-Z(xo + yo-iy У^ Хха + Yyo-Z(xo+yo-iy Если — JL — .1 О О У УО Q J О О т. е. если точка Ео является центром тяжести точек Ei, E2, Ез, эти формулы упрощаются: X Х~ X + Y + Z ' Y у~~ X + Y + Z • ¦ Полученные формулы означают, что числа х, у являются координатами центра тяжести масс X, У, Z, помещенных в точках f?i, E2, Ез. Следователь- Следовательно, X-.Y-.Z являются не чем иным, как барицентрическими . координатами 330
(см. п. 6 § I гл. 2). Таким образом, барицентрические координаты являются частным случаем проективных координат, получающимся, когда точка Ео является центром тяжести точек Et, Ег, Ез. Аналогично можно найти формулы перехода от аффинных координат х, у к проективным координатам X: Y-.Z, определенным репером, одна или две точки которого являются несобственными точками. Мы не будем разбирать этот вопрос в полной общности (хотя и настоятельно рекомендуем сделать это читателю), а ограничимся случаем, когда точки Ео и Ез — собственные, а точки Ei и Ег — несобственные. При этом мы дополнительно будем пред- предполагать, что точка Еа имеет координаты A, 1), точка Е3 — координаты @,0) (является началом координат), точка Ei является несобственной точкой оси абсцисс, а точка Ег — несобственной точкой оси ординат. Согласно общему определению из п. 5 проективные координаты с таким репером являются аффинными координатами в пространстве, отвечающими аффинному координатному реперу Ое^ез, для которого векторы в\, ег па- параллельны осям координат данной аффинной координатной системы Оху на плоскости П, вектор е3 параллелен прямой ОЕ3, а вектор ~е0 = ех + е2 + е3 обладает тем свойством, что он параллелен прямой ОЕо. Ясно, что все эти условия будут выполнены, если мы выберем репер Ое^егвз так, чтобы в со- соответствующих аффинных координатах X, Y, Z плоскость П определялась уравнением 2=1, а координаты X, Y совпадали на плоскости П с данными координатами х, у. (Заметим, что эти условия однозначно определяют репер Ое^гвз.) Поскольку проективными координатами точки М(х,у) плоскости яв- являются, по определению, ее координаты X, Y, Z в этом репере, тем самым доказано, что проективные координаты X-.Y-.Z произвольной (собственной) точки М(х,у) в проективной координатной системе с репером Ео, Ей Е2, Ез, для которого а) точка Ео имеет координаты A,1); б) точка Ei является несобственной точкой оси абсцисс Ох; в) точка Ег является несобственной точкой оси ординат Оу; г) точка Е3 имеет координаты @,0) (является началом координат), определяются соотношением . т. е. являются однородными аффинными координатами. § 2. ГЕОМЕТРИЯ ПЛОСКОСТЕЙ В ПРОСТРАНСТВЕ Геометрия плоскостей в пространстве во многом аналогична геометрии прямых на плоскости. Поэтому некоторые утвержде- утверждения мы будем оставлять читателю в'качестве упражнений и за- заданий. 331
1. Пучки плоскостей Пусть в пространстве фиксирована некоторая аффинная сис- система координат Oxyz. Определение 1. Координатами произвольной плоскости Ах + By + Cz + D = О в этой координатной системе мы будем называть коэффициенты Л, В, С, D ее уравнения. Координаты плоскости — это однородные координаты, т. е. по плоскости они определены только с точностью до про- пропорциональности. Плоскость с координатами А, В, С, D мы бу- будем обозначать символом (А : В : С : D). Числа А, 5, С, D тог- тогда и только тогда являются координатами некоторой плоскости, когда хотя бы одно из чисел А, В, С отлично от нуля. Определение 2. Пучком плоскостей называется множество плоскостей (А : В : С : D), координаты которых выражаются формулами A A + A ч— vC A) ? = nA>+vDIf где Ло, Ль 50, Bi, Со, Cit Do, Di — постоянные числа, обладаю- обладающие тем свойством, что ранг матрицы л0 D0 ^0 L А, В, С, Dj B) равен двум, а ц и v — переменные параметры, одновременно не равные нулю. (Если ранг матрицы B) равен единице, т. е. если четверки (Ло, Во, Со, Do) и (Ах, В\, Сх, Di) пропорциональны, но пучок вырождается в единственную плоскость.) Если каждая из троек (Ло, So, Со) и (Аи Ви Ci) отлична от нулевой тройки (содержит отличное от нуля число) и если эти тройки не пропорциональны, то пучок A) называется собствен- собственным. В противном случае, этот пучок называется несобствен- несобственным. Таким образом, пучок тогда и только тогда — собствен- собственный, когда ранг матрицы Со' равен двум. Для собственного пучка определены две плоскости с уравнениями A C D 332
и эти плоскости не параллельны (и не совпадают). Прямую пе- пересечения этих плоскостей мы будем называть центральной пря- прямой пучка. Предложение 1. Каждый собственный пучок состоит щ всех плоскостей, проходящих через центральную прямую пучка. Предложение 2. Каждый несобственный пучок состоит из всех плоскостей, параллельных некоторой плоскости. При этом любая прямая является центральной прямой некоторого соб- собственного пучка и совокупность всех плоскостей, параллельных произвольной фиксированной плоскости, является несобственным пучком. Кроме того, для собственных пучков плоскостей любые значения пара- параметров ц и v (конечно, одновременно отличные от нуля) опреде- определяют некоторую плоскость, тогда как для каждого несобствен- несобственного пучка имеются значения этих параметров (с точностью до пропорциональности, однозначно определенные), которым ника- никакая плоскость не соответствует. Задание. Докажите предложения 1 и 2 и следующие за ними утвержде- утверждения (ср. п. 1 § 1). 2. Связки плоскостей Пучки плоскостей (подобно пучкам прямым) аналогичны прямым «точечной» геометрии. Рассмотрим теперь аналоги плос- плоскостей. Определение 1. Связкой плоскостей называется множество плоскостей (А : В : С : D), координаты которых выражаются формулами где Аа, Аи свойством, В — |xS0 С = цС0 + vCj + , + vD,+ . .., Di, D2 — постоянные что ранг матрицы /Ао / в0 Л, Ла1' Bj В2 С] С2 Z), D2> 1В2, 1С2> ¦ID2, числа, \ 1 / / 1 1 (и обладающие тем B) равен трем, а ц, v, | — переменные параметры, одновременно не равные нулю. (Если ранг матрицы B) меньше трех, связка вы- вырождается в пучок.) 333
Связка называется собственной, если определитель Ло Ах А2 Во Bi В2 Cq Сх С2 C) отличен от нуля. В противном случае связка называется несоб- несобственной. Для собственной связки определены три плоскости пересекающиеся в единственной точке. Эта точка называется центром собственной связки. Предложение 1. Любая собственная связка состоит из всех плоскостей, проходящих через ее центр. Доказательство. Ясно, что каждая плоскость собст- собственной'связки проходит через центр Мо(хо, уо, z0) связки (его координаты удовлетворяют уравнению этой плоскости). Обрат- Обратно, пусть Ах + By + Cz + D = О D) — произвольная плоскость, проходящая через точку М$(х0, у0, z0). Выберем на этой плоскости две точки Mi(xt, yit Zi) и ¦^2 (х2, Уг, z2), не лежащие на одной прямой с точкой Мо, и по- попробуем найти в связке плоскость, проходящую через эти точ- точки. Параметры ц, v, ?, отвечающие этой плоскости, должны удовлетворять соотношениям + (\iC0 + vC, + 1С2) zx + dxD0 + vZ), + ID2) = 0, x2 + (iiB0 + vfl, + IB2) y2 + vC, + IC2) z2 + (|iD0 + vDt + IDO) = 0, т. е. соотношениям (AoXl + ВоУ1 + Coz, + Do) (x + (A{x, + B,yx + C,2, + Dx) v + + (A2xx + B2yx + C2zx + D%)\ = 0, (Aox2 + B0y2 + C0z2 + Do) (x + (Л,*в + B,y2 + Cxz2 + /),) v + = 0. Эти равенства представляют собой два однородных уравнения относительно fpex неизвестных (д., v и |. Из алгебры известно, что у таких уравнений всегда имеется нетривиальное реше- 334
ние 1) (хо: vo: ?о- Соответствующая этим значениям параметров плоскость связки и является плоскостью, проходящей через точки Mi и М2. Являясь плоскостью связки, эта плоскость про- проходит, кроме того, и через точку Мо. Но через три не лежащие на одной прямой точки проходит только одна плоскость. Поэтому найденная плоскость совпадает с данной плоскостью D). Замечание 1. Тот факт, что плоскость D) принадлежит связке, можно доказать и по-иному. Действительно, рассмотрим систему уравнений Аоц + Л iv + Л21 = А, Во(х + Biv + В2? = В, относительно неизвестных [д., v, gr- По условию, определитель этой системы отличен от нуля и потому она имеет единственное решение jxo, vo, go- Ясно, что хотя бы одно из чисел цо, vo, go от- отлично от нуля (ибо в противном случае все три числа А, В, С были бы равны нулю). Плоскость связки, соответствующая этим значениям параметра, параллельна плоскости D) и имеет с ней общую точку Мо. Следовательно, она совпадает с этой плос- плоскостью. Задание. Докажите, что значения [х0, Vo, |o параметров, дающие пло- плоскость D), определены этой плоскостью однозначно с точностью до пропор- пропорциональности. Подчеркнем, что любая точка пространства является центром некоторой соб- собственной связки: Для доказательства этого утверждения достаточно выбрать три плоско- плоскости, пересекающиеся только в этой точке, и рассмотреть собственную связку, ими определенную. Предложение 2. Любая несобственная связка состоит из всех плоскостей, параллельных некоторой прямой. Доказательство. Для несобственной связки ранг мат- матрицы Л, 5, С, J E) /*2 ,l>2 ^ 2 / меньше трех. Этот ранг не может быть равен единице, поскольку тогда ранг матрицы B) будет, вопреки предположению, мень- меньше трех. Следовательно, ранг матрицы E) в точности равен ') В пространстве с координатами ц, v, | эти уравнения определяют две плоскости, проходящие через начало координат. Поэтому им удовлетворяют координаты любой точки прямой, являющейся пересечением этих плоскостей. 335
двум. Это означает, что матрица E) содержит две непропор- непропорциональные строки, линейной комбинацией которых является третья строка. Пусть, для определенности, не пропорциональны первые две строки. Тогда соответствующие плоскости не параллельны и потому пересекаются по некоторой прямой (уравнениями которой и являются уравнения F)). Рассмотрим теперь произвольную плоскость Ах + By + Cz + D = О, G) принадлежащую нашей связке. В матрице Ло Во С Ах В{ Сх | (8) ABC первые две строки не пропорциональны, а третья строка, ли- линейно выражаясь по условию через строки матрицы E), линей- линейно выражается через первые две строки. Следовательно, ранг матрицы (8) равен двум. Поэтому (см. п. 2 § 3 гл. 3) плоскость G) параллельна прямой F). Обратно, пусть Ах+ By + Cz + D = 0 (9) — произвольная плоскость, параллельная прямой F). Тогда ранг матрицы (8) равен двум, и потому ее третья строка ли- линейно выражается через первые две строки (по условию, ли- линейно независимые). Следовательно, ранг матрицы также равен двум (дополнительная строка Л2, В2, С2 линейно выражается, как мы знаем, через первые две строки). Рассмотрим теперь матрицу Ао Ах А2 А в0 Вх В2 В с с с с о 1 2 ¦Do Dx D2 D 336
Она получается из матрицы A0) прибавлением одного столбца, и потому ее ранг может увеличиться только на единицу. Следо- Следовательно, ранг матрицы A1) не превосходит трех. Но, по ус- условию, первые три строки матрицы A1) линейно независимы (они составляют матрицу B), ранг которой равен трем). Сле- Следовательно, ранг матрицы A1) в точности равен трем и ее по- последняя строка линейно выражается через предыдущие. Это оз- означает, что т. е. плоскость (9) принадлежит рассматриваемой связке. 3. Расширенное пространство Аналогично расширенной плоскости мы можем построить расширенное пространство, точками которого являются все точки аффинного пространства плюс некоторое множество «несобст- «несобственных точек». При этом каждой прямой % аффинного про- пространства сопоставлена некоторая несобственная точка — не- несобственная точка этой прямой, причем так, что любая несоб- несобственная точка является несобственной точкой некоторой прямой и двум различным прямым тогда и только тогда сопо- сопоставлена одна, и та же точка, когда эти прямые параллельны. Предполагая такое соответствие заданным, мы назовем прямой расширенного пространства либо произвольную прямую % аф- аффинного пространства, к которой присоединена ее несобственная точка, либо множество несобственных точек всевозможных пря- прямых некоторой плоскости (несобственную прямую этой плос- плоскости). Аналогично, плоскостями расширенного пространства мы будем называть либо плоскости аффинного пространства, расширенные присоединением их несобственных прямых, либо множество всех несобственных точек (несобственную плоскость пространства). Аналогично аффинной геометрии в геометрии расширенного пространства через любые две различные точки проходит единственная прямая, и через любые три точки, не лежащие на одной прямой, проходит единственная плоскость. С другой стороны, в противоположность аффинной геомет- геометрии, в расширенном пространстве любые две различные плоскости пересекаются по единст- единственной прямой, и любые три плоскости, из которых ни одна не содержит прямую пересечения двух других, пересекаются в единственной точке. 337
- Пучком плоскостей в расширенном пространстве называется множество всех плоскостей, содержащих данную прямую — центральную прямую пучка. Пучок называется собственным, когда эта прямая — собственная, и несобственным, когда эта прямая — несобственная. Аналогично, связкой плоскостей в расширенном пространстве называется множество всех плос- плоскостей, содержащих данную точку — центр связки. Если эта точка — собственная, связка называется собственной, а если она — несобственная, то связка также называется несобствен- несобственной. Ясно, что каждый собственный пучок и каждая собственная связка состоит из тех же плоскостей (лишь пополненных несоб- несобственными прямыми), что и соответствующие пучок или связка в аффинном пространстве. Что же касается несобственных пуч- пучков и связок, то они получаются из соответствующих пучков и связок в аффинном пространстве присоединением дополнитель- дополнительно несобственной плоскости (и конечно, добавлением к каждой плоскости ее несобственной прямой). При этом центральной прямой несобственного пучка будет несобственная прямая плос- плоскости, которой в аффинном пространстве параллельны плос- плоскости пучка, а центром несобственной связки будет несобствен- несобственная точка прямой, которой параллельны плоскости связки. Автоматическая проверка показывает, что в расширенном пространстве любые две различные плоскости содержатся в единственном пучке, и любые три плоскости, не принадлежащие одному пучку, содержатся в единственной связке. Кроме того, любые две различные связки содержат единственный общий пучок, и любые три связки, не содержащие общего пучка, содер- содержат единственную общую плоскость. Мы не будем здесь давать формально-аксиоматические опре- определения расширенного пространства, поскольку это делается в точной аналогии со случаем плоскости (см. п. 2 § 1), и лишь отметим, что при расширении аффинного пространства полу- получается аффинно-проективное пространство, а при расширении евклидова пространства — евклидово-проективное пространство. Кроме того, конечно, все это можно делать над любым полем К, причем в случае К = С — в двух известных нам вариантах («чисто комплексном» и «вещественно-комплексном»). Задание. Дайте формальные определения аффинно-проективного и евкли- дово-проективного пространств над произвольным полем К и, в частности над R и С. Чтобы построить «аффинную» модель расширенного прост- пространства, мы рассмотрим в аффинном пространстве множество всевозможных связок. Примем эти связки за «точки» нашей мо- 338
дели. Множество таких точек мы назовем «прямой», если оно состоит из всех связок, содержащих некоторый фиксированный пучок. Тем самым «прямые» нашей модели и пучки плоскостей аффинного пространства будут находиться в естественном би- биективном соответствии. Наконец, множество точек мы назовем «плоскостью», если оно либо состоит из всех несобственных связок, либо является множеством всех связок, содержащих некоторую фиксированную плоскость аффинного пространства. Без труда проверяется (ср. п. 3 § 1), что тем самым мы дей- действительно получим модель расширенного пространства. Соб- Собственными точками этой модели являются собственные связки и только они. Аналогично, собственным прямым соответствуют собственные пучки плоскостей, а несобственным прямым — не- несобственные пучки. Замечание 1. Никакого аналога «пространственной» или «векторной» интерпретации расширенной плоскости мы для рас- расширенного пространства получить не можем (поскольку в на- нашем распоряжении нет «четырехмерного пространства»). Однако отсутствие «векторной» модели не мешает введению . в расширенном пространстве однородных координат (и, следо- следовательно, построению «числовой модели»). Пусть в пространстве (нерасширенном) задана произволь- произвольная аффинная координатная система Oxyz. Для любой точки М расширенного (аффинно-проективного) пространства мы будем считать ее однородными аффинными координатами числа X, Y, Z, Т, определенные с точностью до пропорциональности соотношениями если fo4Ka М — собственная и имеет аффинные координаты х, у, z, и соотношениями X : Y : Z : Т = /: m : п: О, если точка М — несобственная и является несобственной точкой прямой х — хр у — уо г — га ... I ,"~ m — п - {1> Ясно, что тем самым мы получим взаимно однозначное соот- соответствие между точками расширенного пространства и элемен- элементами множества RP3. Если координаты х, у, z являются прямоугольными (евкли- (евклидовыми) координатами, координаты X : Y : Z : Т называются однородными евклидовыми координатами (конечно, здесь уже речь идет о расширенном евклидовом, т. е. евклидово-проектив- ном, пространстве). 339
По определению, собственные точки характеризуются усло- условием Т Ф 0, а несобственные — условием Т = 0. Следовательно, уравнение 7 = 0 является в координатах X : Y : Z : Т уравнением несобственной плоскости. Аффинные координаты собственных точек выражаются че- через координаты X : У : Z : Т по формулам _Х_ _У_ _ z X j, , у j, , Z — у, . Подставив эти выражения в уравнение Ax+By + Cz + D = 0 B) произвольной плоскости, мы получим (после умножения на Т) уравнение АХ + BY-j-CZ + DT = 0. C) Координаты X : Y : Z : Т собственной точки тогда и только тогда удовлетворяют этому уравнению, когда точка принадлежит плоскости B). Что же касается несобственных точек, то для лю- любой такой точки ее координаты X : Y : Z : Т = t: m : п : 0 тогда и только тогда удовлетворяют уравнению C), когда т. е. когда прямая A) параллельна плоскости B), и, значит, рассматриваемая несобственная точка (являющаяся несобствен- несобственной точкой прямой A)) принадлежит плоскости B). Этим доказано, что уравнение C) выражает в расширенном пространстве плос- плоскость B), пополненную всеми ее несобственными точками. Тем самым, нами доказано следующее Предложение 1. В расширенном пространстве любое уравне- уравнение вида (хотя бы один коэффициент которого отличен от нуля) выра- выражает некоторую плоскость: собственную, если отличен от нуля хотя бы один из коэффициентов А, В, С, и несобственную, если A=B = C = 0. Поэтому прямые в расширенном пространстве задаются двумя (не пропорциональными) уравнениями вида А>Х + B{Y + CXZ + DJ = 0. Теперь уже ясно (в полной аналогии с п. 4 § 1), что «число- «числовой моделью» расширенного пространства будет стандартное 340
(арифметическое) афинно-проективное пространство RP3, точ- точками которого являются классы (X : У : 2 : Т) пропорциональных четверок ~(Х, У, Z, Т) Ф @,0,0,0). Несобственные точки в этом пространстве характеризуются условием Т = 0. Можно, конечно, дать и независимое определение аффинно- проективного (и евклидово-проективного) пространства с по- помощью (очевидным образом определяемых) групп Aff(RP3) и Ort(RP3) (ср. п. 4 § 1). Задание. Определите группы Aff(RР3) и Ort(RP3) и сформулируйте аксиомы аффинно-проективного и евклидово-проективного пространств. 4. Проективное пространство Проективным пространством называется аффинно-проектив- ное пространство, в котором игнорируется различие между соб- собственными и несобственными точками. Задание. Введите группу Proj(RP3) и дайте формальное определение проективного пространства (ср. п. 5 § 1). Обратим внимание на то, что каждая плоскость проективного пространства автоматически является проективной плоскостью в смысле п. 5 § 1 и, аналогично, каждая собственная плос- плоскость аффинно-проективного пространства является аффинно- проективной плоскостью. Напротив, несобственная плоскость аффинно-проективного пространства является лишь проективный плоскостью. Идея считать прямые и плоскости самостоятельными объек- объектами (а не множеством точек) приводит, аналогично случаю плоскости (см. п. 7 § 1), к следующему определению: Определение 1. Конфигурационным пространством называет- называется множество $р, состоящее из объектов трех сортов: точек, пря- прямых, плоскостей, связанных отношением инцидентности, удов- удовлетворяющим следующим аксиомам: Инц. 1. Любые две различные точки инцидентны одной и только одной прямой. Инц. 2. Любые две различные прямые, инцидентные одной плоскости, инцидентны одной и только одной точке. Инц. 3. Любая прямая инцидентна по крайней мере трем различным точкам. Инц. 4. Любая точка инцидентна по меньшей мере трем раз- различным прямым. Инц. 5. Любые две различные плоскости инцидентны един- единственной прямой. Инц. 6. Любые две различные прямые, инцидентные одной точке, инцидентны единственной плоскости. Инц. 7. Любая прямая инцидентна по крайней мере трем раз- различным плоскостям. 341
Инц. 8. Любая плоскость инцидентна по крайней мере трем различным прямым. Инц. 9. Любая плоскость и любая не инцидентная ей прямая инцидентны единственной точке. Инц. 10. Любая точка и любая не инцидентная ей прямая инцидентны единственной плоскости. Обратим внимание на то, что аксиомы Инц. 1—4 совпадают (с точностью до оговорки в аксиоме Инц. 2) с аксиомами Инц. 1—4 из определения 1 п. 7 § 1. Следовательно, множество всех точек и прямых, инцидентных некоторой .плоскости конфигурационного пространства, является конфигу- конфигурационной плоскостью. Определение 2. Конфигурационное пространство называется папповым пространством, если любая его плоскость является папповой плоскостью (см. определение 2 п. 7 § 1). Ясно, что проективное пространство над любым полем К является пап- папповым пространством. Обратное утверждение мы (как и для случая плоскости) приведем без доказательства: Теорема 1. Любое паппово пространство изоморфно проек- проективному пространству над некоторым полем К. Поэтому аксиомы паппова пространства полны в том смысле, что каждая конфигурационная теорема, верная в проективной геометрии над любым полем К, может быть выведена из этих аксиом. Мы видим, что ситуация в «пространственном» случае, каза- .лось бы, вполне аналогична ситуации, имеющей место в «плос- «плоском» случае. Однако более глубокое исследование вскрывает замечательное различие между этими двумя случаями. Пусть К — произвольное тело1) (некоммутативное поле). Назовем две четверки (Хи Yu Zu Т{) и (Х2, Y2, Z2, T2) элемен- элементов тела К, отличные от нулевой четверки @, 0, 0, 0), пропор- пропорциональными, если существует такой элемент р тела К, что .{Обратите внимание на то, что порядок множителей здесь су- существен: четверки (X, Y, Z, Т) и (рХ, рК, pZ, рГ), вообще го- говоря, не пропорциональны). Без труда проверяется (так же, как для случая, когда К коммутативно), что отношение пропор- пропорциональности является отношением эквивалентности. Соответ- Соответствующие классы эквивалентности обозначаются символом (X : Y : Z : Т), а их множество — символом КР3. Аналогично вводится множество КР2 классов (X : Y : Z) про- пропорциональных троек и, вообще, множество КРП при лю- любом п ^ 1. ') Примером тела является рассматриваемое в п. 4 § 2 гл. 7 тело ква- кватернионов. -342
Элементы (X : Y : Z : T) множества КР3 мы будем называть точками. Множества точек, удовлетворяющих уравнениям вида AX + BY + CZ мы назовем плоскостями'), а множества, являющиеся пересече- пересечением двух (различных) плоскостей,— прямыми. За отношение инцидентности между точками, прямыми и плоскостями мы при- примем (как и в коммутативном случае) отношение теоретико-мно- теоретико-множественной принадлежности (например, точка инцидентна плос- плоскости, если она содержится в ней). Простая выкладка показывает, что множество так определенных точек, прямых и плоскостей' является относительно указанного отношения инцидентности конфигурационным пространством. Задание. Докажите это утверждение (не забывайте следить за порядком множителей!). Мы будем это пространство (допуская определенную воль- вольность) обозначать тем же символом КР3 и будем называть его (а также любое конфигурационное пространство, ему изоморф- изоморфное) проективным пространством над телом К. Аналогично определяется проективная плоскость над те- телом К 2). Оказывается, что справедлива следующая замечательная теорема, которую мы приведем без доказательства: Теорема 2. Любое конфигурационное пространство является проективным пространством над некоторым телом К. Таким образом, папповость нам нужна только для того, чтобы тело К было коммутативным. Из теоремы 2 вытекает, что конфигурационная теорема тогда и только тогда может быть выведена из аксиом Инц. 1— 10, когда она выполняется в проективном пространстве над лю- любым телом К. Примером такой теоремы является, скажем, теорема Дезарга (см. п. 7§1). Упражнение. Докажите теорему Дезарга двумя способами: из аксиом Инц. 1—10 (указание: рассмотрите сначала случай, когда плоскости 123 и 456 различны) и алгебраической выкладкой (не забывайте о порядке мно- множителей!). ') Обратим внимание на то, что уравнение вида ХА + YB + ZC + TD = 0, вообще говоря, не является уравнением плоскости. 2) Конечно, мы могли бы ввести проективное пространство (и проектив- проективную плоскость) над телом К не как конфигурационное пространство (конфи- (конфигурационную плоскость), а как множество, снабженное координатными си- системами (ср. п. 5 § 1). Мы от этого уклонились, во-первых, потому что это нам сейчас не нужно, а, во-вторых, потому, что при этом возникают некото- некоторые осложнения в описании элементов групп Proj(KPn) (ввиду трудностей в построении теории определителей над некоммутативным телом). / 345.
Глубокое-различие между случаями я = 3 и л = 2 (о кото- котором мы упоминали выше) состоит в том, что для конфигура- конфигурационных плоскостей аналог теоремы 2 не верен: не любая кон- конфигурационная плоскость является проективной плоскостью над некоторым телом. Действительно, поскольку проективная плоскость над произвольным телом К является плоскостью проек- проективного пространства над телом К, в ней, согласно сказанному ' выше, выполнена теорема Дезарга. Называя конфигурационные плоскости, в которых выполнена теорема Дезарга, дезарговыми плоскостями, мы, следовательно, можем сказать, что проективная плоскость над произвольным телом К является дезарговой плоскостью. Оказывается, что это необходимое условие является также и достаточным, т. е. справедлива следующая теорема (которую мы также приведем без доказательства): Теорема 3. Конфигурационная плоскость тогда и только тогда является проективной плоскостью над некоторым телом К, когда она дезаргова. Замечание 1. В алгебре доказывается, что любое конечное тело является полем. Поэтому любая дезаргова плоскость, содержащая конечное число точек, является папповой плоскостью. Удивительно, что чисто геометрического («синтетического») доказатель- доказательства этого утверждения до сих пор неизвестно. Определение 3. Конфигурационная теорема s4-'', называется (пространственно) двойственной теореме s4-, если она полу- получается из теоремы s& заменами слова «точка» словом «плос- «плоскость» и наоборот. Обратившись к аксиомам Инц. 1—10, мы немедленно обнару- обнаружим, что аксиомы Инц. 1, Инц. 2, Инц. 3, Инц. 4, Инц. 9, двой- двойственны, соответственно, аксиомам Инц. 5, Инц. 6, Инц. 7, Инц. 8, Инц. 10, т. е. что аксиомы Инц. 1 —10 разбиваются на пары двойственных друг другу аксиом. Отсюда очевидным образом (ср. п. 7 § 1) вытекает следую- следующий общий принцип: Принцип пространственной двойственности. Теорема, прост- пространственно двойственная верной конфигурационной теореме, также является верной теоремой. Здесь под «верной теоремой» понимается, естественно, тео- теорема, вытекающая из аксиом Инц. 1—10. Все такие теоремы верны в проективном пространстве над любым телом К. Однако если тело К фиксировано, то под «верной теоремой» можно понимать конфигурационную теорему, справедливую в проективном пространстве именно над этим телом К, и встает' вопрос, справедлив ли принцип пространственной двойственно- двойственности при таком понимании термина «верная теорема», т. е. спра- справедлив ли этот принцип над данным телом К? 344
Оказывается, что ответ на этот вопрос, вообще говоря, от- отрицательный. Выясним, в чем тут дело. Определение 4. Антиавтоморфизмом конфигурационного пространства ty называется его преобразование, переводящее точки в плоскости, прямые в прямые, плоскости в точки и со- сохраняющее отношение инцидентности (ср. определение 3 п. 7§ 1). Ясно, что если конфигурационное пространство обладает хотя бы од- одним антиавтоморфизмом, то в нем выполнен принцип двой- двойственности. Имея это в виду, постараемся построить для конфигурацион- конфигурационного пространства КР3 антиизоморфизм тем же способом, как это мы делали в п. 7 § 1 в случае плоскости, т. е. сопоставив точке (А : В : С: D) плоскость с теми же координатами, т. е. с уравнением AX + BY + CZ + DT = 0. Однако легко видеть, что полученное (очевидно, биективное) со- соответствие не будет, вообще говоря, сохранять отношение инци- инцидентности, поскольку факт инцидентности точки " (X : У : Z: Т) и плоскости (А : В : С : D) выражается уравнением AX + BY + CZ + DT = 0, A) а факт инцидентности точки (А : В : С: D) и плоскости (X : Y : Z : Т) —уравнением XA + YB + ZC+ TD = 0, вообще говоря, отличным от уравнения A). Тем не менее, если тело К является полем, то уравнения A) и B) равносильны/Следовательно, принцип двойственности выполнен в проективном простран- пространстве над любым полем К. Замечание 2. Это утверждение можно обобщить. Напомним с этой целью, что биективное отображение ai—>a тела К на. себя называется антиавтоморфизмом, если для любых элемен- элементов а, Ь е К имеют место равенства a -f- b = a + b, ab = ha, a = a. Предполагая, что тело К обладает таким антиавтоморфизмом '), сопоставим произвольной точке (X : Y : Z : Т) плоскость с коор- координатами (X:Y:Z:T) (а плоскости (А :В :€ : D)—точку ') Например, является телом кватернионов (см. п. 5 § 2 гл. 7). ' 345
{A : В : С : D))^Поскольку факт инцидентности точки (Л : В : С : D) и плоскости (X : F : Z : Т) выражается уравнением ХА + YB + ZC+ TD = О, переходящим при рассматриваемом антиавтоморфизме в урав- уравнение A), мы видим, что построенное (очевидно, биективное) соответствие сохраняет отношение инцидентности. Следова- Следовательно, если тело К обладает антиавтоморфизмом, то антиизоморфиз- антиизоморфизмом обладает ипрсективное пространство над К, и потому в этом пространстве выполнен принцип двойственности. Ясно,, что аналогичное утверждение справедливо и для плос- плоскостей. Можно доказать, что если КР3 (или КР2) обладает антиавто- антиавтоморфизмом, то антиавтоморфизмом обладает и тело К. Дополнение. О геометрии прямых в пространстве Геометрия прямых в пространстве значительно интереснее и сложнее теометрии плоскостей в пространстве и геометрии прямых на плоскости. Мы не имеем здесь возможности заняться этой геометрией сколько-нибудь по- подробно и потому ограничимся лишь тем, что объясним, почему эта геометрия более сложна. Пусть Аох + Воу + Сог + Do = О, — произвольная прямая в пространстве. Что можно принять за ее координа- координаты? Считать ими коэффициенты уравнений A) явно не очень удобно, по- поскольку ту же самую прямую можно задать любой парой плоскостей B) .из соответствующего пучка и потому совсем другими коэффициентами. Хо- Хотелось бы связать с прямой A) инвариантные выражения, т. е. функции коэффициентов, не зависящие от выбора уравнений A). Рассмотрим с этой целью матрицу коэффициентов (Ао Во Со АЛ \At Вх Сх Dxj уравнений A). Она обладает шестью минорами второго порядка D) Р12 = Ао Ах Ао to to Со с, Do Di , Ргг = , Р24 = ' Р34 = Во Во Со Сх Со с, о] Do 346
Поскольку ранг матрицы C) равен двум (в противном случае плоскости A) совпадают и не определяют никакой прямой), хотя бы один из этих миноров: отличен от нуля. Посмотрим, как эти миноры меняются при замене плоско- плоскостей A) плоскостями B). По условию, плоскости B) принадлежат пучку плоскостей, определенно- определенному плоскостями A). Следовательно, существуют такие числа Цо, Vo, Hi, Vi, что Пусть D0 = Рп Pl3 Pl4 К v0Dl' B'o в[ Cn P23 P24 — P34 B'o Co B'o C'o B\ C' D\ \ D\ Подставив выражения E) в формулы F), мы немедленно получим (вос- (воспользовавшись, например, теоремой об умножении определителей), что где Заметим, что Д #= 0, поскольку в противном случае плоскости B) совпадают. Тем самым мы доказали, что числа pi2, pis, Ри, ргз, Pn, P3i однозначно с точностью до пропорцио- пропорциональности определены прямой A). Эти числа называются плюккеровыми координатами прямой A). Под- Подчеркнем, что это — однородные координаты. Теперь уже ясна одна из причин сложности геометрии прямых: прямые описываются шестью однородиылгйг координатами, т. е. могут рассматри- рассматриваться как точки пятимериого пространства. Правда, пока не ясно, нет ли среди плюккеровых координат лишних и, вообще, не связаны ли эти координаты каким-нибудь соотношением. Чтобы 347
ответить на этот вопрос, рассмотрим определитель Ао А\ А* А, Во S, So в. Со с, Со с. Do Di Do D, Этот определитель равен нулю, поскольку он имеет одинаковые строки. С другой стороны, разложив его по первым двум строкам (мы здесь поль- пользуемся известной из алгебры теоремой Лапласа о разложении определите- определителей), мы немедленно получим, что он равен 1{р\грзк— рхзра + РаРгз). Сле- Следовательно, плюккеровы координаты любой прямой удовлетворяют соотношению РпРза — Р\зР24 + РмРгз = 0. G) Это соотношение известно как соотношение Плюккера1). Соотношение Плюккера является соотношением второй степени. Это означает, что прямые представляют собой точки пятимерного пространства, принадлежащие некоторой «четырехмерной гиперповерхности второго поряд- порядка». Это вторая — и главная — причина сложности геометрии прямых. Но является ли соотношение Плюккера единственным соотношением, связывающим плюккеровы координаты, т. е., иными словами, можно ли для любых чисел /3i2, pi3, pu, ргз, Pzi, P34, удовлетворяющих соотношению Плюк- Плюккера, найти прямую, плюккеровыми координатами которой они являются, т. е. можно ли решить уравнения D) относительно неизвестных Ло, Во, Са, Аз, А\, В], Ci, ?>i? Простая выкладка (которую мы предоставили читателю) показывает, что это действительно возможно. Однако при этом могут полу- получиться уравнения параллельных плоскостей. Чтобы этого не было, следует, очевидно, дополнительно потребовать, чтобы хотя бы одно из чисел Рп, Р\з, Ргъ (8) было отлично от нуля. Таким образом, резюмируя, мы получаем, что % прямые в аффинном пространстве описываются шестью однородными плюккеровыми координатами piz, P13, Ра, ргз, Ри, ри, подчиненными соотно- соотношению Плюккера G) и обладающими тем свойством, что хотя бы одна из трех координат (8) отлична от нуля. Замечание 1. Полученные в п. 1 § 3 гл. 3 формулы показывают, что плюккеровы координаты ргз, —Рп, Ри являются координатами /, in, n на- направляющего вектора прямой. Следовательно, две прямые тогда и только тогда параллельны, когда их координаты (8) пропорциональны. В случае, когда координаты (8) равны нулю, получаются пары парал- параллельных плоскостей, т. е. несобственные прямые. Поэтому в проективном (или аффинно-проективном) пространстве прямые, как и следовало ожидать, описываются несколько проще: требование, чтоб^ы координаты (8) были от- отличны от нуля, уже не нужно. ¦') Читатель, не знакомый с теоремой Лапласа, может проверить соотно- соотношение Плюккера прямым вычислением. 348
Заметим в заключение, что плюккеровы координаты p,j можно считать определенными для всех значений I, j = 1, 2, 3, 4, предполагая при этом, что Pit = —рц (и, в частности, что ри = 0). Приняв это соглашение, мы полу- получим возможность записывать плюккеровы координаты любой прямой в виде кососимметрической матрицы четвертого порядка: Ри Рп Рп Ри Р21 Р22 РгЗ Рг4 П РЪ2 РзЗ Р34 \Ра\ Р42 Раз Ри / \ — Ри — Р24 — Ри § 3. ГЕОМЕТРИЯ ОКРУЖНОСТЕЙ НА ПЛОСКОСТИ 1. Степень точки относительно окружности Мы знаем, что в прямоугольных координатах Оху уравнение окружности радиуса R с центром в точке (а, Ь) имеет вид (* - af + (у- bf = R*.' Раскрыв скобки в этом уравнении и положив мы приведем уравнение окружности к виду х2 + у2 — 2ах — 2Ъу — 2с = 0. B) Определение 1. Для любой точки M0(xQ, y0) число, получаю- получающееся в результате подстановки координат этой точки в левую часть уравнения B), называется степенью точки Мо относи- относительно данной окружности и обозначается символом ст Mq. Та- Таким образом, по определению, ст мо = ** + у*- 2ах0 - 2Ьу0 -2с = (х0 - af + ^-bf~R\ C) Ясно, что стЛ40<0 #Ф точка Мо лежит внутри окружности; стМ0 = 0 ФФ точка М0 принадлежит окружности; ст Мо > 0 ФФ точка Мо лежит вне окружности. В частности, степень центра окружности отрицательна и равна —R2, где R — радиус окружности. Степень начала координат @, 0) равна, очевидно, —2с. Степень допускает красивое геометрическое истолкование. 9тобы получить его, мы рассмотрим произвольную прямую x = xo + lt, y = yo + mt, 349
проходящую через точку М0(х0, у0). Будем, для упрощения вы- вычислений, считать, что направляющий вектор аA, т) этой прямой является ортом (т. е. что I2 + т2 = 1)- Точки пересечения прямой D) с окружностью B) определяются из уравнения (хо + ItJ + (г/о + tntf - 2а (х0 + It) - 26 (уо + mt) - 2с = О, т. е. из уравнения 2 [t(xo -a) + m(y0- b)]t + ст М0 = 0. E) Пусть прямая D) на самом деле пересекает окружность, т. е. пусть уравнение E) имеет вещественные (быть может, совпа- совпадающие) корни t\ и t2. Через эти корни координаты точек пере- пересечения М\(х\, ух) и М2(х2, у2) выражаются формулами Х\ = Xq -(- lt\, Х2 = Xq-\- lt2, Рассмотрим теперь векторы MQMX и М0М2. Ясно, что M0Mi = txa, МйМ2 ¦= t2a. Следовательно, в ориентации прямой D), определенной векто- вектором а, величина (см. п. 2 § 2 гл. 1) вектора M0Mi равна tu а ве- величина вектора М0М2 равна t2 (напомним, что вектор а мы пред- предполагаем единичным). Поэтому согласно формуле Вьета для произведения корней квадратного уравнения произведение t\t2 величин этих векторов равно свободному члену уравнения E), т. е. равно степени стМ0 точки Мо. Тем самым мы доказали следующее Предложение 1. Степень точки Мо относительно окружности равна произведению величин вектороз М0М] и М0М2, где М\ и М2 — точки пересечения окружности с произвольной прямой, проходящей через точку Мп. Заметим, что хотя величины векторов на прямой зависят от ориентации этой прямой (от выбора направляющего вектора), их произведение от этой ориентации уже не зависит. В частности, мы видим, что для любой прямой, проходящей через точку Мо и пересекаю- пересекающей данную окружность, произведение длин отрезков М0М\ и М0М2 не зависит от прямой. Этот факт должен быть известен читателю из школьного курса геометрии («теорема о произведении длин секущих»). При t\ = t2, т. е. когда прямая D) пересекает окружность только в одной точке М\ = М2 (и потому касается ее в этой точке), мы получаем 350
Следствие. Степень точки Ма относительно окружности равна квадрату длины касательной, проведенной из точки Мок окруж- окружности. Здесь предполагается, что точка Мо лежит вне окружности (поскольку только из такой точки можно провести к окружно- окружности касательную). Тот факт, что квадрат длины касательной равен произведе- произведению длин секущих, также должен быть известен читателю из школьного курса геометрии. Пусть нам даны две неконцентрические окружности 2,: x2 + y2-2a1x-2bly-2ci=0 и 22: х2 + у2 — 2а2х — 2Ь2у — 2с2 = 0. Степень точки М(х, у) относительно первой окружности мы бу- будем обозначать через CTiM, а относительно второй — через ст2М. Рассмотрим все точки М(х, у), имеющие относительно этих окружностей равные степени СТ! М = СТ2 М. Поскольку СТ[ М — х2 + у2 — 2ахх — 2Ьху — 2си ст2 М = х2 + У2 — 2а2х — 2Ь2у — 2с2, координаты этих точек удовлетворяют соотношению (а2 — al)x + (Ь2 -bi)y + (с2 - с,) = 0. F) Так как по условию (аь bi) ф (а2, Ь2), равенство F) является уравнением некоторой прямой. Определение 2. Прямая F) называется радикальной осью окружностей 2i и 2г. Прямая, соединяющая центры окружностей Ei и 2г, имеет уравнение x—ai __ у — Ь, а2 — п\ Ь2 — Ь\ и, очевидно, перпендикулярна прямой F). Таким образом, радикальная ось двух (неконцентрических) окружностей пер- перпендикулярна прямой, соединяющей их центры. Замечание 1. Если от евклидовой плоскости (в которой мы до сих пор работали) перейти к евклидово-проективной плоскости (см. п. 2 § 1), то уравнение F) (переписанное, конечно, в евклидово-проективных координа- координатах) будет иметь смысл и для концентрических (не совпадающих) окружно- окружностей и будет в этом случае уравнением несобственной прямой. Таким обра- образом, мы можем считать, что радикальной осью концентрических [несовпадающих) окружностей яв- является несобственная прямая. Для совпадающих окружностей уравнение F) вырождается в тождество, которому удовлетворяет каждая точка плоскости. 351
Предложение 2. Радикальной осью двух ¦ пересекающихся окружностей является прямая, проходящая через их точки пере- пересечения, а радикальной осью двух касающихся окружностей яв- является их обитая касательная. Доказательство. Если окружности пересекаются, то степени их общих точек относительно обеих окружностей равны нулю и потому одинаковы. Поэтому радикальная ось проходит через эти точки. Если же окружности касаются, то их общая касательная проходит через точку касания и перпендикулярна прямой, соединяющей центры окружностей. Поэтому она яв- является радикальной осью. Обратно, если радикальная ось двух окружностей пересе- пересекает одну из этих окружностей, то каждая точка пересечения принадлежит второй окружности (ибо степень этой точки отно- относительно второй окружности равна ее степени относительно пер- первой окружности и потому равна нулю). Следовательно, радикальная ось двух непересекающихся окружностей лежит вне этих окружностей {их не пересекает). Рассмотрим три попарно неконцентрические окружности Еь Е2 и Е3, центры Оь О2 и О3 которых не коллинеарны. Пусть \\2 — радикальная ось окружностей Ei и Е2, а ^23 — радикальная ось окружностей Е2 и И3. Поскольку прямые О{О2 и О2О3, по условию, различны (и не параллель- параллельны), а прямые %\2 и /\23 им перпендику- перпендикулярны, то прямые А.12 и Х2з пересекаются в единственной точке Мо. Для этой точки выполнены равенства ст, Мо = ст2 Мо, ст2 Мо = ст3 Мо. Поэтому ст, Мо = ст3 Мо, т. е. точка Мо принадлежит и радикальной оси A,i3 окружно- окружностей Ei и Е3. _ Таким образом, мы доказали, что для любых трех окружностей Еь Е2 и Е3 с неколлинеар- ными центрами три радикальные оси каждой пары окружно- окружностей проходят через одну точку. Определение 3, Точка пересе- пересечения радикальных осей Ai2, >.2з, ?из окружностей Еь Е2, Ез назы- называется радикальным центром этих окружностей. Из доказанного утверждения вытекает простой способ по- построения радикальной оси %\2 двух непересекающихся (и не- неконцентричных) окружностей Ei и Е2: достаточно провести про- произвольную окружность Ез, пересекающую окружности Si и Е2, 352
построить радикальные оси Xi3 и Агз (см. предложение 2) и про- провести через точку их пересечения прямую, перпендикулярную пря- прямой, соединяющей центры окружностей Si и 22. Эта прямая и будет радикальной осью Ai2. Если центры окружностей Si, 22 и 2з коллинёарны, то ради- радикальные оси Ai2, Ягз и Л.13 параллельны, так что для таких окружностей радикального центра не существует. На евклидово-проективной плоскости мы можем считать (в случае, когда все оси Я12, ^23 и Хц различны), что радикальным центром окружностей с коллинеарными центрами является несобственная точка прямой, перпендику- перпендикулярной прямой, соединяющей их центры. Если две из трех радикальных осей совпадают, то третья ось также с ними совпадает. В этом случае говорят, что окруж- окружности Si, S2, 2з имеют общую радикальную ось. Никакого опре- определенного радикального центра (собственного или несобствен- несобственного) в этом случае не имеется. На евклидово-проективной плоскости три концентрические окружности также имеют общую радикальную ось (несобственную прямую). 2. Связки окружностей Три числа а, Ь, с полностью определяют окружность 2: х2 + у2 - Чах - 2Ьу - 2с = 0. Определение 1. Числа а, Ь, с называются координатами ок- окружности 2 (в данной системе прямоугольных координат Оху). Окружность с координатами а, Ь, с мы будем обозначать .сим- .символом 2(а, Ь, с). Выбрав в пространстве некоторую систему прямоугольных координат Oxyz, мы каждой окружности 2 (а, Ь, с) можем со- сопоставить точку пространства, имеющую координаты (а, Ь, с). Будем называть эту точку точкой, изображающей данную ок- окружность. Поскольку радиус Я = У а2 + Ь2 + 2с окружности 2 (а, Ь, с) должен быть вещественным числом, числа а, Ь, с тогда и- только тогда являются координатами некоторой окружности, когда A) Другими словами, отображение «окружность» *—?¦ «изображающая точка» 12 М. Ms Постников 353
определяет биективное соответствие между множеством всех ок- окружностей на плоскости и множеством всех точек пространства, координаты которых удовлетворяют неравенству x2 + y2 + 2z>0 B) Замечание 1. Рассмотрим в пространстве поверхность Q с уравнением х2 + у2 Ч- 2z = 0. Эта поверхность называется параболоидом вращения. В следующей главе мы покажем, что он получается вращением параболы уг = —2г (расположенной в плоскости Оуг) вокруг оси Ог. Этот параболоид разбивает все простран- пространство на две области, одна из которых называется внешней областью и ха- характеризуется неравенством х2 + У2 + 2г > 0, а вторая называется внутренней областью параболоида и харак- характеризуется неравенством х2 + у2 + 2z <Д Таким обра- образом, мы можем сказать, что точки, изображающие окружности, заполняют внеш- внешнюю область параболоида Q. Определение 1. Связкой окружностей на- называется множество всех окружностей, изо- изображающие точки которых принадлежат неко- некоторой плоскости Параболоид<э Ax + By + Cz + D = 0. C) О плоскости C) мы будем говорить, что она изображает связку. Связка называется собственной, если С ф 0, т. е. если плоскость C) не параллельна оси Ог. В противном случае связка назы- называется несобственной. Замечание 1. Не нужно думать, что любая точка плоскости C) изображает некоторую окружность связки. Этим свойством обладают только точки, удовлетворяющие условию B). Другими словами, окружности связки изображаются точками плоскости C), принадлежащими внешней области параболоида Q. Для несобственных связок уравнение C) означает, что центры (а, Ь) окружностей связки принадлежат прямой При этом на третью координату z — с окружностей связки это уравнение никаких ограничений не накладывает. Этим доказано следующее Предложение 1. Каждая несобственная связка является мно- множеством всех окружностей, центры которых принадлежат некото~ рой фиксированной прямой. Ясно, что обратнре утверждение также справедливо, т. е. множество всех окружностей, центры которых принадлежат данной прямой, является несобственной связкой. 354
Определение 2. Прямая, содержащая центры окружностей несобственной связки, называется фундаментальной прямой этой связки. Несобственная связка Чтобы получить пример собственной связки, мы вспомним, что степень р произвольной точки М0(а0, Ьо) плоскости относительно некоторой окружности 2 (а, Ь, с) выражается, по определению, формулой Это показывает, что множество всех окружностей, относительно которых данная точка Мй(а0, Ьо) имеет данную степень р, является собственной связкой с уравнением >-4-ь2о =0. D) Оказывается, что таким образом можно задать любую соб- собственную связку, т. е. имеет место следующее Предложение 2. Любая собственная связка C) является множеством всех окружностей, относительно которых фиксиро- фиксированная точка М0(а0, Ьо) имеет фиксированную степень р. Доказательство. Чтобы привести уравнение C) к виду D), достаточно положить В )=-г' Р=- Аг С2 E) Заметим, что числа а0, Ьо и р однозначно определены связкой (не меняются при умножении ее уравнения на любое число). Определение 3. Точка М0(а0, Ьо) называется центром связки E), а число р — ее степенью. Заметим, что центр и степень однозначно определяют связку. На евклидово-проективиой плоскости центр можно приписать и несоб- несобственным связкам, а именно, центром несобственной связки, изображающейся плоскостью 12» 355
следует считать точку с однородными координатами (А:В:0), т. е. несоб- несобственную точку прямых, перпендикулярных прямой фундаментальной связки. Степень несобственной связки считается, по определению, бесконечной. Из определений немедленно вытекает, что если для трех окружностей связки радикальный центр суще- существует, то он совпадает с центром связки, а если радикальный центр не существует (окружности имеют общую радикальную ось), то их радикальная ось проходит через центр связки. На евклидово-проективной плоскости это утверждение верно и для не- несобственных связок. Задание. Докажите, что если из трех окружностей две принадлежат связке с центром в точке Ма и если точка Мо является радикальным центром этих окружностей (или ле- лежит на их общей радикальной оси), то третья окружность также принадле- принадлежит связке. В случае, когда точка Afo(ao, bo) совпадает с началом коор- координат 0@,0), уравнение D) сводится к равенству z = —р/2. Следовательно, каждая окружность собственной связки степени р, имеющей центр в точке 0@, 0), задается уравнением вида х2 + У2 — 2ах — 2Ьу + р = 0, где а и b — параметры, определяющие окружность. Эти параметры представляют собой не что иное, как коор- координаты центра окружности. Они должны выбираться так, чтобы было выполнено условие A), т. е. чтобы а2 + Ь2>р. F) Таким образом, каждая точка плоскости, координаты (а, Ь) которой удов- удовлетворяют неравенству F), является центром единственной ок- окружности, принадлежащей собственной связке степени р с цент- центром в точке 0@, 0). Этим собственные связки отличаются от несобственных (центры окружностей которых принадлежат фундаментальной лрямой и не заполняют никакой части плоскости). Определение 4. Собственная связка называется эллиптической, ] параболической, i если ее степень р гиперболической, J отрицательна: р < О, равна нулю: р = 0, положительна: р > 0. Из неравенства F) немедленно вытекает следующее Предложение 3. Если собственная связка а) эллиптична, б) параболична, 356
в) гиперболична, то центры ее окружностей заполняют а) всю плоскость, б) всю плоскость, за исключением центра связки, в) всю плоскость, за исключением точек, не лежащих вне окружности радиуса У р c Центром в центре связки. Определение 5. При р > 0 окружность радиуса Yр с цент- центром в центре связки называется фундаментальной окружностью гиперболической связки. Аналогично, при р < 0 окружность ра- радиуса У — р с центром в центре связки называется главной окружностью эллиптической связки. Ясно, что фундаментальная {главная) окружность гиперболической (эллиптической) связки однозначно определяет эту связку. При этом любая окружность является фундаментальной (главной) ок- окружностью некоторой гиперболической (эллиптической) связки. Заметим, что главная окружность эллиптической связки принадлежит этой связке, а фундаментальная окружность гиперболической связки этой связке не принадлежит. Так как каждая точка является центром некоторой окруж- окружности эллиптической связки, то каждая точка плоскости, изображающей эллиптическую связ- связку, изображает некоторую окружность связки. Таким образом, плоскость, изображающая эллиптическую связку, цели- целиком лежит вне параболоида Q, т. е. его не пересекает. Аналогично, каждая точка плоскости, изображающей параболическую связку, изображает, за исключением^ одной точки, некоторую окружность связки. Эта исключительная точка характеризуется тем, что при проектировании параллельно оси Oz на плоскость Оху она пе- переходит в центр Л10(а0, Ьо) связки, т. е. тем, что ее координаты имеют вид (а0, Ьо, с0), где с0 — некоторое число. Подставив коор- координаты (а0, Ьо, с0) в уравнение связки D) (при р = 0), мы не- немедленно получим, что Таким образом, исключительная точка (по, Ьо, с0) принадлежит парабо- параболоиду Q (и является единственной точкой рассматриваемой плоскости, ле- лежащей на параболоиде Q). Это, по определению, означает, что плоскость, изображающая параболическую связку, касается параболоида Q (в точке (а0, Ьо, со)). Рассмотрим теперь гиперболические связки (задаваемые уравнением D) прир<0). 367
Так же, как и выше, мы немедленно получаем, что среди точек плоскости, изображающей гиперболическую связ- связку, только точки, проектирующиеся в точки, лежащие вне фун- фундаментальной окружности связки, изображают окружности связки. Координаты (к, у, z) точек, проектирующихся в точки фунда- фундаментальной окружности, должны удовлетворять уравнению связки D), а первые две координаты (х, у) —уравнению фунда- фундаментальной окружности (х-аоJ+(у-ЬоJ = р, т. е. уравнению х2 + У2-2а0х-2Ь0у + а2 + Ь2- р = 0. Прибавив к этому уравнению уравнение D), умноженное на 2, мы получим уравнение x2 + y2 + 2z = 0. G) Аналогично показывается, что точки, проектирующиеся внутрь фундаментальной окружности, удовлетворяют соотношению х2 + у2 + 2z < 0. (8) Таким образом, первые точки принадлежат параболоиду Q, а вторые лежат в его внутренней области. Другими словами, плоскость, изображаю- изображающая гиперболическую связку, пересекает гиперболоид Q. Условие G) выделяет на плоскости D) некоторую замкнутую линию1), а условие (8) выделяет точки, лежащие внутри этой линии. Собирая вместе все доказанное (и используя принцип обра- обращения), мы получаем следующую теорему. Теорема 1. Собственная связка окружностей тогда и только тогда является а) эллиптической связкой, б) параболической связкой, в) гиперболической связкой, когда изображающая ее плоскость а) не пересекает параболоид Q, б) касается этого параболоида (и в этом случае точка ка- касания проектируется в центр связки на плоскости Оху), в) пересекает параболоид Q по замкнутой линии, проекти- проектирующейся в фундаментальную окружность связки. 1) С помощью результатов п. 2 § 1 гл. 5 легко показать, что эта линия является эллипсом. Впрочем, это непосредственно вытекает (см. п. 8 § 2 гл. 5) также из того, что она является образом некоторой окружности (фундаментальной окружности связки) при параллельном проектировании одной плоскости (плоскости Оху) на другую плоскость (плоскость, изобра- изображающую связку). 358
Замечание 2. В частности, мы видим, что для плоскости в пространстве, не параллельной оси Oz, воз- возможны следующие три взаимно исключающие друг друга случая: 1) плоскость не пересекает параболоид Q (и тогда цели- целиком лежит в его внешней области); 2) плоскость касается этого параболоида (и тогда вся, за исключением точки касания, лежит во внешней области); 3) плоскость пересекает параболоид по некоторой линии (и тогда имеет точки как во внешней, так и во внутренней областях параболоида Q). Упражнение. Дайте прямое доказательство этого утверждения. (Указа- (Указание: перейдите к координатам, для которых данная плоскость является координатной плоскостью.) Задание. Докажите, что плоскости, параллельные оси Oz, т. е. изобра- изображающие несобственные связки, также пересекают параболоид Q по некото- некоторой линии, но уже незамкнутой (параболе). Чтобы получить наглядное описание собственных связок, нам понадобится следующее Определение 6. Две окружности 20 = 2 (а0, Ьо, с0) и 2 = = 2 (а, Ь, с) называются ортогональными, если они пересе- пересекаются под прямым углом, т. е. если они имеют две общие точки и их радиусы в этих точках перпендикулярны. Говорят, что окружность 2 диаметрально пересекает окружность 2о, если либо 2 = 2о, либо окружности 2 и 20 пересекаются и их точки пересечения являются диаметрально противоположными точ- точками окружности So. Пусть Ro и R— радиусы окружностей 2о и 2, a d — расстоя- расстояние между их центрами. Очевидные элементарно-геометрические соображения показывают, что окружности тогда и только тогда ортогональны, когда Но Следовательно, окружности 2(ао, Ьо, с0) и 2 (а, Ь, с) тогда и только тогда ортогональны, когда аоа + bob + с + с0 = 0. (9) Отсюда непосредственно вытекает следующее Предложение 4. Множество всех окружностей, ортогональ- ортогональных данной окружности 2 (а0, Ьо, с0), является собственной связ- связкой с уравнением + Со = 0. A0) ' 359
Далее, ясно, что окружность 2 (а, Ь, с) тогда и только тогда Диаметрально пересекает окружность 2(а0, Ьо, с^)фЪ(а, Ь, с), когда радикальная ось (a — ao)x+(b—b0)y + + (с - с0) = О этих окружностей проходит через центр (а0, Ьо) окруж- окружности 2(а0, Ьо, с0) (ибо ра- радикальной осью двух пере- пересекающихся окружностей яв- является прямая, проходящая через их точки пересечения), т. е. когда имеет место соот- соотношение (а — а0) а0 + (Ь — Ьо) Ьо + + (с - с0) = О, равносильное соотношению Гиперболическая связка aQa -(a* + ftg + co) = O. A1). Поскольку при 2(а0, Ьо, с0) = 2 (а, Ь, с) это соотношение также справедливо, тем самым доказано следующее Предложение 5. Множество всех окружностей, диаметрально пересекающих данную окружность 2 (а0, Ьо, с0), является соб- собственной связкой с уравнением aox+boy + z-(al+bl + co) = O. A2) Е1це один пример собственной связки мы получим, рассмотрев для произвольной точки Мо(ао, Ьо) множество всех окружностей, про- проходящих через эту точку. Усло- Условие, что окружность х2 + у2 — 2ах - 2Ьу - 2с = О проходит через точку М0(а0, Ьо), выражается равенством а2п + bl — 2аап — 2bbn — 2с = 0. 0 ' 0 0 и Следовательно, имеет место Предложение 6. Множество всех окружностей, проходящих через фиксированную точку М0(а0, Ьо), является собственной связкой с уравнением Эллиптическая связка aQx ¦ = 0. A3) 360
Вычисляя по формулам E) центр и степень связок A0), A2) и A3), мы немедленно получим следующее Предложение 7. Центром связки A0) является центр М0(а0, Ьо) окружности И(а0, Ьо, с0), а ее степень выражается формулой и, следовательно, положительна (связка гиперболична). Центром связки A2) является центр М0{а0, Ьо) окружности 2(а0, Ьо, с0), а ее степень р выражается формулой U, Следовательно, Отрицательна (СвЯЗКа Параболическая связка эллиптична). Центром связки A3) является точка М0(а0, Ьо), а ее степень равна нулю: я=К + ^)-(«о + ^) = о (связка параболична). Кроме того, мы видим, что окружность 2 (а0, Ьо, с0) является фундаментальной окруж- окружностью связки A0) и главной окружностью связки A2). При этом ясно, что в виде A0) можно представить любую гиперболическую связку (достаточно принять за окружность 2(а0, Ьо, со) фундаментальную окружность связки), в виде A2) —любую эллиптическую связку (достаточно за окружность 2 (а0, Ьо, с0) принять главную окружность связки), в виде A3)—любую параболическую связку (достаточно за точку М0(а0, Ьо) принять центр связки). Резюмируя, мы получаем следующую теорему: Теорема 2. Связка окружностей тогда и только тогда яв- является а) эллиптической связкой, б) параболической связкой, в) гиперболической связкой, г) несобственной связкой, когда она состоит из окружностей, а) диаметрально пересекающих некоторую окружность (являющуюся главной окружностью связки), б) проходящих через некоторую точку (являющуюся цент- центром связки), в) ортогонально пересекающих некоторую окружность (яв- (являющуюся фундаментальной окружностью связки),- г) имеющих центры на данной прямой. 361
3. Пучки окружностей Определение 1. Пучком окружностей называется множество всех окружностей, изображающие точки которых принадлежат некоторой прямой х — а0 __ у — Ьо г— ср ,п А ~~ В ~ С { ' в пространстве. Об этой прямой мы будем говорить, что она изображает пучок. Если А = В = 0, т. е. если прямая A) па- параллельна оси Oz, пучок окружностей называется несобственным, а в противном случае — собственным. Поскольку прямая однозначно определяется любыми ее двумя (различными) точками, пучок окружностей однозначно определен, когда известны две его окружности. Координаты центров окружностей пучка удовлетворяют пер- первому из уравнений A), т. е. уравнению X— пр У — ftp /q\ Т~— ~~В~- (Z) Для собственного пучка это уравнение выражает собой прямую. Определение 2. Прямая B) называется линией центров соб- собственного пучка. Соглашение. Мы раз и навсегда условимся, что координаты х, у, z в пространстве согласованы с координатами х, у на рас- рассматриваемой нами плоскости в том смысле, что эта плоскость является координатной плоскостью Оху (и ее точка (х, у) имеет в пространстве координаты (х, у, 0)). В силу этого соглашения, линия центров собственного пучка является проекцией на плоскость Оху прямой A), изображающей в пространстве этот пучок. Для несобственного пучка линия центров вырождается в одну точку М0(а0, Ьо). Следовательно, все окружности несобственного пучка концен- тричны. Более того, ясно, что для несоб- несобственного пучка уравнение A) не наклады- накладывает никаких ограничений на третью коор- координату z — с. Это означает, что справедливо следующее Предложение 1. Каждый несобственный пучок состоит из всех окружностей, имею- имеющих данный центр М0(а0, Ьо) (или, по-дру- Несобственный пучок гОМу. U3 вСвХ ОКруЖНОСТвй, КОНЦвНТриЧв- ских данной). Определение 3. Общий центр Мо всех окружностей несоб- несобственного пучка называется его центром. Ясно, что пучок окружностей тогда и только тогда несобствен, когда он является пересечением двух несобственных связок с непа- 862
раллельньши фундаментальными прямыми (точка пересечения этих прямых и будет центром пучка). Чтобы получить пример собственного пучка, мы рассмотрим на Плоскости произвольную прямую Ах + By + С = 0 C) и произвольную окружность 20 = 2(а0, Ьо, со). Как мы знаем (см. п. 1), для любой окружности 2 = 2 (а, Ь, с) (не концен- концентричной с окружностью 2о) радикальной осью окружностей 2 и 2о является прямая (а -ао)х + (Ь- Ьо) у + {с — со) = 0. D) Поэтому радикальная ось окружностей 2 и 2о тогда и только тогда совпадает с данной прямой D), когда а — ао Ь — ftp с — Ср А ~ В ~ С * Это показывает, что множество, состоящее из окружности 2 (а0, Ьо, Со) и всех ок- окружностей, имеющих с этой окружностью данную радикальную ось C), является пучком с уравнением х — ав __ у — ftp 2 — с0 Л ~~ В ~ С ' Сравнивая это уравнение с уравнением A), мы немедленно получаем следующее Предложение 2. Каждый собственный пучок является множе- множеством всех окружностей, состоящим из некоторой окружности 2 (а0, Ьо, с0) и всех окружностей, имеющих с этой окружностью данную радикальную ось C). Отсюда вытекает Следствие. Три (неконцентрические) окружности 2ь 2г и 23 тогда и только тогда принадлежат одному пучку (изображаю- (изображающие их точки коллинеарны), когда они имеют общую радикаль- радикальную ось. Доказательство. Если окружности 2ь 2г и 2з принад- принадлежат пучку A), то радикальной осью каждой из них и окруж- окружности 2о является прямая C). Поэтому радикальная ось любых двух из этих окружностей совпадает с прямой C). Обратно, если окружности 2ь 22 л 2з имеют общую радикальную ось, то, приняв за прямую C) эту ось, а за окружность 2о — одну из данных окружностей (например, окружность 2i), мы, оче- очевидно, получим пучок, содержащий все три окружности. Определение 4. Прямая C) называется осью собственного пучка A). Она перпендикулярна его линии центров B). Точка пересечения оси и линии центров называется центром собствен- собственного пучка. Поскольку центр принадлежит оси пучка, его 363
степень относительно любой окружности пучка — одна и та же для всех окружностей. Эта степень р называется степенью пучка. На евклидово-проективной плоскости осью каждого несобственного пуч- пучка можно считать несобственную прямую. Степень несобственного пучка не определяется (при желании ее можно считать бесконечной). Ясно, что собственный пучок однозначно определен, если известны его ось, линия центров и степень. Все другие способы задания пучка легко сводятся к этому. Например, при задании пучка двумя (неконцентрическими) ок- окружностями линия центров определяется как прямая, проходя- проходящая через центры данных окружностей, ось — как радикальная ось этих окружностей, а степень — как степень точки пересече- пересечения линии центров и оси относительно любой из данных окруж- окружностей. Решив совместно уравнения B) и C) линии центров и оси пучка, мы получим, что центр пучка A) имеет координаты АС + В (АЬ0 — Ва0) _ ВС —А (АЬ0 — Ва0) ,-, хо~ А2 + Вг ' Уо— Аг + В2 # ( ' Подставив эти выражения в уравнение произвольной окружно- окружности пучка, мы, после тривиальных алгебраических преобразова- преобразований, получим, что степень пучка A) равна Задание. Проведите подробно все вычисления (помните, что не любая точка прямой A) изображает окружность; в частности, точка (ao.6o.co) может окружности не изображать). Замечание 1. В предположении, что точка (а0, Ьо, с0) изо- изображает некоторую окружность, формулу F) можно доказать и более геометрическим способом. Действительно, как мы знаем (п. 5 § 1 гл. 3), число » ,а (Аао + ВЬо+С\2 является квадратом расстояния точки (a0, Ьо) от прямой Ах -)-] + By + С = 0 (оси пучка). Но поскольку точка (<2о, &о) при- принадлежит линии центров, перпендикулярной оси пучка и пере- пересекающей эту ось в центре пучка, число d0 равно квадрату рас- расстояния центра пучка от точки (а0, Ьо), т. е. до центра окружно- окружности Е(а0, Ьо, Со). Остается заметить, что степень р центра пучка относительно окружности 2 (а0, Ьо, с0), по определению, равна .2 г>2 а0 — Но- Определение 5. Систему прямоугольных координат х, у мы будем называть канонической относительно рассматриваемого 364 - ,
(собственного) пучка окружностей, если ее осью абсцисс яв- является линия центров пучка, а осью ординат — ось пучка (и зна- значит, началом координат — центр пучка). Каноническая система координат характеризуется, таким об- образом, тем, что уравнение A), прямой, изображающей этот пу^ чок, имеет (в согласованной системе координат Oxyz) вид х — а0 у — 0 г — Со 1 ~ 0 — 0 * Формула F) в канонической системе координат приобретает вид р = - 2с0. Обозначая а0 через t, мы получаем, таким образом, следующее предложение, более или менее удовлетворительно описывающее все окружности собственного пучка: Предложение 3. В системе координат, канонической относи- относительно собственного пучка степени р, уравнение произвольной окружности этого пучка имеет вид где I — параметр, определяющий данную окружность. Центром этой окружности является точка (t, 0). Мы видим, в частности-, что с точностью до выбора системы координат существует только один пучок степени р. Наглядно это означает, что любые два пучка одной и той же степени, можно перевести друг в друга некоторым движением. Определение 6. Собственный пучок окружностей называется эллиптическим, | [ отрицательна: р = —е2, параболическим, \ если его степень р < равна нулю: р = 0, гиперболическим, ) ( положительна: р = е2. Поскольку радиус окружности G) равен, очевидно, + е2 , если пучок эллиптичен, 11, если пучок параболичен, — е2 , если пучок гиперболичен, справедливо следующее Предложение 4. Если собственный пучок а) эллиптичен, б) параболичен, в) гиперболичен, то центры его окружностей заполняют а) всю линию центров, б) всю линию центров, за исключением центра пучка, 365
в) всю линию центров, за исключением точек отрезка, кон- концами которого являются точки, удаленные от центра пучка на расстояние е = Yp ¦ Определение 7. При р > 0 точки, имеющие канонические координаты (—е, 0) и (е, 0), называются фундаментальными точками гиперболического пучка. Аналогично, при р < 0 точки, имеющие канонические координаты @, е) и @, —е),, назы- называются главными точками эллиптического пучка. Ясно, что - фундаментальные (главные) точки гиперболического (эллип- (эллиптического) пучка однозначно определяют этот пучок. При этом любые две точки являются фундаментальными (главными) точками некоторого (однозначно определенного) гиперболиче- гиперболического (эллиптического) пучка. Заметим еще, что любая окружность эллиптического пучка проходит через его главные точки и никакая окружность гиперболического пучка не проходит через его фундаментальные точки. Действительно, точки @, е) и @, —е) удовлетворяют при любом t уравнению х2+ у2 — 2л*-е2 = 0, а точки (—е, 0) и (е, 0) удовлетворяют уравнению только при t = ±е. В частности, мы видим, что справедливо следующее Предложение 5. Любые две окружности эллиптического пучка пересекаются (в его главных точках). Более того, ясно, что любая окружность 2, проходящая через главные точки эл- эллиптического пучка, принадлежит этому пучку. Действительно, пусть (а, Ь)—центр окружности 2. Так как главные точки симметричны относительно линии центров, то точка (а, Ь) принадлежит этой линии и, следовательно, является центром некото- некоторой окружности 2' пучка. Окружности 2 и 2' концентричны и имеют общие точки (обе главные точки пучка). Следователь- Следовательно, 2' = 2, так что окружность 2 при- принадлежит пучку. Мы сформулируем доказанное утвер- утверждение в виде следующей теоремы: Эллиптический пучок ТеОрвМй 1. Каждый ЭЛЛиПТичвСКий пучок состоит из всех окружностей, про- проходящих через две фиксиррванные (различные) точки (главные точки пучка). 366
Что касается гиперболических пучков, то для них справед- справедливо-следующее Предложение 6. Никакие две (различные) окружности ги- гиперболического пучка не имеют общих точек (не пересекаются). Доказательство. Чтобы найти общие точки двух окруж- окружностей у2- е2 = О, х2 + у2- 2xt2 + е2 == О У ' гиперболического пучка, надо совместно ре- решить эти два уравнения. Но, вычитая одно уравнение из другого, мы при t\ ф t2 не- немедленно получим, что х = 0, и следова- следовательно, что у2 + е2 = 0. do Гиперболический пучок Следовательно, уравнения (8) решений (вещественных) не имеют, и потому соответствующие окружности не пересекаются. Наконец, для параболических пучков имеет место Предложение 7. Каждая окружность параболического пучка проходит через его центр и касается в этой точке оси пучка, так что любые две окружности параболического пучка касаются (в его центре). Доказательство. В канонических координатах произ- произвольная окружность параболического пучка имеет уравнение вида х2 + у2 — 2xt = б, т. е. уравнение Следовательно, она проходит через точку @, 0) (центр пучка), а так как ее центр (t, 0) лежит на оси абсцисс, то ось ординат (ось пучка) является касательной в точ- точке @,0) к этой окружности. Задание. Докажите, что любая окружность, касающаяся в центре па- параболического пучка его оси, принадлежит пучку. Таким образом, имеет место следую- следующая теорема: Теорема 2. Каждый параболический пучок состоит из всех окружностей, про- проходящих через фиксированную точку (центр пучка) и касающихся в этой точке фиксированной прямой (оси пучка). Сопоставим теперь предложения 5, 6, принципом обращения. В результате мы теорему: Параболический пучок 7 и воспользуемся получим следующую 367
Теорема 3. Собственный пучок окружностей тогда и только тогда является а) эллиптическим пучком, б) параболическим пучком, в) гиперболическим пучком, когда его любые две окружности а) пересекаются, б) касаются, в) не имеют ни одной общей точки. Так как каждая точка линии центров эллиптического пучка является, согласно предложению 4, центром некоторой окружности пучка, то каждая точка прямой, изображающей эллиптический пучок, является изображением некоторой окружности пучка. Таким образом, прямая, изображающая эллиптический пучок, лежит во внешней области параболоида Q и, следовательно, не пересекает этот пара: ¦болоид. ~ Аналогично, каждая точка прямой, изображающей параболический пучок, за исключением одной точки (проектирующейся в центр пучка), является изображением некоторой окружности пучка. - Эта исключительная точка имеет координаты (а0, Ьо, с0), где (а0, Ьо)—координаты центра пучка. Так как р — 0 и Аай-\-Л ~{- Bb0 -f- С = 0, то из формулы F) следует, что Таким образом, точка (по, Ьо, с0) принадлежит параболоиду Q. Посколь- Поскольку все остальные точки прямой, изображающей параболический пучок, лежат во внешней области параболоида Q, это, по определению, означает, что пря- прямая, изображающая параболический пучок, касается параболоида Q (в точке (а0, Ьо, со)). Наконец, точка прямой, изображающей гиперболический пучок, тогда и только тогда является изображением некоторой окружности пучка, когда она проектируется в точку линии центров, не ле- лежащую на отрезке с концами в фундаментальных точках пучка. Другими словами, если Mi(au b\, с{) и М2(а2, Ь2, с2) —точки прямой х — аа у — Ьо г — со В изображающей гиперболический пучок, проектирующиеся в его фундаментальные точки, то точка этой прямой тогда и только тогда изображает окружность пучка, когда она не принадлежит отрезку MiM2. 568
Чтобы найти точки М{ и М2, мы воспользуемся тем, что рас- расстояние их проекций (фундаментальных точек пучка) до оси пучка равно ур , так что + ВЬХ + С 2 + в2 + с2 Аа2 + ВЬ2 У А2 + В2 + С2 = Р- Сравнивая эти формулы с формулой F) (и учитывая, что за точку (а0, Ьо, Со) в формуле F) можно принять любую точку изображающей прямой,— в частности, точку Му или точку М2), мы немедленно получаем, что а\ + Ь\ + 2с, = 0 и а\ + Ь\ + 2с2 = 0. Аналогично показывается, что для точек (а, Ь, с), являющихся внутренними точками отрезка М\М2, имеет место неравенство Таким образом, точки Mt и М2 принадлежат параболоиду Q, а внутрен- внутренние точки отрезка MiM2 принадлежат внутренней области этого параболоида. Это означает, что прямая, изображающая гиперболический пучок, пересекает параболоид Q в двух точках. Собирая вместе все доказанное (и используя принцип обра- обращения), мы получаем следующую теорему: Теорема 4. Собственный пучок окружностей тогда и только тогда является а) эллиптическим пучком, б) параболическим пучком, в) гиперболическим пучком, когда изображающая его прямая а) не пересекает параболоид Q, б) касается этого параболоида, в) пересекает его в двух точках. Что касается несобственных пучков, то, по определению, они изображаются прямыми, параллельными оси Oz. Задание. Докажите, что любая прямая, параллельная оси Ог, пересекает параболоид Q в одной точке, причем одна из соответствующих полупрямых лежит во внешней об- области параболоида Q, а другая — во внутренней. Замечание 2. Это вскрывает неожиданное сходство между гиперболическими и несобственными пучками: для обоих пучков изображающие их прямые имеют бесконечно много точек во внутренней области параболоида. На этом' основании иногда бывает удобно причислять несобственные пучки к гиперболиче- гиперболическим, ; .. 369
Замечание 3. При доказательстве теоремы 4 мы по ходу дела доказали также, что для любой прямой в пространстве, не параллельной оси Огу возможны следующие три взаимоисключающих друг друга случая: 1) прямая не пересекает параболоид Q (и в этом случае целиком лежит в его внешней области); 2) прямая касается параболоида Q (и в этом случае вся, за исключением точки касания, лежит в его внешней области); 3) прямая пересекает параболоид Q в двух точках Mi и М2 (и в этом случае отрезок МХМ2 прямой лежит во внутренней об- области параболоида, а все остальные ее точки — во внешней области). Задание. Дайте прямое доказательство этого утверждения. (Указа- (Указание: рассмотрите параметрические уравнения прямой и составьте уравнение для значений параметра, отвечающих точкам пересечения; ср. п. 2 § 1 гл. 3.) 4. Пучки как пересечения связок Любая прямая в пространстве является пересечением двух плоскостей и любые две (непараллельные) плоскости пересе- пересекаются по прямой. Следовательно, любой пучок окружностей является пересечением (общей частью) двух связок окружностей и любые две связки (имею- (имеющие хотя бы одну общую окружность) пересекаются по пучку. Отсюда и из теоремы 2 п. 2 немедленно вытекает Теорема 1. Если существуют окружности, 1) диаметрально пересекающие две данные (различные) окружности; 2) диаметрально пересекающие данную окружность и про- проходящие через данную точку; 3) диаметрально пересекающие данную окружность и орто- ортогональные другой данной окружности (отличной от первой); 4) диаметрально пересекающие данную окружность и имею- имеющие центры на данной прямой; 5) проходящие через две данные (различные) точки; 6) проходящие через данную точку и ортогональные данной окружности; 7) проходящие через данную точку и имеющие центры на данной прямой; 8) ортогональные двум данным (различным) окружностям* 9) ортогональные данной окружности и имеющие центры на данной прямой; 10) центры которых принадлежат одновременно двум дан- данным (различным) прямым, то эти окружности составляют пучок. При этом любой пучок может быть получен таким образом (вообще говоря, разными способами). 370
Задание. Покажите, что окружности, удовлетворяющие условию 4), 5), 7) или 9), существуют всегда; удовлетворяющие условию 1), 3) или 8),— тогда и только тогда, когда данные окружности не концентричны; удовлетворяющие условию 2) или 6), — тогда и только тогда, когда данная точка не является' центром Дан- Данной окружности; удовлетворяющие условию 10), — тогда и только тогда, когда данные прямые не параллельны. Из теоремы 5 п. 3 и теоремы 1 п. 2 немедленно вытекает следующее Предложение 1. Эллиптическая связка содержит только эл- эллиптические пучки. Параболическая связка содержит только эллиптические и параболические пучки. Гиперболическая связка содержит пучки всех трех типов (но только собственные). Не- Несобственная связка содержит как несобственные пучки, так и собственные пучки всех трех типов. Задание. Дайте прямое доказательство предложения 1, использующее только теорему 4 п. 3 и теорему 1 п. 2. Следствие. Пересечение двух связок, из которых одна — эл- эллиптическая, может быть только эллиптическим пучком. . Пересечение двух связок, из которых одна — параболиче- параболическая, может быть только эллиптическим или параболическим пучком. Пересечение двух связок, из которых одна — собственная, может быть только собственным пучком. Отсюда вытекает, что описанные в теореме 1 способы 1), 2), 3), 4) и 5) построения пучков приводят только к эллиптическим пучкам; способы 6) и 7) могут приводить как к эллиптическим, так и.к параболическим пучкам; способы 8) и 9) могут приводить к любым собственным пуч- пучкам; способ 10) приводит только к несобственным пучкам. Упражнение. Докажите, что способы 6) и 7) тогда и только тогда приводят к эллиптическим пучкам, когда данная точка не лежит на данной окружности (данной прямой); способы 8) и 9) тогда и только тогда приводят к а) эллиптическим пучкам, б) параболическим пучкам, в) гиперболическим пучкам, когда данные окружности (данные окружность и прямая) а) не пересекаются, б) касаются, в) пересекаются в двух точках. В частности, мы видим, что несобственный пучок может быть представлен лишь как пе- пересечение; несобственных связок (фундаментальные прямые ко- которых пересекаются в центре пучка) и, обратно, пересечение любых двух несобственных связок (с непараллельными фунда- фундаментальными прямыми) является несобственным пучком. 371
Обратим внимание на то, что пересечение двух {различных) параболических связок обя- обязательно является эллиптическим пучком. При этом любой эллиптический пучок единственным образом пред- представляется в виде пересечения двух параболических связок. Действительно, это является лишь другой формулировкой теоремы 1 п. 3. Аналогично, теорема 2 п. 3 означает, что любой параболический пучок однозначно представляется в виде пересечения некоторой параболической связки и множества всех окружностей, касающихся некоторой прямой. Подчеркнем, что последнее множество связкой не является. Чтобы представить параболический пучок в виде пересече- пересечения связок, достаточно заметить, что окружность 2 тогда и только тогда касается в точке Мо некоторой прямой %, когда она ортогонально пересекает произвольную окружность, проходя- проходящую через точку Мо и имеющую центр на прямой Я. Поэтому тео- теорему 2 п. 3 мы можем переформулировать в следующем виде: Теорема 2'. Любой параболический пучок состоит из всех окружностей, проходящих через фиксированную точку и ортого- ортогонально пересекающих в этой точке фиксированную окружность. Осью этого пучка является прямая, проходящая через данную точку и центр данной окружности. Эта теорема означает, что любой параболический пучок является пересечением {одно- {однозначно определенной) параболической связки и некоторой ги- гиперболической связки. Заметим, однако, что эта гиперболическая связка однозначно не определена. С другой стороны, произвольной она тоже быть не может: необходимо (и достаточно), чтобы ее фундаменталь- фундаментальная окружность проходила через центр пучка, а центр этой ок- окружности лежал на оси пучка. Чтобы достичь однозначного представления, мы. переформу- переформулируем теорему 2 п. 3 еще раз: Теорема 2". Любой параболический пучок состоит из всех окружностей, проходящих через фиксированную точку, центры которых лежат на фиксированной прямой {проходящей через эту точку). Осью пучка является прямая, проходящая через данную точку перпендикулярно данной прямой. Это означает, что любой параболический пучок однозначно представляется s виде пересечения параболической и несобственной связок. Теоремы 2' и 2" отвечают способам 6) и 7) построения пуч- пучков из теоремы 1. Формулировки теорем, отвечающих способам 8) и 9), мы оставляем читателю (эти теоремы мало интересны, поскольку они, подобно теореме 2', ле дают однозначного пред- представления). 372
Обратим внимание на то, что однозначность несобственной связки в представлении параболического пучка по способу 7) (теорема 2") является общим фактом, имеющим место для лю- любых собственных пучков, т. е. каждый собственный пучок содержится в единственной не- несобственной связке. Действительно, ось пучка должна быть фундаментальной прямой этой связки. (Другое доказательство: каждая прямая, не параллельная оси Oz, ^содержится в единственной плоскости, параллельной этой оси.) Для эллиптических пучков помимо теоремы 1 п. 3, отвечаю- отвечающей способу 5) построения пучков, возможны еще восемь (!) аналогичных теорем, отвечающих другим способам из теоремы 1. Доказательство их не совсем тривиально, поскольку необходимо показать, что каждым из этих способов можно получить все эллиптические пучки. Мы здесь ограничимся способом 1), т. е. докажем следующую теорему: Теорема 3. Каждый эллиптический^ пучок состоит из всех ок- окружностей, диаметрально пересекающих две фиксированные не- неконцентрические окружности Ei и 22. Осью пучка является прямая, соеди- соединяющая центры этих окружностей. Доказательство. Легко ви- видеть, что эта теорема непосредственно вытекает из следующего предложе- предложения: Предложение 2. Каждая точка оси эллиптического пучка, лежащая между его главными точками, является цент- центром единственной окружности, кото- которую диаметрально пересекает каждая окружность пучка. Никаких других окружностей, диаметрально пересекаемых всеми окружностями пучка, не существует. Действительно, если 2i и 2г — любые две из этих окружно- окружностей, то пучок, состоящий из всех окружностей, диаметрально пересекающих окружности Si h4S2, содержит данный эллипти- эллиптический пучок и потому с ним совпадает (ибо две прямые в про- пространстве, одна из которых содержится в другой, совпадают). Таким образом, нам осталось лишь доказать предложе- предложение 2. Запишем с этой целью наш пучок в канонических координа- координатах х, у. Тогда любая окружность этого пучка будет иметь уравнение вида x2 + y2-2xt-e2 = 0, A) а его главные точки будут иметь координаты @, —е) и @, е). 37а.
Условие того, что окружность A) диаметрально пересекает некоторую окружность 2(ао, Ьо, со), имеет (см. формулу A1) л. 2) вид Чтобы это равенство было выполнено для любых t, необходимо е2 и достаточно, чтобы а0 = 0 и а20 + ^ + с0 —— • Таким образом, мы доказали, что все окружности A) тогда и только тогда диаметрально пере- пересекают окружность 2(а0, Ьо, Со), когда Для завершения доказательства предложения 2 остается .заметить, что этим условиям и условию (необходимому для существования окружности 2 («о, Ьо, с0)) можно, очевидно, удовлетворить тогда и только тогда, когда — е < Ьа < е, причем каждому такому значению fc0 будет соответствовать одно вполне определенное значение с0, т. е. одна вполне опре- определенная окружность 2(а0, Ьо, с0). Гиперболические пучки могут получаться только способами 8) и 9). При этом легко видеть, что если пучок можно получить по способу 8), то его можно по- получить и по способу 9). Действительно, если прямая в пространстве является пере- пересечением двух плоскостей, не параллельных оси Oz, то она же является пересечением одной из этих плоскостей (безразлично, какой) и (однозначно определенной) плоскости, параллельной •оси Oz. Мы не будем ограничиваться гиперболическими пучками и исследуем представимость по способу 8) любых (собственных) лучков. Для этого нам понадобится следующее Предложение 3. Окружность, ортогональная двум окружно- окружностям S(flo, bo, Co) и 2(fli, bu Ci) некоторого пучка, ортогональна и любой окружности этого пучка. Доказательство. Вспомнив параметрические уравнения прямой в пространстве, проходящей через две точки (п. 1 § 3 гл. 3), мы немедленно получим, что координаты произвольной 374
окружности 2 (a, b, с) рассматриваемого пучка выражаются формулами (l t) + t c = (l —t)co + tcu где t — некоторое число. С другой стороны, окружности, ортогональные окружностям: 2(а0, Ьо, с0) и 2(аь Ьи с{), образуют (если они существуют) пучок с изображающей прямой аох + Ьоу + г + с0 = О, B> Для завершения доказательства остается заметить, что если точка (х, у, z) удовлетворяет уравнениям B), то для. любого t она удовлетворяет и уравнению (A - t) а0 + taj x + ((l-t)bo + tb1)y + z + ((l-t)co + /с,) = 0. Уравнения B) определяют пучок (а не пустое множество) тогда и только тогда, когда окружности Е (а0, Ьо, с0) и 2(аь Ь\, С\) не концентричны, т. е. когда данный пучок — соб- собственный. Тем самым доказано, что окружности, ортогональные всем окружностям произволь- произвольного собственного пучка, составляют пучок (также, очевидно^ собственный). Определение 1. Пучок окружностей, ортогональных всем окружностям данного собственного пучка, называется пучком, сопряженным этому пучку. Поскольку сопряженный пучок — собственный, определен пу- пучок, сопряженный сопряженному пучку. Ввиду симметричности отношения ортогональности окружностей (если окружность 2i ортогональна' окружности 22, то окружность 22 ортогональна окружности 2i), ясно, что этот пучок совпадает с исходным пуч- пучком. Другими словами, отношение сопряженности пучков симметрично. Замечание 1. Поскольку пучки окружностей изображаются прямыми в пространстве, отношение сопряженности пучков инду- индуцирует некоторое отношение сопряженности между прямыми в- пространстве. Это очень интересное отношение мы в дополне- дополнении к п. 3 § 2 гл. 6 рассмотрим с совершенно иных позиций. Предложение 4. а) Осью сопряженного пучка является линия центров дан- данного пучка. б) Линией центров сопряженного пучка является ось дан- данного пучка. в) Центр сопряженного пучка совпадает с центром данного пучка. 375.
г) Степень р' сопряженного пучка равна степени р данного пучка, взятой с обратным знаком: Р'=-Р- Доказательство. Введем на плоскости координаты х, у, канонические относительно данного пучка, и согласованные с ними координаты х, у, г в пространстве. Тогда для любых двух окружностей пучка их вторые координаты у будут равны нулю, а их третьи координаты будут одинаковы (и равны —¦—, где р — степень пучка), т. е. эти окружности будут иметь коорди- координаты (а0, О, — у| и (аи О, — -~\, где а0 Ф а{. Поэтому урав- уравнения B) сопряженного пучка будут иметь вид () Этим уравнениям удовлетворяет, в частности, точка Поскольку векторное произведение векторов «о («о, 0, 1) и rii(ai, О, 1) равно @, ах — а2, 0), за направляющий вектор пря- прямой C) мы можем принять вектор @, 1, 0). Следовательно, ка- каноническими уравнениями прямой C) будут уравнения х-0 _у-0 _Z~T 0 1 0 W Поэтому осью сопряженного пучка будет прямая 0х+1г/ + 0 = 0, т. е. ось абсцисс у = 0. Поскольку эта ось является, по опреде- определению, линией центров данного пучка, утверждение а) тем са- самым полностью доказано. Аналогично, линией центров сопряженного пучка будет пря- прямая х — 0 у — 0 ~0 1 ' т. е. ось ординат х = 0 (ось данного пучка). Тем самым дока- доказано и утверждение б). Утверждение в) непосредственно вытекает из утверждений а) и б), а для доказательства утверждения г) достаточно при- применить к пучку D) формулу F) п. 3, согласно которой Тем самым предложение 4 полностью доказано. 376
Следствие. Пучок, сопряженный эллиптическому | f гиперболическим | параболическому i пучку, является \ параболическим i пучком, гиперболическому ) [ эллиптическим J Теперь мы уже немедленно получаем теорему, утверждаю- утверждающую универсальность способа 8) построения пучков: Теорема 4. Любой собственный пучок состоит из всех ок- окружностей, ортогональных двум фиксированным неконцентриче- неконцентрическим окружностям Ei и Ег- Этот пучок а) эллиптический, б) параболический, в) гиперболический, тогда и только тогда, когда окружности Ei и 22 а) не пересекаются, б) касаются, в) пересекаются. Доказательство. В свете сказанного выше, первое ут- утверждение очевидно: достаточно за окружности Ei и Е2 при- принять любые две окружности сопряженного пучка. Второе ут- утверждение теперь непосредственно вытекает из теоремы 3 п. 3. Наиболее интересно, конечно, утверждение теоремы 4, отно- относящееся к гиперболическим пучкам (поскольку для других пуч- пучков мы обладаем более простыми способами их построения). 5. Прямые как окружности Многочисленные мало приятные оговорки в предыдущем пункте были вызваны существованием связок с пустым пересе- пересечением (т. е. существованием в пространстве параллелльных плоскостей). Естественно, что эти оговорки будут ненужными и вся теория пучков и связок окружностей приобретет большую стройность и законченность, если мы перейдем от евклидова 377
пространства к евклидово-проективному' (см. п. 3 § 2), в кото- котором любые две плоскости пересекаются по прямой (воз- (возможно, несобственной). Для этого мы в первую очередь должны, конечно, ответить на вопрос о том, что следует изображать по- посредством несобственных точек. Для ответа на" этот вопрос мы заметим, что самым общим образом уравнение произвольной окружности может быть запи- записано в следующем виде: М (х2 + у2) + Ах + By + С = 0, A) где М Ф 0. Радиус R этой окружности выражается формулой п2 _., Л2 + В2 - ЧСМ т так что, кроме условия М Ф О, должно быть выполнено также условие А2 + В2 — 2СМ > 0. C) Поскольку координаты (а, Ь, с) окружности A) выражаются ¦формулами А_ ,_ В_ С_ а~ 2М ' ° ~ 2М ' с 2М ' мы видим, что точка пространства с однородными координатами X: Y: Z :Т (связанными с координатами х, у, z формулами X У Z \ JK==f. У —у* Z—~Y) изображает окружность A) с А = X, ?=Y,C = Z и М=-±Т. Это показывает, что несобственным точкам пространства (для которых Т = 0) естественно сопоставить линии, выражаю- выражающиеся уравнением A) с М = 0, т. е. прямые. Таким образом, окружность х2 + У2 — 2ах — 2Ьу — 2с = 0 мы изображаем собственной точкой (a:b:c:l) евклидово-про- ¦ективного пространства, а прямую — его несобственной точкой (А : В : С : 0). Соглашение 1. Для упрощения формулировок (и только для этого!) целесообразно теперь несколько изменить нашу терми- терминологию и называть окружностями произвольные линии, выра- выражающиеся (в прямоугольных координатах х, у) уравнением вида A), коэффициенты которого подчинены только условию C) (заметим, что это условие обеспечивает отличие от нуля хотя бы одного из коэффициентов А, В и С, а при М = 0 —от- .378
личие от нуля хотя бы одного из коэффициентов А и В). МФО мы получаем, следовательно, настоящие окружности, а при М = 0 — прямые. Замечание /.Линия, имеющая уравнение вида A) в одно» системе прямоугольных координат, имеет, очевидно, уравнение такого же вида (и даже с тем же М) в любой другой системе прямоугольных координат. Это показывает, что наше определе- определение окружностей корректно (в рамках координатно-аксиомати- ческого построения евклидовой геометрии; с содержательной точки зрения корректность этого определения очевидна). При сделанном соглашении любая окружность A) будет изображаться в евклидово- проективном пространстве точкой {А: В: С: — 2М). Тем самым устанавливается биективное соответствие между всеми окружностями на (евклидовой) плоскости и точками (X : Y: Z : Т) евклидово-проективного пространства, для которых X2 + Y2 + 2ZT Ф 0. D> Замечание 2. Уравнение X2+Y2 + 2ZT = 0 E) получается из уравнения X Y Z заменами x = -j, y = y, z = y (и умножением на Г2). При- этом уравнению E) удовлетворяет, кроме собственных точек,, только одна несобственная точка @ : 0 : 1 : 0), т. е. несобственная точка Zoo оси Oz. На этом основании естественно считать (по- определению!), что в евклидово-проективном пространстве па- параболоид Q содержит, кроме собственных точек, еще только- одну несобственную точку Z^. В соответствии с этим соглаше- соглашением несобственную плоскость как плоскость, имеющую с пара- параболоидом Q только одну общую точку, естественно считать плоскостью, касающейся параболоида Q в точке Zx. Но мы знаем, что если собственная плоскость касается параболоида, та все ее точки, отличные от точки касания, лежат во внешней обла- области параболоида. Поэтому все несобственные точки, отличные от точки Zoo, также естественно считать лежащими в этой области. Приняв все эти соглашения, мы можем, таким образом, ска- сказать, что окружности на евклидовой плоскости находятся в биектив- биективном соответствии с точками евклидово-проективного простран- пространства, принадлежащими внешней области параболоида Q. 37»
Замечание 3. Формула B) показывает, что при М-+0 (и А, В, С постоянных) радиус R стремится к оо. На этом основа- основании иногда говорят, что «прямые являются окружностями бес- бесконечного радиуса». При фиксированных Л, В, С и любом М Ф 0 центр А В 2М ' 2/И окружности A) принадлежит прямой Вх — Ау = 0, * F) перпендикулярной прямой Лж + Вг/+ С = 0. В евклидово-проективной плоскости эти центры имеют однородные коор- координаты (А: В:—2М), а несобственная точка прямой F)—координаты (А : В : 0). Это показывает, что в евклидово-проективной плоскости можно считать, что каждая (соб- (собственная) прямая обладает «центром», являющимся общей несобственной точкой всех прямых, ей перпендикулярных. Замечание 4. Поскольку несобственная прямая изображает- изображается точкой Zoo, принадлежащей параболоиду Q, считать ее «ок- «окружностью» нецелесообразно. Например, никакого «центра» ей приписать разумным образом нельзя. Замечание 5. Введение в рассмотрение евклидово-проективной плоскости позволяет также пролить новый свет на соглашение 1. Действительно, в однородных евклидовых координатах X : Y: Z (связан- X Y \ ных с координатами х, у соотношениями л: = -=-, у — —\ уравнение A) Z Z / имеет вид М (X2 + Y2) + AXZ + BYZ + CZ2 = 0, и при М = 0 распадается на уравнение собственной прямой АХ + BY + CZ = 0 и уравнение несобственной прямой Z = 0. Следовательно, на самом деле окружностью, получающейся при М = 0, мы должны считать не прямую, а пару, состоящую из этой прямой. и несоб- несобственной прямой. Обобщив понятие окружности, мы должны теперь соответ- соответствующим образом пополнить связки и пучки окружностей, при- присоединив к ним окружности (т. е. прямые), изображающиеся несобственными точками. Так, например, к собственному пучку х — а0 у — ftp г — с0 А ~~ В С мы должны теперь присоединить прямую, изображающуюся со- соответствующей несобственной точкой. Эта несобственная точка' 380
имеет по определению (см. п. 3 § 2) -однородные координаты (А : В : С: 0) и потому изображает прямую т. е. ось пучка. Таким образом, ось собственного пучка окружностей является единственной принадлежащей ему прямой. Несобственные пучки (состоящие из окружностей, имеющих данный центр) никаких прямых не содержат. Даже на евклидово-проективной плоскости к несобственному пучку ни- ничего не добавляется: единственного кандидата — несобственную прямую —• мы окружностью условились не считать. Аналогично, к связке, изображающейся плоскостью Ах + By + Cz + D = 0, мы должны присоединить прямые, изображающиеся несобствен- несобственными точками этой плоскости, т. е. точками (X:Y:Z:0), для которых АХ + BY + CZ = 0. G) Пусть сначала С =0, т. е. расматриваемая связка — несоб- несобственная (состоит из всех окружностей, центры которых при- принадлежат прямой Ах -f- By -f- D = 0). В этом случае условию G) удовлетворяют точки вида (—В :A :Z:0), где Z произвольно (и только такие точки). Эти точки изображают прямые — Вх + А у + Z = 0, перпендикулярные прямой Ах + By + D = 0 (и только такие прямые). Следовательно, прямыми, принадлежащими несобственной связке, являются прямые, перпендикулярные ее фундаментальной прямой (и только такие прямые). Пусть теперь С ф 0 (связка собственная). Так как центр связки имеет координаты _ А , _ В а0 — -?-, о0 —?-, то любая прямая, проходящая через этот центр, имеет ура;вне- ние вида т. е. вида 381
где X и У — произвольные параметры (одновременно не рав- равные нулю). Поэтому эта прямая изображается точкой удовлетворяющей уравнению G). Обратно, любая точка (X:Y:Z:0), удовлетворяющая урав- уравнению G), имеет вид (8) и потому изображает прямую, прохо- проходящую через центр связки. Следовательно, прямыми, принадлежащими собственной связке, являются прямые, проходящие через ее центр, и только эти прямые. В евклидово-проективной плоскости это утверждение верно и для не- несобственных связок, поскольку, как мы знаем, центром несобственной связки является несобственная точка прямых, перпендикулярных прямой, на которой расположены центры окружностей связки. Поскольку в евклидово-проективном пространстве совершен- совершенно неестественно ограничиваться лишь его собственными пря- прямыми и плоскостями, мы теперь не можем ограничиваться пуч- пучками и связками, ими изображаемыми. Чтобы быть последова- последовательными, мы должны ввести в рассмотрение пучки окружно- окружностей (являющихся на самом деле прямыми), изображающиеся несобственными прямыми, и связку, изображающуюся несоб- несобственной плоскостью. Что касается последней, то ясно, что связка окружностей, изображающаяся несобственной плос- плоскостью, является не чем иным, как множеством всех (собствен- (собственных) прямых плоскости. На евклидово-проективной плоскости эту связку можно описать как связ- связку окружностей, центры которых принадлежат несобственной прямой. На этом основании связку всех прямых следует считать несобствен- несобственной связкой, фундаментальной прямой которой является несобственная прямая. С другой стороны, поскольку эта связка изображается несобственной плоскостью, касающейся параболоида Q, ее следует считать также и пара- параболической связкой (ср. теорему 1 п. 2). Рассмотрим теперь пучки, изображающиеся несобственными прямыми. Каждая несобственная прямая в пространстве является не- несобственной прямой некоторой плоскости Поэтому пучок, изображающийся этой прямой, состоит из всех прямых, .содержащихся в связке, изображающейся этой плос- плоскостью. Следовательно, если эта связка — собственная, то рас- рассматриваемый пучок состоит из всех прямых, проходящих через центр связки, а если эта связка — несобственная, то пучок со- 382
стоит из всех прямых, перпендикулярных прямой, на которой расположены центры окружностей связки. Таким образом, "мы видим, что пучки окружностей, изображающиеся несобственными пря- прямыми, являются не чем иным, как пучками прямых в смысле ilI § 1. При этом собственные пучки прямых принадлежат собствен- собственным связкам окружностей, а несобственные пучки — несобствен- несобственным связкам. Задание. Докажите, что собственные пучки прямых изображаются несобственными прямыми, не проходящими через несобственную точку 1„ оси Oz, а несобственные пучки прямых — несобственными прямыми, проходящими через эту точку. Посмотрим теперь, что происходит с полученными в преды- предыдущих пунктах результатами при нашем новом понимании пуч- пучков и связок окружностей. В первую очередь нам надо распространить термины «орто- «ортогональные окружности» и «диаметрально пересекающиеся окружности» на случай, когда эти окружности являются пря- прямыми. Определение 1. Говорят, что прямая и окружность (настоя- (настоящая) ортогональны, если прямая проходит через центр окруж- окружности. В этом случае мы будем также говорить, что прямая диаметрально пересекает окружность. Две прямые мы будем называть ортогональными, если они перпендикулярны. На евклидово-проективной плоскости возможна единая формулировка: прямая (собственная) и произвольная окружность (конечного или «беско- «бесконечного» радиуса) ортогональны, если прямая проходит через центр окруж- окружности. Заметим, что отношение «окружность (или прямая) диамет- диаметрально пересекает прямую» мы не определяем. В связи с этим мы принимаем следующее Соглашение 2. В высказывании «окружность Si диаметраль- диаметрально пересекает окружность 22» всегда будет неявно предпола- предполагаться, что окружность 2г является настоящей окружностью (тогда как окружность 2j может быть и прямой). Предложение 1. Множество всех окружностей 2, ортого- ортогональных данной окружности 20, является связкой окружностей. Это предложение аналогично предложению 4 п. 2. Однако даже в случае, когда Но является настоящей окружностью, оно утверждает нечто иное, поскольку теперь окружность 21 может быть и прямой. Поэтому оно и в этом случае нуждается в дока- доказательстве. Доказательство. Пусть Ео — настоящая окружность. В этом случае следует только проверить, что к собственной связ- связке настоящих окружностей, получающейся в силу предложения 383
4 п. 2, присоединяется точно" то, что нужно, т. е. пучок прямых с центром в центре связки. Но это ясно, поскольку согласно предложению 6 п. 2 центром этой связки является центр окруж- окружности 2о, а согласно определению 1 прямая тогда и только тогда ортогональна окружности 20, когда она проходит через ее центр. Следовательно, предложение 1 в этом случае справедливо. Пусть окружность 20 является прямой к. Тогда множество всех окружностей, ортогональных окружности 20, является (предложение 1 п. 2) несобственной связкой (с фундаменталь- фундаментальной прямой А), пополненной (определение 1) всеми прямыми, перпендикулярными прямой к. Следовательно, предложение 1 справедливо и в этом случае. Таким образом, мы видим, что предложение 1 объединяет в единой формулировке два ранее никак не связанных пред- предложения: предложение 1 п. 2 и предложение 4 п. 2. Кроме того, поскольку в зависимости от вида окружности So получается либо гиперболическая, либо несобственная связка, мы видим, что несобственные связки целесообразно причислять к гиперболическим связкам. В силу этого соглашения каждая гиперболическая связка будет обладать фундаментальной окруж- окружностью (которая может оказаться и прямой). Предложение 2. Множество всех окружностей, диаметрально пересекающих данную окружность 20, является связкой окруж- окружностей. Доказательство. В соответствии с соглашением 2 окружность 2о может быть только настоящей окружностью. Но тогда множество всех окружностей, ее диаметрально пересекаю- пересекающих, является (предложение 5 п. 2) собственной связкой настоя- настоящих окружностей, пополненной (определение 1) пучком^ прямых с центром в центре окружности 2о> являющемся (предложение 6 п. 2) центром связки. Предложение 3. Совокупность всех окружностей, проходя- проходящих через данную точку, является связкой окружностей. Доказательство. Достаточно заметить, что эта совокуп- совокупность, кроме пучка прямых с центром в данной точке, содержит еще только настоящие окружности, составляющие (предложе- (предложения 5 и 6 п. 2) связку с центром в этой точке. Обратим внимание на то, что предложения 1, 2 и 3 описы- описывают все возможные связки,за исключением несобственной связки всех прямых, (которую мы условились считать параболи- параболической связкой). Рассмотрим теперь пучки окружностей. Следующая теорема (являющаяся аналогом теоремы ,1 п. 4) теперь очевидна. Теорема 1. Множество всех окружностей, а) диаметрально пересекающих две данные (различные) окружности; 384
б) диаметрально пересекающих данную окружность и про- проходящих через данную точку; в) диаметрально пересекающих данную окружность и орто- ортогональных другой данной окружности (возможно, совпадающей с первой); г) проходящих через две данные (различные) точки; д) проходящих через данную точку и ортогональных данной окружности; е) ортогональных двум данным (различным) окружностям, яв- является пучком окружностей. Любой пучок окружностей может быть получен хотя бы од- одним из этих способов. Способ а) дает эллиптический пучок окружностей (вместе с его осью). Способ б) дает эллиптический пучок окружностей, когда дан- данная точка не является центром данной окружности (в силу со- соглашения 2 являющейся настоящей окружностью), и собствен- собственный пучок прямых в противном случае. На этом основании собственные пучки прямых естественно причислять к эллип- эллиптическим пучкам (что согласуется также с теоремой 4 п. 3). Способ в) (объединяющий способы 3) и 4) теоремы 1 п. 4) дает эллиптический пучок окружностей, если данные окруж- окружности различны (причем вторая окружность может при этом быть прямой), и собственный пучок прямых, если эти окружно- окружности совпадают. Способ г) дает эллиптический пучок окружностей. Способ д) (объединяющий способы 6) и 7) теоремы 1 п. 4) дает параболический пучок окружностей (конечно, вместе с осью), когда данная окружность (могущая .быть и прямой) со- содержит данную точку, эллиптический пучок, когда данная точка не лежит на данной окружности и не является ее центром, и собственный пучок прямых, когда данная окружность является настоящей окружностью, а данная точка совпадает с ее центром. Способ е) (объединяющий способы 8), 9) и 10) теоремы 1 п. 4) в случае, когда не более одной из данных окружностей является прямой, дает эллиптический пучок окружностей (или собственный пучок прямых), если данные окружности не пере- пересекаются, параболический пучок, если они касаются, и гипер- гиперболический пучок, если данные окружности пересекаются. Если же обе данные окружности являются прямыми, то в случае, когда они пересекаются, получается несобственный пучок окруж- окружностей (который мы условились причислять к гиперболическим пучкам; см. замечание 2 п. 4), а в случае, когда они парал- параллельны (но не совпадают), — несобственный пучок прямых. При этом (см. п. 4) каждым из способов а) — е) можно получить любой эллип* тический пучок окружностей (в частности, любой собственный пучок прямых), 13 Ms М. Постников 383
каждым из способов д) или е) можно получить любой пара- параболический пучок окружностей. способом е) можно получить любой гиперболический пучок окружностей (в частности, любой несобственный пучок окруж- окружностей; см. замечание 2 п. 4), а также любой несобственный пучок прямых. Интересено отметить, что предложение 3 п. 4 сохраняется и при теперешнем обобщенном понимании окружностей, т. е. имеет место следующее Предложение 4. Любая окружность 2, ортогональная двум окружностям Si и 1,2 некоторого пучка, ортогональна и любой окружности этого пучка. Задание. Докажите предложение 4 (не забудьте рассмотреть все четыре случая: когда данный пучок является собственным пучком окружностей, когда он является несобственным пучком окружностей, когда он является собственным пучком прямых и, наконец, когда он является несобственным пучком прямых; кроме того, в первом случае следует отдельно рассмотреть возможности, не покрываемые предложением 1 п. 4, т. е. ситуации, когда либо окружность 2 является прямой, либо прямой (и, следовательно, осью данного пучка) является одна из окружностей St и 2г. Согласно предложению 4 определение сопряженного пучка (определение 1 п. 4) имеет теперь смысл для любых пучков. При этом пучком, сопряженным несобственному пучку окружностей, является собственный пучок прямых с тем же центром, пучком, сопряженным собственному пучку прямых, является несобственный пучок окружностей (имеющий тот оке центр). пучком, сопряженным несобственному пучку прямых, являет- является несобственный пучок прямых, состоящий из прямых, перпен- перпендикулярных прямым пучка. Мы видим, в частности, что всегда центры сопряженных пучков совпадают. Чтобы эта формулировка охватывала и несобственные пучки прямых, мы, естественно, должны перейти в евклидово-проективную плоскость. Выше мы условились собственный пучок прямых считать эллиптическим пучком, а несобственный пучок окружностей — гиперболическим пучком. Мы видим, следовательно, что для этих пучков остается справедливым следствие из предложения 4 п. 4. Чтобы это следствие осталось справедливым и для несоб- несобственных пучков прямых, нужно, очевидно, считать эти пучки параболическими (что, кстати, согласуется и с теоремой 4 п. 3). 6. Окружности на вещественно-комплексной плоскости Полную законченность и изящество геометрия окружностей приобретает только на евклидовой вещественно-комплексной плоскости (точнее, чтобы специально не оговаривать несоб- 386
ственные пучки и связки — на евклидово-проективной веществен- вещественно-комплексной плоскости). В свете сказанного в п. 5 мы принимаем Определение 1. Окружностью (вещественной) на евклидовой вещественно-комплексной плоскости называется множество то- точек, координаты х, у которых в некоторой евклидовой коорди- координатной системе удовлетворяют уравнению вида М(х2 + у2) + Ах + Ву + С^0, (I) где М, А, В, С — произвольные вещественные числа, причем хотя бы одно из чисел М, А, В не равно нулю (ясно, что это определение корректно, т. е. при переходе к другим евклидовым координатам х', у' мы снова получаем уравнение вида A), хотя, конечно, с другими коэффициентами). Окружность A) мы будем изображать точкой (А : В : С : —2М) расширенного (евклидово-проективного) пространства (таким образом, пространство у нас по-прежнему остается вещест- вещественным). Тем самым мы, очевидно, получим биективное соот- соответствие между окружностями на вещественно-комплексной пло- плоскости и всеми точками расширенного пространства, отлич- отличными от точки Zoo @ : 0 : 1 : 0). При М = 0 окружность A) является прямой Ах + By: + С = 0 и изображается несобственной точкой (А:В:С:0). При М -ф 0 окружность A) называется настоящей окружностью и имеет уравнение х2 + у2- lax — 2Ъу - 2с = 0, B) где А_ ,_ В_ С_ й ~~ 2АГ ' ° ~ 2М ' 2М ' Такая окружность изображается собственной точкой с неодно- неоднородными (обычными) координатами (а, Ь, с). Проекция этой точки на плоскость Оху, т. е. точка (а, Ь), называется центром окружности B). Уравнение B) может быть переписано в виде (x-aJ + (y-b? = R\ C) где /?2 = а2 + Ъ2 + 2с. При R2 > 0 мы будем называть окружность C) действи- действительной х) окружностью или окружностью вещественного ра- радиуса R. В пересечении с вещественной плоскостью она дает обычную окружность с центром (а, Ь) и радиусом R. Действительные окружности изображаются теми же точками, что и со- соответствующие обычные окружности, т. е. точками внешней области пара- параболоида Q. ') Обратим внимание на различие между понятиями «действительная окружность» и «вещественная окружность». 13* 3S7
При R ¦= О мы будем окружность C) называть окружностью нулевого радиуса. Она проходит через ее центр (а, Ь) (который является ее единственной вещественной точкой) и состоит из двух комплексно-сопряженных прямых х + iy = a -f- ib, х — iy = a — ib. Окружности нулевого радиуса изображаются, очевидно, точками, принад- принадлежащими параболоиду Q. Определение 2. Прямые (собственные), имеющие уравнения вида x±iy + C = 0, называются изотропными. Таким образом, окружность нулевого радиуса является парой комплексно- сопряженных изотропных прямых, проходящих через ее центр. При R2 <С 0 окружность C) называется окружностью мни- мнимого радиуса iR (или просто мнимой окружностью). Каждая такая окружность изображается точками внутренней области параболоида Q. Никаких вещественных точек окружность мнимого радиуса вообще не имеет (является нулевой линией). На евклидово-проективной вещественно-комплексной плоскости мы не- несобственную прямую теперь будем считать окружностью (поскольку причины, по которым мы ее раньше не считали окружностью, теперь отпали). Изо- Изображается эта окружность точкой Z». Замечание 1. Однако, несмотря на то, что точка 2^ принадлежит пара- параболоиду Q, мы не будем причислять несобственную прямую к окружностям нулевого радиуса. Считать ее, подобно собственным прямым, «окружностью бесконечного радиуса» также нет оснований. Поэтому никакого «радиуса» (так же как и никакого «центра») мы этой окружности не приписываем. Степень стМо произвольной точки Мо относительно (настоя- (настоящей) окружности C) определяется так же, как в вещественном случае, т. е. формулой C) п. 1. По-прежнему, точка Мо тогда и только тогда принадлежит окружности C), когда ее степень ст Мо равна нулю. Степень любой вещественной точки относительно окружности, мнимого радиуса всегда положительна, так что каждая точка вещественной плоскости «лежит вне» произвольной такой окруж- окружности. Для окружности нулевого радиуса степень ст Мо равна квад- квадрату расстояния от точки Мо до центра этой окружности. Предложение 1 п. 1, дающее геометрическую интерпретацию степени, конечно, теперь смысла не имеет, хотя его аналог для модуля |ст-М0| степени остается справедливым. Упражнение. Сформулируйте и докажите аналог предложения 1 п. 1 для модуля степени (не забудьте, что длина вектора в комплексной плоскости может быть равна нулю, даже если сам вектор не равен нулю). 388
Замечание 2. Обратим внимание на то, что степень точки относительно окружности «бесконечного радиуса» (т. е. относи- относительно прямой) мы не определяем. Радикальная ось двух (неконцентрических) настоящих окружностей определяется точно так же, как в вещественном случае, и она по-прежнему является прямой с уравнением F) п. 1. Задание. Покажите, что радикальной осью двух окружностей нулевого радиуса является медиат- риса 1) их центров. Чтобы идти дальше, мы должны предварительно обсудить вопрос о точках пересечения двух различных (настоящих) окружностей х2 + у2 -2alx-2b1y-2cl = 0, х2 + у2- 2а2х — 2Ъ2у - 2с2 = 0. { ' По определению, чтобы найти эти точки, надо решить сис- систему D) двух уравнений с двумя неизвестными. Вычтя первое уравнение из второго (и разделив получающееся уравнение на —2), мы получим, что эта система равносильна следующей сис- системе: xl + y2-2aix-2bly-2cl = 0, E) Мы видим, что при (аи Ь\) = (а2, Ъ2) система E) решений не имеет (ибо, по условию, (аи Ь\, С\)ф{а2, Ь2, с2)). Следова- Следовательно, концентрические окружности не пересекаются и в евклидо- евклидовой вещественно-комплексной плоскости. В однородных координатах X : Y : 1 уравнения E) имеют вид X' + Y2- 2atXZ - 2blYZ ~ 2ClZ2 = 0, (а2 ~а,)Х + (b2 -bl)Y + (c2 -Cl)Z = 0 и при (ai, bi) = (a2, b2) сводятся к уравнениям имеющим два решения (i: 1 : 0) и (—I: 1:0). Следовательно, в евклидово-проективной вещественно-комплексной плоскости любые две концентрические окружности пересекаются в двух несобственных комплексно- сопряженных точках A: 1 : 0) и (—i: 1 : 0). Определение 3. Точки ((: 1 : 0) и (—i: 1 : 0) называются циклическими точками. 4) Медиатрисой двух точек Mi и Мг называется прямая, проходящая через середину отрезка AfiM2 перпендикулярно прямой М\М2. Она является множеством всех точек, расстояния которых от точек Mi и Мг одинаковы. 389
Заметим, что если точки имеют координаты (±«: 1 :0) в одной одно- однородной евклидовой координатной системе, то они имеют те же координаты и в любой другой однородной евклидовой координатной системе. Поэтому циклические точки определены корректно. Задание. Покажите, что прямая тогда и только тогда изотропна, когда она проходит через цик- циклическую точку. Для неконцентрических окружностей мы можем из второго уравнения E) выразить одно неизвестное через другое и, под- подставив это выражение в первое уравнение, получить для второго неизвестного квадратное уравнение с вещественными коэффи- коэффициентами. Случай 1. Это квадратное уравнение имеет два различных вещественных корня. В этом случае данные окружности имеют две различные ве- вещественные точки пересечения. Ясно, что это возможно только тогда, когда сами окружности действительны, и эти точки будут точками пересечения обыкновенных окружностей, высекаемых данными окружностями на вещественной плоскости. С л у ч а й 2. Квадратное уравнение имеет два различных ком- комплексно-сопряженных корня. В этом случае данные окружности имеют две различные комплексно-сопряженные точки пересечения. Сами же окружно- окружности могут быть при этом любыми (с вещественным, нулевым или мнимым радиусом). Если они действительны, то высекаемые ими на вещественной плоскости обыкновенные окружности не пересекаются. Случай 3. Квадратное уравнение имеет один двойной (ве- (вещественный) корень. В этом случае данные окружности имеют одну точку пере- пересечения, являющуюся вещественной. Принято говорить, что ок-. ружности касаются друг друга в этой точке, а их точку пе- пересечения принято называть точкой касания. Ни одна из ка- касающихся окружностей не может быть мнимой. Касающиеся действительные окружности высекают на вещественной плоско- плоскости обыкновенные окружности, касающиеся друг друга в эле- элементарно-геометрическом («школьном») смысле. Действительная окружность касается окружности нулевого радиуса с центром в точке Мо тогда и только тогда, когда она проходит через точку Мо (являющуюся в этом случае точкой касания). Таким образом, две настоящие неконцентрические окружности на евклидовой вещественно-комплексной плоскости имеют либо две различные точки пересечения (вещественные или комплексно-сопряжен- комплексно-сопряженные), либо одну общую точку (точку касания). Ясно, что на евклидово-проективной плоскости любая ^настоящая) окружность проходит через циклические точки (i: 1 :0) и (—i: 1:0). 390
Поэтому на этой плоскости к указанным выше точкам пересечения двух •окружностей добавляются еще две циклические точки. Замечание 3. Таким образом, на евклидово-проективной вещественно- комплексной плоскости две (неконцентрические) окружности имеют, вообще говоря, четыре точки пересечения: две собственные и две несобственные (циклические). Исключением является случай касающихся окружностей, ког- когда имеется только одна общая собственная точка (точка касания). Чтобы этот случай (по крайней мере, «лингвистически») не представлял исключе- исключения, удобно считать точку касания кратной (а именно, двойной) точкой пе- пересечения и считать ее дважды. Тогда и в случае касающихся окружностей будет четыре точки пересечения. Другое исключение представляет собой случай концентрических окруж- окружностей, когда имеются только две (циклические) точки пересечения. Чтобы сохранить и в этом случае общий закон, приходится, по определению, счи- считать эти точки двойными точками пересечения (т. е. считать, что концентри- концентрические окружности касаются друг друга в циклических точках1)). Приняв эти соглашения, мы, следовательно, можем сказать, что на евклидово-проективной вещественно-комплексной плоскости любые две различные (настоящие) окружности имеют ровно четыре точки пересе- пересечения. Это утверждение является частным случаем теоремы Без у, которую мы докажем в п. 4 § 2 гл. 6. Возвращаясь к радикальным осям, заметим, что второе из уравнений E) является как раз уравнением радикальной оси данных окружностей. Следовательно, радикальная ось двух окружностей проходит через их точки пересечения. В случае, когда точки пересечения различны, это полностью характеризует радикальную ось (ср. предложение 2 п. 1). Пусть точки пересечения совпадают (окружности касаются). Тогда радикальная ось будет иметь с каждой из окружностей только одну общую точку. Условившись называть ¦ (ср. конец п. 2 § 1 гл. 1) прямую, имеющую с (настоящей) окружностью только одну общую точку, касательной к этой окружности в этой точке (точке касания), мы можем, следовательно, сказать, что радикальной осью двух касающихся окружностей является их общая касательная. Таким образом, предложение 2 п. 1 сохраняется и в веще- вещественно-комплексной плоскости (только без оговорки, что ок- окружности пересекаются). Радикальный центр трех (настоящих) окружностей на веще- вещественно-комплексной плоскости определяется дословно так же, как в вещественном случае (определение 3 п. 1). Все его свой- свойства также полностью сохраняются. ') Таким образом, концентрические (и только концентрические) окруж- окружности касаются друг друга в двух точках! 391
Определение (вещественных, т. е. определяемых уравнения- уравнениями с вещественными коэффициентами) пучков и связок окруж- окружностей также остается прежним. Все их свойства сохраняются. Однако теперь каждая параболическая связка содержит, кроме действи- действительных окружностей (и прямых), одну окруркность нулевого радиуса (с центром в центре связки). На евклидово-проективной плоскости несобственная связка всех прямых (которую мы условились считать параболической) пополняется теперь несоб- несобственной прямой. Аналогично, каждая гиперболическая (собственная) связка содержит, кроме действительных окружностей (и прямых), бесконечно много окружностей нулевого радиуса (с центрами в точках фун- фундаментальной окружности) и бесконечно много окружностей мнимого радиуса (с центрами, лежащими внутри фундамен- фундаментальной окружности). Это верно и для несобственной связки окружностей (кото- (которую мы условились считать гиперболической) с тем лишь отли- отличием, что центры всех ее окружностей принадлежат фундамен- фундаментальной прямой. Что же касается эллиптических связок, то на евклидовой (или евклидово-проективной) вещественно- комплексной плоскости каждая эллиптическая связка содержит только действительные окружности. Задание. Докажите эти утверждения. Таким образом, для любой собственной связки окружностей на евклидовой вещественно-комплексной плоскости каждая вещественная точ- точка плоскости является центром (единственной) окружности связки. Определение 4. Две (настоящие) окружности S(ab bu c{) и 2(a2, Ь2, с2) на вещественно-комплексной плоскости назы- называются сопряженными, если а) они концентричньг: (аь Ь{) = (а2, Ь2), б) выполнено равенство аха2 + Ьф2 + С] + с2 = 0. Окружность, сопряженная главной окружности эллиптической связки, называется фундаментальной окружностью этой связки, а окружность, сопряженная фундаментальной окружности ги- гиперболической связки, называется главной окружностью связки. Для параболической связки, по определению, главная окруж-, ность совпадает с фундаментальной и является окружностью нулевого радиуса с центром в центре связки. 392
Задание. Покажите, что окружность, сопряженная с окружностью а) вещественного радиуса, б) нулевого радиуса, в) мнимого радиуса, является, соответственно, окружностьк а) мнимого радиуса, б) нулевого радиуса, в) вещественного радиуса. Согласно определению 3 каждая собственная связка окружностей на евклидовой ве- вещественно-комплексной плоскости обладает и фундаментальной и главной окружностью. Для непараболических связок одна из этих окружностей имеет вещественный радиус, а другая — мнимый. Упражнение. Покажите, что окружность 2 тогда и только тогда ортогональна окружности Si, когда она диаметрально пересекает сопряженную окружность 2г- Покажите также, что окружность тогда и только тогда ортогональна некоторой окружности нулевого радиуса, когда она проходит через центр этой окружности. Сопоставляя эти утверждения с теоремой 2 п. 2, мы немед- немедленно получаем следующую теорему: Теорема 1. Произвольная собственная связка окружностей на евклидовой вещественно-комплексной плоскости состоит из всех окружностей, ортогональных фиксированной окружности {фун- {фундаментальной окружности связки), а также из всех окружно- окружностей, диаметрально пересекающих фиксированную окружность (главную окружность связки). Аналогично унифицируется теперь и теория, пучков. Мы не будем этого делать во всех деталях и ограничимся следующей теоремой: Теорема 2. На евклидовой вещественно-комплексной плоско- плоскости любая точка линии центров каждого собственного пучка окружностей является центром единственной настоящей окруж- окружности пучка. Каждый собственный непараболический пучок окружностей состоит из всех окружностей, проходящих через две различные точки (вещественные, если пучок эллиптический, и комплексно- сопряженные, если пучок гиперболический). Задание. Докажите теорему 2. Таким образом, если мы назовем главными точками пучка точки, через которые проходят все окружности пучка (ср. опре- определение 7 п. 3), то мы получим, что собственный пучок окружностей на евклидовой веществен- вещественно-комплексной плоскости тогда и только тогда является а) эллиптическим пучком, б) параболическим пучком, в) гиперболическим пучком, 393
когда он имеет а) две главные вещественные точки, б) одну главную вещественную точку {центр пучка), в) две главные комплексно-сопряженные точки. Далее, легко видеть, что для любой окружности 2 собственного пучка в этом пучке имеется единственная окружность 2', ортогональная окружно- окружности 2. Действительно, в канонических координатах окружность S (если эта окружность — настоящая) имеет уравнение вида х2 + У2 - 2xt + р = О, где t — некоторый параметр (а р — степень пучка). Условие, что некоторая другая окружность 2' с уравнением х2 + у2 — 2х? + р = О ортогональна окружности 2, имеет вид (см. формулу (9) п. 2) Н' = р. F) Следовательно, по любому t Ф О мы однозначно определяем соответствующее /'. Если t = 0, т. е. окружность 2 является главной окруж- окружностью пучка, то ей ортогональна, очевидно, ось пучка. Обратно, если окружность Б является прямой (и, следова- следовательно, осью пучка), ей ортогональна главная окружность пучка. Поскольку каждая точка линии центров пучка является центром единственной окружности пучка, мы можем, следова- следовательно, определить некоторое отображение Т этой линии в себя, сопоставив произвольной точке М точку М'=Т(М), являю- являющуюся центром окружности 2', принадлежащей пучку и ортого- ортогональной окружности 2, имеющей центр в точке М (и также принадлежащей пучку). Собственно говоря, это верно только в евклидово-проективной плоскости, поскольку отображение Т сопоставляет центру пучка несобственную точку линии центров. Согласно формуле F) отображение Т переводит точку ли- линии центров, имеющую абсциссу t, в точку с абсциссой *' = -?. G) Мы будем считать, что эта формула определяет отображение Т и для комплексных t (не являющихся абсциссами центров пучка). Формула G) показывает, что при р ф 0 (т. е. для непара- непараболического пучка) отображение Т биективно (на расширенной вещественно-комплексной прямой) и совпадает с обратным ото- 394
бражением Т 1. При р = О (для параболического пучка) ото- отображение Т переводит всю линию центров в центр пучка. Определение 5. Биективное отображение, совпадающее со своим обратным, называется инволюцией. Отображение, пере- переводящее всю прямую в некоторую ее точку Мо, называется па- параболической инволюцией с центром Мо. Таким образом, мы можем сказать, что любой пучок окруж- окружностей определяет на его линии центров некоторую инволюцию Т, параболическую, если пучок параболический. Точка М называется неподвижной точкой инволюции Т, если Т (М) = М. Точки линии центров собственного пучка, являющиеся непо- неподвижными точками соответствующей инволюции Т, называются фундаментальными точками этого пучка. Их абсциссы / опре- определяются из уравнения Р = р. (8) Для гиперболического пучка (р = е2) это уравнение имеет решения ±е. Следовательно, наше теперешнее определение фундаментальных точек совпадает для гиперболических пучков с определением 7 п. 3. Для параболических пучков (р — 0) уравнение (8) имеет единственное решение t = 0, а для эллиптических пучков (р = —е2) — два комплексно-сопряженных чисто мнимых реше- решения ±ге. Таким образом, на евклидовой вещественно-комплексной плоскости соб- собственный пучок окружностей тогда и только тогда является а) эллиптическим пучком, б) параболическим пучком, в) гиперболическим пучком, когда он имеет а) две фундаментальные комплексно-сопряженные точки, б) одну фундаментальную вещественную точку (центр пучка), в) две фундаментальные вещественные точки. Замечание 3. На этом основании любая (непараболическая) инволюция, имеющая две вещественные неподвижные точки, называется гиперболической инволюцией, а инволюция, имею- имеющая две комплексно-сопряженные неподвижные точки (и сле- следовательно, не имеющая вещественных неподвижных точек), называется эллиптической инволюцией1). *) Правду сказать, исторически дело обстояло как раз наоборот. По причинам, которые мы объясним ниже (см. замечание 2 п. 6 § 1 гл. 6), тер- термины «эллиптическая», «параболическая» и «гиперболическая» были перво- •начально применены к инволюциям и лишь затем перенесены на соответ- соответствующие пучки. 395
Дополнение. Геометрии параболической и гиперболической связок Зафиксировав на вещественной евклидово-проективной плоскости неко- некоторую параболическую связку с центром О, будем называть «точками» всевозможные точки плоскости, отличные от точки О, и «прямыми» — всевоз- всевозможные окружности связки, из которых удалена точка О. Очевидная про- проверка показывает, что справедливо следующее Предложение 1. Эти «точки» и «прямые» удовлетворяют {по отношению к теоретико-множественному отношению принадлежности) всем планиметри- планиметрическим аксиомам I( —11 первой группы аксиом Гильберта, а также аксиоме параллельности V. Заметим, что это верно только тогда, когда мы принимаем соглашение 1 из п. 5, т. е. считаем прямые, проходящие через точку О, окружностями связки. Пусть А, В и С — три «коллинеарные» (попарно различные) «точки» (т. е. «точки», принадлежащие одной окружности 2 нашей связки). Мы ска- скажем, что «точка» В расположена между «точками» Л и С, если на окруж- окружности 2 точки В и О разделяют точки А и С, т. е. из двух дуг окружности 2 с концами в точках А и С одна содержит точку В, а другая — точку О. В случае, когда окружность 2 является прямой, а точки Л и С — собствен- собственными точками плоскости, это означает, что точка В принадлежит отрезку АС, если этот отрезок не содержит точки О, и лежит вне этого отрезка — в про- противном случае'). Легко показывается, что справедливо следующее Предложение 2. Для отношения «между» выполнены все аксиомы Hi — П4 второй группы аксиом Гильберта и аксиома IV Дедекинда. Задание. Докажите предложение 2. Из предложения 2, в частности, следует, что в геометрии наших «точек» и «прямых» могут быть определены понятия «отрезка» и «угла». Естественно ожидать, что предложения 1 и 2 можно дополнить следую- следующим предложением: Предложение 3. Для «отрезков» и «углов» можно ввести отношение «конгруэнтность» так, чтобы были выполнены все аксиомы ПЬ — IIIS третьей группы аксиом Гильберта. Это предложение действительно верно, по описание соответствующего отношения конгруэнтности требует понятий, которые мы введем только в гл 7. Поэтому мы его доказывать здесь не будем. Упражнение, Прочтите определение инверсии относительно окружности (определение 1 п. 1 § 3 гл. 7) и докажите, что предложение 3 будет выпол- выполнено, если мы будем считать «отрезки» (или «углы») «конгруэнтными», когда их можно перевести друг в друга некоторой последовательностью инверсий относительно окружностей связки. Предложения lt 2, 3 означают, что справедлива следующая Теорема 1. Построенная «геометрия параболической связки» является ин- интерпретацией евклидовой геометрии. ') Таким образом, на прямых наше отношение «между» не совпадает с обычным отношением «между». 396
Замечание 1. Эту теорему можно было бы предугадать (но, конечно, не доказать), заметив, что аналогичное построение для связки всех прямых (на нерасширенной плоскости) приводит к обычной интерпретации евклидовой геометрии (в которой «точки» — это точки, «прямые» — это прямые и т. д.), и приняв во внимание, что связка всех прямых аналогична параболическим связкам окружностей. Конечно, возможность интерпретировать евклидову геометрию как гео- геометрию параболической связки, возможность сама по себе интересная и по- полезная (поскольку она позволяет из любой евклидовой теоремы о точках и прямых «бесплатно» получить некоторую теорему о точках и окружностях), большого принципиального значения все же не имеет. Однако она наводит на мысль о возможности построения аналогичных «геометрий гиперболиче- гиперболических и эллиптических связок». В геометрии гиперболической связки «точками» считаются внутренние точки фундаментальной окружности связки, а «прямыми» — дуги окружно- окружностей связки, лежащие внутри фундаментальной окружности. Отношение «между» определяется очевидным образом, а отношение «конгруэнтность» — так же, как для геометрии параболической связки (посредством инверсий относительно окружностей.связки). Ясно, что в этой геометрии вместо ев- евклидовой аксиомы о параллельных выполнена аксиома Лобачевского. Поэто- Поэтому естественно ожидать, что справедлива следующая Теорема 2. Геометрия гиперболической связки является интерпретацией неевклидовой геометрии Лобачевского. Упражнение. Докажите теорему 2. Замечание 2. В § 3 гл. 7 мы вернемся к теореме 2 с несколько иных позиций и, в частности, полностью ее докажем. Теорема 2 означает, что геометрия Лобачевского допускает интерпрета- интерпретацию в рамках евклидовой геометрии и, следовательно, непротиворечива (по- (поскольку непротиворечива евклидова геометрия). Обратим внимание на то, что поскольку неконгруэнтных гиперболических связок существует бесконечно много (они различаются их степенями), суще- существует на самом деле бесконечно много геометрий Лобачевского, различаю- различающихся значением некоторого параметра е (называемого кривизной геометрии Лобачевского). При е->0 геометрия Лобачевского переходит в евклидову геометрию. Поскольку геометрия Лобачевского интерпретируется в гиперболической связке окружностей, она часто называется гиперболической геометрией. По аналогичным соображениям, евклидова геометрия называется параболической геометрией. Возможна, конечно, и эллиптическая геометрия, интерпретируемая в эл- эллиптической связке окружностей. Эта геометрия была впервые построена Риманом и потому называется неевклидовой геометрией Римана. В этой гео- геометрии параллельных прямых нет (любые две прямые пересекаются). Она может быть проинтерпретирована на расширенной (проективной) плоскости.
Глава 5 ЭЛЕМЕНТАРНАЯ ТЕОРИЯ ЛИНИЙ И ПОВЕРХНОСТЕЙ ВТОРОГО ПОРЯДКА § 1. ЛИНИИ ВТОРОГО ПОРЯДКА В этом параграфе все координаты х, у предполагаются прямоугольными. 1. Параболы Определение 1. Параболой называется линия, имеющая в некоторой системе прямоугольных координат х, у уравнение У2 = 2рх, A) где р>0. Уравнение A) называется каноническим уравнением параболы, а координаты, в которых пара- парабола имеет такое уравнение,—канониче- уравнение,—каноническими координатами. Замечание 1. Из школьного курса чита- телю должно быть известно определение параболы как графика квадратного трех- трехчлена: у=ах2 + Ьх + с. B) Легко видеть, что переносом начала координат, переименова- переименованием координат и, если нужно, изменением знака одной из ко- координат любое уравнение B) можно привести к виду A). Сле- Следовательно, наше определение совпадает со школьным. Задание. Докажите последнее утверждение. Поскольку уравнение A) не меняется при замене у на —у, то вместе с некоторой точкой (х, у) парабола A) содержит и точку (х, —у), симметричную точке (х, у) относительно оси абсцисс. Это означает, что ось абсцисс канонической системы, координат является осью симметрии параболы. Поскольку парабола A) симметрична относительно оси абс- абсцисс, нам достаточно исследовать только ее «верхнюю поло- половину» y=V2px B) 398
(имеется в виду «арифметический квадратный корень»). Из теории элементарных функций известно, что функция B) яв- является монотонно возрастающей функцией переменной х и стре- стремится к оо при х~> оо. Геометрически это означает, что чем дальше мы будем удаляться вправо в положительном направ- направлении оси Ох, тем выше будет подниматься парабола и при до- достаточном удалении поднимется сколь угодно высоко. Однако парабола поднимается вверх довольно «медленно», во всяком случае «медленнее» любой прямой (т. е. функция B) возрастает медленнее любой линейной функции у = ах -\- Ь). Действительно, прямая, проходящая через точку @,0) и про- произвольную точку (х, у) параболы A) (точнее, ее верхней поло- половины B)), имеет угловой коэффициент и—У — У*Р х ~ fx ' монотонно стремящийся к нулю при х—>оо. Это показывает (ввиду симметричности параболы), что какой бы угол, охватывающий положительную полуось оси . абсцисс мы ни взяли, все достаточно далекие (т. е. имеющие достаточно большую абсциссу) точки параболы будут лежать в этом угле. Таким образом, если смотреть вдоль положительной полуоси оси абс- абсцисс, то парабола будет казаться сходящейся! Теперь легко видеть, что ось Ох является единственной осью симметрии параболы A). Действительно, оси симметрии, параллельной оси Ох (но не совпадающей с этой осью), существовать не может, потому что иначе на оси Оу, кроме точки @,0), была бы и другая (симмет- (симметричная ей) точка, что невозможно (ибо согласно уравнению A) при х = 0 обязательно г/ = 0). Пусть существует ось сим- симметрии К, не параллельная оси Ох. Рассмотрим достаточно ма- малый угол, охватывающий положительную полуось оси Ох..При симметрии относительно прямой X этот угол перейдет в неко- некоторый другой угол, охватывающий полуось, симметричную по- полуоси оси Ох. Поскольку все достаточно далекие точки пара- параболы содержатся в первом угле, они должны содержаться и во втором угле. Но при достаточной малости угла это, очевид- очевидно, невозможно. Определение 2. Ось симметрии параболы (по доказанно- доказанному—единственная) называется ее осью. Предложение 1. С точностью до изменения ориентации оси ординат каноническая система координат однозначно опреде- определена параболой. Доказательство. Осью абсцисс канонической системы является ось параболы, началом координат канонической си- системы — вершина параболы (точка пересечения ее с осью 399
симметрии1)), а ориентацией оси абсцисс —ориентация, по от- отношению к которой парабола расположена в положительной по- полуплоскости х ^ 0. Таким образом, единственным элементом произвола, остающимся в канонической системе, является ориентация ее оси ординат. Из предложения 1 вытекает, что все понятия и конструкции, использующие каноническую систему координат и не завися- зависящие от ориентации ее оси ординат, инвариантно связаны с па- параболой (однозначно ею определены). В частности, это верно для числа р, точки (р/2, 0) и прямой х = —р/2. Определение 3. Число р называется фокальным параметром параболы, а число р/2 — ее фокусным расстоянием. Точка (р/2, 0) называется фокусом параболы, а прямая х = —р/2~ ее директрисой. Ясно, что параметр р параболы равен расстоянию ее фокуса до ее директрисы, а фокусное расстояние р/2 равно расстоянию от ее фокуса до вершины параболы. На прямой, проходящей через фокус параболы перпенди- перпендикулярно оси (т. е. параллельно директрисе), парабола высе- высекает некоторый отрезок, называемый фокальной хордой пара- параболы. Ординаты концов фокальной хорды определяются, оче- очевидно, из уравнения т. е. равны ±р. Следовательно, длина фокальной хорды параболы равна 2р. Простое геометрическое описание параболы дается следую- следующим предложением: Предложение 2. Парабола является геометрическим ме- местом точек, равноудаленных от директрисы и фокуса. Задание. Докажите предложение 2. Указание: расстояние 6м произвольной точки плоскости М(х,у) до директрисы х = —р/2 выражается формулой ¦а ее расстояние г и до фокуса — формулой '-/(-¦& В связи с предложением 2 необходимо заметить, что любая прямая и любая не принадлежащая ей точка яв- являются директрисой и фокусом некоторой (однозначно опре- определенной) параболы. ') Вообще, вершиной произвольной линии, имеющей ось симметрии, на- называется точка ее пересечения с этой осью. 400
Действительно, пусть р — расстояние между данной точкой и данной прямой. Рассмотрим координатную систему, осью аб- абсцисс которой является прямая, перпендикулярная данной пря- прямой и проходящая через данную точку, а началом координат — середина перпендикуляра, опущенного из данной точки на дан^ ную прямую. Пусть ориентация оси абсцисс выбрана так, что данная точка имеет положительную абсциссу. Ориентацию оси ординат мы выберем произвольно. В этой координатной си- системе данная прямая имеет уравнение х = —р/2, а данная точ- точка— координаты (р/2,0). Поэтому эти прямая и точка яв- являются, соответственно, директрисой и фокусом параболы, за- задаваемой в построенной координатной системе уравнением 2. Эллипсы Определение 1. Эллипсом называется линия, выражаю- выражающаяся в некоторой системе прямоугольных координат уравне- уравнением вида где а Г5г Ъ > 0. Система координат, в которой эллипс имеет уравнение A), называется кано- канонической (для этого эллипса), а уравне- уравнение A) называется каноническим урав- уравнением эллипса. При а — b уравнение A) является уравнением окружности радиуса а с центром в точке @,0). Таким образом, окружность является частным случаем эллипса. Ясно, что любая точка с координатами вида х = a cos H, у = b sin 9, — я < 8 B) удовлетворяет уравнению A), и обратно, координаты любой точки, удовлетворяющей уравнению A), могут быть (единст- (единственным образом) представлены в виде B). Это означает, что уравнения B) являются параметрическими уравнениями эл- эллипса A). Пользуясь уравнениями B), можно без труда с любой сте- степенью точности начертить эллипс (для данных а и Ь) или хотя бы составить представление о его виде. Для этого нужно вы- выбрать достаточно много значений 9, вычислить для этих значе- значений по формулам B) соответствующие координаты х, у и за- затем соединить найденные точки плавной кривой. Иным способом представление о форме эллипса (а также все его свой- свойства) можно получить, если ввести в рассмотрение преобразование плоскости, 401
переводящее произвольную точку М(х, у) в точку М'(х\у') с координатам» х' = х, C> где k — некоторое положительное число. Это преобразование называется сжатием плоскости к оси Ох с коэффициентом к. (Конечно, настоящим «сжа- «сжатием» оно является только при k < 1.) Если точка М(х,у) принадлежит окружности х2 + у2 = R2, то, поскольку * = х', ¦f точка М'(х',у') будет удовлетворять соотношению '-¦f т. е. будет принадлежать эллипсу х2 о2 * I У | R2 ^ (kRJ '• Это показывает, что эллипс A) является результатом сжатия к оси Ох окружности х2 + у2 = а2 с коэффициентом k = —^ 1. Замечание 1. Уравнения B) не являются, конечно, един- единственно возможными параметрическими уравнениями эллипса. Например, переходя от параметра 0 к параметру мы немедленно получим, что эллипс A) может быть задан параметрическими уравне~ ниями вида х — а l + f2 • 2t — оо < t < + °°- Обратим внимание на то, что, таким образом, любой эллипс может быть параметризован рационально, т. е. для него су- существуют 'параметрические уравнения, правые части которых являются рациональными функциями параметра. Заметим, что парабола у2 = 2рх также допускает очевидную рацио- рациональную параметризацию: x = 2pt\ У = 2pt. 402
Уравнения B) показывают, что координаты любой точки \(х, у) эллипса A) удовлетворяют неравенствам __ \х\^а, \у\^Ь. D) Эти неравенства определяют на плоскости прямоугольник со сторонами длины 2а и 2Ъ, параллельными осям координат, и с центром в начале координат @, 0). Определение 2. Прямоугольник D) называется основным прямоугольником эллипса A). Как уже было сказано, эллипс A) целиком содержится з прямоугольнике D). При этом каждая сторона этого прямо-, угольника содержит одну (и только одну) точку эллипса. Именно, сторона х = а, —b^.y^.b содержит точку (а, 0), сторона х = — а, —b^.y^.b содержит точку (—а,0). сторона —а ^ х ^ а, у = о содержит точку @, Ь), сторона —а ^ х ^ а, у = —Ъ содержит точку @, —Ь). Это означает, что эллипс A) вписан в свой основной прямоугольник D). Так как уравнение эллипса не меняется при замене х на —х или у на —у, то координатные оси канонической системы координат яв- являются осями симметрии эллипса, а следовательно, начало ко- координат— (единственным) центром симметрии эллипса. Задание. Докажите, что ограниченная фигура (т. е. фигура, помещаю- помещающаяся в некотором прямоугольнике) не может иметь более одного центра симметрии. При а = Ь, т. е. для эллипса, являющегося окружностью, любая прямая, проходящая через его центр симметрии @,0), является осью симметрии. Напротив, легко видеть, что при а > Ь, т. е. для эллипса, не являющегося окружностью, координатные оси канонической системы координат являются его единственными осями симметрии. Действительно, ясно, что любая ось симметрии фигуры, об- обладающей единственным центром симметрии, проходит через этот центр. Следовательно, если эллипс A) обладает осью симметрии, отличной от координатных осей, то уравнение этой оси имеет вид y = kx, k=?0. E) Но легко видеть, что симметрия относительно прямой E) любую точку М(х,у) переводит в точку М'(х',у'} с координа- координатами .., (\-k2)x + 2ky , ... 2kx-(l-~k2)y х — 1 + k2 ' У — 1 + /г2 Задание. Выведите эти формулы. 403
В частности, точка А (а, 0) при симметрии относительно прямой E) переходит в точку А'{а',Ь') с координатами , l-fe2 ,, 2fe a =T+Wa> b =T+Wa- Если прямая E) является осью симметрии эллипса A), то, поскольку точка Л принадлежит этому эллипсу, точка А' также ему принадлежит, т. е. (а'У (Ь'У _ ~1Г~г~Ь2~ — 1' и следовательно, - fe» \2 / 2fe \2 а* Ь2 ~1ш \\+k2} ^[l+k2 J Ь2 Поскольку 2 2k и поскольку, по условию, а ^ 6 > 0, тем самым доказано, что, вопреки предположению, а = Ь. Задание. Докажите аналогичным образом отсутствие у параболы у2 = 2рх осей симметрии, отличных от оси Ох (см. п. 1). Доказанное утверждение означает, что координатные оси канонических координат однозначно характеризуются (при а > Ь) как оси симметрии эллипса. При этом ось Ох харак- характеризуется как ось симметрии, на которой эллипс высекает от- отрезок, больший, чем отрезок, высекаемый эллипсом на другой оси (первый отрезок имеет длину 2а, а другой — длину 26). Следовательно, справедливо Предложение 1. С точностью до изменения ориентации ко- координатных осей каноническая система координат однозначно определена эллипсом (не являющимся окружностью). Для эллипса, являющегося окружностью, канонической си- системой может служить произвольная система прямоугольных координат, начало которой совпадает с центром этой окруж- окружности. Ввиду единственности канонической системы координат, все понятия и конструкции, использующие каноническую систему и не зависящие от ориентации ее осей, инвариантно связаны с эллипсом. В частности, это верно для основного прямоуголь- прямоугольника D) и чисел а, Ь, с = |/а2 — Ь2, е = — и р = —. Определение 3. Числа а и Ъ называются соответственно большой полуосью и малой полуосью эллипса1), число с = ') Таким образом, эти «полуоси» являются числами! 404
= У а2—b2 называется линейным эксцентриситетом эллипса, число 2с называется фокусным расстоянием эллипса, число a называется (числовым) эксцентриситетом эллипса, число " и называется фокальным параметром эллипса. Для окружности а = 6, с = 0, е = 0, р~а. С эллипсом инвариантно связаны также его центр симмет- симметрии @,0) (называемый обычно просто центром эллипса), а при а >¦ b — его оси симметрии Ох и Оу (называемые обычно про- просто осями эллипса: ось Ох — большой, а ось Оу — малой) и четыре точки пересечения (±а, 0), @, +Ь) эллипса с его осями (вершины эллипса). Точки (с, 0) и (- с, 0) большой оси тоже инвариантно определены эллипсом и назы- называются его фокусами (фокус (с, 0) — правым, а фокус (—с, 0) — левым; заметим, что различение левого и правого фо- фокусов уже не инвариантно: оно зависит от выбора ориентации оси Ох). Термин «фокусное расстояние» для числа 2с объясняется тем, что это число, очевидно, равно расстоянию между фо- фокусами. Большая ось эллипса содержит его фокусы и потому иногда называется его фокальной осью. Так как 0 < b ^ а, то 0<с< а и 0<е< 1, причем с = 0 (т. е. е = 0) тогда и только тогда, когда а = Ь, т. е. когда эллипс является окружностью. Таким образом, во- первых, для эллипса, не являющегося окружностью, фокусы не сов- совпадают друг с другом и отличны от его центра, тогда как для окружности фокусы совпадают с ее центром. Во-вторых, эксцентриситет е эллипса является неотрицательным чис- числом, меньшим единицы: равным нулю тогда и только тогда, когда эллипс является окружностью, 405-
Отрезки, высекаемые эллипсом на прямых, проходящих че- через фокусы эллипса перпендикулярно оси абсцисс.канонической системы координат, называются фокальными хордами эллипса. Поскольку при симметрии относительно оси ординат фокаль- фокальные хорды переходят друг в друга, они имеют одну и ту же длину. Задание. Докажите, что длина фокальной хорды эллипса равна 2р. Для любо л точки М(х,у) эллипса длины отрезков, соеди- соединяющих ее с фокусами эллипса, называются фокальными ра- радиусами этой точки (соответственно-—правым и левым). Иногда «фокальными радиусами» называются сами эти отрезки. Для точки окружности имеется только один фокальный ра- радиус, совпадающий с ее радиусом. По определению, левый фокальный радиус Г\ точки М(х, у) эллипса выражается формулой Следовательно, = Ye2x2 -f 2aex -+- a2 = | a + ex |, и потому rl = a-\- ex, F) ибо | ex | = e | x [ <! ea < a. Аналогично, для правого фокального радиуса г2 получается, что г 2 —a — ex. G) Из этих формул непосредственно вытекает, что для любой точки эллипса ri + Г2 = 2а. Обратно, пусть М(х, у) — такая точка плоскости, что сумма ее расстояний от фокусов эллипса равна 2а, т. е. такая, что V(x + cf + y2 + V(x-cJ + J2 = 2а. «Уединяя радикалы» и дважды возводя в квадрат, мы, как легко видеть, получим уравнение (а2 - с2) х2 + а2у2 = а2 (а2 - с2), равносильное, очевидно, уравнению эллипса A) (ибо, по опре- определению, о2 — с2 = Ь2). Тем самым доказано, что точка М(х,у) тогда и только тогда принадлежит эллипсу A), когда сумма ее расстояний от фокусов эллипса равна 2а. 406
Это означает, что справедливо следующее Предложение 2. Любой эллипс является геометрическим местом точек, сумма расстояний которых от двух данных то- точек (фокусов эллипса) постоянна (равна длине большой оси эллипса). В частности, мы видим, что эллипс однозначно определен, когда известны его фокусы и его большая полуось а. При этом ясно, что для любых двух точек и любого числа а, большего половины расстояния между этими точками, существует (единственный) эллипс, фокусами которого являются данные точки, а большая полуось равна а. Действительно, если данные точки совпадают, то искомым эллипсом является окружность радиуса а с центром в этих совпадающих точках. Пусть данные точки различны. Рассмот- Рассмотрим систему прямоугольных координат х, у, осью абсцисс ко- которой является прямая, проходящая через данные точки, а осью ординат — их медиатриса. В этой координатной системе дан- данные точки имеют координаты (—с, 0) и (с, 0), где с — поло- половина расстояния между ними, и потому являются фокусами эллипса х2 у2 + 1 где Ь2 = а2 — с2. Для завершения доказательства остается за- заметить, что большой полуосью этого эллипса является, очевид- очевидно, число а. Замечание 2. Обратим внимание на то, что предложение, обратное предложению 2, требует очевидных оговорок: геомет- геометрическое место точек, сумма расстояний которых от двух данных точек (находящихся друг от друга на расстоянии 2с) равна данному числу 2а, является эллипсом только при а>с (если а = с, то геометрическое место представляет собой от- отрезок, а если а < с, то — пустое множество). Определение 4. Для любого эллипса, не являющегося окружностью, прямые х=-± и * = ?, е е называются его директрисами (соответственно левой и правой). Директрисы инвариантно связаны с эллипсом, но различе- различение правой и левой директрис зависит от ориентации оси абс- абсцисс канонической системы координат. Замечание 3. На евклидово-проективной плоскости директрисы имеют (в однородных координатах X : У: Z = х : у: 1) уравнения еХ — aZ = 0 и е X + aZ = 0. 407
При е = 0 эти уравнения превращаются в уравнение Z = 0 несобственной прямой. На этом основании целесообразно считать, что окружность имеет одну «двойную директрису» — несобственную прямую. Наглядно (на евклидовой плоскости) это отражается в том, что если эллипс изменяется так, что его большая полуось а остается неизменной, а эксцентриситет е стремится к нулю (т. е., другими словами, если эллипс приближается к окружности х2 + у2 = а2), то его директрисы неограниченно удаляются от оси ординат. Фокус и директриса называются одноименными, если они оба — правые или оба — левые. Ясно, что это отношение между фокусом и директрисой геометрически инвариантно. Расстояние d фокуса до одноименной директрисы выра- выражается, очевидно, формулой Поскольку тем самым а г п\ е с — а 1 доказано, U что d е ¦ ) d-- а е - а 1 р_ ¦ с — е ег 1 е Ъ2 а Р е (8) Поскольку для любой точки М(х, у) эллипса ]л;] ^ а, а е < 1, то весь эллипс расположен в полосе между директри- директрисами х—±—. Поэтому расстояние 6i точки М(х,у) эллипса до левой директрисы х = выражается формулой а расстояние бг до правой директрисы х=-— формулой Сравнив эти формулы с формулами F) и G) для фокальных радиусов Гх и г2 точки М(х, у), мы немедленно получим, что для любой точки эллипса Обратно, пусть М(х, у) — такая точка плоскости, что, ска- скажем, отношение её расстояния от левого фокуса эллипса к ее расстоянию от левой директрисы эллипса равно е, т. е. такая, что 408
Тогда (х + сJ + у2 = (а + ехJ, т. е. х2 + 2сх + с2+у2=а2 + 2аех + е2х2 или Поскольку последнее уравнение равносильно, очевидно, урав- уравнению эллипса A), тем самым доказано, что точка М(х,у) тогда и только тогда принадлежит эллипсу A) (не являющемуся окружностью), когда отношение ее рас- расстояния от левого фокуса эллипса к ее расстоянию от левой директрисы эллипса равно эксцентриситету е эллипса. Так как эллипс симметричен относительно оси Оу, то ана- аналогичное утверждение верно и по отношению к правым фокусу и директрисе. Таким образом, нами доказано следующее Предложение 3. Любой эллипс (не являющийся окружно- окружностью) представляет собой геометрическое место точек, отно- отношения расстояний которых от данной точки (фокуса эллипса) и от данной прямой (одноименной с фокусом директрисы) рав- равны данному положительному числу, меньшему единицы (экс- (эксцентриситету эллипса). В частности, мы видим, что эллипс однозначно определен, если известны его фокус, од- одноименная с этим фокусом директриса и его эксцентриситет. При этом для любой точки, любой не содержащей эту точку прямой и любого положительного числа е, меньшего единицы, суще- существует (единственный) эллипс с эксцентриситетом е, для ко- которого данная точка является фокусом, а данная прямая — од- одноименной с этим фокусом директрисой. Задание. Докажите это утверждение. Замечание 4. Предложение 3 аналогично предложению 2 п. 1 и переходит в него при е = 1. Поэтому целесообразно счи- считать, что эксцентриситет е параболы равен единице. Это согласуется также с формулой (8), поскольку для па- параболы расстояние d равно фокальному параметру р. Замеченное сходство между эллипсом и параболой можно выявить и по-другому, рассмотрев уравнение эллипса в системе координат х', у', получающейся из канонической системы пере- переносом начала в левую вершину (—а, 0) эллипса. Канонические координаты х, у выражаются через эти координаты по фор- формулам х = х' — а, У — У'- 409
Поэтому уравнение эллипса в координатах х', у' имеет вид (х'-аУ , (уТ . tf~ г" ь2 ~1- Отбросив штрихи и раскрыв скобки, мы немедленно получим отсюда уравнение y2 = 2px + qx\ (9) где б2 , , Тем самым мы доказали, что в указанной системе прямоугольных координат эллипс выра- выражается уравнением (9), где —1 ^ q < 0. Уравнение (9) называется уравнением эллипса «при вер- вершине». При <7 = 0, т. е. при е = 1, уравнение (9) переходит в ка- каноническое уравнение параболы. Это еще раз оправдывает представление о параболе как о линии, эксцентриситет которой равен единице. Замечание 5. Пусть эллипс (9) меняется так, что его фо- фокальный параметр р остается неизменным, а величина q стре- стремится к нулю (т. е. эксцентриситет е стремится к единице). Тогда эллипс будет неограниченно вытягиваться в положительном направлении оси Ох и в пределе даст параболу у2—2рх. В этом смысле парабола является предельным положением .эллипса при е—> 1 (и р постоянном). Замечание 6. Легко видеть, что при q < —1 уравнение (9) также является уравнением неко- некоторого эллипса с вершиной в начале координат. Действительно, в координатах х', у', связанных с коорди- координатами х, у соотношениями линия (9) имеет уравнение т. е. уравнение /2 Л П2 х' =qy — —. ЧУ q Отбрасывая штрихи и полагая п2 „2 а п ' «2 410
(напомним, что, по условию, q <—1), мы получим канониче- каноническое уравнение эллипса (это, действительно, каноническое уравнение, поскольку а>Ь). Фокальный параметр этого эллипса равен JL , а его эксцен- V — я триситет равен Т/ 1 -(— . г <7 Отличие случая q <<—1 от случая —1 ^ q <С 0 состоит в том, что во втором случае эллипс «как и полагается» вытянут в горизонтальном направлении, тогда как в первом случае он вытянут в вертикальном направлении. Заметим еще, что при q = —1 мы получаем окружность у2 = 2рх — х2 радиуса р с центром в точке (р, 0). 3. Гиперболы Определение 1. Гиперболой называется линия, выражаю- выражающаяся в некоторой системе прямоугольных координат уравне- уравнением вида где а > 0, b > 0. Система координат, в которой гипербола имеет уравнение A), называется канонической (для этой гиперболы), а уравнение A) называется канрническим уравне- уравнением гиперболы. Частным случаем гиперболы является линия с уравнением т. е. с уравнением х2 — у2 = а2. ' B) Эта линия называется равнобочной гиперболой. В координатах х', у', связанных с каноническими коорди- координатами х, у соотношениями 411
(для этих координат оси Ох' и Оу' получаются поворотом по часовой стрелке осей Ох и Оу на л/4, т. е. являются биссек- биссектрисами координатных углов), равнобочная гипербола выра- выражается уравнением , , а2 т. е. представляет собой известный из школьного курса гра- график обратной пропорциональности. Напомним основные факты об этом графике. Для упроще- упрощения формул мы уберем у обозначений координат штрихи и по- ложим А = -<?-. Таким образом, речь у нас будет идти о графике функции у=А> л>о. C) X Так как у > 0 при х > О и у < О при "я л: < О, то график функции C) -расположен в первом и третьем квадрантах. При этом на оси ординат Ог/ нет ни одной точки графика, так что эта ось отделяет часть графика, расположенную в первом квадранте, от его части, расположенной в третьем квадранте. Эти две отдель- отдельные части графика называются его ветвями. Поскольку уравнение ху = А не меняется при одновремен- одновременном изменении знаков у х и у, то график функции C) симметричен относительно начала ко- координат, а поскольку это уравнение не меняется и при перестановке ко- координат, то график функции C) симметричен относительно биссектрис координатных углов. При этом, при симметрии относительно биссектрисы второго и четвертого координатных углов ветви графика переходят друг в друга, а при симметрии относительно биссектрисы первого и третьего координатных углов каждая ветвь графика переходит в себя. Таким образом, каждая ветвь графика функции C) симметрична относитель- относительно биссектрисы первого и третьего координатных углов. Определение 2. Пусть Г—произвольная линия и а —некоторая прямая. Предположим, что линия Г имеет часть, «уходящую в бесконечность» (т. е. такую, что, двигаясь по этой части линии, точка М(х, у) неограниченно уда- удаляется от начала координат1)), и что расстояние точки М(х,у) от прямой а ') Строгое описание такого поведения кривой требует рассмотрения ее параметрических уравнений. Мы это предоставим сделать читателю. 412
стремится при этом к нулю. В этой ситуации прямая а называется асимпто- асимптотой линии Г. Пусть Ма — основание перпендикуляра, опущенного из точки М на прямую а. Когда точка М удаляется по рассматриваемой части линии1 Г в бесконечность, точка Л1о также удаляется в бесконечность, двигаясь по пря- прямой а в определенном направлении (хотя, вообще говоря, и не монотонно). Говорят, что прямая а является асимптотой линии Г в этом направлении. Способы разыскания асимптот (когда они существуют) излагаются в курсе анализа. Мы ограничимся лишь случаем, когда асимптотой является ось абсцисс Ох и когда рассматриваемая линия является графиком неко- некоторой функции у = f(x). Так как расстояние от произвольной точки (x,f(x)) этого графика до оси Ох равно, очевидно, |/(•*)!> то утверждение, что ось Ох является в положительном направлении асимптотой графика у = f(x), равносильно утверждению, что f(x) ->0 при х->+оо. д Для интересующей нас функции у = ¦— дело обстоит именно так: у—>0 при х—>+°°- Следовательно, ось абсцисс является асимптотой графика функции C) в по- положительном направлении. В силу указанных выше свойств симметрии графика отсюда следует, что ось абсцисс является асимптотой графика функции C) и в отрицательном направлении, а также, что ось ординат тоже является асимптотой графика функции C) (как в положительном, так и в отрицательном направле- направлениях) . Более точно, оси абсцисс. и ординат являются в положительных направ- направлениях асимптотами ветви графика, расположенной в первом квадранте, а в отрицательных направлениях — асимптотами ветви, расположенной в третьем квадранте. Поскольку график функции C) «уходит в бесконечность» только при х—>±оо и X—+Q, никаких других асимптот этот график не имеет. Возвращаясь к равнобочной гиперболе х2-у2 = а2 B) и учитывая, что при повороте на л/2 координатные оси пере- переходят в биссектрисы координатных углов и наоборот, мы полу- получаем, во-первых, что оси координат являются осями симметрии равнобочной ги- гиперболы B), а начало координат — ее центром симметрии, и, во-вторых, что равнобочная гипербола B) имеет две (и только две) асим- асимптоты, являющиеся биссектрисами координатных углов. 413
Кроме того, гипербола B) целиком помещается в двух вертикальных углах, образованных этими биссектрисами и содержащими ось абсцисс. Часть гиперболы, содержащаяся в правом вертикальном угле, называется правой ветвью, а содержащаяся в левом — левой ветвью. (Конечно, различение правой и левой ветви за- зависит от ориентации оси абсцисс.) Поскольку уравнение B) может быть переписано в виде х2 = а2 + у2, абсцисса любой точки гиперболы удовлетворяет неравенству \х\>а, причем равенство возможно только при у = 0. Таким образом, равнобочная гипербола пересекает ось абсцисс в точках (±а,0), причем ее правая ветвь расположена справа от прямой х = а, а левая — слева от прямой х = —а. В частности, в полосе —а <С х <; а нет ни одной точки гиперболы. Все сказанное доставляет нам уже довольно определенное представление о форме равнобочной гиперболы. С другой стороны^ легко видеть, что произвольная гипербола a? b2 ~l u> получается из равнобочной гиперболы сжатием к оси Ох с коэффициентом:k — —. Действительно, при сжатии к оси Ох в отношении k каж- каждая точка (х, у) плоскости получается из точки (x,y/k). По- Поэтому в результате сжатия линия с уравнением B) переходит в линию с уравнением х2 у2 . a2 (ka) т. е. (при k=—\ — в гиперболу A). Тем самым мы получаем вполне удовлетворительное пред-» ставление о форме и произвольной гиперболы. 414
В частности, мы видим, что гипербола A) имеет две {и только две) асимптоты, выра- выражающиеся уравнениями b Ь у = — х. и = х. v а > у а Действительно, мы знаем, что асимптотами равнобочной ги- гиперболы B) являются биссектрисы координатных углов, т. е. диагонали произвольного квадрата с центром в начале коор- координат и сторонами, параллельными осям координат. Рассмот- Рассмотрим, в частности, квадрат, длины сторон которого равны 2а. При сжатии к оси Ох с коэффициентом — этот квадрат пере- переходит в прямоугольник с вертикальными сторонами длины 26 и горизонтальными сторонами прежней длины 2а, а его диа- диагонали переходят в диагонали этого прямоугольника, т. е. в прямые у = ± — х. Определение 3. Прямоугольник |д:|^а, |г/|^6 называется основным прямоугольником гиперболы A). Замечание 1. Ясно, что асимптоты гиперболы тогда и только тогда перпендикуляр- перпендикулярны, когда Ъ = я,, г. е. когда гипербола равнобочна. Далее, мы видим, что гипербола A) целиком расположена в содержащих ось абс- абсцисс вертикальных углах, образованных асимптотами, но вне полосы —а < х < а. Кроме того, гипербола A) касается сторон х = а и х = —а основного прямоугольника в точках (а,0) и (—а, 0) и состоит из двух ветвей — правой и левой. Наконец, для гиперболы A) начало координат является центром сим- симметрии, а оси координат — осями симметрии, причем ось абс- абсцисс пересекает гиперболу, а ось ординат — нет. При этом никаких других осей симметрии гипербола не имеет. Действительно, поскольку при любой симметрии асимптоты должны переходить в асимптоты, а точки касания гиперболы сторон основного прямоугольника — в точки касания, то основ- основной прямоугольник гиперболы должен переходить сам в себя, причем его вертикальные стороны должны после симметрии остаться вертикальными. Но это, очевидно, возможно только при симметриях относительно средних линий этого прямоуголь- прямоугольника, т. е. при симметриях относительно осей координат. Таким образом, ось абсцисс канонической системы коорди- координат мы можем охарактеризовать как ось симметрии гиперболы, пересекающую эту гиперболу, а ось ординат — как ось сим- симметрии гиперболы, не пересекающую гиперболу, 415
Поэтому справедливо следующее Предложение 1. С точностью до ориентации осей канони- каноническая система координат однозначно определена гиперболой. Рассмотрим функции е" — е -е ch0 = - называемые соответственно гиперболическим синусом и гиперболическим ко- косинусом. Элементарное исследование (например, методами, известными из курса анализа) показывает, что обе функции sh 0 и ch 9 определены для всех 9, причем функция sh 9 нечетна и при изменении 9 от —оо до +оо монотонно возрастает от —оо до +оо, обращаясь в нуль при 0 = 0. а функ- функция ch 9 четна и при изменении 9 от —оо до +оо сначала монотонно убывает от +оо f , . до I (получающейся при 6 = 0), а затем S"V монотонно возрастает от 1 до +оо. Далее, так как the е ± е~ ± 2 то ch2G-sh20= D) Это соотношение (аналогичное извест- известному тождеству для тригонометрических функций cos 0 и sin 0) позволяет построить для гиперболических функций «тригоно- «тригонометрию», весьма похожую на тригонометрию функций cos 0 и sin 9. В частно- частности, можно ввести гиперболический тангенс ch 9 ew + е'° доказать формулы сложения, формулы двойных и половинных аргументов и т. п. Например, по аналогии с известными формулами тригонометрии, вы- выражающими синус и косинус через тангенс половинного угла, для гиперболи- гиперболических функций справедливы формулы sh9 = 2thi i-th*!' ch0 = 1+th 2 E) (проще всего эти формулы проверяются прямым вычислением). Ввиду соотношения D) любая точка вида (a ch 0, b sh 0) принадлежит гиперболе ^l_jl—1 а2 Ь2 ~~ L или, более точно, ее правой ветви (поскольку всегда ch0 ^ 1), Обратно, любая точка этой правой ветви однозначно представ- представляется в виде (a ch 0, b sh 0). Действительно, поскольку функ- 416
ция sh 0. монотонно изменяется of —оо до Ц-оо (и непрерывна),, для любого у существует единственное 9, удовлетворяющее со- соотношению у = b sh 0. Тогда и, следовательно, x = achQ (ибо, по условию, х>0). Тем самым мы доказали, что уравнения х — a ch 6, -~<e< + eo F) являются параметрическими уравнениями правой ветви гипер- гиперболы A). Переходя к параметру / = thy, мы получаем отсюда (см. формулы D)), что правая ветвь гиперболы A) может быть задана и парамет- параметрическими уравнениями вида Таким образом, аналогично эллипсу и параболе, гипербола (точнее, ее правая ветвь) допускает рациональ- рациональную параметризацию. Поскольку с точностью до ориентации осей каноническая координатная система однозначно определена гиперболой, все конструкции и понятия, использующие эту координатную си- систему и не зависящие от ориентации ее осей, инвариантно свя- связаны с гиперболой. В частности, это верно для чисел а, Ь, с = Определение 4. Числа а и b называются соответственно дей- действительной и мнимой полуосями гиперболы ')% число называется линейным эксцентриситетом гиперболы, число 2с — фокусным расстоянием гиперболы, число 4) Происхождение довольно неудачных, но сохраняющихся, по традиции Эпитетов «действительная» и «мнимая» в применении к полуосям гиперболы объясняется тем, что уравнение (определяющее точки пересечения гиперболы с осью Ох, имеет вещественные. (действительные) решения, а аналогичное уравнение Для оси Оу — мнимые решения. _ - ,. ; i ..-.-,. 14 М, М, Постников ,, 417
'— (числовым) эксцентриситетом гиперболы, а число Ь2 р — фокальным параметром гиперболы. Для равнобочной гиперболы <г = ]/2, р — а. С гиперболой инвариантно связаны также ее (единственный) центр симметрии @, 0) (называемый обычно просто центром гиперболы), ее оси симметрии Ох и Оу (называемые обычно просто осями: ось Ох— действительной осью, а ось Оу — мни- мнимой осью) и две точки пересечения (±а, 0) гиперболы с дей- действительной осью (вершины гиперболы). Точки (- с, 0) и (с, 0) тоже инвариантно определены гиперболой и называются ее фокусами (соответственно левым и правым; заметим, что разли- различение левого и правого фокуса зависит от ориентации оси Ох). Термин «фокусное расстояние» для числа 2с объясняется тем, что это число, очевидно, равно расстоянию между фоку- фокусами. Действительная ось гиперболы содержит ее фокусы и по- потому называется также фокальной осью. Так как b ф 0, то с > а и е > 1, причем с = У2а (т. е. е—]/2) тогда и только тогда, когда а = Ъ, т. е. когда гипербола равнобочна. Поскольку с > а, прямые х = ±с пересекают гиперболу. Отрезки, высекаемые гиперболой на этих прямых, называются ее фокальными хордами. Поскольку при симметрии относи- относительно оси ординат фокальные хорды переходят друг в друга, они имеют одну и ту же длину. Задание. Докажите, что длина фокальной хорды гиперболы равна 2р. Для любой точки М(х, у) гиперболы длины отрезков, сое- соединяющих ее с фокусами гиперболы, называются фокальными радиусами этой точки (соответственно правым и левым). Иног- Иногда «фокальными радиусами» называются сами эти отрезки. По определению, левый фокальный радиус г\ точки М(х, у) гиперболы выражается фбрмулой 418
Следовательно, - 2eax + a2 = | ex + a \. Поскольку для точек правой ветви х > 0, а для точек левой ветви х < 0, причем \ех\>\х\~^ а, тем самым доказано, что а-\-ех при л: > О, — а — ел; при л; < 0. ^ Аналогично, для правого фокального радиуса г2 получается, что т. е. что — а + ех при х>0, I о) а — ех при л: < 0. Из этих формул непосредственно вытекает, что f 2а при л > 0, т. е. что Задание. Докажите обратное утверждение, т. е. что точка плоскости, для которой разность ее расстояний от фокусов гиперболы равна по абсолютной величине числу 2а, принадлежит гиперболе. Таким образом, точка М(х, у) тогда и только тогда принадлежит гиперболе A), когда абсолютная величина разности ее расстояний от фо- фокусов гиперболы равна 2а. Это означает, что справедливо следующее Предложение 2. Любая гипербола является геометрическим местом точек, абсолютная величина разности расстояний кото- которых от двух данных точек (фокусов гиперболы) постоянна (равна 2а). Заметим, что геометрическое место точек, разность расстояний которых от двух данных точек равна данному положительному числу 2а, является одной из ветвей гиперболы (а именно, ветвью, од- одноименной с фокусом, фокальный радиус которого является вычитаемым). Задание. Докажите это утверждение. 14* ' 419
Замечание 2. Так же как в аналогичной ситуации для эл- эллипса, геометрическое место точек, абсолютная величина раз- разности расстояний которых от двух данных точек (находящихся друг от друга на расстоянии 2с) равна данному неотрицатель- неотрицательному числу 2а, является гиперболой только при 0 < 2а < 2с. При 2а = 2с это геометрическое место представляет собой внеш- внешность (два луча) отрезка, с концами в данных точках, а при 2а > 2с — пусто. При а = 0 оно является медиатрисой данных точек. -Согласно предложению 2 гипербола однозначно определена, когда известны ее фо- фокусы и действтельная полуось а. При этом для любых двух различных точек и любого положительного числа а, меньшего половины расстояния между этими точками, существует (единственная) гипебола, фокусами которой являют- являются данные точки, а действительная полуось равна а. Задание. Докажите это утверждение (ср. в п. 2 доказательство анало- аналогичного утверждения для эллипса). Определение 5. Прямые называются директрисами (соответственно левой и правой) ги- гиперболы A). Директрисы инвариантно связаны с гиперболой, но различение правой и левой директрис зависит от ориента- ориентации оси абсцисс. Заметим, что поскольку е > 1, директрисы отделяют вершины гиперболы от ее центра. Фокус и директриса называются одноименными, если они оба — правые или оба — левые. Ясно, что это отношение между фокусом и директрисой геометрически инвариантно. Расстояние d фокуса до одноименной директрисы выра- выражается, очевидно, формулой Поскольку а I \\ е2 - 1 е е а е тем самым доказано (ср. формулу (8) п. 2), что Так же, как для эллипса, показывается, что точка М(х, у) тогда и только тогда принадлежит гиперболе A), когда отношение ее расстояния до некоторого фокуса ги- 420 ;
перболы к ее расстоянию до одноименной директрисы гипер- гиперболы равно эксцентриситету е гиперболы. Задание. Докажите это утверждение (не забудьте рассмотреть обе ветви гиперболы). Таким образом, справедливо следующее Предложение 3. Любая гипербола представляет собой, гео- геометрическое место точек, отношения расстояний которых от данной точки (фокуса гиперболы) и от данной прямой (одно- (одноименной с фокусом директрисы) равно данному положитель- положительному числу е, большему единицы (эксцентриситету гиперболы). В частности, гипербола однозначно определена, если известны ее фокус, одноименная с этим фокусом директриса и ее эксцентриситет е. При этом для любой точки, любой не содержащей эту точку прямой и любого положительного числа е, большего единицы, суще- существует (единственная) гипербола с эксцентриситетом е, для которой данная точка является фокусом, а данная прямая — одноименной с этим фокусом директрисой. Задание. Докажите это утверждение. Замечание 3. Таким образом, гипербола может быть опре- определена той же геометрической конструкцией, что и эллипс и парабола (см. предложение 2 п. 1 и предложение 3 п. 2), только при значении параметра е, большем единицы. Следо- Следовательно, и эллипс (не являющийся окружностью), и парабола, и ги- гипербола являются геометрическими местами точек, отношения расстояний которых от 'данной точки (фокуса) до данной пря- прямой (одноименной директрисы) постоянны (равны эксцентри- эксцентриситету е). При этом значениям е от нуля до единицы соответствуют эллипсы, зна- значению е = 1 соответствуют параболы, а значениям е > 1 — гиперболы (в частности, значению е = ~\[i — равнобочные гипер- гиперболы) . Единство эллипсов, парабол и гипербол можно прояснить и с иной точки зрения. Рассмотрим с этой целью для произ- произвольной гиперболы A) прямоугольные координаты х', у', полу- получающиеся из канонических координат х, у при переносе на- начала координат в правую вершину (а, 0) гиперболы. Канони- Канонические координаты х, у выражаются через эти координаты по формулам х = х' + а, У = У'- 421
Поэтому уравнение гиперболы в координатах' х', у' имеет вид (*' + аJ _^1_, а2 Ь2 ~1- Отбросив штрихи и раскрыв скобки, мы немедленно получим отсюда уравнение 9 о Ь2 . Ъ2 о У2 *=2—* + -?*?> т. е. уравнение y2 = 2px + qx2, (9) где 6" 2 1 " а2 Тем самым мы доказали, что е указанной системе прямоугольных координат гипербола выражается уравнением (9) с q > 0. Замечание 4. Пусть гипербола меняется так, что ее фокаль- фокальный параметр р остается неизменным, а величина q стремится к нулю (т. е. эксцентриситет е стремится к единице). Тогда ле- левая ветвь гиперболы будет неограниченно удаляться влево и в пределе исчезнет, а правая ветвь будет «сходиться» и в пре- пределе перейдет в параболу у2—2рх. В этом смысле (ср. замеча- замечание 4 п. 2) парабола является предельным положением гиперболы, получающимся при е-*1 (яр постоянном). Сопоставляя полученные результаты с результатами п. 2, мы, в частности, получаем следующее Предложение 4. Эллипс, парабола и гипербола могут быть заданы уравнением qx2, ¦ A0) где ц <Z 0 для эллипса, q = 0 для параболы и q > 0 для ги- гиперболы. При этом все эллипсы получаются уже при —1 ^ q <. 0 {окружности — при q — —1). При —\^Cq эксцентриситет е связан с q формулой При q <—1 получается эллипс, имеющий эксцентриситет /1+— и фокальный параметр ¦ гр q У — я Замечание 5. Уравнение A0) показывает, что при непре- непрерывном изменении q от —оо до 4-°° (и постоянном р) эллипс при q, близких к —оо, сильно «прижатый» к оси ординат, по- постепенно «округляется», превращаясь при q = — 1 в окруж- окружность, затем «вытягивается» в положительном направлении оси 422
Ох, переходя при q = 0 в параболу, превращающуюся при q >• 0 в гиперболу с правой ветвью, «близкой» к параболе, и левой ветвью, далеко сдвинутой влево. При дальнейшем воз- возрастании q ветви гиперболы постепенно «раскрываются» все шире (и приближаются друг к другу), так что при q, близких к + оо, получается гипербола, сильно «прижатая» к оси орди- ординат. При q ^—1 все эти кривые имеют один и тот же фокальный параметр р, а их эксцентриситет е меняется от 0 до + °°- При уменьшении q от —1 до —со эксцентриситет растет от нуля до единицы, а фокальный пара- параметр стремится к нулю. Поэтому, хотя в пределе при q-*~—оо и получается значение е = 1, все же предельное положение эллип- эллипса- параболой не является, по- поскольку для него р = 0. Предельное положение эллип- эллипса при q-* оо можно при же- желании рассматривать как дважды пробегаемую ось ординат. Предельное положение гиперболы при q—> -f00 также является дважды пробегаемой осью ординат, но если гипербола «в пре- пределе» является осью ординат, дважды пробегаемой в одном и том же направлении, то эллипс «в пределе» является осью ор- ординат, пробегаемой сначала в одном направлении, а потом в другом. 4. Уравнения эллипса, параболы и гиперболы в полярных координатах Единство эллипсов, парабол и гипербол проявляется также и в их уравнениях в полярных координатах. Рассмотрим сначала произвольную параболу ¦ A) и найдем ее уравнение в системе полярных координат г, ф, по- полюсом которой является фокус параболы, а полярной осью — ось параболы (или точнее, поскольку необходимо указать ориентацию полярной оси, — ось абсцисс канонической системы координат). С этой полярной системой координат согласована система прямоугольных координат х', у', выражающихся через выражение через г и ф, мы немедленно получим, что у/ v ?_ А Л п » у'=у- 423
Поскольку х* = у' = r s'mq>, то, следовательно, X = у + Г COS ф, г/ = г sinqp. Подставив эти выражения в уравнение A) параболы, мы по- получим, что в координатах г, ф парабола выражается уравне- уравнением г2 sin2 ф — 2pr cos ф — р2 = 0. Решая это уравнение относительно г и учитывая, что величина г должна быть положительна, мы немедленно получим, что р cos ф + ^Р2 cos2 ф + Р2 sin2 ф р A + cos ф) sin2 ф sin2 ф 1 — cos ф Таким образом, в указанной полярной системе координат парабола выра- выражается уравнением г__ р 1 — COS ф Рассмотрим теперь произвольный эллипс Так же, как для параболы, мы направим полярную ось по оси абсцисс канонической системы координат, а за полюс примем фокус, имеющий отрицательную абсциссу, т. е. левый фокус. Тогда канонические координаты х, у будут выражаться через полярные координаты г, ф по формулам х = — с + г cos ф, y = rsinq>. Чтобы найти уравнение эллипса в координатах г, ф, можно подставить эти выражения в каноническое уравнение эллипса и решить получающееся квадратное уравнение относительно г. Однако проще вспомнить формулу F) п. 2 для левого фокаль- фокального радиуса произвольной точки эллипса и учесть, что в силу нашего выбора полюса этот фокальный радиус совпадает с по- полярным радиусом г. Подставив в эту формулу вместо х его выражение через г и ф, мы немедленно получим, что г = а + е (— с + г cos ф), и следовательно, что / а — ее ~~ 1 — е cos ф * 424
Поскольку С2 fl2 _ С2 bi — ес = а —— = — = —- = о, а а а "у тем самым доказано, что в указанной полярной системе координат эллипс выражает- выражается уравнением r_ p 1 — е cos <p Наконец, для гиперболы -?--?= 1, а>0, Ь>0, мы рассмотрим систему полярных координат г, ф, полярная ось которой совпадает с осью Ох, а полюс находится в правом фокусе гиперболы (заметим, что для эллипса мы брали левый фокус). Тогда х = с + г соэф, у = г sin ф, причем полярный радиус г произвольной точки М(х, у) гипер- гиперболы будет не чем иным, как ее правым фокальным радиусом и потому будет выражаться формулой (8) п. 3. В частности, для точек правой ветви (с х > 0) мы получим, что г = — а + ех и потому г = ~ а -\- е{с -\- г cos ф), т. е. _ ее — а 1 — е cos ф Поскольку ^ с2 с2-а2 Ь2 ес-а=-^-а=^т- = — ^р, тем самым доказано, что в указанной системе полярных координат правая ветвь ги- гиперболы выражается уравнением 1 — e cos ф Сопоставляя полученные результаты, мы немедленно полу- получаем следующее окончательное Предложение 1. Уравнение r— P 1 — е cos ф является а) при О sg; е < 1 —уравнением эллипса, . б) при е = 1 —уравнением параболы, в) при е > 1 —уравнением одной^ветви гиперболы. 4J5
Во всех трех случаях число е является эксцентриситетом линии, число р— фокальным параметром, а полюс г = 0 — фо- фокусом линии (в случае е > 1 — одноименным с рассматриваемой ветвью). § 2. НЕКОТОРЫЕ ДОПОЛНИТЕЛЬНЫЕ СВОЙСТВА ЛИНИЙ ВТОРОГО ПОРЯДКА 1. Эллипс, парабола и гипербола как конические сечения Определение 1. Прямым круговым конусом называется по- поверхность, имеющая в некоторых прямоугольных координатах Oxyz уравнение вида x2 + y2 = R2z2. A) Плоскость г = 1 пересекает поверхность A) по линии с уравнением x2 + y2^R2, B) т. е. по окружности радиуса R (как мы знаем, х, у являются прямоуголь- прямоугольными координатами и на плоскости z — 1). С другой стороны, если точка (х, у, 1) принадлежит окружности B), то любая точка вида (xt,yt,t) при- принадлежит поверхности A), и обратно. Следовательно, поверхность A) обра- образована всевозможными прямыми, проходящими через точку 0@,0,0) и про- произвольную точку окружности B). Это показывает, что поверхность A) со- состоит из двух бесконечных конусов, имеющих общую вершину О. В пересечении с произвольной плоскостью xcosa + у cos р + zcos y — Р = 0> Р^О, C) конус A) дает некоторую линию. Определение 2. В случае, когда плоскость C) не проходит через начало координат О, т. е. в случае, когда р > 0, линия, высекаемая на плоскости C) конусом A), называется кониче- коническим сечением. Упражнение. Какие линии пересечения получаются при р = 0? Что из- изменится, если мы вместо евклидова пространства будем рассматривать ев- евклидово вещественно-комплексное пространство? Чтобы найти уравнения конических сечений, мы заметим, что в силу круговой симметрии конуса можно, без ограничения общности, считать, что плоскость C) параллельна оси Оу, т. е. что cos р = 0. Тогда cos y = sin а, и потому уравнение плоско- плоскости C) может быть записано в виде xcosa + 2 sin a — р = 0. D) Более того, по аналогичным соображениям мы можем считать, что 0<а<-^. E) Чтобы найти пересечение плоскости D) с конусом A), мы рассмотрим векторы е\(— sin a, 0, cos а), е2@, 1, 0), e3(cosa, 0, sin a). 426
Первые два из этих векторов параллельны плоскости D), а третий ей перпендикулярен. Кроме того, эти векторы состав- составляют ортонормированный базис пространства, разноименный с исходным координатным базисом. Пусть х', у', г' — прямоугольные координаты в простран- пространстве, определенные репером Oe{e2ez. Согласно общим форму- формулам п. 2 § 1 гл. 2 координаты х, у, z выражаются через коор- координаты х', у', z' по формулам х = — х' sin a + z' cos а, z = х1 cos а -{- z' sin а. Поэтому в координатах х', у', z' конус C) имеет уравнение (— х' sin а + z' c°s аJ + у'* — R2 {xr cos а + z' sin аJ = О, т. е. уравнение у'2=2x'z'A + ^2)cosasina + x'2G?2cos2a — sin2 a) + + z'2 (R2 sin2 a -cos2 a). F) С другой стороны, плоскость D) имеет в координатах х', у', z' уравнение z'-p = 0, и потому координаты х', у' являются прямоугольными коорди- координатами на этой плоскости, причем, чтобы получить в этих коор- координатах уравнение линии, являющейся пересечением конуса A) с плоскостью D), достаточно в уравнении F) положить z'=p. Таким образом, эта линия будет иметь в координатах х', у' уравнение yf =2x'p(l + R2) cos a sin a + я'2 (Я2 cos2 a — sin2 a) + -r-p2(tf2sin2a-cos2a). G) Перенесем теперь начало координат в точку R sin a — cos a „\ sina ' /' т. е. перейдем от координат х', у' к координатам х", у", выра- выраф р р жающимся формулами R cos a + sin a ' (Заметим, что в силу условия E) величина R cos a ^ sin а от- отлична от нуля.) .- -- — 427
В координатах х", у" линия G) имеет уравнение Раскрыв скобки, мы после очевидных преобразований получим, как легко видеть, следующее уравнение: у = 2Rpx" + x (R2 cos2 a - sin2 a). (8) Сравнив это уравнение с уравнением A0) п. 3 § 1, мы не- немедленно получаем, что каждое коническое сечение является либо эллипсом, либо параболой, либо гиперболой. При этом фокальным параметром этой линии является число Rp, а коэффициент q из уравнения A9) п. 3 выражается фор- формулой q = R2 cos2 a — sin2 a, (9) Уравнение (8) является уравнением параболы тогда и только тогда, когда R2 cos2 a — sin2 a = 0, т. е. когда R = tga. A0) Поскольку фокальный параметр этой параболы равен Rp, мы получаем, следовательно, что каждая парабола является коническим сечением. Более того, ясно, что каждая парабола является сечением произвольного фиксиро- фиксированного конуса A), (т. е. конуса, отвечающего данному фикси- фиксированному R; например, R = 1). Плоскости, на которых данный конус A) высекает пара- параболы, с точностью до параллельности определяются из условия A0). Чтобы получить данную параболу (с данным фокальным параметром), нужно соответствующим образом подобрать рас- расстояние этой плоскости до вершин конуса (например, при R—1 это расстояние должно быть равно фокальному параметру). Выражая из соотношения (9) угол а через величины q и R, мы немедленно получим, что Отсюда следует, что для любого q, удовлетворяющего нера- неравенствам , 428
существует угол а, удовлетворяющий уравнению (9). Следо- Следовательно, каждый эллипс является коническим сечением. Более того, каждый эллипс является сечением произвольного фиксиро- фиксированного конуса A). Для-соответствующей плоскости угол а определяется из со- соотношения A1), а свободный член (расстояние до вершины конуса) должен быть равен -4-, где р — фокальный параметр эллипса. При а > О уравнение A1) имеет решение только при 0<<7<Я2. A2) Поэтому в отличие от парабол и эллипсов не каждая гипербола является сечением данного конуса A). Тем не менее, каждая гипербола является коническим сечением. Действительно, при любом q > О условие A2) удовлетво- удовлетворяется, если R достаточно велико. Замечание 1. Последнее утверждение может быть доказано проще, если заметить, что, скажем, плоскость пересекает конус A) по кривой с уравнением т. е. с уравнением являющимся уравнением гиперболы с полуосями а = -^ и Ь. Резюмируя, мы получаем следующее предложение: Предложение 1. Линия на плоскости тогда и только тогда является коническим сечением, когда она представляет собой либо эллипс, либо параболу, либо гиперболу. Замечание 2. Описанное в замечании 5 п. 3 § 1 постепенное, вытягивание окружности во все более и более «длинный» эллипс, переход этого эллипса в параболу, а затем в гипер- гиперболу мы можем теперь получить, вращая вокруг оси Оу плос- плоскость D). Действительно, при а = -у мы получаем в пересечении с конусом A) Окружность радиуса R. При уменьшении угла а мы будем получать все более и более «длинные» эллипсы, пока, наконец, при a = arctgi? мы не получим параболу. При даль- дальнейшем уменьшении угла а вплоть до а = 0 мы будем 429
Получать гиперболы. Однако всех гипербол мы при этом не полу- получим. Чтобы получить остальные гиперболы, можно, например, оставляя плоскость (с а = 0) неподвижной, постепенно «рас- «раскрывать» конус A), неограниченно увеличивая R. При этом будет оставаться неизменным уже не фокальный параметр, а мнимая полуось гиперболы. (Чтобы сохранить неизменным фо- фокальный параметр, следует одновременно с раскрытием конуса двигать плоскость параллельно самой себе, приближая ее к оси Оу.) 2. Взаимное расположение конических сечений и прямых Эллипсы, гиперболы и параболы задаются уравнениями вто- второй степени, т. е. являются линиями второго порядка. Чтобы не повторяться, нам будет удобно рассмотреть вопрос о взаим- взаимном расположении этих линий и прямых сначала в общем виде, т. е. для любых линий второго порядка (впрочем, как мы увидим в следующей главе, эллипсами, гиперболами и парабо- параболами исчерпываются, по существу, все линии второго порядка). Чтобы найти точки пересечения произвольной прямой x = xo + lt, y = yo + mt с некоторой линии второго порядка F(x, y)s=anx2 + 2al2xy-\-a22y2 + 2al3x + 2a23y + a33 = 0, B) нужно (см. п. 2 § 1 гл. 3) найти корни уравнения F (х0 + It, г/0 + mi) = (anl2 + 2ai2lm + a22m2) f + -f 2 (aulx0 + al2 (ly0 + mx0) + a22my(l + aj + a23m) t + + anx\ + 2a12x0y0 + any\ + 2al3x0 + 2a23y0 + a33 = 0. C) Определение 1. Прямая A) называется прямой неасимптоти- неасимптотического направления (по отношению к линии B)), если aul2 + 2a12lm + «гг^2 ?= 0. Для такой прямой уравнение C) является уравнением второй степени и потому имеет либо два вещественных корня, либо два комплексных (невещественных) корня, либо один двукрат- двукратный вещественный корень. В первом случае прямая A) пере- пересекает линию B) в двух точках, во втором случае прямая A) и линия B) не пересекаются1), а в третьем случае прямая A) и линия B) имеют одну общую точку. ') В вещественной плоскости. В вещественно-комплексной плоскости это- этому случаю отвечают две ксщгшексно-сопряженные точки пересечения, 430
Определение 2. Если уравнение C) имеет один двукратный вещественный корень, т. е. прямая A) неасимптотиче- неасимптотического направления имеет с линией B) одну общую точку, то говорят, что в этой точке прямая A) касается линии B). Замечание 1. В анализе касательная к произвольной линии в точке Ма определяется как предельное положение секущей MoMt (где Mi— вторая точка пересечения секущей с данной линией) при М\ -*¦ Мо. Для линии вто- второго порядка B) точка Мо определяется некоторым корнем to уравнения C), а точка Mi — другим его корнем ti. Стремление точки М4 к точке Мо озна- означает такое изменение коэффициентов уравнений A), при котором корень to уравнения C) не меняется, а корень t{ стремится к корню to. Следовательно, в пределе мы получим такую прямую, которой будет соответствовать дву- двукратный корень уравнения C). Таким образом, данное нами алгебраическое определение касательной (пригодное только для линий второго порядка) является частным случаем общего аналитического определения касательной (пригодного для любых линий). Для прямой асимптотического направления, т. е. для пря- прямой A), направляющий вектор аA,ш) которой удовлетворяет условию anl2 -\-2al2ltn -|- a22tn2 — О, уравнение C) вырождается в линейное уравнение (конечно, если коэффициент при / также не обращается в нуль), и по- потому каждая такая прямая пересекает кривую B) в одной точке1). Тем не менее, эта прямая касательной не считается. Определение 3. Прямая A) называется асимптотой кривой B), если в уравнении C) равны нулю коэффициенты при t2 и при t, а свободный член F (х0, у0) отличен от нуля. Такая прямая не имеет с линией второго порядка ни одной общей точки (Даже в комплексной плоскости). Замечание 2. Это определение асимптот (для линий второго порядка) по форме отличается от определения 2 п. 3 § 1 (при- (пригодного для любых линий). Мы дальше на примерах увидим, что оно и по существу отлично от определения 2 п. 3 § 1 (пря- (прямая, являющаяся асимптотой линии второго порядка в смысле определения 2 п. 3, будет асимптотой и в нашем теперешнем смысле, но не наоборот). Если для прямой A) обращаются в нуль все коэффициенты уравнения C), то такая прямая целиком принадлежит линии B). Подчеркнем, что, таким образом, любая прямая, целиком принадлежащая линии второго порядка, является, по опреде- определению, прямой асимптотического направления. Замечание 3. Термин «прямая асимптотического направле- направления» согласуется с использованием термина «направление», объясненном в подстрочном примечании на стр. 17. Согласно этому примечанию направлением на плоскости (или в про- пространстве) называется класс параллельных прямых. Все пря- прямые одного направления имеют одни и те же направляющие *) Даже в комплексной плоскости!
векторы и потому каждое направление (на плоскости) одно- однозначно характеризуется отношением 1:т координат этих век- векторов (здесь «отношение» /: т следует, конечно, понимать не как число, — иначе будет исключен случай m = 0, —1а как эле- элемент множества RP1; см. п. 6 § 1 гл. 2). На этом основании мы будем иногда использовать сокращенный термин «направление /: т», понимая под этим направление, характеризующееся от- отношением /: т. Замечание 4 (очень важное!). Во всем сказанном выше мы нигде не использовали предположения об евклидовости коор- координат х, у. Поэтому все это сохраняет силу для любых аффин- аффинных координат. Это показывает, что введенные понятия {каса- {касательные, асимптоты и т. д.) принадлежат аффинной геометрии. Для параболы У2 = 2рх, р>0, D) уравнение C) имеет вид тЧ2 + 2 {ту, - 2pl) t + y*- 2рх0 = 0. Следовательно, асимптотические направления характеризуются равенством т = 0. Другими словами, прямая тогда и только тогда имеет относительно параболы асимптотическое направление, когда она параллельна оси этой параболы. Если т = 0 и пгуо — Ipl = 0, то / = 0, что невозможно (век- (вектор а{1, т), по условию, отличен от нуля). Следовательно, асимптот парабола не имеет. Кроме того, парабола не содержит ни одной прямой. Каждая прямая неасимптотического направления (т. е. не параллельная оси Ох) либо вообще не пересекает параболу, либо касается ее в некоторой точке, либо пересекает параболу в двух различных точках. Чтобы выяснить, какой из этих двух случаев имеет место, удобно перейти к уравнению прямой, раз- разрешенному относительно х, т. е. к уравнению вида х = ky + т E) (это всегда возможно, ибо, по условию, рассматриваемая пря- прямая не параллельна оси абсцисс). Тогда ординаты точек пере- пересечения прямой с параболой будут определяться из уравнения т. е. будут выражаться формулой y = pk± V f№ + 2рх. 438
Таким образом, если х < —^г- , то прямая E) с параболой не пересекается', если т=~"^о~> т0 прямая E) касается параболы (в точке с ординатой pk); если х > — -^г—, го прямая E) пересекает параболу в двух различных точках. Согласно принципу обращения обратные утверждения так- также справедливы. В частности, мы видим, что для любого неасимптотического направления прямые этого направления, пересекающие пара- параболу, заполняют целую полуплоскость. Следовательно, у параболы имеются хорды любого наперед заданного неа- неасимптотического направления. Для эллипса -? + -?= 1, а^Ь>0, F) уравнение C) имеет вид Поскольку при (/, пг) ф @, 0) эллипс не имеет прямых асимптотического направления. В частности, эллипс не имеет асимптот и не содержит ни одной прямой. По аналогии со случаем параболы мы предпочтем сейчас исследовать пересечения эллипса с прямыми, задавая их не параметрическими уравнениями A), а уравнениями, разре- разрешенными относительно у. y = kx + x G) (заметим, что если в случае параболы нам было удобно рас- рассматривать прямые, заданные уравнениями E)—разрешен- E)—разрешенными относительно х, — то здесь уже нет в этом необходи- необходимости). Конечно, ограничиваясь прямыми вида G), мы исключаем из рассмотрения прямые х = х0, параллельные оси ординат. Пересечения таких прямых с эллипсом будут поэтому требо- требовать дополнительного исследования. 433
Чтобы найти точки пересечения эллипса F) с прямой G), мы должны решить (относительно х) уравнение х1 , {кх + тJ _ , а2 t- b2 — h т. е. уравнение 1 _i_ k2 \ 2 _±. 2feT _l т2 1 _ п tf"T--bT) х -г -р- * + "р- ~ ' — и- Сделав это, мы получим для абсцисс х точек пересечения фор- формулу: _ - аЧх ± аб /a2fe2 + &г - т2 ~~ 2й2 + б2 Следовательно, если т2 > a2^2 -f- b2, то прямая G) не пересекается с эл- эллипсом; если х2 = a2k2 -f b2, то прямая G) касается эллипса; если х2 < a2k2 -j- b2, то прямая G) пересекает эллипс в двух точках. Для прямых вида х = х0 ординаты точки их пересечения с эллипсом определяются из уравнения у2 и2 а? ~ Ь2 ' т. е. выражаются формулой Следовательно, если \%q\ > а, то прямая х — х0 не пересекается с эллипсом; если \х0 если х0 = а, то прямая х — х0 касается эллипса; < а, то прямая х = х0 пересекает эллипс в двух точках. Мы видим, таким образом, что в любом пучке параллель- параллельных прямых прямые, пересекающие эллипс в двух точках, за- заполняют целую полосу. Следовательно, как и у параболы, у эллипса имеются хорды любого наперед заданного на- направления (заведомо, неасимптотического). Для гиперболы ^1_|1=1( а>0, Ь>0, (8) уравнение C) имеет вид - . 434
Уравнение асимптотических направлений имеет теперь два решения: /: т = ± а : Ъ. Таким образом, гипербола имеет два асимптотических направления, харак- характеризующихся угловыми коэффициентами ± —. Дальнейшее исследование пересечений гиперболы (8) с пря- прямой мы предпочтем, как и в случае эллипса, производить в предположении, что прямая задана уравнением y = kx + x (9) (или уравнением х = х0). Чтобы найти точки пересечения гиперболы (8) с прямой (9), мы должны решить (относительно х) уравнение х2 (kx + xf _, а2 б2 ~1' т. е. уравнение При k = ± — (прямая (9) имеет асимптотическое на- направление) это уравнение вырождается в линейное и им.еет при т ф 0 только один корень т2 + 62 Х~ 2xk ' а при т = 0 вообще не может быть удовлетворено. Это озна- означает, что из всех прямых асимптотических направлений только пря- прямые " а ' " а не пересекают гиперболы, т. е. являются ее асимптотами (в смысле определения 3). Но, как мы знаем, эти прямые являются асимптотами ги- гиперболы и в смысле определения 2 п. 3 § 1. Таким образом, для гиперболы асимптоты в смысле определения 2 п. 3 § 1 совпадают с асимптотами в смысле определения 3. Для прямой (9) неасимптотического направления уравне- уравнение A0) имеет два корня х—~ аЧх ± ab ^%2 ~ fe2 + fe2 435
Следовательно, если х2 < a2k2 — b2, то прямая (9) не пересекает гиперболу, если х2 = a2k2 — b2, то прямая (9) касается гиперболы; если т2 > a2k2 — b2% то прямая (9) пересекает гиперболу в двух точках. Замечание 5. Если \k\<—, т. е. прямая (9) при х = 0 заключена в той паре вертикальных углов, образованных асимптотами, которая содержит гиперболу, то, величина a2k2—b2 отрицательна и потому при любом т возможен лишь третий случай, т. е. прямая y — kx + T пересекает гиперболу. Если же \k\>—. т- е- если прямая (9) при х = 0 заключена в дополнительной паре вертикальных углов, то величина a2k2 — b2 положительна и возможны все три случая. Для прямых вида х = х0 ординаты у их точек пересечения с гиперболой определяются из уравнения a2 b2 ~ lj т. е. выражаются формулой 1 /" 2 2 Следовательно, каждая прямая вида х = х0 является прямой неасимптоти- неасимптотического направления, причем при при при р ¦< а она не пересекает гиперболу, = а она касается гиперболы, а она пересекает гиперболу в двух точках. В частности, мы видим, что в любом пучке параллельных прямых, имеющих неасимптотическое направление, характери- характеризующееся угловым коэффициентом k (случай k = оо, т. е. слу- случай прямых х = х0 не исключается), прямые, пересекающие гиперболу, исчерпывают при | k | < — весь пучок, а при | k | > — заполняют две полуплоскости, отделенные полосой, в которой вообще нет точек гиперболы. В обоих случаях у гиперболы имеются хорды любого наперед заданного неа- неасимптотического направления. 3. Прямые, касающиеся конических сечений Согласно результатам п. 2 прямая. x=ky + r A) тогда и только тогда касается параболы у2 = 2рх, р>0, 436
когда r~ 2 • . При этом координаты точки касания М0(х0, у0) выражаются, очевидно, формулами pk2 , Поэтому уравнение A) мы можем переписать в следующем виде: Тривиальным образом преобразовав это уравнение, мы полу- получим, что касательная к параболе у2 = 2рх в точке М0(х0, у0) имеет уравнение УоУ = Р (х + *о)- ' B) Замечание 1. Строго говоря, мы доказали лишь, что если в точке М0(х0, г/о) существует касательная к параболе, то она выражается уравнением B). Но чтобы доказать существо- существование касательной, достаточно показать, что для любой точки pk2 Мо(хо,уо) параболы существует такое k, что хо = -^— и г/о = pk (ибо тогда прямая с углевым коэффициентом k, проходящая через точку Мо, и будет, по доказанному выше, касательной), а это очевидно (достаточно, например, за k принять число —). Рассмотрим теперь эллипс -? + -?= 1, а>Ь>0. Как мы знаем (см. п. 2), прямая y=-kx + x C) тогда и только тогда касается эллипса, когда | т | = Va2k2 + b2. При этом, согласно формуле (8) п. 2, абсцисса х0 точки каса- касания выражается формулой %, = -a2kx _ -a2k 4 аЧ2 + Ь2 ± fa2k2 + Ь* ' Подставив это выражение в уравнение C), мы найдем и орди- ординату у0 точки касания: 437
i/o b2 Следовательно, -2±= ^-, т. е. Xq а к D) Таким образом, касательная к эллипсу в точке М0(х0, у0) представляет собой прямую, проходящую через точку Мо и имеющую угловой коэффициент D). Поэтому эта касательная -выражается уравнением У — Уо=--^'-^(х~ *ь). E) т. е. уравнением хох уру _ х\ у\ а2 -t- b2 — aa + 62 • о о хо Уо Поскольку -^2" + -р-=1 (ибо точка М0(х0, у0) принадлежит эллипсу), тем самым доказано, что касательная к эллипсу в точке М0(х0, у0) имеет уравнение хох _|_ УоУ 1 /с\ ~~aF "+" b2 ~ 1 ¦ @) Замечание 2. Строго говоря (ср. выше аналогичное заме- замечание 1 для параболы), мы лишь доказали, что если в точке Мо эллипса существует касательная вида у = kx -f- b, то она выражается уравнением F) (или, точнее, уравнением E)). Чтобы доказать существование такой касательной, достаточно, очевидно, доказать, что координаты х0, у0 точки Мо могут быть представлены в виде — a2fe Ь2 ,„- Х У Ь2 1 ' Х° ± Va2k2 + с некоторым k. Мы покажем, что любая точка Мо(хо,уо) эллипса, отличная от вершин (±а,0), допускает представление вида G). Этим и будет доказано, что в точке Мо существует каса- касательная. Пусть сначала г/о > 0. Найдя k из соотношения = Ь2 Уо ~ мы получим, что а г/0 Знак k мы выберем противоположным знаку Хо. Тогда величина -a2k 438
будет иметь тот же знак, что и х0. Поскольку ее квадрат равен a2k2 + b2 =~67' a2k2 + b2 'k2==Vy2°'V~yY~ = этим доказано, что х -__ -a*k 0 Va2k2 + b2 ' Таким образом, при у0 > 0 все доказано. При г/о < 0 мы рассмотрим точку (—х0, —г/0) (также при- принадлежащую эллипсу) и представим ее в виде G) (что, по уже доказанному, возможно). Тогда для точки (ха, г/о) мы, оче- очевидно, получим представление вида G), но уже с отрицатель- отрицательными знаменателями. Тем самым существование касательной вида у = kx -{- т в любой точке М0(х0,у0) эллипса, для которой уаФО, т. е. в лю- любой точке, отличной от вершин (±а, 0), полностью доказано. Что же касается этих вершин, то, согласно сказанному в предыдущем пункте, в них касательные также существуют, но являются уже прямыми вида х = х0, параллельными оси орди- ординат, а именно, прямыми х=±а. (8) С другой стороны, подставив в уравнение F) значения xo=dza, у0 = 0, мы, очевидно, получим как раз уравнения (8). Следо- Следовательно, уравнение F) является уравнением касательной и в каждой из вершин (±а, 0). Таким образом, мы доказали, что касательная к эллипсу существует в каждой его точке Mo{xq, г/о) и выражается уравнением F). Аналогичное утверждение имеет место и для гиперболы -¦?• —-fr=l, «>°. ь>°< т. е. касательная к гиперболе существует в каждой ее точке М0(х0, г/о) и выражается формулой -J- ь$- — ! • (9) В частности, угловой коэффициент этой касательной равен (при г/о Ф 0) Задание. Докажите формулу (9). 439
Определение 1. Линия называется выпуклой, если она распо- расположена по^одну сторону от каждой ее касательной (за исключе- исключением, конечно, точки касания). Предложение 1. Парабола, эллипс и каждая ветвь гипер- гиперболы являются выпуклыми линиями. — Доказательство. Подставляя координаты х, у произ- произвольной точки М(х, у) параболы в уравнение касательной B) и учитывая соотношения у\ = 2рх0 и у2 = 2рх, мы немедленно получим, что УйУ — Р(х + хо) = ~~(у — г/0J. Таким образом, при подстановке координат любой точки М (х, у) Ф Мо(х0, г/о) параболы в уравнение касательной в точке Мо(-х:о, г/о) мы получаем числа одного знака (отрицательные). Поэтому (см. п. 4 § 1 гл. 3) все эти точки расположены по одну и ту же сторону от касательной. Аналогичное утверждение для эллипса и гиперболы проще всего доказать, используя их параметрические уравнения (урав- (уравнения B) п. 2 § 1 и уравнения F) п. 3 § 1). Пусть 0О —значе- —значение параметра, отвечающее точке касания Мо, а б — значение параметра, отвечающее произвольной точке М эллипса. Тогда 0j г/0 = b sin 0О, x = acos6, у = b sin б, и потому -~?-т--^f - 1 = cos 0О cos 9 +sin 0О sinG- I =cos(90-e)- l<0. Таким образом, при подстановке координат произвольной точки М Ф Мо эллипса в уравнение касательной в точке Мо действи- действительно получаются числа одного и того же знака (отрицатель- (отрицательные). Случай гиперболы совершенно аналогичен: J^? _ Ж. _ 1 = ch 60 ch 9 - sh 0О sh 9 - 1 = ch (9 - 60) - 1 > 0, причем равенство нулю имеет место только при б = б0. Очень интересное и важное (для оптики) свойство каса- касательных к коническим сечениям указывается в следующем предложении: Предложение 2. Касательная к эллипсу или гиперболе об- образует равные углы с фокальными радиусами точки касания. Доказательство. Под углом между двумя прямыми мы понимаем здесь острый (точнее, не тупой) угол из двух смеж- смежных углов, образованных этими прямыми. Поэтому для дока-' зательства равенства интересующих нас углов достаточно до- 440 .
?азать, что они имеют равные синусы, т. е. что отношение рас- расстояния от фокуса до касательной к длине соответствующего фокального радиуса — одно и то же для обоих фокусов. Мы знаем (п. 5 § 1 гл. 3), что расстояние от некоторой точ- точки до прямой равно абсолютной' величине числа, получающе- получающегося при подстановке координат этой точки в левую часть нор- нормального уравнения прямой. Поэтому прежде всего мы должны выяснить, что получится при подстановке координат фокусов в нормальное уравнение касательной. Согласно формулам F) и (9) нормальное уравнение каса- касательной к эллипсу или к гиперболе имеет вид где Af > 0— некоторый нормирующий множитель (точное зна- значение которого нам не понадобится). Подставив в левую часть этого уравнения координаты (—с, 0) левого фокуса, мы полу- получим число (-^r-lJN-- абсолютная величина которого равна N . . . — \а + ехо\. Но как для эллипса, так и для гиперболы длина п левого фо- фокального радиуса точки М0(х0, у0) равна |a-j-e.*o|; см. фор- формулы F) п. 2 § 1 и G) п. 3 § 1 (заметим, что в пп. 2 и 3 § 1 мы число Г\ называли просто левым фокальным радиусом). Следовательно, синус угла, образованного левым фокальным радиусом с касательной, равен —. Аналогично, при подстановке координат (с, 0) правого фо- фокуса в левую часть нормального уравнения касательной полу- получается число абсолютная величина которого равна —\а — ехо\ =—г2 (см, формулы G) п. 2 § 1 и (8) п. 2 § 1. Поэтому синус угла, -образованного правым фокальным радиусом с касательной, равен тому же числу —. -х Тем самым предложение 2 полностью доказано. ; 441
В влучае эллипса более внимательный анализ показывает» что при подстановке координат любого из фокусов в нормаль- нормальное уравнение касательной получается отрицательное число. Следовательно (см. п. 5 § 1 гл. 3), оба фокуса эллипса расположены по одну сторону от каса- касательной (а именно, там, где расположен центр эллипса). Отсюда следует, что касательная не пересекает треуголь- треугольник с вершинами в фокусах и точке касания, т. е. содержится в вертикальных углах, внешних к этому треугольнику. Обра- Образуя одинаковые углы со сторонами треу- треугольника, она поэтому является биссектри- биссектрисой этих внешних углов. Таким образом, касательная к эллипсу является биссек- биссектрисой внешних углов, образованных фо- фокальными радиусами точки касания. Из этого свойства касательной вытекает, что лучи, исходящие из фокуса вогнутого эллиптического зеркала, собираются в другом его фокусе. В случае гиперболы касательная (9) пересекает ось Ох в а точке с абсциссой —. Но, как мы знаем, \хй\~^ а, и потому Xo Это означает, что точка пересечения касательной с осью абс- абсцисс лежит между вершинами гиперболы, а потому и между ее фокусами. Другими словами, касательная проходит внутри треугольника, имеющего вершины в фокусах гиперболы и в точке касания. Образуя равные углы со сторонами этого тре- треугольника, она является, следовательно, биссектрисой его внут- внутреннего угла. Таким образом, касательная к гиперболе является бис- биссектрисой внутреннего угла, образованно- образованного фокальными радиусами точки касания. Чтобы получить аналог предложения 2 для случая параболы, мы рассмотрим угол, образованный фокальным радиусом точки касания Мо и перпендикуляром, опущенным из точки ка- касания на директрису параболы (точнее, тот из двух смежных углов, образованных этими прямыми, который является углом треугольника, имеющего вершины в фокусе, в основании пер- перпендикуляра и в точке касания). Острый угол, образованный перпендикуляром и касательной, равен, очевидно, углу, обра- образованному касательной и осью абсцисс, т.е.равен углу при вер- вершине А в треугольнике AFM0, где А—точка пересечения каса- касательной с осью абсцисс, a F — фокус параболы. Но точка А имеет, очевидно, абсциссу —Xq. Поэтому ее расстояние до фо- 442
куса F равно y + ^o (напомним, что х^О), т. е. равно рас- расстоянию 8л*с от точки касания Мо до директрисы, а значит (см. предложение 1 п. 1), равно расстоянию гм от точки Мо до фо- фокуса F. Следовательно, треугольник AFM0— равнобедренный, и потому углы при его вершинах А и М равны. Тем самым доказано, что угол, образованный касательной с перпендику- перпендикуляром, опущенным из точки касания на директрису, равен углу, образованному касательной с фокальным радиу- радиусом точки касания. Другими словами, мы дока- доказали следующее Предложение 3. Касательная к параболе яв- является биссектрисой угла, образованного фокаль- фокальным радиусом точки касания и перпендикуля- перпендикуляром, опущенным из точки касания на дирек- директрису. Замечание 3. В изложенном доказательстве молчаливо предполагалось, что точка Мо отлич- отлична от вершины @, 0) параболы. Однако дока- доказанное утверждение остается справедливым и в этом случае, поскольку касательная к параболе в ее вершине перпендику- перпендикулярна оси параболы. - Из доказанного свойства касательной к параболе следует, что лучи, исходящие из фокуса вогнутого параболического зеркала, отражаются па- параллельным пучком, а именно, параллельно оси зеркала. На этом свойстве параболических зеркал основано устройство прожекторов, зеркальных теле- телескопов, фар автомобилей и т. п. 4. Семейства софокусных эллипсов и гипербол Пусть на плоскости даны две (различные) точки F\ и F2. В этом пункте мы изучим семейство всех эллипсов и гипербол, имеющих точки F\ и Р2 своими фокусами. Выберем прямоугольные координаты х, у так, чтобы точка Ft имела координаты (—с, 0), а точка F2 — координаты (с, 0), где с — половина расстояния между точками Ft и F2. Ясно, что для любого эллипса (и любой гиперболы) с фо- фокусами Fi и F2 прямая, соединяющая фокусы (т. е. ось абс- абсцисс), и их медиатриса (т. е. ось ординат) являются осями симметрии эллипса (гиперболы). Это показывает, что для лю-' бой линии нашего «семейства софокусных эллипсов и гипер- гипербол» координаты х, у являются каноническими координатами. Следовательно, уравнение этой линии мы можем записать в виде У2 II2 — 4- — — 1 А + В — 1> где А я В — некоторые числа, обладающие тем свойством, что 443
Выбрав в качестве «начального» произвольный эллипс где а*-Ь2 = с\ а>Ь>0, и положив Я = А — а2 = В - Ь2, мы можем уравнение произвольной линии рассматриваемого семейства записать в виде а2 + Я ^ где Я— некоторый параметр (отличный от —а2 и —Ь2). Это уравнение обычно называется каноническим уравне- уравнением семейства софокусных эллипсов и гипербол. Возможны следующие случаи: 1. — оо < Я< а2. Уравнение A) не удовлетворяется ни од- одной точкой плоскости. Этот случай нам не интересен и потому в дальнейшем мы будем исключать его из рассмотрения. 2. —а2 •< Я ¦<—Ъ2. Уравнение A) является уравнением ги- перболы с действительной полуосью У а2 + Я и мнимой полу- полуосью ]/— Ъ2 — Я. 3. —Ъ2 <; Я< -f-oo. Уравнение A) является уравнением эллипса с большой полуосью Уа2 + Х и малой полуосью При Я—>— а2-(-0 действительная полуось гиперболы A) не- неограниченно убывает, и эта гипербола все теснее прижимается с двух сторон к оси ординат Оу. Уравнение же (II) при Я—*—й2-f-0 переходит в уравнение х2 = 0 дважды взятой оси Оу. Таким образом, дважды взятую ось ординат можно рас- рассматривать как предельный случай гипербол A) при X—> — —а2 + 0. При Я—>—Ь2 — 0 действительная полуось гиперболы A) приближается к с=Уа2 — Ь2, а мнимая полуось неограни- неограниченно убывает. Сама же гипербола все теснее прижимается с двух сторон к оси абсцисс, из которой вырезан отрезок между фокусами. При Я—>—62-f-0 большая полуось эллипса* A) приближает- приближается к с=Уа2 — Ь2, а малая неограниченно убывает. Сам же эллипс все теснее охватывает отрезок оси абсцисс между фо- фокусами. ') Точнее, равносильное ему (при X ф —а2, —б2) уравнение (б2 + Л) х* + (а8 + Л) у2 = (а2 + X) (б2 + К). 444
Поскольку уравнение A) при Я —*¦ — ft2 дает дважды взятую ось абсцисс у2 = 0, мы можем, таким образом, сказать, что пределом кривых A) при Я-»—Ь2 является дважды взятая ось Ох. При Я —>+°° эллипс A) неограниченно увеличивается, а его эксцентриситет е стремится к единице (эллипс «округ- «округляется»). Предложение 1. Через любую точку плоскости (не принад- принадлежащую координатным осям) проходят точно две кривые рас- рассматриваемого семейства: одна — являющаяся эллипсом, и дру- другая — являющаяся гиперболой. Доказательство. Условие, что линия A) проходит че- через точку (х, у), выражается уравнением х2 ф2 + Я) + у2 (а2 + Я) = (а2 + Я) (Ь2 + Я), т. е. уравнением Я2 + (а2 + Ь2-х2-у2)Х + a2b2 - Ь2?- а2у2 = 0. Поскольку (а2 + Ь2 - х2 - у2J - 4 (a2b2 - b2x2 - а2у2) = = (b2 — а2-{-х2 — у2J + 4х2у2, это уравнение имеет два вещественных корня x + у* - а2 - Ъг ± У(Ь2 -а2+х2- у2J + 4х2у2 ,Os Л[, 2 2 ' V ' при х Ф 0 и у ф 0 отличных от — а2 и — Ъ2. Так как при х.ф 0 и у ф 0 функция / (я) = я2 + (а2 + б2 - л2 - у2) Я + а262 - б2*2 - а2г/2 положительна при Я = — а2 (равна (а2— Ь2)х2), отрицательна при Я = — Ь2 (равна (Ь2 — а2)у2) и положительна при Я-*+оо, то один из корней B) расположен на отрезке (—а2, —Ь2) (и по- потому ему соответствует гипербола), а другой — на отрезке (—Ь2, +оо) (и потому ему соответствует эллипс). Определение 1. Числа A,i и Яг, определенные формулой B), называются эллиптическими координатами (на плоскости). Чтобы найти выражения прямоугольных координат х, у че- " рез эллиптические координаты Яь Яг, положим в тождестве сначала Я = —а2, а затем Я = —Ь2. Тогда мы получим, что 445
откуда следует, что ..2. a2 — 6г (б2 у ~~ а2-б2 Обратим внимание на то, что эти формулы определяют лишь квадраты прямоугольных координат, так что для каждой пары значений Я,,, Я,2, ~а2<Х1<~Ь2, -&2<Л2<+ оо, мы получим по четыре точки. Собственно говоря, этого и сле- следовало ожидать, поскольку софокусные эллипс и гипербола пе- пересекаются в четырех точках. Таким образом, эллиптические координаты являются «настоящими» координатами только в каждом координатном квадранте. Координатными линиями, т. е. линиями l\ — const и К2 = = const, для эллиптических координат являются, по определе- определению, софокусные эллипсы и гиперболы (линии Х\ = const — ги- гиперболы, а линии Яг = const— эллипсы). Как мы знаем (см. п. 3), касательная к эллипсу одинаково наклонена к фокаль- фокальным радиусам точки касания и является внешней биссектрисой угла между ними, тогда как для гиперболы касательная яв- является внутренней биссектрисой угла между фокальными ра- радиусами точки касания. Отсюда следует, что софокусные эллипс и гипербола пересекаются под прямым углом. Координаты на плоскости называются ортогональными, если их коорди- координатные линии пересекаются под прямым углом. Таким образом, последнее утверждение означает, что эллиптические координаты являются ортогональными координатами. Мы не можем здесь вдаваться в исследование многих за- замечательных свойств эллиптических координат. Отметим лишь следующее свойство «равнодиагональности»: любой «криволинейный четырехугольник», образованный двумя линиями Я] = const и двумя линиями Я2 = const, имеет диагонали равной длины. Упражнение. Докажите свойство равнодиагональности. Замечание 1. Иногда эллиптическими координатами назы- называются величины и и v, связанные с координатами Х\ и Яг со- соотношениями Va2 + Я] « Уа1 + %2 smu = -—J—-, chti = - —- С С <, < < оо. 446
Задание. Докажите, что прямоугольные координаты х, у выражаются через координаты и a v по формулам х = с sin и ch v, у = ± с cos и sh v. Координатная линия и = const является гиперболой ? tf_ У2 _] 1J С' SllT U С* COSJ U а координатная линия v = const — эллипсом х2 . У2 _=i c2ch2t) с2 sh2 и Упражнение. Рассмотрите аналогичным образом семейства софокусных парабол и постройте соответствующие параболические координаты. 5. Диаметры конических сечений Рассмотрим произвольное семейство параллельных хорд па- параболы у2 = 2рх, т. е. семейство отрезков, получающихся при пересечении параболы прямыми x = ky + x с одним и тем же k и различными т (конечно, удовлетворяю- удовлетворяющими условию х >—^т-; см. п. 2). Координаты (хь у{) и (%2, Уг) концов любой хорды этого семейства связаны соотно- соотношениями у1 = 2рх1, у2 = 2рх2, = k (первые два соотношения выражают тот факт, что концы хорды принадлежат параболе, а третье — что хорда имеет угловой ко- коэффициент k). Следовательно, т. е. и потому Но число у' g y" является, как мы знаем, ординатой середины отрезка с концами в точках (хи у{) и (х2,у2), т. е. середины рассматриваемой хорды. Тем самым мы доказали, что 447
середины параллельных хорд параболы (имеющих относи- относительно оси ординат угловой коэффициент k) принадлежат пря- прямой У ™J>b, параллельной оси параболы. Определение 1. Если для некоторой линии и некоторого семейства параллельных хорд этой линии середины хорд семей- семейства принадлежат одной прямой, то эта прямая называется диа- диаметром данной линии, сопряженным с направлением данных хорд. В этой терминологии доказанное свойство параболы озна- означает, во-первых, что с любым неасимптотическим направлением сопряжен неко- некоторый диаметр параболы, и, во-вторых, что все диаметры параболы параллельны ее оси (и, таким об- образом, имеют асимптотическое направление). Кроме того, поскольку в виде у = pk можно (при соответ- соответствующем выборе k) представить уравнение любой прямой, па- параллельной оси параболы, мы видим, что любая прямая, параллельная оси параболы, является ее диаметром, а поскольку представление этой прямой в виде у = pk един- единственно, то любой диаметр параболы сопряжен с однозначно определен- определенным (неасимптотическим) направлением. О диаметре, сопряженном с асимптотическим направлением, говорить не приходится, поскольку хорд асимптотического на- ¦ правления не существует. Определение 2. Диаметр линии называется главным, если он перпендикулярен хордам, с направлением которых он сопряжен. Поскольку любой диаметр параболы параллелен оси Ох, каждый главный диаметр параболы (если он существует} дол- должен быть сопряжен с хордами, параллельными оси Оу. Но для таких хорд k — О, и потому диаметр имеет уравнение у = О, т. е. является осью параболы. Таким образом, парабола обладает единственным главным диаметром, яв- являющимся ее осью. Не нужно думать, что любая точка диаметра является се- серединой некоторой хорды. Действительно, тот факт, что точка (х, у) диаметра у = pk является серединой некоторой хорды (с угловым коэффициентом k) означает, что у— 448
"где #i, */i. и х2, у2 — такие числа, что - у* В силу тождества , (У1+У2\2 2 / л \ 2 / мы имеем: *~~ 2 "~ 2р ""¦ откуда непосредственно вытекает, что точка (х, у) диаметра у = pk тогда и только тогда является серединой некоторой хорды (с угловым коэффициентом k), когда x>^f. B) Действительно, если точка (х, у) является серединой хорды, Dk2 Dk2 то x>j-k- согласно формуле A). Обратно, если x>J-^-t то из соотношения A) мы получим для у' . У2 вещественное зна- значение у р [х — ¦^к~) • Решая затем уравнения мы найдем ординаты концов хорды, серединой которой яв- является данная точка (х,у). Таким образом, мы видим, что на диаметре у = pk, сопряженном с хордами, имеющими угловой коэффициент k, середины этих хорд заполняют полу- полупрямую, характеризующуюся неравенством B). Иногда диаметром параболы, сопряженным с хордами данного направ- направления, называют геометрическое место середин этих хорд, т. е. полупря- полупрямую B). Концевая точка (% Уо) = ("X". Pk) полупрямой B) принадлежит параболе (ибо у2 = 2рх0), и прямая, проходящая через эту точку параллельно хордам рас- рассматриваемого направления, имеет уравнение , 15 М, М. Постников 449
Поскольку у0 = pk, мы можем это уравнение переписать в еле* дующем виде; Уо . Уо * = 1ГУ + Хо-Т, т. е. в виде x = fy-x0. Сравнив это уравнение с уравнением касатедьной к параболе в точке (х0, г/о) (см. уравнение B) п. 8), мы немедленно полу- получим, что они выражают одну и ту же прямую. Тем самым до- доказано, что касательная к параболе параллельна хордам, с направле- направлением которых сопряжен диаметр, проходящий через точку ка- касания. Похожие результаты имеют место для эллипса и ги- гиперболы. Например, рассмотрим для гиперболы -g---fl=l, а>0, Ь>0, C) семейство параллельных хорд, получающихся при пересечении гиперболы прямыми г/ = kx-\- х с одним и тем же k Ф ± — и различными т (конечно, удов- удовлетворяющими условию т2 > a2k2 — b2; см. п. 2). Координаты (лгь у{) и {х2, г/2) концов любой хорды этого семейства связаны соотношениями ii_ii I _fi_il i hZlL ь a2 b2 ~ ' a2 b2 ~~ l> x2-xi (первые два соотношения выражают тот факт, что концы хорды принадлежат гиперболе, а третье — что хорда имеет данный угловой коэффициент k). Следовательно, т. и е. потому *+ < 2 V\ 4- Чг + Уг 2 А ь2 а" 2 г/2 б2 а2 _ б2 л: 1 1 + 2 •) 2 х2 • Это показывает, что середины параллельных хорд гиперболы (имеющих неасим- неасимптотическое направление, характеризуемое угловым коэффи- 450
циентом k) принадлежат прямой проходящей через центр гиперболы. Другими словами, прямая D) является диаметром гиперболы C), сопряжен- сопряженным с хордами, имеющими угловой коэффициент к. Середины хорд, параллельных одной из координатных осей, принадлежат, очевидно, другой координатной оси. Следова- Следовательно, координатные оси (оси симметрии гиперболы) также яв- являются ее диаметрами, причем каждый из них сопряжен с хор- хордами, имеющими направление другого. Таким образом, единственными прямыми, проходящими че- через центр гиперболы, которые, возможно, не являются его диа- диаметрами, являются прямые с угловым коэффициентом вида Ъ2 -и Ь ., ¦ —jr, где к = ± угловой коэффициент некоторого асим- асимптотического направления. Но ясно, что эти прямые и на са- самом деле не являются диаметрами, поскольку хорд асимптоти- асимптотического направления не существует и, тем более, не существует их середин. т-т и _¦_ Ь Ь2 Ь Поскольку при k = ± — число —гг- равно ± — , мы видим, (X и к и, таким образом, что этими исключительными прямыми являются асимптоты гиперболы. Тем самым, мы доказали, что любая прямая, проходящая через центр гиперболы и не яв- являющаяся ее асимптотой, является диаметром гиперболы. Определение 3. Два направления, характеризующиеся угло- угловыми коэффициентами k и k', называются сопряженными (от- (относительно гиперболы C)), если kk' = ?. E) Кроме того, направления координатных осей также считаются сопряженными. В этой терминологии доказанное выше утверждение озна- означает, что диаметром гиперболы, сопряженным с хордами данного не- неасимптотического направления, является прямая, проходящая через центр и имеющая (неасимптотическое\) направление, со- сопряженное с данным. Диаметры, имеющие сопряженные направления, называются сопряженными. Ясно, что отношение сопряженности направлений (и диаметров) сим- симметрично, т. е. если одно направление сопряжено с другим, то второе сопряжено с первые 15* 4SJ1
Действительно, для направлений координатных осей это очевидно, а для остальных направлений непосредственно вы- вытекает из симметричности формулы E) относительно k и k'. Другими словами, середины хорд, параллельных некоторому диаметру, принад- принадлежат диаметру, параллельному хордам, середины которых ле- лежат на данном диаметре. Коротко можно сказать, что из двух сопряженных диаметров каждый сопряжен с хор- хордами, параллельными другому диаметру. При k = k' равенство E) возможно только при k=± —. Следовательно, асимптотические направления гиперболы (и только они) со- сопряжены сами себе. На этом основании асимптоты гиперболы иногда называются ее «само- «самосопряженными диаметрами». Напомним, что диаметр называется главным, если хорды, с которыми он сопряжен, ему перпендикулярны. Таким обра- образом, диаметр гиперболы тогда и только тогда является главным, когда он перпендикулярен сопряженному диаметру. В частности, диаметр, сопряженный с главным диаметром, сам является главным. Одна пара главных диаметров очевидна: это — пара, состоя- состоящая из осей гиперболы. Поскольку (при k, k' Ф 0, <х>) условие перпендикулярности не может быть выполнено одновременно с условием сопряжен- сопряженности никаких других главных диаметров гипербола не имеет. Таким образом, оси гиперболы и только они являются главными диаметрами гиперболы. Пусть Мо(хо,уо)—произвольная точка диаметра D). Пря- Прямая, .проходящая через точку Мо и имеющая угловой коэффи- коэффициент k, выражается уравнением где to = yo — kxo. Но мы знаем (см. п. 2), что эта прямая тогда и только тогда пересекает гиперболу в двух точках, когда .2 -
т. е. когда Wb>. . F) Следовательно, это неравенство является необходимым и до- достаточным условием того, чтобы точка М0(х0, у0) принадлежала некоторой хорде гиперболы, имеющей угловой коэффициент k (и потому, являясь точкой диаметра D), была серединой этой хорды). Но, по условию, _ ь2 и потому , _ a2k2 - b2 У о — кх0 -^1— хо- Подставляя это выражение в неравенство F) (и опуская ин- индексы), мы окончательно получаем, что точка М(х,у), принадлежащая диаметру, сопряженному с хордами, имеющими угловой коэффициент k, тогда и только тогда является серединой одной из этих хорд, когда Х > аЧ2Ъ2 • (П При \k\<— это неравенство удовлетворяется тождествен- тождественно, т. е. при всех значениях х, а при | k \ > — оно определяет на диаметре D) две полупрямые, получающиеся при удалении из диаметра некоторого отрезка, концами которого являются точки с координатами — a'fe _ Ъ2 ,„¦, ±У a2k2 — b2 ±у a2k2 — Ь2 удовлетворяющими уравнению гиперболы C). Тем самым до- доказано, что на каждом диаметре гиперболы точки, являющиеся середи- серединами хорд, имеющих направление, сопряженное с направлв' нием диаметра, либо заполняют весь диаметр, либо принадле- принадлежат внешности отрезка, высекаемого на диаметре гиперболой. Заметив, что при | k \ < — диаметр D) вообще не пересе- пересекает гиперболы и потому в этом случае «внешность отрезка, вы- высекаемого на диаметре гиперболой» представляет собой весь диаметр, мы получаем, что во всех случаях можно считать, что середины указанных .хорд заполняют внешность отрезка, высекаемого на диаметре гиперболой. Без труда проверяется, что это утверждение остается вер- верным и для диаметров, не представимых в виде D), т. е. для осей гиперболы. При этом на действительной оси середины \ - " 453
перпендикулярных хорд заполняют внешность отрезка с кон- концами в вершинах гиперболы, а на мнимой оси исчерпывают всю эту ось. Согласно формуле A0) п. 3 угловой коэффициент касатель- касательной в каждой из точек с координатами (8) равен а2 г/о Таким образом, так же как для параболы, касательная к гиперболе параллельна хордам, с направле- направлением которых сопряжен диаметр, проходящий через точку ка- касания. Очевидно, что это утверждение справедливо и для диамет- диаметров, являющихся осями гиперболы. Совершенно аналогичные результаты имеют место и для эллипса -? + i?-=l, a>b>0. (9) Во-первых, диаметром эллипса (9), сопряженным с хордами, имеющими угловой коэффициент k, является прямая Ух проходящая через центр эллипса, причем любая прямая, про- проходящая через центр эллипса, является ее диаметром. В соответствии с формулой A0) направления, характеризуе- характеризуемые угловыми коэффициентами k и k', называются сопряжен- сопряженными относительно эллипса (9), если kk' = —%r (И) (направления координатных осей также, конечно, считаются со- сопряженными). Так же как и для гиперболы, отношение сопряженности направлений (и диаметров) вза- взаимно, т. е. из двух сопряженных диаметров каждый сопряжен с хордами, параллельными другому диаметру. Самосопряженных направлений (диаметров) эллипс не имеет. Для эллипса, являющегося окружностью (а = Ь), условие (И) сопряженности совпадает с условием kkf=-\ A2) перпендикулярности. Цоэтому диаметры окружности тогда и только тогда сопряжены, когда они перпендикулярны, ' 464
В частности, любой диаметр окружности является главным диаметром. Напротив, поскольку при а>Ь условия A1) и A2) одно- одновременно выполнены быть не могут, единственными главными диаметрами эллипса, не являю- являющегося окружностью, являются его оси. Простое вычисление показывает, что ' точка М(х,у) диаметра A0) тогда и только тогда является серединой одной из сопряженных хорд, когда У a k + A3) Неравенство A3) определяет на диаметре некоторый отре- отрезок, концы которого принадлежат эллипсу. Далее, так же как для гиперболы, касательная к эллипсу параллельна хордам, с направлением которых сопряжен диаметр, проходящий через точку касания. Задание. Докажите (аналитически) все сформулированные выше свой- свойства диаметров эллипса. Замечание 1. Все основные свойства диаметров эллипса можно получить чисто геометрически без всяких выкладок, вос- воспользовавшись тем, что любой эллипс получается сжатием окружности к ее диаметру, и заметив, что при любом сжатии "параллельные прямые переходят в параллельные прямые, а се- середины отрезков — в середины отрезков. Действительно, тот факт, что середины параллельных хорд окружности принадле- принадлежат одной прямой, очевиден. С другой стороны, любое семей- семейство параллельных хорд эллипса получается при рассматри- рассматриваемом сжатии из некоторого семейства параллельных хорд окружности. Следовательно, геометрическое место середин па- параллельных хорд эллипса является образом при этом сжатии геометрического места середин параллельных хорд ,окружности и потому принадлежит некоторой прямой. С этой точки зрения, сопряженные диаметры эллипса — это диаметры, являющиеся образами при сжатии перпендикулярных диаметров окружно- окружности, а главные диаметры — это перпендикулярные диаметры, остающиеся после сжатия перпендикулярными, и т. д. 6. Теоремы Аполлония Согласно формуле (8) п. 2 диаметр пересекает эллипс ? + -&=!> а>Ь>0, 455
в точках с абсциссами аЬ х= ± и, следовательно, с ординатами abk _ У~~ VaW + b2 ' Рассмотрим теперь сопряженный диаметр b2 Поскольку k' = —-^, то Следовательно, этот сопряженный диаметр пересекает эллипс в точках с координатами [ a2k __ Ъ2 Х~~ — York2 -f Ъ2 ' У h Y~a2k2 + b2 ' Определение 1. Отрезок, соединяющий центр эллипса (или гиперболы) с некоторой его (ее) точкой, называется радиусом эллипса (гиперболы). Определение 2. Два радиуса эллипса, имеющие сопряжен- сопряженные направления, называются сопряженными. Из только что доказанных формул непосредственно выте- вытекает, что квадрат а'2 длины а' радиуса, имеющего угловой ко- коэффициент k, выражается формулой 2 , / abk \2 _ аг62A + к2) Va2k2 + Ь2 I \ Ya2k2 -j- b2 1 a2k2 + b2 а квадрат b'2 длины b' сопряженного радиуса — формулой й,2 / a2k \2 , / b2- Следовательно, ,2 _ 2 , Тем самым мы доказали, что сумма площадей квадратов, построенных на произвольной паре сопряженных радиусов эллипса, равна сумме площадей квадратов, построенных на его полуосях: а'2 -Ь Ь'г = а2 + Ь\ Найдем теперь площадь параллелограмма, построенного на паре сопряженных радиусов. Как мы знаем (п. 4 § 6 гл. 1), 456
площадь параллелограмма, построенного на векторах (а1, а2) и (б1, б2), равна абсолютной величине определителя а1 а2 Ь1 Ъ2 В нашем случае этот определитель имеет вид ab abk и потому равен V~a2k2 + b2 a2k b2 1 a2k b2 b2 ab a2k2 + b2 -b2 b2 = — ab. Тем самым мы доказали, что площадь параллелограмма, построенного на произвольной паре сопряженных радиусов эллипса, равна площади ab пря- прямоугольника, построенного на его полуосях. Чтобы доказать аналогичные теоремы для гиперболы, удоб- удобно наряду с данной гиперболой рассматривать также гиперболу г/2_ a>0, b>0, а > 0, b > О, О) B) jym которой каноническими координатами являются перестав- переставленные координаты х, у. Определение 3. Гипербола B) называется гиперболой, со- сопряженной с гиперболой A). Ясно, что центр, асимптоты и основной прямоугольник сопряженной гиперболы B) совпадают с ¦ центром, асимптотами и основным прямоугольником исходной гиперболы A). Кроме того, действительной (мнимой) осью гиперболы B) является мни- мнимая (действительная) ось гиперболы A). В частности, . , вершинами гиперболы B) являются точки (О, Ь) и @, —Ь) оси ординат. Наконец, легко видеть, что гиперболы A) и B) имеют одни и те же диаметры, причем два диаметра тогда и только тогда сопряжены относительно гипер- гиперболы A), когда они сопряжены относительно гиперболы B).
Действительно, тот факт, что диаметры обеих гипербол сов- совпадают, очевиден (ибо диаметром является любая прямая, про- проходящая через центр гиперболы и отличная от ее асимптот, а центр и асимптоты у наших гипербол совпадают). Далее, условие сопряженности диаметров у = kx и у = k'x относи- относительно гиперболы A) имеет вид Чтобы написать условие сопряженности этих диаметров относи- относительно гиперболы B), мы должны их уравнения переписать в виде х = -гу и х = -ггу (ибо абсциссой канонической системы координат гиперболы B) является координата у, а ординатой — координата х) и учесть, что а является мнимой полуосью гипер- гиперболы B), а Ъ —действительной. Поэтому условие сопряженно- сопряженности рассматриваемых диаметров относительно гиперболы B) имеет вид 2. ' __ а2 к ' к' ~~ Ъ2 ' что, очевидно, совпадает с C). Наконец, оси координат, оче- очевидно, сопряжены относительно обеих гипербол. Диаметр y = kx пересекает гиперболу A), если \k\< — , и пересекает сопря- сопряженную гиперболу B), если \k\>—. Поскольку для сопря- сопряженного диаметра y = k'x неравенство | k' | < — имеет место тогда и только тогда, когда | k | > —, мы видим, следовательно, что для любой пары сопряженных диаметров один из диаметров пересекает исходную гиперболу, а другой — сопряженную. Согласно формуле A1) п. 2 диаметр y = kx, Ul<~ пересекает гиперболу A) в точках с абсциссами и, следовательно, с ординатами ^ abk У~ ~ Yb2 - ak1 458
Поэтому квадрат а'2 длины а' радиуса гиперболы A), имею- имеющего угловой коэффициент k, выражается формулой ,2 / ab \2 . / abk \2 a2b2(\+k2) \ fb2 — a2k2 I \ fb2 — a2k2 I b2 — a2k2 Аналогично, сопряженный диаметр у = k'x пересекает со- сопряженную гиперболу B) в точках с абсциссами аЬ Va2k'2 - Ь2 и ординатами Ьг Но, по определению, k' = —ц-, и потому Следовательно, координаты точек пересечения сопряженного диаметра с сопряженной гиперболой могут быть записаны в следующем виде: _ У — ± где в = *+1» если ^ > 0, и е = —1, если k < 0. Эти формулы получены в предположении, что сопряженный диаметр имеет уравнение вида у = k'x, т. е. в предположении, что k ф 0. Но при k = 0 сопряженным диаметром является ось ординат, пересекающая сопряженную гиперболу в точках @, ±Ь). Поэтому полученные формулы справедливы и при k = 0, если только мы условимся, что в этом случае е = 1 (или, что приводит к тому же результату, е = —1). Определение 4. Радиусы сопряженных гипербол A) и B), имеющие сопряженные направления, называются сопряженными (ср. определение 2). Из доказанных выше формул непосредственно вытекает, что квадрат Ь'2 длины Ь' радиуса гиперболы B), сопряженного с радиусом гиперболы A), имеющим угловой коэффициент k, выражается формулой , ,2 = / а21 k | \2 , / eb2 [ Vb2 2k2 ) V - a2k2 ) \ Y& - a2k2 I b* - a?k2 Следовательно, /2 i __ a<k2 + 64 - a2b2 A + k*) ,2 2 о — a — ^2 _ fl2?2 — о — a . 459
Таким образом, - разность площадей квадратов, построенных на любой паре сопряженных радиусов, равна разности площадей квадратов, построенных на полуосях гиперболы: Наконец, площадь параллелограмма, построенного на паре сопряженных радиусов, равна абсолютной величине определи- определителя ab , abk * - a2k2 b2 - a2k2 eb2 b2 - a2k2 = eab (напомним, что, по определению, k\k\ = tk2). Таким образом, как и для эллипса, площадь параллелограмма, построенного на любой паре' со- сопряженных радиусов гиперболы, равна площади аЪ прямо- прямоугольника, построенного на полуосях гиперболы. Доказанные свойства сопряженных радиусов эллипсов и ги- гипербол известны как теоремы Аполлония. § 3. ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 1. Эллипсоиды Определение 1. Эллипсоидом называется поверхность, вы- выражающаяся в некоторой системе прямоугольных координат х, у, z уравнением вида iJ + -fS- + |-=l, a>b^c>0, A) где а^- Ь^- с> 0. Эта система координат называется канони- канонической (относительно данного -эллипсоида), а уравнение A) z называется каноническим уравне- уравнением эллипсоида. ,, При а = Ь = с уравнение A) является уравнением сферы радиуса а с центром в начале координат. Таким образом, сфера является частным случаем эллипсоида. Пусть а = Ь. Перейдем к ци- цилиндрическим координатам р, <р, г (см. п. 5 § 1 гл. 2), согласованным с координатами х, у, z. Эти координаты связаны с координатами х, у, z формулами X 460 -
^Йодставив эти выражения В: уравнение A) (при $=-Ь$, мы во- лучим уравнение 9 1 9 ' * • а2 с2 Это уравнение не зависит от ф, и потому вместе с некоторой точкой Мо(ро, фо,, z0) ему удовлетворяет также любая точка М (ро, ф, Zq) , где ф произвольно. Геометрически это означает, что вместе с точкой Мо эллипсоиду принадлежит и любая точка М, получающаяся из точки Мо поворотом вокруг оси Oz. Поскольку плоскость у = 0 пересекает эллипсоид A) по эллипсу -?i-j_ —=1 а2 ' с2 ' тем самым доказано, что эллипсоид а2 с2 получается из эллипса расположенного в плоскости Oxz, вращением вокруг оси Oz. Это дает уже вполне отчетливое представление о форме эллипсоида B) (называемого обычно эллипсоидом вращения). Аналогично, при а — с или Ъ = с эллипсоид A) также является эллип- эллипсоидом вращения. ' ' Например, при b = с он получается из эллипса ¦Л „2 а2 -Т- 62 — 1» расположенного в плоскости Ол:г/, вращением вокруг оси О#. Замечание 1. Если в плоскости Охг задана произвольная кривая f(x, г) = О, то при вращении этой кривой вокруг оси Oz получается поверхность, имею- имеющая в цилиндрических координатах р, <р, z уравнение /(p.z) = 0, C) .не зависящее от ср, Таким образом, уравнение C) является общим уравне- уравнением поверхностей вращения. В координатах к, у, г оно имеет вид f(Vx2+y\ г)-0. Чтобы представить себе вид ^произвольного эллипсоида A), рассмотрим преобразование пространства, переводящее произ- произвольную точку М(х,у, z) в точку М'(х',у', г') с координатами х' = х, 461
где & —некоторое положительное число. Это преобразование называется сжатием к плоскости Oxz с коэффициентом k. Поскольку при таком сжатии точка (х, у, z) получается из точки (х, ~, z\, эллипсоид вращения B) переходит в резуль- результате этого сжатия в поверхность с уравнением х2 у2 z2 а2 + (kaJ + с2 Ь' т. е. (при k = —) в эллипсоид A). Таким образом, произвольный эллипсоид A) получается из эллипсоида вра- вращения B) сжатием к плоскости Oxz с коэффициентом —. Замечание 2. Эллипсоид вращения B) получается из сферы сжатием пространства к плоскости Оху с коэффициентом —. Следовательно, любой эллипсоид получается из некоторой сферы двумя сжа- сжатиями к взаимно перпендикулярным плоскостям. Другой способ (называемый методом «плоских сечений») представить себе форму эллипсоида A) заключается в том, чтобы рассмотреть его сечения плоскостями, параллельными координатным плоскостям. Рассмотрим, например, плоскости z = h, параллельные ко- координатной плоскости Оху. При пересечении этой плоскостью эллипсоида A) получается линия, имеющая (в координатах х, у, являющихся координатами на плоскости Оху) уравнение т. е. уравнение х2 . у2 _ 1 JL а2 "Г" Ъ2 ~ l ~ а2 ' Г Это показывает, что при | h | > с плоскость z = h не пересекает эллипсоид A); при \п\ = с плоскость z = h имеет с эллипсоидом A) одну общую точку (соответственно @, 0, с) или @, 0, — с)); при \h\<Zc плоскость z = h пересекает эллипсоид A) по эллипсу с полуосями -./i h2 «.-i/i h2 y 1 —-#, by 1 —-p-. наибольшими (и равными а и Ь) при /г = 0 и монотонно умень- уменьшающимися до нуля, когда \п\ возрастает от нуля до с. 462
Аналогично показывается, что при | h | > b плоскость у = h не пересекает эллипсоид A); при \h\ = b плоскость у = h имеет с эллипсоидом A) одну общую точку {соответственно @,6,0) или @,-6,0)); при |/г|<6 плоскость у = h пересекает эллипсоид A) по эллипсу с полуосями У h2 .,/, h2 ~W СУ Х~~? • наибольшими {и равными а и с) при h = 0 и монотонно умень- уменьшающимися до нуля, когда \п\ возрастает от нуля до Ь; и что при | h | > а плоскость х = а не пересекает эллипсоид A); при | h | = а плоскость х = а имеет с эллипсоидом A) одну общую точку (соответственно (а, 0, 0) или (—а, 0, 0)); при | h | <; а плоскость х = а пересекает эллипсоид A) по эллипсу с полуосями JF А2 наибольшими (и равными b и с) при h = 0 и монотонно умень- уменьшающимися до нуля, когда \h\ возрастает от нуля до а. Все это дает уже вполне удовлетворительное представление о форме эллипсоида A). В частности, мы видим, что эллипсоид A) целиком расположен внутри прямоугольного параллелепипеда с центром в точке @,0,0), с гранями, парал- параллельными координатным плоскостям, и со сторонами, имею- имеющими длины 2а, 2Ь и 2с. Можно еще добавить, что так как уравнение A) не ме- меняется при изменении знаков координат х, у, г, то координатные плоскости являются плоскостями симметрии эллипсоида A), а начало координат — его центром симметрии. Упражнение. Докажите, что если числа а, 6 и с все различны, то никаких других плоскостей симметрии эллипсоид A) не имеет. 2. Двуполостные гиперболоиды Определение 1. Двуполостным гиперболои- гиперболоидом называется поверхность, имеющая в не- некоторой системе прямоугольных координат уравнение вида i?_4-j? — = —1 (]) а2 Ь2 с2 ' v где а^Ь > 0 и с > 0. Эта система координат называется ка- канонической (относительно данного гиперболоида), а уравне- уравнение A) называется каноническим уравнением двуполостного ги- гиперболоида. 463
Замечание 1. Весьма часто каноническим уравнением дву- двуполостного гиперболоида называется его уравнение вида х2 у2 г2 _, ~tf~ Ь2 ~~Р"-1- Каноническое в этом смысле уравнение отличается от канони- канонического уравнения в нашем смысле только обозначением ко- координат. При а = Ь уравнение двуполостного гиперболоида в ци- цилиндрических координатах р, ф, z имеет, очевидно, вид Р2 Jl_ 1 Отсюда вытекает (см. в п. 1 аналогичное рассуждение для эл- эллипсоида), что гиперболоид х* + у2 ?1 (9) 1 {г получается из гиперболы X2 а2 X2 а2 расположенной в плоскости Oxz, вращением вокруг оси Oz (являющейся ее действительной осью). Это дает уже вполне отчетливое представление о форме ги- гиперболоида B) (называемого обычно двуполостным гипербо- гиперболоидом вращения). При сжатии к плоскости Oxz с коэффициентом k гипербо- гиперболоид B) переходит, очевидно, в поверхность с уравнением a2 ^ (kaJ c2 " т. е. (при k=-j) — в гиперболоид A). Таким образом, произвольный двуполостный гиперболоид A) получается из двуполостного гиперболоида вращения B) сжатием к плоско- плоскости Oxz с коэффициентом —. Исследуя форму гиперболоида A) методом плоских сечений, мы немедленно получим, что в пересечении с плоскостью z = h гиперболоид A) дает линию с уравнением ~W "*" Т2 ~ Т5" ~ >' т. е. с уравнением щ
Следовательно, при | h | < с плоскость z = h не пересекает гиперболоид 'A); при ]h\= с плоскость z = h имеет с гиперболоидом A) одну общую точку (соответственно @,0, с) или @,0,-^с)); ' при \h\> с плоскость z = h пересекает гиперболоид A) по эллипсу с полуосями г- 1 . монотонно возрастающими (соответственно от а и Ъ до "+о°), когда \h\ возрастает от с до -f-oo. В пересечении с плоскостью у = h гиперболоид A) дает ли- линию с уравнением т. е. с уравнением _2 ..2 = 1. Следовательно, любая плоскость y = h пересекает гиперболоид A) по ги- гиперболе с полуосями /1 i h* монотонно возрастающими (соответственно от с и а до 4-°°)» /сог^а |/г| возрастает от нуля до +<х>. Аналогично показывается, что любая плоскость х = h пересекает гиперболоид A) по ги- гиперболе с полуосями + ¦—, Ь' монотонно возрастающими (соответственно от с и b до когда \п\ возрастает от нуля до +оо. Все это дает уже вполне удовлетворительное представление о форме двуполостного гиперболоида A). В частности, мы видим, что, так как ни одна плоскость z — h с |/г|<с не пересекает гиперболоид и так как он имеет точки по обе стороны от каждой из этих плоскостей, то гиперболоид A) состоит из двух не связанных друг с дру- другом частей, расположенных соответственно в полупространствах г ^ с и г ^ —с. Этим и объясняется эпитет «двуполостный» в названии ги- гиперболоида A). 455
Заметим в заключение, что по тем же соображениям, что и для эллипсоида, координатные плоскости являются плоскостями симметрии ги- гиперболоида A), а начало координат — его центром симметрии. Упражнение. Докажите, что при а > b никаких других плоскостей сим- симметрии гиперболоид A) не имеет. 3. Однополостные гиперболоиды Определение 1. Однополостным гиперболоидом называется поверхность, имеющая в некоторой системе прямоугольных ко- координат уравнение вида а2 "*" Ь1 с2 ~~ ' A) где а^6>0 и с > 0. Эта система координат называется ка- канонической (относительно данного гиперболоида), а уравнение A) называется каноническим уравнением однополостного ги- гиперболоида. При а = b уравнение однополостного гиперболоида в ци- цилиндрических координатах р, ф, z имеет вид Следовательно (ср. пп. 1 и 2), гиперболоид у сг с' получается из гиперболы B) расположенной в плоскости Oxz, вращением вокруг оси Oz (являющейся ее мнимой осью). Это дает уже вполне отчетливое представление о форме ги- гиперболоида B) (называемого обычно однополостным гипербо- гиперболоидом вращения). При сжатии к плоскости Oxz с коэффициентом k гипербо- гиперболоид B) переходит, очевидно, в поверхность с уравнением V2 .,2 -2. (kaJ т. е. (при k = —\ — в гиперболоид A). Таким образом, произвольный однополостный гиперболоид A) получается из однополостного гиперболоида вращения B) сжатием к пло- плоскости Oxz с коэффициентом —. 466
Исследуя форму гиперболоида A) методом плоских сече- сечений, мы немедленно получим, что в пересечении с плоскостью z = h гиперболоид A) дает линию с уравнением ,,2 1Л я2 "г т. е. с уравнением Y2 ,,2 1Л я2 "г b2 ~ "т" с2 ' х2 и2 х j У 1 2 ~ / / ГГ\2 1# Следовательно, любая плоскость z = h пересекает гиперболоид A) по эл- эллипсу с полуосями т С2 . монотонно возрастающими (соответственно от а и b до Ц-оо), когда \п\ возрастает от нуля до 4-°°- Определение 2. Эллипс получающийся при h = 0 (и расположенный в плоскости называется горловым эллипсом однополостного гиперболой- да A). В пересечении с плоскостью у = h гиперболоид A) дает ли- линию с уравнением т. е. либо с уравнением (если |Л| ¦< Ь), либо с уравнением „2 „2 i?--^ = ° C) (если |/г| = Ь), либо, наконец, с уравнением ,2 V2 \2" == (если |А|>й). Заметив, что точка (х, у) тогда и только тогда удовлетво- удовлетворяет уравнению C), когда она удовлетворяет либо уравнению 467
либо уравнению мы получаем, следовательно, что при \h\<zb плоскость у = h пересекает гиперболоид A) по гцперболе с полуосями b2 ' монотонно убывающими (соответственно от а и с до нуля), когда \h\ возрастает от нуля до Ь; при |/г| = 6 плоскость y = h пересекает гиперболоид A) по прямым х_ ? _ п а е~ ' - + - = 0 а + с U' E) у = п; при \h\">b плоскость у = h пересекает гиперболоид A) по гиперболе с полуосями cy^-i, ay^~i, монотонно возрастающими от нуля до +°°. когда \h\ возра- возрастает от b до -|-оо. Заметим, что действительные (мнимые) оси гипербол, по- получающихся при \h\<Cb, параллельны мнимым (действитель- (действительным) осям гипербол, получающихся при \h\> b. Аналогично показывается, что при \h\<.a плоскость x = h пересекает гиперболоид A) по гиперболе с полуосями монотонно убывающими (соответственно от b и с до нуля), когда \ h \ возрастает от нуля до а; при \п\—-а плоскость x = h пересекает гиперболоид A) по прямым Ъ с и' и Ъ + с и> x — h x = h; при |/г|>а плоскость x = h пересекает гиперболоид A) по гиперболе с полуосями 468
монотонно возрастающими от нуля до -foo, когда |Л| возра- возрастает от а до -f-oo. Все это дает вполне удовлетворительное представление о форме однополостного гиперболоида A). Можно также добавить, что по тем же соображениям, что и для эллипсоида и двуполостного гиперболоида. координатные плоскости являются плоскостями симметрии однополостного гиперболоида A), а начало координат — его центром симметрии. Упражнение. Докажите, что при а> b никаких других плоскостей сим- симметрии гиперболоид A) не имеет. 4. Прямолинейные образующие однополостного гиперболоида Обратим внимание на тот замечательный факт, что, не- несмотря на «искривленность», однополостный гиперболоид A) п. 3 содержит целые прямые: например, прямую D) п. 3. Бо- Более того, легко видеть, что этот гиперболоид содержит целое семейство таких прямых. Действительно, если гиперболоид яв- является гиперболоидом вращения, то он, переходит в себя при любом повороте вокруг оси Oz. Поэтому при этом повороте прямая D) п. 3 переходит в некоторую прямую, также при- принадлежащую гиперболоиду. Таким образом, мы можем ска- сказать, что гиперболоид вращения «заметается» (или «зачерчи- «зачерчивается») некоторой прямой1), вращающейся вокруг оси Oz. При сжатии к плоскости Oxz прямые переходят, очевидно, в прямые, а вращение —в некоторое непрерывное преобразова- преобразование пространства (описывать которое более подробно нам нет нужды). Следовательно, мы видим, что . произвольный однополостный гиперболоид заметается неко- некоторой непрерывно перемещающейся прямой. Определение 1. Поверхность в пространстве, являющаяся геометрическим местом точек некоторой непрерывно переме- перемещающейся прямой, называется линейчатой поверхностью. Таким образом, мы доказали, что каждый однополостный гиперболоид является линейчатой поверхностью. Определение 1 линейчатой поверхности является не столько строгим ма- математическим определением, сколько наглядным описанием. Однако его можно без особого труда превратить во вполне'строгое определение. С этой целью мьгзаметим, что любая прямая в пространстве однозначно определена, если известна ее точка М»(хо, уо, Zo) и ее направляющий вектор a(l,m,n). Поэтому, чтобы задать некоторое непрерывное семейство прямых, зависящих, скажем, от параметра т, пробегающего отрезок [xi, Тг], достаточно 4) То, что при этом получается весь гиперболоид, наглядно очевидно. Строгое доказательство будет дано ниже. 469
задать непрерывные функции *оМ, У а (т), zo(t), / (т),  (т). п (т), * первые три из которых для любого т определяют точку на прямой семейства, соответствующей данному значению параметра, а остальные три — направ- направляющий вектор этой прямой (при этом, конечно, требуется, чтобы 1(хJ + т(хJ + гс(тJ Ф 0). Тогда произвольная точка, принадлежащая не- некоторой прямой этого семейства, будет иметь координаты вида х = х0 (т) + / (т) t, y = yo(t) + m(T)t, B) Z=Z0(x) + П (t) /, где t — некоторое число (параметр на прямой). Теперь мы видим, что данное выше наглядное определение линейчатой поверхности может быть переформу- переформулировано следующим образом: Поверхность называется линейчатой, если ее можно задать параметри- параметрическими уравнениями вида B), в которых параметр t изменяется от —оо до +оо, а параметр х— на некотором отрезке [xi, Тг]. При этом, конечно, пред- предполагается, что все функции A) непрерывны и что I (тJ + пг (тJ + п (тJ ф 0 ни при одном % е [to, xi\. Определение 2. Прямые, из которых состоит данная линей- линейчатая поверхность, называются ее прямолинейными образую- образующими. Уравнение каждой прямолинейной образующей полу- получается из уравнений B) при некотором фиксированном т. Таким образом, уравнения B) мы можем рассматривать не только как уравнения линейчатой поверхности, но и как уравнения произвольной прямо- прямолинейной образующей этой поверхности (в зависимости от того, считаем ли мы параметр т изменяющимся или фиксированным). С наглядной точки зрения прямолинейные образующие — это мгновенные положения прямой, перемещением которой об- образована данная линейчатая поверхность. Замечание 1. Подчеркнем, что понятие «прямолинейной об- образующей» связано со способом построения поверхности (или, иными словами, с выбором ее уравнения B)). Может слу- случиться, что та же поверхность будет образована движением со- совсем другой прямой, т. е. будет геометрическим местом точек совсем другой системы прямолинейных образующих. В этом слу- случае иногда говорят, что рассматриваемая поверхность дважды линейчата: (Мыслимы, конечно, и поверхности, линейчатые трижды, четырежды и т. д.) Возможно также, что поверхность (не обязательно линейчатая) содержит некоторую прямую, не включающуюся ни в какое семейство прямолинейных образую- образующих. Такую прямую прямолинейной образующей считать, ко- конечно, нельзя. Тем не менее во многих учебниках аналитической геометрии прямолиней- прямолинейная образующая определяется, просто как прямая, принадлежащая поверх- 470
иости. Это может быть оправдано тем, что для интересующих аналитическую геометрию поверхностей второго порядка каждая прямая, принадлежащая поверхности, является ее прямолинейной образующей (но уже для поверх- поверхностей третьего порядка это не так). Наше доказательство того, что одноиолостный гиперболоид является линейчатой поверхностью, было! по существу, чисто синтетическим. Однако его легко можно алгебраизировать, и тем самым не только заново доказать линейчатость однополост- ного гиперболоида, но и найти его параметрические уравнения вида B), т. е., иными словами, найти параметрические уравне- уравнения его прямолинейных образующих. Для гиперболоида вращения B) п. 3 прямая D) п. 3 (при h = b) имеет, очевидно, параметрические уравнения вида х = at, У — Ь, z = ct. При повороте вокруг оси Oz на угол т, сопровождаемом сжа- сжатием к плоскости Oxz с коэффициентом —, эта прямая, как можно показать, переходит в прямую с уравнениями х = — a sin т + a cos т • t, j/ = bcosT + b sinr. • t, , C) z = ct. Мы не будем этого доказывать, а непосредственно проверим, что при любом т прямая C) целиком расположена на гипер- гиперболоиде A), т. е. что при любых t и т числа х, у, z, даваемые уравнениями C), удовлетворяют уравнению A) п. 3 однопо- лостного гиперболоида. Но, действительно, (— a sin т + a cos т • <J , (b cos т + b sin т • tJ (cf) . Чтобы доказать, что уравнения C) на самом деле опреде- определяют семейство прямолинейных образующих гиперболоида, остается только показать, что для любой его точки M(x,y,z) можно подобрать такие (однозначно определенные) значения т и /, что ее координаты имеют вид C). Другими словами, нужно показать, что уравнения C) однозначно разрешимы относи- относительно т и / (при условии, что х, у и z "удовлетворяют уравне- уравнению A) п. 3). Но последнее уравнение C) однозначно определяет t: 471
Подставляя^ это значение в первые два уравнения C), мы по- получаем уравнения — = — sin т + cos т • —, -|- = cost+ sin т • —. Следовательно, cost = - *z ¦ У ас'*' b sinr = be X а Поскольку 1 + — + с2 — +4-\ ¦?=---\ -V 1+-V эти соотношения однозначно определяют угол т. Тем самым мы доказали, что уравнения C) являются уравнениями некоторого семейства прямолинейных образующих однополостного гиперболоида, т. е. при любом т они представляют собой уравнения некоторой прямолинейной образующей гиперболоида A), п. 3, и любая прямолинейная образующая (принадлежащая рассматривав' мому семейству) получается таким образом. Иначе можно сказать, что уравнения C) являются параметрическими уравнениями од- однополостного гиперболоида, имеющими вид B). Заметим теперь, что вместо того, чтобы исходить из прямой D) п. 3, мы можем с тем же правом отправляться от прямой E) п. 3 (при h = b). В результате мы получим другую си- систему прямолинейных образующих однополостного гиперболоида с уравнениями х = a sin т + a cos т • t, y = — b cos т + b sin т ¦ t, z = ct. D) Задание. Докажите это утверждение. Предложение 1. Однополостный гиперболоид является дважды линейчатой поверхностью: одно семейство его прямолинейных образующих имеет вид C), а другое — вид D). Доказательство. В свете сказанного выше нам остается только доказать, что не существует третьего семейства прямолинейныхобразующих, т. е., что . через"любую точку однополостного гиперболоида A) п. 3 проходят точно две прямые, целиком лежащие на этом гипер-- Щ
болоиде: одна, являющаяся прямолинейной образующей из Се-" мейства C), а другая, являющаяся прямолинейной образующей из семейства D). Пусть М(хо,уо,го) — произвольная точка однопблостного ги- гиперболоида A) п. 3 и пусть — произвольная прямая, проходящая через эту точку. Чтобы эта прямая целиком принадлежала гиперболоиду, необходимо и достаточно, чтобы тождественно по t имело место равенство (xp + ltJ (yo + mtf (zp + niJ , а2 + b2 с2 ~ 1> т. е. равенство / I2 . ш2 п2 \ ,2 . 9 / 1ха . пгуо пго\. что и возможно тогда и только тогда I2 а2 1х0 , . т2 + ъ2 -' туо п , когда 2 20 п Из первого уравнения мы видим, что п ф 0 (ибо, в про- противном случае, / = т = 0, что невозможно). Поскольку числа /, т, га нам заданы только с точностью до пропорциональности, мы, следовательно, без ограничения общности можем считать, что п = с. Но тогда для I n m мы получим уравнение общее решение которого имеет вид / = a cos т, 0<т<2я. т = о sin т, Таким образом, параметрические уравнения рассматривае- рассматриваемой прямой мы можем записать в следующем виде; х = х0 + a cos т • t, у^Уо + bsinx-t, F) Z = Zq + Ct, а соотношение E) (которое мы еще не использовали) — в виде ^cosx + -f sinx = ^. G) 473 ,
Перейдем теперь ё уравнениях F) от параметра t к параметру ff f I Zp i —t-t- e . Тогда мы получим уравнения -— cos т • —j + a cos т • t', 'о • ^0 lit," j./ /Q\ Ь S1 с ) ~*~ T» w г = ct'. Но согласно соотношениям G) COST • (— — COST • —j = ^_SinT + A —.COS2T) —= откуда вытекает, что ^o *^o • Уо ¦ *ч) /п\ COS T • — — U Sin Т, г —^ Sin Т * — WCOST, (У) а с о с v ' где ы — некоторое число. Поэтому уравнения (8) приобретают вид х = — аи sin т + a cos т • /', у = bu cos т + b sin т • Г, z = ct'. Сравнивая эти уравнения с уравнениями C) и D), мы немед- немедленно замечаем, что при м = ±1 они совпадают с этими урав- уравнениями (с точностью до обозначения параметра /'). Поэтому для завершения доказательства нам остается лишь показать, что и = ±1, т. е. что и2 == 1. Но из соотношений (9) непосредственно вытекает, что т. е. что «2 = -^ + ТГ + -^-2— [— COST + — Учитывая соотношения G) и тот факт, что точка Мо (х0, yQ, z0) принадлежит гиперболоиду A) п. 3, мы получаем, следова- следовательно, что 2 9 ,,2 _ ^0. 4- — — — — 1 " — а2 "Г Ь2 с2 ~ 2 2 0. 4- — а2 "Г Ь2 с2 Тем самым предложение 1 полностью доказано. 474
Замечание 2. Обратим внимание на то, что мы фактически заново вывели уравнения C) и D) прямолинейных образую- образующих однополостного гиперболоида. Этот вывод уравнений C) и D) более, громоздок, но он доказывает, что никаких других пря- прямолинейных образующих однополостный гиперболоид не имеет. Замечание 3. Если не гнаться 3« параметрическими уравне- уравнениями прямолинейных образующих (а также за доказатель- доказательством отсутствия третьего семейства прямолинейных образую- образующих), то можно предложить очень короткий, хотя и искусствен- искусственный, вывод их непараметрических уравнений (что одновременно еще раз докажет линейчатость однополостного гиперболоида). Очевидно, что уравнение однополостного гиперболоида мож- можно записать в следующем виде: Это наводит на мысль рассмотреть для произвольного числа k Ф 0 прямую с уравнениями Ясно, что уравнение A0) является следствием уравнений A1). Это означает, что любая точка прямой A1) принадлежит ги- гиперболоиду A0). Кроме того, для любой точки М0(х0,у0,zo) гиперболоида A0) прямая A1) с A2) 1 Уо проходит через эту точку. Этим доказано, что прямые A1) составляют семейство прямолинейных образую- образующих однополостного гиперболоида. Замечание 4. При — ^- = 0 формула A2) дает для k значение О, а с а при 1 Щ- = 0 — «значение» оо. Ясно, что этим случаям отвечают прямые X а 1 г с + JL т b = 0, = 0, и 1 X а _ У Ь , z Q = 0, = 0, которые мы также должны считать принадлежащими нашему семейству. Чтобы получить этим методом второе семейство прямоли- прямолинейных образующих гиперболоида, следует рассмотреть 475
прямые Задание. Докажите, что прямые A3) действительно являются прямоли- прямолинейными образующими однополостного гиперболоида, отличными от обра- образующих A1). Уравнения A1) и A3) не очень удобны для исследования взаимного расположения прямолинейных образующих. Поэтому мы будем пользоваться исключительно параметрическими урав- уравнениями C) и D). Впрочем, целесообразно и эти уравнения несколько преобразовать. Каждая прямая C) пересекает плоскость 2 = 0, т. е. гор- горловой эллипс ¦Л „2 а2 I- Ьг — * гиперболоида, в точке с координатами х0 = — a sin т, Уо = Ь cos т. Поэтому a cos т = -г у0, Ь sin т = х0. Следовательно, уравнения C) мы можем переписать в следую- следующем виде: x=xo + jyot, У = Уо—$х<*. A4) z = ct. Тем самым доказано, что уравнения A4) представляют собой параметрические урав- уравнения некоторой прямолинейной образующей однополостного гиперболоида, проходящей через точку (х0, у0) горлового эл- эллипса. Аналогично показывается, что параметрические уравнения другой прямолинейной образую- образующей, проходящей через точку (х0, г/о) горлового эллипса, имеют вид а . х == хо 6 У° ' У^Уо + ^t, A5) z — ct. ¦ Задание. Выведите уравнения A5).
Теперь у нас все готово для доказательства основных свойств прямолинейных образующих однополостного гипербо- гиперболоида. Свойство ,1. Через любую точку гиперболоида проходит одна и только одна прямолинейная образующая каждого семейства. Это свойство мы уже доказывали (и притом трижды).Здесь мы его привели лишь для полноты списка свойств. Свойство 2. Любые две образующие однополостного гипер- гиперболоида, принадлежащие разным семействам, компланарны (лежат в одной плоскости). Действительно, пусть образующая первого семейства про- проходит через точку (хо,уо) горлового эллипса, а образующая вто- второго семейства — через точку (#i,#i)- Тогда согласно уравне- уравнениям A4) и A5) направляющий вектор первой образующей имеет вид (а ь \ \Ъ Уо> ~Их°' с)' а направляющий вектор второй образующей — вид ~ТУи ~аХи Но мы знаем (п. 2 § 3 гл. 3), что две прямые, имеющие соот- соответственно направляющие векторы (/о, ^о, «о) и {l\,mun\) и проходящие через точки (хо,Уо,го) и (Xi,yuzi), тогда и только тогда компланарны, когда определитель — Xq У\ — Уо %\ za 10 та п0 U т, л, равен нулю. В нашем случае этот определитель имеет вид Хп С - -г Ц> — Х\ с i " а ' и, следовательно, на самом деле равен нулю (поскольку Т + "ТГ = 1 И Тем самым свойство 2 полностью доказано. Можно еще заметить, что рассмотренные образующие тогда и только тогда параллельны, когда а Ь а Ь 477-
т. е. когда х 1 = — х0, У\ = — Уо- Это означает, что две прямолинейные образующие однополостного гипербо- гиперболоида, принадлежащие разным семействам, тогда и только тогда параллельны, когда они проходят через диаметрально противоположные точки горлового эллипса. Рассмотрим теперь образующие, принадлежащие одному семейству. Свойство 3. Две образующие однополостного гиперболоида, принадлежащие одному семейству, скрещиваются {не лежат в одной плоскости). Действительно, пусть (х0, г/о) и( #i,j/i) — точки горлового эл- эллипса, через которые проходят данные образующие. Ясно, что эти точки различны, поскольку через любую точку горлового эллипса проходит только одна образующая каждого семейства. Пусть, для определенности, рассматриваемые образующие при- принадлежат семейству A4). Тогда их направляющие векторы имеют вид Ь \ (a b # х с У * и потому условие их скрещивания состоит в том, чтобы не был равен нулю определитель 1 ха У\ — Уо О а Ь ~Ь~Уо J хо с а_ _Ь_ U У\ 1 ^ Но поскольку точки (х0, г/о) и (хи у{) различны, этот определи- определитель на самом деле отличен от нуля. Для прямолинейных образующих A5) доказательство ана- аналогично. Замечание 5. Свойство 3 можно доказать без всяких вы- выкладок, если заметить, что прямолинейные образующие одного семейства не могут пересекаться (ибо тогда вопреки свойству 1 через некоторую точку гиперболоида проходили бы две обра- образующие этого семейства). Если же они параллельны, т. е. век- векторы A6) коллинеарны, то и потому х0 = xit уо = г/i и, значит, эти образующие совпа- совпадают. :¦
Свойство 4. Никакие Три образующие одного семейства прямолинейных образующих однополостного гиперболоида не параллельны одной и той же плоскости. Действительно, пусть (х0, у0), {хиу{) и (х2, у%) — точки гор- горлового эллипса, через которые проходят данные три образую- образующие одного и того же семейства. Согласно свойству 1 эти точки попарно различны, а согласно формулам A4) и A5) направ- направляющие векторы этих образующих имеют вид — b \ I ^ a — ь \ +% с) [±У +7*ь с)> A7) -% с), [±ТУь (+±u +lx Л Поскольку три прямые тогда и только тогда параллельны одной плоскости, когда их направляющие векторы компланарны, для доказательства свойства 4 достаточно доказать, что век- векторы A7) не компланарны, т. е. определитель, составленный из их координат, не равен нулю. Но этот определитель равен 1 1 1 х0 х2 Уо У\ Уч и потому на самом деле отличен от нуля (ибо точки (хо, г/о), (хиУ\) и (х2,у2) не коллинеарны). Замечание 6. Из доказанных свойств прямолинейных обра- образующих вытекает красивое геометрическое описание произволь- произвольного однополостного гиперболоида. ls Возьмем три произвольных прямолинейных образующих од- однополостного гиперболоида, принадлежащих одному семейству. Согласно свойству 2 любая образующая другого семейства пе- пересекает каждую из этих образующих в некоторой точке (или ей параллельна, т. е. пересекает ее в несобственной точке). Но ясно, что если нам даны три скрещивающиеся прямые, то существует только одна прямая, проходящая через данную точку одной прямой и пересекающая две другие прямые (воз- (возможно, в несобственной точке). Следовательно, прямолинейные образующие некоторого семейства однозначно характеризуются как прямые, пересекающие три произвольно выбранные обра- образующие другого семейства. Это означает, что произвольный однополостный гиперболоид представляет со- собой геометрическое место точек, принадлежащих прямым, пе- пересекающим (возможно, в несобственной точке) каждую из трех фиксированных скрещивающихся прямых, не параллель- параллельных никакой плоскости. Упражнение. Докажите, что какие бы три скрещивающиеся прямые, не параллельные ни одной пло- плоскости, мы пи взяли, геометрическое место точек, принадлежащих прямым, пересекающим эти прямые, является однополостным гиперболоидом. 479
5. Гиперболические параболоиды Определение 1. Гиперболическим параболоидом называется поверхность, имеющая в некоторой прямоугольной системе ко- координат уравнение вида у-V-2*. A) где р > 0, q > 0. Эта система ко- координат называется канониче- канонической (относительно данного па- параболоида), а уравнение A)— каноническим уравнением. Представить себе форму гиперболического параболоида до- довольно трудно. Проще всего это можно сделать методом пло- плоских сечений. Плоскость z = h пересекает параболоид A) по линии с уравнением т. е. либо с уравнением (если h > 0), либо с уравнением Р ~ Я'~ (если h = 0), либо, наконец, с уравнением = 1 у* (V-2qhJ (если h < 0). v В первом случае эта линия является гиперболой с полуосями Y2hp, V^hq, во втором случае она состоит из двух прямых — ¦ —¦'¦ —— о и У _ V~p VI а в третьем случае — снова является гиперболой, но уже с по- полуосями V—2hq, Y—2hp. 480
Таким образом, при h < 0 плоскость 2 = h пересекает гиперболический па- параболоид (I) по гиперболе с полуосями монотонно убывающими от 4-°° до нуля, когда h возрастает от —оо до нуля; при h = О плоскость z = h пересекает гиперболический па- параболоид A) по паре пересекающихся прямых ? У л * I у — О V р У~я ' и Vp Vq 2 = 0 2 = 0; при h > 0 плоскость z = h пересекает гиперболический па- параболоид A) по гиперболе с полуосями монотонно возрастающими от нуля до Ц-оо, когда h возрастает от нуля до +°°- Обратим внимание на то, что действительные (мнимые) оси гипербол, получающихся при h <C 0, параллельны мнимым (дей- (действительным) осям гипербол, получающихся при h > 0. Плоскость у = h пересекает параболоид A) по линии с уравнением ~ Я~~ Z' т. е. с уравнением Это означает, что плоскость у = h пересекает гиперболический параболоид A) по параболе с фокальным параметром р, с вершиной в точ- 0, п, — -д—I ы с «рогами», направленными в положительном направлении оси Oz {«вверх»). Аналогично показывается, что плоскость х=>п пересекает гиперболический параболоид A) по параболе с фокальным параметром q, с вершиной в точке /г2' (h, 0, y~) u c «рогами», направленными в отрицательном на- направлении оси Oz («вниз»). Отметим, что вершины парабол, получающихся в пересече- пересечении с плоскостями y = h (плоскостями лг = /г), принадлежат параболе, получающейся в пересечении с плоскостью х — О (соответственно с плоскостью у = 0). 16 М, М. Постников 481
При известном усилии пространственного воображения те- теперь уже можно представить себе форму гиперболического па- параболоида. Он «поднимается» в положительном и отрицатель- отрицательном направлениях оси Ох и «опускается» в положительном и отрицательном направлениях оси Оу. Вблизи начала коорди- координат он имеет форму седла. Поскольку уравнение A) не меняется при изменении зна- знаков у х и у (но не у z!), координатные плоскости Oxz и Oyz являются плоскостями симметрии гиперболического параболоида. Упражнение. Докажите, что кроме плоскостей Oxz и Oyz других плоско- плоскостей симметрии гиперболический параболоид не имеет. Не имеет он и центра симметрии. Предложение 1. Гиперболический параболоид является два- дважды линейчатой поверхностью. Доказательство. Пусть Мо (х0, у0, z0) — произвольная точка параболоида A) и х = х0 + It, 2 = 20 + nt — произвольная прямая, проходящая через точку M0(xq, у0, z0). Чтобы эта прямая целиком принадлежала параболоиду, необ- необходимо и достаточно, чтобы тождественно по t выполнялось равенство т. е. равенство что возможно только тогда, когда Р я ~ р Отсюда мы находим: Поскольку величины /, т и. п нам заданы только с точностью до пропорциональности, мы без ограничения общности можем считать, что 1=У р. Тем самым" доказано, что прямая, проходящая через точку М {х0, уо, z0) гиперболиче- гиперболического параболоида A), тогда и только тогда целиком принад- 482
лежит этому параболоиду, когда она может быть задана, пара- параметрическими уравнениями либо вида x = xo+V~pt, B) либо вида x = xu+Y~pt, V C) Займемся сначала уравнениями B). Чтобы преобразовать их к более удобному виду, мы заметим, что точке пересечения прямой B) с плоскостью 2 = 0 отвечает'значение параметра * zq L /_*°_ i У» 0 ^i^ 'r V p Vq Поэтому, если мы перейдем к новому параметру f = t — t0, то уравнения B) перейдут в уравнения т. е. в уравнения (мы опускаем в обозначении параметра штрих) „ = _ у y-p vi Следовательно, полагая 16* ¦ t 483-
мы окончательно получим из уравнений B) уравнения x), E) z = 2xt. Таким образом, мы показали, что при некоторых значениях параметра т (а именно, при значениях, представимых форму- формулой D)) уравнения E) являются параметрическими уравне- уравнениями прямой, целиком принадлежащей параболоиду A). При этом для любой точки Мо (х0, уо, z0) параболоида существует (единственное) значение параметра т (а именно, значение, да- даваемое формулой D)), при котором прямая E) проходит че- через точку Мо(хо, уо, г0). Все это означает, что уравнения E) являются параметрическими уравнениями не- некоторого семейства прямолинейных образующих гиперболиче- гиперболического параболоида A). Выясним теперь возможные зн-ачения параметра т (и за- заодно его геометрический смысл). Пусть сначала т ф О, Тогда прямая E) пересекает плоскость г = 0 в точке, отвечающей значению параметра t = 0, т. е. в точке с координатами (Ур т, — У q т, 0). Но ясно, что эта точка принадлежит прямой Vp Vq ¦ F) 2 = 0 (лежащей, как мы знаем, на параболоиде A); см. выше) и число т является координатой этой точки на прямой F) в ко- координатной системе с репером Ое, где О — точка @,0,0), а е — направляющий вектор (У р, — Уq, О). При т = 0 прямая E) целиком расположена в плоскости 2 = 0 (она является пер- первой из указанных выше прямых, по которым плоскость 2 = 0 пересекает параболоид A)) и пересекает прямую F) в точке @,0,0). Поэтому и р этом случае точка пересечения прямых E) и F) имеет координату т в координатной системе на пря- прямой F) с репером Ое. Возьмем теперь на прямой F) произвольную точку Мо и проведем через нее образующую E). По только что сказанному параметр т, соответствующий этой образующей, будет равен координате точки Мо на прямой F) в репере Ое. Так как эта координата может принимать любые значения, то в уравнениях E) параметр т может принимать любые зна- значения от —с» до +оо. Одновременно мы доказали, что гиперболический параболоид A) заметается движущейся прямой, все время пересекающей фиксированную прямую F). 484
Чтобы найти второе семейство прямолинейных образующих гиперболического параболоида, можно было бы повторить шаг- за шагом все наши рассуждения, но отправляясь не от прямой B), а от прямой C). Однако теперь можно поступить проще и написать по аналогии с уравнениями E) уравнения x-t), G) z = 2т/. При любых т и / числа х, у, z, получающиеся из этих уравне- уравнений, удовлетворяют уравнению A) параболоида, ибо (т + tf — (т - tf = 4т*. Поэтому при любом т, —с» «< т < + оо, уравнения G) яв- являются параметрическими' уравнениями некоторой прямой, це- целиком лежащей на параболоиде. Следовательно, чтобы дока-, зать, что уравнения G) являются уравнениями прямолинейных образующих, остается только проверить, что для любой точки М0(х0, yo, 2о) параболоида можно подобрать такое т, что со- соответствующая прямая G) проходит через эту точку, т. е. что координаты х0, Уо, ?о получаются при некотором значении па- параметра t. Другими словами, нужно доказать, что для любой точки Мо(хо, Уо, 2о) параболоида A) уравнения G) (в которых положено х = х0, у = Уо, z = Zo) однозначно разрешимы отно- относительно т и t. Но это очевидно: решение дается формулами / *° | У° \ / _L Тем самым мы доказали, что уравнения G) также являются параметрическими уравне- уравнениями некоторого семейства прямолинейных образующих гипер- гиперболического параболоида A). Задание. Проверьте, что каждая прямая G) пересекает прямую _ L_ = o Vp Vq (8) 2 = 0 и что параметр т является не чем иным, как координатой точки пересечения прямых G) и (8) в координатной системе на прямой (8) с репером Ое', где О, _как и выше,— точка @,0,0), а е —направляющий вектор {V~p, Уя, 0) прямой (8). Поскольку найденные два семейства прямолинейных ?бра- зующих явно различны( направляющие векторы (Yp, ~ Vq> 2т) и (Yp, — Y°> 2т) этих образующих даже не коллинеарны) и поскольку третьего семейства прямолинейных образующих не существует (ибо по доказанному в начале этого пункта 485
через любую точку параболоида A) проходят только две пря- прямые, целиком лежащие на этом параболоиде), тем самым пред- предложение 1 полностью доказано. Замечание 1. Если не доказывать отсутствия третьего семейства прямо- прямолинейных образующих, то все сказанное выше можно существенно сокра- сократить, .начав сразу же с уравнений E) и доказав, что они дают прямолиней- прямолинейные образующие (так же как мы это выше сделали для уравнений G)}. Правда, при этом остается неясным, как до этих уравнений догадаться. (Впрочем, догадаться на самом деле совсем не сложно, если помнить фор- формулу (т + tJ — (т — tJ = 4xi.) Очень просто уравнения обоих семейств прямолинейных об- образующих (правда, в непараметрическом виде и без доказа- доказательства отсутствия третьего семейства) можно получить (ср. п. 4), представив уравнение A) в виде --Mf— y—\—2z V~ql\V~P VI )~ Тогда ясно, что любая прямая с уравнениями (9) __ у г^ V р Vq где k Ф О, а также прямая с уравнениями Vp Vq ' (9а) 2 = 0 (соответствующими уравнениям (9) при k = 0) целиком расположены на параболоиде A). Кроме того, при k= — t-^--\--Ss=.) прямая (9) (или (9а), если k = 0) прохо- 2 \у р У qI дит через произвольную наперед данную точку М (х0, г/о, ?о) этого параболоида. Следовательно, прямые (9) (вместе с прямой (9а)) составляют семейство прямолинейных образующих гиперболического параболоида A), Аналогично показывается, что прямые х у _о. V~р * V1 вместе с прямой _? У_ — о \П> VI ' 2=6 486
составляют другое семейство прямолинейных образующих ги- гиперболического параболоида (I). Свойства прямолинейных образующих гиперболического па- параболоида во многом аналогичны свойствам прямолинейных образующих однополостного гиперболоида (см. п. 4). Свойство 1. Через любую точку гиперболического парабо- параболоида проходит одна и только одна образующая каждого се- семейства. Это свойство мы выше уже доказали. Свойство 2. Любые две образующие гиперболического па- параболоида, принадлежащие разным семействам, пересекаются и потому компланарны. Действительно, пусть y = Vq{t—ti), и у = z = 2xxt z = 2x4 — произвольные образующие первого и второго семейств. Поскольку т2 — ¦ 1 1 Т2 + ' 1 } 0 x2 = 0, 4-Tj) О V~p_ Vq 2т, Vp - Vq 2т2 эти образующие не скрещиваются. Так как Vp_ Vq_ Vp -Vq они и не параллельны. Следовательно, эти образующие пересе- пересекаются. Заметим, что это свойство сильнее соответствующего свой- свойства прямолинейных образующих однополостного гиперболоида (п. 4, свойство 2). Свойство 3. Две образующие гиперболического параболои- параболоида, принадлежащие одному семейству, скрещиваются. Действительно, пусть, например, эти образующие принадле- принадлежат семейству E) и отвечают значениям параметра т, и тг. По- Поскольку V~P 4&7 (Ti-Ta) 0 • Vq_ 2т, V~q 2Т2- эти образующие скрещиваются.
Свойство 4. Все образующие гиперболического параболои- параболоида, принадлежащие одному семейству, параллельны некоторой плоскости. Действительно, если образующие принадлежат, скажем, семейству E), они имеют направляющие векторы вида р, - У Я, 2т) и потому параллельны плоскости х . V~p VI Аналогично, образующие семейства G) параллельны плоскости ^ = 0. V~p VI Так же как и для однополостного гиперболоида, из этих свойств непосредственно вытекает, что произвольный гиперболический параболоид представляет со- собой геометрическое место точек, принадлежащих прямым, пе- пересекающим три фиксированные скрещивающиеся прямые, па- параллельные одной плоскости. Упражнение. Докажите, что какие бы три скрещивающиеся прямые, параллельные одной плоскости, мы ни взяли, геометрическое место точек прямых, пересекающих эти прямые, является гиперболическим параболоидом. 6. Эллиптические параболоиды Определение 1. Эллиптическим параболоидом называется поверхность, имеющая в некоторой системе прямоугольных ко- координат уравнение вида Г2 „2 где р > 0, q > 0. Эта система координат на- называется канонической (относительно данного параболоида), а уравнение A) называется каноническим уравнением этого эллиптиче- ~У ского параболоида. Форму эллиптического параболоида изу- изучить очень легко. При p = q параболоид A) выражается в цилиндрических координатах р, <р, z уравнением р не зависящим от ф. Следовательно, параболоид B) 488
получается из параболы расположенной в плоскости Oxz, вращением вокруг оси Oz. На этом основании параболоид B) называется обычно па- параболоидом вращения. Заметим, что рассмотренный в § 3 гл. 4 параболоид Q является как раз параболоидом вращения, получающимся при р = 1 (правда, в координатной системе с обращенной ориентацией оси Oz). При сжатии к плоскости Oxz с коэффициентом у — пара- параболоид B) переходит в параболоид A) (соответствующее рас- рассуждение мы проводили выше для эллипсоида и двуполостного гиперболоида, и потому повторять его здесь третий раз нужды нет). Таким образом, произвольный эллиптический параболоид получается из па- параболоида вращения сжатием к некоторой плоскости. Этого уже вполне достаточно, чтобы отчетливо представить себе форму эллиптического параболоида. Он имеет вид чаши эл- эллиптического сечения (в случае параболоида вращения — круго- кругового), охватывающей положительное направление оси Oz. Столь же просто форма эллиптического параболоида иссле- исследуется методом плоских сечений. Мы приведем лишь оконча- окончательный результат: При h < 0 плоскость z = h не пересекает эллиптический пара- параболоид A); при h = 0 плоскость z = h имеет с параболоидом A) одну общую точку; при h > 0 плоскость z = h пересекает параболоид A) по эллипсу с полуосями монотонно возрастающими от нуля до + оо, когда h возрастает от нуля до +оо. Плоскость у — h пересекает эллиптический параболоид A) по паоаболе с фокальным параметром р, с вершиной в точке I Л2 \ (О, h, -p— и с «рогами», направленными «вверх»; плоскость x = h пересекает эллиптический параболоид A) по параболе с фокальным параметром q, с вершиной в точке I Л2 \ \h, 0, у-1 и с «рогами», также направленными «вверх». Легко, далее, видеть, что в отличие от гиперболического па- параболоида эллиптический параболоид линейчатой поверхностью не яв- является. Более Toroj эллиптический параболоид не содержит ни одной прямой. 489
Действительно, поскольку параболоид A) расположен в по- полупространстве 2^0, на нем могут лежать лишь прямые, па- параллельные плоскости 2 = 0, т. е. расположенные в одной из плоскостей вида z = А. Но, как мы видели, каждая такая пло- плоскость пересекает параболоид (при А > 0) по эллипсу, и потому никакая прямая, принадлежащая этой плоскости, не может принадлежать параболоиду. Замечание 1. Аналогично доказывается, что ни эллипсоид, ни двуполостный гиперболоид не могут содер- содержать ни одной прямой и потому не являются линейчатыми по- поверхностями. Действительно, для эллипсоида это вытекает из того, что он целиком расположен в некотором параллелепипеде (см. п. 1). Поскольку плоскость z = 0 не пересекает гиперболоид „2 „2 ~2 Л |_ л _ 1 а2 "г б2 с2 ~ 1' каждая прямая, расположенная на этом гиперболоиде, должна принадлежать плоскости вида z = h. Но, как мы знаем (п. 2), каждая такая плоскость либо не пересекает гиперболоид, либо имеет с ним одну общую точку, либо пересекает его по эллипсу. Однако это не означает, что однополостными гиперболоидами и гиперболическими параболоидами исчерпываются все линей- линейчатые поверхности второго порядка. Линейчатые поверхности второго порядка, не являющиеся ни гиперболоидами, ни парабо- параболоидами, мы изучим в следующих пунктах. 7. Конусы второго порядка (Определение 1. Конусом второго порядка называется поверх? ность, имеющая в некоторой системе прямоугольных координат z уравнение вида „2 „2 ~2 ^ + ^--^ = 0, A) 111 ~ где а^б^О, с>0 и —¦т-т-тт-л—г"=1- Эта система координат называется канонической (относительно данного конуса), а уравнение A) называется каноническим уравнением этого ко- конуса. Легко видеть, что плоскость 'z = h с А ф 0 пересекает конус (I) по эллипсу с полуосями 71Н ||Н монотонно увеличивающимися при А —> с» и стремящимися к нулю при А->0; . ' 490
плоскость 2 = 0 пересекает конус A) в одной точке; плоскость y = h с h ф 0 пересекает конус A) по гиперболе с полуосями ь I п |, ^ 6 | п |, монотонно увеличивающимися при h —> оо ы стремящимися к нулю при h-*0; плоскость х = п с h^Q пересекает конус A) по гиперболе с полуосями с . , . ь монотонно увеличивающимися при h —* оо и стремящимися к нулю при h—*0; плоскости у = 0 и х = 0 пересекают конус по паре пересе- пересекающихся прямых. Задание. Докажите все эти утверждения. Пусть Мо (х0, Уо, 20) — произвольная точка конуса A). Прямая ОМ0, проходящая через начало координат 0@,0,0) и точку Мо, имеет параметрические уравнения вида x=xot, У = Уо*, г = zot. Поскольку (VJ , ШГ (VJ D , у1 ¦¦ мы видим, что все точки прямой ОМ0 принадлежат конусу A). Это означает, что справедливо следующее Предложение 1. Конус A) является линейчатой поверх- поверхностью, обладающей семейством прямолинейных образующих, проходящих через точку О. Это оправдывает следующее общее Определение 2. Линейчатая поверхность, обладающая се- семейством прямолинейных образующих, проходящих через неко- некоторую точку, называется конусом с вершиной в этой точке. Замечание 1. Согласно этому определению, любая плоскость является конусом (с вершиной в произвольной ее точке). Более того, конусом будет поверхность, состоящая из произвольного числа плоскостей, проходящих через одну прямую (вершиной такого конуса может служить любая точка этой прямой). Упражнение. Покажите, что, за исключением этих особых случаев, лю- любой конус имеет только одну вершину и только одно семейство образующих. Определение 3. Линия, расположенная на конусе, называется его направляющей, если любая прямолинейная образующая ко- конуса пересекает ее в одной и только одной точке. 491
' Примером направляющей является линия, получающаяся при пересечении конуса произвольной плоскостью, не проходящей через вершину конуса. Направляющие такого вида называются плоскими. Для конуса второго порядка A) плоскими направляющими являются, например, все указанные выше эллипсы и гиперболы. Замечание 2. Интересно, что любой конус 'второго порядка A) обладает плоской направ- направляющей, являющейся окружностью. Упражнение. Докажите это утверждение. На этом основании конусы A) иногда называются круго- круговыми конусами (косыми, если прямая, соединяющая вершину конуса с центром направляющей окружности, не перпендику- перпендикулярна плоскости этой окружности, и прямыми — в противном случае). Задание. Докажите, что конус A) тогда и только тогда является прямым круговым конусом, когда а = Ъ. Это возвращает нас к определению 1 п. 5 § 1, поскольку при а = Ъ уравнение A) может быть переписано в виде х2 + у2 = R2z2, где R = ale Упражнение. Покажите, что любая не проходящая через начало коорди- координат плоскость пересекает конус A) либо по эллипсу, либо по параболе, либо по гиперболе. Напомним, что функция F(x,y,z) называется однородной, если существует такое число р, что для любых х, у, z и t имеет место тождество F(tx,ty, tz) = fF(x, у, г) (число р называется при этом степенью однородной функции 'F(x,y,z)). Выше при доказательстве предложения 1 мы по существу использовали лишь тот факт, что функция F(x, у, 2) = ^- + -|5- — -|?- является однородной функцией (степени 2). Поэтому то же са- самое рассуждение показывает, что любое уравнение F(x,y,z) = 0 B) с однородной функцией F(x, у, z) определяет в пространстве не- некоторый конус с вершиной в начале координат О. Замечание 3. Здесь, конечно, предполагается, что уравнение B) действительно определяет некоторую поверхность (а не удо- удовлетворяется, скажем, только точкой @,0,0)). 492
Замечание 4. Обратим внимание на то, что уравнение B) определяет конус не только в прямоугольных, но в любых а ф- * ф и н н ы х координатах х, у, z. Замечательно, что обратное утверждение также верно, т. е. любой конус с вершиной О может быть задан уравнением B) с однородной функцией F(x, у,z). Действительно, пусть данный конус задается уравнением G{x,y,z) = 0. C) Рассмотрим его пересечение со сферой X*+y2 + Z2=l , D) радиуса 1 с центром в точке О. Ясно, что это пересечение яв- является направляющей конуса C). Определим теперь функцию F(x,y,z) формулой (X, у, Z) — если (х, у, z) Ф @,0,0). При (х, у, z) = @,0,0) мы положим F@, 0, 0) = 0.. Функция F(x,y,z) является, очевидно, однородной функцией (нулевой степени) и потому уравнение F(x,y,z) = 0 E) определяет некоторый конус с вершиной в точке О. Функция F(x,y,z), по построению, совпадает с функцией G(x, у, г) на сфере D). Поэтому конус E) пересекается со сфе- сферой D) по той же линии, что и конус C). Таким образом, ко- конусы C) и E) имеют одну и ту же вершину и одну и ту же направляющую. Следовательно, они совпадают. Тем самым мы доказали, что конус C) может быть задан, как и утверждалось, однородным уравнением. Замечание, 5. Доказанное- утверждение, конечно, не озна- означает, что конус (с вершиной в начале координат) нельзя задать неоднородным уравнением. Рассмотрим, например, функцию вида F(x, у, z) = (x2 + y2 + z2+l)G(x, у, г), где G(x,y,z)—некоторая однородная функция. Функция F(x,y,z) заведомо не однородна и вместе с тем уравнение F(x,y,z) = 0 определяет ту же поверхность (тот же конус), что и уравнение G(x,y,z) = 0. 49а
Интересно, что для алгебраических уравнений первой и вто- второй степени это уже не так, т. е. если многочлен F(x,y,z) первой или второй степени обла-» дает тем свойством, что уравнение -., F(x,y,z) = 0 определяет конус с вершиной в начале координат, то этот много- многочлен однороден. Для многочленов первой степени это утверждение очевидно. Докажем его для многочленов второй степени. Произвольный многочлен второй степени от переменных х, у, г имеет вид F (х, у, z) = F0 + F, (х, у, z) + F2 (x, у, г), где Fo—некоторое число, Ft(x,y,z)—однородный многочлен первой степени относительно х, у, z и F2(x,y,z)—однородный многочлен второй степени относительно х, у, z (выписывать который в явном виде нам нет нужды). Мы хотим доказать, что если уравнение F (х, у, z) = 0 F) является уравнением конуса с вершиной в начале координат и если это урав- уравнение действительно является уравнением второй степени, т-. е. многочлен F2(x,y,z) тождественно не равен нулю, то многочлен F(x,y,z) совпадает с многочленом F2(x, у, г), т. е. число Fo и многочлен F\(x, у, г) равны нулю. Утверждение относительно числа Fo, по существу, очевидно. Действи- Действительно, если уравнение F) является уравнением конуса с вершиной в начале координат, то ему удовлетворяют, в частности, координаты @,0,0) этой вершины. Но поскольку, в силу однородности, Fi@,0,0) = 0 и F2@, 0, 0)=0, то это возможно только при Fo = 0. Утверждение относительно многочлена Fi{x,y,z) доказывается значи- значительно сложнее. Мы проведем доказательсто «от противного». Пусть много- многочлен Fi (я, у, z) = Ах + By + Cz не равен тождественно нулю, т. е. пусть хотя бы один из его коэффициентов А, В, С, скажем, для определенности, коэффициент С, отличен от нуля. Тогда формулы х = х, будут определять в пространстве некоторые новые аффинные координаты х, у, и (вообще говоря, не прямоугольные, даже если исходные координаты к, у, z были прямоугольны). В координатах х, у, и уравнение F) конуса принимает, очевидно, вид. G2 (х, у, и) + и = 0, где G2(x,y,u)—некоторый (однородный) многочлен второй степени от х,у,и. Расположив многочлен G2 (x, у, и) по степеням а, мы можем написать G2 (х, у, и) = аи? + Я, (х, у)и + Н2 (х, у),' где Hi(x,y) и Нг{х,у)—однородные многочлены (соответственно первой и 494 ' . .
второй степени) от переменных х, у, а а — некоторое число. В этих обозначе- обозначениях уравнение F) приобретает вид аи2+ (#,(*, y) + l)u + Ht{x, y) = 0. G) Поскольку это уравнение является, по условию, уравнением конуса с вершиной в начале координат, то вместе с некоторой точкой (хо, уо, «о) ему удовлетворяет и любая точка вида (xot, yot, «oO > где t — произвольное число, т. е, тождественно по / имеет место равенство [ml + ffi (х0, у0) и0 + Я2 (х0, у0)] Р + tu0 = О, что возможно тогда и только тогда, когда иа — 0 и Н% (хо, уо) = 0. Таким образом, мы доказали, что любое решение уравнения G) имеет вид (хо,уо,О), где (ха, г/о) — некоторое решение уравнения - #2 (*,</) = 0. (8) В частности, при Хо = 0, t/o = 0 мы должны обязательно получить «о = 0. Но полагая в уравнении G) х = 0, у = 0, мы получим уравнение аи2 + « = 0. Чтобы это уравнение имело только корень «о = 0, необходимо, чтобы а = 0. Таким образом, уравнение G) имеет на самом деле вид (//,(*, у)+1)и + Н2(х, у)=0. Чтобы каждое решение этого уравнения имело вид (хо, уа, 0), где Хо, у о — некоторое решение уравнения (8), необходимо, чтобы для любых чисел (xi,yi), для которых H2(xt, yi)?= 0 (т. е. которые не являются реше- решениями уравнения (8)), имело место равенство Рассмотрим поэтому более внимательно уравнение (8). Поскольку много- многочлен Нг(х,у) является однородным многочленом второй степени, это уравне- уравнение имеет вид сох2 + 2С1ху + с2у2 = 0. (9) Если многочлен Со*2 + 2с\ху + сгуг разлагается на линейные множители, то этому уравнению удовлетворяют точки двух прямых (возможно, совпа- совпадающих), проходящих через точку @,0). Если же многочлен Cs>xz-\-2c\xy-\-C2yz отличен от нуля и не разлагается на линейные множители, то уравнению (9) удовлетворяет только точка @,0). Наконец, если с0 = с\ = с2 = 0, то уравнению (9) удовлетворяет любая "точка плоскости. Таким образом, условию Нг(х,у)ф 0 либо не удовлетворяют координаты ни одной точки плоскости Оху, либо, напротив, удовлетворяют координаты любой точки этой плоскости, отличной от точки @, 0) или не принадлежащей двум (возможно, совпадающим) прямым, проходящим через точку @,0). С другой стороны^ поскольку многочлен Н\(х,у) является однородным многочленом первой степени, уравнение 495
¦определяет в плоскости Оху прямую, не проходящую через точку @,0) (ли- (либо— если многочлен Hi(x,y) тождественно равен нулю — вообще не может быть удовлетворено). Следовательно, равенство Hi(xi, #i)+1 =0 тогда и только тогда имеет место для любых чисел Xi,yi, для которых #2(xi, f/i) # 0, когда таких чисел вообще нет, т. е. когда многочлен Нг(х,у) тождественно равен нулю. Тем самым мы доказали, что уравнение нашего конуса имеет на самом деле вид и потому для любых чисел х0, (/о, для которых Hi (хо, г/о) + 1 = 0, имеет решение вида (ха, (/о, и) с произвольным и. Поскольку это невозможно (ибо, как мы знаем, для любой точки нашего конуса координата и должна быть равна нулю), отсюда следует, что многочлен 2. Н[ (х, у) тождественно равен нулю. Таким образом, оба многочлена Н\(х, у) и Н2(х,у) тождественно равны нулю. По- Поскольку а = 0, это означает, что тождествен- тождественно равен нулю многочлен Gz(x, у, и), а значит, вопреки предположению, и многочлен У i \ 7 0 8. Цилиндры второго порядка Определение 1. Поверхность назы- называется а) эллиптическим цилиндром, б) параболическим цилиндром, в) гиперболическим цилиндром, если в некоторой системе прямоуголь- прямоугольных координат х, у, г (называемой канонической относительно данной по- поверхности) она имеет следующее (ка- (каноническое) уравнение: и б) у2 = а> „2 hi Р>0, A) Задание. Опишите линии, получающиеся в пересечении этих цилиндров плоскостями х = h, у = h ч z = h. Поскольку уравнения A) не зависят от z, вместе с некоторой точкой (х0, у о, Zq) им удовлетворяет и любая точка вида (х0, у0, z), Это означает, что вместе с некоторой точкой Мо каждый из цилиндров A) содержит всю прямую, проходящую через эту точку парил* яельно оси Oz. 496
Другими словами, справедливо следующее Предложение 1. Каждый из цилиндров A) является линей- линейчатой поверхностью, обладающей семейством прямолинейных образующих, параллельных прямой Ог. Это оправдывает следующее общее Определение 2. Линейчатая поверхность, обладающая семей- семейством прямолинейных образующих, параллельных некоторой фиксированной прямой, называется цилиндром. Направление этой прямой называется осевым направлением цилиндра. Замечание 1. Согласно этому определению любая плоскость и, более общо, любая поверхность, состоящая из любого числа плоскостей, проходящих через одну прямую (или параллельных друг другу), является цилиндром. Таким образом, все «особые» конусы, описанные в замечании 1 п. 7, одновременно являются и цилиндрами. Упражнение. Покажите, что, за исключением цилиндров, являющихся плоскостями или несколькими параллельными. плоскостями, любой цилиндр имеет единственное семейство параллельных образующих (и, следовательно, единственное .ссевое направление). Замечание 2. Во многих отношениях цилиндры подобны ко- конусам. Это объясняется тем, что в евклидово-проективном про- пространстве цилиндры являются частным случаем конусов (а именно, представляют собой конусы с вершиной в несобственной точке). Следующее определение вполне аналогично соответствую- соответствующему определению для конусов: Определение 3. Линия, расположенная на. цилиндре, назы- называется его направляющей, если любая прямолинейная образую- образующая цилиндра пересекает ее в одной и только одной точке. На- Направляющая называется плоской, если она является пересече- пересечением цилиндра с некоторой плоскостью. Можно без особого труда показать, что любая плоская направляющая эллиптического ] (эллипсом параболического ^ цилиндра является < параболой гиперболического J ( гиперболой. Для эллиптических цилиндров верно и более точное утверж- утверждение: любой эллиптический цилиндр обладает плоской направляю- направляющей, являющейся окружностью. Упражнение. Докажите эти утверждения. На основании последнего утверждения эллиптические ци- .линдры иногда называются также косыми круговыми цилин- цилиндрами. Эпитет «косой» здесь подчеркивает, что плоскость на- направляющей окружности может быть не перпендикулярна осе- 497
вому направлению цилиндра. В случае, когда эта плоскость перпендикулярна осевому направлению цилиндра, цилиндр на- называется прямым круговым цилиндром (это в точности — «ци- «цилиндры», известные читателю из школы). Ясно, что эллиптичес- эллиптический цилиндр тогда и только тогда является прямым круговым цилиндром, когда в его каноническом уравнении а = Ь. Соображения, использованные выше для доказательства предложения 1, немедленно показывают, что любое уравнение вида F(x,y) = 0, B) левая часть которого не зависит от г, определяет в пространстве цилиндр, осевым направлением которого является направление оси Oz. При этом ясно, что линия на плоскости Оху, определяемая уравнением B), яв- является направляющей этого цилиндра. Замечание 3. Как и в аналогичном утверждении для конусов (см. п. 7), здесь, конечно, предполагается, что уравнение B) действительно определяет на плоскости Оху некоторую линию. Замечание 4. Уравнение вида B) определяет цилиндр в лю- любых аффинных координатах. Верно и обратное утверждение, т. е.^ любой цилиндр, прямолинейные образующие которого парал- параллельны оси Oz, может быть задан уравнением B) с левой частью, не зависящей от г. Действительно, пусть B) — уравнение направляющей данного цилиндра, получающейся при пересечении его координатной плоскостью Оху. Ясно тогда, что это лее уравнение (но рассмат- рассматриваемое в пространстве, т. е. как уравнение от х, у, z) будет и уравнением данного цилиндра. Упражнение. Покажите (ср. п. 7), что если многочлен F(x,y,z) степени не выше второй обладает тем свой- свойством, что уравнение F (х, у, г) = О определяет цилиндр с прямолинейными образующими, параллельными оси Oz, то этот многочлен не зависит от г. Как показывает пример уравнения для многочленов степени выше второй соответствующее утверж- утверждение неверно.
Глава 6 - ОБЩАЯ ТЕОРИЯ ЛИНИЙ ВТОРОГО ПОРЯДКА § 1. КЛАССИФИКАЦИЯ ЛИНИЙ ВТОРОГО ПОРЯДКА 1. Линии второго-порядка на евклидовой плоскости Самое общее уравнение линии второго порядка имеет (в пря- прямоугольных или любых аффинных координатах) вид аих2 + 2ai2xy + а22у2 + 2al3x + 2а23у + a33 = 0, A) где хотя бы одно из чисел ац, а,\% а2г отлично от нуля. Предполагая координаты х, у прямоугольными, мы попро- попробуем найти другие (также прямоугольные) координаты х', у', в которых уравнение линии A) имеет возможно более простой вид. В первую очередь мы постараемся поворотом координатных осей уничтожить член, содержащий произведение координат (ко- (конечно, если этот член имеется, т. е. если а\2 ф 0). Повернув оси координат на угол 0, мы получим новые коор- координаты х', у', связанные со старыми координатами соотноше- соотношениями х = х' cos 9 — у' sin 9, B) у = х' sin 0 + у' cos 0 к ' (см. п. 4 § 1 гл. 2). В этих координатах линия A) задается урав- уравнением ап {х' cos 8—yf sin бJ + 2а12 (*' cos 6—у' sin 0) (х/ sin Q + yf cos 0) + + a22 (•*' sini6 + у' cos вJ + 2a13 (*' cos 0 — y' sin 9) + + 2a23 (x' sin 9 + y' cos Э) + a33 = 0, т. е. уравнением a'nx'2 + 2a\2xry' + a22z/'2 + 2a{3*' + 2а'2ъу' + а'м = 0, 499
где аи — аи cos2 9 + 2ai2 cos 9 sin 9 + a22 sin2 9, a'12 = (a22 — йц) cos 0 sin 8 + a12 (cos2 8 — sin2 8), 022 = an sin2 8 — 2aI2 cos 0 sin 8 + a22 cos2 0, a'n = a13 cos G + a23 sin0, ^' a23 = — a13 sin 8 + a23 cos 0. йзз = а3з- Условие a'12 = 0 дает нам для угла 0 уравнение (a22 — ап) cos 8 sin 8 + «12 (cos2 0 — sin2 0) = О, т. е. уравнение (а22 — an) sin 20 + 2а[2 cos 28 = 0. Следовательно, 8 = ^=fl. D) Тем самым доказано, что при повороте координатных осей на угол 0=Tarctg Oil ~ 2а,2 уравнение A) преобразуется в аналогичное уравнение с коэф- коэффициентом а\2, равным нулю. Таким образом, без ограничения общности, мы можем счи- считать, что наша линия с самого начала задана уравнением Ян-Х2+а22#2 + 2а13л: + 2а2зГ/ + азз = 0. E) Дальнейшее упрощение этого уравнения мы произведем, пе- перенося начало координат в некоторую точку (*о, Уо), т. е. вводя новые координаты х', у', связанные с координатами х, у фор- формулами х=х' + х0, У = У' + Уо- В координатах х', у' линия A) задается уравнением йп (*' + *оJ + 2fli2 (х' + х0) (у' + г/о) + «22 (у' + УоJ + т. е. уравнением •а!,*'2 + 2а{2*У + a^'2 + 2a'l3xf + 2а!ггу' + азз = 0, 500
где «11 = «11, «12 = «121 «22 = «22» ai3 = alix0+ai2y0 + al3, U2Z = «12*0 + «22#0 + fl23, азз = ап*о + 2а12хоУа + а22У1 + 2ai3*o + 2а2зУо + аз? В частности, для упрощенного уравнения E) мы получаем, чта «II = «и, «12 = «12 = 0, «22 = 022, «23 = а22уо + «2з > «33 = ail*0 + a22yt + 2п1ЪХ0 + 2а2зУ0 + fl33« Постараемся теперь подобрать точку (х0, у0) так, чтобы ко- коэффициенты при х' и у' обратились в нуль. Это дает нам урав- уравнения «п-*о + «13 = О, «22^0 + «23 = О- Если аи ф 0 и й22 Ф 0, то эти уравнения имеют единственное решение Этим доказано, что при переносе начала координат в точку с координатами (8) уравнение E) с пцФО и а^ФО преобразуется в аналогичное уравнение с коэффициентами а\Ъ и а2г, равными нулю. Пусть теперь один из коэффициентов аи и а22 равен нулю- (оба они равны нулю быть не могут, поскольку тогда мы имели бы линию не второго, а первого порядка). Переименовывая, если нужно, координаты, мы можем считать, что а22 Ф 0. Тогда мы можем удовлетворить второму из уравнений G) (решение дается второй из формул (8)), и в нашем распоряжении еще останется Хо. Постараемся им распорядиться так, чтобы обратить в нуль свободный член. Это даст нам уравнение т. е. (поскольку «ц = 0 и г/0=—•—I уравнение \ °22 / Я23 == ~z «зз- a22 При ai3 ф 0 это уравнение имеет единственное решение; вместе со вторым уравнением (8) это дает нам точку с координатами 2апагг ' И) а22' (У> 501
Таким образом, при переносе начала координат в точку с координатами (9) л/равнение E) с аи = .0, а22Ф0 и ai3 Ф 0 переходит в аналогич- аналогичное уравнение с коэффициентами а2з и а3з, равными нулю. Если же ai3 = 0, то выбор координаты х<> никак не влияет на уравнение, и мы получаем, что при переносе начала координат в точки \хп, —— |, где хй — произвольно, уравнение E) с ап = ai3 = 0 и а22 Ф 0 пере- переходит в аналогичное уравнение с коэффициентом а23, равным нулю. Резюмируя, мы получаем следующее Предложение 1. Для любой линии второго порядка суще- существует система прямоугольных координат, в которой ее уравне- уравнение имеет либо вид + а22у2 + а33 = 0, A0) -где апф0, а22ф0, либо вид а22у2 + 2апх = 0, A1) ч где а22 ф 0, а13 ф 0, либо вид +а33 = 0, A2) где а22 Ф 0. Определение 1. Уравнения A0) — A2) называются приведен- мыми уравнениями линии второго порядка. Линии, имеющие при- приведенные уравнения вида A0), мы будем называть линиями типа I, имеющие приведенные уравнения вида A1)—линиями типа II, а имеющие приведенные уравнения вида A2) —линия- —линиями типа III. Замечание 1. Хотя априори не исключено, что одна и та же линия может принадлежать различным типам (т. е. что при одном способе приведения получится, скажем, уравнение A0), а при другом — уравнение A1)), на самом деле это невозможно. Мы этого доказывать здесь не будем, поскольку ниже мы тип .линии охарактеризуем другим способом, из которого невозмож- невозможность для линии иметь два различных типа будет вытекать авто- автоматически. Рассмотрим более внимательно уравнения A0) линий типа I. Случай 1. Коэффициенты аи и а22 имеют различные знаки. Умножив (если нужно) уравнение A0) на — 1, мы можем, без ограничения общности, считать, что коэффициент азз неположи- неположителен: -502
Кроме того (переименовав, если нужно, координаты), мы можеьг также считать, что коэффициент аи положителен, а коэффи- циентагг отрицателен: • ~ аи>0, а22<0.^ Случай 1а. Коэффициент а3з отличен от нуля. Тогда, по- полагая „1 агг i2 азз ап а22 мы приведем уравнение A0) к виду ?? а>о, ь>о, Aз> являющемуся каноническим уравнением гиперболы (см. п. 3 § 1 гл. 5). Случай -16. Коэффициент а3з равен нулю. Тогда без огра- ограничения общности можно считать, что ац =sj —«22- Полагая L2 а11 — Q22 и ~~^ ~^— , а аи мы приведем уравнение A0) к виду -^г — -|г = 0. где а^Ь>0 и -±- + -р = 1, A4> т. е. к виду [а Ъ ) \ а Ь) Этому уравнению удовлетворяют точки двух прямых а Ь а Ь ' пересекающихся в точке @,0). Таким образом, в этом случае наша линия второго порядка состоит из двух пересекающихся прямых. Определение 2. Случай 1 принято называть гиперболическим (при азз Ф 0 — невырожденным, а при а3з = 0 — вырожденным). Случай 2. Коэффициенты ац и а2г имеют один и тот же знак. Умножая (если нужно) уравнение A0) на — 1, мы, без ограничения общности, можем считать эти коэффициенты поло- положительными: fl,i>0, Кроме того, переставляя (если нужно) координаты, мы можем считать, что 505-
Случай 2а. Коэффициент а3з отрицателен. Тогда, полагая „2 аЗЗ . h2 аЗЗ мы приведем уравнение A0) к виду -? + ¦?=1, а>6>0, A5) являющемуся каноническим уравнением эллипса (см. п. 2 § 1 гл. 5). Случай 26. Коэффициент азз равен нулю. Тогда, полагая мы приведем уравнение A0) к виду -g. + -|i=l, где я>&>0 и Jj. + Js-^l. A6) .Этому уравнению удовлетворяет только точка @,0). Случай 2в. Коэффициент а3з положителен. Тогда, полагая аи ' а22 ' мы приведем уравнение A0) к виду ¦? + -?=-1, а>6>0. A7) Этому уравнению не удовлетворяет ни одна точка плоскости, т. е. оно определяет пустое множество. Определение 3. Случай 2 принято называть эллиптическим (при а3з < 0 — действительным невырожденным, при а3з>0 — мнимым невырожденным и при а3з = 0 — вырожденным). Рассмотрим теперь уравнения A1) кривых типа II. Меняя (если нужно) ориентацию оси Ох, мы можем, без ограничения общности, считать, что коэффициенты а2г и а\г имеют разные знаки (напомним, что по условию а2г Ф 0 и а13 Ф 0). Тогда, полагая мы приведем уравнение (И) к виду г/2 = 2рх, р>0, A8) 604
являющемуся каноническим уравнением параболы (см. п. 1 § I гл. 5). Для уравнений A2) кривых типа III возможны три различ- различные случая. Случай А. Коэффициент а3з равен нулю. Тогда после со- сокращения на ац уравнение A2) приобретает вид У2 = 0. A9) Это уравнение определяет ту же прямую (ось Ох), что и урав- уравнение у = 0. Однако чтобы оттенить различие между уравне- уравнениями у2 = 0 и у = О, мы будем говорить, что первое из них — дважды взятая прямая у = 0 или что оно определяет пару сов- совпадающих прямых. Случай Б. Коэффициенты а22 и а33 имеют разные знаки. Тогда, полагая Л2 азз и — « » 022 мы приведем уравнение A2) к виду y2-b2 = 0, b>0, B0) т. е. к виду (У + Ь)(у-Ъ)=*О. Этому уравнению удовлетворяют координаты точек двух парал- параллельных прямых у-\-Ь = О ш у — 6 = 0. Таким образом, в рассматриваемом случае наша линия второго порядка состоит из двух параллельных прямых. Случай В. Коэффициенты а22 и ai3 имеют одинаковые знаки. Тогда, полагая U1 аЗЗ и , мы приведем уравнение A2) к виду у* + й* = 0,'Ь>0. B1) Этому уравнению не удовлетворяет ни одна точка плоскости. Определение 4. Случаи уравнений A1) и A2) называются параболическими (случай уравнения A1)—невырожденным, а уравнения A2)—вырожденным). / 505
Таким образом, линии типа I могут быть двух видов: гипер- гиперболического и эллиптического (с дальнейшим подразделением яа вырожденные и невырожденные, а в случае эллиптических линий — еще не действительные и мнимые). Напротив, линии типов II и III Объединяются в один вид параболических линий (невырожденных, т. е. парабол, г- в случае типа II, и вырожден- вырожденных,— в случае типа III). Определение 5. Уравнения A3) — B1) называются (евкли- (евклидово) каноническими уравнениями, а описанная процедура — приведением уравнения A) к каноническому виду. Заметим, что эта терминология согласована с употреблением термина «каноническое уравнение» для эллипса, гиперболы и параболы в § 1 гл. 5. Замечание 2 (очень важное!). Мы видим, что оставаясь в обыкновенной евклидовой плоскости, мы в качестве «линий вто- второго порядка» получаем, в частности, точки (уравнение A6)) и пустые множества (уравнения A7) и B1)). При этом «линии», задаваемые уравнениями A7) и B1), оказываются одинако- одинаковыми, хотя сами эти уравнения различны (не сводятся одно к другому заменой координат). Чтобы устранить эти недостатки, целесообразно перейти в евклидову вещественно-комплексную плоскость (см. п. 5 § 3 гл. 2), являющуюся «естественной об- областью», в которой следует развивать теорию линий второго порядка и в которой эта теория приобретает законченный и изящный вид. Начиная с этого места, мы будем всегда предполагать (если только явно не оговорено противное), что все линии рассматри- рассматриваются в евклидовой вещественно-комплексной плоскости. Конечно, мы при этом будем по-прежнему интересоваться лишь вещественными линиями второго порядка, т. е. линиями, задаваемыми уравнениями A) с вещественными коэффициен- коэффициентами. Поскольку уравнение A6) может быть представлено в виде мы видим, что на вещественно-комплексной плоскости оно опре- определяет пару мнимых (т. е. невещественных) комплексно-сопря- комплексно-сопряженных прямых пересекающихся в вещественной точке @,0). Аналогично, уравнение B1) определяет пару параллельных (т. е. непересекающихся) мнимых комплесно-сопряженных пря- прямых у = ± ib. «06
Что же касается уравнения A6), то оно определяет в евкли- евклидовой вещественно-комплексной плоскости некоторую новую, у нас еще не встречавшуюся, линию, называемую «мнимым эл- эллипсом». Дадим точное Определение 6. Мнимым эллипсом называется линия, имею- имеющая в некоторой {канонической для этой линии) евклидовой ко- координатной системе уравнение вида ^l_i_il—_ 1 а2 -Г Ъ2 — 1» где а ^ Ь > 0. При а = Ъ получаются уже известные нам (см. п. 6 § 3 гл. 4)< окружности мнимого радиуса. Эллипсы в прежнем смысле (т. е. в смысле определения 1 п. 2 § 1 гл. 5) мы будем теперь называть действительными эл- эллипсами. Замечание 3. Строго говоря, действительные эллипсы не яв- являются эллипсами в смысле определения 1 п. 2 § 1 гл. 5. Послед- Последние являются лишь пересечениями действительных, эллипсов; с вещественной плоскостью. То же самое, конечно, относится и к линиям, которые мы будем теперь называть «гиперболами» и «параболами». Различие между эллипсами на евклидовой вещественной пло- плоскости и действительными эллипсами на евклидовой веществен- вещественно-комплексной плоскости проявляется, например, в том, что,, в то время как эллипс в прежнем смысле не имеет асимптот, действительный эллипс асимптоты имеет (ими будут, очевидно,. 1 Ы \ комплексно-сопряженные прямые у = ± — х\. Вместе с тем легко видеть, что развитая в § 1 гл. 5 теория эллипсов на вещественной плоскости сохраняется (с незначи- незначительными и само собой понятными изменениями) и для действи- действительных эллипсов на вещественно-комплексной плоскости. Бо- Более того, эта теория может быть теперь построена и для мнимых эллипсов. Например, для мнимых эллипсов можно ввести оси (являющиеся вещественными прямыми), центр (являющийся ве- вещественной точкой), фокусы (также являющиеся вещественными точками), директрисы (являющиеся мнимыми комплексно-сопря- комплексно-сопряженными прямыми), доказать аналоги предложений 2 и 3 и» п. 2 § 1 гл. 5 и т. д. Упражнение. Докажите для мнимых эллипсов аналоги предложений 2 и 3 из п. 2 § 1 гл. 5. , ¦ Задание. Докажите, что никакой эллипс (действительный или мнимый) на евклидовой веществен- вещественно-комплексной плоскости (а также. никакая гипербола или парабола) не- несодержит ни одной прямой (даже мнимой). Указание: см. доказательстве аналогичного утверждения для гипер- гипербол на вещественной плоскости в п. 2 § 2 гл. 5. 50Г
Таблица линий второго порядка на евклидовой вещественно-комплексной плоскости Тип линии I II, III Вид линни гиперболиче- гиперболический эллиптический парабсуга- ческий Невырожденные линии гипербола х2 у2 , ~^F~ b2 ~1' а>0, Ь>0 эллипс а) действительный х2 и2 ¦SF + -P-1' а>Ь>° б) мнимый ¦Л ,Л х , У . а2 ^ Ъ2 парабола у2 = 2рх, р > 0 Вырожденные линии пара вещественных пере- пересекающихся прямых *2 У2 п ~~& ~ "ь2 ~~ ' а>0, 6>0, пара мнимых (комплексно- сопряженных) прямых, пе- пересекающихся в веще- вещественной точке ¦J + lJ = O. a>b>0, а2 + Ь2 ~ 1 пара параллельных прямых а) вещественных и раз- различных у2 — Ь2 = О, 6>0 б) мнимых (комплексно- сопряженных) 02 + ?2^0, 6>0 в) совпадающих (вещест- (вещественных) У2 = 0 Мы видим, что произвольная линия второго порядка является либо эллипсом (действительным или мнимым), либо гиперболой, либо параболой, либо парой прямых (мнимых или вещественных, пересекаю- пересекающихся, параллельных или совпадающих). Таким образом, за исключением вырожденных кривых (рас- (распадающихся на две прямые) и мнимых кривых (имеющих не бо- более одной вещественной точки), т. е. за исключением геометри- геометрически неинтересных случаев, любая линия второго порядка яв- является одним из трех конических сечений, изученных в §§ 1—2 гл. 5. Впрочем, пересекающиеся прямые (мнимые и веществен- вещественные) также можно считать коническими сечениями (получающи- (получающимися в вещественно-комплексном пространстве при пересечении 508
конуса плоскостью, проходящей через его вершину). Чтобы по- получить совпадающие прямые (т. е. дважды взятую прямую), следует рассмотреть плоскость, касающуюся конуса по его обра- образующей, а чтобы получить параллельные прямые, нужно вместо конуса взять цилиндр (который можно рассматривать как конус с вершиной в несобственной точке). 2. Инварианты уравнений линий второго порядка Изложенный в п. 1 способ приведения решает сразу две за- задачи: он не только дает каноническое (точнее, приведенное) уравнение, но и указывает каноническую координатную систему. Однако для многих задач столь полная информация оказы- оказывается совершенно излишней: часто достаточно знать лишь при- приведенное уравнение (без знания соответствующей координатной системы) или даже только вид рассматриваемой линии (т. е. является ли она эллипсом, гиперболой и т. п.). В следующем пункте мы изложим существенно более простой метод, позво- позволяющий найти вид кривой и ее приведенное (а значит, и канони- каноническое) уравнение, не производя самого приведения, т. е. не находя соответствующей координатной системы. Этот метод основывается на некоторых алгебраических результатах, доказа- доказательству которых и будет посвящен настоящий пункт. Коэффициенты уравнения линии второго порядка удобно представлять себе расположен- расположенными в виде матрицы U «12 «13 21 «22 «23 v «31 «32 «33' (для единства обозначений мы условливаемся здесь, что символ uij обозначает то же самое число, что и символ Определение 1. Определитель этой A). А = матрицы называется а его минор 6 = «п «21 «И «21 «31 «12 «22 «32 большим «12 «22 1 = «11 «13 «23 «33 определителем «22 - «12 уравнения ( 609
— малым определителем уравнения A). Число S = an + a22 (след матрицы определителя б) называется следом уравнения A). Числа А, б и 5 называются также инвариантами уравнения A). Предположим, что от координат х, у мы перешли к новым координатам х', у', получающимся поворотом прежних осей координат на некоторый угол 9. Тогда вместо уравнения A) мы получим уравнение A') п. 1, коэффициенты которого выра- выражаются формулами C) п. 1. В частности, для следа S' = а'и + аг22 уравнения A') мы получаем отсюда выражение S' — au cos2 9 + 2a12CQs9 sin 9 + «22 sin2 9 + + au sin8 9 — 2a12 cos 0 sin 9 + a22cos2 6 = «и + Я22 = «S- Таким образом, преобразованное уравнение A) имеет тот же след, что и исходное уравнение A). Аналогично, для малого определителя 6' = а'п а'п а.22 мы получаем, что б' = а'па'22 — Oi2 = = (aucos26 + 2a12cos0 sin6 + a22sin29) X Х(«п sin2 б — 2a12cos0sin0 + a22cos28) — — [(«22 — On) cos б sin б + ai2 (cos2 0 — sin2 б)]2 = + 2 [ — aual2 + ai2a22 — (a22 — a,,) ai2] cos3 9 sin 6 + + \a\x - Aa\2 + a22 - (a22 - anf + 2a\2] cos2 0 sin2 0 + + 2[a12an — a22«i2 + («22 — a\\) ^12] cos б sin3 9 + + (a22an-a22)sin40 = = (ana22 — a22) (cos4 0 + 2 cos2 9 sin2 8 + sin* 6) = Наконец, большой определитель для уравнения A) имеет вид = «31 «12 «13 «22 «23 — «32 «11 «21 f O23 + азз / О21 «ь 022 510
Но простое вычисление (аналогичное приведенному выше для определителя б') показывает, что a 12 ai3 «22 «23 «11 «21 «13 «23 «12 «13 «22 «23 «12 «13 «22 «23 COS0 — sin0 «u «21 «11 «21 «13 Й23 «13 «23 sin б cos 9. Отсюда, после тривиальных преобразований мы получаем, что «31 «12 «13 «22 «23 аи «21 «13 а'23 = «31 «12 «22 «13 «23 — «32 «11 «21 «13 «23 Кроме того, так как йзз = «зз (см. последнюю формулу C) п. 1) и 6'= 6 (по уже доказанному), то а'зъ aU a'21 «22 Следовательно, «12 «13 «22 «23 = йззб' == а^б = а33 «11 «21 «12 «22 A' = a3I — « •32 «11 «13 «21 «23 + «33 «21 Й12 «22 «11 «21 «12 «13 «22 «23 «31 «32 «33 = Д. Посмотрим теперь, что происходит с величинами 5, 6 и А при сдвиге начала координат. Как мы знаем, при переносе начала координат в точку (хо,г/о)г коэффициенты уравнения A) претер- претерпевают изменение, описываемое формулами F) п. 1. Из этих формул непосредственно явствует, что при этом переносе вели- величины 5 и б не изменяются, а определитель А переходит в опре- определитель А' = где «33 = «u «21 «31 «12 «22 a'32 «13 «23 ЙЗЗ «23 = а32 = «12*0 + + а32> «22^0 = a i3 а32у0 + 511
Вычтя из третьей «троки этого определителя первую строку, умноженную на х0, и вторую строку, умноженную на г/о, мы по- получим, следовательно, определитель #11 #12 #13 #21 #22 «23 «31 #32 «33 где = «31*0 =А. Поэтому, вычтя из последнего столбца этого определителя пер- первый столбец, умноженный на х0, и второй столбец, умноженный на г/0> мы получим определитель «И «12 «13 «21 #22 «23 #31 «32 «33 Поскольку при этих преобразованиях определитель не меняется, тем самым доказано, что величины 5, б и А не меняются и при переносе начала координат. Так как любое преобразование координат сводится к пово- повороту координатных осей и к переносу начала координат, тем са- самым мы доказали следующее Предложение 1. При любом преобразовании прямоугольных координат х, у числа S, б и А не меняются. Это объясняет термин «инвариант» для чисел 5, б и А. Рассмотрим теперь число При Но, а'и а'ы К — «11 #31 повороте как легко #13 #33 =(" и, аналогично, Й22 а'ъч #23 #зз Xх #13 #33 «22 «32 «23 #33 _ осей координат оно а'п #31 проверить, ,,аи — а2,) cos + 2Ка12- 33«22 " — а 23/ LUb #13 азз 2е + «13а23) 0 — 1 is* 1 . j" N 2 аЗЗ^1 "Г-2^ 3 ^переходит в число #22 #23 #32 #33 COS 8 Sin 6 -f- (#зза22 — о - а23. «23); - 2 (азза12 ~ а1за2з)cos б sin 6 + (а33ап - а%) sin2 6. 612
Поэтому , К' = (а33ап - а213) (cos2 6 + sin2 0) -f («Зза22 - al) (cos2 e + sin2 9) = = (a33au - О + (азз«22 ~ а1з) = *• При переносе начала координат в точку (х0, у0) число К пере- переходит (см. формулы F) п. 1) в число K' = «л «31 «33 которое равно (проверьте это!) «13 «22 Й23 ЙЗЗ «12 «22 -20„ «13 «23 Таким образом, справедливо следующее Предложение 2. При повороте координатных осей число К не меняется, а при переносе начала координат в точку (х0, у0) к нему прибавляется определитель «И «21 «12 «22 «13 «23 B) Определение 2. Число К называется семиинвариантом урав- уравнения A) (приставка «семи» означает «полу»). Замечание 1. Обратим внимание на то, что при умножении уравнения на некоторое число кФО инвариант S умножается на k, инвариант б и семиинвариант К умножаются на k2, а инва- инвариант А умножается на k3. Поэтому геометрический смысл мо- может иметь только равенство инвариантов 5 и. А нулю (или знак их произведения) и знак инварианта б и семиинварианта К- 3. Определение вида линии второго порядка по инвариантам ее уравнения Согласно предложению 1 п. 2 инварианты S, б и А имеют одни и те же значения как для исходного уравнения A) п. 1, так и для соответствующего приведенного уравнения (см. п. 1, урав- уравнения A0), A1) или A2)). Но для уравнения A0) п. 1 эти инварианты выражаются фор- формулами , v •S-—«11 + «22t 6 = aua22^=0, A) 17 М, М. Постников 613
для уравнения A1) п.1 — формулами 5 = a22=?0, 6 = 0, B) А = - а22а213 Ф 0, и для уравнения A2) п. 2— формулами 5 = ^22 ^ 0| 6 = 0, C) д = о. Следовательно (здесь мы пользуемся принципом обращения), уравнение A) п. 1 тогда и только тогда принадлежит типу I, когда 8фО. Другими словами, гиперболические и эллиптические линии характеризуются тем, что б ф 0, а параболические — тем, что 6 = 0. Кроме того, невырожденные линии (гиперболические, эллиптические или параболические) характеризуются тем, что А ф 0, а вырожден- вырожденные — тем, что А = 0. Таким образом, для типов линий второго порядка мы имеем следующую таблицу: Тип I II III Инварианты 6 = 0, 6 = 0, А=0 Замечание 1. Эта таблица, в частности, доказывает коррект- корректность распределения линий второго порядка по типам, т. е. факт, что одно и то же уравнение A) п. 1 не может быть приведено к уравнениям различных типов. Чтобы научиться отличать по инвариантам гиперболические линии от эллиптических, рассмотрим более внимательно первые два уравнения A). Эти уравнения показывают, что коэффи- коэффициенты ап и а22 приведенного уравнения (.10) п. 1 являются корнями квадратного уравнения Я2 - 5Я + 6 = 0. D) Определение 1. Уравнение D) называется характеристиче- характеристическим уравнением (для уравнения A))., 514. .......
Заметим, что это уравнение имеет лишь вещественные корни (ибо числа аи и а22 вещественны). По определению, эллиптические линии характеризуются тем, что для них числа ап и а22 имеют один и тот же знак, т. е. тем, что их произведение положительно. Но по формулам Вьета это произведение равно свободному члену б характеристического уравнения D). Поэтому для эллиптических линий б > 0. Аналогично показывается, что для гиперболических линий б < 0. Кроме того, согласно третьему из уравнений A) коэффи- коэффициент йзз в уравнении A0) п. 1 равен А/б. Поэтому приведенное уравнение A0) п. 1 может быть записано в виде M2 + W + x = 0, E) где Ль Яг — корни характеристического уравнения D). Таким образом, при 6 ф 0 мы можем найти уравнение, к ко- которому приводится уравнение A) п. 1, не производя приведения (т. е. не отыскивая соответствующей системы канонических коор- координат). Для этого достаточно вычислить инварианты 5, б и А, составить уравнение D), найти его корни "К\, Лг и написать урав- уравнение E). Осталось научиться отличать случай мнимого эллипса от действительного. Но это легко. На самом деле, при 5 > 0 знак корней Ль %2 совпадает, очевидно, со знаком их суммы 5. С дру- другой стороны, уравнение E) показывает, что мы имеем мнимый эллипс, когда знаки корней совпадают со знаком определителя А, и действительный, когда эти знаки различны. Окончательные результаты для случая б ф 0, т. е. случая ли- линий типа I, можно свести в следующую таблицу: Линия 1. Эллипс а) действительный б) мнимый 2. Гипербола 3. Пара пересекающихся прямых а) вещественных б) мнимых Характеристика по инвариантам 6>0, Д=И=0 SA<0 SA>0 6<0, A^O А = 0 6<0 6>0 Рассмотрим теперь параболические линии F = 0). Как мы уже знаем, невырожденные линии, т. е. линии, приводящиеся к уравнению A1) п. 1 (тип II), характеризуются условиями 17* ¦ Ш
ел С» Таблица линий второго порядка пп [1] B1 [3] 14] .- Название Эллипс(действи- Эллипс(действительный) Мнимый эллипс Точка (пара мни- иых пересекаю- пересекающихся прямых) Гипербола Схематический вид линии Характеристика б>0, 5А<0 б>0, SA>0 б>0, Л = 0 б<0, А^=0 Приведенное уравнение Каноническое уравнение л:2 и2 ^-—11 = 1, e>0t-ft>0
1 . [5] 16] - {8] [9] a Пара пересекаю- пересекающихся прямых (веществен- (вещественных) Парабола Пара параллель- параллельных прямых (веществен- (вещественных) Пара мнимых параллельных прямых Пара совпадаю- совпадающих прямых t б<0, А = 0 б = о, а=о, л:<о б = о, д=о, л:>о б — о, а — о, л:—о > 2 а>Ь>0, х У —п , , а2 Ь* ' —+— =1 а2 + б2 ' у2 = 2/?л;, /? > 0 г,2 + 62 = 0, 6>0,
б = 0 и Л =7^= 0. При этом согласно формулам B) коэффициенты G22 и а\г приведенного уравнения A1) выражаются формулами с -,/ Д" а22 — 5, а13 = у — -?- . Таким образом, приведенное уравнение A1) п. 1 может быть записано в виде V + 2y —%x = 0. F) Следовательно, и для линий типа II мы можем написать при- приведенное уравнение, не производя фактического приведения. Осталось рассмотреть лишь линии типа III, приводящиеся к уравнению A2) п. 1. Здесь мы воспользуемся семиинвариан- семиинвариантом К. Вспомним, как .мы в п. 1 осуществляли приведение уравнения A) п. 1 к простейшему виду. Сначала мы поворотом осей коор- координат привели его к виду E) п. 1. Как мы знаем, семиинвариант /( при этом не изменился. В интересующем нас сейчас случае уравнения A2) п. 1 опре- определитель B) п. 2 прибавляющийся при переносе начала коор- координат в точку (х0, г/о) к семиинварианту К, имеет вид 0 0 0 0 а22 а23 ~2х0 ~2у0 х\-\-Ь и потому равен нулю. Следовательно, если уравнение A) п. 1 приводится к уравнению A2) п. 1, то семиинвариант К для обоих уравнений — один и тот же. Но для уравнения A2) п. 1 этот семиинвариант выражается формулой а22 О О а33 Поэтому уравнение A2) п. 1 может быть записано в виде V + f = 0. G) Отсюда следует, что при К = 0 мы имеем пару совпадающих прямых, при К > 0 — пару мнимых параллельных прямых, при К < 0 — пару вещественных параллельных прямых. Окончательные результаты произведенного исследования ли- линий второго порядка подытожены в таблице на стр. 516—517. Обратим внимание на то, что в этой таблице все линии вто- второго порядка на евклидовой вещественно-комплексной плоско- плоскости распределены по девяти классам. Принадлежность линии тому или иному классу определяется знаками инвариантов 6 и 6.18
SA, фактом равенства или неравенства нулю инварианта Д и (при б = О, А = 0) знаком семиинварианта К. Из полученных результатов вытекает, в частности, что уравнение второй степени аих> + 2а12ху + а22у2 + 2ai3x + 2а23у + а33 = О тогда и только тогда является (в прямоугольных координатах х, У) а) уравнением окружности (вещественного радиуса), когда аи^=а22, а12 = 0, апа33< а% +а23, б) уравнением равнобочной гиперболы, когда ап = — а22, АфО, в) уравнением пары перпендикулярных прямых, когда ап = — а22, А = 0. Задание, Докажите это утверждение. 4. Линии второго порядка на аффинной плоскости. Теорема единственности В аффинных координатах х, у произвольная линия второго порядка задается уравнением того же вида апх2 + 2а12ху + а22у2 + 2а13х + Za^y + а33 = 0, A) что и в прямоугольных. Но в аффинных координатах свобода в преобразованиях координат большая, чем в прямоугольных, и потому уравнение A) можно упрощать сильнее. Замечание 1. Можно представлять себе, что мы по-прежнему находимся в евклидовой плоскости и лишь позволяем себе поль- пользоваться аффинными координатами. Однако более последова- последовательно считать, что мы перешли теперь в аффинную плоскость (вещественную или вещественно-комплексную), в которой имен- именно аффинные координатные системы наиболее естественны. Чтобы преобразованием аффинных координат привести урав,- нение A) к наиболее простому виду, можно, например, перейти сначала от данных аффинных координат к некоторым прямо- прямоугольным (при этом преобразовании уравнение A) сохранит свой вид, но, конечно, его коэффициенты изменятся), а затем уже известным нам образом перейти от этих прямоугольных координат к прямоугольным каноническим координатам. Если при этом получились канонические уравнения [1]—[5] из таблицы на стр. 516—517, то следует дополнительно сделать (нарушаю- (нарушающее прямоугольность координат) преобразование у' • а ' У — Т* 519
Если получилось уравнение [6], то нужно сделать преобразо- преобразование х' = рх, У' = У, а если получились уравнения [7] или [8], то — преобразование хг — х v ь В случае уравнения [9] можно канонические координаты х, -у оставить прежними. Этим будет доказана следующая теорема об аффинно- канонических уравнениях линий второго по- порядка: Теорема 1. Для любой линии второго порядка существует аффинная координатная система, в которой уравнением линии является одно из следующих девяти уравнений: [1] х2 + у2=1, [4]х2-у2=1, [7]*/2-1=0, [2] ** + /=_ 1, [5] я*-у* = 0, [8]г/2+1 = 0, [3] ** + ^ = 0, [6] г/2 = 2*. [9] г/2 = 0. Определение 1. Уравнения [1]—[9] называются аффинно ка- каноническими уравнениями, а аффинные координаты, в которых уравнение данной линии второго порядка является аффинно каноническим уравнением, называются аффинно каноническими координатами (относительно этой линии). Замечание 2. Изложенное доказательство теоремы 1 (хотя и вполне правильное) может быть подвергнуто серьезной критике с методологических позиций. Действительно, теорема 1 имеет чисто аффинный характер (справедлива в аффинной плоскости), а для ее доказательства мы привлекли евклидовы понятия (пря- (прямоугольные координаты). Хотелось бы иметь доказательство этой теоремы, не выходящее из рамок аффинной геометрии. Поиск такого доказательства имеет не только методологическое, но и чисто практическое значение, поскольку можно ожидать (и это, как мы увидим ниже, действительно оправдывается), что по пути мы найдем более простой способ приведения, не требующий решения характеристического уравнения D) из п. 3 (или триго- тригонометрического уравнения D) из п. 1). Этим вопросом мы зай- займемся в следующих пунктах, а пока обсудим некоторые другие вопросы принципиального характера, связанные с теоремой 1. Замечание 3. Незначительное формальное усовершенствование изложен- изложенного выше доказательства теоремы 1 позволяет сделать его чисто «аффин- «аффинным». Для этого достаточно заметить, что в п. 1 мы по существу пользова- пользовались прямоугольностью координат х, у только дли геометрической интерпре- интерпретации производимых преобразовании. Поэтому с формальной точки зрения все приведение из п. 1 можно делать и в аффинных координатах (только теперь угол 0 в формулах B) п, 1' уже не -будет иметь никакого явного гео- 520. ' -
метрического смысла). Это позволяет провести доказательство теоремы 1, не употребляя слов «прямоугольные координаты» и, следовательно, целиком в рамках аффинной геометрии. Именно, применив преобразования из п. 1 к уравнению A) в аффинных координатах х, у, мы сначала получим описанные в п. 1 «евклидово канони- канонические» уравнения (конечно, это не будут настоящие евклидово канонические уравнения, поскольку соответствующие координаты не будут, вообще говоря, прямоугольными). Затем, применив указанные в доказательстве теоремы 1 дополнительные преобразования (имеющие целью «обратить коэффи- коэффициенты а, Ъ и р в единицы»), мы и получим аффинно канонические уравне- уравнения [1]—[9]. Конечно, этот формальный трюк нисколько не проясняет геометрической основы процесса приведения и не помогает его упростить (правда, некото- некоторого малосущественного упрощения мы все же достигли: предварительный переход от данных аффинных координат к прямоугольным координатам оказывается ненужным). Тем не менее некоторую пользу из него извлечь можно. Дей- Действительно, аналогично евклидовому случаю (см. п. 3) можно поставить задачу об отыскании аффинно канонического урав- уравнения линии второго порядка непосредственно по ее уравнению A), без того чтобы находить соответствующие аффинно канони- канонические координаты. Чтобы решить эту задачу, мы заметим, что описанные выше «дополнительные» преобразования координат переводят евклидово канонические уравнения, принадлежащие различным классам, в различные аффинно канонические уравне- уравнения. С другой стороны, мы знаем, что эти классы могут быть охарактеризованы по инвариантам уравнения данной линии (см. таблицу на стр. 516—517), причем, в силу формально-алге- формально-алгебраического характера этого утверждения, оно верно независимо от того, являются ли наши координаты евклидовыми или лю- любыми аффинными (нужно только, чтобы преобразования коор- координат записывались формулами B) из n.'l). Поэтому, несмотря на то, что величины 5, б и А (н-е говоря уже о К) при любых преобразованиях аффинных координат, вообще говоря, инвари- инвариантными не остаются, мы можем тот факт, что данная линия второго порядка имеет то или иное аффинно каноническое урав- уравнение, охарактеризовать теми же условиями на инварианты: пп [1] [2] [3] [4] [5] [6] [7] [8] [9] Аффиино-канонические уравнения х2 + у2 = 1 X2 + уг = — 1 х2 + у2 = 0 х2 - у2 = 1 Х2 _ у* = 0 I/2 = 2* i/2-l=0 i/2 + 1 = 0 f/2 = 0 Характе] 6>0, 6>0, 6>0, 6<0, 6<0, 6=0, 6=0, 6 = 0, . 6==0, шстика по инвариантам SA<0 SA>0 Д=0 Д^=0 Д=0 Д=^=0 д=о, /е<о д=0, К>0 д=0, К=0 521
Происхождение аффинно канонических уравнений [1]—[9] из евклидово канонических уравнений, рассмотренных в предыду- предыдущих пунктах, показывает, что (в аффинной вещественно-ком- вещественно-комплексной плоскости) эти уравнения выражают соответственно следующие линии: [1] действительные эллипсы, [2] мнимые эллипсы, [3] пары мнимых пересекающихся прямых, [4] гиперболы, {5] пары вещественных пересекающихся прямых, [6] параболы, [7] пары вещественных параллельных (но не совпадающих) прямых, [8] пары мнимых параллельных прямых, [9] пары совпадающих вещественных прямых. Линии, принадлежащие каждому из этих классов, могут быть легко охарактеризованы чисто геометрически. Действительно, рассмотрим следующие условия: A) линия имеет более одной вещественной точки; Б) линия имеет более одной оси симметрии; B) линия пересекает (в вещественной точке) каждую свою ось симметрии; Г) линия содержит две различные прямые (возможно, мни- мнимые) . Тогда мы можем составить следующую таблицу: Класс линий [1] [21 [3] [4] [5] [6] [7] [8] [9] Выполненные условия А, Б, В Б Б, В, Г А, Б А, Б, В, Г А, В А, Б, Г Б, Г А, Б, В Невыполненные условия Г А, В, Г А В, Г — Б, Г В А, В Г Согласно принципу обращения, условия, перечисленные в среднем столбце этой таблицы, однозначно характеризуют соот- соответствующие линии. Заметим теперь, что тот факт, что некоторая линия второго порядка удовлетворяет тем или иным из условий А—Г, не зави- зависит от того, в какой системе координат она рассматривается. Поэтому никаким преобразованием аффинных координат ни одно из уравнений [I]—[9] нельзя перевести в другое, 532
Другими словами, «лишних» линий среди линий [1]—[9] нет. Это означает, что справедлива следующая теорема един- единственности канонических уравнений: Теорема 2. Для любой линии второго порядка ее аффинно- каноническое уравнение однозначно определено. Подчеркнем, что различных систем канонических координат может быть, тем не менее, много. Замечание 4. Поскольку условия Б и В имеют евклидов ха- характер, наше доказательство теоремы 2— методологически не выдержано (ср. замечание 2). При более методологически выдержанном подходе следовало бы найти аналогичные характеризующие условия чисто аффин- аффинного плана и проверить их выполнение (или невыполнение) не- непосредственно по уравнениям [1]—[9]. Упражнение. Сделайте это. Замечание 5. Конечно, еще в пп. 1—3 нам нужно было до- доказать аналогичную теорему для евклидово канонических урав- уравнений, т. е. доказать, что никаким преобразованием прямоугольных координат ни одно из уравнений классов [1]—[9] п. 3 (см. таблицу на стр. 516—517) нельзя перевести в другое уравнение. Мы этого не сделали в пп. 1—3 только для того, чтобы избе- избежать излишних повторений. Сделаем это теперь. Поскольку это утверждение для уравнений, принадлежащих различным классам [1]—[9] п. 3, очевидным образом вытекает из уже доказанного утверждения об аффинно канонических урав- уравнениях, нам достаточно теперь лишь показать, что никаким преобразованием прямоугольных координат ни одно из уравне- уравнений этих классов нельзя перевести в другое уравнение того же класса. Ясно, что для этого достаточно показать, что фигурирующие в этих уравнениях коэффициенты внутренним образом связаны с линией, т. е. могут быть геометрически охарактеризованы без использования каких-либо координат. Но это делается без вся- всякого труда. Например, для линий класса [1] (действительных эллипсов) числа а п b являются расстояниями от центра линии до ее вершин (точек пересечения с осями симметрии), причем если а Ф Ь, то а является большим из этих расстояний, a b — мень- меньшим. Для линий [2] (мнимых эллипсов) аналогичные расстояния равны ia и ib, что снова позволяет однозначно характеризовать числа а и Ь. Задание. Охарактеризуйте геометрически коэффициенты остальных евкли- дово-канонических уравнений. Замечание 6. Аналогичные результаты справедливы, ко- конечно, и в вещественной (евклидовой или аффинной) плоскости. S23
J . Единственное отличие состоит в том, что линии [3] интерпрети- интерпретируются теперь как точки, а линии [2] и [8] объединяются в один класс нулевых линий (пустых множеств). Обратим внимание на то, что, оставаясь на вещественной плоскости, мы не можем доказать (геометрически), что, например, уравнение [2] нельзя преобразовать в уравнение [8]. Поэтому теорему 2 мы можем доказать на вещественной плоскости только для линий второго порядка, содержащих бо- более одной точки. Полученные результаты позволяют без особого труда дока- доказать обещанную в п. 2 § 2 гл. 2 теорему единственно- единственности для линий второго порядка: Теорема 3. Если на вещественно-комплексной плоскости {евклидовой или аффинной) два уравнения второй степени F(x,y) = 0, G(x,y)^Q определяют (в одной и той же координатной системе) одну и ту же линию, то существует такое число k Ф О, что G{x,y) = kF{x, у). На вещественной плоскости аналогичное утверждение спра- справедливо для линий, содержащих более одной точки. Доказательство. Приведем уравнение F(x,y) = 0 B) к каноническому виду (евклидову — на евклидовой плоскости и аффинному — на аффинной). Это приведение состоит в переходе к некоторым каноническим координатам х', у' я в умножении получающегося уравнения на некоторое число. Следовательно, если /(*',*/') = () C) — каноническое уравнение, а х' = ф, (х, у), г/' = ф2(л;, у) — формулы перехода от координат х, у к координатам х', у', то тождественно по х и у имеет место равенство F(x, y) = k1f((f1(\, у), <р2(х, у)), где k\ — некоторое число. Аналогично, приводя к каноническому виду уравнение G(x, y) = 0, D) мы получим тождество вида G (X, у) = k2g (ifo (X, у), "ф2 (X, У)), где &2 — некоторое число, Б24
— канонические координаты для уравнения C), а g(x", y") = 0 E) — соответствующее каноническое уравнение. Но согласно теореме 2 канонические уравнения C) и E) совпадают (с точностью до обозначений координат) и, более того, сохраняются при переходе y" = h2(x',y') от канонических координат х', у' к каноническим координатам х", у". Это означает, что f(x',y') = g(hl(x',y'),h2(x',y% Кроме того, по определению i|>i (*, У) = Л, (q>i (x, у), <р2 (х, у)), ¦Фг (¦*> У) = К (Ф1 (*> У)> Ф2 (х, у)). Поэтому т. е. а (х, у) = f (x, у) h k, • что и требовалось доказать. На вещественной плоскости теорема 2 справедлива только для линий, имеющих более одной точки, и потому теорема 3 справедлива тоже только для таких линий. Теоремы 1 и 2 позволяют также полностью выяснить вопрос об аффинной эквивалентности линий второго порядка. Согласно общему определению (см. определение 3 п. 3 гл. 2) две линии второго порядка называются аффинно эквивалент- эквивалентными («одинаковыми с аффинной точки зрения»), если суще- существует аффинный автоморфизм . (преобразование по равенству координат в двух аффинных координатных системах; см. п. 3 § 3 гл. 2), переводящий одну линию в другую. Пусть F(x,y) = 0 F) 1— уравнение некоторой линии в аффинной координатной си- системе Оху. Перейдем к новой координатной системе О'х'у'. Пре- Преобразование по равенству координат в системах Оху и О'х'у' переводит линию F) в линию, имеющую в координатах х', у' то же уравнение F& */') = 0, G) 525
что и линия F) в координатах х, у. Чтобы получить уравнение G{x,y) = Q (8) линии G) в исходных координатах х, у, нужно, следовательно, в уравнении G) координаты х', у' выразить согласно формулам перехода через координаты х, у. Обратно, пусть нам дана некоторая линия, имеющая в коор- координатах х, у уравнение (8). Перейдя к координатам х', у', мы получим уравнение G) той же линии в координатах х', у'. Обо- Обозначив в этом уравнении координаты х', у' через х, у, мы полу- получим уравнение F) аффинно эквивалентной линии в исходных координатах. Все это можно выразить короче, сказав, что два уравнения F(x, y) = 0 и G(x, y) = 0 тогда и только тогда выражают в одних и тех же аффинных координатах аффинно эквивалентные линии, когда одно уравне- уравнение получается из другого некоторой заменой аффинных коор- координат (и переобозначением координат). В применении к линиям второго порядка это означает, что если некоторая линия, имеющая (в произвольных аффинных координатах- х, у) уравнение второй степени F(x, у) = 0, имеет (в канонических для этой линии координатах х, у), ска- скажем, уравнение 2+2=1, (9) то она аффинно эквивалентна линии, имеющей в исходных коор- координатах х, у уравнение (9). Тем самым из теорем 1 и 2 мы получаем следующую тео- теорему аффинной классификации линий второго порядка: Теорема 4. Любая линия второго порядка аффинно эквива- эквивалентна одной и только одной из девяти линий, выражающихся в произвольной (но фиксированной) системе аффинных коорди- координат уравнениями [1]—[9]. Таким образом, например, все эллипсы аффинно эквива- эквивалентны. Замечание 7. Последнее утверждение иногда формулируют следующим образом: «любой эллипс аффинно эквивалентен ок- окружности». Такая формулировка ') совершенно правильна, но ') Заметим, что она нам по существу известна из элементарной теории эллипса, поскольку рассмотренное в п. 2 § 1 гл. 5 сжатие является, очевид- очевидно, аффинным автоморфизмом. - 526
принадлежит евклидовой геометрии, поскольку в аффинной гео1- метрии понятие окружности отсутствует. Замечание 8. Из того, что любой эллипс аффинно эквивален- эквивалентен окружности, ¦ вытекает, что любым аффинно инвариантным свойством окружности обладают все эллипсы. Это позволяет очень просто получать (методами евклидовой геометрии) раз- разнообразные свойства эллипсов. Например, любая окружность обладает центром симметрии, что является свойством аффинно инвариантным. Следовательно, центром симметрии обладает и любой эллипс. Однако этот способ методологически невыдержан (аффинные свойства получаются евклидовыми методами!), и потому мы им пользоваться не будем. Он и опасен: можно ошибиться и счесть аффинно инвариантным свойством свойство, на самом деле таковыми не являющееся. Конечно, об эллипсе мы говорили только для примера. Все сказанное с равным правом применимо, скажем, к гиперболе (здесь роль окружности играет, естественно, равнобочная гипер- гипербола). Совершенно аналогичные результаты имеют место, конечно, и в евклидовом случае. В частности, имеет место следующая теорема евклидовой классификации линий второго порядка: Теорема 5. Любая линия второго порядка евклидово эквива- эквивалентна (конгруэнтна) одной и только одной линии, выражаю- выражающейся в произвольной (но фиксированной) системе евклидовых координат евклидово каноническим уравнением. Таким образом, имеется бесконечное множество различных евклидово не эквивалентных линий второго порядка, в то время как различных аффинно не эквивалентных линий второго по- порядка имеется только девять. В применении, скажем, к эллипсам (и гиперболам) теорема 5 утверждает, что два эллипса (две гиперболы) тогда и только тогда конгруэнтны, когда они имеют одни и те же полуоси. Аналогично, две параболы тогда и только тогда конгруэнтны, когда их параметры одинаковы. 5. Центры линий второго порядка Мы теперь приступим к систематическому изучению аффин- аффинных свойств линий второго порядка с целью найти подходы к «аффинному» доказательству теоремы 1 п. 4. При этом мы не будем ограничиваться вещественно-комп- вещественно-комплексным случаем и будем рассматривать линии второго порядка в аффинной плоскости над произвольным полем К характери- характеристики, отличной от двух (т. е. таким, что 2а =ф О при а=^0). Это не вызовет (по крайней мере на первых порах) никаких 527
существенных осложнений, но позволит применить полученные результаты, во-первых, к линиям на вещественной плоскости (случаи, геометрически наиболее, наглядный) и, во-вторых, к ли-. ниям на комплексной плоскости (случай, алгебраически наибо- наиболее простой). Пусть аих2 + 2а12ху + а22у2 + 2а1Ъх+2а2Ъу + а33 = 0, A) — уравнение некоторой линии второго порядка в данной аффин- hoJ координатной системе Оху. Согласно формулам F) п. 1 (справедливыми, очевидно, и в рассматриваемом сейчас общем случае), если мы хотим пере- переносом начала координат уничтожить члены с х и у, то новое начало координат мы должны выбрать среди решений системы уравнений al3 0, апу + а23 = 0. Определение 1. Каждая точка (х0, г/о), координаты которой удовлетворяют уравнениям B), называется центром линии вто- второго порядка A). Таким образом, точка {х0, у0) является центром линии вто- второго порядка, если в координатной системе с началом в этой точке уравнение линии не содержит членов с х и у, т. е. имеет вид апх2 -f 2ai2xy -f а22у2 -f a33 = 0. C) Поскольку это уравнение не меняется при замене х, у на —х,—у, начало координат является центром симметрии1) ли- линии C). Но, по условию, это начало координат представляет собой центр линии. Следовательно, каждый центр линии второго порядка является ее центром симметрии. Конечно, здесь предполагается, что говорить о центре сим- симметрии имеет смысл, т. е. что кривая C) содержит хотя бы одну точку (не является нулевой линиейJ). Обратное утверждение мы докажем в следующем виде: Предложение 1. На вещественной или вещественно-комплекс- вещественно-комплексной плоскости каждой центр симметрии линии второго порядка является ее центром. Доказательство. Пусть начало координат @, 0) яв- является центром симметрии линии A). Мы должны показать, что ') Ясно, что понятие центра симметрии имеет смысл в аффинной геомет- геометрии над любым полем (поскольку имеет смысл понятие «середина отрезка»). 2) В вещественно-комплексной (или комплексной) плоскости это условие выполнено автоматически. 528 -
тогда als = 0 и йгз = 0. Но поскольку точка @, 0) является центром симметрии линии A), вместе с некоторой точкой (хо, Уо) уравнению A) удовлетворяет и точка (—х0, —у0), т. е. вместе с соотношением «33 = ° имеет место и соотношение апх\ + 2а12х0у0 + а22у20 — 2а13х0 — 2а23у0 + а33 = 0. Вычитая эти соотношения (и сокращая на 2), мы получим ра- равенство «13*0 + <*23Уо = 0. При ai3 ф 0 или а2з ?= 0 это показывает, что любая точка рассматриваемой линии второго порядка принадлежит прямой 0. Примером линии второго порядка, расположенной на пря- прямой, является дважды взятая прямая. Наиболее общее уравне- уравнение такой линии имеет вид Ясно, что все центры симметрии такой линии ей принадлежат. Поэтому если точка @, 0) является ее центром симметрии, то С = 0 и, следовательно, Для случая вещественно-комплексной плоскости это доказы- доказывает предложение 1, поскольку дважды взятая прямая является, как мы знаем из теоремы 2 п. 4, единственной линией второго порядка, расположенной на прямой. На вещественной плоскости, кроме дважды взятых прямых, имеется еще лишь один класс ненулевых линий второго порядка, располагающихся на прямой, а именно — точки. Поскольку цент- центром симметрии множества, состоящего из одной точки/ является сама эта точка, уравнение A), изображающее линию второго порядка, являющуюся точкой и имеющую центр симметрии в на- начале координат, должно удовлетворяться координатами точки @, 0) .и только ее координатами. Следовательно, если линия второго порядка A) является точкой @,0), то, во-первых, • 529
и, во-вторых, уравнение получающееся из уравнения A) подстановкой у = О, должно удовлетворяться только при х = О, что возможно лишь при аи = 0 и а\з ф О или при аи ф О и а[3 = 0. Аналогично показывается, что либо а2г = 0 и а23 ^ 0, либо а2г =/= 0 и а2з = 0. Если а!3 = 0 и а2з т^ 0, то а^Ф 0 и а2г = 0, так что уравне- уравнение A) имеет вид аих2 + 2а12ху + 2а2гу = 0, аи Ф 0, а23 # 0 и поэтому имеет ненулевые решения (х0, г/о) (достаточно взять любое х0 Ф 0, для которого a{ix0-\-а2г Ф 0). Следовательно, случай ai3 = 0, а2з Ф 0 невозможен. Аналогично показывается, что случай an ф 0, а2з = 0 также невозможен. Пусть теперь а[3 ф 0 и а23 ф 0. Тогда ац = 0 и 022 = 0, и уравнение A) имеет вид 2а12ху + 2а13х + 2а23 = О, и потому также имеет ненулевые решения. Следовательно, этот случай также невозможен. Поэтому а\$ = а23 = 0. Тем самым, предложение 1 полностью доказано. Для случая произвольного поля К (характеристики, отлич- отличной от двух) изложенное доказательство показывает лишь, что если линия второго порядка либо не расположена на прямой, либо является дважды взятой прямой или точкой, то любой центр симметрии этой линии служит ее центром. Замечание 1. Определение 2 центра линии второго порядка привязано к определенному уравнению линии и определенной координатной системе, и потому неясно, не зависит ли оно от выбора этой координатной системы? Теперь мы охарактери- охарактеризовали центры линии второго порядка (по крайней мере, на ве- вещественной или вещественно-комплексной плоскости) как ее центры симметрии, т. е. способом, не зависящим от системы ко- координат. Поэтому центры линии второго порядка на веществен- вещественной или вещественно-комплексной плоскости определены кор- корректно. В общем случае любого поля К для доказательства коррект- корректности определения центра следует найти, как преобразуются коэффициенты уравнения A) при произвольном преобразовании 530
координат, и на этой основе показать, что для преобразован- преобразованного уравнения центры будут те же самые, что и для исходного уравнения. Упражнение. Докажите в общем случае корректность определения центра линий второго порядка. Для системы уравнений B) возможны следующие три слу- случая: I. Уравнения B) имеют единственное решение. II. Уравнения B) не имеют ни одного решения. III. Уравнения B) имеют бесконечно много решений. Определение 2. В случае I линия второго порядка назы- называется центральной. Она имеет единственный центр. В случаях II и III линия A) либо вообще не имеет центров, либо они заполняют некоторую прямую, называемую прямой центров (уравнения B) не могут удовлетворяться тождественно, ибо, по условию, хотя бы одно из чисел аи, а\2, а22 отлично от нуля). Такие линии второго порядка называются нецентраль- нецентральными. Примерами центральных линий являются эллипсы, гиперболы и пары пересекающихся прямых, а нецентральных — параболы (центров нет) и пары параллельных прямых (имеется прямая центров). Из алгебры известно, что система двух уравнений с двумя неизвестными тогда и только тогда имеет единственное реше- решение, когда ее определитель отличен от нуля. Но определитель системы B) —это знакомый нам определитель «11 «12 о = а2[ а22 Следовательно, центральные линии второго порядка характеризуются ус- условием 6=7^=0, а нецентральные — условием 6=0. Далее, система двух уравнений с двумя неизвестными тогда и только тогда имеет семейство решений, зависящих- от одного параметра, когда уравнения пропорциональны. Но пропорцио- пропорциональность уравнений B) означает пропорциональность первых двух строк определителя Д = а11 а12 а13 а21 а22 а2з Следовательно, если имеет место случай III, то А = 0. Обратно, пусть А = 0 (и 6 = 0). Покажем, что тогда первые две строки определителя А пропорциональны (т. е. что имеет место случай III). 531
Действительно," так как 6 = 0, то строки определителя^ пропорциональны. Хотя бы одна строка -Этого определителя по условию отлична от нуля. Пусть, для определенности, отлична от нуля первая строка. Тогда где k — некоторое число. Разложив определитель Д по элементам последней строки, мы, следовательно, получим, что «11 «22 «13 «23 — «32 «U «21 «13 «23 + «33 «11 «12 «21 «22 = (««31 — «32) «11 «21 «13 «23 Поскольку Д = 0, отсюда вытекает, что либо ka3i — а3г = 0, либо «И «13 «21 «23 = 0 и, следовательно, существует такое число /, что «13 = /«11, «23 = ^«21! и потому а2з = /&«ц = я«1з- В обоих случаях а32 = &«зь так что первые две строки определителя Д пропорциональны. Тем самым доказано, что случай II характеризуется условиями б = 0, Д Ф 0, а случай III —условиями б = 0, Д = 0. Замечание 2. Сравнивая полученные утверждения с резуль- результатами п. 1, мы немедленно получаем следующую геометриче- геометрическую интерпретацию типа линии второго порядка (введенного в п. 1 довольно формальным образом): линии типа I—это центральные линии, линии типа II — это линии, не имеющие центра, линии типа III — это линии, обладающие прямой центров. Таким образом, на вещественно-комплексной плоскости центральные линии — это эллипсы {действительные или мнимые), гиперболы и пары пересекающихся прямых {вещест- {вещественных или мнимых), линии, не имеющие центра, — это параболы {и только они), линии, обладающие прямой центров — это пары параллель- параллельных {или совпадающих) прямых {вещественных или мнимых). Для эллипса (действительного) и гиперболы центр совпадает с центром в смысле пп. 2 и 3 § 1 гл. 5. Для пары пересекаю- пересекающихся (вещественных или мнимых) прямых центром является их точка пересечения. Для параллельных (вещественных) прямых прямой центров является прямая, им параллельная и находящаяся от них на половинном расстоянии. Прямой цент- центров дважды взятой прямой является сама эта прямая, Б32
Схематически расположение центра (центров) изображено на следующих диаграммах: Ш й С • ') ^- '' [7] г 1 ^ -'' т OOOOOOOOOO га >< [з] ооооооооэо °°?9Ааоооа 6. Асимптоты и диаметры линий второго порядка В соответствии с определением 1 п. 6 § 1 гл. 5, направление /: т на плоскости называется асимптотическим для линии вто- второго порядка апх2 + 2а12ху + а22у2 + 2al3x + 2a^\) + а33 = 0, A) если au/2-f-2ai2/m + a22m2 = 0. B)" Пусть, как и выше, а12 #22 Легко видеть, что если основное поле К содержит элемент Y — 6? т.е. эле- элемент, квадрат которого равен —б, то решения уравнения B) могут быть выражены любой из двух формул: 6 = /. m = а22 .\ — а12 + у —о); в противном случае уравнение B) решений не имеет. Замечание 1. При пц =ф 0 и а22 =ф 0 формулы C) равносиль- равносильны. В случае же, когда аи = 0 или а2г = 0, следует пользоваться той из формул C), которая имеет смысл. В частности, на вещественной плоскости (т. е. при K=»R) эллиптические линии (с б > 0) не имеют асимптотических направлений; параболические линии (с 6=0) имеют одно асим- асимптотическое направление (характеризующееся отношением БЗЗ
—#12: Qii~*== —#22: «12), а гиперболические линии (с 6 < 0) имеют два асимптотических направления. Для гиперболы асимптотическими направлениями являются направления ее асимптот (этим и объясняется термин «асимп- «асимптотическое направление»), а для пары пересекающихся пря- прямых— направления этих прямых. Для параболы единственным асимптотическим направлением является направление ее оси, а для пары параллельных (или совпадающих) прямых — направления этих прямых. На вещественно-комплексной плоскости (когда К = С), эллиптические линии имеют два комплексно-сопряженных асимптотических направления, параболические линии имеют одно (вещественное) асимптотическое направление, а гиперболиче- гиперболические линии— два вещественных асимптотических направления. Заметим, что асимптотическое направление параболической линии вещественно и тогда, когда линия является парой мни- мнимых параллельных прямых (и совпадает с направлением этих прямых, которое, следовательно, вещественно). На комплексной плоскости (т. е. при К = С) различе- различение эллиптических и гиперболических линий смысла не имеет. На этой плоскости можно говорить только о центральных ли- линиях (с б Ф 0) и нецентральных (параболических) линиях (с 6 = 0). При этом центральные линии имеют два асимптотических направления, а нецентральные — только одно. Замечание 1. Мы видим, в частности, что асимптотические направления линии второго порядка могут быть охарактеризо- охарактеризованы (по крайней мере на вещественной плоскости) чисто гео- геометрически. Это показывает, что хотя в определении асимптоти- асимптотического направления и участвует система координат, но на са- самом деле асимптотические направления от выбора координатной системы не зависят (определены корректно). В общем случае корректность определения асимптотических направлений следует (подобно корректности определения цен- центра; см. замечание 1 из п. 5) доказывать вычислением, выяснив предварительно, как меняются коэффициенты уравнения A) при преобразовании координат. Упражнение. Докажите корректность определения асимптотических на- направлений. На вещественной, комплексной или вещественно-комплекс- вещественно-комплексной плоскости асимптотами (в смысле п. 2 § 2 гл. 5) обладают из всех линий второго порядка только гиперболы и пары парал- параллельных (или совпадающих) прямых (в последнем случае асимптотой является любая прямая, параллельная этим пря- прямым, но от них отличная). Напротив, асимптотами в смысле п. 3 § 1 гл. 5 обладают (на вещественной плоскости) кроме :534
гипербол также пары (необязательно различных) прямых (без- (безразлично, параллельных или пересекающихся), причем теперь асимптотами будут уже сами эти прямые и только они (ибо по- постоянная величина, равная нулю, имеет предел 0). Впрочем, до- допуская определенную непоследовательность, обычно говорят об асимптотах (в смысле п. 3 § 1 гл. 5) только тогда, когда «уходя- «уходящая в бесконечность» ветвь линии, к которой приближается асимптота, не является прямой. В этом смысле, из всех линий второго порядка асимптотами обладают лишь гиперболы. Пусть теперь /: т — произвольное неасимптотическое направление. Поскольку аи12 + 2а121т + а22т2 = (ant + al2m) I + (al2l + а22т) тфО, D) то хотя бы одно из чисел ац1 + a,\2tn и anl + a22tn отлично от нуля. Поэтому уравнение (anl + al2m) x -f (al2l + а22т) у + (anl + а23т) = 0 E) определяет на плоскости некоторую прямую. Определение 1. Прямая E) называется диаметром линии второго порядка, сопряженным с неасимптотическим направле- направлением I: ш. Прямые направления /: m имеют параметрические уравне- уравнения вида х = х0 + It, у = Уо + mt. Предположим, что одна из таких прямых пересекает линию A) в двух различных точках Мг(хи yt) и М2(х2, у2)- Будем считать, что за точку (хо, у0) на такой прямой выбрана середина отрезка М\М2. Тогда + + _ *1 + *2 _ t/i+j/2 0 — 2 ' ^° — 2 и, одновременно, Х1 — х0 ~\~ Ни -^2 == ^0 "Т~ Мъ yi=yo + mtu у2 = Уо + ™*2, где /, и /2 — корни уравнения {aul2 + 2a12lm + а22"г2) t2 + + 2 [anlx0 + а12 (/г/о + mx0) + a22tny0 + a13l + a23m] t + + апх20 + 2а12х0у0 + аау\ + 2а13х0 + 2а23у0 + а33 = 0 (см. п. 2 § 2 гл. 5). Следовательно, — *0 + lh + Х0 + It2 _ . / ,, , , v 2 — ^oTyl'iT h) 535
и, аналогично, = 00 +-7 01 +'а). Поскольку числа I и т одновременно нулю не равны, эти ра- равенства возможны тогда и только тогда, когда Но если сумма корней квадратного уравнения равна нулю, его средний коэффициент также равен нулю. Поэтому при ука- указанном выборе точки (хо, г/о) имеет место равенство ап1ха + а12 Aу0 + тх0) -f a22my0 -f al3t -f а23т = 0, т. е. равенство (ап1 + а12т) х0 + (ап1 + а22т) у0 + (al3l + а2гт) — 0. Тем самым доказано следующее Предложение 1. Если среди прямых неасимптотического направления I: m имеются прямые, пересекающие линию A) в двух точках, то диаметр E), сопряженный с направлением I: пг, является прямой, содержащей середины хорд, высекаемых на прямых этого направления линией A). Определение 2. Направление /: m мы назовем хордальным (по отношению к данной линии второго порядка A)), если су- существуют по крайней мере две прямые этого направления, каж- каждая из которых пересекает линию A) в двух различных точках. В этой терминологии предложение 1 утверждает, что диаметр, сопряженный с произвольным хордальным неасимп- неасимптотическим направлением, однозначно характеризуется как пря- прямая, содержащая середины хорд этого направления. , На вещественной (а также на вещественно-комплексной и комплексной) плоскости каждое неасимптотическое направление эллипса, параболы, гиперболы и пары несовпадающих прямых является, очевидно, хордальным. Поэтому для этих линий пред- предложение 1 характеризует все диаметры. При этом диаметры эл- эллипса, параболы и гиперболы оказываются совпадающими с их диаметрами в смысле- п. 5 § 2 гл. 5, а диаметрами пары пересе- пересекающихся прямых являются все прямые, проходящие через их точку пересечения. Что же касается пары параллельных (раз- (различных) прямых, то они имеют единственный диаметр — пря- прямую, им параллельною и находящуюся от них на половинном расстоянии (т. е. прямую центров). Найдем теперь диаметры линии второго порядка, являю- являющейся дважды взятой прямой: (Ах-\-Ву + СJ = 0. В развернутом виде уравнение такой линии имеет вид Л2^ + 2АВху + В2у2 + 2 АСх,+ 2ВСу + С2 = 0v 636 -:
Следовательно, уравнение E) имеет для такой линии вид (АН + АВт) х + (АВ1 + В2т) у + (АС1 + ВСт) = 0. Сокращая на А1-\-Вт (что возможно, ибо в силу условия не- неасимптотичности А1 -f- Вт =Ф 0), мы получаем уравнение 'Ах + By + С = 0. Следовательно, любой диаметр линии второго порядка, являющейся дважды взятой прямой, совпадает с этой прямой. Таким образом, и для этих кривых диаметр может быть охарактеризован инвариантным геометрическим образом. Естественно считать, что дважды взятую прямую каждая прямая (от нее отличная) пересекает в двух совпадающих точ- точках. Поскольку середина вырожденного отрезка совпадает с его концами, отсюда следует, что и для дважды взятой прямой диаметр может быть охарактеризован как прямая, содержащая середины хорд данного направления. Поскольку определение 1 диаметра использует координат- координатные системы, возникает вопрос о его корректности (независимо- (независимости от координатной системы). Для дважды взятой прямой от- ответ на этот вопрос — утвердительный, поскольку такая линия имеет единственный диаметр, совпадающий с этой прямой. Для других линий второго порядка утвердительный ответ обеспечи- обеспечивается предложением 1 для диаметров, сопряженных с хордаль- ными направлениями. В частности, для всех диаметров ответ ут- утвердительный (на плоскости над любым полем) для пар прямых (пересекающихся или параллельных), а на вещественной, веще- вещественно-комплексной или комплексной плоскости — для эллипса, гиперболы и параболы. На вещественно-комплексной плоскости это полностью ре- решает вопрос, а на вещественной плоскости корректность опре- определения диаметров остается открытой только для нулевых ли- линий и линий, состоящих из одной точки. Общее доказательство корректности определения диаметра можно получить (так же как и общее доказательство коррект- корректности определения центра; см. п. 5), исследовав, как меняются коэффициенты уравнения A) при преобразовании координат, Упражнение. Проведите доказательство корректности определения диа- диаметра. Пусть (х0, у0) — произвольный центр линии второго порядка A). Тогда, по определению, 537
Умножая первое уравнение на 7, а второе на т и складывая, мы получаем, что (ап1 + а12т) х0 + (al2l + а22т) Уо + (а13/ + «23^) = 0. Этим доказано, что каждый диаметр линии второго порядка проходит через лю- любой ее центр. В частности, отсюда вытекает, что если линия второго порядка обладает прямой центров, то эта линия имеет единственный диаметр, совпадающий с этой пря- прямой. Таким образом, для линии, являющейся парой параллельных (или совпадающих) прямых, имеется единственный диаметр — ее прямая центров. Впрочем, этот факт мы выше уже доказали другим способом. Определение S. Направления I: m и /': пг' называются со- сопряженными (относительно данной кривой второго порядка A)), если (ап1 + а12т) V + (а21/ + а22т) пг' = 0, т. е. если anll' + al2 (Im' + I'm) + а22тт' = 0. F) Поскольку равенство F) симметрично относительно /:т и /': т', то отношение сопряженности симметрично, т. е. если направление I: m сопряжено с направлением V: пг', то направление V : пг' сопряжено с направлением I: т. Направление /: т тогда и только тогда самосопряжено, т. е. сопряжено с самим собой, когда aul2 + 2a12lm -f a22tn2 = 0, т. е. когда оно является асимптотическим направлением. Определение 4. Направление /: пг называется особым, если оно сопряжено с каждым направлением V : пг'. Ясно, что для того чтобы направление I: пг было особым, не- необходимо и достаточно, чтобы anl + al2m = 0, ' a2\l -f- а^пг = 0, ^ Поскольку система двух уравнений с двумя неизвестными тогда и только Тогда имеет нетривиальное решение, когда ее определи- определитель равен нулю, и поскольку определителем системы G) слу- служит определитель б, мы видим, что особые -направления могут быть только у нецентральных (па- (параболических) линий. При 6 = 0 каждое из уравнений G) является следствием другого, и потому эти уравнения1 имеют единственное (с точ- точностью до пропорциональности) нетривиальное.решение /: m == 538
= —tf]2: аи = —«22: ai2. Поскольку отношение —а^ : аи = = —а2г: аи характеризует, как мы уже знаем, асимптотическое направление параболической линии, тем самым доказано, что любая параболическая линия имеет единственное особое на- направление, совпадающее с ее асимптотическим направлением. Направление /': т', сопряженное с неособым направлением I: т, однозначно характеризуется равенством /.''. т' = — (а21/ + а22т) '¦ (ап1 + апт). Поэтому, если направление /: т не асимптотично (и, в частно- частности, не особо), то сопряженное с ним направление V : т' может быть описано как направление диаметра, сопряженного с на- направлением 1:т, поскольку, как показывает уравнение E), на- направление этого диаметра как раз и характеризуется отноше- отношением — (al2l + а22т) : (ап1 + аХ2т). Определение 5. Диаметры линии второго порядка назы- называются сопряженными, если они оба имеют неасимптотические направления (ситуация, возможная только для центральных ли- линий) и эти направления сопряжены. Согласно только что ска- сказанному, диаметры (центральной) линии второго порядка тогда и только тогда сопряжены, когда каждый из них сопряжен с на- направлением другого. , Для центральных линий второго порядка каждый из сопря- сопряженных диаметров, имеющих хордальные направления, может быть описан как прямая, содержащая середины хорд, которые данная линия высекает на прямых, параллельных другому диаметру. Эти утверждения геометрически характеризуют сопряженные направления, что, в частности, доказывает корректность опре- определения сопряженности направлений (и диаметров). Замечание 2. На евклидово-проективной плоскости направления (соб- (собственных) прямых находятся в биективном соответствии с точками несоб- несобственной прямой. Будем называть несобственные точки сопряженными, если соответствующие им направления сопряжены. Предположим, что рассматри- рассматриваемая линия второго порядка центральна. Тогда для любой несобственной точки М существует единственная несобственная точка М', сопряженная с точкой М. Следовательно, сопоставив каждой точке М сопряженную точку М', мы получим некоторое однозначно определенное отображение Г несоб- несобственной прямой на себя. Поскольку отношение сопряженности симметрично, это отображение является инволюцией. Для эллиптических линий эта ин- инволюция не имеет неподвижных точек, а для гиперболических линий она обладает двумя неподвижными точками (соответствующими асимптотиче- асимптотическим направлениям). В параболическом случае отображение Г также опреде- определено и представляет собой отображение, переводящее всю несобственную прямую в одну «особую» точку (соответствующую особому направлению). Если рассматривать отношение х = /: m как «координату» на несобственной прямой, то отображение Г будет задаваться дробно-линейной функцией 539 aux + an'
На основании этой связи между линиями второго порядка и инволюция- инволюциями на несобственной прямой любая инволюция*на произвольной прямой, вы- выражающаяся дробно-линейной функцией, называется эллиптической, если она не имеет неподвижных точек, гиперболической, если она имеет две неподвиж- неподвижные точки, и параболической, если она имеет одну неподвижную точку (и представляет собой отображение всей прямой в эту точку). Ср. замечание 3 п. 6 § 3 гл. 4.' 7. Приведение уравнений линий второго порядка к простейшему виду Направления координатных осей характеризуются отноше- отношениями 1:0 и 0:1. Отсюда и из формулы F) п. 6 непосред- непосредственно вытекает, что направления координатных осей.тогда и только тогда сопря- сопряжены, когда а12 = 0. Кроме того, мы знаем (см. п. 5), что начало координат @, 0) тогда и только тогда является центром линии второго порядка, когда Тот факт, что начало координат является центром линии второго порядка, а направления координатных осей сопряжены, означает для центральных линий (тип. I), что координатные оси являются сопряженными диаметрами. В этом случае урав- уравнение линии имеет вид ?зъ-=Ъ, A) причем аи Ф 0 и а22 ?=0 (ибо в противном случае 6 = 0). Для нецентральных линий условие сопряженности осей од- однозначно определяет направление одной из них (оно должно быть особым, т. е.-асимптотическим). Для определенности мы будем считать, что особое направление имеет ось абсцисс. На- Направление оси ординат мы тогда можем выбрать произвольно (поскольку любое направление сопряжено с особым). Так как координатные оси сопряжены, то й\2 = 0, а так как направление оси абсцисс является особым направлением, то ац = 0. Поэто- Поэтому, если рассматриваемая нецентральная линия обладает пря- прямой центров (принадлежит типу III), то, выбирая указанным способом направления координатных осей и помещая начало координат в произвольный центр линии, мы получим для нее уравнение вида 2 + а33 = 0, ап Ф 0. B) Заметим, что при таком выборе начала координат ось абс- абсцисс будет не просто пряцой асимптотического направления, а будет диаметром,. сопряженным с направлением оси ординат (прямой центров). 540
Для нецентральных линий, не имеющих центра (тип. II), уничтожить линейные члены невозможно. Поэтому в этом случае мы поступим несколько иначе. Именно, так же как для линий типа III, мы направление оси ординат выберем произвольно, а за ось абсцисс примем диаметр, сопряженный с этим направле- направлением. Поскольку направление этого диаметра является асимпто- асимптотическим, то ап = 0. С другой стороны, согласно формуле E) п. 6 диаметр, сопряженный с направлением 0: 1 оси ординат, имеет уравнение а22у + а2Ъ = 0. Так как, по условию, этим диаметром является ось абсцисс, коэффициенты а12 и а2ъ этого уравнения должны быть равны нулю (а коэффициент а22 отличен от нуля). Таким образом, в описанной координатной системе (с пока еще точно не опреде- определенным положением оси ординат) уравнение рассматриваемой линии второго порядка имеет вид а22у2 + 2апх + а33 = 0, а22ф 0. Полагая в этом уравнении у = 0, мы немедленно получим, что ось абсцисс пересекает нашу линию в некоторой точке (а именно, в точке с абсциссой—-^12-; заметим, что а\гФ0, поскольку в противном случае наша линия принадлежала бы не типу II, а типу III). Поэтому мы можем окончательно выбрать систему координат, потребовав, чтобы начало координат было точкой пересечения оси абсцисс с линией. При таком выборе начала координат будет иметь место равенство а33 = 0 и потому уравнение линии будет иметь вид а22у2-\-2а13х — 0, C) где а22 ф 0 и aiS ф 0. Подводя итоги, мы получаем следующую теорему при- приведения: Теорема 1. Для любой линии второго порядка существует аффинная координатная система, в которой ее уравнение имеет либо вид A), либо вид B), либо вид C). К виду- A-) могут быть приведены уравнения центральных линий, причем уравнение центральной линии тогда и только тогда имеет вид A), когда координатные оси являются сопря- сопряженными диаметрами. К виду B) могут быть приведены уравнения нецентральных линий, не имеющих центров, причем ~~уравнение такой линии тогда и только тогда имеет вид B), когда ось абсцисс является диаметром, сопряженным с направлением оси ординат, а на- начало координат является точкой пересечения линии с осью абсцисс, ' '. . 541
К виду C) могут быть приведены уравнения нецентральных линий, обладающих прямой центров, причем уравнение такой линии тогда и только тогда имеет вид C), когда ось абсцисс является прямой центров этой линии. Замечание 1. Подчеркнем, что эту теорему мы доказали для линий второго порядка над любым полем К (характери- (характеристики, отличной от двух). Более того, коэффициенты приведен- приведенных уравнений A), B) и C) (так же как и соответствующие координаты) мы можем найти (по коэффициентам исходного уравнения) лишь рациональными действиями (сложением и вы- вычитанием, умножением и делением). Например, если коэффи- коэффициенты исходного уравнения линии второго порядка были ве- вещественными числами, то коэффициенты приведенных уравне- уравнений (и коэффициенты формул перехода от исходных координат к новым) также будут вещественными числами. Возможность дальнейшего упрощения уравнений A), B) и C) зависит от арифметических свойств поля К. Например, пусть поле К является полем R вещественных чисел (т. е. мы находимся в вещественной или вещественно-комплексной плос- плоскости). Тогда для любой центральной линии мы от координат х, у, в которых ее уравнение имеет приведенный вид A), можем перейти к координатам х', у', связанным с координатами х, у формулами если а33 ф О, г , если а33 = О. Уг=У\а22\у ' Для линий с уравнением C) мы положим х' = а13х, У' = V\ «22 I У, а для линий с уравнением B) положим х' = х, | у=*<~ если азз х' = х, 542 \ если «зз== О-
В результате мы получим следующие уравнения (штрихи в обозначениях координат мы опускаем): ± х2 ± у2 + 1 = О, ± х2 ± у2 = О, ± у2 + 2х = О, ±г/2+1=0, Меняя (если нужно) ориентации координатных осей и умно- умножая уравнения на ±1, мы немедленно получаем из этих урав- уравнений знакомые нам девять уравнений, перечисленные в тео- теореме 1 п. 4: [1]*2+г/2=1, [4]х2-у2 = 1, [7]у2-1=0, [2] х2+у2=-1, [5]х2-у2 = 0, [8] г/2+1=0, [3] х2+у2 = 0, [6] у2 = 2х, [9] г/2 = 0. Тем самым мы заново (и чисто «аффинно») доказали тео- теорему 1 п. 4 (одновременно выяснив геометрический смысл про- процесса приведения). Пусть теперь поле К является полем С комплексных чисел, т. е. мы рассматриваем комплексную аффинную плоскость и на ней линии второго порядка, выражающиеся уравнениями с комплексными коэффициентами (напомним, что на комплексной плоскости — в отличие от вещественно-комплексной плоскости — понятие линии, выражающейся уравнением с вещественными коэффициентами, бессмысленно). Тогда совершенно аналогич- аналогичные (лишь несколько более простые) рассуждения доказывают следующую теорему об аффинно канонических уравнениях линий второго порядка на ком- комплексной плоскости: Теорема 2. Для любой линии второго порядка на комплекс- ной плоскости существует аффинная координатная система, в которой уравнением линии является одно из следующих пяти уравнений: [1] х2 + у2=\, [3] у2 = 2х, [2] *2+г/2 = 0,. [4] у2- 1=0, [5] г/2 = 0. При этом никаким преобразованием аффинных координат (на комплек- комплексной плоскости) ни одно из уравнений [1]—[5] нельзя перевести в другое. Задание, Докажите это утверждение (.ср.. п. .4). ¦ ¦ 543
Линии, имеющие каноническое уравнение A), являются не- невырожденными центральными линиями (их с равным правом можно называть «эллипсами» или «гиперболами»). Линии, имеющие каноническое уравнение [3], являются не- невырожденными параболическими (нецентральными) линиями (их можно называть «параболами»). Остальные линии ([2], [4] и [5]) являются парами прямых (пересекающихся, параллельных, но не совпадающих, и совпа- совпадающих) . Чтобы понять, каким образом эллипсы и гиперболы объединились на комплексной плоскости в одну линию, напомним, что любая линия в ком- комплексной плоскости геометрически представляет собой поверхность и .что ве- вещественно-комплексная плоскость получается из комплексной плоскости не- некоторым выбором вещественной плоскости Ш1вещ. Поверхность, изображаю- изображающая линию [1], обладает тем свойством, что при одном выборе веществен- вещественной плоскости Ш1вещ в пересечении получается эллипс, а при другом — ги- гипербола. Наглядно представить себе эту поверхность нельзя. Непосредственным следствием теоремы 2 является (ср. п. 4) следующая теорема об аффинной классификации линий второго порядка на комплексной пло- плоскости: Теорема 3. Любая линия второго порядка на комплексной плоскости аффинно эквивалентна одной и только одной из пяти линий, имеющих в произвольной (но фиксированной) системе аффинных координат уравнения [1]—[5]. В частности, на комплексной плоскости все невырожденные центральные линии аффинно эквивалентны. 8. Главные направления и диаметры линий второго порядка Вернемся снова к евклидовой (вещественной или веществен- вещественно-комплексной) геометрии и в соответствии с этим будем опять считать координаты х, у прямоугольными. Определение 1. Направление /: m называется главным, по отношению к данной линии второго порядка апх2 + 2а12ху + а22у2 + 2а13х + 2а23у + а33 ==0, A) если перпендикулярное к нему направление /': т' с ним сопря- сопряжено. Таким образом, в частности, для любой параболической линии особое направление яв- является главным. Главным является и направление, перпендикулярное особому. ' Если направление 1:пг не особо, то с ним сопряжено един- единственное направление V :т'== — (a2ll -f- .Cjj/») : (anl + ai2m). 544 " ' ".'.¦¦¦¦
Так как направления I: m и V :т' тогда и только тогда пер- перпендикулярны, когда //' + mm' = О, отсюда вытекает, что неособое направление /: т тогда и только тогда является главным, когда / (а21/ + а22т) — т (аи1 + а12т) = О, т. е. когда — an)lm — а12т2 = 0. B) Поскольку для особого направления это соотношение также справедливо, тем самым доказано, что направление I: m тогда и только тогда является главным, когда для него имеет место соотношение B). При Й12 = 0 и аи = «22, т. е. (см. конец п. 3) в случае, когда линия A) является окружностью (быть может, мнимого или нулевого радиусов), соотношение B) удовлетворяется тожде- тождественно. В противном случае оно представляет собой уравне- уравнение, которому должны удовлетворять главные направления. Ре- Решения этого уравнения могут быть, очевидно, выражены любой из формул I: m = (аи - а22 ± V{an - а22J + 4а%) : 2а12) l:m = - 1ап : (а„ - а,2 =F У(ап — a22f + 4а*2). (При а\2 Ф 0 эти формулы равносильны. В случае же, когда Й12 = 0, следует пользоваться той из формул C), которая имеет смысл; именно, первой формулой, когда корень берется с поло- положительным знаком, и второй — в противном случае.) . Поскольку подкоренное выражение в формулах C) положительно, мы видим, что даваемые этими формулами значения отношения I : m всегда вещественны (и различны). Тем самым доказано следующее Предложение 1. Для любой линии второго порядка, не яв- являющейся окружностью, существует точно два различных ве- вещественных главных направления. Для окружности (возможно, мнимого или нулевого радиусов) все направления являются главными. Поскольку направление, перпендикулярное главному, также, очевидно, является главным, найденные главные направления перпендикулярны друг другу. Замечание 1. Согласно формулам C) нахождение главных направлений требует, вообще говоря, извлечения квадратных корней. Замечательно, что для параболических (нецентральных) 18 Ms Ma Постников 545
линий главные направления можно найти, и не извлекая квад- квадратных корней, поскольку для параболических линий главные направления характеризуются отношениями а\\ '• а\1 == #12 '• #22 и — #12 • аП — — #22 • #12- Действительно, отношение —аХ2:ап=-—а22: аХ2 характери- характеризует, как мы знаем, асимптотическое (особое) направление па- параболических линий, а отношение ап : а!2 = ai2: а2г — направ- направление, ему перпендикулярное. Определение^ 2. Диаметр линии второго порядка называется главным-, если он сопряжен с перпендикулярным ему направ- направлением, т. е. если он перпендикулярен некоторому главному на- направлению (ср. определение 2 п. 5 § 2 гл. 5). Так как любой диаметр проходит через середины хорд сопря- сопряженного направления (см. п. 6), то любой главный диаметр линии второго порядка является ее осью симметрии. Обратное, как показывает пример двух перпендикулярных прямых, вообще говоря, неверно. Далее, ясно, что направление любого главного диаметра является главным направлением. Обратное также, вообще говоря, неверно. Действительно, для параболических линий все диаметры имеют особое (асимпто- (асимптотическое) направление, но существует главное направление, ко- которое неасимптотично и потому не является направлением ни- никакого диаметра. Для вырожденных параболических линий (линий типа III) существует только один диаметр (прямая центров) и поскольку перпендикулярное к нему направление представляет собой глав- главное направление, он является главным диаметром. Для парабол (линий типа II) также существует только один главный диаметр, а именно, диаметр, сопряженный с главным неасимптотическим направлением. Для центральных линий (линий типа I), отличных от окруж- окружности, существует два главных диаметра, каждый из которых сопряжен с направлением другого (и потому ему перпендику- перпендикулярен). Для окружностей все диаметры являются главными. Для нецентральных линий (линий типа II и III) главный диаметр сопряжен с направлением, характеризующимся отноше- отношением пц : ai2 = а12: аг2- Следовательно, чтобы получить уравне- уравнение главного диаметра, следует в уравнении E) п. 6 положить либо I = an, m = ахъ либо / = ai2, т = а22. Полагая, например, / = аи, т = а12, мы получим уравнение (ап + «У * + ai2 (ап + ап) У + anai3 + aacha-=ss °- 546
Но, по условию, Qua22 = a\v и потому а2п + а% = аи(ап + а22). Кроме того, «н + а22 ф О, поскольку, как мы знаем (см. п. 3), равенство ап»\-а22 = 0 ха- характеризует равнобочные гиперболы и пары перпендикулярных прямых. Следовательно, мы можем полученное уравнение сократить на а\\ + а22. В результате получим уравнение Аналогично, полагая в уравнении E) п. 6 / = а2!, т=а22, мы (после сокращения на аи + aJ2) получим уравнение + = О. E) Таким образом, уравнение главного диаметра параболической линии второго порядка может быть записано либо в виде D), либо в виде E). Уравнение D) имеет смысл (не сводится к тождеству 0 = 0) тогда и только тогда, когда либо аи ф 0, либо an Ф 0. Это не удивительно, поскольку при его выводе мы принимали за / и m числа ац и а[2, что имеет смысл тогда и только тогда, когда хотя бы одно из этих чисел отлично от нуля. Аналогично, уравнение E) имеет смысл тогда и только то- тогда, когда либо й2\ ф 0, либо а22 Ф 0. Когда оба уравнения D) и E) имеют смысл, они равно- равносильны. В случае, когда рассматриваемая линия является параболой (имеет тип II), ее главный диаметр является ее осью. Следо- Следовательно, для параболы уравнения D) и E) являются уравнениями ее оси. В случае вырожденной параболической линии (линии типа III) из условий б = 0 и А = 0 легко вытекает, что 1 Поэтому ДцД13 + а^я-ух аи + я22 аи + а22 так что уравнения D) и E) приобретают вид а13 = 0 и а21х + Каждое из этих уравнений (когда оно имеет смысл) являет- является уравнением прямой центров вырожденной параболической 18* 54Г
линии, как это и должно быть, поскольку главным диаметром такой линии является ее прямая центров. Уравнения главных диаметров центральных линий второго порядка рационально через коэффициенты уравнения кривой не записываются. Теперь мы можем без труда охарактеризовать прямоуголь- прямоугольную систему координат, в которой уравнение данной линии вто- второго порядка имеет приведенный вид: Осью абсцисс этой системы является главный диаметр {единственный главный диаметр для нецентральных линий и любой из двух главных диаметров для центральных линий). Осью ординат этой системы является для центральных ли- линий другой главный диаметр, а для нецентральных линий — прямая, перпендикулярная главному диаметру (г. е. прямая, имеющая неасимптотическое главное направление) и проходя- проходящая (в случае параболы) через точку пересечения линий с глав- главным диаметром. Замечание 2. Обратим внимание на то, что мы заново до- доказали и существование прямоугольных координат, в которых линия второго порядка имеет приведенное уравнение. Дополнение. Классификация поверхностей второго порядка Совершенно аналогичные результаты имеют место и для поверхностей второго порядка в пространстве (аффинном или евклидовом, вещественном, вещественно-комплексном или комплексном). Мы приведем здесь формулировки соответствующих теорем для евкли- евклидова случая. Доказывать их мы не будем. Во-первых, оказывается, что в вещественном евклидовом пространстве все поверхности второго порядка исчерпываются поверхностями, рассмотрен- рассмотренными в § 3 гл. 5, и парами плоскостей, т. е. любая поверхность второго порядка в вещественном евклидовом про- пространстве представляет собой поверхность одного из следующих шести ви- видов: 1) эллипсоид, 2) гиперболоид (однополостный или двуполостный), 3) параболоид (эллиптический или гиперболический), 4) конус, 5) цилиндр (эллиптический, параболический или гиперболический), 6) пара плоскостей (различных или совпадающих). Впрочем, пары плоскостей мы можем считать цилиндрами (а пары пе- пересекающихся или совпадающих плоскостей — и конусами); см. пп. 7—8 § 3 .тл. 5. В вещественно-комплексном евклидовом пространстве возможны еще .мнимые эАлипсоиды с каноническим уравнением вида 4- + -|г+|г = -1. а>6>с>0, $48
(в вещественном пространстве эти эллипсоиды являются пустыми множе- множествами), мнимые конусы с каноническим уравнением вида "V-o (являющиеся в вещественном пространстве точками) и мнимые эллиптиче- эллиптические цилиндры (являющиеся в вещественном пространстве пустыми множе- множествами). Кроме того, конечно, возможны пары мнимых (комплексно-сопря- (комплексно-сопряженных) плоскостей (в вещественном пространстве являющиеся либо пря- прямыми, либо пустыми множествами). Всего мы получаем, таким образом, семнадцать классов различных поверхностей второго порядка в евклидовом вещественно-комплексном про- пространстве: Таблица вещественных поверхностей второго порядка в евклидовом вещественно-комплексном пространстве пп Название Схематический вид поверхности Каноническое уравнение поверхности [1] Эллипсоид (действительный) .12] Мнимый эллипсоид [3] ^".^ Мнимый конус второго порядка а2 + Ь2 + с2 с > 0, a2 b2 c2 [4] Двуполостный гипербо- гиперболоид с>0 [5] Однополостный гипер- гиперболоид a2 "*" b2 с2 ' • b > 0, о > 0 §49
Продолжение NsNs п/п Название Схематический вид поверхности Каноническое уравнение поверхности [6] Действительный конус второго порядка a2 ^ b2 c2 ~u' a > 6 > О, О 0, •1.1.1 [7] Эллиптический пара- параболоид P>Q>0 [8] Гиперболический пара- параболоид > 0, ¦ (/ > О [9] Эллиптический цилиндр (действительный) [10] Мнимый эллиптический цилиндр а2 ' U2 '> [11] Пара мнимых пересе- пересекающихся плоскостей jiiTr-J ..-nil щ а:2 г/2 > 0, [12] Гиперболический ци- цилиндр X' а2 Ь2 а>0, [13] Пара пересекающихся плоскостей (вещест- (вещественных) ¦ = 0 a > 0, 6 > 0, i „, f n! T l! [14] Параболический ци- цилиндр р>0 650
Продолжение пп [15] [16] [17] Название Пара параллельных (не совпадающих) пло- плоскостей (веществен- (вещественных) Пара мнимых парал- параллельных плоскостей Пара совпадающих плоскостей Схематический вид поверхности щ iii j .и г / !' У i\ Каноническое уравнение поверхности I/2 — б2 = 0, b > 0 2/24-62 = 0, b>0 Самое общее уравнение поверхности второго порядка в прямоугольны* (или аффинных) координатах имеет вид апх2+ 2апху + 2апхг + 2аих + 4- аг2у2 4- 2а23уг + 2a2iy + + «44 =0. A) Считая, что ац = ац, i, /= 1, 2, 3, 4, мы сопоставим этому уравнению симметрическую матрицу Пусть «43 S = au- аи аи «21 «22 f + д = D — «22 «11 ап «21 «31 «11 «12 «21 «22 «31 «32 Й41 «42 + «з: «13 «33 «12 «22 «32 «13 «23 «33 «43 + < + «13 Й23 Язз ч 4. «22 «23 «32 «33 * «14 «24 «34 «44 B). 551
Оказывается, что числа- S, 8, Д, D не меняются при переходе к любой другой системе прямоугольных координат. На этом основании они называются инвариантами уравнения A). Нам понадобятся также числа г __ Оказывается, что числа К и L не меняются при повороте координатных осей (при пере- переносе начала координат они, вообще говоря, меняются). На этом основании числа К и L называются семиинвариантами. Оказывается, что класс (вещественной) поверхности второго порядка может быть определен по инвариантам и семиинвариантам его уравнения: «11 «21 «41 «12 «22 «42 «11 «14 «41 «44 а14 а24 «44 + «22 «24 «42 «44 ,1 L «11 «13 «14 «31 «зз аз4 Й41 «43 «44 «33 «43 + «22 «зг «42 «34 «4.4 «23 «33 «43 «24 «34 «44 пп [И [2] [3] 14] [5] [6] [7] [8] [9] [10] [И] [12] [13] [14] [15] 116] [17] Поверхности Эллипсоид Мнимый эллипсоид Мнимый конус Двуполостный гиперболоид Однополостный гиперболоид Конус второго порядка Эллиптический параболоид Гиперболический параболоид Эллиптический цилиндр Мнимый эллиптический ци- цилиндр Пара мнимых пересекающих- пересекающихся плоскостей Гиперболический цилиндр Пара пересекающихся (веще- (вещественных) плоскостей Параболический цилиндр Пара параллельных (вещест- (вещественных) плоскостей Пара мнимых параллельных плоскостей Пара совпадающих (веще- (вещественных) плоскостей Характеристика по инвариантам и семиинвариантам SA>0, 6>0, D<0 SA>0, 6>0, ?>>0 SA>0, 6>0, D = 0 SA<0, A=^0, 6<0, D>0 SA<0, Д=^0, 6<0, D<0 SA<0, 1±ф0, 6<0, D = 0 А = 0, О<0 А = 0, D>0, Д = 0, D = 0, б>0, SL<0 д = 0, D = 0, 6>0, SL>0 д = 0, ?> = 0, 6>0, L==0 Д = 0, D = 0, 6<0, ЬфО д = 0, D = 0, б<0, L = 0 Д = 0, D = 0, 6=0, ЬфЪ Д = 0, D = 0, 6=0. 1 = 0, К<0 д = 0, D = 0, 6 = 0, L = 0, K>0 д = 0, О = 0, 6 = 0, 1 = 0, К = 0 552
Таким образом, с помощью инвариантов и семиинвариантов можно опре- определить класс поверхности второго порядка, не производя фактического при- приведения к каноническому виду (возможность использования семиинвариантов для выделения поверхностей классов [9]—[17] объясняется тем, что для этих поверхностей они являются инвариантами). Более того, зная инварианты и семиинварианты уравнения поверхности, можно написать даже ее каноническое уравнение (по-прежнему не произ- производя приведения, т. е. не находя канонической системы координат). Для этого следует ввести в рассмотрение кубическое уравнение ц — Я п\2 п\3 ^21 #22 — Я #23 а31 агг а33 — Я в развернутом виде имеющее вид Я3 — SX2 + 6Я — Д = О (это уравнение называется характеристическим уравнением для уравнения A)). Можно показать, что корни Ты, Яг, Яз характеристического уравнения всегда веи^ественны'). При Д Ф 0 все корни Ты, Яг, Яз отличны от нуля, при Д = 0 и б ф О один (и только один) из этих корней равен нулю (пусть это будет ко- корень Я3), при Д = 0 и б = 0 равны нулю два из корней (скажем, корни Яг и А,3), а третий корень Я( равен S (и заведомо отличен от нуля, ибо в про- противном случае, как можно показать, все коэффициенты уравнения A) равны нулю). Оказывается, что преобразованием прямоугольных координат уравнение произвольной по- поверхности второго порядка можно привести к одному из следующих пяти типов: (I) Я,*2 + Я2г/2 + Я3г2 + -^- = 0 (при (II) Я,!*2 + Я2г/2 ± 21/ — -?-2 = 0 (при Д = 0, йфО, 6^ ОJ), (III) Я,*2 + Я2г/2 + j = 0 (при Д = 0, D = 0, б Ф 0), ±2y —^-у = 0 (IV) Sx2±2y —^-у = 0 (при Д = 0, D = 0, 6 = 0, (V) Sx1 + -— = 0 (при Д == 0, D = 0, б = 0, L = 0). Эти уравнения называются приведенными уравнениями поверхностей второго порядка. ') Алгебраической причиной этого является симметричность матрицы B). *) При Д = 0 величины D и 6 имеют противоположные знаки. 3) При Д = D = б = 0 величины L и S имеют противоположные знаки. 553
Подчеркнем, что написать приведенное уравнение произвольной поверх- поверхности второго порядка мы можем непосредственно по ее инвариантам и се- семиинвариантам. Переход от приведенного уравнения к каноническому сводится к три- тривиальным алгебраическим преобразованиям и никакого труда не представ- представляет. Приведенные уравнения типа (I) имеют поверхности [1]—[6], типа (II) — поверхности [7]—[8], типа (III)—поверхности [9]—[13], типа (IV)—поверх- (IV)—поверхности [14] и типа (V) — поверхности [15]—[17]. § 2. ПРОЕКТИВНАЯ ТЕОРИЯ ЛИНИЙ ВТОРОГО ПОРЯДКА 1. Линии второго порядка на аффинно-проективной и проективной плоскостях Определение 1. Линией второго порядка на аффинно-проек- аффинно-проективной плоскости называется множество точек, однородные аф- аффинные координаты X:Y : Z которых удовлетворяют уравнению вида апХ2 + 2al2XY + a22Y2 + 2al3XZ + 223YZ + a33Z2 = 0. A) Замечание 1. Ясно, что это определение корректно, т. е. в любой другой однородной аффинной координатной системе ли- линия второго порядка выражается аналогичным уравнением (но, конечно, с другими коэффициентами). Замечание 2. Определение 1 имеет смысл в аффинно-проек- аффинно-проективной плоскости под любым полем К (а в случае поля С.— как в комплексной, так и в вещественно-камплекснои плоскости). Для определенности мы в дальнейшем ограничимся лишь аф- аффинно-проективной вещественно-комплексной плос- плоскостью (случай, для нас наиболее интересный), хотя почти все результаты будут справедливы и над любым полем К характе- характеристики, отличной от двух (конечно, с соответствующими три- тривиальными и само собой разумеющимися изменениями). X Y Аффинные координаты д: = у, # = у собственных точек линии A) удовлетворяют уравнению апх2 + 2а12ху + а22у2 + 2ахзх + 2а23у + а33 == 0 B) и, следовательно, составляют (если хотя бы один из коэффи- коэффициентов аи, аи, а22 отличен от нуля) некоторую линию второго порядка на аффинной плоскости. Если -п\\ = «12 = «22 = 0, но аK ф 0 или йгз Ф 0, то уравне- ние B) выражает прямую, а если ап = «12 = а22 = a!3 "= = а2з = 0 (но, конечно, а3зФ0), то ему не удовлетворяют ко- координаты никакой собственной "точки. 554
Координаты X : Y : Z = I: m : 0 несобственных точек линии A) определяются из уравнения , anl2 + 2al2lm + а22т2 = О, удовлетворяющегося тождественно при ац = а\2 = а22 = 0 и определяющего асимптотические направления линии B) в про- противном случае. Таким образом, если хотя бы, один из коэффициентов ац, ai2, а22 отличен от нуля, то линия второго порядка A) на аффинно-проективной плоскости получается из линии второго порядка B) на аффин- аффинной плоскости присоединением несобственных точек ее асимпто- асимптотических направлений, если же ап = аХ2 = а22 = 0, то линия второго порядка A) распадается на две прямые, одна из которых является несоб- несобственной прямой Z = 0 (а другая — либо некоторой собствен- собственной прямой, либо также несобственной прямой Z = 0). Если линия B) является эллипсом, параболой или гипербо- гиперболой, то те же названия сохраняются и для соответствующей ли- линии A) на аффинно-проективной плоскости. Поскольку эллипс и гипербола имеют два различных асимп- асимптотических направления (эллипс — мнимые, а гипербола — ве- вещественные), а парабола — одно асимптотическое направление, то, следовательно, на аффинно-проективной вещественно-комплексной плоско- плоскости эллипс имеет две дополнительные мнимые несобственные точки, гипербола — две вещественные несобственные точки, а па- парабола— одну (вещественную) несобственную точку. Если линия B) является парой прямых, то ее асимптотиче- асимптотическими направлениями являются направления этих прямых. По- Поэтому присоединение несобственных точек этих направлений превращает эти прямые в прямые на аффинно-проективной пло- плоскости. Таким образом, мы видим, что, так же как и на аффинной плоскости, любая (вещественная)линия второго порядка на аффинно- проективной (вещественно-комплексной) плоскости представ- представляет собой линию одного из следующих четырех видов: 1) эллипс (действительный или мнимый); 2) парабола; 3) гипербола; 4) пара прямых (вещественных или мнимых, различных или совпадающих, собственных или несобственных). Поскольку мнимые прямые (составляющие вещественную ли- линию второго порядка) обязательно различны, а совпадающие прямые обязательно вещественны, мы, следовательно, полу- получаем одиннадцать различных классов вещественных линий второго порядка на аффинно-проективной вещественно-комплек- вещественно-комплексной плоскости: 555
Таблица вещественных линий второго порядка на аффиино-проективной вещественно-комплексной плоскости пп [1] [2] 13] [4] [5] [6] [7] [8] [9] [10] [П] Линия Действительный эллипс Мнимый эллипс Пара различных мнимых (ком- (комплексно-сопряженных) прямых, пересекающихся в собственной точке Гипербола Пара различных вещественных собственных прямых, пересекаю- пересекающихся в собственной точке Парабола Пара различных собственных ве- вещественных прямых, пересекаю- пересекающихся в несобственной точке Пара различных мнимых (ком- (комплексно-сопряженных) прямых, пересекающихся в несобственной точке Пара совпадающих вещественных собственных прямых Пара прямых, состоящая нз веще- вещественной собственной прямой и несобственной прямой Пара совпадающих несобственных прямых Каноническое уравнение X2 + Y2-Z2 = 0 X2 + Y2 + Z2 = 0 X2 + Y2 = 0 X2 — Y2 — Z2 = 0 X2 — Y2 = 0 Y2 = 2XZ Y2 — Z2 = 0 Y2 + Z2 = 0 K2 = 0 XZ = 0 Z2 = 0 Аналогично, на аффинно-проективной комплексной пло- плоскости получается следующая таблица: Таблица линий второго порядка на аффинно-проективной комплексной плоскости пп [И [2] [3] [4] [5] [6] [7] Линия Центральная невырожденная линия (эллипс или гипербола) Пара различных собственных пря- прямых, пересекающихся в собст- собственной точке Нецентральная невырожденная линия (парабола) Пара различных собственных пря- прямых, пересекающихся в несоб- несобственной точке Пара совпадающих собственных прямых Пара прямых, состоящая из соб- собственной и несобственной пря- прямой Пара совпадающих несобственных прямых Каноническое уравнение X2 + Y2 + Z2 = 0 X2 + Y2 = 0 Y2=-2XZ Y2 + Z2 = 0 Y2 = 0 XZ = 0 Z2 = 0 556
Таким образом, в этом случае имеется сем'ь классов линий второго порядка. Аналогичные результаты имеют место и для линий второго порядка на проективной плоскости. Определение 2. Линией второго порядка на проективной плоскости называется множество всех точек, однородные проек- проективные координаты X : Y : Z которых удовлетворяют уравнению вида апХ2 + 2al2XY + a22Y2 + 2al3XZ + 2a^YZ + a^Z2 = 0, C) Ясно, что это определение корректно. На аффинно-проективной (вещественно-комплексной) плос- плоскости эллипсы, параболы и гиперболы различились по характеру их пересечения с несобственной прямой. Поскольку на проектив- проективной плоскости несобственной прямой нет, различие между эл- эллипсами, параболами и гиперболами пропадает. Аналогично пропадает различие между парами прямых, состоящих из соб- собственных прямых, и парами прямых, одна из которых (или обе) являются несобственными прямыми. Поэтому на проективной вещественно-комплексной плоскости имеется только пять клас- классов (вещественных) линий второго порядка: Таблица вещественных линий второго порядка на проективной вещественно-комплексной плоскости пп [1] [2] [3] [4] [5] Линия Действительная невырожденная линия Мнимая невырожденная линия Пара вещественных различных прямых .Пара мнимых (комплексно-сопря- (комплексно-сопряженных) прямых Пара совпадающих прямых Каноническое уравнение X2 + Y2 - Z2 = 0 Х2 + Г2 + 22 = 0 Х2-К2 = 0 Х2 + у2 = 0 Х2 = 0 На проективной комплексной плоскости остается только три класса линий второго порядка: пп [1] [2] [3] Таблица линий второго порядка на комплексной плоскости Линия Невырожденная линия Пара различных прямых Пара совпадающих прямых проективной Каноническое уравнение X2 + Y2 + Z2 = 0 X2 + Y2 = 0 X2 = 0 557
2. Пересечение прямой и линии второго порядка Пересечение прямой и линии второго порядка мы исследо- исследовали до сих пор (см., например, п. 2 § 2 гл. 5) на аффинной (или евклидовой) плоскости. Рассмотрим теперь этот вопрос на аффинно-проективной и проективной плоскостях. Естественно, что мы получим аналогичные результаты, но несколько более простые (поскольку нам не придется различать асимптотиче- асимптотических и неасимптотических направлений). Исследование мы будем вести одновременно на аффинно-про- аффинно-проективной и проективной плоскостях. В первом случае коорди- координаты X : Y : Z будут предполагаться, естественно, однородными аффинными координатами, а во втором — произвольными про- проективными координатами. Для определенности мы будем предполагать плоскость ве- вещественно-комплексной. * В аффинно-проективной (и проективной) плоскости прямая, проходящая через (фиксированные) точки Мо(Хо: Yo:Zo) и Mi{X\ : Y\: Zj), имеет параметрические уравнения вида A) где ц, v — произвольные параметры, одновременно не равные нулю. Пусть anX2 + 2al2XY + a22Y2 + 2ai3XZ + 2a23YZ + a33Z2 = 0 B) — произвольная линия второго порядка. Обозначения. Для упрощения формул введем следующие сокращенные обозначения: F (М) = апХ2 + 2al2XY + a22Y2 + 2al3XZ + 2a^YZ + a33Z2, FiW) = allX + al2Y+al3Z, F2 (M) = a2lX + a22Y + a23Z, ( } где M — точка с координатами X:Y:Z. Аналогично, F(M0, Af,l = + a2iYnXl + a22Y0Yl -t aMZ0Xi -I- а3220У1 558
где Мо и А1, — точки с координатами Хо: YQ: ZQ и Х{ : У, : Zx. Таким образом, . F(Af) = F(Af, М) = F,{M) X + F2{M)Y + FZ(M) Z, и F (Af0, Af,) = F, (Mo) Xi + F2 (Mo) Y, + F3 (Af0) Z, = = F, (Af,) Jo + F2 (M,) Уо + F3 (Af,) 7,. Обратим внимание на то, что, скажем, число FX(M) зави- зависит от выбора координат точки М (при переходе от координат X, Y, Z к пропорциональным координатам рХ, рУ, pZ оно умно- умножается на р). Замечание 1. (Для читателей, знакомых с дифференциальным исчисле- исчислением функций многих переменных.) Ясно, что р ' dF р Х dF F ' dF Чтобы найти точки пересечения прямой A) с линией B), следует, как мы знаем, подставить выражения A) в уравнение B) и решить получающееся уравнение относительно ц : v. В обозначениях C) и C') это уравнение имеет, очевидно, вид li2F (Мо) + 2iivF (Мо, М,) + v»F'(Af,) = 0. D) Если Р (Мо) = Р (Мо, Л1.) = F (М,) = 0, то уравнение D) удовлетворяется тождественно, т. е. прямая A) целиком содержится в линии B). В противном случае уравнение D) имеет два решения, вы- выражающиеся формулами ¦г : v = (- Р (Мо, М,) ± /F(M0)M,J-F(M0)f(M1)): F (Мо), ц : v = F(Мх): (- F (Мо, Л1,) + /F(M0, Af,J-F(M0)F(M,)). (Если F(Afo) =5^ 0 и F(Mt) ^=0, то эти формулы равносильны; при F(Af0) = 0 или F(M\) = 0 следует пользоваться той из этих формул — в зависимости от знака корня,— которая имеет смысл.) Таким образом, в аффинно-проективной (проективной) вещественно-комп- вещественно-комплексной плоскости каждая линия второго порядка, не содержа- содержащая данную прямую, пересекается с этой прямой не более чем в двух точках. Определение 1. В случае, когда имеются две точки пересе- пересечения, они, по определению, считаются точками пересечения кратности 1, а в случае, когда точка пересечения только одна, она, по определению, считается точкой пересечения кратности 2. 559,
Точки кратности 1 называются также простыми точками пе- пересечения, а точки кратности 2 — двойными точками пересече- пересечения. Прямая, имеющая с линией второго порядка двойную точку пересечения (или целиком принадлежащая линии) называется касательной к линии в этой точке (соответственно — в любой своей точке). Для прямой A) это имеет место тогда и только тогда, когда F(M0, 7WIJ-F(Af0)F(M1) = O. E) Если данные прямая и линия второго порядка вещественны, то их точки пересечения либо вещественны, либо комплексно- сопряжены. Если точка М0(Х0: Уо: Zo) принадлежит линии B), т. е. если F(M0) = О, то условие E) выполнено тогда и только тогда, когда F(MQ, Af,) == О, т. е. когда Fi (Щ *i + F2 (Мо) Yx + F% (Mo) Z, = 0. F) Таким образом, соотношению F) удовлетворяют координаты Х\ : Y\ : Zj любой точки М\ каждой касательной, проходящей через точку Мо. Определение 2. Если хотя бы одно из чисел Fi(M0), F2(M0), F3(M0) отлично от нуля, то точка Мо называется простой точкой линии B). Если же Fl(M0) = F2(M0) = F3(MJ = 0, G) то точка Мо называется двойной точкой линии B). Если (фиксированная) точка Мо — простая, то уравнение F1(M0)X-\-F2(MQ)Y + F3(Ma)Z = 0 (8) определяет на плоскости некоторую прямую. Поскольку уравне- уравнению (8) должны удовлетворять, согласно сказанному выше, ко- координаты любой точки каждой касательной в точке Af0, мы по- получаем, что в каждой простой точке Мо линия второго порядка B) имеет единственную касательную, выражающуюся уравнением (8). В обозначениях C) уравнение (8) имеет вид F(M0, M) = 0 . (80 (где точка Мо—фиксированная, а точка М — переменная), т. е. вид (ацХ0 + al2Y0 + a13Z0) X + (a2lX0 + a22Y0 + a23Z0) Y + + (а31Х0 + а32У0 + аззг0)г = 0. (8") 560
Если точка Мо — двойная, условие F) выполнено для любой точки Mi. Это означает, что каждая прямая, проходящая через двойную точку линии B), является касательной к этой линии. Таким образом, точка линии второго порядка тогда и только тогда является ее простой точкой, когда в этой точке существует единственная касательная. Уравнения G), определяющие двойные точки, т. е. урав- уравнения «11^0 " «12^0 + й13^0 = 0, а21 Хо + a22Y0 + a23Z0 = 0, (9) а31 Хо + а32У0 + «зз^о = 0 тогда и только тогда имеют нетривиальное решение (Хо, Y0,Z0)^= ?=@, 0, 0), когда определитель «11 «12 «13 «21 «22 Й23 «31 «32 «33 равен нулю. Определение 3. Линия второго порядка B) называется вы- вырожденной, если Д = 0, и невырожденной, если Д^0. Умножив равенства (9) соответственно на Хо, Уо, Zo и сло- сложив, мы получим соотношение .F(X0, Уо, Z0) = 0, показывающее, что любая точка, координаты Хо : Yo ; Zo которой удовлетворяют уравнениям (9), принадлежит линии B) (и потому является ее двойной точкой). Следовательно, линия второго порядка тогда и только тогда вырождена, когда она имеет двойные точки. Это, в частности, показывает, что определение 3 корректно. Пусть Мо — двойная точка линии B) и Mi—другая ее точка (безразлично, простая или двойная). Прямая М0М1 является ка- касательной в точке Мо и проходит через точку Mi. Но если каса- касательная не содержится в линии B), то она имеет с ней только одну общую точку. Поэтому прямая M0Mi целиком содержится в линии B), что, как мы знаем, возможно тогда и только тогда, когда линия B) является парой прямых (быть может, совпа- совпадающих). Обратно, пусть линия B) является парой прямых, т. е. имеет уравнение вида (Л,X +. Д,У + CiZ) (A2X + B2Y + C2Z) = 0. 561
Тогда п aI2 = «23 = - «33 = 2 A\A2 iB2 +Л2В, Ail 2B, 2 BiC2 -\- B2C] •Л2С, BjC2 »c, = 0. Таким образом, линия второго порядка тогда и только тогда вырождена (об- (обладает двойными точками), когда она является парой прямых. Задание. Покажите, что если прямые, составляющие линию B), различ- различны, то эта линия обладает единственной двойной точкой и этой точкой будет точка пересечения этих прямых. Покажите также, что если линия B) яв- является двойной прямой, то любая ее точка будет двойной точкой. Для линии B), являющейся парой прямых, касательной в любой ее простой точке является та из прямых, составляющих линию, которая проходит через эту точку. Касательной в двойной точке является (согласно сказанному выше) любая прямая, про- проходящая через эту точку. В частности, для двойной прямой каждая прямая на плоско- плоскости является касательной. На аффинно-проективной плоскости эллипс и гипербола пе- пересекают, как мы знаем, несобственную прямую в двух различ- различных точках, а парабола — в одной. Следовательно, на аффинно-проективной плоскости параболы могут быть охарактеризованы как невырожденные линии второго порядка, касающиеся несобственной прямой. Точкой касания является, очевидно, несобственная точка оси параболы. Далее, собственная прямая тогда и только тогда касается эллипса, параболы или гиперболы, когда она является либо асимптотой (если точка касания — несобственная), либо касательной в смы- смысле п. б § 1 гл. 5 (если точка касания —собственная). Задание. Докажите это утверждение. Таким образом, в частности, асимптоты линии второго порядка могут быть охарактери- охарактеризованы (на аффинно-проективной плоскости) как прямые (соб- (собственные), касающиеся линии в несобственной точке. 662 .
3. Поляры и полюсы Обратим внимание на то, что уравнение (8) п. 2, т. е. урав- уравнение . F(M0, М) = 0 A) (с фиксированной точкой Мо и переменной точкой М), опреде- определяет некоторую прямую и тогда, когда точка Ма не принадлежит линии второго порядка. Определение 1. Прямая A) называется полярой точки Мо (по отношению к линии F = 0), а точка Мо называется ее по- полюсом. Замечание 1. Так как F\(M0) = F2(MQ) = F3(MQ) = 0тогда и только тогда, когда точка Мо является двойной точкой линии F = О (см. п. 2), то для любой точки М плоскости, не являю- являющейся двойной точкой линии F = 0, уравнение A) действи- действительно определяет некоторую прямую. Таким образом, поляра существует (и однозначно определена) для любой точки, не являющейся двойной точкой линии F = 0. При этом полярой любой простой точки линии F = 0 является каса- касательная к линии F = 0 в этой точке. Короче: касательная есть поляра точки касания. В частности, мы видим, что касательная является полярой, содержащей свой полюс. Обратно, если поляра содержит свой полюс, то она является касатель- касательной (в полюсе). Действительно, так как = F(M0, Mo), точка Мо, принадлежащая своей поляре, принадлежит линии F = 0. Пусть аих2 + 2аиху + а22у2 + 2апх + 2а^у + а33 = 0 B) — произвольная линия второго порядка на аффинной плоскости. Соглас- Согласно определению 1 п. 6 § 1 диаметром, сопряженным с неасимптотическим направлением /: т, называется прямая (aul + «i2«) х + (a^l + а22т) у + (ап1 + а23т) = 0. В однородных аффинных координатах X : Y : Z = х : у : 1 это уравнение имеет вид (ап1 + апт) X + (anl + a2im) Y + (a^l + a23m) 2 = 0. Сравнив это уравнение с уравнением поляры несобственной точки Хо: Yd : Zo = I: т : 0, мы немедленно получим, что эти два уравнения сов- совпадают. 563
Следовательно, каждый диаметр линии B) {пополненный, конечно, своей несобственной точкой) является полярой несобственной точки сопряженного направления. Таким образом, поляры можно рассматривать как обобщения диаметров. Предложение 1. Если точка Мх принадлежит поляре точки Мо, то точка Мо принадлежит поляре точки М\. Доказательство. Точка М\ тогда и,только тогда принад- принадлежит поляре точки 'Af0, когда F(M0, M,) = 0, а точка Мо тогда и только тогда принадлежит поляре точки Ми когда F(MU М0) = 0. Остается заметить, что F(M0, Ml) = F(Ml, Ma) для любых точек Мо и Мь Конечно, в предложении 1 предполагается, что ни точка Мо, ни точка Mi не являются двойными точками линии F = 0. Чтобы избежать подобного рода оговорок, будем далее пред- предполагать, что линия F == 0 невырождена (не является па- парой прямых). Тогда поляра будет существовать Для любой .точки плоскости. Более того, легко видеть, что относительно невырожденной линии второго порядка F =0 любая прямая является полярой некоторой однозначно опреде- определенной точки. Действительно, пусть АХ + BY + CZ = 0 — произвольная прямая. Рассмотрим систему уравнений аиХ + al2Y + ai3Z = A, a2lX + a22Y + a23Z = В, Поскольку определитель А этой системы отличен, по условию, от нуля, она имеет единственное решение (Хо, Fo, Zo) Ф @,0,0). Тогда полярой точки М0(Х0: Y0:Z0) и будет, очевидно, данная прямая. Найдем, в частности, на аффинно-проективной плоскости полюс несоб- несобственной прямой. Согласно предложению 1 через этот полюс проходят по- поляры всех несобственных точек, т. е. (см. выше) диаметры рассматриваемой линии второго порядка. Следовательно, полюсом несобственной прямой относительно некоторой (невырожден- (невырожденной) линии второго порядка является {в случае, когда этот полюс представ- представляет собой собственную точку) центр_ данной линии. 564
Мы видим, что отображение «полюс» \—> «поляра» C) определяет биективное соответствие между множеством всех точек и множеством всех прямых, сохраняющее отношение инци- инцидентности точек и прямых. Определение 2. Соответствие C) называется поляритетом (относительно данной невырожденной линии второго порядка F = 0). В терминологии, введенной определением 3 п. 7 § 1 гл. 4, лю- любой поляритет представляет собой антиавтоморфизм (корреля- (коррелятивное преобразование) проективной плоскости. Заметим, что построенный в п. 7 § 1 гл. 4 антиизоморфизм проективной плоскости над произвольным полем К является не чем иным, как полярите- поляритетом относительно линии второго порядка X2 + Y2 + Z2 = 0. (Ясно, что понятия поляры, полюса и поляритета имеют смысл в проектив- проективной геометрии над любым полем.) Не нужно думать, что любой антиизоморфизм проективной плоскости является поляритетом. Упражнение. Докажите, что антиавтоморфизм проективной (вещественно-комплексной) плоскости тог- тогда и только тогда является поляритетом относительно некоторой невырож- невырожденной линии второго порядка, когда он инволютивен, т. е. обладает тем свойством, что если точке М сопоставлена прямая X, то и, наоборот, пря- прямой X сопоставлена точка М. Существует красивый геометрический способ отыскания по- полюсов (доказывающий еще раз их существование). Так как для любой прямой Ко, являющейся касательной, полюсом служит точка касания, то достаточно рассмотреть случай, когда прямая Ко пересекает (невырожденную) линию F = 0 в двух различных точках Mi и М2. Пусть %\ — касательная в точке М\, а Я2 — касательная в точке М2. Эти касательные различны и потому пересекаются в единственной точке Мо. Оказывается, что точка Мо является полюсом прямой Хо. Действительно, пусть цо — поляра точки Мо. Так как каса- касательная К\ является полярой точки М\ и содержит точку Мо, то согласно предложению 1 поляра ц0 точки Мо содержит точку Л1|. По аналогичным соображениям поляра цо содержит и точку М2. Поэтому |х0 = М\М2 = %о- Следствие 1. Через любую точку Мо плоскости, не принад- принадлежащую невырожденной линии второго порядка F = 0, про- проходят две и только две касательные к этой линии. Действительно, поскольку каждая прямая имеет единствен- единственный полюс, точка Мо является точкой пересечения касательных
« линии F = 0, касающихся этой линии в точках ее пересечения ¦с полярой ко точки Мо. Никакой третьей касательной через точку Мо проходить не может, поскольку ее точка касания была бы третьей точкой пересечения прямой Хо с линией F = 0. Следствие 2. Полярой произвольной точки Мо, не принад- принадлежащей невырожденной линии второго порядка F = 0, яв- является прямая, проходящая через точки касания д~вух касатель- касательных к линии F = 0, проходящих через точку Мо. Замечание 1, Предусмотренные следствием 1 касательные могут быть мнимыми (комплексно-сопряженными), даже если точка Мо вещественна. Это позволяет разбить совокупность всех вещественных точек проективной (или аффинно-проектив- ной) вещественно-комплексной плоскости, не принадлежащих данной невырожденной (вещественной) линии второго порядка, на две области: внешнюю, для которой эти касательные веще- вещественны, и внутреннюю, для которой эти касательные мнимы (для нулевых линий последняя область пуста). Замечание 2. Следствие 2 показывает, что понятие поляры не зависит от выбора системы координат (ее определение кор- корректно). Рассмотрим в заключение вопрос: как найти предусмотрен- предусмотренные следствием.1 касательные? Пусть невырожденная линия второго порядка J>(X, Y, Z)^anX2 + 2al2XY + a22Y2 + 2al3XZ + 2a23YZ + aziZ2=0 касается в некоторой (заранее не фиксированной) точке (Хо: Yo: Zo) прямой А X + BY + CZ = 0. D) Сравнивая уравнение D) с уравнением касательной (урав- (уравнение (8) п. 2), мы немедленно получаем, что это возможно то- тогда и только тогда, когда a2iXQ + Ь а32^0 "Г" Язз^О == -где ро — некоторый множитель пропорциональности (отличный ¦от нуля). Кроме соотношений E), должно иметь место также равен- ¦ство означающее, что точка (Xq:Yu:Zq) принадлежит прямой D). -566
Таким образом, мы видим, что если прямая D) касается ли- линии второго порядка F = О, то система однородных уравнений' F). а21Х + «22^ + a3lX + a32Y + — Вр — О, — Ср = О, CZ =0 имеет нетривиальное решение (Хо, Yo, Zo, po) и потому ее опре- определитель «11 «12 «13 ™ «2! «22 «23 В «31 «32 «33 А В С О равен нулю. Обратно, если определитель G) равен нулю и потому система уравнений F) имеет нетривиальное решение IY У 7 е\\ \Л0» 1 0» 0» гО/> то, во-первых, ро Ф 0, поскольку в противном случае опреде- литель Л== аи а12 а1? «21 «22 «23 «31 «32 «33 был бы равен нулю и линия F = 0 была бы вырожденной, и, во-вторых, хотя бы одно из чисел Хо, У о, %а также не равно- нулю, ибо в противном случае имели бы место равенства А = = В = С = 0. Таким образом, числа XQ, Yo, Zo являются однород- однородными координатами некоторой точки Мо, принадлежащей пря- прямой D) и удовлетворяющей соотношениям E). Умножая эта соотношения на Хо, Yo, Zo и складывая, мы немедленно получим,. что F (Мо) = F, (Мо) Хп + F2 (Мо) YQ + F3 (Mo) Zo = _ = f>0(AX0+BY0+CZQ)=*0, т. е. что. точка Мо принадлежит линии F = 0. Поэтому в этой точке существует единственная касательная, совпадающая & силу соотношений E) с данной прямой D). Б6Г
Тем самым доказано, что линия F = 0 тогда и только тогда касается прямой D) в некоторой (заранее не фиксированной) точке, когда = 0. (8) Задание. Проверьте, что это утверждение верно для любых (а не толь- только невырожденных) линий второго порядка. Теперь уже ясно, как искать касательную, проходящую через точку М0(Х0, Уо, ZQ) (безразлично, лежащую или не лежащую на линии F — 0). Для этого нужно решить (относительно А : В : С) систему двух уравнений, состоящую из уравнения (8) и уравнения «21 «31 А 2 «22 «32 В «13 «23 «33 С А В с 0 выражающего тот факт, что касательная проходит через точку Мо. Соответствующие числа А, В, С я будут коэффициентами уравнения искомой касательной. Дополнение. Поляры в пространстве Совершенно аналогичным образом можно определить относительно про- произвольной поверхности второго порядка поляру точки в пространстве, яв- являющуюся некоторой плоскостью. Если поверхность невырождена (D =? Q), то эта поляра определена для любой точки (проективного про- пространства) и отображение «точка» i—> «ее поляра» определяет биективное соответствие, сохраняющее инцидентность. Наглядно, поляру можно определить, рассмотрев для любой точки Мо конус касательных с вершиной в точке Мо, образующими которого являются касательные к данной (невырожденной) поверхности второго порядка, прохо- проходящие через точку Мо. Если точка Мо не принадлежит поверхности, то, как можно показать, этот конус касается поверхности по некоторой плоской ли- линии второго порядка. Плоскость, содержащая эту линию, и является полярой точки Мо. Далее, оказывается, что поляры всех точек, принадлежащих некоторой прямой X, проходят через вполне определенную прямую ц, называемую поля- полярой прямой %. При этом полярой прямой |х оказывается исходная прямая К. Упражнение. Покажите (см. п. 6 § 3 гл. 4), что если пучок окружностей изображается в (евклидово-проективном) про- пространстве прямой к, то сопряженный пучок окружностей изображается по- полярой прямой % относительно параболоида X2 + Y2 + 2ZT = 0 Таким образом, понятие поляры прямой в пространстве обобщает поня- понятие сопряженного пучка окружностей. 568
4. Теорема Безу Пусть F=0 и G=0 — две линии второго порядка. Отыскание точек пересечения этих линий на аффинной плоскости сводится к решению системы двух уравнений второй степени с двумя неизвестными х, у. Во- Вообще говоря, такая система имеет четыре решения, так что данные линии пересекаются в четырех точках. Поскольку решения могут оказаться комплексными, мы при этом с не- неизбежностью должны выйти в вещественно-комплексную плос- плоскость (или просто в комплексную, если мы не хотим ограни- ограничиваться вещественными линиями). Однако и в комплексной (аффинной) плоскости число точек пересечения может ока- оказаться меньше четырех (например, пара сопряженных гипер- гипербол вообще не имеет общих точек). Суть дела здесь в том, что точки пересечения «могут уходить в бесконечность». Это по- показывает, что для того, чтобы добиться «правильного» числа точек пересечения, необходимо перейти в аффинно-проективную (или просто проективную) плоскость. Все это объясняет, почему мы будем рассматривать задачу о точках пересечения двух линий второго порядка на аффинно- проективной вещественно-комплексной плоскости. Конечно, все результаты будут справедливы (с соответствующими упроще- упрощениями) и для линий второго порядка на проективной, или ком- комплексной, плоскости. Однако и в аффинно-проективной вещественно-комплексной плоскости число точек пересечения двух линий второго порядка может оказаться меньшим четырех (примером является та же пара сопряженных гипербол, имеющих только две общие точ- точки— несобственные точки их общих асимптот). Здесь уже дело в том, что некоторые точки пересечения (аналогично корням алгебраических уравнений) могут иметь кратность и такие точки нужно считать столько раз, какова их кратность. Оказывается, что для двух алгебраических линий можно так определить кратность точки их пересечения (собственной или несобственной, вещественной или мнимой), что будет справед- справедлива следующая теорема: Теорема Безу. Число точек пересечения двух алгебраиче- алгебраических линий соответственно порядков тип либо бесконечно (и в этом случае данные линии имеют общую часть, также яв- являющуюся алгебраической линией1)), либо это число, подсчи- подсчитанное с учетом кратностей всех точек (иными словами — сумма кратностей всех общих точек наших линий), равно пгп. *) Порядка, не превосходящего меньшего нз чисел m и п. 56»
В частности, число точек пересечения произвольной прямой с данной •алгебраической линией {не содержащей этой прямой) равно по- порядку этой линии. Таким образом, теорема Безу позволяет, в частности, дать геометрическую характеристику понятия порядка алгебраиче- алгебраической линии. Для линии второго порядка мы получаем из теоремы Безу правильное число точек их пересечения (четыре). Доказать теорему Безу не очень сложно после того, как дано определение кратности точки пересечения. Однако дать та- такое определение, пригодное во всех случаях, оказывается очень деликатной и трудной задачей-1). Мы ограничимся здесь тем, что определим кратности точек пересечения только для линий порядка не выше второго (и докажем в этом случае теорему Безу). В первую очередь мы рассмотрим случай, когда одна из рассматриваемых линий является прямой. ¦ Если и вторая линия является прямой, то никакой проблемы нет: кратность точки пересечения двух (различных) прямых по определению считается равной единице. Теорема Безу при этом, конечно, автоматически справедлива (на аффинно-проективной плоскости). Кратности точек пересечения прямой и линии второго по- порядка мы уже определили в п. 2 (определение 1). Ясно, что согласно этому определению теорема Безу справедлива и в этом случае (число точек пересечения, с учетом кратности, всегда равно двум). Рассмотрим теперь точки пересечения двух вырожден- вырожденных линий второго порядка: = О и f2g2 = 0, т. е. линий, распадающихся в пары прямых Л = о, gl = o A) f* = 0, g2 = 0. B) Мы будем предполагать, что эти линии не имеют общей прямой, т. е. что ни одна из прямых A) не совпадает ни с од- одной из прямых B). Тогда возможны следующие четыре случая: Случай 1. Никакие три из прямых A) и B) не имеют общей точки. ') Ее решение использует, в частности, известное из алгебры понятие результанта двух многочленов. 570
Тогда они пересекаются в четырех различных точках. Мы„ по определению, будем считать эти точки простыми точками пе- пересечения. Случай 2. Три и только три из прямых A) и B) имеют общую точку Мо. Пусть, для определенности, эта точка принадлежит прямым /i = 0, /2 = 0, gi = 0 (и потому является двойной точкой ли- линии figi = 0). Тогда прямая gi = 0 пересекает кривую f2g2 = О в двух различных точках. Эти точки мы, по определению, будем считать простыми точками пересечения данных ли- линий второго порядка, а точку Мо — их двойной точкой пере- пересечения. Случай 3. Одна из данных линий (скажем, первая) яв- является двойной прямой и эта прямая не проходит через двой- двойную точку другой линии. В этом случае наши линии пересекаются в двух точках (каждая из которых является двойной точкой первой линии). Мы, по определению, будем считать эти точки двойными точ- точками пересечения. Случай 4. Все четыре прямые A) и B) проходят через одну точку. Тогда эта точка является единственной точкой пересечения данных кривых (и на каждой из них является двойной точкой). Мы, по определению, будем считать ее точкой пересечения кратности 4. Мы видим, что в каждом из этих четырех случаев теорема Безу справедлива (общее число точек пересечения с учетом кратности всегда равно четырем). Сопоставим каждой точке первой кривой число р=\, если эта точка — простая, и число р — 2, если эта точка — двойная. Аналогично, любой точке второй кривой сопоставим числа q=\, если эта точка — простая, и число q = 2, если эта точ- точка — двойная. Тогда все четыре случая можно объединить следующим об- общим определением: Определение 1. Кратностью произвольной точки пересечения двух вырожденных линий второго порядка называется произве- произведение pq. Для точек пересечения вырожденной и невырожден- невырожденной линий второго порядка дело обстоит сложнее. Пусть — произвольная вырожденная линия второго порядка, и пусть — произвольная невырожденная линия второго порядка. 571
Возможны следующие шесть случаев: Случай 1. Общая точка Мо прямых f = 0 и g = 0 не при- принадлежит линии F = 0 и ни одна из прямых f = 0 и g = О не касается линии F — О. В этом случае имеется четыре точки пересечения, все, по определению, простые. Случай 2. Точка Мо не принадлежит линии F = 0, но одна (и только одна) из прямых f = 0 и g = 0 касается линии F = 0. В этом случае имеется три точки пересечения: две простые и одна двойная (точка касания). Случай 3. Точка Мо не принадлежит линии F = 0 и обе прямые f = 0 и g = 0 касается линии F — 0. Имеется только две точки пересечения, обе, по определению, двойные. Случай 4. Точка Мо принадлежит линии F = 0, но пря- прямые / = 0 н g = 0 не касаются линии F = 0 в этой точке. В этом случае каждая из прямых / = 0 и g = 0 пересекает линию F = 0 еще в одной точке. Эти точки, по определению, считаются простыми точками пересечения обеих линий второго порядка, а точка Мо — их двойной точкой пересечения. Случай 5. Одна (и только одна) из прямых f = 0 и g = 0 касается линии F = 0 в точке Mq. Тогда другая прямая пересекает линию F — 0 еще в одной точке. Эта точка, по определению, считается простой точкой пере- пересечения, а точка Мо — тройной точкой пересечения (кратности 3). Случай 6. Обе прямые f = 0 и g = 0 касаются линии F = 0 в точке Мо (и, следовательно, совпадают). В этом случае никаких других точек пересечения нет и точка Мо, по определению, считается точкой пересечения крат- кратности 4. Снова теорема Безу во всех случаях автоматически вы- выполнена. Условно считая, что точка, не являющаяся общей точкой двух кривых второго порядка, является их точкой пересечения нулевой кратности, мы можем все шесть случаев объединить в следующей формулировке: Определение 2. Пусть р — кратность точки М как точки пе- пересечения прямой / = 0 и линии F = 0, и пусть q — кратность точки М как точки пересечения прямой g = 0 и линии F = 0. Тогда кратностью точки М как точки пересечения линий fg = 0 и F == 0 называется сумма р + а. Определим теперь кратности точек пересечения двух невы- невырожденных линий второго порядка /7 = 0, О = 0. C) Случай 1. В точке пересечения Мо данные линии имеют различные касательные. 572
В этом случае мы, по определению, будем считать точку Mq простой точкой пересечения. Пусть линии F = 0 и G = 0 имеют в точке Мо совпадающие касательные. Лемма 1. Линии C) тогда и только тогда имеют общую касательную в их точке пересечения Мо, когда существуют та- такие числа |л0 и vo (не равные одновременно нулю), что линия второго порядка H^lx0F + v0G = 0 D) имеет точку Мо своей двойной точкой. о Этим условием линия Н = 0 однозначно определена. Доказательство. Если касательные к линиям C) в точке Мо совпадают, то _ F3 (Af0) ,-v G, (Af0) ~ G2(MQ) G3(M0) {°> (см. в п. 2 уравнение касательной (8)), и потому существуют такие числа цо и vo (одновременно не равные нулю), что ЛУ + v0G, (Мо) = О, M0) + v0G2(Mo) = 0, F) о Тогда для линии Н = 0 будут иметь место равенства Я, (Мо) = Н2 (Мо) = Я, (Мо) = 0, G) т. е. точка Л10 будет двойной точкой этой линии. Обратно, если линия вида D) с двойной точкой Мо суще- существует, то имеют место равенства G), т. е. равенства F), озна- означающие справедливость пропорции E). Поэтому касательные к линиям C) в точке Мо совпадают. Наконец, ясно, что поскольку точка Мо не является двойной точкой линий F = 0 и' G = 0 (по условию, эти линии вообще не имеют двойных точек), соотношения F) однозначно опреде- определяют отношение |Хо: vo, а значит, и линию D). о Поскольку линия Н = 0 обладает двойной точкой Мо, она распадается в пару прямых, пересекающихся в точке Мо. Случай 2. Ни одна из прямых, составляющих линию о Я = 0, не касается в точке Мо линий F — 0 и G = 0 (т. е. не совпадает с их общей касательной). В этом случае, мы, по определению, будем считать точку Мо двойной точкой пересечения линий F = 0 и G = 0. Случай 3. Одна и только одна прямая из прямых, со- о ставляющих линию Н = 0, совпадает с общей касательной ли- линий F = 0 и G = 0. В этом случае мы, по определению, будем считать точку Мо тройной точкой пересечения линий F = 0 и G = 0. 573
Случай 4. Обе прямые, составляющие линию Н = О, сов- совпадают с общей касательной линий F = 0 и G = 0. ~~ В этом случае мы, по определению, будем считать точку Мо точкой пересечения кратности 4. Например, парабола Y2 — 2XZ = О и гипербола А'2 _ 2У2 + 2XZ == О имеют в собственной точке @:0: 1) об- общую касательную л = о. Кривая Н — 0 имеет вид (Y2 — 2XZ) + (X2 — 2У2 + 2XZ) = 0, т. е. вид X2 - Y2 = 0, и.потому является парой прямых X + Y = 0 и X — Y = 0. Поскольку эти прямые отличны от общей касательной X = 0, точка @:0: 1) является двойной точкой пересечения. Аналогично, два эллипса X2 + Y2 + 2XZ = 0 имеют в точке @ : 0 :1) общую касательную Х = 0. о Кривая Н = 0 теперь имеет вид (X2 + Y2 + 2XZ) - {X2 + 2Y1 + 2XZ) = 0, т. е. вид Y2 = 0, и потому является двойной прямой У = 0. Поскольку эта прямая не совпа- совпадает с касательной X = 0, точка @:0:1) также является двойной точкой пересечения. Парабола Y2 - 2XZ = 0 и гипербола 2XY + Y2 — 2XZ = 0 также имеют в точке @:0:1) общую касательную Х = 0. Но кривая Н = 0 для них имеет вид (К2 — 2XZ) — BXY + Y2 — 2XZ) =0 или XY = 0, f. e. представляет собой пару различных прямых, одной из которых является прямая X = 0, а потому точка @:0:1) является тройной точкой пересе- пересечения. 674
Наконец, эллипс X* + уг _ 2X2 = О и парабола Y2 — 2XZ = 0 обладают в точке @:0: 1) общей касательной эта точка является их точкой пересечения кратности 4, поскольку соответ- о ствующая кривая Н = 0 имеет вид (X2 + Y2 — 2XZ) - (Y- - 2XZ) = 0 л потому является дважды взятой общей касательной X = 0. Сравнивая изложенные определения с опре- определением 2, мы немедленно получаем, что в каждом из случаев 2—4 кратность точки Мо как точки пересечения линий F = 0 и G = 0 равна ее кратности как точки пересечения о линий F = 0 и Я = 0 (или, что то же самое, — линий G = 0 и Я = 0). Поэтому все сказанное можно объеди- объединить в следующем общем определении: Определение 3. Пусть для общей точки Мо двух невырожден- невырожденных линий второго порядка F = 0 и G — 0 существует линия Я = 0 вида D), имеющая точку Мо своей двойной точкой. Тогда кратностью точки /Ио как точки пересечения линий F =0 и G = 0 называется ее кратность как точки пересечения линий F = 0 и о ' о Я = 0 (см. определение 2). Если такой линии Я = 0 не суще- существует, точка Мо, по определению, считается простой точкой пересечения (кратности 1). Докажем теперь для линий C) теорему Безу. Для этого нам понадобятся три вспомогательные леммы. Лемма 2. Если линии F = 0 и G = 0 имеют в их общей точке Мо общую касательную, то эта касательная будет каса- касательной в точке Мо и для любой линии вида Я = [iF + vG = 0, где ц и v — произвольные числа, не равные одновременно нулю. Доказательство. Тот факт, что линии F = 0 и G = 0 имеют в точке Мо общую касательную, означает (см. доказа- доказательство леммы 1), что имеет место пропорция Fi(Afo) _ F2(M0) _ F3(M0) . О,(М0) G2(Ma) G3(M0)- Но тогда ясно, что для любых |л и v будет иметь место и про- пропорция Ht(M0) _ Н2(М0) __ Н3(М0) О,(«о) — О2(М0) G3(M0) (ибо, например, Hi = ^Fi + vGi). 575
Лемма 3. Кратность точки пересечения Мо любых двух не- невырожденных линий второго порядка F = 0 и G = О равна ее кратности и как точки пересечения линии F — О и любой линии вида где [I и v — произвольные числа (причем v ф 0). Доказательство. Пусть Мо является простой точкой пе- пересечения, т. е. пусть касательные к линиям F = 0 и G = 0 в точке Мо различны. Применим лемму 2 к линиям F = 0 и И = 0. Так как (напомним, что, по условию, v=^=0), то согласно этой лемме касательные к линиям F = 0 и Я = 0 различны. Поэтому точка /Wo является их простой точкой пересечения. Пусть кратность точки пересечения Мо больше единицы. Тогда эта кратность, по определению, равна ее кратности как точки пересечения линий F = 0 и Я = 0, где Я = 0— линия вида D), являющаяся парой прямых. Но ясно (в силу един- о ственности линии Я = 0), что если мы составим аналогичную линию для линий F = 0 и Я = 0 (напомним, что согласно лемме 2 эти линии также имеют в точке Мо общую касатель- касательную), то она совпадет с линией Я = 0. Поэтому кратность точки Мо как точки пересечения линий F = 0 и Я = 0 и в этом случае равна ее кратности как точки пересечения линий F = 0 и G = 0. Лемма 4. Для любых двух линий второго порядка F = 0 и G = 0 существуют такие числа \i и v (не равные одновременно нулю), что линия Н = nF + vG = 0 (8) вырождена (является парой прямых). Доказательство. Пусть F (X, Y, Z) = аиХ2 + 2а12XY G (X, Y, Z) = buX2 + 2bl2XY b22Y2 2al3XZ + 2a23YZ 2bnXZ -f 2b23YZ a33Z2, Тогда условие вырожденности линии имеет вид vb2l vb3l ца23 \ia33 vbl3 vb23 vb33 = 0. (9) ца31 + vb3i ца32 + vb32 ца33 + vb33 Это уравнение (относительно \х :v) либо удовлетворяется тождественно, либо имеет три (возможно, совпадающих) корня, 676
хаждый из которых отвечает некоторой вырожденной линии вида (8). В случае комплексной плоскости этим все доказано. В слу- случае вещественно-комплексной плоскости достаточно заметить," что уравнение (9), являясь (для вещественных линий F=0 и G = 0) уравнением третьей степени с вещественными коэффи- коэффициентами, обязательно имеет вещественный корень. Теперь у нас уже все готово для доказательства теоремы Безу (в оставшемся случае, когда линии F = 0 и G = 0 не- невырождены). Действительно, для этих линий согласно лемме 4 существует вырожденная линия # = 0 вида (8), а согласно лемме 3 кратность любой точки пересечения линий F = 0 и G = 0 равна ее кратности как точки пересечения линий F = 0 и Н = 0. Поэтому сумма кратностей всех точек пересечения линий F = 0 и G = 0 равна сумме кратностей всех точек пе- пересечения линий F = 0 и Н = 0. Но, поскольку линия Н — 0 вырождена, последняя сумма, как мы знаем, равна четырем. Тем самым теорема Безу (для линий второго порядка) пол- полностью доказана. Легко видеть, что если вещественные линии F = 0 и G = 0 (на вещественно- комплексной плоскости) имеют две мнимые (комплексно-сопря- (комплексно-сопряженные) точки пересечения, то кратности этих точек совпадают. Задание. Докажите это утверждение. Отсюда (и из теоремы Безу) вытекает, что любая мнимая точка пересечения двух (вещественных) ли- линий второго порядка (на вещественно-комплексной плоскости) является либо простой, либо двойной точкой пересечения (в по- последнем случае линии пересекаются только в двух точках: з данной и в комплексно-сопряженной). Дополнение. Дифференциально-геометрическое истолкование кратности точки пресечения Для читателей, знакомых с основными понятиями дифференциального исчисления, мы напомним, что для любой линии вида ее касательная в точке (xt>, у о) = (х0, f (хо)) имеет уравнение У — Уа = Г (*о) (х — х0). Если функция у =/(х) задана неявным уравнением F {х, у) = 0, р то по правилу дифференцирования неявной функции у' = =^-, и потому 19 М, М. Постников ,- J577
уравнение касательной может быть переписано в виде ?х (*о> Уо) (х — дг0) + Fy (*о. Уо) (у — Уо) — 0. Для линии второго порядка F (х, у) = аих2 + 2апху + а22у* + 2ai3x + 2a2iy + а33 = О это вполне согласуется с полученными выше результатами, поскольку урав- уравнение касательной (уравнение (8) п. 2) в неоднородных координатах имеет вид (<2n*o + «122/0 + 013) х + (a2i*o + «222/о + а23) у + (вз1*о + «згг/о + Дзз) = О и, очевидно, равносильно уравнению 2 (аих0 + а12у0 + а13) (х — х0) + 2 (а^Хо + «гг2/о + Дгз) B/ — Уо) = О'. По определению, две линии проходящие через точку (х0, у а), касаются друг друга в этой точке, если их касательные совпадают, т. е. если Поэтому линии F(x,y) = 0, G(x,y)=O, заданные неявными уравнениями, касаются друг друга в точке (хо,Уо), если I*X (*^0> У0/ у \Xoi Уо) Ох (х0, уо) ~ Оу (х0, Уо) ' Линии y^f(x), y = g(x) называются соприкасающимися (в точке (х0,уо)), если они касаются и, кро- кроме того, По правилу дифференцирования неявных функций вторая производная f"(x) функции у = f(x), заданной неявно уравнением F (х, у) = О, выражается формулой ГХХ\Гу) — 4Г xyt xty + Г yy(tx) U Поэтому, полагая мы можем для функций, заданных неявно, условие f" (xa) == g" (*0) записать (при выполнении условия f (х0) == g' (х0), т. е. при Fx (х0, Цо) = kOx (*o. в следующем виде: Нхх (ха, уо) I3 + 2Нху (х0, уо) lm + Нуу (х0, у0) ш2 = 0, 678- - ' ' ' \
где . а При F (х, у) = ацх2 + 2ацху + а22у" + 2аих + 2а23у + а33, G (ft У) = Ьпх* + 2Ъпху + Ь22уг + 26,3* + 26230 + &зз условие соприкасания приобретает вид (в„ - kbu) Р + 2 (а12 - *612) /т + (а22 - kb22) т2 = О, а это означает, что направление 1:т является асимптотическим для линии Н = 0. Таким образом, мы установили, что линии второго порядка F = 0 и G = 0, имеющие в точке (Хо, уо) общую касательную, направление кото- которой характеризуется отношением /: т, тогда и только тогда соприкасаются в этой точке, когда линия второго порядка И = 0 содержит несобственную точку (I: т : 0). Но ясно, что линия Н = 0 как раз и является указанной в лемме 1 о линией Н = 0, имеющей в точке пересечения двойную точку. С другой сто- стороны, мы знаем, что если некоторая прямая проходит через двойную точку линии второго порядка и еще через одну ее точку, то эта прямая целиком о содержится в линии. Поэтому утверждение, что линия Н = 0 содержит не- несобственную точку \1: т: 0) касательной, равносильно утверждению, что эта касательная целиком принадлежит линии Н = 0. Сопоставляя все эти обстоятельства, мы немедленно получаем, что собственная точка пересечения двух (вещественных) линий второго по- порядка является а) простой точкой пересечения, если линии в этой точке не касаются; б) двойной точкой пересечения, если линии в этой точке касаются, но не соприкасаются; в) точкой пересечения кратности 3 или 4, если линии в этой точке со- соприкасаются. Вычисляя третьи производные, можно аналогичным образом различить точки пересечения кратности 3 н 4. Упражнение. Докажите, что для точки пересечения кратности 3 произ- производные f'"(xo) и g'"(x0) различны, а для точки пересечения кратности 4 они совпадают. § 3. ГЕОМЕТРИЯ ЛИНИЙ ВТОРОГО ПОРЯДКА 1. Пучки линий второго порядка Определение 1. Пусть F=0 и G=0 —две различные линии второго порядка. Пучком линий второго порядка называется множество всех линий вида +lp + vG==0> (!) где |л и v — произвольные числа, одновременно не равные нулю. 19* 679
Замечание 1. Это определение пригодно в любой плоскости ^аффинной, аффинно-проективной или "проективной, веществен- лой, вещественно-комплексной, комплексной или над любым по- полем). В дальнейшем мы, как правило, будем предполагать плоскость аффинно-проективной и вещественно- комплексной (а все линии — вещественными). Конеч- Конечно, все результаты будут справедливы (с соответствующими упрощениями) и на проективной или комплексной плоскости. Замечание 2. Линия второго порядка полностью определена (в данной •системе координат) шестью коэффициентами а,-,- ее уравнения и, обратно, однозначно (с точностью до пропорциональности) их определяет (теорема единственности). Следовательно, эти коэффициенты можно рассматривать как однородные координаты, линии (ср. определение 1 п. 1 § 1 гл. 4). Однако шесть однородных координат определяют точки «пятимерного» пространства. Поскольку концепцией многомерных пространств мы еще не владеем, возни- возникающим отсюда изображением линий второго порядка как точек пятимер- пятимерного (проективного) пространства мы пользоваться не можем. Наоборот, геометрию линий второго порядка мы можем истолковать как конкретное воплощение абстрактной пятимерной геометрии. В частности, пучки линий второго порядка являются, с этой точки зре- зрения, не чем иным, как прямыми в пятимерном пространстве. Подобно точкам (проективной) прямой каждая линия пучка определяется отношением ц : v. При ц : v = 1 : 0 получается линия F = 0, а при ц : v = 0 : 1 — линия G — 0. Ясно, что (подобно прямой) пучок однозначно определяется любыми двумя (различными) линиями, ему принадлежащими. Если F (Мо) = 0 и G (Мо) = 0, то Это показывает, что любая линия пучка \iF + vG = 0 проходит через каждую точку пересечения линий F = 0 и G = 0. Рассмотрим, например, случай, когда линии F = 0 и G = 0 имеют общую прямую h = 0 (здесь h — сокращенное обозна- обозначение для левой части Ах -\- By + С уравнения прямой). В этом случае обе линии F = 0 и G = 0 являются вырожденными ли- лилиями, т. е. распадаются в пару прямых. Пусть А = 0, / = 0 — прямые, составляющие линию F = 0, а — прямые, составляющие линию G = 0. Без ограничения общ- общности мы можем, очевидно, считать, что Поэтому уравнение любой линии пучка \iF -f- vG = 0 имеет вид (l*f + vff) A = 0, 580 ^
и потому эта линия также является вырожденной линией, со- состоящей из прямой h = 0 и некоторой прямой \x,f -f- vg = 0, при- принадлежащей пучку прямых, определенному прямыми f = 0 и g = 0. Определение 2. Пучок линий второго порядка, получающийся из некоторого пучка прямых присоединением к каждой прямой пучка одной и той же прямой, называется вырожденным. При выбранной дополнительной прямой h — 0 вырожденные пучки находятся в биективном соответствии с пучками прямых. Ясно, что точки пересечения любой пары линий невырож- невырожденного пучка — одни и те же для всех пар. Определение 3. Общие точки всех линий невырожденного пучка называются фундаментальными точками этого пучка. Ряд элементарных свойств (невырожденных) пучков мы уже фактически установили в леммах п. 4 § 2. Например, соглас- согласно лемме 3 п. 4 § 2, кратность точки пересечения любой пары линий пучка — одна и та же для всех пар. Определение 4. Кратностью фундаментальной точки пучка называется ее кратность как точки пересечения любой пары ли- линий пучка. Согласно только что сказанному, это определение кор- корректно. В силу теоремы Безу сумма кратностей всех фундаменталь- фундаментальных точек пучка равна четырем. Поэтому возможны следую- следующие типы пучков: а) пучки с четырьмя простыми фундаментальными точками; б) пучки с тремя фундаментальными точками — одной двой- двойной и двумя простыми; в) пучки с двумя двойными фундаментальными точками; г) пучки с двумя фундаментальными точками — одной трой- тройной и одной простой; д) пучки с одной фундаментальной точкой кратности 4. Определение 5. Пучки а) мы будем называть пучками типа [1111] (или пучками общего типа), пучки б) — пучками типа [211], пучки в) — пучками типа [22], пучки г) — пучками типа [31] и, наконец, пучки д) — пучками типа [4]. Согласно лемме 2 п. 4, если две линии пучка имеют в некоторой (фундаменталь- (фундаментальной) точке общую касательную, то эта касательная является касательной (в той же точке) и любой другой линии пучка. Определение 6. Общие касательные всех линий невырожден- невырожденного пучка называются фундаментальными прямыми этого пучка. Фундаментальные точки и фундаментальные прямые пучков не могут быть выбраны совершенно произвольно. Простое не- необходимое условие указывает следующее 581
Предложение 1. Никакие три фундаментальные точки не- невырожденного пучка не коллинеарны. Никакая фундаменталь- фундаментальная прямая не содержит двух фундаментальных точек. Доказательство. Прямая, проходящая через три (с учетом кратностей) фундаментальные точки, пересекаясь с любой линией пучка по трем точкам, должна этой линии при- принадлежать. Таким образом, все линии пучка содержат одну и ту же прямую, т. е. пучок является, вопреки предположению, вырожденным пучком. Пучок общего типа не имеет фундаментальных прямых, пу- пучок типа [211] имеет одну фундаментальную прямую (прохо- (проходящую через двойную фундаментальную точку и не содержа- содержащую простых), пучок типа [22] имеет- две (различные) фунда- фундаментальные прямые, и, наконец, пучок типа [31] имеет одну фундаментальную прямую (проходящую через тройную точку). Что же касается пучков типа [4] то, как мы увидим ниже, они имеют либо одну фундаментальную прямую, либо любая прямая, проходящая через фундаментальную точку, является фундаментальной прямой. Все сказанное выше с равным правом применимо как к ком- комплексной, так и к вещественно-комплексной плоскостям. Рас- Рассмотрим теперь свойства пучков, имеющие место только в ве- вещественно-комплексной плоскости (проективной или аффинно-проективной). Определение 7. Пучок линий второго порядка на веществен- вещественно-комплексной плоскости называется вещественным, если он содержит по крайней мере две (а потому и бесконечно много) различных вещественных кривых. Вещественные пучки общего типа (типа [1111]) распадаются на следующие классы: а) класс пучков, все фундаментальные точки которых веще- вещественны; б) класс пучков, две фундаментальные точки которых ве- вещественны, а другие две — мнимые комплексно-сопряженные; в) класс пучков, все фундаментальные точки которых мнимы (и попарно комплексно-сопряжены). Вещественные пучки типа [211] распадаются на два класса: а) класс пучков, все фундаментальные точки которых веще- вещественны; б) класс пучков, простые фундаментальные точки которых — мнимые комплексно-сопряженные. Заметим, что двойная фундаментальная точка веществен- вещественного пучка типа [211] всегда вещественна. Вещественна и его фундаментальная прямая. Вещественные пучки типа [22] также распадаются на два класса: * 582
-.'.- а) класс пучков, обе фундаментальные точки которых веще- вещественны; б) класс пучков, фундаментальные точки которых комплекс- комплексно-сопряжены. В случае а) фундаментальные прямые вещественны, а в слу- случае б) — комплексно-сопряжены. Вещественные пучки типов [31] и [4] имеют только веще- вещественные фундаментальные точки и прямые. Предложение 2. В произвольном пучке pF + vG = 0 линий второго порядка для любой точки Мо плоскости, отлич- отличной от фундаментальных точек пучка, существует единственная линия проходящая через точку Мо. Если пучок и точка вещественны, то линия Н = 0 также вещественна. Доказательство. Условие Н(Ма) = 0 означает, что Поскольку хотя бы одно из чисел F(M0) и G{MU) отлично от нуля (точка Мо не фундаментальна), это соотношение однознач- однозначно определяет отношение цо: v0, т. е. однозначно определяет ли- линию Н = 0. Если числа F(M0) и G(M0) вещественны, то отно- отношение (Ло : vo также вещественно. 2. Описание пучков линий второго порядка Теорема 1. Каждый пучок общего типа [1111] состоит из всех линий второго порядка, проходящих через его фундаментальные точки. Доказательство. Пусть F = 0 — произвольная линия второго порядка, проходящая через фундаментальные точки Ми М2, М3, Л^4 данного пучка, и пусть Мо -А произвольная точка этой линии, отличная от точек Ми М2, М3, М4. Согласно предложе- предложению 2 п. 1, в пучке существует линия Н = 0, проходящая через точку Мо. Линии F = 0 и Я = 0 имеют, таким образом, пять об- общих точек, что согласно теореме Безу возможно тогда и только тогда, когда эти линии либо совпадают (и в этом случае все доказано), либо имеют общую прямую (и, следовательно, обе являются парами прямых). В последнем случае, мы, без огра- ограничения общности, можем предполагать, что линия И = 0 со- состоит из прямых М\М2 и МгМ^ и что прямая М\Мз является общей прямой линий Я = 0 и F = 0. Но тогда линия F = 0, состоящая из двух прямых, одной из которых является прямая 583
М\М2, и проходящая через четыре точки Ми М2, М3, М4, ника- никакие три из которых не коллинеарны (предложение 1 п. 1), обя- обязательно должна содержать прямую М3М4. Следовательно, ли- линии' F = 0 и Н = 0 совпадают и в этом случае. Следствие. Пучок общего типа однозначно определяется его фундаментальными точками. Чтобы описать все линии, принадлежащие пучку с фунда- фундаментальными точками Ми М2, М3, М4, рассмотрим прямые MiM2, М3М4, MtM3 и М2М4. Пусть — уравнения этих прямых. Тогда линии второго порядка f lffl = О И fng2 = 0 как линии, проходящие через все четыре точки, будут согласно теореме 1 принадлежать рассматриваемому пучку. Этим доказано следующее Предложение 1. Любой пучок общего типа состоит из всех линий второго порядка, имеющих уравнения i I вида = 0, A) где ц и v — произвольные числа, а /i = 0, gl==Qf f2 = 0j g2==0 B) ' ¦— уравнения прямых, никакие три из кото- торых не имеют общей точки. Фундаментальными точками пучка являются точки пересе- пересечения прямых f1 = O,gl = Oc прямыми f2 = 0, g2 = 0. Заметим, что если пучок A) — вещественный, то прямые B) можно вы- выбрать вещественными или комплексно-сопряженными. Действительно, если все точки Мь М2, М3, М4 — веществен- вещественные, то все прямые B) также будут вещественными. Если, скажем, точки М\ и М2 комплексно-сопряжены (а точки Мг и М4 вещественны или комплексно-сопряжены), то прямые /i = 0 и gi = 0 будут вещественными, а прямые /2 = 0 и g2 = 0 — комплексно-сопряженными. Ясно, что формула A) определяет пучок общего типа для любых точек Mi, M2, М3, М4, никакие три из которых не ле- лежат на одной прямой (причем этот пучок — вещественный тогда и только тогда, когда мнимые из точек Mi, M2, М3, М4 попарно комплексно-сопряжены). Таким образом, указанное в предло- предложении 1 п. 1 необходимое условие для фундаментальных точек, является (для пучков общего типа) также и достаточным. 584
Пучки типа [211] изучаются совершенно аналогично. Теорема 2. Каждый пучок типа [211] состоит из всех линий второго порядка, проходящих через его фундаментальные точки и касающихся его фундаментальной прямой. Доказательство. Пусть М\ — двойная фундаменталь- фундаментальная точка, а М2 и М3 — простые фундаментальные точки, и пусть h == 0 — фундаментальная прямая (проходящая через точку Mi и не проходящая через точки М2 и М3). Рассмотрим произвольную линию второго порядка F = 0, проходящую че- через точки Mi, M2, М3 и касающуюся (в точке Mi) прямой h = 0. Пусть Mq — произвольная точка линии F = 0, отличная от точек Ми М2, М3, и пусть Н = 0 — линия пучка, проходящая через точку Мо (предложение 2 п. 1). Линии второго порядка F = 0 и Н = 0 имеют (с учетом кратностей) по крайней мере пять общих точек (двойную точку Mi и еще три точки М2, М3, Мо неизвестных кратностей); поэтому согласно теореме Безу эти линии либо совпадают (и тогда все доказано), либо имеют общую прямую (и, следовательно, обе являются парами пря- прямых). В последнем случае точка Mi должна быть единственной двойной точкой линии Н = 0 (ибо согласно предложению 1 п. 1 точки Ми М2, М3 не коллинеарны), и следовательно, эта линия состоит из различных прямых MiM2 и MiM3. При этом без ограничения общности мы можем считать, что в состав линии F = 0 входит прямая MiM2. С другой стороны, поскольку прямая h = 0 является, по условию, касательной к линии F=0, она должна либо совпадать с прямой Л^Мг, либо точка М{ должна быть двойной точкой линии F = 0. Поскольку первый случай невозможен (фундаментальная прямая h = 0 не про- проходит через фундаментальную точку М2), остается только вто- второй случай. Но тогда второй прямой, входящей в состав линии F = 0, должна быть обязательно прямая MiM3. Поэтому и в этом случае линии F = 0 и Н = 0 совпадают. Следствие. Пучок типа [211] однозначно определяется его фундаментальными точками и фундаментальной прямой. Пусть /, = 0, g = 0 и /2 = 0 — уравнения прямых MiM2, MXM3 и М2М3. Тогда линии вто- второго порядка % f,g = O и f2h = O принадлежат, согласно теореме 2, рассматриваемому пучку. Этим доказано следующее Предложение 2. Каждый пучок типа [211] состоит из всех линий второго порядка, имеющих уравнения вида v/2A = O, C) 585
где ц и v — произвольные числа, а — уравнения таких (различных) прямых, что прямые /i = О, g = О и h = О проходят через одну точку, через которую не проходит прямая f2 = О. Фундаментальными точками пучка являются точки попарного пересечения прямых fi = О, g = О и f2 = О, а фунда- фундаментальной прямой — прямая h = О. При этом если пучок C) — вещественный, то прямые f2 = О и h = О обязательно ве- вещественны, а прямые fi = О и g = О либо вещественны, либо комплексно-сопря- комплексно-сопряжены. Действительно, как мы знаем, прямая А = Ои двойная фун- фундаментальная точка Mi обязательно вещественны, а простые фундаментальные точки М2 и Мз либо вещественны, либо ком- комплексно-сопряжены. Ясно, что формула C) определяет некоторый пучок типа [211] для любых неколлинеарных точек Ми М2, М3 и любой прямой h = 0, проходящей через точку Mi и не проходящей через точки М2 и М3 (причем этот пучок — вещественный тогда и только тогда, когда точка М] и прямая h = 0 вещественны, а точки М2 и Л43 либо вещественны, либо комплексно-сопря- комплексно-сопряжены). Таким образом, и для пучков типа [211] необходимые условия из предложения I п. 2 оказываются достаточными. Рассмотрим теперь пучки типа [22]. Теорема 3. Каждый пучок типа [22] состоит из всех линий второго порядка, проходящих через его фундаментальные точки и касающихся в этих точках его фундаментальных прямых. Доказательство этой теоремы вполне аналогично доказа- доказательству теорем 1 и 2 и потому мы его опустим. Задание. Докажите теорему 3. Следствие. Пучок типа [22] однозначно определяется его фундаментальными точками и прямыми. Пусть - hi = 0, h2 = О — фундаментальные прямые пучка типа [22] и пусть — прямая, соединяющая его фундаментальные точки. Посколь-. ку линии второго порядка /2 = 0 и hih2 = O X 686 .'
\ \ принадлежат, согласно теореме 3, пучку, справедливо сле- следующее Предложение 3. Каждый пучок типа [22] состоит из всех линий второго порядка, имеющих уравнения вида где ц и v — произвольные числа, а / = 0, Л, = 0, h2 = 0 E) — уравнения трех прямых, не про- проходящих через одну точку. Фундаментальными прямыми этого пучка являются прямые а фундаментальными точками — точки пересечения этих пря- прямых с прямой / = 0. При этом, если пучок D) — вещественный, то прямая / = 0 веществен- вещественна, а прямые h\ = 0 и h2 = 0 либо вещественны, либо ком- пл ексно-сопряжены. Формула D) определяет, очевидно, некоторый пучок типа [22] для любых прямых E), не проходящих через одну точку (причем этот пучок — вещественный тогда и только тогда, когда прямая f = 0 вещественна, а прямые ht = 0 и h2 = 0 либо вещественны, либо комплексно-сопряжены). Таким образом, и для пучков типа [22] необходимые условия из предложения 1 п. 1 оказываются достаточными. Для пучков типа [31] и [4] ситуация значительно сложнее. Рассмотрим сначала пучки типа [31]. Каждый такой пучок имеет две фундаментальные точки М\ и М2 (тройную и про- простую) и одну фундаментальную прямую h = 0, проходящую через тройную точку М\. Пусть g = 0 — прямая М\М2 и пусть / = 0 — произвольная прямая, проходящая через точку М2 и отличная от прямой g = 0. Будем пока предполагать, что мы находимся на проек- проективной (вещественно-комплексной или комплексной) плоско- плоскости. Тогда без ограничения общности мы можем считать, что прямые Л = 0, g = 0 и /==0 имеют соответственно уравнения Пусть = 0, Y = 0 и Z = 0. апХ2 + 2ai2XY 2al3XZ + 2a23YZ О — уравнение произвольной линии рассматриваемого пучка в координатах X: Y: Z. Так как эта линия проходит через точку 687
Mi с координатами Хх: Yi :ZX = 0 :0 : 1, то аъъ = О, а так как она проходит через точку М2 с координатами Х2: Y2:Z2 — = 1:0:0, то ац = 0. Кроме того, эта линия касается, по усло- условию, прямой X == 0 в точке Mi@:0: 1), откуда непосредственно вытекает (см. уравнение касательной (8) п. 2 § 2), что а23=0. Таким образом, уравнение произвольной линии нашего пучка имеет на самом деле вид 2al2XY + a22Y2 + 2al3XZ = 0. Заметим теперь, что в силу нашего выбора координат при- о надлежащая пучку линия второго порядка Н = О, имеющая в точке М\ двойную точку (см. лемму 1 п. 4 § 2), задается уравнением XY = 0. Поэтому наш пучок содержит некоторую линию с уравнением a22Y2 + 2al3XZ = 0. Легко видеть, что коэффициенты а22 и ai3 этого уравнения отличны от нуля. Действительно, если, например, ai3 = 0, то пучок содержит две распадающиеся линии XY = 0 и Y2 = 0 с общей прямой У = 0 и потому является вырожденным пуч- пучком. Аналогично, если а22 = 0, то пучок также содержит две линии XY = 0 и XZ = 0 с общей прямой и потому снова яв- является вырожденным пучком. Следовательно, деля на а22 и полагая р = —, мы окон- чательно получаем, что рассматриваемый пучок типа [31] содержит линию вида Y2 = 2pXZ F) с рфО. В однородных аффинных координатах линия F) является параболой. Однако в рассматриваемых сейчас произвольных однородных проективных координатах она может быть любой (невырожденной) линией второго по- порядка. Легко видеть, что двух различных линий вида F) данный пучок содержать не может. Действительно, в противном случае уравнение любой линии пучка было бы линейной комбинацией двух уравнений вида F). Но ясно, что уравнение XY = 0 вырожденной линии пучка получить таким образом невозможно. Доказанное утверждение означает, что число р однозначно определяется пучком {при выбранной системе однородных проективных координат). Таким образом, мы видим, что в отличие от пучков пре- предыдущих типов, пучков типа [31] с данными фундаментальными точками и данной фундаментальной прямой существует целое семействоу 588
зависящее от одного параметра р (подчиненного единственному условию: быть не равным нулю). Поскольку пучок содержит линию F) и линию XY = 0, лю- любая принадлежащая ему линия второго порядка имеет урав- уравнение вида \iXY + v (Y2 — 2pXY) = 0. Возвращаясь к произвольным координатам и учитывая, что- прямые Z = 0 и 2pZ = 0 совпадают, мы получаем, таким об- образом, следующее Предложение 4. Каждый пучок типа [31] состоит из всех линий второго порядка, имеющих уравнение вида v(g2-fh) = 0, G) где ц и v — произвольные числа, а / = 0, g = 0, А = 0 (8) — уравнения трех прямых, не проходящих через одну точку. Фундаментальной прямой этого пучка является прямая а фундаментальными точками — точки пересечения прямых, h = 0 и f = 0 с прямой g — 0. При этом, если пучок G) — вещественный, то прямые (8) также ве- вещественны. Формула G) определяет, очевидно, некоторый пучок типа [31] для любых прямых (8), не проходящих через одну точку (причем этот пучок — вещественный тогда и только тогда, когда все прямые (8) вещественны). Таким образом, и для пучков типа [31] необходимые условия из предложения 1 п. 1 оказы- оказываются достаточными. Итак, мы видим, что условия предложгния 1 п. 1 достаточ- достаточны во всех случаях (для пучков типа [4] они выполнены три- тривиально). Замечание 1. Чтобы от пучка G) перейти к другому пучку типа [31] с теми же фундаментальными точками и той же фун- фундаментальной прямой, достаточно под h — 0 понимать другое (пропорциональное) уравнение фундаментальной прямой. Замечание 2. Хотя в доказательстве предложения 4 мы пользовались проективными координатами, ясно, что предло- предложение 4 справедливо и в аффинно-проективной плоскости. Рассмотрим, наконец, пучки типа [4]. Каждый такой пучок имеет единственную фундаментальную- точку Mi. Если в пучке содержится линия Я = 0, состоящая из
двух различных прямых, то, во-первых, двойная точка этой ли- линии должна совпадать с точкой Ми а, во-вторых, любая другая линия пучка должна быть вырожденной линией с той же двой- двойной точкой. Действительно, только при этих условиях каждая линия пучка пересекается с линией Н = 0 в точке Мi кратно- кратности 4. Таким образом, в этом случае каждая линия пучка является парой прямых (пересекаю- (пересекающихся в его фундаментальной точке). Определение 1. Пучки типа [4], содержащие линии, являю- являющиеся парами различных прямых, мы будем называть пучками вырожденных линий (не путать с вырожденными пучками!). Выбрав в пучке вырожденных линий две линии, мы немед- немедленно получаем следующее Предложение 5. Каждый пучок вырожденных линий состоит из всех линий второго порядка, имеющих уравнения вида \ifigi + vf2g2 = 0, (9) где pi и v — произвольные числа, а /i = 0, gi = Ot ;2 = 0, g2 = 0 A0) — уравнения четырех прямых, проходящих через одну точку и обладающих тем свойством, что каждая из прямых f\ = 0 и gl = 0 отлична от прямых f2 — 0 и g2 = 0 (совпадение прямых f1 = 0 и gi = 0 или прямых f2 = 0 и g2 = 0 не исключается). Фундаментальной точкой этого пучка является точка Мх пе- пересечения прямых A0), а фундаментальной прямой — произ- произвольная прямая, проходящая через точку Мх. Пучок (9) тогда и только тогда — вещественный, когда либо все прямые A0) вещественны, либо прямые fi = 0 и gi=0 или прямые /2 = 0 и g2 = 0 комплексно-сопряжены (а осталь- остальные прямые вещественны), ¦ Замечание 3. Не нужно думать, что пучок (9) содержит все вырожденные линии второго порядка с двойной точкой Мх. На- Напротив, из предложения 2 п. 1 непосредственно вытекает, что каждая прямая, проходящая через точку Мь входит в со- состав одной и только одной линии пучка (9). Рассмотрим теперь пучки типа [4], содержащие невырож- невырожденные линии второго порядка. Согласно сказанному выше, со- о держащаяся в таком пучке вырожденная линия Н = 0 (см. лемму 3 п. 4 § 2) обязана быть двойной прямой, и эта прямая должна касаться в точке Мх каждой линии пучка, т. е. должна быть фундаментальной прямой пучка. Поэтому, в частности, линия Я = 0 будет единственной вырожденной линией, содер- содержащейся в пучке. ^ 590
Мы выберем систему однородных проективных координат X:Y:Z так, чтобы точка Мх имела координаты A :0:0), а ли* ния Я = 0— уравнение Z2 = 0. Тогда фундаментальная пря- прямая пучка будет иметь уравнение Z = 0. Пусть апХ2 + 2al2XY + a22Y2 + 2al3XZ + 2a23YZ + a33Z2 = 0 — уравнение произвольной линии пучка. Так как эта линия проходит через точку Mi(l:0:0), тег аи = 0, а так как она ка- касается в этой точке прямой Z = 0, то й\2 = 0. Таким образом, уравнение произвольной линии рассматри- рассматриваемого пучка имеет на самом деле вид a22Y2 + 2ai3XZ + 2a23YZ + a33Z2 = 0. Поскольку линия Z2 = 0 принадлежит, по условию, пучку, отсюда вытекает, что в пучке содержится линия с уравнением вида a22Y2 + 2al3XZ + 2a23YZ = 0. Ясно, что коэффициенты а22 и ai3 этого уравнения отличны от нуля, поскольку в противном случае пучок будет содержать две вырожденные линии, что согласно сказанному выше невоз- невозможно. Следовательно, деля на а22 и полагая мы получаем, что рассматриваемый пучок типа [4] содержит линию вида A1) где р ф 0. Так же как для пучков типа [31], немедленно доказывается, что при выбранной системе однородных проективных координат числа р Ф0 и q однозначно определяются пучком. Таким образом, пучков типа [4] с данной фундаментальной точкой и данной фундаментальной прямой существует целое семейство, завися- зависящее от двух параметров р и q (подчиненных единственному условию: р Ф 0). Поскольку пучок содержит линию A1) и линию Z2='O, лю- любая принадлежащая ему линия второго порядка имеет урав- уравнение вида v (У2 - 2pXZ - 2qYZ) = 0. 5S1
Возвращаясь к произвольным координатам и обозначая че- через / = О, g = 0 и /г = О прямые, имеющие ' в координатах X:Y:Z уравнения 2pX-\-2qY = О, Y = 0 и Z = О, мы немед- немедленно получаем отсюда следующее Предложение 6. Каждый пучок типа [А], не являющийся пуч- пучком вырожденных линий, состоит из всех линий второго поряд- порядка, имеющих уравнение вида (g*-fh) = 0, A2) где ц и v — произвольные числа, а f = 0, g = 0, ft = 0 A3) — уравнения трех прямых, не проходящих че- через одну точку. Фундаментальной прямой пучка A2) яв- является прямая h = 0, а его фундаментальной точкой — точка пересечения прямых h = 0 и g = 0. Пучок A2) тогда и только тогда — вещественный, когда все прямые A3) вещественны. Замечание 4. Подобно предложению 4 предложение 6 спра- справедливо и в аффинно-проект иеной плоскости. Замечание 5. Сопоставляя все доказанные предложения, мы видим, что каждый пучок линий второго порядка может быть представ- представлен в одном из следующих трех видов: vf2g2 = 0, A4) -fh) = 0, A5) 2-fh) = 0, A6) где fi — 0, gi=0, f2 = 0, g2 = 0 A7) f = 0, g = 0, h = 0 A8) — уравнения некоторых прямых. При этом, если из прямых A7) никакие три не проходят через одну точку, то пучок A4) является пучком общего типа [1111]; если три (и только три) из прямых A7) проходят через одну точку, то пучок A4) является пучком типа [211], когда все прямые A7) различны, и пучком типа [22], когда либо fi — gi, либо /г = g2', если все четыре прямые A7) проходят через одну точку (и ни одна из прямых fi = 0, gi = 0 не совпадает ни с одной из прямых f2 = 0, g2 = 0), то пучок A4) является пуч- пучком типа [4], состоящим из вырожденных линий; и, наконец, во всех остальных случаях пучок A4) вырожден. Пучки A5) и A6) являются (при прямых A8), не прохо- проходящих через одну точку) соответственно пучками типа [31] и 592
пучками типа [4], не являющимися пучками вырожденных линий. Упражнение. Докажите, что если прямые A8) проходят через одну точку, то пучки A5) и A6) яв- являются либо пучками вырожденных линий, либо вырожденными пучками Дополнение. Еще раз о пучках окружностей Все сказанное выше справедливо и для линий второго порядка па евкли- дово-проективной (вещественно-комплексной или комплексной) п носкости, поскольку такую плоскость мы можем единственным образом превратить в аффинно-проективную плоскость (см. п. 4 § 1 гл. 4). Как мы знаем (см. п. 6 § 3 гл. 4), любая окружность на евклидово- проективной вещественно-комплексной плоскости проходит через цикличе- циклические точки (±( : 1 : 0) (конечно, мы здесь пользуемся однородными евклидо- евклидовыми координатами). Покажем, что и, обратно, любая вещественная линия второго порядка на евклидово-проективной вещественно-комплексной плоскости, проходящая через циклические точки, является окружностью. Действительно, если линия 0 A) проходит через точки (± /: I :0), то — аи + 2ia12 + а22 — 0 и, следовательно (поскольку числа аи, аи, а22, по условию, вещественны). Поэтому при аи = а?2 Ф 0 линия (I) —настоящая окружность (см. п. 6 § 3 гл. 4), а при п\\= а22 = 0—прямая (плюс несобственная прямая Z = 0). Отсюда вытекает, что любой вещественный пучок линий второго поряд- порядка, среди фундаментальных точек которого содержатся обе циклические точки, состоит только из окружностей (точнее, из окружностей состоит его подмножество вещественных линий). Если этот пучок имеет еще две собственные фундаментальные точки (и потому является пучком общего типа), то он будет эллиптическим пучком окружностей, если эти точки вещественны, и гиперболическим пучком, если эти точки комплексно-сопряжены. Если этот пучок имеет одну двойную соб- собственную фундаментальную точку, то он будет параболическим пучком окружностей. Если среди его фундаментальных ^точек имеется (кроме цик- циклических) несобственная точка, то он будет вырожденным пучком с общей несобственной прямой, так что, удалив эту прямую, мы получим пучок пря- прямых. Пучок типа [22], фундаментальными точками которого являются цик- циклические точки (а фундаментальные прямые комплексно-сопряжены), являет- является несобственным пучком концентрических окружностей (имеющих центры в точке пересечения фундаментальных прямых). Таким образом, теория пучков окружностей естественным образом вкла- вкладывается в общую теорию пучков линий второго порядка. 593
3. Линии второго порядка, проходящие через пять точек В этом и следующих пунктах мы применим теорию пучков линий второго порядка к доказательству некоторых важных теорем о линиях второго порядка. Конечно, эти теоремы можно доказывать, и не пользуясь пучками, но тогда их доказатель- доказательства получаются гораздо бодее сложными. Пусть нам даны пять различных точек 1, 2, 3, 4, 5 аффинно-проективной вещественно-комплексной плоскости, из которых никакие четыре не коллинеарны. Покажем, что из этих пяти точек можно выбрать четыре, из которых ни- никакие три не коллинеарны. Действительно, рассмотрим точки 1, 2, 3, 4. Если никакие три из них не коллинеарны., то все доказано. Пусть среди этих точек имеются три точки (скажем, точки 1, 2, 3), принадлежа- принадлежащие одной прямой. По условию точка 4 не принадлежит пря- прямой 123 и потому определены три прямые 14, 24 и 34. Точка 5 может принадлежать не более чем одной из этих прямых. Пусть она не принадлежит прямым 14 и 24. Тогда ясно, что никакие три из четырех точек 1, 2, 4 и 5 не коллинеарны. Из этого утверждения немедленно вытекает следующее Предложение 1. Через любые пять точек 1, 2, 3, 4, 5 аффин- аффинно-проективной вещественно-комплексной плоскости, из кото- которых никакие четыре не коллинеарны, проходит единственная линия второго порядка. Доказательство. Пусть 1, 2, 3, 4 — те из данных точек, никакие три из которых не коллинеарны. Тогда существует единственный пучок линий второго порядка общего типа, фун- фундаментальными точками которого являются эти точки, а в этом пучке существует единственная линия, проходящая через точку 5. Поскольку этот пучок состоит из всех линий второго порядка, проходящих через точки 1, 2, 3 и 4, никакой другой линии вто- второго порядка, проходящей через точки 1, 2, 3, 4 и 5, существо- существовать не может. Чтобы найти эту линию, следует составить уравнения fl2 = 0, fs4 = 0, fl3 = 0, f24 = 0 A) прямых, проходящих соответственно через точки 1, 2, через точки 3, 4, через точки 1, 3 и через точки 2, 4, а затем найти от- отношение |л : v из условия, чтобы линия проходила через точку 5. Если точки 1, 2, 3, 4 — вещественные, то прямые A) — также вещественные. Если точки 1, 4 — вещественные,' а точки 2, 3—• комплексно-сопряженные, то прямые fi2 = О и fi3^= 0, а также 594 -- •
прямые f34 = 0 и /24 = О комплексно-сопряжены. Наконец, если точки 1, 2,^а также точки 3, 4—комплексно-сопряженные, то прямые / 12 = 0 и /з4 = 0 •— вещественные, а прямые /K = 0 • и /гз = 0 — комплексно-сопряженные. Таким образом, во всех слу- случаях пучок содержит две вещественные линии (линии /12/34 = О, /13/24=0 — в первом и третьем случае, и линии /12/34-1-/13/24=0, t (/12/34 — /13/24) = 0 — во втором случае) и потому является ве- вещественным пучком. Поэтому, если среди пяти точек 1, 2, 3, 4 и 5 каждая мнимая содер- содержится вместе со своей комплексно-сопряженной, то проходящая через них линия второго порядка вещественна. Если нам даны пять точек 1, 2, 3, 4 и 5, из которых четыре (скажем, точки 1, 2, 3 и 4) принадлежат одной прямой, то ли- линия второго порядка, проходящая через эти точки, все равно будет существовать (ею будет, например, пара прямых, состоящая из прямой 1234 и произвольной прямой, проходящей через точку 5), но эта линия уже не будет единственной. Замечание 1. Предложение 1 можно легко доказать, и не пользуясь понятием пучка (но зато используя более серьезные алгебраические соображения, чем те, которыми мы пользова- пользовались до сих пор). Действительно, линия второго порядка с урав- уравнением аиХ2 + 2a12XY + a22Y2 + 2a13XZ + 2a^YZ + a33Z2 = 0 тогда и только тогда проходит через точку (Хо: Yo: Zo), когда апХ\ + 2a12X0Y0 + a22Y\ + 2al3X0ZQ + 2а23Y0Z0 +. abiZ\ = 0. Но это равенство, является линейным однородным уравнением относительно шести неизвестных ап, а12, а22, а13, а23, а33. Поэтому требование, чтобы линия проходила через пять точек, алгебраически выражается в виде системы пяти таких уравне- уравнений. А так как из алгебры известно, что система однородных уравнений, число уравнений которой меньше числа неизвест- неизвестных, всегда имеет нетривиальное решение, то всегда существует линия второго порядка, проходящая через пять данных точек. Чтобы на этом пути получить единственность линии, проходящей через пять, точек, из которых никакие четыре не лежат на одной прямой, необходимо воспользоваться более точным алгебраическим фактом, а именно тем, что система ли- линейно независимых однородных линейных уравнений от « + 1 неизвестных, состоящая из п уравнений, имеет единственное (с точностью до пропорциональности) нетривиальное решение. Чтобы мы могли эту теорему использовать, нам нужно только доказать, что наши пять уравнений линейно независимы. Но это легко доказывается от противного. 595
Действительно, если, скажем, пятое уравнение является следствием четырех других уравнений, то любая линия второго порядка, проходящая через точки 1, 2, 3 и 4, будет проходить и через точку 5. В частности, точка 5 должна принадлежать ли- линии, состоящей из прямых 12 и 34, а также линии, состоящей из прямых 13 и 24. Но если никакие три из точек 1, 2, 3 и 4 не коллинеарны, то эти две линии имеют общими только точки 1, 2, 3 и 4, так что в этом случае мы приходим к противоречию. Если же, скажем, точки i, 2, 3 коллинеарны, то чтобы прийти к противоречию, достаточно рассмотреть линию второго по- порядка, состоящую из прямой 123 и произвольной прямой, про- проходящей через точку 4 и не содержащей точку 5. Замечание 2. Обратим внимание на то, что последним спо- способом мы доказали не только единственность линии, проходя- проходящей через точки 1—5, но даже единственность (с точностью до пропорциональности) ее уравнения. Это позволяет нам немед- немедленно получить теорему единственности для линий второго порядка в следующей формулировке: Любые два уравнения произвольной линии второго порядка на аффинно-проективной вещественно-комплексной плоскости пропорциональны. Действительно, если линия не является дважды взятой пря- прямой, то на ней существует пять точек, из которых никакие че- четыре не коллинеарны, а согласно только что сказанному урав- уравнение линии второго порядка, проходящей через эти точки, оп- определено однозначно (с точностью до пропорциональности). Если же линия является дважды взятой прямой, то ее урав- уравнение имеет (с точностью до числового множителя) вид (АХ + BY + CZf = 0, и его единственность немедленно вытекает из единственности (с точностью до пропорциональности) уравнения прямой. Теорема единственности для линий второго порядка на аф- аффинной (а значит, и на евклидовой) вещественно-комплексной плоскости (см. п. 4 § 1) вытекает отсюда немедленно, поскольку любая- линия второго порядка на аффинной плоскости одно- однозначно дополняется не более чем двумя точками до линии на аффинно-проективной плоскости. Совершенно так же может быть доказана и теорема един- единственности для линий второго порядка (содержащих более од- одной точки) на вещественной плоскости.. Дополнение. Поверхности второго порядка, проходящие через девять точек Уравнение поверхности второго порядка в пространстве имеет десять коэффициентов ац. Условие, что поверхность проходит через данную точку, накладывает на эти коэффициенты одно линейное соотношение. Следова-
тельно, поскольку система десяти линейных однородных уравнений с десятью- неизвестными всегда имеет хотя бы одно нетривиальное решение. через любые девять точек (аффинно-проективного или проективного) про- пространства проходит хотя бы одна поверхность второго порядка. Упражнение. Найдите необходимые и достаточные условия, которым должны удовлетворять девять точек пространства, чтобы через них прохо- проходила единственная поверхность второго порядка. Из доказанного утверждения непосредственно вытекает, что через любые три прямые проходит хотя бы одна поверхность второго порядка. Действительно, достаточно выбрать на каждой из данных прямых по три точки и провести через получающиеся девять точек поверхность второго порядка. Эта поверхность, имея с каждой из данных прямых три общие точки, будет эти прямые целиком содержать. Построенная поверхность второго порядка не может быть ни эллипсои- эллипсоидом, ни двуполостным гиперболоидом, ни эллиптическим параболоидом, по- поскольку ни одна из этих поверхностей не может содержать ни одной прямой. Аналогично, если данные прямые скрещиваются, то она не может быть ци- цилиндром (и, в частности, парой плоскостей). Поэтому для скрещивающихся прямых содержащая их поверхность второго порядка обязана быть либо однополостным гиперболоидом, либо гиперболическим параболоидом (заме- (заметим, что здесь мы существенно используем оставленный нами в дополнении к § 1 без доказательства факт, что перечисленными в этом дополнении сем- семнадцатью классами поверхностей исчерпываются все поверхности второго по- порядка в пространстве). Но мы знаем, что прямые, лежащие на однополост- ном гиперболоиде или гиперболическом параболоиде, являются его прямоли- прямолинейными образующими, причем три прямолинейные образующие тогда и только тогда скрещиваются, когда они принадлежат одному семейству обра- образующих. Таким образом, наши три прямые являются прямолинейными обра- образующими либо однополостного гиперболоида, либо гиперболического парабо- параболоида, принадлежащими одному семейству образующих. Поскольку три образующих одного семейства однозначно определяют поверхность (потому что эта поверхность может быть охарактеризована как геометрическое место всех точек прямых, проходящих через данные три образующие; см. пп. 4—5 § 2 гл. 5), тем самым доказано, что через любые три скрещивающиеся прямые проходит единственная по- поверхность второго порядка (являющаяся однополостным гиперболоидом, если эти прямые не параллельны одной плоскости, и гиперболическим параболои- параболоидом— в противном случае). Упражнение. Существуют ли не скрещивающиеся прямые, для которых содержащая их поверхность второго порядка все же единственна? Одновременно мы также доказали,, что для любых трех скрещивающихся прямых существует линейчатая по- поверхность второго порядка (однополостный гиперболоид или гиперболический параболоид), прямолинейными образующими которой, принадлежащими од- одному семейству, они являются. 597
Это означает (см. пп. 4—5 § 2 гл. 5), что какие бы три скрещивающиеся прямые мы ни взяли, геометрическое ме- •сто точек всех прямых, пересекающих эти прямые, является либо однопо- -лостным гиперболоидом (если данные прямые не параллельны одной пло- плоскости), либо гиперболическим параболоидом (если они параллельны некото- некоторой плоскости). 4. Теорема Штурма Пусть нам даны три линии второго порядка имеющие попарно лишь простые точки пересечения, и пусть эти кривые проходят через две данные точки Мо и No. Тогда любые две из этих линий пересекаются еще в двух точках (отличных от точек Мо и No). Пусть Mi, A^i—дополнительные точки пересечения линий F2 = 0 и F3 = 0; М2,' N2— дополнительные точки пересечения линий - Ft = 0 и Ft = 0; М3, Л'з — дополнительные точки пересечения линий Fi = 0 и F2 = 0. Теорема Штурма. Прямые MiNu M2N2 и M3N3 проходят че- ,рез одну точку. Доказательство. Пусть go = 0 — уравнение прямой М0Л^0; gi = 0 — уравнение прямой M\N\\ gz = 0 — уравнение прямой M2N2; g3 = 0 —уравнение прямой AJ3^3- Если одна из данных линий (скажем/ линия F3 = 0) яв- является парой прямых, одной из которых служит прямая go = 0, то другой прямой, входящей в состав линии, будет прямая gl = 0 (поскольку линия F3 = 0 содержит точки Mi и М), а также прямая g2 = 0 (поскольку линия F3 = 0 содержит точки М2 и Л'г). Следовательно, прямые ?ь = 0 и. g2 = 0 совпадают, и потому в этом случае утверждение теоремы очевидно. Пусть теперь ни одна из данных линий не является парой прямых, одной из которых служит прямая go = 0. Рассмотрим «598
пучок линий второго порядка ИЛ + vF2 = 0. По условию, он является пучком общего типа с фундаменталь- фундаментальными точками Мо, No, М3, N3a потому содержит любую линию» второго порядка, проходящую через эти точки. В частности, этот пучок содержит пару прямых gogs = 0. Так как линии Fi = 0h gog3 = 0, по условию, различны, су- существуют такие числа ц и v (оба отличные от нуля), что Поскольку все уравнения линий нам заданы только с точ- точностью до пропорциональности, мы можем (заменяя, если нуж- 1 v \ но, F2 на —F2, a g3— на —g3j без ограничения общности: считать, что ' ?2 = Л + gog3- Аналогично показывается, что (при соответствующей нормировке уравнений F3 = 0 и g2 = 0).. Поэтому F F так что линия F%—F3 = 0 является парой прямых g0 = 0 и- gs — g2 = 0. Но линия F2 — F3 = 0 принадлежит пучку \iF2 + vF3 = 0 и- потому проходит через точки Мо, NQ, Mu N\. Поскольку прямой M0N0 является прямая g0 = 0, это показывает, что прямая MiNl (т. е. прямая gi = 0) имеет уравнение &з — g2 = 0. Следовательно, прямая gi = 0 принадлежит пучку, определен- определенному прямыми g2 = 0, g3 = 0, и потому проходит через точку их пересечения. Тем самым теорема Штурма полностью доказана. Рассмотрим частный случай, когда точки Мо и Мо являются^ циклическими точками. Тогда линии второго порядка будут окружностями, а прямые ^1 = 0, ^2 = 0, ^3 = 0 — об- общими хордами этих окружностей, т. ^е. их радикальными осями- (см. п. 1 § 3 гл. 4). ' " , 599»
В этом случае теорема Штурма переходит в уже известную «ам теорему о том, что для любых трех окружностей их ра- радикальные оси пересекаются в одной точке (радикальном цент- центре этих трех окружностей; см. определение 3 п. 1 § 3 гл. 4). Другие варианты теоремы Штурма получаются, когда неко- некоторые из рассмотренных выше точек совпадают. Пусть, например, совпадают точки Мо и No, т. е. пусть ли- линии второго порядка проходят через точку Мо, причем эта точка является двойной точкой пересечения любых двух из этих линий. Другими сло- словами, пусть в точке Мо все три линии имеют одну и ту же ка- касательную Предполагая по-прежнему, что все другие точки пересечения этих линий различны (и отличны от точки Мо), мы можем по- повторить все изложенные выше рассуждения. Единственное от- отличие будет теперь <в том, что пучок \xF\ + vF2 = 0 будет те- теперь пучком типа [211] с фундаментальной прямой g0 = 0, но распадающаяся на прямые линия gog3 = 0 будет, как и раньше, ему принадлежать. Таким образом, для трех линий второго порядка, касающихся друг друга в некоторой точке, прямые, проходящие через другие точки их пе- расечения, проходят через одну точку. Точно так же, теорема Штурма сохраняется и тогда, когда, например, точки М\ и N\ совпадают (т. е. когда в точке М\ ли- линии F2 = 0 и F3 = 0 касаются друг друга). Естественно, что в этом случае под прямой §\ = 0 следует понимать общую ка- касательную линий F2 == 0 и F;з = 0 в точке Mi. Задание. Разберите все возможные здесь случаи (когда совпадают точки пересечения одной пары линий, двух пар и т. д.) и сформулируйте соответ- соответствующие теоремы. ^«00
5. Теорема Паскаля Пусть на некоторой линии второго порядка F = 0 дано шесть ее простых точек. Обозначим их (в произволь- произвольном порядке) символами 1, 2, 3, 4, 5, 6. Определение 1. О шести прямых 12, 23, 34, 45, 56, 61 мы будем говорить, что они образуют шестиугольник, вписан- вписанный в линию F = 0. Обратим внимание на то, что термин «шестиугольник» здесь используется в смысле, отличном от элементарно-геометриче- элементарно-геометрического («сторонами» шестиугольника являются не отрезки, а прямые, и эти стороны могут как угодно пересекаться). Стороны, между которыми лежит по одной «свободной вер- вершине», т. е. стороны 12 и 45, 23 и 56, 34 и 61, мы будем называть противоположными сторонами нашего шести- шестиугольника. Теорема Паскаля. Точки пересечения противоположных сторон шестиугольника, вписанного в линию второго по- порядка, коллинеарны. Доказательство. Рас- Рассмотрим три линии второго по- порядка: 1) данную линию, 2) вырожденную линию, со- состоящую из прямых 12 и 34, 3) вырожденную линию, со- состоящую из прямых 16 и 45. Эти линии пересекаются в двух точках 1 и 4 (имеют общую хорду 14), и потому к ним применима теорема Штурма. Соответствующими прямыми gi = 0. ?2 = 0, gi = 0 являются здесь, как легко видеть, прямые 23, 65 и прямая, сое- соединяющая точку 12-45 пересечения прямых 12 и 45 с точкой пересечения 34-61 прямых 34 "и 61. Поскольку эти прямые пере- пересекаются в одной точке, мы получаем, что три точки: а) точка 12-45 пересечения прямых 12 и 45, б) точка 23-56 пересечения прямых 23 и 56, в) точка 34-61 пересечения прямых 34 и 61, действительно лежат на одной прямой. 601
Теорема Паскаля позволяет по пяти данным точкам (невы- (невырожденной) линии второго порядка строить (с помощью одной только линейки) любое число других ее точек. Действительно, лусть 1, 2, 3, 4, 5 — данные точки (из которых никакие четыре не коллинеарны). Построим точку 12-45 пересечения прямых 12 и 45 и через эту точку проведем произвольную прямую / = 0. Пусть эта прямая пересекает прямую 23 в точке М, а прямую 34 — в точке N. Сое- Соединив прямыми точку М с точкой 5, а точку N— с точкой 1, рассмотрим точку 6 пересечения этих прямых. Легко видеть, что точка 6 принадлежит линии второго порядка F = 0, прохо- проходящей через точки 1—5. Действительно, пусть 6' — точка пересечения прямой МЪ с .линией F = 0, отличная от точки 5. Применим к точкам 1, 2, 3, 4, 5, 6' теорему Паскаля. Согласно этой теореме три точки пересечения 12 • 45, 23 • 56', 34 • 6'1 лежат на одной прямой. Но поскольку прямая 56' совпадает с прямой МЪ, то М = 23-56'. Следовательно, указанная прямая совпадает с прямой / = 0 (проходящей, по построению, через точки 12-45 и М), и потому точка N (являясь точкой пересече- пересечения прямой / = 0 с прямой 34) совпадает с точкой 34-6'1. Это показывает, что точка 6' расположена на прямой /VI. Будучи точкой прямой МЪ, она является, следовательно, точкой пере- пересечения этих прямых, т. е. совпадает с точкой 6. Поэтому точка 6 принадлежит линии F = 0. Правду сказать, в этом доказательстве допущена, небольшая неточность, поскольку не рассмотрены различные «вырожден- «вырожденные случаи», например, случай, когда прямая МЪ касается ли- линии F = 0 и потому точка 6' совпадает с точкой 5. Мало'Прият- ный труд рассмотрения всех возможных здесь вырождений мы предоставим читателю. Для этого необходимы, конечно, соот- соответствующие «вырожденные варианты» теоремы Паскаля, про- простейшим из которых является следующее утверждение (полу- (получающееся, когда две вершины сливаются в одну): две пары несмежных сторон вписанного в линию второго порядка пятиугольника пересекаются в двух точках, коллинеар- ных с точкой пересечения пятой стороны и касательной к линии s противоположной вершине. Для доказательства этого утверждения достаточно повто- повторить изложенное выше доказательство теоремы Паскаля, толь- только вместо теоремы Штурма следует воспользоваться соответ- соответствующим ее вариантом. «02 .
Аналогично доказывается, что в четырехугольнике, вписанном в линию второго порядка^ противоположные стороны пересекаются в двух точках, колли- неарных с точкой пересечения касательных к линии в любой: паре противоположных вершин, а также, что в треугольнике, вписанном в линию второго порядка, точки- пересечения каждой из сторон с касательной к линии в проти- противоположной вершине коллинеарны. Задание. Докажите эти утверждения. Замечание 1. В справедливости последних утверждений можно непосредственно убедиться, заметив, что они получают- получаются из теоремы Паскаля о шестиугольнике предельным перехо- переходом, когда некоторые вершины шестиугольника сливаются в- одну точку, поскольку предельным положением секущей яв- является касательная. Однако такого рода соображения «по не- непрерывности» носят эвристический характер и не могут рас- рассматриваться как доставляющие строгое доказательство. Рассмотрим теорему Паскаля в частном случае, когда линия- F = О является парой различных прямых-(парой совпадающих прямых она быть не может, поскольку, на такой линий нет про- простых точек). Если на одной из прямых, составляющих линию- F = 0, находятся вершины 1—6 с номерами разной четности, то, как легко убедиться, по крайней мере две из рассматривае- рассматриваемых в теореме Паскаля трех точек пересечения совпадают, и- потому эта теорема сводится к тавтологии. Напротив, если точки 1, 3, 5 расположены на одной прямой, а точки 2, 4, 6 — на другой, то, сравнивая формулировки, мы немедленно полу- получим, что в этом случае теорема Паскаля превращается в уже известную нам теорему Паппа — Паскаля (см. п. 6 § 1 гл. 4). Таким образом, общую теорему Паскаля можно рассматривать- как обобщение теоремы Паппа— Паскаля на любые линии вто- второго порядка. 6. Квадратичные пучки прямых Принцип двойственности на проективной плоскости (см. п. & § 1 гл. 4) мотивирует следующее Определение 1. Множество всех прямых (А: В: С), коорди- координаты которых удовлетворяют некоторому однородному алге- алгебраическому уравнению называется алгебраическим пучком прямых. Степень п этого- уравнения называется порядком пучка. В этой терминологии пучки прямых в смысле п. 1 § 1 гл. 4 являются не чем иным, как пучками первого порядка. боа
Для пучков второго порядка (которые будем также назы- называть квадратичными пучками) может быть развита теория, пол- полностью параллельная (или, лучше сказать, двойственная) раз- развитой выше теории кривых второго порядка. Например, через любую точку (аффинно-проективной веще- вещественно-комплексной) плоскости проходят, вообще говоря, две прямые данного пучка второго порядка, определяемые корнями некоторого квадратного уравнения. Если это уравнение имеет двойной корень, то точка называется касательной к пучку, а единственная прямая пучка, проходящая через эту точку, на- называется прямой касания (о точке говорят также, что она ка- касается пучка в этой прямой). Прямая пучка второго порядка называется двойной, если любая ее точка касается пучка в этой прямой. Остальные пря- прямые пучка называются простыми. На каждой простой прямой пучка существует единственная точка, касающаяся пучка в этой прямой. Пучок второго порядка называется вырожденным, если он имеет двойную прямую. Каждый такой пучок состоит из двух пучков первого порядка. Если эти пучки различны, то един- единственной двойной прямой является прямая, соединяющая их центры. Если же они совпадают, то любая прямая данного пучка второго порядка является его двойной прямой. Если пучок второго порядка имеет уравнение Ьц А2 + 2Ь12АВ + Ь22В2 + 2Ь13АС + 2Ь23ВС + Ь33С2 = О, A) то он вырожден тогда и только тогда, когда 1 2 3 Ь31 ^32 ^33 = 0 (как и в аналогичной ситуации для линий, мы считаем, что Ьц — bji для любых ?, /). Его двойные прямые (А: В: С) оп- определяются в этом случае из уравнений В любой простой прямой (Ао:Во: Со) пучка A) касательная ¦является центром пучка первого порядка, состоящего из пря- прямых (А: В: С), координаты которых удовлетворяют уравнению <ЬцА0 + Ь12В0 + 613С0) А + (Ь21А0 + Ь22В0 + Ь23Со) В + + (ft3i4> + W + 6ззС0)с — 0, €04
т. е. является точкой с координатами (ЬпА0 + Ь12В0 + Ь13С0): (Ь21А0 + Ь22В0 + Ь23С0): (b3lA0+b32B0+b3ZC0). Любые (не совпадающие и не имеющие общего пучка пер- первого порядка) пучки второго порядка ф = 0, W = Q имеют не более четырех общих прямых. Каждой такой общей прямой можно приписать некоторую кратность так, чтобы сум- сумма всех их кратностей была равна четырем. Общие прямые кратности 1 называются простыми прямыми пересечения двух пучков второго порядка. Если все общие прямые двух пучков второго порядка (не имеющих общего пучка первого порядка) являются простыми прямыми пересечения, то их ровно четыре. Пусть нам даны три пучка второго порядка Ф1=О, Ф2 = 0, Ф3 = 0, имеющие попарно лишь простые прямые пересечения, и пусть эти пучки содержат две данные прямые а0 и р0. Тогда любые два из этих пучков содержат еще по паре прямых (отличных от прямых а0 и р0). Пусть ось pi — дополнительные прямые 'пересечения пучков Ф2 = О и Ф3 = О, сс2, fb — дополнительные прямые пересечения пучков Ф] = О и Ф3 = О, «з, Рз — дополнительные прямые пересечения пучков Ф: = О и Ф2 = О, и пусть 'М\—точка пересечения прямых oti и Pi, М2 — точка пересечения прямых а2 и Рг, М3 — точка пересечения прямых аз и р3. Теорема, двойственная теореме Штурма, утвер- утверждает, что точки Ми М2, М3 расположены на одной прямой. Аналогично, пусть в произвольном пучке второго порядка Ф = 0 даны шесть простых прямых 1, 2, 3, 4, 5, 6, и пусть 12, 23, 34, 45, 56, 61 — их точки пересечения. Рассмотрим прямые 12-45, 23-56, 34-61, соединяющие точку 12 с точкой 45, точку 23 — с точкой 56 и точку 34 — с точкой 61. Тогда теорема, двойственная теореме Паскаля, утверждает, что прямые 12-34, 23-56 ы 34-61 проходят через одну точку. 605
Иногда эту теорему называют теоремой Бриан шона для пучков второго' порядка, Доказанная в п. 6 § 1 гл. 4 теорема Паппа — Брианшона яв- является, очевидно; частным случаем теоремы Брианшона, полу- получающимся, когда пучок Ф = 0 вырожден, а прямые 1—6, имею- имеющие номера разной четности, не принадлежат одному из пучков первого порядка, составляющих пучок Ф = 0. Подчеркнем, что все эти результаты немедленно вытекают из соответствующих результатов для линий второго порядка и того факта, что для проективной плоскости существует хотя бы один поляритет (см. п. 3 § 2). Тем не менее, прямые доказательства этих результатов очень полезны, поскольку только таким обра- образом можно полностью осознать их геометрический смысл. Задание. Дайте прямые доказательства всех перечисленных выше утвер- утверждений. Между невырожденными линиями и пучками второго по- порядка существует замечательное взаимоотношение, позволяю- позволяющее интерпретировать результаты о пучках как результаты о линиях. Поэтому теория пучков второго порядка является не просто теорией, двойственной к теории линий второго порядка, но и представляет собой мощное орудие доказательства новых теорем об этих линиях. Пусть нам дан произвольный невырожденный квадра- квадратичный пучок прямых + 2Ь23ВС + Ь33С2 = 0. B) Поскольку этот пучок невырожден, в любой его прямой (А : В : С) существует единственная касательная, имеющая ко- координаты Х^ЬпА + Ь12В + ЬтС, 23C, C) Определение 2. Множество всех касательных к невырож- невырожденному пучку второго порядка называется огибающей этого пучка. Предложение 1. Огибающая произвольного невырожденного пучка второго порядка является невырожденной линией второго порядка. Доказательство. Чтобы найти уравнение, которому удовлетворяют координаты касательной, следует из соотноше- соотношений B) и C) исключить переменные А, В, С. Это делается сле- следующим образом. Поскольку пучок B) невырожден, соотношения C) мож- можно единственным образом разрешить относительно А, В, С. 606
В результате мы получим формулы вида А = апХ-\-aX2Y-\-al3Z, В = a2lX + a22Y + a23Z, С = a3lX + a,32Y + a33Z, где /«11 «12 «13Ч U = I «21 «22 «23 \ «31 «32 «33' — матрица, обратная к матрице D) ^22 ^32 Подставив эти выражения в уравнение B), мы получим урав- уравнение F(X,Y,Z) = 0, E) которому должны удовлетворять точки, являющиеся касатель- касательными. При этом ясно, что любая точка X: Y: Z, удовлетворяю- удовлетворяющая этому уравнению, является касательной к пучку B) в не- некоторой его прямой (а именно, в прямой (А: В: С), опреде- определяемой соотношениями D)). Поскольку уравнение E) является, очевидно, однородным уравнением второй степени, для завершения доказательства осталось лишь доказать, что линия E) невырождена, т. е. что невырождена матрица коэффициентов многочлена F(X,Y,Z). Мы докажем даже большее, а именно, что матрицей коэффициентов многочлена F(X, У, Z) является матрица U, обратная матрице V коэффициентов многочлена Ф(А,В,С). Это утверждение можно, конечно, проверить прямым вы- вычислением. Однако поскольку такого рода вычисление весьма длинно и утолительно, мы предпочтем обходной путь, исполь- использующий символику матричного исчисления. Введем в рассмотрение столбец х, составленный из коорди- координат X, Y, Z, и столбец а, составленный из координат А, В, С: Х\ ¦ (А Тогда соотношения C) мы можем записать в виде одного мат- матричного равенства x = Va, где, как и выше, V — матрица коэффициентов однородного мно- многочлена Ф. 607
Умножая это равенство слева на U = V~l, мы немедленно получим соотношения D),записанные в виде одного матричного равенства: а = Ux. F) Рассмотрим теперь матрицу По правилам матричного умножения это должна быть некото- некоторая 1 X 1-матрица, т. е. число. Произведя умножение, мы не- немедленно получим, что это число равно Ф(А, В, С). Таким об- образом, Ф(А, В, C) = aTVa. По определению, если мы выразим здесь столбец а через столбец х, т. е. положим а = Ux (см. формулу F)), то полу- получим многочлен F(X, Y,Z). Следовательно, F(X, Y, Z) = (Ux)t V (Ux) = xTU^VUx = x*Ux, поскольку, как известно из алгебры, с/т = (v~ly = {vyyl = v~l = u (матрица V — симметрическая, и потому VT = V). Так как однородный многочлен F{X, У, Z) второй степени единственным образом записывается в виде F(X, Y, Z) = xT(Jx. с симметрической матрицей U, то тем самым наше утвер- утверждение полностью доказано. Вместе с тем полностью доказано и предложение 1. Пусть теперь, обратно, F (X, Y, Z) = апХ2 + 2al2XY + a22Y2 + + 2a13XZ + 2a23YZ + a33Z2 = 0 G) — произвольная невырожденная линия второго порядка. В каж- каждой точке (X: Y: Z) этой линии существует единственная ка- касательная (А : В : С) с координатами А = апХ B = a2lX + a22Y + a23Z, (8) С = а31Х Определение 3. Множество всех этих касательных мы бу- будем называть пучком касательных к линии G). Предложение 2. Для произвольной невырожденной линии второго порядка пучок касательных является невырожденным пучком второго порядка. 608 .
Доказательство. Пусть, как и выше, х— столбец коор- координат X, У, Z, а а — столбец координат А, В, С. Тогда F(X, Y,Z) = xTUx и (см. формулы (8)) Поэтому при подстановке в многочлен F(X, У, Z) вместо X, У, Z их выражений через А, В, С, получающихся из соотно- соотношений (8), мы получим однородный многочлен второй степени Ф(А, В, С) = ат(С/~1)т i 1 матрицей коэффициентов которого является матрица U~l. Поскольку прямая (А : В : С) тогда и только тогда является касательной к линии G), когда Ф(А,В,С) = 0 (в одну сторону это следует из определения многочлена Ф(Л, В, С), а в другую — из того, что если Ф(А, В, С) = О, то числа X, У, Z, определенные уравнениями (8), удовлетворяют уравнению G) и имеет место равенство АХ 4* ВУ-f- CZ = 0), тем самым предложение 2 полностью доказано. На самом деле мы доказали даже большее, а именно, что соответствия «пучок» t—> «огибающая», «линия» *—> «пучок касательных» являются взаимно обратными биективными соответствиями между множеством всех невырожденных линий второго порядка и множеством всех невырожденных пучков второго порядка. Действительно, в силу полной симметричности полученных выше формул, пучок касательных к огибающей является исход- исходным пучком, а огибающая пучка касательных является исход- исходной линией. Таким образом, каждый невырожденный пучок второго порядка является пучком касательных к некоторой невырожденной линии вто- второго порядка, и обратно, каждая невырожденная линия второго порядка является огибающей некоторого невырожденного пучка второго по- порядка. Замечание 1. В п. 3 § 2 мы вывели формулу (см. п. 3 § 2, формула F)), выражающую необходимое и достаточное усло- условие того, что данная прямая касается данной линии второго порядка. С нашей теперешней точки зрения эта формула яв- является не чем иным, как уравнением пучка касательных. Таким образом, 20 М5 Ms Постников . 609
пучок касательных к линии второго порядка G) задается уравнением ап ап а1Ъ А а31 а32 А В = 0. (9) Сравнив это уравнение с полученным выше уравнением Ф(А, В, С) = 0, мы немедленно получаем тождество ап пи я13 А а21 0-22 0-23 В 031 O-Z2 «33 С А В С 0 (Ю) где k — некоторый (отличный от нуля) множитель. Задание. Проверьте тождество A0) прямым вычислением (и, в частно- частности, найдите множитель k). Ясно, что уравнение, аналогичное уравнению (9), имее,т место и для огибающих, т. е. огибающая к пучку второго порядка B) задается уравне- уравнением fisi X Ъ\2 fij3 X Y Z 0 = 0. Упражнение. Докажите это утверждение тем же методом, которым была доказана формула (8) п. 3 § 2. Установленные биективные соответствия между линиями и пучками второго порядка позволяют доказывать новые тео- теоремы о линиях второго порядка (или очень просто доказывать уже известные). Например (см. следствие 1 в п. 3 § 2), мы немедленно по- получаем, что через каждую точку (вещественно-комплексной) плоскости, не принадлежащую данной невырожденной линии второго по- порядка, проходит точно две различных касательных к этой линии. ' ч Действительно, так как пучок касательных является пучком второго порядка, то через каждую точку плоскости проходят две (возможно, совпадающие) касательные. Если эти каса- касательные совпадают, то рассматриваемая точка является, по определению, касательной к пучку, т. е. принадлежит его оги- 610
бающей. Для завершения доказательства остается заметить, что огибающей пучка касательных как раз и является данная линия. Аналогично, применив теорему, двойственную теореме Штурма, к пучкам касательных линий второго порядка, мы не- немедленно получим, что если три невырожденные линии второго порядка имеют две общие касательные, то три точки пересечения трех пар пря- прямых, являющихся касательными к двум из данных линий, ле- лежат на одной прямой. Эта теорема известна как теорема Штурма для ка- касательных. Чтобы сформулировать теорему, получающуюся подобным образом из теоремы Брианшона, мы для невырожденной линии второго порядка будем называть описанным вокруг нее шести- сторонником произвольную систему из шести ее касательных («сторон» шестисторонника). Считая эти касательные зануме- занумерованными в произвольном порядке, мы будем называть две его «вершины» (точки пересечения соседних сторон) противо- противоположными, если между ними расположена «свободная сто- сторона». Таким образом, если 1, 2, 3, 4, 5, 6 — это стороны, то противоположные вершины — это вершины 12 и 45 23 и 56 34 и 61. Прямые, соединяющие противоположные вершины, мы будем называть главными диагоналями описанного шестисторонника. В этой терминологии теорема, получающаяся применением теоремы Брианшона к пучку касательных, утверждает, что три главные диагонали произвольного шестисторонника, опи- описанного вокриг невырожденной линии второго порядка, пере- пересекаются в одной точке. Эта теорема обычно называется теоремой Брианшона для линий второго порядка. Подобно теореме Паскаля, теорема Брианшона обладает рядом «предельных случаев» (теоремы Брианшона для пяти- пятиугольника, для четырехсторонника и т. д.). Задание. Сформулируйте и докажите эти теоремы. Аналогично тому как теорема Паскаля позволила нам ука- указать построение любого числа точек линии второго порядка по ее пяти точкам, из теоремы Брианшона непосредственно вы- вытекает способ построения (одной только линейкой) любого чис- числа касательных к (невырожденной) линии второго порядка по ее пяти касательным. Задание. Сформулируйте этот способ и^ докажите его правильность. 20* * •- » ¦ 611
7. Фокусы линий второго порядка Вернемся к формуле (9) п. 6 (т. е. к формуле F) п. 2 § 2). При фиксированных а^ эта формула является уравнением пучка касательных к данной линии второго порядка. Однако ее можно читать и «наоборот», предполагая коэффициенты А, В, С фикси- фиксированными, а коэффициенты а.ц — переменными. Тогда она бу- будет уравнением совокупности линий второго порядка, касаю- касающихся данной прямой. Обратим внимание на то, что уравнение (9) п. 6 является (относительно ац) уравнением второй степени1), тогда как условие, что линия второго порядка проходит через данную точ- точку, линейно (см. п. 3). Это кажется странным, ибо условие, что линия второго порядка касается данной прямой, означает, что ее пучок касательных содержит данную прямую, а по сооб- соображениям двойственности условие, что квадратичный пучок прямых содержит данную прямую, линейно. Это кажущееся противоречие разрешается легко: коэффициенты уравнения пучка касательных квадратично выражаются через коэф- коэффициенты уравнения линии, и поэтому линейное условие на коэффициенты уравнения пучка оказывается квадратичным условием на коэффициенты уравнения линии. Можно сказать, что совокупность всех линий второго порядка, проходя- проходящих через данную точку, изображается в пятимерном пространстве коэффи- коэффициентов (см. п. 1) некоторой гиперплоскостью, а совокупность всех линий второгр порядка, касающихся данной прямой, изображается гиперповерхно- гиперповерхностью второго порядка. Поэтому, в то время как семейство всех линий второго порядка, прохо- проходящих через четыре фиксированные точки, изображается линией пересечения четырех гиперплоскостей, т. е. некоторой прямой (и потому является пуч- пучком), семейство всех линий второго порядка, касающихся четырех данных прямых, изображается линией пересечения четырех гиперповерхностей вто- второго порядка, и потому представляет собой весьма сложную кривую. По этой причине изучение семейств линий второго порядка, касающихся четырех фиксированных прямых, несравненно слож- сложнее изучения пучков. Поэтому мы их рассматривать не будем. Любопытно все же отметить, что одно такое семейство (правда, очень специального вида) выше мы уже изучали. Именно, оказывается, что рассмотренное в п. 4 § 2 гл. 5 семей- семейство софокусных эллипсов и гипербол может быть охарактеризо- охарактеризовано (на евклидовой вещественно-комплексной плоскости) как семейство линий второго порядка, касающихся четырех прямых. Чтобы показать это, мы напомним (см. пп. 1—3 § 1 гл. 5), что фокусом невырожденной линии второго порядка (эллипса, гиперболы или параболы) является точка, обладающая тем свой- свойством, что для любой тачки линии отношение ее расстояния до *) На первый взгляд даже третьей! Однако, ввиду нудя в правом ниж- нижнем углу определителя, члены третьей степени (по вц) В его. разложении отсутствуют. 612
этой точки к ее расстоянию до некоторой фиксированной пря- прямой (директрисы) постоянно (равно эксцентриситету е линии). Если в некоторой системе прямоугольных координат фокус имеет координаты (хо,уо), а директриса —уравнение Ах+Ву + С = 0, A) то это характеристическое свойство фокуса может быть запи- записано в виде соотношения V{x- xaf+{y- yof= V^-W2\ Ax + By + С\. Предполагая, что уравнение директрисы A) нормировано так, что мы (после возведения в квадрат) можем это уравнение перепи- переписать в следующем виде: (х - хоJ + (у- УоJ = (Ах + Ву + СJ.. B) Поскольку это уравнение является алгебраическим эквива- эквивалентом описания линии второго порядка как геометрического места точек, отношение расстояния которых до точки (х0, у0) к расстоянию до прямой A) равно е, мы видим, что уравнение B) является уравнением невырожденной линии второго порядка с фокусом в точке (хо,уо) и директрисой A), причем любое уравнение такого вида (для которого прямая A) не проходит через точку (х0, уй)) является уравнением невырожденной линии второго порядка с фокусом в точке (хо,уо), директрисой A) и эксцентриситетом е = У А2 + В2. Задание. Покажите, что если прямая A) проходит через точку (лго, уо), то линия B) является парой прямых, проходящих через точку (хо, (/о). Уравнение B) показывает, что выражаемая этим уравнением линия принадлежит пучку линий второго порядка, определенно- определенному, окружностью нулевого радиуса (х-^ + (у-у^^0 C) и двойной прямой (Ах + Ву + СJ = 0. D) Фундаментальными-точками этого пучка являются точки пере- пересечения (имеющие, очевидно, кратность 2) окружности C) и двойной прямой D). (Таким образом, рассматриваемый пучок имеет тип [22].) Но тогда, согласно общей теории пучков линий второго по- порядка, каждая линия пучка (и, в частности, данная линия B)) будет иметь эти точки двойными точками пересечения с окруж- йостью. C). Поскольку тот факт, что точка пересечения — двой- 613
ная, равносилен, по определению, тому, что линии в этой точке касаются (имеют общую касательную), тем самым доказано, что если точка (х0, г/о) является фокусом линии второго порядка, то окружность нулевого радиуса с центром в этой точке касает- касается линии в двух точках. 'Задание. Могут ли эти точки касания совпадать? Обратно, если окружность нулевого радиуса с центром в точке {хо,уо) касается в двух точках некоторой невырожденной линии второ- второго порядка, то точка (х0, г/о) является фокусом этой линии. Действительно, пусть F = 0 • E) — уравнение данной линии. По условию пучок линий второго порядка, определенный линией E) и окружностью C), имеет две двойные фундаментальные точки. Поэтому- содержащаяся в нем вырожденная линия второго порядка является двойной прямой, проходящей через эти точки. Следовательно, уравне- уравнение E) является линейной комбинацией уравнения окружности C) и уравнения некоторой линии вида D). Пользуясь тем, что уравнения E) и D) нам заданы только с точностью до пропор- пропорциональности (а также учитывая, что по условию линия E) не- . вырождена), мы, следовательно, без ограничения общности мо- можем считать, что F = (x- х0J + (у- у0J - (Ах +Ву + СJ, т. е. что уравнение линии имеет вид B). Поэтому точка (х0, г/0) является фокусом (а прямая Ах + By + С = 0 — директрисой). Таким образом, фокус невырожденной линии второго порядка мы можем определить как точку, обладающую тем свойст- свойством, что окружность нулевого радиуса с центром в этой точке ка- касается кривой в двух точках. При этом прямая, проходящая че- через точки касания, является соответствующей директрисой. Но мы знаем (см. п. 6 § 3 гл. 4), что окружность нулевого радиуса является парой изотропных прямых, проходящих че- через ее- центр. С другой стороны, если пара прямых касается линии второго порядка в двух точках, то это значит, что каж- каждая из этих прямых касается-линии (в соответствующей точке). Все эти соображения мотивируют следующее общее Определение 1. Точка вещественно-комплексной (евклидовой или евклидово-проективной) плоскости называется фокусом ли- линии второго порядка, если проходящие через эту точку изотроп- изотропные прямые касаются этой линии (вообще говоря, в точках, от- отличных от фокуса). В частности, мы видим, что изотропные прямые, проходящие через центр произвольной окружности, касаются этой окружности в циклических точках. 614 *
Как мы знаем, через любую точку плоскости (не принадле- принадлежащую данной линии второго порядка) проходят две касатель- касательные к этой линии. В частности, это верно для циклических точек. Определение 2. Касательные, проходящие через циклические точки, называются изотропными касательными. ' Вообще говоря, линия второго порядка имеет четыре изот- изотропные касательные (по две для каждой циклической точки). Если же линия проходит через циклические точки, то число ее изотропных касательных соответственно уменьшается. Напри- Например, окружность имеет только две изотропные касательные (пе- (пересекающиеся в ее центре). Пользуясь понятием изотропной касательной, мы можем сказать, что фокус линии второго порядка является точкой пересечения изотропных касательных этой линии. Следовательно, линия второго порядка имеет, вообще говоря, четыре фо- фокуса.' Действительно, две пары изотропных касательных пересе- пересекаются, вообще говоря, в четырех точках. Если линия второго порядка вещественна, то ее изотропные касательные попарно комплексно-сопряжены и потому пересе- пересекаются в двух вещественных и двух мнимых (комплексно-сопря- (комплексно-сопряженных) точках. Таким образом, вещественная линия второго порядка имеет, вообще говоря, два вещественных и два комплексно-сопряженных фокуса. Найдем, например, фокусы эллипса iLa.jL- аг + Ь2 Пучок его касательных имеет уравнение = 0, а2 0 0 А 0 Т2 0 в 0 0 —1 с А В с 0 т. е. уравнение а2А2 + Ь2В2 = С2. Чтобы найти прямые этого пучка, проходящие через циклическую точку A : i: 0),_надо решить это уравнение совместно с уравнением Сделав это, мы получим, что А + iB = 0. В = 1А, где, как всегда, с = \' а2 г- Ьг. 615
Следовательно, изотропные касательные эллипса, проходящие через цик- циклическую точку A : i: 0), имеют уравнения х + iy ± с = 0. Аналогично показывается, что изотропными касательными эллипса, проходя- проходящими через циклическую точку A : —i: 0), являются прямые х — iу ± с = 0. Из четырех точек попарного пересечения этих четырех прямых имеем две вещественные: (-с, 0), (с, 0) (это-—известные из элементарной теории фокусы эллипса) и две мнимые: @, - ic), @, ic) (эти фокусы в элементарной теории не рассматриваются). Аналогично находятся фокусы гиперболы и параболы. В частности, мнимыми фокусами любой параболы являются циклические точки, а из вещественных фокусов один является известным элементарным фокусом (р/2,0), а другой — несобственной точкой ее оси. Для окружности имеется один («четырехкратный») фокус — ее центр. Теперь мы видим, что семейство всех (вещественных) линий второго порядка, ка- касающихся четырех (попарно комплексно-сопряженных) изо- изотропных прямых, является не чем иным, как семейством софо- кусных эллипсов и гипербол. Понятие фокуса (и директрисы) имеет красивую интерпре- интерпретацию и в терминах теории поляр. Например, легко понять, что директриса является полярой (одноименного) фокуса. Упражнение. Докажите это утверждение. Назовем две прямые взаимно полярными (по отношению к данной невырожденной линии второго порядка), если каждая из них проходит через полюс другой прямой (см. предложение 1 п. 3 § 2). Оказывается, что точка (проективно-евклидовой вещественно-комплексной или вещественной плоскости) тогда и только тогда является фоку- фокусом невырожденной линии второго порядка, когда любые две взаимно полярные прямые, проходящие через эту точку, пер- перпендикулярны. Упражнение. Докажите это утверждение. Заметим, что это утверждение дает, в частности, проективно- евклидову интерпретацию фокуса на вещественной плос- плоскости (без выхода в комплексную область). Упражнение. Докажите директориальное свойство эллипса, гиперболы и параболы (предложение 2 п. 1 § 1 гл. 5, предложение 3 п. 2 § 1 гл. 5 и предложение 3 п. 3 § 1 гл. 5), основываясь на материале этого пункта.
Глава 7 ГЕОМЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ § I. АФФИННЫЕ, ПРОЕКТИВНЫЕ И ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 1. Аффинные преобразования Основным понятием аффинной геометрии является, конечно, понятие пря- прямой. Поэтому естественно возникает вопрос о наиболее общих преобразо- преобразованиях (вещественной) аффинной плоскости или (вещественного) аффин- аффинного пространства, переводящих прямые в прямые. Такого рода преобразо- преобразования будут в этой главе изучены в рамках элементарного содержательного понимания геометрии. Уточнения аксиоматического плана предоставляются инициативе читателя. Определение 1. Преобразование (биективное отображение на себя; см. п. 1 § 7 гл. 1) аффинной плоскости или аффинного пространства называется аффинным, если любые три коллине- арные точки оно переводит в три коллинеарные точки («сохра- («сохраняет отношение коллинеарности»). Замечание 1. Для «плоскостного случая» можно рассматри- рассматривать также биективные отображения одной плоскости на дру- другую, сохраняющие отношение коллинеарности точек. Такие ото- отображения называются аффинными отображениями. Читателю предлагается самостоятельно продумать, что из доказываемых ниже утверждений об аффинных преобразованиях сохраняется для аффинных отображений (и в какой форме). Как и для произвольного преобразования, для любого аф- аффинного преобразования Ф существует обратное преобразова- преобразование Ф. Оказывается, что преобразование Ф~\ обратное к аффинному преобразова- преобразованию Ф, также является аффинным преобразованием. Рассуждая «от противного», предположим, что существует коллинеарная тройка точек Ми М'ч, М'3, которую преобразова- преобразование Ф переводит в неколлинеарную тройку точек Мь М2, М3. Пусть а' — прямая М1М2М3, Р — плоскость М1М2М3, а <х12, <х13 и «23 —прямые Af[M2, MiM3 и М2М3 соответственно. По условию 617
все три прямые <х12, <х13 и агз попарно различны (и не проходят через одну точку). Пусть М — произвольная точка прямой а12 и пусть М' — ее образ при преобразовании Ф. Поскольку тройка Мь М2, М кол- линеарна, тройка М{, М2, М' также коллинеарна, т. е. точка Мг принадлежит прямой а' = М'\МГ2. Таким образом, всю прямую а12 преобразование Ф переводит в прямую а'. Аналогично доказы- доказывается, что преобразование Ф переводит в прямую а' также и прямые <х13 и а23. Пусть теперь М—произвольная точка плоскости Р, отличная от точек прямых а12, а13 и а23. Проведем через эту точку произ- произвольную прямую, пересекающую, скажем, прямые а12 и а1з в двух различных точках N2 и N3. По только что доказанному, образы N2 и iV3 точек N2 и iV3 при преобразовании Ф принад- принадлежат прямой а'. С другой стороны, так как точки N2, N3, М по построению коллинеарны, то точки N2, N'3, M' также кол- линеарны. Следовательно, точка М' — Ф(М) принадлежит пря- прямой а'= N'iN's- Этим доказано, что преобразование Ф всю пло- плоскость Р отображает в прямую а'". В «плоскостном случае» (Ф является преобразованием плоскости) мы тем самым уже пришли к противоречию (всю плоскость преобразование Ф отображает в ее часть — пря- прямую а', что в силу условия биективности преобразования не- невозможно). В «пространственном случае» (Ф является преобразова- преобразованием пространства) нам следует сделать еще один шаг. Пусть Мо— произвольная точка пространства, не принадлежащая плоскости Р. Рассмотрим плоскость Р\ содержащую прямую а' и образ М'о точки Мо при преобразовании Ф (если точка М'о не принадлежит прямой а', эта плоскость однозначно опреде- определена; в противном случае мы за нее принимаем произвольную плоскость, проходящую через прямую а').( . Пусть М — произвольная точка пространства, отличная от точки Мо-Рассмотрим сначала случай, когда прямая М0М пере- пересекает плоскость Р. Пусть N — соответствующая точка пересече- пересечения. Поскольку точки Мо, М, N коллинеарны, их образы М'о, М', N' также коллинеарны. Но, по построению, точки Мо и N' принадлежат плоскости Р'. Поэтому точка М' также принадлежит этой плоскости. Пусть, наконец, прямая МоМ параллельна плоскости Р, т. е. пусть точка М принадлежит плоскости Ро, проходящей через точку Мо параллельно плоскости Р. Проведем через точку М произвольную прямую, не лежащую в плоскости Ро, и выберем на ней две точки Nit N2, отличные от точки- М. (и потому не принадлежащие плоскости Ро). По уже доказанному образы N[ и N2 точек Ny и Af2 принадлежат плоскости Р'. Следова- Следовательно, поскольку точки Ni, N2, М, а значит, и точки N\, 'N'2, Мг коллинеарны, точка М' также принадлежит плоскости Р'. 618 " ¦' - '
Таким образом, преобразование Ф ¦переводит все простран- пространство в плоскость Р', что невозможно. Следовательно, преобра- преобразование Ф не может не быть аффинным. Ясно, что композиция -двух аффинных преобразований так* же является аффинным преобразованием. Поэтому (см. п. 1 § 7 гл. 1) справедливо следующее Предложение 1. Совокупность всех аффинных преобразова- преобразований плоскости или пространства является группой преобразо- преобразований. Эту группу мы будем обозначать символом AffB) в случае плоскости и символом Aff C) —в случае пространства. Докажем теперь несколько простейших свойств аффинных преобразований. Пусть Ф — произвольное аффинное преобразование (плос- (плоскости или пространства) и пусть а — произвольная прямая. 'Вы- 'Выбрав на прямой а две точки Mi и М2, рассмотрим прямую а', проходящую через точки М\ и Ms, являющиеся образами точек Mi и М2 при преобразовании Ф. Ясно, что прямая а' содержит образ М' любой точки М прямой а (и потому, в частности, не зависит от выбора точек Mi и М2). Определение 2. Мы будем говорить, что прямая а' соответ- соответствует прямой а в аффинном преобразовании Ф. Свойство 1. Аффинное преобразование Ф каждую прямую а отображает на соответствующую прямую а'. Доказательство. В обратном преобразовании Ф~* пря- прямой а' соответствует, очевидно, прямая а (ибо точки- М\ и М'2 преобразование Ф~* переводит в точки Mi и М2). Это означает, что, каждая точка М' прямой а' преобразованием Ф перево- переводится в некоторую точку М прямой а (напомним, что преобра- преобразование Ф аффинно). Поскольку М' = Ф(М), то, следова- следовательно, образом прямой а при преобразовании Ф является вся прямая а'. Предположим теперь, что Ф является аффинным преобра- преобразованием пространств а, и рассмотрим произвольную плос- плоскость Р. Выбрав на этой плоскости три неколлинеарные точки Ми М2, М3, рассмотрим их образы М\, М'2, М'з при преобразова- преобразовании Ф. По доказанному выше точки М\, Ms, М'з не коллинеар- ны, и потому определяют единственную плоскость Р'. Пусть М—произвольная точка плоскости Р и пусть М' — ее образ при преобразовании Ф. Если точка М принадлежит пря- прямой М{М2, то точка Мг принадлежит прямой М\М2, а значит, и плоскости Р'. Аналогично доказывается, что точка М' при- принадлежит плоскости Р' и тогда, когда точка М расположена на прямых MiM3 и М2М3. Пусть точка М не принадлежит ни одной из прямых МХМЪ МуМз, М2М3. Проведем через эту точку произвольную прямую, ¦пересекающую, скажем, прямые МхМ2 и МХМ3. Пусть N2 и 619
Ыъ — соответствующие точки пересечения. По уже доказанному, образы Щ и Л/з этих точек принадлежат плоскости Р'. Поэтому точка М', будучи коллинеарной с точками N'2 и Щ, также принадлежит плоскости Р'. Таким образом, мы доказали, что плоскость Р' содержит образ М' произвольной точки М плос- плоскости Р. Это показывает, в частности, что плоскость Р' зависит толь- только от плоскости Р и преобразования Ф (но не зависит от вы- выбора точек Mi, Мг, Мз). Определение 2'. О плоскости Р' мы будем говорить, что она соответствует плоскости Р в аффинном преобразовании Ф. Свойство 1'. Аффинное преобразование Ф каждую плоскость Р, отображает на соответствующую плоскость Р'. Доказательство по существу дословно совпадает с доказа- доказательством свойства 1, и потому мы его опустим. Задание. Докажите свойство 1'. Замечание 2. Определим отображение Фр плоскости Р на плоскость Р', считая, что каждую точку М оно переводит в ту же точку М\ что и-исходное преобразование Ф. (Таким образом, отображения Ф и Фр действуют на точках одинаковым обра- образом; их различие состоит только в том, что отображение Фр определено лишь для точек М плоскости Р, а соответствующие точки М' считаются точками плоскости Р'). Свойство Г ут- утверждает, что отображение Фр является биективным отобра- отображением плоскости Р на плоскость Р'. Кроме того, это отобра- отображение сохраняет, очевидно, отношение коллинеарности точек (плоскости Р). Таким образом, отображение Фр является аффинным отображением плос- плоскости Р на плоскость Р'. Определение 3. Мы будем говорить, что отображение Фр индуцировано преобразованием Ф. Согласно сказанному выше каждое аффинное преобразова- преобразование Ф определяет некоторое биективное отображение (преобра- (преобразование) множества всех прямых (плоскости или пространства) на себя, а в «пространственном случае» — и множества всех плоскостей. Мы будем эти преобразования обозначать тем же самым символом Ф. Свойство 2. Преобразование Ф переводит параллельные пря- прямые в параллельные. Доказательство. Параллельные прямые — это непере- непересекающиеся прямые, расположенные в одной плоскости. По- Поскольку любое аффинное преобразование переводит прямые, расположенные в одной плоскости, в прямые, также располо- расположенные в одной плоскости (для аффинных преобразований плоскости это верно автоматически, а для аффинных преобразо- преобразований пространства вытекает из свойства 1'), для доказатель- доказательства свойства 2 достаточно поэтому доказать, что любое аф- 620
финное яреобразование Ф переводит непересекающиеся прямые а и р в прямые а' и р', также не пересекающиеся. Рассуждая «от противного», предположим, что прямые а' и Р' имеют общую точку М'. Пусть М = Ф (ЛГ). Поскольку (свойство 1) преобразование Ф отображает прямую а на пря- прямую а', точка М принадлежит прямой а. Но по тем же сооб- соображениям точка М принадлежит и прямой р. Таким образом, вопреки предположению, прямые аир пересекаются. Свойство 2'. Преобразование Ф переводит параллельные плоскости в параллельные. Задание. Докажите свойство 2'. Чтобы сформулировать следующее свойство аффинных, пре- преобразований, мы рассмотрим две различные точки Ми М2 и проходящую через них прямую а. Пусть k — отношение, в ко- котором некоторая точка М прямой а делит направленный отре- отрезок М\М2 (см. л. 3 § 1 гл. 2). При произвольном аффинном пре- преобразовании Ф коллинеарные точки Ми М2, М перейдут в кол- линеарные точки Mi, М'г, М', и потому будет определено отно- отношение k', в котором точка1 М' делит отрезок М\М'2. Свойство 3. Имеет место равенство т. е. аффинное преобразование сохраняет отношение, в котором данная точка делит данный отрезок. Поскольку внутренние точки отрезка MiM2 характеризуют- характеризуются условием 0 < k < оо, из этого свойства вытекает Следствие. Преобразование Ф каждую внутреннюю точку от- отрезка М\М2 переводит во внутреннюю точку отрезка М\М2. В отличие от первых двух свойств свойство 3 требует для своего доказательства довольно глубоких соображений. Мы до- докажем его в следующем пункте, связав аффинные преобразова- преобразования с линейными операторами. 2. Линейный оператор, индуцированный аффинным преобразованием Определение 1. Оператором (см. определение 1 п. 1 § 7 гл. 1), индуцированным аффинным преобразованием Ф, назы- называется оператор Ф, определенный формулой Ф (МШ2) = МШ'2, где М^ = Ф(М!) и М'2-~Ф{М2). Это определение нуждается, конечно, в проверке коррект- корректности, т. е. нужно доказать, что 621
если направленные отрезки М.ХМ.2 и NxNz эквиполлентны, то направленные отрезки Mi№ и NiNi также эквиполлентны. Если бы свойство 3 из п. 1 нами уже было доказано, дока- доказательство этого факта не составляло бы никакого труда. Дей- Действительно, по определению, отрезки MtM2 и N1N2 ?квиполлент- ны, если середина отрезка MiN2 совпадает с серединой отрезка M2Nu Поскольку в силу свойства 3 (примененного к случаю k = 7г) середина отрезка переходит при преобразовании Ф в середину отрезка, то середина отрезка МШг совпадает с сере- серединой отрезка МШ\ и потому направленные отрезки МШ'г и N[N'i эквиполлентны. Однако к доказательству свойства 3 мы по существу и стре- стремимся. Чтобы разорвать получающийся порочный круг, мы за- заметим, что в изложенном доказательстве свойство 3 использо- использовалось не в полном объеме, а лишь при k = х\2. Поэтому все будет в порядке, если мы этот частный случай свойства 3 не- независимо докажем. Таким образом, все свелось к доказательству того, что при любом аффинном преобразовании Ф (плоскости или пространства) середина С произвольного отрезка MiMz перехо- переходит в середину С отрезка М[М2. Мы сначала докажем это утверждение для случая, когда Ф является аффинным преобразованием плоскости. С этой целью мы проведем в рассматриваемой плоскости через точки Mi и М2 две различные пары параллельных прямых, отлич- отличных от прямой MiM2. Эти прятиые образуют параллелограмм с вершинами в точках Mi, M2 и еще в двух точках Л^ и N2. Согласно известному свойству диагоналей параллелограмма, прямые МХМ2 и N{N2 пересекаются в середине С отрезка М{М2. При аффинном . преобразовании Ф точки Ми М2, Nt и N2 перейдут в некоторые точки М'п М2, N'i, N2, причем согласно свойству 2 из п. 1 прямая M\N\ останется параллельно . прямой МШь а прямая MiN'i—прямой M'iN'u Другими словами, четырехугольник с вер- вершинами М[, Mr2, N'i, Щ по-прежнему останется параллелограм- параллелограммом. Следовательно, прямые М\М2 и N'\N'2 будут пересекаться в точке С, являющейся серединой отрезка М\М'2.^ < Но согласно свойству 1 из п. 1 пр*ямая M^l^ отображается на прямую МШь а прямая ЛЛА/а — на прямую NjN2. Следова- Следовательно, точка С пересечения этих прямых перейдет в точку С пересечения прямых М\М'2 и NiNi. Другими словами, середина отрезка МуМ^ перейдет в середину отрезка М\М'г. В случае, когда Ф представляет собой аффинное преобразо- преобразование пространства, достаточно рассмотреть произвольную 622 -
плоскость, содержащую точки Aft, M2, и применить уже дока- доказанное утверждение к аффинному отображению этой плоскости, индуцированному преобразованием Ф. Тем самым корректность определения 1 полностью доказана. Предложение 1. Оператор Ф, индуцированный аффинным преобразованием Ф, является линейным оператором. Доказательство. Свойство аддитивности означает, что для любых трех точек M]t M2, М3 имеет место ра- равенство М\М'г + МШ'з = МШз. Но это очевидно. Труднее доказывается свойство однородности Ф (kx) = kO x. A) В первую очередь мы заметим, что если х = О, то Фх = 0. Действительно, если х = ММ, то Фх = М'М'. Поэтому соотношение A) нам нужно доказать только при х ф 0 и k ф 0. Это соотношение при х Ф 0 означает, во-первых, что векторы Фх и Ф (kx) коллинеарны, а во-вторых, что отношение Ф (kx) '. Фх коллинеарных векторов Ф (kx) и Фд: равно k. Первое утверждение доказывается без труда. Действительно, пусть х = ОМ и kx = ON. Тогда Фх = оТм' и Ф (fex) = (ГЛГ. Поскольку векторы х и kx коллинеарны, точки О, М, N также коллинеарны. Но тогда коллинеарны и точки О', ЛГ, N', что и означает, что векторы Фх = О'ЛГ и Ф (kx) = О'МГ коллинеарны. Таким образом, нам нужно только доказать, что отношение векторов Ф (kx) и Фх равно k. Для этого Мы предварительно докажем, что отношение Ф (kx): Фх не зависит от вектора х, т. е. для любых двух векторов х Ф 0 и у ф 0 имеет место равенство Ф(kx): Фх =Ф (ky): Предположим сначала, что векторы х и у не коллинеарны. Пусть, как и выше, х = ОМ, kx и пусть y = O~Mlt ky = O~Ni. 623
По условию, прямые ОМ *= ON и ОМ{ = ON{ (пересекающиеся в точке О) различны. В этом случае тот факт, что отноше- отношение ky : у вектора ky к вектору у равно отношению kx : x век- вектора kx к вектору х, овначает, что прямые ММХ и NNX парал- параллельны. Но тогда (свойство 2 из п. 1) прямые М'М'\ и N'N[ также параллельны. Следовательно, отношение вектора Ф (ky) = = O'N1 к вектору Фу = О'М\ равно отношению вектора Ф (kx) = = (УЛГ к вектору Фх = О^М'. В случае, когда векторы х и у коллинеарны, мы введем в рассмотрение третий вспомогательный вектор г, им не кол- линеарный. Поскольку векторы х и г не коллинеарны, то по уже доказанному Ф (kx) : Фх = Ф (кг): Фг. Аналогично, Ф (ky) :ФУ*=Ф (кг): Фг. Следовательно, Ф (kx): Фд: = Ф (ky): Фу. Тем самым независимость отношения Ф(&х):Фя: от выбора вектора а: Ф 0 полностью доказана. Это отношение является, таким образом, некоторой функ- функцией только числа k: и наша задача состоит в том, чтобы доказать, что эта функ- функция тождественно равна k. Пусть е — произвольный отличный от нуля вектор. Так как для любых чисел k и / (k + I) e = ke + le, то в силу уже доказанного свойства аддитивности Ф ((к + /) е) = Ф (ke) + Ф Aе), и потому Ф ((k + /)е): Фе =Ф (ke): Фе + Ф Aе) : Фе, ( (( Далее, ф((Ы) e)=O(k (le)) = f (k)ФAе) = / (A)/(/) Ф (le), Наконец, поскольку аффинное преобразование Ф переводит равные векторы в равные, то 624
Таким образом, мы доказали, что функция f(k) обладает следующими тремя свойствами: /@ = 1. Любая числовая функция f(k), обладающая этими свойст- свойствами, называется автоморфизмом поля R вещественных чисел. Пользуясь этой терминологией, мы можем, следовательно, ска- сказать, что функция f(k) является автоморфизмом поля R. Функция f{h)*=k является, конечно, автоморфизмом. Этот автоморфизм называется тождественным. Для доказательства предложения 1 нам достаточно теперь доказать следующую лемму: Лемма Дарбу. Поле вещественных чисел не имеет автомор- автоморфизмов, отличных от тождественного. Доказательство. Пусть f — произвольный автомор- автоморфизм. Нам нужно доказать, что для любого числа xeR имеет место равенство /(*) = *. Мы это сделаем в семь этапов. 1°. Для любых чисел Х\, х2 имеет место равенство f(X2-Xl)=f(X2)-f(xl). Действительно, Xi + (х2 — Xi) = x2, и потому 2°. Если Xi<x2. то Действительно, / (х2) - f (*,) = / (х2 - х,) = 3°. /@) = 0. Действительно, 4°. f(-x) = -f(x). Действительно, /(_ ^)=/(О-дг)=/(О)-/(дг) = О-/(*)=-/(дс). 5°. / (х) = х, если х — целое. Согласно свойству 4° мы без ограничения общности можем предполагать, что целое число х положительно, т. е. является натуральным числом п. Тогда ... +f(l) = 1+ ••• +1 = п. «раз ' л раз «раз 625
6°. f(x) = x, если х рационально. Для рационального числа х существует такое натуральное п, что число пх—целое. По уже доказанному / (цх) = пх и / (п) = п, а по условию f(nx) = f{n)f{x). Следовательно, п >~ f(x) ~ п —х- 7°. /(х) = х для любого вещественного х. Действительно, пусть для некоторого х имеет место неравен- неравенство !{х)Ф х. Предположим для определенности, что x<f(x). Тогда существует такое рациональное число г, что X < Г < f (X). В частности, х < г, и потому согласно свойствам 2° и 6° f(x)<f(r) = r, что противоречит неравенству r<f(x). Следовательно, неравен- неравенство x<f(x) невозможно. Аналогично показывается, что невозможно и неравенство f(x)<x. Следовательно, f(x) = х для всех х. Тем самым лемма Дарбу, а вместе с ней и предложенае 1, полностью доказаны. Ясно, что соотношение A) в точности равносильно сформу- сформулированному в конце предыдущего пункта свойству 3 аффин- аффинных преобразований. Таким образом, это свойство мы также мо- можем считать доказанным. Замечание 1. Поскольку аффинное преобразование Ф биек- биективно, оператор Ф та,кже биективен. Другими словами (см. п. 4 § 7 гл. 1), оператор, индуцированный аффинным преобразова- преобразованием., обратим. В п. 3 § 3 гл. 2 мы подробно рассмотрели автоморфизмы аф- аффинной плоскости и показали, в частности, что они совпадают с преобразованиями по равенству координат в двух аффинных координатных системах (для понимания дальнейшего текста знакомство с § 3 гл. 2 необязательно; термин «автоморфизм» можно далее понимать просто как синоним термина «преобразо- «преобразование по равенству координат в двух аффинных координатных системах»). , Аналогичным образом можно, конечно, говорить об автомор- автоморфизмах аффинного пространства. Тот факт,' что понятие коллинеарности троек точек имеет смысл в аффинной геометрии, означает, что любой автоморфизм аффинной плоскости (аффинного про- пространства) является аффинным преобразованием. . Замечательно, что обратное тоже верно. 626
Теорема 1. Любое аффинное преобразование Ф аффинной {вещественной) плоскости {аффинного пространства) является ее автоморфизмом. Доказательство. Пусть Оех ... еп — произвольный аф- аффинный координатный репер (где, как всегда, п = 3 в случае пространства и п = 2 в случае плоскости) и пусть О' = Ф(О), е[ = Фер ..., < = Фе„. Поскольку оператор Ф обратим; векторы е\, ..., е'п со- составляют базис, т. е. мы имеем аффинный координатный репер Пусть М — произвольная точка и М'= Ф{М) — ее образ при преобразовании Ф. По определению, координаты х1, ..., хп точки М в репере Ое4... е„ определяются из разложения ОуИ =*'<?,+ ... +хпеп ее радиус-вектора СШ по векторам базиса еи ..., еп- Приме- Применив к обеим частям этого, соотношения оператор Ф и воспользо- воспользовавшись его линейностью, мы получим соотношение 6ГМ' = ххе[-\- ... +хпе'п, показывающее, что точка М имеет в репере О'е\ ... е'п ге же самые координаты xi, ..., хп. Следовательно,' преобразование Ф действительно является преобразованием по равенству аффинных координат, т. е. яв- является автоморфизмом. Теорема 1 объясняет, почему аффинная геометрия играет та- такую роль во всех вопросах, связанных с прямыми линиями: она является самой общей геометрией (на обычной плоскости), в которой еще имеет смысл понятие прямой линии. По аналогии, автоморфизмы аффинной прямой, а также аф- аффинной плоскости (аффинного пространства) над любым полем К также называются «аффинными преобразованиями». Подчеркнем, что в случае произвольного поля К так понимаемые аффин- аффинные преобразования уже не будут самыми общими преобразованиями, сохра- сохраняющими коллинеарность точек. Например, в случае поля С преобразование, переводящее каждую точку в точку, имеющую (в данной координатной си- системе) комплексно-сопряженные координаты, сохраняет, очевидно, отношение коллинеарности, но автоморфизмом (преобразованием по равенству аффин- аффинных- координат) не является. Суть дела здесь в том, что для произвольного поля лемма Дарбу н е- вер н а. Задание. Покажите, что преобразование (вещественной) прямой тогда и только тогда является аффинным преобразованием, когда оно сохраняет отношение, в котором данная точка делит данный отрезок. Поскольку преобразование по равенству координат вполне определено, когда известны реперы Ое{ . •. еп и О'е\ ... е'п, мы видим, что 627
аффинное преобразование однозначно определяется репером О'е\ ... е'п, в который оно переводит дачный репер Oet... еп. Другими словами, аффинные преобразования, одинаково преобразующие неко- некоторый репер, совпадают. При этом, поскольку для любых двух реперов Ов\ ... еп и О'е\ ... е'п существует (единственное) преобразование но ра- равенству координат, мы видим также, что для любых двух реперов Ое, ... еп и О'в\ ... е'п существует единственное аффинное преобразование, переводящее первый репер во второй. Вместо реперов Ов\... еп мы можем рассматривать соот- соответствующие системы точек общего положения, состоящие из п + 1 точек (см. определение 3 п. 4 § 4 гл. 1). Поэтому справед- справедливо следующее Предложение 2. Для любых двух троек точек плоскости об- общего положения (пар точек прямей и четверок точек простран- пространства) существует единственное аффинное преобразование, пере- переводящее первую тройку {пару или четверку) во вторую. Замечание 2. Не любую коллинеарную тройку точек плос- плоскости (компланарную четверку точек пространства) можно аф- аффинным преобразованием перевести в данную коллинеарную тройку (компланарную четверку). Когда это все же возможно, соответствующее аффинное преобразование не единственно. 3. Общий вид аффинных преобразований Предположим теперь, что нами выбрана и зафиксирована не- некоторая точка О («начало»). Тогда точкам М будут взаимно однозначно соответствовать их радиус-векторы х = ОМ, что по- позволит нам отождествлять точки и векторы. В силу этого отождествления каждое аффинное преобразова- преобразование Ф (прямой, плоскости или пространства) мы можем рас- рассматривать как преобразование соответствующих радиус-век- радиус-векторов. Иными словами, вместо того, чтобы рассматривать точ- точки М и М' = Ф(М), мы можем рассматривать векторы х = ОМ н~ х' = ОМ'. При этом последний вектор естественно обозначать также через Ф(х): ф (х) = ОМ'. Замечание 1. Обратим внимание на различие между векто- векторами Ф(дс) и Фх. Первый зависит от выбора точки О, а второй не зависит. По определению, = 67М', где ~О' = 628
Поэтому ф (х)^Фх + Ь, где Таким образом, мы видим, что аффинное преобразование Ф полностью известно (при вы- выбранной точке О), если известны линейный оператор Ф и век- вектор Ь. Обратно, пусть нам дан произвольный линейный оператор А и произвольный вектор Ь. Определим отображение Ф (пря- (прямой, плоскости или пространства) в себя формулой Ф(х) = Ах + Ь, B) где х — радиус-вектор произвольной точки относительно вы- выбранной точки О. В соответствии со сказанным выше эта формула означает, что отображение Ф точку М с радиус-вектором х — ОМ перево- переводит в точку М' с радиус-вектором ОМ' = Ах + Ъ. Легко видеть, что если точки с радиус-векторами xit x%, х3 коллинеарны, то точ- точки с радиус-векторами Ф(Х1), Ф{х2), Ф(#з) также коллинеарны. Задание. Докажите это утверждение. Таким образом, мы видим, что рассматриваемое отображе- отображение Ф сохраняет отношение коллинеарности точек. Однако утверждать, что отображение Ф будет аффинным преобразованием, было бы неосторожно, поскольку для этого нужно, чтобы оно было биективным. Очевидно, что отображение Ф обладает последним свойством (и, следовательно, является аффинным преобразованием) тогда и только тогда, когда линейный оператор А обратим. Заметим еще, что для аффинного преобразования Ф, опре- определенного формулой B), индуцированный линейный оператор Ф совпадает с исходным оператором Л, а вектор 00' совпадает с вектором Ь. Резюмируя все сказанное, мы получаем следующее Предложение 1. Выбор точки О определяет биективное со- соответствие между аффинными преобразованиями Ф и парами (А, Ь), состоящими из обратимого линейного оператора A it произвольного вектора Ь. Оператор А и вектор Ь, соответствую- соответствующие преобразованию Ф, определяются формулами 62».
Аффинное преобразование Ф, соответствующее паре {А, Ь), опре- определяется (Ьоамилой где х — радиус-вектор произвольной точки (относительно вы- выбранной точки О). Замечание 2. Иногда полезно рассматривать отображения Ф, задаваемые формулой B), и в случае, когда оператор не- необратим. Такие отображения называются вырожденными аф- аффинными преобразованиями. Замечание 3. В случае геометрии над произвольным полем К предложе- предложение 1 описывает лишь аффинные автоморфизмы. Предложение 1 по существу полностью сводит теорию аф- аффинных преобразований к теории линейных операторов. Напри- Например, вспомнив формулы B) п. 3 § 7 гл. 1, выражающие линей- линейный оператор в координатах, мы немедленно получаем, что в произвольной аффинной координатной системе Ох1. . . хп каждое аффинное преобразование Ф записывается в координа- координатах формулами вида D) где xi,.., хп — координаты произвольной точки М (т. е. коор- координаты ее радиус-вектора х = ОМ), у1, ..., уп — координаты преобразованной точки М' = Ф(М) (т. е. координаты радиус-. вектора Ф (х) = ОМ'), а\...а\ .«?••• «й — матрица обратимого линейного оператора Ф, индуцированно- индуцированного аффинным преобразованием Ф, Ь\ ... ,Ьп — координаты точ- точки О' = Ф(О) (т. е. координаты радиус-вектора Ь — 00'). Без ссылки на линейные операторы матрица А = может быть описана как матрица, столбцы которой состоят из координат точек Е\, ;.., Е'п, являющихся образами при пре- преобразовании Ф единичных точек ?1(..., ?я координатных осей (т. е. при я = 3 —точек ?i(l, 0,0), ?«@,1,0), ?3@,0,1); при п = 2 — точек ?i(l,0), ?2@, 1) и при п=\ — точки ?i(l)). •630
Обратно, любое неоднородное линейное преобразование = апх\ с невырожденной матрицей задает (в данной аффинной координатной системе) некоторое аффинное преобразование (D. Действительно, преобразование Ф можно записать в виде Ф(х) = Ах + Ь, где А—линейный оператор с матрицей А, а Ь — вектор с ко- координатами Ь\ ..., Ъп. Поэтому это преобразование аффинно. Замечание 4. Установленные результаты утверждают изо- изоморфизм группы аффинных преобразований Aff(n) с группой Aff(Rn) неоднородных линейных преобразований. Очевидно, что- это в точности изоморфизм рассмотренный в п. 3 § 3 гл. 2. Определение 1. Аффинное преобразование Ф называется сохраняющим ориентации, если индуцированный им линейный оператор Ф сохраняет ориентации (см. п. 6 § 7 гл. 1), т. е. если оно является преобразованием по равенству координат в двух одноименных координатных системах. Ясно, что совокупность Aff+(n) всех сохраняющих ориентации аффин- аффинных преобразований является подгруппой {даже нормальным делителем) группы Aff (n). Аналогично, совокупность Aff-(n) аффинных преобразований, обращаю- обращающих ориентации, является смежным классом группы Aff (л) no- подгруппе Aff+(n). Определение 2. Аффинное преобразование называется па- параллельным переносом, если оно индуцирует тождественный ли- линейный оператор Е. Согласно сказанному выше любой параллельный перенос Ф записывается (в радиус-векторах относительно некоторой точки О) формулой вида Ф() + Ь 63t
тде Ъ = 00'. Но, если точка М имеет радиус-вектор х, а точка М' = Ф(М)—радиус-вектор х + Ь, то вектор ЛШ' равен Ь. Следовательно, параллельный перенос Ф произвольную точку М переводит в такую точку М', что ММ'=Ь. Обратно, ясно, что если преобразование Ф таково, что для лю- любой точки М имеет место равенство ММ' = Ь, где Ь — некоторый фиксированный вектор, то это преобразова- преобразование является параллельным переносом. Таким образом, мы могли бы определить параллельный перенос как преобра- преобразование, обладающее этим свойством. С последним определением читатель, без сомнения, уже знаком из эле- элементарного курса геометрии. Ясно, что, сопоставив параллельному переносу Ф(лс) = = х + Ь вектор Ь, мы получим биективное соответствие между переносами и векторами из Vect(n). Более того, легко видеть,' что композиция Ф2°Ф1 двух параллельных переносов Ф1 и Ф2 также является параллельным переносом, причем, если пере- переносам Ф1 и Ф2 соответствуют векторы bi и Ъ2, то переносу ф2 о фу соответствует вектор bi + bz. Это означает, во-первых, - что совокупность Trans(л) всех параллельных переносов яв- является подгруппой группы Aff(n) (и даже подгруппы Aff+(n)), и, во-вторых, что соответствие «параллельный перенос» i—> «вектор 00'» определяет изоморфизм группы Trans (л) на линеал Vect(n), рассматриваемый как группа относительно операции сложения ¦векторов. В частности, мы видим, что группа Trans (п) — абелева, т. е. композиция любых двух ¦параллельных переносов Фу и Ф2 не зависит от их порядка: Ф, оф2 = ф2оф,. Замечание 5. Очевидно, что отображение является эпиморфизмом группы Aff(n) на группу Ор(п) (ото- (отображающим подгруппу Aff+(n) на подгруппу Ор+(я), а смеж- смежный класс Aff~(n) — на смежный класс Ор~(п)). «€32
Поскольку ядром этого эпиморфизма является, по определе- определению, группа Trans (и), мы видим, что группа Trans(n) является не только подгруппой, но даже нормальным делителем группы Aff(n) (а также группы- АЙ+(п)), причем имеют место изоморфизмы: Аи (n)/Trans (n) ~ Op (n), Aff+ (rt)/Trans (я) « Ор+ (п). 4. Проективные преобразования По аналогии с определением 1 п. 1 мы принимаем следую- щее Определение 1. Преобразование вещественной проективной плоскости (или вещественного проективного пространства) на- называется проективным, если каждую тройку коллинеарных то- точек оно переводит в тройку коллинеарных точек. Таким образом, различие между аффинными и проектив- проективными преобразованиями состоит формально только в том, что первые действуют на аффинной плоскости (аффинном про- пространстве), а вторые — на проективной плоскости (проективном пространстве). Точно так же, как и для аффинных преобразований, пока- показывается, что преобразование, обратное к проективному, проективно. Задание. Докажите это утверждение. Отсюда непосредственно вытекает, что совокупность всех проективных преобразований плоскости или пространства является группой. Эту группу мы будем обозначать символом Proj B) в случае плоскости и символом Proj C) в случае пространства. Пусть П — произвольное проективное преобразование про- проективной плоскости WI и пусть а — произвольная прямая плос- плоскости Ж. Эту прямую преобразование П отображает на некото- некоторую прямую а', а множество Ш\а точек плоскости Ш, не при- принадлежащих прямой а, — на множество Ш\а' точек, не при- принадлежащих прямой а'. Но мы знаем (п. 5 § 1 гл. 4), что при удалении из проективной плоскости некоторой прямой остается аффинная плоскость. Таким образом, проективное преобразова- преобразование П индуцирует некоторое отображение аффинной плоскости ЯЯ\сс на аффинную плоскость Ш\а'. Это отображение биек- биективно и сохраняет коллинеарность троек точек, т. е. является аффинным отображением. Тем самым доказано, что проективное преобразование П проективной плоскости Шг переводящее прямую а в прямую а', индуцирует некоторое аф- аффинное отображение ГГ аффинной плоскости Ш\а на аффин- аффинную плоскость Wl\a'. 633
Докажем теперь следующее Предложение 1. Соответствие ' A) является биективным соответствием между множеством всех проективных преобразований проективной плоскости Ш, пере- переводящих прямую а в прямую а', и множеством всех аффинных отображений аффинной плоскости Ш\а на аффинную плос- плоскость Ш\а'. Доказательство. Чтобы доказать инъективность соот- соответствия A), нужно доказать, что аффинное отображение П' однозначно определяет соответствующее проективное преобра- преобразование П. Но для точек М, не принадлежащих прямой а, это очевидно, ибо для таких точек по определению Поэтому вопрос может стоять только для точек М прямой а. Пусть М — произвольная такая точка. Проведем через эту точку произвольную прямую р, отличную от прямой а, и выбе- выберем на прямой р две точки Л/4 и Nz, отличные от точки М. Пря- Прямая р' плоскости Ш, в которую преобразование П переводит прямую р, однозначно характеризуется как прямая, проходящая через точки N'i = ll(Ni) и N2 = U(N2)- С другой стороны, по- поскольку точки jVi и N2 не принадлежат, очевидно, прямой а, то N\ = Ur(Ni), N'2 = Il'(N2). Следовательно, прямая р' однозначно определяется отображе-. нием IT, т. е. может быть полностью восстановлена, когда из- известно это отображение. Но точка М' = П(Л1) является, оче- очевидно, точкой пересечения прямых а' и р', и потому также од- однозначно определяется отображением ГГ. Таким образом, аф- аффинное отображение ГГ однозначно определяет проективное преобразование П, т. е. соответствие A) инъективно. Чтобы доказать его надъективность, мы «обратим» преды- предыдущее рассуждение. Именно для любого аффинного отображе- •ния Ф плоскости 2I \ а на плоскость Ж\а' мы для точек М, не принадлежащих прямой а, определим преобразование П фор- формулой П (М) = Ф (М), а для точек М, принадлежащих этой прямой, — следующим по- построением: выберем произвольную прямую р, проходящую через точку М, на этой прямой выберем две точки N\ и N2, отличные от точки М, рассмотрим прямую р', проходящую через точки N\ = (p(Ni), М == Ф (N2), и примем за точку ЛГ = П(М) точ- точку пересечения прямых а' и р/, 634
Конечно, здесь нужно проверить, во-первых, корректность,, т. е. независимость точки М' от выбора прямой р и точек Ni w N2, а во-вторых, — что получающееся отображение П является проективным преобразованием. Все эти проверки совершенно- автоматичны (хотя и несколько утомительны), и мы оставим >их читателю. Поскольку построенное проективное преобразование П: 97i —»- 27Z индуцирует, очевидно, данное аффинное отобра- отображение: П' = Ф, предложение 1 тем самым полностью доказано. Упражнение. Сформулируйте и докажите аналог предложения 1 для про- проективных преобразований пространства. Предложение 1 по существу сводит изучение проективных преобразований к изучению аффинных отображений. Напри- Например, мы знаем (теорема 1 п. 2), что любое аффинное преобразо- преобразование является преобразованием по равенству аффинных коор- координат- Ясно, что аналогичное утверждение имеет место и для аффинных отображений. Отсюда уже без особого труда выте- вытекает аналогичное утверждение и для проективных преобразова- преобразований: Предложение 2. Любое проективное преобразование яв- является преобразованием по равенству координат в двух проек- проективных координатых системах (т. е. является проективным автоморфизмом). Доказательство. Пусть проективное преобразование П проективной плоскости Ш переводит прямую а в прямую аЛ и потому индуцирует аффинное отображение П' аффинной плос- плоскости Т1\а на аффинную плоскость Ш\а'. Согласно сказан- сказанному выше отображение ГГ является отображением по равен- равенству некоторых аффинных координат. Пусть х, у — эти коорди- координаты на плоскости Ш\а, а х', у' — координаты на плоскости 992\а'. Рассмотрим соответствующие однородные аффинные ко- ординаты X : Y : Z и X': Y': Z'. Как первые, так и вторые ко- координаты являются проективными координатами на плоскости Ш. .Соответствующее преобразование по равенству координат (проективный автоморфизм) переводит прямую а (имеющую уравнение Z = 0) в прямую а' (имеющую уравнение Z' •¦= 0) и индуцирует, очевидно, аффинное отображение П' аффинной плоскости Ш\а на- аффинную плоскость Т1\а'. Поэтому этот проективный автоморфизм совпадает с данным проективным преобразованием П. Замечание 1. Подчеркнем, что предложение 2 (так же как и аналогичное утверждение для аффинных преобразований) спра- справедливо только для вещественной проективной плоскости. Для плоскостей над другими полями класс преобразований, со- сохраняющих коллинеарность троек точек, как правило, шире 635
класса проективных автоморфизмов. Тем не менее, и в случае произвольного поля К (а также в случае проективной прямой) принято употреблять термин «проективное преобразование» как синоним термина «проективный автоморфизм». Из предложения 2 немедленно вытекает, что любое проективное преобразование проективной плоскости в произвольной системе проективных координат X : Y: Z за- задается формулами вида pX' = a\X + a\Y + alZ, pY' = a\X + a22Y + a\Z, pZ' = а\Х + a32Y + a\Z, где a\ a\ a\ a2 n1 n1 Ul   //3 *>3 nZ "l U2 U3 и, обратно, любые формулы такого вида задают некоторое про- проективное преобразование. В этих формулах р — произвольный (отличный от нуля) множитель пропорциональности. В более «инвариантных» терминах это утверждение озна- означает, что соответствие где П: Ш-+Ш — произвольное проективное преобразование, а a: 5Й—>RP2— данная проективная координатная система, устанавливает изоморфизм группы ProjB) проективных преоб- преобразований на группу Proj(RP2) проективных автоморфизмов стандартной проективной плоскости RP2 (ср. замечание 4 п. 3). Предложение 3. Для любых двух четверок Ео, Еи Е2, Е3 и Е'о, Е'и Е'г, ?з точек общего положения проективной плоскости существует одно и только одно проективное преобразование, переводящее первую четверку во вторую. Доказательство этого предложения вполне аналогично до- доказательству соответствующего предложения для аффинных преобразований (см. предложение 2 п. 2): требуемым проектив- проективным преобразованием является преобразование по равенству проективных координат с реперами Ео, Ей Е%, Е3 и Ео, Е\ Bi Eey соответственно (см. предложение 1 п. 5 § 1 гл. 4). ' Задание. Сформулируйте и докажите аналог предложения 3 для проек- проективных преобразований пространства. Наглядное описание проективных преобразований плоскости можно получить, воспользовавшись проективной плоскостью Шо (см. п. 5 § 1 гл. 4), точками которой являются прямые про- 636
странства (аффинного), проходящие через фиксированную точ- точку О. Каждое аффинное преобразование Ф пространства, остав- оставляющее точку О на месте, переводит прямые в прямые и потому индуцирует некоторое преобразование Пф проективной плос- плоскости Tto, сохраняющее коллинеарность троек точек, т. е. яв- являющееся проективным преобразованием. Ясно, что соответ- соответствие является гомоморфизмом группы AffoC) всех аффинных пре- преобразований пространства, оставляющих на месте точку О, в группу Proj B) == Proj (Шо). Упражнение. Докажите, что отображение Ф|—5» Пф является эпиморфиз- эпиморфизмом, т. е. что любое проективное преобразование плоскости индуцируется некоторым аффинным преобразованием пространства, К числу аффинных преобразований из группы AffoC) принад- принадлежат гомотетии пространства с центром в точке О. Ясно, что эти гомотетии образуют подгруппу Нот0C) группы AffoC). Упражнение. Докажите, что ядром гомоморфизма Ф I—> Пф является группа Homo C). Следовательно, группа Proj B) изоморфна факторгруппе группы AffoC) по подгруппе Ното(З). Замечание 2. В частности, мы видим, что группа Homo C) является нор- нормальным делителем группы Aff о C). Выражаясь несколько вольно, мы можем, таким образом, сказать, что проективные преобразования проективной плос- плоскости являются не чем иным, как рассматриваемыми с точ- точностью до гомотетии аффинными преобразованиями аффинного пространства, оставляющими на месте данную точку. 5. Ортогональные преобразования Основным понятием евклидовой геометрии является поня- понятие расстояния. Естественно поэтому, что важную роль в ев- евклидовой геометрии должны играть преобразования, сохраняю- сохраняющие расстояния. Такие преобразования называются «ортого- «ортогональными». Дадим точное определение. Определение 1. Отображение Ф прямой, плоскости или про- пространства в себя называется ортогональным преобразованием, если для любых точек Мх и М2 длина | М{М21 отрезка Af,M2 равна длине | М\М'г | отрезка M\M%\ 637
Чтобы оправдать эту терминологию, следует, конечно, пока- показать, что ортогональные преобразования действительно яв- являются преобразованиями, т. е. биективными отображе- отображениями прямой, плоскости или пространства на себя. Инъективность ортогонального преобразования Ф очевидна: если М\ = М'г, то | М\щ | = о, и потому | М, Af21 = 0, т. е. Мх = М2. Чтобы показать, что Ф надъективно, нам понадобятся неко- некоторые предварительные рассмотрения. Пусть нам даны три различные точки Ми Мг и М3. Для упрощения формул положим г,=|М2М3|, гг = \МгМЛ г3 = | М,М2\. Лемма 1. Точки Mi, М2, М3 тогда и только тогда не колли- неарны, когда одновременно выполнены три неравенства гх<г2 + г3, г2 < /•, + г3, Г3<г{+ г2. Для коллинеарных (различных) точек Ми М2, М3 одно и толь- только одно из этих неравенств обращается в равенство. Именно, тогда и только тогда, когда точка Mi лежит между точками М2 и М3; тогда и только тогда, когда точка М2 лежит между точками М1 и М3; тогда и только тогда, когда точка М3 лежит между точками Mi и М2. Доказательство. Первое утверждение непосредственно вытекает из известной теоремы о сумме длин двух сторон тре- треугольника. Остальные утверждения очевидны. Эта лемма показывает, что коллинеарность или неколлинеарность тройки точек, а в случае коллинеарности — характер их взаимного расположения (какая точка находится между какими), полностью определяет- определяется взаимными расстояниями между этими точками. Но, по определению, ортогональное преобразование сохра- сохраняет расстояние между точками. Поэтому каждое ортогональное преобразование переводит неколли- неарные точки в неко л линеарные, а коллинеарные — в колли- неарные, причем в последнем случае характер взаимного рас- расположения точек не меняется. Более того, так как отношение k, в котором, скажем, точка Мг делит отрезок MiM3, определяется характером взаимного расположения этих точек и расстояниями между ними (расстоя- 638 " ..
ния определяют абсолютную величину отношения, а характер взаимного расположения — его знак), то каждое ортогональное преобразование сохраняет отношение, в котором точка делит отрезок, т. е., более распространенно, если точки М2 делит отрезок MiM3 в отношении k, то для любого ортогонального преобразования Ф точка Mi = Ф (М2) делит отрезок М[М'3, где МJ = Ф (Mi) и М3 = Ф (М3), в том же отношении k. <¦ Так как ортогональные преобразования сохраняют колли- коллинеарность точек, то для любых двух различных точек Mi и М2 ортогональное преобразование Ф отображает прямую MiM2 в прямую MiMi- Более того, на самом деле, преобразование Ф отображает прямую MiM2 на прямую М\М2. Действительно, пусть М' — произвольная точка прямой М\М'ч, и пусть k — отношение, в котором эта точка делит отрезок M'lM'i' Рассмотрим на прямой МХМ2 точку М, делящую отрезок МХМ2 в отношении k. По доказанному выше, ортогональное преобразование Ф переводит точку М в точку М", делящую отрезок М\М2 в том же отношении k. Но если две точки делят один и тот же отрезок в одном и том же отношении, то они совпадают. Следовательно, М" = ЛГ, так что любая точка пря- прямой М\М2 действительно является образом при преобразовании Ф некоторой точки прямой МгМ2- Теперь мы уже можем доказать, что каждое ортогональное преобразование Ф (прямой, плос- плоскости или пространства) надъективно. Для случая прямой это непосредственно вытекает из пре- предыдущего утверждения. v Рассмотрим случай плоскости. Пусть Mi, М2, М3 — три не- коллинеарные точки. По доказанному выше, преобразование Ф переводит эти точки в три неколлинеарные точки М\, М'ч, М'з и отображает прямые М{М2, М{М3, М2М3 на прямые M'iMf2, М[М3, М.'гМ3. Мы должны доказать, что для любой точки М' существует такая точка М, что М' = Ф(М). При этом без огра- ограничения общности мы можем предполагать, что точка М' не принадлежит прямым М\МГ2, М\М'3 и М'2М3. Проведем через точку М' произвольную прямую, пересекающую, скажем, пря- прямые М{МГ2 и М\М'з в некоторых точках А/г и N3. По доказан- доказанному выше, точки А/2 и Л^з являются образами некоторых то- точек N2. и N3 (лежащих соответственно на прямых МгМ2 и MiM3). Рассмотрим прямую Л^Л^. Как мы знаем, эта прямая отобра- отображается на прямую Л^А/з. Но точка М' принадлежит, по по- построению, прямой ЫШ'ъ- Поэтому на прямой N2N3 существует ' 639
такая точка М, что М' — Ф(М). Тем самым для случая пло- плоскости наше утверждение полностью доказало. Для случая пространства изложенное рассуждение показы- показывает, что ортогональное преобразование Ф отображает плое- кость, проходящую через три неколлинеарные точки Ми М2, М3, на плоскость, проходящую через точки М\, М2, М'3. Выбе- Выберем в пространстве две различные непараллельные плоскости Pi и Р2. Согласно только что сказанному, преобразование Ф отображает эти плоскости на некоторые плоскости Pi и Р?. Поскольку линия пересечения плоскостей Pi и Рг переходит при преобразовании Ф в линию пересечения плоскостей Р{ и Рг, последние плоскости не параллельны (и различны). Рас- Рассмотрим теперь в пространстве произвольную точку М'. Без ограничения общности мы можем считать, что эта точка не принадлежит плоскостям PJ и Рг\ так что через нее можно провести прямую, пересекающую эти плоскости в двух раз- различных точках N'i и Л/г. Пусть N\ и N2— точки, переходящие при преобразовании Ф в точки iVi и N'2 («а основании только что сказанного такие точки существуют). Как мы знаем, пре- преобразование Ф отображает прямую NXN2 на прямую N'iN'2. Следовательно, на прямой NiN2 найдется точка М, обладаю- обладающая тем свойством, что М'=**Ф(М). Тем самым наше утверж- утверждение доказано и в случае пространства. Тот факт, что ортогональное преобразование сохраняет кол- коллинеарность точек (и отношение, в котором точка делит отре- отрезок), означает теперь, что оно является аффинным преобразо- преобразованием (в том числе и в случае прямой). Таким образом, в качестве окончательного результата (покрывающего все дока- доказанные в этом пункте утверждения) мы получаем следующее Предложение 1. Любое ортогональное преобразование яв- является аффинным преобразованием. Это означает, что совокупность Ort(n) всех ортогональных преобразований прямой (п=\), плоскости (п = 2) или про- пространства (и = 3), являющаяся, очевидно, группой, представ- представляет собой подгруппу группы Aff(n). Будучи аффинным преобразованием, каждое ортогональное преобразование Ф индуцирует некоторый линейный оператор Ф. По определению, этот оператор переводит произвольный век- вектор х = МхМч в вектор Фд: = МШь где М[ = Ф (М\) и М'2 = Ф (М2), Но, по условию, ]М\М'2\ = \М1М2\, т. е. I Ф* | = |*|- Тем самым доказано (см. п. 7 §7 гл. 1), что для любого ортогонального преобразования Ф индуцированный линейный оператор Ф является изометричным оператором, 640
Легко видеть, что и обратно, аффинное преобразование Ф, индуцирующее изометричный линейный оператор Ф, является ортогональным преобразова- преобразованием. Действительно, как мы знаем, в радиус-вектора-х относитель- относительно некоторой точки О аффинное преобразование Ф записывается формулой где Ь — некоторый вектор. С другой стороны, для любых точек Мх{х{) « М2(х2) Поэтому, если линейный оператор Ф изометричен, то так что преобразование Ф ортогонально. На языке теории групп эти утверждения означают, что эпиморфизм Ф |—> ф группы Aff(n) на группу Ор(/г) ото- отображает подгруппу Ort(n) на подгруппу Iso(n). Отсюда и из известных свойств изометричных линейных опе- операторов (см. п. 7 § 7 гл. 1) немедленно вытекают следующие свойства ортогональных преобразований: Свойство 1. Каждое ортогональное преобразование Ф сохра- сохраняет не только длины, но и углы, т. е. для любых трех некол- линеарных точек О, А, В угол /_ОАВ равен углу JLO'A'B'. Замечание 1. Это свойство легко доказывается и непосред- непосредственно: поскольку преобразование Ф сохраняет длины, сто- стороны треугольника ОАВ равны соответствующим сторонам треугольника О'А'В', так что эти треугольники конгруэнтны и потому их соответственные углы равны. Свойство 2. Преобразование {прямой, плоскости или про- пространства) тогда и только тогда ортогонально, когда оно дей- действует по равенству координат в двух прямоугольных реперах (т. е. является евклидовым автоморфизмом; см. п. 2 § 3 гл. 2). В частности, это означает, что любое ортогональное преобразование переводит произволь- произвольный прямоугольный репер О1^2 ... in снова в прямоугольный репер 0% ...i'n и обратно, для любых двух прямоугольных реперов Oi\ ... in и O'i\ ... i'n существует (единственное) ортогональное преобразование, пере- переводящее первый репер во второй. Свойство 3. Аффинное%преобразование тогда и только тогда ортогонально, когда в некоторой (а потому и в любой) системе 21 Ms Ms Постников . 641
прямоугольных координат оно выражается формулами у1 =a[xl+ .... +abc'l + b1, 0 ?_+ ,+ где /«!•¦• < U? • • • ai — ортогональная матрица. Являясь аффинным преобразованием, каждое ортогональное преобразование либо сохраняет, либо обращает ориентации. Ясно, что совокупность Ort+(«) всех ортогональных преобразований, сохраняющих ориентации, является подгруппой (даже нормаль- нормальным делителем) группы. Ort(«), а совокупность* Ort-(n) всех ортогональных преобразований, обращающих ориентации, яв- является смежным классом группы, Ort(n) no подгруппе Ort+(«). Замечание 2. Обратим внимание на то, что группа Ort+(«) не является нормальным делителем группы Aff(«) (и даже группы Aff+(«)). Каждый параллельный перенос является, очевидно, ортого- ортогональным преобразованием, сохраняющим ориентации. Следова- Следовательно, группа Trans(n) является подгруппой группы Ort+(«). Более того, так как Trans (n) является ядром гомоморфизма, сопоставляющего каждому ортогональному преобразованию ин- дуцировая.ный линейный оператор, то группа Trans (n) является нормальным делителем группы Ort+(«) (и даже группы Ort(n)), причем: Ort+ («)/Trans (n) « Iso+ (n), Ort («)/Trans (n) ~ Iso (n). Определение 2. Ортогональные преобразования, сохраняю- сохраняющие ориентации (т. е. элементы группы Ort+(«)), мы будем на- называть также движениями. Обычно (например, в школьном курсе) движение (скажем, плоскости) определяют как результат непрерывного перемещения плоскости самой по себе. (Обратим внимание на различие между движениями и перемещениями: движение является результатом перемещения.) Поскольку при любом перемещении взаимные расстояния между точками не меняются и поскольку (в силу непрерывности перемещения) ориентация каждого репера при пере- перемещении остается той же самой, движение в этом смысле является движе- движением в смысле определения 2. Обратно, ясно, что, непрерывно двигая некоторый прямоугольный репер Oei ... еп, мы можем его совместить с любым другим одноименным с ним прямоугольным репером О ех ... е^ (Например, на плоскости, чтобы совме- совместить прямоугольный репер Ое&г с одноименным прямоугольным репером 642 - ¦ -
0'«\е'2, достаточно передвинуть точку О в точку О', а затем повернуть плоскость на угол между векторами «j и «j.) Следовательно, для любого сохраняющего ориентации ортогонального преобразования Ф существует дви- движение "Ч? (результат перемещения), переводящее данный репер Ое( ... еп в тот же репер, что и преобразование Ф. Но мы знаем, что для любых двух прямоугольных реперов существует только одно ортогональное преобразова- преобразование, переводящее первый репер во второй. Следовательно, Ф = Ч7. Таким образом, движения, как мы их определили, совпадают с движениями в элемен- элементарно-геометрическом смысле. Преимуществр нашего определения состоит в том, что оно не исполь- использует лежащих вне математики понятий механики. Определение 3. Движение, оставляющее на месте некоторую TO4KV О, называется вращением с центром О. Ясно, что композиция двух вращений с центром О также является вращением с центром О (ибо если Ф(О)=О и Цг (О) = О, то (Ф о V) (О) = О). Это означает, что совокупность Roto (и) всех вращений с данным центром О является подгруппой группы движений Ort+fn). В радиус-векторах относительно точки О каждое вращение Ф с центром О записывается формулой где, как всегда, Ф — изометричный линейный оператор, иаду- цирова«ный преобразованием Ф. Это показывает, что соответствие «вращение Ф»*-> «индуцированный оператор Ф» устанавливает изоморфизм группы Roto(«) на группу lso+(n).. Поскольку последняя группа изоморфна группе SO(n), мы видим также, что для любой точки О группа Roto(n) изоморфна группе SO (и). Заметим, что последний изоморфизм зависит от выбора ре- репера Оех ... е„. Элемент группы SO(n) (собственную ортогональную мат- матрицу), соответствующий данному вращению Ф, мы, допуская- определенную вольность речи, будем называть матрицей враще- вращения Ф в данном репере. Вольность здесь состоит в том, что эта матрица является на самом деле матрицей соответствующего изометричного оператора. Замечание 3. Подчеркнем, что (при п > 1) группы Roto(n) и Rote (я), соответствующие различным точкам О и О', различ- различны (хотя и изоморфны одной и той же группе Iso+(n)« SO(n))^ Предложение 2. Любое движение Ф (прямой, плоскости или пространства) единственным образом разлагается в компози- композицию некоторого вращения R (с заранее заданным центром О) и некоторого параллельного переноса Т. 21* 64*
Доказательство. В радиус-векторах относительно точки О движение Ф записывается формулой ф(х)=Фх-\-Ь и потому является композицией вращения R(x) = (tx и параллельного переноса Т(х) = х + Ь. Замечание 4. Обратим внимание на то, что в полученном разложении Ф = T°R порядок множителей существен: Тем не менее, движение Ф допускает также разложение вида Ф = R ° Г, где R — то же самое вращение, что и выше, а Т' — некоторый параллельный перенос (вообще говоря, отличный от переноса Т). Действительно, пусть Ъ' — такой вектор, что Тогда ф(х) = Ф(х-\-Ь'), и, следовательно* преобразование Ф является композицией па- параллельного переноса Т'(х) = х + Ь' и вращения R(x) — Фх. Упражнение. Докажите, что Ф = R' о Т, где Т — тот же параллельный перенос, что и выше, a R' — вращение с цен- центром О' = Ф(О), индуцирующее тот же изометричный оператор Ф, что и вращение R. § 2. РАЗЛОЖЕНИЕ АФФИННЫХ И ОРТОГОНАЛЬНЫХ ПРЕОБРАЗОВАНИЙ В КОМПОЗИЦИЮ БОЛЕЕ ПРОСТЫХ В этом параграфе аффинные преобразования будут изучаться средствами евклидовой геометрии. В соответствии с этим все координаты мы будем предполагать прямоугольными (ев- (евклидовыми). 1. Аффинные и ортогональные преобразования прямой Аффинные преобразования прямой устроены очень просто.* любое такое преобразование записывается в координатах фор- формулой у = ах + Ь, где а и Ь — произвольные числа, причем а ф 0. Это преобразование ортогонально тогда и только тогда, ког- когда \а\ = 1, т. е. когда а == ±1. €44 •
Простейшим неортогональным аффинным преобразованием прямой является преобразование, задаваемое формулой где k > 0. По аналогии со сжатиями плоскости к прямой (см. п. 2 § 1 гл. 5) и пространства к плоскости (см. п. 1 § 2 гл. 5), мы будем называть это преобразование сжатием прямой с ко- коэффициентом k к точке О. Оно, конечно, сохраняет ориентации (поскольку k > 0). Предложение 1. Любое аффинное преобразование прямой является композицией сжатия к фиксированной точке О и неко- некоторого ортогонального преобразования. Доказательство. Преобразование у — ах + b является композицией преобразования у = \а\х и преобразования у = ех + Ъ, где ( + 1, если а > 0 1—1, если а < 0. Замечание 1. Любое ортогональное преобразование прямой у=±х+Ь является либо параллельным переносом у = х + Ь, A) либо симметрией у = -х B) относительно точки О, либо композицией симметрии B) и па- параллельного переноса A).При этом, если преобразование, сохра- сохраняет ориентации (является движением, см. определение 2 п. 5 § 1), то оно непременно является параллельным переносом A) (так что Ort+(l) = Trans(l)I)- Следовательно, сохраняющее ориентации аффинное преобразование Ф пря- прямой единственным образом разлагается в композицию- некото- некоторого параллельного переноса Т и некоторого сжатия К к точ- точке О: Ф = К°Т, C) ') Это согласуется с предложением 2 п. 4 § 1, поскольку единственным вращением прямой является тождественное преобразование. 645
а аффинное преобразование Ф, обращающее ориентации, раз- разлагается (также единственным образом) в композицию некото- некоторого параллельного переноса Т, симметрии S относительно точ- точки О и некоторого сжатия К к точке О: G> = KoS°T. D) Конечно, в этих разложениях перенос Т и сжатие К могут оказаться и тождественными преобразованиями. Подчеркнем, что в разложениях C) и D) точка О предпо- предполагается фиксированной. Если ее не фиксировать, то будет спра- справедливо следующее (в некотором смысле более точное) Предложение 2. Любое аффинное преобразование прямой является либо параллельным переносом, либо сжатием к неко- некоторой (зависящей от преобразования) точке (если оно сохра- сохраняет ориентации), либо композицией сжатия к некоторой точке и симметрии относительно той же точки (если оно обращает ориентации). Доказательство. Преобразование у = ах -f Ь при аф \ оставляет на месте точку Ь х Поэтому в координате х' = х — х0 Ъ оно записывается формулой г/' = ах' и потому при а > 0 является сжатием к точке Хо, а лри й < 0 — композицией такого сжатия и симметрии Замечание 2. В частности, мы видим, что любое ортогональное преобразование прямой является либо параллельным переносом, либо симметрией относительно неко- некоторой точки. Для любой точки О симметрия So относительно этой точки составляет вместе с тождественным преобразованием Е группу второго порядка Symo(l) = {?, So}. Поэтому мы получаем, что группа Ort(l) является теоретико-множественным объедине- объединением группы Trans(l) (изоморфной группе вещественных чисел по сложению) и групп второго порядка Symo(l), отвечающих всевозможным точкам прямой. 646 •
Заметим, что любые две группы, объединением которых яв- является группа Ort(l), пересекаются лишь по тождественному преобразованию. Конечно, это еще не описывает полностью алгебраического строения группы Ort(l): нужно указать, что получается в ре- результате перемножения (компонирочзан'ия) элементов различ- различных групп, объединением которых является группа Ort(l). Задание. Покажите, что 1) композицией двух симметрии относительно точек Oi и Ог является параллельный перенос на вектор 2OiO2; 2) композицией симметрии, относительно точки О и параллельного пере- переноса на вектор Ь является симметрия относительно точки О', имеющей отно- относительно точки О радиус-вектор Ч2Ь; 3) композицией параллельного переноса на вектор Ь и симметрии отно- относительно точки О является симметрия относительно точки О',имеющей отно- относительно точки О радиус-вектор —'/г&- Таким образом, любое ортогональное преобразование прямой является либо симметрией, либо композицией двух симметрии. Наша ближайшая цель — перенести доказанные в этом пункте утверждения на случаи плоскости и пространства. 2. Разложение аффинных преобразований плоскости и пространства Предложение 1. Любое аффинное преобразование плоско- плоскости (пространства) является композицией некоторого ортого- ортогонального преобразования и двух (трех) сжатий к взаимно перпендикулярным прямым (плоскостям) . - Для доказательства этого предложения (аналогичного пред- предложению 1 п. 1) мы заметим, что поскольку аффинное преобра- преобразование переводит параллельные прямые в параллельные, оно индуцирует некоторое преобразование направлений (на плоско- плоскости или, соответственно, в пространстве). Определение /.Пусть Ф — произвольное аффинное преобра- преобразование плоскости. Пару перпендикулярных направлений на плоскости мы будем называть парой главных направлений аф- аффинного преобразования Ф, если преобразоваиие Ф переводит -эти направления снова в перпендикулярные направления. Ана- Аналогично, тройку перпендикулярных направлений в пространстве мы будем. называть тройкой главных направлений аффинного преобразования Ф,- пространства, если преобразование Ф пе- переводит эти направления снова в перпендикулярные на- направления. Если преобразование Ф ортогонально, то любая пара (трой- (тройка) перпендикулярных направлений является для него главной. 647
Теорема 1. Для любого аффинного преобразования Ф плос- плоскости (пространства) существует пара (тройка) главных на- направлений. Из этой теоремы предложение 1 вытекает уже без особого труда. Действительно, пусть, например, Ф — произвольное аф- аффинное преобразование плоскости. Выбрав прямоугольный ко- координатный репер Oexe<i, орты е\ и е2 которого имеют главные направления преобразования Ф, рассмотрим репер О'е\е'г, в ко- который это преобразование переводит репер Ое\е2. По условию, векторы е[ = Фв1 и е'2 = Фе2 ортогональны (и отличны от нуля). Поэтому, положив fl = k1efl, f2 = k2e'2, где k1= 1el, 2 22 1jr j \е\\ \е2\ мы получим прямоугольный координатный репер O'/i/г- Но, как мы знаем (см. п. 5 § 1), любые два прямоугольных репера можно перевести друг в друга некоторым ортогональ- ортогональным преобразованием. Пусть Ф' — ортогональное преобразова- преобразование, переводящее репер Оехе2 в репер O'f\f2. Пусть, далее, Ф" — аффинное преобразование, оставляющее точку О' на месте и переводящее векторы /ь /2 в векторы е[, е2. Это преобразование является, очевидно, композицией двух сжа- сжатий плоскости к взаимно перпендикулярным прямым (коорди- (координатным осям репера O'f\f2) с коэффициентами k\ и k2. В коор- координатах х, у с репером O'fif2 преобразование Ф" записывается формулами X = fZ[X, у' = k2y. Поскольку преобразование Ф' переводит репер Оехе2 в репер O'f\f2, а преобразование Ф" переводит репер O'f\f2 в репер О'е[е'2, то композиция Ф" о ф' переводит репер Оехе2 в репер О'е\е2. Но мы знаем, что аффинное преобразование однозначно определяется репером, в который оно переводит данный репер. Следовательно, поскольку преобразования Ф и Ф"° Ф' перево-, дят репер Ое{е2 в один и тот же репер О'е[е2, эти преобразова- преобразования совпадают. Задание. Докажите предложение 1 для случая пространства. Замечание 1. Обратим внимание на то, что предложение I не является полным аналогом предложения 1 п. 1, поскольку в предусмотренных им разложениях сначала делается ортогональ- 'ное преобразование, а затем сжатия, тогда как в предложении 1 п. 1 дело обстояло как раз наоборот. Задание. Докажите для случая прямой точный аналог предложения 1, а для случая плоскости и пространства — точный аналог предложения 1 п. 1« 648
Таким образом, нам осталось только доказать теорему 1. Доказательство теоремы 1. Рассмотрим сначала случай плоскости. Пусть 2 — произвольная окружность с центром в некоторой точке О. При преобразовании Ф точка О перейдет в некоторую точку О', а каждая точка М окружности 2 — в некоторую точку М'. Несмотря на то, что все отрезки ОМ имеют одну и ту же длину, длины отрезков О'М', вообще говоря, различны. Пусть Мо— та из точек М окружности 2, для которой длина отрезка О'М' имеет наименьшее значение, и пусть а — прямая ОМ0. Пусть, далее, р— прямая, проходящая через точку Мо перпен- перпендикулярно прямой а. Заметим, что все точки прямой р, отлич- отличные от точки Мо, лежат вне окружности 2. При преобразовании Ф прямая а переходит в прямую и'= О'М'о, a прямая р — в некоторую прямую р', проходящую через точку М'о. Для доказательства теоремы 1 достаточно, оче- очевидно, показать, что прямая р' перпендикулярна прямой а'. Пусть это не так, т. е. пусть прямая а' отлична от перпенди- перпендикуляра, опущенного из точки О' на прямую р'. Пусть N'—-осно- N'—-основание этого перпендикуляра и пусть А^ — точка, переходящая при преобразовании Ф в точку Л^. Точка Л^ принадлежит пря- прямой р « отлична от точки Мо. Поэтому точка Л^ лежит вне окружности 2 и, следовательно, прямая ON пересекает эту окружность в некоторой точке Ми являющейся внутренней точ- точкой отрезка ON. При аффинном преобразовании Ф отрезок ON переходит, как мы знаем, в отрезок ОТ, причем внутренние точки отрезка ON переходят во внутренние точки отрезка ОТ, В частности, точка М{ перейдет в некоторую точку Ml, яв- являющуюся внутренней точкой отрезка O'N'. Следовательно, дли- длина отрезка О'М'\ будет меньше длины отрезка O'N'. Но длина отрезка O'N' в свою очередь меньше длины отрезка О'М'о (пер- (перпендикуляр короче наклонной). Поэтому длина отрезка О'М1, меньше длины отрезка О'М'о. Таким образом, мы нашли на окружности 2 точку Ми для которой длина отрезка О'М'\ мень- меньше длины отрезка О'М'о, что противоречит выбору точки Мо. Следовательно, прямая а' перпендикулярна прямой р'. Рассмотрим теперь случай пространства. Пусть 2 — произвольная сфера и О— ее центр. Найдем на сфере 2 точку Мо, для которой длина отрезка О'М'о, где О' = Ф(О) и Мо — Ф(Мо), имеет наименьшее возможное зна- значение. Пусть а — прямая ОМ\ и пусть Р—плоскость, проходящая через точку М\ перпендикулярно прямой а. Заметим, что все точки плоскости Р, отличные от точки Мо, лежат вне сферы 2. 649
При преобразовании Ф прямая а переходит в прямую а' = = O'Mq, a плоскость Р — в некоторую плоскость Р'. Покажем, что плоскость Р' перпендикулярна прямой а'. Действительно, пусть это не так, т. е. пусть прямая а' от- отлична от перпендикуляра, опущенного из точки О' на плоскость Р'. Пусть N'— основание этого перпендикуляра и пусть /V — точка, переходящая при преобразовании Ф в точку N'. Точка /V принадлежит плоскости Р и отлична от точки Мо. Поэтому точка N лежит вне сферы 2 и, следовательно, прямая ON пересекает сферу 2 в некоторой точке М\, являющейся внутренней точкой отрезка ON. Но тогда точка М[ = Ф (МО будет внутренней точкой отрезка ОТ и потому длина отрезка О'М\ будет мень- меньше длины отрезка O'N', а, следовательно, и меньше длины от- отрезка О'М'о. Таким образом, мы нашли на сфере 2 точку М\, для которой длина отрезка О'М[ меньше длины отрезка О'Мо что невозможно. Следовательно, плоскость Р' перпендикулярна прямой а'. Рассмотрим теперь аффинное отображение Фр плоскости Р на плоскость Р', индуцированное аффинным преобразованием Ф. По уже доказанной теореме для аффинных преобразований плоскости (справедливой, очевидно, и для аффинных отображе- отображений одной плоскости на другую) на плоскости Р существуют две перпендикулярные прямые pi и Рг, переходящие при ото- отображении Фр (а значит, и при преобразовании Ф) в перпенди- перпендикулярные прямые Pj и Pg плоскости Р'. Ясно тогда, что три по- попарно перпендикулярные прямые a, Pi и Рг переходят при пре- преобразовании Ф в три попарно перпендикулярные прямые а', Pi и & ' Тем самым теорема 1 полностью доказана. Замечание 2. Внимательный читатель заметит в изложен- изложенном доказательстве существенный пробел: почему мы знаем, что точка Мо с минимальны» расстоянием I О'М'о I существует? Ин- Интуитивно существование такой точки очевидно. Для строгого доказательства мы должны воспользоваться известной из курса анализа теоремой В е й е р ш т р а с с а, утверждающей, что для любой непрерывной функции «а компактном (замкнутом и ограниченном) множестве точек плоскости (или пространства) существует точка, в- которой эта функция имеет наименьшее значение. В нашем случае этим компактным множеством яв- является окружность (сфера) 2, а непрерывной функцией — функ- функция f{M), сопоставляющая произвольной точке М окружности (сферы) 2 длину отрезка О'М'. (Тот факт, что эта функция не- непрерывна, проще всего усмотреть, заметив, что ввиду известных нам формул, выражающих в координатах аффинные преобразо- преобразования, квадрат функции f(M) является некоторым многочленом второй степени от координат точки М и потому непрерывен.) 650 '
Замечание 3. Для случая плоскости можно дать очень про- простое доказательство теоремы 1, не использующее теоремы Вейер- штрасса. Рассмотрим на плоскости произвольную окружность 2. Как мы знаем (см. п. 4 § 1 гл. 5), аффинное преобразование Ф пе- переводит эту окружность в некоторый эллипс 2'. При этом лю- любая пара сопряженных диаметров эллипса 2' является образом некоторой пары перпендикулярных диаметров окружности 2. Но (см. п. 5 § 2 гл. 5 или п. 8 § 1 гл. 6) любой эллипс обладает парой главных, т. е. сопряженных и перпендикулярных, диамет- диаметров. Соответствующие диаметры окружности 2 являются, таким образом, парой перпендикулярных прямых, переходящих при преобразовании Ф в пару перпендикулярных прямых. По опре- определению, направления этих прямых и будут главными направ- направлениями аффинного преобразования Ф. Обратим внимание на то, что главные направления эллипса 2/ отнюдь не являются главными направлениями аффинного преобразования Ф (они бу- будут главными направлениями обратного преобразования Ф~'). Замечание 4. Если аффинное преобразование Ф оставляет ¦на месте точку О, то соответствующее ортогональное преобразо- преобразование Ф' также оставляет на месте эту точку, и потому однознач- однозначно определяется индуцированным изометричным оператором Ф. Что же касается сжатий к двум (трем) взаимно перпендикуляр- перпендикулярным прямым (плоскостям), то их композиция Ф" индуцирует, очевидно, оператор, обладающий тем свойством, что в соответ- соответствующем ортонормированием базисе он выражается диагональ- диагональной матрицей с положительными диагональными элементами (и подобно преобразованию Ф' однозначно этим оператором опре- определяется). Линейный оператор, имеющий в некотором ортонормирован- ортонормированном базисе диагональную матрицу, называется ортогонально диагоналтируемым или симметрическим. (Последнее название объясняется тем, что, как показывается в курсе линейной ал- алгебры, линейный оператор тогда и только тогда симметричен, когда в произвольном ортонормированном базисе его матрица симметрична.) Симметрический оператор, обладающий (в неко- некотором ортонормированном базисе) диагональной матрицей с по- положительными диагональными элементами, называется положи- положительным. Сопоставляя все сказанное, мы немедленно получаем сле- следующее (очевидное при, п = 1) Предложение 2. Любой линейный обратимый оператор А разлагается в произведение некоторого изометричного опера- оператора U и некоторого положительного симметрического опера- оператора Р: A*=PU. 651
Это разложение операторов называется полярным разложе- разложением. В некоторых отношениях оно аналогично разложению z = reia произвольного комплексного числа z ф 0 в произведе- произведение его модуля r= \z\ (являющегося положительным числом) и комплексного числа eia, имеющего модуль, равный единице. Упражнение. Докажите, что операторы U и Р однозначно определяются оператором А. Упражнение. Докажите, что ^полярное разложение возможно и в случае, когда оператор А необратим. Будет ли оно в этом случае однозначно опре- определенным? 3. Разложение ортогональных преобразований плоскости Ортогональные преобразования прямой полностью описаны в замечаниях 1 и 2 п. 1. В этом и следующем пунктах мы полу- получим аналогичные результаты для ортогональных преобразова- преобразований соответственно плоскости и пространства. На плоскости любое вращение R^RotoB) задается (в не- некотором евклидовом репере Oiii2) собственной ортогональной матрицей, т. е. (см. п. 6 § 5 гл. 1) некоторой матрицей вида cosqp sinq>\ —smqp cosqp/ где —п < ф ^ я. Вообще говоря, угол ф зависит от выбора репера Oi\i2. Од- Однако легко видеть, что в одноименных реперах Oixi2 и Oi\i'2 угол ф — один и тот же. Действительно, мы знаем (см. предложение 3 п. 3 § 7 гл. 1), что оператор, имеющий в базисе iu i2 матрицу А, будет иметь в базисе i\, i2 матрицу С~ХАС, где С — матрица перехода от базиса *,, i2 к базису i\, i'2, т. е. в нашем случае — некоторая собственная ортогональная матрица. Но (см. п. 6 § 5 гл. 1) группа SO B) собственных ортогональных матриц второго порядка — абелева. Поэтому С~ АС = А. Следовательно, если плоскость ориентирована (и мы усло- условились выбирать репер Oi\i2 положительно ориентированным), то угол ф определен однозначно. Определение 1. Угол ф называется углом вращения R (на ориентированной плоскости). Говорят также, что R представ- представляет собой вращение на угол ф вокруг точки О. Это вполне согласуется с «наивно-наглядным» представлением о враще- вращении. Действительно, вращение R переводит, например, вектор н в вектор ii cos ф — »] sin ф, образующий с вектором «i как раз угол <р. 652
Для любого п имеют место изоморфизмы (см. п. 4 § 1 и п. 7§ 7 гл. 1) Roto(n)« Iso+(n)« SO (л). Но при п = 2 имеет место также изоморфизм SO B) » S\ где S1 — группа по умножению комплексных чисел z = ei(p, no модулю равных единице (см. п. 6 § 5 гл. 1). Композиция этих изоморфизмов дает изоморфизм Roto B) ~ S1. В этом изоморфизме вращению на угол qp отвечает число е^. Это полностью описывает алгебраическое строение группы Roto B). Точки плоскости можно характеризовать не прямоугольными координатами х, у, а одной комплексной координатой Операция умножения комплексного числа z = х -\- iy на число е"Р = cosqp + isinqp выражается формулой ei4>z = (х cos ф — у sin ф) + I (x sin ф + У cos ф). Это показывает, что, сопоставив точке М с комплексной коор- координатой z точку М' с комплексной координатой ejfz, мы- полу- получим вращение вокруг точки О (имеющей комплексную коорди- координату z = 0) на угол ф. Аналогично, сопоставив точке M(z) точку M'(z-fp), где $ = b\-\- ib2, мы получим, очевидно, параллельный перенос на вектор b(b\, b2). Это означает, что справедливо следующее предложение, пол- полностью описывающее алгебраическое строение группы Ort+B): Предложение 1. В комплексной координате произвольное движение плоскости однозначно записывается формулой вида где |?[=1. Обратно, любое такое преобразование является движением. Обратим внимание на то, что это описание группы Ort+B) полностью аналогично данному в замечании 1 п. 1 описанию группы Ort(l): единственное отличие состоит в том, что вместо вещественных чисел появляются числа комплексные. Замечание 1. Напомним (см. зам-ечание 3 п. 4 § 3 гл. 2), что хотя формула х' = ах + Ь, аф§, a, 6eR, 653
описывает все аффинные преобразования прямой, аналогичная формула для комплексных чисел не описывает всех аффинных преобразований плоскости. Совершенно иное описание группы Ort+B) (аналогичное описанию группы Ort(l), данному в замечании 2 п. 1) можно получить, введя в рассмотрение вращения с не заданным напе- наперед центром. Предложение 2. Каждое движение Ф лоскости, не являю- являющееся параллельным переносом, является вращением (вокруг некоторого, зависящего от Ф, центра). Доказательство. В радиус-векторах относительно произ- произвольной точки О движение Ф записывается формулой где Ъ — некоторый вектор, а Ф — сохраняющий ориентации ли- линейный изометричиый оператор, отличный по условию от тож- тождественного оператора Е. Чтобы доказать, что это движение яв- является вращением, мы должны показать, что хотя бы одна (на самом деле — только одна) точка плоскости оставляется этим движением на месте, т. е. обладает тем свойством, что ее ра- радиус-вектор Хо удовлетворяет соотношению Ф (х0) = хй. Поскольку х0 = Ех0, это соотношение можно переписать в сле- следующем виде: (Е-Ф)хо = Ь. Но мы знаем (лемма 1 п. 8 § 7 гл. 1), что при наложенных на оператор Ф условиях оператор Е—Ф обратим. Следовательно, рассматриваемое уравнение для х0 имеет единственное решение Доказанное предложение означает, что группа Orf+B) является теоретико-множественным объеди- объединением группы параллельных переносов Trans B) и всевозмож- всевозможных групп вращений Roto B), отвечающих произвольным точ- точкам О плоскости. ' Чтобы получить полное описание алгебраического строения группы Ort+B), это предложение необходимо дополнить ука- указанием, что получается в результате умножения (композиции) элементов различных групп, объединением которых является группа Ort+B). 654
Задание. Покажите, что: ^ If композицией произвольного вращения R (не являющегося тождествен- тождественным преобразованием Е) и параллельного переноса на вектор Ь является вращение, индуцирующее тот же изометричный оператор R, что и вращение R, но имеющее центр в точке, радиус-вектор которой относительно центра О вращения R равен (Е — #)"'&; 2) композицией параллельного переноса на вектор Ь и вращения R ф Е является вращение, индуцирующее оператор R, но имеющее центр в точке с радиус-вектором (Е — R)'iRb\ 3) композицией R2 ° Ri двух вращений Rt и Rz, имеющих центры со- соответственно в точках Oi и Ог, является при R2 = -Rf параллельный пере- перенос на вектор (Е-Ц2)Ъ = Ь- R2b, где 6 = О|О2, а при R2=^R^~l —вращение, индуцирующее оператор R2^i и имеющее центр в точке, радиус-вектор которой относительно центра О\ вращения Ri равен (E-RzR:)-1 (E-R%)b. Поскольку операторы вида Е — R2 обратимы, отсюда, в част- частности, вытекает следующее Предложение 3. Каждый элемент группы Ort+B) является либо вращением, либо композицией двух вращений. Рассмотрим теперь ортогональные преобразования плоско- плоскости, не сохраняющие ориентации. Простейшим таким преобразоваиием является симметрия относительно произвольной прямой а. В координатах х, у, осью абсцисс которых является прямая а, эта симметрия выражает- выражается формулами х' = лг, В комплексной координате z = x-\-iy эти формулы запи- записываются в виде одной формулы: z' = z. Замечание 2. Таким образом, симметрия плоскости не я в- ляегся. аффшшым преобразованием (автоморфизмом) комп- комплексной прямой (ср. замечание 3 п. 4 § 3 гл. 2). Предложение 4. Каждое обращающее ориентации ортого- ортогональное преобразование 4я плоскости является композицией некоторого движения Ф и симметрии S отноеительно произволь- произвольно выбранной (но фиксированной) прямой а. ^Доказательство. Преобразование 65S
является ортогональным преобразованием, сохраняющим ориен- ориентации, т. е. движением. С другой стороны, ? = S о Ф, ибо S = 5-1. Замечание 4. Вообще говоря, OoS =? S°W. Тем не менее, преобразование \F допускает и разложение Ч»- = ф'о5, где S — та же симметрия, что и выше, а Ф'— некоторое движе- движение (вообще говоря, отличное от движения Ф). Задание. Докажите это утверждение. Следствие 1. В комплексной координате г любое обращаю- обращающее ориентации ортогональное преобразование задается фор- формулой z' = 5z + p, где | ? | = 1, и обратно, любая такая формула задает ортого- ортогональное преобразование, обращающее ориентации. Следствие 1 является аналогом предложения 1. Чтобы по- получить соответствующий аналог предложения 2, нам понадо- понадобится следующее Определение 2. Композиция симметрии относительно пря- прямой а и параллельного переноса на вектор, параллельный этой прямой, называется скользящей симметрией с осью а. Заметим, что согласно этому определению, любая (простая) симметрия является скользящей симметрией. Предложение 5. Каждое обращающее ориентации ортого- ортогональное преобразование W плоскости является скользящей сим- симметрией. Доказательство. Согласно следствию из леммы 1 п. 8 § 7 гл. 1 существует система прямоугольных координат Оху, в которой преобразование 4я записывается формулами Поэтому это преобразование является композицией-параллель- композицией-параллельного переноса ' + Ь на вектор FЬ 0), параллельный оси Ох, и преобразования X === X, €56
являющегося, как нетрудно видеть, симметрией относительно прямой у = -у-. (Действительно, в координатах Х[ =Х, это преобразование записывается формулами х\ = х, у\ = — у Л. Сопоставляя предложения 2 и 5, мы получаем следующее Предложение 6, Каждое ортогональное преобразование плос- плоскости является одним из следующих трех преобразований: а) параллельным переносом, б) вращением, в) скользящей симметрией. Рассмотрим, в частности, композицию R°S симметрии S от- относительно оси Оу и вращения R на угол ф вокруг точки О. Эта композиция выражается, очевидно, формулами х' = х cos ф + У sin ф, у' = хъту—г/соэф. С другой стороны, согласно предложению 5 она является неко- некоторой скользящей симметрией. Но эта скользящая симметрия оставляет на месте точку О. Поэтому преобразование A) является простой симметрией относи- относительно некоторой прямой а, проходящей через точку О. Упражнение. Покажите, что прямая а образует с осью абсцисс угол ф/2. Поскольку R = {R о S) о S, тем самым доказано, что каждое вращение является композицией двух симметрии. Поскольку любая прямая может быть осью абсцисс некото- некоторой системы прямоугольных-координат (а любая точка на ней — началом координат), одновременно доказано, что композиция двух симметрии относительно пересекающихся прямых является вращением {вокруг точки пересечения этих прямых на удвоенный угол между этими прямыми). Задание. Докажите, что аналогичные утверждения справедливы и для параллельных переносов, т. е. что, во-первых, каждый параллельный- перенос является композицией двух симметрии (относительно параллельных прямых), и, во-вторых, композиция двух симметрии относительно параллельных прямых является параллельным переносом (на вектор, перпендикулярный этим прямым и имеющий длину, равную удвоенному расстоянию между этими прямыми). 657
Отсюда и. из предложения 6 мы немедленно получаем сле- следующее Предложение 7. Каждое ортогональное преобразование плос- плоскости может быть разложено (не единственным образом) в ком- композицию не более чем трех симметрии. 4. Разложение ортогональных преобразований пространства Определение 1. Сохраняющее ориентации ортогональное пре- преобразование пространства, оставляющее на месте все точки неко- некоторой прямой а, называется вращением вокруг прямой а, а пря- прямая а называется его осью. Очевидно, что совокупность RotaC) всех вращений про- пространства вокруг данной прямой а является группой. Пусть ii, «2, h— такой (ортонормированный) базис простран- пространства, что вектор ?3 параллелен прямой а. Тогда оператор R, ин- индуцированный произвольным вращением R e RotaC), будет об- обладать тем свойством, что Кроме того, в силу изометричности оператора R будут иметь место равенства (JW,) h = (Rid (Rh) = hh = О, Следовательно, оператор R в базисе i\, i% ц будет иметь мат- матрицу вида О1 А о ,0 0 1 где Л — некоторая собственная ортогональная матрица: /cosqp — sinqp\ \sin ф cosqp/ ' Этим доказано, что в репере Oij2h, где О — точка прямой а (а вектор i3 по-прежнему параллелен прямой а), вращение R записывается формулами Теперь ясно, соответствие что х' У' zr = .x:cosqp — ==л; sin ф -f- = z. У COS ф, определяет изоморфизм группы RotaC) на группу S1. 658
Тем самым алгебраическое строение группы RotaC) полно- стью выяснено. Кроме того, мы видим, что любую плоскость Р, перпендику- перпендикулярную прямой а, каждое вращение R e Rota C) переводит в себя и индуцирует на этой плоскости некоторое вращение во- вокруг точки пересечения плоскости Р с прямой а. Угол ф этого вращения — один и тот же для всех (одинаково ориентиро- ориентированных) плоскостей Р. Определение 2. Этот угол q> называется углом вращения R. Подчеркнем, что он зависит от ориентации плоскости Р. Таким образом, наше нонятие «вращения пространства вокруг прямой» совпадает с наивно-интуитивным понятием «вращения», известным читателю из школьного курса. Рассмотрим теперь группы RotoC) вращений пространства с центром в фиксированной точке О (см. определение 3 п. 5 § 1). Ясно, что для любой прямой а, проходящей через точку О, имеет место включение RotaC)c:Rot0C). Поэтому группа RotoC) содержит теоретико-множественное объединение U R°U3) азО всех групп RotaC), отвечающих всевозможным прямым а, про- проходящим через точку О. Оказывается, что на самом ^деле группа RotoC) совпадает с этим объединением: RotoC)= (J RotaC). a=>0 Иными словами, справедливо следующее Предложение 1. Каждое вращение пространства с центром в точке О является вращением вокруг некоторой прямой, прохо- проходящей через эту точку. Доказательство. Пусть R e RotoC) и пусть R — инду- индуцированный изометричный оператор. Согласно следствию к лем- лемме 4 п. 8 § 7 гл. 1 для оператора R существует ортонормирован- ный базис <ь ч, h, в котором он имеет матрицу вида (cosqp — sin ф О sin ф cos ф О О 0 1 Но тогда ясно, что /?eRotaC), где а— прямая, проходящая через точку О и имеющая направляющий вектор ц. Предложение 1, конечно, не определяет полностью алгебраи- алгебраического строения группы RotoC): нужно еще указать, чему 659
равны произведения элементов из различных групп RotaC), объединением которых является группа RotoC). Мы этого здесь делать не будем. Полное алгебраическое описание группы Roto{3) (основан- (основанное на совершенно -иных идеях) мы получим в следующем пункте. Замечание 1. Обратим внимание на то, что различные группы RotaC), входящие в состав группы RotoC), пересекаются лишь по тождественному преобразова- преобразованию Е. Действительно, вращение плоскости, оставляющее на месте две различные точки, является, очевидно, тождественным пре- преобразованием. Связь между группами Rot0C), отвечающими различным точкам О, описывается следующим предложением: Предложение 2. Для любых двух различных точек О\ и О2 имеет место соотношение') Rot0l C)nRot0jC) = Rota C), где а — прямая О\О%. Доказательство. Включение RotOl C)nRotO2C)^ Rota C) очевидно. Обратно, пусть Тогда согласно предложению 1 R е= Rot0l C), R e= Rota, C), где ai и а2 —некоторые прямые, проходящие через точки Ох и О2 соответственно. Если R Ф Е, то прямые а,\ и а2 однозначно определены вращением R и каждая из них состоит из всех то- точек, остающихся при вращении R на месте. Следовательно, ai = а.2 = О\О2, т. е. R e Rota C). Следствие. Имеет место равенство RotaC)= П П где пересечение распространено на все точки О прямой а. Определение 3. Пусть a — произвольная прямая в простран- пространстве. Движение пространства называется винтовым движением с осью а, если о«о является композицией некоторого вращения ') Заметим, что пересечение (в отличие от объединения) двух групп преобразований всегда является группой. 660
вокруг прямой а и параллельного' переноса на вектор Ь, парал- параллельный прямой а. В частности, любое вращение вокруг прямой а и любой па- параллельный перенос на вектор, параллельный прямой а, яв- являются винтовыми движениями с осью. а. Ясно, что композиция двух винтовых движений с одной и той же осью также является винтовым движением с той же осью, и движение, обратное винтовому движению, также яв- является винтовым движением с той же осью. Это означает, что совокупность1) ScrewaC) всех винтовых движений с осью а является подгруппой группы Ort+C). Каждое винтовое движение Ф однозначно задается (если выбраны ориентация пространства и оси а) углом вращения ф и величиной b вектора переноса. При этом легко видеть, что если винтовому движению Ф\ соответствуют угол q>i и число Ь\, а винтовому движению Фг— угол ф2 и число Ь2, то их компози- композиции Ф2°Ф[ будет соответствовать угол ф1 + фг и число b\-\-b%. Заменяя углы ф соответствующими комплексными числами егф, мы, следовательно, можем сказать, что группа ScrewaC) винтовых движений с осью а изоморфна группе, элементами которой являются пары вида (eicp, b) и ум- умножение в которой определено формулой (е1^, bt) (ei(f\ b2) = (е< №-+Ч 6, + b2). Это полностью описывает алгебраическое строение группы ScrewaC). На языке теории групп доказанное утверждение означает, что группа ScrewaC) является прямым произведением групп S1 и R. Предложение 3. Любое движение пространства является винтовым движением. Доказательство. Поскольку любое движение является (см. предложение 2 п. 4 § 1) композицией вращения и параллель- параллельного переноса и поскольку любой параллельный перенос является композицией переноса на вектор, параллельный данной прямой, и переноса на вектор, перпендикулярный этой прямой, для дока- доказательства предложения 3 достаточно доказать, что композиция Т ° R произвольного вращения R и параллель- параллельного переноса Т на вектор Ь, перпендикулярный оси а враще- вращения R, является вращением вокруг прямой а', параллельной прямой а. С этой целью мы запишем движение Т ° R в координатах х, у, z, осью Oz которых является ось а вращения R: х' = х cos ф — у sin ф + blt у' = х sin ф + у cos ф + Ь2, От английского «Screw» — винт. 661.
Мы видим, что каждую плоскость z = const это движение пе- переводит в себя и индуцирует на ней движение х' === х cos ф — у sin ф + Ьи у' — х sin ф + у cos ф + Ь2. Поскольку ф=?0, мы "знаем (предложение 2 п. 2), что послед- последнее движение представляет собой вращение на угол ф вокруг некоторой точки (х0, у0). Поэтому и исходное движение 71»/? будет вращением на угол ф вокруг прямой а' с уравнениями х = х0, Тем самым предложение 3 полностью доказано. Это предложение означает, что группа Ort+C) всех движений пространства является теоре- теоретико-множественным объединением групп ScrewaC), соответ- соответствующим всевозможным прямым а. При этом любые две группы Screwa, C) и Screwa, C) пересекаются только по тождественному преобразованию, если прямые а\ и сс2 не параллельны, и по группе параллельных переносов на векторы, параллельные прямым «i и ссг, если эти прямые па- параллельны. Действительно, для любого движения (PeScrewaC), не яв- являющегося параллельным переносом, прямая а однозначно ха- характеризуется как прямая, на которой это движение индуци- индуцирует параллельный перенос. Предложение 3 еще не дает полного описания алгебраиче- алгебраического строения группы Ort+C). Такое описание мы получим в сле- следующем пункте. Рассмотрим, наконец, группу OrtC) всех ортогональных преобразований пространства. Примером ортогонального преобразования, обращающего ориентации, является симметрия относительно произвольной плоскости-Р. В прямоугольных координатах х, у, г, для которых плоскость Р является плоскостью Оху, эта симметрия записы- записывается формулами z'=-z. Предложение 4. Каждое обращающее ориентации ортогональ- ортогональное преобразование Ч? пространства является композицией •662
некоторого движения Ф и симметрии S относительно произволь- произвольно выбранной (но фиксированной) плоскости Р. Доказательство (ср. доказательство предложения 4- п. 2). Движение Ф определяется формулой ф = S о Т. Уточнением этого предложения является следующее предло- предложение (не имеющее аналога на плоскости): Предложение 5. Каждое обращающее ориентации ортого- ортогональное преобразование Т пространства является композицией S о ф некоторого винтового движения Ф и симметрии S относи- относительно плоскости, перпендикулярной оси движения Ф. Доказательство. В первую очередь мы покажем, что для любого обращающего ориентации ортогонального преоб- преобразования Т пространства существует точка О, оставляемая этим преобразованием на месте: W (О) = О. Действительно, если преобразование W является симметрией" относительно некоторой плоскости Р, то существование точки О очевидно. В противном случае оператор Ч1", индуцированный пре- преобразованием Т, обладает тем свойством, что ни в одном орто- нормированном базисе он не имеет матрицы вида 1 О О' or о .0 0 -1 и потому согласно лемме 5 п. 8 § 7 гл. 1 оператор Е — W обра- обратим. Но тогда уже известное нам рассуждение (см. доказатель- доказательство предложения 2 п. 2.) показывает, что точка О существует (и притом единственная). Отсюда и из следствия к лемме 4 п. 8 § 7 гл. 1 немедленно* вытекает, что в некоторой системе прямоугольных координат преобразование W записывается формулами х' = х cos ф — у sin ф, у' = х sin ф + у cos ф, z' = - z. Поэтому композиция Ф = So^ преобразования W и симметрии S относительно координатной плоскости Оху будет записываться- формулами х' = х cos ф — у sin ф, у' = х sin ф + у cos ф, * *' = * и, следовательно, будет винтовым движением с осью Oz. 663.
Поскольку Чг = 5°ф и поскольку плоскость симметрии S перпендикулярна оси Oz движения Ф, предложение 5 тем самым полностью доказано. Докажем в заключение, что, аналогично ортогональным пре- преобразованиям прямой и плоскости, любое ортогональное пре- преобразование пространства является композицией некоторого числа симметрии. Предложение 6. Каждый элемент группы Ort C) является композицией не более чем пяти симметрии относительно плоско- плоскостей. Доказательство. Поскольку любое обращающее ориен- ориентации (сохраняющее ориентации) ортогональное преобразова- преобразование пространства является композицией винтового движения и симметрии (является винтовым движением), а любое винтовое движение — композицией параллельного переноса и вращения, нам достаточно доказать, что вращение вокруг прямой а на угол ф является композицией двух симметрии относительно плоскостей, пересекающихся по прямой а и образующих угол ф/2 (а в остальном произвольных), и что параллельный перенос на вектор Ь является композицией двух симметрии относительно параллельных плоскостей, перпен- перпендикулярных вектору Ъ и находящихся друг от друга на расстоя- расстоянии | & |/2. Мы докажем только первое утверждение. Второе доказы- доказывается аналогично, и мы оставим его читателю. Пусть R— вращение на угол ф вокруг прямой а и пусть Р — плоскость, перпендикулярная прямой а. Как мы знаем, враще- вращение R отображает плоскость Р на себя и индуцирует на ней вра- вращение Rp на угол ф вокруг точки О пересечения плоскости Р и прямой а. Являясь вращением плоскости, преобразование R'P разлагается (см. п. 2) в композицию двух симметрии плоскости" Р относительно некоторых прямых Pi и Рг, пересекающихся в точке О и образующих угол ф/2 (а в остальном произвольных). Пусть Pi — плоскость, проходящая через (пересекающиеся) пря- прямые а и Рь а Рг — плоскость, проходящая через (пересекающие- (пересекающиеся) прямые а и Р2, и пусть Si— симметрия относительно плоско- плоскости Pi, a S2— симметрия относительно плоскости Р2. Композиция S2 ° Si симметрии S\ и S2 представляет собой со- сохраняющее ориентации ортогональное преобразование простран- пространства (т. е. винтовое движение) и оставляет на месте каждую точку прямой а. Поэтому оно является вращением вокруг этой прямой на некоторый угол. Но, по построению, вращение S2°Si индуцирует на плоскости Р то же вращение Rp, что и данное вращение R. Следовательно, преобразование S2°Si является вра- вращением на угол ф и потому совпадает с R. 664 •
5. Представление движений пространства с помощью кватернионов Как, мы видели (см. замечание 1 п. 1), каждое ортогональное преобразование прямой может быть записано формулой х' = ах + Ь, где \а\ = 1. Аналогичную запись допускают и сохраняющие ори- ориентации ортогональные преобразования (движения) плоскости, только вместо вещественных чисел необходимо использовать комплексные числа (см. предложение 1 и: 3). Оказывается, что подобными формулами можно задавать и движения в простран- пространстве, если воспользоваться обобщенными комплексными чис- числами, известными под названием кватернионов. По определению кватернионом называется произвольное выражение вида х0 + xxi + x2j + xbk, где Хо, Xi, х2, хъ— вещественные числа, а t, /, k — некоторые символы, назы- называемые кватернионными единицами. Коэффициенты Xi, х2, х3, равные едини- единице, не пишутся, а члены с коэффициентами, равными нулю, опускаются. На- Например, вместо 0 + It + 0/ + Ok пишется просто L Кватернионы вида Хо + Oi + О/ + Ok отождествляются с вещественными числами хо. Кватернионы складываются по «векторному» правилу (х0 + xxi + x2j + x3k) + (г/о + У\1 + Уг] + Уък) = = (хо + у о) + (xi + У\) I + (*2 + Уг) 1 + (х3 + Уз) К а перемножаются по правилу (х0 + xxi + x2j + x3k) (уй + yti + y2j + уф) == = (хйу0 — хху\ — х2у2 — хъуз) + (*o2/i + xty0 + х2у3 — хгу2) I + + (*о</2 — Ххуг + х2у0 + х3ух) j + (х0у3 + Х\у2 — х2ух + х3у0) k. В частности, Хо (Уо + 2Лг + Уг! + Узк) = (хоУо) + (*o?/i)« + (х0у2) 1 + (ЗДз) к. В силу этих правил любой кватернион l = xo-jr xti + x2j + x3k является суммой кватернионов Хо, xii, Хг\, x3k, где вещественные числа х0, Хи хг, хз рассматриваются (в соответствии с принятым выше соглашением) как кватернионы. Операции над кватернионами обладают всеми стандартными свойствами арифметических операций (ассоциативностью, дистрибутивностью и т. п.), за исключением того, что умножение не коммутативно. Например, (/ = k, но ji = —k. Однако, если кватернион является вещественным числом, то он перестановочен с любым кватернионом. Упражнение. Покажите, что кватернион тогда и только тогда переста-. новочен с любым кватернионом, когда он является вещественным числом. 665
Все возможные произведения кватернионных единиц выражаются форму- формулами /2 = —1, ij — k, ik = — /, /;=-*, f=-l, ;ft = i, ki = j, kj= — i, k2=- 1. Произведение любых двух кватернионов сводится к этим произведениям •в силу дистрибутивности сложения относительно умножения. Для любого кватерниона l = xo + xti + x2j + x3k число хо называется его вещественной частью и обозначается символом Re ?- Кватернионы вида X\i + x2j + x3k, т. е. кватернионы, вещественная часть которых равна нулю, называются мнимыми. Кватернион х0 — xxi — х2\ — x%k называется сопряженным, с кватернионом | = ха + xxi + x2j + x%k. ¦Сопряженный кватернион обозначается символом |, Ясно, что f = | для любого кватерниона \. Столь же ясно, что кватернион | тогда и только тогда является веще- вещественным числом, когда I = |, и мнимым кватернионом, когда i = —\. Автоматическая проверка показывает, что операция сопряжения удовле- удовлетворяет соотношениям (обратите внимание на порядок множителей во второй формуле!). Для любого кватерниона % кватернион gf является вещественным числом (ибо || = 1"| = g|). Более того, вычисляя это число, мы немедленно полу- получим, что +4 Следовательно, число ?1 неотрицательно (и равно нулю только для кватер- кватерниона g = 0). Арифметический квадратный корень из числа \% обозначается символом |5| и называется модулем (или абсолютной величиной) кватер- яиона |: Так как (напомним, что вещественные числа перестановочны с любыми кватерниона- кватернионами), то, так же как для комплексных чисел, модуль произведения кватер- кватернионов равен произведению модулей сомножителей; «66
Поскольку для любого отличного от нуля кватерниона ? число лично от нуля, то определен кватернион 1 112' удовлетворяющий равенствам Это означает, что в множестве кватернионов возможно деление на любой' отличный от нуля кватернион (хотя в силу некоммутативности умножения1 следует различать левое частное ?~'ti от правого частного т)^1). Множество всех кватернионов т] с модулем, равным единице: обозначается символом S3. Для таких кватернионов так что, если т| е S3, то rp'eS3. Кроме того, если т), е S3 и % е S3, то» T)]Ti2 e S3 (ибо I г)|ТJ1 == | t)i 11 тJ1 = 1). Все это означает, что совокупность S3 всех кватернионов, равных по модулю единице, яв- является группой по умножению. Единицей этой группы служит кватернион 1. > Группе S3 принадлежит, в частности, каждый кватернион вида c6s ф + sin ф • i. Такой кватернион мы будем обозначать символом ei<f>: et<f = cos <p + sin <p • /. Поскольку cos ф — sin ф • i = cos (— ф) + sin (— ф) • i, то е == е ( Аналогично показывается, что Следовательно, совокупность всех кватернионов вида ei<f является группой, изоморфной группе S* комплексных чисел, равных по модулю единице. Аналогично мы положим е'ф = cos ф + sin ф • /, ek<p = cos <p + sin <p • k. Эти кватернионы также принадлежат групие S3 и для них имеют место ана- аналогичные утверждения (например, совокупность всех кватернионов вида е*4* также изоморфна группе S1), . 667
Замечание 1. Обозначения ег<р, е/ф, е*ф носят условный характер и вво- вводятся только для сокращения записи. Обращаться с ними нужно осто- осторожно: например, нельзя писать, что е'^е = ei<s>+' (хотя бы потому, что ¦обозначение ei(f>+^ смысла не имеет!). Лемма 1. Каждый кватернион ц е S3 допускает разложение вида r, = e*We, A) где — я/2<ф<я/2, 0<т|)<л/2, — я/2<9<я/2. Если ty ф Q, я/2, то это разложение единственно. Доказательство. Пусть П = «/о + У\1 + Уг1 + УзЬ- По условию 1 \ и потому существует такой угол а, 0^а^п/2, что Если а Ф л/2, то Уо + У% = cos2a, y\ + y\ = sin'2 a. cos a , и потому существует такой угол Р, —я/2 < Р ^ я/2, что у о = cos a cos p, y3 = cos a sin p. Эти формулы справедливы и при a = л/2, но только в этом случае угол р может быть любым (а при а ф л/2 угол {3 определен однозначно). По аналогичным соображениям существует такой угол у, — я/2 < у^л/2 (однозначно определенный при а ф 0), что Ух = sin a cos y. Уъ = sin a sin Y- Таким образом, r\ = cos a cos [3 + sin a cos y • i + sin a sin у j -\- cos a sin P • k. С другой стороны, по правилу умножения кватернионов gMPgif _ (cos ф -(- sin ф • ^) (cos i|) + sin a|) • i) — — cos ф cos a|) + cos <p sin i|) • i + sin ф siri г|) • / + sin ф cos i|) • k и екч>е'^екв = (cos ф cos г|э + cos ф sin a|) • i + sin cp sin гр • / + sin ф cos \(i • k) X X (cos 9 + sin 9 • k) — (cos ф cos г|) cos 9 — sin ф cos i|) sin 9) + -f- (cos ф sin a|) cos 9 + sin ф sin a|) sin 9) i + (sin ф sin a() cos 9 — cos ф sin i|) sin 9) / + .-)- (sin ф cos ф cos 9 -\- cos ф cos a|) sin 9) k = = cos i|) cos (Ф + 9) + sin a|) cos (ф — 9) • I + + sin a|) sin (ф — 9) • / + cos ф sin (ф + 9) • k. Сравнивая полученные формулы, мы немедленно замечаем, что разложе- разложение A) имеет место при 668
Единственность этого разложения непосредственно вытекает из един- единственности углов а, р, V- Заметим в заключение, что, скажем, кватернион ei(f> тогда и только тогда — мнимый, когда ф = я/2. В этом случае он совпадает с кватернион- ной единицей i и потому его квадрат равен —1. Оказывается, что это об- общий факт, т. е. кватернион г\ <= S3 тогда и только тогда — мнимый, когда if = —1. Действительно, если кватернион т) — мнимый, то г\ == —г\, и потому г\г = —цг\ = —|г]|2 = —1. Обратно, если ц2 = —1, то ц = г\- \ц\ = г\цг\ = = —г\ и, следовательно, кватернион г\ — мнимый. Множество всех мнимых кватернионов, принадлежащих группе S3, мы будем обозначать символом S2. Подчеркнем, что группой это множество н е является. Предположим теперь, что в пространстве выбрана (и раз на- навсегда фиксирована) некоторая система прямоугольных коорди- координат х, у, z. Тогда, сопоставив произвольному вектору с координа- координатами х, у, z кватернион | = х1 + yi + zk, мы получим биективное соответствие между векторами в про- пространстве и мнимыми кватернионами. Это соответствие сохра- сохраняет, очевидно, операции сложения и умножения на веществен- вещественное число. Следовательно, векторы в пространстве можно отождествлять с мнимыми кватернионами. После такого отождествления мы можем говорить о скаляр- скалярном произведении двух мнимых кватернионов |i и Ъ (понимая под ним скалярное произведение соответствующих векторов). Поскольку символ \\\z у нас уже занят для обозначения произ- произведения кватернионов, их скалярное произведение мы будем обозначать символом (?ьЬ)- По правилу умножения кватернионов (я,/ + У\\ + Z\k) (x2i + y2j + z2k) = — (x{x2 + yxy2 + zxz2) + ... Это показывает, что скалярным произведением двух мнимых кватернионов gi и \2 является взятая с обратным знаком вещественная часть их про- произведения: Ни y = -Re(|,y. В частности, мнимые кватернионы тогда и только тогда ортогональны, когда их произведение \\\2 также является мнимым кватернио- кватернионом. Упражнение. Покажите, что «мнимой частью» |i|2 — Re(lil2) кватер- Лиона liia является векторное произведение векторов gi и |г. 669
Для любой точки пространства М ее радиус-вектор (рассма- (рассматриваемый как мнимый кватернион) мы будем называть кватер- нионной координатой этой точки. Таким образом, если точка имеет координаты х, у, г, то ее кватернионная координата будет выражаться формулой l = xi + yj + zk. Для любого кватерниона ц е S3 и любой точки М с кватер- нионной координатой \ рассмотрим кватернион Поскольку кватернион |'— мнимый и потому является кватернионной коор- координатой некоторой точки М'. Положив мы, таким образом, получим некоторое отображение /?ц про- пространства в себя. Так как для любых двух точек -Mi(gi) и ^2{Ъ) расстояние |iW!iW2| между этими точками, очевидно, равно модулю кватер- кватерниона ?2 — h- )M]M2\ = \h-h\ и так как то, следовательно, для любого кватерниона ч\ s S3 преобразование /?„ является ортогональным преобразованием пространства. Так как то для любых кватернионов tii.t^sS3 имеет место равенство показывающее, что соответствие является гомоморфизмом группы S3 в группу OrtC). Найдем преобразование Яц при т] = efta. По правилу умноже- умножения кватернионов efeo| __ (cos a -f sin a • A) (jc/ + yj -\- zk) = = — z sin a + (* cos a — у sin a) / + + (дс sin a + у cos a) / + z cos я • k 670
и, далее, ekaleka = (х cos 2а — у sin 2а) / + (х sin 2а + У cos 2а) / + zk. Это показывает, что преобразование Reka задается в координатах х, у, z фор- формулами х' = х cos 2а — у sin 2а, у' — х sin 2а + у cos 2а, z' = г и потому представляет собой вращение вокруг оси Ог на угол 2а. Аналогично показывается, что преобразование /?е/о задается в координатах х, у, z фор- формулами ' 2a — z sin 2a, У'=У> z' = x sin 2a + z cos 2a и потому представляет собой вращение вокруг оси Оу на угол 2а, и что преобразование Reia задается в координатах х, у, z фор- формулами Xf — X у' — у cos 2а — г sin 2a, z' = у sin 2а + z cos 2a и потому представляет собой вращение вокруг оси Ох на угол 2а. Но согласно доказанной выше лемме 1 любой кватернион г] е S3 допускает разложение вида Следовательно, каждое преобразование Rn, \\ e S3, является композицией трех вращений: R^^R^oR^oR^e, B) и потому само является вращением (вокруг начала коорди^ нат О). Таким образом, соответствие представляет собой на самом деле гомоморфизм группы S3 в / группу вращений RotoC). . 671
Прежде чем исследовать этот гомоморфизм более подробно, мы введем в рассмотрение еще один класс преобразований про- пространства, получающихся с помощью кватернионов. Пусть ц — произвольный кватернион, принадлежащий мно- множеству S2 (т. е. являющийся мнимым кватернионом из S3). Лю- Любой точке М(?,) мы сопоставим кватернион Поскольку | = — |, г\ = — т), то и, следовательно, кватернион \' — мнимый и потому является кватернионной координатой некоторой точки М'. Сопоставив точке М точку М', мы получим поэтому некоторое отображение Sn пространства в себя: Пусть Рт, — плоскость, проходящая через точку О перпенди- перпендикулярно (единичному) вектору ц. Кватернионные координаты g точек этой плоскости ортогональны, таким образом, кватерни- кватерниону i\. Покажем, что отображение Sn представляет собой симметрию пространства относительно плоскости Рп- Для этого достаточно показать, что если кватернион | орто- ортогонален кватерниону tj, то а если кватернион | коллинеарен кватерниону ц (имеет вид k-ц, где k — вещественное число), то Но если кватернион \ ортогонален кватерниону ц, то (см. выше) кватернион 1ц — мнимый и потому 1ц== — |т]. Следова- Следовательно, I' = ф\ = - тйч = - titjl = I т) \1 = |. Аналогично, если % = kv\, то (напомним, что rf — — l для любого кватерниона TjeS2). Тем самым наше утверждение полностью доказано.. Композиция Sri, ° -Згь двух симметрии S4l и Эщ определяется, очевидно, формулой I' . 6 72
Но, поскольку кватернионы т^ и т^ — мнимые, то fb^i =='П2'П1 И ПОТОМУ Это показывает, что композиция Sni ° Sr\2 симметрии Sni и Sn2 является враще- вращением ЯЦЛ. На мы знаем, что (см. п. 3) в виде композиции двух симмет- симметрии может быть представлено любое вращение пространства. Следовательно, каждое вращение пространства вокруг точки О является вра- вращением /?п, соответствующим некоторому кватерниону r\ e S3. Другими словами, имеет место следующее Предложение 1. Каждое вращение пространства вокруг точ- точки О записывается в кватернионных координатах | формулой где | т) | = 1. На языке теории групп это означает, что гомоморфизм r\ -> R^ является эпиморфизмом группы S3 на группу RotoC). Упражнение. Покажите, что мнимая часть г\ — Re г) кватерниона т| е S3 представляет собой вектор, параллельный оси вращения R^, и выразите его длину через угол вращения R^. Эпиморфивм tji—>/?ч изоморфизмом заведомо не является, по- поскольку кватернионы 1 и —1 оба определяют тождественное пре- преобразование. Другими словами, группа второго порядка S° = {1, -1} содержится в его ядре. Оказывается, что группа S0 составляет все ядро, т. е. справед- справедливо следующее Предложение 2. Если кватернион ц е S3 обладает тем свой- свойством, что для любого мнимого кватерниона | имеет место ра- равенство ЦЩ = |, ТО Т) = ± 1. Доказательство. Пусть Л = Уо + У\1 + Уч\ + Угк. Тогда цщ = (— у{ + yoi -f у3] — Угк) (Уо — У\1 — y2j — Узк) = ( + УоУ\ ~ У\ ~ У1) + ¦ • ¦ Следовательно, равенство Tjtfi = i возможно только тогда, когда уз + У\ ^ °> т- е- К0ГДа У^ "= °> Уз = °- 22 М, М, Постников • 673
Аналогично, полагая ? = /, мы получим, что у\. = О, у$ = 0. Следовательно, кватернион ч\ является вещественным числом г/о- Для завершения доказательства остается заметить, что един- единственными вещественными числами, равными по модулю еди- единице, являются числа ±1. Согласно общеалгебраической теореме о гомоморфиз- гомоморфизмах предложение 2 означает, что справедлива следующая тео- теорема, полностью описывающая алгебраическое строение группы RotoC): Теорема 1. Группа Roto C) изоморфна факторгруппе S3/S°. Напомним, что элементами факторгруппы S3/S° являются пары (т],—т]), где т] е S3. Умножаются эти пары по формуле Замечание 2. Совершенно аналогичные формулировки воз- возможны для п = 1 и п = 2: группа Roto(l) изоморфна фактор группе S°/S°, а группа Roto B) —факторгруппе S'/S0. Действительно, факторгруппа S°/S° состоит только из одного элемента (единицы), а факторгруппа S'/S0 изоморфна группе S1 (изоморфизм осуществляется соответствием (eia, e~ia) н-> e2ia). Чтобы получить более «наглядное» представление о много- многообразии элементов группы RotoC), мы рассмотрим отображение сопоставляющее каждому кватерниону Л = Уо + У\1 + Уг! + Уз& е S3 точку (г/о: ух : у2 '• Уз) арифметического проективного простран- пространства RP3 (см. п. 3 § 2 гл. 4). Пусть (xo:xi:x2:x3) — произвольная точка пространства RP3. Положив Г., Хо ,, Х\ Х2 Хз 1#о = у-> У\— — > У2 = ~, Уз — — , где г = Yxl + х\ + xt "т1 Х1> мы> очевидно, получим, во-первых, что (х0 :х1\х2:х3) == (у0:ух:у2: у3), и во-вторых, что У%+У\+У\+У\=1> 674 .
Это показывает, что точка (х0: хх: х2: *3) получается из кватер- кватерниона r\ = yQ + y\i + Уъ\ + Уцк, принадлежащего группе S3. Сле- Следовательно, построенное отображение является отображением группы S3 на все прострайство RP3. Двум кватернионам т), и г\2 тогда и только тогда соответ- соответствует одна и та же точка пространства RP3, когда существует такое вещественное число k, что Но поскольку |ti2| = \r\\\ = 1, это число должно быть равно ±1. Это показывает, что отображение S3->RP3 индуцирует биективное отображение факторгруппы S3/S° на про- пространство RP3. Таким образом, мы получаем, что группа S3/S°, а следовательно, и группа вращений RotoC) находится в биективном соответствии с проективным простран- пространством RP3. Это утверждение хотя ничего и не говорит об алгебраическом строении группы RotoC), но зато дает вполне наглядное описа- описание множества ее элементов. Замечание 3. Обратим внимание на то, что изоморфизм групп S3/S° и RotoC) зависит от выбора в пространстве некото- некоторой системы прямоугольных координат х, у, z. От этого выбора зависит также и построенный в п. 4 § 1 изоморфизм между груп- группами RotoC) и SOC). Композиция этих двух изоморфизмов дает изоморфизм между группами S3/S° и SOC), уже, как легко видеть, не зависящий от выбора координат (и потому естествен- естественный). Это означает, что группу SOC) собственных ортогональных матриц третьего порядка мы можем отождествить с группой S3/S° (а следова- следовательно, и с проективным пространством RP3). Замечание 4. Поскольку любое вращение пространства (во- (вокруг точки О) имеет вид Rn, то согласно формуле разложения A) мы получаем, что каждое вращение R пространства вокруг точки О может быть разложено в композицию где R' и R'" — вращения вокруг оси Oz, a R" — вращение вокруг оси Ох. 22* 675-
Для ортогональных матриц это означает, что любая собственная ортогональная матрица допускает разло- разложение вида cosqp ¦ sincp 0 — sin cos 0 Ф Ф ° l/ /1 ° Vo 0 cos sin •Ф 0 — sin cos \/ /\ cos 9 sin 9 0 — sin9 cos 9 0 0 0 1 где — я< Таким образом, мы заново (но «на более высоком уровне») получили найденное в п. 6 § 5 гл. 1 разложение Эйлера. С другой стороны, заметив, что за оси Oz и Ох мы можем принять любые две перпендикулярные прямые, проходящие че- через точку О, мы получаем, что выбрав две перпендикулярные прямые а\ и аг, проходящие через точку О, мы каждое вращение R с центром О (элемент группы RotoC)) можем разложить в композицию где R' и R'" — вращения вокруг прямой щ (элементы группы Roto,C)), a R" — вращение вокруг прямой а2 (элемент группы Rota2C)). Замечание 5. Из описания вращений как преобразований, за- записывающихся формулой немедленно вытекает следующее предложение, дающее анало- аналогичное описание всех движений: Предложение 3. Каждое движение пространства (элемент группы Ort+C)) записывается в кватернионной координате Ъ, формулой где 1о — некоторый мнимый кватернион, а ц — некоторый кватер- кватернион из S3 (т. е. такой, что \ц\= 1). Подчеркнем, что в отличие от аналогичных формул для дви- движений плоскости, это представление движений пространства не единственно (кватернион т) может быть заменен кватернионом -Л). Упражнение. Докажите, что каждое обращающее ориентации ортогональное преобразование простран- пространства (элемент смежного класса Ort"C)) записывается в кватернионной коор- координате | формулой Г = - ЛИ + h- Это представление также не единственно. 676 •
§ 3. КОНФОРМНЫЕ ПРЕОБРАЗОВАНИЯ 1. Инверсия относительно окружности Точки М и М' плоскости, симметричные относительно некото- некоторой прямой а, обладают, очевидно, тем свойством, что любая окружность, центр которой лежит на прямой а (т. е. любая окружность, ортогональная прямой а) и которая проходит через точку М, проходит также и через точку М'. Обобщением этого утверждения на любые окружности является следующее Предложение 1. Для любой точки М, не принадлежащей дан- данной окружности 2 и отличной от ее центра О, существует един- единственная точка М', обладающая тем свойством, что любая окруж- окружность 2', ортогональная окружности 2 и проходящая через точ- точку М, проходит также и через точку М'. Доказательство. Совокупность всех окружностей, орто- ортогональных окружности 2, является (см. п. 3 § 3 гл. 4) гипербо- гиперболической связкой окружностей, а совокупность всех окружно- окружностей, проходящих через точку М — параболической связкой окружностей. Поэтому совокупность всех окружностей, ортого- ортогональных окружности 2 и проходящих через точку М, представ- представляет собой пучок окружностей. Этот пучок не может быть ги- гиперболическим, поскольку все его окружности имеют общую точ- точку М. Он не может быть и параболическим, поскольку тогда ему принадлежала бы окружность нулевого радиуса с центром в точке М, что невозможно (если окружность нулевого радиуса ортогональна окружности 2, то ее центр должен принадлежать этой окружности, а по условию точка М окружности 2 не при- принадлежит). Следовательно, этот пучок эллиптичен. Кроме того, он является пучком именно окружностей, а не прямых, поскольку пучок прямых, проходящих через точку М, тогда и только тогда состоит из прямых, ортогональных окружности 2, когда точка М является центром этой окружности. Являясь эллиптическим пучком окружностей, рассматривае- рассматриваемый пучок состоит поэтому из всех окружностей, проходящих через две фиксированные точки. Одной из этих точек является данная точка М, а другой — искомая точка М'. Определение 1. По очевидной аналогии со случаем прямой, точка М' называется точкой, симметричной точке М относительно окружности 2, а преобразование1) Л* н->ЛГ называется инверсией (или симметрией) относительно окруж- окружности 2. Центр О окружности 2 называется центром инверсии, а ее радиус R > О— радиусом инверсии, квадрат R2 радиуса инвер- инверсии называется степенью инверсии. •) Определенное пока лишь для точек М, не принадлежащих окружно- окружности 2 и отличных от ее центра. 677
Одной из окружностей эллиптического пучка, состоящего из окружностей, проходящих через точки Ми М', является прямая ММ' (прямая центров этого пучка). Поскольку эта прямая орто- ортогональна окружности 2, она проходит через ее центр. Таким об- образом, точки М и М', симметричные относительно окружности 2, ле- лежат на прямой, проходящей через центр О этой окружности. Пусть 2'—произвольная окружность, проходящая через точки М и М'. Степень точки О относительно окружности 2' равна (см. п. 1 § 3 гл. 4) произведению величин векторов ОМ и ОМ'. Но поскольку окружность 2' ортогональна окружности 2, эта степень равна квадрату R2 радиуса окружности 2 и, в част- частности, положительна. Следовательно, точка М' лежит на прямой ОМ по ту же сторону от точки О, что и точка М. Кроме того, мы видим, что произведение длин отрезков ОМ и ОМ' равно R2: \OM\-\ ОМ'| = Я2. Ясно, что последние два свойстйа однозначно определяют на прямой ОМ точку М'. Поэтому их можно положить в основу определения этой точки. Заметим, что получающееся определе- определение пригодно и тогда, когда точка М принадлежит окружности 2, и дает в этом случае ту же самую точку М. Таким образом, мы приходим к следующему окончательному определению инверсии относительно окружности 2 радиуса R с центром в точке О: точка М' симметрична точке М относительно окружности 2, если 1) она расположена на прямой ОМ по ту же сторону от точки О, что и точка М; 2) имеет место равенство \OM\-]OM'\ = R2. Тем самым инверсия относительно окружности оказывается определенной для всех точек плоскости, отличных от точки О. При этом М' = М тогда и только тогда, когда М принадле- принадлежит окружности 2. • Ясно, что аналогично симметрии относительно прямых, каждая инверсия S является инволютивным преобразованием^ т. е. обратное преобразование S~l совпадает с S: Пусть х, у — прямоугольные координаты на плоскости. Най- Найдем формулу, выражающую координаты точки М'(х',у') через 678
координаты точки М(х,у). Для этого оказывается удобным пе- перейти к соответствующей комплексной координате z = х + iy- Рассмотрим сначала случай, когда центр инверсии совпадает с началом координат 2 = 0. Пусть R— радиус инверсии. По определению, произвольную точку z инверсия переводит в точку z', обладающую следующими свойствами: 1) отношение z': z является положительным числом; 2) имеет место равенство \z\-\z'\ = R\ Ясно, что этим условиям удовлетворяет точка Поскольку условия 1) и 2) однозначно определяют точку z', тем самым доказано, что инверсия с центром в точке z = 0 задается формулой A), где R2 — степень инверсии. В координатах х, у формула A) превращается в две фор- формулы: Х х2 + у2 ' У Чтобы получить аналогичную формулу для инверсии с цент- центром в произвольной точке z0, достаточно перейти к новой коор- координате I = z — zQ. Согласно формуле A) рассматриваемая ин- инверсия выражается в координате t, формулой Возвращаясь к прежней координате z, мы получаем отсюда, что инверсия с центром в точке z0 выражается формулой *' = 7^ + *о. B) где R2 — степень инверсии. 2. Пополненная плоскость Тот факт, что инверсия с центром О не определена в точке О, очень неприятен. Естественно .добиваться того, чтобы этот недо- недостаток был устранен. С этой целью достаточно пополнить плос- плоскость еще одной фиктивной точкой М^ и по определению счи- считать, что инверсия с центром в О переводит точку О в точку ЛГ«, (и, наоборот, точку М» в точку О). 679
Определение 1. Плоскость, пополненную указанным образом одной точкой Me*, мы будем называть пополненной плоскостью '). Добавленную точку Мх мы будем называть бесконечна удаленной точкой, а все остальные ее точки — конечными точ- точками. По определению, инверсия с произвольным центром является на пополненной плоскости всюду определенным инволютивным преобразованием. Любое преобразование плоскости (например, ортогональное или аффинное) мы будем считать преобразованием пополненной плоскости, переводящим точку М^ в себя. Следует отчетливо понимать различие между пополненной и рас- расширенной (евклидово-проективной) плоскостями: первая получается до- добавлением к обычной (евклидовой) плоскости одной точки, а вторая — добавлением бесконечного числа точек (составляющих целую прямую). В том, что к обычной плоскости можно по-разному добавлять фиктивные точки, нет ничего удивительного: все определяется свойствами тех преобразований, ко- которые мы хотим сделать всюду определенными добавлением фиктивных точек. На евклидовой (или аффинной) плоскости проективное преобразование не определено на целой прямой, и поэтому, чтобы сделать любое такое преобра- преобразование определенным всюду, надо добавить прямую. Инверсия же не опре- определена только в одной точке, и потому надо добавлять одну точку. Вполне может быть, что для каких-нибудь других преобразований придется попол- пополнять плоскость, скажем, парой прямых или парой точек. Пусть а — произвольная прямая, проходящая через центр О некоторой инверсии S. По определению, для любой точки М этой прямой (отличной от точки О) точка М' = S(M) также принад- принадлежит прямой а. На этом основании целесообразно считать, что точка Мее также принадлежит прямой а. Поскольку точка О может быть любой (конечной) точкой, следует, таким образом, считать, что точка Мх, принадлежит всем прямым пополненной плоскости. Таким образом, подобно расширенной плоскости пополненная плоскость не имеет непересекающихся прямых. Однако, в отли- отличие от расширенной плоскости, две прямые на пополненной пло- плоскости, вообще говоря, имеют две общие точки (общую конеч- конечную точку и точку Мы), хотя возможен случай, когда они имеют только одну общую точку Мао (параллельные прямые). В этом отношении прямые на пополненной плоскости напоминают не столько прямые на расширенной плоскости, сколько окружности на обычной (евклидовой) плоскости. Действительно, две окруж- окружности имеют, вообще говоря, две общие (собственные) точки (возможно, мнимые), за исключением того случая, когда они касаются. Это наводит на мысль, что в геометрии пополненной плоскости прямые следует рассматривать как окружности, про- проходящие через точку М^. Это подкрепляется тем, что, как мы ниже покажем, любая инверсия с центром в точке О каждую окружность перево- l) Используется также термин «круговая плоскость». 680
дит, вообще говоря, в некоторую окружность; однако окруж- окружности, проходящие через точку О, эта инверсия переводит в прямые. Стоит также напомнить, что и в теории пучков окружностей (§ 3 гл. 4) оказалось удобным рассматривать прямые как окруж- окружности «бесконечного радиуса». По всем этим основаниям мы при изучении геометрии попол- пополненной плоскости будем, как правило, избегать термина «пря- «прямая», заменяя его оборотом «окружность, проходящая через ТОЧКУ iWoo». Тогда можно будет уже без всяких исключений утверждать, например, что инверсия переводит окружности в окружности. Делается также совершенно ясно, почему пучок прямых, про- проходящих через произвольную точку О, следует считать эллип- эллиптическим пучком окружностей: действительно, он состоит из окружностей, проходящих через две фиксированные точки О И Моо. В этом круге идей следует считать, что параллельные прямые касаются друг друга в точке М^. Действительно, при таком со- соглашении пучок параллельных прямых окажется пучком окруж- окружностей, проходящих через точку М<х> и касающихся в этой точке друг друга, т. е. попадет под общее определение параболических пучков. Наглядную интерпретацию пополненной плоскости можно получить, рас- рассмотрев в (евклидовом) пространстве произвольную сферу и касающуюся ее в некоторой точке плоскость. Пусть О — точка сферы, диаметрально противо- противоположная точке касания. Тогда для любой точки М плоскости прямая ОМ пересекает сферу в единственной точке М' (называемой стереографической проекцией точки М). Это показывает, что точки плоскости мы можем отож- отождествить с точками сферы, отличными от точки О. . После этого отождествления необходимость в пополненной плоскости де- .лается очевидной: добавление одной и только одной точки нужно, чтобы ликвидировать в сфере получившийся «прокол». Одновременно мы ви- видим, чго пополненную плоскость можно отождествить со сферой. Эта интерпретация пополненной плоскости как сферы часто бывает по- полезна. Например, в этой интерпретации совершенно ясно, почему мы должны •считать параллельные прямые касающимися в точке М„: образы этих пря- прямых при стереографической проекции являются окружностями, касающимися друг друга в точке О. Комплексную координату z = х + iy мы распространим на пополненую плоскость, считая, что точке Мх отвечает «значение» координаты z, равное оо. В силу этого соглашения, формулы A), B) п. 1 будут выражать инверсию и на попол- пополненной плоскости. Действительно, при z = 0 формула A) дает г' = оо, а при г = оо — дает z' = 0. 681
Мы знаем, что любое движение плоскости записывается в комплексной координате формулой z' = az + b, A) где а,Ь — комплексные числа, причем \а\ = 1 (см. п. 3 § 2). При любом афО преобразование A) является композицией дви- движения г' = -г—г z + b \а\ ' и гомотетии z' = \a\z с центром в точке О, т. е. является преобразованием подобия (сохраняющим ориентации). Поскольку в силу формулы A) z' = оо при z = оо, эта фор- формула выражает преобразование подобия (а при |а|= 1 — дви- движение) и на пополненной плоскости. Аналогично, формула z' = z, выражающая, очевидно, симметрию относительно оси Ох, сохра- сохраняет силу и на пополненной плоскости. Определение 2. Преобразование пополненной плоскости на- называется дробно-линейным преобразованием, если оно выра- выражается (в данной координате z) формулой вида * — cz + d' w и называется сопряженно дробно-линейным преобразованием, если оно выражается формулой вида , __ az+b .„л cz + d ' v ' Конечно, здесь следует проверить корректность этого опре- определения, т. е. тот факт, что преобразование, дробно-линейное (сопряженно дробно-линейное) в координате z, остается дроб- дробно-линейным (сопряженно дробно-линейным) и в любой дру- другой комплексной координате. Задание. Проверьте корректность определения 2. Чтобы формулы B) и B') действительно задавали преобра- преобразования (биективные отображения пополненной плоскости на себя), необходимо (и достаточно), чтобы а Ъ с d 682
При выполнении этого условия преобразованием, обратным, скажем, к преобразованию B), будет преобразование dz-b cz-a' Все рассмотренные выше преобразования были либо дробно- линейными, либо сопряженно дробно-линейными преобразова- преобразованиями. Например, преобразования подобия A) являются преобразо- преобразованиями B), получающимися при с = О, d = 1, а иаверсия с центром 2 = 0— преобразованием B'), получающимся при а = 0, b = R2, с= 1, d = 0. Оказывается, что и наоборот, каждое дробно-линейное или сопряженно дробно-линейное преобразование является композицией преобразований, являю- являющихся преобразованиями подобия или симметриями (относи- (относительно окружностей или прямых). Действительно, каждое преобразование B) при с = 0 яв- является, очевидно, преобразованием подобия. Пусть с ф 0. Тогда az + Ъ be — ad , a ' Д / 1 \ , а тт „г т 1 ~г „ cz + d c{cz + d) ~ с с2 I z с_ | ^ с и потому преобразование B) является композицией преобразо- преобразования z — и преобразования подобия z — С2 z -т- с . С другой стороны, преобразование C) является, очевидно, композицией параллельного переноса и преобразования z * z ' являющегося композицией симметрии г' = ги инверсии z'' — -т. Подобным же образом может быть разложено и любое пре- преобразование B') (с сфО): к указанным преобразованиям до- добавится еще одна симметрия z1 = z. Определение 3. Преобразование пополненной плоскости на- называется конформным, если оно переводит окружности в окруж- окружности. 7 683
Замечание-1. Конформные преобразования называются также круговыми преобразованиями или преобразованиями Мёбиуса. Ясно, что все конформные преобразования пополненной плоскости со- составляют группу. Мы будем обозначать эту группу символом Conf. Легко видеть, что уравнение любой окружности на пополненной плоскости имеет вид azz + Ьг + Ьг + с = 0, D) где b — некоторое комплексное число, а а и с — вещественные числа. Действительно, если рассматриваемая окружность имеет центр в точке zu и радиус R, то ее уравнение может быть запи- записано в виде \z-zo\ = R. Возводя в квадрат и перемножая, мы получаем уравнение zz — zQz — zoz + zQz0 — R2 = Q, E) имеющее вид D) с а = 1, Ь = —га и с = ZoZo — R2. Если же рассматриваемая окружность является прямой Ах + By + С = О, то, положив а = 0, Ъ = —~ ' , с —С, мы снова получим урав- уравнение вида D). Обратно, покажем, что любое уравнение azz + bz + bz + c = 0, F> где а и с вещественны, является уравнением некоторой окруж- окружности. Действительно, при а = 0 это — уравнение прямой Ах + В у + С = О, где А = Re b, В = —Im b и С = с. Пусть а ф 0. Разделив на а и положив „ — Ъ ту - УъЪ-ас мы получим уравнение вида E), показывающее, что рассмат- рассматриваемая линия является окружностью радиуса R с центром в точке го. Замечание 2. Настоящую окружность мы получим только при ЬЪ > ас. При ЬЪ < ас получается окружность мнимого радиуса, не имеющая веще- вещественных точек, а при ЪЪ = ас — окружность нулевого радиуса, имеющая только одну вещественную точку. 684
Инверсия с центром в точке z = 0 переводит окружность azz + bz + bz -+- с = О в линию с уравнением D2 D2 _ г>2 $2 z' г' z' z' ' т. е. с уравнением cz'z' + &/?V + bR2z' + аЯ4 = 0. Поскольку это уравнение имеет вид D), оно является уравне- уравнением некоторой окружности. Таким образом, инверсия переводит произвольную окруж- окружность снова в окружность, т. е. является конформным преобра- преобразованием. (Ясно, что это справедливо и для инверсии с центром в произвольной точке z0.) Поскольку преобразования подобия и симметрии относитель- относительно прямых-очевидным образом являются конформными преоб- преобразованиями, тем самым доказано, что каждое дробно-линейное или сопряженно дробно-линейное преобразование является конформным преобразованием. Замечательно, что справедливо и обратное утверждение: Предложение 1. Каждое конформное преобразование попол- пополненной плоскости является дробно-линейным или сопряженно дробно-линейным преобразованием. Доказательство. Покажем сначала, что любое конформное преобразование -пополненной плоскости, оставляющее на месте точку М^, является преобразованием подобия (возможно, не сохраняющим ориентации, т. е. представ- представляющим собой композицию некоторого сохраняющего ориента- ориентации преобразования подобия и симметрии). Действительно, если конформное преобразование оставляет на месте точку М^, то любую окружность, проходящую через эту точку, оно переводит снова в окружность, проходящую че- через точку Мао. Другими словами, любую прямую оно переводит в прямую. Следовательно, это конформное преобразование яв- является аффинным преобразованием, и потому разлагается в композицию Фг°Ф1 некоторого ортогонального преобразования Ф1 и преобразования Ф2, являющегося композицией двух сжа- сжатий к двум взаимно перпендикулярным прямым. Поскольку преобразования Ф2°Ф1 и Ф4 конформны, преобразование Фг также конформно. Но ясно, что композиция двух сжатий тогда и только тогда переводит окружности в окружности (является 685
конформным преобразованием), когда коэффициенты этих сжа- сжатий одинаковы, тЛе. когда эта композиция является гомотетией. Таким образом, данное конформное отображение является ком- композицией некоторого ортогонального преобразования и гомоте- гомотетии, т. е. представляет собой преобразование подобия. Пусть теперь Q — произвольное конформное преобразование плоскости. Пусть это преобразование переводит точку Мж в (конечную) точку О. Рассмотрим произвольную инверсию 5 с центром в точке О. Композиция Й' = 5 о Q является конформным преобразованием, оставляющим на месте точку Мао, и потому, по доказанному, представляет собой преоб- преобразование подобия. Поскольку Q = S°Q', тем самым доказано, что любое конформное преобразование пополненной плоскости является либо преобразованием подобия, либо композицией пре- преобразования подобия и некоторой инверсии.. Чтобы завершить доказательство предложения 1, осталось заметить, что если дза преобразования выражаются формулами вида B) или B'), то их композиция также выражается форму- формулой такого вида. 3. Свойства конформных преобразований Предложение 1 п. 2 сводит изучение конформных преобразо- преобразований к простым алгебраическим вычислениям с дробно-линей- дробно-линейными и сопряженно дробно-линейными преобразованиями. Рассмотрим сначала конформные преобразования, язляю- щиеся дробно-линейными преобразованиями: Такое преобразование полностью определено, если известна матрица 'а Ь\ B) Поскольку эта матрица невырождена, она принадлежит группе GL(?L2) всех невырожденных квадратных матрид второго по- порядка с комплексными элементами. Таким образом, сопоставив матрице B) преобразование A), мы получим некоторое отображение GL (С2) -> Conf C) матричной группы GL(.G2) в группу Conf. 686
Легко видеть, что отображение C) является гомоморфизмом, т. е. произведе- произведению матриц отвечает' композиция соответствующих преобразо- преобразований A). Задание. Докажите это утверждение. Отсюда, в частности, вытекает, что совокупность Conf+ всех конформных преобразований, яв- являющихся дробно-линейными преобразованиями (т. е. записы- записывающихся формулами вида A)), является подгруппой группы Conf. Действительно, эта совокупность является образом группы GL(C.2) при гомоморфизме C). Было бы неверно утверждать, что гомоморфизм C) яв- является изоморфизмом группы GL(C2) на группу Conf+. Дейст- Действительно, ясно, что матрицы, отличающиеся скалярным множи- множителем, определяют одно и то же преобразование A). Покажем, что обратное тоже верно, т. е. что равенство a\Z -\- Ъ\ a2z + 62 C\Z -f- d\ c2z -f- d2 тогда и только тогда имеет место для всех z, когда существует такое число k Ф О, что ' а2 Ь2\_ (ах V vc2 d2) \cx dXl Действительно, если a\Z + Ъ\ a2z + Ь2 C\Z + dx c2z + d2 для всех z, то (axz + bx) (c2z -+- d2) — (cxz + dx) (a2z + b2) = 0, т. e. (axc2 — cxa2) z2 + [{axd2 — dxa2) + (bxc2 — cxb2)] z + {bxd2 — dtb2) = 0 тождественно по z. Но многочлен тогда и только тогда тождест- тождественно равен нулю, когда равны нулю все его коэффициенты. Следовательно, и axd2 — dxa2 = cxb2 — bxc2. D) Первые два соотношения означают, что существуют такие числа k и /, что и 687
Подставляя эти выражения в соотношение D), мы получаем ра- равенство /a,d, — kdxa{ «= iclbl т. е. равенство возможное только при k = I (напомним, что, по условию, a^di — cibi Ф 0). На языке теории групп доказанное утверждение означает, что ядром гомоморфизма C) является подгруппа всех диаго- диагональных матриц вида 'k 0' .0 k, где 1гф0. Можно попытаться уменьшить это ядро, требуя, чтобы опре- определитель матрицы B) был раве-н единице: а Ь с d = 1. E) Это означает, что вместо группы GL(C,2) всех невырожденных матриц второго порядка с комплексными элементами мы рас- рассматриваем ее подгруппу SL(C2), состоящую из матриц, удов- удовлетворяющих условию E). Соответствующий гомоморфизм SL (С2) -> Conf также отображает группу SL(C2) на группу Conf+. Однако он по-прежнему не будет изоморфизмом, поскольку матрицы, отли- отличающиеся знаком, будут определять одно и то же преобразова- преобразование из группы SL(C2). Другими словами, ядром гомоморфиз- гомоморфизма C) будет группа второго порядка, состоящая из матриц /1 0\ /-1 0 ?==\о 1/' -Е~={ о -1 Обозначив эту группу символом {±?}, мы можем, таким об- образом, сказать, что группа Conf+ изоморфна факторгруппе группы SL(C2) no нормальному делителю {±Е}. Запись конформного преобразования из группы Conf+ фор- формулой A), в которой а Ь __ с d =1> 688
называется нормированной. Подчеркнем, что, согласно сказан- сказанному выше, для преобразования A) существуют две нормиро- нормированные записи. От этой неоднозначности избавиться невоз- невозможно, и о ней всегда нужно помнить (в противном случае лег- легко прийти к ошибке). Обратим внимание на то, что запись (сохраняющего ориентации) пре- преобразования подобия в виде г' = аг + Ь не нормирована. Нормированная запись этого преобразования имеет вид _ _ ,_ V~az+ bIY a Z ~ UV"a Рассмотрим теперь конформные преобразования, выражаю- выражающиеся формулами а Ь cz+d ' С d ФО. Их'совокупность мы обозначим символом Conf". Каждое такое преобразование Q является композицией сим- симметрии S: z' = z и преобразования Q+. ~> — aZ + \ li • г — cz + i ' принадлежащего группе Conf+: Q = Q+oS. При этом ясно, что где Q+ — преобразование из группы Conf+, выражающееся фор- формулой /_ az + b cz + d Из этих формул вытекает, что для любых двух преобразо- преобразований Qt, ^it s Conf4" имеют место равенства (Qt о S) о (Q2+ о S) = (Qt о S) о {S о Q2+) = Qjf" o Q+, (Qi+ о s) о q2+ = (at ° Ш) о 5, ut ° (Qt ° S) = (Qi1" о Qt) ° 5. 689
Поскольку представление преобразования Q из Conf" в виде Q+°S, очевидно, единственно, мы видим, что произведение лю- любых двух элементов группы Conf = Conf+ U Conf" мы можем вычислить, если нам известно произведение любых двух элементов группы Conf+. Тем самым алгебраическое строение группы Conf полностью выяснено (или, точнее, сведено к алгебраическому строению группы Conf+). В частности, мы видим, что множество Conf~ является смежным классом группы Conf по ее нормальному делителю Conf+. Рассмотрим теперь некоторые «геометрические» свойства конформных преобразований. Предложение 1. Для любых двух троек zi, z%, 2з и z[, г'2, zi точек пополненной плоскости, не содержащих одинаковых то- точек, существует конформное преобразование из группы Conf+, переводящее точки zi, z%, z3 в точки z\, z'2, z'3. Доказательство. Предполагая сначала, что ни одна из данных шести точек не является бесконечно удаленной точ- точкой z = оо, рассмотрим соотношение {г'-г'Мъ-г'з) = (z ~ zi) (Z2~ гз) # ,~ Выразив из этого соотношения z' через z, мы, очевидно, полу- получим формулу вида , аг + Ь Z ~~^z~Td> показывающую, что соответствие z i—*z является конформным преобразованием из группы Conf+. Это преобразование переводит точки zu z2, z3 в точки z\, 22, 2з, так как обе стороны соотношения (G) обращаются в нуль при z' = z[ и z = zu в единицу при г'= 22 и 2 = г2 и в беско- бесконечность при г' = 2з и 2 = г3. В случае, когда одна из заданных точек является бесконеч- бесконечно удаленной точкой, нужно написать соотношение, аналогич- аналогичное соотношению F) и получающееся из него предельным переходом, когда соответствующая точка z\, 22, 23, z\, zk, 23 «уходит в бесконечность». Так, если 24 = оо, то правую часть соотношения F) нужно заменить выражением z2 — z3 690 •
если z2 = оо — то выражением z — z3 а если гз = оо — то выражением z — zl 22 — 2, Если одна из точек г\, гг. г'з является точкой оо, то аналогич- аналогичные замены нужно произвести в левой части соотношения F). Тем самым предложение 1 полностью доказано. Чтобы ответить на вопрос аб единственности построен- построенного конформного преобразования, нам будет удобно рассмотреть предварительно неподвижные точки произвольного преобразо- преобразования Z — cz +J V' из группы Conf+, т. е. точки, оставляемые этим преобразованием на месте. Эти точки определяются из уравнения _ az + b Z~ cz + d ' т. е. из уравнения cz2 + {d - а) г — Ъ = О, (8) называемого уравнением неподвижных точек. При с ф 0 уравнение (8) имеет либо два различных корня, либо один двойной корень. При с = 0 и d ф а уравнение (8) имеет один корень-j . Однако в этом случае преобразование а — о, G) является преобразованием подобия и, по определению, оставляет на месте еще точку Мх. Поэтому целесообразно счи- считать, что при с = 0 уравнение (8) имеет также корень z = оо. Наконец, при с = 0 и d = а (т. е. в случае, когда ..преобразова- ..преобразование G) является параллельным переносом) уравнение (8) вообще не имеет конечных корней (конечно, если Ь Ф 0, т. е. если преобразование G) не тождественно). В этом случае мы будем условно считать, что оно имеет двойной корень z = оо. Резюмируя, мы получаем, что каждое конформное преобразование из группы Conf+, не яв- являющееся тождественным преобразованием, имеет либо две не- неподвижные точки, либо одну двойную неподвижную точку. В частности, если преобразование из группы Conf+ оставляет на месте три различные точки, то оно является тождественным преобразова- преобразованием, 691
Отсюда уже непосредственно вытекает ответ на вопрос об- единственности конформного преобразования, переводящего три данные точки в три данные точки: Предложение 2. Группа Conf+ содержит только одно преоб- преобразование, переводящее три различные точки zi, z2, z3 в три различные точки- z'i, zi, z3. Доказательство. Если существует два таких преобра- преобразования Qi и Q2, то преобразование Qf' ° йг оставляет на месте три различные точки Z\, z2, z3 и, следовательно, QT1 oQ2 = E, что противоречит условию Qi ф Q2. Аналогичные результаты имеют место и для преобразова- преобразований из смежного класса Conf". Предложение 3. Для любых двух троек точек zt, z2, z3 и z'i, z'2, z'i пополненной плоскости, не содержащих одинаковых точек, существует в смежном классе Conf" единственное пре- преобразование, переводящее точки zit z%, z3 в точки z[, z'2, z'3. Доказательство. Ясно, что через любые три различные точки пополненной плоскости проходит единственная окружность. Действительно, в случае, когда данные точки конечны и не лежат на одной прямой, это утверждение известно из элемен- элементарной геометрии. Если же эти точки лежат на одной прямой, или если одна из них является бесконечно удаленной точкой, то искомой окружностью будет прямая, проходящая через эти точки. В частности, через данные точки zit z2, z3 проходит некоторая окружность 2. Пусть 5 — инверсия относительно этой окруж- окружности (симметрия, если окружность 2 является прямой) и пусть Q+ — преобразование из группы Coni+, переводящее точ- точки zu z2, z3 в точки z'i, zi, z'3. Рассмотрим преобразование Являясь композицией преобразования 5 из смежного класса Conf~ и преобразования Q+ из группы Conf+, это преобразова- преобразование принадлежит смежному классу Conf". Кроме того, оно пе- переводит точки Zi, Z2, z3 в точки z'i, z'i, z'i, поскольку инверсия S оставляет точки zit z-i, z3 на месте. Тем самым существование искохмого преобразования доказано. Пусть теперь существует два преобразования Qj и Q2 из смежного класса Conf-, переводящих точки zu z2, za в точки z'i, zi, z'3. Рассмотрим преобразование QT ° й2. Это преобразование принадлежит группе Conf+ и оставляет и а месте точки z\, z%, z3. Поэтому оно является тождественным преобразованием, и, следовательно, Qi = Q2- 692
Тем самым предложение 3 полностью доказано. Подчеркнем, что в группе Conf существует, таким образом, два преобразования, переводящих точки zu z2, z3 в точки z'\, 22, z'3: одно — из группы Conf+, а другое — из смежного класса Conf~. Не нужно думать, что доказанное выше утверждение о не- неподвижных точках преобразований из группы Conf+ остается справедливым для преобразований из смежного класса Сопг. Напротив, легко видеть, что преобразование ,_ az+b Z ~ cz + d из смежного класса Conf- может иметь бесконечно много не- неподвижных точек, заполняющих целую окружность. Действительно, уравнение неподвижных точек для такого преобразования имеет вид: czz + dz — az — b = 0 (9) и потому при вещественных с и b и при d = —а является урав- уравнением некоторой окружности. Замечание 1. В общем случае уравнение (9) распадается на два уравнения, каждое из которых является уравнением окруж- окружности (или удовлетворяется тождественно). Действительно, по- положим с = Ci + ic2> b = — b\ — ib2, d = ui-\- ia2, a = — a{ — ia2, где Ci, c'2, bu b2 — вещественные числа, а а4 и a2 — комплексные. Подставив эти выражения в уравнение (9) и отделив веществен-, ную и мнимую части, мы, очевидно, получим уравнения c2zz -j- a2z + <22г + b2 = 0, каждое из которых является уравнением окружности или удов- удовлетворяется тождественно. Таким образом, каждое из уравнений A0) определяет либо пустое множество точек (окружность мнимого радиуса), либо точку (окружность нулевого радиуса), либо окружность (или прямую), либо всю плоскость. При этом в случае, когда оба уравнения A0) определяют окружности, эти окружности могут не пересекаться, касаться, пересекаться в двух точках и, на- наконец, совпадать. Кроме того, Случай, когда оба уравнения A0) удовлетворяются тождественно, очевидно, невозможен (по- (поскольку все коэффициенты а, Ь, с и d не могут одновременно 693-
¦быть равны нулю). Следовательно, всего возможно 21 различных случаев. В одиннадцати из этих случаев неподвижных точек нет, в шести имеется одна неподвижная точка, в одном — две непо- .движные точки и, наконец, в трех случаях неподвижные точки заполняют целую окружность. Тем самым доказано, что преобразование из смежного класса Conf" либо не имеет неподвижных точек, либо имеет одну или две неподвижные точ- точки, либо — целую окружность неподвижных точек. 4. Конформные преобразования и ориентации Пополненную плоскость мы будем считать ориентированной, если ориентирована исходная евклидова плоскость. Таким обра- образом, в частности, пополненная плоскость, отнесенная к комп- комплексной координате z, автоматически ориентирована. Основная цель этого пункта — переформулировать для по- пополненной плоскости определение ориентации таким образом, чтобы было удобно исследовать поведение ориентации при кон- конформных преобразованиях. Обычное определение ориентации (см. п. 1 § 4 гл. 1) как, скажем, класса одноименных неколли- неарных троек точек для такого исследования плохо приспособ- приспособлено, поскольку конформное преобразование неколлинеарную тройку точек может перевести в коллинеарную. Мы сначала обсудим понятие ориентации пополненной плос- плоскости на неформальном, наглядном, уровне, а затем дадим фор- формальное определение. Принципиальное отличие окружностей от прямых на евкли- евклидовой плоскости состоит в том (см. пп. 1 и 4 § 4 гл. 1), что ориен- ориентация окружности') определяет ориентацию плоскости, а ориен- ориентация прямой — не определяет. Как мы знаем, это связано с тем, что две стороны прямой совершенно равноправны, а стороны окружности — нет. Однако на пополненной плоскости по отно- отношению к конформным преобразованиям стороны окружности совершенно равноправны, ибо, например, инверсия относительно окружности переводит одну ее сторону в другую (подобно тому как симметрия относительно прямой переставляет ее стороны). Поэтому на пополненной плоскости мы для каждой окружности .X должны специально указывать ее сторону. Если теперь окружность 2 ориентирована (т. е. на ней ука- указано некоторое направление движения), то мы сопоставим этой ориентации правую ориентацию плоскости (ориентацию «про- «против часовой стрелки», см. п. 2 § 4 гл. 1), если при движении по окружности в данном направлении выбранная сторона остает- остается слева, и левую ориентацию плоскости (ориентацию «по ча- часовой стрелке»), если при этом движении выбранная сторона ') То есть области, на которые окружность разбивает плоскость. 694 . .
остается справа. Обратно, если на плоскости выбрана некоторая- ориентация о, то мы можем сопоставить ей ориентацию окруж- окружности 2, обладающую тем свойством, что при движении по ок- окружности в положительном (относительно этой ориентации) на- направлении данная сторона остается слева, если ориентация о — правая, и справа, если ориентация о — левая. Наконец, за- задание ориентации о плоскости и ориентации окружности Б опре- определяет некоторую сторону окружности, а именно, сторону, ко- которая при движении по окружности в положительном направ- направлении остается слева, если ориентация о — правая, и остается справа, если ориентация о — левая. Таким образом, из трех объектов: 1) ориентация плоскости, 2) ориентация окружности, 3) сторона окружности, любые два однозначно определяют третий. Замечание 1. Все это справедливо как для «настоящих» окружностей,, так и для прямых («окружностей, проходящих через точку М„»). При этом ясно, что для прямых мы получаем в точности результаты п. 4 § 3 гл. 1. Кроме того, если для окружности мы выберем сторону, содержащую ее центр, то получающееся соответствие между ориентациями плоскости и окружности будет совпадать с соответствием, описанным в п. 1 § 4 гл. 1 (поскольку при движении по окружности, скажем, против часовой стрелки ее центр остается слева). Окружности и прямые отличаются еще и в том отношении, что для задания ориентации на прямой нам нужны не три точки А, В, С, а только две точки А, В, такие, что А -^ В в данной ориентации. Однако фактически мы и на прямой имеем дело с тремя точками: третьей точкой является бесконечно удаленная точка Мх, и ориентация, в которой А <^ В, может быть описана как направление на прямой, в котором точка В разделяет точки А и Моо. Иными словами, задавая направление на прямой двумя точками А и В, мы, на самом деле, дополнительно требуем, чтобы при движении от точки А к точке В в этом направлении мы не проходили через точку М^. Если мы от этого последнего условия откажемся (подобно тому, как мы отказались выбирать сторону окружности обязательно там, где расположен ее центр), то для задания ориентации на прямой нам также по- понадобятся три точки А, В, С (одна из которых может быть точкой Моо). Подчеркнем, что если, например, точка С лежит между точ- точками А и В (в элементарно-геометрическом смысле), то ориен- ориентация, определенная точками А, В, С, будет обладать тем свой- свойством, • что при движении в положительном направлении (по» отношению к этой ориентации) от точки А к точке С мы долж- должны будем пройти через точку В, т. е. это будет направление, в котором С <^ А.. 695-
Суть дела здесь в том, что, пополнив прямую точкой Мх, мы превращаем ее в замкнутую линию, аналогичную окруж- окружности, Согласно сказанному выше, чтобы задать ориентацию плос- плоскости, достаточно задать ориентацию некоторой окружности (или прямой) и выбрать для'Этой окружности сторону. Чтобы задать ориентацию окружности, достаточно задать на ней три точки А, В, С, а чтобы задать сторону, достаточно задать про- произвольную точку D, расположенную на этой стороне. Следова- Следовательно, ориентация плоскости однозначно определена заданием четырех точек А, В, С, D, не принадлежащих одной окруж- окружности. Именно, чтобы определить по точкам А, В, С, D соответ- соответствующую ориентацию, нужно 1) провести через точки А, В, С окружность, 2) ориентировать эту окружность так, чтобы точка В раз- разделяла точки A yl С, 3) выбрать сторону окружности4) ABC, содержащую точку D. Тогда ориентация плоскости, определенная окружностью ABC и выбранной ее стороной, и будет ориентацией, соответствующей четверке А, В, С, D. Называя две четверки точек А, В, С, D и А', В', С, D' одно- одноименными, если они определяют одну и ту же ориентацию плос- плоскости, мы можем, следовательно, отождествить ориентации плоскости с классами одноименных четверок точек (не принад- принадлежащих одной окружности). Конечно, такое понимание ориентации плоскости не будет тавтологией только тогда, когда мы сумеем описать одноимен- одноименность четверок независимо от понятия ориентации. Решать эту задачу нам будет удобно в следующей поста- постановке: определить по данной четверке точек А, В, С, D, не при- принадлежащих одной окружности, задает ли она данную (ска- (скажем, правую) ориентацию плоскости или нет. При этом ответ должен быть получен в терминах, не связанных (по крайней мере явно) с понятием ориентации. Предположим сначала, что точка В является бесконечно удаленной точкой М^. Тогда окружность ABC будет прямой АС, ориентированной так, что С<С,А. Рассмотрим наряду с этой прямой также и прямую AD (т. е. окружность ABD), ориенти- ориентированную соответствующим образом (так, чтобы D-^A). По- Поскольку прямые АС и AD пересекаются в точке А и обе ориен- ') Окружность, проходящую через точки А, В, С и ориентированную так, чтобы точка В разделяла точки Л и С, мы будем обозначать символом ABC. 696
тированы, а на плоскости задана ориентация, то определен уголф от прямой AD к прямой АС. При этом точки А, Моо, С, D тогда и только тогда определяют данную ориентацию плоскости, когда угол ф положи- положителен: 0<ф< п. Это утверждение очевидно из чертежа. Задание. Дайте формальное доказательство. Таким образом, вопрос о том, определяет ли четверка А, М^, С, D данную ориентацию плоскости, однозначно решается в аависимости от величины угла ф. Чтобы получить аналогичный ответ в случае, когда точка В конечна, мы должны предварительно определить, что следует по- понимать под углом от одной ориентированной окружности к другой. Пусть 2— произвольная окружность, А — некоторая ее точка и се— касательная к окружности 2 в точке А. Заметим, что зада- задание ориентации окружности 2 однозначно определяет некоторую ориентацию прямой се. Наглядно эту ориентацию каса- касательной можно описать следующим образом: представим себе, что материальная точка, двигаясь по окружности в положитель- положительном направлении, освобождается от связей в точке А. Тогда она будет продолжать движение по касательной се. Направление этого движения и определяет ориентацию касательной се. Более формально, ориентацию касательной, соответствующей данной ориентации окружности 2, можно определить следую- следующим способом. Рассмотрим на окружности точки А, В, С, опре- определяющие заданную ориентацию окружности и выбранные так, чтобы точка В находилась от точки А на расстоянии, меньшем четверти окружности, р/ N^ Спроектировав точку В из центра окруж- окружности на прямую се, мы получим на прямой се некоторую точку В' Тогда ориентация прямой се задается направлением, в кото- д 2F "~ ром А -<[ В'. Конечно, это определение нуж- нуждается в проверке корректности, т. е. в доказательстве неза- независимости получающейся ориентации на прямой от выбора точки В. Упражнение. Докажите корректность определения ориентации касатель- касательной. Таким образом, мы видим, что касательная к ориентированной окружности естественным образом определяется как ориентированная прямая. 697 1^
Это утверждение остается справедливым и для случая, ког- когда окружность 2 является прямой, если под касательной к пря- прямой понимать саму эту прямую. Пусть теперь Si и ?г — две ориентированные окружности, имеющие общую точку А, и пусть cti и сег — касательные к этим окружностям в точке А. Угол от ориентированной прямой cti к ориентированной прямой ссг мы и будем называть углом от окружности Si к окружности 22 в их общей точке А. Согласно сказанному выше, угол от ориентированной прямой к ориентированной прямой попадает под это общее определение. В изложенном определении молчаливо предполагалось, что точка А конечна. Чтобы перенести его на случай, когда А — Моо, следует определить, что такое угол (рх между двумя ориентированными прямыми в точке М^. Если эти прямые параллельны и ориентации их одинаковы, мы, по определению, положим Аналогично, если прямые параллельны, но имеют противопо- противоположные ориентации, то мы положим Наконец, если прямые не параллельны и образуют (в их конеч- конечной точке пересечения) угол ф, то мы, по определению, положим Фоо = - Ф- Последнее определение оправдывается тем, что если две (на- (настоящие) окружности пересекаются в точках Л и В, то, как легко видеть, угол от первой окружности ко второй в точке А знаком отличается от угла в точ- точке В. Рассмотренный выше случай В = Мао наво- наводит на мысль о том, что четверка точек А, В, С, D, не принадлежа- щих одной окружности, тогда и только тогда определяет данную ориентацию плоскости, когда угол от окружности ABD к окружности ABC в точке А по- положителен (в предположении, конечно, что этот угол вычисляется относительно данной ориентации плоскости и выбирается в пре- пределах от —я до л). Это утверждение действительно верно, и его доказательство сводится к рассмотрению пяти возможных случаев: когда все точки А, В, С, D конечны, когда точка А является точкой Моо, когда точка В является точкой Мх (случай, выше уже рассмот- рассмотренный), когда точка С является точкой Моо, и, наконец, когда точка D является точкой Мх,. Справедливость утверждения в «98
каждом из этих случаев непосредственно вытекает из чертежа.- Формальные доказательства мы опустим. Полученные результаты приобретут ценность только тогда, когда мы научимся вычислять угол <р (скажем, по координатам точек А, В, С, D). Выведем соответствующую формулу. Предполагая все точки А, В, С, D конечными, и, следова- следовательно, окружности ABD и ABC настоящими, рассмотрим прямые СВ, СА, DB, DA и АВ, ориентированные в соответствии с указанным порядком точек (т. е., например, прямая СВ ориентирована так, что С<^В). Пусть <xi — касательная в точке А к окружности ABD, а а% — касательная в точке А к окружности ABC. Кроме того, пусть у — угол от прямой СВ к прямой ' СА, б — угол от прямой DB ,к прямой DA, ф4 — угол от прямой АВ к касатель- касательной аи ф2 — угол от прямой АВ к касатель- касательной а% По определению, Кроме того, по известной теореме о вписанных углах (спра- (справедливой и для ориентированных углов): Ф,= Следовательно, Предположим теперь, что на плоскости нам задана комп- комплексная координата z, определяющая данную ориентацию о (т. е. такая, что соответствующие прямоугольные координаты х, у определяют ориентацию о). Пусть — комплексные координаты точек А, В, С, D. Согласно извест- известной геометрической интерпретации аргумента комплексного числа аргумент argB2 — z3) числа 22 — z3 равен углу от оси Ох к прямой СВ, а аргумент argBj — z3) числа г4 — z3 равен углу от оси Ох к прямой СА. Следовательно, угол у равен раз- разности этих аргументов, т. е. аргументу соответствующего част- частного:
Аналогично, 2 4 •Следовательно, ¦ > ' <p = arglP, A) где 22 — 23 22 — 24 V Пусть теперь одна (и только одна) из точек А, В, С, D яв- является бесконечно удаленной точкой Мм. Оказывается, что формула A) остается справедливой, если считать, что — 2з при z, = C) Г ТГ 2 — 24 2[ — 24 23 . j = 2, - Z, z2 — г3 г2 — 23 т. е. если определять число W формулой, получающейся из фор- формулы B) соответствующим предельным переходом. Задание. Докажите это утверждение. Если точки А, В, С, D принадлежат одной окружности, т. е. если окружности ABD и ABC совпадают, то естественно считать (по определению!), что ф = 0, если ориентации окружностей ABD и ABC совпадают, и ф = я, если эти ориентации различны. Ока- Оказывается, что формула A) остается справедливой и в этом случае. Задание. Докажите это утверждение (не забудьте рассмотреть случай, когда окружности ABD и ABC проходят через точку М„). Сопоставляя все сказанное мы немедленно получаем, что точки А, В, С, D тогда и только тогда определяют ориента- ориентацию, задаваемую координатой z, когда аргумент числа W поло- положителен. Теперь мы уже можем перейти к формальным определениям. (Определение 1. Число W, определенное формулой B) (или формулами C)), называется двойным отношением точек Л, В, C,D. Из геометрической интерпретации модуля разности двух комплексных чисел непосредственно вытекает, что модуль \W\ двойного отношения четырех точек не зависит от выбора координатной системы z. 700
Действительно, если, например, все точки А, В, С, D конеч-" ны, то |Ц7 ,_\АС\ . \АР\ 1 w ' \ВС\ ' \BD{' Что же касается аргумента двойного отношения W, то, как показывает формула A), его абсолютная величина имеет ин- инвариантный геометрический смысл (и потому не зависит от выбора координатной системы z), а знак определяется ориента- ориентацией плоскости, задаваемой координатой z (и потому при пере- переходе к другой координатной системе может измениться). Таким образом, с точностью до знака аргумента (т. е. с точностью до пере- перехода к комплексно-сопряженному числу W) двойное отношение не зависит от выбора координатной системы (т. е. определено корректно). Замечание 2. Мы доказали корректность определения числа W, пользуясь геометрическими соображениями. Методологически более выдержанным было бы прямое алгебраическое доказатель- доказательство, использующее формулы перехода от одной координатной системы к другой. Упражнение. Дайте алгебраическое доказательство корректности опреде- определения двойного отношения четырех точек. Из формулы A) непосредственно вытекает следующее Предложение 1. Точки А, В, С, D тогда и только тогда при- принадлежат одной окружности, когда их двойное отношение W вещественно. Задание. Докажите предложение 1 прямым вычислением, не используя формулы A) (не забудьте рассмотреть случай, когда окружность является прямой). Определение 2. Две четверки точек пополненной плоскости, каждая из которых ,состоит из точек, не принадлежащих одной окружности, называются одноименными, если двойные отноше- отношения W этих четверок имеют аргументы arg W одного знака (ко- (конечно, при условии, что эти аргументы выбраны так, чтобы —я < arg W < я). Согласно предложению 1 это определение имеет смысл (ар- (аргументы двойных отношений W не могут быть равны ни нулю, ни я). Кроме того, ясно, что это определение корректно, т. е. не зависит от выбора координатной системы z. Очевидно, что отношение одноименности четверок точек по- пополненной плоскости является отношением эквивалентности. Определение 3. Соответствующие классы эквивалентности называются ориентациями пополненной плоскости. Пополнен- Пополненная плоскость, для которой выбрана ориентация, называется ориентированной. 701
Проведенные выше неформальные рассмотрения показы- показывают, что это определение равносильно определению, принятому в начале этого пункта. Теперь мы можем геометрически охарактеризовать разли- различие между конформными преобразованиями из группы ConF" и из смежного класса Conf". Определение 4. Мы будем говорить, что конформное преоб- преобразование Q сохраняет ориентации, если для любой четверки точек А, В, С, D, не принадлежащих одной окружности, чет- четверка A' = Q(A), B' = Q(B), C' = Q(C), D' = Q(D) (также не принадлежащая одной окружности) одноименна чет- четверке А, В, С, D (определяет ту же ориентацию). Если же для любой четверки А, В, С, D четверка А', В', С, D' определяет противоположную ориентацию, мы будем говорить, что кон- конформное преобразование Q обращает ориентации. Теорема 1. Конформное преобразование тогда и только тогда принадлежит группе Conf+ (смежному классу Conf-), когда оно сохраняет (обращает) ориентации. Замечание 3. Априори могли бы существовать конформные преобразования, не сохраняющие и не обращающие ориента- ориентации, т. е. такие, что для одной четверки А, В, С, D четверка А', В', С, D' определяет ту же ориентацию, что и четверка А, В, С, D, а для другой четверки А, В, С, D — противоположную. Согласно теореме 1 таких конформных преобразований не суще- существует. Упражнение. Докажите этот факт непосредственно (не пользуясь тео- теоремой 1). Мы выведем теорему 1 из следующего предложения: Предложение 2. Для любого преобразования из группы Conf+ и любой четверки различных точек А, В, С, D двойное от- отношение W точек А', В', С', D' равно двойному отношению W точек А, В, С, D: Аналогично, для любого преобразования из смежного класса Conf-. Доказательство. По определению, конформное преоб- преобразование из группы Conf+ записывается в комплексной коорди- лате г формулой вида ,_ az + b z ~ cz + d ' 702.
При этом, без ограничения общности, можно предполагать, что эта запись нормирована, т. е. что а Ь с d , 1 Пусть ги г2, 23, 24 — координаты точек А, В, С, D, а г\, гк, г'з, z'i — координаты точек А', В', С, D'. Тогда , / azi + Ь аг3 + Ь __ {ad — be) (zt — z3) Zl Z3~~ cZl+d czs + d (czl + d) (cz3 + d) ~~ (сг, + d) (cz3 + d) ' и аналогично, • d) (CZ3 + d) ' Zl — Zj "" ~4 (czi+d)(czi + d)' f f Z% "~~ *^4 2 4 (cz2 + d) (сг4 + d) Поэтому z'i — 4 _ г, — z3 cz2 + d Z2 ~Z3 Z2~ Z3 cz,- + d ' zi — Z4 cz2 + d и, следовательно, 2j "¦" Zq 2 i —~ Z^ Z^ "~™ Zo Z j —^ 2д Z2 Z3 Z2 — Z4 Z2 — Z3 Z2 — т. e. W' = W. Равенство для конформных преобразований из Conf~ доказывается ана- аналогично. Тем самым предложение 2 полностью доказано. Доказательство теоремы 1. Если W = W, го arg W = arg W, а если W = W, то arg W = —arg W. Поэтому в силу определения 1 четверки А, В, С, D и А', В', С', D' опреде- определяют в первом случае одну и ту же ориентацию, а во втором — противоположные ориентации. 703
5. Конформная геометрия Определение 1. Свойство фигур на пополненной плоскости называется конформно инвариантным, если вместе с некоторой фигурой X этим свойством обладает и "любая фигура X', полу- получающаяся из фигуры X произвольным конформным преобразо- преобразованием. Изучение конформно инвариантных свойств составляет предмет конформной геометрии. Пополненная плоскость, на которой рассматривается кон- конформная геометрия, называется конформной плоскостью. Все точки конформной плоскости совершенно равноправны, так что, в частности, понятие конечных точек и бесконечно уда- удаленной точки в конформной геометрии отсутствует. Замечание 1. Можно, конечно, рассматривать лишь конформ- конформные преобразования, оставляющие точку М», на месте. В соот- соответствующей конформно-евклидовой геометрии понятие конеч- конечных точек смысла уже имеет. Взаимоотношение между конформной и конформно-евклидо- конформно-евклидовой геометриями полностью аналогично взаимоотношению между проективной и аффинно-проективной геометриями. Поскольку конформные преобразования, оставляющие на ме- месте точку Мао, являются (см. п. 2) не чем иным, как преобразова- преобразованиями подобия (возможно, не сохраняющими ориентации); кон- конформно-евклидова геометрия отличается от геометрии подобия (изучающей свойства, одинаковые у всех подобных фигур) лишь наличием дополнительной точки Мх. Таким образом, взаимоотношение между конформно-евкли- конформно-евклидовой геометрией и- геометрией подобия полностью аналогично взаимоотношению между аффинно-проективной и аффинной гео- геометриями. Формально-аксиоматическое определение конформной плоско- плоскости без труда получается на основе общих идей § 3 гл. 2. Введем в рассмотрение множество С+ всех комплексных чи- чисел, пополненное символом оо, и группу Conf(O) его дробно- линейных и сопряженно дробно-линейных преобразований z'= az cz + d ' az + b cz + d ' b 0. d Определение 2. Множество $, для которого задано семейство Соог(ф) его биективных отображений а: на множество С+, называется конформной плоскостью, если вы- выполнены следующие две аксиомы: 704
Аксиома 1. фоаеСоог(Ф) для любых аеСоог(Ф) «те е Conf (О). Аксиома 2. а' ° а'1 е Conf (С+) для любых а,а' е Соог (Щ. Согласно этому определению множество С+ можно превратить в конформную плоскость, полагая Соог (С+) = Conf (С+). Эта плоскость называется стандартной конформной плоскостью. Конформная плоскость в смысле определения 1 является, ко- конечно, конформной плоскостью в смысле определения 2. Изоморфизмы конформных плоскостей определяются очевид- очевидным образом и для них имеют место известные нам общие тео- теоремы. При этом, автоморфизмами конформных плоскостей яв- являются конформные преобразования и только они (это лишь иная формулировка предложения 1 п. 2). Важный вариант конформной геометрии мы получим, заме- заменив группу Conf группой Conf+ конформных преобразований, со- сохраняющих ориентации. Мы будем называть эту геометрию спе- специальной конформной геометрией. Чтобы получить описываю-' щие ее аксиомы, нужно в аксиомах 1 и 2 группу Conf(C+) заме- заменить группой Conf+(C+) дробно-линейных преобразований. Поскольку Conf+(C+)c:Conf(C+), каждая специальная конформная плоскость автоматически опре- определяется как конформная плоскость. Чтобы, обратно, от кон- конформной плоскости перейти к специальной конформной плоско- плоскости, нужно зафиксировать некоторую координатную систему (ср., например, в п. 5 § 1 гл. 3 обсуждение аналогичной связи между аффинно-проективной и проективной геометриями). При этом две координатные системы а и а' тогда и только тогда приводят к одной и той же специальной конформной плоскости, когда т. е. когда они одноименны. Другими словами, чтобы получить из конформной плоскости специальную конформную плоскость, ну- нужно зафиксировать некоторую ориентацию. По этой причине спе- специальная конформная геометрия называется также конформной геометрией ориентированной плоскости. Замечание 2. Комплексная координата z, которую мы исполь- использовали выше, к сожалению, не вполне адекватна конформной геометрии, поскольку точка Мх имеет в ней особую координату z = оо. Более отвечают сути дела две однородные координаты Z\ 23 М, М. Постников 705
и 2г, связанные с координатой г соотношением) (и принимающие значения не в О, а в С). В этих координатах дробно-линейные преобразования записываются формулами pz\ = azl + bz2, pz'2 = czx + dzr Но это — в точности формулы, описывающие проективные преоб- преобразования комплексной проективной прямой. Следовательно, конформные ориентированные плоскости — это не что иное, как комплексные проективные прямые, а конформные преобра- преобразования, сохраняющие ориентацию, — это проективные преобра- преобразования комплексных проективных прямых. Другими словами, конформная геометрия ориентированной плоскости — это в точности проективная геометрия комплексной прямой. В конформной геометрии понятие прямой смысла не имеет. Оно заменяется понятием окружности. Отметим, что, тем не ме- менее, понятия центра и радиуса окружности в конформной гео- геометрии отсутствуют. Две области, на которые окружность разби- разбивает конформную плоскость, совершенно равноправны. Они называются полуплоскостями, определенными данной окруж- окружностью. Поскольку любые три точки конформной плоскости можно конформным преобразованием перевести в любые другие три точки, фигура, состоящая из трех точек, никаких конформных инвариантов не имеет. Тем более это справедливо для фигуры, состоящей из двух точек. Поэтому никакого аналога понятия расстояния в конформной геометрии не имеется. Напротив, фигура, состоящая из четырех точек, обладает семиинвариантом W — двойным отношением этих точек. Этот семиинвариант не меняется при преобразованиях из подгруппы Соп{+ и переходит в комплексно-сопряженное число при npei образованиях из смежного класса Conf". Следовательно, в-кон- формной геометрии ориентированной плоскости он является ин- инвариантом. Таким образом, в проективной геометрии комплексной прямой имеется инвариант четырех точек — их двойное отношение. Оказывается, что построе- построение этого инварианта может быть перенесено в проективную геометрию пло- плоскости или пространства (и притом над любым полем). В проективной гео- геометрии этот инвариант играет роль, сравнимую с ролью инварианта двух точек — расстояния в евклидовой геометрии, и никакое более или менее глубокое развитие проективной геометрии без него невозможно. К со- сожалению, все эти вопросы далеко выходят за рамки нашего элементарного курса. 70S .
В отличие от понятия длины понятие угла (между окруж- окружностями) в конформной геометрии смысл имеет, поскольку со- согласно формуле A) п. 4 угол между окружностями выражается через инвариант W. При формально-аксиоматическом построении конформной геометрии формулу A) п. 4 мы должны принять за определение. Это делается следующим образом. Пусть Ei и Ег— две ориентированные окружности на кон- конформной ориентированной плоскости, пересекающиеся в точках А и В. Выберем на окружности Si точку С, отличную от точек А, В и такую, что тройка (А, В, С) определяет данную ориента- ориентацию окружности Ei. Аналогично, на окружности Е2 выберем точку D, отличную от точек А, В и такую, что тройка (А, В, D) определяет данную ориентацию окружности Ег. Пусть W — двой- двойное отношение точек А, В, С, D. Определение 3. Аргумент arg W двойного отношения W на- называется углом от ориентированной окружности Si к ориентиро- ориентированной окружности 2г в точке А на ориентированной конформной плоскости. Конечно, в рамках формально-аксиоматического построения конформной геометрии это определение требует проверки кор- корректности, т. е. доказательства независимости аргумента arg W от выбора точек С и D. Упражнение. Докажите корректность определения 2. Задание. Докажите, что угол от окружности Si к окружности 2г в точ- точке В равен —arg W. На неориентированной конформной плоскости углом между (неориентированными) окружностями Si и Е2 называется абсо- абсолютная величина |argW| аргумента двойного отношения точек А, В, С, D, где А и В, как и выше,-—общие точки окружностей Si и Ег, а С и D — их произвольные точки, отличные от точек А и В. Это определение также корректно. Дальнейшее развитие конформной геометрии мы предоставим инициативе читателя. § 4. ГРУППЫ И ГЕОМЕТРИИ 1. Геометрии с данной группой автоморфизмов Все разнообразные «геометрии», изученные в предыдущих главах, строились по некоей единой схеме. Рассмотрим эту схему в общем виде. В первую очередь мы фиксируем некоторую числовую модель Шо, элементы («точки») которой тем или иным способом строят- строятся из чисел (вообще говоря, принадлежащих произвольному полю К), и некоторую группу преобразований Go этой модели. Например, для аффинной геометрии плоскости Шо = R2 и Go = = Aff (R2), для евклидовой геометрии Шо = R2 и Go = Ort(R2), 23* . 707
для проективной геометрии 2Яо = RP2 и Go = Proj(RP2), для конформной геометрии Шо = JC,+ и Go = Conf(.C+), и т. д. Далее, мы рассматриваем произвольное множество Ш и се- семейство Соог(Шг) его биективных отображений («координатных систем») на множество Шо, подчиненное известным аксиомам 1 и 2. Это множество мы и объявляем «областью действия» (мо- (моделью) соответствующей геометрии. Тот факт, что геометрия (при данных Зйо и Go) получается только «одна», находит стро- строгое выражение в утверждении об изоморфности различных се моделей (свойство полноты аксиом). Автоморфизмы каждой модели Ш совпадают с преобразова- преобразованиями «по равенству координат» и составляют группу G = = Aut(ЯЛ), изоморфную группе GQ = Aut(Ti0) (изоморфизм группы G на группу Go задается произвольной координатной си- системой a: Wl—*.SMO и определяется формулой фг->а»фоач). После того как группа G построена, мы можем забыть о чис- числовой модели Зйо и определить геометрию модели Ш как науку, изучающую свойства подмножеств множества Ш, инвариантные относительно группы G. Числовая модель Зйо и ее группа автоморфизмов Go нам нужна для того, чтобы в произвольной модели Ш можно было говорить о координатах и тем самым применить к изучению мо- модели Ш метод аналитической геометрии. Самым общим образом можно рассматривать произвольное множество Ш1 и произвольную группу G его преобразований и называть «геометрией» этого множества науку, изучающую свойства подмножеств, инвариантные относи- относительно группы G. В этой общности геометрия растворяется в общей теории групп преобразований и теряет свою специфику. Изложенный общий взгляд на геометрию был выдвинут в конце XIX в. немецким математиком Ф. Клейном. Он позволяет обозреть с единой точки зрения всевозможные геометрии и рас- расположить их в определенном иерархическом порядке. Например, возможна ситуация, когда две геометрии имеют одну и ту же числовую модель ?Шо и отличаются лишь соответ- соответствующими группами Go и Но, причем группа Но является под- подгруппой группы Go: HoczGo (стандартный пример: евклидова геометрия с группой Ort(R2) и аффинная геометрия с группой Aff(R2)). В этом случае любая модель 31 геометрии с группой Но есте- естественным образом определяется как модель SK геометрии с груп- группой Go: достаточно принять за координатные системы модели Ш всевозможные отображения вида <р°а, где а — произвольная координатная система модели 31, а <р — произвольное преобразо- преобразование из группы Go; см. п. 3 § 3 гл. 2, где все это подробно об- обсуждено для случая #o = Ort(R2) и G0 = Aff(R2). В частности, 708 •
каждая координатная система модели $ft будет координатной системой модели 50J: Соог C1) <= Соог (Ж) («любые прямоугольные координаты являются аффинными коор- координатами») и любой автоморфизм модели $Я будет автоморфиз- автоморфизмом модели 50J («любое ортогональное преобразование является аффинным преобразованием»), так что группа Я автоморфизмов модели SKI будет подгруппой группы G автоморфизмов модели Ш: HczG. При этом для каждой координатной системы а модели 5Л (рас- (рассматриваемой как координатная система модели 50J) соответ- соответствующий изоморфизм ф н-» а о ф о а группы G на группу Go будет отображать подгруппу Я на под- подгруппу Но и его ограничение на эту подгруппу будет совпадать с изоморфизмом Н^-Но, определенным системой а, рассматри- рассматриваемой как координатная система модели SR: Я c=G I I #oc=G0 Поскольку Я a G, любое свойство, инвариантное относитель- относительно G, будет инвариантно и относительно Я, так что любое утвер- утверждение геометрии с группой G будет справедливо и в геометрии с группой Я. В этом смысле геометрия с «меньшей» группой Я «богаче» геометрии с «большей» группой G, т. е. геометрия с группой G является «частью» геометрии с группой Я («аффин- («аффинная геометрия является частью евклидовой»). Обратный переход от геометрии с группой Go к геометрии с группой Яо осуществляется выбором для любой модели Ш гео- геометрии с группой Go произвольной координатной системы а0: ЗЯ-^ЗИо. Когда эта система выбрана, мы можем построить модель З^а, геометрии с группой Но, считая, что как множество она совпа- совпадает с моделью Ш, и принимая за ее координатные системы все- всевозможные отображения вида ф ° ао, где ф —произвольное пре- преобразование из группы Но: Модель Ша„ зависит, естественно, от системы ао, причем ~УСа„ — ~УСа, тогда и только тогда, когда (см., например, в п. 5 § 1 гл. 4 случай Яо = Aff(RP2), Go = = Proj(RP2)). 709
Отметим две важные особенности этой конструкции. Во-первых, модель Ша<, определена для любой координат- координатной системы «о. В частности, для случая Яо = Ort(R2) и Go = = Aff(R2) это означает, что в аффинную плоскость можно так ввести метрику (измерение углов и длин), чтобы любой, напе- наперед заданный аффинный репер Ое\е2 оказался бы прямоуголь- прямоугольным репером. Во-вторых, модели геометрии с группой Но, имеющие вид Зйоо,обладают дополнительной структурой, которой не обладают произвольные модели. Эта дополнительная структура состоит в том, что семейство Соог (ЭЖао) координатных систем мо- модели 9№а0 вполне определенным образом вложено в семейство Соог(ЯЯ) координатных систем модели WI. Например, для евклидовой геометрии утверждение, что дан- данный аффинный репер является евклидовым (прямоугольным) репером, зависит, кроме всего прочего, от выбора эталона длины, т. е. отрезка, длина которого принята за единицу. Если мы возь- возьмем другой эталон длины, то мы получим совсем другие евкли- евклидовы координатные системы. Поэтому при изучении геометрии на моделях вида ЗЯал нужно очень внимательно следить, чтобы доказываемые утверждения не зависели от вложения Соог CWao) в Соог (Ш) (конечно, никто не запрещает рассматривать утверждения, зависящие от этого вложения, — например, в евклидовой геометрии утверждения, зависящие от выбора эталона длины, — но это будут уже утвер- утверждения, не принадлежащие рассматриваемой геометрии). Для дополнительной иллюстрации изложенных общих сооб- соображений мы рассмотрим в следующих пунктах несколько инте- интересных примеров. При этом мы, как правило, ограничимся гео- геометриями, числовой моделью которых является множество R2. Геометрии с моделью R2 можно представлять себе действую- действующими на обычной, неформально рассматриваемой, плоскости. Как мы знаем (см. п. 2 § 1), для того чтобы в геометрии на плоскости с группой автоморфизмов G имело смысл понятие пря- прямой, необходимо (и достаточно), чтобы группа G была подгруп- подгруппой аффинной группы Aff B). Такого рода геометрии мы будем называть геометриями аффинного типа. За недостатком места мы в основном ими и ограничимся. Аналогично, геометрии с моделью RP2 можно представлять себе действующими на расширенной плоскости. Для того чтобы в такой геометрии имело смысл понятие прямой, необходимо и достаточно, чтобы ее группа автоморфизмов G была подгруппой группы Proj B). Некоторые из таких геометрий проективного типа чрезвычайно интересны, но, к сожалению, у нас нет воз- возможности здесь их рассмотреть. По определению, чтобы получить какую-нибудь геометрию аффинного типа, нужно выделить в группе Aff B) определенную 710
подгруппу Существует некий общий метод выделения подгрупп группы AffB) (и, вообще, любой группы преобразований G) которым мы и будем в дальнейшем пользоваться. Этот метод' состоит в том, что фиксируется некоторый геометрический' объект (точка, ориентация, бивектор, направление и т. п.) и рассматрит ваются все преобразования, оставляющие этот объект инвариантным. Ясно, что эти преобразования образуют под- подгруппу группы Aff B) (конечно, эта подгруппа может оказаться неинтересной: например, совпадать со всей группой Aff B), или, наоборот, содержать только тождественное преобразование Е). Вопрос о том, можно ли таким образом задать произвольную подгруппу группы Aff B), мы рассматривать не будем. 2. Простейшие геометрии аффинного типа Наиболее близкой к аффинной геометрии геометрией аффин- аффинного типа является геометрия с группой Aff+B) всех аффинных преобразований, сохраняющих ориентации. Мы будем называть эту геометрию специальной аффинной геометрией. Отметим, что в то время как имеет смысл говорить об аффинной геомет- геометрии над произвольным полем К (см. п. 4 § 3 гл. 2), специальная аффинная геометрия определена лишь над полем R. «Евклидовым» вариантом специальной аффинной геометрии является специальная евклидова геометрия с группой Ort+B) всех сохраняющих ориентации ортогональных преобразований. Эта геометрия отличается от евклидовой геометрии только тем, что симметричные фигуры в ней считаются различными. Чтобы проиллюстрировать различие между евклидовой и спе- специальной евклидовой геометрией, можно, например, указать, что понятие векторного произведения (п. 6 § б гл. 1) принадлежит специальной евклидовой геометрии (пространства); в собственно евклидовой геометрии это понятие отсутствует. Плоскость, в которой действует специальная аффинная (или специальная евклидова) геометрия, естественно называть спе- специальной аффинной (соответственно — евклидовой) плоскостью. Чтобы из аффинной плоскости WI получить специальную аффин- аффинную плоскость ЯЯспец, нужно, следуя общей схеме, изложенной в п. 1, выбрать некоторую аффинную координатную систему а: Ш—*-R2 и рассмотреть все аффинные координатные системы вида ф о а, где ф е Aff+(R2). При этом две аффинные координат- координатные системы «1 и аг тогда и только тогда приводят к одной и той же специальной аффинной плоскости, когда а^а^ е Aff+ (R2), т. е. когда эти системы одноименны (определяют одну и ту же ориентацию). Следовательно, переход от аффинной плоскости к специальной аффинной плоскости заключается в вы- выборе на плоскости некоторой ориентации. В этом смысле можно сказать, что специальные аффинные плоскости являются не чем иным, как ориентированными аффинными плоскостями. 711
Однако выбор "двух различных ориентации приводит к раз- различным (хотя, конечно, и изоморфным) специальным аффин- аффинным плоскостям. Поэтому, представляя себе специальную аф- аффинную плоскость как ориентированную аффинную плоскость, надо постоянно следить за тем, чтобы результаты не зависели от выбора ориентации. Это является проявлением общего феномена зависимости от вложения Соог C#а0) в СоогC№), который мы об- обсуждали в п. 1. Конечно, все это с равным правом справедливо и для специ- специальных евклидовых плоскостей. Геометрия с группой AffoB) всех аффинных преобразований плоскости, оставляющих на месте некоторую точку О, называет- называется центроаффинной геометрией, а соответствующая плоскость — центрированной аффинной плоскостью. Центроаффинная геомет- геометрия отличается от аффинной геометрии тем, что точка О играет в ней особую роль. Координатными системами центроаффинной геометрии яв- являются аффинные координатные системы с началом в точке О. Центроаффинная геометрия определена, конечно, и для слу- случая произвольного поля К. Точки центрированной аффинной плоскости находятся в есте- естественном биективном соответствии с векторами из VectB) (точке М соответствует ее радиус-вектор ОМ). Поэтому в цен- центроаффинной геометрии можно, в частности, говорить о сумме точек и о произведении точки на число (понятия, в общей аф- аффинной геометрии смысла не имеющие). Вообще, поскольку группа AffoB) изоморфна группе обратимых линейных операто- операторов ОрB), можно сказать, что центроаффинная геометрия яв- является не чем иным, как геометрией линеала VectB) относи- относительно группы ОрB). Вариантом центроаффинной геометрии, «различающим сим- симметричные фигуры», является специальная центроаффинная гео- геометрия с группой Affo B) всех сохраняющих ориентации аффин- аффинных преобразований, оставляющих точку О на месте. С учетом сказанного выше можно сказать, что специальная центроаффин- центроаффинная геометрия является не чем иным, как геометрией ориентиро- ориентированного линеала VectB). Евклидовым вариантом центроаффинной геометрии является центроевклидова геометрия с группой OrtJ B), состоящей из всех ортогональных преобразований, оставляющих точку О на месте. Эта геометрия совпадает с «метрической геометрией век- векторов» из VectB). В ней имеют смысл понятия длины точки и угла между двумя точками (впрочем, обычно длину точки, т. е. длину соответствующего радиус-вектора, называют нормой точ- точки, а угол между двумя точками, т. е. угол между.соответствую- между.соответствующими радиус-векторами, — угловым расстоянием между этими точками). - 712
Можно также рассматривать специальную центроевклидову геометрию с группой OrtJ B) = Roto B) всех вращений вокруг точки О. Эта геометрия отличается от центроевклидовой геомет- геометрии только тем, что симметричные фигуры (с осью симметрии, проходящей через точку О) в ней считаются различными. Пусть Ф — произвольное аффинное преобразование плоско- плоскости. В некоторой системе аффинных координат х, у с репером Ое\е2 это преобразование выражается, как мы знаем, форму- формулами где А = а\ а\ а\ а\ — матрица индуцированного линейного оператора Ф в базисе ev e2. В любом другом базисе е\, е'2 матрицей оператора Ф является матрица С~[АС, где С — матрица перехода от базиса еи е2 к базису е\, е'2 (см. п. 3 § 7 гл. 1). Так как I Г~1 А Г I \ Г V1 -\ А \ \ С \ — \ А \ то, следовательно, определитель \А\ матрицы А не зависит от выбора репера Ое{е2. Этот определитель мы будем называть определителем аф- аффинного преобразования Ф и будем его обозначать символом |Ф| или det Ф. Согласно только что доказанному, это определение коррект- корректно (не зависит от выбора репера Oeie2). Геометрический смысл определителя аффинного преобразова- преобразования выясняется следующим предложением: Предложение 1. Пусть X — произвольная плоская фигура и пусть X' — фигура, получающаяся из неё аффинным преобразо- преобразованием Ф. Тогда площадь фигуры X' равна площади фигуры X, умноженной на абсолютную величину определителя преобразо- преобразования Ф: площ. X' = | det Ф [ • площ. X. Доказательство. Выберем на плоскости некоторую пря- прямоугольную систему координат Оху. Тогда, как известно из ана- анализа, площадь фигуры X будет равна„абсолютной величине инте- интеграла [jdxdy. х 713
С другой стороны, согласно формуле замены переменных в двойной интеграле при любом преобразовании плоскости, выра- выражающемся в координатах х, у формулами y' = g(x,y), имеет место равенство J X где X'— образ множества X при преобразовании B), а at df d(f,g) д (х, у) дх ду dg dg дх ду — якобиан этого преобразования. Для завершения доказательства остается заменить, что в на- нашем случае преобразование B) выражается формулами A) и потому имеет постоянный якобиан, равный определителю преоб- преобразования Ф. Для читателей, не знакомых с интегральным исчислением, дадим дока- доказательство, не использующее интегралов. Пусть снова Оху — произвольная система прямоугольных координат на плоскости. Всевозможные прямые вида х = гае и у = те, где е > 0, а га и m — произвольные целые числа, разбивают плоскость на квадраты Ке со сторонами, равными е (и потому имеющими площадь е2). Пусть Ne — число всех таких квадратов, содержащихся в X. Тогда по определению площади площ. X = lim (JVee2). 8->0 Предположим, что наше аффинное преобразование Ф является компози- композицией двух сжатий: одного — к оси Ох с коэффициентом ki и другого — к оси Оу с коэффициентом ki. При этом преобразовании квадраты Кв перейдут в прямоугольники Ks со сторонами длины kis и fes (и потому имеющие площадь &ift2e2), а число всех таких прямоугольников, содержащихся в X', будет равно JVe. Поскольку при вычислении площади фигуры X' мы с рав- равным правом вместо квадратов можем использовать прямоугольники /f?) то площ. X' = !im (JVe• fttft262) = k\k2' lim (iVee2) = fci&2• площ. X. e-»o »0 Поскольку определитель преобразования Ф равен, очевидно, kikz, тем самым для рассматриваемых преобразований предложение 1 доказано. Пусть теперь преобразование Ф ортогонально. При этом преобразовании квадраты Ке перейдут в .некоторые квадраты Ке той же площади е.2, но только, возможно, повернутые (и сдвинутые), причем число квадратов Ке, содержащихся в X', будет по-прежнему равно числу JV8 квадратов К&, со- содержащихся в X. Следовательно, площ. X' = lim (NEe2) = площ. X. 714
Таким образом, и для ортогональных преобразований (имеющих, как мы знаем, определители ±1) предложение 1 справедливо. Для того чтобы доказать это предложение для любых аффинных преоб- преобразований, остается вспомнить, что каждое такое преобразование является композицией некоторого ортогонального преобразования и двух сжатий к взаимно перпендикулярным прямым (которые мы можем принять за оси координат). Поскольку определитель композиции двух аффинных преобразо- преобразований равен, очевидно, произведению определителей сомножителей, предло- предложение 1 тем самым доказано полностью. Следствие. Площадь s эллипса с полуосями а и b (точнее, площадь области, ограниченной этим эллипсом) выражается формулой s = nab. Доказательство. Площадь круга радиуса а равна, как известно, па2. Но эллипс с полуосями а я b получается из этого круга сжатием плоскости к одному из его диаметров с коэффи- коэффициентом &= —. Следовательно, s = k • (па2) = nab. Определение 1. Аффинное преобразование Ф называется эк- виаффинным, если |Ф| = ± 1. Согласно предложению 1, аффинное преобразование тогда и только тогда эквиаффинно, когда оно сохраняет площади, т. е. когда площадь любой плоской фигуры X равна площади преобразованной фигуры X'. К числу эквиаффинных преобразований принадлежат все ортогональные преобразования. Однако существуют и неортого- неортогональные эквиаффинные преобразования. Задание. Приведите пример такого преобразования. Так как |?оф| = |ЧЧ.|Ф|, то совокупность всех эквиаффинных преобразований является группой. Геометрия с этой группой называется эквиаффинной геомет- геометрией, а соответствующие плоскости — эквиаффинными плоско- плоскостями. В отличие от аффинной геометрии, в эквиаффинной геометрии имеет смысл понятие площади. Она является есте- естественной областью, в которой целесообразно строить теорию площадей. Две аффинные координатные системы с реперами Oete2 и О'е\е'2 тогда и только тогда определяют (согласно общей схеме из п. 1) одну и ту же эквиаффинную плоскость, когда бивекторы е, Л е2 и е\ Л е2 либо совпадают, либо отличаются знаком, т.е. когда параллелограммы, построенные на векторах ev e2 и e'v e'2, 715.
имеют одну и ту же площадь. Это показывает, что эквиаффин- ная плоскость является .не чем иным, как аффинной плоскостью, на которой задан эталон площади (область, площадь которой принята за единицу). Конечно, и здесь при выборе различных эталонов площади мы получаем из одной аффинной плоскости различные экви- аффинные плоскости. При формулировке утверждений эквиаффинной геометрии, относящихся к площадям, необходимо соблюдать определенную осторожность. Например, доказанное выше следствие о площади эллипса, как оно сформулировано, не принадлежит эквиаффин- эквиаффинной геометрии, поскольку в нем фигурируют длины полуосей а и Ь, смысла в эквиаффинной геометрии не имеющие. Чтобы по- получить «эквиаффинную» формулировку этого следствия, доста- достаточно, однако, заметить, что согласно теореме Аполлония (см. п. 6 § 2 гл. 5) площадь параллелограмма, построенного на про- произвольной паре сопряженных радиусов эллипса, равна аЬ. По- Поэтому мы можем сказать, что отношение площади эллипса к площади параллелограмма, построенного на паре его сопряженных радиусов, равно л. Эта формулировка в эквиаффинной геометрии уже вполне осмыслена. Замечание 1. Ясно, что теорема Аполлония очевидным образом вытекает из возможности представления произвольного эллипса как образа некоторой окружности при аффинном преобразовании, поскольку для случая окруж- окружности она тривиальна (площадь квадрата, построенного на паре перпендику- перпендикулярных радиусов окружности, равна квадрату радиуса окружности). Замечание 2. Утверждение о площади эллипса может быть сформулировано также и следующим образом: отношение площадей эллипса и параллелограмма, построен- построенного на паре его сопряженных радиусов, равно л. Обратим внимание на тонкое, но существенное, различие меж- между двумя последними формулировками: в то время как в первой формулировке мы говорим об отношении площади одной фигуры (эллипса) к площади другой фигуры (параллелограмма), во вто- второй формулировке речь идет об отношении площадей этих фи- фигур. Поскольку согласно предложению 1 при любом аффинном преобразовании площади всех фигур умножаются на одно и то же число, не зависящее от фигуры, то для любых двух фигур X и У отношение их площадей аффинно инвариантно. Другими сло- словами, хотя в аффинной геометрии и нельзя говорить о площади одной отдельно взятой фигуры, но понятие отношения площадей двух фигур имеет полный смысл (подобно тому как имеет смысл понятие отношения длин двух параллельных отрезков). Таким образом, вторая из приведенных выше формулировок имеет смысл в аффинной геометрии, тогда как первая — только в эквиаф- эквиаффинной. 71S
Вариант эквиаффинной геометрии, в котором фундаменталь- фундаментальной группой считается группа эквиаффинных преобразований, сохраняющих ориентации, конечно, также возможен. В этой гео- геометрии имеет смысл понятие ориентированной площади. Определение 2. Аффинное преобразование Ф называется пре- преобразованием подобия, если оно сохраняет углы между пря- прямыми, т. е. если любые две (пересекающиеся) прямые аир оно переводит в прямые а' и |3', образующие тот же угол. Ясно, что все преобразования подобия образуют группу. Соответствующая геометрия называется геометрией подобия. Фигуры, равные в этой геометрии, т. е. фигуры, переводящиеся друг в друга преобразованием подобия, называются подобными. Покажем, что это понятие подобия совпадает с известным читателю из элементарного курса, т. е. что две фигуры тогда и только тогда подобны, когда после соответствующего перемещения они гомотетичны. Для этого, оче- очевидно, достаточно показать, что любое преобразование подобия является композицией некоторого ортогонального преобразования (движения или дви- движения плюс симметрия) и некоторой гомотетии, т. е. преобразования, выра- выражающегося в соответствующим образом подобранной системе прямоугольных, координат х, у формулами вида х = hx, У1 = hy, где h — коэффициент гомотетии. В силу предложения 1 п. 2 § 2 для этого в свою очередь достаточно показать, что преобразование вида x[ = klXt kl>0, k2>0, C) У = k2y, тогда и только тогда сохраняет углы между прямыми, когда k\ = k%, т. е. когда оно является гомотетией. Но это ясно. Действительно, преобразование C) переводит ось абсцисс у = о в себя, а прямую с уравнением у=ах C) — в прямую с уравнением k Поэтому угол между осью абсцисс и прямой D) -тогда и только тогда сохра- сохраняется при преобразовании C), когда k2 " т. е. когда fti = k2. Мы не будем здесь рассматривать геометрию подобия,, поскольку она достаточно подробно изучается в школе. (Заме- (Заметим, кстати, что на самом деле школьный курс геометрии представляет собой смешение теорем из целого ряда геомет- й—в основном, евклидовой геометрии и геометрии подобия.) 717
Чтобы перейти от геометрии подобия к евклидовой геомет- геометрии, достаточно выбрать эталон длины. ( Ряд более или менее интересных вариантов геометрии подо- подобия мы получим, накладывая на преобразования подобия те или иные дополнительные требования (сохранение ориентации, сохранение данной точки О и т. п.). В геометрии, основываю- основывающейся на сохраняющих ориентации преобразованиях подобия (специальной геометрии подобия), имеет смысл понятие ориен- ориентированного угла. Поскольку, как мы уже видели (см. п. 2 § 3), любое сохра- сохраняющее ориентации преобразование подобия записывается в ком- комплексной координате z = х + iy формулой г'=az -\-b, а ф О, й, JeC, специальная геометрия подобия по существу совпадает с аф- аффинной геометрией комплексной прямой. Наложение условия эквиаффинности снова приводит к евкли- евклидовой геометрии, поскольку, как легко видеть, преобразование подобия тогда и только тогда эквиаффинно, когда оно ортогонально. 3. Геометрии Галилея и Пуансо Поскольку любое аффинное преобразование переводит любое направление на плоскости (пучок параллельных прямых) снова в некоторое направление, имеет смысл говорить об аффинных преобразованиях, оставляющих на месте данное направление со. Все такие преобразования образуют подгруппу Affa,B) груп- группы Aff B). Соответствующую геометрию мы будем называть аффинной геометрией с особыми прямыми, поскольку прямые направления ш играют в ней особую роль. Координатными системами этой геометрии являются аффин- аффинные координатные системы Оху, ось абсцисс у = О которых имеет направление со (является особой прямой). Пусть Оху — такая координатная система. Поскольку аффин- аффинное преобразование. переводит ось абсцисс у = 0 в прямую с параметрическими ура- уравнениями (здесь х', у' текущие координаты точек прямой, а х — параметр), 718
т. е. в прямую а*х'- а\у'= аф — а\Ь\ то это преобразование тогда и только тогда принадлежит группе Aff<BB), когда а\ = 0, т. е. когда оно записывается формулами Здесь числа b\ Ь2 и а\ могут быть произвольными веществен- вещественными числами, а числа а\ и а\ должны быть отличны от нуля. Если мы ограничимся лишь преобразованиями группы Affa>B), сохраняющими площади (эквиаффинными), то мы получим ана- аналогичную геометрию {эквиаффинную геометрию с особыми пря- прямыми), в которой дополнительно имеется понятие площади. В преобразованиях A) для этой геометрии числа а\ и а\ долж- должны удовлетворять соотношению a\al=± 1. Точно так же мы можем получить еще одну геометрию, огра- ограничившись преобразованиями группы Affa,B), оставляющими на месте некоторую точку О. В этой геометрии, кроме особых пря- прямых, имеется, таким образом, и особая точка О. В преобразо- преобразованиях A) для такой геометрии коэффициенты Ъх и Ъ2 должны быть равны нулю. Накладывая на преобразования оба условия, мы получим геометрию с особыми прямыми и особой точкой, в которой имеет смысл понятие площади. Преобразования A) для этой геомет- геометрии должны, естественно, удовлетворять обоим ограничениям: а\а\=±\, ЬХ = Ь2 = Ъ. Конечно, для всех этих трех геометрий возможны варианты, возникающие, когда мы ограничиваемся лишь аффинными пре- преобразованиями, сохраняющими ориентации. Еще одна геометрия получается, если на преобразования A) наложить условие а\ = ± 1, означающее, что индуцированные этими преобразованиями ото- отображения особых прямых должны быть ортогональншми отобра- отображениями. , Вариантом последней геометрии является геометрия, преоб- преобразования которой характеризуются условием а\ = 1 (индуцированные отображения особых прямых являются парал- параллельными переносами). 719
И для этих двух геометрий возможны варианты, когда мы ограничиваемся либо преобразованиями, оставляющими на ме- месте данную точку О, либо преобразованиями, сохраняющими ориентации, либо эквиаффинными преобразованиями, либо пре- преобразованиями,- обладающими любыми из этих свойств. Таким образом, всего мы получаем четырнадцать раз- различных геометрий. Все эти геометрии тесно связаны друг с дру- другом и, изучив одну из них, мы без особого труда можем перейти к любой другой. Мы выберем для более детального изучения геометрию, преобразования которой характеризуются условиями а\ = а\= 1, т. е. выражаются формулами Ь\ У' = У + Ь2. Иными словами, мы будем рассматривать геометрию с осо- особыми прямыми, автоморфизмы которой 1) сохраняют ориентации; 2) эквиаффинны; 3) для любой особой прямой индуцируют параллельный пе- перенос этой прямой на соответствующую особую прямую. Изменив обозначения, .мы можем преобразования B) запи- записать в следующем виде: х' = х + vt + х0, В этом виде они совпадают с известными из механики преобра- преобразованиями Галилея, описывающими переход от одной инерциаль- ной системы отсчета (х, t) на прямой к другой такой системе (х', ?), движущейся относительно первой с постоянной ско- скоростью v. Согласно принципу относительности Гали- Галилея механический (точнее, кинематический) смысл имеют толь- только те свойства движений, которые инвариантны относительно преобразований Галилея. Это означает, что интересующая нас геометрия по существу совпадает с кинематикой движений на прямой и отличается от нее лишь словесной оболочкой (термино- (терминологией). Каждое утверждение этой геометрии может быть пере- переформулировано как утверждение кинематики, и наоборот. На этом основании мы будем называть рассматриваемую гео- геометрию геометрией Галилея, а преобразования B) —галилеевы- ми преобразованиями. Чтобы перейти от аффинной плоскости к галилеевой, нужно выбрать 1) особые прямые; 2) ориентацию особых прямых; 3) ориентацию плоскости; 4) эталон длины на особых прямых; 5) эталон площади. 720
Тогда каждая галилеева координатная система будет представ- представлять собой аффинную координатную систему, репер Ое\е2 кото- которой обладает следующими свойствами: 1) вектор «1 параллелен особым прямым и положительно ориентирован (по отношению к данной ориентации этих пря- прямых); 2) базис еи е2 положительно ориентирован (по отношению к данной ориентации плоскости); 3) длина вектора е4 равна единице (по отношению к дан- данному эталону длин на особых прямых); 4) площадь параллелограмма, построенного на векторах ей е2, равна единице (по отношению к данному эталону площа- площадей). В каждой из таких координатных систем Оху галилеевы пре- преобразования записываются формулами вида B). В дальнейшем мы будем считать фиксированной некоторую галилееву координатную систему Оху. На евклидовой плоскости расстояние между двумя точками Mi(*i, Ы и М2{х2,у2) может быть охарактеризовано как един- единственный (с точностью до постоянного множителя) ортогональ- ортогональный инвариант фигуры, состоящей из этих двух точек. Легко видеть, что единственным галилеевым инвариантом этой фигу- фигуры является разность у2 — у\. (Инвариантность этой разности очевидна; ее единственность вытекает из того, что любые пары точек с одной и той же разностью у2 — i/i можно некоторым галилеевым преобразованием перевести друг в друга.) По ана- аналогии с евклидовой плоскостью абсолютную величину разности у2 — yi мы будем называть галилеевым расстоянием между точками Mi(xi, г/i) и М2(х2, у2). Заметим, что в отличие от евклидова расстояния галилеево расстояние может быть равно нулю даже тогда, когда точки Mi и М2 не совпадают. Именно, ясно, что галилеево расстояние d между точками М\ и М2 тогда и только тогда равно нулю, когда эти точки принадлежат одной особой прямой. В этом случае для точек Mi(xu y{) и М2(х2,у2) существует еще один галилеев инвариант, а именно, число х2—хи Действи- Действительно, согласно формулам B) 4 ~ х\ = Х2 ~ xi + а\ {У2 - Уд и потому х'2 — х/1=х2 — х1, если г/2 — r/j = 0. Таким образом, разность х2 — xt инвариантна не всегда, а только при некотором специальном расположении точек Mi(xi,yO и М2{х2,у2). На этом основании она называется от* носительным инвариантом^ 24 Ms Ма Постников , 721
Абсолютную величину относительного инварианта Хг — Xi мы будем называть особым расстоянием между точками Mi(xi, yt) и М2(х2, у%). Подчеркнем, что оно имеет смысл тогда и только тогда, когда галилеезо рас- расстояние между этими точками равно нулю. Ясно, что точки М\ и М2 тогда и только тогда совпадают, когда оба расстояния dud между ними равны нулю. По аналогии с евклидовой геометрией окружностью в гео- геометрии Галилея называется геометрическое место точек, гали- леево расстояние которых от данной точки Мо(хо, г/о) (центра окружности) равно дайному числу R (радиусу окружности). Ана- Аналитически окружность задается уравнением \y-yQ\=R и потому представляет собой пару особых прямых у = г/о ± R (сливающихся в одну при R==0). Заметим, что в отличие от евклидовой геометрии галилеева окружность имеет бесконечно много центров (но однозначно определенный радиус). Продолжая аналогию с евклидовой геометрией, мы опреде- определим галилеев угол ф(точнее «галилееву величину угла») между двумя неособыми прямыми ai и а2, пересекающимися в точке М0(х0, г/о), как особое расстояние между точками пересечения N\ и N% прямых oi и аг с окружностью радиуса R = 1 с центром в точке М0(х0, г/о) (точнее, с одной из особых прямых, составляю- составляющих эту окружность; скажем, для определенности, с прямой У = Уо+ !)• Для особых прямых угол не определяется. Пусть прямые ai и а2 заданы уравнениями с угловым коэф- коэффициентом (относительно оси ординат): Тогда их точка пересечения М0(х0, г/о) имеет ординату Уо- !^П7 и потому точки Ni и N% (являющиеся точками пересечения пря- прямых ai и осг с прямой у = уй + 1) имеют абсциссы , . 0\R% — УгК\ = «1+ Ь.-k,' *2 = k2 + '^_^ . (Следовательно, особое расстояние между ними равно I *2 — *1 I — 1 ^2 "—" ^1 1 • 722 .
Таким образом, галилеев угол ф между неосоо\ыми прямыми с угловыми коэффициентами ki и k2 выражается формулой Мы могли бы принять эту формулу за определение угла ф. Но тогда мы, конечно, должны были бы доказывать галилееву инвариантность величины \k2 — &i|. Если прямые параллельны (k2 = ki), то для них определена величина Ь = \Ь2~Ь{\, равная длине произвольного заключенного между ними отрезка особой прямой. Эту величину мы будем называть особым уг- углом между параллельными прямыми. Имея в своем распоряжении основные понятия расстояния и угла, мы можем теперь без особого труда развивать геометрию Галилея сколь угодно далеко. Мы этого здесь делать не бу- будем, отсылая читателя к специальной литературе1). Конечно,, теоремы этой геометрии совсем не похожи на теоремы геомет- геометрии Евклида. Например, в любом треугольнике большая сторо- сторона равна в геометрии Галилея сумме двух других сторон и, аналогично, больший угол равен сумме двух других углов. Мы скажем только несколько слов о геометрии прямых в геометрии Галилея. Каждая неособая прямая x = ky + Ь в геометрии Галилея определяется двумя «координатами» Ъ и k. При галилеевом преобразовании B) такая прямая перехо- переходит в прямую с уравнением х' - а\ {у' -b2)-bl^k {у' - Ь2) + Ь, т. е. с уравнением l -alb2), Это означает, что сопоставив прямой х = ky -j- b точку с координатами х = b и у = k, мы преобразованной прямой должны будем сопоставить точку с координатами У'=У ') См., например, И. М. Я г л о м, Принцип относительности Галилея и неевклидова геометрия, «Наука», 1969. 24* 723
где Поскольку преобразования C) —также галилеевы и каж- каждое галилеево преобразование можно представить в виде C) (при соответствующем выборе чисел b\ b2 и а12), мы можем, следовательно, сказать, что геометрия неособых прямых на галилеевой плоскости также является галилеевой геометрией. Из этого утверждения легко следует, что на галилеевой плос- плоскости справедлив следующий общий принцип: Принцип двойственности. Любая теорема геометрии Гали- Галилея (относящаяся к точкам и прямым) переходит в верную тео- теорему при одновременных заменах «точка» =ф «неособая прямая», «расстояние» =ф «угол», «особое расстояние» =Ф «особый угол», «лежат на» Ф «проходят через», «лежат на особой прямой» =#> «параллельны» и т. д. Задание. Докажите принцип двойственности. В заключение мы приведем «словарь» для перевода основ- основных понятий геометрии Галилея на язык кинематики (см. выше). Читателю настоятельно рекомендуется как следует его осознать и по возможности продолжить. Геометрические понятия Точка Неособая прямая Особая прямая Галилеево расстояние Особое расстояние Галилеев угол Особый угол Окружность радиуса R Кинематические понятия Мгновенное положение движущейся материаль ной точки (событие), характеризующееся мес том (координата х) и временем (коорди пата t) Мировая линия (траектория событий) равномер но движущейся точки Совокупность всех собыгяй, происходящих в дан ный момент времени Временной интервал между событиями Пространственный интервал между одновремен ными событиями Относительная скорость Расстояние между . покоящимися друг относи тельно друга точками Совокупность всех событий, опережающих дан ное событие на время R и отстающих от не го на то же время Упражнение, Дайте кинематическое истолкование принципа двойствен- двойственности. 724
Для аналогичного геометрического описания кинематики движений в плоскости служит пространственная геометрия Га- Галилея, преобразования которой являются композициями парал- параллельных переносов, вращений вокруг оси времени Ot и преоб- преобразований вида Хг = Х-\- V{t, У' = У + v2t, где vi и vz — компоненты скорости инерциальной системы от- отсчета (x,y,t) относительно системы (x',yr,f). Обозначая координату / более привычным (в геометрии) символом г, мы можем наиболее общее такое преобразование записать формулами xf = x cos ф — у sin ф + zv\ + х0, у' = х sin ф + у cos ф + zv2 + г/о, z' = z + z0. Естественно, что эта геометрия значительно сложнее плос- плоской геометрии Галилея, и мы ею заниматься здесь не будем. Заметим только, что в этой геометрии на каждой плоскости z = const имеет место обычная евклидова геометрия. Для механики наиболее важен, конечно, случай движений в простран- пространстве. Геометрически это соответствует рассмотрению геометрии Галилея че- четырехмерного пространства — времени. Необходимых для описания такой геометрии средств мы пока еще не имеем. Интересным вариантом пространственной геометрии Галилея является центрогалилеева геометрия, преобразования которой имеют вид X' = X COS ф — у Sin ф + 20], у' = х sin ф + У cos ф + zv2, D) Рассмотрим в этой геометрии произвольную плоскость, не проходящую через начало координат О (являющееся особой точкой центрогалилеевой геометрии). При соответствующей нор- нормировке коэффициентов уравнение такой плоскости может быть единственным образом записано в виде Ах + By + Cz = 1. Без труда проверяется, что преобразование D) переводит эту плоскость в плоскость А'х' + В'у' + C'z^= I, 725
для которой А' = A cos ф — В sin ф, В' = A sin ф + В cos ф, С = — Avi — Bv2 + С. Это означает, что геометрия плоскостей центральногалилеевой геометрии (не проходящих через особую точку О) является геометрией, пре- преобразования которой задаются формулами вида х' = х cos ф — у sin ф, у' = х sin ф + у cos ф, E) z' = ах + by -\- z. Напомним теперь, что любая система сил на плоскости пол- полностью характеризуется (при выбранной точке О) некоторым вектором [главным вектором системы) и некоторым числом (главным моментом системы). Обозначая координаты (в неко- некоторой прямоугольной системе координат) главного вектора символами х, у, а главный момент системы — символом г, мы можем, таким образом, сказать, что в любой прямоугольной системе координат каждая система сил на плоскости характе- характеризуется тремя «координатами» х, у, г. При повороте коорди- координатных осей координаты х, у преобразуются, естественно, как координаты вектора, т. е. по формулам х' = х cos ф — у sin ф, у' = х sin ф + у cos ф, а координата г остается неизменной. При переносе же начала координат О в некоторую точку О'(х0, г/о) координаты х, у, яв- являясь координатами вектора, не меняются, а координата г (главный момент системы) переходит, как показывается в- механике, в координату г' = уоХ — хоу + z. Это означает, что статика систем сил на плоскости изучает свойства «точек» (х, у, z), инвариантные относительно преобра- преобразований вида х' = х cos ф — у sin ф, у' = х sin ф + у cos ф, г' = уоХ — xoy-\-z. Поскольку эти преобразования только обозначениями отли- отличаются от преобразований E), мы видим, что «геометрия плоской статики» совпадает с геометрией плоско- плоскостей центрогалилеевой геометрии, не проходящих через особую- точку. 726
Общая теория систем сил была впервые разработана фран- французским механиком Пуансо. В честь него геометрия с груп- группой преобразований E) называется геометрией Пуансо. Любое утверждение этой-геометрии может быть переформулировано как некоторое утверждение о системах сил на плоскости, и нао- наоборот. Расстоянием между точками Mi{xu yit Zi) и M2(x2,y2,z2) в геометрии Пуансо естественно называть величину d = V(x2 — х{J + (г/2 - г/О2, инвариантную относительно всех преобразований E). Когда это расстояние равно нулю, для точек Mi(xu yx Z\) и М2(Х2, г/2, z2) инвариантна также разность z2 — Zi. Абсолютная величина б = | z2- 2,| этой разности называется особым расстоянием между точками Mi (xu г/i, Zi) и М2 {х2, г/г, z2). Дальнейшее построение геометрии Пуансо (определение угла, окружностей, сфер, построение теории треугольников и т. п.) мы оставим инициативе читателя. Упражнение. Опишите геометрию Пуансо на плоскости. 4. Геометрия Минковского Целый «куст» геометрий получается, когда мы выбираем на плоскости не одно, а два (различных) направления сем и ю2, и рас- рассматриваем аффинные преобразования, переводящие прямые каждого из этих направлений снова в прямые того же направле- направления и удовлетворяющие, возможно, некоторым дополнительным условиям (эквиаффинность, сохранение ориентации и т. п.). Мы здесь ограничимся геометрией, преобразования которой: 1) переводят прямые каждого из двух направлений o>i и а2 в прямые того же направления; 2) сохраняют ориентации прямых этих направлений; 3) эквиаффинны (сохраняют площади)-. Такие преобразования называются преобразованиями Лорен- Лоренца, а соответствующая геометрия — геометрией Минковского (или псевдоевклидовой геометрией). В этой геометрии прямые направлений o»i и а>2 играют особую роль. Их принято называть изотропными прямыми геометрии Минковского (а их направле- -ния toi и юг — изотропными направлениями). Чтобы получить из аффинной плоскости плоскость Минков- Минковского, следует выбрать 1) направления o>i и юг; 727
2) ориентацию прямых направления иц; 3) ориентацию прямых направления юг; 4) эталон площади. Тогда координатными системами Минковского будут аффин- аффинные координатные системы, реперы Oeie2 которых обладают сле- следующими свойствами: 1) вектор е\ параллелен прямым направления он и положи- положительно ориентирован (по отношению к данной ориентации этих прямых); 2) вектор ?г параллелен прямым направления а2 и положи- положительно ориентирован (по отношению к данной ориентации пря- прямых этого направления); 3) площадь параллелограмма, построенного на векторах еи е2, равна единице (по отношению к данному эталону пло- площади) . В дальнейшем мы будем считать фиксированной некоторую координатную систему Минковского Оху. В такой координатной системе преобразования Лоренца имеют вид f х' = 1х + х0, Уг==\ У + Ух» где %, х0, уо — произвольные числа, причем % > 0. Запишем преобразование Лоренца A) в координатах X, У, связанных с координатами х, у формулами X — Y X + Y Преобразование т. е. вид (О в X X этих ' — Y' V2 ' + Y' V2 V2 координатах имеет вид *[ X — Y\ { V2 ) 1 (X + Y\ ~ Я ( V2 1 Уи' %2 J Положив р = ,2 , мы получим, что 2 ^ А 728
Обозначая координату X прежним символом х, а координату У — символом t, мы получаем, следовательно, для преобразования A) формулы вида В специальной теории относительности Эйнштейна эти формулы описывают переход от одной инерциальной системы отсчета (х, i) к другой такой системе (х', ?), движущейся относительно первой с постоян- постоянной скоростью v = |3с (где с— скорость свега). Таким образом, подобно тому как геометрия Галилея является переложением на геометрический язык классической (галилеевой) кинематики, так и геометрия Минковского являет- является переложением кинематики теории относительности Эйнштейна. Именно для наглядного изображения и лучшего прояснения релятивистской кинематики ее впервые Минковский и ввел. Систему координат X, У мы будем называть физической системой коор- координат, соответствующей данной системе координат х, у. Каждое неизотропное направление на плоскости Минков- Минковского характеризуется его угловым коэффициентом k (относи- (относительно, как обычно, оси абсцисс Ох). Произвольная прямая у = kx + Ь этого направления переходит при преобразовании A) в прямую т. е. в прямую направление которой характеризуется угловым коэффициентом Мы видим, таким образом, что знак коэффициента k — один и тот же для всех прямых, переводимых друг в друга преобразо- преобразованиями Лоренца, и потому этот знак должен иметь в геомет- геометрии Минковского определенный геометрический смысл. Прямые с k > 0 называются пространственноподобными, а прямые с k < О — времяподобными. Эти названия распростра- распространяются также и на отрезки этих прямых. Эта терминология объясняется тем, что, как можно легко показать, любой времяподобной прямой существует физическая система координат, осью ординат которой (т. е. с физической точки зрения — осью времени) является данная прямая. Это означает, что для любого времяподобн.ого от- отрезка М±Мг существует инерциальная система отсчета, в которой события, изображаемые точками Mi и М2, происходят в одном и том же месте (но в разное время). Аналогично, для любой пространственноподобной прямой существует фи- физическая система координат, осью 'абсцисс (т< е. осью «мест») которой яв- является эта прямая, так что для любого пространственноподобного отрезка М1М2 существует инерциальная система отсчета, в которой события Afj и Мг происходят в одно и то же время (но в разных местах). 729
Для любой точки Мо совокупность всех точек М, обладаю- обладающих Фем свойством, чго отрезок MqM пространственноподобен, называется областью одновременности точки Мо, а совокупность всех точек М, обладающих тем свойством, что отрезок МоМ времяподобен, — областью одно местности точки Мо. Для начала координат О область одновременности состоит из первого и третьего квадрантов (т. е. характеризуется нера- неравенством jo/> 0), а область одноместное™ — из второго и чет- четвертого квадрантов (характеризуется неравенством jm/<0). Вообще, для любой точки Мо область одновременности со- состоит из одной пары вертикальных углов, образованных изо- изотропными прямыми, проходящими через точку Мо, а область одноместности — из другой пары. Ясно, что для любых двух точек Mi(xi,yi) и М2(х2, у2) вели- величина (х2 - х{) (у2 - ух) инвариантна относительно всех преобразований Лоренца A). Корень квадратный d=V2(x2-x1)(y2-yl) из удвоенной этой величины называется расстоянием между точками Mi и М2 (или длиной отрезка MiM2) в геометрии Мин- ковского. Ясно, что отрезок MiM2 тогда и только тогда изотропен {принадлежит изотропной прямой) когда его длина равна нулю. Таким образом, в геометрии Минковского расстояние между точками может быть равно нулю даже тогда, когда эти точки не совпадают. Предположим, что отрезок MiM2 неизотропен. Тогда его уг- угловой коэффициент выражается формулой и потому для длины d отрезка М\М2 мы получаем формулу d = | х2 — х1 | У2k, показывающую, что отрезок MiM2 тогда и только тогда пространственноподобен (времяподобен), когда его длина вещественна (соответственно, чисто мнима). Замечание 1. До сих пор мы не фиксировали знака квадрат- квадратного корня в определении длины. Теперь мы можем это сделать. Именно, мы потребуем, чтобы для пространственноподобных от- отрезков длина была неотрицательным числом, а для времяподоб- ных—имела неотрицательную мнимую часть. 730 •
Простое вычисление показывает, что для простраиствениоподобного от- отрезка MiM2 расстояние d равно обычному расстоянию между событиями, изображаемыми точками Mt и Мг< вычисленному в инерциальной системе от- отсчета, в которой эти события одновременны. Аналогично, для времяподобного отрезка MiMz расстояние d равно умноженному на ic времени, протекшему между событиями Mi и М% в инерциальной системе отсчета, в которой эти ¦события одноместны (где с — скорость света). Окружностью в геометрии Минковского называется, по ана- аналогии с евклидовой геометрией, геометрическое место точек, на- находящихся на одном и том же расстоянии R (радиусе окруж- окружности) от данной точки Мо (центра окружности). При этом ра- радиус окружности может быть как вещественным (неотрицатель- (неотрицательным) числом, так и чисто мнимым (с положительной мнимой частью). Аналитически окружность радиуса R с центром в точ- j<e Mq(x0, г/о) задается уравнением (х-хо)(у-уо)=-^- C) и потому на евклидовой плоскости является (при R ф 0) ги- гиперболой с центром в точке М0(х0, у0). При R = 0 эта окруж- окружность представляет собой пару изотропных прямых, проходящих через точку Мо. При R вещественном окружность с центром Мо расположена в области одновременности для точки Мо, а при R чисто мнимом — в области одноместности. Окружности, ра- радиусы которых имеют один и тот же модуль \R\, сопряжены (как гиперболы, см. п. 6 § 2 гл. 5). Имея понятие окружности, мы могли бы теперь по аналогии с геометриями Евклида и Галилея определить угол между двумя пересекающимися в точке Мо прямыми как длину дуги, высекаемой этими прямыми на окружности единичного радиу- радиуса с центром в точке Мо. Однако это определение требует (в до- достаточной мере сложного) выяснения понятия «длина дуги окружности» в геометрии Минковского. Поэтому мы пойдем другим путем. При этом для простоты мы будем считать, что точка Мо совпадает с точкой О (что, очевидно, не ограничивает общности). ' . В физических координатах X, Y, соответствующих координа- координатам х, у, окружность радиуса R с центром в точке О имеет урав- уравнение X-Y X + Y _ R2 УТ ' УТ 2 ' т. е. уравнение X2 Y2 _. R2 д«—*• Следовательно (см. п. 3 § 1 гл. 5), положив (при /?2 > 0) У = ? she, , 731
мы получим параметрические уравнения правой ветви этой ок- окружности. Эти уравнения вполне аналогичны параметрическим урав- уравнениям X = R cos ф, евклидовой окружности (в прямоугольных координатах X, У), в которых параметр ф, соответствующий произвольной точке М окружности, является (ориентированным) углом, образованным прямой ОМ с осью абсцисс Ох. Следуя этой аналогии, мы для любой точки М ветви D) примем, по определению, за угол от оси Ох к прямой ОМ в геометрии Минковского значение параметра 6, отвечающее в силу уравнений D) этой точке. Далее, для любых двух точек Afi и М2 ветви D) мы опреде- определим угол 0 от прямой OMt к прямой ОМ2 формулой где 02 и 0j —tзначения параметра, отвечающие точкам М2 и М^ За угол между прямыми OMi и ОМ2 мы примем абсолютную величину угла 0. Заметим, что, в отличие от евклидовой геометрии, угол 8 от оси Ох к прямой ОМ принимает любые вещественные значения: когда прямая ОМ, вращаясь, приближается к асимптоте X = У гиперболы D) (являющейся изотропной прямой х = 0), угол 9 стремится к -f-°°» a когда эта прямая приближается к асимпто- асимптоте X = —У (т. е. к изотропной прямой у = 0), угол 0 стремится к —оо. Мы ввели угол между прямыми в геометрии Минковского, руковод- руководствуясь довольно формальной аналогией с евклидовой геометрией. Более содержательное оправдание нашего определения можно получить, заметив, что в евклидовой геометрии угол ср между двумя прямыми, пересекающимися в точке Мо, равен удвоенной площади кругового сектора, высекаемого этими прямыми из круга единичного радиуса с центро,.: в точке Мо. Аналогом этого сектора в геометрии Минковского является гиперболический сектор MoMiMlt ограниченный отрезками МоМи AfoAf2 и дугой MiM2 гиперболы D). Пользуясь, скажем, известными из интегрального исчисления формулами для площадей плоских фигур, можно без труда показать, что площадь этого сектора равна 2 —- . С другой стороны, поскольку преобразования Ло- Лоренца эквиаффинны, понятие евклидовой площади сохраняется и в геометрии Минковского. Поэтому так же, как и в евклидовой геометрии, угол между двумя прямыми в геометрии Минковского равен удвоенной площади сектора, высекаемого этими прямыми из «единичного круга». • Упражнение. Проверьте, что это утверждение верно и в геометрии Га- Галилея. Точка М, имеющая в физической координатной системе координаты X = R ch 0 и У = R sh 0, имеет в исходной 732
координатной системе Оху координаты Поэтому угловой коэффициент k прямой ОМ (в координатной системе Оху) выражается формулой , ch 8 + sh 8 1 + th 8 che-she i — the" Следовательно, 111"— k+\ ' Пусть теперь нам даны две точки Mi и М2 и пусть ki — угло- угловой коэффициент прямой О Mi, a k2 — угловой коэффициент прямой ОМ2. Тогда для угла 8 между прямыми OMi и ОМ2 мы получаем, что the = th(9 0 ) ^ th &2 ~th 9| —- к2 + ' ~ ki + 1 ^ k2 ~ kl kt + Г k2 + l Тем самым доказано, что угол 8 в геометрии Минковского между прямыми y = kix-\-bl, y = вычисляется по формуле th 8 = k.2 ~ k.1 . E) k2 + ky v ' Замечание 2. Последнюю формулу мы могли бы принять за определение угла 0. Этот путь был бы, конечно, самым про- простым. Однако геометрический смысл угла был бы при этом со- совершенно потерян. Внимательный читатель, без сомнения, уже заметил, что наше определение угла пригодно" не для любых прямых. Дей- Действительно, кривая D) является ветвью окружности, квадрат R2 радиуса которой положителен (т. е. является ветвью окруж- окружности вещественного радиуса R). Поэтому для любой ее точки М прямая ОМ пространственноподобна. Следовательно, наше определение угла пригодно только для пространственноподобных прямых. Но для окружности мнимого радиуса iR параметрические уравнения некоторой ее ветви имеют вид 733
и для любой точки М этой ветви прямая ОМ времяподобна. Поэтому, поступая, как и выще, мы примем параметр 8 за угол от прямой ОМ к оси ординат Оу, а затем определим угол от прямой OMi к прямой ОМ2 формулой 0 = 0[ — 02 (обратим внимание на перемену ролей точек Mi и Мг). Тем са- самым угол будет определен и для времяподобных прямых. Ясно, что он также будет равен удвоенной площади соответствующего гиперболического сектора. Формула E) для него также оста- останется справедливой. Для прямых, одна из которых времяподобна, а другая про- странственноподобна, угол не определяется (формула E) дает в этом случае для 0 комплексное значение). Имея в своем распоряжении понятия длины и угла, мы мо- можем теперь развивать геометрию Минковского сколь угодно да- далеко. Мы этого делать не будем. В следующем пункте мы осве- осветим аналогию между геометриями Евклида и Минковского ¦ с другой, совершенно неожиданной стороны. 5. Комплексная евклидова геометрия Как уже отмечалось (замечание 3 п. 4 § 3 гл. 2), построе- построение евклидовой геометрии возможно и над полем комплексных чисел С. В этой геометрии имеет смысл понятие расстояния d между любыми точками Mi(xi, yi) и М2(х2, г/г), определяюще- определяющегося обычной формулой d = У(х2 - *,)* + (г/2 - Уд2. Однако получающаяся геометрия малоудовлетворительна, поскольку это расстояние может быть любым комплексным числом (и к тому же определенным только с точностью до знака) и может быть равно нулю даже в том случае, если Mi и М2 различны. По этой причине угол между двумя прямыми (также определяемый по обычной формуле) оказывается не всегда существующим (и, вообще говоря, представляет собой комплексное число). Правда, с аналогичными неприятностями мы уже встречались в геометрии Минковского, но ввиду возмож- возможности физической интерпретации этой геометрии нам приходи- приходилось с ними мириться. В то же время комплексная евклидова геометрия появляется лишь в порядке не слишком глубо- глубокого обобщения и никаких интересных приложений и интер- интерпретаций даже внутри математики (не говоря уже о физике) не имеет. Поэтому разбираться в ее сложностях в принципе не очень интересно. В крайнем случае это было бы оправдано, если бы теоремы этой геометрии оказались в достаточной мере кра- красивы и изящны. Однако на самом деле все обстоит как раз 734
наоборот (это общее правило: неудачная математическая тео- теория, не имеющая приложений, никогда не отличается изяще- изяществом и красотой). По всем этим причинам комплексную евкли- евклидову геометрию мы выше и не рассматривали. Иначе дело обстоит, конечно, для евклидовой вещественно- комплексной геометрии (п. 5 § 3 гл. 2), на множестве веществен- вещественных точек которой имеет место обычная евклидова геометрия. Однако эта геометрия имеет лишь вспомогательное значение: она служит для удобного описания феноменов вещественной геометрии, которые трудно описать, не выходя в «мнимую область». Ее группа автоморфизмов по существу совпадает с группой автоморфизмов (ортогональных преобразований) веще- вещественной евклидовой геометрии, и отличие между этими геомет- геометриями состоит только в том, что первая имеет «больше» точек. Заметим, что «вещественно-комплексный» вариант возможен для любой вещественной геометрии. Можно говорить, например, о вещественно-ком- вещественно-комплексной геометрии Галилея, вещественно-комплексной геометрии Минков- ского и даже о вещественно-комплексной конформной геометрии. Переход от евклидовой комплексной геометрии к евклидовой вещественно-комплексной геометрии можно описать также сле- следующим образом (ср. п. 5 § 1 гл. 4). Мы выбираем в комплекс- комплексной плоскости Ж вещественную плоскость 9Ивещ, характеризую- характеризующуюся требованием вещественности координат всех ее точек (по' отношению к данной координатной системе), и ограничиваемся рассмотрением только тех преобразований, которые эту веще- вещественную плоскость переводят в себя. Чтобы получить затем вещественную геометрию, остается откинуть мнимые точки. Таким образом,- вещественная евклидова геометрия полу- получается из комплексной в два этапа: на первом этапе мы, остав- оставляя неизменным множество точек, сокращаем группу до группы всех вещественных преобразований, а на втором — сокращаем множество точек до множества, состоящего из точек, все коор- координаты которых вещественны. Поскольку каждая линия в вещественной плоскости 9ИвеЩ получается сечением соответствующей линии в комплексной пло- плоскости СОТ плоскостью Швещ, иногда говорят, что вещественная евклидова геометрия является сечением комплексной евклидо- евклидовой геометрии, получающимся наложением условий «х вещественно», «у вещественно». Другое сечение комплексной евклидовой геометрии мы по- получим, наложив на координаты х, у условия «х вещественно», «у чисто мнимо». Множество всех точек (х, у), координаты которых удовлетво- удовлетворяют этим условиям, мы обозначим через Зйм. Каждая точка 735
этого множества характеризуется двумя вещественными коор- координатами X, Y, связанными с координатами х, у соотношениями X *-j— А.} Таким образом, множество Зйм мы также можем рассматри- рассматривать как вещественную плоскость (с координатами X, У). Преобразование х'=а\х + а\у-\-Ь\ у' = а\х + а\у + Ь* A) тогда и только тогда переводит каждую точку из Шм снова в точку из ЯЯМ, когда для любых вещественных чисел X и Y числа а\Х + to'y + б1 и -j(a\X-tialY + b2) также вещественны. Очевидно, что это имеет место тогда и только тогда, когда числа а\, а\ и Ь1 вещественны, а числа а\, а\ и Ь1 чисто мнимы. Мы положим а\ -— Д1 „l — fAl ftl—Д1 tij V 2 — 2J ' a] = iA\, a\« Л», b2 = Ш2. Тогда условия J =¦ ! • <a\ + a\al" °> («D2 + («IJ - 1 ортогональности преобразования A) перепишутся в следующем виде: Мы найдем общее решение этих уравнений при дополнитель- дополнительном предположении А\ > 0, Al> 0. C) Таким образом, мы несколько сократим интересующую нас группу. Это сокращение совершенно несущественно, и от гео- геометрии с сокращенной группой мы всегда без особого труда можем вернуться к геометрии с полной группой. Мы будем искать коэффициент А\ в виде где ix — некоторый положительный параметр. Подставляя это выражение в первое из уравнений B), мы немедленно получим, что ' 2 738
Заменяя в случае необходимости ц на 1/ц, мы можем общее решение этого уравнения записать в следующем виде: Аналогично, общее решение третьего из уравнений B) имеет вид где X — некоторый положительный параметр. Подставляя эти выражения во второе уравнение B), мы по- после тривиальных преобразований получим, что Заметив, что преобразование, индуцированное на плоскости преобразованием A), имеет в координатах X, Y вид = а\х — Г = А\Х + A\Y + В\ мы окончательно получаем (полагая В1 = Хо и В2 = Уо), что Поскольку эти формулы совпадают с формулами, выражаю- выражающими преобразование Лоренца в физических координатах (см. п. 4), мы видим, следовательно, что сечением евклидовой комплексной геометрии, получающимся наложением условий «х вещественно», «у чисто мнимо», (а также условий C)) является геометрия Минковского. Таким образом, как евклидова геометрия, так и геометрия Минковского (псевдоевклидова геометрия) являются сечениями комплексной евклидовой геометрии. В частности, отсюда вытекает, что подстановка у i—s* iy переводит формулы, евклидовой геомет- геометрии в формулы геометрии Минковского. Последнее обстоятельство читатель, возможно, уже давно заметил. Теперь же он знает и объяснение этому. Обратим внимание на то, что установленная связь между евклидовой геометрией и геометрией Минковского позволяет нам почти автоматически получать теоремы геометрии Минков- Минковского из соответствующих евклидовых теорем. 737
6. Унитарная геометрия Вернемся теперь снова к задаче «разумного» обобщения ев- евклидовой геометрии на комплексный случай. Как мы видели, «прямолинейное» обобщение, приводящее к комплексной евкли- евклидовой геометрии, по существу не достигает цели. Оказывается, что более удовлетворительная геометрия получается, если мы на- наложим на коэффициенты преобразования A) п. 5 следующие условия, сводящиеся в вещественном случае к тем же соотноше- соотношениям ортогональности: а\а\ + а\а\ = \, a{aJ + a'a* = 0, d\a\ + a\a\ = 1. A) Здесь, конечно, необходимо в первую очередь доказать, что преобразования, коэффициенты которых удовлетворяют этим ус- условиям, образуют группу. Мы докажем сначала, что группу со- составляют всевозможные матрицы а\ с элементы которых удовлетворяют условиям A). Определение 1. Матрицы B), элементы которых удовлетво- удовлетворяют условиям A), называются унитарными матрицами. Полагая а\ а\ а\ а\ мы можем условия A) переписать в следующем виде: ААТ=Е. C) Перейдя в этом соотношении к определителям, мы немед- немедленно получим равенство |Л|-Гд|=1, означающее, что определитель унитарной матрицы является комплексным чи- числом, по модулю равным единице (и потому отличным от нуля). Умножив соотношение C) на матрицу Л~', получаем Таким образом, матрицей, обратной к унитарной матрице А, является мат- матрица Ат. Поэтому для любой унитарной матрицы А имеет место соотношение АТА = Е. ¦ 738 • J
Поскольку А = (Л т) , мы можем это соотношение переписать в следующем виде: т. е. в виде локазывающем, что матрица А'1, обратная к унитарной матрице А, унитарна. Наконец, если ААГ = Е, ВВТ = Е, то (АВ) (Щт = АВВТ А т = А А т = Е. Следовательно, произведение АВ двух унитарных матриц А и В также яв- является унитарной матрицей. Заметим, что все сказанное справедливо не только для матриц второго порядка (с которых мы начинали), но и для матриц любого порядка п. Совокупность всех .унитарных матриц порядка п принято обозначать симво- символом U(n). Последние два доказанные выше утверждения означают, что множество U(n) всех унитарных матриц порядка п является группой. Вернемся теперь к преобразованиям A) п. 5, коэффициенты которых удовлетворяют соотношениям A). В матричном виде эти преобразования записываются формулой *'\ (х\ (Ьх\ где А — произвольная унитарная матрица. Из того, что унитарные матрицы образуют группу, немед- немедленно вытекает, что преобразования F) составляют группу. Соответствующая геометрия называется унитарной геомет- геометрией. Без труда проверяется, что в унитарной геометрии фигура, состоящая из двух точек Mi(xuyi) и М2(х2, у2), имеет инвариант, выражающийся формулой (х2 — я,) (х2 — хх) + (г/2 — У\) (#2 — 9i) = 1*2 — х\ I2 +1 Уг — У\ I2- Этот инвариант является неотрицательным вещественным чис- числом и арифметический квадратный корень из него называется (унитарным) расстоянием между точками M\(xy,yi) иМ2(х2,у2). N 739
Это расстояние равно нулю тогда и только тогда, когда точ- точки Mi и М2 совпадают. Поэтому можно ожидать, что унитарная геометрия и является искомым «разумным» обобщением евкли- евклидовой геометрии на комплексный случай. Оказывается, что это действительно так: во всяком случае, многие утверждения ев- евклидовой геометрии естественным образом переносятся в уни- унитарную геометрию, и получающаяся теория не только красива и изящна, но и имеет многочисленные применения. К сожале- сожалению, у нас здесь нет н-и места,'ни времени для более детального ознакомления с этой замечательной геометрией. Отметим только, что унитарная геометрия тоже «не без гре- греха»: окружности в ней выражаются уравнениями вида и потому не являются алгебраическими линиями. Это об- обстоятельство, кажущееся на первый взгляд малосущественным, на самом деле приводит часто к серьезным осложнениям (или, если хотите,— к интересной специфике унитарной геометрии, резко отличающей ее от евклидовой). Накладывая на унитарную геометрию ограничения «х вещественно», «у вещественно», мы получаем, очевидно, евклидову геометрию. Интересно отме- отметить, что ограничения «х вещественно», «у чисто мнимо» также приводят к евклидовой геометрии. 7. Геометрия Пуанкаре — Лобачевского В соответствии с общими принципами п. 1 каждая подгруппа группы Conf определяет на конформной плоскости некоторую геометрию, в которой имеет смысл понятие окружности. Примером такой геометрии является специальная конформ- конформная геометрия с группой Conf+. Другой пример мы получим, зафиксировав на конформной плоскости некоторую окружность и рассмотрев подгруппу груп- группы Conf (или группы Conf+), состоящую из всех конформных преобразований, переводящих эту окружность в себя. Ясно, что для любых двух окружностей получающиеся таким образом геометрии изоморфны. Поэтому достаточно ограни- ограничиться некоторой Одной окружностью. В качестве такой окруж- окружности мы выберем вещественную ось у = 0 на стандартной кон- конформной плоскости О (напомним, что z = x + iy). Кроме того, мы ограничимся лишь преобразованиями из группы Conf+. Соот- Соответствующая геометрия называется геометрией Пуанкаре. По определению, группой автоморфизмов геометрии Пуан- Пуанкаре является подгруппа Confo" группы Conf+, состоящая из 740
всех дробно-линейных преобразований г, _ az_+_b_ сг + d ' переводящих прямую у = 0 в себя, т. е. обладающих тем свой- свойством, что для любого вещественного z число г' вещественно. Полагая z = О, мы видим, что число b\d должно быть веще- вещественным, а полагая г = ±\,— что вещественными должны быть и числа (±а + 6)/(±с + d). Отсюда непосредственно вы- вытекает, что коэффициенты а, Ь, с, d должны быть пропорцио- пропорциональны вещественным числам. Ясно, что это необходимое усло- условие также и достаточно. Сокращая коэффициенты на общий множитель, мы получаем, таким образом, что любое преобразование из группы Confo" имеет вид '-¦Sir- <•> а Ъ где а, о, с, d — такие вещественные числа, что 0. с d Нормируя коэффициенты а, Ь, с, d, мы можем добиться тогог чтобы последний определитель был равен ±1. Ясно, что совокупность Confo" всех преобразований A), для которых a b с d является подгруппой группы Геометрически преобразования из группы Confo"+ характе- характеризуются тем, что они сохраняют ориентацию вещественной оси. Оказывается целесообразным вместо геометрии с группой Confo" изучать геометрию с группой Соп^о"+, устроенную не- несколько проще. Эти две геометрии настолько тесно связаны, что обратный переход от геометрии с группой Confo^+ к геометрии с группой Confo" никаких затруднений не вызывает. Каждое преобразование из группы Confo"+ переводит точку z = х + iy в точку z' = xr + iy', для которой / (ах + Ь) (сх + d) + асу {cx + dy + (cy) У ~ (сх + dJ + (суJ ' Следовательно, если у Г> 0, то г/'>• 0, а если у ¦< 0, то у' < 0. Это показывает, что геометрия с группой Confo" в опре- определенном смысле распадается на две геометрии, «областями дей- действия» которых являются «верхняя полуплоскость» у > 0 и «нижняя полуплоскость» у <С 0. Эти две геометрии очевидным образом изоморфны, и потому достаточно ограничиться изуче- изучением лишь геометрии точек верхней полуплоскости. Эта геомет- геометрия называется геометрией Пуанкаре на верхней полуплоскости. 741
В связи с этим верхнюю полуплоскость у > О часто называют плоскостью Пуанкаре. Она обозначается символом 1Н+. От каждой окружности из С+ в верхней полуплоскости Н+ остается, вообще говоря, одна дуга. Точнее, возможны следую- следующие четыре случая: 1) остается вся окружность 2; 2) остается вся окружность, за исключением одной точки (случай, когда окружность 2 касается вещественной оси); 3) остается полуокружность (случай, когда окружность 2 ортогональна вещественной оси); 4) остается дуга окружности, не являющаяся полуокруж- полуокружностью (случай, когда окружность 2 образует с вещественной осью угол фп/2). Полуокружности, ортогональные вещественной оси (случай 3), называются прямыми геометрии Пуанкаре. К ним принадле- принадлежат, в частности, евклидовы полупрямые, ортогональные веще- вещественной оси (т. е. «вертикальные» полупрямые, параллельные мнимой оси х = 0). Ясно, что через любые две различные точки полуплоскости Н+ прохо- проходит точно одна прямая. Это свойство и оправдывает термин «прямая» в применении к этим полуокружностям. Поскольку прямая в геометрии Пуанкаре является незамкну- незамкнутой линией, направление на ней однозначно характеризуется двумя точками. Прямую, проходящую через точки z\, z2 и ориен- ориентированную в направлении от точки z{ к точке z2, мы будем обозначать символом [z\, z2]. Прямая [zu z2] пересекает вещественную ось у = 0 в двух точках Х\ и х2 (одной из этих точек может быть точка оо). Предполагая, что эти точки занумерованы так, что точка Х\ предшествует точке Z\ на ориентированной прямой [гь z2], рас- рассмотрим двойное отношение точек zu z2, xu x2: При произвольном преобразовании из группы Confo"+ точки 2j, z2 переходят в некоторые точки z[, z2, прямая [zlt z2] пере- переходит в прямую [z'u z2], а точки хх, х2 — в точки пересечения х'и х2 прямой [z\, z2] с вещественной осью. Поэтому, в силу инвариантности двойного отношения, Таким образом, в геометрии Пуанкаре две точки обладают инвариантом W(zu z2). Это наводит на мысль, что в геометрии Пуанкаре должно иметь смысл какое-то понятие расстояния между точками (яв- (являющееся, вообще говоря, некоторой функцией числа W). Чтобы 742 - - .
выяснить этот вопрос, изучим более внимательно инвариант W(zu га). Во-первых, ясно, что число W(zu z2) вещественно. Действительно, точки zu z2, Х\, х2 принадлежат, по построе- построению, одной окружности. - Заметим теперь, что в группе Confo" + существует (и даже не одно) преобразование, переводящее точку х\ в точку 0, а точку х2 — в точку оо. Например, если обе точки л^и х2 конечны, такое преобразование можно задать формулой г' = ' . г~*' . Х\ — Х% *2 ~~" %2 Прямую [z\, z2] это преобразование переводит в прямую, про- проходящую через точки 0 и оо, т. е. в мнимую ось х = 0. Пусть it)\ и iy2— образы точек г\ и z2 при этом преобразовании. По- Поскольку дробно-линейное преобразование сохраняет порядок то- точек на окружности, точка 0 предшествует точке iy\ на мнимой оси, точка iy\ предшествует точке iy2, а точка iy2 предшествует точке оо. Другими словами, 0 < У\ < У2 < °°- Поскольку, в силу инвариантности, . > iy\ — 0 (/[ 1У2 — 0 Уг отсюда немедленно вытекает, что вещественное число W(zu z2) положительно и не превосхо- превосходит единицы: 0<W(zuz2)<l. Наконец, легко видеть, что для любых трех точек z\, z2, z3, принадлежащих одной пря- прямой (геометрии Пуанкаре) и расположенных^ так, что точка z2 находится между точками z\ и z3, имеет место равенство \ = W(z,,z2)W(z2,z3). Действительно, условие на расположение точек z\, z2, z3 оз- означает, что ориентированные прямые [zu z2], [z2, z3] и [zu z3] совпадают. Поэтому W(Z2,Z3): Za — Xi 22 — X2 Z2 — Xi . Z2 — X2 Z3 — Xi ' Z3 — X2 где Х\ и x2 — одни и те же во всех трех формулах. Требуемое соотношение вытекает, отсюда непосредственно. 743
Мы видим, таким образом, что число \ги z2\=-logW(zuz2) для любых (различных) точек Zi, z% верхней полуплоскости по- положительно (если основание логарифмов больше единицы) и обладает тем свойством, что |2„ Z3\ = \ZU Z2\ + \z2, Z3\ каждый раз, когда точка z2 принадлежит прямой [z\, z3] и рас- расположена между точками Z\ и г3. Это показывает, что число \zu221 обладает одним из важней- важнейших свойств евклидова расстояния. Оно называется расстоянием Пуанкаре между точками z\ и z2. Для случая z\ = z2, мы, естественно, полагаем |2l,Zll = 0. Тогда расстояние \z\, z2\ будет определено для любой пары Z\, z2 точек полуплоскости Н+ и будет равно нулю тогда и только тогда, когда эти точки совпадают. Расстояние \zlt z2\, очевидно, симметрично: \zu г21 = | 22, г, |, поскольку при перестановке точек Z\, z2 переставляются также И ТОЧКИ Хи *2- Кроме того, можно показать, что оно удовлетворяет нера- неравенству треугольника, т. е. \ZU 23|<|2i, Z2\ + \Z2, Z3\ для любых трех точек z\, z2, z3. Задание. Докажите неравенство треугольника для расстояния Пуанкаре. Заметим, что расстояние, Пуанкаре определено только с точностью до множителя (зависящего от основания ло- логарифмов). Чтобы его фиксировать, нужно, как и в евклидовой геометрии, выбрать эталон длины, т. е. отрезок, длина которого принимается за единицу. При приближении точки z2 по прямой [гь <г2] к точке х2 рас- расстояние \z\, z2\ стремится, очевидно, к бесконечности. Аналогич- Аналогично, оно стремится к бесконечности и при ?i->Xi. Таким обра- образом, точки х\ и х2 мы можем рассматривать как бесконечно удаленные точки прямой [zh z2]. Обратим внимание на то, что, в отличие от евклидовой гео- геометрии, прямые в геометрии Пуанкаре имеют, таким образом, две различные бесконечно удаленные точки, которые можно условно называть «левой» и «правой». Для вертикальных полу- полупрямых одной из этих точек является конечная точка веще- вещественной оси, а другой — точка оо; В евклидовой геометрии параллельные прямые можно рас- рассматривать как прямые, имеющие общую бесконечно удаленную 744
(несобственную) точку. По аналогии мы будем две прямые плос- плоскости Пуанкаре называть параллельными, если они имеют об- общую бесконечно удаленную точку. Поскольку прямая имеет в геометрии Пуанкаре две бесконечно удаленные точки, через каждую точку, не принадлежащую прямой, проходят две пря- прямые, параллельные данной: «левая» и «правая». Любая прямая, лежащая «между» этими параллельными прямыми, не пересе- пересекает данной прямой. Читатель, знакомый с геометрией Лобачевского, немедленно обнаружит в этом аксиому параллельности Лобачевского. Более того, без труда проверяется> что все аксиомы геометрии Лоба- Лобачевского выполнены в геометрии Пуанкаре (об этих аксиомах см. дополнение к § 3 гл. 2). Это означает, что геометрия Пуанкаре является одной из интерпретаций гео- геометрии Лобачевского. Упражнение. Проверьте аксиомы геометрии Лобачевского в геометрии Пуанкаре. Поэтому обычно термин «геометрия Пуанкаре» не употреб- употребляется: предпочитают говорить об интерпретации Пуанкаре гео- геометрии Лобачевского. Таким образом, в интерпретации Пуанкаре точками плоскости Лобачевского считаются, по определению, точки верхней полуплоскости Н+, прямыми — полуокружности, ортогональные оси у = О, движениями — преобразования из группы Confo~+. Замечательным свойством интерпретации Пуанкаре является тот факт, что углы между прямыми в этой интерпретации совпа- совпадают с обычными евклидовыми углами (между окружностями). Как уже отмечалось, интерпретацию Пуанкаре необязательно строить в верхней полуплоскости: можно взять любую область в С+, ограниченную окружностью, например, единичный круг \г\<\, ограниченный единичной окружностью \z\= 1. Соответствующая интерпретация называется интерпретацией Пуанкаре в единич- единичном круге. В этой интерпретации прямыми являются полуокруж- полуокружности, ортогональные единичной окружности. Эту интерпретацию мы по существу уже рассматривали в до- дополнении к § 3 гл. 4. Теперь мы, во-первых, можем указать, как измерять длины отрезков в этой интерпретации (длина отрезка с концами в точках Z\ и z% равна логарифму двойного отношения этих точек и точек пересечения с единичной окружностью окруж- окружности, проходящей через точки 2i и 2г и ортогональной единич- единичной окружности), а во-вторых, можем описать все движения: ими будут сохраняющие ориентации конформные преобразования, переводящие единичный круг в себя. 745
Найдем явные формулы для этих движений. Пусть сохраняющее ориентации конформное преобразование переводит в себя единичный круг. Рассмотрим точку z0 единич- единичного круга, переходящую при этом преобразовании в центр О круга. Ясно, что точка l/z0, симметричная точке z0 относительно единичной окружности, переходит при этом преобразовании в точку оо, симметричную точке 0. Действительно, симметричная точка характеризуется (см. п. 1 § 3) тем, что любая окружность, проходящая через точку z0 и ортогональная единичной окруж- окружности, проходит и через точку l/z0. Поэтому любое конформное преобразование, переводящее в себя единичную окружность, переводит симметричные точки в симметричные. Но ясно, что любое сохраняющее ориентации конформное преобразо'вание, переводящее точку Zo в точку 0, а точку 1/г — в точку оо, выражается формулой z т. е. формулой z' = (— az0) *Zt°z ' B) где а — произвольное число. Условие, что конформное преобразование B) переводит еди- единичную окружность в единичную, т. е. условие, что |z'| = 1 при |z| = 1, накладывает некоторые ограничения на число а. Дей- Действительно, при \z\ =1 ~ — Zq = \ Z —• Zq [ = \ Z — Zq\. Поэтому |г'| = 1 при |.г| = 1 тогда и только тогда, когда |azo| = l. Полагая —az0 = eie, мы получаем, что любое сохраняющее ориентации конформное преобразование, переводящее единичный круг в себя, имеет вид где \zo\< I, a 0 произвольно. У нас здесь нет ни времени, ни места подробно изучать гео- геометрию Пуанкаре — Лобачевского. Мы ограничимся лишь тем, что охарактеризуем линии, изображающиеся евклидовыми ок- окружностями (или, точнее, их дугами). Как выше было отмечено, эти линии принадлежат к четырем различным типам 1)—4). Линии типа 3) мы уже рассмотрели: это прямые геометрии Пуанкаре. Займемся поэтому линиями оставшихся типов 1), 2) и 4). 746 • .
Рассмотрим сначала линии типа 1) (окружности, целиком ле- лежащие в верхней полуплоскости). Окружности, ортогонально пе- пересекающие такую окружность 2 и ортогональные вещественной оси у = 0, составляют, очевидно, пучок (являющийся пересече- пересечением гиперболической связки окружностей, ортогональных ок- окружности 2, и гиперболической связки окружностей, ортого- ортогональных вещественной оси). Этому пучку принадлежит, в част- частности, вертикальная прямая, проходящая через евклидов центр окружности 2. Поскольку эта прямая пересекает, как нетрудно видеть, любую другую окружность пучка, этот пучок является эллиптическим пучком, и потому все его окружности проходят через две фиксированные точки. Поскольку линией центров этого пучка является, очевидно, вещественная ось, эти точки симметричны относительно этой оси, и потому одна (и только одна) из них лежит в верхней полуплоскости. Следовательно, переходя от окружностей к соответствующим полуокружностям (прямым плоскости Пуанкаре), мы получаем, что все прямые геометрии Пуанкаре, ортогональные окружности 2, проходят через одну точку z0 верхней полуплоскости. Эта точка называется центром Пуанкаре окружности 2. Она расположена на той же вертикальной прямой, что и евклидов центр этой окружности, но ниже его (ближе к вещественной оси). В евклидовой геометрии окружность с центром в точке А может быть определена как линия, ортогонально секущая все прямые, проходящие через точку А, Принимая то же определе- определение окружности и в геометрии Пуанкаре, мы получаем, следо- следовательно, что окружностями геометрии Пуанкаре являются евклидовы ок- окружности, целиком расположенные в верхней полуплоскости. Однако при этом центром окружности в геометрии Пуанкаре является ее центр Пуанкаре (а не евклидов центр). Теперь естественно возникает вопрос, является ли окруж- окружность геометрии Пуанкаре геометрическим местом точек, рав- равноудаленных от ее центра? Ответ оказывается утвердитель- утвердительным, т. е. линия на плоскости Пуанкаре тогда и только тогда является окружностью с центром z0, когда любая ее точка удовлетворяет уравнению | 20> z | = г, где г — некоторое число {называемое радиусом Пуанкаре этой окружности}. Это утверждение удобнее доказывать в интерпретации не на верхней полуплоскости, а в единичном круге. При этом, по- поскольку соответствующим неевклидовым движением (конформ- (конформным преобразованием) любую точку круга можно перевести в. 747
его центр 0, мы без ограничения общности можем предполагать, что z0 = 0. Таким образом, для доказательства нашего утверждения до- достаточно доказать, что геометрическое место точек z единичного круга, удовлетво- удовлетворяющих уравнению |0, 2| = Г, представляет собой окружность с центром в точке 0 (некото- (некоторого евклидова радиуса R < 1). С этой целью мы заметим, что для любой точки z Ф 0 еди- единичного круга прямой Пуанкаре, проходящей через точки 0 и г, является, очевидно, обыкновенная евклидова прямая. По- Поэтому эта прямая пересекает единичную окружность в точках -.—г и —:—г и, следовательно, по определению, Таким образом, соотношение |0, z\ = г равносильно соотношению \z\ — R, где R = (kr— l)/(kr + 1) (здесь k — основание логариф- логарифмов). Это полностью доказывает наше утверждение. Окружности типа 2) (касающиеся вещественной оси) назы- называются в геометрии Пуанкаре орициклами. Заметим, что ори- орициклом является, в частности, любая прямая у = уо, парал- параллельная вещественной оси (она касается оси в точке оо). Пучок прямых геометрии Пуанкаре, ортогональных орицик- орициклу, является, очевидно, параболическим пучком с центром в точке, в которой орицикл касается вещественной оси. Это озна- означает, что орицикл, касающийся вещественной оси в точке хо, можно рассматривать как окружность с центром Пуанкаре в точке х0. В этом отношении орициклы аналогичны прямым на евкли- евклидовой плоскости (которые можно рассматривать как окружно- окружности с несобственными центрами). Пусть 2 — окружность, проходящая через точки Zo, Z\, z%. Оставляя точки z\, z2 неподвижными, будем придвигать точку z0 к вещественной оси (например, двигая ее вертикально вниз). В пределе получится, очевидно, орицикл. Таким образом, можно сказать, что орициклы являются предельными положениями окружностей. На этом основании они называются также пре- предельными линиями. Аналогичными предельными линиями на евклидовой плоско- плоскости являются прямые. Орициклы обладают многими замечательными свойствами, но у нас нет возможности их здесь изучать. 748
Дуги окружностей типа 4) (пересекающие вещественную ось под углом фп]2) называются эквидистантами. Это назва- название объясняется тем, что геометрическое место точек плоскости Пуанкаре, равноуда- равноудаленных от некоторой прямой, состоит из двух эквидистант, про- проходящих через бесконечно удаленные точки этой прямой. В этой формулировке под расстоянием от точки до прямой понимается, как и в евклидовой геометрии, длина перпендику- перпендикуляра, опущенного из данной точки на прямую. Поскольку неевклидовым движением любую прямую мы мо- можем перевести в любую другую прямую, нам достаточно дока- доказать это утверждение лишь для случая, когда данная прямая является мнимой осью Перпендикулярами к этой прямой будут, очевидно, всевоз- всевозможные полуокружности с центром в точке 0. Такая полуокруж- полуокружность, проходящая через точку z, имеет радиус \z\ и потому пересекает мнимую ось в точке i\z\, а вещественную ось — в точках ±|г|. Следовательно, по определению, расстояние от точки z до прямой х = 0 равно Поэтому условие, что точка z находится от прямой х = 0 на данном расстоянии г, выражается формулой т. е. формулой где k — основание логарифмов. Полагая е ~ 1 - ikr ' мы можем это условие записать в следующем виде: показывающем, что точки г, удаленные от прямой х = 0 на рас- расстояние г, расположены на двух лучах, исходящих из точки 0 и образующих с вещественной осью углы ±6. Для завершения доказательства остается заметить, что эти лучи и являются дугами окружностей, проходящих через бес- бесконечно удаленные точки 0 и оо прямой х = 0. Прямая, от которой равноудалены точки данной эквиди- станты, называется ее базой. 749
В соответствии с тем, что существуют три типа пучков ок- окружностей—эллиптические, параболические и гиперболиче- гиперболические,— на плоскости Пуанкаре можно различать три типа пуч- пучков прямых. Пучки первого (эллиптического) типа состоят из всех прямых геометрии Пуанкаре, проходящих через данную точку z0 (центр пучка). Пучки второго (параболического) типа состоят из всех прямых, проходящих через данную бесконечно удаленную точку х0, т. е. из всех прямых, параллельных неко- некоторой данной прямой. Наконец, пучки третьего (гиперболиче- (гиперболического) типа состоят из всех прямых, ортогональных (т. е. пер- перпендикулярных) некоторой данной прямой (базе пучка). (На евклидовой плоскости последние два типа пучков совпадают, на плоскости Пуанкаре они различны.) Выше мы доказали, что любая окружность ортогонально се- сечет все прямые пучка, центр которого совпадает с центром ок- окружности. Аналогично можно показать, что любой орицикл является линией, ортогонально секущей пря- прямые некоторого пучка паралелльных прямых (бесконечно уда- удаленной точкой которых является центр орицикла), а любая экви- дистанта является линией, ортогонально секущей прямые неко- некоторого пучка перпендикуляров (базой которого является база эквидистанты). Задание. Докажите это утверждение. Пусть Ш — произвольное множество и G — некоторая его группа преобразований. Для любой точки А^Ш множество всех точек, которые можно получить из этой точки преобразо- преобразованиями группы G, называется орбитой точки А (по отношению к группе G). Например, на евклидовой плоскости орбитой точки А по от- отношению к группе Roto вращений вокруг некоторой точки О Ф Ф А является окружность с центром в точке О, проходящая че- через точку А. Если мы на евклидовой плоскости выберем некото- некоторое направление со и рассмотрим группу Transm всех параллель- параллельных переносов на векторы, параллельные прямым направления о, то орбитой произвольной точки А по отношению к этой группе будет прямая направления со, проходящая через точку А. В геометрии Пуанкаре аналогом группы Roto является под- подгруппа группы Confcf+, состоящая из всех преобразований, ос- оставляющих на месте данную точку Zo (такие преобразования естественно называть неевклидовыми вращениями вокруг точки z0). Поскольку все преобразования из этой группы не меняют расстояний Пуанкаре, то орбита произвольной точки z относи- относительно этой группы содержится, очевидно, в окружности с цент- центром Пуанкаре z0 и радиусом, равным |z0, z\. Но легко видеть, что и обратно, эта орбита содержит всю указанную окружность, поскольку для любых двух точек z\ и z2, находящихся от точки Zo на одном и том же расстоянии, существует неевклидово вра- 750
щение вокруг точки z0, переводящее точку Z\ в точку z^. Дей- Действительно, этим вращением будет, как нетрудно видеть, со- сохраняющее ориентации конформное преобразование, оставляю- оставляющее на месте точки zq и zQ я переводящее точку z\. в точку z2. Тем самым доказано, что аналогично евклидовым окружно- окружностям окружности плоскости Пуанкаре с центром в точке z0 яв- являются орбитами группы неевклидовых вращений вокруг этой точки. Параллельные переносы на евклидовой плоскости можно оп- определить как движения, относительно которых инвариантно некоторое направление, т. е. некоторая несобственная точка. По аналогии, переносом (прилагательное «параллельный» здесь неуместно.) плоскости Пуанкаре мы будем называть ее движение (преобразование из группы Confo~+), оставляющее на месте не- некоторую точку хо вещественной оси. Все переносы, оставляющие на месте данную точку х0, образуют, очевидно, группу (являю- (являющуюся аналогом группы TranSo,). Оказывается, что орбитами этой группы являются орициклы, имеющие точку х0 своим центром Пуанкаре. Задание. Докажите это утверждение. Параллельные переносы на евклидовой плоскости можно также определить как движения, переводящие в себя некото- некоторую прямую. По аналогии, сдвигами плоскости Пуанкаре вдоль некоторой прямой мы будем называть ее движения, переводя- переводящие в себя эту прямую. Вообще говоря, сдвиг не является пере- переносом, а перенос — сдвигом. Все сдвиги плоскости Пуанкаре вдоль данной прямой образуют группу (также являющуюся аналогом группы Transo,) и орбитами этой группы являются эквидистанты, базой кото- которых служит данная прямая, а также сама эта прямая. Задание. Докажите это утверждение. Резюмируя, мы можем, таким образом, сказать, что окружности, орициклы, эквидистанты и прямые являются орбитами некоторых групп движений плоскости Пуанкаре. Отсюда, в частности, следует, что все эти линии обладают свойством свободной подвижности, т. е. любой отрезок такой линии можно как угодно двигать по этой линии.
СОДЕРЖАНИЕ Предисловие 7 Глава 1. Векторное исчисление 11 § 1*. Понятие вектора 11 1. Предварительное определение вектора 11 2. Отношения эквивалентности 13 3. Окончательное определение вектора 15 4. Векторы на прямой, на плоскости и в пространстве 19 § 2*. Векторы на прямой . . . ' 21 1. Ориентации прямой 21 2. Длина и величина вектора на прямой 25- 3. Отношение векторов на прямой 2& 4. Сложение векторов на прямой. Лемма Шаля 29 5. Алгебраические свойства линейных операций 30 6. Теорема об изоморфизме 32 § 3*. Линейные операции над векторами на плоскости и в пространстве 34 1. Определение линейных операций 34 2. Алгебраические свойства линейных операций 37 3. Линейная зависимость 38 4. Геометрический смысл линейной зависимости 42 5. Базисы и координаты 46 6. Проекции и координаты 50- 7. Преобразование координат при замене базиса . 54 Дополнение. Теорема о ранге матрицы 58 § 4*. Ориентации прямой, плоскости и пространства 63 1. Понятие ориентации 63 / 2. Правые и левые ориентации 67 3. Произведения ориентации 68 4. Стороны прямой на плоскости и плоскости в пространстве ... 70 5. Деформации базисов и ориентации 73 6. Резюме, 79 Дополнение. О понятии угла 80 § 5*. Метрическая теория векторов 82" 1. Длина вектора и угол между векторами ..'........ 82 2. Скалярное произведение векторов 86 3. Применение скалярного умножения к доказательству геометри- геометрических теорем . . 88 4. Выражение скалярного произведения в координатах 90- 5. Ортонормированные базисы 94 6. Ортогональные матрицы 98 § 6. Поливекторы 105 1. Бивекторы 105 2. Линейные операции над бивекторами 110» 3. Линейная теория бивекторов 116» 4. Метрическая теория бивекторов Ш
5. Тривекторы • 1-26 6. Векторное и смешанное произведения 133 § 7. Линейные операторы 135 1. Отображения и преобразования 135 2. Кольцо линейных операторов 138 3. Описание линейных операторов 140 4. Обратимые линейные операторы 145 5. Операторы, действующие по равенству координат 14у 6. Обратимые линейные операторы и ориентации 15 i 7. Изометричные операторы 155 8. Свойства изометричных операторов 157 Глава 2. Метод координат 164 § 1*. Координаты на прямой, в плоскости и в пространстве 164 1. Аффинные координаты . 164 2. Замена аффинных координат 169 3. Деление отрезка в данном отношении 172 4. Прямоугольные координаты 173 5. Полярные, сферические и цилиндрические координаты .... 175 6. Однородные координаты 177 § 2. Уравнения линий и поверхностей 184 1. Задание линий и поверхностей уравнениями 184 2. Алгебраические линии 187 3. Параметрические уравнения линий и поверхностей 191 § 3. Координатно-аксиоматическое построение геометрии 195 1. Основные положения аксиоматического метода 195 2. Аксиоматика евклидовой геометрии 198 3. Аксиоматика аффинной геометрии . 208 4. Афинная геометрия над полем комплексных чисел 217 5. Вещественно-комплексная геометрия 221 Дополнение. Аксиоматика Гильберта 226 Глава 3. Линии и поверхности первого порядка 239 § I*/ Прямая на плоскости 23Э .239 . 242 . 247 ¦ 251 5. Прямая на евклидовой плоскости 253 § 2*. Плоскость в пространстве 258 1. Плоскость как поверхность первого порядка 258 2. Параметрические уравнения плоскости 260 3. Взаимное расположение плоскостей в пространстве 263 4. Полупространства, на которые плоскость разбивает пространство 266 5. Плоскость в евклидовом пространстве 268 § 3*. Прямая в пространстве 271 1. Прямая в аффинном пространстве 271 2. Взаимное расположение прямых и плоскостей 275 3. Прямая в евклидовом пространстве , . 278 4. Расстояние между двумя прямыми в пространстве .,..,. 282 Глава 4. Геометрии прямых, плоскостей и окружностей 290 § 1. Геометрия прямых на плоскости 290 1*. Пучки прямых . 290 2. Расширенная плоскость , . 294 3. Полнота и непротиворечивость аксиом геометрии расширенной плоскости 298 4. Координаты на расширенной плоскости 302 5. Проективная плоскость 307 6. Интерпретации проективной геометрии и их применения . . . 316 1. Прямая как линия первого порядка 2. Параметрические и канонические уравнения прямой 3. Взаимное расположение прямых на плоскости . . . 4. Полуплоскости, на которые прямая разбивает плоскость .
7. Конфигурационная геометрия 322 Дополнение. Трилинейные координаты 326 § 2. Геометрия плоскостей в пространстве 331 1*. Пучки плоскостей 332 2*. Связки плоскостей 333 3. Расширенное пространство 337 4. Проективное пространство 341 Дополнение. О геометрии прямых в пространстве 346 § 3. Геометрия окружностей на плоскости 349 1. Степень точки относительно окружности 349 2. Связки окружностей 353 3. Пучки окружностей 362 4. Пучки как пересечения связок 370 5. Прямые как окружности 377 6. Окружности на вещественно-комплексной плоскости 386 Дополнение. Геометрии параболической и гиперболической связок 396 Глава 5. Элементарная теория линий и поверхностей второго порядка . 398 § 1*. Линии второго порядка 398 1. Параболы 398 2. Эллипсы 401 3. Гиперболы . 411 4. Уравнения эллипса, параболы и гиперболы в полярных коорди- координатах 423 § 2. Некоторые дополнительные свойства линий второго порядка . . . 426 1. Эллипс, парабола и гипербола как конические сечения .... 426 2. Взаимное расположение конических сечений и прямых .... 430 3. Прямые, касающиеся конических сечений 436 4. Семейства софокусных эллипсов и гипербол 443 5. Диаметры конических сечений 447 6. Теоремы Аполлония 455 § 3*. Поверхности второго порядка 460 1. Эллипсоиды 460 2. Двуполостные гиперболоиды 463 3. Однополостные гиперболоиды 466 4. Прямолинейные образующие однополостного гиперболоида . . . 469 5. Гиперболические параболоиды 480 6. Эллиптические параболоиды 488 7. Конусы второго порядка . 490 8. Цилиндры второго порядка 496 Глава 6. Общая теория линий второго порядка 499 § 1*. Классификация линий второго порядка 499 1. Линии второго порядка на евклидовой плоскости ...... 499 2. Инварианты уравнений линий второго порядка 509 3. Определение вида линии второго порядка по инвариантам ее уравнения 513 4. Линии второго порядка на аффинной плоскости. Теорема един- единственности 519 5. Центры линий второго порядка 527 6. Асимптоты и диаметры линий второго порядка ....... 533. 7. Приведение уравнений линий второго порядка к простейшему виду ^ 540 8. Главные направления и диаметры линий второго порядка . . . 544 Дополнение. Классификация поверхностей второго порядка . 548 § 2. Проективная теория линий второго порядка 554 1. Линии второго порядка на аффинно-проективной и проективной плоскостях . 554 2. Пересечение прямой и линии второго порядка 558 5
3. Поляры и полюсы 563 Дополнение. Поляры в пространстве 568 4. Теорема Безу . . 569 Дополнение. Дифференциально-геометрическое истолкование кратности точки пересечения 577 § 3. Геометрия линий второго порядка 579 1. Пучки линий второго порядка 579 2. Описание пучков линий второго порядка 583 Дополнение. Еще раз о пучках окружностей 593 3. Линии второго порядка, проходящие через пять точек .... 594 Дополнение. Поверхности второго порядка, проходящие че- через девять точек 596 4. Теорема Штурма " 598 5. Теорема Паскаля 601 6. Квадратичные пучки прямых 603 7. Фокусы линий второго порядка 612 Глава 7. Геометрические преобразования , . . . . . . . . . . . .617 § 1. Аффинные, проективные и ортогональные преобразования .... 617 1. Аффинные преобразования 617 . 2. Линейный оператор, индуцированный аффинным преобразованием 621 3. Общий вид афинных преобразований 628 4. Проективные преобразования 633 5. Ортогональные преобразования 637 § 2. Разложение аффинных и ортогональных преобразований в компо- композицию более простых 644 1. Аффинные и ортогональные преобразования прямой 644 2. Разложение аффинных преобразований плоскости и пространства 647 3. Разложение ортогональных преобразований плоскости .... 652 4. Разложение ортогональных преобразований пространства . . . 658 5. Представление движений пространства с помощью кватернионов 665 § 3. Конформные преобразования . . 677 1. Инверсия относительно окружности 677 2. Пополненная плоскость 679 3. Свойства конформных преобразований 686 4. Конформные преобразования и ориентации ......... 694 5. Конформная геометрия л. ... 704 § 4. Группы и геометрии 707 1. Геометрии с данной группой автоморфизмов . 707 2. Простейшие геометрии аффинного типа . 711 3. Геометрии Галилея и Пуансо 718 4. Геометрия Минковского 727 5. Комплексная евклидова геометрия 734 6. Унитарная геометрия 738 7. Геометрия Пуанкаре — Лобачевского 740