Text
                    УДК 514
ББК 22.151
Б42
Беклемишев Д. В. Курс аналитической геометрии и линейной ал-
алгебры: Учеб. для вузов. — 10-е изд., испр. — М.: ФИЗМАТЛИТ, 2005. —
304 с. - ISBN 5-9221-0304-0.
В учебнике излагается основной материал, входящий в объединенный
курс аналитической геометрии и линейной алгебры: векторная алгебра, пря-
прямые и плоскости, линии и поверхности второго порядка, аффинные преобра-
преобразования, системы линейных уравнений, линейные пространства, евклидовы
и унитарные пространства, аффинные пространства, тензорная алгебра.
Настоящее издание существенно переработано. В основном изменения
направлены на улучшение изложения, но сделано много добавлений, из
которых наиболее существенное — теорема ^Кордана. Добавлены задачи и
упражнения, снабженные ответами и указаниями. Произведен также ряд
сокращений.
Для студентов университетов и технических вузов с расширенной про-
программой по математике.
Табл. 2. Ил. 55. Библиогр. 23 назв.
© ФИЗМАТЛИТ, 2000, 2001, 2003, 2004, 2005
ISBN 5-9221-0304-0	© Д. В. Беклемишев, 2000, 2001, 2003, 2004, 2005


ОГЛАВЛЕНИЕ Предисловие 9 ГЛАВА I. ВЕКТОРНАЯ АЛГЕБРА § 1. Векторы 9 1. Предварительные замечания (9). 2. Определение вектора (9). 3. О дру- другом определении вектора A0). 4. Линейные операции A1). 5. Линейная зависимость векторов A3). 6. Базис A6). § 2. Системы координат 17 1. Декартова система координат A7). 2. Деление отрезка в заданном отношении A8). 3. Декартова прямоугольная система координат A9). 4. Полярная система координат A9). 5. Цилиндрические и сферические координаты B0). § 3. Замена базиса и системы координат 21 1. Изменение базиса B1). 2. Изменение системы координат B2). 3. За- Замена декартовой прямоугольной системы координат на плоскости B2). § 4. Скалярное, смешанное и векторное произведения 24 1. Скалярное произведение B4). 2. Ориентация прямой, плоскости и пространства B7). 3. Площадь ориентированного параллелограмма, объем ориентированного параллелепипеда B9). 4. Смешанное произ- произведение C0). 5. Выражение векторного и смешанного произведения через компоненты сомножителей C2). 6. Детерминанты второго и третьего порядков C3). 7. Условия коллинеарности и компланарнос- компланарности C5). 8. Площадь параллелограмма C6). 9. Двойное векторное произведение C7). 10. Биортогональный базис C7). 11. О векторных величинах C8). ГЛАВА П. ПРЯМЫЕ ЛИНИИ И ПЛОСКОСТИ § 1. Общее понятие об уравнениях 40 1. Определения D0). 2. Алгебраические линии и поверхности D2). 3. Уравнения, не содержащие одной из координат D4). 4. Однородные уравнения. Конусы D5). § 2. Уравнения прямых и плоскостей 46 1. Поверхности и линии первого порядка D6). 2. Параметрические урав- уравнения прямой и плоскости D7). 3. Прямая линия на плоскости D8). 4. Векторные уравнения плоскости и прямой E0). 5. Параллельность плоскостей и прямых на плоскости E2). 6. Уравнения прямой в про- пространстве E4). § 3. Основные задачи о прямых и плоскостях 56
Оглавление 1. Уравнение прямой, проходящей через две точки E6). 1. Уравнение прямой, проходящей через две точки E6). 3. Параллельность прямой и плоскости E6). 4. Полупространство E7). 5. Расстояние от точки до плоскости E8). 6. Расстояние от точки до прямой E8). 7. Расстояние между скрещивающимися прямыми E9). 8. Вычисление углов F0). 9. Некоторые задачи на построение F0). 10. Пучок прямых F2). 11. О геометрическом смысле порядка алгебраической линии F3). ГЛАВА III. ЛИНИИ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 1. Исследование уравнения второго порядка 65 2. Эллипс, гипербола и парабола 69 1. Эллипс F9). 2. Гипербола G3). 3. Парабола G6). 3. Линия второго порядка, заданная общим уравнением 79 1. Пересечение линии второго порядка и прямой G9). 2. Тип линии (80). 3. Диаметр линии второго порядка (80). 4. Центр линии второго по- порядка (81). 5. Сопряженные направления (84). 6. Главные направле- направления (85). 7. Касательная к линии второго порядка (85). 8. Особые точки (86). 4. Поверхности второго порядка 88 1. Поверхности вращения (88). 2. Эллипсоид (89). 3. Конус второго по- порядка (90). 4. Однополостный гиперболоид (90). 5. Двуполостный ги- гиперболоид (91). 6. Эллиптический параболоид (92). 7. Гиперболический параболоид (92). ГЛАВА IV. ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ 1. Отображения и преобразования 95 1. Определение (95). 2. Примеры (95). 3. Произведение отображе- отображений (96). 4. Координатная запись отображений (98). 2. Линейные преобразования 99 1. Ортогональные преобразования (99). 2. Определение линейных пре- преобразований A00). 3. Произведение линейных преобразований A02). 4. Образ вектора при линейном преобразовании A03). 3. Аффинные преобразования 106 1. Образ прямой линии A06). 2. Изменение площадей при аффинном преобразовании A07). 3. Образы линий второго порядка A09). 4. Раз- Разложение ортогонального преобразования A10). 5. Разложение аффин- аффинного преобразования A11). ГЛАВА V. МАТРИЦЫ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 1. Матрицы 114 1. Определение A14). 2. Транспонирование матриц A15). 3. Неко- Некоторые виды матриц A16). 4. Сложение и умножение на число A16). 5. Линейная зависимость матриц A17). 2. Умножение матриц 120 1. Символ ^2 A20). 2. Определение и примеры A21). 3. Свойства ум- умножения матриц A23). 4. Элементарные преобразования. Элементар- Элементарные матрицы A25). 5. Вырожденные и невырожденные матрицы A27). 6. Обратная матрица A29). 3. Ранг матрицы 132 2. Основные теоремы A33). 3. Ранг произведения матриц A34). 4. На- Нахождение ранга матрицы A35).
Оглавление 4. Детерминанты 136 1. Определение детерминанта A36). 2. Единственность детерминан- детерминанта A39). 3. Существование детерминанта. Разложение по столбцу A40). 4. Свойства детерминантов A42). 5. Формула полного разложения A43). 5. Системы линейных уравнений (основной случай) 146 1. Постановка задачи A46). 2. Основной случай A48). 3. Правило Крамера A48). 4. Формулы для элементов обратной матрицы A49). 6. Системы линейных уравнений (общая теория) 149 1. Условия совместности A49). 2. Нахождение решений A52). 3. При- Приведенная система A52). 4. Общее решение системы линейных уравне- уравнений A55). 5. Пример A55). ГЛАВА VI. ЛИНЕЙНЫЕ ПРОСТРАНСТВА 1. Основные понятия 157 1. Определение линейного пространства A57). 2. Простейшие следст- следствия A59). 3. Линейная зависимость A59). 4. Базис A60). 5. Замена базиса A63). 6. Ориентация пространства A64). 2. Линейные подпространства 165 1. Определения и примеры A65). 2. Сумма и пересечение подпрост- подпространств A67). 3. Линейные отображения 171 1. Определение A71). 2. Координатная запись отображений A73). 3. Изоморфизм линейных пространств A75). 4. Изменение матрицы линейного отображения при замене базисов A75). 5. Канонический вид матрицы линейного отображения A76). 6. Сумма и произведение отображений A76). 4. Задача о собственных векторах 178 1. Линейные преобразования A78). 2. Умножение преобразований A79). 3. Инвариантные подпространства A80). 4. Собственные подпростран- подпространства A82). 5. Характеристическое уравнение A83). 6. Свойства собст- собственных подпространств A85). 7. Комплексные характеристические числа A86). 8. Приведение матрицы преобразования к диагональному виду A87). 9. Приведение матрицы преобразования к треугольному виду A89). 5. Линейные функции 191 1. Определение функции A91). 2. Линейные функции A91). 3. Сопря- Сопряженное пространство A93). 6. Квадратичные формы 195 1. Билинейные функции A95). 2. Квадратичные формы A97). 3. Ранг и индекс квадратичной формы B01). 4. Полуторалинейные функции B04). 7. Теорема Жордана 205 1. Теорема Гамильтона-Кэли B05). 2. Корневые подпространства B07). 3. Строение корневого подпространства B08). 4. Теорема Жорда- Жордана B11). 5. Приведение к жордановой форме B12). ГЛАВА VII. ЕВКЛИДОВЫ И УНИТАРНЫЕ ПРОСТРАНСТВА 1. Евклидовы пространства 215 1. Скалярное произведение B15). 2. Длина и угол B16). 3. Выражение скалярного произведения через координаты сомножителей B17). 4. Ор- Ортогональные базисы B18). 5. Ортогональные матрицы B19). 6. Ортого- Ортогональное дополнение подпространства B20). 7. Ортогональные проек-
Оглавление ции B21). 8. Метод ортогонализации B21). 9. фй-разложение B23). 10. Объем параллелепипеда B23). § 2. Линейные преобразования евклидовых пространств 225 1. Преобразование, сопряженное данному B25). 2. Самосопряженные преобразования B26). 3. Изоморфизм евклидовых пространств B29). 4. Ортогональные преобразования B30). 5. Полярное разложение B32). § 3. Функции на евклидовых пространствах 235 1. Линейные функции B35). 2. Преобразование, присоединенное к били- билинейной функции B36). 3. Ортонормированный базис, в котором квад- квадратичная форма имеет диагональный вид B37). § 4. Понятие об унитарных пространствах 239 1. Определение B39). 2. Свойства унитарных пространств B41). 3. Са- Самосопряженные и унитарные преобразования B42). 4. Эрмитовы фор- формы в унитарном пространстве B43). ГЛАВА VIII. АФФИННЫЕ ПРОСТРАНСТВА § 1. Плоскости 245 1. Аффинное пространство B45). 2. Плоскости в аффинном простран- пространстве B47). § 2. Общая теория линий и поверхностей второго порядка 248 1. Закон преобразования коэффициентов B48). 2. Линии второго по- порядка на плоскости B51). 3. Ортогональные инварианты B52). 4. По- Поверхности второго порядка B53). ГЛАВА IX. ОСНОВЫ ТЕНЗОРНОЙ АЛГЕБРЫ § 1. Тензоры в линейном пространстве 259 1. Вводные замечания B59). 2. Обозначения B59). 3. Определение и примеры B61). 4. Линейные операции B64). 5. Умножение тензо- тензоров B65). 6. Свертывание B66). 7. Транспонирование B68). 8. Сим- Симметрирование и альтернирование B69). 9. Замечание B70). 10. Сим- Симметричные и антисимметричные тензоры B71). § 2. Тензоры в евклидовом пространстве 273 1. Метрический тензор B73). 2. Поднятие и опускание индексов B73). 3. Евклидовы тензоры B74). § 3. Поливекторы. Внешние формы 277 1. р-векторы B77). 2. Относительные инварианты B79). 3. Внешние формы B80). 4. Внешнее умножение B81). Указания и ответы к упражнениям 285 Предметный указатель 298 Список литературы 302
ГРЕЧЕСКИЙ АЛФАВИТ А, а альфа Е, е эпсилон I, I йота N, v ню Р, 9 ро Ф, ф фи в, /3 бета дзета К, к каппа кси S, о сигма х,х ХИ Г, 7 гамма Н, г) эта Л, Л лямбда О, о омикрон Т, т тау Ф, ф пси A, S дельта 0, в тета М, 11 мю П, 7Г ри Y,v ипсилон п, и омега
ПРЕДИСЛОВИЕ Эта книга отражает многолетний опыт преподавания соответст- соответствующего курса в Московском физико-техническом институте. Осо- Особенности подготовки студентов МФТИ вызывают необходимость ускоренного изложения курса математики, по объему приближаю- приближающегося к университетскому. В связи с этим аналитическая геометрия излагается так, чтобы на простом и доступном материале подго- подготовить студента к изучению линейной алгебры. Собственно линейной алгебре, т. е. теории линейных пространств, предпослана большая глава о системах линейных уравнений и матрицах. Ее цель — дать читателю исследование систем линейных уравнений, независимое от методов линейной алгебры. В этой же главе собраны и другие све- сведения, необходимые для дальнейшего. Настоящее издание существенно отличается от предыдущих. Про- Произведены две перестановки материала: в теории определителей ис- используется умножение матриц и элементарные операции, теория евклидовых пространств излагается после квадратичных форм. До- Добавлены параграфы о теореме Жордана и о внешних формах. Кроме того, сделан ряд других дополнений и изменений. В конце каждого параграфа добавлены упражнения, снабженные ответами и указа- указаниями. Произведены также некоторые сокращения. В настоящем издании улучшены некоторые доказательства и ис- исправлены погрешности предыдущего. В частности, ранг матрицы из- изучается независимо от теории определителей. Добавлена теорема о приведении матрицы линейного преобразования к треугольному ви- виду. Более подробное представление о строении книги можно получить из оглавления. Мне хочется с благодарностью отметить то влияние, которое ока- оказали на эту книгу преподаватели кафедры высшей математики МФТИ, больше других все, читавшие лекции по курсу аналитической геометрии и линейной алгебры. Особенно я благодарен проф. А.А. Абрамову, проф. Л.А. Беклемишевой, чл.-корр. РАН Л.Д. Кудряв- Кудрявцеву, проф. В.Б. Лидскому, акад. Л.В. Овсянникову, проф. С.С. Рыш- кову, проф. С.А. Теляковскому.
ГЛАВА I ВЕКТОРНАЯ АЛГЕБРА § 1. Векторы 1. Предварительные замечания. Первые главы этой книги можно рассматривать как продолжение школьного курса геометрии. Известно, что каждая математическая дисциплина основывается на некоторой системе не доказываемых предложений, называемых ак- аксиомами. Полный перечень аксиом геометрии, так же, как и обсуж- обсуждение роли аксиом в математике, можно найти в книге Н.В. Ефи- Ефимова [5]. (Цифры в квадратных скобках означают ссылки на список рекомендуемой литературы, помещенный в конце книги.) Мы не ставим себе целью изложение логических основ предмета и потому просто опираемся на теоремы, доказываемые в курсе элемен- элементарной геометрии. Равным образом мы не пытаемся дать определения основных геометрических понятий: точки, прямой, плоскости. Чита- Читатель, интересующийся их строгим введением, может обратиться к той же книге Н.В. Ефимова, мы же просто будем считать, что эти и другие введенные в школьном курсе математики понятия известны читателю. Предполагаются также известными определение вещественных (действительных) чисел и их основные свойства. (Строгая теория вещественного числа приводится в учебниках математического ана- анализа.) Будет широко использоваться то обстоятельство, что при выб- выбранной единице измерения каждому отрезку можно сопоставить положительное вещественное число, называемое его длиной. Едини- Единицу измерения длин мы будем считать выбранной раз и навсегда и, говоря о длинах отрезков, не будем указывать, какой единицей они измеряются. 2. Определение вектора. Понятие вектора также известно из школьного курса, но лучше напомнить основные факты, с ним свя- связанные. Пару точек мы называем упорядоченной, если про эти точки известно, какая из них первая, а какая — вторая. Определение 1. Отрезок, концы которого упорядочены, назы- называется направленным отрезком или вектором. Первый из его концов называется началом, второй — концом вектора. К векторам относит- относится и нулевой вектор, у которого начало и конец совпадают. Направление вектора на рисунке принято обозначать стрелкой, над буквенным обозначением вектора тоже ставится стрелка, напри-
10 Гл. I. Векторная алгебра мер АВ (при этом буква, обозначающая начало, обязательно пишется первой). В книгах буквы, обозначающие векторы, набираются полу- полужирным шрифтом, например а. Нулевой вектор обозначается 0. Расстояние между началом и концом вектора называется его дли- длиной (а также модулем или абсолютной величиной). Длина вектора обо- обозначается а или АВ\. Векторы называются коллинеарными, если существует такая пря- прямая, которой они параллельны. Векторы компланарны, если сущест- существует плоскость, которой они параллельны. Нулевой вектор считается коллинеарным любому вектору, так как он не имеет определенного направления. Длина его, разумеется, равна нулю. Определение 2. Два вектора называются равными, если они коллинеарны, одинаково направлены и имеют равные длины. Из этого определения вытекает, что, выбрав любую точку А', мы можем построить (и притом только один) вектор |А'#'|, равный не- некоторому заданному вектору |АЕ?|, или, как говорят, перенести век- вектор \АВ\ в точку А'. 3. О другом определении вектора. Понятие равенства векто- векторов существенно отличается от понятия равенства, например, чисел. Каждое число равно только самому себе, иначе говоря, два равных числа при всех обстоятельствах могут рассматриваться как одно и то же число. С векторами дело обстоит по-другому: в силу определе- определения существуют различные, но равные между собой векторы. Хотя в большинстве случаев у нас не будет необходимости различать их между собой, вполне может оказаться, что в какой-то момент нас будет интересовать именно вектор АВ, а не равный ему вектор А'В'. Для того чтобы упростить понятие равенства и снять некоторые связанные с ним трудности, иногда идут на усложнение определения вектора. Мы не будем пользоваться этим усложненным определени- определением, но сформулируем его. Чтобы не путать, будем писать "Вектор" (с большой буквы) для обозначения определяемого ниже понятия. Определение 3. Пусть дан направленный отрезок. Множест- Множество всех направленных отрезков, равных данному в смысле определе- определения 2, называется Вектором. Таким образом, каждый направленный отрезок определяет Век- Вектор. Легко видеть, что два направленных отрезка определяют один и тот же Вектор тогда и только тогда, когда они равны согласно определению 2. Для Векторов, как и для чисел, равенство означает совпадение. Из начального курса физики хорошо известно, что сила может быть изображена направленным отрезком. Но она не может быть изображена Вектором, поскольку силы, изображаемые равными нап- направленными отрезками, производят, вообще говоря, различные дейст- действия. (Если сила действует на упругое тело, то изображающий ее отре-
§ 1. Векторы 11 зок не может быть перенесен даже вдоль той прямой, на которой он лежит.) Это только одна из причин, по которой наряду с Векторами при- приходится рассматривать и направленные отрезки. При этих обстоя- обстоятельствах применение определения 3 осложняется большим числом оговорок. Мы будем придерживаться определения 1, причем по обще- общему смыслу всегда будет ясно, идет речь об определенном векторе или на его место может быть подставлен любой, ему равный. В связи со сказанным стоит разъяснить значение некоторых слов, встречающихся в литературе. Вместо определения 2 можно ввести для векторов другое определение равенства, согласно которому векто- векторы равны, если они равны по длине, лежат на одной прямой и направ- направлены в одну сторону. В этом случае вектор не может быть перенесен в любую точку пространства, а переносится только вдоль прямой, на которой он лежит. При таком понимании равенства векторы назы- называются скользящими векторами. В механике сила, действующая на абсолютно твердое тело, изображается скользящим вектором. Можно для векторов не давать никакого особого определения ра- равенства, т. е. считать, что вектор характеризуется, помимо длины и направления в пространстве, еще и точкой приложения. В этом слу- случае векторы называются приложенными. Как уже упоминалось, сила, действующая на упругое тело, изображается приложенным вектором. Если нужно подчеркнуть, что равенство векторов понимается в смысле определения 2, то векторы называются свободными. 4. Линейные операции. Так называются сложение векторов и умножение вектора на число. Напомним их определения. Определение. Пусть даны два вектора а и Ь. Построим равные им векторы АВ и ВС. Тогда вектор АС называется суммой векто- векторов а и b и обозначается а + Ь. Заметим, что, выбрав вместо В другую точку, мы получили бы другой вектор, равный вектору АС. Определение. Произведением вектора а на вещественное чис- число а называется вектор Ь, удовлетворяющий следующим условиям: а) |Ь| = |а||а|; б) b коллинеарен а; в) b и а направлены одинаково, если а > 0, и противоположно, если а < 0. (Если же а = 0, то из первого условия следует b = 0.) Произведение вектора а на число а обозначается аа.. Приведенное определение определяет вектор аа. не единственным образом, но все удовлетворяющие ему векторы равны между собой. В курсе средней школы были выведены основные свойства линей- линейных операций. Перечислим их без доказательства.
12 Гл. I. Векторная алгебра Предложение 1. Для любых векторов a, b и с и любых чисел а и C выполнено: 1) а + b = b + а {сложение коммутативно)] 2) (а + Ь) + с = а + (Ь + с) [сложение ассоциативно)] 3) а + 0 = а; 4) вектор (—1)а противоположный для а: а + (—1)а = 0; 5) (а/3)а = а(/3а); 6) (а + /?)а = аа + /За; 7) а(а + b) = аз, + ab; 8) 1а = а. Вектор (—1)а обозначается —а. Разностью векторов а и b называ- называется сумма векторов а и —Ь. Она обозначается а — Ь. Если b + х = = а, то х = а — b (рис. 1). В этом смысле вычитание — операция, сопоставляющая паре векторов разность первого и второго, — есть операция, обратная сложению, и мы не считаем его отдельной операцией. Точно так же мы не выделяем деление вектора на число а, так как его можно определить как умножение на а~г. Из определения произведения вектора на число прямо следует П ре д ложен и е 2. Если а ф 0, то любой век- вектор Ь, коллинеарный а, представим в виде b = = ±(|b|/|a|)a. Знак + или — берут, смотря по тому, направлены а и Ъ однаково или нет. Применяя линейные операции, можно составлять суммы векто- векторов, умноженных на числа: aiai + «2^2 + ... + о^а/,. Выражения та- такого вида называются линейными комбинациями. Числа, входящие в линейную комбинацию, называются ее коэффициентами. Свойства, перечисленные в предложении 1, позволяют преобразовывать линей- линейные комбинации по обычным правилам алгебры: раскрывать скобки, приводить подобные члены, переносить некоторые члены в другую часть равенства с противоположным знаком и т. д. Предложение 1 дает в некотором смысле полный набор свойств: любые вычисления, использующие линейные операции, можно про- производить, основываясь на них и не обращаясь к определениям. Это будет иметь для нас принципиальное значение в гл. VI. Линейные комбинации обладают следующим очевидным свойст- свойством: если векторы ai, ...,а& коллинеарны, то любая их линейная ком- комбинация им коллинеарна. Если же они компланарны, то любая их ли- линейная комбинация им компланарна. Это сразу следует из того, что вектор аз. коллинеарен а, а сумма векторов компланарна слагаемым и коллинеарна им, если они коллинеарны. Множество называется замкнутым относительно некоторой опе- операции, если для любых элементов множества результат применения этой операции принадлежит данному множеству.
§1. Векторы 13 Определение. Множество векторов, замкнутое относительно линейных операций, называется векторным пространством. Если од- одно векторное пространство является подмножеством другого, то оно называется его подпространством. Таким образом, можно сказать, что множество всех векторов, параллельных данной прямой, и множество всех векторов, парал- параллельных данной плоскости, являются векторными пространствами. Чтобы различать эти два типа векторных пространств, их называ- называют соответственно одномерными и двумерными пространствами. Помимо упомянутых, существуют еще два векторных простран- пространства: нулевое или нульмерное, состоящее только из нулевого вектора, и трехмерное — множество всех векторов пространства. Нулевое пространство является подпространством для каждого другого, и каждое векторное пространство является подпространст- подпространством для трехмерного. 5. Линейная зависимость векторов. Мы будем говорить, что вектор b раскладывается по векторам ai,...,a^, если он представим как их линейная комбинация: найдутся такие коэффициенты, что b = —/Jiai + ••• + ftk&k- Вполне может случиться, что какой-то вектор рас- раскладывается по данной системе векторов, и при этом коэффициенты разложения определены неоднозначно. Например, если а3 = ai +a2, то вектор b = —аз раскладывается так же, как b = —ai — а2 или b = аз — 2ai — 2а2 и т. д. Посмотрим, с чем это связано. Нулевой вектор раскладывается по любой системе векторов: мы получим нулевой вектор, если возьмем линейную комбинацию этих векторов с нулевыми коэффициентами. Такая линейная комбинация называется тривиальной. Определение. Система векторов ai,...,afe называется линейно независимой, если нулевой вектор раскладывается по ней единствен- единственным образом. Иначе говоря, система векторов линейно независима, если толь- только тривиальная линейная комбинация этих векторов равна нулевому вектору, или, подробнее, если из равенства aiai + ... + а^а/, = 0 сле- следует, что а\ = ... = аи = 0. Система векторов ai,..., а/, линейно зависима, если нулевой вектор раскладывается по ней не единственным образом, т. е. если найдутся такие коэффициенты ai,...,a^, что aiai + ... + а^а^ = 0, но не все они равны нулю: а\ + ... + а\ ф 0. Рассмотрим свойства линейно-зависимых и линейно-независимых систем векторов. • Если среди векторов ai,..., а/, есть нулевой, то такая система ли- линейно зависима. Действительно, рассмотрим линейную комбинацию, в которую 0 входит с коэффициентом 1, а остальные векторы с ну- нулевыми коэффициентами. Эта линейная комбинация нетривиальна и равна нулевому вектору. В частности,
14 Гл. I. Векторная алгебра • Система, содержащая один вектор, линейно зависима, если он нулевой. • Если к линейно зависимой системе ai,...,a/, добавить какие-то векторы bi, ...,hs, то полученная система векторов будет линейно за- зависимой. В самом деле, к имеющейся равной 0 нетривиальной линей- линейной комбинации векторов ai, ...,а^ можно добавить векторы bi, ...,hs с нулевыми коэффициентами. Таким образом, • Если в системе векторов какая-то часть линейно зависима, то вся система обязательно линейно зависима. Отсюда от противного следует, что • Любая часть линейно независимой системы линейно независима. Предложение 3. Если вектор х раскладывается по системе векторов ai,...,a^, то это разложение единственно тогда и только тогда, когда система векторов линейно независима. Действительно, пусть существуют два разложения х = aiai + ... ... + oik^-k и х = /3iai + ... + @иъ-к- Вычитая их почленно одно из дру- другого, мы получим (а\ — /3i)ai + ... + [аи — Рк)&-к = 0. Если векторы линейно независимы, отсюда следует, что о>\ — E\ = 0, ..., а^ — Рк — О, т. е. оба разложения совпадают. Обратно, если векторы линейно зависимы, существует их нетри- нетривиальная линейная комбинация, равная нулевому вектору: ai^i + ... ... + QLk&k — 0. Мы можем прибавить ее к имеющемуся разложению х = /3iai + ... + fikS-k и получить новое разложение х по тем же век- векторам: х = («1 + /3i)ai + ... + {аи + /3k)&k- Предложение доказано. Предложение 4. Система из к > 1 векторов линейно зави- зависима тогда и только тогда, когда один из векторов раскладывает- раскладывается по остальным. Доказательство. Пусть система векторов ai,...,a^ линейно зависима, т. е. существуют такие коэффициенты ai,...,a^, что aia.i + ... + QLk&k — 0, и, например, о>\ отличен от нуля. В этом случае мы можем разложить ai по остальным векторам: ai = а2 -3Lk- ai ai Обратно, пусть один из векторов, например, ai, разложен по осталь- остальным векторам: ai = ,6^2 + ... + Pk^-k- Это означает, что линейная ком- комбинация векторов ai,...,a/, с коэффициентами —1,/?2, ...,/3fc равна ну- нулевому вектору. Предложение доказано. Понятие линейной зависимости будет играть большую роль в даль- дальнейшем изложении, но сейчас мы могли бы обойтись без него ввиду простого геометрического смысла, который имеет это понятие. Теорема 1. Система из одного вектора линейно зависима тогда и только тогда, когда это — нулевой вектор. Система из двух векторов линейно зависима тогда и только тог- тогда, когда векторы коллинеарны.
§ 1. Векторы 15 Система из трех векторов линейно зависима тогда и только тог- тогда, когда векторы компланарны. Любые четыре вектора линейно зависимы. Доказательство 1. Мы уже отмечали, что нулевой вектор со- составляет линейно зависимую систему. Система, содержащая только ненулевой вектор линейно независима, так как при его умножении на число, отличное от нуля, получится ненулевой вектор. 2. Пусть векторы а и b коллинеарны. Если а = 0, то а и b линейно зависимы. Пусть а ф 0. Тогда по предложению 2 b раскладывается по а. Таким образом, в любом случае коллинеарные векторы линейно зависимы. Обратно, из двух линейно зависимых векторов один обязательно раскладывается по другому и, следовательно, ему коллинеарен. 3. Пусть векторы a, b и с компланарны. Если а и b коллинеарны, то они линейно зависимы, и тогда линей- линейно зависимы все три вектора. Пусть а и b не коллинеарны. Разложим с по ним. Для этого поместим начала всех век- векторов в одну точку О (рис. 2) и прове- проведем через конец С вектора с прямую, параллельную Ь, до пересечения в точ- точке Р с прямой, на которой лежит а. (Это построение возможно, так как век- векторы а и b не коллинеарны и, в част- частности, оба ненулевые.) Теперь ОС = OP + PC, причем ОР и PC коллинеарны соответственно а и Ь. По доказанному выше найдут- найдутся числа а и C такие, что ОР = ааи PC = /ЗЪ. Таким образом, с = = аз. + /ЗЪ. Это означает, что a, b и с линейно зависимы. Обратно, если a, b и с линейно зависимы, то один из них раскла- раскладывается по двум другим и, следовательно, им компланарен. 4. Рассмотрим четыре вектора а, Ь, с и d. Если a, b и с компла- компланарны, то они линейно зависимы сами по себе и вместе с вектором d. Пусть a, b и с не компланарны. Аналогично предыдущему докажем, что d раскладывается по ним. Поместим начала всех векторов в од- одну точку О (рис. 3) и проведем через конец D вектора d прямую, параллельную с, до пересе- пересечения в точке Р с плоскостью, на которой ле- лежат а и Ь. Теперь OD =ОР + PD, причем ОР компланарен а и b, a PD коллинеарен с. По доказанному выше ОР раскладывается по а и b, a PD — по с. Значит, d разложен по a, b и с и составляет с ними линейно зависимую систему. Теорема дока- доказана. Рис. 2 Рис. 3
16 Гл. I. Векторная алгебра 6. Базис. В конце п. 4 было дано определение векторного прост- пространства. Введем следующее Определение. Базисом в векторном пространстве называется упорядоченная линейно независимая система векторов такая, что лю- любой вектор этого пространства по ней раскладывается. Из теоремы 1 сразу вытекает, что • В нулевом пространстве базиса не существует. • В одномерном пространстве (на прямой линии) базис состоит из одного ненулевого вектора. • В двумерном пространстве (на плоскости) базис — упорядочен- упорядоченная пара неколлинеарных векторов. • В трехмерном пространстве базис — упорядоченная тройка не- некомпланарных векторов. Требование упорядоченности означает, что, например, в случае плоскости a, b и b, a — два разных базиса. Так как векторы базиса линейно независимы, коэффициенты раз- разложения по базису для каждого вектора пространства определены од- однозначно. Они называются компонентами или координатами вектора в этом базисе. Таким образом, если ei, е2, е3 — базис трехмерного пространства, то по формуле а = a\G\ + а2е2 + «зез каждому вектору сопоставлена единственная упорядоченная тройка чисел «i,a2,a3 и каждой трой- тройке чисел — единственный вектор. Аналогично, вектор на плоскости имеет две компоненты, а на прямой — одну. Компоненты пишутся в скобках после буквенного обозначения век- вектора, например аA,0,1). В аналитической геометрии геометрические рассуждения о векто- векторах сводятся к вычислениям, в которых участвуют компоненты этих векторов. Следующее предложение показывает, как производятся ли- линейные операции над векторами, если известны их компоненты. Предложение 5. При умножении вектора на число все его ком- компоненты умножаются на это число. При сложении векторов склады- складываются их соответствующие компоненты. Действительно, если а = «iei + а2е2 + а3е3, то Аа = / Если а = а а + b = (ai \(aie: ei + i a2e2 2e2 + aj + a3e3 + «зе3) и + b = A • (Aei - ai)ei + (Aa2)e2 H ei +/32e2 +/33e3, f /32e2+/33e3) = h (Aa3)e3. TO = (ах + /?i)ei + (а2 + /32)е2 + (а3 Для одномерного и двумерного пространств доказательство отли- отличается только числом слагаемых.
§2. Системы координат 17 Упражнения 1. Докажите, что точка С лежит на отрезке АВ тогда и только тогда, когда существует число Л Е [0,1] такое, что для любой точки О выполне- выполнено ОС = ХОА + A — \)ОВ. Если Л дано, то в каком отношении точка С делит отрезок АВ? 2. Дан правильный шестиугольник ABCDEF, \АВ\ = 2. Найдите коор- координаты вектора АС в базисе АВ, AD. 3. В некотором базисе на плоскости заданы координаты векторов аA, 2), ЬB,3) и с(—1,1). Проверьте, что а и b линейно независимы, и найдите ко- координаты с в базисе а, Ь. 4. Даны три точки А, В и С. Найдите такую точку О, что О А + + ОВ + ОС = 0. Решив аналогичную задачу для четырех точек, докажите, что в треугольной пирамиде отрезки, соединяющие вершины с центрами тяжести противоположных граней, пересекаются в одной точке. § 2. Системы координат 1. Декартова система координат. Фиксируем в пространст- пространстве точку О и рассмотрим произвольную точку М. Радиус-вектором точки М по отношению к точке О называется вектор ОМ. Если в пространстве кроме точки О выбран некоторый базис, то точке М со- сопоставляется упорядоченная тройка чисел — компоненты ее радиус- вектора. Определение. Декартовой системой координат в пространстве называется совокупность точки и базиса. Точка носит название начала координат. Прямые, проходящие че- через начало координат в направлении базисных векторов, называются осями координат; первая — осью абсцисс, вторая — осью ординат, третья — осью аппликат. Плоскости, проходящие через оси коорди- координат, называются координатными плоскостями. Определение. Пусть дана декартова система координат О, е1,в2,ез. Компоненты x,y,z радиус-вектора ОМ точки М назы- называются координатами точки М в данной системе координат: ОМ = xei + уе2 + ze3. Первая координата называется абсциссой, вторая — ординатой, а третья — аппликатой. Аналогично определяются координаты на плоскости и на прямой линии. Разумеется, точка на плоскости имеет только две координаты, а на прямой линии — одну. уе2 АA/2 1/2) Координаты точки пишут в скобках пос- после буквы, обозначающей точку. Например, за- запись А{2,1/2) означает, что точка А имеет ко- координаты 2 и 1/2 в ранее выбранной декартовой системе координат на плоскости (рис. 4). 2 Д.В. Беклемишев
18 Гл. I. Векторная алгебра Координаты точки, как и компоненты вектора, — величины без- безразмерные. В частности, они не зависят от выбранной единицы из- измерения длин. В самом деле, раскладывая векторы в теореме 1, мы сводили дело к разложению вектора по коллинеарному с ним ненуле- ненулевому вектору. А в этом случае компонента равна отношению длин, взятому с определенным знаком (предложение 2). Легко видеть, что при заданной системе координат координаты точки определены однозначно. С другой стороны, если задана систе- система координат, то для каждой упорядоченной тройки чисел найдет- найдется единственная точка, имеющая эти числа в качестве координат. Система координат на плоскости определяет такое же соответствие между точками плоскости и парами чисел. Задание системы коорди- координат на прямой линии сопоставляет каждой точке вещественное число и каждому чис- числу — точку. Рассмотрим две точки А и В, коорди- координаты которых относительно некоторой де- декартовой системы координат О, е1,в2,ез соответственно x\,y\,z\ и #2,2/2,^2- Поста- Поставим себе задачу найти компоненты век- вектора АВ. Очевидно, что АВ = ОВ - О А (рис. 5). Компоненты радиус-векторов О А и ОВ равны (#i,2/ij2i) и (#2,2/2,^2) по определению координат. Из предложения 5 § 1 следует, что АВ имеет компоненты (#2 — #i,2/2 — У 1^2 — z\). Этим доказано следующее Предложение 1. Чтобы найти координаты вектора, нужно из координат его конца вычесть координаты его начала. 2. Деление отрезка в заданном отношении. Найдем коорди- координаты точки М на отрезке АВ, которая делит этот отрезок в отноше- отношении X/11, т. е. удовлетворяет условию B(x2,y2,z2) О Рис. 5 \АМ\ _ А --^ Л>0' О > О (рис. 6). Это условие можно переписать в виде ^ ^ цАМ = ХМВ. A) Обозначив через (#1,2/1,21) и (#2,2/2,22) со- Рис# 6 ответственно координаты точек А и В, а через (x,y,z) координаты точки М, разложим обе части равенства по базису, причем компоненты векторов AM и MB найдем по пред- предложению 1. Тогда /i(# - #1) = Л(#2 - #), fi(y - yi) = АB/2 - у), z\) =
§2. Системы координат 19 Из этих равенств можно найти ж, у и z, поскольку Л + \i ф 0: _ /1X1 + \Х2 _ Ml + Ху2 _ № + Xz2 /9ч Если в формулах B) мы будем считать одно из чисел Л или \i отрицательным, то из равенства A) увидим, что М находится на той же прямой вне отрезка АВ, деля его в отношении |A//i|. Поэтому из формул B) можно найти координаты точки, делящей отрезок в заданном отношении как внутренним, так и внешним образом. На плоскости и на прямой линии задача о делении отрезка ре- решается точно так же, только из трех равенств в B) остается соот- соответственно два и одно равенство. 3. Декартова прямоугольная система координат. Общие де- декартовы системы координат используются реже, чем специальный класс таких систем — декартовы прямоугольные системы координат. Определение. Базис называется ортонормированным, если его векторы попарно ортогональны и по длине равны единице. Декартова система координат, базис которой ортонормирован, называется декар- декартовой прямоугольной системой координат. Нетрудно проверить, что координаты точки относительно декар- декартовой прямоугольной системы координат в пространстве по абсолют- абсолютной величине равны расстояниям от этой точки до соответствующих координатных плоскостей. Они имеют знак плюс или минус в зави- зависимости от того, лежит точка по ту же или по другую сторону от плоскости, что и конец базисного вектора, перпендикулярного этой плоскости. Аналогично находят координаты точки относительно декартовой прямоугольной системы координат на плоскости. 4. Полярная система координат. Декартовы системы коорди- координат не единственный способ определять при помощи чисел положение точки на плоскости. Для этого используются многие другие типы ко- координатных систем. Здесь мы опишем некоторые из них. На плоскости часто употребляется полярная система координат. Она определена, если задана точка О, называемая полюсом, и исходя- исходящий из полюса луч /, который называется полярной осью. Положение точки М фиксируется двумя числами: радиу- радиусом г = \ОМ\ и углом (р между полярной осью и вектором ОМ. Этот угол называется полярным углом (рис. 7). Мы будем измерять полярный угол в радиа- радианах и отсчитывать от полярной оси против ча- часовой стрелки. У полюса г = 0, a ip не определе- определено. У остальных точек г > 0, a ip определяется с точностью до слагаемого, кратного 2тг. Это озна-
20 Гл. I. Векторная алгебра чает, что пары чисел (г, ф), (г, ip + 2тг) и вообще (г, ip + 2&тг), где к — любое целое число, представляют собой полярные координаты одной и той же точки. Иногда ограничивают изменение полярного угла какими-нибудь условиями, например, 0 ^ ip < 2тг или —тг < ip ^ тг. Это устраняет неоднозначность, но зато вводит другие неудобства. Пусть задана полярная система координат и упорядоченная пара чисел (г, ip), из которых первое неотрицательно. Мы можем сопоста- сопоставить этой паре точку, для которой эти числа являются полярными координатами. Именно, если г = 0, мы сопоставляем полюс. Если же г > 0, то паре (г, ф) ставим в соответствие точку, радиус-вектор ко- которой имеет длину г и составляет с полярной осью угол ср. При этом парам чисел (г,ср) и (ri,(^i) сопоставляется одна и та же точка, ес- ли г = ri, а ср — ipi = 2тг&, где к — целое число. Выберем на плоскости декартову прямоугольную систему коор- координат, поместив ее начало в полюс О и приняв за базис векторы ei и в2 длины 1, направленные соответственно вдоль полярной оси и под углом тг/2 к ней (угол отсчитывается против часовой стрелки). Как легко видеть из рис. 7, декартовы координаты точки выражаются через ее полярные координаты формулами x = rcos(^, y = rsm(p. C) 5. Цилиндрические и сферические координаты. В простран- пространстве обобщением полярных систем координат являются цилиндричес- цилиндрические и сферические системы координат. И для тех, и для других фи- фигура, относительно которой определяется положение точки, состоит из точки О, луча I, исходящего из О, и вектора п, равного по дли- длине 1 и перпендикулярного к I. Через точку О проведем плоскость 0, перпендикулярную вектору п. Луч I лежит в этой плоскости. Пусть дана точка М. Опустим из нее перпендикуляр ММ' на плос- плоскость 0. Цилиндрические координаты точки М — это три числа г, (р, h. Числа г и ср — полярные координаты точки М' по отношению к полю- Рис. 8 Рис. 9 су О и полярной оси I, a h — компонента вектора М'М по вектору п. Она определена, так как эти векторы коллинеарны (рис. 8).
§3. Замена базиса и системы координат 21 Сферические координаты точки — три числа (r,ip,6). Они опреде- определяются так: г = |ОМ|. Как и для цилиндрических координат, ср — угол вектора ОМ' с лучом /, а в — угол вектора ОМ с плоскостью 0 (рис. 9). Упражнения 1. Дан параллелограмм О ABC. В нем \ОА\ = 2, \ОС\ = 3, угол АОС равен тг/3. Найдите координаты точки В в системе координат О, ОС, О А. 2. Даны три точки А(х\,у\), Б(ж2,2/2), С(жз,2/з)- Найдите координаты вершины D параллелограмма ABCD. 3. Нарисуйте на плоскости множества точек, полярные координаты ко- которых связаны соотношениями: а) г = 2/ cos 9?; б) г = 2 cos 9?. 4. Пусть О, /, п — сферическая система координат. Введем декартову прямоугольную систему координат О, ei, ег, п, где ei направлен вдоль /, а угол тг/2 от ei к е2 отсчитывается в сторону возрастания полярного угла. Напишите формулы, выражающие декартовы координаты через сферичес- § 3. Замена базиса и системы координат 1. Изменение базиса. До сих пор мы предполагали, что рас- рассматривается один базис. Однако выбор базиса ничем не ограничен, и принципиальное значение имеет задача о нахождении компонент вектора в одном базисе по его компонентам в другом базисе. При этом положение нового базиса относительно старого должно быть за- задано, а именно должны быть известны компоненты новых базисных векторов e'l5 е2 и е^ в старом базисе е1,в2,ез. Пусть1 ef2 = a5>ei + a^e2 + а^ез, A) е3 = a\ei + a\e2 + а!ез- Произвольный вектор а разложим по базису е^е^ед: а = а1е1 + а2е2 + ^зез- Компоненты этого же вектора в старом базисе обозначим ai,a2,a3. Раскладывая каждый член предыдущего равенства по базису ei, e2, ез, в силу предложения 5 § 1 имеем a1 = a\a[ + a\a'2 + ^3^3, a2 = а\а'х + о^а'2 + a|a3, B) *) Здесь для удобства один из индексов мы располагаем сверху. Это не пока- показатель степени. Например, а\ читается "а один-три".
22 Гл. I. Векторная алгебра Соотношения B) и являются решением нашей задачи. Если нас за- заинтересует выражение новых компонент через старые, то надо будет решить систему уравнений B) относительно неизвестных а'^а^^а'^. Результат будет иметь такой же вид, как B), только коэффициентами будут компоненты старых базисных векторов в новом базисе. Точно тем же способом получаются формулы, связывающие ком- компоненты вектора в разных базисах на плоскости. Вот они: =а\а \а[ Коэффициенты в формулах B) можно записать в таблицу: D) а\ а\ а\ Она называется матрицей перехода от базиса е^е^вд к базису еъ е2, ез. В ее столбцах стоят компоненты векторов e'l5 е2, е^ в старом базисе. 2. Изменение системы координат. Рассмотрим теперь две де- декартовы системы координат: старую О, ei, в2, ез и новую О', е[, е2, е^. Пусть М — произвольная точка, и координаты ее в этих системах обозначены (x,y,z) и (x',y',z'). Поставим себе задачу выразить ж, у и z через ж', у' и z', считая известным положение новой системы отно- относительно старой. Оно определяется координатами (ао,ао,ао) точки О' в системе координат О, ei,e2,e3 и компонентами векторов е^е^ед, составляющими матрицу перехода D). Радиус-векторы точки М относительно точек О и О' связаны ра- равенством ОМ = 00' + О'М, которое мы можем записать в виде ОМ = 66' + х'е[ + у'е'2 + z'e'3, E) так как ж', у' и z' — компоненты О'М в базисе e^e^eg. Разложим каждый член равенства E) по базису е1,в2,ез, имея в виду, что ком- компоненты векторов ОМ и 00' равны координатам точек МиО', ко- которые мы обозначили (x,y,z) и (aj,ao,ajj). Мы получим х = aj + а\х' + а\у' + a\z'', у = al + а\х' + а\у' + ajz1', F) z = al + a\x' + а\у' + a\z'. Равенства F) представляют собой закон преобразования коорди- координат точки при переходе от одной декартовой системы координат в пространстве к другой такой же системе. 3. Замена декартовой прямоугольной системы координат на плоскости. Формулы перехода от одной декартовой системы ко- координат на плоскости к другой получаются из F), если там оставить
3. Замена базиса и системы координат 23 только первые два равенства и в них вычеркнуть члены с z х = а\х' = а\х' а\у' Рассмотрим частный случай, когда обе системы координат декар- декартовы прямоугольные. Через ср обозначим угол между векторами ei и е[, отсчитываемый в направлении кратчайшего поворота от ei к в2. Тогда (рис. 10) е^ = cos if ei + sin cp e2, e2 = cos i^p ± |Jei + sin (ip ± |je2. В разложении e2 ставится знак плюс, если кратчайший поворот от е^ к е'2 направлен так же, как кратчайший поворот от е^ к е'2, т. е. если новый базис повернут относительно старого на угол ср. Знак Рис. 10. Два случая взаимного расположения ортонорми- рованных базисов на плоскости минус в разложении е'2 ставится в противоположном случае, когда новый базис не может быть получен поворотом старого. Поскольку cos (if ± — J = =F sin cp, sin (if =Ь — J = ± cos cp, получаем aj, x = x' p F ^/^ у = x' sin ip±y' cos if + clq , причем при повороте системы координат берутся верхние знаки. (8) Упражнения 1. Выведите формулы замены базиса и замены системы координат на прямой линии. Как меняются координаты точек прямой, если при неиз- неизменном начале координат длина базисного вектора увеличивается вдвое? 2. Пусть О' — середина стороны АВ треугольника ОАВ. Напишите формулы перехода от системы координат О, ОВ, О А к системе коорди- координат о', дЪ, сГв. 3. Дана декартова система координат О, ei, e2, е3. Как расположена относительно нее система координат О', е^е^ез, если формулы перехода имеют вид х = 1 — у' — zf, у = 1 — х — zf, z = 1 — х — у .
24 Гл. I. Векторная алгебра § 4. Скалярное, смешанное и векторное произведения 1. Скалярное произведение. Под углом между векторами мы понимаем угол между векторами, равными данным и имеющими об- общее начало. В некоторых случаях мы будем указывать, от какого вектора и в каком направлении угол отсчитывается. Если такого ука- указания не сделано, углом между векторами считается тот из углов, ко- который не превосходит тг. Если угол прямой, то векторы называются ортогональными. Определение. Скалярным произведением двух векторов назы- называется число, равное произведению длин этих векторов на косинус угла между ними. Если хоть один из векторов нулевой, то угол не определен, и скалярное произведение по определению равно нулю. Скалярное произведение векторов а и b обозначается (а, Ь) или ab. Таким образом, мы можем написать (a,b) = |a||b|cos<p, где ip — угол между векторами а и Ь. Необходимо подчеркнуть следующее принципиальное обстоя- обстоятельство: скалярное произведение может быть определено только после того, как будет выбрана определенная единица измерения длин векторов. Иначе приведенное выше определение не имеет смысла. Скалярное умножение имеет следующие очевидные свойства. • Коммутативность: для любых а и b выполнено (а, Ь) = (Ь,а). • (а, а) = |а|2 для любого вектора а. • Скалярное произведение равно нулю тогда и только тогда, когда сомножители ортогональны или хотя бы один из них равен 0. • Векторы ортонормированного базиса удовлетворяют равенствам (ebei) = (е2,е2) = (е3,е3) = 1, (еье2) = (е2,е3) = (e3jei) = 0. Предложение 1. Если базисные векторы попарно ортогональны, то компоненты любого вектора а находятся по формулам ' ч (а,е2) „ (а,е3) «2 = |ез|2 В частности, если базис ортонормирован- ныщ ах = (a, ei), а2 = (а, е2), а3 = (а, е3) A) а = (a, ei)ei + (а, е2)е2 + (а, е3)е3. Доказательство. Пусть а = ai + + а2 + а3, причем каждое слагаемое коллине- арно соответствующему базисному вектору. Мы знаем из предложе- Рис. 11
§4- Скалярное, смешанное и векторное произведения 25 ния 2 § 1, что oli = ±|ai|/|ei|, где выбирается знак + или — в за- зависимости от того, одинаково или противоположно направлены ai и еь Но, как видно из рис. 11, ±|ai| = |a|cos(^i, где ipi — угол меж- между векторами а и ei. Итак, а\ = |а| cos<^i/|ei| = (a, ei)/|ei|2. Аналогично вычисляются и остальные компоненты. Определение. Косинусы углов между вектором а и базисными векторами декартовой прямоугольной системы координат называют- называются направляющими косинусами этого вектора. Направляющие косинусы — это компоненты вектора а0 = а/|а|. Их отличительная особенность состоит в том, что сумма их квадра- квадратов равна квадрату длины а0, т. е. 1 (см. ниже формулу C)). Предложение 2. Для любых векторов a, b и с и любых чисел а и C выполнено равенство (аа + /ЗЪ, с) = а(а, с) + /?(Ь, с). В частности, (аа, с) = а(а, с) и (а + Ь, с) = (а, с) + (Ь, с). Доказательство. Если с = 0, то утверждение очевидно. Пусть с ф 0. Примем с за первый вектор базиса, а остальные выберем ортогонально к нему и между собой. Число (аа + /ЗЬ, с)/|с|2 — первая компонента вектора аа. + /ЗЬ. Точно так же (а, с)/|с|2 и (Ь,с)/|с|2 — первые компоненты векторов а и Ь. Согласно предложению 5 § 1 (аа + /ЗЬ, с)/|с|2 = а(а, с)/|с|2 + /9(Ъ, с)/|с|2. Отсюда прямо получается доказываемое равенство. Легко показать, что такая же формула справедлива и для линей- линейной комбинации любого числа векторов. Используя коммутативность скалярного умножения, мы получаем тождество (а, (ЗЪ + 7с) = Жа> Ь) + 7(а, с). Теорема 1. Если базис ортонормированныщ то скалярное произ- произведение векторов а и b выражается через их компоненты (ai,a2,a3) и (/?i, /?2, Рз) по формуле (a,b) =ai/?i +a2C2+a?>P?>. B) Действительно, подставим вместо а его разложение и воспользу- воспользуемся предложением 2: (a,b) = (aiei + a2e2 +a3e3,b) = ai(ebb) + а2(е2,Ъ) +а3(е3,Ь). Теперь доказываемое следует из формулы A). Отметим, что требование ортонормированности базиса очень су- существенно. В произвольном базисе выражение скалярного произве- произведения через компоненты гораздо сложнее. Поэтому в задачах, свя- связанных со скалярным произведением, чаще всего используются ортонормированные базисы. Если почему-либо все же надо вычислить скалярное произведение в неортонормированном базисе, следует перемножить разложения со- сомножителей по базису и, раскрыв скобки, подставить в полученное
26 Гл. I. Векторная алгебра выражение известные скалярные произведения базисных векторов. Теорема 1 позволяет выписать выражение длины вектора через его компоненты в ортонормированном базисе а также выражение косинуса угла между векторами cos in = (a'b) = W|b| / Используя формулу (З), мы можем вычислить расстояние между точками, если заданы их координаты в декартовой прямоугольной системе координат. В самом деле, пусть точки А и В имеют коорди- координаты (x,y,z) и (xi,yi,zi). Тогда расстояние между ними равно \АВ\ = л/(х1 - хJ + (yi - уJ + [z\ — zJ. E) Скалярное умножение тесно связано с понятием проекции векто- вектора. Слово "проекция" употребляется в двух смыслах. Введем соот- соответствующие определения. Пусть задан вектор АВ и некоторая прямая I. Опустим из точек А и В перпендикуляры на прямую и обо- обозначим их основания А' и В' (рис. 12). Вектор А'В' называется (ортогональной) векторной проекцией вектора АВ на пря- прямую I и обозначается Пр^А!?. Из определения сразу следует, что векторные проекции равных векторов на параллельные прямые равны между собой. Пусть е — ненулевой вектор на пря- прямой I. Тогда А'В' = ае при некото- некотором а. Представим АВ в виде АВ = А'В" = ае + b и заметим, что вектор b = В'В" ортогонален е. Поэтому после скалярного умноже- умножения на е получаем (АВ,е) = а(е,е). Находя отсюда а, имеем -е- F) Хотя на вид это выражение зависит от е, фактически оно не меняется при замене е любым ненулевым вектором Ле, коллинеарным е. Проекцию А'В' можно представить в виде (АВ,е) е Рис. 12 и заметить, что (АВ,е)/|е| — это компонента А'В' = е/|е|. Так как |е°| = 1, компонента по абсолютной величине равна по вектору е° =
§4- Скалярное, смешанное и векторное произведения 27 длине А'В'. Она положительна, если направление А'В' совпадает с направлением е, и отрицательна в противоположном случае. Величина (АЕ?,е)/|е| не меняется при замене е на сонаправленный вектор Ае, А > 0, и меняет знак при замене е на противоположно направленный вектор. Прямая линия называется направленной прямой (употребляются также термины ориентированная прямая и ось), если на ней указано определенное направление. Подробнее это определение рассматрива- рассматривается в начале п. 2. ^ Определение. Число (АВ,е)/|е| называется скалярной проек- проекцией вектора АВ на ось I, определяемую вектором е (или на вектор е), и обозначается UptAB или ИреАВ. Из определения следует, что Пр^В = \АВ\ cos (р, где ip — угол между АВ и е. Компоненты вектора в ортонормированном базисе равны его скалярным проекциям на оси координат. 2. Ориентация прямой, плоскости и пространства. Выше мы дали определение ориентированной прямой (оси). Скажем о нем подробнее, с тем чтобы аналогично ввести определение ориентиро- ориентированной плоскости и ориентированного пространства. Все базисы (ненулевые векторы) на прямой разделяются на два класса: векторы из одного класса направлены одинаково, а векторы из разных классов направлены противоположно. Говорится, что пря- прямая ориентирована или что на ней задана ориентация, если из двух классов базисов выбран один. Базисы выбранного класса называются положительно ориентированными или положительными. Задать ориентацию можно, указав какой-либо базис и считая по- положительно ориентированными все базисы того же класса. Однако то, что прямая ориентирована, не означает, что на ней выбран какой-то определенный базис. Два базиса на плоскости называются одинаково ориентированны- ориентированными, если в обоих базисах кратчайший поворот от первого вектора ко ез ез е2 ех а б Рис. 13. Левый базис (а), правый базис (б) второму производится в одну сторону, и противоположно ориенти- ориентированными в противном случае. На рис. 10, а базисы ориентирова-
28 Гл. I. Векторная алгебра ны одинаково, а на рис. 10, б— противоположно. Если фиксировать какой-то базис, то любой другой ориентирован с ним либо одинаково, либо противоположно, и, таким образом, все базисы распадаются на два класса: любые два базиса одного класса ориентированы одинако- одинаково, базисы разных классов ориентированы противоположно. Определение. Плоскость ориентирована, если из двух классов базисов на ней выбран один класс. Ориентацию можно задать, выбрав базис и считая положитель- положительно ориентированными все базисы одного с ним класса. Но, конечно, задание ориентации не предполагает выбор определенного базиса. В планиметрии часто ориентируют плоскость, считая положитель- положительными те базисы, у которых кратчайший поворот от первого вектора ко второму производится против часовой стрелки. Для плоскости в пространстве это соглашение не имеет смысла, так как видимое на- направление поворота зависит от того, с какой стороны смотреть на плоскость. Но если выбрать одно из полупространств, ограничивае- ограничиваемых плоскостью, и смотреть на повороты именно из него, то класс базиса определяется видимым направлением поворота. Определение. Базис в пространстве называется правым, если (считая векторы имеющими общее начало) с конца третьего векто- вектора мы видим кратчайший поворот от первого вектора ко второму Рис. 14. Левый базис (а), правый базис (б) направленным против часовой стрелки. В противном случае базис называется левым (рис. 13). Представим себе, что на рис. 14 концы векторов лежат в плоскос- плоскости рисунка, а их общее начало — за плоскостью. Тогда поворот от вектора ei к вектору в2 и затем к ез для правого базиса нам виден против часовой стрелки, а для левого — по часовой стрелке. Определение. Пространство называется ориентированным, ес- если из двух классов базисов (правых или левых) выбран один. Базисы этого класса называются положительно ориентированными. Ниже мы всегда будем выбирать правую ориентацию пространст- пространства, считая положительными правые базисы. Но важно помнить, что выбор ориентации мог бы быть противоположным. Если пространство ориентировано, то ориентацию любой плоскос- плоскости в нем можно задать, указав ориентацию прямой, перпендикуляр-
§4- Скалярное, смешанное и векторное произведения 29 ной этой плоскости. При этом положительным базисом a, b на плос- плоскости считается такой, который вместе с положительным базисом п на прямой составляет положительный базис пространства а, Ь,п. Это — внешний способ задания ориентации. Говорится, что ориен- ориентация плоскости определяется нормальным вектором п. Аналогично, в ориентированном пространстве можно внешним об- образом задать ориентацию прямой линии. Для этого нужно задать ориентацию плоскости, перпендикулярной этой прямой. Положитель- Положительным базисом на прямой будет такой базис, который вместе с положи- положительным базисом плоскости составляет положительный базис прост- пространства. 3. Площадь ориентированного параллелограмма, объем ориентированного параллелепипеда. Если прямая ориентирова- ориентирована, то длине ненулевого вектора на ней можно приписать знак: счи- считать длину положительной, если вектор ориентирован положительно, и отрицательной в противоположном случае. Именно так мы припи- приписываем знак длине векторной проекции, когда определяем скалярную проекцию. Обобщим это определение. Рассмотрим параллелограмм, построенный на двух векторах так, что две его смежные стороны являются векторами с общим началом. Параллелограмм называется ориентированным, если пара векторов, на которой он построен, упорядочена. На ориентированной плоскос- плоскости параллелограмм считается положительно или отрицательно ориен- ориентированным, смотря по тому, как ориентирована определяющая его пара векторов. На ориентированной плоскости принято считать площадь ориен- ориентированного параллелограмма числом со знаком: она равна площади параллелограмма (положительна), если параллелограмм ориентиро- ориентирован положительно, и равна той же площади со знаком минус, если отрицательно. Мы будем обозначать площадь ориентированного па- параллелограмма, построенного на векторах а и Ь, через S±(a, b). Рассмотрим теперь параллелепипед, построенный на трех векто- векторах так, что три его ребра, исходящие из одной вершины, являют- являются векторами с общим началом. Параллелепипед называется ориен- ориентированным, если эти три ребра упорядочены. В ориентированном пространстве ориентация параллелепипеда положительна или отрица- отрицательна смотря по тому, какую тройку образуют векторы, на которых он построен. В ориентированном пространстве объем ориентированного па- параллелепипеда— число со знаком: объем положительно ориентирован- ориентированного параллелепипеда считается положительным, а отрицательно ориентированного — отрицательным. При выбранной нами правой ориентации пространства положи- положительными считаются объемы ориентированных параллелепипедов, по- построенных на правых тройках векторов.
30 Гл. I. Векторная алгебра 4. Смешанное произведение. Если пространство ориентирова- ориентировано, мы можем ввести Определение. Смешанным произведением векторов a, b и с (в данном порядке) называется число, равное объему ориентирован- ориентированного параллелепипеда, построенного на этих векторах, если они не компланарны, и равное нулю, если компланарны. Смешанное произведение векторов a, b и с обозначается (а, Ь,с). При перестановке сомножителей в смешанном произведении, са- самое большее, может измениться только ориентация тройки векторов. Поэтому абсолютная величина смешанного произведения не зависит от порядка сомножителей. Для любых векторов a, b и с мы получаем, сравнивая ориентации троек векторов (см. рис. 14), (а, Ь, с) = (с, а, Ь) = (Ь, с, а) = -(Ь, а, с) = -(с, Ь, а) = -(а, с, Ь). G) Следующее предложение устанавливает связь между скалярным произведением и смешанным произведением. Предложение 3. Каковы бы ни были векторы b и с, найдется единственный [не зависящий от а) вектор d такой, что при любом а выполнено равенство (a,b,c) = (a,d). (8) Доказательство Докажем сначала существование вектора d, а потом установим, что такой вектор возможен только один. Пусть векторы b и с коллинеарны. Тогда при любом а векторы a, b и с компланарны и (а, Ь,с) = 0. Поэтому мы можем положить d = 0. Рассмотрим неколлинеарные векторы b и с и предположим сначала, что a, b и с не компланарны. Построим на них ориентированный параллелепипед и при- примем за его основание параллелограмм, пост- построенный на b и с (рис. 15). Введем ориента- ориентацию на прямой ОН, перпендикулярной осно- ванию. Мы зададим ее с помощью вектора п длины 1, составляющего с b и с правую трой- тройку п, Ь,с. (Тройка b,c,n также правая.) ис. . десь трои- (а, п) — скалярная проекция вектора а KcL ?1; D ; С ЛСВЭлЯ тт на п. По модулю она равна высоте параллеле- параллелепипеда ОН, а знак ее определяется ориентацией тройки а, Ь,с. Действительно, (а,п) > 0 тогда и только тогда, когда концы векто- векторов а и п лежат в одном полупространстве, т. е. тройка а, Ь,с пра- правая так же, как n, b,c. Таким образом, (а, п) положительно для правой тройки а, Ь,с и отрицательно для левой. Пусть положительное число S — площадь основания параллеле- параллелепипеда. Тогда произведение (а, пM по модулю равно объему парал- параллелепипеда, а знак его совпадает со знаком (а, п). Это значит, что (а, Ь,с) = 5(а, п). Полученное равенство совпадает с (8), если d = 5n. (9)
§4- Скалярное, смешанное и векторное произведения 31 Осталось рассмотреть случай, когда b и с не коллинеарны, а а, b и с компланарны. В этом случае а лежит в плоскости векторов b и с и, следовательно, ортогонален вектору d, вычисленному по фор- формуле (9). Поскольку (а, Ь, с) = 0 и (а, п) = 0, вектор (9) удовлетворяет равенству (8) и в этом случае. Итак, мы нашли вектор, который удов- удовлетворяет (8) при любом а и определяется только по b и с. Допустим, что для фиксированных b и с нашлось два вектора di и d2 таких, что для любого а выполнено (а, Ь, с) = (a, di) и (а, Ь, с) = = (a, d2). Отсюда следует, что (a, di) = (a, d2) или (a, di - d2) = 0. Поэтому вектор di — d2 ортогонален каждому вектору пространства и, следовательно, равен нулевому вектору. Это доказывает, что век- вектор d, определяемый формулой (8), может быть только один. Пред- Предложение полностью доказано. Опишем еще раз, как вектор d определяется по b и с. 1. Если b и с коллинеарны, то d = 0. 2. Если b и с не коллинеарны, то: а) |d| = S = |b||c| sin(^, где ср — угол между b и с; б) вектор d ортогонален векторам b и с; в) тройка векторов Ь, с, d имеет положительную ориентацию. При нашем выборе ориентации пространства — это правая тройка. Определение. Вектор d, определенный перечисленными выше условиями, или, что то же, формулой (8), называется векторным про- произведением векторов b и с. Подчеркнем, что векторное произведение, как и смешанное, опре- определено только для ориентированного пространства. Разумеется, не- необходим также выбор единицы измерения длин. Векторное произведение векторов b и с обозначают [Ь,с] или b х с. Используя это обозначение, мы можем записать формулу (8) в виде (а,Ъ,с) = (а,[Ь,с]). A0) Благодаря этому равенству смешанное произведение и получило свое название. Пример 1. Пусть ei, е2, ез — правый ортонормированный базис. Тогда при выбранной нами правой ориентации пространства [е2,е3] = еь [e3jei] = e2j [еье2]=е3. A1) Если fI, f2, fз — левый ортонормированный базис, то [f2, f3] = -fi, [f3, fi] = -f2, [fi, f2] = -f3. Предложение 4. Векторное умножение антикоммутативно, т. е. для любых векторов [Ь,с] = — [с,Ь]. Действительно, если (a, b,c) = (a, d), то (a,c,b) = -(a,d) = (a,(-d)). Получим теперь свойство линейности смешанного и векторного произведений по каждому из сомножителей. Применяя предложе-
32 Гл. I. Векторная алгебра ние 2 к скалярному произведению (Aai + /ia2, [b,c]), мы получим (Aai + /ia2,b,c) = A(abb,c) + /i(a2,b,c). A2) Из равенств G) следуют аналогичные тождества для остальных сомножителей. Например, для второго сомножителя (a,Abi +/Л>2,с) = A(a,bbc)+/i(a,b2,c). A3) Действительно, мы можем переставить интересующий нас сомножи- сомножитель на первое место, раскрыть скобки, а затем выполнить обратную перестановку. Предложение 5. Для любых векторовbi, b2 и с и любых чисел А и \i имеет место равенство [Abi + [лЪ2, с] = A[bi, с] + /i[b2, с]. В самом деле, правой части формулы A3) можно придать вид (a,A[bbc]) + (a,/i[b2,c]). Поэтому по предложению 2 получаем (a, [Abi +/ЛJ,с]) = (a,A[bbc] +/i[b2,c]). Так как это верно для любого вектора а, мы можем, выбрав орто- нормированный базис ei, е2, ез, подставить на место а последователь- последовательно каждый вектор этого базиса. В силу предложения 1 мы получим равенство всех компонент векторов [Abi + /ib2, с] и A[bi, с] + /i[b2, с], а отсюда и равенство векторов, которое нам нужно было доказать. Линейность векторного произведения по второму сомножителю можно получить из свойства антикоммутативности. 5. Выражение векторного и смешанного произведения через компоненты сомножителей. Если заданы разложения век- векторов а и b по векторам некоторого базиса ebe2,e3, то мы можем раскрыть скобки: [а, Ь] = [(aiei + а2е2 + а3е3), (/?iei + /32е2 + /33е3)] = , е3] + 3)[е3,е1]. A4) Здесь использовалась антикоммутативность векторного умножения и то, что векторное произведение двух одинаковых сомножителей — нулевой вектор. В примере 1 были сосчитаны попарные векторные произведения векторов ортонормированного базиса. Поэтому из фор- формулы A4) следует Теорема 2. В положительно ориентированном ортонормирован- ном базисе векторное произведение выражается через компоненты сомножителей формулой [а,Ь] = (а2C3 - «зАОе! + (a3/?i - a1f33)e2 + (ai/?2 - a2/?i)e3. A5) Если базис ориентирован отрицательно, перед правой частью этой формулы следует поставить знак минус.
§4- Скалярное, смешанное и векторное произведения 33 Избежать постоянной заботы об ориентации базисов можно двумя способами. Можно договориться при правой ориентации пространст- пространства, если не оговорено противное, использовать только правые базисы. Такого соглашения мы и будем придерживаться. Второй способ состоит в том, чтобы не фиксировать заранее ори- ориентацию пространства, а выбирать ее так, чтобы используемый базис был ориентирован положительно. При таком подходе векторное про- произведение всегда вычисляется по формуле A5), но приходится сле- следить за тем, как векторное произведение направлено. Этот подход принят, например, в литературе по физике. Теорема 3. Смешанное произведение векторов a, b и с выража- выражается через их компоненты (ai,a2,a3), (/?ъ/?2>/?з) и Gъ72?7з) в про- произвольном базисе е1,в2,ез по формуле (а,Ь,с) = {а\Р2^ + «2/%7i + + «зА72 -аз/?271 -«2А73 ~ «lA^Xei, e2, е3). Для доказательства заметим, что (а, Ь,с) = (с, [а, Ь]) и умножим скалярно обе части равенства A4) на вектор с = 71 ei +72^2 + 73^3. Мы получим (a,b,c) =7i(«2^3 -аз/?2)(еь[е2,ез]) + + 72(аз/?1 -«i/^3)(e2,[e3,ei]) + 7з(«1#2 - a2/?i)(e3j [еь е2]). (Слагаемые, содержащие смешанные произведения с одинаковыми со- сомножителями, мы не выписываем, так как они равны нулю.) Отсюда, учитывая равенства G) и приводя подобные члены, получаем нуж- нужный нам результат. 6. Детерминанты второго и третьего порядков. Найденные нами формулы достаточно громоздки. Для их более компактной записи употребляются детерминанты (или определители) второго и третьего порядков. Рассмотрим четыре числа ai,a2j Pi, fi2. Из них можно составить таблицу, называемую матрицей второго порядка: Pi а2 Число а±р2 — a2Pi называется детерминантом этой матрицы или де- детерминантом второго порядка и обозначается *i а2 \ Р2 Теперь выражение векторного произведения в правом ортонорми- рованном базисе перепишется так: [а,Ъ] = а2 «з Р2 Рз Рз Pi P2 Из компонент трех векторов можно составить таблицу — матрицу 3 Д.В. Беклемишев
34 Гл. I. Векторная алгебра третьего порядка Число 01 7i а2 а3 02 03 72 7з 02 72 0з 7з самое, 02 72 7з + а2 — OL2 7з 01 7i 7i 7з + «з + «3 01 7i 01 7i 72 02 72 называется детерминантом этой матрицы или детерминантом третьего порядка и обозначается По теореме 3 в новых (а,Ъ, 01 7i 72 обозначениях с) = 01 7i а2 02 72 а3 7з а3 03 7з (еье2,е3). В частности, в правом ортонормированном базисе A6) (а,Ь,с) = OL\ A7) OL2 OL3 0i 02 0з 7i 72 7з При помощи теоремы 2 и определения детерминанта можно полу- получить следующее выражение векторного произведения через компо- компоненты сомножителей в правом ортонормированном базисе: ei e2 е3 «1 а2 а3 01 02 03 Детерминанты тесно связаны с системами линейных уравнений, решения которых удобно записывать с их помощью. Этим мы зай- займемся в гл. V, а сейчас дадим только геометрическую иллюстрацию. Пусть дана система из трех уравнений (а,Ь,с) = A8) а2х + b2y + c2z = d2, a3x + b3y + c3z = d3. Выберем в пространстве некоторый базис и рассмотрим векторы a(ai,a2,a3), b(bi, 62, 63)? c(ci,c2,c3) и d(di, d2, d3). Тогда система яв- является координатной записью векторного равенства xa. + yh + zc = d. A9)
§4- Скалярное, смешанное и векторное произведения 35 Поэтому решение системы x,y,z — коэффициенты разложения d по a, b и с. Мы можем быть уверены, что система имеет единствен- единственное решение, если a, b и с не компланарны, т. е. (а, Ь,с) ф 0. Предпо- Предположим, что это условие выполнено, и найдем решение. Для этого умножим обе части равенства A9) скалярно на векторное произ- произведение [Ь,с]. Мы получим ж(а,b,c) = (d,b,c), и, следовательно, х равен отношению детерминантов d2 d3 и b2 C3 bi 0.2 bi C2 аз Ьз Аналогично находятся и остальные неизвестные. Остановимся на следующих свойствах детерминантов. Из ра- равенств G) следует, что детерминант меняет знак при перестановке каких-либо двух строк матрицы. Формула A2) означает, что Ха[ + ца'1 \а2 Аа3 1 1 1 1 а2 ь2 с2 аз Ьз сз + /i < Cl CL2 b2 c2 a b\ c3 = А 7. Условия коллинеарности и компланарности. Начнем со следующего полезного предложения. Предложение 6. Каков бы ни был базис ei, е2, е3, попарные век- векторные произведения базисных векторов линейно независимы. Докажем это от противного. Рассмотрим равенство А[е2,е3] +/i[e3,ei] + z/[ebe2] = 0 и допустим, что какой-нибудь коэффициент, пусть для определеннос- определенности А, отличен от нуля. Умножив обе части равенства скалярно на еь мы получим A(ei,e2,e3) = 0. Полученное противоречие доказывает наше предложение. Следующие предложения дают условия на компоненты векторов в произвольном базисе, необходимые и достаточные для компланар- компланарности или коллинеарности векторов. Предложение 7. Равенство нулю детерминанта матрицы из компонент трех векторов необходимо и достаточно для компланар- компланарности векторов. Это сразу следует из формулы A6), поскольку (ei,e2,e3) ф 0. Предложение 8. Пусть («i,a2,a3) и (/?ь/?2>/?з) — компоненты векторов а и Ъ в некотором базисе. Векторы а и Ъ коллинеарны тогда и только тогда, когда «3 Oil /Зз 01 01 02 = 0. B0)
36 Гл. I. Векторная алгебра Достаточность условия очевидна: из равенств B0) по формуле A4) следует обращение в нуль [а, Ь], что равносильно коллинеарности век- векторов. Заметим, что мы пользуемся формулой A4), которая справед- справедлива для произвольного базиса. Наоборот, из обращения в нуль [а, Ь] и формулы A4) мы можем вывести B0), так как в силу предложения б векторы [е2,е3], [e3,ei] и [еье2] линейно независимы. В планиметрии признак коллинеарности двух векторов дает Предложение 9. Обращение в нуль детерминанта матрицы из компонент двух векторов на плоскости необходимо и достаточно для коллинеарности этих векторов. Для доказательства будем считать, что плоскость помещена в пространство и базис в этой плоскости дополнен третьим вектором до базиса в пространстве. Тогда векторы а(а1,а2) и b(/^i, /^2) на плоскости имеют компоненты («i,a2,0) и (/3i, /З2,0) относительно базиса в пространстве. Применяя предложение 8, получаем условие 1 «2 A fa Остальные два детерминанта равны нулю, так как а% = /3s = 0. 8. Площадь параллелограмма. Если в пространстве заданы два неколлинеарных вектора, имеющих общее начало, то площадь парал- параллелограмма, построенного на этих векторах, может быть найдена че- через их компоненты в ортонормированном базисе по формуле S = |[а,Ь]| = y/{a2fc - а3/32J B2) |[]| / B1) Еще одно выражение для площади параллелограмма мы получим, если заметим, что |[а,Ь]|2 = |a|2|b|2sinV= |a|2|b|2(l - cos2 ^). В результате |а|2 ({цЬ) " (a,b) |b|2 Найдем теперь площадь ориентированного параллелограмма на ориентированной плоскости. Можно считать, что ориентация плос- плоскости определена вектором п, перпендикулярным плоскости и сос- составляющим правую тройку с положительным базисом на плоскости. Более того, будем предполагать, что |п| = 1. Пусть дан ориентированный параллелограмм, построенный на век- векторах а и Ь. Рассмотрим скалярную проекцию Прп[а, Ь]. Так как [а, Ь] и п коллинеарны, проекция по модулю равна |[а, Ь]|, т. е. площади па- параллелограмма. Она положительна, если [а, Ь] и п сонаправлены, и отрицательна в противном случае. Но вектор [а, Ь] сонаправлен с п, если пара векторов a, b на плоскости ориентирована положительно. Поэтому Прп[а, Ь] равна площади ориентированного параллелограм- параллелограмма, построенного на а и Ь. По определению проекции S±(a,b) = (n,a,b)
§4- Скалярное, смешанное и векторное произведения 37 (напомним, что |п| = 1). На плоскости выберем произвольный (не обя- обязательно положительный) базис ei, е2. Примем п за третий базисный вектор и выразим смешанное произведение через координаты сомно- сомножителей: О 0 1 S±(a,b) = a2 0 (еье2,п). 01 02 О Вычисляя детерминант, находим, что он равен а\02 —«2/?ъ и полу- получаем окончательное выражение 'Л 012 5±(а,Ь) = 5±(еье2). B3) 01 02 Эта формула сходна с формулой A6). По существу это та же фор- формула, написанная для двумерного пространства. Если ei, е2 — поло- положительный ортонормированный базис, то S±(a,b)=ai/J2-a2/Ji. B4) Для площади неориентированного параллелограмма в ортонорми- рованном базисе мы получаем формулу S=|ai/32-a2/3i|, B5) которая следует и из B1). 9. Двойное векторное произведение. Выражение [а, [Ь,с]] на- называется двойным векторным произведением. Докажем, что [а, [Ь, с]] = (а, с)Ь - (а, Ь)с. B6) С этой целью выберем правый ортонормированный базис в1,е2,ез так, чтобы ei был коллинеарен Ь, а е2 был компланарен b и с. Тогда b = /Jei, с = 7iei + 72е2 и а = а\е\ + а2&2 + «зез- Отсюда получа- получаем [Ь,с] = /^72е3 и [а, [b,c]] = -ai/37 С другой стороны, (а,с)Ь = (ai7i +«272)^1, (а,Ь)с = Разность правых частей двух последних равенств совпадает с най- найденным выше двойным векторным произведением. Это заканчивает доказательство. 10. Биортогональный базис. Дадим следующее Определение. Базис, составленный из векторов * _ [е2,е3] * _ [e3,ei] * _ [еье2] 1 — / \ 1 2 — / \ 1 3 — / \ 1 (ei,e2,e3) (ei,e2,e3) (ei,e2,e3) называется взаимным или биортогоналъным для базиса е1,в2,ез. Из предложения б вытекает, что е*, е^, е^ не компланарны и дейст- действительно образуют базис. Название "биортогональный" связано с тем,
38 Гл. I. Векторная алгебра что векторы обоих базисов, имеющие разные номера, ортогональны: (е^,е*) = 0 при г ф j. Кроме того, (е^,е*) = 1 для всех г. Нетрудно проверить, что ортонормированный базис совпадает со своим взаимным. Предложение 10. Если ё[, е^, е^ — базис, взаимный с ei, в2, ез, то произвольный вектор а раскладывается по этим базисам так: а = (а,е*)е1 + (а, е2>2 + (а,е*)е3, B7) а = (а,е1)е* + (а,е2)е; + (а,е3)е*. B8) Чтобы доказать B7), умножим равенство а = a\ei + а^е2 + «зез скалярно сначала на е^, затем на е^ и на е^. Мы получим а\ = (а, е^), «2 = (а, е^), аз = (а, е^). Аналогично доказывается равенство B8). Предложение 11. Если е^, е^, е^ — базис, взаимный с ei, в2, ез, то базис e;f*, е^*, е^*, взаимный с e^e^eg, совпадает с ei,e2,e3. Действительно, равенство B8), написанное для базиса e^e^eg, имеет вид а = (a, el) е*г* + (а, е^) е*2* + (а, е|) е^. Подставляя сюда вместо а последовательно ei, в2 и ез и учитывая, что (е^, е*) = 0 при г ф j, а (е^, е*) = 1, получаем ei = е**, в2 = е^* и е3 = е**. Числа (a, ei), (а, е2) и (а, е3) однозначно определяют вектор а с помощью векторов базиса е1,в2,ез. Они называются ковариантными координатами вектора а в базисе е1,в2,ез. По отношению к бази- базису е^,е2,ез — это обычные координаты вектора. Обычные коорди- координаты, чтобы подчеркнуть их отличие от ковариантных координат, называют контрвариантными координатами. 11. О векторных величинах. В приложениях математики час- часто рассматриваются величины, изображаемые векторами: силы, ско- скорости, моменты сил и т. д. Векторам, изображающим такие величи- величины, приписывается размерность. Не вдаваясь в существо дела, мы ограничимся изложением формальных правил действий с размернос- размерностями. С формальной точки зрения, размерность — это одночлен, состав- составленный из какого-то набора символов. Такие одночлены перемножа- перемножаются и делятся, как обычные одночлены. Имеют место следующие правила действий с векторными величинами. • Модуль векторной величины имеет ту же размерность, что и сама величина. • Складывать векторные величины можно только в том случае, когда их размерности совпадают. При этом размерность суммы та же, что и у слагаемых. • При умножении векторной величины на скалярную их размер- размерности перемножаются.
§4- Скалярное, смешанное и векторное произведения 39 • Скалярное, векторное и смешанное произведения имеют размер- размерность, равную произведению размерностей сомножителей. Это лег- легко следует из первого правила, определений скалярного и векторного произведений и формулы A0). Для того чтобы изобразить векторную величину на чертеже, мы должны условиться о масштабе: сколькими единицами длины (на- (например, см) мы будем изображать одну единицу данной размерности (например, км, м/с, Н). Если в векторном произведении сомножители имеют размерность длины, то произведение имеет размерность площади. Масштаб для изображения единиц площади выбирается так, чтобы одна единица площади изображалась одной линейной единицей. При этом длина векторного произведения будет численно равна площади параллело- параллелограмма, построенного на сомножителях. Поскольку единица длины у нас выбрана и не меняется, указанное соглашение ни к каким противоречиям привести не может. Однако оно не так безобидно, как может показаться. Именно, два математи- математика, пользующиеся этим соглашением, но разными единицами длины (например, француз, пользующийся сантиметрами, и англичанин — дюймами), для одних и тех же векторов нарисуют несовпадающие векторные произведения. Как связаны длины этих произведений, ес- если дюйм равен примерно 2,5 см? Упражнения 1. Пусть в некотором базисе скалярное произведение вычисляется по формуле B). Докажите, что базис ортонормированный. 2. Используя свойства скалярного умножения, докажите, что высоты произвольного треугольника пересекаются в одной точке. 3. Найдите сумму векторных проекций вектора а на стороны заданного правильного треугольника. 4. Построены векторы, перпендикулярные граням произвольного тет- тетраэдра, равные по длине площадям этих граней и направленные в стороны вершин, противоположных граням. Докажите, что сумма этих векторов равна 0. 5. Дан трехгранный угол. Используя свойства векторного произведе- произведения, найдите выражение какого-либо из его двугранных углов через плос- плоские углы. 6. Пусть дан положительный базис на ориентированной плоскости та- такой, что |ei| = 2, |в2| = 3 и (ei,e2) = 2. Найдите площадь ориентированного параллелограмма, построенного на векторах аA,2) и ЬB,1). 7. При каком условии на матрицу перехода от одного базиса к другому оба базиса ориентированы одинаково? Вопрос поставлен как для плоскости, так и для пространства. 8. Какова размерность векторов взаимного базиса е^е^ез, если век- векторы базиса е1,е2,ез измеряются в сантиметрах?
ГЛАВА II ПРЯМЫЕ ЛИНИИ И ПЛОСКОСТИ § 1. Общее понятие об уравнениях 1. Определения. Начнем с простого примера. Пусть в прост- пространстве задана декартова прямоугольная система координат. Рас- Рассмотрим сферу радиуса г, центр которой находится в точке Р с ко- координатами (а,Ь,с). Сфера — множество всех точек, отстоящих от центра на одно и то же расстояние г. Обозначим через (ж, у, z) коорди- координаты некоторой точки М и выразим через них равенство \РМ\ = г: у/{х - аJ + (у - ЪJ + (z- сJ = г. A) Возводя в квадрат обе части равенства, мы придадим ему более удоб- удобную форму (x-aJ + (y-bJ + (z-cJ=r2. B) Очевидно, что это равенство выполнено для всех точек сферы и толь- только для них, и, следовательно, его можно рассматривать как запись определения сферы при помощи координат. Равенство B) называет- называется уравнением сферы в рассматриваемой системе координат. Приведем пример из геометрии на плоскости. Графиком функ- функции / называется линия L, состоящая из точек, координаты которых связаны соотношением у = /(ж). Если нас интересует в первую оче- очередь линия, а не функция, мы можем встать на другую точку зрения и считать, что соотношение у = f(x) есть уравнение линии L. Вообще, под уравнением множества S в некоторой системе коор- координат следует понимать выражение определения множества S через координаты его точек, т. е. высказывание, верное для координат всех точек множества и неверное для координат точек, ему не принадле- принадлежащих. Чаще всего уравнение представляет собой равенство, записанное математическими символами, но это вовсе не обязательно: оно может быть словесным описанием, перечислением и т. д. Например, выска- высказывание "обе координаты точки — рациональные числа" мы будем считать уравнением соответствующего множества в какой-либо зара- заранее выбранной системе координат. Это должно звучать естественно для читателя, знакомого со способами задания функций. Часто уравнению множества точек в планиметрии можно придать вид F(x, у) = 0, а в стереометрии — вид F(x, у, z) — 0, где F — функ- функция соответственно двух или трех переменных. Уравнение сферы B)
§1. Общее понятие об уравнениях 41 имеет такой вид, если не замечать то несущественное обстоятельст- обстоятельство, что член г2 написан в другой части равенства. Может случиться, что уравнение какого-либо множества удобнее записать в виде неравенства. Например, шар, ограниченный сферой с уравнением B), имеет уравнение (х - аJ + (у -ЪJ + (z - сJ ^г2. Однако напрасно было бы надеяться разделить множества на такие, которые задаются равенствами, и такие, которые задаются неравен- неравенствами. Действительно, равенство $(x,y,z) = F(x,y,z) - \F(x,y,z)\ = О задает то же множество, что и неравенство F(x,y,z) ^ 0. Следует подчеркнуть зависимость уравнения от системы коорди- координат. При изменении системы координат меняются координаты точки, а потому уравнения одного и того же множества в разных системах координат, вообще говоря, различны. Обучаясь математике, мы знакомимся с логическими и матема- математическими правилами, по которым из одного верного высказывания можно получить другое верное высказывание. Строгое изучение этих правил относится к специальной науке — математической логике. Мы же, формулируя приведенные ниже предложения, просто будем считать, что такие правила известны. Естественно поэтому, что о доказательстве этих предложений не может быть речи. • Если Ps и РТ — уравнения множеств S и Г, то уравнение пе- пересечения S Г\Т есть высказывание, состоящее в том, что Ps и Рт верны одновременно. Такое высказывание обозначается Ps Л Рт- В случае, когда Ps и Рт — равенства, содержащие координаты точки, Fs(x,y,z) = 0 и FT(x,y,z) = 0, уравнение пересечения есть система уравнений Fs(x,y,z) = 0, FT(x,y,z)=0. • Если Ps и Рт — уравнения множеств S и Т, то уравнение объединения S U Т — высказывание, состоящее в том, что из Ps и Рт верно хотя бы одно. Такое высказывание обозначается Ps V Рт- • В случае, когда Ps и Рт — равенства, содержащие координаты точки, Fs(x,y,z) = 0 и FT(x,y,z) = 0, уравнение объединения можно написать в виде y,z)FT(x,y,z) =0. • Если Ps и Рт — уравнения множеств S и Г и S есть подмно- подмножество Т, то из Ps следует Рт- • Множества S и Т совпадают тогда и только тогда, когда их уравнения эквивалентны, т. е. из Ps следует Рт, а из Рт следует Р^- Проиллюстрируем два последних утверждения. Уравнения A) и B) эквивалентны. Переходя от B) к A), мы можем не ставить двойного
42 Гл. П. Прямые линии и плоскости знака перед корнем, так как г ^ 0. Наоборот, уравнение z-c= лЛ2 -{х- аJ -(у- ЪУ C) не эквивалентно уравнению B). Действительно, хотя возведением в квадрат можно получить B) из C), при извлечении корня из B) мы получаем z-c = ±^r2 -{х-аJ -{у-ЪJ. Это означает, что равенство B) выполнено не только для точек, удов- удовлетворяющих C), но и для точек, удовлетворяющих уравнению z - с= -л/г2 - (х - аJ - (у -ЪJ. D) Уравнение B) следует также и из D). Таким образом, уравнения C) и D) определяют части сферы — "верхнюю" и "нижнюю" полусферы. Иногда два последних утверждения считают определениями отно- отношений "следует" и "эквивалентно" для уравнений. 2. Алгебраические линии и поверхности. Изучение произ- произвольных множеств точек — задача совершенно необъятная. В этом пункте мы определим сравнительно узкий класс множеств, все еще чересчур широкий для того, чтобы быть подробно изученным. Определение. Алгебраической поверхностью называется мно- множество точек, которое в какой-нибудь декартовой системе координат может быть задано уравнением вида AlXklyllzmi + ... + A8xk-yl'zm- = 0, E) где все показатели степени — целые неотрицательные числа. Наи- Наибольшая из сумм1 fci + h + 777-1, -.., ks + ls + ms называется степенью уравнения, а также порядком алгебраической поверхности. Это определение означает, в частности, что сфера, уравнение ко- которой в декартовой прямоугольной системе координат имеет вид B), является алгебраической поверхностью второго порядка. Определение. Алгебраической линией на плоскости называет- называется множество точек плоскости, которое в какой-нибудь декартовой системе координат может быть задано уравнением вида AlXklyh +... + Asxksyls =0, F) где все показатели степени — целые неотрицательные числа. Наи- Наибольшая из сумм к\ + /]_,..., к8 + 18 называется степенью уравнения, а также порядком алгебраической линии. Легко видеть, что алгебраическая поверхность не обязательно яв- является поверхностью в том смысле, который мы интуитивно придаем *) Разумеется, здесь имеется в виду наибольшая из сумм, фактически вхо- входящих в уравнение, т. е. предполагается, что после приведения подобных членов найдется хотя бы одно слагаемое с ненулевым коэффициентом, имеющее такую сумму показателей. Это же замечание относится и к определению порядка ал- алгебраической линии, приводимому ниже.
§1. Общее понятие об уравнениях 43 этому слову. Например, уравнению х2 + у2 + z2 + 1 = 0 не удовлетво- удовлетворяют координаты ни одной точки, уравнение (Ж2 +у2+ Z2)[{x _ 1J + {у_ 1}2 + (z _ 1J] = 0 определяет две точки, уравнение у2 + z2 = 0 определяет линию (ось абсцисс). Такое же замечание надо сделать и об алгебраических ли- линиях. Читатель сам сможет найти соответствующие примеры. Приведенные определения имеют существенный недостаток. Именно, не известно, какой вид имеет уравнение поверхности в какой-нибудь другой декартовой системе координат. Если же уравне- уравнение и имеет в другой системе координат уравнение вида E), то по- порядок какого из этих уравнений мы будем называть порядком по- поверхности? Те же вопросы возникают и об алгебраических линиях. Ответом служат следующие теоремы. Теорема 1. Алгебраическая поверхность порядкар в любой декар- декартовой системе координат может быть задана уравнением вида E) порядка р. Теорема 2. Алгебраическая линия порядка р на плоскости в лю- любой декартовой системе координат может быть задана уравнением вида F) порядка р. Обе теоремы доказываются одинаково. Докажем, например, тео- теорему 2. Для этого перейдем от системы координат O,ei,e2, о которой шла речь в определении, к произвольной новой системе ко- координат О',е'1,е'2. Старые координаты х,у связаны с новыми коорди- координатами х',у' формулами G) §3 гл. I: х = а\х' + а\у' + aj, х = а\х' + а\у' + а^. G) Чтобы получить уравнение линии в новой системе координат, под- подставим в ее уравнение F(x,y) = 0 выражения х и у через х' и у'. При умножении многочленов их степени складываются. Поэтому \а\х' + + а\у'+ а\)к — многочлен степени к относительно х' и у', а {а\х' + а^у' + clqI — многочлен степени I. Таким образом, каждый одночлен вида Ахку1 есть многочлен степени к + I относительно х' и у'. Степень суммы многочленов не выше максимальной из степе- степеней слагаемых. (Она окажется ниже, если члены с максимальными степенями уничтожатся.) Итак, мы доказали пока, что алгебраическая линия в любой декар- декартовой системе координат может быть задана уравнением G(x',у') = О вида F), причем степень многочлена G(x',y') не больше степени мно- многочлена F(x,y), т. е. степень уравнения не повышается. Нам осталось доказать, что степень уравнения не может и понизиться, а потому не меняется при переходе к другой системе координат. Это легко доказать от противного. Действительно, G(x',y') = F(a\x' + a\y' + aj, a\x' + а\у' + ag). Поэтому, если мы подставим в G(x',у') выражения х' и у' через х и у,
44 Гл. П. Прямые линии и плоскости полученные решением уравнений G), мы получим многочлен F(x,y). Если бы степень G была меньше степени F, это означало бы, что при переходе от системы координат О^е^е^ед к системе O,ei,e2,e3 степень уравнения повысилась, чего, как мы видели, быть не может. Порядок алгебраической линии — первый встретившийся нам при- пример инварианта. Вообще, инвариантом называют всякую величину, не меняющуюся при изменении системы координат. Только инвари- инвариантные комбинации величин (коэффициентов, показателей и т. д.), входящих в уравнение линии или поверхности, характеризуют ее гео- геометрические свойства, не зависящие от ее расположения относитель- относительно системы координат. Какой геометрический смысл имеет порядок линии, мы увидим в конце главы. Замечание. Свойство неизменности порядка не относится к различным уравнениям, которые линия или поверхность могут иметь в одной и той же системе координат. Хотя такие уравнения и эквива- эквивалентны, среди них могут быть уравнения различных степеней и да- даже не получаемые приравниванием многочлена нулю. Действительно, следующие три уравнения задают окружность радиуса 1 в декартовой прямоугольной системе координат: лЛ2 + У2 = 1, х2 + у2 - 1 = 0, (ж2 + у2 - IJ = 0. Принято считать, что эквивалентные уравнения вида F), имею- имеющие разные степени, задают разные алгебраические линии (хотя со- соответствующие множества точек и совпадают). Например, говорят, что последнее из приведенных выше уравнений задает "сдвоенную окружность". Основания для такой терминологии и удобства, из нее вытекающие, в точности те же, что и в случае привычного читателю термина "кратный корень" квадратного уравнения. Теперь мы можем указать основной предмет курса аналитичес- аналитической геометрии. Это — исследование линий и поверхностей первого и второго порядка, которые доступны для изучения средствами эле- элементарной алгебры. Однако перед этим полезно рассмотреть некоторые более общие уравнения. Мы будем говорить о линиях и поверхностях. Формули- Формулирование их общих определений не входит в нашу задачу. Читатель, который любит, чтобы все было точно определено, может под ними понимать соответственно алгебраическую линию и поверхность, од- однако все результаты имеют место и в более общем случае. 3. Уравнения, не содержащие одной из координат. Рассмот- Рассмотрим частный случай уравнения поверхности F(x, у, z) — 0, когда левая часть уравнения не зависит от одной из переменных, например, от z, и уравнение имеет вид F(x,y) = 0. Пусть точка Мо(жо?2/(ь zq) лежит на поверхности. Тогда все точки с координатами ж0, г/о? z ПРИ любых z также лежат на поверхности. Легко заметить, что все точки с коор- координатами такого вида заполняют прямую, проходящую через Mq в
§1. Общее понятие об уравнениях 45 ез направлении вектора ез. Таким образом, вместе со всякой точкой Mq на поверхности лежит прямая, проходящая через Mq в направлении вектора е3. Определение. Поверхность, которая состоит из прямых линий, параллельных заданному направ- направлению, называется цилиндрической поверхностью или цилиндром, а прямые линии — ее образующи- образующими (рис. 16). Линию, лежащую на поверхности и пересекающую все образующие, называют направляю- направляющей. Мы показали, что уравнение, не содержащее одной из координат, определяет цилиндр с образующи- образующими, параллельными соответствую- соответствующей координатной оси. В качестве примера рекомен- L \ / ¦-Х< M(xo,yo,z) Рис. 16. L — направляющая, М0М — образующая дуем читателю нарисовать поверхность, заданную уравнением х + + у2 = г2 в декартовой прямоугольной системе координат в простран- пространстве. Эта поверхность — прямой круговой цилиндр. Еще один вопрос, над которым стоит подумать: как выглядят множества, уравнения которых не содержат двух из трех координат, т. е. имеют, например, вид F{x) = О? 4. Однородные уравнения. Конусы. Пусть F(x,y,z) — функ- функция от трех переменных, as — натуральное число. Введем Определение. Допустим, что для каждой тройки чисел (ж, у, z) из области определения функции и для каждого числа Л тройка чи- чисел (Xx,Xy,Xz) также принадлежит области определения, и, кроме того, F(Xx, Xy, Xz) = XsF(x, у, z). Тогда F называется однородной функцией степе- степени s. Рассмотрим поверхность, определя- определяемую в некоторой декартовой систе- системе координат уравнением F(x,y,z) = = 0, где F — однородная функция. Ес- Если точка М с координатами (x,y,z) принадлежит поверхности, то при лю- любом Л точка Р(Хх, Ху, Xz) также при- принадлежит поверхности. Радиус-векторы точек М и Р коллинеарны, и потому точка Р лежит на прямой ОМ (рис. 17). Рис. 17. L — направляющая, МР — образующая Определение. Поверхность, которая состоит из прямых линий, проходящих через фиксированную точку, называется конической по-
46 Гл. П. Прямые линии и плоскости верхностъю или конусом. Прямые линии называются ее образующими, а точка — вершиной конуса (рис. 17). Линию, лежащую на поверхнос- поверхности, не проходящую через вершину и пересекающую все образующие, называют направляющей. Мы доказали, что уравнение F(x,y,z) = 0, где F — однородная функция, определяет конус с вершиной в начале координат. Упражнения 1. В декартовой прямоугольной системе координат даны точки АA,0) и 5D,0). Напишите уравнение множества точек, отстоящих от В вдвое дальше, чем от А. 2. Каждое из двух уравнений системы (х — 2J + у2 = г2, (х + 2J + у2 = = г2 в декартовой прямоугольной системе координат определяет окруж- окружность. Вычитая одно уравнение из другого, мы получим следствие этой системы х = 0. Как геометрически истолковать этот результат? Рассмот- Рассмотрите случаи г = 3 и г = 1. 3. Составьте уравнение цилиндра с направляющей, заданной системой уравнений х2 + у -\-z2 = l,x-\-y-\-z = l,u образующей, параллельной век- вектору е3. 4. Напишите уравнение конуса с направляющей, заданной системой уравнений х2 + у2 = 4, z = 1, и с вершиной в начале координат. § 2. Уравнения прямых и плоскостей 1. Поверхности и линии первого порядка. Уравнение первой степени, или линейное уравнение, связывающее координаты точки в пространстве, имеет вид Ax + By + Cz + D = 0, A) причем предполагается, что коэффициенты при переменных не рав- равны нулю одновременно, т. е. А2 + В2 + С2 ф 0. Аналогично, линей- линейное уравнение, связывающее координаты точки на плоскости, — это уравнение Ах + Ву + С = 0 B) при условии А2 + В2 ф 0. В школьном курсе доказывается, что в декартовой прямоугольной системе координат уравнения A) и B) определяют соответственно плоскость и прямую линию на плоскости. Из теорем 1 и 2 § 1 следу- следует, что то же самое верно и в общей декартовой системе координат. Точнее, имеют место следующие теоремы. Теорема 1. В общей декартовой системе координат в простран- пространстве каждая плоскость может быть задана линейным уравнением A). Обратно, каждое линейное уравнение в общей декартовой системе ко- координат определяет плоскость. Теорема 2. В общей декартовой системе координат на плос- плоскости каждая прямая может быть задана линейным уравнением B).
§2. Уравнения прямых и плоскостей 47 Обратно, каждое линейное уравнение в общей декартовой системе ко- координат на плоскости определяет прямую. Эти теоремы полностью решают вопрос об уравнениях плоскости и прямой линии на плоскости. Однако ввиду важности этих уравне- уравнений мы рассмотрим их в других формах. При этом будут получены независимые доказательства теорем этого пункта. 2. Параметрические уравнения прямой и плоскости. Пря- Прямая линия (на плоскости или в пространстве) полностью определе- определена, если на ней задана точка Mq и задан ненулевой вектор а, парал- параллельный этой прямой. Разумеется, и точку, и вектор можно выбрать по-разному, но мы будем считать, что они как-то выбраны, и назы- называть их начальной точкой и направляющим вектором. Аналогично, плоскость задается точкой и двумя неколлинеарными векторами, ей параллельными, — начальной точкой и направляющими векторами плоскости. Мы будем предполагать, что задана декартова система координат в пространстве (или на плоскости, ес- если мы изучаем прямую в планиметрии). м Это, в частности, означает, что каждой точке сопоставлен ее радиус-вектор отно- относительно начала координат. Пусть дана прямая. Обозначим че- через го и а соответственно радиус-вектор ее начальной точки Мо и направляю- направляющий вектор. Рассмотрим некоторую точ- точку М с радиус-вектором г (рис. 18). Вектор М0М = г - г0, начало которого лежит на прямой, параллелен прямой тогда и только тогда, когда М также лежит на прямой. В этом и только этом случае для точки М найдется такое число ?, что г - г0 = ?а. C) Наоборот, какое бы число мы ни подставили в формулу C) в ка- качестве ?, вектор г в этой формуле определит некоторую точку на прямой. Уравнение C) называется векторным параметрическим уравне- уравнением прямой, а переменная величина ?, принимающая любые вещест- вещественные значения, называется параметром. Векторное параметрическое уравнение выглядит одинаково и в планиметрии, и в стереометрии, но при разложении по базису оно сводится к двум или трем скалярным уравнениям, смотря по тому, сколько векторов составляют базис. Рассмотрим прямую в пространстве. Пусть (ж, у, z) и (ж0, уо, ^о) — координаты точек М и Mq, соответственно, а вектор а имеет ком- компоненты (а1,а2,аз). Тогда, раскладывая по базису обе части уравне-
48 Гл. П. Прямые линии и плоскости ния C), мы получим х - хо = ait, у - уо = a2t, z - z0 = a3t. D) Для прямой на плоскости мы получаем, аналогично, х — хо = ait, У — Уо = o>2t. E) Уравнения D) или E) называются параметрическими уравнениями прямой. Получим теперь параметрические уравнения плоскости. Обозначим че- через р и q ее направляющие векто- векторы, а через го — радиус-вектор ее начальной точки Mq. Пусть точка М с радиус-вектором г — произволь- произвольная точка пространства (рис. 19). Век- тор MqM = г — го, начало которого лежит на плоскости, параллелен ей Рис. 19 тогда и только тогда, когда его ко- конец М также лежит на плоскости. Так как р и q не коллинеарны, в этом и только этом случае г — го может быть по ним разложен. Поэтому, если точка М лежит в плоскости (и только в этом случае), найдутся такие числа ti и t2, что г - г0 = tip + t2q. F) Это уравнение называется параметрическим уравнением плоскости. Каждой точке плоскости оно сопоставляет значения двух парамет- параметров ti и t2. Наоборот, какие бы числа мы ни подставили как зна- значения ti и t2, уравнение F) определит некоторую точку плоскости. Пусть (x,y,z) и (xo,yo,zo) — координаты точек М и Mq соответ- соответственно, а векторы р и q имеют компоненты (р1,р2,Рз) и (tfi,a2,tf3). Тогда, раскладывая по базису обе части уравнения F), мы получим параметрические уравнения плоскости х - х0 = tipi + t2tfb у -у0 = tip2 + t2a2, z - z0 = tips + t2a3. G) Отметим, что начальная точка и направляющий вектор прямой образуют на ней ее внутреннюю декартову систему координат. Значение параметра t, соответствующее какой-то точке, является ко- координатой этой точки во внутренней системе координат. Точно так же на плоскости начальная точка и направляющие векторы сос- составляют внутреннюю систему координат, а значения параметров, соответствующие точке, — это ее координаты в этой системе. 3. Прямая линия на плоскости. Параметрическое уравнение прямой утверждает, что точка М лежит на прямой тогда и только тогда, когда разность ее радиус-вектора и радиус-вектора начальной точки Мо коллинеарна направляющему вектору а. Пусть в некото- некоторой общей декартовой системе координат на плоскости заданы коор- координаты точек и вектора М(х,у), Мо(хо,уо), a(ai,a2). Тогда условие
2. Уравнения прямых и плоскостей 49 коллинеарности может быть записано в виде равенства х-х0 у ~Уо = 0. (8) Поэтому имеет место Предложение 1. В любой декартовой системе координат на плоскости уравнение прямой с начальной точкой Мо(хо,уо) и направ- направляющим вектором a.(ai,a2) может быть записано в виде (8). Уравнение (8) линейное. Действительно, после преобразования оно принимает вид а2х — а\у + (aiyo — а2хо) = 0, т. е. Ах + By + G = 0, где А = а2, В = -ах и С = сцуо - а2х0. С другой стороны, при заданной системе координат для произ- произвольного линейного многочлена Ах + By + G, А2 + В2 ф 0, найдутся такая точка Мо(хо,уо) и такой вектор a(ai,a2), что Ах + Ву + С = х - х а* У-Уо Действительно, выберем числа хо и уо так, чтобы Ахо + В качестве таких чисел можно взять, например, -АС -ВС (9) Уо + С = 0. Если С = — Ахо — Вуо, то Ах + By + G = А(ж — хо) + ??(?/ — з/о)? т- е- выполнено равенство (9) при а2 = А, а\ = —5. Итак, мы получили Предложение 2. Вектор с координатами {-В, А) можно принять за направляющий вектор прямой с уравнением B) в общей декартовой системе координат, а точку A0) за начальную точку. Следствие. Если система координат декартова прямоугольная, то вектор п(А,В) перпендикулярен прямой с уравнением A). Действительно, в этом случае (а, п) = — В А + АВ = 0. Заметим, что из предложений 1 и 2 вытекает теорема 2. Пусть в уравнении прямой Ах + By + G = 0 коэффициент В отличен от нуля. Это означает, что отлична от нуля первая компонента направляющего векто- вектора, и прямая не параллельна оси ординат. В этом случае уравнение прямой можно представить в виде A1) О Рис. 20. к=-1. Пря- Прямая у=— сс+1/2 где к = —А/В, а Ъ = —С/В. Мы видим, что к равно отношению компонент направляющего вектора: к = a2ja\ (рис. 20). Определение. Отношение компонент нап- направляющего вектора а2/а\ называется угловым коэффициентом прямой. Угловой коэффициент прямой в декартовой прямоугольной систе- системе координат равен тангенсу угла, который прямая образует с осью 4 Д.В. Беклемишев
50 Гл. П. Прямые линии и плоскости абсцисс. Угол этот отсчитывается от оси абсцисс в направлении крат- кратчайшего поворота от ei к е2 (рис. 21). Положив х = 0 в уравнении A1), получа- получаем у = Ъ. Это означает, что свободный член урав- аС-1/2 1/2) нения Ъ является ординатой точки пересечения прямой с осью ординат. Если же в уравнении прямой В = 0 и ее уравнение нельзя представить в виде A1), то обязательно А ф 0. В этом случае прямая па- параллельна оси ординат и ее уравнению можно р рд ур Рис. 21. fc=tgcp = -l. придать вид х = жо, где хо = —С/А — абсцис- рямая у — -х+ I са точки пересечения прямой с осью абсцисс. 4. Векторные уравнения плоскости и прямой. Параметри- Параметрическое уравнение плоскости утверждает, что точка М лежит на плос- плоскости тогда и только тогда, когда разность ее радиус-вектора и радиус-вектора начальной точки Mq компланарна направляющим векторам р и q. Эту компланарность можно выразить и равенством (r-ro,p,q) =0. A2) Вектор n = [p,q] — ненулевой вектор, перпендикулярный плоскости. Используя его, мы можем записать уравнение A2) в виде (г-го,п) = 0. A3) Уравнения A2) и A3) называют векторными уравнениями плоскос- плоскости. Им можно придать форму, в которую не входит радиус-вектор начальной точки. Например, положив в A3) D = —(го,п), получим (r,n)+L> = 0. A4) Для прямой на плоскости можно также написать векторные урав- уравнения, аналогичные A3) и A4), (г-го,п) = 0 или (г,п) + С = 0. Первое из них выражает тот факт, что вектор г — го перпендикуля- перпендикулярен ненулевому вектору п, перпендикулярному направляющему век- вектору а, и потому коллинеарен а. Предложение 3. Пусть x,y,z — компоненты вектора г в об- общей декартовой системе координат. Тогда скалярное произведение (г — го, п) при п / 0 записывается линейным многочленом Ах + + By + Cz + D (A2+B2 + C2 фО). Обратно, для любого линейного многочлена найдутся такие век- векторы го iin/О, что в заданной общей декартовой системе коорди- координат Ах + By + Cz + D = (г — го, n). Первая часть предложения очевидна: подставим разложение век- вектора г по базису в данное скалярное произведение: +уе2 + ze3 - г0, п),
§2. Уравнения прямых и плоскостей 51 раскроем скобки и получим многочлен Ах + By + Cz + D, в кото- котором D = — (го, п) и А=(еьп), В = (е2,п), С = (е3,п). A5) А, В и С одновременно не равны нулю, так как ненулевой вектор п не может быть ортогонален всем векторам базиса. Для доказательства обратного утверждения найдем сначала век- вектор п из равенств A5), считая А, В и С заданными. Из предложе- предложения 10 §4 гл. I следует, что 1] + C[ebe2] п + + (ei,e2,e3) (ei,e2,e3) (ei,e2,e3)' Вектор го должен удовлетворять условию D = — (го,п). Один из таких векторов можно найти в виде го = An. Подставляя, видим, что — Л(п, n) = D, откуда го = —Dn/|n|2. Итак, мы нашли векторы пиго такие, что линейный многочлен записывается в виде ж(еьп) +2/(e2jn) + z(e3,n) - (ro,n), который совпадает с требуемым (г - го,п). Заметим, что из доказанного предложения вытекает теорема 1. Предложение 4. Если система координат декартова прямо- прямоугольная, то вектор с компонентами А, В, С является нормальным вектором для плоскости с уравнением Ах + By + Cz + D = 0. Это сразу вытекает из формул A5) и предложения 1 §4 гл. I. Рассмотрим вектор а = aiei + «ie2 +«3^3 в общей декартовой системе координат О,е1,в2,ез. Очевидно, что (а, п) = ai(ei,n) + + «2(е2,п) +«з(ез,п). Теперь из формул A5) следует, что (а, п) = Aai + Ва2 + Са3. (Заметьте, что в общей декартовой системе координат числа А, В, С, вообще говоря, не являются координатами вектора п, и скалярное произведение не записывается как сумма произведений одноимен- одноименных компонент, но (а, п) выглядит так же, как и в прямоугольных координатах.) Теперь очевидным становится следующее Предложение 5. Вектор а с компонентами ai,a2,«3 в общей декартовой системе координат параллелен плоскости с уравнени- уравнением Ах + By + Cz + D = 0 тогда и только тогда, когда Аах + Ва2 + Са3 = 0. A7) Следствие. Любые два неколлинеарных вектора, удовлетворяю- удовлетворяющие уравнению A7), можно принять за направляющие векторы плос- плоскости. Предложение 5 нетрудно доказать и непосредственно, рассмат- рассматривая координаты вектора, параллельного плоскости, как разности соответствующих координат двух точек, лежащих в плоскости. По- Постарайтесь сделать это.
52 Гл. П. Прямые линии и плоскости Все, сказанное о плоскостях, почти без изменений может быть сказано и о прямых на плоскости. В частности, имеет место Предложение 6. Вектор а с компонентами а\,а2 в общей де- декартовой системе координат параллелен прямой с уравнением Ах + + By + G = 0 тогда и только тогда, когда Аах + Ва2 = 0. A8) Действительно, а\, а2 должны быть пропорциональны компонен- компонентам — В, А направляющего вектора прямой. Векторное уравнение прямой линии в пространстве может быть написано в виде [г-го,а]=О. A9) Здесь а — направляющий вектор прямой, а го — радиус-вектор ее начальной точки. В самом деле, это уравнение, как и векторное па- параметрическое, выражает коллинеарность векторов го и а. 5. Параллельность плоскостей и прямых на плоскости. Ниже, говоря о параллельных прямых или плоскостях, мы будем счи- считать, что параллельные плоскости (или прямые) не обязательно раз- различны, т. е. что плоскость (прямая) параллельна самой себе. Предложение 7. Прямые линии, задаваемые в общей декарто- декартовой системе координат уравнениями Ах + Ву + С = 0, Ахх + Вху + d = 0, параллельны тогда и только тогда, когда соответствующие коэффи- коэффициенты в их уравнениях пропорциональны, т. е. существует такое число X, что А1 = ХА, В1 = ХВ. B0) Прямые совпадают в том и только том случае, когда их уравнения пропорциональны, т. е. помимо уравнения B0) выполнено (с тем же А) равенство d = АС. B1) Доказательство. Первая часть предложения прямо следует из того, что векторы с компонентами {—В, А) и (—В\, А\) — направляю- направляющие векторы прямых. Докажем вторую часть. В равенствах B0) и B1) А ф 0, так как коэффициенты в уравнении прямой одновременно нулю не равны. Поэтому, если эти равенства выполнены, уравнения эквивалентны и определяют одну и ту же прямую. Обратно, пусть прямые параллельны. В силу первой части предложения их уравнения должны иметь вид Ах + By + С — 0 и Х(Ах + By) + С\ — 0 при некотором А. Если, кроме того, су- существует общая точка Мо(жо,2/о) обеих прямых, то Ах0 + Ву0 + С = = 0 и Х(Ахо + Вуо) + С\ =0. Вычитая одно равенство из другого, получаем С\ — АС, как и требовалось.
2. Уравнения прямых и плоскостей 53 Предложение 8. Плоскости, задаваемые в общей декартовой системе координат уравнениями Ax + By + Cz + D = 0, Ахх + Вгу + Cxz + Dx = 0, параллельны тогда и только тогда, когда соответствующие коэффи- коэффициенты в их уравнениях пропорциональны, т. е. существует такое число X, что Ах = ХА, Вх = ХВ, d = АС. B2) Плоскости совпадают в том и только том случае, когда их уравне- уравнения пропорциональны, т. е. помимо уравнений B2) выполнено (с тем же А) равенство L>i = XD. B3) Доказательство. Если плоскости параллельны, то их нормаль- нормальные векторы пип1 коллинеарны, и существует такое число А, что ni = An. В силу уравнений A5) А\ = (ei,ni) = A(ei,n) = ХА. Ана- Аналогично доказываются и остальные равенства B2). Обратно, если ра- равенства B2) выполнены, то из формулы A6) следует, что ni = An. Это доказывает первую часть предложения. Вторая его часть дока- доказывается так же, как вторая часть предложения 7. Условия B0) выражают не что иное, как коллинеарность векторов с компонентами (А, В) и {Ai,B\). Точно так же условия B2) означа- означают коллинеарность векторов с компонентами (А, В, С) и (Ai,Bi,C\). Поэтому согласно предложениям 9 и 10 § 3 гл. I условие параллель- параллельности прямых на плоскости можно записать в виде = 0, = 0. B4) B5) А В Аг В, а условие параллельности плоскостей — в виде ВС_СА_АВ В, d ~ d Аг ~ А, В, Предложению 7 можно придать чисто алгебраическую формули- формулировку, если учесть, что координаты точки пересечения прямых — это решение системы, составленной из их уравнений. Предложение 9. При условии B4) система линейных уравнений Ах + By + С = 0, А\х + Biy + Ci = 0 не имеет решений или имеет бесконечно много решений (в зависи- зависимости от С и Ci). В последнем случае система равносильна одному из составляющих ее уравнений. Если же А В то при любых С и С\ система имеет единственное решение (х,у). Разумеется, это предложение можно доказать и непосредственно и отсюда получить условие параллельности прямых. Исследованием произвольных систем линейных уравнений мы займемся в гл. V.
54 Гл. П. Прямые линии и плоскости 6. Уравнения прямой в пространстве. Прямая линия в про- пространстве может быть задана как пересечение двух плоскостей и, следовательно, в общей декартовой системе координат определяется системой уравнений вида Ах + By + Cz + D = О, Aix + Biy + Cxz + D1 = 0. B6) Пересечение плоскостей — прямая линия тогда и только тогда, когда они не параллельны, что согласно B5) означает, что хоть один из детерминантов отличен от нуля: в с С А В B7) Разумеется, систему B6) можно заменить на любую, ей эквива- эквивалентную. При этом прямая будет представлена как пересечение двух других проходящих через нее плоскостей. Вспомним параметрические уравнения прямой D). Допустим, что в них ни одна из компонент направляющего вектора не равна нулю. Тогда Z - ZQ t = х — t = а2 и мы получаем два равенства у-уо _ z- OL2 B8) B9) или, в более симметричном виде, х — хо _ у — уо _ z — zo Oil OL2 OLZ Уравнения B8) представляют прямую как линию пересечения двух плоскостей, первая из которых параллельна оси абсцисс (в ее уравне- уравнение не входит переменная ж), а вторая параллельна оси ординат. Если обращается в нуль одна из компонент направляющего векто- вектора, например, ai, то уравнения прямой принимают вид ж = Жо, 1Щ/? = ?^о_ C0) Эта прямая лежит в плоскости х — хо и, следовательно, параллельна плоскости х = 0. Аналогично пишутся уравнения прямой, если в нуль обращается неаьа другая компонента. Когда равны нулю две компоненты направляющего вектора, на- например, ai и«2, то прямая имеет уравнения х = жо, У = Уо- C1) Такая прямая параллельна одной из осей координат, в нашем слу- случае — оси аппликат. Важно уметь находить начальную точку и направляющий век- вектор прямой, заданной системой линейных уравнений B6). По ус- условию B7) один из детерминантов отличен от нуля. Допустим для
§2. Уравнения прямых и плоскостей 55 определенности, что АВ\ — А\В ф 0. В силу предложения 9 при лю- любом фиксированном z система уравнений будет иметь единственное решение (х,у), в котором х и у, разумеется, зависят от z. Они — линейные многочлены от z: x = ot\z + /3i, у = a2z + fii- Не будем доказывать этого, хотя это и не трудно сделать. Для яс- ясности, заменяя z на ?, получаем параметрические уравнения прямой x = a1t + {31, y = a2t + {32, z = t. Первые две координаты начальной точки прямой Мо (/?i, /32,0) можно получить, решая систему B6) при значении z = 0. Из параметрических уравнений видно, что в этом случае направ- направляющий вектор имеет координаты (ai,a2,l). Найдем его компонен- компоненты в общем виде. Если система координат декартова прямоугольная, векторы с компонентами (А, В, С) и (Ai,Bi,C\) перпендикулярны соответствующим плоскостям, а потому их векторное произведение параллельно прямой B6), по которой плоскости пересекаются. Вы- Вычисляя векторное произведение в ортонормированном базисе, мы по- получаем компоненты направляющего вектора Сг С А с ^ л л ^ C2) А Б Si Предложение 10. Вектор с компонентами C2) есть направля- направляющий вектор прямой с уравнениями B6), какова бы ни была декартова система координат. Доказательство. Согласно предложению 5 каждый ненулевой вектор, компоненты которого (аьа^^з) удовлетворяют уравнению Act\ + Ва2 + Саз = 0, параллелен плоскости с уравнением Ах + By + + Cz + D = 0. Если, кроме того, он удовлетворяет уравнению А\а\ + + В\а2 + С±аз = 0, то он параллелен и второй плоскости, т. е. может быть принят за направляющий вектор прямой. Вектор с компонен- компонентами C2) ненулевой в силу неравенства B7). Непосредственно легко проверить, что его компоненты удовлетворяют обоим написанным выше условиям. На этом доказательство заканчивается. Упражнения 1. Найдите параметрические уравнения прямой с уравнениями х + у + z = 4, х — у + 3z = 0. 2. Найдите параметрические уравнения плоскости х — 2у + 3z = 1. 3. Найдите координаты точки пересечения прямых с уравнениями х = = 1— ?, у = 1 + t, z = 1 — t и х = 3t — 1, у = 2t — 2, z = 1 -\-t. Какое значение параметра соответствует этой точке на каждой из прямых? Как устано- установить, что прямые пересекаются, не находя точки пересечения? 4. Напишите уравнения плоскости, в которой лежат прямые из упр. 3. 5. Напишите параметрические уравнения прямых, заданных векторны- векторными уравнениями: а) [г, а] = Ь, (а, Ь) = 0;
56 Гл. П. Прямые линии и плоскости б) (г, щ) + А = 0, (г, п2) + D2 = О, (щ, п2) = О. В задаче б) не слишком трудно получить решение и без условия (щ, п2) = = 0. Попробуйте сделать это. § 3. Основные задачи о прямых и плоскостях 1. Уравнение прямой, проходящей через две точки. Пусть в пространстве задана общая декартова система координат и две точ- точки Mi и М2 с координатами [x\,y\,z\) и (#2,2/2? 22)• Чтобы написать уравнение прямой MiM2, примем М\ за начальную точку, a MiM2 за направляющий вектор. Этот вектор не нулевой, если точки не сов- совпадают. По формуле B9) § 2 мы получаем х - xi _ г/ - г/i _ z - zi ,.ч Х2 — XI У2 — У\ Z2 — Z\ Если в этих равенствах какой-либо из знаменателей равен нулю, то следует приравнять нулю соответствующий числитель. В планиметрии задача решается также. Отличие только в том, что координаты точек теперь [хх.Ух) и {х2,у2), и мы получаем по форму- формуле (8) § 2 х - хх У-У1 х2 - #1 2/2 - 2/1 2. Уравнение плоскости, проходящей через три точки. Пусть Mi, М2 и Мз — не лежащие на одной прямой точки с ко- координатами (ari,2/i,2i), (^2,2/2,22) и (жз?2/з?2з) в общей декартовой системе координат. Выберем Mi в качестве начальной точки, a MiM2 и М1М3 в качестве направляющих векторов. Тогда по форму- формулам A2) §2 и A6) § 4 из гл. I получаем уравнение плоскости х-хх у -ух Х2 -Xi у2 - УХ хз -хх Уз- У1 = 0. B) 3. Параллельность прямой и плоскости. Пусть известен на- направляющий вектор прямой а(а1,а2,аз), а плоскость задана одним из уравнений (г — го, п) = 0 или (г — го, р, q) = 0. Прямая параллельна плоскости (а возможно, и лежит в ней) тогда и только тогда, когда соответственно (а, п) = 0 или (a, p,q) = 0. Если плоскость задана ли- линейным уравнением Ах + By + Cz + D = 0, то по предложению 5 § 2 условие параллельности — Аах + Ва2 + Са3 = 0. C) Пусть прямая задана системой уравнений Cxz + Dx = 0, А2х + В2у + C2z + D2 = 0.
3. Основные задачи о прямых и плоскостях 57 Тогда по предложению 10 § 2 условие C) переписывается в виде А Во ИЛИ c2 В A A A d В L B1 2 ^2 aI с Су c2 + С Во = 0, = 0. D) Легко проверить, что все приведенные здесь условия являются не только необходимыми, но и достаточными. Из формулы D) следует, что три плоскости пересекаются в од- одной точке тогда и только тогда, когда коэффициенты их уравнений удовлетворяют условию А В С Аг В, d ^0. E) А2 В2 С2 Действительно, это неравенство означает, что прямая, по которой пе- пересекаются две плоскости, не параллельна третьей. 4. Полупространство. Пусть даны плоскость Р и определенный ее нормальный вектор п. Полупространством, определяемым Р и п, называется множество точек М таких, что для некоторой точки Mq на плоскости вектор MqM составляет с п угол, не больший тг/2. Если г — радиус-вектор точки М, а го — точки Mq, to определе- определение полупространства, эквивалентно неравенству (г - ro,n) ^ 0. Это неравенство и есть уравнение полупространства. Нетрудно проверить, что определение полупространства не зави- зависит от выбора точки Мо. Действительно, если Mi(ri) — другая точка плоскости, то вектор а = ri — го лежит в плоскости, перпендикуля- перпендикулярен п, и мы имеем (г-гьп) = (г-г0 -a,n) = (r-ro,n). Мы получим уравнение полупространства в координатной форме, если вспомним, что согласно предложению 3 §2 выражение (г — го, п) в координатах записывается линейным многочленом Ах + By + Cz + + D. Итак, полупространство в декартовой системе координат зада- задается линейным неравенством Ах + By + Cz + D ^ 0. Обратно, любое такое неравенство можно записать как (г - r0, n) ^ 0, откуда сразу видно, что оно задает полупространство. Плоскость Р и вектор ni = —п задают другое полупространство с уравнением (г — ro,ni) ^ 0 или (г - ro,n) ^ 0. Его назовем "отри- "отрицательным", в отличие от "положительного" полупространства г — — го, п) ^ 0. Однако такое наименование условно — оно определяется
58 Гл. П. Прямые линии и плоскости выбором вектора п. Изменение направления этого вектора равносиль- равносильно умножению уравнения плоскости на (—1). При этом "положитель- "положительное" полупространство становится "отрицательным", и наоборот. Вот, однако, факт, не зависящий от выбора направления нормаль- нормального вектора: если Mi(xi,yi,zi) и M2(x2jy2j z2) две точки, не ле- лежащие в плоскости, то результаты подстановки их координат в левую часть уравнения плоскости Ах\ + Ву\ + Cz\ + D и Ах2 + Ву2 + + Cz2 + D имеют один знак тогда и только тогда, когда точки ле- лежат в одном полупространстве. Для решения задач бывает полезно следующее замечание: если точка М0(ж0, ?/о, ^о) лежит на плоскости, то точка с координатами ж0 + + А, уо + В, zo + С лежит в "положительном" полупространстве. Ина- Иначе говоря, вектор с координатами А, В, С направлен в "положитель- "положительное" полупространство. Это легко проверяется подстановкой. Вполне аналогично сказанному о полупространствах мы можем определить, что такое полуплоскость, и доказать, что неравенст- неравенство Ах + By + С ^ 0, связывающее декартовы координаты точки на плоскости, определяет полуплоскость. Вторая полуплоскость, ограни- ограниченная прямой Ах + By + G = 0, задается неравенством Ах + By + Точки Mi(xi,2/i) и М2(х2,у2) лежат по одну сторону от прямой тогда и только тогда, когда (Axi + Ву2 + С)(Ах2 + Ву2 + С) > 0. 5. Расстояние от точки до плоскости. Пусть дана плоскость с уравнением (г —го,п) =0 и точка М с радиус-вектором R. Рас- Рассмотрим вектор MqM = R — го, соединяющий начальную точку плос- плоскости с М (рис. 22). Расстояние от точки до плоскости равно модулю его скалярной проекции на век- , М тор п, т. е. Ъ^\. F) Если в декартовой прямоугольной сис- системе координат точка М имеет коорди- координаты (X, Y, Z), то равенство F) запишет- запишется согласно предложениям 3 и 4 § 2 так: \AX + BY л/ А2 + Б2 + С2 G) 6. Расстояние от точки до прямой. Если прямая задана урав- уравнением [г — го, а] = 0, то мы можем найти расстояние h от точки М с радиус-вектором R до этой прямой, разделив площадь параллело- параллелограмма, построенного на векторах R — го и а, на длину его основания
3. Основные задачи о прямых и плоскостях 59 (рис. 23). Результат можно записать форму- формулой Для прямой в пространстве мы не будем по- получать координатной записи этого выраже- выражения. Рассмотрим прямую на плоскости, за- заданную уравнением Ах + By + С = 0 в де- картовой прямоугольной систе- картовой прямоугольной системе координат. Пусть Мо(жо,2/о) — началь- начальная точка прямой, а М(Х, Y) — некоторая Рис. 23 точка плоскости. В качестве направляющего вектора возьмем век- вектор sl(—B,A). Из формулы B5) §4 гл. I следует, что площадь парал- параллелограмма равна S = \{Х — хо)А — (Y — уо)(—В)\. Тогда по форму- формуле (9) § 2 5 = \АХ + BY + C\ и () А2 + В2 V J Легко заметить также, что для нахождения расстояния от точки до прямой на плоскости можно воспользоваться формулой F), считая, что п — нормальный вектор прямой. 7. Расстояние между скрещивающимися прямыми. Пусть прямые р и q не параллельны. Известно, что в этом случае существу- существуют такие параллельные плоскости Р и Q, что прямая р лежит в Р, а прямая q лежит в Q. (Если уравнения прямых г = ri + ait и г = Г2 + + a2t, то плоскость Р имеет начальную точку ri и направляющие век- векторы ai и а2. Аналогично строится плоскость Q.) Расстояние h меж- между Р и Q называется расстоянием между прямыми р и q. Если р и q пересекаются, то Р и Q совпадают и Для того чтобы найти расстоя- расстояние /i, проще всего разделить объем параллелепипеда, построенного на век- векторах Г2 — ri, ai и а2, на площадь его основания (рис. 24). Мы получим h _ |(г2 -ri,aba2)| Рис. 24 Знаменатель этой дроби отличен от нуля, поскольку прямые не па- параллельны. Предложение 1. Прямые линии с уравнениями г = ri + ait и г = r2 + a2t пересекаются тогда и только тогда, когда h = 0, т. е. (г2 -гьаьа2) = 0, [аьа2] ф 0.
60 Гл. П. Прямые линии и плоскости 8. Вычисление углов. Чтобы найти угол между двумя прямы- прямыми, следует найти их направляющие векторы и вычислить косинус угла между ними, используя скалярное произведение. При этом следует иметь в виду, что, изменив направление одного из векторов, мы получим косинус смежного угла. Для нахождения угла между прямой ^ / Gl и плоскостью определяют угол в между _, ог направляющим вектором прямой и Рис. 25. ф = ф9 = ф1 т^ нормальным вектором плоскости. Ес- Если векторы выбрать так, чтобы cos# ^ 0, и взять 0 ^ в ^ тг/2, то искомый угол дополняет в до тг/2. Угол между плоскостями находят как угол между их нормальны- нормальными векторами. Полезна бывает формула для угла между прямыми линиями на плоскости, заданными уравнениями у = к\х + Ъ\ и у = к2х + Ъ2 в де- декартовой прямоугольной системе координат. Обозначим через ср угол между прямыми, отсчитываемый от первой прямой ко второй в том же направлении, в котором производится кратчайший поворот от пер- первого базисного вектора ко второму. Тогда tgcp можно найти как тан- тангенс разности углов, которые прямые составляют с осью абсцисс. Так как тангенсы этих углов равны угловым коэффициентам прямых, мы получаем 7 7 A0) 1 + &1&2 ' Конечно, эта формула не имеет смысла, когда знаменатель дроби обращается в нуль. В этом случае прямые перпендикулярны. Дейст- Действительно, согласно предложению 1 §2 векторы с компонентами (l,&i) и A,&2) — направляющие векторы прямых, и их скалярное произве- произведение равно 1 + к\к2. Мы получили Предложение 2. Для перпендикулярности прямых с угловыми коэффициентами к\ и к2 в декартовой прямоугольной системе коор- координат необходимо и достаточно выполнение равенства \ + k\k2 =0. 9. Некоторые задачи на построение, а) Перпендикуляр из точки на плоскость. Проекция точки. Если (г — го, п) =0 — урав- уравнение плоскости и дана точка М с радиус-вектором R, то прямая с уравнением г = R + ?п проходит через М и перпендикулярна плоскости. Решая совместно уравнения прямой и плоскости, найдем ортогональную проекцию М на плоскость. Из (R — го + ?п, п) = 0 находим t и подставляем в уравнение прямой. Мы получим радиус- вектор проекции (R-ro,n) _ Тл — ±1 — П. Обратите внимание на структуру этой формулы: из радиус-векто-
3. Основные задачи о прямых и плоскостях 61 pa R вычитается проекция R — го на нормальный вектор плоскости. Из этих соображений можно было получить ответ. б) Перпендикуляр из точки на прямую. Пусть прямая задана урав- уравнением [г —го, а] = 0 и дана точка М с радиус-вектором R. Век- Вектор р = [R —го,а] перпендикулярен плоскости, проходящей через прямую и точку М. Если точка не лежит на прямой, то р ф О, и вектор [а, р] = [a, [R — го, а]] также ненулевой и перпендикулярен а и р. Следовательно, он лежит в указанной плоскости и перпендикуля- перпендикулярен прямой. Итак, получено уравнение г = R + ?[a,[R-ro,a]] перпендикуляра, опущенного из точки М на заданную прямую. Применив формулу двойного векторного произведения, вы заме- заметите, что [а, р] коллинеарен разности вектора R — го и его проекции на вектор а. Задачу можно было решить, заметив это свойство на- направляющего вектора перпендикуляра. в) Уравнение проекции прямой на плоскость. Его просто полу- получить, если не требуется находить направляющий вектор и началь- начальную точку. Пусть заданная плоскость имеет уравнение (г, п) + + D = 0, а прямая — уравнение [г —го,а] = 0, причем [а, п] ф 0. Тогда плоскость (г —го,а, п) = 0 проходит через прямую перпен- перпендикулярно заданной плоскости. Таким образом, проекция прямой может быть задана системой из двух уравнений: (r-ro,a,n) =0, (r,n)+L> = 0. Направляющий вектор проекции b — проекция а на плоскость. Она получается из а вычитанием из него его проекции на нормаль: 1 (а, п) b = а - v ,/ п. За начальную точку может быть принята точка пересечения проекти- проектируемой прямой с плоскостью, если она существует, или же проекция начальной точки прямой. г) Общий перпендикуляр к двум скрещивающимся прямым. Пусть прямые с уравнениями г = ri + + ?ai и г = г2+?а2 не параллельны, т. е. [ai,a2] Ф 0. Вектор р = [аьа2] перпендикулярен обеим прямым. Следо- Следовательно, плоскость (г-г1,а1,[а1,а2]) = 0 A1) проходит через первую прямую и общий перпендикуляр к обеим прямым (рис. 26), а плоскость (г-г2,а2,[аьа2]) = 0 A2) Рис.26
62 Гл. П. Прямые линии и плоскости — через вторую прямую и общий перпендикуляр. Поэтому общий перпендикуляр можно задать системой уравнений A1), A2). Чтобы найти его начальную точку, можно решить совместно уравнение пер- первой прямой и плоскости A2). Направляющий вектор — [ai,a2]. 10. Пучок прямых. Пучком прямых на плоскости называется множество прямых, проходящих через фиксированную точку — центр пучка. Пусть А\х + В\у + С\ — 0 и А2х + В2у + С2 = 0 — урав- уравнения двух прямых, принадлежащих пучку. Тогда уравнение а(А1Х + В1У + d) + C(А2х + В2у + С2) = 0 A3) при условии а2 + /З2 ф 0 называется уравнением пучка прямых. Основанием для этого служит Предложение 3. При любых а и /3 (а2 + /З2 ф 0) уравнение A3) определяет прямую линию, принадлежащую пучку. Обратно, уравнение каждой прямой из пучка представимо в виде A3). Докажем сначала, что коэффициенты при переменных в уравне- уравнении A3) не равны нулю одновременно. Для этого перепишем его в виде (аАг + /ЗА2)х + {аВ1 + /ЗВ2)у + (ad + /ЗС2) = 0. Допустим, что аА\ + /ЗА2 = 0 и аВ\ + /ЗВ2 = 0. Так как прямые пе- пересекаются, А\В2 — А2В\ /0 и из предложения 9 § 2 вытекает, что значения а = 0, /3 = 0 единственные, которые удовлетворяют этим двум равенствам. Но эти значения мы исключили. Таким образом, уравнение A3) определяет прямую линию. Обозначим через ж0, уо координаты центра пучка. По условию А±х0 + В±у0 + d = 0, А2х0 + В2у0 + С2 = 0, а потому ж0, уо удовлетворяют уравнению A3), и прямая проходит через центр пучка. Вторая часть предложения будет доказана, если окажется, что че- через любую точку, отличную от центра пучка Мо, проходит прямая линия с уравнением вида A3). Легко проверить, так ли это. Рассмот- Рассмотрим точку Mi(xi,2/i), отличную от Мо, и обозначим и = Аххг + Вхух + Ci, v = A2xx + B2yi + С2. Так как наши прямые имеют только одну общую точку, числа и и v одновременно не равны нулю, и мы вправе положить а = —и, /3 = и. При таких значениях а и /3 координаты точки Mi удовлетворяют уравнению A3). Это означает, что соответствующая этим значениям прямая пучка проходит через Mi, и предложение доказано. Заметим, что каждая пара чисел а и /3 (а2 + /З2 ф 0) определяет в пучке единственную прямую, но каждой прямой соответствуют бесконечно много пропорциональных между собой пар чисел. Если нам известны координаты центра пучка, то уравнение пучка можно написать в виде а(х -х0) + /3(у -у0) = 0,
§3. Основные задачи о прямых и плоскостях 63 положив, что пучок определяется прямыми х — хо = 0 и у — уо = 0. Впрочем, и без того очевидно, что это — уравнение произвольной прямой, проходящей через Мо. Посмотрим на уравнение пучка прямых с несколько более общей точки зрения. Систему из уравнений прямых, определяющих пучок, можно рассматривать как уравнение центра пучка. Поэтому уравне- уравнение каждой прямой пучка есть следствие этой системы. Теперь наш результат можно сформулировать так. Предложение 4. Если система линейных уравнений имеет ре- решение, то некоторое линейное уравнение является ее следствием тогда и только тогда, когда оно есть сумма уравнений системы, ум- умноженных на какие-то числа. Мы доказали это предложение для частного случая систем из двух уравнений с двумя неизвестными. В общем виде оно вытекает из ре- результатов гл. V о системах линейных уравнений. Другими геомет- геометрическими интерпретациями этого предложения являются пучки и связки плоскостей. Пучком плоскостей называется множество плоскостей, проходя- проходящих через фиксированную прямую — ось пучка. Уравнение пучка плоскостей имеет вид а(Агх + Вху + C\z + ?>i) + C(А2х + В2у + C2z + D2) = 0, где а2 + (З2 ф 0, а в скобках стоят левые части уравнений двух раз- различных плоскостей пучка. Связкой плоскостей называется множество плоскостей, проходя- проходящих через фиксированную точку — центр связки. Уравнение связки плоскостей имеет вид а(Агх + Вгу + Cxz + Dx) + /3(A2x + В2у + C2z + D2) + + -/(А3х + В3у + C3z + D3) = 0, где а2 + /З2 + 72 Ф 0> а в скобках стоят левые части уравнений плос- плоскостей связки, имеющих центр своей единственной общей точкой. Предоставим читателю самостоятельно вывести эти уравнения, если он пожелает. 11. О геометрическом смысле порядка алгебраической линии. Пусть на плоскости дана алгебраическая линия L, имею- имеющая в декартовой системе координат уравнение AlXklyh +... + Asxksyls =0. A4) Рассмотрим произвольную прямую с параметрическими уравне- уравнениями x = xo+ait, y = yo + a2t. A5) Найдем точки пересечения L и прямой линии. Они будут извест- известны, если мы найдем соответствующие им значения параметра t. Это будут те значения, при которых х и у, выраженные по форму-
64 Гл. П. Прямые линии и плоскости лам A5), удовлетворяют уравнению A4). Подставим A5) в A4): А1(х0 + arfI*1 (у0 + a2t)h + ...+ As(x0 + CL!t)ks (у0 + a2t)ls = 0. A6) Раскрывая скобки в каждом члене, мы получим многочлены отно- относительно t степеней k\ + /i, ...,ks + ls- Их сумма будет многочленом, степень которого не выше, чем максимальная из степеней слагаемых. Но максимальное из чисел к\ + Zi,..., ks + ls — это порядок линии L. Поэтому степень уравнения A6) не превосходит порядка линии. Может, конечно, случиться, что все коэффициенты этого уравне- уравнения равны нулю, и оно представляет собой тождество. Если исклю- исключить этот случай, то число корней уравнения и, следовательно, число точек пересечения не превосходит порядка линии. Мы доказали Предложение 5. Число точек пересечения алгебраической ли- линии с прямой, которая на ней не лежит целиком, не превосходит порядка линии. Существуют линии, которые ни с одной прямой не имеют в прин- принципе возможного числа точек пересечения, равного порядку линии. Примерами могут служить линии с уравнениями х2 + у2 =0 или (х2+у2J-1 = 0. Пример. Архимедова спираль — линия с уравнением г = аср в полярной системе координат — пересекает каждую прямую, прохо- проходящую через полюс, в бесконечном числе точек. Следовательно, она не является алгебраической линией. Упражнения 1. В декартовой прямоугольной системе координат даны координаты вершин треугольника АB0, —15), В(—16,0) и С(—8,6). Найдите координа- координаты центра и радиус окружности, вписанной в треугольник. 2. Начало координат лежит в одном из углов, образованных прямыми с уравнениями А\х + В\у + С\ = 0 и А^х + В^у + С2 = 0. При каком не- необходимом и достаточном условии на коэффициенты уравнений этот угол острый? 3. Составьте уравнение прямой, проходящей через начало координат и пересекающей прямые с уравнениями х = 1 + 2?, у = 2 + 3?, z = — t и х = 4?, у = 5 - bt, z = 3 + 2t. 4. В декартовой прямоугольной системе координат найдите координаты центра и радиус сферы, проходящей через точку А@,1,0) и касающейся плоскостей с уравнениями ж + г/ = 0, х — у = 0их-\-у-\-4г = 0. 5. В декартовой прямоугольной системе координат даны координаты вершин треугольника АA,2,3), БA,5, —1) и GE,3,-5). Найдите коорди- координаты центра окружности, описанной около треугольника. 6. Напишите уравнения прямой, которая параллельна прямой г = го + и пересекает прямые г = п + a.\t и г = г2 + а2?.
ГЛАВА III ЛИНИИ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА § 1. Исследование уравнения второго порядка В общей декартовой системе координат линия второго порядка может быть задана уравнением1 Ах2 + 2Вху + Су2 + 2Dx + 2Еу + F = 0, A) в котором коэффициенты А, В и С не равны нулю одновременно. Исследуем множество точек, которые ему удовлетворяют, не предпо- предполагая заранее, что хоть одна такая точка существует. С этой целью мы будем менять систему координат так, чтобы уравнение стало воз- возможно проще. С самого начала можно считать систему координат декартовой прямоугольной, так как при переходе к прямоугольной системе координат общий вид уравнения A) не изменится. При повороте базиса декартовой прямоугольной системы коорди- координат на угол ip старые координаты точки ж, у будут связаны с ее но- новыми координатами х',у' формулами (8) §3 гл. I х = х' cos if — у' sin ср, у = х' sin ср + у' cos (p. В новых координатах уравнение A) примет вид А(х' cos ip - у' sin ерJ + 2В(х' cos ip - у' sin ф) х x (V sin ip + yf cos ф) + C(xf sin ip + y' cos (pJ + ... = 0. Здесь многоточием обозначены члены первой степени относитель- относительно х',у' и свободный член, которые нет необходимости выписывать. Нас будет интересовать член с произведением х'у' в преобразованном уравнении. В невыписанные члены это произведение не входит, и мы подсчитаем, что половина коэффициента при х'у' есть В' = —A sin cp cos ср + В (cos2 ср — sin2 ф) + С sin cp cos (p. Если В = 0, то поворачивать систему координат не будем. Если же В ф Ф 0, то выберем угол ip так, чтобы В' обратилось в нуль. Это требование приведет к уравнению 2В cos 2(p=(A- С) sin 2<p. B) Если А = С, то cos 2(р = 0, и можно положить ip = тг/4. Если же А ф С, 1 Г О 7~? "I то выбираем <р = - arctg -—— . Для нас сейчас важно то, что хоть 2 L А. О J *) Коэффициенты при произведении переменных и при их первых степе- степенях обозначены 2В, 2D и 2Е, так как ниже часто будут употребляться поло- половины этих коэффициентов.
66 Гл. III. Линии и поверхности второго порядка один такой угол обязательно существует. После поворота системы координат на этот угол линия будет иметь уравнение А'х'2 + Су'2 + 2D'x' + 2Е'у' + F' = 0. C) Выражения для коэффициентов уравнения C) через коэффициенты A) подсчитать не трудно, но это не нужно. Теперь коэффициент при произведении переменных равен нулю, а остальные члены мы по- прежнему считаем произвольными. Сформулируем следующее вспомогательное Предложение 1. Если в уравнение C) входит с ненулевым ко- коэффициентом квадрат одной из координат, то при помощи перено- переноса начала координат вдоль соответствующей оси можно обратить в нуль член с первой степенью этой координаты. В самом деле, пусть, например, А' ф 0. Перепишем C) в виде А' (х12 + Щ-х1 + fJJ) + Су'2 + 2Е'у' + F' - ^ = 0. Если мы сделаем перенос начала координат, определяемый формула- формулами х" = х' + D'/А', у" = у', то уравнение приведется к виду А'х + Су + 2Е'у" + F" = 0, как и требовалось. А. Предположим, что А'С ф 0, т. е. оба коэффициента отличны от нуля. Согласно предложению 1 при помощи переноса начала коорди- координат уравнение приведется к виду А'х + Су + F" = 0. D) Могут быть сделаны следующие предположения относительно зна- знаков коэффициентов в этом уравнении. А1. А'С > 0 — коэффициенты А' и С имеют один знак. Для F" имеются следующие три возможности. Ala. Знак F" противоположен знаку А' и С. Перенесем F" в дру- другую часть равенства и разделим на него. Уравнение примет вид где а2 = —F"/А', Ъ2 = —F"/С. Можно считать, что в этом уравне- уравнении а>0, b > 0 и а ^ Ь. Действительно, если последнее условие не выполнено, то можно сделать дополнительную замену координат х*=у", у*=х". F) Определение. Линия, которая в некоторой декартовой прямо- прямоугольной системе координат может быть задана уравнением E) при условии а ^ Ь, называется эллипсом, уравнение называется канони- каноническим уравнением эллипса, а система координат — его канонической системой координат. При а = Ъ уравнение E) есть уравнение окружности радиуса а. Таким образом, окружность — частный случай эллипса.
§1. Исследование уравнения второго порядка 67 А1б. Знак F" совпадает с общим знаком А" и С". Тогда аналогично предыдущему мы можем привести уравнение к виду Этому уравнению не удовлетворяют координаты ни одной точки. Уравнение, которое приводится к каноническому виду G), называ- называется уравнением мнимого эллипса. А1в. F" = 0. Уравнение имеет вид aV'2 + с2у" = 0. (8) Ему удовлетворяет только одна точка х" = 0, у" = 0. Уравнение, при- приводящееся к каноническому виду (8), называется уравнением пары мнимых пересекающихся прямых. Основанием для этого названия слу- служит сходство с приведенным ниже уравнением A0). А2. А'С < 0 — коэффициенты А' и С имеют разные знаки. От- Относительно F" имеются следующие две возможности. А2а. F" ф 0. В случае необходимости, делая замену F), мы мо- можем считать, что знак F" противоположен знаку А'. Тогда уравнение приводится к виду где а2 = -F"/A', Ъ2 = F"/C. Определение. Линия, которая в некоторой декартовой прямо- прямоугольной системе координат может быть задана уравнением (9), на- называется гиперболой, уравнение называется каноническим уравнением гиперболы, а система координат — ее канонической системой коор- координат. А2б. F" = 0. Уравнение имеет вид aV'2 - сУ'2 = 0. A0) Его левая часть разлагается на множители ах" — су" и ах" + су" и, следовательно, обращается в нуль тогда и только тогда, когда равен нулю хоть один из сомножителей. Поэтому линия с уравнением A0) состоит из двух прямых. Эти прямые пересекаются в начале коорди- координат, и мы имеем, таким образом, пару пересекающихся прямых. Б. Допустим теперь, что А'С = 0, и, следовательно, один из ко- коэффициентов А' или С равен нулю. В случае необходимости, делая замену F), мы можем считать, что А' = 0. При этом С ф 0, так как иначе порядок уравнения был бы меньше двух. Используя предложе- предложение 1, мы приведем уравнение к виду Су + 2D'x" + F" = 0. Б1. Пусть D' ф 0. Сгруппируем члены следующим образом:
Гл. III. Линии и поверхности второго порядка Перенесем начало координат вдоль оси абсцисс в соответствии с фор- формулами перехода ж* = х" + F" /2D', ?/* = у". Тогда уравнение примет вид Су" + 2D'x* = О, или 2/*2 = 2рх*, (П) где р = —D'/C. Мы можем считать, что р > О, так как в противном случае можно сделать дополнительную замену координат, изменяю- изменяющую направление оси абсцисс: х = —ж*, у = у*. Определение. Линия, которая в некоторой декартовой прямо- прямоугольной системе координат может быть задана уравнением A1) при условии р > 0, называется параболой, уравнение называется канони- каноническим уравнением параболы, а система координат — ее канонической системой координат. Б2. Допустим, что D' = 0. Уравнение имеет вид Су + F" = 0. Относительно F" есть следующие три возможности. Б2а. СF" < 0 — знаки С и F" противоположны. Разделив на С, приведем уравнение к виду у - а2 = 0. A2) Левая часть уравнения разлагается на множители у" + а и у" — а. Обращение в нуль каждого из них определяет прямую линию. Эти прямые параллельны, и, таким образом, уравнение определяет пару параллельных прямых. Б2б. СF" > 0 — знаки С и F" совпадают. Разделив на С\ при- приведем уравнение к виду у + а2 = 0. A3) Этому уравнению не удовлетворяют координаты ни одной точки. Уравнение, приводящееся к каноническому виду A3), называют урав- уравнением пары мнимых параллельных прямых. Б2в. F" = 0. После деления на С уравнение принимает вид у = 0. A4) Это уравнение эквивалентно уравнению у" = 0, и потому определяет прямую линию. Уравнение, приводящееся к каноническому виду A4), называется уравнением пары совпавших прямых. Соберем вместе полученные результаты. Теорема 1. Пусть в декартовой системе координат задано урав- уравнение второго порядка A). Тогда существует такая декартова прямоугольная система коор- координат, в которой это уравнение принимает один из следующих девя- девяти канонических видов:
§2. Эллипс, гипербола и парабола 69 4)J-fJ = 1; 5)a2x2-cV=0; 6) у2 = 2рх; 7) у2 - а2 = 0; 8) у2 + а2 = 0; 9) ?/2 = 0. В соответствии с этим существуют семь классов линий второго порядка: 1) эллипсы; 3) точки (пары мнимых пересекающихся пря- прямых); 4) гиперболы; 5) пары пересекающихся прямых; 6) параболы; 7) пары параллельных прямых; 9) прямые (пары совпавших прямых). Уравнению 2) мнимого эллипса и уравнению 8) пары мнимых па- параллельных прямых не удовлетворяет ни одна точка. Упражнения 1. Приведите к каноническому виду уравнение Зх2 + Юху + Зу2 - 2х + Чу - 9 = 0. 2. Приведите к каноническому виду уравнение 9х2 - 24ху + 16у2 - 34ж — Зву — 9 = 0. 3. Какого класса линию может определять уравнение второго порядка, если его левая часть раскладывается в произведение линейных мночленов? 4. При каком условии на его коэффициенты уравнение второго поряд- порядка в декартовой прямоугольной системе координат является уравнением окружности? 5. Система координат удовлетворяет условиям |ei| = |в2| = 5, (ei,e2) = = 7. Какая линия определяется в этой системе координат уравнением х2 + + 2/2 = 1? 6. Докажите, что сумма коэффициентов А + С в уравнении A) не меня- меняется при переходе от одной декартовой прямоугольной системы координат к другой такой же системе. § 2. Эллипс, гипербола и парабола В предыдущем параграфе мы познакомились с классификацией линий второго порядка. Геометрические свойства только трех классов линий не являются очевидными. Ими мы сейчас займемся. 1. Эллипс. Напомним, что мы назвали эллипсом линию, которая в некоторой декартовой прямоугольной системе координат определя- определяется каноническим уравнением при условии а ^ Ъ > 0. Из уравнения A) следует, что для всех точек эллипса \х\ ^ а и \у\ ^ Ъ. Значит, эллипс лежит в прямоугольнике со сторонами 2а и 2Ъ. Точки пересечения эллипса с осями канонической системы коор- координат, имеющие координаты (а,0), (—а, 0), @,6) и @,-6), называ- называются вершинами эллипса. Числа а и Ъ называются соответственно большой и малой полуосями эллипса.
70 Гл. III. Линии и поверхности второго порядка м м. В каноническое уравнение входят только квадраты координат. По- Поэтому, если координаты (ж, у) какой-либо точки М ему удовлетворя- удовлетворяют, то ему удовлетворяют и координа- координаты (—ж,у), (х,—у) и (—ж, — у) точек Mi, М2 и М3 (рис. 27). Отсюда вытекает Предложение 1. Оси канонической системы координат являются осями сим- симметрии эллипса, а начало канонической системы — его центром симметрии. Внешний вид эллипса проще всего опи- описать сравнением с окружностью радиуса а с центром в центре эл- эллипса: ж2 + у2 = а2. При каждом х таком, что |ж| < а, найдутся две точки эллипса с ординатами ±Ь^/1 — х2 jo? и две точки окружнос- окружности с ординатами ±а^/1 — х2 jo?. Пусть точке эллипса соответствует точка окружности с ординатой того же знака. Тогда отношение ор- ординат соответствующих точек равно Ъ/а. Итак, эллипс получается из окружности таким сжатием ее к оси абсцисс, при котором ординаты \ М Рис. 28. Здесь Ъ/а= 1/2 Рис. 29 всех точек уменьшаются в одном и том же отношении Ъ/а (рис. 28). С эллипсом связаны две замечательные точки, называемые его фокусами. Пусть по определению с2 =а2- Ъ2 B) и с^О. Фокусами называются точки F\ и F2 с координатами (с, 0) и (—с, 0) в канонической системе координат (рис. 29). Для окружности с = 0, и оба фокуса совпадают с центром. Ниже мы будем предполагать, что эллипс не является окружностью. Отношение C) _ С а называется эксцентриситетом эллипса. Отметим, что г < 1. Предложение 2. Расстояние от произвольной точки М(х,у), лежащей на эллипсе, до каждого из фокусов (см. рис. 29) является
§2. Эллипс, гипербола и парабола 71 линейной функцией от ее абсциссы х: r1 = \F1M\ = a-ex, r2 = \F2M\ = а + ex. D) Доказательство Очевидно, что г\ = [х — сJ + у2. Подставим сюда выражение для у2, найденное из уравнения эллипса. Мы полу- получим у2 2 Учитывая равенство B), это можно преобразовать к виду г2 = а2 - 2сх с2х2 , ч2 —^- = (а - еху. Так как х ^ а и е < 1, отсюда следует, что справедливо первое из равенств D): г\ = а — ex. Второе равенство доказывается аналогично. Предложение 3. Для того чтобы точка лежала на эллипсе, не- необходимо и достаточно, чтобы сумма ее расстояний до фокусов рав- равнялась большой оси эллипса 2а. Необходимость условия очевидна: если мы сложим равенства D) почленно, то увидим, что +Г2 = 2а. E) Докажем достаточность. Пусть для точки М(х,у) выполнено усло- условие E), т. е. у/{х - сJ 9 о // i \9 i 9 yz = 2а — у (х + c)z + 2/ . Возведем обе части равенства в квадрат и приведем подобные члены: хс + а2 = ал/(х + сJ + ^/2. F) Это равенство также возведем в квадрат и приведем подобные члены, используя соотношение B). Мы придем к равенству Ь2х2-\-а2у2 = = a2b2, равносильному уравне- уравнению эллипса A). С эллипсом связаны две заме- замечательные прямые, называемые его директрисами. Их уравнения в канонической системе коорди- координат (рис. 30) -а/е а х = . е G) Рис. 30 Директрису и фокус, которые лежат по одну сторону от центра, будем считать соответствующими друг другу. Предложение 4. Для того чтобы точка лежала на эллипсе, не- необходимо и достаточно, чтобы отношение ее расстояния до фокуса к расстоянию до соответствующей директрисы равнялось эксцентри- эксцентриситету эллипса е. Докажем это предложение для фокуса F2(—с, 0). Пусть М(х,у) — произвольная точка эллипса. Расстояние от М до директрисы с урав-
72 Гл. III. Линии и поверхности второго порядка нением х = —а/е по формуле (9) § 3 гл. II равно . а х + - е 1 - [F е х + а) Из формулы D) мы видим теперь, что r2/d2 = е. Обратно, пусть для какой-то точки плоскости rijdi — г, т. е. Так как г = с/а, это равенство легко приводится к виду F), из кото- которого, как мы знаем, следует уравнение эллипса. Выведем уравнение касательной к эллипсу, заданному каноничес- каноническим уравнением. Пусть Мо(жо,2/о) — точка на эллипсе и у0 ф 0. Че- Через Мо проходит график некоторой функции у = /(ж), который цели- целиком лежит на эллипсе. (Для уо > 0 это график fi(x) = Ь^/l — ж2/а2, для уо < 0 — график /2(ж) = —Ъ^/1 — х2/а2. Не уточняя знака ^/о5 обо- обозначим подходящую функцию /(ж).) Для нее выполнено тождество az Дифференцируем его по х: (Я*)J _ 1 7 9 2 а2 Ь2 Подставляя х = Х(,н /(жо) = Уо, находим производную от / в точке равную угловому коэффициенту касательной: Теперь мы можем написать уравнение касательной: Упрощая это уравнение, учтем, что Ь2х\ + о? у о — a2b2, так как Mq лежит на эллипсе. Результату можно придать вид Е* + УШ = 1. (8) az bz При выводе уравнения (8) мы исключили вершины эллипса (а, 0) и (—а,0), положив уо ф 0. Для этих точек оно превращается, соот- соответственно, в уравнения х = а и х = —а. Эти уравнения определяют касательные в вершинах. Проверить это можно, заметив, что в верши- вершинах х как функция от у достигает экстремума. Предоставим читате- читателю проделать это подробно и показать тем самым, что уравнение (8) определяет касательную для любой точки Mo(xo,2/o) на эллипсе. Предложение 5. Касательная к эллипсу в точке Мо(жо,2/о) есть биссектриса угла, смежного с углом между отрезками, соединяю- соединяющими эту точку с фокусами.
§2. Эллипс, гипербола и парабола 73 Доказательство Нам надо сравнить углы ные векторами FiM0 и F2M0 с векто- вектором п, перпендикулярным касатель- касательной (рис. 31). Из уравнения (8) на- находим, что п(хо/а2,уо/Ь2), и потому .< xqc а — i составлен- составленРис. 31 az a Используя D), мы получаем отсюда, что cosifi = l/(a|n|). Аналогично находим cos(^2 = l/(alnl)- Предложение доказано. 2. Гипербола. Гиперболой мы назвали линию, которая в некото- некоторой декартовой прямоугольной системе координат определяется ка- каноническим уравнением 2 2 Из этого уравнения видно, что для всех точек гиперболы |ж| ^ а, т. е. все точки гиперболы лежат вне вер- вертикальной полосы ширины 2а (рис. 32). Ось абсцисс канонической системы ко- координат пересекает гиперболу в точках с координатами (а, 0) и (—а,0), назы- называемых вершинами гиперболы. Ось ор- ординат не пересекает гиперболу. Таким образом, гипербола состоит из двух не связанных между собой частей. Они на- Рис. 32 зываются ее ветвями. Числа а и Ъ называются соответственно вещественной и мнимой полуосями ги- гиперболы. В точности так же, как и для эллипса, доказывается Предложение 6. Для гиперболы оси канонической системы ко- координат являются осями симметрии, а начало канонической систе- системы — центром симметрии. Для исследования формы гиперболы найдем ее пересечение с про- произвольной прямой, проходящей через начало координат. Уравнение прямой возьмем в виде у = кх, поскольку мы уже знаем, что пря- прямая х = 0 не пересекает гиперболу. Абсциссы точек перечения нахо- находятся из уравнения к2х2 Ъ2 = 1. Поэтому, если Ъ2 — а2к2 > 0, то х = ±- аЪ /Ь2 - а2к2 Это позволяет указать координаты точек пересечения (ab/v,abk/v) и
74 Гл. III. Линии и поверхности второго порядка Рис. 33 (—ab/v, —abk/v), где обозначено v = (b2 — а2к2I/2. В силу симметрии достаточно проследить за движением пер- первой из точек при изменении к (рис. 33). Числитель дроби ab/v постоянен, а знаменатель принимает наибольшее зна- значение при к = 0. Следовательно, наимень- наименьшую абсциссу имеет вершина (а,0). С ростом к знаменатель убывает, и х рас- растет, стремясь к бесконечности, когда к приближается к числу Ь/а. Прямая у = = Ъх/а с угловым коэффициентом Ь/а не пересекает гиперболу, и прямые с большими угловыми коэффици- коэффициентами ее тем более не пересекают. Любая прямая с меньшим поло- положительным угловым коэффициентом пересекает гиперболу. Если мы будем поворачивать прямую от горизонтального положе- положения по часовой стрелке, то к будет убывать, к2 расти, и прямая будет пересекать гиперболу во все удаляющихся точках, пока не займет по- положения с угловым коэффициентом —Ь/а. К прямой у = —bx/а относится все, что было сказано о у = Ьх/а: она не пересекает гиперболу и отделяет прямые, пересекающие ее, от не пересекающих. Из приведенных рассуждений вытекает, что гипер- гипербола имеет вид, изображенный на рис. 33. Определение. Прямые с уравнениями у = Ъх/а и у = —Ъх/а в канонической системе координат называются асимптотами гипер- гиперболы. Запишем уравнения асимптот в виде Ьх — ау = 0 и Ьх + ау = 0. Расстояния от точки М(х,у) до асимптот равны соответственно , _ \Ьх — ау\ , _ \Ъх + ау\ 1 ~ л/а2 + Ь2' 2 ~ л/а2 + Ъ2' Если точка М находится на гиперболе, то Ъ2х2 — а2у2 = о?Ъ2, и |т 2 2 2 7 7 о ж а ' ГЦГ12 = ГПТ 2 + b2 a2 + b2 Предложение 7. Произведение расстояний от точки гиперболы до асимптот постоянно и равно a2b2/(а2 + Ъ2). Отсюда следует важное свойство асимптот. Предложение 8. Если точка движется по гиперболе так, что ее абсцисса по абсолютной величине неограниченно возрастает, то расстояние от точки до одной из асимптот стремится к нулю. Действительно, хотя бы одно из расстояний hi или h2 при этих условиях должно неограниченно возрастать, и, если бы предложение было неверно, произведение не было бы постоянно. Введем число с, положив с2 =а2 + Ъ2 A0)
§2. Эллипс, гипербола и парабола 75 и с > 0. Фокусами гиперболы называются точки F\ и F2 с коорди- Рис. 34. с2 = а2 + Ъ2 Рис. 35. г2-г1 = 2а; г[ -г'2 =2а натами (с, 0) и (—с, 0) в канонической системе координат. Отношение г = с/а, как и для эллипса, называется эксцентриси- эксцентриситетом. У гиперболы г > 1. Предложение 9. Расстояния от произвольной точки М(х,у) на гиперболе до каждого из фокусов следующим образом зависят от ее абсциссы х: П = |FiM| = \а- гх\, r2 = \F2M\ = \а + гх\. A1) Доказательство этого утверждения почти дословно совпадает с доказательством предложения 2, и мы не будем его воспроизво- воспроизводить. Заметим, что равенства A1) можно подробнее записать так: для правой ветви гиперболы (х ^ а) П = гх — а, г2 = ех + а; для левой ветви гиперболы (х ^ —а) Т\ — а — гх, т2 — —ех — а. Итак, для правой ветви г2 — г\ = 2а, а для левой ветви г\ — г2 = = 2а. В обоих случаях \т2 -п\ = 2а. A2) Предложение 10. Для того чтобы точка М лежала на гипер- гиперболе, необходимо и достаточно, чтобы разность ее расстояний до фокусов по абсолютной величине равнялась вещественной оси ги- гиперболы 2а. Необходимость условия уже доказана. Для доказательства доста- достаточности условия его нужно представить в виде у/(х — сJ + у2 = =Ь2а + у/(х + сJ + у2. Дальнейшее отличается от доказательства предложения 3 только тем, что нужно воспользоваться равенством A0), а не B). Директрисами гиперболы называются прямые, задаваемые в ка- канонической системе координат уравнениями A3) а х = -, а х = . е Директрисы лежат ближе к центру, чем вершины, и, следователь- следовательно, не пересекают гиперболу. Директриса и фокус, лежащие по одну сторону от центра, считаются соответствующими друг другу.
76 Гл. III. Линии и поверхности второго порядка Предложение 11. Для того чтобы точка лежала на гиперболе, необходимо и достаточно, чтобы отношение ее расстояния до фоку- фокуса к расстоянию до соответствую- соответствующей директрисы равнялось эксцен- эксцентриситету г (рис. 36). Доказательство повторяет до- доказательство предложения 4. До- Докажем, например, необходимость Рис зб условия для фокуса F2(-c, 0). Пусть М'(х, у) — точка гиперболы. Расстояние от М' до директрисы с уравнением х = —а/е по форму- формуле (9) § 3 гл. II равно п . d' = ex + a Из формулы A1) мы видим теперь, что г'/dl = г. Уравнение касательной к гиперболе в точке Мо(жо,2/о), лежащей на ней, выводится так же, как соответствующее уравнение (8) для эллипса. Оно имеет вид ххр _ ууо_ , ., а2 Ъ2 { } Предложение 12. Касательная к гиперболе в точке Мо(хо,уо) есть биссектриса угла между отрезками, соединяющими эту точку с фокусами. Доказательство почти не отличается от доказательства предложе- предложения 5. Рекомендуем читателю полностью провести доказательства этого и остальных утверждений, здесь сформулированных, но не до- доказанных для гиперболы. 3. Парабола. Параболой мы назвали линию, которая в некоторой декартовой прямоугольной системе координат определяется канони- каноническим уравнением у2 = 2рх A5) при условии р > 0. Из уравнения A5) вытекает, что для всех точек параболы х ^ 0. Парабола проходит через начало канонической системы координат. Эта точка называется вершиной параболы. Форма параболы известна из курса средней школы, где она встре- встречается в качестве графика функции у = ах2. Отличие уравнений объ- объясняется тем, что в канонической системе координат по сравнению с прежней оси координат поменялись местами, а коэффициенты связа- связаны равенством 2р = а~1. Фокусом параболы называется точка F с координатами (р/2,0) в канонической системе координат. Директрисой параболы называется прямая с уравнением х = — р/2 в канонической системе координат (PQ на рис. 37).
§2. Эллипс, гипербола и парабола 77 Предложение 13. Расстояние от точки М(х,у), лежащей на параболе, до фокуса равно г = х + Р-. A6) Для доказательства вычислим квадрат расстояния от точки М(х, у) до фокуса по координатам этих точек: г2 = (ж — -р/2J -\-у2 и подставим сюда у2 из канони- канонического уравнения параболы. Мы получаем q Отсюда в силу ж ^ 0 следует равенство A6). Заметим, что расстояние от точки М до ди- директрисы по формуле 9 § 2 гл. II также равно р/2 О р/2 \ Рис. 37. r = d Отсюда вытекает необходимость следующе- следующего условия. Предложение 14. Для того чтобы точ- точка М лежала на параболе, необходимо и достаточно, чтобы она была одинаково удалена от фокуса и от директрисы этой параболы. Докажем достаточность. Пусть точка М(х,у) одинаково удалена от фокуса и от директрисы параболы: Возводя это уравнение в квадрат и приводя в нем подобные чле- члены, мы получаем из него уравнение параболы A5). Это заканчивает доказательство. Параболе приписывается эксцентриситет г = 1. В силу этого со- соглашения формула г верна и для эллипса, и для гиперболы, и для параболы. Выведем уравнение касательной к параболе в точке Мо(жо,2/о), ле- лежащей на ней. Пусть уо ф 0. Через точку Mq проходит график функ- функции у = /(ж), целиком лежащий на параболе. (Это у = у/2рх или же у = = -л/2рх, смотря по знаку у0.) Для функции f(x) выполнено тож- тождество (/(ж)J = 2рх, дифференцируя которое имеем 2f(x)f'(x) = 2р. Подставляя х = хо и /(жо) = Уо, находим f'(xo) = р/уо- Теперь мы можем написать уравнение касательной к параболе У ~Уо = —(х-хо). Уо Упростим его. Для этого раскроем скобки и вспомним, что у% = 2рх0. Теперь уравнение касательной принимает окончательный вид 2/2/о =р(х + х0). A7)
78 Гл. III. Линии и поверхности второго порядка М, Заметим, что для вершины параболы, которую мы исключили, положив уо ф 0, уравнение A7) превращается в уравнение х = 0, т. е. в уравнение касательной в вершине. Поэтому уравнение A7) справед- справедливо для любой точки на параболе. Предложение 15. Касательная к параболе в точке Mq есть биссектриса угла, смежного с углом между отрезком, который соединяет Mq с фокусом, и лу- лучом, выходящим из этой точки в направ- направлении оси параболы (рис. 38). Доказательство Рассмотрим ка- касательную в точке Мо(хо,уо). Из урав- уравнения A7) получаем ее направляющий вектор v(yo,p). Значит, (v,ei) = у0 и = yo/\v\. Вектор FMq имеет компоненты хо — р/2 иуо,а потому (FM0, v) = хоуо - I Уо + РУо = Уо \ Рис. 38 Но |FMq| = хо + р/2. Следовательно, cos(^2 = 2/o/|v|- Это заканчивает доказательство. Заметим, что \FN\ = \FM0\ (см. рис. 38). Упражнения 1. Докажите, что вершины гиперболы и точки пересечения ее асимптот с директрисами лежат на одной окружности. 2. Фокус эллипса (гиперболы или параболы) делит проходящую через него хорду на отрезки длины и и v. Докажите, что сумма 1/и + 1/v посто- постоянна. 3. Выведите уравнение эллипса, гиперболы и параболы в полярной сис- системе координат, приняв за полюс фокус, а за полярную ось — луч, лежащий на оси симметрии и не пересекающий директрису, соответствующую дан- данному фокусу. 4. На плоскости нарисованы эллипс и парабола вместе с их осями сим- симметрии. Как с помощью циркуля и линейки построить их фокусы и ди- директрисы? Тот же вопрос относительно гиперболы, у которой нарисованы асимптоты. (Задача построения осей симметрии и асимптот решается на основании материала § 3.) 5. Пусть и и v — длины двух взаимно перпендикулярных радиусов эллипса. Найдите сумму 1/и2 + 1/v2. 6. Найдите кратчайшее расстояние от параболы у2 = 12ж до прямой х — -у + 7 = 0. 7. Докажите, что отрезок касательной, заключенный между асимпто- асимптотами гиперболы, делится пополам точкой касания. 8. В уравнение касательной к эллипсу (8) в качестве хо и г/о подставлены координаты точки, лежащей не на эллипсе, а вне эллипса. Как расположена получившаяся прямая? 9. Из точки на директрисе проведены две касательные к параболе. До- Докажите, что они взаимно перпендикулярны, и отрезок, соединяющий точки касания, проходит через фокус.
§3. Линия второго порядка, заданная общим уравнением 79 § 3. Линия второго порядка, заданная общим уравнением 1. Пересечение линии второго порядка и прямой. Рассмот- Рассмотрим линию второго порядка, заданную общим уравнением Ах2 + 2Вху + Су2 + 2Dx + 2Еу + F = 0 A) в декартовой системе координат, и исследуем пересечение этой линии с произвольной прямой х = х0 + at, у = уо + fit. B) Значения параметра ?, соответствующие точкам пересечения, долж- должны удовлетворять уравнению, получаемому подстановкой B) в A): А(х0 + atJ + 2В(х0 + at)(y0 + Ct) + С(у0 + CtJ + + 2D(x0 + at) + 2E(y0 +/3t)+F = Q. C) Раскрывая скобки и приводя подобные члены, мы получим уравнение Pt2 + 2Qt + R = 0, D) в котором А2 2 С/32, E) Q = (Ах0 + Яз/о + D)a + (Бжо + СУо + Я)& F) или, при другой группировке слагаемых, Q = (Аа + 5/3)ж0 + Eа + С/%0 + ^« + ^/3. G) Свободный член — это значение многочлена при t = 0, т. е. R = Ах20 + 2Бжо2/о + С?/о + 2^о + 2%0 + F = 0. (8) Вообще говоря, уравнение D) квадратное, имеет не больше двух корней, и прямая пересекает линию или в двух точках, или в одной точке (кратные корни), или не пересекает ее (комплексные корни). Но возможны "исключительные" прямые, для которых Р = 0, т. е. Аа2 + 2Ва/3 + С/32 = 0, (9) и, следовательно, уравнение D) является линейным. В этом случае оно имеет один корень при Q ф 0, а при Q = 0 либо выполнено тож- тождественно (если и R = 0), либо не имеет решений. Следовательно, "исключительные" прямые или пересекают линию в единственной точке, или лежат на ней целиком, или не имеют с ней общих точек. В равенство (9) не входят координаты начальной точки прямой. Кроме того, оно остается справедливым, если умножить а и /3 на общий ненулевой множитель. Определение. Направление, определяемое вектором, компонен- компоненты которого удовлетворяют уравнению (9), называется асимптоти- асимптотическим направлением линии второго порядка.
80 Гл. III. Линии и поверхности второго порядка 2. Тип линии. Выясним, сколько асимптотических направлений может иметь линия второго порядка. Обозначив А В В С сформулируем следующее Предложение 1. Линия второго порядка имеет два асимптоти- асимптотических направления, если S < 0, одно, если S = 0, и ни одного, если S > 0. Доказательство. Рассмотрим несколько случаев. 1) Пусть А = С = 0. Тогда Б/0и($ = -В2 < 0. Уравнение (9) имеет вид 2ВаC = 0, и ему удовлетворяют векторы A,0) и @,1). 2) Пусть С ф 0. Тогда вектор @,1) не является решением этого уравнения, и каждое решение можно задать угловым коэффициен- коэффициентом к = /3/а, удовлетворяющим уравнению Ск2 + 2Вк + А = 0. Дис- Дискриминант этого уравнения равен В2 — АС = —S. Следовательно, оно имеет два вещественных корня при S < 0, один корень при S = 0 и не имеет вещественных корней при S > 0. 3) Случай А ф 0 исследуется аналогично случаю 2, только нужно рассматривать не угловой коэффициент, а отношение а//3. Поскольку разобранные выше случаи исчерпывают все возмож- возможности, предложение доказано. От противного нетрудно проверить, что и обратно число асимпто- асимптотических направлений определяет знак S. Мы определили асимптотические направления при помощи анали- аналитического условия (9). Поэтому в принципе при изменении системы координат асимптотическое направление могло бы перестать быть асимптотическим, или, наоборот, обыкновен- обыкновенное направление стать асимптотическим. Из геометрического смысла асимптотических направлений видно, что в действительности асимптотические направления не зависят от выбора системы координат. v Я \\ Используя канонические уравнения, легко т^ ^ проверить, что эллипс не имеет асимптоти- ческих направлений, парабола имеет одно, а гипербола — два асимптотических направле- Рис- 39 ния (рис. 39). Поэтому линии второго порядка называются линиями гиперболического, параболического или эллипти- эллиптического типа, смотря по тому, имеют они два, одно или не имеют ни одного асимптотического направления. Для линий гиперболического типа S < 0, для параболического ти- типа S = 0, а для эллиптического S > 0. 3. Диаметр линии второго порядка. Назовем хордой любой отрезок, концы которого лежат на линии, а остальные точки на ней
§3. Линия второго порядка, заданная общим уравнением 81 не лежат. Таким образом, хорда не может иметь асимптотического направления. Предположим, что рассматриваемая линия второго порядка име- имеет по крайней мере одну хорду. Это- Этому условию удовлетворяют эллипсы, ги- гиперболы, пары пересекающихся прямых, параболы и пары параллельных прямых. Фиксируем какое-нибудь неасимпто- неасимптотическое направление и исследуем мно- множество середин хорд, имеющих это направление. Если начальная точка Рис 4о Мо(хо,уо) секущей B) находится в сере- середине хорды, то корни уравнения D) равны по абсолютной величине и отличаются знаком (рис. 40). Это будет так в том и только том случае, когда Q = 0. Используя G), мы получаем, что середины хорд направления (а,CJ лежат на прямой (Аа + ВC)х + (В а + СC)у + Da + ЕC = 0. A0) Определение. Прямая A0) называется диаметром линии вто- второго порядка, сопряженным направлению (а,/3). Стоит обратить внимание на то, что диаметром называется вся прямая. Это не означает, что середины хорд заполняют ее целиком. Так может быть, но возможно также, что множество середин хорд есть, например, отрезок или луч. Конечно, остается сомнение, действительно ли уравнение A0) опре- определяет прямую: не окажутся ли в нем коэффициенты при переменных оба равными нулю? Допустим, что это так, т. е. Аа + В E = 0, Ba + Cf3 = 0. Умножим первое из этих равенств на а, второе — на C и сложим. Мы получим равенство (9), которое по предположению не имеет места. Следовательно, уравнение A0) определяет прямую. 4. Центр линии второго порядка. Обозначим левую часть урав- уравнения A) через Ф(х,у) и введем Определение. Точка О(жо?2/о) называется центром линии вто- второго порядка Ф(х,у) = 0, если для любого вектора а(а,/3) выполнено равенство Ф(жо + а, уо + /3) = Ф(жо — а,уо — /3). A1) По-видимому, это определение зависит от выбора системы коорди- координат, так как в нем участвует не линия, а многочлен, стоящий в левой части ее уравнения. Допустим, что координаты (жо,2/о) точки О в не- некоторой системе координат удовлетворяют уравнению A1). Будут ли *) Мы обозначаем направление компонентами ненулевого вектора, имеюще- имеющего это направление. Ясно, что а и [5 интересуют нас с точностью до общего множителя. 6 Д.В. Беклемишев
82 Гл. III. Линии и поверхности второго порядка ее координаты (хо,уо) в другой системе координат удовлетворять ра- равенству того же вида для многочлена Ф(ж, у), задающего ту же линию в новой системе координат? Легко видеть, что это так, потому что многочлен Ф так и выбирается, чтобы для координат любой точки выполнялось равенство Ф(х,у) = Ф(х,у). Нам остается только выпи- выписать это равенство для точек, получаемых из О сдвигом на векторы а и —а. Ниже мы докажем, что в том случае, когда линия содержит хоть одну точку, центры линии и только они являются ее центрами сим- симметрии. Однако понятие центра несколько более общее: линии, яв- являющиеся пустыми множествами, имеют вполне определенные цент- центры, хотя говорить об их центрах симметрии смысла нет. Например, каждая точка прямой у = 0 является центром линии с уравнени- уравнением у2 + 1 = 0. Получим систему уравнений для координат центра. С этой целью напишем подробнее равенство A1). Его левая часть равна А(х0 + аJ + 2В(х0 + а) B/о + /?) + + С(у0 + /ЗJ + 2D(x0 + а) + 2Е(у0 + /3) + F. Правая часть отличается от левой только знаками у а и /3. Поэтому при вычитании Ф(жо — а,уо — C) из Ф(^о Ч- ск, 2/о + C) уничтожаются все члены, кроме тех, в которые а и C входят в первой степени, а члены с первыми степенями удвоятся. После упрощений мы получаем (Ах0 + Ву0 + D)a + (Вх0 + Су0 + Е)C = 0. A2) Но равенство A1), а вместе с ним и равносильное равенство A2) имеет место при любых а и /3, в частности, при а = 1, C = 0 и при а = 0, /3 = 1. Отсюда следует, что координаты (жо,2/о) ЧентРа должны удовлетворять системе уравнений Axo+Byo + D = 0, Легко видеть, что и обратно, если справедливы равенства A3), то, ум- умножая их на произвольные числа а и C и складывая, мы получим A2), а тем самым и A1). Исследуем, обязательно ли существуют центры у линии второго порядка, а если они существуют, то сколько их и как они расположе- расположены. Система уравнений A3) согласно предложению 9 § 2 гл. II имеет единственное решение тогда и только тогда, когда А В 5= В С ф 0. A4) Таким образом, условие 8 ф 0 необходимо и достаточно для того, что- чтобы линия второго порядка имела единственный центр. Линии второго порядка, имеющие единственный центр, называ- называются центральными.
§3. Линия второго порядка, заданная общим уравнением 83 Полученное условие показывает, что центральными являются линии эллиптического и гиперболического типов. Условие 6 = 0 характеризует нецентральные линии. Это — линии параболического типа. При условии 6 = 0 система A3) либо не имеет решения, либо равносильна одному из составляющих ее уравнений (предложение 9 §2 гл. II). Это значит, что нецентральная линия либо не имеет центра (парабола), либо ее центры заполняют прямую ли- линию (пары параллельных прямых, вещественных и мнимых, и пары совпавших прямых). Предложение 2. Если линия второго порядка не является пус- пустым множеством и имеет центр О(жо?2/о)? то он — ее центр сим- симметрии. В самом деле, рассмотрим произвольную точку линии М(х,у) и докажем, что симметричная ей относительно О точка Mi(x\,yi) так- также лежит на линии. Точка Mi определяется равенством ОМ\ = —ОМ. Если (а, C) — координаты вектора ОМ , то х = х0 + а, у = у0 + /3, а х1 = хо — а, у\ = уо — C. Теперь ясно, что в силу A1) из Ф(х,у) = О следует $(xi,yi) = 0. Предложение доказано. Предложение 3. Если линия содержит хотя бы одну точку и имеет центр симметрии О(жо,2/оM то О является центром. Доказательство. Рассмотрим пересечение линии с прямой, проходящей через О, приняв эту точку за начальную точку прямой. Имеются две возможности: 1) Точка О лежит на линии. Пусть прямая имеет неасимптоти- неасимптотическое направление. Тогда О — единственная точка пересечения, так как иначе с учетом симметрии точек пересечения было бы не мень- меньше трех. Следовательно, уравнение D) имеет кратный корень t = О, откуда вытекает Q = 0. Итак, координаты точки О удовлетворяют ра- равенству A2) при любых а и /3, соответствующих неасимптотическим направлениям. Выберем два различных неасимптотических направ- направления (а,/3) и (а',/3') и рассмотрим равенства (Ах0 + Ву0 + D)a + (Вх0 + Су0 + Е)C = О, (Ах0 + Ву0 + D)a' + (Вх0 + Су0 + Е)/3' = О как систему уравнений с коэффициентами а,/3,а',/3', причем (аC' — -а'/З ф 0). Мы получаем равенства A3), как и требовалось. 2) Точка О не лежит на линии. Если прямая пересекает линию в точке М, которой соответствует значение параметра t\ ф 0, то существует симметричная точка пересечения со значением парамет- параметра -?ь Тогда Pt\ + 2Q*i + R = 0 и Pt\ - 2Qtx + R = 0, откуда сле- следует Q = 0. Таким образом, если линия имеет точки пересечения с двумя раз- различными прямыми, проходящими через О, то, как и выше, мы можем получить равенства A3) для координат О. Докажем, что такие пря- прямые обязательно найдутся. Действительно, в противном случае все
84 Гл. III. Линии и поверхности второго порядка точки линии лежат на одной прямой. Согласно теореме 1 § 1 линии только двух классов обладают этим свойством: пары совпавших пря- прямых и пары мнимых пересекающихся прямых. Но и для того, и для другого класса все центры симметрии принадлежат линии, что про- противоречит сделанному предположению. Предложение доказано. 5. Сопряженные направления. Направление (а',/31), определя- определяемое диаметром, сопряженным направлению (а,/3), называется со- сопряженным направлению (а,/?). Компоненты (а',C), направляющего вектора диаметра A0) согласно предложению б § 2 гл. II удовлетво- удовлетворяют условию (Аа + ВC)а' + (В а + СC)C' = 0 A5) или Ааа' + В(а'C + аC') + С CC' = 0. A6) В последнее выражение пары чисел (а,/?) и (а', /3') входят симмет- симметричным образом. Поэтому имеет место Предложение 4. Если направление (а',C'), сопряженное с (а,C), Рис. 41 не является асимптотическим, то сопряженным для (а',C') будет направление (а,/3) (рис. 41). Возникает вопрос, при каких условиях направление, сопряжен- сопряженное какому-нибудь направлению (а, C) может оказаться асимптоти- асимптотическим. Это легко выяснить. Из равенства A5) следует, что в ка- качестве а' и /3' можно выбрать соответственно — (Ва + СC) и (Аа + + ВC). Подставим это в уравнение (9) для асимптотических нап- направлений: А(Ва + CCf - 2В(Ва + СC)(Аа + ВC) + + С(Аа + ВCJ =0. После преобразований получаем (АС — В2) х х(Аа2 + 2ВаC + С/32) = 0. Поскольку исходное направление не асимптотическое, это произведе- произведение может обратиться в нуль только за счет пер- первого сомножителя. Мы получаем Предложение 5. Если линия не централъ- ная ^ = ^)' гпо ^ля лю^ого направления (а,C) сопряженное направление — асимптотическое параболы (рис. 42). Если линия центральная (S ф 0), то Рис ные
§3. Линия второго порядка, заданная общим уравнением 85 направление, сопряженное любому направлению, не асимптоти- асимптотическое. 6. Главные направления. Если диаметр перпендикулярен хор- хордам, которым он сопряжен, то он является осью симметрии рассмат- рассматриваемой линии. Введем следующее Определение. Направление (а,/3) и направление (а',/3') сопря- сопряженного ему диаметра называются главными направлениями, если они перпендикулярны. Если система координат декартова прямоугольная, то для глав- главного направления компоненты (а, C) должны быть пропорциональ- пропорциональны коэффициентам уравнения A0), т. е. должно существовать такое ЧИСЛО А, ЧТО . ъп л т-> лп л п /i~\ Аа + ВC = Ха, Ва + С{3 = Xf3. A7) Исключая А, мы получаем уравнение для а и /3: (А - С)аC + В(/32 - а2) = 0. A8) Если положить а = costp, /3 = sin у?, то уравнение A8) превратит- превратится в уравнение B) § 1, которое, как мы видели, обязательно имеет решение относительно (р. Поэтому имеет место Предложение 6. Каждая линия второго порядка имеет хотя бы одну пару главных направлений. Более подробное исследование уравнения A8) показывает, что ли- либо эта пара единственная, либо каждая пара перпендикулярных на- направлений является главной. Последний случай имеет место, ког- когда А = С, В = 0. При этом уравнение линии приводится к одному из канонических видов: х2 + у2 = а2, х2 + у2 = —а2 или х2 + у2 = 0. В двух последних случаях линия не имеет хорд, и результат лишен геометрического смысла. 7. Касательная к линии второго порядка. Как известно, ка- касательной к какой-либо линии называется предельное положение се- секущей, когда хорда стягивается в точку. Выведем уравнение каса- касательной к линии второго порядка, заданной уравнением A). Дадим предварительно следующее Определение. Особой точкой линии второго порядка называ- называется ее центр, который лежит на линии. Особыми точками являются: точка пересечения пары пересекаю- пересекающихся прямых, единственная точка пары мнимых пересекающихся прямых и каждая точка пары совпавших прямых. В особой точке ка- касательная не определена. Если точка лежит на прямой, входящей в состав линии, то касательная в этой точке совпадает с прямой. Ис- Исключив эти случаи, мы фактически ограничиваемся рассмотрением касательных к эллипсам, гиперболам и параболам. Рассмотрим точку Мо(хо,уо), лежащую на линии L, и прямую с начальной точкой Mq, заданную уравнением B). С нашей точки зре- зрения, приведенное выше определение касательной означает, что урав-
86 Гл. III. Линии и поверхности второго порядка нение D), определяющее точки пересечения L и прямой, имеет два совпадающих корня. Так как начальная точка принадлежит L, в уравнении D) R = О, и один из его корней равен нулю. Корни совпадают, если и второй ко- корень равен нулю, для чего необходимо, чтобы Q = 0. Если при этом окажется, что и Р = 0, то прямая принадлежит линии второго поряд- порядка. Этот случай мы исключили, и потому уравнение имеет кратный корень t = 0 в том и только том случае, когда Q = 0. Мы рассмат- рассматриваем равенство Q = 0 как условие, определяющее направляющий вектор касательной: (Ах0 + Ву0 + D)a + (Вх0 + Су0 + Е)C = 0. A9) Так как Mq не особая точка, обе скобки здесь одновременно в нуль не обращаются, и условие A9) определяет а и C с точностью до общего множителя. Точка М(х,у) лежит на касательной тогда и только тогда, когда вектор М0М коллинеарен а(а,/3), т. е. его коор- координаты х — хо и у — уо удовлетворяют тому же условию, что и (а, C): (Ах0 + Ву0 + D)(x- х0) + (Вх0 + Су0 + Е)(у - у0) = 0. B0) Это и есть уравнение касательной к линии L в точке Mq, лежащей на линии. Уравнение B0) можно записать и иначе, если заметить, что координаты Mq удовлетворяют уравнению A) и, следовательно, (Ах0 + Ву0 + D)x0 + (Вх0 + Су0 + Е)у0 + ?>ж0 + Eyo + F = 0. Прибавляя это равенство к B0) и группируя слагаемые, получим окончательное уравнение Ахх0 + В(ху0 + хоу) + С2/2/о + D(x + ж0) + Я(з/ + Уо) + F = 0. B1) 8. Особые точки. Напомним, что особая точка линии второго порядка — это ее центр, лежащий на линии. Исследуем, при каких условиях линия второго порядка имеет особую точку. Для коорди- координат (жо,2/о) ос°бой точки должны быть справедливы равенства Ах0 +Byo + D = 0, Вхо + СУо + Е = 0, Ах\ + 2Бжо2/о + Cyl + 2?>ж0 + 2Еу0 + F = 0. Умножим первое из них на ж0, второе на у0 и вычтем из третьего. Мы получим эквивалентную систему уравнений Ах0 + Ву0 + D = 0, Вх0 + С^/о + Е = 0, B2) ?>ж0 + Яг/о + F = 0. Выберем какой-нибудь базис в пространстве и рассмотрим вспомога- вспомогательные векторы p(A,B,D), q(B,C,E) и r(D,E,F). Равенства B2) представляют собой координатную запись векторного равенства + УоЧ = -г. B3)
§3. Линия второго порядка, заданная общим уравнением 87 Отсюда следует, что при наличии особой точки векторы р, q и г компланарны, и потому А В D А = ВСЕ D E F = 0. B4) Если линия центральная, то векторы р и q не коллинеарны, и условие компланарности B4) равносильно существованию разложе- разложения B3), т. е. существованию решения системы B2). Мы получили Предложение 7. Центральная линия имеет особую точку тог- тогда и только тогда, когда А = 0. Итак, сочетание S < 0, А = 0 характеризует пары пересекающих- пересекающихся прямых, а й > 0, А = 0 — пары мнимых пересекающихся прямых. Рассмотрим нецентральные линии. Для них существует центр, хотя бы не являющийся особой точкой, тогда и только тогда, ког- когда А = 0. В этом (и только этом) случае векторы р и q коллинеар- коллинеарны. Действительно, так как S = 0, по предложению 9 § 2 гл. II, если система уравнений A3) имеет решение, она равносильна одному из составляющих ее уравнений: либо коэффициенты и свободный член одного из уравнений равны нулю, либо коэффициенты и свободные члены обоих уравнений пропорциональны. Тогда А = 0 независимо от г. Обратно, пусть для нецентральной линии А = 0. Докажем, что р и q коллинеарны, что равносильно совместности уравнений цент- центра. Действительно, в противном случае г по ним раскладывается, и согласно B3) существует особая точка. Она — центр, р и q коллине- коллинеарны, и мы получаем противоречие. Предложение 8. Для нецентральных линий условие А = 0 рав- равносильно существованию центра. Итак, сочетание S = А = 0 характеризует пары параллельных пря- прямых (вещественных, мнимых или совпавших). Из предложений 7 и 8 следует, что равенство А = 0 является инва- инвариантным: оно не может измениться при переходе к другой системе координат. Упражнения 1. Линия второго порядка описана около параллелограмма, если его вер- вершины лежат на линии, а остальные точки на ней не лежат. Докажите, что такая линия обязательно центральная, и центр ее совпадает с центром па- параллелограмма. 2. На плоскости нарисованы эллипс, гипербола и парабола. Как с по- помощью циркуля и линейки построить их оси симметрии и асимптоты гиперболы? 3. Докажите, что сумма квадратов длин хорд, лежащих на сопряженных диаметрах эллипса, постоянна. 4. Не приводя уравнение к каноническому виду, найдите центр и асимп- асимптоты гиперболы Зх + Юху + Зу2 — 2х + 2у — 9 = 0.
Гл. III. Линии и поверхности второго порядка 5. Не приводя уравнение к каноническому виду, укажите класс линии Зх2 + Юху + Зу2 - 2х + Чу - 1 = 0. 6. Как разложить на множители левую часть уравнения из упр. 5? 7. Напишите уравнение касательной к линии х2 — 2ху + Зу2 = 3 в точ- точке М0@,1). Рис. 43 § 4. Поверхности второго порядка Подобно тому как в §2 были описаны все наиболее интересные ли- линии второго порядка, в настоящем параграфе мы опишем важнейшие поверхности второго порядка, а полную классификацию таких по- поверхностей отложим до гл. VIII. Составить себе общее представление о большинстве поверхностей второго поряд- порядка можно, рассматривая поверхности вра- вращения линий второго порядка вокруг их осей симметрии. 1. Поверхности вращения. Поверх- Поверхность S называется поверхностью вращения с осью d, если она составлена из окруж- окружностей, которые имеют центры на пря- прямой d и лежат в плоскостях, перпендику- перпендикулярных данной прямой. В основе этого определения лежит следующее представ- представление. Рассмотрим линию L, которая ле- лежит в плоскости Р, проходящей через ось вращения d (рис. 43), и будем вращать ее вокруг этой оси. Каждая точка линии опишет окруж- окружность, а вся линия — поверхность вращения. Выберем начало декартовой прямоугольной системы коорди- координат O,ei,e2,e3 на оси d, вектор е3 направим вдоль d, а вектор ei поместим в плоскости Р. Таким образом, О,в1,ез — декартова сис- система координат в плоскости Р. Пусть линия L имеет в этой системе координат уравнение f(x,z) = 0. Рассмотрим точку M(x,y,z). Через нее проходит окружность, ко- которая имеет центр на оси d и лежит в плоскости, перпендикуляр- перпендикулярной этой оси. Радиус окружности равен расстоянию от М до оси, т. е. у^х2 + у2. Точка М лежит на поверхности вращения тогда и только тогда, когда на указанной окружности имеется точка Mi, при- принадлежащая вращаемой линии L. Точка Mi(xi,yi,zi) лежит в плоскости Р, и потому у\ = 0. Кроме того, z\ = z и \х\\ = \j'х2 + у2, так как Mi лежит на той же окруж- окружности, что и М. Координаты точки Mi удовлетворяют уравнению линии L: f(xi,zi) = 0. Подставляя в это уравнение х\ и z\, мы по- получаем условие на координаты точки М, необходимое и достаточное
§4- Поверхности второго порядка для того, чтобы М лежала на поверхности вращения S: равенство 0 A) должно быть выполнено хотя бы при одном из двух знаков перед кор- корнем. Это условие, которое можно записать также в виде /(л/^Т^^)/(-л/^Т^^)=0, B) и является уравнением поверхности вращения линии L вокруг оси d. 2. Эллипсоид. Рассмотрим поверхности, которые получаются при вращении эллипса вокруг его осей симметрии. Направив век- а б Рис. 44. Сжатый (а) и вытянутый (б) эллипсоиды вращения тор е3 сначала вдоль малой оси эллипса, а затем вдоль большой оси, мы получим уравнения эллипса в следующих видах: az cz az cz (Здесь через с обозначена малая полуось эллипса.) В силу форму- формулы A) уравнениями соответствующих поверхностей вращения будут v>2 i „,2 J2 2 2,2 ' -< ¦? ^. X ~\ У -| / ^ \ /о\ у Поверхности с такими уравнениями называются соответственно сжатым и вытянутым эллипсоидами вращения (рис. 44). Каждую точку М(ж, у, z) на сжатом эллипсоиде вращения сдвинем к плоскости у = 0 так, чтобы расстояние от точки до этой плоскости уменьшилось в |ез постоянном для всех точек отношении Л < < 1. После сдвига точка попадет в положе- положение М'(х',у', z'), где х' = ж, у' = Ху, z' = z. Таким образом, точки эллипсоида вращения переходят в точки поверхности с уравнением :'__^Ni /2 — а2 /2 — С2 D) Рис. 45 где Ъ = Ха. Поверхность, которая в некоторой декартовой системе ко- координат имеет уравнение D), называется эллипсоидом (рис. 45). Если
90 Гл. III. Линии и поверхности второго порядка случайно окажется, что Ъ = с, мы получим снова эллипсоид вращения, но уже вытянутый. Эллипсоид так же, как и эллипсоид вращения, из которого он полу- получен, представляет собой замкнутую ограниченную поверхность. Из уравнения D) видно, что начало канонической системы координат — центр симметрии эллипсоида, а координатные плоскости — его плос- плоскости симметрии. Эллипсоид можно получить из сферы х2 + у2 + z2 = а2 сжатиями к плоскостям у = 0и2; = 0в отношениях Л = Ь/а и \i — с/а. В этом параграфе нам часто придется прибегать к сжатию, и мы не будем его каждый раз описывать столь подробно. 3. Конус второго порядка. Рассмотрим на плоскости Р пару пересекающихся прямых, задаваемую в системе ко- координат О, < уравнением а2х2 — c2z2 = 0. Поверх- Поверхность, получаемая вращением этой линии вокруг оси аппликат, имеет уравнение a2(x2+y2)-c2z2 = 0 E) и носит название прямого кругового конуса (рис. 46). Сжатие к плоскости у = 0 переводит прямой круговой конус в поверхность с уравнением а2х2 + Ъ2у2 - c2z2 = 0, F) называемую конусом второго порядка. Обратите внимание на то, что левая часть урав- уравнения F) — однородная функция, и поверхность 1 гл. П. Рис. 46 является конусом в смысле определения, введенного в 4. Однополостный гиперболоид. Однополостный гиперболоид вращения — это поверхность вращения ги- гиперболы 2 2 х z _ 9 9 а2 с2 вокруг той оси, которая ее не пересекает. По формуле A) мы получаем уравнение этой по- поверхности (рис. 47) х2 + у2 z2 -^~г = 1- G) В результате сжатия однополостного ги- Рис- 47 перболоида вращения к плоскости у = 0 мы получаем однополостный гиперболоид с уравнением Интересное свойство однополостного гиперболоида — наличие у него прямолинейных образующих. Так называются прямые линии, все-
§4- Поверхности второго порядка 91 ми своими точками лежащие на поверхности. Через каждую точку однополостного гиперболоида проходят две прямолинейные образую- образующие, уравнения которых можно получить следующим образом. Уравнение (8) можно переписать в виде Рассмотрим прямую линию с уравнениями где Аи/i — некоторые числа (Л2 + ц2 ф 0). Координаты каждой точки прямой удовлетворяют обоим уравнениям, а следовательно, и уравне- уравнению (8), которое получается их почленным перемножением. Поэтому каковы бы ни были А и /i, прямая с уравнениями (9) лежит на од- нополостном гиперболоиде. Таким образом, система (9) определяет семейство прямолинейных образующих. Второе семейство прямолинейных образующих определяется сис- системой С/ Ч OJ ,щ Покажем на примере, как найти образующие, проходящие через данную точку поверхности. Рассмотрим поверхность х2 + у2 - z2 = = 1 и точку MqA,1,1) на ней. Подставляя координаты Mq в урав- уравнения (9), мы получаем условия на Л и /а: 2Л = 2\i и 0 • Л = 0 • \i. Первое из них определяет Аи/ic точностью до общего множителя, но только с такой точностью они и нужны. Подставляя эти значе- значения в (9), получаем уравнения прямолинейной образующей х + z — 1 + у, х — z — \ — у. Она проходит через Мо, так как Аи/i так и выбирались, чтобы ко- координаты Мо удовлетворяли этой системе. Аналогично, подставляя координаты Мо в A0), находим условия на А' и //: 2// = 0 и 2// = 0. Коэффициент А' можно взять любым ненулевым, и мы приходим к уравнению второй образующей: х — z, у — 1. Если вместе с гиперболой мы будем вращать ее асимптоты, то они опишут прямой круговой конус, называемый асимптотическим конусом гиперболоида вращения. При сжатии гиперболоида вращения его асимптотический конус сжимается в асимптотический конус об- общего однополостного гиперболоида. 5. Двуполостный гиперболоид. Двуполостный гиперболоид вра- вращения — это поверхность, получаемая вращением гиперболы у2 г2 — - — = 1 9 9 с2 а2
92 Гл. III. Линии и поверхности второго порядка вокруг той оси, которая ее пересекает. По формуле A) мы получаем уравнение двуполостного гиперболоида вращения 2 у _ 1. В результате сжатия этой поверхности к плоскос- плоскости у = 0 получается поверхность с уравнением A2) — - ?_ _ 1L = 1 2 2 Ъ2 & а- Ъ2 Поверхность, которая в некоторой декартовой прямоугольной системе координат имеет уравнение вида A2), называется двуполостным гиперболоидом (рис. 48). Двум ветвям гиперболы здесь соответству- Рис. 48 ют Две не связанные между собой части ("полости") поверхности, в то время как при построении одно- полостного гиперболоида вращения каждая ветвь гиперболы описы- описывала всю поверхность. Асимптотический конус двуполостного гиперболоида определяет- определяется так же, как и для однополостного. 6. Эллиптический параболоид. Вращая параболу х2 = 2pz во- вокруг ее оси симметрии, мы получаем поверхность с уравнением х2 + у2 = 2pz. A3) Она называется параболоидом вращения. Сжатие к плоскости у = 0 переводит параболоид вращения в по- поверхность, уравнение которой приводится к виду 4 + i = **¦ A4) а2 Ъ2 Поверхность, которая имеет такое уравнение в Рис. 49 некоторой декартовой прямоугольной системе коор- координат, называется эллиптическим параболоидом (рис. 49). 7. Гиперболический параболоид. По аналогии с уравнени- уравнением A4) мы можем написать уравнение х2 ± 9 а2 _ 79 Ъ2 A5) Поверхность, которая имеет уравнение вида A5) в некоторой де- декартовой прямоугольной системе координат, называется гиперболи- гиперболическим параболоидом. Исследуем форму этой поверхности. Для этого рассмотрим ее сече- сечение плоскостью х = а при произвольном а. В этой плоскости выберем декартову прямоугольную систему координат О/,в2,ез с началом в точке О'(а, 0,0). Относительно этой системы координат линия пере-
§4- Поверхности второго порядка 93 сечения имеет уравнение A6) Эта линия — парабола, в чем легко убедиться, перенеся начало ко- координат в точку О" с координатами @, а2/{2а2)). (Координаты этой точки относительно исходной системы координат O,ei,e2,e3 в пространстве равны (а, 0, а2/Bа2)).) Точка О", очевидно, является вершиной параболы, ось параболы параллельна вектору ез, а знак минус в левой части равенства A6) означает, что ветви параболы направлены в сторону, противополож- противоположную направлению ез. Заметим, что после переноса начала координат в точку О" величина а не входит в уравнение параболы, и, следо- следовательно, сечения гиперболического параболоида плоскостями х = а при всех а представляют собой равные параболы. Будем теперь менять величину а и проследим за перемещением вершины параболы О" в зависимости от а. Из приведенных выше ко- координат точки О" следует, что эта точка перемещается по линии с уравнениями 2 х в системе координат О,е1,в2,ез. Эта линия — парабола в плоскос- плоскости у = 0. Вершина параболы находится в начале координат, ось сим- симметрии совпадает с осью аппликат, а ветви параболы направлены в ту же сторону, что и вектор ез. Теперь мы можем построить ги- гиперболический параболоид следую- следующим образом: зададим две парабо- параболы и будем перемещать одну из них так, чтобы ее вершина сколь- скользила по другой, оси парабол были параллельны, параболы лежали во взаимно перпендикулярных плос- плоскостях и ветви их были направ- направлены в противоположные стороны. При таком перемещении подвиж- подвижная парабола описывает гипербо- гиперболический параболоид (рис. 50). Рис. 50. ОВ — неподвижная пара- парабола, KLM, NOP и QRS — разные положения подвижной параболы Предоставим читателю проверить, что сечения гиперболичес- гиперболического параболоида плоскостями с уравнениями z = а при всевоз- всевозможных а — гиперболы. Эти сечения нарисованы на рис. 51. Гиперболический параболоид, как и однополостный гиперболоид, имеет два семейства прямолинейных образующих (рис. 52). Уравне- Уравнения одного семейства — *(!-!)=*
94 Гл. III. Линии и поверхности второго порядка Рис. 51 Рис. 52 а другого — Выводятся эти уравнения так же, как и уравнения прямолиней- прямолинейных образующих однополостного гиперболоида. Упражнения 1. Докажите, что линия пересечения поверхности второго порядка с плоскостью, которая целиком на ней не лежит, есть алгебраическая линия не выше второго порядка. Сколько общих точек могут иметь прямая и поверхность второго порядка? 2. Найдите уравнение и определите вид поверхности, получаемой вра- вращением вокруг оси аппликат прямой линии: a) x = l+t,y = 3 + t, z = 3 + t; 6)x = l+t,y = l+t, z = 3 + t. 3. Докажите, что прямолинейные образующие гиперболического пара- параболоида, принадлежащие одному семейству, все параллельны какой-то од- одной плоскости. 4. На гиперболическом параболоиде с уравнением A5) лежат парабо- параболы у = 0, х2 = 2a2z и х = 0, у2 = —2b2z. Пусть точки А\ и В\ на первой параболе и точки А^ и В^ на второй все находятся на одинаковом расстоя- расстоянии от плоскости z = 0. Докажите, что прямые A\B<i, A\A<i, B\A<i и B\B<i являются прямолинейными образующими. 5. Найдите проекцию линии пересечения двуполостного гиперболоида —х2 + у2 — z2 = 1 и конуса Ъх2 — Зу + 4z2 = 0 на плоскость z = 0. 6. Докажите, что никакая плоскость не пересекает эллиптический па- параболоид по гиперболе.
ГЛАВА IV ПРЕОБРАЗОВАНИЯ ПЛОСКОСТИ § 1. Отображения и преобразования 1. Определение. Под отображением плоскости Р в плоскость R понимают закон или правило, по которому каждой точке плоскости Р сопоставлена некоторая определенная точка на плоскости R. Мы бу- будем пользоваться обозначением f: Р —>¦ R. Если потребуется указать, что точке А на плоскости Р соответствует точка В на плоскости R, мы будем писать В = f(A). В этом случае точка В называется образом точки А, а точка А — прообразом точки В. Подчеркнем, что совсем не обязательно каждая точка плоскос- плоскости R является образом какой-либо точки. Вполне может оказаться, что множество всех образов не совпадает с R. Если для некоторого отображения плоскости Р и R совпадают, то такое отображение называется преобразованием плоскости. Этот вид отображений целесообразно выделить, так как преобразования обла- обладают некоторыми свойствами, которыми не обладают отображения в общем случае. Разумеется, можно говорить об отображениях произвольных мно- множеств, а не обязательно плоскостей, но в этой главе, за исключением некоторых примеров, мы будем заниматься только отображениями плоскостей. 2. Примеры. Пример 1. Рассмотрим в пространстве две плоскости Р и R и сопоставим каждой точке плоскости Р основание перпендикуля- перпендикуляра, опущенного из этой точки на плоскость R. Так будет определено отображение, называемое ортогональным проектированием. При ор- ортогональном проектировании, вообще говоря, каждая точка плоскос- плоскости R имеет единственный прообраз. В одном случае ортогональное проектирование резко меняет свои свойства. Именно, если плоскости взаимно перпендикулярны, то не каждая точка в R имеет прообраз, а только точки, лежащие на линии пересечения плоскостей. Зато у каждой из этих точек бесконечно много прообразов: они заполняют перпендикуляр к R, восстановленный из нее. Пример 2. Преобразованиями являются известные читателю па- параллельный перенос, поворот, осевая симметрия и гомотетия. Пример 3. Рассмотрим прямую р и зададим число Л > 0. Из про- произвольной точки М плоскости опустим перпендикуляр на прямую р
( M2=f(M2) ,f(M) 96 Гл. IV. Преобразования плоскости и обозначим его основание через N. Образ f (М) точки М определим соотношением JVf (M) = XNM. Если точ- точка М принадлежит р, то положим f (M) = = М (рис. 53). Так построенное преобра- преобразование f называется сжатием к прямой р в отношении Л. (Если уточнено, что Л > 1, преобразование можно называть растя- N Ьл.ч жением.) Мы уже пользовались сжатием к пря- прямой в § 2 гл. III, когда изучали фор- форму эллипса. Аналогичное преобразование пространства — сжатие к плоскости — применялось в § 4 гл. III для описания формы поверхностей второго порядка. Пример 4. Выберем на каждой из плоскостей Р и R декартову прямоугольную систему координат и сопоставим точке с координата- координатами х и у на плоскости Р точку с координатами ж* = х2 — у2 и у* = 2ху на плоскости R. Нетрудно убедиться, решая эти уравнения относи- относительно х и у, что каждая точка плоскости R имеет два прообраза, за исключением начала координат, которое имеет один прообраз. Пример 5. Зададим точку О на плоскости Р и сопоставим каж- каждой точке, отличной от О, такую точку f(M), что OffM) = агсЧ^' ОМ. \ом\ Положим f (О) = О. При этом каждой точке плоскости сопоставляется единственная точка внутри круга радиуса тг/2 с центром в точке О. Каждая точка, лежащая внутри круга, имеет единственный прообраз, а точки, не лежащие внутри круга, не имеют прообразов. Пример 6. Можно сопоставить каждой точке плоскости основа- основание перпендикуляра, опущенного из этой точки на прямую р, а каж- каждой точке на р — саму эту точку. При этом каждой точке любой прямой, перпендикулярной р, сопоставляется одна и та же точка. Пример 7. Можно сопоставить каждой точке на плоскости Р одну и ту же точку на плоскости R. Пример 8. Тождественным преобразованием плоскости Р назы- называется преобразование, сопоставляющее каждой точке плоскости эту же точку. 3. Произведение отображений. Результат последовательного выполнения двух отображений называется их произведением или ком- композицией. Точнее, вводится следующее Определение. Пусть даны отображения f: Рч Л и g: R —)> —> S. Отображение h, сопоставляющее точке А на плоскости Р точ- точку g(f(A)) на плоскости 5, называют произведением отображения f
§1. Отображения и преобразования 97 на отображение g и обозначают gf. Отображение, которое делается первым, пишется справа. Подчеркнем, что для того, чтобы существовало произведение двух отображений, нужно, чтобы плоскость, в которую отображает первое из них, совпадала с плоскостью, которая отображается при втором. Для двух преобразований одной плоскости это условие выполнено. Разумеется, произведение отображений зависит от порядка со- сомножителей, т. е. gf не совпадает с fg. Оба произведения определены только тогда, когда f: P ^ Л, a g : R ->• Р. При этом gf — преоб- преобразование плоскости Р, a fg — преобразование плоскости R. Зависит от порядка сомножителей и произведение преобразований, хотя оба произведения являются преобразования- преобразованиями той же плоскости. Действительно, пусть f — параллель- параллельный перенос плоскости на вектор a, a g — гомотетия с центром в точке О. Из рис. 54 видно, что f(g(A)) отлично от g(f(A)). Рис- 54 Рассмотрим свойства умножения для преобразований плоскости. Эти свойства с соответствующими изменениями могут быть перене- перенесены на отображения, но мы займемся только преобразованиями. Умножение преобразований ассоциативно. Это значит, что для лю- любых трех преобразований f, g и h выполняется равенство Действительно, для любой точки А преобразование fg переводит точку Ь(А) в точку f(g(h(A))), а преобразование f переводит точ- точку g(h(A)) в ту же точку f(g(h(A))). Если мы обозначим через е тождественное преобразование плос- плоскости, то для любого преобразования f выполнено fe = ef = f. Таким образом, тождественное преобразование играет ту же роль по отношению к умножению преобразований, как число 1 по отношению к умножению чисел. По определению при любом отображении f: Р —>¦ R каждая точка плоскости Р имеет только один образ. Примеры 4 и б показывают, что точка плоскости R может иметь много прообразов, а в примерах 5, б и 7 не каждая точка плоскости R имеет прообраз, т. е. служит образом какой-либо точки. Определение. Отображение f:P^R называется взаимно одно- однозначным, если каждая точка плоскости R имеет прообраз, и притом только один. Разумеется, это определение распространяется на преобразова- преобразования. Отображения, рассмотренные в примерах 2 и 3, взаимно одно- однозначны, а в примерах 4-7 — нет. 7 Д.В. Беклемишев
98 Гл. IV. Преобразования плоскости Пусть дано преобразование f плоскости Р. Каждой точке А из Р оно сопоставляет ее образ f(A). Теперь попробуем, наоборот, точ- точке f(A) сопоставить точку А. Такое соответствие удовлетворяет опре- определению преобразования в том и только том случае, когда каждая точка плоскости является образом некоторой точки, и притом только одной. Это равносильно взаимной однозначности f. Определение. Обратным преобразованием для взаимно одно- однозначного преобразования f плоскости Р мы назовем такое преобра- преобразование f~ , что f~1(f(A)) = А для каждой точки А плоскости Р. Очевидно, что определение обратного преобразования равносильно соотношению f-1f = е, где е — тождественное преобразование. Совпадающие точки должны иметь совпадающие образы, поэто- поэтому f(f~1(f(A))) = f(A) или f(f~1E)) = В для любой точки В на плос- плоскости. Это может быть записано как f = e. Отсюда, в частности, следует, что преобразование f имеет обратное (и потому взаимно однозначно), и этим обратным является f. Предложение 1. Пусть преобразования fug плоскости Р вза- взаимно однозначны. Тогда их произведение fg взаимно однозначно, Действительно, по условию существуют f 1 и g 1. Поэтому опре- определено произведение (fg)(g~1f~1). В силу ассоциативности умноже- умножения преобразований его можно записать как f(gg~1)f~1. По опреде- определению обратного преобразования это равно fef = ff = e. Этим доказано, что fg имеет обратное преобразование нужного вида. Но существование обратного преобразования для преобразования fg рав- равносильно его взаимной однозначности. Предложение доказано. 4. Координатная запись отображений. Пусть нам задано не- некоторое отображение f: Р —> R. По определению это означает, что задан закон, по которому каждой точке А на плоскости Р сопостав- сопоставлен ее образ А* = f(A) на плоскости R. Если мы выберем на плос- плоскости Р систему координат O,ei,e2, а на плоскости R систему ко- координат Q,Pi,P2, то точка А будет определена парой чисел (х,у), а точка А* — парой чисел (х*,у*). Следовательно, при выбранных сис- системах координат на плоскостях Р и R отображение сопоставляет паре чисел (ж,у) пару чисел (х*,у*). Таким образом, задать отображение при выбранных системах координат все равно, что задать две функ- функции, каждая из которых зависит от двух независимых переменных: x*=ip(x,y), у*=гр(х,у). A) Координатной записью мы пользовались в примере 4. Подчеркнем, что системы координат на плоскостях Р и R никак не связаны между собой: точка Q может не совпадать с образом точки О, а векторы рь р2 с образами векторов еье2. При координатной записи преобразования достаточно выбрать од- одну систему координат, так как и точка, и ее образ находятся на одной
§2. Линейные преобразования 99 плоскости. Обратно, рассмотрим две функции, зависящие от двух независи- независимых переменных каждая. Если они определены для любых пар чисел, то по формулам A) при выбранных системах координат на плоскос- плоскостях Р и R они определяют отображение Р в R. Упражнения 1. Нарисуйте три крестика и четыре нолика. а) Как должны идти стрелки от крестиков к ноликам, чтобы получилось отображение множества крестиков в множество ноликов? б) Можно ли провести стрелки так, чтобы каждый образ имел единст- единственный прообраз? в) Можно ли провести их так, чтобы каждый нолик имел прообраз? г) Ответьте на те же вопросы, если крестиков четыре, а ноликов три. д) При каком числе ноликов возможно взаимно однозначное отображе- отображение множества из трех крестиков? 2. Пусть преобразования f, g и h имеют обратные. Найдите преобразо- преобразование, обратное к их произведению fgh. 3. Напишите формулы, задающие осевую симметрию относительно пря- прямой, имеющей уравнение х + у = 5 в декартовой прямоугольной системе координат. § 2. Линейные преобразования 1. Ортогональные преобразования. Так называются преобра- преобразования плоскости, которые не меняют расстояния между любыми двумя точками, т. е. преобразования f ортогональное, если для лю- любых точек А и В выполнено \АВ\ = |f(A)f(??)|. Основными приме- примерами ортогональных преобразований служат параллельный перенос, поворот и осевая симметрия. Получим координатную запись ор- щ м ^2^ тогонального преобразования в декар- ^ ° ^^м* товой прямоугольной системе коорди- координат O,ei,e2. Обозначим через А и В концы базисных векторов: ei = ОА, е2 = О В (рис. 55). При ортогональном преобразовании равнобедренный прямо- Рис 55 угольный треугольник ОАВ перейдет в равный ему треугольник О*А*?Г. Рассмотрим произвольную точ- точку М(х,у). Она перейдет в точку М* с координатами (х*,у*). Нам надо выразить (х*,у*) через (х,у). По определению координат ОМ = хОА + уОВ. Отсюда следует, что (ГМ* = жО*1* + уб*В*. Действительно, векторы 0*1* и 0*Б* взаимно перпендикулярны и по длине равны 1, а потому компоненты 0*М* по этим векторам равны его скалярным проекциям на них. Эти
100 Гл. IV. Преобразования плоскости проекции равны проекциям ОМ на ei,e2, что видно из равенства соответствующих треугольников. Теперь мы можем написать ОМ* = (ХГ + б*~М* = 66* + хб*~А* + уб*~В*. A) Обозначим через ip угол между О* А* и ei. Поскольку |О*А*| = 1, координаты этого вектора в базисе еь е2 равны (cos (р, sin ф). Тог- Тогда перпендикулярный вектор единичной длины О*В* имеет коорди- координаты (=р simp, ± cosy?), причем верхние знаки берутся в том случае, когда пара векторов О*А* и О*В* ориентирована так же, как ei,e2. Координаты точки О* обозначим через (ci,c2). Теперь мы можем разложить все члены равенства A) по базису: х* = х cos if =F У sin ip + c\, ,~\ y* = xsincp ± у cos ip + C2. ^ ' Итак, доказано Предложение 1. Произвольное ортогональное преобразование в декартовой прямоугольной системе координат записывается форму- формулами B), где (р — угол, на который поворачивается первый базисный вектор, а с\ и с^ — координаты образа начала координат. При этом выбираются верхние знаки, если образы базисных векторов ориенти- ориентированы так же, как и сами эти векторы, и нижние знаки в противо- противоположном случае. Пример 1. Параллельный перенос на вектор с сопоставляет точ- точке М с координатами (ж, у) в некоторой декартовой системе коорди- координат точку М* с координатами х* =ж + сь у* = у + с2, где ci и С2 — координаты с. Пример 2. Напишем уравнения поворота плоскости на угол у? вокруг некоторой точки, приняв эту точку за начало декартовой прямоугольной системы координат. В этом случае О = О* и, следо- следовательно, с\ — С2 = 0. Должны быть выбраны верхние знаки. Итак, х* — х cos ip — у sin Lp, у* = х sin ср + у cos ср. Пример 3. Рассмотрим осевую симметрию относительно неко- некоторой прямой. Примем ось симметрии за ось абсцисс декартовой пря- прямоугольной системы координат. Тогда точка М(х, у) переходит в точ- точку М* с координатами х* = х, у* = -у. Здесь с1=с2 = 0и(р = 0 при нижних знаках в формулах B). 2. Определение линейных преобразований. Основным объ- объектом для нас будет более широкий класс преобразований, включаю- включающий в себя ортогональные преобразования. Определение. Преобразование f плоскости Р называется ли- линейным, если на Р существует такая декартова система координат, в
§2. Линейные преобразования 101 которой f может быть записано формулами ж* = Ь Взаимно однозначное линейное преобразование называется аффин- аффинным преобразованием. Подчеркнем, что в определении линейного преобразования, вовсе не требуется, чтобы коэффициенты в формулах C) не обращались в нуль одновременно. Они могут быть любыми. Однако имеет место Предложение 2. Для того чтобы преобразование, задаваемое формулами C), было взаимно однозначным, необходимо и достаточно, чтобы 7 п1 и 7^0. D) а2 62 w Таким образом, аффинное преобразование определяется формула- формулами C) при условии D). Доказательство. Наше утверждение вытекает по существу из предложения 9 §2 гл. П. Нам нужно узнать, при каком условии каждая точка плоскости имеет единственный прообраз. Формулы C) связы- связывают координаты (ж*,у*) точки М* и координаты (х,у) ее прообра- прообраза. Их можно рассматривать как систему линейных уравнений для нахождения ж и у, и эта система имеет единственное решение при любых свободных членах ж* — с\ и у* — с2 (а значит, при любых ж* и у*) тогда и только тогда, когда выполнено условие D). Как видно из предложения 1, ортогональные преобразования явля- являются линейными. Проверка условия D) показывает, что они аффин- аффинные. Рассмотрим другие примеры. Пример 4. Рассмотрим сжатие к прямой (пример 3 § 1) и при- примем эту прямую за ось абсцисс декартовой прямоугольной системы координат. Легко видеть, что в такой системе координат сжатие с коэффициентом Л записывается формулами ж* = ж, у* = Ху. Сжатие к прямой — аффинное преобразование. Пример 5. Проектирование на прямую (пример б § 1) в такой декартовой прямоугольной системе координат, для которой эта пря- прямая — ось абсцисс, записывается формулами х* = ж, у* = 0. Это — линейное, но не аффинное преобразование. Пример 6. Для записи уравнений гомотетии не существенно, чтобы система координат была прямоугольной, но уравнения про- проще, если начало координат поместить в центр гомотетии. По опре- определению гомотетии с коэффициентом Л вектор ОМ переходит в век- вектор ОМ* = ХОМ. Если О — начало координат, координаты точек М и М* будут связаны равенствами х* = Лж, у* = Ху.
102 Гл. IV. Преобразования плоскости Гомотетия — аффинное преобразование. Пример 7. Преобразование, сопоставляющее каждой точке плос- плоскости одну и ту же точку С, записывается формулами х* = ci, у* = с2, где с\ и с2 — координаты точки С. Оно линейное, но не аффинное. Определение аффинного преобразования содержит упоминание о некоторой определенной системе координат, и заранее не известно, будет ли преобразование записываться формулами вида C) в какой- либо другой системе координат. Устраним это сомнение. Предложение 3. В любой декартовой системе координат, ли- линейное преобразование задается формулами вида C). Доказательство. Пусть преобразование задано равенствами C) в системе координат O,ei,e2. Перейдем к системе координат О',е'1,е'2. Как мы знаем, старые координаты точки М(х,у) выражаются через новые координаты (х',у') по формулам G) §3 гл. I: х = оцх' + /?i2/' + 7ь У = ol2x! + /32у' + 72- E) Для образа М* точки М нам нужно будет, наоборот, выразить но- новые координаты (х'*,у'*) через его старые координаты (х*,у*). Они выражаются такими же формулами, разумеется, с другими коэффи- коэффициентами: х'* = Aix* + /xi 2/* + i/i, 2/'* = А2ж* + /х22/* + ^2- F) Нам требуется найти выражение новых координат (х'*,у'*) точ- точки М* через новые координаты (х*\у') точки М. С этой целью под- подставим в равенства F) значения ж* и у* из формул C): X7* = \1((ЦХ + &i2/ + Ci) + /Alfax + 622/ + C2) + ^1, 2/* = A2(aix + &12/ + ci) + /i2(a2x + b2y + c2) + 1/2. Для нас важно, что правые части этих равенств — многочлены сте- степени не выше 1 относительно х и у: х1" = А1Х + В1У + d, у" = А2х + В2у + С2. G) Подставив сюда выражения х и у по формулам E), мы найдем иско- искомую зависимость: ж'* = А^агх' + C1У' + 7i) + #1@^' + Р2у' + 72) + d, 2/'* = ^(aix7 + y9i2/' + 71) + ^2@:2^ + fay' + 72) + C2. Мы видим, что правые части этих равенств — многочлены степени не выше 1 относительно х' и у'. Это нам и требовалось доказать. Заметим, что аффинные преобразования выделяются из линейных требованием взаимной однозначности, которое не зависит от системы координат. Поэтому без дополнительных проверок мы можем быть уверены, что формулы, задающие аффинное преобразование в новой системе координат, удовлетворяют условию D). 3. Произведение линейных преобразований. Доказательст- Доказательство предложения 3 было основано на том, что результат подстановки
§2. Линейные преобразования 103 многочленов степени не выше 1 в многочлен степени не выше 1 оказы- оказывается таким же многочленом. Это же обстоятельство лежит в основе следующего предложения. Предложение 4. Произведение линейных преобразований явля- является линейным преобразованием. Произведение аффинных преобразо- преобразований — аффинное преобразование. Доказательство Пусть заданы линейные преобразования f и g и выбрана система координат. Тогда координаты точки f (M) выра- выражаются через координаты точки М формулами х* = а\х + Ь\у + ci, у* — а2х + Ь2у + с2, (8) а координаты точки g(f(M)) через координаты точки f(M) форму- формулами ж** = dlX* + eiy* + /ь ^** = ^2Ж* + е22/* + /*. (9) Подстановка равенств (9) в (8) выражает координаты g(f(M)) через координаты М. В результате подстановки мы получаем многочлены степени не выше 1, что и доказывает первую часть предложения. Для доказательства второй части достаточно вспомнить, что по предложению 1 § 1 произведение двух взаимно однозначных преобра- преобразований взаимно однозначно. Предложение 5. Преобразование, обратное аффинному преобра- преобразованию, также является аффинным. Если преобразование f записано уравнениями C), то координат- координатная запись его обратного преобразования получается решением урав- уравнений C) относительно х и у. Для того чтобы решить эти уравнения, умножим первое из них на Ь2> второе — на Ъ\ и вычтем одно уравне- уравнение из другого. Мы получим (aib2 - a2bi)x = Ь2(х* - с\) — h(y* - с2). Из условия D) следует, что х — линейный многочлен от ж* и у*. Вы- Выражение для у получается аналогично. 4. Образ вектора при линейном преобразовании. Рассмот- Рассмотрим вектор М\М2. Если координаты точек М\ и М2 в системе коор- координат О, ei, е2 обозначить соответственно xi,yi и х2, у2, то компонен- компоненты вектора будут равны х2 - х\ и у2 - у\. Пусть формулы C) задают преобразование f в выбранной системе координат. Тогда образы М| и М* точек М2 и Mi имеют абсциссы Х*2 = OLiX2 + 6i2/2 + Ci, X\ Следовательно, первая компонента вектора М^М^ равна х*2 - х\ = а2(х2 - х{) + h(y2 - 2/i). Аналогично находим вторую компоненту этого вектора 2/2 ~ 2/1 = а2(>2 - ХХ) + Ь2(у2 - 2/1). Обратим внимание на то, что компоненты М^М^ выражаются только через компоненты М\М2, а не через координаты точек М\
104 Гл. IV. Преобразования плоскости и М2 по отдельности. Два равных вектора имеют одинаковые ком- компоненты и, следовательно, при линейном преобразовании перейдут в векторы, компоненты которых также одинаковы. Итак, мы получаем Предложение 6. При линейном преобразовании равные векто- векторы переходят в равные векторы. Компоненты а*, а% образа вектора выражаются через его компоненты а\, а2 формулами а* = aiai + , b2a2. Если быть точным, говорить об образе вектора при преобра- преобразовании f неправильно: преобразование отображает точки, а не век- векторы. Точнее было бы сказать, что f порождает преобразование f множества векторов. Но ниже мы, тем не менее, будем придержи- придерживаться не совсем точной, но более удобной и общепринятой терми- терминологии — говорить, что преобразование f переводит вектор а в вектор а* и обозначать последний через f(a). Из формул A0) вытекает, что для линейного преобразования f при любых векторах а и b и любом числе Л f(a + b)=f(a)+f(b), f(Aa) = Af(a). [ } Докажем, например, первое из этих равенств. Пусть 7i и 72 — компоненты вектора f (a + b). Тогда 7Г =а1(а1 +Pi) + b1(a2+f32)J 72* = «2(«i + Pi) + Ъ2{а2 + /?2), где ai,a2 и /3i,/32 — компоненты векторов а и b. Отсюда 7Г = (aiai + ha2) + (aiA + h/32) = a{ + /?*, 72 = (a2ai + h2a2) + (a2Ci + b2f32) = a*. + /?2. Это — координатная запись доказываемого равенства. Второе из ра- равенств A1) доказывается аналогично. Из равенств A1) следует, что при линейном преобразовании f ли- линейно зависимые векторы переходят в линейно зависимые. Дейст- Действительно, как легко видеть, f@) = 0. Тогда любое соотношение ви- вида Ла + /ih = 0 влечет за собой Af (а) + /if (b) = 0. Если преобразование аффинное, то линейно независимые векторы переходят в линейно независимые. В самом деле, в противном случае из равенства Af (а) + /if (Ь) = 0, А2 + /i2 ф 0, при обратном преобразо- преобразовании мы получили бы Аа + /ib = 0. Следующее предложение устанавливает геометрический смысл ко- коэффициентов в формулах, задающих линейное преобразование. Предложение 7. Пусть преобразование f записано в системе координат O,ei,e2 формулами C). Тогда с\ и с2 — координаты точ- точки f(O), a ai,a2 и bi,b2 — компоненты векторов f(ei) и f(e2) в сис- системе координат O,ei,e2.
§2. Линейные преобразования 105 Для доказательства подставим в формулы C) значения х = 0 и у = 0 координат точки О и увидим, что координаты f (О) равны с\ и с2. Подставим в формулы A0) координаты вектора ei ol\ = 1, а2 = = 0 и найдем а* = аь «2 = а2. Следовательно, f(ei) имеет компонен- компоненты а\ и а2. Так же доказывается, что компоненты f(e2) равны Ь\ и 62. Предложение 8. Каковы бы ни были три точки L,M,N, не лежащие на одной прямой, и три точки L*,M* и N*, существует единственное линейное преобразование f такое, что L* = f (L), М* = = f(M) ?/ TV* = f (iV). Это преобразование аффинное тогда и только тогда, когда точки L*, М* и N* также не лежат на одной прямой. Доказательство Векторы LM и LN не коллинеарны. Следо- Следовательно, L,LM,LN — декартова система координат. Пусть ci,c2 — координаты L*, а а\, а2 и Ь\, 62 — компоненты векторов L*M* и L*N* в этой системе координат. Формулы 62^/ + с2 определяют линейное преобразование f, которое, как легко видеть, обладает требуемым свойством. При этом согласно предложению 7, коэффициенты в формулах однозначно определены. Условие D), равносильное аффинности преобразования, необходи- необходимо и достаточно для того, чтобы векторы L*M* и L*N* были не кол- коллинеарны, т. е. L*, М* и N* не лежали на одной прямой. Предложение доказано. Заметим, что в том случае, когда преобразование f аффинное, точ- точка f (О) и векторы f (ei) и f (e2) могут быть использованы как система координат. Для этой системы координат имеет место Предложение 9. При аффинном преобразовании f образ М* точки М в системе координат f(O),f(ei),f(e2) имеет те же коор- координаты, что и точка М в системе координат O,ei,e2. Доказательство. Равенство ОМ = xei + ?/e2 означает, что х,у — координаты М в системе координат O,ei,e2. Подействовав преобразованием f на обе части этого равенства, мы получа- получаем f(O)f(М) = xf(ei) + 2/f(e2), которое означает, что х и у — коорди- координаты М* в системе координат f(O),f(ei),f(e2). Упражнения 1. Являются ли аффинными преобразования, задаваемые формулами: а) ж* = х + у - 1, 2/* = х - у + 1; б) ж* = х - у - 1, у* = -х + у + 1. 2. Найдите образ прямой х — у = 2 при преобразовании а) из упр. 1. 3. Докажите, не прибегая к формулам A), что ортогональное преобра- преобразование взаимно однозначно. 4. Точка А называется неподвижной точкой преобразования f, если f(A) = А. Найдите неподвижные точки преобразования а) из упр. 1.
106 Гл. IV. Преобразования плоскости 5. Докажите, что линейное преобразование, не являющееся тождествен- тождественным, либо имеет единственную неподвижную точку, либо имеет прямую, состоящую из неподвижных точек, либо не имеет их совсем. 6. Как изменятся формулы, задающие линейное преобразование, если начало координат перенести в неподвижную точку, не меняя базисных век- векторов? 7. Линейное преобразование в системе O,ei,e2 задано формулами C). Какими формулами оно задается в системе координат: a) O,e2,ei; б) O,ei,2e2? 8. Докажите, что линейное преобразование, задаваемое в декартовой прямоугольной системе координат формулами х* = х cos if + у sin (р, у* = х sin if — у cos if, — осевая симметрия. Найдите уравнение оси симметрии. 9. Может ли случиться, что произведение двух линейных преобразова- преобразований аффинное, если одно из них не аффинное? 10. Пусть аффинное преобразование в декартовой прямоугольной сис- системе координат задано формулами х* = x + by + ci, у* = ах + С2. Найдите векторы, ортогональные их образам. 11. Дан треугольник с вершинами АA,0), Б(-1/2,1) и С(-1/2, -1). Найдите преобразование, переводящее каждую вершину в середину проти- противоположной стороны. 12. Докажите, что преобразование из упр. 8 есть произведение осевой симметрии f относительно оси абсцисс и поворота g на угол if вокруг начала координат. Какое преобразование получится, если f и g перемножить в другом порядке? § 3. Аффинные преобразования 1. Образ прямой линии. В этом параграфе мы изучим геомет- геометрические свойства аффинных преобразований. Ниже f обозначает аф- аффинное преобразование, записываемое в декартовой системе коорди- координат O,ei,e2 формулами х* = а\х + Ь\у + ci, у* = а2х + Ь2у + с2 A) при условии 7 Ф 0. B) Рассмотрим на плоскости прямую линию с уравнением г = го + + at и найдем ее образ при преобразовании f. (Под образом прямой понимается множество образов ее точек.) Радиус-вектор образа М* произвольной точки М можно вычислить так: ОМ* = бф) +f (О)М* = с + f (г). Здесь с — постоянный вектор Of (О), а г — радиус-вектор точки М. Согласно A1) §2 мы получаем ОМ* =c + f(ro)+f(a)?. C)
§3. Аффинные преобразования 107 Так как f — аффинное преобразование и а / 0, то а перейдет в век- вектор f(a) ф О, и уравнение C) является уравнением прямой линии. Итак, образы всех точек прямой г = r0 + at лежат на прямой C). Более того, преобразование f определяет взаимно однозначное ото- отображение одной прямой на другую, так как при сделанном здесь вы- выборе начальных точек и направляющих векторов точка М* имеет на прямой C) то же значение параметра ?, что и точка М на исходной прямой. Отсюда мы получаем Предложение 1. При аффинном преобразовании: прямая линия переходит в прямую линию; отрезок переходит в отрезок; параллельные прямые переходят в параллельные. Для доказательства второго утверждения достаточно заметить, что отрезок прямой состоит из таких точек, у которых значения па- параметра удовлетворяют неравенству вида t\ ^ ? ^ ?2- Третье утверж- утверждение следует из того, что при аффинном преобразовании коллинеар- ные векторы переходят в коллинеарные. Предложение 2. При аффинном преобразовании отношение длин параллельных отрезков не изменяется. Доказательство Пусть отрезки АВ и CD параллельны. Это значит, что существует такое число Л, что АВ = XCD. Образы векто- векторов АВ и CD связаны той же зависимостью А*В* = \C*D*. Отсюда \АВ\ _ |I*5 \CD\ \C*D*\ Следствие. Если точка С делит отрезок АВ в некотором от- отношении А, то ее образ С* делит образ А*В* отрезка АВ в том же отношении А. 2. Изменение площадей при аффинном преобразовании. Для начала рассмотрим ориентированный параллелограмм. Выбе- Выберем общую декартову систему координат O,ei,e2 и обозначим через (РъРг) и (#ъ#2) компоненты векторов р и q, на которых он построен. Площадь параллелограмма мы можем вычислить, пользуясь форму- формулой B3) §4 гл. I: S± = S±(p,q) = (piq2 — P2Qi)S±(ei,e2). Пусть аффинное преобразование f записывается в выбранной сис- системе координат формулами A). Из предложения 9 §2 следует, что век- векторы f(p) и f(q) имеют в базисе f(ei),f(e2) те же компоненты (рьРг) и (#ь#2)? что и векторы р и q в базисе ei,e2. Образ параллелограмма построен на векторах f(p) и f(q), и площадь его равна S*± = 5±(f(p),f(q)) = (pi?2 - p2giM±(f(e1),f(e2)). Вычислим последний множитель. По предложению 7 § 2 коорди- координаты векторов f(ei) и f(e2) равны соответственно (ai,a2) и F1,62).
108 Гл. IV. Преобразования плоскости Поэтому S±(f(ei),f(e2)) = {а\Ь2 - a2fri)S±(ei, e2) и S± = (piq2 -P2qi)(a>ib2 - a2b1)S±(e1, e2). Отсюда мы видим, что a2 D) Таким образом, отношение площади образа ориентированного па- параллелограмма к площади этого параллелограмма одинаково для всех параллелограммов и равно а\Ь2 — а2Ъ\. Отсюда следует, что данный детерминант не зависит от выбора системы координат, в которой записано преобразование, хотя он вы- вычисляется по коэффициентам, зависящим от системы координат. Эта величина — инвариант, выражающий геометрическое свойство пре- преобразования. Из формулы D) видно, что отношение площади образа неориенти- неориентированного параллелограмма к его площади равно S*/S = \a1b2-a2b1\. E) Если а\Ъ2 — а2Ь\ > 0, то ориентации всех ориентированных парал- параллелограммов сохраняются при преобразовании, а если а\Ъ2 — а2Ъ\ < 0, то для каждого ориентированного параллелограмма ориентация обра- образа противоположна его ориентации. Займемся теперь площадями других фигур. Каждый треугольник может быть дополнен до параллелограмма, площадь которого равна удвоенной площади треугольника. Поэтому отношение площади об- образа треугольника к площади этого треугольника удовлетворяет ра- равенству E). Каждый многоугольник может быть разбит на треугольники. Следовательно, формула E) справедлива и для произвольных мно- многоугольников. Мы не будем здесь касаться определения площади произвольной криволинейной фигуры. Скажем лишь, что в тех случаях, когда эта площадь определена, она равна пределу площадей некоторой после- последовательности многоугольников, вписанных в рассматриваемую фи- фигуру. Из теории пределов известно следующее предположение: ес- если последовательность Sn стремится к пределу 5, то последователь- последовательность SSn, где S постоянное, стремится к пределу SS. На основании этого предложения мы заключаем, что формула E) справедлива в самом общем случае. В качестве примера найдем выражение площади эллипса через его полуоси. В §2 гл. II мы доказали, что эллипс с полуосями а и Ъ может быть получен сжатием окружности радиуса а к прямой, проходящей через ее центр. Коэффициент сжатия равен Ь/а. В примере 4 § 2 мы получили координатную запись сжатия к прямой ж* = ж, у* = Ху. Де- Детерминант из коэффициентов в этих формулах равен Л, т. е. в нашем
§3. Аффинные преобразования 109 случае Ъ/а. Таким образом, отношение площади эллипса к площади окружности равно Ъ/а, и эта площадь равна S = (Ь/а)тга2. Оконча- Окончательно имеем S = тгао. 3. Образы линий второго порядка. Мы видели, что прямая линия переходит в прямую. Это частный случай следующего предло- предложения. Предложение 3. Аффинное преобразование переводит алгебра- алгебраическую линию в алгебраическую линию того же порядка. В самом деле, пусть линия L в декартовой системе координат O,ei,e2 имеет алгебраическое уравнение порядка р. Согласно пред- предложению 9 § 2 образы всех точек линии L при аффинном преобразо- преобразовании f имеют в системе координат f(O),f(ei),f(e2) те же координа- координаты, что и их прообразы в системе координат O,ei,e2. Следовательно, координаты образов в системе f@),f(ei),f(e2) связаны тем же алгеб- алгебраическим уравнением порядка р. Этого достаточно, чтобы сделать нужное нам заключение. Из предложения 3, в частности, следует, что линия второго по- порядка при аффинном преобразовании перейдет в линию второго по- порядка. Мы докажем более сильное утверждение. Именно, в теореме 1 § 1 гл. III линии второго порядка были разделены на семь классов. Мы увидим, что класс линии сохраняется при аффинном преобразо- преобразовании. На этом основании классы линий, перечисленные в указанной теореме, называются аффинными классами. Итак, докажем Предложение 4. Линия второго порядка, принадлежащая к од- одному из аффинных классов, при любом аффинном преобразовании мо- может перейти только в линию того же класса. Каждую линию второго порядка подходящим аффинным преобразованием можно перевести в любую другую линию того же аффинного класса. Доказательство. Линию мы назовем ограниченной, если она лежит внутри некоторого параллелограмма. Легко видеть, что при аф- аффинном преобразовании ограниченная линия должна перейти в огра- ограниченную, а неограниченная — в неограниченную. 1) Эллипс — ограниченная линия второго порядка. Кроме эллипсов ограничены только линии, состоящие из одной точки, т. е. пары мни- мнимых пересекающихся прямых. Поскольку эллипс ограничен и состоит больше, чем из одной точки, он может перейти только в эллипс. 2) Гипербола состоит из двух отдельных ветвей. Это свойство можно сформулировать так, что будет ясна его неизменность при аффинных преобразованиях. Именно, существует прямая линия, не пересекающая гиперболу, но пересекающая некоторые ее хорды. Из всех линий второго порядка только гиперболы и пары парал- параллельных прямых обладают этим свойством. У гиперболы ветви не прямые линии, и потому при аффинном преобразовании она может перейти только в гиперболу.
110 Гл. IV. Преобразования плоскости 3) Парабола — неограниченная линия второго порядка, состоящая из одного непрямолинейного куска. Этим свойством не обладают ни- никакие другие линии второго порядка, и потому парабола может пе- перейти только в параболу. 4) Если линия второго порядка представляет собой точку (пару мнимых пересекающихся прямых), прямую (пару совпавших пря- прямых), пару пересекающихся или пару параллельных прямых, то из доказанных ранее свойств аффинных преобразований следует, что эта линия не может перейти в линию никакого другого класса. Докажем вторую часть предложения. В теореме 1 § 1 гл. III ка- канонические уравнения линий второго порядка написаны в декарто- декартовой прямоугольной системе координат и содержат параметры а, 6,... Если мы откажемся от ортонормированности базиса, то сможем про- произвести дальнейшие упрощения канонических уравнений и привести их к виду, не содержащему параметров. Например, замена коорди- координат х' = ж/а, у' = у /Ъ переводит уравнение эллипса х2 /а2 + у2/Ъ2 = 1 в уравнение х'2 + у'2 = 1, каковы бы ни были а и Ъ. (Последнее уравне- уравнение не есть уравнение окружности, так как новая система координат не декартова прямоугольная.) Читатель без труда покажет, что канонические уравнения линий второго порядка переходом к подходящей системе координат могут быть преобразованы в уравнения: 1)х2+у2 = 1; 2)х2+у2 = 0; 3) х2 - у2 = 1; 4) х2 - у2 = 0; Б)у2 = 2х; 6) у2 -1 = 0; 7) у2 = 0. Такую систему координат мы назовем аффинной канонической системой координат. Из предложения 9 § 2 следует, что аффинное преобразование, ко- которое совмещает аффинные канонические системы координат двух линий одного аффинного класса, совмещает и эти линии. Это закан- заканчивает доказательство. 4. Разложение ортогонального преобразования. Теорема 1. Каждое ортогональное преобразование расклады- раскладывается в произведение параллельного переноса, поворота и, возможно, осевой симметрии. Доказательство. Пусть f — ортогональное преобразование и ААВС — равнобедренный прямоугольный треугольник с прямым уг- углом А. При преобразовании f он перейдет в равный ему треуголь- треугольник АА*В*С* с прямым углом при вершине А*. Теорема будет дока- доказана, если, производя последовательно параллельный перенос р, пово- поворот q и (в случае необходимости) осевую симметрию г, мы сможем совместить треугольники ABC и А*В*С*. Действительно, произве- произведение rqp — аффинное преобразование так же, как и f, а аффинное преобразование однозначно определяется образами трех точек, не ле- лежащих на одной прямой. Поэтому rqp совпадает с f.
§3. Аффинные преобразования 111 Итак, переведем Аи А* параллельным переносом р на вектор АА* (если А = А*, то р — тождественное преобразование). Затем поворо- поворотом q вокруг точки А* совместим р(В) с В* (возможно, и это преоб- преобразование окажется тождественным). Точка q(p(C)) либо совпадает с С*, либо симметрична ей относительно прямой А*В*. В первом слу- случае цель уже достигнута, а во втором потребуется осевая симметрия относительно указанной прямой. Теорема доказана. Следует иметь в виду, что полученное разложение ортогонального преобразования не однозначно. Более того, можно поворот или парал- параллельный перенос разложить в произведение осевых симметрии, про- произведение параллельного переноса и поворота представить как один поворот и т. д. Мы не будем уточнять, как это сделать, а выясним следующее общее свойство всех таких разложений. Предложение 5. При любом разложении ортогонального преоб- преобразования в произведение любого числа параллельных переносов, пово- поворотов и осевых симметрии четность числа осевых симметрии, вхо- входящих в разложение, одна и та же. Для доказательства рассмотрим на плоскости произвольный базис и проследим за изменением его ориентации (направления кратчайше- кратчайшего поворота от ei к ег) при осуществляемых преобразованиях. Заме- Заметим, что поворот и параллельный перенос не меняют ориентацию ни одного базиса, а осевая симметрия меняет ориентацию любого бази- базиса. Поэтому, если данное ортогональное преобразование меняет ори- ориентацию базиса, то в любое его разложение должно входить нечетное число осевых симметрии. Если же ориентация базиса не меняется, то число осевых симметрии, входящих в разложение, может быть только четным. Определение. Ортогональные преобразования, которые могут быть разложены в произведение параллельного переноса и поворо- поворота, называются ортогональными преобразованиями первого рода, а остальные — ортогональными преобразованиями второго рода. Ортогональное преобразование в декартовой прямоугольной сис- системе координат записывается формулами A) § 2. При верхних зна- знаках коэффициентов у у в этих формулах детерминант, составлен- составленный из коэффициентов, равен +1, а при нижних знаках он равен —1. Отсюда и из формулы D) следует Предложение 6. Ортогональное преобразование первого рода за- записывается в декартовой прямоугольной системе координат формула- формулами A) §2 с верхними знаками у коэффициентов при у, а ортогональное преобразование второго рода — с нижними знаками. 5. Разложение аффинного преобразования. Мы видели, на- насколько аффинное преобразование может изменить плоскость: ок- окружность может перейти в эллипс, правильный треугольник — в совершенно произвольный. Казалось бы, никакие углы при этом со- сохраниться не могут. Однако имеет место следующее.
112 Гл. IV. Преобразования плоскости Предложение 7. Для каждого аффинного преобразования су- существуют две взаимно перпендикулярные прямые, которые переходят во взаимно перпендикулярные прямые. Для доказательства рассмотрим какую-либо окружность. При дан- данном аффинном преобразовании она перейдет в эллипс. Каждая ось эллипса — множество середин хорд, параллельных другой оси. При аффинном преобразовании хорда перейдет в хорду, параллельность должна сохраниться, а середина отрезка переходит в середину его об- образа. Поэтому прообразы осей эллипса — отрезки, обладающие тем же свойством: каждый из них есть множество середин хорд окружности, параллельных другому отрезку. Такие отрезки непременно являют- являются двумя взаимно перпендикулярными диаметрами окружности. Это то, что нам требовалось: существуют два взаимно перпендикулярных диаметра окружности, которые переходят во взаимно перпендикуляр- перпендикулярные отрезки — оси эллипса. Стоит отметить один особый случай: окружность при аффинном преобразовании может перейти в окружность. В этом случае то же рассуждение проходит с любыми двумя взаимно перпендикулярны- перпендикулярными диаметрами окружности-образа. Очевидно, что при этом любые два взаимно перпендикулярных направления остаются перпендику- перпендикулярными. Определение. Два взаимно перпендикулярных направления называются главными или синугулярными направлениями аффин- аффинного преобразования f, если они переходят во взаимно перпендику- перпендикулярные направления. Теорема 2. Каждое аффинное преобразование раскладывается в произведение ортогонального преобразования и двух сжатий к двум взаимно перпендикулярным прямым. Доказательство аналогично доказательству теоремы 1. Рассмот- Рассмотрим аффинное преобразование f и выберем равнобедренный прямо- прямоугольный треугольник ABC так, чтобы его катеты АВ и АС были направлены вдоль главных направлений преобразования f. Обозначим через А*, В* и С* образы его вершин. Сделаем такое ортогональное преобразование g, при котором g(A) = А*, а точки g(B) и g(C) лежат соответственно на лучах А*В* и А*С*. (Этого легко добиться, как и в теореме 1, параллельным переносом, поворотом и осевой симмет- симметрией.) nycTb\=\A*B*\/\A*g(B)\,aii=\A*C*\/\A*g(C)\. Тогда сжатие Pl к прямой А*С* в отношении Л переведет g(B) в p1(g(B)) = В* и не сдвинет точек А* и g(C). Аналогично, сжатие р2 к прямой А*В* переведет g(C) в p2(g(C)) = С* и не сдвинет точек прямой А*В*. Это означает, что произведение p2Pig переводит точки А, В и С в точки А*, В* и С* так же, как и заданное нам преобразова- преобразование f. Согласно предложению 8 §2 имеем p2Pig = f, как и требовалось.
§3. Аффинные преобразования 113 Упражнения 1. Найдите площадь треугольника, если его стороны лежат на прямых с уравнениями х — ?/ + 1 = 0, х + у — 1 = 0и2ж+у = 2в декартовой пря- прямоугольной системе координат. 2. Пусть при аффинном преобразовании точки А, В и С перешли в точ- точки А*, В* и С*. Докажите, что точка пересечения медиан ААВС перейдет в точку пересечения медиан АА*В*С*. 3. Будем говорить, что аффинное преобразование растягивает вектор а в а раз, если |а*| = а|а|. Для преобразования, заданного в декартовой пря- прямоугольной системе координат формулами х* = 4х + 7у, у* = 8х + у, найдите векторы, для которых растяжение: а) максимально; б) минимально. 4. Пусть прямая касается линии второго порядка. Докажите, что при произвольном аффинном преобразовании образ прямой касается образа ли- линии. 5. Докажите, что вершины ромба, описанного около эллипса, лежат на его осях симметрии. 6. Представьте как произведение двух осевых симметрии: а) параллельный перенос на вектор а; б) поворот на угол ср вокруг точки О. 7. Представьте сжатие к оси абсцисс декартовой прямоугольной систе- системы координат как произведение сжатия к другой прямой и параллельного переноса на а@,а). 8 Д.В. Беклемишев
ГЛАВА V МАТРИЦЫ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ § 1. Матрицы 1. Определение. Мы будем называть матрицей размеров т х п совокупность тп чисел, расположенных в виде таблицы из т строк и п столбцов: а\ а\ ... о}п 2 2 2 GL-\ Go ... CL^. 7га nm nrr l^ п>2 ••• CLn Числа, составляющие матрицу, мы будем называть элементами мат- матрицы. Если число строк в матрице равно числу столбцов, то матрица называется квадратной, а число строк — ее порядком. Остальные мат- матрицы носят название прямоугольных. Можно дать и такое определение матрицы. Рассмотрим два мно- множества целых чисел / = {1, 2,...,т} и J = {1, 2,...,п}. Через I x J обозначим множество всех пар вида (г, j), где г Е /, a j Е J. Матрицей называется числовая функция на / х J, т. е. закон, сопоставляющий каждой паре (г, j) некоторое число а*-. Для читателя, знакомого с программированием, заметим, что мат- матрица — это в точности то же, что и двумерный массив. Две матрицы называются равными, если они имеют одинаковые размеры, и равны их элементы, стоящие на одинаковых местах. Рассматривая произвольные матрицы, мы будем обозначать их элементы буквами с двумя индексами. Если оба индекса расположены внизу, то первый из них обозначает номер строки, а второй — номер столбца; если один из индексов расположен сверху, как в написанной выше матрице, то этот индекс обозначает номер строки. Не следует путать верхние индексы с показателями степени. Матрицу размеров 1 х п, состоящую из одной строки, мы будем называть строкой длины п или просто строкой. Матрицу разме- размеров т х 1 называют столбцом высоты т или просто столбцом. Столб- Столбцы и строки мы будем обозначать полужирными буквами. Часто бывает удобно записывать матрицу как столбец из строк
§ 1. Матрицы 115 или как строку из столбцов. Пусть ап = Тогда написанную в начале матрицу можно записать в виде II ai а2 ... ап II . а\ ... at, Аналогично, если а1 = же матрица записывается в виде ... а" то та Рассмотрим матрицу А размеров т х п и выберем какие-ни- какие-нибудь г номеров строк ii,...,ir и s номеров столбцов ji,...,js, при- причем будем предполагать, что номера выбраны в порядке возраста- возрастания: i\ < %2 < ... < гг и ji < 2ч < ••• < 3s- Матрицу А' размеров г х s, составленную из элементов А, стоящих на пересечении выбранных строк и столбцов, мы назовем подматрицей матрицы А. Итак, Af = Js Если матрица квадратная, то множество тех ее элементов а\, у которых номер строки равен номеру столбца, называется главной диагональю или просто диагональю матрицы. 2. Транспонирование матриц. Рассмотрим матрицу _ из т строк и п столбцов. Ей можно сопоставить матрицу В из п строк и т столбцов по следующему правилу. Элементы каждой стро- строки матрицы А записываются в том же порядке в столбцы матри- матрицы В, причем номер столбца равен номеру строки. Эту матрицу В = аи ат1 называют транспонированной по отношению к А и обозначают АТ. Переход от А к Ат называют транспонированием.
116 Гл. V. Матрицы и системы линейных уравнений Видно, что г-я строка В состоит из тех же элементов в том же порядке, что и г-й столбец А. Ясно также, что (АТ)Т = А. Определение транспонированной матрицы можно записать в виде тип равенств, связывающих элементы матриц Аи В: bij = dji (i = l,...,m, j = l,...,n). 3. Некоторые виды матриц. Введем определения некоторых часто употребляемых видов матриц. Все матрицы предполагаются квадратными. 1. Матрица А называется симметричной или симметрической, если АТ = А. Для такой матрицы ац = ctji при всех г и j — элемен- элементы, расположенные симметрично относительно главной диагонали, равны. 2. Матрица А называется ко со симметричной или антисимметрич- антисимметричной, если АТ =—А. Для такой матрицы ац — -а^ при всех г и j — элементы, расположенные симметрично относительно главной диаго- диагонали, отличаются знаком. Диагональные элементы равны нулю. 3. Матрица А называется верхней треугольной, если ее элементы, расположенные ниже главной диагонали, равны нулю: ац — 0 при г > > j. Аналогично определяется нижняя треугольная матрица: ац = О при г < j. 4. Матрица А называется диагональной, если у нее равны нулю все недиагональные элементы: ац = 0 при г ф j. Другие частные виды матриц будем определять по мере необхо- необходимости. 4. Сложение и умножение на число. Пусть А и В — матри- матрицы размеров т х п. Мы можем сопоставить им третью матрицу С размеров т х п, элементы которой сц связаны с элементами ац и Ьц матриц А и В равенствами Cij=aij+bij (i = l,...,m, j = l,...,n). A) Определение. Матрица С, определяемая по А и В форму- формулой A), называется их суммой и обозначается А + В. Определение. Матрица С, элементы которой сц равны произ- произведениям элементов ац матрицы А на число а, называется произве- произведением А на а и обозначается аА. Мы имеем dj^aciij (i = l,...,m, j = l,...,n). B) Из свойств сложения и умножения чисел легко вытекает Предложение 1. Для любых матриц А, В, С и любых чисел а и C выполнены равенства А + В = В + А, (А + В) + С = А + (В + С), а(А + В) = аА + аВ, (а + C)А = аА + (ЗА, Матрица, все элементы которой равны нулю, называется нулевой матрицей. Если О — нулевая матрица размеров т х п, то для любой
§ 1. Матрицы 117 матрицы тех же размеров А + О = А. Матрицу (—1)А называют противоположной матрице А и обознача- обозначают —А. Она обладает тем свойством, что А+(-А) = 0. Сумма матриц В и —А называется разностью матриц В и А и обо- обозначается В — А. Мы видим, что сформулированные выше свойства линейных опе- операций с матрицами совпадают со свойствами линейных операций с векторами, перечисленными в предложении 1 § 1 гл. I. Используя линейные операции, мы можем составлять из матриц одинаковых размеров Ai,...,Ak и чисел а\,...,ак выражения вида axAx + ... + акАк. Такие выражения называются линейными комбинациями матриц. Ес- Если какая-то матрица представлена как линейная комбинация других матриц, то говорят, что она по ним разложена. Пример 1. Пусть pi,..., pk — столбцы одинаковой высоты п. Тог- Тогда столбец q той же высоты по ним разложен, если при некоторых коэффициентах ai,...,ak q = c^iPi или, в более подробной записи, р\ Р? Pk В силу определения линейных операций это матричное равенство рав- равносильно п числовым равенствам q1 ={ 4 5. Линейная зависимость матриц. Какова бы ни была сис- система матриц фиксированных размеров т х п, нулевая матрица тех же размеров раскладывается по этим матрицам в линейную комби- комбинацию с нулевыми коэффициентами. Такую линейную комбинацию называют тривиальной. Как и для векторов, введем следующее Определение. Система матриц Ai,...,Afe линейно независима, если нулевая матрица раскладывается по ней однозначно, т. е. из а1А1 + ... + akAk = 0 C) следует а\ = ... = ак = 0. В противном случае, т. е. если существуют к чисел «1,..., ак, одновременно не равных нулю и таких, что выполнено равенство C), система матриц называется линейно зависимой.
118 Гл. V. Матрицы и системы линейных уравнений Пример 2. Столбцы 1 О О е„. = D) (в столбце е^ на г-м месте стоит 1, а остальные элементы равны нулю) являются линейно независимыми. Действительно, равенст- равенство aiei + ... + апеп = о можно записать подробнее так: 1 0 0 + OL2 0 1 0 0 0 1 ап 0 0 0 Отсюда видно, что а\ = а2 = ... = ап = 0. Это равенство показывает также, что произвольный столбец вы- высоты п может быть разложен по столбцам ei, ...,еп. Действительно, в качестве коэффициентов линейной комбинации нужно взять элемен- элементы раскладываемого столбца. Определение. Квадратная матрица порядка п, состоящая из столбцов D): Е = 0 1 о о называется единичной матрицей порядка п или просто единичной матрицей, если порядок известен. Строки единичной матрицы отличаются от ее столбцов только формой записи. Итак, мы можем сформулировать Предложение 2. Столбцы (строки) единичной матрицы линей- линейно независимы и обладают тем свойством, что каждый столбец (строка) с тем же числом элементов раскладывается по ним. Укажем несколько свойств линейно зависимых и линейно незави- независимых систем матриц. Эти свойства были доказаны в § 1 гл. I для векторов, и доказательства совпадали с приводимыми ниже. Предложение 2. Система из к > 1 матриц линейно зависима тогда и только тогда, когда хотя бы одна из матриц есть линейная комбинация остальных. В самом деле, пусть система линейно зависима. По определению выполнено равенство вида C), где хотя бы один коэффициент отличен от нуля. Допустим для определенности, что это а\. Тогда мы можем представить первую матрицу как линейную комбинацию А1 = А2 - ... Ак.
§ 1. Матрицы 119 Обратно, если одна из матриц разложена по остальным, то это разло- разложение преобразуется к виду C), где один из коэффициентов равен 1. Предложение 4. Если некоторые из матриц Ai, ...,Ак состав- составляют сами по себе линейно зависимую систему, то вся систе- система Ai,...,Ak линейно зависима. Действительно, пусть существует нетривиальная линейная комби- комбинация некоторых из матриц системы, равная нулевой матрице. Если мы добавим к ней остальные матрицы с нулевыми коэффициента- коэффициентами, то получится равная нулевой матрице нетривиальная линейная комбинация всех матриц. В частности, если в систему матриц входит нулевая матрица, то система линейно зависима. Предложение 5. Любые матрицы, входящие в линейно незави- независимую систему матриц, сами по себе линейно независимы. В самом деле, в противном случае мы пришли бы к противоречию на основании предыдущего предложения. Предложение 6. Если матрица В разложена по линейно неза- независимой системе матриц Ai,...,Ak, то коэффициенты разложения определены однозначно. Действительно, пусть мы имеем два разложения В = ахАх + ... + akAk и В = /Mi + ••• + PkAk- Вычитая одно разложение из другого, мы получаем О = (ai - /3i)Ai + ... + (a* - /Зк)Ак. Матрицы Ai,...,Ak линейно независимы, значит, щ — fa = 0 для всех г = !,...,&. Итак, коэффициенты обоих разложений совпадают. Упражнения 1. Дана матрица 1 2 3 4 5 6 7 8 9 а) Выпишите подматрицу, расположенную в строках 1 и 3 и столб- столбцах 1 и 3. б) Сколько квадратных подматриц второго порядка имеет данная матрица? в) Сколько всего подматриц она имеет? 2. Даны матрицы А = 1 2 3 5 6 , в = 2 5 8 3 6 9 Можно ли сложить матрицы: а) А и В; б) АТ и В; в) А и Вт; г) Ат и ВТ1 3. Даны матрицы А = В = 2 1 -1 1 С = 4 3 1 5
120 Гл. V. Матрицы и системы линейных уравнений Вычислите матрицу 2А + ЗВ — С. 4. С какими коэффициентами раскладывается матрица D = по матрицам А и В и С из предыдущей задачи? 1 3 5. Можно ли разложить матрицу 7 9 по матрицам: а) А и В из задачи 3, б) А и Б и С из задачи 3? 6. Являются ли линейно независимыми строки а=||1234||, Ь = ||2345||, с = || 3 4 5 6 ||? 7. Убедитесь, что классы матриц, определенные в п. 3, замкнуты отно- относительно операций сложения и умножения на число. § 2. Умножение матриц 1. Символ J2- Прежде чем двигаться дальше, остановимся на обозначениях. В математике часто приходится рассматривать суммы большого числа слагаемых, имеющих сходный вид и отличающихся только индексами. Для таких сумм принято следующее обозначение. п Символ 2_, •> после которого стоит некоторое выражение, содержащее к=1 индекс к, обозначает сумму таких выражений для всех значений ин- индекса от 1 до п, например, а2 ап, ап(Зп. к=1 к=1 Индекс к называется индексом суммирования. Разумеется, в качестве индекса суммирования может быть употреблена любая другая буква. На указанный символ и следующее за ним выражение можно смот- смотреть как на скобку, содержащую п однотипных слагаемых. Следующие формулы являются другой записью вынесения мно- множителя за скобку и группировки слагаемых: A) k=i k=i Е< B) k=l k=l Если имеется выражение, зависящее от двух индексов, принима- принимающих значения 1,...,п и 1,...,т, мы можем просуммировать снача-
Умножение матриц 121 ла по одному из них, а затем полученные суммы — по-другому: п т ?(!>)¦ г=1 j=l (Скобки обычно не пишутся.) Эта двойная сумма содержит слагае- слагаемые, соответствующие всевозможным парам значений индексов. Ес- Если мы запишем Рц для всех i = 1, ...,п и j = I, ...,m в виде матрицы, то сумма в скобках равна сумме элементов г-й строки, а во внешней сумме складываются результаты для всех строк. То же самое число мы, конечно, получим, если сначала сложим элементы по столбцам, а затем просуммируем полученные суммы для всех столбцов. Поэтому г=1 j=l j=l i=l 2. Определение и примеры. Рассмотрим сначала строку а с элементами ai (i = 1,..., п) и столбец b с элементами bj (j = 1,..., п). Существенно, что в а и в b число элементов одинаково. Произведени- Произведением а на b называется число, равное сумме произведений элементов с одинаковыми номерами, т. е. ab = а\Ъ\ + ... + апЪп. Пусть теперь дана матрица А размеров т х п и матрица В разме- размеров п х р. Матрицы таковы, что длина строки (число столбцов) первой матрицы равна высоте столбца (числу строк) второй. Умножим каж- каждую строку А на каждый столбец В. Полученные тр произведений запишем в виде матрицы С размеров т х р. Именно, каждый стол- столбец С составим из произведений всех строк А на соответствующий столбец матрицы В. Любая строка С состоит из произведений стро- строки А, имеющей тот же номер, на все столбцы В. Таким образом, эле- элементы матрицы С для всех г = 1,...,т и j = l,...,p равны ctikbkj. D) k=l Определение. Матрицу С, элементы которой выражаются через элементы матриц А и В по формулам D), назовем произведе- произведением А на В и обозначим АВ. Определение произведения матриц формулируется более сложно и выглядит менее естественно, чем определение суммы. Однако из дальнейшего читатель увидит, что именно такое определение оказы- оказывается полезным в целом ряде вопросов. Как легко заметить, если матрицу В записать как строку из столб- столбцов, то произведение АВ запишется как строка из столбцов так: АВ = А\\ bi ... Ър || = || Abi ... АЪР ||. E)
122 Гл. V. Матрицы и системы линейных уравнений Действительно, для получения j-ro столбца произведения мы умно- умножаем последовательно все строки А на столбец hj. Аналогично, строки АВ — произведения строк А на матрицу В: АВ = в = Приведем несколько примеров. Пример 1. Матрица А размеров т х п умножается на столбец х высоты п 1 II II г1 II п Х 2 п X \хх а\х \хх а\х а2пхп Это столбец высоты т. В обратном порядке эти матрицы при т ф 1 перемножить нельзя: произведение хА не определено. Правую часть последнего равенства можно записать также и как линейную комбинацию столбцов матрицы А (пример 1 §1). Это пока- показывает, что столбец Ах есть линейная комбинация столбцов матри- матрицы А с коэффициентами, равными элементам столбца х: Ах = Пример 2. Произведение строки длины т на матрицу В разме- размеров т х п будет строкой длины п: ьш г=1 г=1 Пример 3. Произведение столбца высоты т на строку длины п есть матрица размеров т х п: Л Х± х2 ••• ап\\ = X CL2 хта2 х1ап х2ап Пример 4. Пусть А — матрица размеров т х п, е^ — г-й стол- столбец единичной матрицы порядка т, а е^ — j-й столбец единичной матрицы порядка п. Тогда ejAej — матрица размеров 1 х 1 с эле-
2. Умножение матриц 123 е,- = ||0... 1... 0| аи ... aiT &21 ••• 0>2r Предложение 1. j-й столбец матрицы АВ есть линейная ком- комбинация столбцов матрицы А с коэффициентами равными элемен- элементам j-го столбца матрицы В. i-я строка матрицы АВ есть линейная комбинация строк матри- матрицы В с коэффициентами, равными элементам г-й строки матрицы А. Оба утверждения доказываются одинаково. Докажем первое. Мы видели, что г-й столбец произведения есть произведение А на г-й стол- столбец В (формула E)). Но произведение матрицы А на столбец — это линейная комбинация столбцов А с элементами второго сомножителя в качестве коэффициентов (пример 1). 3. Свойства умножения матриц. Умножение матриц не ком- коммутативно. Если А матрица размеров т х п, то оба произведения АВ и В А определены только в том случае, когда В имеет размеры п х т, т. е. такие же, как АТ. При этом АВ — квадратная матрица поряд- порядка т, а В А — порядка п. Итак, о равенстве АВ = В А может идти речь, только если А и В — квадратные матрицы одного порядка. Но и в этом случае равенство выполнено далеко не всегда. Например, 1 1 0 0 0 0 1 1 = 1 1 0 0 > 0 0 1 1 1 1 0 0 = 0 0 1 1 Если какие-нибудь две матрицы А и В удовлетворяют равенству АВ = В А, то они называются перестановочными. Перестановочные матрицы существуют. Например, единичная матрица порядка п пе- перестановочна с любой квадратной матрицей того же порядка: АЕ = ЕА = А. F) Вообще, если определены произведения BE и ЕС, то ВЕ = В и ЕС = С. Предоставим читателю самостоятельно проверить это в качестве уп- упражнения на умножение матриц. Равенства F) выражают важное свойство единичной матрицы, которому она обязана своим названием. Если бы какая-нибудь другая матрица Е' обладала этим свойством, мы имели бы Е'Е = Е и Е'Е = = Е', откуда следовало бы Е — Е1. Очевидно, что произведение нулевой матрицы О (справа или сле- слева) на любую другую матрицу равно нулевой матрице: АО = О', ОВ = О".
124 Гл. V. Матрицы и системы линейных уравнений (Размеры матриц О, О' и О", возможно, различны.) Предложение 2. Умножение матриц ассоциативно, т. е. если определены произведения АВ и (АВ)С, то определены ВС и А(ВС), и выполнено равенство (АВ)С = А(ВС). Действительно, пусть размеры матриц А, В и С соответствен- соответственно равны тпа х па, тпв х пв и тс х пс- Если АВ определено, то па = тв, и матрица АВ имеет размеры тпа х пв- Поэтому, если определено (АВ)С, то пв = тс- Матрица АВ состоит из элементов и, следовательно, элементы (АВ)С имеют вид пв ( 5^ J G) Поскольку пв = ^гс определено произведение ВС. Его элементы пв Так как n^ = ттг^, определено произведение А(ВС) с элементами s = l,...,nc). (8) /=i / В силу формул A) и C) выражения G) и (8) совпадают, и наше утверждение доказано. Предложение 3. Умножение матриц дистрибутивно по от- отношению к сложению: если имеет смысл выражение А(В + С), то А(В + С) = АВ + АС, если имеет смысл выражение (В + С)А, то (В + С) А = ВА + С А. Обе части предложения доказываются одинаково. Докажем пер- первую из них. Очевидно, что В и С должны иметь одинаковые разме- размеры т х п, а А — размеры р х т (р может быть любым). Выпишем элементы матрицы А(В + С) через элементы А, В и С: т ^2asi(bij +Cij) (s = 1,...,р; j = l,...,n). Раскроем скобки в каждом слагаемом и сгруппируем члены: asic icij- г=1 г=1 Эти суммы равны элементам матриц ЛВ и АС, стоящим в строке с номером s и столбце с номером j. Утверждение доказано. Из формулы A) следует такое свойство умножения матриц:
2. Умножение матриц 125 Предложение 4. Если произведение АВ определено, то при лю- любом числе а ,, m а(АВ) = (а А) В = А(аВ). Предложение 5. Если определено произведение АВ, то опреде- определено и произведение ВТАТ и выполнено равенство (АВ)Т = ВТАТ. Доказательство. Пусть матрицы А и В имеют, соответствен- соответственно, размеры m х п и п х р. В матрице АВ на пересечении г-й строки и j-ro столбца стоит элемент п ^aikbkj (г = l,...,m; j = l,...,p). (9) k=l j-я строка матрицы Вт состоит из элементов &ij,..., bnj, а г-й столбец матрицы Ат — из элементов ац,..., а^п. Поэтому произведение ВТАТ определено, и в нем на пересечении j-й строки и г-ro столбца стоит элемент п ^bkjaik (j = l,...,p; г = 1,...,ш). А;=1 Он совпадает с элементом (9), а индексы г и j принимают в обо- обоих выражениях одни и те же значения. Этим предложение доказано. Последовательно применяя доказанную формулу, мы получим 4. Элементарные преобразования. Элементарные матри- матрицы. В этом пункте впервые появляются элементарные преобразова- преобразования матриц. Они играют большую роль в теории матриц и широко используются в вычислениях. Определение. Мы назовем элементарными преобразованиями строк матрицы следующие преобразования: 1) умножение строки на число, отличное от нуля; 2) прибавление одной строки к другой строке. Аналогично определяются элементарные преобразования столб- столбцов матрицы. Все, сказанное ниже об элементарных преобразованиях строк, переносится на элементарные преобразования столбцов. Следующие более сложные преобразования получаются последо- последовательным применением нескольких элементарных преобразований: а) прибавление к одной строке другой строки, умноженной на чис- число, в частности, вычитание одной строки из другой; б) перестановка двух строк. Покажем, как эти преобразования сводятся к элементарным на примере матрицы, состоящей из двух строк а и Ь. Если в матрице есть еще строки, не участвующие в преобразованиях, они переписы- переписываются без изменения:
126 Гл. V. Матрицы и системы линейных уравнений а) б) а b а b аа b —>> a + b b b aa + aa a + b-a b -b a b + aa = a + b —a b —a b a Эти два типа преобразований также часто относят к числу элемен- элементарных. При описании длинных последовательностей элементарных преобразований мы будем включать в последовательность преобра- преобразования этих двух типов, не разлагая их на элементарные. Возможность вычитать одну строку из другой и отличие числово- числового множителя от нуля имеют следующее принципиальное значение: элементарные преобразования обратимы. Это значит, что перейдя от матрицы А к матрице В последовательностью элементарных преоб- преобразований, с помощью другой последовательности мы сможем вер- вернуться от В к А. Каждое элементарное преобразование строк матрицы А разме- размеров т х п равносильно умножению А слева на некоторую квадрат- квадратную матрицу S порядка т. При этом S не зависит от А, а полностью определяется преобразованием, которое она осуществляет. Именно, пусть Si — матрица, получаемая из единичной матри- матрицы Е порядка т заменой г-й единицы на диагонали на число Л ф 0. Тогда матрица Si А отличается от А тем, что ее г-я строка умноже- умножена на Л. Пусть $2 — матрица, которая отличается от Е заменой на единицу нулевого элемента на пересечении г-й строки и j-ro столбца. Умножение А слева на $2 равносильно прибавлению j-й строки к г-й. Оба утверждения доказываются одинаково. Докажем второе. Рассмотрим строку матрицы S2A с номером к ф г. Согласно пред- предложению A), эта строка — линейная комбинация строк А с коэф- коэффициентами равными элементам к-й строки Е. Это значит, что в линейную комбинацию входит (с коэффициентом 1) только к-я стро- строка А, и потому к-я строка S2A равна к-й строке А. Для г-й строки положение другое: в линейную комбинацию входят г-я и j-я строки с коэффициентами 1. Значит, г-я строка S2A равна сумме г-й и j-u строк А. Пример 5. 1 0 1 0 1 1 а с а Ъ с d а Хс Ь Xd а Ъ с + а d + b Те матрицы, умножение на которые осуществляет элементарные преобразования, называются элементарными матрицами. Последовательное выполнение нескольких элементарных преобра- преобразований строк осуществляется умножением слева на произведение со-
Умножение матриц 127 ответствующих элементарных матриц, причем множитель, который соответствует преобразованию, сделанному позже, стоит левее. Легко найти матрицу 5, умножение на которую производит задан- заданную последовательность элементарных преобразований строк: надо осуществить эту последовательность элементарных преобразований над единичной матрицей. Это видно из равенства SE = S. Элементарные преобразования столбцов сводятся к умножению матриц аналогично. Разница состоит в том, что множители помеща- помещаются справа, а не слева от преобразуемой матрицы, и эти множители получаются из единичной матрицы подходящего порядка элементар- элементарными преобразованиями ее столбцов, а не строк. 5. Вырожденные и невырожденные матрицы. Квадратная матрица называется вырожденной, если ее строки линейно зависимы. Вырожденной будет, например, матрица, имеющая нулевую строку, или матрица, имеющая две одинаковых строки. Примером невырож- невырожденной матрицы является единичная матрица (предложение 2 § 1). Предложение 6. Элементарные преобразования строк перево- переводят линейно независимые строки в линейно независимые, а линейно зависимые — в линейно зависимые. Точно так же при элементарных преобразованиях столбцов сохраняются линейная зависимость и не- независимость столбцов. Докажем это предложение для строк. Пусть строки ai,a2,...,an линейно независимы, и мы прибавили, допустим, первую строку ко второй. Рассмотрим произвольную линейную комбинацию получен- полученных строк, равную нулевой строке: aiai + a2(ai + a2) + ... + ana.n = (ai + «2)^1 + «2а2 + ... + апа.п = о. Так как исходные строки линейно независимы, а± + а^ = 0, а^ = = 0, ..., ап = 0. Отсюда следует, что а\ также нуль, и система строк, полученная прибавлением одной строки к другой, линейно независи- независима. Сохранение линейной независимости системы строк при умноже- умножении г-й строки на число А ф 0 доказывается аналогично. Пусть теперь строки линейно зависимы. Вспомним, что последова- последовательности элементарных преобразований обратимы. Если мы из ли- линейно зависимой системы строк с помощью элементарных преобразо- преобразований получили линейно независимую, то обратный переход должен переводить линейно независимую систему в линейно зависимую, что невозможно. Доказательство предложения для столбцов не отличается от при- приведенного. Следствие. Элементарные преобразования строк переводят не- невырожденную матрицу в невырожденную, а вырожденную матрицу — в вырожденную. Предложение 7. Элементарные преобразования строк сохра- сохраняют линейные зависимости между столбцами. Элементарные пре-
128 Гл. V. Матрицы и системы линейных уравнений образования столбцов сохраняют линейные зависимости между строками. Доказательство. Матрица А = ||ai,..., ап|| после элементарно- элементарного преобразования строк переходит в матрицу SA, где S — соот- соответствующая элементарная матрица. Столбцами матрицы SA будут Sai,..., San. Пусть в матрице А столбцы связаны линейной зависи- зависимостью aiai + ... + ana.n = о. Умножая это равенство на 5, мы полу- получаем точно такую же зависимость между столбцами преобразованной матрицы: aiSa.i + ... + anSs.n = о. Доказательство для элементарных преобразований столбцов ана- аналогично. Предложение 8. Каждая невырожденная матрица с помощью элементарных преобразований строк может быть превращена в еди- единичную матрицу. Доказательство. Пусть дана невырожденная квадратная мат- матрица А порядка п. Обозначим ее строки ai,...,an. В первой строке обязательно есть элемент, отличный от нуля, так как в противном случае матрица имела бы строку из нулей и была бы вырожденной. Пусть этот элемент имеет номер si, т. е. расположен в si-м столбце. Разделим первую строку на этот элемент. В преобразованной мат- матрице элемент в позиции (l,si) будет равен 1. После этого для всех г = 2, ...,п вычтем из г-й строки первую строку, умноженную на aiSl. Так преобразованную матрицу обозначим А^\ Ее si-й столбец — это первый столбец единичной матрицы: все его элементы равны нулю, за исключением первого элемента, равного 1. С каждой из остальных строк будем поступать таким же обра- образом. Пусть после очередного преобразования получена матрица А^к\ у которой столбцы с номерами sb ..., Sk — первые к столбцов единич- единичной матрицы; (к + 1)-я строка матрицы А^ отлична от нуля, так как А^ получена элементарными преобразованиями из А и, следователь- следовательно, не вырождена. При этом элементы строки с номерами si, ...,Sfc — нули, а значит, не равен нулю другой элемент. Пусть его номер Sfc+i. Делим строку на него и вычитаем ее с подходящими множителями из остальных так, чтобы превратить s^+i-й столбец в к + 1-й столбец единичной матрицы. Получается матрица А^к+1\ После того, как будет произведена последовательность преобразо- преобразований с n-й строкой, все столбцы полученной матрицы А^, будут различными столбцами единичной матрицы A-й, 2-й,..., n-й столбцы единичной матрицы стоят на местах si,...,sn). Одновременно стро- строки А^ являются различными строками единичной матрицы (при всех г в г-й строке на Si-м месте стоит единица, а остальные элемен- элементы равны нулю). Переставляя строки, мы можем расположить их в естественном порядке. Это закончит преобразование исходной матри- матрицы А в единичную при помощи элементарных преобразований строк.
Умножение матриц 129 Метод преобразования матрицы, примененный при доказательст- доказательстве, называется методом Гаусса, точнее "методом Гаусса-Жордана с выбором ведущего элемента по строке". Различные варианты метода Гаусса широко применяются в вычислительной практике. Предложение 9. Матрица невырождена тогда и только тогда, когда она раскладывается в произведение элементарных матриц. Доказательство. В силу предложения 8 найдутся такие эле- элементарные матрицы Ti,...,Tm, что ТМ...Т1А = Е. A0) Так как последовательности элементарных преобразований обрати- обратимы, существуют элементарные матрицы Si,...,S/v, для которых /S1/S2... SjyE = А. Отбрасывая множитель Е, мы получаем требуемое разложение. Обратно, последняя формула показывает, что произведение эле- элементарных матриц получается элементарными преобразованиями строк из единичной матрицы, которая невырождена. Поэтому, соглас- согласно следствию из предложения б оно невырождено. Предложение 10. Столбцы квадратной матрицы линейно не- независимы тогда и только тогда, когда матрица невырождена. Действительно, элементарными преобразованиями строк мы пре- превращаем невырожденную матрицу в единичную, столбцы которой линейно независимы. По предложению 7 столбцы исходной матрицы также должны быть линейно независимы. Обратно, пусть столбцы матрицы А линейно независимы. Это значит, что транспонированная матрица АТ невырождена, и по предыдущему ее столбцы — строки матрицы А — линейно независимы. Иначе предложение 10 можно сформулировать так. Следствие. Матрица А невырождена тогда и только тогда, ког- когда невырождена ее транспонированная АТ. 6. Обратная матрица. Введем Определение. Матрицу X назовем обратной для матрицы А, если ХА = АХ = Е, где Е — единичная матрица. Вспомним, что две матрицы могут быть перестановочны только в том случае, если они обе квадратные матрицы одного и того же по- порядка. Поэтому иметь обратную может только квадратная матрица. Предложение 11. Если у матрицы А существует обратная, то она единственна. Это легко проверяется от противного. Допустим, что их нашлось две: Х1 и Х2. Тогда Х1 = Х1(АХ2) = (Х1А)Х2 = Х2. Предложение 12. Матрица имеет обратную тогда и только тогда, когда она невырождена. Доказательство. Вернемся к формуле A0) и объединим в ней все элементарные матрицы в один множитель X. Мы можем утверж- 9 Д.В. Беклемишев
130 Гл. V. Матрицы и системы линейных уравнений дать таким образом, что для любой невырожденной матрицы А су- существует матрица X такая, что ХА = Е. Докажем, что X удовлетво- удовлетворяет также и второму равенству в определении обратной матрицы. Для этого заметим, что X невырождена как произведение элемен- элементарных матриц, и потому для нее существует такая матрица У, что YX — Е. Рассмотрим произведение Y(XA) = Y. При другой расста- расстановке скобок мы видим, что (YX)A = А. Поэтому Y = А, и равенство YX = Е переписывается как АХ = Е. Нам осталось доказать, что вырожденная матрица не имеет об- обратной. Пусть матрица А вырождена, т. е. существует нулевая ли- линейная комбинация ее строк Aiai + ... + Anan = о, причем \\ + ... ... + Л^ ф 0. Тогда согласно предложению 1 произведение ненулевой строки v = ||Ai,..., Ап|| на матрицу А — нулевая строка: vA = о. Ес- Если матрица А имеет обратную X, мы можем умножить на X справа обе части этого равенства: vAX = оХ. Таким образом, v = о, что противоречит определению v. Это заканчивает доказательство. Обратную к матрице А принято обозначать А~х. На символ -1 в обозначении обратной матрицы можно смотреть как на показатель степени. Для квадратной матрицы А целая положительная степень Ак определяется как произведение матрицы А самой на себя к раз. По- Положительная степень (А~1)к матрицы А~х считается отрицательной степенью А~к матрицы А. По определению нулевой степенью любой квадратной матрицы называется единичная матрица того же поряд- порядка. При этом определении для невырожденной матрицы Ак А1 = Ak+l при любых целых к и I. Получим основные свойства обратной матрицы. 11 • Из определения прямо видно, что (А~1)~1 = А. 1 1 1 (АВ)-1 = В'1 А'1, так как (AB)(B~1A-1) = AiBB-^A-1 = AA-1 = Е. • Из А'1 А = Е, получаем АТ(А~1)Т= Е. Поэтому (А7^)-1^ {А'1)^ Опишем способ вычисления обратной матрицы. Именно, если эле- элементарными преобразованиями строк мы обратим матрицу А в еди- единичную, то те же преобразования переведут единичную матрицу в матрицу А, так как для соответствующих элементарных матриц из формулы A0) имеем Тм---Т\Е = Тм---Т\ = А~1. Эти вычисления могут быть оформлены так: составим матрицу D размеров п х 2п, приписав к матрице А справа единичную матрицу. Элементарными преобразованиями строк преобразуем D так, чтобы обратить ее левую половину в единичную матрицу. Тогда правая по- половина превратится в матрицу А~х. Теорема 1. Пусть А — невырожденная матрица порядка п. Тог- Тогда любой столбец высоты п раскладывается по столбцам А, причем коэффициенты разложения однозначно определены. Доказательство. Действительно, если матрица А невырожде-
Умножение матриц 131 на, то у нее существует обратная, и мы можем написать равенст- равенство b = АА~гЪ. Из него видно, что столбец b получается умноже- умножением матрицы А на столбец А~ХЪ и, следовательно, является линей- линейной комбинацией столбцов матрицы А. Для доказательства последнего утверждения достаточно вспом- вспомнить, что столбцы невырожденной матрицы линейно независимы, и сослаться на предложение б § 1. Применяя теорему 1 к транспонированной матрице, мы получаем Следствие. Пусть А — невырожденная матрица порядка п. Тог- Тогда любая строка длины п раскладывается по строкам А, причем ко- коэффициенты разложения однозначно определены. Упражнения 1. Пусть аффинные преобразования f и g в некоторой системе координат записаны, соответственно, формулами \ х* = а\х + Ь\у, \ х* = с\х + d\y, \ У* = (*2Х + Ъ2у, у у* = с2х + d2y. Докажите, что произведение f • g запишется такими же формулами, причем матрица коэффициентов будет равна а2 с2 2. Пусть ||2|| — матрица размеров 1 х 1 с элементом 2. Верно ли, что: 1 2 3 = 2 4 6 ; б) 1 2 3 1|2|| = 2 4 6 3. Пусть ai,..., ап — столбцы матрицы А, а Ь1,..., Ъп — строки матри- матрицы В. Убедитесь, что п 4. Верно ли, что для любых двух квадратных матриц одного и того же порядка: а) (А + ВJ = А2 + 2АВ + В2; б) (А + ВJ + (А - ВJ = 2(А2 + В2)? 5. Рассмотрим матричное уравнение X2 + Е = О. а) Проверьте, что матрица 0 -1 1 О удовлетворяет этому уравнению. Как объяснить это в терминах задачи 1? б) Найдите все решения этого уравнения среди вещественных матриц второго порядка. 6. Сопоставим каждому комплексному числу z = a + Ы матрицу A(z) = -Ь а Проверьте, что выполнены равенства A(z\) + A(z2) = = AT(z), А{Х1)АЫ = A(zlZ2), A{z~l) = A~\z). z2), A(z) =
132 Гл. V. Матрицы и системы линейных уравнений 7. Найдите обратную для матрицы 1 О О 1 1 2 1 1 3 8. Разложите матрицу из упр. 7 в произведение элементарных. § 3. Ранг матрицы 1. Определение. Введем Определение. Пусть в матрице А существует линейно незави- независимая система из г строк, и нет линейно независимой системы из большего числа строк. Тогда мы будем говорить, что строчный ранг матрицы А равен г. Нулевая матрица не содержит никакой линей- линейно независимой системы строк, и ее строчный ранг по определению равен нулю. Аналогично определяется столбцовый ранг матрицы. Он равен ri, если есть линейно независимая система из г\ столбцов, и нет линейно независимой системы из большего числа столбцов. Столбцовый ранг нулевой матрицы по определению равен нулю. Предложение 1. Система из г строк линейно независима тог- тогда и только тогда, когда в этих строках найдется невырожденная подматрица порядка г. Доказательство. 1°. Пусть г строк линейно зависимы. Рас- Рассмотрим произвольную подматрицу порядка г, расположенную в этих строках. Если строки линейно зависимы, то также линейно зависимы (с теми же коэффициентами) и отрезки этих строк, составляющие подматрицу, и подматрица является вырожденной. 2°. Обратное утверждение докажем по индукции. Одна строка ли- линейно независима, если она не нулевая. В этом случае она содержит ненулевой элемент, составляющий невырожденную подматрицу по- порядка 1. Пусть теперь даны г линейно независимых строк. Первые г — 1 из них также линейно независимы, и по предположению индукции со- содержат невырожденную подматрицу порядка г — 1. Пусть ji,..., jr-i — номера столбцов этой подматрицы. Рассмотрим отрезок r-й стро- строки, расположенный под подматрицей, т. е. составленный из элементов с номерами ji,...,jr-i- По следствию из теоремы 1 §2 этот отрезок раскладывается в линейную комбинацию строк подматрицы. Коэф- Коэффициенты этой линейной комбинации обозначим ai,...,ar_i. Теперь будем рассматривать полные строки. Вычтем из последней строки линейную комбинацию предыдущих с теми же коэффициента- коэффициентами «1, ...,ar_i. Это обратит в нуль jb ..., jV-i-й элементы r-й строки, но не всю строку, так как строки линейно независимы. Таким обра- образом, в преобразованной r-й строке есть ненулевой элемент aj, и его
3. Ранг матрицы 133 номер j отличен от номеров ji,..., jr-i- В преобразованной матрице рассмотрим столбцы, имеющие номе- номера ji,..., jr-bj- (Мы для удобства пишем j на последнем месте, хо- хотя в действительности столбцы располагаются в порядке возраста- возрастания номеров.) Легко видеть, что эти столбцы линейно независимы. Действительно, пусть aia^ + ... + ar-1ajr_1 + olslj = о A) их нулевая линейная комбинация. Тогда для последних элементов столбцов а\0 + ... + ar-i0 + aa1^ = 0. Так как aj ф 0, отсюда следу- следует а = 0, и мы получаем а±^г + ... + ar-\3.jr_1 = о. Если бы среди коэффициентов этой линейной комбинации были отличные от нуля, то столбцы с номерами ji,...,jr-i были бы линейно зависимы. Это противоречило бы тому, что исходная подматрица порядка п — 1 не- невырождена. Таким образом, все коэффициенты в A) равны нулю, и столбцы с номерами ji,..., jV-ъ j линейно независимы. Отсюда следу- следует, что составленная ими подматрица порядка г невырождена. Невырождена соответствующая подматрица и в непреобразован- ной матрице, так как элементарными преобразованиями мы превра- превратили ее в невырожденную матрицу. Это заканчивает доказательство. Определение. В матрице А размеров т х п подматрица поряд- порядка г называется базисной, если она невырождена, а все квадратные подматрицы большего порядка, если они существуют, вырождены. Столбцы и строки матрицы А, на пересечении которых стоит ба- базисная подматрица, называются базисными столбцами и строками А. В силу предложения 1 базисные столбцы и строки линейно неза- независимы. Определение. Рангом матрицы называется порядок базисной подматрицы или, иначе, самый большой порядок, для которого су- существуют невырожденные подматрицы. Ранг нулевой матрицы по определению считают нулем. Отметим два очевидных свойства ранга. • Ранг матрицы не меняется при транспонировании, так как при транспонировании матрицы все ее подматрицы транспонируются, и при этом невырожденные подматрицы остаются невырожденными, а вырожденные — вырожденными. • Если А' — подматрица матрицы А, то ранг А' не превосходит ранга А, так как любая невырожденная подматрица, входящая в А1\ входит и в А. 2. Основные теоремы. Из предложения 1 прямо следует теоре- теорема о ранге матрицы: Теорема 1. Ранг любой матрицы равен ее строчному рангу и ее столбцовому рангу. Действительно, если строчный ранг А равен г, то в А найдется линейно независимая система из г строк, а значит, и невырожденная
134 Гл. V. Матрицы и системы линейных уравнений подматрица порядка г. Если при этом есть р > г различных строк А, то они линейно зависимы, и любая подматрица порядка р в них вы- вырождена. Столбцовый ранг равен строчному рангу АТ, значит, и ран- рангу Ат, а потому — рангу А. Таким образом, мы видим, что все три определения на самом деле определяют одно и то же число, и впредь не будем их различать. Будем говорить ранг матрицы и обозначать его Kg А. Из теоремы о ранге матрицы мы получаем теорему о базисном ми- миноре, на которую существенно опирается все дальнейшее изложение. Слово "минор" означает "детерминант подматрицы". В частности, базисный минор — это детерминант базисной подматрицы. О детер- детерминантах будет речь в следующем параграфе, а здесь это слово можно воспринимать просто как составную часть названия теоремы. Теорема 2. Каждый столбец матрицы раскладывается в линей- линейную комбинацию ее базисных столбцов. Доказательство. Каждый из базисных столбцов, разумеется, раскладывается по базисным: для этого достаточно взять его самого с коэффициентом 1, а остальные с нулевыми коэффициентами. Пусть теперь а^ — не базисный столбец. Базисные столбцы обо- обозначим через а^,..., щг. По теореме о ранге матрицы любые г + 1 столбцов линейно зависимы, и найдутся такие коэффициенты, что aia^ + ... + ars.ir + as.j = о. При этом мы можем быть уверены, что а ф 0, так как иначе это ра- равенство означало бы линейную зависимость базисных столбцов. Деля на а, мы получаем нужное нам разложение Следствие. Каждая строка матрицы раскладывается по ее ба- базисным строкам. 3. Ранг произведения матриц. Согласно предложениям б и 7 § 2 элементарные преобразования не меняют столбцового ранга. Та- Таким образом, справедливо Предложение 2. Ранг матрицы не меняется при элементарных преобразованиях. Отсюда и из предложения 9 § 2 прямо следует Предложение 3. Если матрица А невырождена и определены произведения АВ и С А, то KgAB = Kg В и KgCA = Kg С. В общем случае имеет место Предложение 4. Ранг произведения двух матриц не превосхо- превосходит рангов сомножителей. Доказательство. Пусть определено произведение АВ. Рассмот- Рассмотрим матрицу D, составленную из всех столбцов матриц А и АВ. Так как АВ — подматрица, Kg АВ ^ KgD.
3. Ранг матрицы 135 По предложению 1 § 2 столбцы АВ — линейные комбинации столб- столбцов А. Легко видеть, что приписывание к матрице линейной комбина- комбинации ее столбцов не меняет ранга матрицы. Действительно, не меняя ранга, элементарными преобразованиями столбцов мы можем обра- обратить приписанный столбец в нулевой, а добавление нулевого столбца не создает новых невырожденных подматриц. Отсюда следует, что RgD = Rg А Итак, Rg АВ ^ Rg A Аналогично доказывается, что KgAB ^ Rg??. Для этого надо со- составить матрицу D' из всех строк матриц В и АВ. 4. Нахождение ранга матрицы. Введем Определение. Матрица размеров т х п называется упрощенной (или имеет упрощенный вид), если некоторые г ее столбцов являются первыми г столбцами единичной матрицы порядка т и, в случае т > > г, ее последние т — г строк — нулевые. Предложение 5. Каждую матрицу с помощью элементарных преобразований строк можно превратить в упрощенную матрицу. Доказательство. Если матрица нулевая, то она уже упрощен- упрощенная (г = 0). В общем случае применим метод Гаусса. В предложении 8 § 2 мы превратили квадратную невырожденную матрицу элементар- элементарными преобразованиями строк в единичную матрицу. Это — частный случай доказываемого предложения. То обстоятельство, что матрица невырождена, использовалось, когда мы в очередной строке преобра- преобразованной матрицы находили ненулевой элемент. В общем случае ненулевой элемент может не найтись, т. е. оче- очередная строка окажется нулевой. Все встречающиеся нулевые строки будем переставлять на последние места и будем продолжать преоб- преобразования так, как при доказательстве предложения 8 § 2. Преобразования закончатся, когда либо будут исчерпаны все стро- строки, либо останутся только нулевые строки. При этом не существенно, квадратная матрица или нет. Конечно, может случиться, что некото- некоторые столбцы не будут превращены в столбцы единичной матрицы, но это нам и не требуется. Пусть всего в столбцы единичной мат- матрицы преобразовано г столбцов. Если остались строки ниже r-й, они нулевые, иначе преобразования можно продолжить. Предложение до- доказано. Пусть мы привели матрицу А к упрощенному виду, и в упро- упрощенной матрице А', столбцы aJX,..., aJr (ji < ... < jr) превращены в столбцы единичной матрицы ei,...,er. Можно считать, что aJfc —> е/, для всех к = 1, ...,г. Это достигается перестановкой строк. Рассмотрим упрощенную матрицу А'. В ней есть невырожденная подматрица порядка г, а невырожденных подматриц большего поряд- порядка, очевидно, нет. Следовательно, ранг матрицы равен г, а подматри- подматрица базисная. Из этого следует, что RgA = г, так как ранг не изменился при элементарных преобразованиях. За базисную подматрицу в А можно
136 Гл. V. Матрицы и системы линейных уравнений принять подматрицу, расположенную в столбцах с номерами ji,..., jr и строках, которые после перестановок попали на места 1,..., г в упро- упрощенной матрице. Это видно из того, что, преобразуя матрицу, мы не прибавляли к пересекающим ее строкам никаких строк, которые ее не пересекают. Таким образом, если мы не знали ранга матрицы и ее базисной подматрицы, то приведя ее к упрощенному виду, мы их определим. С другой стороны, имеет место Предложение 6. Какова бы ни была базисная подматрица мат- матрицы А, элементарными преобразованиями строк можно привести А к такому упрощенному виду, в котором базисные столбцы будут пер- первыми столбцами единичной матрицы. Действительно, небазисные строки можно обратить в нулевые, вы- вычитая из них подходящие линейные комбинации базисных. После это- этого можно превратить базисную подматрицу в единичную так, как это было сделано в предложении 8 §2. (Элементарные преобразования производятся, конечно, над полными строками.) Упражнения 1. Дана матрица А = 1 2 3 4 5 6 7 8 9 а) Найдите ее ранг и какую-либо базисную подматрицу. б) Найдите коэффициенты разложения небазисной строки по базисным строкам и небазисного столбца по базисным столбцам. в) Прибавьте в матрице вторую строку к первой и убедитесь, что ли- линейная зависимость между столбцами осталась прежней. г) Сколько всего базисных подматриц в этой матрице? 2. Квадратная матрица порядка п имеет нулевую подматрицу поряд- порядка п — 1. Оцените ранг матрицы. 3. Пусть А — матрица с элементами (ц3;, г = 1,..., m; j = 1,..., п и Rg A = = 1. Докажите, что найдутся числа ai,...,am и /3i,..., /Зп, не все равные нулю, такие, что ац = oa$j для всех г и j. 4. В матрице ранга г отмечены г линейно независимых строк и г ли- линейно независимых столбцов. Докажите, что на их пересечении стоит невы- невырожденная подматрица порядка г. Покажите на примере, что утверждение не верно, если число отмеченных строк меньше г. 5. Докажите, что для любых матриц А и В одинаковых размеров ранг суммы не больше суммы рангов. § 4. Детерминанты 1. Определение детерминанта. Мы будем говорить, что на мно- множестве квадратных матриц порядка п задана числовая функция, если каждой матрице из этого множества сопоставлено некоторое число. Примерами могут служить две часто употребляемые функции:
?. Детерминанты 137 след матрицы — функция, сопоставляющая каждой квадратной матрице сумму ее диагональных элементов ац + ... + апп; евклидова норма матрицы — функция, сопоставляющая каждой матрице квадратный корень из суммы квадратов всех ее элементов. Во многих вопросах необходимо уметь определить, вырождена данная матрица или нет. При этом полезна такая функция от мат- матрицы, которая равна нулю для вырожденных матриц, отлична от ну- нуля для невырожденных и при этом сравнительно просто вычисляется. Для матриц второго и третьего порядка такими функциями являются их детерминанты, уже известные нам. Определение. Числовая функция / на множестве всех квад- квадратных матриц порядка п называется детерминантом [или опреде- определителем) порядка п, а ее значение на матрице А — детерминан- детерминантом А, если она обладает следующими тремя свойствами. 1. Какую бы строку матрицы мы ни взяли, функция является ли- линейным однородным многочленом от элементов этой строки. Для г-й строки матрицы А это значит, что f(A) = 1цац + h2ai2 + ... + hnain, A) где /ii,...,/in — коэффициенты, не зависящие от элементов г-й стро- строки а^1, ...,ain, но зависящие от остальных элементов матрицы. 2. Значение функции на любой вырожденной матрице равно нулю. 3. Значение функции на единичной матрице равно 1. Детерминант матрицы А обозначается det А или, если нужно вы- выписать элементы матрицы, прямыми линиями по бокам матрицы. Рекомендуем читателю проверить, что известные нам детерми- детерминанты второго и третьего порядков удовлетворяют приведенному определению. Для матрицы порядка 1, состоящей из одного элемента, детерминантом является этот элемент. Когда определение состоит из условий, которым должен удовле- удовлетворять определяемый объект, заранее не ясно, выполнимы ли эти условия, т. е. существует ли объект, им удовлетворяющий. Кроме то- того, если такой объект существует, то не ясно, однозначно ли он опре- определен этими условиями. Ниже мы докажем существование и единст- единственность детерминанта. Мы докажем также, что для любой невырожденной матрицы де- детерминант отличен от нуля. Однако сначала необходимо изучить усло- условия, определяющие детерминант. Условие 1 выражает свойство линейности детерминанта по стро- строке. Его равносильную формулировку дает следующее Предложение 1. Функция / на множестве квадратных мат- матриц порядка п обладает свойством линейности по строке тогда и только тогда, когда для каждой строки произвольной матрицы А вы- выполнено следующее: если эта строка есть линейная комбинация ар +
138 Гл. V. Матрицы и системы линейных уравнений + /3q, строк р и q, mo f(A) = af(Ap)+/3f(Aq), B) где матрицы Ар и Aq получены из А заменой этой строки на р и q. Доказательство. 1°. Пусть функция / обладает свойством ли- линейности по строке A). Если г-я строка А есть линейная комбинация ар + /3q, то при любом & элемент а^ этой строки равен ар/, + /3qk, гдерк и qk — соответствующие элементы строк р и q. Следовательно, f(A) = /ц(сф1 + /%) + ... + hn(apn + Cqn). Группируя члены, мы получим f(A) = a(ftipi + ... + ftnpn) + /3(/ii^i + ... + hnqn). Здесь /ii, ...,/in не зависят от элементов г-й строки, и потому ftipi + ... + hnpn = f(Ap) и ftiqfi + ... + hnqn = /(Ag). Таким образом, получено равенство B). 2°. Докажем обратное. Возьмем г-ю строку матрицы А и разложим ее в линейную комбинацию строк единичной матрицы аце1 + ... + ainen. Последовательно применяя равенство B), получаем отсюда где матрицы Ai, ...,An получены из А заменой г-й строки на соответ- соответствующую строку единичной матрицы. Они не зависят от элемен- элементов г-й строки А, а потому значения / на данных матрицах также не зависят от этих элементов. Предложение доказано. Сформулированное в предложении 1 свойство также называют свойством линейности по строке и часто формулируют в виде двух отдельных утверждений. • Множитель, общий для всех элементов строки, может быть вынесен за знак детерминанта. • Если какая-либо из строк матрицы А есть сумма двух строк, то det А равен сумме детерминантов матриц, получаемых из А заменой этой строки на каждое из слагаемых. Разумеется, если строка матрицы представлена как линейная ком- комбинация aipi + ... + asps любого числа s строк, то det A = ai det Ax + ... + as det A8, C) где Ai,... As — матрицы, получаемые из А заменой рассматриваемой строки соответственно на pi,...,ps. Предложение 2. Если к некоторой строке матрицы прибавить другую ее строку, умноженную на число, то детерминант матрицы не изменится.
?. Детерминанты 139 Доказательство. Пусть в матрице А мы заменили г-ю стро- строку а^ на строку а^ + Aaj, г ф j. Тогда по свойству линейности детер- детерминант полученной матрицы А' равен det A' = det А + Л det Aj, где матрица Aj получается из А заменой г-й строки на j-ю. В эту матрицу строка а^ входит дважды: на г-м и на j-м местах. Поэтому матрица вырожденная, и det Aj = 0. Итак, det A = det A'. Предложение 3. Если две строки матрицы поменять местами, то ее детерминант умножится на (—1). Доказательство. Пусть матрица А' получается из А переста- перестановкой г-й и j-й строк. Выполним следующую последовательность преобразований матрицы А, не меняющих детерминанта в силу пред- предложения 2: А = а; + Детерминант последней матрицы равен детерминанту А и отличается только знаком от детерминанта матрицы А'. Свойство, выраженное предложением 3, носит название антисим- антисимметрии детерминанта по строкам. В дальнейшем нам потребуется Предложение 4. Пусть некоторая функция f на множестве квадратных матриц линейна по строкам, и для матриц, имеющих две одинаковые строки, ее значение равно нулю. Тогда на всех вырож- вырожденных матрицах ее значение равно нулю. Доказательство. Пусть А — произвольная вырожденная мат- матрица. Если строк больше одной, и они линейно зависимы, то одна из строк есть линейная комбинация остальных. Допустим для опре- определенности, что строка ai разложена по а2,...,ап с коэффициента- коэффициентами а2,..., ап. Тогда последовательно применяя формулу B), получаем где матрицы А2,...,Ап получены из А заменой первой строки на ее 2-ю, ...,п-ю строки. Каждая из них имеет две одинаковых строки, и потому f(Ai) =0, г — 2,...,п. Отсюда f(A) = 0, как и требовалось. 2. Единственность детерминанта. Начнем с того, что с помо- помощью известных нам свойств детерминанта вычислим детерминанты элементарных матриц. Если матрица Si получена из единичной умножением какой-либо строки на число Л ф 0, то det Si — Adet^E = Л, согласно свойству линейности детерминанта по строке. Если матрица $2 получена из
140 Гл. V. Матрицы и системы линейных уравнений единичной матрицы прибавлением одной строки к другой, то из пред- предложения 2 видно, что det S2 = det E = 1. Таким образом, имеет место Предложение 5. Если существуют две функции d\ и d2, удовле- удовлетворяющие определению детерминанта, то для любой элементарной матрицы di(S) = d2(S). Кроме того, легко проверить, что для любой матрицы А и любой элементарной матрицы S выполнено равенство det(SА) = det S det A. D) Действительно, достаточно вспомнить, что SA получается из А тем же элементарным преобразованием, что и S из Е. Отсюда для матриц первого типа det (Si А) = Л det А. Поскольку det/Si = Л, равенство D) справедливо. Точно так же, для матриц второго типа detE2^4) = det A и detS2 = 1. Теперь может быть доказана Теорема 1. На множестве квадратных матриц порядка п не мо- может быть более одной функции, удовлетворяющей определению де- детерминанта. Доказательство. Пусть существуют две такие функции di и d2. Докажем, что di(A) = d2(A) для любой квадратной матрицы А. Если А — вырожденная матрица, то по определению di(A) = = d2(A) =0. Рассмотрим невырожденную матрицу А. По предложению 9 § 2 она может быть разложена в произведение элементарных матриц. Последовательно применяя формулу D), мы получаем Аналогично, d2(A) = d2(Si)...d2(SN)- Теперь из предложения 5 следу- следует di(A) = d2(A), как и требовалось. Вместе с доказательством теоремы, мы получили важную форму- формулу: если невырожденная матрица А разложена в произведение эле- элементарных матриц, то det A = det Si... det SV. E) Отметим, что детерминант элементарной матрицы либо равен чис- числу Л ф 0, либо равен единице, т. е. в любом случае отличен от нуля. Из равенства E) тогда следует Предложение 6. Если матрица невырожденная, то ее детер- детерминант отличен от нуля. Следствие. Для того чтобы матрица была вырожденной, необ- необходимо и достаточно, чтобы ее детерминант был равен нулю. 3. Существование детерминанта. Разложение по столбцу. Минором матрицы называется детерминант какой-либо ее квадратной подматрицы. В частности, вводится Определение. Пусть ац — элемент матрицы А порядка п, рас- расположенный в г-й строке и j-м столбце. Назовем дополнительной под- подматрицей этого элемента матрицу D^ порядка п — 1, получаемую из
?. Детерминанты 141 А вычеркиванием г-й строки и j-ro столбца. Дополнительным мино- минором элемента ац назовем число dij = det Dij. Разумеется, говорить о дополнительном миноре имеет смысл толь- только в том случае, если детерминант порядка п — 1 существует. Теорема 2. На множестве квадратных матриц произвольного порядка определен детерминант. Докажем это методом полной индукции по порядку матрицы. На- Начало индукции трудностей не вызывает, так как мы знаем, что из- известные нам детерминанты второго и третьего порядка обладают нужными свойствами. Предположим теперь, что на множестве матриц порядка п — 1 де- детерминант существует, и построим на множестве матриц порядка п функцию следующим образом. Фиксируем произвольно номер столб- столбца j и произвольной матрице А порядка п сопоставим число k=i где dkj — дополнительный минор элемента ctkj в матрице А. Допол- Дополнительные миноры существуют в силу предположения индукции. До- Докажем, что функция F) удовлетворяет трем условиям, входящим в определение детерминанта. 1. Выберем произвольную строку (пусть ее номер г) и покажем, что выражение в правой части формулы F) есть линейный многочлен относительно элементов этой строки. В самом деле, при к = г слага- слагаемое aij(-iy+jdij содержит элемент ац из г-й строки. Коэффициент при нем не зависит от элементов г-й строки, так как эта строка в подматрицу D^ не входит. В остальных слагаемых (при г ф к) мно- множитель ctkj не принадлежит г-й строке, a dkj — линейный многочлен от элементов г-й строки. Теперь свойство линейности по строке для функции fj следует из того, что сумма линейных многочленов — ли- линейный многочлен. 2. Докажем, что для вырожденных матриц fj равна нулю. В си- силу предложения 4 и уже доказанной линейности по строке для это- этого достаточно проверить, что fj(A) = 0 для произвольной матрицы, имеющей две одинаковые строки. Пусть в матрице А строки с номе- номерами г и I одинаковы (I > г). Тогда в сумме F) могут быть не рав- равны нулю только два слагаемых, так как при к ф г и к ф I дополни- дополнительная подматрица Dkj содержит одинаковые строки, и потому минор dkj равен нулю. Итак, fj(A) = {-ly+iaijdij + (-l)l+Jaijdij. Учтем, что ац = aij ввиду совпадения строк. Тогда fi(A) = (-1)Ч((-1)% + (-1L-). G) Дополнительные подматрицы D^ и D\j состоят из одинаковых эле- элементов, но отличаются порядком строк: в каждой из них оста-
142 Гл. V. Матрицы и системы линейных уравнений лась одна из двух одинаковых строк, но в Dij она стоит на г-м мес- месте, а в D^ — на (I — 1)-м. Переставим в матрице D^ строку с номе- номером I - 1 на г-е место, не нарушая взаимное расположение остальных строк. Для этого меняем ее последовательно местами с (I — 2)-й, (I — — 3)-й, ..., г-й строками. Потребуется (I — 2) — (г — 1) = I — г — 1 пе- перестановок. Отсюда следует, что &ц — (-l)l~l~1dij. Подставив это в равенство G), мы увидим, что fj(A) = 0. 3. Рассмотрим fj(E), где Е — единичная матрица порядка п. В этом случае в сумме F) только одно ненулевое слагаемое Но Djj — единичная матрица порядка п - 1, и ее детерминант ра- равен 1. Отсюда fj(E) = 1, как и требовалось. Теорема доказана. В силу теоремы 1 функции fj при всех j совпадают, и мы можем написать: п AetA = Yjakj{-l)k+4kj. (8) к=1 Правая часть этой формулы — линейный многочлен от элемен- элементов j-ro столбца, следовательно, имеет место Предложение 7. Детерминант обладает свойством линейнос- линейности по столбцам. 4. Свойства детерминантов. Используя формулу (8) разложе- разложения детерминанта по столбцу, мы можем найти коэффициенты в фор- формуле A). Предложение 8. Каков бы ни был номер строки г, детерминант матрицы А порядка п вычисляется по формуле det A = J2aij(-Vi+J dij, (9) j=i где dij — дополнительный минор элемента ац. Доказательство. Для того чтобы найти коэффициент hj при dij в формуле A), сгруппируем все члены в этой формуле, кроме интересующего нас, и обозначим их сумму через q. Тогда det A = hjOLij + q. Аналогично мы можем преобразовать разложение по j-му столбцу: det A = aij(-l)i+jdij + г. По определению hj не зависит от элементов г-й строки, a q содержит все ее элементы кроме ац. Точно так же, при всех к в дополнитель- дополнительную подматрицу Dkj не входит j-й столбец, и, следовательно, йщ не зависит от dij. В частности, d^ не зависит от ац. Отсюда же видно, что и г не зависит от этого элемента. Заметив это, обозначим через Aq матрицу, которая получена из матрицы А заменой элемента ац на 0, и увидим, что detAo = q и
?. Детерминанты 143 det Aq = г. Учтем это при вычислении детерминанта матрицы Ai, от- отличающейся от А заменой элемента ац на 1: det A1=hj+r = (-l)i+jdij + г. Отсюда получается нужное значение для hj. Предложение 9. Для любой квадратной матрицы = detAT. Для доказательства определим функцию от матрицы А равенст- равенством f(A) = det AT. По предложению 7 эта функция линейна по столб- столбцам Ат, т. е. по строкам А. Если матрица А вырождена, то вырож- вырождена и Ат (согласно следствию из предложения 9 § 2), и потому f(A) = det Ат = 0. Наконец, Ет = Е,а значит, f(E) = det ET = detE = = 1. Таким образом, / удовлетворяет всем условиям в определении детерминанта, что и заканчивает доказательство. Из предложения 9 следует равноправность строк и столбцов. Имен- Именно, если справедливо какое-либо утверждение о детерминантах, касающееся строк матриц, то верно и аналогичное утверждение, касающееся столбцов, и обратно. Поэтому известные нам свойства детерминантов можно переформулировать для столбцов. Предложение 10. Столбцы матрицы линейно зависимы, тогда и только тогда, когда матрица вырождена и детерминант ее равен нулю. Если переставить два столбца матрицы, то ее детерминант ум- умножится на (—1). Если в матрице к одному из столбцов прибавить другой, умножен- умноженный на число, то детерминант ее не изменится. Предложение 11. Для любых двух квадратных матриц одного порядка det АВ = det A det В. Доказательство. Пусть матрица А невырождена. Разложим ее в произведение элементарных матриц. Тогда АВ = S\...SnB. По- Последовательно применяя формулу D), получим det АВ = det Si... det SN det В. Теперь из формулы E) следует нужное утверждение. Если же матрица А порядка п вырождена, то RgA < п. Из пред- предложения 4 § 3 тогда следует Rg АВ < п. Значит, произведение АВ также вырождено и det АВ равен нулю так же, как и det A det В. 5. Формула полного разложения. Здесь мы получим формулу полного разложения детерминанта порядка п, представляющую его как многочлен от элементов матрицы. Введем предварительно некоторые определения. Мы будем назы- называть перестановкой чисел 1, ...,п эти числа, написанные в каком-либо
144 Гл. V. Матрицы и системы линейных уравнений определенном порядке. Например, из чисел 1 и 2 образуются две пе- перестановки: 1, 2 и 2, 1. Перестановку чисел 1,...,п обозначим ii,...,гп. Число гк виновно в нарушении порядка в перестановке гь ...,гп, ес- если оно стоит левее меньшего числа: k < s, но гк > г8- Например, при п = 4 в перестановке 2, 4, 3, 1 числа 2 и 3 виновны каждое в одном нарушении порядка, а число 4 — в двух. Итак, общее число наруше- нарушений порядка в перестановке равно четырем. Число всех нарушений порядка в перестановке ii,...,in мы обозначим N(ii, ...,in). Перестановка называется четной, если iV(n, ...,in) — четное чис- число, и нечетной в противном случае. Докажем формулу полного разложения: det A0) Сумма в правой части равенства берется по перестановкам. Это озна- означает, что каждой перестановке чисел 1, ...,п соответствует слагаемое. Слагаемое для перестановки ii,...,in, составляют так: берут из 1-й строки ii-й элемент, из 2-й строки — г2-й элемент и т. д. и перемно- перемножают их. В результате в произведение входит по одному и только по одному элементу из каждой строки и каждого столбца. Произведения складываются со знаками, определяемыми четностями соответству- соответствующих перестановок. Формулу A0) мы докажем по индукции. Пусть при п = 2 дана матрица пц CL\2 Двум перестановкам 1, 2 и 2, 1 отвечают, соответственно, сла- слагаемые (—1OУA'2^аца22 и (—lOV^2'1^ai2a2i. Их сумма равна аца22 — -ai2a2i, т. е. как раз детерминанту данной матрицы. Допустим, что формула верна для матриц порядка п — 1, и дока- докажем ее для произвольной матрицы А порядка п. Напишем разложе- разложение det А по первой строке: п detA = ^(-l)*+1ai*di*. (И) к=1 В к-е слагаемое этого разложения входит множитель d±kj равный де- детерминанту подматрицы Dlk. Порядок этой матрицы п - 1, и по пред- предположению индукции dlk = detDlk = У^ ( Здесь все номера ii,...,in_i отличны от к, а первые индексы у со- сомножителей равны 2, ...,п, так как, сохраняя старые обозначения для элементов матрицы А, мы должны учесть, что в D\k не входят первая строка и к-й столбец.
?. Детерминанты 145 Теперь в к-м слагаемом формулы A1) можно внести множитель (—l)k+1aik П°Д знак суммы и записать это слагаемое так: (-l)k+1alkdlk = Числа &,ii, ...,in_i образуют перестановку чисел 1,...,п, причем так как правее к стоит ровно к — 1 чисел, меньших к. Следовательно, N(k,ii,...,in-i) имеет ту же четность, что и N(ii,...,in-i) + к + 1, и мы имеем В правой части этого выражения собраны все те члены из суммы A0), которые соответствуют перестановкам, имеющим к на первом месте. В сумму A1) входят слагаемые для любого к, и потому сумма A1) содержит все члены суммы A0) и, конечно, не содержит никаких других членов. Этим формула полного разложения доказана. Упражнения 1. Пусть А — квадратная матрица порядка п. Выразите det aA че- через det A. 2. Пусть А — квадратная матрица порядка 2п+ 1, и Ат = —А. Дока- Докажите, что det A = 0. 3. Докажите, что детерминант любой треугольной матрицы равен про- произведению ее диагональных элементов. 4. Вычислите 1 1 2 1 0 4 0 5 8 0 9 4 1 3 3 1 5. Матрица А порядка п содержит нулевую подматрицу размеров m x к, причем m + к > п. Докажите, что det A = 0. 6. Пусть матрица Р порядка п разделена на 4 подматрицы так: Р = Здесь А и С — квадратные матрицы порядков кип — к, а О — нулевая матрица размеров (п — к) х к. Докажите, что det P = det A det С. 7. К каждому элементу матрицы А прибавлено одно и то же число t. Пусть получившаяся матрица — A(t). а) Докажите, что det A(t) = kt + 6, где к и Ь не зависят от t. б) Найдите к и Ь. 8. Вычислите детерминант порядка п: 2 1 1 ... 1 -12 1 ... 1 -1 -1 -1 -1 2 1 -1 2 10 Д.В. Беклемишев
146 Гл. V. Матрицы и системы линейных уравнений 9. Два квадратных многочлена ах2 + Ьх + с и ах2 + /Зх + 7> имеют об- общий корень. Докажите, что а Ъ с О О а Ь с а C 7 О О а /3 7 = 0. 10. Сколько нарушений порядка в перестановке E, 4, 3, 2, 1)? § 5. Системы линейных уравнений (основной случай) 1. Постановка задачи. Систему уравнений вида \хх а\х а\х2 а2пхп = A) мы будем называть системой т линейных уравнений с п неизвестны- неизвестными ж1, ...,жп. Коэффициенты этих уравнений мы будем записывать в виде матрицы А = а\ п in п in а2 ... ап называемой матрицей системы. Числа, стоящие в правых частях уравнений, образуют столбец Ь, называемый столбцом свободных членов. Матрица системы, дополненная справа столбцом свободных чле- членов, называется расширенной матрицей системы и в этой главе обо- обозначается А*: А* = а] а\ ... а\ Ь1 а'А Ъш Если свободные члены всех уравнений равны нулю, то система называется однородной. Определение. Совокупность п чисел а1,...^71 называется ре- решением системы A), если каждое уравнение системы обращается в числовое равенство после подстановки в него чисел а1,...,^™ вместо соответствующих неизвестных х1,...,хп. Пользуясь определением линейных операций со столбцами, мы мо- можем записать систему A) в виде ь1 ът
§ 5. Системы линейных уравнений (основной случай) 147 (пример 1 § 1) или, короче, х1*! + ... + жпап = Ь, где ai, ...,ап — столбцы матрицы системы, a b — столбец свободных членов. Отсюда сразу вытекает следующая интерпретация решения системы линейных уравнений. Предложение 1. Решение системы линейных уравнений — это совокупность коэффициентов, с которыми столбец свободных членов раскладывается по столбцам матрицы системы. Используя умножение матриц, можно записать систему A) еще короче: Ах = b (пример 1 § 2). Выбор обозначений определяется решаемой задачей. Наша цель состоит в нахождении всех решений системы A), при- причем мы не делаем заранее никаких предположений относительно ко- коэффициентов и свободных членов системы и даже относительно числа уравнений и неизвестных. Поэтому могут представиться различные возможности. Система может вообще не иметь решения, как система х1+х2 = 1, х1 + х2 =0, определяющая две параллельные прямые. Система может иметь бес- бесконечное множество решений, как система (п = 2, т = 1) х1 + х2 = 0, решением которой является любая пара чисел, равных по модулю и отличающихся знаком. Примеры систем, имеющих одно-единственное решение, в изобилии встречаются в школьном курсе. Системы, имеющие решения, называются совместными, а не имеющие решений — несовместными. Как следствие предложения 1 и предложения б § 1 мы получаем Предложение 2. Если столбцы матрицы системы линейно не- независимы, то система не может иметь двух различных решений: она или несовместна, или имеет единственное решение. Основным средством исследования и решения систем линейных уравнений для нас будут элементарные преобразования матриц. При- Причину этого показывает Предложение 3. Элементарным преобразованиям строк расши- расширенной матрицы системы A) соответствуют преобразования систе- системы уравнений, не меняющие множества ее решений. Действительно, если строка матрицы А* умножается на число Л ф 0, то преобразованная матрица является расширенной матрицей для системы, получаемой из A) умножением соответствующего урав- уравнения на Л. Если в матрице г-я строка прибавляется к j-й, то в системе уравнений г-е уравнение прибавляется к j-му. В любом случае преоб- преобразованная система является следствием исходной. Но элементарные преобразования обратимы, а значит, и исходная система может быть получена из преобразованной и является ее следствием. Поэтому мно- множества решений обеих систем совпадают. ю*
148 Гл. V. Матрицы и системы линейных уравнений 2. Основной случай. В этом параграфе мы рассмотрим основ- основной случай, когда число уравнений равно числу неизвестных: т = п. Кроме того, мы наложим определенные ограничения на коэффициен- коэффициенты системы. Если этого не сделать, то нам придется изучать здесь, например, и систему из одного уравнения, повторенного п раз. Мы хотим, чтобы ни одно уравнение не было следствием остальных. Для этого во всяком случае необходимо, чтобы ни одно из них не было линейной комбинацией остальных (в действительности, этого и до- достаточно, но мы можем не вникать сейчас в этот вопрос). В случае т = п для линейной независимости уравнений необходимо потребо- потребовать, чтобы матрица системы была невырожденной, или, что то же, чтобы ее детерминант был отличен от нуля. Действительно, если одно из уравнений — линейная комбинация остальных с коэффициентами ai, ...,an_i, то соответствующая строка расширенной матрицы есть линейная комбинация остальных строк с теми же коэффициентами. То же относится и к матрице системы. Теорема 1. Пусть дана система из п уравнений с п неизвест- неизвестными а\хх + а\х2 + ... + а^х71 = Ъ1, а\хх + а\х2 + ... + а2пхп = Ь2, ^\ + ... + <жп = Ьп. Если детерминант матрицы системы отличен от нуля, то сис- система имеет решение, и притом только одно. В самом деле, зная предложение 1, мы можем сформулировать эту теорему иначе. Пусть А — квадратная матрица порядка п и det А^О. Тогда любой столбец b высоты п раскладывается по столбцам А, и коэффициенты разложения определены однозначно. Так как отличие детерминанта от нуля равносильно невырожденности матрицы, это утверждение совпадает с теоремой 1 § 2. 3. Правило Крамера. Правилом Крамера называются формулы для нахождения решения системы из п уравнений с п неизвестными и детерминантом, отличным от нуля. Для того, чтобы найти значения неизвестных, составляющие ре- решение, выберем произвольный номер неизвестной j и рассмотрим детерминант матрицы, получаемой из матрицы системы заменой ее г-го столбца столбцом свободных членов b : Аг = det ||ai ...Щ- Если ж1,...,^ — решение, то b = x1^ + ... + жпап, и в силу линей- линейности детерминанта по столбцу Дг = х1 det || ai ... a;_i ai ai+i ... an || + ... ... + x% det || ai ... Щ-\ щ щ+\ ... an || + xn det || ai ... Щ-\ an a^_i ... an || .
§ 6. Системы линейных уравнений (общая теория) 149 Все слагаемые, кроме г-го, равны нулю, так как матрицы в них имеют по два одинаковых столбца. Поэтому Аг = хг det А. Отсюда Формулы Крамера при п = 3 мы вывели в п. 6 §4 гл. I. 4. Формулы для элементов обратной матрицы. Рассмотрим квадратную матрицу А с детерминантом, отличным от нуля. Пра- Правило Крамера позволяет получить формулы, выражающие элементы обратной матрицы А~х через элементы А. Пусть е^ — j-R столбец единичной матрицы. Заметим, что j-R столбец А~х при произволь- произвольном j равен A-1ej. Если мы обозначим его Xj, то A*j = е^. При- Применим правило Крамера для нахождения i-R неизвестной в решении этой системы: ж*- = A*/det А, где Аг — детерминант матрицы, полу- получаемой из А заменой ее г-ro столбца на j-R столбец единичной матри- матрицы. Разлагая Аг по этому столбцу, мы имеем только одно слагаемое, так как в е^ только j-R элемент равен 1, а остальные равны нулю. Следовательно, Аг = (-1)г+^, где d\ — дополнительный минор эле- элемента а\ в матрице А. Подчеркнем, что этот элемент стоит в позиции, симметричной с позицией, в которой расположен вычисляемый нами элемент х]. Окончательно, \ ( \ D) 3~ det A • D) Формулы D), как и правило Крамера, имеют некоторое теорети- теоретическое значение, но для численного решения систем линейных урав- уравнений и обращения матриц применяются совсем другие методы. Упражнения 1. Пусть числа х\,Х2,х$ попарно различны. Докажите, что при лю- любых 2/1,2/2,2/3 найдется единственный многочлен степени не выше двух, гра- график которого проходит через точки с координатами (х\, г/i), (жг, 2/2), (жз, уз)- 2. Пользуясь формулами D), найдите обратную для матрицы а Ъ с d § 6. Системы линейных уравнений (общая теория) 1. Условия совместности. Общие определения, касающиеся сис- систем линейных уравнений, были введены в начале §5. Теперь мы зай- займемся изучением систем из т уравнений с п неизвестными. Систему 11. 1 2 , , Л п 7 1 1 db | Lt/O db | • • • | \A)(ул w \J • 91. 99. . 9 n 79 afx1 + a^x* + ... + a^xn = oz, tl-i Jb ~r t*O «^ "Г ... "Г U/^, X — U
150 Гл. V. Матрицы и системы линейных уравнений мы можем кратко записать в виде Ах = Ь. A) Система задается своей расширенной матрицей А*, получаемой объединением матрицы системы А и столбца свободных членов Ь. Простое и эффективное условие, необходимое и достаточное для совместности системы A), дает следующая теорема, называемая те- теоремой Кронекера-Капелли. Теорема 1. Система линейных уравнений совместна тогда и только тогда, когда ранг матрицы системы равен рангу расширен- расширенной матрицы. Иначе утверждение теоремы можно сформулировать так: припи- приписывание к матрице А размеров т х п столбца b высоты т не меняет ее ранга тогда и только тогда, когда этот столбец — линейная ком- комбинация столбцов А. Докажем это. Если RgA* = RgA, то базисный минор А являет- является базисным и для А*. Следовательно, b раскладывается по базис- базисным столбцам А. Мы можем считать его линейной комбинацией всех столбцов А, добавив недостающие столбцы с нулевыми коэффициен- коэффициентами. Обратно, если b раскладывается по столбцам А, то элементарны- элементарными преобразованиями столбцов можно превратить А* в матрицу Aq, получаемую из А приписыванием нулевого столбца. Согласно предло- предложению 2 § 3, Rg^-о = Rg^4*. С другой стороны, RgAo = Rg^4, так как добавление нулевого столбца не может создать новых невырож- невырожденных подматриц. Отсюда Rg A = RgA*, как и требовалось. Предложение 1. Пусть матрица А* приведена к упрощенному виду с помощью элементарных преобразований строк. Система A) не- несовместна тогда и только тогда, когда в упрощенную матрицу вхо- входит строка || 0 ... 0 11|. Доказательство. Пусть рассматриваемая система не совмест- совместна, и RgA* > RgA = r. В упрощенном виде матрицы А последние т — г строк — нулевые. Последний столбец матрицы А* должен быть базисным, и в упрощенном виде матрицы А* последний столбец — г + 1-й столбец единичной матрицы. Поэтому г + 1-я строка этой мат- матрицы есть || 0 ... 0 11|. Обратно, если в матрице содержится такая строка, то последний столбец не может быть линейной комбинацией остальных, и система с упрощенной матрицей несовместна. Тогда несовместна и исходная система (предложение 3 §5). Иначе это предложение можно сформулировать так. Следствие. Система линейных уравнений несовместна тогда и только тогда, когда противоречивое равенство 0 = 1 является линей- линейной комбинацией ее уравнений. Равенство рангов матрицы системы и расширенной матрицы мож- можно выразить, понимая ранг матрицы как строчный ранг. Это приведет
§ 6. Системы линейных уравнений (общая теория) 151 нас к важной теореме, известной как теорема Фредголъма. Транспонируем матрицу А системы A) и рассмотрим систему из п линейных уравнений \ а\у2 + ... + а^ут = О, а\у2 + ... + а^ут = 0, ^) alvi + а2пУ2 + ... + а™ут = О с т неизвестными, матрицей АТ и свободными членами, равными нулю. Она называется сопряженной однородной системой для системы A). Если у — столбец высоты m из неизвестных, то систему B) можно записать как Ату = о, или лучше в виде утА = о, C) где о — нулевая строка длины п. Теорема 2. Для того чтобы система A) была совместна, необ- необходимо и достаточно, чтобы каждое решение сопряженной однородной системы C) удовлетворяло уравнению уТЪ = у1Ь1+... + УтЬт = О. D) Доказательство. 1°. Пусть система A) совместна, т. е. су- существует столбец х высоты п, для которого Ах = Ь. Тогда для любо- любого столбца у высоты т выполнено уТАх = yTb. Если у — решение системы C), то yTb = (утА)х = ох = 0. 2°. Предположим теперь, что система A) несовместна. Тогда со- согласно предложению 1 строка ||0 ... 0 11| входит в упрощенный вид расширенной матрицы А* = \\А \ Ь|| и, следовательно, является ли- линейной комбинацией ее строк. Обозначим коэффициенты этой линей- линейной комбинации 2/1,...,уш и составим из них столбец у. Для этого столбца ут|| (предложение 1 § 2). Это же равенство можно расписать как два: утА = о и yTb = 1. Итак, нам удалось найти решение системы C), не удовлетворяющее условию D). Это заканчивает доказательство. В качестве примера применим теорему Фредгольма к выводу усло- условия параллельности двух различных прямых на плоскости. Их урав- уравнения составляют систему А-ух + Biy + d = 0, А2х + В2у + С2 = 0. Она не имеет решений, если существуют такие числа з/ъ 2/2, что 2/i^i + У^А2 = 0, 2/1 #i + 2/2#2 = 0, но 2/iCi + у2С2 ф 0. Ясно, что ух и у2 не равны нулю. Поэтому можно положить Л = —у2/у\ и запи- записать полученное условие в виде: существует число Л такое, что А\ — — \A2l В\ — ХВ2 и С\ ф ХС2. В таком виде условие нам известно из предложения 7 § 2 гл. П.
152 Гл. V. Матрицы и системы линейных уравнений 2. Нахождение решений. В этом пункте мы будем предпола- предполагать, что дана совместная система из т линейных уравнений с п неизвестными. Ранг матрицы системы обозначим г. Поскольку ранг расширенной матрицы тоже равен г, мы можем считать базисные столбцы матрицы системы базисными столбцами расширенной мат- матрицы. Элементарными преобразованиями строк приведем расширен- расширенную матрицу к упрощенному виду (предложение б §3). Наша система линейных уравнений перейдет в эквивалентную ей систему из г ли- линейно независимых уравнений. Для удобства записи будем предполагать, что первые г столбцов — базисные. Тогда преобразованную систему можно записать в виде х1=/31-{а1г+1хг+1 + ... + а1пхп), E) хг =CГ - «+1xr+1 + ... + агпхп). Здесь alj и (Зг — элементы преобразованной расширенной матрицы. В левых частях равенств мы оставили неизвестные, соответствующие выбранным нами базисным столбцам, так называемые базисные не- неизвестные. Остальные неизвестные, называемые параметрическими, перенесены в правые части равенств. Как бы мы ни задали значения параметрических неизвестных, по формулам E) мы найдем значения базисных так, что они вместе со значениями параметрических неизвестных образуют решение систе- системы A). Легко видеть, что так мы получим все множество решений. На формулах E) можно было бы и остановиться, но ниже мы да- дадим более простое и наглядное, а также принципиально важное опи- описание совокупности решений системы линейных уравнений. 3. Приведенная система. Сопоставим системе линейных урав- уравнений A) однородную систему с той же матрицей коэффициентов: Ах = о. F) По отношению к системе A) она называется приведенной. Предложение 2. Пусть xq —решение системы A). Столбец х также будет ее решением тогда и только тогда, когда найдется та- такое решение у приведенной системы F), что х = х0 + у. Доказательство. Пусть х — решение системы A). Рассмот- Рассмотрим разность у = х — xq. Для нее Ау — Ах — Axq = b — b = о. Обратно, если у — решение системы F), и х = х0 + у, то Ах = = Ахо + Ау = Ь + о = Ь. Это предложение сводит задачу описания множества решений сов- совместной системы линейных уравнений к описанию множества реше- решений ее приведенной системы. Однородная система совместна. Действительно, нулевой столбец является ее решением. Это решение называется тривиальным. Пусть столбцы матрицы А линейно независимы, т. е. RgA = п.
§ 6. Системы линейных уравнений (общая теория) 153 Тогда система F) имеет единственное решение (предложение 2 § 5) и, следовательно, нетривиальных решений не имеет. Предложение 3. Если xi и Х2 — решения однородной системы, то любая их линейная комбинация — также решение этой системы. Действительно, из Axi = о и Ах2 = о для любых а и /3 следу- следует A(ax.i + /2x2) = аАк\ + /ЗАх.2 = о. Если однородная система имеет нетривиальные решения, то мож- можно указать несколько линейно независимых решений таких, что любое решение является их линейной комбинацией. Сделаем это. Определение. Матрица F, состоящая из столбцов высоты п, называется фундаментальной матрицей для однородной системы с матрицей А, если: а) AF = О; б) столбцы F линейно независимы; в) ранг F максимален среди рангов матриц, удовлетворяющих условию а). Столбцы фундаментальной матрицы называются фундаменталь- фундаментальной системой решений. Если фундаментальная матрица существует, то каждый ее столбец в силу условия (а) — решение системы. Если система не имеет не- нетривиальных решений, то фундаментальной матрицы нет. Это будет в том случае, когда столбцы А линейно независимы: Rg A = п. Ниже мы докажем, что в остальных случаях фундаментальная матрица существует, но сначала выясним, что означает третье усло- условие в определении. Предложение 4. Пусть А — матрица размеров т хп и ран- ранга г. Если AF = О, то RgF ^ п - г. Доказательство. Приведем матрицу А к упрощенному ви- виду элементарными преобразованиями строк, а затем элементарны- элементарными преобразованиями столбцов обратим в нулевые все небазисные столбцы. Мы получим матрицу А' = PAQ, где Р и Q — произведе- произведения соответствующих элементарных матриц. Первые г строк А' — строки единичной матрицы порядка п, а остальные — нулевые. Обо- Обозначим F' = Q~XF. Тогда RgF' = RgF. Используя предложение 1 § 2, легко заметить, что первые г строк матрицы A'F' совпадают с первыми г строками F''. Но A'F' = PAF = О и, следовательно, F' со- содержит г нулевых строк. Так как всего в ней п строк, RgF; ^.п — г. Это равносильно доказываемому утверждению. Покажем теперь, как может быть построена фундаментальная мат- матрица. Согласно предложению 1 § 5, решение однородной системы со- состоит из коэффициентов равной нулю линейной комбинации столбцов матрицы системы. Мы можем получить такие линейные комбинации, основываясь на теореме о базисном миноре. Снова для удобства за- записи будем считать, что в матрице А первые г столбцов — базисные. Каждый из небазисных столбцов а^ (j = г + 1, ...,п) раскладывается
154 Гл. V. Матрицы и системы линейных уравнений по базисным: SLj = Oj G) является Отсюда следует, что столбец ||— aj ... — aj 0 ... О 1 0 ... О решением. (Единица в нем стоит на j-м месте.) Таких решений можно составить столько, сколько есть небазис- небазисных столбцов, т. е. п - г. Убедимся в том, что эти решения линейно независимы. Для этого объединим все столбцы в одну матрицу (8) Подматрица в последних п — г строках — единичная. Поэтому ранг матрицы (8) равен числу столбцов, и столбцы линейно независимы. Таким образом, мы получили Предложение 5. Если ранг матрицы однородной системы ли- линейных уравнений г меньше числа неизвестных п, то система имеет фундаментальную матрицу из п — г столбцов. Итак, система столбцов (8) — фундаментальная система решений. Она называется нормальной фундаментальной системой решений. Каждому выбору базисных столбцов соответствует своя нормаль- нормальная фундаментальная система решений. Вообще же, каждая систе- система из п - г линейно независимых решений является фундамен- фундаментальной. Для нахождения матрицы (8) можно привести матрицу А сис- системы к упрощенному виду, что даст коэффициенты разложения небазисных столбцов по базисным. (См. задачу 3 § 3 и задачу 4 настоящего параграфа.) Пусть F — фундаментальная матрица системы Ах = о. Рассмот- Рассмотрим произвольный столбец с высоты п — г. Произведение Fc — стол- столбец высоты п, и из равенства AFc = о следует, что при любом с столбец Fc — решение системы. Оказывается, имеет место Предложение 6. Столбец х — решение системы Ах = о тогда и только тогда, когда существует такой столбец с, что х = Fc. (9) Остается доказать необходимость условия. Пусть х — решение. Присоединив его к F, получим матрицу F* = || F | х || . Эта матри- матрица удовлетворяет условию AF* = О, так как каждый ее столбец — решение. Значит, RgF* = п — г. По теореме Кронекера-Капелли мы заключаем отсюда, что существует столбец с, удовлетворяющий сис- системе Fc = х.
Системы линейных уравнений (общая теория) 155 4. Общее решение системы линейных уравнений. Теперь мы можем собрать воедино наши результаты — предложения 2 и 6. Теорема 3. Если xq — некоторое решение системы A), a F — фундаментальная матрица ее приведенной системы, то столбец х = х0 + Fc A0) при любом с является решением системы A). Наоборот, для каждого ее решения х найдется такой столбец с, что оно будет представлено формулой A0). Выражение, стоящее в правой части формулы A0), называется общим решением системы линейных уравнений. Если fi,...,fn_r — фундаментальная система решений, a ci, ...,cn_r — произвольные по- постоянные, то формула A0) может быть написана так: X = Х0 + Cifi + ... + Cn_rfn_r. A1) Теорема 3 верна, в частности, и для однородных систем. Ес- Если х0 — тривиальное решение, то A0) совпадает с (9). Теорема 1 § 5 гласит, что для существования единственного реше- решения системы из п линейных уравнений с п неизвестными достаточно, чтобы матрица системы имела детерминант, отличный от нуля. Сей- Сейчас легко получить и необходимость этого условия. Предложение 7. Пусть А — матрица системы из п линейных уравнений с п неизвестными. Если det A = 0, то система либо не имеет решения, либо имеет бесконечно много решений. Доказательство. Равенство det А = 0 означает, что Rg А < п и, следовательно, приведенная система имеет бесконечно много ре- решений. Если данная система совместна, то из теоремы 3 следует, что и она имеет бесконечно много решений. 5. Пример. Рассмотрим уравнение плоскости как систему Ах + By + Cz + D = 0 A2) из одного уравнения. Пусть А ф 0 и потому является базисным мино- минором матрицы системы. Ранг расширенной матрицы 1, значит, система совместна. Одно ее решение можно найти, положив параметрические неизвестные равными нулю: у = z = 0. Мы получим х = —D/A. Так как п = 3, г = 1, фундаментальная матрица имеет два столбца. Мы найдем их, придав параметрическим неизвестным два набора значе- значений: 2/ = 1, г = 0 и |/ = 0, z — \. Соответствующие значения базис- базисной неизвестной ж, найденные из приведенной системы, будут —В/А и —С/А. Итак, общее решение системы A2) -D/A 0 0 -В/А 1 0 + с2 -С/А 0 1 A3) Выясним геометрический смысл полученного решения. Очевид- Очевидно, прежде всего, что решение || — D/A 0 0 ||т состоит из координат
156 Гл. V. Матрицы и системы линейных уравнений некоторой (начальной) точки плоскости, или, что то же, из компо- компонент ее радиус-вектора. В формуле A0) решение xq можно выбирать произвольно. Это соответствует произволу выбора начальной точки плоскости. Согласно предложению 2 § 2 гл. II компоненты лежащих в плоскости векторов удовлетворяют уравнению Act\ + Ва^ + Са% = 0, т. е. приведенной системе. Два линейно независимых решения этой системы (фундаментальная система решений) могут быть приняты за направляющие векторы плоскости. Таким образом, формула A3) — не что иное, как параметрические уравнения плоскости. Рекомендуем читателю рассмотреть систему уравнений двух пе- пересекающихся плоскостей и показать, что ее общее решение пред- представляет собой параметрические уравнения прямой. Упражнения 1. Система линейных уравнений с матрицей А совместна при любом столбце свободных членов тогда и только тогда, когда строки матри- матрицы А линейно независимы. Докажите это: а) пользуясь теоремой Кронекера-Капелли; б) пользуясь теоремой Фредгольма. 2. Даны векторы а и b, a / 0. При помощи теоремы Фредгольма дока- докажите, что уравнение [а, х] = b имеет решение тогда и только тогда, ког- когда (а,Ь) =0. 3. Найдите фундаментальную матрицу для системы с матрицей hi 11II- 4. Пусть \\ЕГ | В\\ — упрощенный вид матрицы однородной системы уравнений. Найдите фундаментальную матрицу системы. 5. Пусть F — фундаментальная матрица системы линейных уравне- уравнений Ах. = 0 и строки А линейно независимы. Какая будет фундаментальная матрица у системы: a) Fy = 0; б) FTъ = О? 6. Напишите общее решение системы с расширенной матрицей 1 4 7 2 5 8 3 6 9 1 1 1 7. Пусть матрица F размеров n x p — фундаментальная матрица неко- некоторой системы уравнений. Докажите, что F' будет фундаментальной мат- матрицей той же системы тогда и только тогда, когда найдется невырожденная матрица Q порядка р, такая, что F' = FQ. 8. Рассматривается система из трех уравнений с двумя неизвестными. Убедитесь, что применение теоремы Фредгольма к этой системе равносиль- равносильно такому (геометрически очевидному) утверждению: вектор b расклады- раскладывается по векторам ai и а2 тогда и только тогда, когда он ортогонален каждому вектору у, ортогональному этим векторам. 9. Пусть строки матрицы А линейно независимы, F - соответствующая фундаментальная матрица, а матрица D получена из А приписыванием к ней снизу матрицы FT. Докажите, что D невырождена.
ГЛАВА VI ЛИНЕЙНЫЕ ПРОСТРАНСТВА § 1. Основные понятия 1. Определение линейного пространства. В этой книге нам уже встречались множества, в которых были определены линейные операции: сложение и умножение на число. В гл. I мы рассматрива- рассматривали множество векторов (направленных отрезков), которые мы можем складывать и умножать на числа. В множестве матриц одинаковых размеров мы также ввели операцию сложения и операцию умножения на число. Свойства этих операций для матриц, выраженные предло- предложением 1 § 1 гл. V, совпадают со свойствами тех же операций с век- векторами, сформулированными в предложении 1 § 1 гл. I. В каждом множестве линейные операции определяются по-своему, но имеют одни и те же свойства: коммутативность и ассоциативность сложения, дистрибутивность умножения на число по отношению к сложению чисел и т. д. Рассмотрим еще один пример. Пример 1. Пусть ^— множество всех функций от одной пере- переменной, определенных и непрерывных на отрезке [0,1]. Любым двум функциям / и д из ^ можно сопоставить их сумму, которая при- принадлежит ^?. Вещественному числу а и функции / сопоставляется функция af — произведение функции на число, которое также при- принадлежит *ё. Легко видеть, что основные свойства линейных опера- операций те же, что для векторов и для матриц, причем роль нуля играет функция, тождественно равная нулю. Вспомним одну из важных задач математического анализа: по заданной функции f(x) найти ее первообразную, т. е. такую функ- функцию F(x), что F'(x) = f(x). Общее решение этой задачи, как извест- известно, таково: если существует хоть одна первообразная Fo, то любая из них может быть получена по формуле F(x) = Fq(x) + С, где С — произвольная постоянная. Заметим, что постоянная — решение од- однородного уравнения F'(x) = 0. Теперь очевидно, что эта формула сходна с общим решением системы линейных уравнений: общее ре- решение есть сумма одного из решений и общего решения однородного уравнения. Сходство здесь, конечно, не случайное. Оно следует из совпадения алгебраических свойств операций дифференцирования и матричного умножения по отношению к линейным операциям. Естественно возникает необходимость исследовать множество, со- состоящее из элементов какой угодно природы, в котором определены
158 Гл. VI. Линейные пространства операции сложения двух элементов и умножения элемента на число. Эти операции могут быть определены любым образом, лишь бы они обладали определенным набором свойств. Определение. Множество «if называется линейным прост- пространством, а его элементы — векторами, если: задан закон {операция сложения), по которому любым двум эле- элементам х и у из «if сопоставляется элемент из J?, называемый их суммой и обозначаемый х + у\ задан закон (операция умножения на число), по которому элемен- элементу х из Jf и числу а сопоставляется элемент из Jf, называемый про- произведением х на а и обозначаемый ах; для любых элементов х,у и гиз^ и любых чисел аи /3 выполнены следующие требования (или аксиомы): 1) х + у = у + х; 2) (x + y)+z = x + (y + z); 3) существует элемент о такой, что для каждого х из Jf выполне- выполнено х + о = ж; 4) для любого х существует элемент -х такой, что х + (-х) = о; 5) а{х + у) = ах + ау; 6) (а + /3)ж = ах + /Зж; 7) а(/3ж) = (а(З)х; 8) произведение ж на число 1 равно х, т. е. 1х = ж. Если мы ограничиваемся вещественными числами, то Jf назы- называется вещественным линейным пространством, если же определено умножение на любое комплексное число, то линейное пространство Jf называется комплексным. Вектор —х называется противоположным вектору х, вектор о на- называется нулевым вектором или нулем. Мы будем обозначать векторы строчными латинскими буквами, а числа, как правило, греческими. Пример 2. Пусть Jf — множество всех многочленов от одной пе- переменной, степень которых не превосходит заданного числа п. Сумма двух многочленов из ?? — многочлен степени не выше п и, следова- следовательно, принадлежит ??. Произведение многочлена из ?? на число также принадлежит ??. Аксиомы линейного пространства выполне- выполнены и в этом случае. Роль нуля играет многочлен, все коэффициен- коэффициенты которого равны нулю. ?? будет вещественным или комплексным пространством, смотря по тому, рассматриваем мы многочлены с ве- вещественными или с комплексными коэффициентами. Пример 3. Множество комплексных чисел по отношению к обыч- обычным операциям сложения и умножения на комплексное число бу- будет комплексным линейным пространством. Аналогично, множество вещественных чисел по отношению к обычным операциям является вещественным линейным пространством.
§1. Основные понятия 159 Пример 4. Множество комплексных чисел по отношению к обыч- обычной операции сложения и умножения на вещественное число пред- представляет собой вещественное линейное пространство. Пример 5. Существует линейное пространство, состоящее из од- одного элемента. Его элемент является нулем и самому себе противопо- противоположным. Такое пространство называется нулевым и обозначается {о}. Операции в нем задаются равенствами о + о = оиао = о. 2. Простейшие следствия. Из аксиом, входящих в определение, вытекает, что может быть только один нулевой вектор и для каждо- каждого вектора только один противоположный. Действительно, допустим, что существуют два нулевых вектора о\ и o<i. Тогда их сумма долж- должна быть равна каждому из них: о\ + о^ — о\ — о^. Аналогично, если какой-нибудь вектор х имеет два противоположных —х\ и—Х2, то сумма (—xi) + х + (—Х2) должна быть равна и —х\, и — х^- Равенство о + о — о означает, что противоположным для нулево- нулевого вектора является он сам, а из равенства х + (—х) = о следует, что противоположным для —х является вектор х. Сумму векторов у и —х мы будем обозначать у — х и называть разностью векторов у и х. Легко видеть, что Ох = о для любого вектора х. В самом деле, Ох = Ох + х — х = A + 0)х — х — о. Отсюда вытекает, что (—1)х = —х для любого х. Действительно, (-1)ж + х = (-1 + 1)х = Ох = о. Отметим также, что произведение любого числа на нулевой вектор равно нулевому вектору, поскольку ао = а(х — х) = ах — ах = о. Если ах = о, то либо а = 0, либо х = о. В самом деле, если а ф 0, то, умножая равенство ах — о на а, получаем 1х = о. В сказанном здесь читатель заметит мало нового: таковы же свойства операций с векторами и с матрицами. Теперь мы видим, что все это верно и в произвольном линейном пространстве. Выражение вида а\Х\ + ... + akXk, как и в предыдущих главах, мы будем называть линейной комбинацией векторов xi,...,Xk с коэф- коэффициентами ai,...,afc. 3. Линейная зависимость. По аналогии с соответствующими определениями для векторов и для матриц мы можем дать определе- определения линейно зависимой и линейно независимой системы векторов в линейном пространстве. Напомним, что линейная комбинация назы- называется тривиальной, если все ее коэффициенты равны нулю. Определение. Система векторов в линейном пространстве «if называется линейно независимой, если нулевой вектор раскладывает- раскладывается единственным образом по этой системе векторов. Иными словами, векторы линейно независимы, если из равенства нулю их линейной
160 Гл. VI. Линейные пространства комбинации следует, что она тривиальная. Наоборот, если существу- существует нетривиальная линейная комбинация, равная нулевому вектору, то система векторов называется линейно зависимой. В § 1 гл. I и § 1 гл. V мы получили свойства линейно зависимых и линейно независимых систем векторов (направленных отрезков) и матриц. При их доказательстве использовались только те свойства линейных операций, которые совпадают с аксиомами линейного про- пространства. Поэтому для систем векторов в любом линейном простран- пространстве имеют место те же свойства. Приведем только формулировки, так как доказательства не отличаются от доказательств соответству- соответствующих предложений § 1 гл. V. Предложение 1. Система из к > 1 векторов линейно зависима тогда и только тогда, когда хотя бы один из векторов есть линейная комбинация остальных. Предложение 2. Если в систему векторов входит нулевой век- вектор, то система линейно зависима. Предложение 3. Если некоторые из векторов a\,...,ak сос- составляют сами по себе линейно зависимую систему, то вся систе- система а\,..., аи линейно зависима. Предложение 4. Любые векторы, входящие в линейно независи- независимую систему векторов, сами по себе линейно независимы. Предложение 5. Если вектор раскладывается по линейно неза- независимой системе векторов, то коэффициенты разложения определены однозначно. 4. Базис. Введем Определение. Базисом в линейном пространстве «if мы назо- назовем упорядоченную конечную систему векторов, если: а) она линейно независима; б) каждый вектор из «if раскладывается в линейную комбинацию векторов этой системы. В определении сказано, что базис — упорядоченная система век- векторов. Это означает, что из одного и того же множества векторов можно составить разные базисы, по-разному нумеруя векторы. Коэффициенты линейной комбинации, о которой идет речь в опре- определении базиса, называются компонентами или координатами векто- вектора в данном базисе. Векторы базиса еь ...,еп мы будем записывать в виде строки: е = = || е\ ... еп ||, а компоненты ^, ...,?п вектора х в базисе е — в столбец: е который назовем координатным столбцом вектора. Теперь разложение вектора по базису можно записать в любом
§1. Основные понятия 161 из следующих видов: е X = г=1 Из предложения 5 непосредственно следует, что компоненты век- вектора в данном базисе определены однозначно. Предложение 6. Координатный столбец суммы векторов ра- равен сумме их координатных столбцов. Координатный столбец произ- произведения вектора на число равен произведению координатного столбца данного вектора на это число. Для доказательства достаточно выписать следующие равенства: х + у = е| + ег] = е(? + rj), ax = ае? = е(а?), где ? и г] — координатные столбцы векторов х и у. Здесь исполь- использованы свойства умножения матриц — предложения 3 и 4 § 2 гл. V. Из предложения б видно, что координатный столбец линейной ком- комбинации векторов есть линейная комбинация их координатных столб- столбцов с теми же коэффициентами. Отсюда следует Предложение 7. Векторы линейно зависимы тогда и только тогда, когда линейно зависимы их координатные столбцы. Предложение 8. Если в линейном пространстве существует базис из п векторов, то любая система из т > п векторов линейно зависима. Доказательство. Предположим, что в пространстве сущест- существует базис ei,...,en, и рассмотрим систему векторов /i,...,/m, при- причем т > п. Каждый из векторов Д, ...,/т мы разложим по базису и составим матрицу из их координатных столбцов. Это матрица раз- размеров п х т, и ранг ее не превосходит п. Поэтому столбцы матрицы линейно зависимы, а значит, линейно зависимы и векторы /i,...,/m. Отсюда прямо вытекает Теорема 1. Если в линейном пространстве есть базис из п век- векторов, то и любой другой базис состоит из п векторов. Действительно, число векторов в одном базисе не может быть больше, чем в другом. Теперь мы можем ввести следующее Определение. Линейное пространство, в котором существует базис из п векторов, называется п-мерным, а число п — размерностью пространства. Размерность пространства «if обозначается dim J?f. В нулевом пространстве нет базиса, так как система из одно- одного нулевого вектора линейно зависима. Размерность нулевого прост- пространства по определению считаем равной нулю. Может случиться, что каково бы ни было натуральное число т, в пространстве найдется т линейно независимых векторов. Такое 11 Д.В. Беклемишев
162 Гл. VI. Линейные пространства пространство называется бесконечномерным. Базиса в нем не сущест- существует: если бы был базис из п векторов, то любая система из п + 1 векторов была бы линейно зависимой по предложению 8. Пример 6. Множество всех векторов плоскости является двумер- двумерным линейным пространством, а множество всех векторов простран- пространства, изучаемого в элементарной геометрии, — трехмерное линейное пространство. Пример 7. Линейное пространство столбцов высоты п имеет размерность п. Действительно, предложение 2 § 1 гл. V по сущест- существу означает, что столбцы единичной матрицы порядка п образуют базис в этом пространстве, называемый стандартным базисом. Ли- Линейное пространство столбцов высоты п называют арифметическим п-мерным пространством. Пример 8. Линейное пространство функций от одной перемен- переменной ?, определенных и непрерывных на отрезке [0,1], является бес- бесконечномерным. Чтобы это проверить, достаточно доказать, что при любом т в нем существует линейно независимая система из т век- векторов. Зададимся произвольным числом т. Векторы нашего прост- пространства — функции t° = 1, ?, ?2,..., tm~1 — линейно независимы. Действительно, равенство нулю линейной комбинации этих векторов означает, что многочлен а0 + axt + a2t2 + ... + ttm-i^ тождественно равен нулю. А это возможно только тогда, когда все его коэффициенты равны нулю. В линейной алгебре изучаются конечномерные линейные прост- пространства. Далее всюду, за исключением некоторых примеров, мы бу- будем предполагать пространство конечномерным. В ненулевом конечномерном пространстве существует бесконеч- бесконечно много различных базисов. Это видно из следующих предложений. Предложение 9. В п-мерном пространстве каждая упорядо- упорядоченная линейно независимая система из п векторов есть базис. Доказательство. Пусть xi,...,xn — такая система. Нам на- надо доказать, что произвольный вектор у раскладывается по ней. По предложению 8 система у,х\, ...,хп линейно зависима, и найдутся та- такие коэффициенты, что ау + а±х\ + ... + апхп = о, причем а ф 0, так как иначе система жь ...,жп была бы линейно зависима. Отсюда прямо следует доказываемое утверждение. Предложение 10. В п-мерном пространстве каждую упорядо- упорядоченную линейно независимую систему из k < n векторов можно до- дополнить до базиса. Это вытекает из того, что к такой системе можно присоединить еще один вектор, который по ней не раскладывается. (Если бы это бы- было не так, система сама была бы базисом.) После присоединения мы имеем такую же систему из к + 1 векторов и, если к + 1 < п, повторя-
§1. Основные понятия 163 ем рассуждение. В конце концов мы получим п линейно независимых векторов, в число которых входят заданные векторы. В частности, до базиса можно дополнить любой ненулевой вектор. 5. Замена базиса. Если в n-мерном пространстве даны два ба- базиса ei,..., еп и е[,..., е'п, то мы можем разложить каждый вектор вто- второго базиса по первому базису: *е; (г = 1,...,п). A) Компоненты о\ можно записать в виде квадратной матрицы Столбцы этой матрицы — координатные столбцы векторов е[, ...,е'п в базисе е. Поэтому столбцы линейно независимы, и det S ф 0. Определение. Матрицу, j-й столбец которой есть координат- координатный столбец вектора e'j в базисе е, мы назовем матрицей перехода от базиса е к базису е'. Равенство A) можно переписать в матричных обозначениях II р' р' II — II Рл Р IIе? || t^ ... еп || — || ei ... еп || о, ИЛИ е' = eS. B) Это легко проверить, перемножая матрицы. Из формулы B) мы получаем е = e'S~1, откуда следует, что 5 — матрица перехода от е; к е. Пусть в линейном пространстве даны три базиса е, е; и е", при- причем е' = eS и е" = е'Т. Подставляя е;, мы получаем е" = eST. C) Итак, при последовательной замене базисов матрицы перехода пере- перемножаются, и последующие множители располагаются правее. Предложение 11. Пусть задан базис е. Каждая матрица S с det S ф 0 есть матрица перехода от е к некоторому базису е'. Действительно, при det 5^0 столбцы S линейно независимы и яв- являются координатными столбцами п линейно независимых векторов, которые и составляют базис e;. Выясним, как связаны компоненты одного и того же вектора х в двух разных базисах е и e;. Пусть х = е? и х = е'?'. Подставим в последнее равенство выражение для е; по формуле B) и получим х = eS?'. Итак, мы имеем разложение вектора х по базису е в двух видах, и в силу единственности координатного столбца получаем ? = S?'. D) и*
164 Гл. VI. Линейные пространства Подробнее эту формулу можно переписать в виде е или, если выполнить умножение матриц, г E) Для трехмерного пространства мы уже получили это в §3 гл. I. 6. Ориентация пространства. Понятие ориентации прямой, плоскости и пространства в §4 гл. I основывалось на разделении всех базисов на два класса. Произведем это разделение для вещественных линейных пространств любой размерности. Фиксируем некоторый базис ео и обозначим через <?+(ео) мно- множество всех таких базисов е, что е = ео5, det S > 0. Остальные базисы отнесем к классу <?_(ео). Ясно, что для е' G <?_(ео) выполне- выполнено е' = е0Г, det Г < 0. Предложение 12. Классы базисов <?+(е0) и <?_(е0) не зависят от выбора исходного базиса ео. Доказательство. Рассмотрим базис fo, и пусть fo G <?+(ео), т. е. (ро = еоР, det Р > 0. Для каждого базиса е G <?+(fo) имеем е = foS, det5>0ne = eoP5, где det PS = det Pdet S > 0. Значит, е G <?+(e0). Отсюда следует ^+(fo) С ^+(е0). Ho eo G <^+(fo), так как detP > 0. Поэтому, меняя местами fo и е0, мы получаем ^+(е0) С ^+(f0), и в результате <?+(fo) = ^+(е0). Клас- Классы <^-(fo) и <^_(ео) состоят из базисов, не вошедших соот- соответственно в <?+(fo) и <^+(ео), и потому также совпадают. Итак, Случай, когда fo G <f_(eo), рассматривается аналогично. При этом ока- оказывается, что <?+(fo) = ^-(е0) и <?_(f0) = ^+(е0). Чтобы подчеркнуть независимость классов базисов от выбора ис- исходного базиса, мы обозначим их просто ё\ и $2- Определение. Вещественное линейное пространство называет- называется ориентированным, если из двух классов базисов S'i и ?*2 указан один. Базисы выбранного класса называются положительно ориенти- ориентированными. Задать ориентацию линейного пространства можно, выбрав неко- некоторый базис и считая его (и все базисы одного с ним класса) положи- положительно ориентированным.
§2. Линейные подпространства 165 Упражнения 1. Обозначим через Eij матрицу размеров т х п, у которой элемент на пересечении г-й строки и j-ro столбца равен 1, а остальные элементы рав- равны нулю. Убедитесь, что после упорядочивания эти тп матриц образуют базис в линейном пространстве матриц размеров т х п. (Такой базис назы- называется стандартным базисом данного пространства.) Каковы координаты матрицы А с элементами ац в стандартном базисе? 2. Докажите, что верхние треугольные матрицы порядка п образуют линейное пространство по отношению к обычным операциям с матрицами. Найдите размерность этого пространства и какой-нибудь базис в нем. 3. В линейном пространстве многочленов степени < 3 от перемен- переменной t заданы два базиса: I,t,t2,t3 и 1,? — 1, (t — aJ, (t — ay. Найдите мат- матрицу перехода от первого базиса ко второму и с ее помощью разложение многочлена p{t) по второму базису. 4. Как расположены друг относительно друга два базиса е\,...,еп и /i,...,/n, если матрица перехода от е к f верхняя треугольная? Докажите из этих соображений, что обратная к верхней треугольной матрице также верхняя треугольная. 5. Как ориентированы друг относительно друга два базиса, если: /i = = ei + e2; /2 = е2 + е3; /з = е3 + е4; /4 = е4 - е{1 § 2. Линейные подпространства 1. Определения и примеры. В обычном геометрическом про- пространстве сумма векторов, лежащих в некоторой плоскости, также лежит в этой плоскости, и умножение вектора на число не выводит его из плоскости, в которой он лежит. Теми же свойствами облада- обладают векторы, лежащие на прямой линии. Для линейных пространств обобщением плоскости и прямой служат линейные подпространства. Определение. Непустое подмножество ^ векторов линейного пространства «if называется линейным подпространством, если: а) сумма любых векторов из J?l принадлежит «if1'; б) произведение каждого вектора из ??' на любое число также принадлежит ??'. В силу этого определения любая линейная комбинация векторов из ??' принадлежит ^. В частности, нулевой вектор как произведе- произведение Ох должен принадлежать Jf1, и для каждого х из Jf1 противопо- противоположный вектор —х = (—1)х лежит в Jf1. Сложение и умножение на число, определенные в Jf, будут таки- такими же операциями в его подпространстве Jf1. Справедливость аксиом линейного пространства для Jf1 прямо вытекает из их справедливос- справедливости для Jf. Таким образом, подпространство является линейным про- пространством. Пример 1. Пусть дано некоторое множество & векторов в линей- линейном пространстве ??. Обозначим через ??' совокупность всевозмож- всевозможных линейных комбинаций, каждая из которых составлена из конеч- конечного числа векторов из &. Множество S^1 является подпространством
166 Гл. VI. Линейные пространства в «if. Действительно, если х и у принадлежат J^, то х = \\Р\ + ... ... + ^кРк м у = /xift + ... + /xmgm, где ^, ^- е & (г = 1,..., fc; j = = 1, ...,m). Мы видим, что х + у = ^ Ада + ^/ij^-, т. е. ж + 2/ так" же является линейной комбинацией конечного числа векторов из ^. Точно так же мы видим, что ах = Так построенное подпространство ^ называется линейной обо- оболочкой множества &. Пусть pi,...,pm — линейно независимая система векторов из 3? такая, что каждый вектор из 2? по ней раскладывается. (Если прост- пространство конечномерно, то очевидно, что в каждом множестве, со- содержащем ненулевые векторы, такая система найдется.) Векто- Векторы pi,...,pm образуют базис в линейной оболочке &. В самом деле, каждую линейную комбинацию векторов из 3? можно представить как линейную комбинацию векторов pi,...,pm, так как каждый век- вектор из 2? можно разложить по pi, ...,рт и подставить эти разложения в рассматриваемую линейную комбинацию. В частности, если & — конечное множество векторов, мы имеем Предложение 1. Размерность линейной оболочки множества из т векторов не превосходит т. Пример 2. Рассмотрим однородную систему линейных уравне- уравнений с п неизвестными. Согласно предложению 3 § б гл. V совокуп- совокупность всех решений этой системы представляет собой подпрост- подпространство в линейном пространстве столбцов высоты п. Каждая фундаментальная система решений этой системы уравне- уравнений является базисом в этом подпространстве. Пример 3. В каждом линейном пространстве множество, сос- состоящее только из нулевого вектора, является подпространством. Оно называется нулевым. Пример 4. Все пространство «if является подпространством в ??. Предложение 2. Пусть Jf1 — подпространство п-мерного пространства Jf. Тогда dimJ/f7 ^ п. Если dimJ/f7 = n, то Jf1 сов- совпадает с ??. Действительно, любая система из т > п векторов в ??' лежит так- также ивУи потому линейно зависима. Пусть базис в ??' содержит п векторов. Тогда любой вектор из Jf раскладывается по этому базису и, следовательно, принадлежит Jf'. Значит, Jf' совпадает с Jzf. Сформулируем еще одно достаточно очевидное Предложение 3. Пусть Jf1 — подпространство п-мерного ли- линейного пространства Jf. Если базис ei, ...,е^ в Jf1 дополнить до ба- базиса ei,..., е/., efc+i,..., еп в ??, то в таком базисе все векторы из ??* и только они будут иметь компоненты ^+1 = 0, ..., ?п = 0. Действительно, если для вектора х имеем ^+1 = ... = ?п = 0, то х — ^ei + ... + ?feefc и, следовательно, х G S?{'. Обратно, вектор
§2. Линейные подпространства 167 из ^ раскладывается в линейную комбинацию х = ^е\ + ... + ?,кеи. Она же есть разложение х по базису ei, ...,en при ^к+1 = ... = ?п = 0. Заметим, что равенства ^+1 = 0, ...,?п = 0 можно рассматривать как систему линейных уравнений, связывающую координаты векто- вектора х. Нетрудно доказать, что и в любом другом базисе ^ определяет- определяется системой линейных уравнений. Действительно, при замене базиса старые компоненты выражаются через новые по формулам E) § 1, и в новом базисе система уравнений примет вид г=1 г=1 Ранг этой системы равен п — к, поскольку строки матрицы перехода линейно независимы. Итак, мы доказали Предложение 4. Пусть в п-мерном пространстве J? выбран базис. Тогда координатные столбцы векторов, принадлежащих к-мер- к-мерному подпространству J?l (к < п), удовлетворяют однородной систе- системе линейных уравнений ранга п - к. 2. Сумма и пересечение подпространств. Рассмотрим два подпространства Jfr и Jf" линейного пространства Jf. Определение. Будем называть суммой подпространств Jf1 и Jf" и обозначать Jf' + Jg" линейную оболочку их объединения -Sf'U-Sf". Подробнее определение означает, что вектор х из ^ + ??" (и толь- только такой) представим в виде х — 2^aiPi + /^^^^ где вектоРы Pi лежат в ??\ a gj — в J?". Обозначая написанные выше суммы через х' и х", мы видим, что подпространство J?' + J?" состоит из векторов, представимых в виде х = х' + х", где х' G ^f;, a x" G 1?п. Пусть размерности подпространств ^ и ??" равны ки1. Выберем в этих подпространствах базисы ei,...,e^ и Д,...,//. Каждый вектор из J^' + J?" раскладывается по векторам ei,...,e^, Д,...,//, и мы по- получим базис в ^ + J?", если удалим из этой системы все векторы, которые линейно выражаются через остальные. Сделать это можно, например, так. Выберем какой-либо базис в ?? и составим матрицу из координат- координатных столбцов всех векторов ei,..., е^, Д,...,//. Те векторы, координат- координатные столбцы которых — базисные столбцы этой матрицы, составляют базис B-Sf'+-Sf". Определение. Назовем пересечением подпространств ^ и ??" и обозначим ??' П J?" множество векторов, которые принадлежат обо- обоим подпространствам. Пересечение ^ П ??" есть подпространство. Действительно, ну- нулевой вектор лежит во всех подпространствах и, следовательно, пере- пересечение не пустое множество. Если векторы х и у лежат в Jf1 П Jf",
168 Гл. VI. Линейные пространства то они лежат как в J?', так и в J?". Поэтому вектор х + у и при лю- любом а вектор ах также лежат и в J?', и в J?", а следовательно, и BjSf'riJSf". В конечномерном пространстве подпространства могут быть за- заданы системами линейных уравнений. Тогда их пересечение задает- задается системой уравнений, получаемой объединением систем, задающих подпространства. Для s > 2 подпространств «if *,..., «ifs сумма и пересечение опре- определяются аналогично, и полученные выше свойства переносятся на суммы и пересечения s подпространств. В частности, суммой подпространств «if1,..., «ifs называется ли- линейная оболочка их объединения. Это — множество всех векторов, представимых в виде суммы х\ + ... + xs, где Х{ е J?г (г = l,...,s). Каждый из векторов Х{ может быть разложен по базису в своем под- подпространстве «if*, и потому любой вектор из суммы ^f1,...,^ рас- раскладывается по системе векторов, получаемой объединением бази- базисов всех подпространств. Число векторов в этой системе равно dim^f1 + ... + dimJ?fs. Поскольку векторы всех базисов в совокуп- совокупности могут быть линейно зависимыми, размерность суммы подпро- подпространств может оказаться меньше общего числа векторов в системе: Базис в сумме подпространств получается, как и при s = 2, из объединения базисов слагаемых удалением векторов, линейно выра- выражающихся через остальные. Определение. Сумма подпространств ^f1,...,^* называется прямой суммой, если ее размерность равна сумме размерностей этих подпространств, т. е. имеет максимальное из возможных значений. Если надо подчеркнуть в обозначении, что сумма прямая, то ис- используют знак 0. Прибавление нулевого подпространства не меняет ни размерность суммы, ни сумму размерностей. Но ниже мы будем считать подпро- подпространства ненулевыми, чтобы избежать оговорок, вызванных несу- несуществованием базиса в нулевом подпространстве. Предложение 5. Для того чтобы сумма ??* подпространств ^f1, ...,^fs была прямой суммой, необходимо и достаточно выполнение любого из следующих четырех свойств: а) любая система из т ^ s ненулевых векторов, принадлежащих различным подпространствам J?% (г = l,...,s), линейно независима; б) каждый вектор х е J?' однозначно раскладывается в сумму х\ + ... + xs, где xi G J?% (i = 1,..., s); в) пересечение каждого из подпространств ??% с суммой остальных есть нулевое подпространство;
§2. Линейные подпространства 169 г) объединение базисов подпространств J?% (г = 1, ...,s) есть базис Доказательство. Мы докажем, что из определения прямой суммы следует свойство а), и каждое из свойств б), в) и г) следу- следует из предыдущего. Поскольку из свойства г) непосредственно сле- следует определение прямой суммы, это будет означать равносильность каждого из свойств определению. 1. Докажем от противного, что из определения следует свойство а). Допустим, что нашлась линейно зависимая система ненулевых век- векторов Xi1,...,Xim таких, что никакие два из них не лежат в одном и том же подпространстве «if*. Дополним каждый из этих векторов до базиса в его подпространстве, а в тех подпространствах, из которых в системе векторов нет, выберем базис произвольно. Объединение этих базисов — система из к = dim J/f1 + ... + dim J?fs векторов. Каждый вектор из J?' раскладывается по этой системе, но система эта линейно зависима (так как она содержит линейно зави- зависимую подсистему). Поэтому базис в ^ содержит меньше, чем к векторов, и размерность суммы меньше суммы размерностей. 2. Докажем, что из свойства а) следует свойство б). Допустим, что б) не выполнено и некоторый вектор х представлен как сумма х = = xi + ... + xs и как сумма х = у1 + ... + у8, где x^yi Е «ifг {г = 1,..., s). Тогда (х\ — 2/i) + ... + (х8 — у8) = о. Если хоть одна из разностей от- отлична от нуля, мы получаем противоречие со свойством а). 3. Докажем теперь также от противного, что из свойства б) следу- следует в). Не уменьшая общности, мы можем допустить, что ^f1 имеет ненулевое пересечение с суммой ^f2 + ... + J?s. В этом случае сущест- существует ненулевой вектор z — х\ G ^f1, представимый в виде суммы Х2 + ... + х8. Но равенство х\ — х<± + ... + xs означает, что z двумя способами представлен как сумма векторов, выбранных по одному из каждого J?l. 4. Докажем, наконец, что из свойства в) следует г). Рассмот- Рассмотрим систему векторов, получаемую объединением базисов подпрост- подпространств J?l (i = l,...,s). Каждый вектор из суммы Jf' обязательно раскладывается по этой системе, и нам остается доказать, что при условии в) эта система линейно независима. Сделаем это от противного. Допустим, что существует равная ну- нулю нетривиальная линейная комбинация всех векторов, входящих в рассматриваемые базисы подпространств J?l (г = l,...,s). Сгруппи- Сгруппируем слагаемые в этой линейной комбинации так, чтобы объединить все слагаемые, относящиеся к одному подпространству. Мы получим равенство вида х\ + ... + х8 = о, где хотя бы один вектор отличен от нуля. Не уменьшая общности, можно считать, что это х\. Тог- Тогда х\ — —Х2 — ... — х8. Это значит, что ненулевой вектор х\ G ^f1 принадлежит также сумме S? + ... + J?s. Получено противоречие со
170 Гл. VI. Линейные пространства свойством в). Это заканчивает доказательство всего предложения. Отметим как частный случай свойства в), что сумма двух под- подпространств прямая, если их пересечение нулевое. Легко видеть, что при сложении подпространств можно произ- произвольно расставлять и убирать скобки. Это относится и к прямой сум- сумме. Например, (^f1 0 ^f2) 0 (^f3 0 ^f4) = ^f1 0 ^f2 0 ^f3 0 ^f4. Если _Sf' С ?>", то _Sf' + ^" = ?>". В частности, для любого под- подпространства &1 + &1 = 3?. Предложение 6. Для любого подпространства ^ пространст- пространства ?? найдется такое подпространство ??h', что ?? — ??' 0 ??". Доказательство. Выберем базис е\,..., е/. подпространства ??' и дополним его до базиса пространства «if векторами e^+i, ...,en. Ли- Линейную оболочку ejfe+i, ...,en обозначим через .if". Из предложения 5 видно, что-Sf = -Sf'0-Sf". Теорема 1. Размерность суммы двух подпространств равна сум- сумме их размерностей минус размерность их пересечения. Если сумма прямая, утверждение справедливо: размерность равна сумме размерностей, а пересечение нулевое. Пусть теперь ??1 и ^f2 — подпространства с ненулевым пересече- пересечением. Согласно предложению б найдется такое подпространство Ж, что ^f2 = ^0 (^f1 П ^f2). Тогда ^x +??2 = ^x + (^f1 П ^f2) + Ж Отсюда видно, что ^х + ??2 = ^f1 + Л, так как (^f1 П З?2) С З?1. Докажем, что ??1 + Ж — прямая сумма. Для этого рассмотрим произвольный вектор z G ^f1 П Ж. Из z G <у#С ^2 следует z G ^f1 П D^f2, а следовательно, z G (^f1 П ^f2) П ^. Отсюда z — о, и пересече- пересечение ^f1 П ,у# нулевое. По определению прямой суммы dim («if1 + ^f1) = dim .if1 + dim .Ж Кроме того, dim^2 = dim(^1 П ^2) + &\т.Ж. Вычитая эти равенст- равенства почленно, приходим к требуемому заключению. Упражнения 1. В линейном пространстве ?? заданы векторы ai, аг и аз с координат- координатными столбцами 1 2 3 4 5 6 7 8 9 10 11 12 в базисе е15е2,ез,е4. Найдите базис их линейной оболочки 3? . 2. Найдите систему уравнений, задающую подпространство^7 из упр. 1. 3. Найдите какое-нибудь подпространство Ж\ которое вместе с под- подпространством 3f' из упр. 1 удовлетворяет условию 3f = 3f' © Ж''. 4. Подпространство 3f' определено в упр. 1, подпространство J?n на- натянуто на векторы Ь\ и hi с координатами 1,1,1, 2 и 2, 2, 2, 5. Найдите: а) базис в &' + -Sf"; б) базис в &' П ^fr/.
Линейные отображения 171 5. В четырехмерном пространстве заданы: а) четыре подпространства; б) пять подпространств; в) пять ненулевых подпространств. Может ли их сумма быть прямой? § 3. Линейные отображения 1. Определение. Пусть Jf и Jf — два линейных пространства, оба вещественные или оба комплексные. Под отображением А про- пространства «if в пространство «if понимается закон, по которому каж- каждому вектору из Jf сопоставлен единственный вектор из Jf. Мы бу- будем писать А: ?? —> Jf. Образ вектора х обозначается А(х). Определение. Отображение Л: J? —>¦ ?? называется линейным, если для любых векторов х и у из S? и любого числа а выполнены равенства А(х + у) = А(х) + А(у), А(ах) = аА(х). A) Следует подчеркнуть, что знак + в левой и правой частях первой из формул A) обозначает две, вообще говоря, различные операции: сло- сложение в пространстве Jf и сложение в пространстве Jf. Аналогичное замечание относится и ко второй формуле. Линейное отображение мы будем называть линейным преобразова- преобразованием, если пространства Jf и Jf совпадают. Пример 1. Пусть Л — фиксированное число. Сопоставим каждо- каждому вектору х пространства Jf вектор Хх. Легко видеть, что это — линейное преобразование. Пример 2. При аффинном преобразовании плоскости двумерное пространство векторов, на ней лежащих, отображается само на себя. В силу формул A1) §2 гл. IV — это линейное преобразование. Пример 3. Выберем в n-мерном линейном пространстве Jf какой- нибудь базис. Это сопоставит каждому вектору его координатный столбец и тем определит линейное отображение пространства Jf в n-мерное арифметическое пространство (пространство столбцов). Пусть Jf — вещественное пространство. Сопоставляя каждому вектору его первую компоненту в выбранном базисе, мы получаем ли- линейное отображение Jf в линейное пространство вещественных чисел. Пример 4. Пусть G°[—1,1] и С0[О, 2] — пространства функций, непрерывных соответственно на отрезках [—1,1] и [0,2]. Сопоставим функции /(?) из первого пространства функцию ip(s) = f(s - 1) из второго. Это отображение, очевидно, является линейным. Пример пре- преобразования можно получить, если сопоставить функции из С°[— 1,1] ее первообразную F(t), удовлетворяющую условию F@) = 0. Пример 5. Рассмотрим n-мерное арифметическое пространст- пространство &п и прямоугольную матрицу А размеров т х п. Сопоставим
172 Гл. VI. Линейные пространства столбцу ? Е &п столбец А?. Он имеет высоту т. Таким образом, определено отображение &п в &ш. В силу свойств умножения мат- матриц это отображение линейное. Пример 6. Отображение, сопоставляющее каждому вектору из «if нулевой вектор из «if, является линейным. Оно называется нулевым отображением. В дальнейшем в этом параграфе пит будут обозначать размер- размерности пространства ?? и ?? соответственно. Из определения немедленно вытекает, что при линейном отображе- отображении линейная комбинация векторов переходит в такую же линейную комбинацию их образов. Нулевой вектор переходит в нулевой, поскольку А(р) = А@х) = = 0А(х) = о. (Обратим внимание, что нулевые векторы пространств Jf и Jf мы обозначаем одинаково.) Из сказанного следует, что при линейном отображении линейно зависимые векторы отображаются в линейно зависимые. Как пока- показывает пример б, обратное вовсе не обязательно верно. Предложение 1. При линейном отображении A: J? ->• J? ли- линейное подпространство Jf1 С Jf переходит в линейное подпрост- подпространство A(Jf') С 3?, причем dim A(jf') ^ dimjf'. Для нулевого подпространства утверждение очевидно. Рассмот- Рассмотрим подпространство J^' размерности к > 0. Пусть ei, ...,e^ — базис в Jfr. Для любого вектора х G Jfr имеем х = ^1е\ + ... + ^е/. и А(х) = А^ег + ... + ?кек) = ?М(е1) + ... + ?М(е*). B) Это означает, что произвольный элемент множества A(Jfr) образов всех векторов из Jf1 есть линейная комбинация векторов /A(ei),... ...,Л(е^). Наоборот, каждая такая линейная комбинация, очевидно, является образом вектора из Jfr. Итак, множество A(J?') — линей- линейная оболочка /A(ei),..., Л(е^), и, следовательно, есть подпространство. Размерность его не превосходит к в силу предложения 1 § 2. Необходимо отметить частный случай доказанного предложе- предложения: множество образов всех векторов из ?? является подпространст- подпространством A(Jf) в Jf. Оно называется множеством значений отображения и обозначается ImA Определение. Размерность множества значений отображения называется рангом отображения. Если ранг А равен т, то A(J?) совпадает с ^, и каждый вектор из ?? является образом некоторого вектора из ??. Отображение, об- обладающее этим свойством, называется сюръективным отображением. Определение. Множество векторов, отображающихся в нуле- нулевой вектор при отображении Л, называется ядром отображения А и обозначается КегЛ. Предложение 2. Ядро есть линейное подпространство в Jf.
§3. Линейные отображения 173 Действительно, ядро не пусто: оно во всяком случае содержит нулевой вектор. Далее, если А{х) = о и А(у) = о, то А(ах + /Зу) = = аА(х) + (ЗА(у) = о. Пусть ядро А ненулевое: dim КегЛ ^ 1. Тогда каждый вектор из A(Jf) имеет бесконечно много прообразов. Действительно, если у = = А{х) и о ф хо Е КегЛ, то А{х + хо) = у. Верно и обратное утверж- утверждение: если какой-то вектор у Е ?? имеет хотя бы два различных прообраза, то ядро А содержит ненулевой вектор. Действительно, ес- если А{х\) — А{х^) — у для х\ ф Ж2, то А{х\ — х^) = о и z = х\ — х<± — ненулевой вектор в ядре. Отображение, при котором различные векторы имеют различные образы, называется инъективным отображением. Итак, получено Предложение 3. Отображение инъективно тогда и только тог- тогда, когда его ядро — нулевое подпространство. Если отображение инъективно, то линейно независимые векторы переходят в линейно независимые. Действительно, пусть образы век- векторов xi,...,Xk линейно зависимы: a\A{xi) + ... + akA(xk) = о. Тог- Тогда A(oliXi + ... + otkXk) = о. Отсюда для инъективного отображения получаем а\Х\ + ... + ctk%k — о, и, следовательно, xi,...,Xk линейно зависимы. 2. Координатная запись отображений. Рассмотрим линейные пространства «if и «if размерностей пиши линейное отображение A: J? ->• ??. Пусть еь ...,еп — базис в ??. Тогда образ произвольного вектора х — f^e\ + ... + ?,пеп раскладывается в линейную комбинацию А(х)=?1А(е1) + ... + €пА(еп). C) Значит, А(х) может быть найден по координатам ж, если известны образы базисных векторов /A(ei),..., А(еп). Выберем также базис в пространстве ??. Пусть это f = — II Л ••• /m II- Каждый из образов базисных векторов мы можем разло- разложить по f: m Р=1 Если компоненты вектора А(х) мы обозначим через Т]1, ...,?7т, то равенство C) может быть переписано так: р=1 г,р Отсюда в силу единственности разложения по базису a№ (P=l.-.m). D)
174 Гл. VI. Линейные пространства Если мы составим матрицу А из чисел а?, то равенства D) могут быть записаны в матричной форме V = At E) или, подробнее, at, а е Здесь координатный столбец образа вектора х (в базисе f) выражен как произведение матрицы А размеров т х п на координатный стол- столбец вектора х в базисе е. Определение. Матрицей линейного отображения A: J? —у J? в паре базисов е и f называется матрица, столбцы которой (в их естес- естественном порядке) — координатные столбцы векторов /A(ei),..., А(еп) в базисе f. Формула E) показывает, как употребляется матрица линейного отображения для нахождения образа вектора. Матрица линейного отображения в следующем смысле однозначно определена: если для любого вектора х = е? координатный столбец образа в базисе f есть г] = В?, то матрица В совпадает с А. Это утверждение нетрудно проверить. Умножим матрицу В на коорди- координатный столбец вектора е^, т. е. на г-й столбец единичной матрицы. Произведение равно г-му столбцу В, а это и есть координатный стол- столбец A{ei). Пример 5 показывает, что при выбранных в пространствах «if и «if базисах каждая матрица размеров т х п служит матрицей не- некоторого линейного отображения ?? —у ??. Предложение 4. Ранг матрицы линейного отображения равен рангу этого отображения. Доказательство. Пусть ji,..., jr — номера базисных столбцов матрицы А линейного отображения А. Тогда векторы /А(е^),..., A(ejr) линейно независимы и каждый из векторов A(ei) (i = 1, ...,п) по ним раскладывается. Следовательно, мы можем разложить образ А(х) лю- любого вектора только по /А(е^),..., A(ejr). Таким образом, эти векторы образуют базис в 1тЛ, и их число равно рангу А. Предложение до- доказано. Из этого предложения видно, что ранг матрицы линейного отобра- отображения один и тот же, какую бы пару базисов мы ни выбрали. Предложение 5. Сумма ранга отображения и размерности его ядра равна размерности отображаемого пространства. Доказательство. Согласно формуле E) ядро отображения оп- определяется однородной системой линейных уравнений At; = о с п не- неизвестными. Ранг матрицы системы равен рангу отображения г. Фун- Фундаментальная система решений этой системы состоит из d = п — г
§3. Линейные отображения 175 решений, которые являются координатными столбцами векторов, со- составляющих базис в ядре. В частности, равенство г — п необходимо и достаточно, чтобы отображение имело нулевое ядро, т. е. было инъективным. Напомним, что отображение называется взаимно однозначным, ес- если каждый вектор у Е Jf является образом одного и только одного вектора из «if, т. е. если оно является как инъективным, так и сюръ- ективным. Для инъективного отображения г = п, а для сюръектив- ного г = т. Итак, имеет место Предложение 6. Линейное отображение A: J? -у J? взаимно однозначно тогда и только тогда, когда размерности пространств совпадают и равны рангу отображения: п = т = Rg А. 3. Изоморфизм линейных пространств. Дадим следующее Определение. Взаимно однозначное линейное отображение на- называется изоморфизмом. Если существует изоморфизм S? —у Jf, то линейные пространства ?? и ?? называются изоморфными. Пример 7. Выбор базиса в n-мерном линейном пространстве ?? определяет изоморфизм ?? на n-мерное арифметическое пространст- пространство, сопоставляющий каждому вектору его координатный столбец. Это координатный изоморфизм. Из предложения б видно, что два линейных пространства могут быть изоморфны только тогда, когда их размерности совпадают. Ока- Оказывается, это условие является и достаточным: имеет место Теорема 1. Два вещественных пространства изоморфны тогда и только тогда, когда их размерности равны. То же верно и для комп- комплексных пространств. Нам остается проверить только достаточность условия. Она оче- очевидна: пусть ?? и ?? — два n-мерных линейных пространства. Если в каждом из них выбран базис, то любая невырожденная квадратная матрица порядка п по формуле E) определяет линейное отображение, которое будет изоморфизмом согласно предложению 6. Значение теоремы об изоморфизме линейных пространств — в следующем. Линейные пространства могут состоять из чего угодно (столбцов, многочленов, чисел, направленных отрезков, функций) — природа их элементов роли не играет, когда изучаются их свойства, связанные с линейными операциями. Все эти свойства у двух изо- изоморфных пространств совершенно одинаковы. Если мы условимся не различать между собой изоморфные пространства, то для каждой раз- размерности найдется только одно линейное пространство. 4. Изменение матрицы линейного отображения при заме- замене базисов. Рассмотрим линейное отображение A: J? -у Jf. Если в пространствах выбраны базисы е и f, то А определяется матрицей А. Пусть другая пара базисов е; и f связана с е и f матрицами перехо-
176 Гл. VI. Линейные пространства да S и Р, и в базисах е' и f отображение А имеет матрицу А'. Наша задача — найти связь между матрицами А и А!. Рассмотрим произвольный вектор х пространства «if и его об- образ у = А(х). Обозначим координатные столбцы х в базисах е и е' соответственно через ? и ?', а координатные столбцы 2/ в базисах f и f через г] и г]'. Согласно формуле D) § 1 ? = ??', 77 = Рг]'. Подставив эти выражения в формулу E), мы получаем Prj' = AS?'. Поскольку матрица перехода имеет обратную, г]' = P~1AS?'. Но по формуле E) г]' = А'?'. Так как матрица линейного отображения для данной пары базисов единственна, мы получаем А' = P^AS. F) 5. Канонический вид матрицы линейного отображения. Естественно возникает вопрос, как выбрать в пространствах «if и «if базисы таким образом, чтобы матрица заданного отображения имела возможно более простой вид. Теорема 2. Для любого линейного отображения A: J? —у J? ран- ранга г можно так выбрать базисы в J? и ??, что оно будет иметь матрицу ^& G) о о (Ег — единичная подматрица порядка г, остальные элементы, если они есть, равны нулю). Доказательство. Поместим векторы er+i,...,en базиса про- пространства ?? в КегЛ (его размерность как раз равна п — г), а век- векторы ei,...,er можем выбрать произвольно. В силу такого выбора при любом базисе в ?? последние п — г столбцов матрицы А будут нулевыми. Так как RgA = г, первые г столбцов должны быть ли- линейно независимыми. Поэтому линейно независимыми будут векто- векторы /A(ei),..., А(ег). Примем их за первые г базисных векторов в про- пространстве Jf, а остальные векторы /r+i,...,/m этого базиса выберем произвольно. При таком выборе первые г столбцов А будут первыми г столбцами единичной матрицы порядка т. Это и есть вид G). 6. Сумма и произведение отображений. Рассмотрим два ли- линейных отображения A: J? -у J? и в: ?? -у %\ Мы назовем суммой этих отображений и обозначим А + В отображение С : Jf —> Jf, опре- определяемое равенством С{х) = А{х) + В(х) для любого х G ??. Не представляет труда проверить, что С — линейное отображе- отображение. Действительно, если в У и У выбраны базисы, координатные столбцы векторов А(х) и В(х) запишутся через матрицы отображе- отображений как А? и В?. Следовательно, С(х) будет иметь координатный столбец А? + B$, = (А + В)?. Итак, сумма А + В линейных отобра- отображений — линейное отображение, и его матрица равна сумме мат- матриц А + В.
§3. Линейные отображения 177 Произведение линейного отображения А на число а определяется как отображение В, сопоставляющее вектору х вектор аА(х). Лег- Легко проверить, что это отображение линейное и имеет матрицу аА, если А — матрица отображения А. Из сказанного следует, что по отношению к введенным здесь ли- линейным операциям множество всех линейных отображений «if в «if представляет собой линейное пространство, которое изоморфно ли- линейному пространству матриц размеров т х п. Теперь рассмотрим три линейных пространства Jf, J^f и J?n. Ре- Результат последовательного выполнения отображений А : ?? —У J&' и В : Jfr —у ??п называется их произведением и обозначается В А (отображение, которое делается первым, пишется справа). Разу- Разумеется, В А отображает ?? в J?" и является линейным отображением. Пусть в пространствах ??, ??' и ??п выбраны базисы соответствен- соответственно е, f и g. Обозначим через А матрицу отображения А в базисах е и f, а через В — матрицу отображения В в базисах f и g. Предложение 7. Отображение В А имеет матрицу В А в бази- базисах е и g. Доказательство. Рассмотрим координатный столбец ? про- произвольного вектора из ??. Координатные столбцы векторов А[х) и В(А(х)) обозначим соответственно через rj и ?. Тогда rj = А? и ? = = Вт] = ВА?, как нам и требовалось. Ранг отображения равен рангу его матрицы, а потому из оценки ранга произведения матриц (предложение 7 § 5 гл. V) следует Предложение 8. Ранг произведения отображений не превосхо- превосходит рангов этих отображений. Другие свойства умножения отображений тоже легко следуют из свойств умножения матриц, и мы не будем на них останавливаться. Пусть дано линейное отображение A: J? —у ??. Линейное отобра- отображение В\ J? ^ J? назовем обратным для А и будем обозначать Л, если В А = Е и АВ = Е, где Е и Е — тождественные преобразования пространств Jf и Jf. Иначе говоря, для любых х G S? и у G Jf должно быть В(А(х))=х, А(В(у))=у. (8) Предложение 9. Линейное отображение А имеет обратное тог- тогда и только тогда, когда оно — изоморфизм. Рассмотрим линейное отображение А: J? —У J? и выберем бази- сы е и f в У и У. Пусть А — матрица отображения А в этих базисах. 1°. Пусть А — изоморфизм. Тогда А — невырожденная квадрат- квадратная матрица и имеет обратную матрицу А~х. Рассмотрим отображе- отображение в: ?? ^ %\ определяемое матрицей А~х в базисах f и е. Очевид- Очевидно, что оно удовлетворяет условиям (8), и потому является обратным для А. 12 Д.В. Беклемишев
178 Гл. VI. Линейные пространства 2. Пусть А не изоморфизм. Тогда либо г < т, либо г < п. В пер- первом случае в «if найдется вектор и, не принадлежащий A(Jf). Если существует обратное отображение, мы приходим к противоречию: и = А(А~1(и)) Е A(Jf). Во втором случае существует вектор z ф о, 2 Е Кег А Если существует Л, мы приходим к противоречию: z = = Л-1(Л(г))=Л(о)=о. Одновременно мы доказали, что матрица обратного отображения в базисах f и е есть А~х. Упражнения 1. Все квадратные матрицы порядка 2 умножаются справа на матрицу 12 3 2 4 6 Этим определено отображение А пространства матриц порядка 2 в прост- пространство матриц размеров 2x3. Найдите: а) матрицу этого отображения в стандартных базисах (упр. 1 § 1); б) базис в Кег Л; в) базис в 1т А. 2. Какому условию должна удовлетворять матрица С размеров 2x3 для того, чтобы отображение, определенное в упр. 1, было инъективным? Может ли оно быть сюръективным? 3. Пусть Ск — пространство функций, имеющих к непрерывных произ- производных на отрезке [0,1]. Дифференцирование отображает Ск в Ск~1. Про- Проверьте, что это — линейное отображение. Будет ли оно: а) инъективным; б) сюръективным? 4. Пусть Л: ?g ->3? и Л= A(Jf). Определим отображение А': %'->> Л равенством А'(х) = А(х). Докажите, что: а) Кег А' = Кег Л; б) Rg/A7 = Rg/A; в) А' сюръективно. 5. Пусть «if = «ifi © «if2 и х = х\ + Ж2, х\ G Jfi, X2 G «if2- Определим преобразования Р\ и Р2 пространства ^ формулами Р\(х) = #i и Рг(ж) = = Ж2 (такие преобразования называются проектированиями). Докажите, что о Рх + Р2 = Е, РгРо. = Р2Р, = 0, Р? = Pi (i = 1, 2), где О — нулевое, а Е — тождественное преобразования. 6. Докажите теорему 2, приводя матрицу линейного отображения эле- элементарными преобразованиями строк и столбцов к виду G). 7. Пусть А — линейное отображение. Верно ли, что: a) A(jgf П J8f') = 4(j2f) П d(J2f'); 6) ^(jSf n JSf') С A(^f') n ^(JSf')? § 4. Задача о собственных векторах 1. Линейные преобразования. Линейное преобразование — это отображение, которое отображает линейное пространство в то же са- самое пространство. В этом параграфе мы будем заниматься исклю- исключительно преобразованиями. Все результаты об отображениях верны и для преобразований, но здесь должны быть сделаны существенные оговорки, касающиеся координатной записи преобразования.
§4- Задача о собственных векторах 179 Именно, для координатной записи отображения Л: «if —>¦ «if вы- выбираются базисы в обоих пространствах ^ и J^. Если же пространст- пространства «if и «if' совпадают, естественно пользоваться одним и тем же базисом и для векторов, и для их образов. Поэтому вводится сле- следующее Определение. Матрицей линейного преобразования А: ?? —> ?? в базисе е = || е\ ... еп || называется матрица, столбцы которой — ко- координатные столбцы векторов /A(ei),..., А(еп) в базисе е. В соответствии с этим определением формула F) §3 для матрицы преобразования принимает вид Л1 = S^AS. A) Множество матриц А', получаемых из данной матрицы А по форму- формуле A), уже, чем множество матриц, получаемых из той же матрицы А по формуле F) § 3 при несвязанных между собой матрицах S и Р. В более узком множестве, вообще говоря, не найдется матрицы кано- канонического вида G) § 3, и теорема 2 § 3 не верна для преобразований. Не следует думать, что это — случайное обстоятельство, связан- связанное с "неудачным" определением матрицы преобразования. Матрица отображения задает это отображение, и потому все свойства отобра- отображения содержатся среди свойств его матрицы. Свойствами отображе- отображения являются те свойства его матрицы, которые инвариантны, т. е. не меняются при переходе к другой паре базисов, а остальные описы- описывают как бы его расположение по отношению к базисам. Теорема 2 § 3 по существу означает, что единственным свойством отображения является его ранг. Линейные преобразования имеют больше свойств, чем линейные отображения. Это связано с тем, что образ вектора лежит в том же пространстве, и мы получаем возможность говорить о взаимном рас- расположении вектора и его образа. Например, приобретают смысл во- вопросы о том, коллинеарен ли вектор своему образу, имеют ли ядро и множество значений ненулевое пересечение. Для отображения Jf в другое пространство Jf эти вопросы лишены смысла. Естествен- Естественно, что матрица преобразования должна иметь больше инвариантных свойств, чем матрица отображения, а это означает, что множество матриц, задающих преобразование в различных базисах, должно быть уже, чем соответствующее множество для отображения. 2. Умножение преобразований. Линейные преобразования об- обладают той особенностью, что произведение определено для любых преобразований одного пространства. В частности, если Лив — преобразования пространства ^f, то определены АВ и В А. Эти про- произведения, вообще говоря, различны. Однако может случиться, что АВ = В А. В этом случае говорят, что Лив перестановочны или ком- коммутируют. Произведение АА естественно обозначить Л2 и определить целую 12*
180 Гл. VI. Линейные пространства положительную степень А по индукции соотношением Ак = ААк~г. Нулевой степенью преобразования по определению считают тождест- тождественное преобразование Е. Линейное преобразование В, представленное как линейная комби- комбинация целых неотрицательных степеней преобразования А называется многочленом от преобразования А или, точнее, значением многочлена p(t) = «о + ot\t + ... + aktk на преобразовании Л, и обозна- обозначается р(А). Нетрудно проверить, что любой многочлен от А перестановочен с Л и что любые два многочлена от А перестановочны. Отметим, что при нашем определении матрицы преобразования сохраняется все сказанное о связи алгебраических операций над отображениями с соответствующими операциями над их матрица- матрицами. В частности, матрицей произведения В А преобразований в бази- базисе е будет произведение ВА их матриц, и для произвольного много- многочлена р(А) матрицей в каком-либо базисе будет матрица р(А). 3. Инвариантные подпространства. Рассмотрим линейное пространство «if и его линейное преобразование А. Определение. Подпространство ^ С ?? называется инвари- инвариантным относительно Л, если для каждого вектора х из ??' образ А(х) лежит в J^, или, что то же, A(Jf') С J?'. Пример 1. Рассмотрим обычное геометрическое пространство и поворот А этого пространства на угол а вокруг заданной оси р. При повороте вектор переходит в вектор, и, следовательно, поворот по- порождает преобразование трехмерного векторного пространства. Оче- Очевидно, что это преобразование линейное. Векторы, лежащие на оси р, образуют одномерное инвариантное подпространство, так как для них А(х) = х. Векторы, перпендикулярные оси р, образуют двумерное инвариантное подпространство, так как вектор, перпендикулярный оси, после поворота останется ей перпендикулярным. Пример 2. Нулевое подпространство инвариантно относительно любого преобразования. Пример 3. Пространство ??, рассматриваемое как подпрост- подпространство, является инвариантным относительно любого преобразо- преобразования. Пример 4. Каждое подпространство является инвариантным от- относительно тождественного и нулевого преобразований. Пример 5. Ядро преобразования и множество его значений яв- являются его инвариантными подпространствами. Пусть в n-мерном линейном пространстве ?? задано линейное пре- преобразование Л, и пусть /^-мерное подпространство ??' инвариантно от- относительно Л. Выберем в ?? базис ei,...,en так, чтобы векто- векторы ei,...,e/. лежали в J?l. Матрица А преобразования Л может быть
(. Задача о собственных векторах 181 разделена на четыре подматрицы, или, как говорят, клетки: Ах Az А2 А = Клетки Ах, А2, А3 и А4 имеют размеры к х к, к х (п - к), (п - к) х к и (п — к) х (п — к) соответственно. Докажем, что А% = О, т. е. эле- элементы azj матрицы А равны нулю при j = 1,...,к и г = fc + l,...,n. Действительно, первые & столбцов матрицы А — координатные столбцы векторов А(е\),..., /А(е^). Так как J^ — инвариантное под- подпространство, эти векторы лежат в J?', и их компоненты по базис- базисным векторам e^+i,...,en равны нулю. Легко видеть, что и, обратно, если в каком-либо базисе матрица линейного преобразования А имеет вид А2 А = О А4 B) то линейная оболочка векторов ei,..., е/. инвариантна относительно А. В самом деле, в этом случае для всех j = 1,...,& имеем A(ej) = = ajei + ... + a^ek, и потому образ линейной комбинации векто- векторов ei,...,e/. есть линейная комбинация этих же векторов. Матрицы вида B) называют клеточно-треуголъными. Получено Предложение 1. Матрица линейного преобразования клеточно- треуголъная тогда и только тогда, когда линейная оболочка базисных векторов ei,...,e/. — инвариантное подпространство. Если мы поместим в инвариантное подпространство не первые к базисных векторов, а базисные векторы с номерами р + 1, ...,р + к при каком-то р, то повторением тех же рассуждений мы получим для элементов матрицы А равенства а*- = 0 при j =p+l,...,p + & и г < р + 1 или г > р + к. Это значит, что в столбцах с номера- номерами р + 1, ...,р + к может быть отлична от нуля только квадратная клетка порядка к в строках с теми же номерами, т. е. расположен- расположенная на главной диагонали. Пусть теперь «if разложено в прямую сумму s инвариантных под- подпространств Jf = Jfi 0 ... © J?fs размерностей di,...,ds и в качестве базиса выбрано объединение базисов этих подпространств. Тогда в матрице преобразования могут отличаться от нуля только элементы квадратных клеток порядков di,...,ds на диагонали: А, О А = О Ая C) Такие матрицы называются клеточно-диагональными или блочно-диа- гональными. Итак, имеет место Предложение 2. Матрица линейного преобразования являет- является клеточно-диагональной тогда и только тогда, когда базис есть
182 Гл. VI. Линейные пространства объединение базисов инвариантных подпространств. Преобразование Л каждому вектору из инвариантного подпрост- подпространства J?' сопоставляет вектор из j?f'. Этим определено преобразова- преобразование подпространства J^, которое мы назовем ограничением А на J?' и обозначим Af. Для векторов из J?l по определению А'(х) = Л (ж), а для векторов, не принадлежащих JZ"', преобразование А' не определе- определено. А' отличается от А только тем, что оно преобразует ??' в J^, a не & в _Sf. Если сохранить обозначения, введенные выше, то нетрудно заме- заметить, что в базисе ei,...,e^ подпространства ??' матрицей ограниче- ограничения А! является клетка А\ матрицы B). Инвариантные подпространства преобразования А тесно связаны с преобразованиями, перестановочными с А. Эту связь описывает Предложение 3. Если преобразования А и В перестановочны, то ядро и множество значений одного из них инвариантны относи- относительно другого. Доказательство. 1°. Если х Е Кег Л, то Л (ж) = о, и потому В(А(х)) = о. Тогда А(В(х)) = о, а значит, В(х) Е Кег А. 2°. Если х Е 1тЛ, то существует вектор z такой, что х = A(z). Тогда В(х) = B(A(z)) = A(B(z)). Это означает, что В(х) Е Im A 4. Собственные подпространства. Мы найдем подпростран- подпространство, инвариантное относительно заданного линейного преобразова- преобразования Л, если найдем преобразование, перестановочное с Л и имею- имеющее ненулевое ядро. Перестановочны с А прежде всего многочлены от Л и, в частности, простейшие из них — линейные. С точностью до числового множителя линейному многочлену от Л можно придать вид Л — ЛЕ, где Л — некоторый коэффициент. Определение. Если для числа Л подпространство Кег (Л — ЛЕ) ненулевое, то Л называется собственным значением преобразования, а подпространство — собственным подпространством, соответст- соответствующим (или принадлежащим) собственному значению Л. Отметим один важный частный случай. Если преобразование Л имеет ненулевое ядро, то это ядро — собственное подпространство, соответствующее собственному значению Л = 0. Ограничение Л на этом инвариантном подпространстве — нулевое преобразование. Если вектор х лежит в собственном подпространстве, то для не- него (Л — \Е)(х) = о или Л (ж) — \Е(х) = А(х) — Хх = о и, окончательно, А(х) = Хх. D) Отсюда следует Предложение 4. Ограничение преобразования на собственном подпространстве является или нулевым преобразованием, или гомо- гомотетией: оно умножает каждый вектор этого подпространства на собственное значение.
§4- Задача о собственных векторах 183 Пусть нам каким-то образом удалось найти собственные значе- значения преобразования А. Тогда для нахождения собственных подпро- подпространств нужно для каждого собственного значения Л составить сис- систему линейных уравнений (А - \Е)? = о, E) где А — матрица преобразования в некотором базисе е. Фундамен- Фундаментальная система решений системы E) состоит из координатных столб- столбцов векторов, составляющих базис собственного подпространства. В развернутом виде система E) записывается так: Определение. Вектор х называется собственным вектором преобразования Д, соответствующим (или принадлежащим) собст- собственному значению Л, если: 1) х ф о; 2) А{х) = Хх. Определение означает, что собственные векторы — это ненулевые векторы собственных подпространств. Предложение 5. Собственные векторы и только они являют- являются базисными векторами одномерных подпространств, инвариантных относительно А. Доказательство. 1°. Пусть вектор х собственный, а у принад- принадлежит одномерному подпространству ^ с базисом х. Тогда у = ах и А(у) = аА(х) = аХх. Значит, А(у) лежит в Jf1'. 2°. Пусть х — базис инвариантного подпространства ??['. Тогда А(х) лежит в «if' и раскладывается по базису: А(х) = Хх. Так как х ф о, он собственный. Следствие. В собственном подпространстве через каждый век- вектор проходит одномерное инвариантное подпространство. Предложение 6. В г-м столбце матрицы линейного преобразо- преобразования все элементы вне главной диагонали равны нулю тогда и только тогда, когда i-й базисный вектор собственный. В этом случае диаго- диагональный элемент столбца — собственное значение. Действительно, если базисный вектор е« собственный, то A(ei) = = Хвг, и поэтому г-й элемент координатного столбца вектора Л(е«) ра- равен Л, а остальные элементы равны нулю. Остается вспомнить, что координатный столбец A(ei) есть г-й столбец матрицы преобразова- преобразования. Обратное утверждение доказывается аналогично. 5. Характеристическое уравнение. Выберем базис и обозна- обозначим через А матрицу линейного преобразования А в этом базисе. Тог- Тогда преобразование А — ХЕ имеет матрицу А — ХЕ, и согласно пред-
184 Гл. VI. Линейные пространства ложению 5 § 3 его ядро отлично от нуля тогда и только тогда, когда а\ — X а\ ^ det (А - ХЕ) = det а\ а\-Х <-Л = 0. G) < а ... < Равенство G), рассматриваемое как условие на Л, называется характеристическим уравнением матрицы А, а его корни — харак- характеристическими числами матрицы А. Разумеется, в вещественном пространстве в качестве множите- множителей допускаются только вещественные числа, и собственные значе- значения должны быть вещественными. В соответствии с этим имеет место Теорема 1. В комплексном пространстве все корни характерис- характеристического уравнения и только они являются собственными значени- значениями. В вещественном пространстве то же справедливо для вещест- вещественных корней характеристического уравнения. Левая часть характеристического уравнения представляет собой многочлен степени п. Действительно, согласно формуле полного раз- разложения A0) §4 гл. V детерминант равен алгебраической сумме про- произведений, в каждое из которых входит по п элементов матрицы. Содержат Л только элементы, стоящие на главной диагонали. Сущест- Существует одно произведение (al-A)(al-A)...«-A), (8) в котором все сомножители содержат Л. Если в какое-нибудь другое произведение вошел сомножитель а*- (г ф j), то в него не могут войти сомножители (а\ — Л) и (а\ — А). Поэтому каждый член суммы, кро- кроме (8), содержит Л в степени не выше, чем п - 2. Раскрывая скобки в выражении (8), выпишем два члена со старшими степенями Л: (-1)ПЛП + {-1)п-\а\ +о% + ... + ОА". Эти же члены будут старшими во всем многочлене. Свободный член многочлена равен его значению при Л = 0, а это значение равно det(A — (Ж) = det А. Таким образом, п det (А - ХЕ) = (-l)nAn + (-I)™ А™ ^ а\ + ... + det A. (9) Этот многочлен называется характеристическим многочленом мат- матрицы А. Остальные его коэффициенты находить не будем, так как они нам не потребуются. Многочлен степени п, как известно, не мо- может иметь больше, чем п различных корней и всегда имеет хотя бы один комплексный корень. Если мы рассматриваем вещественное пространство, то может случиться (при четной размерности), что ха- характеристическое уравнение не имеет ни одного вещественного кор-
§4- Задача о собственных векторах 185 ня, и, следовательно, линейное преобразование не имеет собственных значений и собственных подпространств. Примером может служить поворот плоскости. В комплексном пространстве и в вещественном пространстве не- нечетной размерности каждое линейное преобразование имеет хоть од- одно собственное значение и хоть одно собственное подпространство. Предложение 7. Если А и А' — матрицы линейного преобразо- преобразования А в разных базисах, то характеристические многочлены этих матриц совпадают. Доказательство. Согласно формуле A) мы имеем det(A' - XE) = det (S AS - XS^S) = detS^ - XE)S = = det(A - XE) det S'1 det S = det(A - XE). Из этого предложения следует, что мы можем назвать характе- характеристический многочлен матрицы А характеристическим многочле- многочленом преобразования А. Коэффициенты характеристического многочлена являются инва- инвариантами, связанными с преобразованием. В частности, детерминант матрицы преобразования не зависит от выбора базиса. Другим важ- важным инвариантом является коэффициент а\ + ... + а™ при (-А)™, называемый следом матрицы или следом преобразования. Он обозна- обозначается tr А или tr A С помощью теоремы Виета из (9) нетрудно установить, что след матрицы равен сумме всех корней ее характеристического многочле- многочлена, а детерминант — произведению корней. 6. Свойства собственных подпространств. Взаимное распо- расположение собственных подпространств описывает Теорема 2. Сумма собственных подпространств является пря- прямой суммой. В силу предложения 5 § 2 это равносильно утверждению: собственные векторы xi,...,xs, принадлежащие попарно различ- различным собственным значениям Ai,...,As, линейно независимы. Для доказательства рассмотрим преобразования В^ = (А — Х{Е) для всех г = l,...,s и образы векторов xi,...,xs при этих преобра- преобразованиях. Для любых г и j имеем Bi(xj) = A(xj) - XiXj = (Xj - Xi)xj. A0) Таким образом, Bi(xj) ф о при г ф j, a Bi(xi) = о. Допустим, что один из векторов раскладывается по остальным, например, хх — а2х2 + ... + olsxs. Подействуем на обе части равенства преобразованиями В2,..., Bs. Век- Вектор х\ в левой части равенства перейдет в отличный от нуля век- вектор (Ai — A2)...(Ai — As)xi, а произвольное слагаемое ctjXj (j = 2, ...,s) в правой части равенства перейдет в
186 Гл. VI. Линейные пространства т. е. в нулевой вектор. Поэтому вся правая часть равенства перей- перейдет в нулевой вектор. Полученное противоречие заканчивает доказа- доказательство теоремы. Пусть Ло — корень многочлена р(Х). Напомним, что кратностью корня Ло называется самое большое число s, при котором многочлен может быть представлен в виде р(Х) = (Л - A0)spi(A), где pi(X) — некоторый многочлен. Корни кратности 1 называются простыми. Теорема 3. Пусть собственное значение Ло преобразования А есть корень характеристического многочлена кратности s. Тогда раз- размерность соответствующего собственного подпространства не пре- превосходит s. Доказательство. Пусть корню Ло соответствует собственное подпространство размерности к. Выберем там базис ei, ...,е/. и допол- дополним его векторами e^+i, ...,en до базиса в пространстве J?. Первые к столбцов матрицы А преобразования А в этом базисе определяются предложением 6: А = О Ао О С О ... О Здесь В и С — какие-то подматрицы, занимающие п — к столбцов. Раскладывая детерминант матрицы А - \Е последовательно по каждому из первых к столбцов, мы получаем det(A - \Е) = (Ло - A)* det(C - \Е). Отсюда по определению кратности к ^ s. Теорема доказана. Собственному значению кратности s может принадлежать собст- собственное подпространство размерности, меньшей, чем s. Например, чи- читатель может проверить, что линейное преобразование двумерного пространства, задаваемое матрицей 1 1 О 1 имеет собственное значение кратности 2 и одномерное собственное подпространство. 7. Комплексные характеристические числа. Допустим, что у линейного преобразования А вещественного линейного пространст- пространства «if характеристический многочлен имеет комплексный (не вещест- вещественный) корень Л. Поскольку коэффициенты многочлена ве- вещественны, комплексно сопряженное число Л также будет корнем многочлена. Имеет место Предложение 8. Паре комплексно сопряженных корней харак- характеристического многочлена преобразования А вещественного прост-
§4- Задача о собственных векторах 187 ранства соответствует ненулевое инвариантное подпространст- подпространство J?l, обладающее тем свойством, что оно не содержит собственных векторов, а через любой его вектор проходит двумерное инвариантное подпространство. Доказательство. Числа Л и Л являются корнями веществен- вещественного квадратного трехчлена t2 + pt + q (в котором р = — (А + А), а q = АА). Рассмотрим линейное преобразование В = A2 +pA + qE и подпространство J?l = KerB. По предложению 3 J?1 инвариантно. Докажем, что ??* — ненулевое подпространство. Если в некото- некотором базисе А имеет матрицу А, то матрицей преобразования В бу- будет A2+pA + qE. Эта матрица вещественна, но_ раскладывается на два комплексных множителя: В = (А - ХЕ)(А - ХЕ). Отсюда det В = = det (А - ХЕ) det (А — ХЕ) = 0, так как det (А - ХЕ) = 0, и мы видим, что ядро В ненулевое. Jf1 не содержит собственных векторов. Действительно, если для некоторого вектора х выполнено А(х) = \±х, то В(х) = /i2x + p/ix + + qx = (/i2 + p\i + q)x. Так как квадратный трехчлен не имеет вещест- вещественных корней, /i2 + р/1 + q ф 0, и поэтому из В(х) = о следует х = о. Вектор х не может быть собственным. Пусть теперь х — ненулевой вектор из ??*'. Рассмотрим подпро- подпространство ^П — линейную оболочку векторов х и А(х). Это под- подпространство инвариантно. В самом деле, пусть у = ах + /ЗА(х) — вектор из J?n. Тогда А(у) = аА(х) + /ЗА (х). Так как в (ж) = о, мы находим, что А2(х) = — рА(х) — qx, и потому А(у) = аА(х) — (ЗрА(х) — — /3qx. Значит, А(у) раскладывается по ж и А(х), т. е. принадлежит Jfr. Итак, линейная оболочка векторов х и А(х) — инвариантное под- подпространство. Ясно, что его размерность не больше двух. Если бы она равнялась 1, то подпространство содержало бы собственный вектор, чего, как мы видели, быть не может. Предложение доказано. Рассмотрим корни характеристического многочлена. Если среди них найдется вещественный, то существует собственное подпрост- подпространство, а значит, и одномерное инвариантное подпространство. Ес- Если найдется не вещественный корень, то найдется двумерное инва- инвариантное подпространство. Поэтому имеет место Следствие. Любое линейное преобразование ненулевого вещест- вещественного пространства имеет или одномерное, или двумерное инвари- инвариантное подпространство. 8. Приведение матрицы преобразования к диагональному виду. Из предложения б вытекает Предложение 9. Матрица преобразования А в базисе ei,...,en является диагональной тогда и только тогда, когда все базисные век- векторы собственные. В этом случае диагональные элементы матри- матрицы — собственные значения. Для произвольного линейного преобразования может не сущест-
188 Гл. VI. Линейные пространства вовать базиса из собственных векторов (пример в конце п. 6). Если такой базис существует, то мы будем говорить, что матрица преоб- преобразования приводится к диагональному виду, а преобразование на- называют диагонализуемым или преобразованием простой структуры. Предложение 10. Преобразование А пространства ?? диагона- лизуемо тогда и только тогда, когда J? совпадает с суммой собст- собственных подпространств А. Доказательство. Если «if совпадает с суммой собственных подпространств, то в if есть базис из собственных векторов, так как сумма собственных подпространств прямая, и объединение их базисов — базис в if. Обратно, если есть базис из собственных век- векторов, то каждый вектор раскладывается по собственным векторам, и потому принадлежит сумме собственных подпространств. Следующее предложение дает простое, но важное достаточное ус- условие диагонализуемости преобразования. Предложение 11. Если преобразование п-мерного пространст- пространства if имеет п попарно различных собственных значений, то оно диа- гонализуемо. Действительно, соответствующие этим п собственным значениям собственные подпространства расположены так, что их сумма пря- прямая. Самое меньшее, каждое из них имеет размерность 1, и потому размерность суммы не может быть меньше, чем п. Значит, сумма собственных подпространств должна совпадать с if. Условие в предложении 11 не является необходимым. Например, если все элементы диагонали одинаковы (в частности, для тождест- тождественного и нулевого преобразований), то каждый ненулевой вектор будет собственным, и в каждом базисе матрица преобразования бу- будет диагональной. Предложению 11 можно придать следующую форму. Предложение 12. Если все характеристические числа матри- матрицы А попарно различны, то существует невырожденная матрица S такая, что матрица S~1AS диагональная. Если матрица А вещест- вещественна, а ее характеристические числа попарно различны и вещест- вещественны, то существует такая вещественная матрица S. Теорема 4. Линейное преобразование А пространства J? диа- гонализуемо тогда и только тогда, когда оно удовлетворяет уравне- уравнению р(А) = О, где p(t) — некоторый многочлен без кратных (а для вещественного пространства и комплексных) корней. При этом все собственные значения преобразования — корни многочлена. Доказательство. 1°. Пусть А диагонализуемо. Это значит, что ?^ раскладывается в сумму собственных подпространств, и каж- каждый вектор х представим в виде суммы х = х\ + ... + xs собственных векторов, принадлежащих различным собственным значениям Ai,... ..., Xs. Рассмотрим многочлен p(t) = (t — \i)...(t — \s) и покажем, что преобразование R = р(А) = (А — XiE)...(A — XSE) нулевое. Действи-
§4- Задача о собственных векторах 189 тельно, согласно A0) (А — X\E)(xj) = (Xj — \i)xj, и потому R(*j) = (Aj - \i)...(Xj ~ Xj)...(Xj - Xs)Xj = o. Отсюда вытекает, что R{x) = R{x\) + ... + R(xs) = о для любого х. 2°. Обратно, пусть А удовлетворяет уравнению р(А) = О, в кото- котором p(t) = (t — ai)...(t — as). Разложим функцию l/p(t) на элементар- элементарные дроби: 1 Р1 P I I t — Oil t — OLs После приведения к общему знаменателю получим тождество где qi(t) = /3ip(t)/(t — QLi) — произведение /3{ на многочлен, получае- получаемый из p(t) вычеркиванием множителя t — щ. Подставим в это тож- тождество преобразование А вместо переменной t: E = qi(A) + ... + qs(A). Подействуем обеими частями полученного равенства на произволь- произвольный вектор х. Мы получим х = х\ + ... + х8, где xi = qi(A)(x). Вектор xi ф о тогда и только тогда, когда он собственный, a «j — соответствующее собственное значение. Действительно, (А — aiE)(xi) = /3ip(A)(x) = о. Таким образом, произвольный век- вектор пространства разложен в сумму собственных векторов. Это равносильно тому, что Jf раскладывается в сумму собственных под- подпространств. 9. Приведение матрицы преобразования к треугольному виду. Теорема 5. В комплексном линейном пространстве для каждо- каждого линейного преобразования существует базис, в котором матрица преобразования — верхняя треугольная. В вещественном пространстве то же утверждение справедливо, если все корни характеристического многочлена преобразования ве- вещественны. Заметим, что диагональные элементы треугольной матрицы — корни ее характеристического многочлена. Поэтому условие во вто- второй части теоремы необходимо. Доказательство. Если в n-мерном пространстве у линей- линейного преобразования А существует собственное значение Л, то найдется (п — 1)-мерное инвариантное подпространство j?fn_i. Дейст- Действительно, dim Im (A - ЛЕ) = п - dim Ker (А - ЛЕ) ^ п - 1. Инвари- Инвариантным будет любое (п — 1)-мерное подпространство j?fn_i, содержа- содержащее Im (А — ЛЕ), так как если х G j??n_i, то А(х) можно представить в виде суммы (А(х) - Хх) + Хх, причем А(х) - Хх е Im (А - ХЕ) С С ?? и Хх G ?? Поместим в J??n_i первые п — \ базисных векторов. Так как J??n_i инвариантно, первые п - 1 элементов последней строки матрицы А преобразования будут равны нулю. Мы можем свободно распоряжать- распоряжаться первыми п — 1 базисными векторами, не выводя их из j?fn_i.
190 Гл. VI. Линейные пространства Применим те же соображения к ограничению преобразования А на «ifn_i. Мы получим J?n-2 С «ifn_i, и поместив туда первые п — 2 ба- базисных векторов, сделаем равными нулю элементы (п - 1)-й строки, лежащие ниже диагонали. Продолжая далее те же рассуждения, мы получим цепочку инва- инвариантных подпространств jsfi с... cjSfn-2CJSfn-i, (и) причем е\ G «ifi; ei,e2 G «if 2; •••; ei,...,en_i G «ifn_i. Матрица преоб- преобразования в таком базисе будет треугольной. В комплексном пространстве на каждом этапе существование собственного значения сомнений не вызывает. В вещественном прост- пространстве мы предполагаем, что все корни характеристического мно- многочлена вещественны. Докажем, что в этом случае ограничение А' преобразования А на каком-либо инвариантном подпространстве ??' имеет только вещест- вещественные корни характеристического многочлена. Допустим, что у А' существует пара_ комплексно сопряженных корней Л и Л, и обозна- обозначим р — — (А + А) и q = XX. Согласно предложению 8 найдется не- ненулевой вектор ж Gif', такой, что (А1 + рА' + qE')x = о. Так как А1(ж) = А(х), мы имеем (А + рА + qE)x = о. Это означает, что мат- матрица В преобразования А2 + рА + qE вырождена. Но В = А2 + рА + + qE = (А - ХЕ)(А - ХЕ). Поэтому из det В = 0 следует det(A - ХЕ) = = 0, что противоречит условию теоремы. Таким образом, и в вещест- вещественном пространстве при наших предположениях на каждом этапе построения базиса существование собственного значения гарантиро- гарантировано. Упражнения 1. Докажите, что каждое подпространство, лежащее в Кег/А, и каждое подпространство, содержащее Im/A, инвариантно относительно А. 2. Докажите, что сумма и пересечение инвариантных подпространств инвариантны. 3. Докажите, что размерность подпространства ??\ определенного в предложении 8, — четное число. 4. Пусть A: Jf —»> «if. Докажите, что «if = Ker A © Im/A тогда и только тогда, когда КегЛ2 = Ker A 5. Пусть Jf = Ker/A© ImA Какой вид имеет матрица преобразова- преобразования А в базисе е, если ei,..., er G Im Д, a er+i,..., en G Ker A? 6. Пусть х и у — столбцы высоты п. Докажите, что det(i? + xyT) = = 1 + хту. 7. Найдите собственные значения и собственные подпространства пре- преобразования, заданного матрицей 3-2 6 -2 6 3 6 3-2
§ 5. Линейные функции 191 8. Каждой квадратной матрице порядка п сопоставляется ее транспони- транспонированная матрица. Этим определено преобразование Т пространства мат- матриц. Найдите его собственные векторы и собственные подпространства. Докажите из этих соображений, что каждая матрица однозначно представ- представляется как сумма симметричной (Ат = А) и кососимметричной (Ат = —А). 9. Пусть Аи В — квадратные матрицы одного порядка и det A / 0. До- Докажите, что характеристические многочлены матриц АВ и В А совпадают. 10. Пусть А диагонализуемо. Докажите, что ограничение А на любом инвариантном подпространстве также диагонализуемо. 11. В исходном базисе преобразование А задано матрицей 1 -2 -2 А= 4 7 6 -1 -1 1 Найдите какой-либо базис, в котором его матрица А' — верхняя треуголь- треугольная и напишите эту матрицу. § 5. Линейные функции 1. Определение функции. Мы будем рассматривать линейное пространство «if, вещественное или комплексное. Слово "число", упо- употребленное без уточнения, означает комплексное число для комплекс- комплексного пространства и вещественное число для вещественного. Определение. Будем говорить, что на линейном пространст- пространстве «if задана функция f от одного вектора, если каждому вектору х Е Е ?? сопоставлено число f(x), а также, что задана функция g от двух векторов, если каждой упорядоченной паре векторов ж, у из S? сопо- сопоставлено число g(x,y). Функции на бесконечномерных пространствах, элементы которых сами являются функциями, называют функционалами. Пусть пространство ?? имеет размерность п. При выбранном бази- базисе каждому вектору х из ?? сопоставлены п его компонент ^1, ...,?п. Напомним, что в математическом анализе функцией от п перемен- переменных называют закон, который ставит в соответствие некоторое чис- число каждому упорядоченному набору из п чисел ?1,...,?п, входяще- входящему в определенную совокупность таких наборов. Таким образом, при выбранном базисе функция f на линейном пространстве ^ задается функцией от п переменных, определенной на множестве всевозмож- всевозможных наборов ?1,...,?п. Если базис изменится, тому же вектору х бу- будут соответствовать новые компоненты, и, следовательно, прежняя функция f будет задана новой функцией от п переменных. 2. Линейные функции. Введем Определение. Функция f на линейном пространстве Jf назы- называется линейной, если для любых х и у из Jf и любого числа а вы- выполнены равенства 1(x + y)=f(x)+f(y), f(ax)=af(x). A)
192 Гл. VI. Линейные пространства Читатель может заметить, что линейная функция на пространст- пространстве «if не является новым для него объектом. Это в точности то же самое, что линейное отображение «if в одномерное арифметическое пространство. Пример 1. Функция, сопоставляющая каждому вектору число О, линейная. Функция, сопоставляющая всем векторам одно и то же чис- число, отличное от нуля, не линейная, так как для каждой линейной функции f (о) = 0. Пример 2. Рассмотрим геометрическое пространство векто- векторов — направленных отрезков. Выберем в нем некоторый фикси- фиксированный вектор а. Каждому вектору х можно сопоставить число ? = (а, х). Ясно, что равенства A) выполнены, и мы имеем линейную функцию. Пример 3. Пусть в n-мерном пространстве J? выбран базис е. Сопоставим каждому вектору х его г-ю компоненту в базисе е. Оче- Очевидно, что это соответствие — линейная функция на J?. Мы обозна- обозначим ее р\ Так может быть построено п функций р1, ...,рп. Конечно, они зависят от того, какой базис в Jf был выбран. Пример 4. Рассмотрим пространство ^функций, определенных и непрерывных на отрезке [0,1] (пример 1 § 1). Пусть v — фиксирован- фиксированная функция из ^. Тогда каждой функции и из ^ можно сопоставить число ! ( = fv(t)u(t)dt. о Нетрудно проверить, что это соответствие — линейный функционал. Еще один линейный функционал на том же пространстве ^ мы получим, если сопоставим каждой функции и ее значение в нуле и@). Рассмотрим n-мерное линейное пространство Jf и выберем в нем базис ei,...,en. Значение линейной функции f на векторе х может быть выражено через координаты этого вектора ?1,...,?п: Цх) = f(^ei + ... + Сеп) = еЦег) + ... + СЧеп). Числа f(ei), ...,f(en) не зависят от вектора ж, а определяются толь- только функцией f и базисом. Мы доказали следующее Предложение 1. Каждая линейная функция на п-мерном линей- линейном пространстве в произвольном базисе е задается линейным одно- однородным многочленом г, ч v f(x) + ... + (pnr B) от координат вектора в этом базисе. Коэффициенты многочлена (pi,...,(pn равны значениям функции на базисных векторах. Значения функции f на векторах базиса е удобно называть компо- компонентами или коэффициентами функции f в базисе е. Матрица линей- линейного отображения n-мерного пространства в одномерное имеет раз- размеры 1 х п, т. е. это — строка длины п. Предоставим читателю про- проверить, что это строка || <?i ...<?п ||- Формула B) в матричном виде
§ 5. Линейные функции 193 записывается так: е f(x) = \\<Pl...<Pn\ (з) Каждая строка ср по формуле C) определяет линейную функцию. В самом деле, <р(? + rf) = ср? + <?Т7 и <р(а?) = а<р(?). Формула F) § 3 выражает матрицу отображения в новых базисах через его старую матрицу и матрицы перехода к новым базисам. Так как в одномерном арифметическом пространстве базис фиксирован раз и навсегда, для линейной функции эта формула принимает вид Ч>' = 4>S. D) Здесь ср — строка коэффициентов функции в базисе е, а ср' — стро- строка ее коэффициентов в базисе е' = eS. Разумеется, формулу D) легко получить и непосредственно. Действительно, ср\ — f (е[) = cpai для лю- любого г. Координатный столбец <Ji вектора е[ есть г-й столбец матрицы перехода S. Отсюда прямо следует D). 3. Сопряженное пространство. В §3 введены определения ли- линейных операций для линейных отображений. В применении к линей- линейным функциям эти определения формулируются так. Определение. Суммой линейных функций f и g называется функ- функция h, значение которой для любого вектора х определяется равенст- равенством h(x) = f (ж) + g(x). Произведением линейной функции f на число а называется функция g, значение которой на векторе х определяется как g(x) = af(ж). Предложение 2. Пусть fug — линейные функции, а (р и ф — их строки коэффициентов в некотором базисе е. Тогда сумма f + + g — линейная функция, и ее строка коэффициентов равна cp + ip. Для произвольного числа а произведение af — линейная функция, и ее строка коэффициентов есть аср. Докажем первую часть предложения. Вторая часть доказывается аналогично. Для произвольного вектора х значения функций записы- записываются как f (ж) = <р? и g(x) = ф?. Тогда значение суммы f + g на том же векторе равно ср? + ф? = (ср + *ф)?- Это показывает, что f + g — линейная функция со строкой коэффициентов ср + ф. Предложение 3. Множество ??* всех линейных функций на п-мерном линейном пространстве J? no отношению к введенным выше линейным операциям представляет собой п-мерное линейное пространство. Действительно, существует взаимно однозначное отображение множества «if* на множество строк длины п, причем сумме функ- функций соответствует сумма строк, а произведению функции на число — произведение ее строки на это число. Поскольку аксиомы линейного 13 Д.В. Беклемишев
194 Гл. VI. Линейные пространства пространства выполнены для операций со строками, они будут вы- выполнены и для операций в J?*. Следовательно, J?* — линейное про- пространство, изоморфное пространству строк длины п. Определение. Линейное пространство J?* всех линейных функ- функций на линейном пространстве Л? называется сопряженным для Л?. Выберем базис е в пространстве Л? и рассмотрим линейные функ- функции рг (г = 1, ...,п), определяемые равенствами ръ[х) = ?г, где ?г — г-я координата вектора х (пример 3). Это означает, что / 3i D 4 1 rr>\ (K\ или, иначе, строка коэффициентов функции рг есть г-я строка единич- единичной матрицы. Отсюда легко следует, что функции р1,...,рп линейно независимы. Так как пространство J?* n-мерное, эти функции со- составляют в нем базис. Определение. Базис рг,..., рп в «if*, определяемый формулой E), называется биортогональным или взаимным базису ei,...,en прост- пространства S?. Строка || ipi ...(fn || раскладывается по строкам единичной матри- матрицы с коэффициентами (^i, ...,(pn. Поэтому элемент f пространства ^* со строкой коэффициентов \\cpi ...срп\\ имеет разложение f^l i i ~п /??\ Введем столбец р, составленный из функций р\ Теперь разложение F) можно переписать в матричной форме: л f = = <РР- G) Таким образом, строка координат элемента f Е Jf* во взаимном бази- базисе р совпадает с его строкой коэффициентов в исходном базисе ei,..., еп пространства ??. Если для пространства ^* придерживаться сог- соглашения писать компоненты вектора в столбец, а базисные векто- векторы в строку, то формулу G) следовало бы написать в виде f = Т Т Пусть в ?? базисы е и е; связаны равенством е; = eS. Найдем матрицу перехода между их взаимными базисами ри р'. Для этого напишем формулу D) в виде D) § 1, решив ее относительно старых коэффициентов и транспонировав, чтобы записать коэффициенты в столбец. Мы получим Отсюда видно, что матрицей перехода от базиса р к базису р' в про- пространстве ??* будет матрица (S~1)T. Значит, базисы связаны фор- формулой р; = ртE-1)т. Если вернуться для пространства ^* к записи
§ 5. Линейные функции 195 элементов базиса в столбец, связь базисов примет вид Р = Sp'. (8) Пространство Jf* — такое же линейное пространство, как и лю- любое другое, и, следовательно, имеет сопряженное пространство «if**, элементы которого — линейные функции на «if*. Предложение 4. Пространство J?** может быть отождеств- отождествлено с ??. Доказательство. Фиксируем определенный вектор х из S? и сопоставим каждому элементу f Е J?f* число f(x). Таким образом, х можно рассматривать как функцию на Jf*. Эта функция линей- линейная. Действительно, (f + g)(x) = f (ж) + g(x), и, следовательно, х сум- сумме функций сопоставляет сумму чисел, сопоставляемых слагаемым. Аналогично, равенство (af)(x) = af(x) означает, что произведению f на а вектор х сопоставляет произведение а на число, сопоставлен- сопоставленное f. Итак, х можно отождествить с некоторым элементом J?**. При этом сумма и произведение на число для векторов из ?? сов- совпадают с их суммой и произведением на число, если их понимать как функции на J?*. Это очевидно. Например, для суммы это равносильно равенству f[х + у) = f (ж) + f(у). Теперь мы видим, что ?? может быть отождествлено с под- подпространством в ??**. Но dim J?f = dim J?f* = dim J?f**, и подпростран- подпространство совпадает со всем пространством. Упражнения 1. Может ли для линейной функции на линейном пространстве Jf для всех xGif выполняться: a) f (ж) > 0; б) f (ж) ^ 0? 2. Пусть а — фиксированный вектор плоскости. Сопоставим каждому вектору х площадь ориентированного параллелограмма, построенного на х и а, или 0, если векторы коллинеарны. Проверьте, что эта функция линейна, и найдите строку ее коэффициентов в базисе ei,e2, если а = aei +/3e2. Изменив базис, проверьте формулу D). 3. Пусть к — натуральное число. Сопоставим каждому многочлену сте- степени не выше п значение его к-й производной в точке а. Проверьте, что этим определена линейная функция. Найдите ее координатную строку в базисах: а) 1, t, t2,..., Г; б) 1, (t-a),(t- аJ,..., (t - а)п. 4. Пусть ei,..., en E Jf и р1,..., рп Е ??* — пара биортогональных базисов. Докажите, что для любого х Е ?? и для любого f E ~?f* выполнено ж = = p1(x)ei + ... + рп(х)еп и f = f(ei)p1 + ... + f(en)pn. § 6. Квадратичные формы 1. Билинейные функции. Введем следующее Определение. Билинейной функцией или билинейной формой на линейном пространстве Jf называется функция b от двух векторов 13*
196 Гл. VI. Линейные пространства из S?^ линейная по каждому из своих аргументов, т. е. удовлетво- удовлетворяющая (для любых ж, у и z и любого числа а) равенствам b(x + y,z) = b(x, z) + b(y, z), b(ax, y) = ab(x, y), b(x, y + z) = b(x, y) + b(x, z), b(x, ay) = ab(x, y). Пример 1. Паре векторов на плоскости сопоставим скалярное произведение. В силу известных свойств скалярного произведения это — билинейная функция. Пусть е = || ei ... еп|| — базис в Jf. Если ?г и t]j (i,j = 1, ...,n) — координаты векторов х и у, то значение билинейной функции b на этой паре векторов может быть вычислено согласно A) так: ь(х,у) = г=1 или, окончательно, B) Здесь п2 чисел $ц = b(ei,ej) (значения билинейной функции на все- всевозможных парах базисных векторов) называются ее коэффициента- коэффициентами в базисе е. Их записывают в виде квадратной матрицы порядка п: В = 13ц 1321 012 022 P in 0п2 Эта матрица называется матрицей билинейной функции в данном ба- базисе. Как легко проверить умножением матриц, равенство B) можно написать в матричном виде: b(x,y)=STBri. C) Матрица билинейной функции в следующем смысле однозначно опре- определена: если значение Ь(х,у) для любой пары векторов получается по формуле C) с помощью матрицы С, то С = В, т. е. элементы С — зна- значения b на парах базисных векторов. Действительно, в этом случае мы имеем /3ij = b(e^ej) = efCej, где е^ и е^ — столбцы единичной матрицы. Пример 4 § 2 гл. V показывает, что flij равно элементу сц матрицы С. При замене базиса матрица билинейной функции, разумеется, ме- меняется. Получим закон ее изменения. Пусть ^'иг/' — координатные столбцы векторов жиув базисе е; = eS. Тогда ? = S?' и г] = Sr]'. По формуле C) имеем Ь(х,у) = (Sg)TB(Sr]f) = ^f(STBS)r]f. Поскольку матрица В' функции b в базисе е; однозначно определена, В' = STBS. D)
§6. Квадратичные формы 197 Перемножая матрицы, мы получим выражение для элементов В' #j = I>Mflw (M = l,...,n), E) к,1 в котором о\ — элементы матрицы перехода S. Билинейная функция b называется симметричной, если для любой пары векторов Ь(х,у) = Ь(у,х). Если билинейная функция симметрична, то b(ei,ej) = b(ej,e«) для любых г и j, т. е. /3ij = /?ji. Таким образом матрица В билинейной функции симметрична. Обратно, пусть билинейная функция имеет симметричную матри- матрицу. Тогда, поскольку матрица размеров 1 х 1 не меняется при транс- транспонировании, Ь(х,у) = ЦТВП)Т = г)ТВтЦ = г)ТВ? = Ь(у,х). Мы доказали Предложение 1. Билинейная функция симметрична тогда и только тогда, когда симметрична ее матрица. 2. Квадратичные формы. Определение. Квадратичной формой или квадратичной функ- функцией на линейном пространстве «if называется функция к, значение которой на любом векторе х определяется равенством к(х) = Ь(ж,ж), где b — симметричная билинейная функция. Пример 2. Скалярное произведение векторов — симметричная билинейная функция. Соответствующая квадратичная функция сопо- сопоставляет вектору квадрат его длины. По заданной квадратичной форме к однозначно определяется соот- соответствующая симметричная билинейная функция Ь. Действительно, пусть х и у — произвольные векторы. Тогда к(х + у) = Ь(х + у, х + у) = Ь(х, х) + Ь(х, у) + Ь(у, х) + Ь(у, у). Отсюда, используя b(y,x) = b(x,y), получаем и значение Ь на любых векторах выражается через значения к. Матрицей квадратичной формы называется матрица соответст- соответствующей билинейной функции. Согласно C) мы имеем следующее выражение значения квадра- квадратичной формы через координатный столбец вектора: или, в развернутом виде,
198 Гл. VI. Линейные пространства Правая часть формулы G) — однородный многочлен второй степе- степени относительно ?1,...,?п. (Собственно, слово "форма", когда-то упо- употреблявшееся значительно шире, означает "однородный многочлен".) Приведенная запись этого многочлена содержит подобные члены: при г ф j члены /3ijC^ и Pji&€ и Pji&€ совпадают. Поэтому после при- приведения подобных членов G) принимает вид Определение. Квадратичная форма к в базисе е имеет диаго- диагональный вид, если в этом базисе т. е. ее матрица является диагональной. Теорема 1. Для каждой квадратичной формы к существует ба- базис, в котором она имеет диагональный вид. Доказательство. Пусть В — матрица квадратичной формы к в каком-либо базисе. Применим к матрице В последовательность эле- элементарных преобразований, которую для удобства описания ра- разобьем на ряд шагов. На первом шаге возможны два случая. 1) Основной случай: (Зц ф 0. Если это так, вычитаем первую стро- строку, умноженную на подходящие множители {(Зц/ (Зц для г-й строки), из всех лежащих ниже строк и вычитаем первый столбец, умножен- умноженный на те же множители, из всех столбцов правее него. В результате матрица В перейдет в матрицу В\ вида 0 0 0 A0) где С\ — симметричная матрица порядка п — 1. 2) Особый случай: (Зц = 0. Здесь имеются две возможности. а) (Зц = 0 для всех г = 2,..., п. При этом матрица уже имеет нужный вид A0). б) Найдется г, для которого /Зц ф 0. При этом делается вспомога- вспомогательное преобразование: если /Зц ф 0, то г-я строка переставляется с первой, и г-й столбец переставляется с первым; если же /Зц = 0, то г-я строка прибавляется к первой и г-й столбец прибавляется к первому. В преобразованной матрице оказывается C'1Х ф 0. После вспомогатель- вспомогательного преобразования матрица приводится к виду A0) так же, как и в основном случае.
§ 6. Квадратичные формы 199 Пусть в результате к шагов мы получили матрицу вк = ?i 0 0 0 0 ск A1) Здесь Ск — симметричная матрица порядка п — к, а через ?]_,...,?& обозначены левые верхние элементы матриц d, полученных на пре- предыдущих шагах. Следующий, (к + 1)-й шаг состоит в такой последовательности элементарных преобразований последних п — к строк и последних п-к столбцов матрицы Вк, которая равносильна применению пре- преобразований первого шага к матрице Ск. В результате мы получаем матрицу Bk+i, имеющую тот же вид с большим на 1 значением к. После (п — 1)-го шага матрица Сп-\ имеет порядок 1 и не нужда- нуждается в преобразовании. В результате матрица В будет превращена в диагональную матрицу В' = Разумеется, если исходная матрица нулевая или нулевой окажется какая-либо из матриц Си, то в дальнейших преобразованиях необхо- необходимости нет, так как матрица уже диагональная. Это равносильно тому, что на всех следующих шагах имеет место особый случай а). Важно заметить, что после каждого элементарного преобразова- преобразования строк осуществлялось такое же элементарное преобразование столбцов. Если элементарное преобразование столбцов равносильно умножению преобразуемой матрицы справа на матрицу Sa, то то же преобразование строк равносильно умножению слева на матрицу S^ (п. 4 §2 гл. V). В результате всей последовательности элементарных преобразо- преобразований мы получаем матрицу В' = STBS, где S = Si...Sn — произве- произведение всех матриц, осуществляющих элементарные преобразования столбцов. Мы доказали, таким образом, что матрица В' является матрицей квадратичной формы к в базисе е;, который связан с исходным бази- базисом е матрицей перехода S. Теорема доказана. Доказательство дает способ выписать матрицу перехода S к бази- базису, в котором квадратичная форма имеет диагональный вид. Для это- этого нужно попутно с преобразованиями матрицы В делать все элемен- элементарные преобразования со столбцами единичной матрицы. В конце единичная матрица превратится в произведение всех элементарных матриц, т. е. в нужную нам матрицу S.
200 Гл. VI. Линейные пространства При приведении квадратичной формы к диагональному виду мож- можно воспользоваться методом выделения квадратов. Покажем его на примере. Пусть задана квадратичная форма их) = 2(ег+4ее+цег+±ее+це?. Заметив, что коэффициент при f^1J отличен от нуля, соберем вместе все члены, содержащие ^: Дополним выражение в квадратных скобках до квадрата суммы, при- прибавив и вычтя 2(?2J: т1J+ч1е + к2J] - ш2J+че?+ч2е+неJ- Теперь к(х) = 2[(^ + ?2)]2 + к'(х), где к; — квадратичная форма, значения которой зависят только от ?2 и ?3: к'(х) = (еJ+ц2е+чеJ- К ней можно применить тот же прием: к'(Х) = (е+2еJ + (еJ- Итак, где Последние формулы задают преобразование координат при переходе к базису, в котором квадратичная форма имеет диагональный вид. В методе выделения квадратов также возможен особый случай, когда в квадратичную форму не входят квадраты координат, а вхо- входят только произведения. Допустим, что с ненулевым коэффициен- коэффициентом 2/?i2 входит произведение ^?2. Рекомендуется замена координат После этой замены в квадратичную форму войдут члены -2/3i2(?2J, и выделение квадратов может быть продолжено. При доказательстве теоремы 1 была предложена определенная по- последовательность элементарных преобразований. В основном случае метод выделения квадратов только формой записи отличается от при- приведения с помощью этой последовательности преобразований. Но полезно иметь в виду, что можно использовать любую последователь- последовательность элементарных преобразований при единственном условии: пос- после каждого элементарного преобразования строк должно выполняться то же элементарное преобразование столбцов. Диагональный вид квадратичной формы в вещественном простран- пространстве мы будем называть каноническим видом, если элементы Sk на диагонали могут быть равны только 1, —1 и 0. В комплексном
§6. Квадратичные формы 201 пространстве диагональный вид квадратичной формы канонический, если числа на диагонали могут равняться только 1 или 0. Теорема 2. Для каждой квадратичной формы существует базис, в котором она имеет канонический вид. Для доказательства будем исходить из диагонального вида квад- квадратичной формы и сделаем следующее преобразование. Если какой- либо из диагональных элементов е/. отличен от нуля, то разделим к-ю строку и к-й столбец матрицы на ^/ё/Г в случае комплексного прост- пространства и на д/k^I в слУчае вещественного пространства. Это рав- равносильно делению к-го базисного вектора на то же число. Сделав это для всех к таких, что Sk ф 0, мы приведем квадратичную форму к каноническому виду. 3. Ранг и индекс квадратичной формы. Существует много базисов, в которых данная квадратичная форма имеет канонический вид. Коэффициенты Sk могли бы быть, вообще говоря, своими для каждого из таких базисов. Однако оказывается, что они одни и те же (с точностью до порядка их расположения), как бы мы ни приводили квадратичную форму к каноническому виду. Теорема 3. Ранг матрицы квадратичной формы не зависит от базиса. Действительно, по формуле E) матрицы В и В' квадратичной фор- формы в двух базисах связаны равенством В' = STBS, где det S ф 0. Отсюда RgB' = RgBS = RgB в силу предложения 3 §3 гл. V. Если квадратичная форма имеет диагональный вид, то ранг ее матрицы равен числу диагональных элементов, отличных от нуля. Таким образом, это число не зависит от базиса. Определение. Число не равных нулю коэффициентов в канони- каноническом виде квадратичной формы к называется рангом к. Итак, ранг квадратичной формы равен рангу ее матрицы. В комплексном пространстве все квадратичные формы одного и того же ранга г приводятся к одному и тому же каноническому ви- ДУ f^1J + ••• + (?гJ- Теперь рассмотрим вещественное пространст- пространство &. Определение. Квадратичную форму к будем называть положи- положительно определенной на подпространстве Jf1 пространства «if, если к(ж) > 0 для любого ненулевого вектора х из ??*'. Форма к отрица- отрицательно определена на J^, если к(ж) < 0 для любого ж/оиз ^. Если говорят, что квадратичная форма положительно или отрица- отрицательно определена, без уточнения подпространства, то она обладает таким свойством на всем ??. Квадратичные формы, для которых к(ж) ^ 0 или к(ж) ^ 0 при лю- любом ж, называются соответственно положительно или отрицательно полуопределенными. Удобно считать, что на нулевом подпространстве каждая квадра-
202 Гл. VI. Линейные пространства тичная форма и положительно определена, и отрицательно определена одновременно. В силу этого соглашения всегда существует (хотя бы нулевое) подпространство, на котором квадратичная форма отрица- отрицательно определена. Определение. Пусть ^' — подпространство максимальной размерности среди всех подпространств, на которых квадратичная форма отрицательно определена. Число dim «if'' называется отрица- отрицательным индексом или просто индексом квадратичной формы. Ана- Аналогично определяется положительный индекс как максимальная из размерностей подпространств, на которых квадратичная форма по- положительно определена. Докажем так называемый закон инерции квадратичных форм. Теорема 4. Число отрицательных и число положительных ко- коэффициентов в каноническом виде квадратичной формы не зависят от базиса, в котором она приведена к каноническому виду. Докажем сначала, что если в каком-либо базисе форма к приведена к каноническому виду, то число коэффициентов, равных —1, равно отрицательному индексу формы к. Пусть в базисе ei,...,en форма к ранга г с индексом s имеет канонический вид -(^J - - - (П2 + (?i+1J + - + (ГJ- Обозначим через J?\ линейную оболочку векторов ei,...,ej, а через J?i — линейную оболочку остальных базисных векторов. Для любого х е -Sfi имеем ?*+1 = ... = С = 0, и к(х) = -(^J - ... - (^'J < 0, если только х ф о. Значит, к отрицательно определена на «if \ и s ^ j. На ^2 форма к положительно полуопределенная, потому что ^ = ... = & = 0 для любого х е ^2 и к(х) = (^+1J + ... + (ГJ- (Форма может равняться нулю на ненулевом векторе, если г < п.) dim ^2 = п — j- Пусть существует подпространство J?^> размер- размерности s > j, на котором к отрицательно определена. Тогда, посколь- поскольку сумма размерностей J^ и J?^> больше п, эти подпространства имеют ненулевой вектор z в пересечении. Имеем k(z) < 0, так как z G ^' и k(z) ^ 0, так как z G «if2- Полученное противоречие пока- показывает, что j = s. Число коэффициентов, равных —1, равно отрица- отрицательному индексу, и потому не зависит от базиса. Число коэффициен- коэффициентов, равных +1, также не зависит от базиса, так как оно равно г — s, а ранг г и индекс s от базиса не зависят. Теорема доказана. Следствие. Число положительных и число отрицательных ко- коэффициентов в любом диагональном виде квадратичной формы не за- зависят от базиса. Положительно определенные квадратичные формы имеют ранг п и индекс 0 и приводятся к каноническому виду (?1J + - + (ГJ- A2) Отрицательно определенные квадратичные формы имеют ранг п и
§6. Квадратичные формы 203 индекс п и приводятся к каноническому виду — f^1J — ••• — (?пJ« Положительно и отрицательно полуопределенные квадратичные фор- формы ранга г приводятся соответственно к каноническим видам В вещественном пространстве квадратичная форма характеризу- характеризуется двумя числами в том смысле, что все квадратичные формы, у которых эти пары чисел одинаковы, приводятся к одному и тому же каноническому виду. В качестве таких чисел можно взять положи- положительный и отрицательный индексы или же ранг, который равен их сумме, и отрицательный индекс. Часто вместе с рангом используют разность положительного и отрицательного индексов. Эта разность называется сигнатурой квадратичной формы. Условие положительной определенности квадратичной формы дает следующая теорема, называемая критерием Сильвестра. Теорема 5. Для положительной определенности квадратичной формы необходимо и достаточно, чтобы миноры ее матрицы удов- удовлетворяли неравенствам п ... /31к мк = h >0 (& = 1,...,п). A3) Миноры вида A3) называются главными минорами матрицы. Для доказательства вспомним преобразования матрицы квадра- квадратичной формы, примененные при доказательстве теоремы 1. 1°. Необходимость. Если квадратичная форма к положительно определена, то диагональные элементы ее матрицы в любом базисе удовлетворяют условию /Зц = к(е<) > 0, и, следовательно, при приведении матрицы к диагональному виду особый случай не встретится. В основном случае к любой строке может быть прибавлена только лежащая выше, а к любому столб- столбцу — только расположенный левее. При таких преобразованиях глав- главные миноры матрицы не изменятся. Но у диагональной матрицы для положительно определенной квадратичной формы главные миноры положительны. Поэтому они положительны и у исходной матрицы. 2°. Достаточность. Пусть все главные миноры матрицы В положительны. В частности, Mi = /Зц > 0, и первый шаг преобра- преобразования приводит матрицу к виду A0) с е\ > 0. Допустим, что пос- после к шагов мы получили матрицу Вк с положительными ?]_,...,?&, причем не возникало особого случая. Тогда для левого верхнего эле- элемента матрицы Си имеем su+i = Mk+i/Mk, так как главные миноры не менялись. Поэтому 8к+\ > 0, на очередном шаге преобразования имеет место основной случай и полученная матрица имеет положи-
204 Гл. VI. Линейные пространства тельные элементы ei,..., s^+i. Рассуждая так для всех к, мы придем к доказываемому утверждению. 4. Полуторалинейные функции. В комплексных пространст- пространствах квадратичные формы используются сравнительно редко. В при- приложениях чаще встречаются так называемые эрмитовы формы. Определение. Функция b от двух векторов на комплексном ли- линейном пространстве «if называется полуторалинейной или эрмито- эрмитовой билинейной функцией, если для любых векторов ж, у и z и любого комплексного числа а Ь(х + y,z) = Ь(х, z) + Ь(у, z), Ь(ах, у) = аЬ(х, у), b(x, y + z) = b(x, у) + b(x, z), b(x, ay) = ab(x, y). Отличие полуторалинейной функции от билинейной в том, что она не линейна по второму аргументу: при его умножении на число а значение функции умножается на комплексно сопряженное число а. Перечислим основные свойства этих функций. Доказываются они так же, как соответствующие свойства билинейных функций. Ниже черта над буквой, обозначающей матрицу, будет обозначать замену всех элементов матрицы комплексно сопряженными числами. Если в «if выбран базис, то значение полуторалинейной функции на паре векторов х иу может быть выражено через координаты этих векторов формулой j В называется матрицей полуторалинейной функции. Ее элементы рав- равны значениям b на парах базисных векторов: fyj = b(e^ej). При замене базиса _с матрицей перехода S матрица В заменяется на матрицу В' = STBS. Полуторалинейная функция b называется эрмитово симметрич- симметричной, если для любой пары векторов b(x,y) = b(y,x). Для этого необ- необходимо и достаточно, чтобы в любом базисе элементы матрицы этой функции удовлетворяли условиям Pij = /3ji. Это равносильно усло- условию ВТ = В на матрицу полуторалинейной функции. Определение. Матрица В, для которой Вт = В, называется эрмитовой матрицей. Элементы эрмитовой матрицы, симметричные относительно глав- главной диагонали, комплексно сопряжены: /3^ = /3ji, в частности, элемен- элементы на главной диагонали вещественные: /Зц = (Зц. Определение. Функция к на комплексном линейном простран- пространстве называется эрмитовой формой, если к(х) = Ь(ж, х) для некоторой эрмитовой симметричной полуторалинейной функции Ь. Для заданной эрмитовой формы к можно так выбрать базис, что ее матрица будет иметь канонический вид: диагональная матрица с элементами 1, —1 или 0 на диагонали. При этом для эрмитовых форм справедлив закон инерции: в матрице канонического вида число
§ 7. Теорема Жордана 205 элементов на диагонали, равных 0, 1 и —1, не зависит от базиса, в котором форма имеет канонический вид. Таким образом, эрмитовы формы по свойствам ближе к квадра- квадратичным формам в вещественном пространстве, чем к квадратичным формам в комплексном пространстве. Упражнения 1. Значение билинейной функции b в некотором базисе записано как многочлен от координат ?г и rf векторов х и у: Ь(х, у) = еУ + Ы - Ч2ц + Ч2ц + ЧУ + ?У ¦ Напишите матрицу этой билинейной функции, если пространство: а) трехмерное; б) четырехмерное. 2. Как изменится матрица билинейной функции из упр. 1, а), если пе- перейти к базису: е[ = е\ + e<i\ е2 = в2 + ез; е3 = ез? 3. Напишите матрицу квадратичной формы (^J + ^^2 + (?2J. 4. Приведите к каноническому виду квадратичную форму с матрицей: б) и найдите матрицу перехода к каноническому базису. 5. Нуль-пространством симметричной билинейной функции b называ- называется множество векторов х таких, что для всех у выполнено Ь(х,у) = 0. Проверьте, что это — линейное подпространство. Как связана его размер- размерность s с рангом Ь? Какой будет матрица функции b в базисе, последние s векторов которого лежат в нуль-пространстве? 6. В n-мерном пространстве заданы т квадратичных форм. При каком условии существует базис, в котором они все могут быть представлены как многочлены от первых к < п координат вектора? 7. Пусть А — квадратная матрица порядка п и ранга г. У квадратичной формы с матрицей АТА определите: а) ранг; б) индекс. 8. Квадратичная форма с матрицей В положительно определена тогда и только тогда, когда найдется верхняя треугольная матрица Я, det R ф 0, такая, что В = RTR. Докажите это. 9. Дана квадратичная форма к. При каком условии найдется ненулевой вектор ж, для которого к(х) = 0? 10. Какому необходимому и достаточному условию должны удовлетво- удовлетворять главные миноры отрицательно определенной квадратичной формы? 11. Может ли матрица положительно определенной квадратичной фор- формы иметь неположительный диагональный минор? (Минор называется диа- диагональным, если главная диагональ его подматрицы находится на главной диагонали матрицы.) § 7. Теорема Жордана 1. Теорема Гамильтона-Кэли. Так называется следующая теорема, справедливая как для комплексных, так и для веществен- вещественных матриц.
206 Гл. VI. Линейные пространства Теорема 1. Если р(Х) = det(A — ХЕ) — характеристический многочлен матрицы А, то р{А) = О. Доказательство. Если Л не является характеристическим чис- числом матрицы А, то матрица (А — ХЕ) имеет обратную, элементы ко- которой можно вычислить по формулам D) § 5 гл. V. Следовательно, где В(Х) — матрица с элементами bij(X) = (—l)*+J'd^(A), а множите- множители d\ являются минорами порядка п — 1 матрицы (А — ХЕ) и, сле- следовательно, многочленами от Л степени, не большей п — 1. Поэтому Ь^.(А) = Ь% + Xb}j + ... + А"^. Так как линейные операции с матрицами определены поэлементно, В(Х) = Во + ABi + ... + Xn~1Bn_u где Bk — матрица с элементами Ьк- (к = 0, ...,п — 1). Равенство A) можно переписать в виде (А — ХЕ)В(Х) = det(A — XE)E, или (А - ХЕ)(В0 + ХВг + ... + А"-1^-!) = р(Х)Е. B) Обозначим коэффициенты характеристического многочлена че- через ao,ai,...,an. Тогда р(Х)Е = а0Е + ХахЕ + ... + ХпапЕ. Раскроем скобки в левой части равенства B) и приравняем матрицы, стоящие при одинаковых степенях А. Это законно, так как равенст- равенство B) имеет место для всех А и по существу означает, что равны друг другу две матрицы, а значит, равны все их соответствующие элементы, являющиеся многочленами от А. Мы получим АВ0 = АВХ -Во = АВ2 - Вх = — Bn_i = anE. Умножим первое из этих равенств на А0 = Е, второе — на А, третье — на А2 и т. д., последнее на Ап и сложим все равенства по- почленно. Тогда справа мы получим р(А) — результат подстановки А в характеристический многочлен, а слева — нулевую матрицу, так как все слагаемые взаимно уничтожатся. Это заканчивает доказа- доказательство. Следствие. Каждое линейное преобразование А линейного прост- пространства ?? удовлетворяет своему характеристическому уравне- уравнению р( А) = О.
§ 7. Теорема Жордана 207 2. Корневые подпространства. Рассмотрим n-мерное комплекс- комплексное линейное пространство «if и его линейное преобразование А. Ха- Характеристический многочлен преобразования p(t) раскладывается на множители в общем случае так: pit) = (-l)n(t - АО*1 (t - А2)*2 ...(t - \s)k°. Именно ради возможности такого разложения мы предполагаем пространство комплексным. Если характеристический многочлен ли- линейного преобразования вещественного пространства имеет только вещественные корни, то все следующие ниже результаты справедли- справедливы и для такого преобразования. Рассмотрим рациональную функцию l/p(t) и разложим ее на эле- элементарные дроби. Для наших целей разложению удобно придать вид 1 = hit) fs(t) p(t) (t-Ai)*i (t-\8)k*' После приведения к общему знаменателю мы получаем тождество где qi(t) — многочлен, равный произведению fi(t) на многочлен, по- получаемый из p(t) вычеркиванием множителя (t - Xi)ki: —' (t-\i)ki v J J J Подставим в полученное тождество преобразование А вместо t: Преобразования Qi = qi(A) обладают тем свойством, что QiQj = О при г ф j. D) Действительно, в произведение qi(t)qj(t) входят все множители, со- содержащиеся в разложении p(t), и при подстановке преобразования А это произведение превращается в нулевое преобразование. Умно- Умножая C) на Qi и используя D), мы получим для любого г = 1, ...,s Qi = QiQi. E) Теперь мы можем разложить пространство J? в прямую сумму. Действуем обеими частями равенства C) на произвольный вектор х: или х = х\ + ... + xs, где Xi = Qi(x) G Q^(^f). Разложение такого вида единственно. Действительно, допустим, что х = у\ + ... + ys, где yi e G Qi(J^) (i = l,...,s). Это значит, что найдутся такие векторы zi, что yi = Qi(zi). Теперь, действуя на обе части равенства х = С преобразованием Qi, мы получаем Qi(x) = Qi(zi) в силу свойств D) и E), т. е. Xi = yi, как и требовалось.
208 Гл. VI. Линейные пространства Равенство F) означает, что «if — сумма подпространств ( а единственность разложения равносильна тому, что сумма прямая: &=Q1(&)®...®Qa(&). G) По предложению 3 §4 подпространства Qi(J?) инвариантны. Они называются корневыми подпространствами. Обозначим их через <Ж{ (г = 1,..., s). Мы доказали Предложение 1. Каково бы ни было линейное преобразование А комплексного пространства «if, это пространство раскладывается в прямую сумму корневых подпространств преобразования А. Ниже мы покажем, как разложить корневое подпространство в прямую сумму инвариантных подпространств, но сначала докажем Предложение 2. Ж\ = Кег (А — XiE)ki для любого г. Доказательство. В произведение (t — Xi)hiqi(t) входят все мно- множители, составляющие характеристический многочлен. Поэтому из теоремы Гамильтона-Кэли следует, что (А — XiE)ki Qi = О. Это озна- означает, что для любого ж^У выполнено (А — XiE)ki Qi(x) = о, т. е. Qi(x) Е Кег (А - XiE)ki, Qi(&) С Кег (А - ХгЕ)к'. С другой стороны, пусть х G Кег (Л — XiE)ki. В каждое преобра- преобразование Qj при j ф г входит множитель (А - XiE)ki, обращающий х в нуль. Поэтому формула F) для такого х имеет вид х = Qi(x). Зна- Значит, х G Qi(Jf), и поэтому Кег (А — XiE)ki С Q^Jf). Предложение доказано. Следствие. Собственное подпространство принадлежит соот- соответствующему корневому подпространству: (XiE) С Jfi. Действительно, если (А — Л^Е)(ж) = о, то и (А — XiE)ki(x) = о. В силу предложения 2 формула G) может быть написана так: ^f = KerfTl-AiE)*1 е...0 Кег(Д-А,Е)Ч (8) 3. Строение корневого подпространства. Рассмотрим одно корневое подпространство Ж\ и ограничение преобразования (А — — \{Е) на нем. Обозначим это ограничение через В. Индекс г для краткости будем пропускать. Предложение 2 означает, что Bki = О. Преобразования, некоторая степень которых равна нулевому пре- преобразованию, называются нильпотентными. Итак, рассматривается комплексное линейное пространство Ж и его нильпотентное преобразование В. Вк(х) = о для любого ж, но вполне может случиться, что для ка- какого-то х при h < к будет Bh(x) = о. Число h такое, что Bh(x) = о, но Bh~1(x) ф о называется высотой вектора х. Векторы высоты 1 со- составляют ядро в, т. е. собственное подпространство А. Пусть т —
§ 7. Теорема Жордана 209 максимальная среди высот всех векторов. Она называется показате- показателем нильпотентности преобразования. Ясно, что т ^ к. Подействовав на обе части включения В(Ж) С ^преобразовани- ^преобразованием В'1, мы видим, что Bh{X) С Bh~1(X) для любого h и {о} = Вт(Х) С Вт-1{Ж) С ... С B(Jf) С «Ж Обозначим через ^^ пересечение ВН(Ж) с собственным подпро- подпространством Кегв. Из предыдущих включений следует {о} = Ут С У™'1 С ... С У1 С Кегв. Выберем в Кегв базис следующим образом: базис в ут~1 допол- дополним до базиса в ут~2^ полученный базис дополним до базиса ут~3 и т. д. В результате получится базис е?,...,е^ в Кегв, обладающий тем свойством, что векторы из любого "Vh раскладываются только по тем векторам базиса, которые лежат в Ук. Пусть базисный вектор е^ лежит в /^, но не в yh+i^ ^ем самым он принадлежит к ВН(Ж), и существует вектор е^ такой, что е^ = = Bh(e1j). Этот вектор мы назовем h-м присоединенным к е^. Вообще, вектор e) = Bh-\e)) (/ = 1,..,Л) (9) называется 1-м присоединенным KeJ. Из формулы (9) видно, что Таким образом, по е^ определена цепочка векторов e^,ej, ...,e^, удов- удовлетворяющая равенствам В{е))=е% Б(е|) = е),..., В{е)) = е)~\ A0) Такие цепочки векторов называются жордановыми цепочками. Самые длинные цепочки начинаются с векторов из ут~1 и имеют длину т. Если е^ 0 У1, то он — единственный вектор в своей цепочке. Вн+1(е^) = В(е®) = о. Поэтому из (9) следует, что 1-Й присоеди- присоединенный вектор имеет высоту I + 1. Обозначим через е систему векторов, получающуюся объедине- объединением всех жордановых цепочек, начинающихся с векторов е?,...,е^. Предложение 3. Система векторов е является базисом в <Ж. Доказательство. 1°. Линейную независимость системы е не- нетрудно проверить индукцией по числу векторов в системе. Действи- Действительно, если в системе один вектор, то он собственный, и утвержде- утверждение очевидно. Пусть любая система из s собственных и присоединенных к ним векторов линейно независима при условии, что входящие в нее собственные векторы линейно независимы. Рассмотрим произволь- произвольную систему такого вида, содержащую s + 1 векторов, и какую- 14 Д.В. Беклемишев
210 Гл. VI. Линейные пространства нибудь линейную комбинацию векторов этой системы, равную ну- нулю. Покажем, что она тривиальная. Для этого подействуем на нее преобразованием В. В силу формул A0) мы получим равную нулю линейную комбинацию этой же системы, но содержащую меньше векторов, так как все собственные векторы перейдут в нуль. По предположению индукции все коэффициенты последней ли- линейной комбинации равны нулю. Но это — коэффициенты исходной линейной комбинации, стоящие там при присоединенных векторах. Значит, исходная комбинация могла содержать ненулевые коэффи- коэффициенты только при собственных векторах. Собственные векторы ли- линейно независимы, и потому ни одного ненулевого коэффициента нет. 2°. Докажем, что каждый вектор х из Ж можно разложить по системе е. Сделаем это с помощью индукции по высоте вектора х. Высоту 1 имеют собственные векторы. Они раскладываются по бази- базису е^,...,е^, составляющему часть системы е. Пусть утверждение доказано для векторов высоты ^ h. Рассмот- Рассмотрим произвольный вектор х высоты h + 1. Для него вектор Bh(x) соб- собственный и принадлежит Bh(J(f). Следовательно, Bh(x) e УН. Пусть dim yh = р. По построению базиса в Кег В векторы ej,..., е^ — базис в У , и В (х) раскладывается по этим векторам. Все они имеют h-e присоединенные, и потому Bh(x) = aiBh(e$) + ... + apBh{ehp). Это означает, что вектор у = х — ot\e\ — ... — арвр удовлетворяет равенству Bh(y) = о, т. е. имеет высоту ^ h. По предположению ин- индукции у раскладывается по системе е. Отсюда сразу получается раз- разложение х по этой системе. Базис е, построенный в предложении 3, называется жордановым базисом корневого подпространства Ж, а объединение жордановых базисов всех корневых подпространств — жордановым базисом в Jf. Векторы жордановой цепочки, начинающейся cej, — часть жор- данова базиса и, значит, линейно независимы. Поэтому они — базис в их линейной оболочке ^-. Такое подпространство ^ называется циклическим. Если х G ^/, то в силу формул A0) В(х) = ° ) ) ] ^1 Следовательно, ^ инвариантно относительно В. Так как В — огра- ограничение преобразования (А — \{Е) на Ж — J^, то циклическое под- подпространство инвариантно также и относительно А. Действитель- Действительно, А(х) = В(х) +\iX е tfj. Жорданов базис корневого подпространства — объединение бази- базисов циклических подпространств. Поэтому мы получаем Предложение 4. Если В — нилъпотентное преобразование
§7. Теорема Жордана 211 пространства <Ж, то Ж распадается в прямую сумму jr=^i е...е% циклических относительно В подпространств. Их число равно раз- размерности d собственного подпространства КегВ. 4. Теорема Жордана. Из предложений 1 и 4 прямо следует Предложение 5. Если в комплексном пространстве J? задано линейное преобразование Д, то J? — прямая сумма инвариантных относительно А циклических подпространств. Их число равно общему числу всех цепочек в жордановом базисе пространства «if, га. е. d\ + ... + d8, где di = dim Ker (A - A^E). Жорданов базис пространства Jf — объединение базисов инвари- инвариантных подпространств, и по предложению 2 §4 матрица преобразова- преобразования А в этом базисе клеточно-диагональная. При этом диагональные клетки этой матрицы являются матрицами ограничений А на соот- соответствующих подпространствах. Поэтому, если мы хотим получить вид матрицы преобразования в жордановом базисе, мы должны сна- сначала написать матрицу ограничения А на циклическом подпростран- подпространстве. Пусть циклическое подпространство принадлежит корневому под- подпространству с собственным значением А^ и натянуто на векторы цепочки е°,...,е^. Мы имеем А{е)) = В{е)) + Щ (/ = о,...,Л), и по формулам A0) А($) = А,е°, А(е)) = е] + А,е],..., А{е)) = е)'1 + \е). Столбцы матрицы преобразования — это координатные столбцы образов базисных векторов. Поэтому матрица ограничения А в рас- рассматриваемом базисе имеет вид \г 1 0 ... 0 0 Ai 1 ... 0 0 0 0 ... 1 0 0 0 ... ^ Матрица такого вида называется жордановой клеткой порядка h + 1 с собственным значением А^. Клеточно-диагональная матрица, у ко- которой клетки жордановы, называется жордановой матрицей или мат- матрицей, имеющей жорданову форму. Из всего сказанного вытекает теорема Жордана. Теорема 2. Для любого линейного преобразования комплексного линейного пространства существует базис (жорданов базис), в кото- котором его матрица имеет жорданову форму. Жорданов базис для данного преобразования, конечно, не един- единствен: базис е?,...,е^ в каждом корневом пространстве выбирается с 14*
212 Гл. VI. Линейные пространства некоторым произволом, и присоединенные векторы по формулам A0) определены не однозначно. Однако, как видно из построения, кор- корневые подпространства (и в каждом из них число собственных векторов, с которых начинаются цепочки определенной длины) опре- определяются геометрически — инвариантными подпространствами пре- преобразования. Таким образом, жорданова форма матрицы преобра- преобразования определена единственным образом с точностью до порядка расположения клеток на главной диагонали. Собственные значения клеток — это собственные значения преобразования. При этом все жордановы клетки с одним и тем же собственным значением объединяются в одну большую клетку, соответствующую корневому подпространству. Жорданова матрица треугольная. Поэтому кратность собственного значения Л^ равна ki, если Xi встречается на диагонали матрицы к{ раз. Отсюда сразу следует Предложение 6. Размерность корневого подпространства рав- равна кратности его собственного значения в характеристическом мно- многочлене. 5. Приведение к жордановой форме. Нахождение жордано- жорданова базиса, или, как говорят, приведение матрицы преобразования к жордановой форме облегчается тем, что при этом нет нужды искать корневые подпространства. Они получатся автоматически после того, как будут построены соответствующие жордановы цепочки. Действи- Действительно, для построения цепочек достаточно найти для каждого кор- корня Xi его собственное подпространство и вложенные в него подпро- подпространства У\, ...У™1, определяющие, с каких собственных векторов начинаются цепочки. Согласно определению П Кег (А - А;Е), но тут не надо находить J^. Дело в том, что (А - \iE)\&) П Кег (А - А;Е) = = {А - XiEI {Jtfi) С\ Кег(Д-А;Е). (9) Действительно, любой вектор х из «if раскладывается в сумму век- векторов из корневых подпространств х = х\ + ... + xs и (А — А^Е)(ж) = — У\ + ••• + Us, где 2/j = (А — XiE)(xj) G Ж^ так как корневые подпрост- подпространства инвариантны. При этом если Xj ф о при г ф j, то и yj ф о, так как Кег (А — \{Е) С <Ж{. По этим соображениям вектор, не лежа- лежащий в J^f, не может перейти в вектор из J^. Отсюда сразу следу- следует (9) и У1. = (A-XiE)lCf)n Кег(Д-А;Е). Рассмотрим в качестве примера преобразование А шестимерного
§ 7. Теорема Жордана 213 2 0 0 0 0 0 0 1 0 0 0 0 1 0 1 0 -1 0 0 0 0 4 0 1 0 0 1 0 3 0 0 0 0 -9 0 -2 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 -1 0 0 0 0 3 0 1 0 0 1 0 2 0 0 0 0 -9 0 -3 пространства, заданное в некотором базисе матрицей А = Нетрудно подсчитать, что характеристический многочлен А равен (Л — 1K(Л — 2K, и, следовательно, имеются два корневых подпрост- подпространства размерности 3 каждое. Начнем с корня Ai = 1. Составим матрицу А-Е = Решая однородную систему линейных уравнений с этой матрицей, находим, что собственное подпространство натянуто на векторы а\ и а2 с координатными столбцами, соответственно а.\ = || 0 1 О О О О ||Т и а2 = || 000301 ||т. Собственное подпространство двумерное, а корне- корневое трехмерное. Значит, должен быть один присоединенный вектор. Чтобы найти, к какому собственному вектору он присоединен, ищем пересечение У1 собственного подпространства с Im (Л — Е), которое натянуто на столбцы матрицы А — Е. Легко заметить, что четвертый столбец А- Е совпадает с а2. Так как OL\ не раскладывается по столбцам А — Е, размерность суммы подпространств равна 5, а сумма размерностей — 6. Значит, пересе- пересечение одномерно, и базис в нем — а2. Решим систему уравнений (А — Е)? = а2 и найдем координатный столбец аз = ||000100||т присоединенного вектора аз- После этого жорданов базис первого корневого подпространства построен. Для корня А2 = 2 составляем матрицу А-2Е = Из однородной системы уравнений с такой матрицей следует, что собственное подпространство одномерно, и его базисный вектор Ъ имеет координатный столбец /3 = ||100000||т. Так как корневое пространство трехмерное, к Ъ должны быть два присоединенных век- 0 0 0 0 0 0 0 -1 0 0 0 0 1 0 -1 0 -1 0 0 0 0 2 0 1 0 0 1 0 1 0 0 0 0 -9 0 -4
214 Гл. VI. Линейные пространства тора. Первый присоединенный получаем из системы (А — 2Е)? = /3. Его координатный столбец есть /3i = ||0 0 1 0 1 0||т. Второй присо- присоединенный — решение системы (А - 2Е)^ = f3\. Его координатный столбец — ^2 = || 000010 ||т. Итак, жорданов базис состоит из трех цепочек: цепочка а\ дли- длины 1, цепочка а2, аз и цепочка 6, bi, &2- Координатные столбцы этих векторов ai,a2,a3,/3,/3i,/32 составляют матрицу перехода S от ис- исходного базиса к жорданову базису. Учитывая порядок, в котором мы расположили векторы жордановых цепочек, мы можем выписать жорданову матрицу А', которую имеет А в построенном базисе. В матрице S выделены жордановы цепочки, а в матрице А' — соот- соответствующие жордановы клетки: А! = Рекомендуем читателю проделать все описанные здесь вычисления. 0 1 0 0 0 0 0 0 0 3 0 1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 11 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 2 0 0 0 0 0 1 2 0 0 0 0 0 1 2 Упражнения 1. Сколько существует жордановых матриц, отличающихся кратностя- ми характеристических чисел, числом и размерами клеток, среди матриц: а) второго порядка; б) третьего порядка; в) четвертого порядка? 2. Найдите жорданову форму матрицы и матрицу перехода к жорданову базису для преобразования, заданного в исходном базисе матрицей: 3 1 0 0 -1 1 0 0 0 0 2 1 -1 -1 -1 0 1 1 0 0 0 -1 1 1 0 0 0 1 1 0 0 -1 0 1 1 0 0 1/2 0 1/2 1
ГЛАВА VII ЕВКЛИДОВЫ И УНИТАРНЫЕ ПРОСТРАНСТВА § 1. Евклидовы пространства 1. Скалярное произведение. Линейное пространство, введен- введенное в предыдущей главе, существенно отличается от множества век- векторов обычного геометрического пространства тем, что в линейном пространстве не определены понятия длины вектора и угла между векторами. В настоящей главе мы изучим такие пространства, в ко- которых эти понятия определены. В гл. I, используя длину вектора и угол, мы определили скаляр- скалярное произведение. Здесь удобнее поступить наоборот. Мы аксиома- аксиоматически определим операцию скалярного умножения, а длину и угол определим с ее помощью. Определение скалярного умножения для вещественных и для комплексных пространств формулируется раз- различно. Этот параграф посвящен вещественным пространствам. Определение. Вещественное линейное пространство $ называ- называется евклидовым, если в нем определена операция скалярного умно- умножения: любым двум векторам ж и у из $ сопоставлено веществен- вещественное число (обозначаемое (ж,?/)), и это соответствие удовлетворяет следующим требованиям, каковы бы ни были векторы ж, у и z и число а: 1) (х,у) = (у,ж); 2) (x + y,z) = (x,z) + (y,z); 3) (ах,у) = а(х,у); 4) (ж,ж) > 0 для всех ж ф о. Будем рассматривать n-мерное евклидово пространство ё. Любое подпространство ?" в § — также евклидово пространство, так как для его векторов определено то же самое скалярное умножение. Очевидны простейшие следствия из перечисленных аксиом. Так как (х,ау) = (ау,х) = а(у,х), имеем (х,ау) =а(х,у). A) Аналогично доказывается (x,y + z) = (x,y) + (x,z). B) Можно дать второе определение евклидова пространства, эквива- эквивалентное первому. Определение. Вещественное линейное пространство называет- называется евклидовым, если в нем задана положительно определенная квад- квадратичная форма.
216 Гл. VII. Евклидовы и унитарные пространства Из первого определения следует второе. Действительно, если в ве- вещественном линейном пространстве определена операция скалярного умножения, то это — функция от двух векторов. Аксиомы 2) и 3) и формулы A) и B) равносильны тому, что функция билинейная. Аксиома 1) означает, что билинейная функция симметрична, а ак- аксиома 4) — что соответствующая квадратичная форма положительно определена. Поскольку симметричная билинейная функция однознач- однозначно определяется соответствующей квадратичной формой, обратное утверждение столь же очевидно. Конечно, в вещественном линейном пространстве существует бес- бесконечно много положительно определенных квадратичных форм. Во втором определении слово "задана" означает, что одна из них выделе- выделена и играет особую роль. Будем называть ее основной квадратичной формой. Пример 1. Для векторов геометрического пространства скаляр- скалярное произведение двух векторов определено как произведение их длин на косинус угла между ними. Так, определенная операция скалярно- скалярного умножения обладает нужными свойствами, но зависит от выбора единицы измерения длин. Поэтому, если такая единица выбрана, век- векторы геометрического пространства образуют трехмерное евклидово пространство в определенном здесь смысле. Пример 2. В n-мерном арифметическом пространстве мы можем ввести скалярное умножение, сопоставив столбцам ? и г] число $Tv = ZW + - + Cvn, (з) где через ?г и rf обозначены элементы столбцов. Используя свойст- свойства умножения матриц, читатель без труда может проверить, что все условия, входящие в определение, выполнены. Иначе можно было бы сказать, что в качестве основной квадратичной формы выбрана та, которая в стандартном базисе арифметического пространства (со- (состоящем из столбцов единичной матрицы) имеет канонический вид. Пример 3. В пространстве функций, непрерывных на отрез- отрезке [0,1], можно ввести скалярное произведение по формуле 1 (f,g) = ff(t)g(t)dt. О Аксиомы 1)-4) вытекают из известных свойств определенных интег- интегралов. 2. Длина и угол. В соответствии с формулами §4 гл. I введем Определение. Назовем длиной вектора х и обозначим х\ чис- число у (ж, ж). Углом между векторами х и у назовем каждое число ср, удовлетворяющее условию j^J. D) \A\y\
§1. Евклидовы пространства 217 В силу аксиомы 4) длина вектора — вещественное неотрицатель- неотрицательное число, причем она равна нулю тогда и только тогда, когда вектор нулевой. С определением угла дело обстоит несколько сложнее. Нам предстоит доказать, что выражение в правой части равенства D) по абсолютной величине не превосходит единицы. Это следует из нера- неравенства (х,уJ <С (х,х)(у,у), E) связываемого с именами Шварца, Коши и Буняковского. Ниже мы по- получим это неравенство как следствие из теоремы 1. Еще одно важное неравенство, называемое неравенством треу- треугольника, \х + у\ ^М + М (б) следует из неравенства Коши-Буняковского: (ж + у,ж + у) = \х\2 + 2(ж,у) + \у\2 <С \х\2 + 2\х\\у\ + \у\2 = (\х\ + \у\J. Знак равенства имеет место, если (х,у) = |ж||?/|, т. е. если угол меж- между х и у равен нулю, и только в этом случае. Неравенство F) для векторов — направленных отрезков — означает, что длина стороны треугольника меньше суммы длин остальных его сторон. Векторы х и у называются перпендикулярными или ортогональны- ортогональными, если (ж, у) = 0. Это условие выполнено, если хоть один из векторов нулевой. Если оба вектора ненулевые, то по формуле D) угол между ними равен тг/2. Предложение 1. Только нулевой вектор ортогонален каждому вектору пространства. Действительно, если (х,у) = 0 для всех у, то, положив у = ж, по- получим (ж, ж) = 0, что возможно только при ж = о. 3. Выражение скалярного произведения через координаты сомножителей. Если в евклидовом пространстве выбран базис е, то скалярное произведение векторов ж и у, как и значение любой билинейной функции, выражается по формуле C) § б гл. VI через координатные столбцы ? и г] этих векторов: (x,y)=erv- G) Согласно определению матрицы билинейной функции элементы дц матрицы Г равны скалярным произведениям (е^е^), т. е. (ebei) ... (еьеп) Г= (en,ei) ... (еьеп) Эта матрица называется матрицей Грама базиса е. Матрица Грама симметрична. По критерию Сильвестра все ее главные миноры положительны, в частности справедливо Предложение 2. Детерминант матрицы Грама любого базиса положителен.
218 Гл. VII. Евклидовы и унитарные пространства Это предложение может быть обобщено следующим образом. Теорема 1. Пусть х\,...,хк — произвольная, не обязательно ли- линейно независимая система векторов. Тогда детерминант матрицы, составленной из их попарных скалярных произведений, det положителен, если векторы линейно независимы, и равен нулю, если они линейно зависимы. Первое утверждение следует из предложения 2, так как линейно независимые векторы составляют базис в своей линейной оболочке. Докажем второе утверждение. Если векторы линейно зависимы, то выполнено равенство а\х + ... + акхк — о, в котором среди коэф- коэффициентов есть отличные от нуля. Умножая это равенство скалярно на каждый из векторов, мы придем к системе линейных уравнений ^) = О, i) + ... + ak(xk,xk) = О, которой удовлетворяют коэффициенты а\,...,ак. Так как система имеет нетривиальное решение, детерминант ее матрицы равен нулю. Следствие. Для любых двух векторов в евклидовом простран- пространстве имеет место неравенство Коши-Буняковского E), причем оно выполнено как равенство тогда и только тогда, когда векторы ли- линейно зависимы. Пусть базис е' связан с базисом е матрицей перехода S. Тогда формула D) § б гл. VI переписывается в виде Г' = STYS, (8) показывающем связь матриц Грама двух разных базисов. 4. Ортогональные базисы. Базис, в котором основная квад- квадратичная форма имеет канонический вид, называется ортонорми- рованным базисом. Так как она положительно определена, матрица Грама ортонормированного базиса единичная: (е^е^) = 0 при г ф j и (ei,ei) = 1 (i,j = l,...,n). Это значит, что векторы ортонормиро- ортонормированного базиса попарно ортогональны, а по длине равны единице. Для ортонормированного базиса формула G) имеет вид (ж,2/)=?тт? = ?У+ ... + ОЛ (9) Предложение 3. п попарно ортогональных ненулевых векто- векторов hi,...,hn в п-мерном евклидовом пространстве составляют ба- базис. Разложение вектора по этому базису задается формулой г=1
§1. Евклидовы пространства 219 Действительно, матрица из произведений (hi,hj) диагональная с ненулевыми элементами на диагонали. Из теоремы 1 следует, что /ii,...,/in составляют базис. Пусть х = a\h\ + ... + anhn. Умножая это равенство скалярно на любой из /if, находим, что cti = (ж, hi)/\hi\2, что равносильно A0). Базис из ортогональных векторов называется ортогональным ба- базисом. Вычислим (ж,ж) с помощью формулы A0). Поскольку (hi,hj) = 0 при г ф j, получаем равенство Парсеваля 5. Ортогональные матрицы. Рассмотрим два ортонормирован- ных базиса е и е' = eS. Тогда в формуле (8) Г; = Г = Е, и формула принимает вид STS = Е. A2) Наоборот, если выполнено условие A2) и исходный базис ортонорми- рованный, то мы получаем Г; = Е, и новый базис также ортонорми- рованный. Определение. Матрица, удовлетворяющая условию A2), назы- называется ортогональной матрицей. Как мы видели, ортогональные матрицы и только они могут слу- служить матрицами перехода от одного ортонормированного базиса к другому. Равенство A2) равносильно равенству ST = S~1. A3) Из свойств обратной матрицы теперь следует, что SST = Е. A4) Это означает, что матрица ST также является ортогональной. Обозначив элементы матрицы S через о1^ мы можем написать равенства, равносильные A2) и A4): k=l K k=l Впрочем, первое из равенств можно получить непосредственно из (9), если вспомнить, что столбцы матрицы перехода — коорди- координатные столбцы новых базисных векторов в старом базисе. Произведение SU двух ортогональных матриц S и U — ортого- ортогональная матрица. Действительно, (SU)T = UTST = U~1S~1 = (SU)~1. Вычисляя детерминант обеих частей равенства A2), мы полу- получим (detSJ = l. Значит, для ортогональной матрицы det S = 1 или = -1.
220 Гл. VII. Евклидовы и унитарные пространства Рекомендуем читателю проверить, что любая ортогональная мат- матрица порядка 2 имеет один из двух видов cos a - sin a sin a cos a cos a sin a sin a — cos a A6) 6. Ортогональное дополнение подпространства. Пусть S" — ^-мерное подпространство в n-мерном евклидовом пространстве $. Определение. Ортогональным дополнением подпространства ?" называется множество всех векторов, ортогональных каждому век- вектору из ?". Это множество обозначается S>t±. Предложение 4. Ортогональное дополнение k-мерного под- подпространства в п-мерном пространстве есть (п — к)-мерное под- подпространство. Доказательство. Пусть а\,..., а/. — базис в ?". Вектор х лежит в ?" тогда и только тогда, когда (x,ai) = 0,..,(x,a/0 =0. A7) Действительно, если х G ?"±, то равенства A7), разумеется, выполне- выполнены. Обратно, при выполнении этих равенств х ортогонален любому а из <#", поскольку к к (ж, а) = (ж,^АЧ) =^А*(ж,а<) = 0. г=1 г=1 Выберем в ^ортонормированный базис и обозначим через а},... ..., а™ компоненты вектора ai (г = 1,..., к) в этом базисе, а через ^,... ...,?п — компоненты вектора х. Условия A7) запишутся тогда в виде однородной системы из к линейных уравнений с п неизвестными: Ранг матрицы системы равен к, поскольку ее строки — строки из компонент векторов ai,..., a/. — линейно независимы. Таким образом, множество ?"^ определяется однородной системой линейных уравне- уравнений ранга к, и потому является (п — &)-мерным подпространством. Предложение доказано. Рассмотрим (<^э/±)± — ортогональное дополнение ортогонального дополнения подпространства S". Каждый вектор из S" ортогонален каждому вектору из S-. Поэтому ?" С (<#)/±)±. Но dim(<^/±)± — n — -(п-к) = к. Итак, (^/±)± = <f. Очевидно, что ?" и S- не имеют общих ненулевых векторов, а сумма их размерностей равна п. Отсюда следует
§1. Евклидовы пространства 221 Предложение 5. Евклидово пространство — прямая сумма лю- любого своего подпространства и его ортогонального дополнения. Два подпространства ?" и ?"' называются ортогональными, ес- если g" С ?г±. Тогда и i1 С <Г;±, так как (ж,?/) = 0, если х е i1 и 7. Ортогональные проекции. Так как § — ?" 0<^;±, каждый вектор ж Е <? однозначно раскладывается в сумму векторов х\ Е <#" и ж2 Е <^э/±. Вектор xi называется ортогональной проекцией х на <#". Легко видеть, что ж2 — ортогональная проекция х на S-. Найдем ортогональную проекцию х на ?" в предположении, что в § задан некоторый ортогональный базис /ii,...,/i^. Дополним этот базис до ортогонального базиса в пространстве ?", присоединив к не- нему произвольный ортогональный базис /i^+i,..., hn из ?"^. Так как сумма ?" и ?"^ прямая, искомое разложение вектора х единственно, и мы, группируя слагаемые в формуле A0), получаем Е(ж, hi) , (Л оч ^ W^- A8) Если к = 1, проекция имеет вид xi = ((ж,/i)/|/i|2)/i, и мы видим, что правая часть формулы A8) — сумма проекций на ортогональные од- одномерные подпространства, натянутые на /ii,...,/i^. Так же истолко- истолковывается формула A0), а значит, равенство Парсеваля A1) является обобщением теоремы Пифагора. Из (ж1,ж2) = 0 следует \х\2 = \xi + ж2|2 = |^i|2 + |ж2|2 ^ \xi\2- Длина |ж2| ортогональной проекции х на S- обладает следующим свойством минимальности, обобщающим теорему о длине перпенди- перпендикуляра и наклонной из элементарной геометрии. Предложение 6. Пусть х\ — ортогональная проекция х на ?". Тогда для любого вектора у е ?"', отличного от жь выполнено х2\ = \х-хх\ < \х -у\. Доказательство. Обозначив х\ - у через z, имеем х — у\2 = \х\ + х2 - у\2 = \z + ж2|2 = (z + x2,z + ж2) = Но B:,ж2) = 0, так как z G S", и, следовательно, |ж - у\2 = |ж2|2 + \z\2. Отсюда непосредственно вытекает доказываемое утверждение. 8. Метод ортогонализации. Формула A8) служит основой метода, позволяющего произвольный базис евклидова пространства преобразовать в ортогональный, а затем в ортонормированный. Этот метод называется методом ортогонализации Грама-Шмидта. Пусть в $ задан некоторый базис /i,...,/n. Положим h\ — Д. За- Затем из вектора /2 вычтем его ортогональную проекцию на линейную
222 Гл. VII. Евклидовы и унитарные пространства оболочку h\ и положим /i2 равным полученной разности: Отметим, что h<± раскладывается по Д = h\ и Д, причем h<± ф о, так как в противном случае Д и Д были бы пропорциональны. Будем продолжать таким же образом. Допустим, что построены попарно ортогональные ненулевые векторы h\, ...,/i/e, причем для лю- любого г ^ к вектор hi раскладывается по Д,..., Д. Положим . | Вектор ftjfe+i — проекция Д.+1 на ортогональное дополнение линейной оболочки /ii, ...,/1^, и потому ортогонален всем /if при г < fc + 1. Кро- Кроме того, он раскладывается по Д,..., Д.+1, так как для любого г ^ к вектор hi раскладывается по Д,..., Д. Отсюда следует, что /ife+i 7^ о, поскольку иначе векторы Д,..., Д+i оказались бы линейно зависимы. После того как будет преобразован последний вектор /п, мы по- получим ортогональную систему из п ненулевых векторов. Итак, нами построен ортогональный базис h. От него можно пе- перейти к ортонормированному базису е из векторов е« = hi/\hi\ (г = = 1, ...,п). Это называется нормировкой базиса h. Посмотрим на матрицу перехода S от базиса h к базису f. Из равенства Д = h\ и формулы A9) видно, что fj при любом j раскла- раскладывается по hi,..., /ij, причем его координата по hj равна 1. Поэтому элементы матрицы перехода (jj равны нулю, если они ниже главной диагонали (при г > j), и единице при г = j. Таким образом, эта мат- матрица — верхняя треугольная (п. 3 § 1 гл. V) с единицами на главной диагонали. Пусть базис е получен нормировкой базиса h. Тогда h = eD, где D — диагональная матрица с положительными элементами на диагонали. Если f = hS, то f = eDS, причем, как легко видеть, матрица R = DS — треугольная, как и 5, и ее диагональные эле- элементы положительны, хотя, возможно, и не равны единице. Теперь мы можем сформулировать Предложение 7. Если ортогональный базис h получен ортого- нализацией базиса f, то матрица перехода S от h к f верхняя тре- треугольная с единицами на диагонали. Если базис е получен нормировкой базиса h, то матрица перехода R от е к f верхняя треугольная с по- положительными диагональными элементами. Замечание. По существу, метод ортогонализации — метод при- приведения положительно определенной квадратичной формы к диаго- диагональному виду. Метод, примененный при доказательстве теоремы 1 § б гл. VI, в случае положительно определенной формы отличается только порядком выполнения элементарных операций.
§1. Евклидовы пространства 223 9. Q-R-разложение. Так называется следующее разложение мат- матрицы на множители, часто используемое в приложениях. Предложение 8. Если матрица А невырождена, то она может быть представлена в виде произведения А = QR, где Q — ортого- ортогональная, a R — верхняя треугольная матрица, причем диагональные элементы R положительны. Доказательство. Будем рассматривать столбцы А как коор- координатные столбцы векторов а\,...,ап в ортонормированном базисе g евклидова пространства. Так как А невырождена, эти векторы со- составляют базис а. При этом А — матрица перехода от g к а, т. е. а = gA. Пусть е — ортонормированный базис, полученный ортогона- лизацией и нормировкой базиса а. Тогда а = eR, и по предложению 7 матрица R верхняя треугольная с положительными диагональными элементами. Кроме того, так как базис е ортонормированный, е = gQ, где матрица Q ортогональная. Из двух последних равенств следует а = gQR. Сравнивая это с равенством а = gA, получаем QR = А. 10. Объем параллелепипеда. Рассмотрим к линейно независи- независимых векторов fi,...,fk в n-мерном евклидовом пространстве. Под к-мерным параллелепипедом {/ь ...,//,}, построенным на них, мы бу- будем понимать множество всех их линейных комбинаций с коэффици- коэффициентами ai, 0 ^ ai ^ 1 (г = 1,..., к). Векторы fi,..., fk назовем ребрами параллелепипеда. Если ребра упорядочены, параллелепипед называет- называется ориентированным. Параллелепипед {Д,..., fk-i} естественно назвать основанием па- параллелепипеда {/i,...,//,}, а высотой, соответствующей этому осно- основанию, назовем длину \hk\ ортогональной проекции hk вектора fk на ортогональное дополнение линейной оболочки fi,...,fk-\. Объем одномерного параллелепипеда {/} мы определим как длину его единственного ребра: V{f} = |/|, а объем к-мерного параллелепи- параллелепипеда V{fi,..., fk} определим по индукции как произведение объема основания на высоту. При таком определении объем параллелепипеда может оказаться зависящим от порядка, в котором записаны ребра, но из полученной ниже формулы B0) для объема мы увидим, что в действительности такой зависимости нет. Если ребро fk ортогонально остальным ребрам, то hk = fk и V{fi,...,fk} = V{fi,...,fk-i}\fk\- Отсюда легко заметить, что объем прямоугольного параллелепипеда (у которого ребра попарно ортого- ортогональны) равняется произведению длин ребер. Рассмотрим n-мерный параллелепипед {/i,...,/n}. Применяя к /i,...,/n процесс ортогонализации, мы заменяем очередной вектор его проекцией на ортогональное дополнение линейной оболочки пре- предыдущих векторов и в результате строим n-мерный прямоугольный параллелепипед {hi,..., hn}, имеющий тот же объем. Матрица Грама 1\ системы векторов h\,...,hn — диагональная с
224 Гл. VII. Евклидовы и унитарные пространства элементами |/ii|2,..., \hn\2 на диагонали. Поэтому V{fi,...Jn} = V{hu ...,ЛП} = |/ii|...|/in| = л/detIV Пусть 5 — матрица перехода от /ib...,/in к /i,...,/n. Согласно пред- предложению 7 det 5 = 1, и потому detF/ = det (ST Г hS) = detIV Итак, ^{/i,...,/n} = x/ditr7. B0) Пусть е — произвольный базис, a F — матрица из координатных столбцов векторов /i,...,/n в этом базисе. Эта матрица — матрица перехода от е к f. Поэтому Г/ = FTTeF. Отсюда в силу B0) V{fi,...,fn} = \detF\^detTe = | det F\V{eu ...,en}. В частности, для ортонормированного базиса е Если евклидово пространство ориентировано (п. 6 § 1 гл. VI), мы определим объем п-мерного ориентированного параллелепипеда как его объем со знаком плюс, если его ребра составляют положитель- положительно ориентированный базис, и со знаком минус в противном случае. Тогда для положительно ориентированного ортонормированного ба- базиса мы имеем V±{/i, ...,/n} = detF, а в общем случае V±{fu...,fn} = detFV±{eu...,en}. B1) Формулы этого пункта были получены нами для п = 2, 3 в § 4 гл. I. Упражнения 1. Проверьте, что в пространстве многочленов степени ^ 2 скалярное произведение можно определить формулой 1 (p,q) = fp(t)q(t)dt. -1 а) Составьте матрицу Грама базиса l,t,t2. б) С помощью матрицы перехода найдите матрицу Грама базиса 1, (t-1), it-if. в) Найдите угол между многочленами t2 + 1 и t + 1. 2. Подпространство евклидова пространства задано в ортонормирован- ном базисе уравнением ?* + ?2 + ?3 + ?4 = 0. Найдите ортонормированный базис в этом подпространстве. 3. Пусть dim<#= 4 и ?" С <# задано в ортонормированном базисе сис- 6 + 6 + 6 = 0, & + & + & = 0. Найдите: а) базис в S>f±; б) ортогональную проекцию на ?" вектора || 1 2 3 4 ||т. 4. Допустим, что все элементы ортогональной матрицы порядка п рав- равны между собой по абсолютной величине.
2 3 ; б) 2 4  §2. Линейные преобразования евклидовых пространств 225 а) Чему равна абсолютная величина элемента такой матрицы? б) Докажите, что такие матрицы существуют, если п = 2fc, где к — натуральное число. 5. Найдите (^Д-разложение матрицы: 13 1 б) 1 1 -1 6. В четырехмерном евклидовом пространстве трехмерный параллеле- параллелепипед построен на векторах, имеющих в ортонормированном базисе коор- координатные столбцы || 1 1 — 1 О ||т, || 1 1 1 — 1 ||Т и || 1 1 1 1 ||Т. Найдите объем параллелепипеда. § 2. Линейные преобразования евклидовых пространств 1. Преобразование, сопряженное данному. Все сказанное в предыдущей главе о линейных преобразованиях линейных прост- пространств остается, конечно, в силе и для евклидовых пространств. С введением скалярного произведения преобразования приобретают но- новые свойства подобно тому, как векторы приобретают длину. Определение. Линейное преобразование Л* евклидова прост- пространства называется сопряженным преобразованию Л, если для любых векторов х и у имеет место равенство (А(х),у) = (х,А*(у)). A) Допустим, что данное преобразование Л имеет сопряженное Л*. Выясним, как связаны матрицы преобразований Л и Л* в некотором базисе е. Обозначим эти матрицы через А и А*, а координатные столб- столбцы векторов х и у через ? и г]. Тогда равенство A) можно переписать в координатной форме (А^)ТГг] = ?тГА*г], где Г — матрица Грама базиса е. Выполнив транспонирование, получаем eATTV = |ТГА*77. B) Это равенство показывает, что левая и правая части A) являются билинейными функциями, а АТТ и ТА* — матрицы этих функций в базисе е. Если значения функций равны при любых х и у, то матрицы этих функций равны. Поэтому АТГ = ГА*. C) Итак, матрицы преобразований Л и Л* связаны соотношением C). В частности, если базис ортонормированный, А* = Ат. D) Предложение 1. Каждое линейное преобразование евклидова пространства имеет единственное сопряженное преобразование. Для доказательства выберем ортонормированный базис е и рас- рассмотрим линейное преобразование в, матрица которого в базисе е 15 Д.В. Беклемишев
226 Гл. VII. Евклидовы и унитарные пространства равна АТ. Подставим В вместо Л* в определение A). Это приведет к очевидному равенству для матриц (А?)тг] = ?т(Атг]). Таким обра- образом, В является сопряженным для Л. Если бы имелось два преобразо- преобразования, сопряженных одному и тому же Л, то в силу D) их матрицы совпадали бы. Предложение доказано. Поскольку (Ат)т = А, из формулы D) вытекает, что (А*)*=А. E) Для любых двух преобразований Л и в из (АВ)Т = ВТАТ получаем (АВ)* = в*Л*. F) Из той же формулы D) следует, что характеристические много- многочлены Л и Л* совпадают. Следовательно, собственные значения пре- преобразований и их кратности одинаковы. В качестве приложения понятия сопряженного преобразования дадим геометрическое истолкование теоремы Фредгольма для систе- системы Ах = b из п уравнений с п неизвестными. Для этого рассмотрим n-мерное евклидово пространство и ортонормированный базис в нем. Каждый столбец будет координатным столбцом некоторого вектора, а матрица А — матрицей линейного преобразования Л. Система совместна, если существует такой вектор ж, что А(х) = Ь, т. е. Ъ принадлежит множеству значений 1тЛ преобразования Л. С другой стороны, сопряженная однородная система Ату = о равно- равносильна условию А* (у) = о, т. е. является системой уравнений для Кег Л*. Таким образом, теорема Фредгольма эквивалентна следующе- следующему утверждению: Ъ Е 1тЛ тогда и только тогда, когда (Ь,у) = 0 для любого у е Кег Л*. Мы приходим к такой ее формулировке: Предложение 2. Множество значений преобразования А совпа- совпадает с ортогональным дополнением ядра его сопряженного преобразо- преобразования: 1тЛ= ^ В гл. V мы доказали теорему Фредгольма (для более общего слу- случая), но и эта ее формулировка легко проверяется. Действительно, для любого х и любого у G Кег Л* Следовательно, 1тА С (Кег Л*)^. Сравнение размерностей показыва- показывает, что пространства совпадают. 2. Самосопряженные преобразования. Линейное преобразо- преобразование Л евклидова пространства называется самосопряженным, если А = А^. Это равносильно тому, что (А(х),у) = (х,А(у)) для любых х и у. Из формулы D) следует Предложение 3. Преобразование является самосопряженным тогда и только тогда, когда его матрица в ортонормированном ба- базисе симметрична.
§2. Линейные преобразования евклидовых пространств 227 Собственные значения и собственные подпространства самосопря- самосопряженных преобразований обладают рядом важных свойств, к изуче- изучению которых мы переходим. Ниже нам дважды придется воспользо- воспользоваться следующими замечаниями: ограничение А! самосопряженного преобразования А на любом инвариантном подпространстве является самосопряженным. Собственный вектор ограничения является собст- собственным и для преобразования. Оба утверждения очевидны. Они сразу следуют из соответствующих определений и того, что А1 (х) = А{х) для тех векторов, для которых определено А'. Теорема 1. Все корни характеристического многочлена самосо- самосопряженного преобразования вещественны. Доказательство. Допустим, что самосопряженное преобразо- преобразование А имеет не вещественный корень характеристического много- многочлена. Тогда согласно предложению 8 § 4 гл. VI существует двумер- двумерное инвариантное подпространство ?", не содержащее собственных векторов А. Обозначим через А' ограничение А на ?". Посколь- Поскольку А' — самосопряженное преобразование, в ортонормированном ба- базисе оно будет иметь симметричную матрицу а /3 /3 7 Характеристический многочлен этой матрицы \2 — (а + (cry — Р2) имеет дискриминант (а + jJ — 4 (cry — Р2)- Последнее легко преобразуется в (а - jJ + 4/32. Следовательно, дискриминант неотрицателен, характеристический многочлен имеет веществен- вещественный корень, а преобразование Af — собственный вектор, что противо- противоречит выбору подпространства S". Теорема доказана. Доказанное утверждение допускает следующую матричную фор- формулировку. Предложение 4. Если А — вещественная симметричная мат- матрица, то все корни уравнения det(A — \Е) = 0 вещественны. Теорема 2. Собственные подпространства самосопряженного преобразования попарно ортогональны. Теорема равносильна следующему утверждению. Если собственные векторы самосопряженного преобразования при- принадлежат различным собственным значениям, то они ортогональны. Докажем его. Пусть А{х) = Хх и А(у) = /лу, причем Л ф \i. Тогда (А(х),у) = \(х,у). Но иначе можно получить Из этих двух равенств следует (Л — /i)(x, у) = 0, откуда (ж, у) = 0, как и требовалось. Теорема 3. Если подпространство ?" инвариантно относитель- относительно самосопряженного преобразования Л, то ортогональное дополне- 15*
228 Гл. VII. Евклидовы и унитарные пространства ние S- этого подпространства — также инвариантно относитель- относительно А. Доказательство. Нам дано, что для каждого х из S" образ А(х) также лежит в S". Поэтому (А(х),у) = 0 для любого у е ?"^. Но для самосопряженного А это равносильно (х,А(у)) = 0, и, следователь- следовательно, А(у) Е ?"^, как и требовалось. Теперь мы можем доказать основную теорему о самосопряженных преобразованиях. Теорема 4. Пусть А — самосопряженное преобразование евкли- евклидова пространства ё. Тогда в $ существует ортонормированный ба- базис из собственных векторов А. Доказательство. Обозначим через «if сумму собственных под- подпространств преобразования А и докажем, что она совпадает с $. Сум- Сумма собственных подпространств — инвариантное подпространство. Действительно, если вектор х раскладывается в линейную комбина- комбинацию собственных векторов (принадлежащих каким бы то ни было собственным значениям), то его образ раскладывается по ним же. Из теоремы 3 следует, что ортогональное дополнение ?? также инвариантно. Допустим, что подпространство J?^~ ненулевое и рас- рассмотрим ограничение А' преобразования А на Л?^. Это — самосопря- самосопряженное преобразование, и потому оно имеет вещественные характе- характеристические числа и, следовательно, хоть один собственный вектор. Этот вектор собственный и для А и должен лежать в ??. Так как он ненулевой, в У?1- он лежать не может. Полученное противоречие показывает, что J?^~ — нулевое подпространство, и ?? совпадает с §. Поскольку сумма собственных подпространств — прямая сумма, требуемый базис в $ можно выбрать как объединение ортонормиро- ванных базисов собственных подпространств. Этот базис будет орто- нормированным, так как векторы базиса, лежащие в разных собст- собственных подпространствах, ортогональны по теореме 2. Доказанная теорема допускает такую матричную формулировку. Предложение 5. Если А — симметричная матрица, то су- существует ортогональная матрица S такая, что S~1AS — диаго- диагональная матрица. Действительно, матрица А задает самосопряженное преобразова- преобразование в ортонормированном базисе. В качестве S можно взять матрицу перехода от этого базиса к базису, построенному в теореме 4. Для теоремы 4 справедлива обратная теорема. Предложение 6. Если существует ортонормированный базис из собственных векторов линейного преобразования А евклидова пространства, то А самосопряженное. Действительно, в таком базисе матрица преобразования диаго- диагональная, а потому симметричная. А = Л* по предложению 3. Приведем геометрическую характеристику самосопряженного
§2. Линейные преобразования евклидовых пространств 229 преобразования. В теореме 2 § 3 гл. IV мы рассматривали, в част- частности, аффинное преобразование плоскости, состоящее в сжатии (растяжении) по двум взаимно перпендикулярным направлениям. В n-мерном евклидовом пространстве обобщением такого преобразо- преобразования будет сжатие по п попарно перпендикулярным направлениям. Выберем ортонормированный базис так, чтобы его векторы имели данные направления. Тогда каждый базисный вектор е« перейдет в ему пропорциональный вектор \е\, где Л^ — коэффициент сжатия. По предложению б преобразование будет самосопряженным. Обрат- Обратно, самосопряженное преобразование с положительными собственны- собственными значениями является сжатием по п попарно перпендикулярным направлениям. Нулевому собственному значению соответствует уже не сжатие, а проектирование, а отрицательному собственному значе- значению — произведение сжатия и симметрии. Рассмотрим теперь нахождение базиса, существование которого доказано в теореме 4. Выбрав некоторый (удобнее, если ортонормиро- ортонормированный) базис составляем матрицу А преобразования. Находим кор- корни ее характеристического многочлена det(A — ХЕ) и для каждого корня — базис в собственном подпространстве как фундаменталь- фундаментальную систему решений системы (А — ХЕ)? = о. Для простых корней единственный вектор базиса следует пронормировать, а для кратных корней полученный базис нужно ортогонализовать и нормировать. Для практического решения вычислительных задач по ряду при- причин применяются совсем другие методы. Изложение этих вопросов не входит в нашу задачу. Поясним, однако, одну из таких причин на простом примере. Допустим, что мы производим вычисления с округ- округлением, учитывая два десятичных знака после запятой, и нам нужно найти характеристические числа матрицы 1 0,03 II 0,03 1 || • При выбранной точности истинное характеристическое уравнение Л2 — 2Л + 0,9991 будет воспринято как Л2 — 2Л + 1, и мы найдем Л^ = = Х'2 = 1. Однако умножение матрицы на столбцы ||1 1||т и ||1 - 1||т показывает, что на самом деле характеристическими числами явля- являются Ai = 1,03 и А2 = 0,97. 3. Изоморфизм евклидовых пространств. Два евклидовых пространства § и § называются изоморфными, если существует вза- взаимно однозначное линейное отображение А : $ ->• $, при котором (А(х),А(у)) = (х,у) G) для любых х и у из ?. Такое отображение называется изоморфизмом евклидовых пространств. Таким образом, термин "изоморфизм" имеет различные значения в зависимости от контекста. Если речь идет о евклидовых прост-
230 Гл. VII. Евклидовы и унитарные пространства ранствах, то при изоморфизме помимо линейности требуется сохра- сохранение скалярного произведения. Для того чтобы два евклидовых пространства были изоморфны, разумеется, необходимо, чтобы были равны их размерности. Дейст- Действительно, в противном случае они не изоморфны даже как линейные пространства. Оказывается, что этого и достаточно. Теорема 5. Любые два евклидовых пространства одной размер- размерности изоморфны. Евклидовы пространства разных размерностей не изоморфны. Для доказательства первого утверждения выберем в каждом из рассматриваемых пространств <^и<^ по ортонормированному базису. Отображение А : $ ->• $ зададим, сопоставляя вектору х е $ век- вектор А(х) ?<#*, имеющий те же координаты. Матрица этого отображе- отображения единичная, поэтому А будет взаимно однозначным. Из форму- формулы (9) § 1 следует, что при таком отображении сохраняется скалярное произведение. Интересно отметить, что условие G) очень сильное. Из него сле- следует, что А — линейное отображение и, более того, инъективно. Дей- Действительно, рассмотрим произвольный вектор жиз^и произвольное число а. Скалярный квадрат вектора А(ах) - аА(х) можно записать в виде (А(ах), А(ах)) - 2а(А(ах), А(х)) + а2 (А(х), А(х)). Учитывая G), видим, что это равно (ах, ах) — 2а(ах,х) -\-а2(х,х), т. е. нулю. Та- Таким образом, А(ах) = аА(х). Аналогично доказывается, что А(х + + у) = А(х)+А(у). Далее, пусть х е Кег Л, т. е. А(х) — о. Это значит, что (А(х), А(х)) = = 0 и, в силу G), что (ж, ж) = 0. Таким образом, ядро А нулевое и А инъективно. В общем случае А не взаимно однозначно, но если dim <#*= dim $ , то из dim<^= Rg/A по предложению б §3 гл. VI следует, что А является изоморфизмом. Мы доказали Предложение 7. Произвольное отображение евклидова прост- пространства в евклидово пространство той же размерности является изоморфизмом, если оно сохраняет скалярное произведение. 4. Ортогональные преобразования. Преобразование А евкли- евклидова пространства 8 называется ортогональным, если оно сохраняет скалярное произведение, т. е. если условие G) выполнено для любых векторов из $. Из предложения 7 следует, что ортогональное преоб- преобразование является изоморфизмом <^на себя. Предложение 8. Если преобразование ортогонально, и только в этом случае, сопряженное ему преобразование является обратным к нему. Действительно, по формуле G) имеем (х,А*А(у)) = (х,у), или (х,А*А(у) — у) = 0. Это означает, что вектор А*А(у) — у ортогонален любому вектору пространства и, следовательно, является нулевым.
§2. Линейные преобразования евклидовых пространств 231 Поскольку равенство А* А(у) = у выполнено для всех у, преобразова- преобразование ДМ является тождественным, что равносильно доказываемому утверждению. Обратно, из равенства А*А = Е легко получить G). Предложение 9. Преобразование ортогонально тогда и только тогда, когда его матрица в любом ортонормированном базисе являет- является ортогональной. Это прямо следует из формулы D) и предложения 8. Предложение 10. Для двух ортонормированных базисов е uf найдется единственное ортогональное преобразование А, для которо- которого Afa) = fi(i = l,...,n). Доказательство. Преобразование, переводящее е в f, сущест- существует и единственно: его матрица в базисе е состоит из координатных столбцов векторов /i,...,/n в базисе е. Преобразование является ор- ортогональным, так как его матрица в ортонормированном базисе ор- ортогональная (она же служит матрицей перехода от е к f). Предложение 11. Собственные значения ортогонального преоб- преобразования по абсолютной величине равны единице. Действительно, для любого собственного вектора ж мы имеем (А(х),А(х)) = Л2(ж,ж) и (А(х),А(х)) = (ж,ж). Отсюда Л2 = 1. Предложение 12. Если ?" — подпространство, инвариантное относительно ортогонального преобразования А, то его ортогональное дополнение S- также инвариантно относительно А. В самом деле, ортогональное преобразование взаимно однознач- однозначно, и потому переводит каждое подпространство в подпространство той же размерности. Так как S" инвариантно, имеем А(?") = S". Если ж е ?", а у е ?г±, то 0 = (ж, у) = (А(х),А(у)). Таким образом, А(у) при- принадлежит (Л(^/))±- Но из А(ё') = ё' следует Д(<Г)^ = &IJL- Поэтому А(у) Е ?"^, как и требовалось. Теорема 6. Пусть А — ортогональное преобразование п-мерного евклидова пространства 8. Тогда 8 — прямая сумма попарно орто- ортогональных одномерных и двумерных подпространств, инвариантных относительно А. Для доказательства воспользуемся индукцией. Для пространств размерностей 1 и 2 утверждение очевидно. Предположим, что мы до- доказали теорему для пространств размерностей fc — 1 и fc — 2, и дока- докажем ее для /^-мерного пространства. По следствию из предложения 8 §4 гл. VI в «^существует или одномерное, или двумерное инвариант- инвариантное подпространство ?[. Его ортогональное дополнение ?^~ — инва- инвариантное подпространство размерности к — 1 или к — 2. К ограниче- ограничению преобразования А на ?^ мы применим предположение индукции. Подпространства ^2,-5С5 на которые распадается ^, инвариантны относительно А. dim<^= dim<^i +dim<^L. По предположению индукции dim^ = = dim<^2 + ... + dim<fm. Таким образом, для подпространств ё\, ...,<?ш
232 Гл. VII. Евклидовы и унитарные пространства размерность суммы равна сумме размерностей, и, следовательно, сум- сумма прямая. Теорема доказана. Выберем в каждом из подпространств ^,.../m по ортонормиро- ванному базису и объединим все эти базисы. Мы получим ортонор- мированный базис в §. Как следует из предложения 2 § 4 гл. VI, матрица преобразования в этом базисе будет клеточно диагональ- диагональной. Одномерным инвариантным подпространствам будут соответст- соответствовать клетки порядка 1, т. е. числа 1 или —1 на диагонали. Дву- Двумерным подпространствам соответствуют клетки порядка 2. Каждая такая клетка — матрица ограничения А! преобразования А. Так как базис ортонормирован, она ортогональна и имеет вид A6) § 1 при не- некотором а. Из двух матриц A6) § 1 вторая матрица симметрична. Если А' имеет такую матрицу, то оно не только ортогональное, но и само- самосопряженное, и потому имеет собственный вектор. Как вытекает из предложения 8 § 4 гл. VI, двумерные инвариантные подпространст- подпространства не содержат собственных векторов, а значит, матрицей Af будет первая из матриц A6) — матрица поворота плоскости на угол а. Такое представление матрицы ортогонального преобразования из- известно как разложение преобразования на плоские вращения, так как каждому двумерному подпространству соответствует поворот, и эти повороты могут осуществляться последовательно. Надо, однако, пом- помнить, что в общем случае имеются собственные подпространства с собственными значениями 1 и —1. 5. Полярное разложение. Так называется разложение преобра- преобразования на множители, введенное в следующей теореме. Эта теорема является обобщением основной теоремы об аффинных преобразова- преобразованиях из гл. IV, и даже доказательства этих теорем весьма сходны: центральным местом является построение ортонормированного бази- базиса, который при данном преобразовании переходит в ортогональный. Теорема 7. Каждое линейное преобразование А евклидова пространства может быть представлено как произведение А = QS, где Q — ортогональное, a S — самосопряженное преобразование с неотрицательными собственными значениями. Доказательство. Согласно формулам E) и F) преобразова- преобразование А*А самосопряженное. Пусть еь ...,еп — ортонормированный ба- базис из его собственных векторов. Пронумеруем векторы так, чтобы собственные значения удовлетворяли неравенствам Ai ^ ... ^ Ап. Для любых г и j выполнено (A(ei),A(ej)) = (АМ(е*),е,) = А*(е*,е,). Так как базис е ортонормирован, отсюда следует, что векторы A(ei) попарно ортогональны: (/А(е^), /А(е^)) = 0 при г ф j. Кроме того, |/4(ei)|2 = Af, откуда, в частности, видно, что А^ ^ 0 (г = 1,...,п). Собственные значения пронумерованы так, что если только г из них
§2. Линейные преобразования евклидовых пространств 233 отличны от нуля, они на первых местах, a Ar+i = ... = Лп = 0. Числа oti — л/Xi, г = 1,...,п, называются сингулярными числами преобразования А. Векторы fi = ol^1 A(ei), i = 1, ...,г, составляют ор- тонормированную систему векторов. Если г < п, дополним произ- произвольным образом эту систему до ортонормированного базиса векто- векторами /r+i,..., fn- После этого для любого г мы можем написать A(ei) = aifi. (При i > г обе части такого равенства равны нулю.) По предложению 10 найдется ортогональное преобразование Q та- такое, что Q{ei) = fi для любого г. Рассмотрим преобразование 5 = = Q~XA и докажем, что оно самосопряженное. Действительно, S(ei) = Q-Mfe) = Q'^aifi) = свд. (8) Таким образом, е — ортонормированный базис из собственных век- векторов S, и по предложению б преобразование S самосопряженное. Его собственные значения ai,...,an неотрицательны. Теорема доказана. Базисы е и f, построенные при доказательстве, называются син- сингулярными базисами преобразования А. Замечание. Если бы в конце доказательства теоремы 7 мы взя- взяли не преобразование S = Q Л, а Si = /AQ, то получили бы разло- разложение А = SiQ, где Si — самосопряженное преобразование с собст- собственными векторами /i,...,/n. Укажем геометрический смысл сингулярных чисел. Для этого рассмотрим n-мерную единичную сферу — множество векторов, по длине равных 1. S представляет собой растяжение по г попарно пер- перпендикулярным направлениям с коэффициентами ai,...,ar и про- проектирование вдоль линейной оболочки векторов er+i,...,en, соот- соответствующих нулевым сингулярным числам. Поэтому S переводит единичную сферу в r-мерный эллипсоид с полуосями, равными ai,... ..., аг. Преобразование Q не меняет длин векторов и только перемеща- перемещает этот эллипсоид. Итак, на сингулярные числа преобразования А следует смотреть как на полуоси эллипсоида, в который А перево- переводит единичную сферу. Приведем матричную формулировку теоремы 7. Предложение 13. Каждая квадратная матрица А может быть разложена в произведение А = QS ортогональной матрицы Q и сим- симметричной матрицы S с неотрицательными характеристическими числами. По предложению 5 для симметричной матрицы S найдется орто- ортогональная матрица Р такая, что P~XSP — диагональная матрица D с характеристическими числами матрицы S на диагонали. Подста- Подставим S = РВР~Х в разложение А = QS. Тогда А = QPDP'1. Матри- Матрицы QP и Р~х ортогональные. Обозначив их Q\ и Q2, получаем Предложение 14. Для каждой квадратной матрицы А найдут- найдутся такие ортогональные матрицы Q\ UQ2, что А = Q1DQ2, где D — диагональная матрица с сингулярными числами матрицы А на диаго-
234 Гл. VII. Евклидовы и унитарные пространства нали. Полученное разложение матрицы называется SVD или сингуляр- сингулярным разложением. Аналогичное разложение можно получить и для матрицы А размеров т х п. В этом случае Q\ и Q^ — матрицы по- порядков т и n, a D имеет такие же размеры, как и А, и состоит из нулей, за исключением квадратной диагональной подматрицы по- порядка Kg А в левом верхнем углу. Сингулярное разложение имеет важные применения, но мы не можем на них останавливаться. Упражнения 1. В базисе е с матрицей Грама Г преобразование А имеет матрицу А; А = -1 -2 3 4 Г = 1 1 1 2 а) Найдите матрицу сопряженного преобразования. Найдите собственные подпространства: б) преобразования Л; в) преобразования А*. 2. Докажите, что собственные подпространства преобразований Л и Л*, принадлежащие разным собственным значениям, ортогональны. Проверьте этот результат для упр. 1. 3. Найдите все линейные преобразования, которые являются как орто- ортогональными, так и самосопряженными. 4. Сколько существует ортонормированных базисов из собственных век- векторов данного самосопряженного преобразования, если у его характеристи- характеристического многочлена: а) нет кратных корней; б) есть кратные корни? в) Возможен ли неортогональный базис из собственных векторов само- самосопряженного преобразования? 5. Найдите матрицу перехода S к ортонормированному базису из собст- собственных векторов преобразования, заданного в ортонормированном базисе матрицей А = и напишите матрицу А' преобразования в найденном базисе. 6. Ортогональное преобразование, заданное матрицей 0 0 0-1 10 0 0 0 10 0 0 0 1 0 в ортонормированном базисе, разложите в произведение двух вращений во взаимно перпендикулярных двумерных подпространствах. 7. Получите полярное разложение преобразования, заданного в ортонор- ортонормированном базисе матрицей: л/2 0 1 8. Получите сингулярное разложение преобразования, заданного в ор- ортонормированном базисе матрицей из упр. 7, б).
§3. Функции на евклидовых пространствах 235 § 3. Функции на евклидовых пространствах 1. Линейные функции. Выбор базиса в линейном пространст- пространстве «if устанавливает изоморфизм между «if и его сопряженным J?*. В этом пункте мы покажем, что для n-мерного евклидова простран- пространства «^существует такой изоморфизм, не зависящий от базиса. Определение. Если для линейной функции f на евклидовом про- пространстве найдется вектор а такой, что f(x) = (а, ж) для любого ж, то функция называется регулярной, а вектор а — ее присоединенным век- вектором. Говорят также, что функция присоединена к вектору а. Как легко видеть, каждому вектору присоединена некоторая ре- регулярная линейная функция (см. пример 2 §5 гл. VI). Выберем в евклидовом пространстве базис е и выразим в нем связь координатного столбца а вектора а и строки коэффициентов ср его присоединенной функции f. По определению ^i = f (е;) = О, е;) = атГв; (г = 1,..., га), где Е{ — г-й столбец единичной матрицы — координатный столбец е\. Последнее произведение равно г-му элементу строки атГ, и пото- потому f = атГ, или fT = Га. A) В ортонормированном базисе эта формула выглядит особенно прос- просто: fT = а, т. е. коэффициенты регулярной функции равны коорди- координатам ее присоединенного вектора. Вспомним, что коэффициенты линейной функции в базисе е — это ее координаты в базисе р, биортогональном базису е. Отсюда следует, что равенство A) можно рассматривать как координатную запись линейного отображения Г пространства <?в его сопряженное <?* в паре базисов е и р. Так как Г — квадратная невырожденная матрица, это отображение взаимно однозначно. В пространстве <?* пока не введено скалярного умножения. Но мы можем ввести его по формуле (f,g) = (f~1(f), f~1(g)). Тогда отобра- отображение Г будет изоморфизмом евклидовых пространств. Этот изоморфизм не зависит от базиса, так как соответствие, со- сопоставляющее вектору его присоединенную функцию, записывается формулой f(x) = (а, ж) в не зависящем от базиса виде. Как следствие мы получаем Предложение 1. В конечномерном евклидовом пространстве каждая линейная функция является регулярной. Замечание. В бесконечномерном пространстве подобное пред- предложение было бы неверно. В примере 3 § 1 введено скалярное про- произведение в пространстве функций, определенных и непрерывных на отрезке [0, 1]. По отношению к этому скалярному произведению из двух линейных функционалов, рассмотренных в примере 4 §5 гл. VI, первый является регулярным, а второй, как можно доказать, нет.
236 Гл. VII. Евклидовы и унитарные пространства Не зависящий от выбора базиса изоморфизм между пространст- пространствами §и <о* позволяет отождествить эти пространства. С подобным обстоятельством мы встречались, когда отождествляли пространст- пространство «if и его второе сопряженное «if**. Отождествление евклидова про- пространства с его сопряженным (или линейной функции с ее присоеди- присоединенным вектором) является общепринятым. Рассмотрим векторы р1,...,//1, отождествляемые с элементами р1,..., рп базиса, биортогонального базису е. Из формулы E) §5 гл. VI следует, что они удовлетворяют условию , г=3- Отсюда нетрудно вывести, что при п = 3 биортогональный базис, определенный нами в §4 гл. I, совпадает с биортогональным базисом, определенным в §5 гл. VI. Это же выясняет происхождение термина "биортогональный". 2. Преобразование, присоединенное к билинейной функ- функции. Пусть b — билинейная функция на евклидовом пространстве ё. С помощью скалярного произведения ей может быть сопоставлено не зависящим от выбора базиса образом некоторое линейное преобразо- преобразование. Определение. Линейное преобразование А называется присо- присоединенным к билинейной функции Ь, если для любых векторов х и у из «^выполнено равенство Ь(х,у) = (х,А(у)). B) Предложение 2. Каждая билинейная функция имеет одно- единственное присоединенное преобразование. Доказательство. Пусть А — матрица преобразования А в не- некотором базисе е. Тогда (х,А(у)) = ?ТТАг], где Г — матрица Грама базиса е, а ? и г] — координатные столбцы х и у. Отсюда видно, что (х,А(у)) — билинейная функция с матрицей ТА. Если значения двух билинейных функций равны для любых х и у, то их матрицы совпадают. Поэтому если у функции b существует присоединенное преобразование, ее матрица В равна ТА. Отсюда А — Г /3 Ds) /i — i п. \д) Это означает, что билинейная функция не может иметь больше од- одного присоединенного преобразования: если оно существует, то его матрица равна Т~гВ. Докажем существование присоединенного преобразования. Для этого достаточно проверить, что преобразование с матрицей C) яв- является присоединенным. Подставим А = Т~гВ в (х,А(у)) = ?тТАг]. Мы получим (х,А(у)) = $,тВг] = Ь(х,у). Предложение доказано. Одновременно мы получили связь C) между матрицами билиней- билинейной функции ее присоединенного преобразования. Для ортонормиро-
§3. Функции на евклидовых пространствах 237 ванного базиса связь особенно проста — эти матрицы совпадают: А = В. D) Отсюда и из предложения 3 § 2 мы получаем Предложение 3. Для симметричных билинейных функций и только для них присоединенное преобразование является самосопря- самосопряженным. Преобразование, присоединенное к симметричной билинейной функции, называют присоединенным также к соответствующей квад- квадратичной форме. 3. Ортонормированный базис, в котором квадратичная форма имеет диагональный вид. Установленная выше связь меж- между квадратичными формами и самосопряженными преобразованиями позволяет доказать две важные теоремы. Теорема 1. В евклидовом пространстве для каждой квадратич- квадратичной формы существует ортонормированный базис, в котором она име- имеет диагональный вид. Теорема почти очевидна: базисом, существование которого утверж- утверждается, является ортонормированный базис из собственных векторов самосопряженного преобразования, присоединенного к квадратичной форме. В нем В = А и А — диагональная матрица. Следующая теорема является по существу другой формулировкой теоремы 1. Теорема 2. Пусть в линейном пространстве J? заданы две квад- квадратичные формы к и h, причем h положительно определенная. Тогда в ?? существует базис, в котором обе формы имеют диагональный вид. Для доказательства введем в «if скалярное произведение, приняв h за основную квадратичную форму. По отношению к этому скалярно- скалярному произведению ортонормированными будут те базисы, в которых h имеет канонический вид. По теореме 1 для формы к существует ор- ортонормированный базис, в котором она имеет диагональный вид. Это и есть базис, существование которого мы доказываем. Замечание. Если пространство «if евклидово, то теорема 2 оста- остается, конечно, справедливой. Уже существующее скалярное произве- произведение оставляется без внимания, а для доказательства вводится новое скалярное произведение при помощи формы h. Найденный базис, во- вообще говоря, не будет ортонормированным по отношению к старому скалярному произведению. Чтобы привести две квадратичные формы к диагональному виду в одном и том же базисе, можно сначала привести к каноническому виду форму h и найти матрицу К1 формы к в полученном базисе. Этим будет осуществлен переход к базису, ортонормированному по отношению к вспомогательному скалярному произведению. Линейное преобразование, имеющее ту же матрицу К1, является присоединен- присоединенным к форме к. Следует найти его ортонормированный базис из соб-
238 Гл. VII. Евклидовы и унитарные пространства ственных векторов, вычисляя скалярное произведение по формуле (9) § 1. В этом базисе матрица формы h будет по-прежнему единичной, а матрица К" формы к будет диагональной. Тот же результат можно получить и иначе. Пусть К и Я — мат- матрицы квадратичных форм в исходном базисе е. Матрица Я является матрицей Грама базиса е для вспомогательного скалярного произве- произведения. Поэтому преобразование, присоединенное к форме к в базисе е, имеет матрицу А = П~1К. Напишем его характеристический много- многочлен detiH^K - ХЕ) в виде det^^ - ЛЯ)]. Так как det Я ф О, характеристическое уравнение имеет те же корни, что и уравнение det(K - ЛЯ) = 0, E) называемое обобщенным характеристическим уравнением. Для каж- каждого из его корней система уравнений собственного подпространст- подпространства (Н~1К — \Е)? = о эквивалентна системе (К - АЯ)? = о. Для каждого корня фундаментальную систему решений такой сис- системы уравнений надо ортогонализовать и нормировать, находя ска- скалярное произведение по формуле G) § 1 с матрицей Грама Я. Объеди- Объединяя все так полученные ортонормированные базисы собственных под- подпространств, мы получаем базис е'. Он ортонормирован относительно вспомогательного скалярного произведения, и потому форма h в нем имеет канонический вид. Так как он состоит из собственных век- векторов преобразования, присоединенного к к, эта форма будет иметь диагональный вид в базисе е'. Упражнения 1. В пространстве многочленов степени ^ 3 скалярное произведение зададим так же, как в упр. 1 § 1. Линейная функция f сопоставляет мно- многочлену p{t) его свободный член р@). Найдите вектор (многочлен), присо- присоединенный к этой линейной функции. 2. Линейное преобразование А присоединено к билинейной функции Ь. К какой билинейной функции присоединено его сопряженное преобразова- преобразование Л*? 3. В базисе е билинейная функция имеет матрицу В. Найдите матри- матрицу ее присоединенного преобразования, если Г — матрица Грама базиса е; В = 2 1 1 2 Г = 1 1 1 2 4. Докажите, что значение квадратичной формы к(ж) на векторе х дли- длины 1 заключено между наименьшим и наибольшим собственными значе- значениями ее присоединенного преобразования, и эти границы достигаются на соответствующих собственных векторах. 5. Квадратичная форма задана в ортонормированном базисе многочле- многочленом Щ1J + 3(?2J + 3(^3J - 2^2 - 2^3 - 2f2f3. Найдите матрицу пере- перехода к ортонормированному базису, в котором она имеет диагональный вид, и ее вид в этом базисе.
§4- Понятие об унитарных пространствах 239 6. Пусть к и h — квадратичные формы и h положительно определена. Существует ли базис, в котором к имеет канонический, a h диагональный вид? 7. Приведите пример двух квадратичных форм, которые: а) не приводятся к диагональному виду в одном и том же базисе; б) приводятся к диагональному виду в одном и том же базисе, но ни одна из них не является ни положительно определенной, ни отрицательно определенной. 8. Найдите матрицу перехода к базису, в котором квадратичные фор- формы к(х) = (е1J - 2^Т + (f2J и Ь(ж) = 17(^J + 8^f + (f2Y обе имеют диа- диагональный вид, а также их вид в этом базисе. 9. Докажите, что для того, чтобы для двух непропорциональных квад- квадратичных форм в двумерном пространстве существовал базис, в котором они обе имеют диагональный вид, необходимо и достаточно, чтобы сре- среди их линейных комбинаций нашлась положительно определенная форма. Насколько здесь существенно предположение о размерности пространства? § 4. Понятие об унитарных пространствах 1. Определение. В этом параграфе мы покажем, как определяет- определяется скалярное произведение в комплексных линейных пространствах. При этом мы не приводим доказательств, поскольку их можно по- получить незначительным видоизменением доказательств соответству- соответствующих предложений о евклидовых пространствах. Договоримся, что черта над буквой, обозначающей матрицу, означает замену всех эле- элементов матрицы на комплексно сопряженные. Рассмотрим комплексное линейное пространство «if и предполо- предположим, что мы каким-то образом сопоставили каждой упорядоченной паре векторов х и у число (ж, у). Оказывается, что естественные акси- аксиомы, определяющие скалярное произведение в евклидовых простран- пространствах, выполнены быть не могут. Действительно, пусть ж — ненуле- ненулевой вектор. В нашем пространстве определено умножение на комп- комплексное число, и мы можем взять вектор гж, где г — мнимая единица. Если скалярное произведение линейно по каждому сомножителю, то имеет место равенство (гж,гж) = —(ж, ж). При положительном произведении справа произведение слева от- отрицательно. Таким образом, выбирая в качестве скалярного произве- произведения векторов значение билинейной функции, мы не можем рассчи- рассчитывать, что длина вектора будет вещественна. Поэтому в комплексном пространстве вводятся другие определе- определения скалярного произведения. В одном из них заменяют аксиому 4 более слабым требованием: из того, что (х,у) = 0 для всех ж, выте- вытекает у — о (иначе говоря, ортогональное дополнение пространства «if есть нулевое подпространство). Комплексное линейное пространство,
240 Гл. VII. Евклидовы и унитарные пространства в котором так определено скалярное произведение, называется комп- комплексным евклидовым пространством. Такие пространства использу- используются сравнительно редко. Гораздо чаще в приложениях встречаются так называемые унитарные пространства. Определение. Комплексное линейное пространство «if называ- называется унитарным (или эрмитовым) пространством, если задан закон, сопоставляющий каждым двум векторам ж и у из «if комплексное число (ж,у), называемое их скалярным произведением, и этот закон удовлетворяет следующим аксиомам, каковы бы ни были векторы ж, у и z и число а: 1) (х,у) = (?/,ж), т. е. при перестановке сомножителей скалярное произведение заменяется на комплексно сопряженное число; 2) (ах,у) = а(х,у); 3) (x + y,z) = (x,z) + (y,z); 4) (ж, ж) > 0, если х ф о. Заметим, что для любого вектора (ж,ж) = (ж,ж), и потому скаляр- скалярный квадрат вектора — вещественное число. В аксиоме 4) требуется, чтобы оно было положительным для х ф о. Из аксиом 1) и 2) вытекает правило вынесения числового множи- множителя от второго сомножителя в скалярном произведении. Как легко проверить, для любых комплексных чисел Л и \i выполнены равенства (А/х) = Ар, (А + /х) = А + р. A) В силу первого из этих равенств (ж, ау) = (ау, ж) = а(у, ж) = а(у, ж), и окончательно (ж,ш/) =а(х,у). B) Раскрытие скобок при сложении во втором сомножителе происходит без замены на сопряженное. Согласно второму из равенств A) (ж, y + z) = (y + z,x) = (у, ж) + (z, ж) = (у, ж) + (z, ж) = (ж, у) + (ж, z). Это показывает, что унитарное пространство можно определить как комплексное линейное пространство, в котором задана положи- положительно определенная эрмитова форма. Длина вектора и угол между векторами определяются теми же формулами, что и в евклидовом пространстве. Длина вектора вещест- вещественна, неотрицательна и равна нулю только для нулевого вектора. Угол, вообще говоря, комплексный. Отметим, что неравенство Коши-Буняковского пишется так: (х,х)(у,у) ^ (х,у)(у,х) = |О,2/)|2. Пример 1. Комплексное линейное пространство комплексных столбцов высоты п становится n-мерным унитарным пространством, если определить скалярное произведение по формуле
§4- Понятие об унитарных пространствах 241 Действительно, по этой формуле имеем также При помощи равенств A) теперь можно получить (?,7/) = (т/,?). Аксиомы 2) и 3) следуют из свойств умножения матриц. Далее, а следовательно, скалярный квадрат неотрицателен и равен нулю толь- только для нулевого столбца. Пример 2. Одномерное унитарное пространство можно постро- построить следующим образом. Рассмотрим в качестве множества векто- векторов векторы обычной плоскости. Сложение векторов определим, как обычно, по правилу параллелограмма. Для того чтобы определить произведение вектора на комплексное число, выберем некоторый (пусть, для определенности, ортонормиро- ванный) базис ei,e2. Произведением вектора х с координатами ^,^2 на число Л = а + i/З мы назовем вектор с координатами а^1 — /З^2 и at;2 + (З^1. Смысл этого определения следующий: вектору х соот- соответствует комплексное число f;1 + if;2. Произведением Лх называется вектор, соответствующий произведению чисел Л(^ +i?2). Заметим, что при сложении векторов складываются соответствующие комп- комплексные числа. Проверим аксиомы линейного пространства. Аксиомы, относя- относящиеся к сложению векторов, разумеется, выполнены, так как тут обычные векторы складываются обычным образом. Аксиомы, отно- относящиеся к умножению вектора на число, вытекают из свойств сло- сложения и умножения комплексных чисел. Таким образом, мы имеем комплексное линейное пространство. Размерность его равна 1, так как каждый вектор х равен (^ + i?2)ei, где ?* + if;2 — комплексное число, определяемое вектором х. Базисом является вектор еь Скалярным произведением векторов х = Aei и у = fiei назовем число A/J. Не представляет труда проверить, что такое скалярное ум- умножение удовлетворяет аксиомам унитарного пространства. Унитарная длина вектора A + i)ei равна л/2. Скалярное произве- произведение (ei,e2) = (ei,iei) = —г, даже если по отношению к обычному скалярному произведению эти векторы и перпендикулярны. 2. Свойства унитарных пространств. Все доказанные выше свойства евклидовых пространств с небольшими изменениями пере- переносятся на унитарные пространства. Скалярное произведение выражается через координаты сомножи- сомножителей в базисе е по формуле (х, ?/)=№, где Г — матрица Грама базиса е, или, иначе, матрица основной эрми- эрмитовой формы. Ее элементы — скалярные произведения всевозможных 16 Д.В. Беклемишев
242 Гл. VII. Евклидовы и унитарные пространства пар базисных векторов. Поскольку (е^е^) = (ej,ei), матрица Грама в унитарном пространстве удовлетворяет условию Гт = Г. C) Напомним, что при условии C) матрица называется эрмитовой. В конечномерном унитарном пространстве существует ортонор- мированный базис, векторы которого попарно ортогональны, а по дли- длине равны 1. Такой базис можно получить из произвольного базиса методом ортогонализации. В ортонормированном базисе скалярное произведение выражается формулой Ортогональное дополнение подпространства и ортогональные про- проекции вектора в унитарном пространстве определяются так же, как в евклидовом, и имеют те же свойства. Разумеется, нужно не забывать следить за порядком сомножителей в скалярном произведении. Матрица перехода от одного ортонормированного базиса в унитар- унитарном пространстве к другому такому же базису должна удовлетворять равенству STS = E. D) Это означает, что S = 5Т, а отсюда следует SST = Е. Определение. Матрица, удовлетворяющая равенству D), назы- называется унитарной. Применяя равенства A) к формуле полного разложения детерми- детерминанта, мы получаем, что det S = det S. Теперь из D) следует detET5) = detSTdet5 = det SdetS = | detS\2 = 1. Таким образом, детерминант унитарной матрицы — комплексное число, по модулю равное 1. В теореме 5 §4 гл. V мы видели, что для каждого линейного пре- преобразования комплексного линейного пространства существует ба- базис, в котором его матрица — верхняя треугольная. Легко видеть, что ортогонализация такого базиса не выводит его векторы из подпрост- подпространств A1) §4 гл. V. Поэтому справедлива Теорема 2. Для каждого линейного преобразования унитарного пространства существует ортонормированный базис, в котором его матрица — верхняя треугольная. 3. Самосопряженные и унитарные преобразования. Пре- Преобразование унитарного пространства называется самосопряженным, если для любых векторов х и у выполнено равенство Из этого определения вытекает, что преобразование является са- самосопряженным тогда и только тогда, когда его матрица в любом ортонормированном базисе эрмитова.
§4- Понятие об унитарных пространствах 243 Собственные значения (а значит, и все характеристические чис- числа) самосопряженного преобразования вещественны. Действительно, если А(х) = Лж, то (А(х),х) = Л(ж,ж) и (х,А(х)) = А(ж,ж). Следова- Следовательно, Л = Л. На самосопряженные преобразования унитарных пространств без изменений переносятся теоремы 2-4 § 2. Заметим, однако, что обращение теоремы 4 §2 — предложение б §2 — на унитарные преобразования не переносится: эрмитова матри- матрица должна иметь вещественные числа на главной диагонали, а потому не всякая диагональная матрица эрмитова. Преобразование унитарного пространства такое, что (А(х),А(у)) = (х,у) для любых векторов хиу, называется унитарным преобразованием. Преобразование унитарно тогда и только тогда, когда его матрица в любом ортонормированном базисе унитарная. Собственные значения унитарного преобразования по модулю рав- равны единице. Каждое унитарное преобразование имеет ортонормированный ба- базис из собственных векторов. Этим унитарные преобразования отли- отличаются от ортогональных преобразований евклидова пространства. 4. Эрмитовы формы в унитарном пространстве. Рассмот- Рассмотрим в унитарном пространстве полуторалинейную форму Ь. Преобра- Преобразование А этого пространства называется присоединенным к форме Ь, если Ь(х,у) = (х,А(у)) для любых векторов х и у. В ортонормиро- ортонормированном базисе матрица присоединенного преобразования совпадает с матрицей, комплексно сопряженной матрице полуторалинейной фор- формы Ь. Отсюда следует, что преобразование, присоединенное к эр- эрмитовой форме, является самосопряженным. Теперь аналогично теореме 1 § 3 мы можем заключить, что для эрмитовой формы в унитарном пространстве найдется ортонормированный базис, в ко- котором она имеет диагональный вид с вещественными числами на диагонали. Для двух эрмитовых форм, из которых одна положительно опре- определенная, найдется базис, в котором они обе имеют диагональный вид. Упражнения 1. В двумерном унитарном пространстве дан ортонормированный базис и векторы а и 6, координаты которых в этом базисе соответственно 1 + г, 1 -г и -г, 2 - 2г. а) Найдите их длины и косинусы углов между а и Ъ и между Ъ и а. б) Ортогонализуйте эту пару векторов. 2. Напишите какую-нибудь эрмитову матрицу порядка 3 и какую- нибудь унитарную матрицу порядка 2. 16*
244 Гл. VII. Евклидовы и унитарные пространства 3. Докажите, что корни характеристического уравнения вещественной ортогональной матрицы (в том числе и комплексные) по модулю равны 1. 4. Найдите ортонормированный базис из собственных векторов и мат- матрицу преобразования в этом базисе для преобразования Д, заданного в ор- тонормированном базисе матрицей О г -г О Является ли преобразование самосопряженным, унитарным? 5. Найдите ортонормированный базис из собственных векторов уни- унитарного преобразования, заданного в ортонормированном базисе матрицей cos if — sin if sin cp cos cp
ГЛАВА VIII АФФИННЫЕ ПРОСТРАНСТВА § 1. Плоскости 1. Аффинное пространство. В гл. I мы считали известным из школьного курса понятие обычного геометрического пространства и ввели определение вектора как упорядоченной пары точек. В гл. VI и гл. VII были изучены многомерные векторные пространства. Теперь мы можем дать аксиоматическое определение точечного пространст- пространства любой размерности. Рассмотрим n-мерное вещественное линейное пространство «if и дадим следующее Определение. Множество 5? называется п-мерным аффинным пространством, а его элементы точками, если задан закон, сопостав- сопоставляющий каждой упорядоченной паре его элементов А и В единствен- единственный вектор из «if (который мы обозначим АВ) так, что: 1) для любой точки А из 5? и любого вектора ж^У существует единственная точка В такая, что АВ — ж; эта точка будет обозна- обозначаться Р(А,х); 2) для любых трех точек А, В и С выполнено АВ + ВС = АС. ?? называется пространством векторов пространства «У, а его элементы — векторами из У. Чтобы установить соответствие с привычными определениями, заметим, что первое требование соответствует возможности отло- отложить произвольный вектор от любой точки, а второе — определению сложения векторов. Приведем простейшие следствия из определения аффинного пространства. а) Для любых двух точек А и В АА + АВ = АВ. Поэтому вектор, соответствующий паре совпавших точек, является нулевым векто- вектором. Отсюда для любой точки А имеем Р(А,о) = Р(А,АА) = А. б) Второе требование для точек А, В, А дает АВ + В А = АА, откуда АВ = —ВА. в) Для любых четырех точек А, В, А!, В' справедливо равенст- равенство АГА + АВ = Ail}1 + В*Ъ. Поэтому равенство АВ = J^B' выполне- выполнено тогда и только тогда, когда выполнено равенство А'А = В'В. Это свойство соответствует определению равенства векторов из § 1 гл. I.
246 Гл. VIII. Аффинные пространства Пример. Исходя из линейного пространства У можно постро- построить аффинное пространство. Для этого возьмем в качестве множества точек У множество векторов пространства «if и сопоставим каждой паре векторов х и у вектор щ — у — х. Легко проверить, что оба усло- условия из определения выполнены. Интуитивно это означает следующее: представим себе векторы из J? как направленные отрезки, исходящие из одной точки. Тогда точками У мы будем считать концы наших векторов. Определение. Аффинные пространства У и У1 называются изоморфными, если существует такое взаимно однозначное отображе- отображение f: У -У У' и такой изоморфизм F: J? -у ??*', что для любых двух точек выполнено f(A)f(B) = F(AB). Могут быть изоморфны только аффинные пространства одной раз- размерности. Для двух пространств разных размерностей не найдется изоморфизма F. Если для изоморфизма f известен образ f(A) какой-то одной точ- точки А и задан изоморфизм F, то отображение f однозначно определено. Действительно, образ любой точки В может быть найден по форму- формуле ip(B) = P(f (A), F(AB)). С другой стороны, как бы мы ни задали образ А* точки А и изо- изоморфизм векторных пространств F, этим путем мы получим изомор- изоморфизм f : У —У У1. Действительно, если В и С — произвольные точки, тоА1^) = F(AB) иАЩС) = F(AC). Поэтому f(B)f(C) =АЩС) -АЩВ) = F(AC) - F{AB) = F{BC). Отсюда вытекает Предложение 1. Любые два аффинных пространства одной раз- размерности изоморфны. Изоморфизм однозначно определяется заданием образа одной точки и изоморфизма соответствующих пространств векторов. Исследуем аффинные преобразования — изоморфизмы пространст- пространства У на то же пространство. Для этого предположим сначала, что изоморфизм F — тождественное преобразование. Зададимся обра- образом А* некоторой точки А и рассмотрим преобразование f, определя- определяемое равенством f(B) = P(A*,AB) для любой точки В. Если обозна- обозначить f(B) = В*, то предыдущее равенство означает, что А*В* = АВ, а это эквивалентно равенству В В* = АА*. Итак, образ каждой точ- точки получается из нее сдвигом на один и тот же вектор АА*. Такое преобразование естественно назвать параллельным переносом. Если мы предположим, что f(A) = А для некоторой точки A, a F — невырожденное линейное преобразование, то преобразование аффин- аффинного пространства будет задано формулой f(B) = P(A, F(AB)). Та- Таким образом устанавливается взаимнооднозначное соответствие меж- между невырожденными линейными преобразованиями Jf и аффинными
§1. Плоскости 247 преобразованиями, оставляющими неподвижной точку А. Нетрудно доказать, что произвольное аффинное преобразование есть произведение параллельного переноса и преобразования, имею- имеющего неподвижную точку. Определение. Аффинное пространство называется точечным евклидовым пространством, если его пространство векторов евклидо- евклидово. В этом случае расстоянием между точками А и В называется длина вектора АВ. Трехмерное точечное евклидово пространство совпадает с прост- пространством, изучаемым в элементарной геометрии, если в последнем фиксировать единицу измерения длин. Декартовой системой координат в аффинном пространстве назы- называется совокупность точки О и базиса е пространства «if. Если в 5? задана система координат О, е, то каждой точке i из У взаимно од- однозначно сопоставляется упорядоченный набор из п чисел, а именно координаты вектора О А в базисе е. Эти числа называются декар- декартовыми координатами точки, а столбец из них — ее координатным столбцом. Эти определения фактически повторяют определения из гл. I, и потому основные утверждения и формулы оттуда справедли- справедливы и для любых аффинных пространств. В частности: координатный столбец вектора АВ равен разности координатных столбцов точек В и А; координатный столбец точки Р(А,х) равен сумме координатных столбцов точки А и вектора х. Формулы замены координат точки при изменении системы коор- координат выводятся и выглядят так же, как и соответствующие форму- формулы из §3 гл. I. 2. Плоскости в аффинном пространстве. Пусть в аффинном пространстве 5? заданы точка Aq и ^-мерное (к > 0) подпрост- подпространство J?l в его пространстве векторов «if. Множество 5^1 всех то- точек вида Р(А0,х), где х е ^, называется к-мерной плоскостью в У. Точка Aq, разумеется, лежит в плоскости. Мы назовем ее начальной точкой, а подпространство J?l — направляющим подпространством. Любая точка плоскости А = P(Aq,x) может быть принята за ее начальную точку. Действительно, любая точка В = Р(Ао,у) предста- вима в виде В = Р(А,у — х), так как АВ = AqB — AqA. Наоборот, Не представляет труда доказать, что ^-мерная плоскость являет- является /^-мерным аффинным пространством. Предложение 2. Если в У выбрана декартова система коор- координат, то k-мерная плоскость может быть задана системой линей- линейных уравнений ранга п - к. Обратно, множество точек, координаты которых удовлетворяют совместной системе ранга п — к, являет- является к-мерной плоскостью.
248 Гл. VIII. Аффинные пространства Доказательство. Если ?о — координатный столбец начальной точки, то по определению столбец ? = г] + ?о является координатным столбцом точки плоскости тогда и только тогда, когда rj — коор- координатный столбец вектора из направляющего подпространства. По предложению 4 § 2 гл. VI в этом случае г] должен удовлетворять од- однородной системе ранга п — к вида Urj = 0. Следовательно, столбец | удовлетворяет системе и? = /3, где /3 = U?o. Вторая часть предложе- предложения следует из теоремы 3 §6 гл. V. Общее решение системы линейных уравнений дает параметричес- параметрические уравнения (п — г)-мерной плоскости, в которых фундаменталь- фундаментальная система решений — базис в направляющем подпространстве, а частное решение неоднородной системы — начальная точка. (п - 1)-мерная плоскость называется гиперплоскостью. Она зада- задается одним линейным уравнением о>\^1 + ... + ап?,п — /3- Одномерная плоскость называется прямой линией. Она может быть задана пара- параметрическими уравнениями вида ? = ?0 + trj. Упражнения 1. В некоторой декартовой системе координат четырехмерного аффин- аффинного пространства плоскость задана системой уравнений Напишите ее параметрические уравнения (найдите начальную точку и базис в направляющем подпространстве). 2. а) Что может представлять собой пересечение двух плоскостей? б) В n-мерном аффинном пространстве оцените размерность плоскости, получаемой как пересечение плоскостей размерностей к\ и fe. 3. Докажите, что в аффинном пространстве любые две прямые лежат в некоторой трехмерной плоскости. § 2. Общая теория линий и поверхностей второго порядка В этом параграфе мы возвращаемся к геометрии трехмерного то- точечного пространства, которой были посвящены первые главы книги. Настоящий параграф может изучаться независимо от § 1. Он содер- содержит применение результатов, полученных для квадратичных форм евклидова пространства, к исследованию произвольной линии или по- поверхности второго порядка. 1. Закон преобразования коэффициентов. Мы начинаем с рассуждений, одинаково пригодных для линий второго порядка на плоскости и поверхностей второго порядка, и потому не будем фик- фиксировать размерность п — она равна 2 или 3 в зависимости от того, какой случай иметь в виду. (В действительности читатель сможет за- заметить, что многое здесь справедливо для любых размерностей.)
§2. Общая теория линий и поверхностей второго порядка 249 И линии, и поверхности мы будем называть поверхностями, чтобы не делать большого числа оговорок. Рассмотрим произвольное уравнение второго порядка п цё? + 2 Y1 а>°? + ««о = 0, A) i,j=l г=1 связывающее координаты точек на плоскости или в пространстве, причем о точках, которые ему удовлетворяют, не будем предполагать ничего, даже того, что такие точки существуют. Если мы изменим систему координат и подставим в A) выражение старых координат через новые, то мы получим новое уравнение (также второго порядка согласно теоремам 1 и 2 § 1 гл. II). Мы будем говорить, что уравне- уравнение перешло в новое уравнение, или, что то же самое, что преобразо- преобразовались его коэффициенты. Получим закон, по которому преобразуются коэффициенты урав- уравнения. Напомним, что замена системы координат распадается на пе- перенос начала координат и изменение базиса. Если мы изменим базис при неизменном начале координат, то старые координаты выразятся через новые по формуле k=i где агк — элементы матрицы перехода от старого базиса к новому. Подставляя это в уравнение A), получаем yJfY, ti + «оо = О i,k с коэффициентами a'ko = ^2^iocrl, a'oo = aOo. B) Если мы перенесем начало координат в точку с координатами рг A ^ г ^ п), оставив базис без изменения, то старые координаты вы- выразятся через новые по формуле _ е ег Подстановка в уравнение A) дает ?? 1Ф 2^ai0(f +p') +«оо = О, ИЛИ Е ^j Е ?V ?V Е ю? + а00 = о. Отсюда OLij = OLij, ai0 = E aikPk + «i0, C)
250 Гл. VIII. Аффинные пространства так как суммы У^а^^Р7 и У^аи^рг отличаются только обозначе- обозначением индексов суммирования. Выражение для свободного члена йоо нам не потребуется. Формулы B) и C) выражают искомый закон преобразования ко- коэффициентов уравнения. Обсудим его. Члены второй степени в уравнении A) образуют однородный мно- многочлен второй степени. Мы видим, что его коэффициенты не меняют- меняются при переносе начала координат, а при замене базиса преобразуются как коэффициенты квадратичной формы. Поэтому многочлен Е D) можно рассматривать как квадратичную форму. Назовем ее малой квадратичной формой. Из сказанного вытекает Предложение 1. Ранг и сигнатура малой квадратичной фор- формы D) не меняются при изменении декартовой системы координат. Получим закон преобразования в другой форме, позволяющей до- доказать инвариантность еще двух чисел. Рассмотрим однородный мно- многочлен второй степени от п + 1 переменных Е p,q=O = Е <*а??+2 Е а Левая часть A) получается из E) при ?° = 1. Многочлен E) можно рассматривать как координатную запись квадратичной формы при некотором выборе базиса в (п + 1)-мерном пространстве. Назовем эту квадратичную форму большой квадратич- квадратичной формой. Ранг и сигнатура этой квадратичной формы не изменят- изменятся, если перейти к другому базису с произвольной матрицей перехо- перехода S порядка п + 1, но нам потребуются матрицы перехода, имеющие специальный вид. Выпишем его при п = 2: s s = On о о е е е Тут переменная ?° не меняется, а для г = 1,...,? n F) G) Если положить ?° = ?/0 = 1, а ?г (г = 1,..., п) интерпретировать как де- декартовы координаты точки n-мерного пространства, то в G) записано самое общее преобразование декартовой системы координат. Итак, мы доказали Предложение 2. Ранг и сигнатура большой квадратичной фор- формы E) не меняются при замене декартовой системы координат.
2. Общая теория линий и поверхностей второго порядка 251 Поверхность, определяемая уравнением A), не изменится, если умножить левую часть уравнения на какой-либо отличный от нуля множитель. При этом ранги большой и малой квадратичных форм не изменятся, а сигнатуры могут изменить только знак (если множи- множитель отрицательный). Отсюда следует Теорема 1. Четыре числа — ранги и модули сигнатур большой и малой квадратичных форм — являются инвариантами поверхности второго порядка. Обозначим ранг и модуль сигнатуры малой квадратичной фор- формы соответственно через г и а, а ранг и модуль сигнатуры большой квадратичной формы — через R и Е. 2. Линии второго порядка на плоскости. В теореме 1 § 1 гл. III мы показали, что любое уравнение второго порядка на плос- плоскости за счет выбора декартовой прямоугольной системы координат может быть приведено к одному из девяти канонических видов. В соответствии с этим имеется девять классов уравнений второго по- порядка. Составляя матрицы большой и малой квадратичных форм для ка- канонических уравнений, мы можем непосредственно усмотреть зна- значения г, a, R и Е, соответствующие каждому классу. Единственное затруднение возникает в случае параболы. Матрица большой квадра- квадратичной формы для ее канонического уравнения имеет вид О -р О А= -р О О 0 0 1 Чтобы найти R и Е, выберем матрицу перехода 1 -1 О 5= 1 1 О О 0 1 Мы получим STAS = -2р 0 0 0 2р 0 0 0 1 и обнаружим, что R = 3 и Е = 1. Матрица S не имеет вида F), но R и Е не меняются при произвольной замене базиса. Выпишем канонические виды уравнений второго порядка на плос- плоскости вместе со значениями рангов и модулей сигнатур в табл. 1. Из теоремы 1 видно, что уравнениям одного класса соответствует один и тот же набор инвариантов, а из табл. 1, что наборы инвариан- инвариантов, соответствующие уравнениям разных классов, различны. Таким образом, имеет место Теорема 2. Аффинный класс уравнения второго порядка с двумя переменными однозначно определяется числами г, R, а и Е.
252 Гл. VIII. Аффинные пространства Кроме того, мы видим, что значение г = 2 характеризует цен- центральные линии, а их разделение на линии эллиптического и гипербо- гиперболического типов определяется значением а. Значение R < 3 соответ- соответствует "распавшимся" линиям, в состав которых входят веществен- вещественные или мнимые прямые. Это было установлено в § 3 гл. III в связи с геометрическим смыслом определителей S и А. Сейчас мы в сос- состоянии посмотреть на них с более общей точки зрения. Таблица 1 Название Эллипс Мнимый эллипс Пара мнимых пересекаю- пересекающихся прямых Гипербола Пара пересекающихся прямых Парабола Пара параллельных прямых Пара мнимых параллель- параллельных прямых Две совпавшие прямые Каноническое уравнение «1J/а2 + «2J/Ь2 = 1 «1J/а2 + «2J/Ь2 = -1 а2«1J + Ь2«2J = 0 к1J/*2 - (еу/ъ2 = 1 а\еу-ъчеу = о (еу = 2Ре «2J = а2 tf2J = -a2 (еу = о R 3 3 2 3 2 3 2 2 1 1 3 2 1 0 1 0 2 1 г 2 2 2 2 2 1 1 1 1 сг 2 2 2 0 0 1 1 1 1 3. Ортогональные инварианты. Вместе с малой квадратичной формой мы можем рассматривать ее присоединенное преобразова- преобразование. Если пользоваться только прямоугольными системами коорди- координат, то матрица малой квадратичной формы совпадает с матрицей присоединенного преобразования. Поэтому коэффициенты ее харак- характеристического многочлена не меняются при замене одной декарто- декартовой прямоугольной системы координат другой такой же системой. Определение. Величины, не меняющиеся при замене одной де- декартовой прямоугольной системы координат на другую декартову прямоугольную систему, называются ортогональными (или евклидо- евклидовыми) инвариантами. Итак, с линией связаны два ортогональных инварианта h = h = an «22 /2 — это знакомый нам детерминант 8. При произвольных заменах координат его величина меняется, но знак (или обращение в 0) оста- остается инвариантным. Об 1\ речь шла в упр. 6 § 1 гл. III. Замена базиса F) имеет специальный вид, но если прямоугольная
2. Общая теория линий и поверхностей второго порядка 253 система координат меняется на прямоугольную, то матрица ортогональная, и ее детерминант равен 1 или —1. В этом случае де- детерминант матрицы перехода S в формуле F) также равен ±1. При замене базиса F) детерминант матрицы большой квадратичной фор- формы умножается на (detSJ, т. е. остается неизменным. Мы получили еще один ортогональный инвариант уравнения второго порядка — известный нам детерминант А, записанный несколько иначе: /я = «00 «10 «20 «Ю «11 «12 «20 «12 «22 Легко видеть, что матрица перехода в формуле F) ортогональна тогда и только тогда, когда ортогональна матрица (8) и а$ = а^ = О, т. е. ортонормированный базис заменяется на ортонормированный, а перенос начала координат не производится. При этом коэффициен- коэффициенты характеристического многочлена матрицы большой квадратичной формы не изменятся. Итак, коэффициенты при Л2 и -Л «00 +«11 +«22, (9) «И «21 «12 «22 «00 «10 «10 «И «00 «20 «20 «22 A0) не меняются при ортогональной замене базиса и, возможно, меняются при переносе начала координат. Величины такого типа называются семиинвариантами (т. е. полуинвариантами). Вычитая из (9) и A0) соответственно 1\ и /2, мы получаем семиинварианты «оо и К = «оо «10 «10 «и «00 «20 «20 «22 Впрочем, то, что а00 — семиинвариант, видно и из формул B). Значения полученных здесь инвариантов и семиинвариантов поз- позволяют найти коэффициенты в канонических уравнениях, и потому определяют линию второго порядка с точностью до положения на плоскости. Следует, однако, помнить, что эти величины связаны с многочленом второго порядка, а не с линией. Они меняются очевид- очевидным образом, если уравнение умножить на отличное от нуля число. 4. Поверхности второго порядка. Пусть уравнение A) связы- связывает координаты точки в трехмерном пространстве. В этом пункте мы покажем, что существует такая декартова прямоугольная система координат, при переходе к которой уравнение принимает один из 17 канонических видов. В качестве базиса такой системы координат выберем тот орто- ортонормированный базис, в котором малая квадратичная форма имеет
254 Гл. VIII. Аффинные пространства диагональный вид. Таким образом, мы будем исходить из уравнения Ai^1J + Л2(^2J + Лз(^3J + 2а10?1 + 2а20^2 + 2a3Of + а00 = 0 A1) и запомним, что уже выбран определенный ортормированный базис. На коэффициенты уравнения не накладывается никаких ограниче- ограничений, за исключением того, что Ai, А2 и Л3 не обращаются в нуль од- одновременно. Дальнейшие упрощения определяются следующим вспо- вспомогательным предложением. Предложение 3. Если в уравнение A1) входит с ненулевым коэффициентом квадрат одной из координат, то при помощи перено- переноса начала координат вдоль соответствующей оси можно обратить в нуль член с первой степенью этой координаты. Это доказывается так же, как и предложение 1 § 1 гл. III. Нам будет удобно рассмотреть отдельно несколько случаев, соот- соответствующих различным значениям инвариантов г, a, R и Е. 1. Пусть г = 3. Это равносильно тому, что ни одно из Ai, А2 и Л3 не равно нулю. Тогда в силу предложения 3 начало координат можно перенести в такую точку, что уравнение A1) примет вид Ai(^J + А2(^2J + АзК3J + fi = 0. A2) 1А. Условие R = 4 равносильно тому, что свободный член \i в A2) не равен нулю. Разделив на него, получим --(е? - -(а2 - -(а2 = i. аз) [I [I [I 1Аа. Пусть Е = 4. Это означает, что Ai, Л2, Аз и \i одного знака, коэффициенты в уравнении A3) отрицательны, и оно приводится к каноническому виду Это уравнение называется уравнением мнимого эллипсоида. Ему не удовлетворяет ни одна точка. 1А6. Если Е = 2, а а — 3, то общий знак Ai, A2, Аз противоположен знаку fi. Коэффициенты в A3) положительны, и уравнение приводит- приводится к каноническому виду a2 b2 с2 Поверхность — эллипсоид. 1Ав. При Е = 0 и а — 1 знак одного из собственных значений (можно считать, при необходимости изменяя нумерацию базисных векторов, что это Аз) противоположен знаку двух других (Ai и А2) и совпадает со знаком \i. В уравнении A3) два положительных и один отрицательный коэффициент. Поверхность — однополостный гипер- гиперболоид с каноническим уравнением Ю1 + ii!2! _ ii!2! = i. а2 Ъ2 с2
§2. Общая теория линий и поверхностей второго порядка 255 1Аг. Пусть теперь Е = 2, а = 1. Знак одного из собственных зна- значений (считаем, что Ai) противоположен знаку двух других и про- противоположен знаку \i. Теперь в уравнении A3) два отрицательных и один положительный коэффициент. Оно приводится к виду a2 b2 с2 и определяет двуполостный гиперболоид. 1Б. Пусть R = 3. При г = 3 это равносильно \i = 0. Уравнение A2) однородно, и всегда Е = а. 1Ба. При а — 3 все собственные значения имеют один знак, и уравнение A2) может быть записано в виде 11 + 11 + 11 = о. а2 Ь2 с2 Оно называется уравнением мнимого конуса. Поверхность состоит из одной точки. 1Б6. Если а = 1, то одно из собственных значений отличается зна- знаком от двух других. Уравнение приводится к каноническому виду 11 + И _ 11 = П 9 "^ 7 9 9 а2 о2 с2 Поверхность называется конусом второго порядка. 2. Пусть теперь г = 2. В уравнении A1) одно из собственных значений равно нулю. Не уменьшая общности, мы можем считать, что Аз = 0. Используя предложение 3, приведем A1) к виду Ai^1J + А2(^2J + 2a3Of + а00 = 0. A4) (Начало координат переносится вдоль осей ^ и ?2.) Выпишем детер- детерминант матрицы большой квадратичной формы для уравнения A4): A5) «00 0 0 «30 и Ai 0 0 и 0 А2 0 «30 0 0 0 Условие R = 4 в силу равенства A5) равносильно «зо Ф 0. 2А. Пусть R = 4. Сгруппируем члены в уравнении A4): Отсюда видно, что переносом начала координат вдоль оси Л Л 72 <-2 73 ^3 , «00 уравнение можно преобразовать в Ai(?J + A2(?J + 2«30?=0. Далее есть две возможности в соответствии со значением а.
256 Гл. VIII. Аффинные пространства 2Аа. а = 2. Тут Ai и Л2 одного знака, и, в случае необходимости, заменяя базисный вектор ез на —ез, мы приведем уравнение к виду (Ц 4. Ю1 - ф а2 ^ Ь2 С ' Это — каноническое уравнение эллиптического параболоида. 2А6. а = 0. В этом случае Ai и А2 имеют разные знаки, и уравнение приводится к каноническому виду а2 Ъ2 ** ' (Тут также может потребоваться изменение направления ез.) Это уравнение определяет гиперболический параболоид. 2Б. Пусть R = 3. Тогда а^о = 0, и левая часть уравнения не со- содержит координаты ?3. В соответствии со сказанным в § 1 гл. II это означает, что уравнение определяет цилиндр, образующие которого параллельны базисному вектору ез, а направляющая определяется в плоскости векторов ei и е2 уравнением A4) при а^о = 0: Ai(^J + A2(^2J+aoo = 0. A6) Уравнение A6) на плоскости может определять одну из пяти цен- центральных линий второго порядка. Им соответствуют пять цилинд- цилиндров, которые это уравнение может определять в пространстве: эл- эллиптический цилиндр, гиперболический цилиндр, пара пересекающих- пересекающихся плоскостей (направляющая — пара пересекающихся прямых), пара мнимых пересекающихся плоскостей (поверхность состоит из прямой линии, направляющая — точка, т. е. пара мнимых пересекающихся прямых) и, наконец, мнимый эллиптический цилиндр (пустое мно- множество, направляющая — мнимый эллипс). Канонические уравнения этих поверхностей приведены в табл. 2. 3. Рассмотрим случай г = 1. В уравнении A1) имеем \2 = \% = 0, a Ai ф 0. Переносом начала координат вдоль оси ^ уравнение приво- приводится к виду Л о о о А!^1J + 2а20е + 2азое + а00 = 0. A7) ЗА. Допустим, что а^0 + а|0 Ф 0. Тогда мы можем сделать поворот базиса вокруг вектора еь d1 - a d2 - а^ + азо^ w3 _ S — S 5 S — 5 S где v = ^«20 + а|0- Теперь A7) принимает вид А1(^/1J + 2<2+а0о = 0. A8) Переносом начала координат вдоль оси ?' преобразуем A8) в уравне- уравнение Ai(^/; J + 2vt;" = 0, которое приводится к каноническому виду Р>0.
2. Общая теория линий и поверхностей второго порядка 257 (При необходимости можно изменить направление е^.) Это уравнение параболического цилиндра. ЗБ. Если «20 = «зо = О, то уравнение A7) сводится к и приводится к одному из трех последних канонических видов. На этом классификация поверхностей второго порядка заканчива- заканчивается. Ее результаты приведены в табл. 2. Таблица 2 Название Л/Гн/Г1\ЛТ-.ТТ/Г Ч ТТ ТТТ/ГТТРЛТЛ ТТ ^ ГГ ГГТ/ГТТРПТЛ 7T Однополостный гипербо- гиперболоид Двуполостный гипербо- гиперболоид Мнимый конус Конус Эллиптический парабо- параболоид Гиперболический парабо- параболоид Эллиптический цилиндр Мнимый эллиптический цилиндр Гиперболический ци- цилиндр Пара пересекающихся плоскостей Пара мнимых пересекаю- плоскостей Параболический цилиндр Пара параллельных плос- плоскостей Пара мнимых параллель- параллельных плоскостей Пара совпавших плоскос- плоскостей Каноническое уравнение (ег сР (ег сР (ег сР (ег (Р (ег о? (ег о? (ег (ег сР (ег CL (ег а2 (а2 а2 (а2 а2 (а2 а2 (а2 (а2 ! 2 (С2J ъ2 , (е? ь2 , (е? 1 ь2 (а2 ь2 , (е? ь2 , (е? ь2 _1_ vs ) (ег ъ2 . (ег Ь2 , (е-г (ег б2 (ег ь2 , (е-г 1 ь2 = ы2 2 — CL 2 — —CL — п , (ег. , (ег _ (ег с2 (ег с2 с (ег с2 — 1РЪ - 2?3 = 1 — 1 — 1 — П — П - \ 1 - 1 -о -о R 4 4 4 4 3 3 4 4 3 Q Q 2 2 3 9 9 1 Е 4 9 П 9 3 1 2 п 1 Q 1 п 2 1 Г) 9 Г Q Q Q Q 3 3 2 2 2 9 9 2 2 1 1 1 Q Q 1 1 3 1 2 п 2 9 п П 2 1 1 1 17 Д.В. Беклемишев
258 Гл. VIII. Аффинные пространства Из теоремы 1 и табл. 2 следует Теорема 3. Аффинный класс уравнения второго порядка с тремя переменными однозначно определяется числями г, R, а иТ,. Упражнения 1. Приведите к каноническому виду уравнение Щ2J - Щ3J - 2л/3^2 - 4^3 + 4л/3^3 + 50^3 = 80. 2. Не приводя уравнение к каноническому виду, определите класс по- поверхности второго порядка (С1J + 4'f + 6^Ч3 " (?2J + 2?? + 4(?3J + 2? = 0. 3. При каких значениях параметра а поверхность с уравнением ее является эллипсоидом?
ГЛАВА IX ОСНОВЫ ТЕНЗОРНОЙ АЛГЕБРЫ § 1. Тензоры в линейном пространстве 1. Вводные замечания. В предыдущих главах мы рассматрива- рассматривали в линейных или евклидовых пространствах различного рода объекты: линейные преобразования, билинейные функции и т. д. Изучение каждого объекта основывалось на определении, которое фор- формулировалось без участия базиса. Например, линейное преобразова- преобразование определялось как такое отображение пространства в то же про- пространство, которое удовлетворяет определенным условиям (A) § 3 гл. VI). Таким образом, изученные нами объекты существуют и в принципе могут быть изучены без введения базиса. Для обозначе- обозначения таких объектов мы будем пользоваться термином геометричес- геометрический объект. Хотя геометрический объект и существует независимо от базиса, бывает удобно, выбрав некоторый базис, задать объект относительно этого базиса при помощи упорядоченной системы чисел — компо- компонент объекта. Например, выбор базиса устанавливает взаимно одно- однозначное соответствие между линейными преобразованиями и квад- квадратными матрицами. Элементы матрицы линейного преобразования можно считать компонентами линейного преобразования в рассмат- рассматриваемом базисе. Неизменность объекта при замене базиса приводит к изменению компонент. Во всех встречавшихся случаях мы могли вычислить компоненты объекта в одном базисе через его компоненты в другом базисе и че- через элементы матрицы перехода от первого базиса ко второму. Такая зависимость называется законом преобразования компонент геомет- геометрического объекта. В этой главе мы рассмотрим важный класс геометрических объ- объектов, называемых тензорами. Закон преобразования их компонент таков, что новые компоненты являются линейными однородными мно- многочленами от старых компонент, а коэффициенты этих многочленов являются произведениями элементов матрицы перехода и элементов обратной к ней матрицы. Для того чтобы точно описать этот закон и тем самым дать определение тензора, необходимо ввести некоторые обозначения. 2. Обозначения. Напомним, что матрицу размеров т х п можно определить как функцию, сопоставляющую некоторое число каждой
260 Гл. IX. Основы тензорной алгебры паре (г, j), где г Е {1, ...,m}, a j Е {1, ...,п}. Обобщим это определение. Поскольку нам будут нужны только матрицы, аналогичные квадрат- квадратным матрицам, все индексы будут принадлежать одному и тому же множеству {1,...,п}. Определение, s-мерной матрицей порядка п (или s-мерным массивом) называется функция, определенная на множестве всевоз- всевозможных наборов чисел (ii,...,is), где все числа принимают значения из множества {1,...,п}. Для того чтобы разъяснить термин "s-мерная матрица", рассмот- рассмотрим трехмерную матрицу с элементами a^k- При любом фиксиро- фиксированном значении индекса к = ко элементы вида aijk0 составляют квадратную матрицу порядка п. Таким образом, вся совокупность элементов трехмерной матрицы распадается в упорядоченный набор из п квадратных матриц: ||a^i||j •••? ll^ijnll- Можно представить себе эти матрицы расположенными одна под другой в виде слоев, так что образуется куб, разделенный на п3 ячеек, содержащих по одному чис- числу. Аналогично, четырехмерная матрица может рассматриваться как упорядоченный набор трехмерных матриц и т. д. Строку и столбец удобно считать одномерными матрицами: их элементы нумеруются одним индексом. В рассматриваемых нами матрицах не все индексы будут равно- равноправны: будут выделены два сорта индексов. Принято индексы одного сорта писать вверху, а другого — внизу. В принципе мы могли бы, скажем, обозначать один сорт индексов латинскими буквами, а дру- другой — греческими, но принятое обозначение жестко связано со всей системой обозначений. За расположением индексов приходится стро- строго следить. Если порядок индексов не установлен иначе, мы будем считать, что нижние индексы следуют за верхними так, как если бы они были написаны правее верхних. Многомерные матрицы полностью выписывать сложно. Действует следующее соглашение: буквенный индекс рассматривают как пере- переменную величину, принимающую значения 1,...,п, и если написано выражение, содержащее буквенный индекс1, не являющийся индексом суммирования, то предполагается, что написаны п таких выражений, соответствующих каждому значению этого индекса. Когда имеется несколько индексов, сказанное относится к каждому из них. Таким образом, например, агг"л* обозначает всю совокупность элементов s-мерной матрицы, а запись аг-к = Eг-к означает, что равны стоящие на одинаковых местах элементы двух трехмерных матриц, т. е. мат- матрицы равны. Вводится следующее новое обозначение суммирования. Пусть на- написан одночлен, состоящий из букв с индексами, причем какой-то ин- *)У нас в качестве буквенных индексов, как правило, будут применяться буквы г, j, /с, I, возможно, снабженные своими индексами. Буква п всегда обозна- обозначает фиксированное число — размерность пространства.
§1. Тензоры в линейном пространстве 261 деке встречается дважды: один раз вверху, а другой раз внизу. Это обозначает сумму членов такого вида, написанных для всех значений повторяющегося индекса так, как если бы перед ним стоял знак J^, а индекс был индексом суммирования, принимающим значения от 1 до п. Если описанным образом повторяются несколько индексов, то имеется в виду многократная сумма. Раньше мы постоянно сталки- сталкивались с подобными суммами, но писали знак суммирования. Теперь мы этого делать не будем. Например, формулы будем писать в виде f(x) = we, /З'ы = 3. Определение и примеры. Мы рассматриваем n-мерное ве- вещественное линейное пространство «if. Определение. В пространстве ?? задан тензор типа (p,q), ес- если каждому базису сопоставлена (р + д)-мерная матрица порядка п. При этом, каковы бы ни были базисы е и е', соответствующие им матрицы alj^"lj и а'^"'^ должны быть связаны следующими соотно- соотношениями: ih-ip _ ix ip Ji lq кг...кр /-.ч а h-jq -Tk1---Tkp(Jj1---(Jjqal1...lq > КЧ где alj — элементы матрицы перехода от е к е', a rj — элементы ее обратной матрицы. Элементы матрицы, соответствующей некоторому базису, назы- называются компонентами тензора в этом базисе. Число р + q называется валентностью тензора, a q и р соответственно ковариантной и контр- контрвариантной валентностью. Подчеркнем, что, несмотря на сложность суммы в правой части формулы A), в каждое слагаемое входит единственная компонента тензора. Это означает, что новые компоненты являются линейными однородными многочленами относительно старых компонент. Слож- Сложность формулы A) связана с выражением коэффициентов этих мно- многочленов через элементы матрицы перехода. Два тензора равны, если они одного типа и имеют одинаковые ком- компоненты в некотором базисе. Тогда из закона преобразования выте- вытекает, что равны их компоненты в любом базисе. Для любой (р + д)-мерной матрицы и любого базиса е найдется тензор типа (p,q), который в базисе е имеет эту матрицу компонент. Его компоненты в остальных базисах могут быть найдены с помощью формулы A). Пример 1. Вектор является тензором типа A, 0). Действитель- Действительно, если задан вектор, то каждому базису соответствует одномерная матрица — столбец. При этом компоненты, соответствующие разным
262 Гл. IX. Основы тензорной алгебры базисам, связаны формулой ? = S?' или ?' = S~1?: Это — закон преобразования компонент тензора типа A,0). Пример 2. Линейная функция на пространстве ?? является тен- тензором типа @,1). Действительно, если задана линейная функция, то каждому базису соответствует одномерная матрица — строка коэф- коэффициентов этой функции. При изменении базиса коэффициенты ли- линейной функции преобразуются по формуле ср' = cpS, т. е. / _ к Тензоры типа @,1) — векторы сопряженного пространства Jf* — называют ковекторами. Пример 3. Линейное преобразование пространства Jf является тензором типа A,1). В самом деле, если задано линейное преобразо- преобразование, то каждому базису соответствует матрица, и матрицы, соот- соответствующие двум базисам, связаны формулой А' = S~1AS: Пример 4. Билинейная функция на пространстве Jf — тензор типа @,2). Если дана такая функция, то каждому базису сопоставля- сопоставляется ее матрица, и матрицы билинейной функции в разных базисах связаны формулой В' = STBS: Следует заметить, что симметричная билинейная функция и соответ- соответствующая квадратичная форма — один и тот же тензор, поскольку их матрицы в любом базисе совпадают. Пример 5. Пусть В — матрица билинейной функции ранга п в базисе е. Сопоставим этому базису матрицу В~х. Сделав это для всех базисов, мы получим тензор типа B, 0). Действительно, из В' = STBS следует В'~г = S~1B~1(ST)~1 = S~1B~1(S~1)T, или Plij = Ti-ij Pkl. Пример 6. Число, не зависящее от выбора базиса, — инвари- инвариант — можно считать тензором типа @,0). Пример 7. Важным тензором типа A,1) является так называе- называемый символ Кронекера, компоненты которого в некотором базисе со- составляют единичную матрицу: Г О i zL i ®3~\\ ' — \^) Формула B) — принятое обозначение, и мы будем им ниже пользо- пользоваться. Если интерпретировать символ Кронекера как линейное пре- преобразование, то это будет тождественное преобразование Е, и потому
§1. Тензоры в линейном пространстве 263 в любом другом базисе этот тензор имеет те же компоненты, состав- составляющие единичную матрицу. Для примера проверим это, используя тензорную символику. Согласно закону преобразования д'; = 4а^. C) Если 8f определяется формулой B), то из п2 слагаемых в правой части C) равны нулю все, кроме тех, для которых к = I. Поэто- Поэтому 8'j = ткак, а ткак — элементы произведения S~1S. Значит, S'j = Sj. Пример 8. Рассмотрим обобщение билинейной функции — функ- функцию F(xi,...,xg) от q векторов, линейную по каждому из них, если остальные фиксированы. Такие функции называются q-линейными или полилинейными, если число аргументов не уточняется. Разложим каждый из векторов по некоторому базису е. Тогда в силу полили- полилинейности F(xu...,xq) = F(^1eil,..,^eig) = _ ?l\ tlqp(p. p\—p4 рг4гу. где коэффициенты а^...^ = F(ei1,..., eiq) играют ту же роль, что и элементы матрицы билинейной функции. Докажем, что при замене базиса они преобразуются как компоненты тензора типа @,д). Для этого рассмотрим базис е\ — crfek и снова воспользуемся полилиней- полилинейностью: ^l ^l F(ekl,...,ekq), или а[г iq = a1l\..aiqak1...kq, как и требовалось. Пример 9. Таким же способом можно построить пример тензо- тензора любого типа (p,q). При этом полилинейная функция должна за- зависеть от q векторов и р ковекторов. Значение такой функции на векторах xi,...,xq и ковекторах f1,...,P можно вычислить, разложив векторы по базису е, а ковекторы — по его биортогональному бази- базису р в пространстве «if*. Напомним, что базис р1,...^71 называется биортогоналъным базису ei, ...,еп, если p'(efc) =<***• Если Xi = ^е/.., а F = cpj, plj, то аналогично предыдущему получаем р(Жь..., Ж9 j\ ...г) = ^--еЫ-Xat: v где Вспомним, что базис р преобразуется матрицей E-1)т, когда ба- базис е преобразуется матрицей S. В тензорных обозначениях это за- записывается как p/J = rJkpk и проверяется так:
264 Гл. IX. Основы тензорной алгебры Теперь подставим в а'г^'"\р = F(e'- ,..., е'- , pm,..., р/гр) выраже- ния новых базисных векторов через старые (для обоих базисов е и р) и, как и в примере 8, получим закон преобразования коэффициентов, который будет совпадать с законом преобразования A). Этот пример показывает, что для любой р + g-мерной матрицы и любого базиса е найдется тензор типа (р, q), который в базисе е имеет такую матрицу компонент. 4. Линейные операции. Линейные операции определены для тен- тензоров одного и того же типа. Именно, определим для пространствен- пространственных матриц одной размерности сложение и умножение на число по- поэлементно: суммой матриц oQ'.'^f и /З^'? назовем матрицу 'Л-Зя - аЛ-Зя ^ Р31-3я> W а произведением матрицы &]¦[ ]Р на число Л — матрицу Предложение 1. Пусть А и В — тензоры типа (p,q). Сопо- Сопоставим каждому базису сумму их матриц в этом базисе. Этим будет определен тензор типа (р, q). Сопоставим каждому базису произведе- произведение матрицы тензора А на число Л. Этим будет определен тензор того же типа (p,q). Обе части предложения доказываются одинаково и по существу вытекают из того, что правая часть формулы A) — линейный одно- однородный многочлен относительно старых компонент тензора. Приве- Приведем доказательство для первой части. При замене базиса (ii...ip _ ix iP h lqk!...kp a 31--Зя -Tki-Tkp(Tj1-Gjqal1...lq > n(ii...ip _ ii Jv J-\ lq nki...kp P h...jq -Tki-TkpGj1-GjqPi1...iq • Складывая почленно эти равенства, мы получаем iH...ip . nin...ip _ и гр и Iq(k1...kpnki...kp^ а 31--Зя +Р 31--Зя -Tk1-Tkp(Jj1-(Jjq^al1...lq +Ph...lq h т. e. тензорный закон преобразования для а,1'", р +/371"\ р. х х х ь\ .. Л q ' i I .. Л q Тензоры, определенные в предложении 1, мы назовем, соответ- соответственно суммой тензоров А и В и произведением А на число Л. Свойст- Свойства линейных операций описываются следующим предложением. Предложение 2. По отношению к операциям сложения и умно- умножения на число множество всех тензоров одного и того же типа (р, q) является линейным пространством размерности np+q. Предоставим читателю проверить все аксиомы в определении ли- линейного пространства и займемся размерностью. Выберем в «if какой- нибудь базис и рассмотрим тензоры, у которых одна из компонент в данном базисе равна 1, а остальные компоненты равны нулю. Сущест- Существует ровно np+g таких тензоров, так как тензор типа (р, q) имеет np+g
§1. Тензоры в линейном пространстве 265 компонент. Каждый тензор данного типа раскладывается, и притом однозначно, по выбранным нами тензорам (коэффициенты разложе- разложения равны компонентам данного тензора). Таким образом, размер- размерность пространства тензоров типа (p,q) равна np+g, и предложение доказано. Более того, мы построили базис в пространстве тензоров ти- типа (p,q), естественным образом связанный с базисом в простран- пространстве «if. Напомним, что как раз таким способом мы построили ба- базис в сопряженном пространстве «if* — пространстве тензоров ти- типа @,1) — и назвали его биортогональным исходному базису в Jf. Теперь для пространства ?? мы имеем бесконечную последователь- последовательность линейных пространств, связанных с ним так же, как J?*\ как только выбран базис в S?^ во всех этих пространствах также появля- появляются базисы. 5. Умножение тензоров. Пусть А — тензор типа (р, д), а в — тензор типа (г, s). Произвольному базису е мы можем сопоставить (р + q + г + з)-мерную матрицу, составленную из произведений каж- каждой компоненты А на каждую компоненту В. Эти произведения упо- упорядочим, записав сначала индексы, относящиеся к Л, а затем индек- индексы, относящиеся к В, так, как показывает формула гг.-Аркг-.-кг _ гг...гр пкг...кг /гч Предложение 3. Если каждому базису мы сопоставим чис- числа T^i"'?7"? определяемые формулой E), то этим будет определен тензор типа (p + r,q + s). Доказательство мы проведем для случая тензоров типов A,1) и @,1). В общем случае доказательство отличается только более гро- громоздкой записью. Выразим компоненты тензоров Л и в в базисе е; через их компоненты в базисе е: Отсюда т. е. величины rfh преобразуются при замене базиса как компоненты тензора типа A,2). Определение 1. Тензор, построенный в предложении 3, назы- называется произведением тензора А на тензор В и обозначается А 0 В. Пример 10. Рассмотрим две линейные функции f и h на У и сопоставим каждой паре векторов х и у число f(x)h(y). Пусть в не- некотором базисе значения функций записываются как f(x) = (р^г и U(y) = /ikVk? гДе С И Vk — компоненты векторов х и у. Тогда Ь(х,у) = f(x)h(y) = (^if )(W7*) = (<PWk)erik, поскольку при перемножении многочленов каждый член одного со- сомножителя умножается на каждый член другого. Итак, построенная
266 Гл. IX. Основы тензорной алгебры нами функция b — произведение двух линейных функций — би- билинейная функция, т. е. тензор типа @,2). Он является тензорным произведением тензоров, соответствующих f и h. Мы можем напи- написать b = f (g) h, или, в компонентах, flik = ФФк- Тензорное произведение не коммутативно. Это хорошо видно на предыдущем примере. Пусть Ь* = h ® f. Тогда b*(x,y) = h(x)f(y) = = b(y,x), т. е. это будет другая билинейная функция, если только функция b не симметричная. Посмотрим на то же самое с точки зре- зрения компонент. Конечно, (pi/ik = HWi- Это значит, что f3ik = /3ki: мат- матрицы билинейных функций отличаются на транспонирование, В* = = ВТ. Они совпадают, если cpi/ik ~ И№к — 0 Для всех г, к. Равенст- Равенство нулю всех этих детерминантов равносильно пропорциональности коэффициентов линейных функций f и h. И в общем случае множество чисел, являющихся компонентами произведения тензоров, не зависит от порядка сомножителей, но упо- упорядочиваются эти числа по-разному в зависимости от порядка сомно- сомножителей. Предоставим читателю самостоятельно убедиться, что умножение тензоров ассоциативно и дистрибутивно по отношению к сложению. Легко заметить также, что произведение тензора на число совпадает с произведением на тензор типа @,0), имеющий это число в качестве компоненты. Предложение 4. Любой тензор типа (p,q) раскладывается в линейную комбинацию произведений, в каждое из которых входит р векторов и q ковекторов. Для доказательства покажем, что произведениями требуемого ви- вида являются тензоры, из которых в предложении 2 был построен ба- базис в пространстве тензоров типа (p,q). Мы сделаем это для тензоров типа B,1), поскольку в общем случае рассуждение аналогично. Пусть тензор Q таков, что в базисе е его компонента в\3 = 1, а остальные компоненты равны нулю. Рассмотрим векторы базиса е2, е3 и ковектор р1, входящий в биортогональный базис. Векторы е2 и ез имеют компоненты @,1, 0,..., 0) и @, 0,1, 0,..., 0), а компоненты ко- вектора — A,0, ...,0). Поэтому произведение Q = е2 0 е3 0 р1 имеет только одну компоненту Of3, равную 1, а все остальные его компо- компоненты равны нулю. Точно так же утверждение доказывается и для остальных тензоров, составляющих базис в пространстве тензоров рассматриваемого типа. 6. Свертывание. Рассмотрим множество элементов s-мерной матрицы, для которых все индексы, кроме некоторых двух, имеют фиксированные значения. Это множество образует двумерный слой — квадратную матрицу. Таким образом, вся матрица распадается на двумерные слои, соответствующие выбранной паре индексов. Всего таких слоев столько, сколько комбинаций значений могут принимать остальные s — 2 индексов, т. е. ns~2.
§1. Тензоры в линейном пространстве 267 Пусть А — тензор типа (р, q), причем р > 0 и q > О, т. е. тензор име- имеет как верхние, так и нижние индексы. Выберем какой-нибудь верх- верхний (например, первый) индекс и какой-нибудь нижний (например, последний) и рассмотрим слои, соответствующие такой паре индек- индексов. Напомним, что следом квадратной матрицы называется сумма ее диагональных элементов. Следы всех слоев образуют (р + q - 2)- мерную матрицу, имеющую р — 1 верхних и q — 1 нижних индексов: ni2 •••ip H2...ip . 2i2...ip . . ni2...iv /r>\ Ph-Li = ah...jq-il + ah-U-i2 + - + ah...jq-in- F) Используя тензорное обозначение суммирования, мы можем написать nii---iv _ ki2...ip rji...jq-i u'j1...jq-1k' Предложение 5. Сопоставим каждому базису систему чи- чисел, получаемую из компонент тензора типа (р, q) вычислением следа каждого слоя, соответствующего одному верхнему и одно- одному нижнему индексам. Такое соответствие определяет тензор ти- типа (р — 1, q — 1). Для доказательства выясним, как преобразуется указанная систе- система чисел при изменении базиса. Для случая, описанного формулой F), мы имеем n/i2...ip _ ,ki2...ip _ k ^i2 JbvJ\ Vi ^mi-mP P 3i...jq-i ~aji...jq-ik -rm1Tm2-rmpGj1-Gjq-1Gkal1...lq • Но так как r^a^ = 6тг, это выражение равно Slq ri2 Tiv h [q-i тг...гпр При суммировании по индексам lq и mi равны нулю все слагаемые, за исключением тех, для которых lq = mi. Обозначив lq=mi= к, мы можем написать niii...ip _ i2 I и lq-i кгп2...гпр Р ji...jq-i - Tm2---Tmp(Tj1---Gjq_1al1...lq-1k- Это и есть доказываемый закон преобразования. Определение. Тензор, получаемый из тензора А по форму- формулам F), называется его сверткой по первому верхнему и последнему нижнему индексам. Аналогично определяется свертка по любому верхнему и любому нижнему индексам. Подчеркнем, что для двух верхних (или двух нижних) индексов свертка не определена. Свертка тензора типа A,1) по единственной паре индексов есть инвариант — уже упоминавшийся след линейного преобразования (см. с. 185). Сверткой двух тензоров называется свертка их произведения по верхнему индексу одного из сомножителей и нижнему индексу дру- другого. Например, образ вектора х с компонентами ?г при линейном преобразовании с матрицей а^ есть свертка соответствующих тензо- тензоров: Т]к = а^1. Значение линейной функции f со строкой коэффици- коэффициентов ipk на векторе х с координатами ?г есть свертка ip(x) = фк?,к•
268 Гл. IX. Основы тензорной алгебры 7. Транспонирование. Транспонированием s-мерной матрицы по каким-либо двум индексам называется такая перестановка ее элемен- элементов, при которой транспонируется каждый слой, получаемый фик- фиксированием всех индексов, кроме двух выбранных. Например, при транспонировании матрицы а^ по двум первым верхним индексам она переходит в матрицу fi\3 , связанную с ней равенством 0р =ajik. G) Вообще, под транспонированием матрицы по множеству индек- индексов понимается результат ее последовательных транспонирований по различным парам индексов из этого множества. По множеству из к индексов может быть осуществлено к\ транспонирований. Транспонирование иногда называют перестановкой индексов, хо- тя, например, записи ot\3- и определяют одну и ту же матрицу: в обоих случаях все индексы независимо друг от друга принимают значения от 1 до п. Пример 11. Пусть п = 2. Рассмотрим трехмерную матрицу ацк. Значениям 1 и 2 последнего индекса соответствуют два слоя. Выпи- Выпишем их рядом: «211 «121 «221 «112 «212 «122 «222 Транспонирование по двум первым индексам переводит эту мат- матрицу в fiijk = ajikj или, в развернутом виде, 0ш 02и 0121 0221 0112 0212 0122 0222 «111 «121 «211 «221 «112 «122 «212 «222 Если при более сложном транспонировании 7ij/e = ыщ, T0 Tin 7i2i 7211 7221 7112 7122 7212 7222 «111 «112 «121 «122 «211 «212 «221 «222 Предложение 6. Пусть каждому базису сопоставлена (р + q)- мерная матрица, полученная из матрицы тензора А типа (р, q) транспонированием, причем переставляются только верхние (или только нижние) индексы. Этим определен тензор В типа (p,q). Нам достаточно доказать это для транспонирований по двум ин- индексам, так как любое транспонирование — результат последователь- последовательного выполнения таких транспонирований. Кроме того, для любой па- пары верхних или нижних индексов доказательство одинаково. Число и расположение индексов, не участвующих в транспонировании, роли не играет. Поэтому мы проведем доказательство для транспониро- транспонирования по первой паре верхних индексов, записанного в формуле G). Транспонируем матрицу новых компонент тензора А: — i ~ — -3 T rllrvJlilkl — T3\
§1. Тензоры в линейном пространстве 269 Это отличается от обычной записи закона преобразования компонент тензора типа C,1) только порядком сомножителей. Определение. Тензор В, построенный в предложении б, назы- называется результатом транспонирования тензора А. Тензоры, являющиеся произведениями двух данных тензоров в разном порядке, получаются один из другого транспонированием. 8. Симметрирование и альтернирование. Рассмотрим тен- тензор Л, контрвариантная валентность которого не меньше заданного числа s ^ 2. Выберем какие-нибудь s верхних индексов. Эти индексы можно переставить s\ способами, и потому существуют s\ тензоров, получающихся из А транспонированием по этим индексам. Сложим все эти тензоры и разделим результат на число s\. Полученный тензор называется результатом симметрирования А по выбранным индек- индексам. Его компоненты обозначаются заключением в круглые скобки этой группы индексов у компонент тензора А. Аналогично определя- определяется симметрирование по нижним индексам. Пример 12. Симметрирование тензора типа C,0) по первому и третьему индексам: . , , . -. Обратите внимание, что второй индекс, не участвующий в симмет- симметрировании, выделен прямыми чертами. Пример 13. Симметрирование тензора типа A, 3) по всем ниж- нижним индексам: FW) = \ ($« Снова рассмотрим тензор А типа (p,q), где р ^ s ^ 2. Выберем группу из s верхних индексов и пронумеруем выбранные индексы числами l,...,s. Тогда каждому тензору, получаемому из А транспо- транспонированием по этим индексам, будет сопоставлена некоторая пере- перестановка ii,...,is номеров l,...,s. Обозначим через N(ii,...,is) число нарушений порядка в ней (см. п. 6 § 3 гл. V). Напомним, что пере- перестановка называется четной, если число нарушений порядка в ней четное, и нечетной в противном случае. Транспонируя А по выбранным индексам, мы, как и выше, по- получим s\ тензоров. Сложим все эти тензоры, предварительно умно- умножив каждый из них на (-1OУ(гь--->**)? Где ii,...,is — перестановка, ему соответствующая. Сумму разделим на число s\. Так построен- построенный тензор называется результатом альтернирования тензора А по выбранным индексам. Его компоненты обозначаются заключением в квадратные скобки тех индексов, по которым производится альтер- альтернирование. Пример 14. Альтернирование тензора типа C,0) по первому и третьему индексам: . , , . -. a\i\№ = ±(aijk-akji). ,к + Ры, + fan + tikj + Phk) • (8)
270 Гл. IX. Основы тензорной алгебры Пример 15. Альтернирование тензора типа A, 3) по всем ниж- нижним индексам: 4*4 = \($*' + tiik + Pkij - ti» - ftkj -P)ik)- (9) Пример 16. В §4 гл. VI мы отмечали, что детерминант матри- матрицы линейного преобразования является инвариантом. Выразим этот инвариант при помощи тензорных операций. Пусть аг- — элементы матрицы А преобразования А в некотором базисе е. Тогда п-крат- ное произведение А на самого себя А 0 ... ® А имеет компоненты a}iajV*'ajV Альтернируем это произведение по всем нижним индек- индексам, а затем свернем по всем индексам. Мы получим инвариант Докажем, что это и есть интересующий нас детерминант. Здесь п индексов суммирования, каждый из которых принимает п значений. Следовательно, правая часть распадается на пп слагаемых. Каждое из этих слагаемых представляет собой сумму п\ членов, воз- возникающих при альтернировании. Если в наборе значений индексов суммирования, определяющих какое-то слагаемое, есть два одинако- одинаковых, то такое слагаемое равно нулю. Действительно, для каждого чле- члена в нем, взятого со знаком плюс, найдется не отличающийся член, взятый со знаком минус. Пусть все значения индексов суммирования, определяющие слагаемое, различны. Тогда, переставляя сомножите- сомножители в каждом члене такого слагаемого, упорядочим верхние индексы и этим приведем его к виду ah... а™,, причем Всего слагаемых такого типа п!. Следовательно, Отсюда по формуле полного разложения детерминанта А = det А. Если разбор этого примера вызвал затруднение, выпишите под- подробно всю сумму при п = 2. 9. Замечание. Пусть имеется какое-то соотношение между тен- тензорами, написанное при помощи введенных нами тензорных опе- операций. Если выбран базис, это соотношение порождает такие же соотношения между компонентами рассматриваемых тензоров. Тен- Тензорные операции инвариантны в том смысле, что соотношения между компонентами выглядят одинаково, каков бы ни был базис. Скажем, соотношение A = x®y + z®z, где ж, у и z — векторы, равносильно равенству аг^ = ^гт]^ + (г& между компонентами, причем безразлич- безразлично, в каком базисе, так как во всех базисах оно выглядит одинаково. В силу этого обстоятельства часто, говоря о тензорах, имеют в виду их компоненты или, наоборот, говоря о компонентах, имеют
§1. Тензоры в линейном пространстве 271 в виду тензоры. Говорят, например, "тензор a^V' вместо "тензор, компоненты которого в таком-то базисе равны ац^\ Это не может вызвать недоразумений и сильно упрощает речь. В дальнейшем мы будем пользоваться подобными сокращениями. 10. Симметричные и антисимметричные тензоры. Определение. Тензор называется симметричным по паре ин- индексов, если он не меняется при транспонировании по этой паре. Ре- Результат его альтернирования по этой паре равен нулевому тензору. Тензор симметричен по группе индексов, если он симметричен по любой паре индексов из этой группы. В этом случае он не меняется при любом транспонировании по индексам этой группы. Не представляет труда убедиться, что результат симметрирова- симметрирования тензора по некоторой группе индексов является тензором, сим- симметричным по этим индексам. Если, например, переставить любые два нижних индекса в формуле (8), то в ее правой части изменится только порядок слагаемых. Определение. Тензор называется антисимметричным по паре индексов, если он умножается на (—1) при транспонировании по этой паре индексов, или, иначе говоря, результат его симметрирования по ней равен нулевому тензору. Если тензор антисимметричен по паре индексов, то равны нулю те его компоненты, у которых совпадают значения этих индексов. Это видно из того, что каждый слой, соответствующий этим индексам, — антисимметричная квадратная матрица. Тензор антисимметричен по группе индексов, если он антисим- антисимметричен по любой паре индексов из этой группы. Результат альтернирования тензора по нескольким индексам ан- антисимметричен по этим индексам. Причину этого легко понять, если переставить какие-нибудь два нижних индекса в формуле (9): ее пра- правая часть изменит только знак. Предложение 7. Антисимметричный по группе из s индексов тензор не меняется при транспонировании по ней, если соответству- соответствующая перестановка индексов четная, и умножается на (-1), если не- нечетная. Доказательство. Транспонирование, соответствующее пере- перестановке индексов ii, ...,is, сводится к последовательной перестановке пар индексов. Поскольку каждая из них меняет знак всех компонент тензора, достаточно доказать, что данное транспонирование осущест- осуществимо за N(ii, ...,is) перестановок пар индексов. Последнее утверждение равносильно тому, что числа 1,..., s можно расположить в порядке ii,...,is, переставляя N(ii, ...,is) раз соседние числа. Докажем сначала, что числа ii,...,is можно указанным спо- способом расположить в порядке возрастания. Для этого отыщем в пе- перестановке ii,...,is число 1 и переставим его на первое место, меняя
272 Гл. IX. Основы тензорной алгебры местами последовательно со всеми числами, стоящими левее. Все они больше 1, и мы переставим единицу столько раз, сколько нарушений порядка она образует. Затем отыщем число 2 и точно так же пере- переставим его на второе место. При этом его придется переставить со всеми числами, которые стоят левее него, кроме 1, а со всеми ними оно образует нарушение порядка. Проделаем далее то же самое со всеми числами 3,..., s - 1. Число s окажется на последнем месте, переставлять его не надо, но и нару- нарушений порядка в перестановку оно не вносит. В результате будет сделано iV(n, ...,is) попарных перестановок чисел, и числа окажутся расположенными в порядке возрастания. Теперь исходя из 1, ...,s мы можем проделать те же перестановки чисел в обратном порядке и получить ii,...,is. На это потребуется также N(ii, ...,is) перестановок соседних чисел. Предложение 8. Если тензор симметричен по группе из s ин- индексов, то результат его альтернирования по этой группе индексов — нулевой тензор. Если тензор антисимметричен по группе индексов, то результат его симметрирования по ней — нулевой тензор. Обе части предложения доказываются одинаково. Докажем пер- первую. Все s\ тензоров, которые можно получить транспонированием, одинаковы. При альтернировании мы складываем их со знаками, опре- определяемыми четностями соответствующих перестановок. При этом все слагаемые уничтожатся, так как из s\ перестановок ровно полови- половина четных, а половина нечетных. Действительно, меняя местами два первых числа в перестановке, мы изменяем ее четность (вводится или ликвидируется ровно одно нарушение порядка). Этим устанавливает- устанавливается взаимно однозначное соответствие между четными и нечетными перестановками. Замечание. Если индексов больше двух, равенства нулю ре- результата альтернирования (симметрирования) по этим индексам еще недостаточно для того, чтобы тензор был симметричным (антисим- (антисимметричным) по ним. Упражнения 1. Пусть S$ — линейное пространство билинейных функций, определен- определенных на линейном пространстве J?\ а Л — линейное преобразование про- пространства S$. Докажите, что А — тензор типа B, 2) в пространстве J^. 2. а) Сколько компонент имеет трехвалентный тензор в четырехмерном пространстве? б) Сколько слагаемых содержит выражение какой-либо его компоненты в новом базисе через компоненты в старом базисе? 3. Тензор типа @,п) в n-мерном линейном пространстве в базисе е имеет компоненты е^ш.лп = 0, если среди значений ii,...,in есть оди- одинаковые, и
§2. Тензоры в евклидовом пространстве 273 в противном случае. Найдите компоненты этого тензора в базисе е' = eS. 4. Линейная функция f задана в базисе е строкой <р, а вектор а — столбцом (X. Найдите матрицу тензора а 0 f. Какой геометрический смысл имеет этот тензор? 5. Сколько различных тензоров можно образовать при помощи сверты- свертывания из тензора типа B,2)? 6. Докажите, что тензор из упр. 3 антисимметричен по любому под- подмножеству множества индексов. 7. Докажите, что для любого тензора типа A, 1) выполнено равенство (i ЬЛ i k § 2. Тензоры в евклидовом пространстве 1. Метрический тензор. Все, сказанное о тензорах в линейном пространстве, разумеется, справедливо и в случае евклидова пространства. Однако в евклидовом пространстве тензоры обладают многими свойствами, которых они не имеют в линейном. Определение. Сопоставим каждому базису евклидова прост- пространства матрицу Грама этого базиса. Определяемый этим тензор дц типа @, 2) называется метрическим тензором пространства. Как мы видели в примере 5 § 1, справедливо Предложение 1. Сопоставим каждому базису евклидова пространства матрицу, обратную матрице Грама этого базиса. Это соответствие определяет тензор gtJ типа B,0). Определение. Тензор, построенный в предложении 1, называ- называется контрвариантным метрическим тензором. Поскольку (Г~1)Т = (ГТ)~1 = Г, контрвариантный метрический тензор симметричен: {- ji Напишем равенство ГГ = Е в тензорных обозначениях: 2. Поднятие и опускание индексов. Наличие метрического тензора позволяет ввести в евклидовом пространстве еще две опера- операции над тензорами — поднятие и опускание индексов. При опускании индекса тензору типа (р, q), р ^ 1, сопоставляется тензор типа (р — 1, q + 1), получаемый свертыванием данного тензора с метрическим тензором по тому индексу, который мы хотим опус- опустить. При этом порядок индексов сохраняется в следующем смысле. Мы отказываемся от соглашения, согласно которому нижние индек- индексы следуют за верхними. Для того чтобы отметить порядок индексов, над каждым нижним индексом и под каждым верхним индексом ста- ставится точка. Например, при опускании первого индекса у тензора а3к мы получаем тензор gua Jk = otf'k. 18 Д.В. Беклемишев
274 Гл. IX. Основы тензорной алгебры В действительности эти точки расставляются не всегда, а тогда, когда возможны недоразумения или неоднозначность в интерпрета- интерпретации формул. Часто можно обойтись без них. При поднятии индекса данный тензор сворачивается с контрва- контрвариантным метрическим тензором по тому индексу, который следует поднять. Результат будет тензором типа (р + 1, q - 1). Например, под- поднятие первого индекса у af'k дает а3к — дг1а\3к, а поднятие третьего приводит к а'[к = gklotfx. Пример i. В §3 гл. VII был введен вектор, присоединенный к линейной функции на евклидовом пространстве. Строка коэффициен- коэффициентов (р линейной функции и координатный столбец вектора а связаны формулой ср = oltT. Переходя от матричной записи к тензорной, мы получаем cpi = ak'ды- Итак, линейная функция получается из вектора опусканием индекса. Наоборот, вектор получается из функции под- поднятием индекса: а3 = д13\р{. Пример 2. К билинейной функции Ь на евклидовом пространстве присоединено линейное преобразование Л, матрица которого связана с матрицей билинейной функции равенством А — Т~1В. В тензорных обозначениях это может быть переписано как a)=gikl3kj. Мы видим, что тензор А получен из тензора b поднятием первого индекса. Мы можем сказать также, что b получается из А опусканием индекса, но здесь уже необходимо подчеркнуть, что при опускании верхний индекс становится первым нижним индексом: То, что здесь это существенно, показывает Пример 3. В §2 гл. VII мы определили линейное преобразова- преобразование Л*, сопряженное данному преобразованию А. В произвольном ба- базисе их матрицы связаны равенством, которое можно переписать в виде ТА* = (ТА)Т. Обозначим через а1- и а*г элементы А и А* и напишем это равенство в тензорных обозначениях: 9ik<*kj = gjkaf- — после опускания индексов один тензор получается из другого транс- транспонированием. Свертывая обе части этого равенства по индексу j с тензором glj\ мы получим Slka*k' = gljgikOtk- или — чтобы получить один тензор из другого, надо поднять нижний индекс и опустить верхний. 3. Евклидовы тензоры. При изучении евклидова пространст- пространства часто можно ограничиться только ортонормированными базиса- базисами. При этом все формулы, связанные со скалярным произведением,
§2. Тензоры в евклидовом пространстве 275 значительно упрощаются, так как метрический тензор имеет единич- единичную матрицу: !1' i=J'' 0, гфз. Матрица перехода от одного ортонормированного базиса к друго- другому ортонормированному является ортогональной, т. е. удовлетворяет соотношению S~l = 5Т, а ее элементы связаны равенствами 4=rl B) Пусть мы ограничились ортонормированными базисами. Тогда в силу B) закон преобразования компонент тензора имеет вид а,ч-л у CT*i .^ст'1 .Ст'«а*1"-Ч C) Jl---Jq / J Ъ\ 1р Jl Jq l\...lq V / k\ ,...,kp Здесь нарушились правила тензорной символики: индексы ii,...,ip в левой части равенства верхние, а в правой — нижние. Кроме того, пришлось написать знак ^, так как индексы суммирования fci, ...,kp оказались все сверху. Это признаки того, что равенство не является инвариантным (оно верно только в ортонормированных базисах). Формула C) показывает, что, ограничиваясь ортонормированны- ортонормированными базисами, мы уничтожаем различие между верхними и нижними индексами: и тем, и другим в законе преобразования соответствуют одинаковые множители. Заметим еще, что в силу A) в ортонормированном базисе совпада- совпадают компоненты тензоров, отличающихся друг от друга на поднятие или опускание индекса. Мы отмечали это в гл. VII для векторов, при- присоединенных к линейным функциям, и для преобразований, присоеди- присоединенных к билинейным функциям. Это легко проверяется и в любом случае. Мы имеем, например, аци — 9jia'tk = а1к-> так как в сУмме по I отлично от нуля только то слагаемое, где I = j, а в нем ди = 1. Из сказанного следует, что, ограничиваясь ортонормированными базисами, мы можем отождествить все тензоры, которые отличаются друг от друга поднятием или опусканием индекса. Точнее говоря, все тензоры, имеющие в ортонормированных базисах одинаковые компо- компоненты, мы объединяем в один класс и рассматриваем этот класс как некоторый новый объект — евклидов тензор. Определение. В евклидовом пространстве размерности п за- задан евклидов тензор валентности s, если каждому ортонормирован- ортонормированному базису сопоставлена s-мерная матрица порядка п. При этом ка- каковы бы ни были ортонормированные базисы е и е;, элементы 0^...^ и a'k k соответствующих матриц связаны соотношением Все индексы у евклидовых тензоров равноправны, и мы пишем их внизу. По повторяющимся индексам, как всегда, производится сум- суммирование. 18*
276 Гл. IX. Основы тензорной алгебры Числовые величины, не меняющиеся при переходе от одного ор- тонормированного базиса к другому, в гл. VIII были названы ортого- ортогональными (или евклидовыми) инвариантами. Теперь мы видим, что это — евклидовы тензоры валентности 0. Компоненты евклидова тензора в неортонормированных базисах не определены. Однако для каждого евклидова тензора валентности s можно определить эти компоненты так, чтобы получился тензор лю- любого типа (p,q), где р + q = s. Для этого их нужно найти, исходя из компонент евклидова тензора в ортонормированном базисе, при по- помощи закона преобразования компонент тензора типа (p,q). Таким образом, каждый евклидов тензор порождается любым тензором из некоторого класса тензоров. Ясно, что все тензоры этого класса отли- отличаются друг от друга поднятием или опусканием индексов. Рассмотрим вектор евклидова пространства и присоединенную к нему линейную функцию. В ортонормированном базисе их компо- компоненты совпадают, а в неортонормированном — различаются. В этом случае компоненты линейной функции называются ковариантными координатами евклидова вектора, определяемого рассматриваемым вектором. Это — координаты вектора в биортогональном базисе. Важным примером евклидова тензора является так называемый дискриминантный тензор, определяемый для некоторого ортонорми- рованного базиса равенством (где N — число нарушений порядка в соответствующей перестанов- перестановке), если все индексы различны, и е^..лп = 0 в противном случае. Как мы видели в упр. 3 § 1, компоненты такого тензора преобразуются по формуле е[г in = ?гг..лп det?, что в случае ортогональной матри- матрицы перехода дает г[г in = ±?^1#.^та — компоненты дискриминантного тензора одинаковы во всех ортонормированных базисах одной ориен- ориентации с исходным и отличаются только знаком в базисах противо- противоположной ориентации. Для неортонормированных базисов дискрими- дискриминантный тензор доопределяется как тензор типа @,п). Для евклидовых тензоров определены все тензорные операции, вве- введенные для тензоров в § 1. Определения, а также формулировки и доказательства свойств этих операций были бы почти дословным по- повторением сказанного, и мы не приводим их. Заметим только, что для евклидовых тензоров свертывание возможно по любой паре паре ин- индексов, и транспонировать, симметрировать и альтернировать можно по любому множеству индексов. Например, если, ограничиваясь ор- тонормированными базисами, мы отождествим квадратичную форму с присоединенным к ней линейным преобразованием, то полученный новый объект — евклидов тензор валентности 2 — будет иметь ин- инвариантную свертку (как линейное преобразование) и инвариантно будет удовлетворять условию симметрии о.ц — oiji (как квадратич-
§3. Поливекторы. Внешние формы 277 ная форма). Инвариантность здесь подразумевается, конечно, только относительно замены одного ортонормированного базиса другим ор- тонормированным. Упражнения 1. В базисе е метрический тензор задан матрицей Г, а тензор aij мат- матрицей А: Г = 1 1 1 2 А = 3 4 5 7 Найдите матрицы В, С и D тензоров akj, а^ и а-7'*5. 2. Можно заметить, что в упр. 1 детерминанты матриц А, В, С и D совпадают, и следы В и С одинаковы. Объясните это. 3. Упростите выражение (S™arijgjk + б{а%дш)дк8 + a^k]gjkgis. § 3. Поливекторы. Внешние формы 1. р -векторы. Этот параграф посвящен изучению двух специ- специальных классов тензоров, важных для приложений. Определение. Антисимметричный по всем индексам тензор типа (р, 0) называется р-вектором или поливектором, если р не уточ- уточняется. 2-векторы принято называть бивекторами. Антисимметричный по всем индексам тензор типа @, q) называ- называется q-формой или внешней формой, если q не уточняется. Число q называется порядком или степенью внешней формы. Тензоры типов A,0) и @,1) по определению считают 1-вектором и 1-формой. Внешние формы пространства «if можно рассматривать как по- поливекторы в сопряженном пространстве «if*. Поэтому свойства этих двух классов тензоров одинаковы. В начале мы будем говорить в ос- основном о поливекторах. Заметим, прежде всего, что при р > п существует только нуле- нулевой р-вектор. Действительно, из р индексов, принимающих значе- значения 1,...,п, в каждой компоненте хотя бы два должны иметь оди- одинаковые значения. Как отмечалось в § 1, из антисимметрии следует, что каждая компонента такого тензора равна нулю. При р — п могут быть отличны от нуля только те компоненты, у которых значения индексов составляют перестановку чисел 1,...,п (иначе снова окажутся два равных индекса). Все такие компоненты по предложению 7 § 1 выражаются через одну из них по формуле р-вектор аг1"Лр называется простым или разложимым, если он представим как произведение р\ на альтернированное произведе- произведение векторов, т. е. найдутся такие векторы х\,...,хр с координата-
278 Гл. IX. Основы тензорной алгебры МИ ЧТО а B) Пример 1. Пусть f и?|г — два вектора в трехмерном простран- пространстве. Они определяют простой бивектор с компонентами О О i_OO i_OO Q1 i_ О 1 i_1O 1 о i_ 1 О i_O1 / \ а23 = $У -$У, а31 = $У -$У, а12 = ^г]2 - fV; C) а32, а13 и а21 отличаются знаком от этих, а а11 = а22 = а33 = 0. Выражения C) напоминают о векторном произведении. И дейст- действительно, если пространство евклидово, рассмотрим свертку с дис- криминантным тензором Sijk^V^- Выпишем первую компоненту это- этого ковектора в правом ортонормированном базисе. Если г = 1, то в сумме только два ненулевых слагаемых j = 2, к = 3 и j = 3, к = 2. 2^=а23. Аналогично подсчитываются и остальные компоненты. Поднятие ин- индекса у этого ковектора дает вектор который и является векторным произведением. Это видно из выра- выражения его компонент в ортонормированном базисе. Предложение 1. Каждый п-вектор является простым. Действительно, пусть дан произвольный n-вектор аг1"Лп. Возь- Возьмем какой-нибудь ненулевой простой n-вектор CЪ1--Лп = n!?i...?n и обозначим отношение al'"n/J3l'"n через Л. Из формулы A) следу- следует, что для всех компонент а J г1"Лп = = Х/Зг1"Лп. Положив пг = мы имеем а г1"Лп = n! ...Сп , как и требовалось. Рассмотрим р векторов xi, ...,xp и составим матрицу из их коор- координатных столбцов: D) Вычислим минор этой матрицы, расположенный в строках с номера- номерами i\ < %2 < ... < ip, по формуле полного разложения dh...iP= ^^ Сравнивая это выражение с B), мы находим те компоненты просто- простого р-вектора, у которых значения всех индексов попарно различны и расположены в порядке возрастания (существенные компоненты): ah...ip =pi^...^p] =dil-i^. E) Остальные компоненты вычисляются по уже найденным из свойства антисимметрии.
§3. Поливекторы. Внешние формы 279 В частности, для n-вектора имеем а1'1 = det ||?j|| (пример 16 §1). Вспомним формулу B1) § 1 гл. VII. Из нее видно, что если прост- пространство евклидово, а базис положительный ортонормированный, то компонента al'"n равна объему ориентированного параллелепипеда, построенного на векторах, составляющих данный п-вектор. Из формулы E) следует, что простой р-вектор является нулевым тогда и только тогда, когда составляющие его векторы линейно зави- зависимы, т. е. ранг матрицы D) меньше р. 2. Относительные инварианты. Любой n-вектор в каждом ба- базисе вполне характеризуется одним числом — его существенной ком- компонентой а1 •••п. Попробуем найти закон преобразования этого числа при замене базиса без участия других компонент n-вектора. Мы по- получим или, согласно формуле полного разложения, а'1-71 = (det S-V"n = (det S^a1-71. F) Мы видим, что соответствие, относящее каждому базису существен- существенную компоненту n-вектора, определяет геометрический объект с од- одной компонентой и законом преобразования F). Этот объект не тен- тензор, так как тензор с одной компонентой должен иметь тип @,0) и, следовательно, быть инвариантом. Другой пример объекта такого рода дает детерминант матрицы из компонент тензора типа @,2). Эта матрица В при замене базиса преобразуется, как известно, в матрицу В' = STBS, и det Б' = (det SJ det В. Определение. В линейном пространстве задан относительный инвариант веса г, если каждому базису сопоставлено число так, что числа, соответствующие базисам е и е' = е5, связаны равенством а'= (det S)rа. G) Инвариант, или, как говорят, чтобы подчеркнуть отличие от относительного инварианта, абсолютный инвариант, является отно- относительным инвариантом веса 0. Аналогично формуле F) можно показать, что существенная ком- компонента n-формы является относительным инвариантом веса 1. Отметим следующие свойства алгебраических операций с относи- относительными инвариантами. Предложение 2. Если а и Ъ — относительные инварианты одного и того же веса г, то их сумма — относительный инвариант веса г. Если а и Ъ — относительные инварианты весов га и г&, то их произведение — относительный инвариант веса га + г&.
280 Гл. IX. Основы тензорной алгебры Если а — относительный инвариант веса г, то его р-я степень — относительный инвариант веса рг. Все три утверждения легко доказываются непосредственной про- проверкой закона преобразования, и мы предоставим читателю написать доказательство. Подчеркнем, что сумма относительных инвариантов разных весов не является относительным инвариантом. Относительный инвариант называют также плотностью. Объект, получаемый умножением тензора на относительный инвариант, назы- называется тензорной плотностью. Напишите закон преобразования ком- компонент такого объекта. 3. Внешние формы, g-формы чаще всего представляют интерес как полилинейные функции от q векторов (пример 8 § 1). Для такой функции антисимметрия означает, что ее значение меняет знак, если поменять местами какие-нибудь два ее аргумента. Например, функ- функция, сопоставляющая трем векторам трехмерного евклидова прост- пространства их смешанное произведение, является 3-формой. Значение g-формы и; с компонентами и^..лч на векторах xi,...,xq с компонентами ^i1,...,^9 равно Uj{xU...,Xq) =CJil...ig^1...^. Учтем, что равны нулю те слагаемые, в которых хотя бы два индекса суммирования имеют одинаковые значения, а остальные слагаемые сгруппируем. Пусть числа ii,...,ig расположены в порядке возраста- возрастания, a ikt,...,ikq — их перестановка. Тогда группу из q\ слагаемых, в которых индексы суммирования (в каком бы то ни было порядке) равны ii, ..i Поэтому w(Xl,...,xq)=q\ Y, "h-i^-Q^ J2 ^...i/1-1*, (8) ii<...<iq ii<...<iq где сг1"Лд = #!?i...?g • В сумму (8) входят только существенные компоненты внешней формы — те, у которых индексы расположены в порядке возрастания. Итак, мы имеем Предложение 3. Значение q-формы на векторах xi,...,xq яв- является линейным однородным многочленом от компонент простого q-вектора, ими определяемого. Для фиксированного q линейная комбинация g-форм также являет- является g-формой. Поэтому при каждом q множество g-форм — линейное пространство. Аналогично, линейным пространством является мно- множество всех g-векторов. Из формулы (8) следует, что эти два про- пространства сопряжены одно другому.
§3. Поливекторы. Внешние формы 281 Построим базис пространства g-форм. Для этого рассмотрим базис е пространства «if и его биортогональный базис р1, ...,рп в про- пространстве «if*. 1-форма рг имеет компоненты 6гк. Компоненты произ- произведения q различных 1-форм рп ® ... ® plq [i\ < ... < iq) равны 6гк ...6г^ . Одна из них, та, для которой к\ = ц при всех I = l,...,g, равна 1, а остальные равны нулю. Альтернируем это произведение. Полученный при этом тензор имеет компоненты Й1---<^91, т. е. 1/д!, если индексы ki,...,kq — чет- четная перестановка чисел ii,...,ig, (—l/q\) если перестановка нечетная, и 0, если набор нижних индексов не совпадает с набором верхних. Введем обобщенный символ Кронекера 6k1...kq ~ ^[fci •"%]> ki,...,kq —четная перестановка ii,...,ig, ki,...,kq —нечетная перестановка ii,...,ig, (9) в остальных случаях. Обобщенный символ Кронекера антисимметричен также и по верх- верхним индексам. Действительно, как легко видеть, Si1'? = qlS^1 ...Slq. Обозначим через e11'* g-форму с компонентами 8г^"л^ . Предложение 4. Система q-форм ег1"Лд для всевозможных на- наборов %i < ... < iq является базисом в пространстве q-форм. Доказательство. Пусть и^..лч — компоненты д'-формысс;. Рас- Рассмотрим линейную комбинацию Найдем компоненту в^—н для пРоизвольного набора ji < ... < jq: так как в сумме только одно ненулевое слагаемое. Итак, в = uj и произвольная форма uj раскладывается по системе ег1"Лд. Линейная независимость этой системы форм следует из того, что одна и только одна из существенных компонент такой формы равна 1, а остальные равны нулю. Следствие. Размерность пространства q-форм п-мерного ли- линейного пространства равна числу сочетаний СД. 4. Внешнее умножение. Как для поливекторов, так и для внеш- внешних форм определена операция внешнего умножения. В обоих случа- случаях операция определяется одинаково и имеет одни и те же свойства. Обычно она употребляется для внешних форм.
282 Гл. IX. Основы тензорной алгебры Определение. Пусть даны внешние формы ио и в степеней р и q. Обозначим через [и, 6] внешнюю форму степени p + q, равную тензорному произведению ио и 0, альтернированному по всем индек- индексам. Внешним произведением форм ио и в называется (р + д)-форма ио Ав = - Пример 2. Если ио1 и ио2 — линейные формы с компонентами uj\ 2 1 2 рр и о;2, то uj1 /\uj2 имеет компоненты Это билинейная функция с кососимметричной матрицей. Тензорное умножение дистрибутивно по отношению к сложению, а результат альтернирования суммы равен сумме альтернированных слагаемых. Поэтому внешнее умножение дистрибутивно по отноше- отношению к сложению: для любых форм в1, в2 одной степени и любой фор- Легко видеть, что умножение внешнего произведения на число равносильно умножению на это число любого из сомножителей. Рассмотрим три внешние формы о;1, о;2 и ио3 степеней р, q и г и произведение {ио1 /\ио2) Л ссА Компоненты [[о;1, о;2], о;3] равны ш}иЛ i и2- ¦ ЛиЛл к ] = ujh ¦ иЛл а иЛл к 1, A0) [[l\...lp Jl---Jq\ Kl...Kr\ [l\...lp Jl-..Jq ftl...ftrj' V / так как в силу предложения 7 § 1 внутреннее альтернирование да- дает (р + q)\ одинаковых членов. Понять, что здесь происходит, проще всего на таком примере. Пусть ср и ф суть 1-формы, а ио — 2-форма. Тогда компоненты формы [[<?,?/>],о;] равны Так как второе слагаемое антисимметрично по всем индексам, оно отличается знаком от первого, и внутреннее альтернирование может быть пропущено: Точно так же внутреннее альтернирование можно пропустить и при вычислении компонент [о;1, [о;2,о;3]]. Вместе с A0) это дает Сравним множители, которые надо добавить, чтобы получить внеш- внешние произведения. Они одинаковы: (p + g + r)! (p + g)! _ (p + g + r)! (g + r)! (p + q)\r\ p\q\ (q-\-r)\p\ q\r\ Из сказанного следует ассоциативность внешнего умножения и1 Л (и2 Л и3) = (и1 Л и2) Л и3.
§3. Поливекторы. Внешние формы 283 Это позволяет нам говорить о внешнем произведении любого числа внешних форм без упоминания о расстановке скобок. В частности, базис в пространстве g-форм, построенный в предложении 4, состоит из внешних произведений ^l\...lq __ l\ д ^ д lq Заметим в качестве еще одного примера, что простой р-вектор, образованный векторами х\,...,хр, есть их внешнее произведение. Исследуем перестановочность внешнего умножения. Пусть в — р-форма, a uj — g-форма, и каждая из них разложена по соответствую- соответствующему базису. Вычисляя 0 Аи, мы воспользуемся дистрибутивностью и получим сумму V V 0h i uh j ph Л...Лр^ Лрл Л...Лр^. A1) ii<...<ip ji<...<jq При вычислении и А в возникнет аналогичная сумма: i Числовые коэффициенты, разумеется, перестановочны, и вопрос сво- сводится к возможности переставить базисные 1-формы во внешнем про- произведении рп А ... Л р1р Л pJ1 Л ... Л pJg. Рассмотрим компоненту этого произведения с произвольным набором индексов k\, ...,kp+q. Она рав- на h...ipji...jq к\... kp-\-q Сравним эту компоненту с соответствующей компонентой другого произведения sji...jqh...ip к\... kp+q Мы должны переставить каждый из р индексов г через q индек- индексов j. Так как обобщенный символ Кронекера антисимметричен по верхним индексам, это вызовет умножение компоненты на (—l)pq. Все слагаемые в A1) и A2) отличаются на этот множитель, и потому в А и; = (-l)pqu;A0. A3) Отсюда следует Предложение 5. При внешнем умножении внешние формы ком- коммутативны, если хотя бы одна из них четного порядка, и антиком- мутативны, если оба порядка нечетные. Упражнения 1. Функция от двух векторов в трехмерном евклидовом векторном пространстве сопоставляет любым двум векторам х и у смешанное произ- произведение (а, х,у), где а — фиксированный вектор. Докажите, что эта функ- функция — 2-форма. Выразите ее матрицу в заданном базисе е через координа- координаты вектора а.
284 Гл. IX. Основы тензорной алгебры 2. Пусть ^l1,..., ^ — линейно независимые векторы в n-мерном линей- линейном пространстве. Докажите, что бивекторы Zq^y для всех к < I состав- составляют базис в пространстве бивекторов пространства j?f. 3. Пусть Ж1, ...,хр — базис подпространства ??' С j?f. Назовем направ- направляющим р-вектором подпространства w = х\ Л ... Л хр. Докажите, что: а) вектор у лежит в Л? тогда и только тогда, когда у Л w = 0; б) любые два направляющихр-вектора подпространства^' отличаются один от другого на числовой множитель; в) если пространство евклидово, этот множитель равен отношению объемов ориентированных параллелепипедов, построенных на соответст- соответствующих базисах.
УКАЗАНИЯ И ОТВЕТЫ К УПРАЖНЕНИЯМ ОБЩИЕ ЗАМЕЧАНИЯ В конце каждого параграфа приведены упражнения, относящиеся к ма- материалу данного параграфа. Решая их, надо иметь в виду, что получение верного ответа необходимо, но не оно является основной целью. Эта цель — посмотреть на конкретные частные случаи общих фактов, поупражняться в применении методов, изложенных в соответствующем параграфе. Поэтому не все предлагаемые способы решения одинаково полезны. Часто встречается тенденция решать задачи не теми методами, которые в данный момент изучаются, например, в начале изучения аналитической геометрии студент бывает склонен решать предложенные ему задачи мето- методами элементарной геометрии. Это бессмысленно: элементарная геометрия уже изучена, сейчас нужно овладеть новым материалом. Иногда есть возможность догадаться, каков должен быть ответ, а за- затем проверить свою догадку. Это, конечно, прекрасно, но мало чему учит. Сделав это, подумайте, как бы вы стали решать, если бы вам не удалось догадаться. Как правило, решение задач не требует длительных рассуждений или громоздких вычислений. Если найденный вами способ решения трудоемок, посмотрите, нельзя ли сделать задачу иначе. В некоторых упражнениях указания приведены для того, чтобы обратить внимание читателя на тот путь решения, который кажется автору предпочтительным. В любом слу- случае перед тем, как окончательно остановиться на определенном способе решения, полезно сравнить его с другими возможными способами. После того как решение получено, подумайте, нельзя ли получить его проще. Ответы ко всем упражнениям приведены, но в жизни приходится ре- решать задачи без готовых ответов, и потому полезно выработать в себе при- привычку делать проверку. Там, где это возможно, следует подставить полу- полученный ответ в условие задачи и убедиться, что он удовлетворяет условию. Это, однако, не гарантирует, что найдены все возможные решения задачи. Если полная проверка невозможна, то следует проделать частичную про- проверку: удовлетворяет ли полученное решение хотя бы части условий задачи и естественным требованиям, которым оно необходимо должно удовлетво- удовлетворять (скажем, является ли вычисленная длина положительной)? Сколько решений должна иметь задача из общих соображений? Совпадает ли раз- размерность найденной величины с размерностью искомой? Верна ли найден- найденная общая формула в простейших частных случаях? Важно обратить внимание на обоснованность ответа. Особенно это отно- относится к задачам на доказательство, которые можно рассматривать как за- задачи с готовым ответом. Не каждый текст, заканчивающийся словами "что
286 Указания и ответы к упражнениям и требовалось доказать", является доказательством. Здесь трудно дать об- общие рекомендации, однако, закончив доказательство, задайте себе два во- вопроса: положились бы вы на это рассуждение, если бы от его результата зависело что-то очень важное для вас, или потребовали бы дополнитель- дополнительных гарантий? Если бы кто-то привел вам это доказательство, то что бы вы возразили? Часто ошибка в рассуждении находится там, где написано "очевидно". Вы в этом уверены, но на чем основывается эта уверенность? Очевидные вещи тем и хороши, что их легко доказать. Если нет полной ясности, то копайтесь, пока ее не будет. Приведенные ниже указания к задачам иногда имеют форму утверж- утверждения. На такое утверждение надо смотреть как на вспомогательный ре- результат, который еще нужно проверить. УКАЗАНИЯ Гл ава I 4. Если такая точка существует, то РА + РВ + PC = ЗРО для любой точки Р. §4 3. Разложите а по сторонам треугольника. Проекция линейной комби- комбинации равна линейной комбинации (с теми же коэффициентами) проекций этих же векторов. 5. Заметьте, что ([а, Ь], [а, с]) = (а, [Ь, [а, с]]). Далее можно применить формулу двойного векторного произведения. Это преобразование бывает полезно и в других случаях. Глава II §2 5. Если два данных вектора не коллинеарны, то часто бывает удобно использовать базис, составленный из этих векторов и их векторного про- произведения. §з 2. Если умножить уравнение на его свободный член, то свободный член полученного уравнения будет положителен. Глава III §1 2. Члены второй степени составляют квадрат двучлена Зх — 4у. Мы не можем положить у' = Зх — 4у, х' = ж, так как при этом мы перейдем к не- непрямоугольной системе координат. Но замена у' = (—Зх + 4?/)/5, х = Dж + Зу)/Ъ переводит прямоугольную систему в прямоугольную. 5. Так как базисные векторы равны по длине, векторы ei + е2 и ei — e2 взаимно перпендикулярны. Удобно выбрать оси декартовой прямоугольной системы координат направленными вдоль этих векторов.
Указания и ответы к упражнениям 287 §2 2. Факт очевиден, если использовать результат упр. 3. Но попробуйте доказать это непосредственно. 5. Непосредственный подсчет не сложен, но можно ввести декартову прямоугольную систему координат, оси которой направлены вдоль радиу- радиусов, и сослаться на результат упр. 6 § 1. 6. Проведите касательную к параболе, параллельную данной прямой. §з 6. Посмотрите на упр. 4. §4 1. Следует различать два случая: когда пересечение есть прямая, и когда оно — пара совпавших прямых. 5. Решение. Уравнением линии пересечения является система Ъх2 - Зу2 + 4z2 = 0, -х2 + у2 - z2 = 1. Если мы исключим z (т. е. найдем его из второго уравнения и подставим в первое), то получим уравнение х2 + у2 = 4. Это уравнение — следствие системы, и потому определяет множество, содержащее линию пересечения. Так как в уравнение не входит z, это множество — цилиндр с образующи- образующими, параллельными ез. Пересекая цилиндр плоскостью z = 0, мы получаем окружность с уравнением z = 0, х2 + у2 = 4, на которой лежит проекция. Однако проекция не совпадает с окружностью. Исключая z, мы должны бы- были запомнить условие z2 = — 1 — х + у2 ^ 0. Итак, проекция — две дуги окружности: х + у2 = 4, у2 — х2 ^ 1 на плоскости z = 0. 6. Гипербола не умещается в полуплоскости. Глава IV §2 8. Посмотрите, во что переходят начало координат и базисные векторы. 9. Множество образов всех точек при линейном неаффинном преобра- преобразовании — прямая линия или точка. 11. Гомотетия с центром в точке пересечения медиан. §з 1. Преобразуйте плоскость так, чтобы две из прямых перешли в оси координат. 3. Искомые направления совпадают с теми, о которых идет речь в пред- предложении 7. 4. Обратите внимание на то, что прямая, имеющая единственную общую точку с параболой или гиперболой, не обязательно является каса- касательной. Глава V §з 3. б) Коэффициенты разложения те же, что и в упрощенной матрице. 4. Что означает теорема о базисном миноре при Rg A = 1?
288 Указания и ответы к упражнениям 5. Элементарными преобразованиями строк обратите в нулевые все строки, кроме отмеченных. 6. Оцените ранги матриц §4 5. Индукция. Разложите детерминант по столбцу, не пересекающему подматрицу. 6. При произвольном п индукция по к. Разложите по первому столбцу. 8. Используйте результат задачи 7, а). 9. Пусть общий корень t. Умножим первый столбец на ?3, второй — на ?2, третий — на t и все прибавим к четвертому столбцу. §6 4. Используйте упр. 3, б) из §3 и способ построения матрицы (8) из §6 . Глава VI §2 2. Вектор с координатами ?*, ?2, ?3, ?4 принадлежит j?f' тогда и только тогда, когда совместна система уравнений с неизвестными а и C: 1 2 3 4 + Р 5 6 7 8 е е е 4. Для нахождения линейных зависимостей между векторами можно привести матрицу из их координатных столбцов к упрощенному виду с помощью элементарных преобразований строк. Находим, что ai, a<i и Ь\ линейно независимы, а hi = —а\ a<i + ЪЬ\. Поэтому z = а\ — a<i = 4(&2 — 4 4 —36i) принадлежит J?' П J?". §4 3. В инвариантном подпространстве нечетной размерности найдется собственный вектор. 8. 7~2 = Е. Отсюда следует, что Л2 = 1. 9. А'1 АВА = В А. 10. Воспользуйтесь теоремой 4. 6. Если В — матрица билинейной функции, то В? = 0 — система урав- уравнений ее нуль-пространства (см. упр. 5). Пересечение нуль-пространств всех форм задается системой D^ = 0. Поместим в этом пересечении по- последние п — к базисных векторов. 7. Если АТА? = 0, то ?тАтА% = (А?)Т(А%) = 0, и потому А? = 0. 8. Найдется верхняя треугольная матрица S такая, что STBS = Е (см. доказательство критерия Сильвестра). 9. Пусть k(xi) > 0, а к(жг) < 0. Рассмотрим многочлен k(tx\ + Ж2) от переменной t.
Указания и ответы к упражнениям 289 Глава VII §1 4. б) Если вы нашли такую матрицу, то постарайтесь с ее помощью по- построить матрицу такого типа вдвое большего порядка. Что это за матрицы для п = 1 и п = 2? 5. R = QTA. §2 6. Чтобы найти инвариантные подпространства, представьте характе- характеристический многочлен Л4 + 1 как (Л2 + л/2Х + 1)(Л2 — у/2 А + 1) и восполь- воспользуйтесь предложением 8 §4 гл. VI. Второе подпространство — ортогональ- ортогональное дополнение первого. §з 7. См. задачу 9. §4 3. Преобразование унитарного пространства, имеющее такую матрицу в ортонормированном базисе, является унитарным. Глава VIII §2 2. R = 4, г = 2. Малая квадратичная форма не является ни положитель- положительно, ни отрицательно полуопределенной. ОТВЕТЫ Гл ава I §1 1. \ВС\/\СА\ =А/A-А). 2. Ж7A,1/2). 3.E,-3). 4. Точка пересечения медиан: АО = -(АВ + АС). о §2 1.A,1). 2. D(xi-x2 + ж3, У1-У2 + уз). 4. х = г cos 9? cos #; у = rsincp cos в] z = г sin #. §з 1. а = ас/, ж = ах' + <зд. Координаты уменьшаются вдвое. 2.х = 1(-х' + у' + 1), г/ = -i(x' + у' - 1). 3. О' — противоположная О вершина параллелепипеда, построенного на базисных векторах. Концы соответствующих базисных векторов совпа- совпадают. §4 3. C/2)а. 5. cos# = (cos а - cos/3 cos 7)/(sin/3 sin 7). 6. -12л/2. 19 Д.В. Беклемишев
290 Указания и ответы к упражнениям 7. Необходимо и достаточно, чтобы детерминант матрицы был положи- положителен. 8. (см). Глава II 0 0 Q Q 0 0 0 1.x + у =4. 3. ж + ху + у — х — у = 0. 4.x +у = 4z . §2 1. х = 2 - 2t, у = 2 +1, z = t. 2. x = l + 2ti- 3t2, у = tu z = t2. 3. B, 0, 2), ti = -1, t2 = 1. 4. Зж - 2j/ - 5^ + 4 = 0. ч [a, bl ч 5.a)r = L^J+te; 6)r § 3 1. O(-8,1), r = 4. 2. (AiA2 + B1B2)C1C2 < 0. 3. ж = 8t, у = 65t, ^ = 491 4. Oi@,2,1), n = л/2; О2@, |, i), r2 = ^. 5 40 (ao,aba2) Глава III о ]_ - ?/2 _ 2 /. / _ 4^ + 3^ + 1 , _ . у — ix , x — , у — 5 5 3. Возможны: пары пересекающихся, параллельных и совпавших пря- прямых. 4. А = С, В = О, D2 + Е2 > AF. 5. Эллипс с полуосями 4л/2 и Зл/2. §2 3. Для эллипса, параболы и ближайшей к фокусу ветви гиперболы г = = р/A — еcos9?). Для второй ветви гиперболы г = — р/A + еcos9?). 5. Дг + ^. 6. 2л/2. а Ь 8. Прямая соединяет точки касания касательных, проведенных к линии из данной точки. § 3 4. О( --,-); Зж + ?/ + 1 = 0, ж + 3г/ - 1 = 0. 5. Пара пересекающихся прямых. 7. х - Зу + 3 = 0.
Указания и ответы к упражнениям 291 §4 2. а) Однополостный гиперболоид х2 + у2 — 2z2 + 4z = 4; б) конус х2 + у2 = 2{z — 2J. 3. Для гиперболического параболоида, заданного каноническим уравне- уравнением, нормальные векторы плоскостей niF, а, 0) и пг(—Ь, а,0). Глава IV §1 1. б) Да; в) нет. 2. (fgh) = h^g"^- 3. ж* = 5 - у, у* = 5 - х. §2 I. а) Да. б) нет. 2. Прямая у = 3. 4. A,1). 6. Свободные члены заменятся на нуль. 7. а) х* = &2Ж + «22/ + С2\ б) ж* = а\х + 26i2/ + СЬ У* = ^ж + ai2/ + ci; г/* = -сад + 622/ + -сг. 8. у = xtg-. 9. Нет. 10. В любом случае — векторы, коллинеарные е2, при а + Ъ / 0 еще и коллинеарные (а + 6, —1). II. ж =--ж, 2/ =-2?/- 12. Осевая симметрия относительно у = — xtg —. §3 1. 1/3. 3. Векторы, коллинеарные вектору: а) аC, 2); б) Ь(—2,3). Соответст- Соответствующие растяжения: а) 2л/26; б) л/26- 6. а) Ось одной симметрии перпендикулярна а, ось другой получена из нее параллельным переносом на A/2)а. б) Оси обеих симметрии проходят через О, ось второй получена пово- поворотом оси первой на угол (р/2. 7. gf, где f: {х* = ж, у* = \у - a}, g: {х* = ж, у* = у + а}; f — сжатие к прямой у = —а/A — Л). Гл ава V §1 1 3 1. а) ; б) 9; в) 48, не считая ее самой. 2. а) Нет; б) да; в) да; г) нет; 3. 2В. 4. D = C - 2А)А - A + Х)В + АС, А произвольно. 5. а) Нет; б) нет. 6. Нет, а = 2Ь - с. §2 2. а) Да; б) нет. 4. а) Нет. б) да. 19*
292 Указания и ответы к упражнениям 5. а) Матрице (-Е) отвечает центральная симметрия, а / — поворот на тг/2; h , где аиЬ/0 произвольны. 7. 8. -(а 1 -1 0 а 2 + 1) 0 3 -1 /ь 0 -2 1 —а 1 0 0 0 1 0 0 1 1 1 0 0 О 1 О О 0 1/2 1 О О О 1 1 О 0 1 1 О О О 1 О 0 0 2 1 1 0 0 1 1 0 0 1 §3 1. a) Rg A = 2, базисная подматрица, например, = 2||4 = 2 1 2 3 5 1 4 7 г) 9 — все квадратные подматрицы второго порядка. 2. а) Ранг не больше двух; б) Ранг не больше п/2. 3. а) 1 0 0 0 1 0 -1 2 0 -2 3 0 -3 4 0 ; б) 5 7 9 = -3 1 3 5 + 4 2 4 6 1. andetA. 4. 46. 7. б) 6 = detA, jfe = ^(-1 и элемента а^ матрицы А. 8. (Зп + 1)/2. 10. 10. j, где с^- — дополнительный минор 2. -6с -с d -Ь 3. 6. -1 1 0 -1 1 0 -1 0 1 + с . 4. 1 -2 1 -Б Еп-Г §6 5. а) Не существует; б) АТ
Указания и ответы к упражнениям 293 Глава VI §1 2. п(п + 1)/2. За базис можно принять матрицы Ец (г базиса пространства квадратных матриц порядка п. j) стандартного 3. 1 0 0 0 —а 1 0 0 az -2a 1 0 -a° 3a2 -3a 1 = р(а) +p'(a)(t - а) + - 2 - аJ + V 6 ~ аK (штрих обо- значает дифференцирование по t). 4. /i раскладывается по е\\ fi раскладывается по ei,e2; /з раскладыва- раскладывается по ei, в2, ез; ...; /n-i раскладывается по ei, ..., en-i- 5. Ориентированы одинаково. §2 1. Например, ai,a2. Например, линейная оболочка векторов ез и i а) ai, a2, Ь\\ б) ai — a2. а) Да; б) да; в) нет. 12 0 0 2 4 0 0 3 6 0 0 0 0 12 0 0 2 4 0 0 3 6 1 2 3 0 0 0 §з 2 -1 0 0 0 0 2 -1 0 0 0 1 2 3 Инъективно при RgC = 2. Сюръективным быть не может, а) Нет; б) да. 7. а) Нет; б) да. §4 О О О , где А\ — квадратная подматрица порядка г и ранга г. 7. Для Ai = 7 базис в собственном подпространстве — векторы с ко- координатами || 1 —2 0 ||т и || 0 3 1 ||т. Для Л = —7 собственный вектор с координатами || 2 1 — 3||т. 8. Для Ai = 1 собственное подпространство — множество симметрич- симметричных матриц. Для А2 = —1 собственное подпространство — множество ко- сосимметричных матриц.
294 Указания и ответы к упражнениям 1 -1 0 1 -3 1 0 0 1 , А' = 3 0 0 2 3 0 0 -2 3 11. S = §5 1. а) Нет; б) да, если f (ж) = 0 для всех ж. 2. ||/fy-ag||, г 3. a) (pi = О, г б) ^=0, %ф А;; ^ = (г - 1)...(г - к)а?~к~1, г > А; (г = 1,..., п); 1. а) 2. 1 1 3 -2 4 0 0 0 1 б) §6 113 0 -2400 0 0 10 0 0 0 0 4 8 3 2 5 1 0 1 1 ?/1\2 3. 1 1/2 1/2 1 4. а) (Г1J + (О2 " (ГУ; /Зч2. -1 -1 1 у/2 0 0 -1 -1 1 -3 0 1 -5 1 1 (ГJ-(П2; ^ 5. s = n— Rgb. Последние s строк и последние s столбцов нулевые. 6. Пусть D — матрица, составленная из матриц всех форм, написанных одна под другой. Необходимо и достаточно Rg-D ^ к. 7. а) г; б) 0. 9. к не является ни положительно, ни отрицательно определенной. 10. Миноры четного порядка > 0, а нечетного порядка < 0. 11. Нет. 1. а) 3; б) 6; в) 14. 2. а) А' = А' = 1 0 0 0 1 1 0 1 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 2 0 0 0 0 1 0 0 0 1 2 , 6 = 1 1 1 1 0 || || 0 0 1 1 5 = 1 1 1 0 -1 0 1 0 0 1 1 0 0 0 0 0 1 0 1 0 0 0 0 0 -1 0 2 0 1 0 -1 0 0 0 2 0 -2
Указания и ответы к упражнениям 295 1. а) 2. ill 2 " 3. а) | 5. а) ««= 2 0 2/3 -1 1 0 1 1 Q = - 0 2/3 2/3 0 0 2/5 1-llf, \ 1||т, ||11 К 1 А 1 2 1 1 -2 2 1 Глава ; б) |1 -] 31Г; с , д = л/3 л/2 0 -л/2 -л/3 л/2 §i 2 -2 8/3 L 1 - 5) ||1 1 , R- VII -2 8/3 8/3 -4 -4 32/5 nf, \ -10 1|| 5 7 0 1 л/6 0 0 111 - г. 4. 2л/б л/2 0 ; в) arccos J-. -1 -If. л^ л/3 6. 4л/2. 1. 2 4 О 1 §2 Собственные подпространства А: ||1 — -3|f. Собственные подпространства А*: ||4 — 1||т, ||1 0||т. 3. Или тождественное преобразование, или отражение в подпространст- подпространстве g' : если х = х' + х", ж' G <?', ж7/ G ^/Х, то А(х) = х - х". Если g' = {о}, то А = -Е. 4. а) 2пп\; б) бесконечно много; в) да, в случае б). 5. 5= 4= л/6 6. Поворот на 5тг/4 в плоскости векторов ai, a2 и поворот на тг/4 в плос- плоскости векторов &i,&2- (Углы отсчитываются от а\ к а2 и от 6i к 62.) Коор- Координатные столбцы ai5a2,6i,b2 соответственно -л/3 лД 0 -1 -1 2 л/2 л/2 л/2 , А' = 1 0 0 0 1 0 0 0 4 1 2 1 -л/2 1 0 1 ' 2 -1 0 1 1 ' 2 1 л/2 1 0 1 ' 2 -1 0 1 7. а) 0 1 1 0 о о 0 1 -1 л/8 8. А = л/273 -, лД/З л/2/3 4 л/2 л/2 5 2 0 0 1 /з 2/3 Т7з
296 Указания и ответы к упражнениям 1. 5. 6. 8. (9- S = Да; 5 = Ш2)/8. 2. b% л/6 7. а) 1 л/26 л/3 L л/2 0 -2 л/2 -л/3 (?1J _ (?2 1 -5 1 21 L л/2 J и 2?*< ; к(«) = (»,*). 3. , 4(т71J + ^ б) (ег- - 2^)\ h 3 -1 4(?72J и (?*} (*)= 0 1 + (^ 2 ~ ( 9. Без ограничения на размерность условие только достаточно. При- меР: (^J и (s J- _ §4 _ 1. а) \а\ = 2, |&| = 3, cos(o^b) = C + г)/6, cos(M) = C - 0/6; б) Векторы а и Ь'(—2 — Зг/2, 3/2 — г) ортогональны, 6' = 6 — аа, а = = C"i)/4'i ; /А и самосопряженное, и уни- 4. А = тарное. 1 0 0 -1 1 л/§ г 1 —г 1 ' V51 Глава VIII 1. Х\ Х2 хз Х4 4 -3 0 0 + tl 1 -2 1 0 + ?2 2 -3 0 1 а) Пустое множество или плоскость; б) dimP ^ к\ + &2 — п. §2 1. + (Ч2J " (Г13У = 1, ^ 2. Гиперболический параболоид. 3. —1/2 < а < 0. Глава IX §1 2. а) 64; б) 64. 3* sii,...,in = (~ 1)^(г1'""'гта) det S, если zi,...,zn различны, и 0 в против- противном случае.
Указания и ответы к упражнениям 297 4. Линейное преобразование А(х) = f(x)a имеет матрицу окр. 5. Четыре тензора типа A,1) и два инварианта. §2 С = D = 2. В — матрица преобразования, сопряженного преобразованию с мат- матрицей Ст. Их детерминанты и следы должны быть одинаковы. Остальные детерминанты равны, так как det Г = 1. 3. 2а^вч. §3 . (ei,e2,e3) и -а3 а2 а 0 -а1 —а а 0
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абсцисса 17 Аппликата 17 Базис 16, 160 — биортогональный 37 — жорданов 210 — ортогональный 219 — ортонормированный 19 — положительный 27, 164 — правый 28 — сингулярный 233 — стандартный 162, 165 Бивектор 277 Вектор 9, 10, 245 — коллинеарный 10 — компланарный 10 — направляющий 47 плоскости 47 — нулевой 9, 158 — присоединенный 209 —, абсолютная величина 10 —, высота 208 —, длина 10 —, конец 9 —, модуль 10 —, начало 9 Векторы приложенные 11 — равные 10 — свободные 11 Векторное произведение двойное 37 Векторов линейная комбинация 159 Гипербола 67 —, асимптоты 74 —, вершины 73 —, ветви 73 Гипербола, вещественная полуось 73 —, директрисы 75 Гипербола, каноническое уравне- уравнение 67 —, мнимая полуось 73 Гиперболоид двуполостный 91 — однополостный 90 Гиперплоскость 248 Декартова система координат 17 Детерминант второго порядка 33 Диагональ главная 115 Диаметр 81 Директрисы 71 Изоморфизм 175 — координатный 175 Инвариант 44, 262 — абсолютный 279 — относительный 279 — евклидов 252 — ортогональный 252 Индекс суммирования 120 —, опускание 273 —, поднятие 274 Квадратичная форма 197 , закон инерции 202 , индекс 202 , канонический вид 200 , сигнатура 203 диагонального вида 198 — —, отрицательно определен- определенная 201 — —, положительно определен- определенная 201 Классы аффинные 109 Ковектор 262 Композиция 96 Конус 46 — асимптотический 91 — второго порядка 90 Координаты 17
Предметный указатель 299 Координаты вектора ковариантные 38 — вектора контрвариантные 38 сферические 21 цилиндрические 20 Критерий Сильвестра 203 Линейная комбинация 12, 159 тривиальная 13, 159 — пространство сопряженное 194 Линии центральные 82 Линия алгебраическая на плоскос- плоскости 42 — гиперболического типа 80 — параболического типа 80 — эллиптического типа 80 —, особая точка 85 Массив s-мерный 260 Матрица упрощенная 135 — антисимметричная 116 — верхняя треугольная 116 — вырожденная 127 — Грама 217 — диагональная 116 — жорданова 211 — квадратная 114 — клеточно-треугольная 181 — линейного преобразования 179 — нулевая 116 — обратная 129 — ортогональная 219 — перестановочная 123 — перехода 163 — полуторалинейной функции 204 —, противоположная матрице 117 — прямоугольная 114 — размеров т х п 114 — симметричная 116 — системы 146 расширенная 146 — транспонированная 115 — унитарная 242 — фундаментальная 153 — эрмитова 204, 242 —, главные миноры 203 —, порядок 114 —, ранг 133 Матрица, след 185 —, степень 130 —, характеристические числа 184 Матрица, характеристический многочлен 184 —, характеристическое уравне- уравнение 184 Матрицы равные 114 Метод выделения квадратов 200 — Гаусса 129 — ортогонализации Грама-Шмид- та 221 Минор 140 — базисный 134 — диагональный 205 — дополнительный 141 Многочлен характеристичес- Многочлен характеристический 184 Направление асимптотическое 79 — сопряженное 84 Направления главные 85 — синугулярные 112 Направляющая 45 Начало координат 17 Неизвестные базисные 152 — параметрические 152 Образующая 45 Объем ориентированного паралле- параллелепипеда 29 п-мерного 224 Ограничение 182 Определитель порядка п 137 Ордината 17 Ортогональное дополнение 220 Отображение 95, 171 — взаимно однозначное 97, 175 —, множество значений 172 — нулевое 172 — обратное 177 — ранг 172 — сюръективное 172 — ядром 172 Пара параллельных прямых 68 мнимых 68 — пересекающихся прямых 67 — совпавших прямых 68 Парабола 68 —, вершина 76 —, директриса 76 —, каноническое уравнение 68 —, фокус 76
300 Предметный указатель Параллелепипед ориентирован- ориентированный 29 Параметр 47 Перенос параллельный 246 Пересечение подпространств 167 — ^-мерная 247 Площадь ориентированного парал- параллелограмма 29 Поверхность алгебраическая 42 — вращения 88 Подматрица 115 — дополнительная 140 Подпространство 13 — инвариантное 180 — корневое 208 — линейное 165 — направляющее 247 — собственное 182 Поливектор 277 Полупространство 57 Полюс 19 Полярная ось 19 Полярный угол 19 Преобразование 95, 171 Преобразование аффинное 101, 246 — диагонализуемое 188 — линейное 100, 171 — обратное 98 — ортогональное 99 — присоединенное 243 — сопряженное 225 — тождественное 96 — унитарное 243 — нильпотентное 208 — ортогональное 230 первого рода 111 второго рода 111 , разложение на плоские вра- вращения 232 —, показатель нильпотентности 209 — самосопряженное 226, 242 Преобразования перестановочные 179 Проектирование ортогональное 95 Проекция векторная 26 — ортогональная 221 — скалярная 27 Произведение векторное 31 — внешнее 282 — линейного отображения на чис- число 177 Произведение линейных отображе- отображений 177 — матриц 116 — скалярное 24, 240 — смешанное 30 — тензора на тензор 265 Пространства аффинные изоморф- изоморфные 246 Пространство линейное вещест- вещественное 158 комплексное 158 — арифметическое п-мерное 162 — аффинное п-мерное 245 — бесконечномерное 162 — векторное 13 — векторов 245 — вещественное линейное ориен- ориентированное 164 — евклидово 215 комплексное 240 точечное 247 — ориентированное 28 —, размерность 161 — унитарное 240 — эрмитово 240 Прямая ориентированая 27 Пучок плоскостей 63 — прямых 62 Радиус 19 Радиус-вектор 17 Разложение полярное 232 — сингулярное 234 Разность векторов 12 Ранг квадратичной формы 201 Расстояние 247 Решение тривиальное 152 Свертка 267 Связка плоскостей 63 Сжатие к прямой 96 Символ Кронекера 262 — обобщенный 281 Сингулярные числа 233 Система векторов линейно зави- зависимая 13, 160 независимая 13, 159 — каноническая 67 — координат декартова 247 прямоугольная 19 полярная 19 — линейных уравнений 146
Предметный указатель 301 Система линейных уравнений од- однородная 146 приведенная 152 — решений нормальная фундамен- фундаментальная 154 Сложение 158 Собственное значение 182 Собственный вектор 183 Спираль Архимедова 64 Столбец высоты т 114 Строка длины п 114 Сумма векторов 11 — матриц 116 — подпространств 167 прямая 168 Тензор 261 — антисимметричный по паре ин- индексов 271 — дискриминантный 276 — евклидов 275 — метрический контрвариантный 273 — симметричный по паре индек- индексов 271 —, альтернирование 269 —, компоненты 261 —, симметрирование 269 —, транспонирование 269 Тензоры равные 261 Точка начальная 47, 247 —, образ 95 —, прообраз 95 — плоскости 47 Точки n-мерного аффинного пространства 245 Умножение на число 158 — скалярное 215 — векторное 31 Уравнение мнимого эллипса 67 Уравнение множества 40 — параметрическое 48 плоскости 48 — пары мнимых пересекающихся прямых 67 — прямой векторное параметри- параметрическое 47 — пучка прямых 62 — характеристическое 184 обобщенное 238 Уравнения степень 42 Фокус 70 Форма квадратичная 197 — эрмитова 204 Функция билинейная 195 , коэффициенты в базисе 196 симметричная 197 — однородная 45 — полилинейная 263 — эрмитова билинейная 204 Хорда 80 Центр пучка 62 — линии 81 Цепочки жордановы 209 Цилиндр 45 — прямой круговой 45 Эллипс, большая полуось 69 —, вершины 69 —, малая полуось 69 —, эксцентриситет 70 Эллипсоид 89 р-вектор 277 — простой 277 — разложимый 277
СПИСОК ЛИТЕРАТУРЫ Читателю можно рекомендовать следующие подробные учебники по аналитической геометрии. 1. Александров П. С. Курс аналитической геометрии и линейной алгеб- алгебры. — М.: Наука, 1979. 2. Ильин В. А., Лозняк Э.Г. Аналитическая геометрия. — М.: Наука, 1981. 3. Постников М. М. Лекции по геометрии. Семестр I. Аналитическая геометрия. — М.: Наука, 1979. В качестве задачника рекомендуется 4. Беклемишева Л. А., Петрович А. Ю., Чубарое И. А. Сборник задач по аналитической геометрии и линейной алгебре. — М.: Наука, 1987. Аксиоматику геометрии можно найти в книге 5. Ефимов Н. В. Высшая геометрия. — М.: Наука, 1978. В этой книге рассказано также и о теоретико-групповых принципах гео- геометрии. Изложение основ теории групп, другие сведения по общей алгеб- алгебре и дополнительный материал по линейной алгебре содержится в учебнике 6. Кострикин А. И. Введение в алгебру. — М.: Наука, 1977. В качестве более подробного изложения линейной алгебры рекоменду- рекомендуются следующие курсы. 7. Мальцев А. И. Основы линейной алгебры. — М.: Наука, 1970. 8. Ефимов Н. Я., Розендорн Э. Р. Линейная алгебра и многомерная гео- геометрия. — М.: Наука, 1974. 9. Ильин В. А., Позняк Э. Г. Линейная алгебра. — М.: Наука, 1984. 10. Постников М. М. Лекции по геометрии. Семестр П. Линейная алгеб- алгебра. — М.: Наука, 1979. Обширный материал по линейной алгебре и ее приложениям содержится в следующих монографиях. 11. Гантмахер Ф. Р. Теория матриц. — М.: Наука, 1967. 12. Хорн Р., Джонсон Ч. Матричный анализ. — М.: Мир, 1989.
Список литературы 303 Много интересных результатов собрано в книге 13. Прасолов В. В. Задачи и теоремы линейной алгебры. — М.: Наука, 1966. Полезно ознакомиться с книгой 14. Халмош П. Конечномерные векторные пространства. — М.: Физмат- гиз, 1963. Прикладные вопросы линейной алгебры рассматриваются в книге 15. Беклемишев Д. В. Дополнительные главы линейной алгебры. — М.: Наука, 1983. Сведения по истории можно найти, например, в книге 16. Вилейтнер Г. История математики от Декарта до середины XIX столетия. — М.: Наука, 1966.
Учебное издание БЕКЛЕМИШЕВ Дмитрий Владимирович КУРС АНАЛИТИЧЕСКОЙ ГЕОМЕТРИИ И ЛИНЕЙНОЙ АЛГЕБРЫ Редактор Е.Ю. Ходан Корректор Т.С. Вайсберг Оригинал-макет И.Л. Ивановой Оформление обложки А.Ю. Алехиной ЛР №071930 от 06.07.99. Подписано в печать 26.01.05. Формат 60x90/16. Бумага типографская. Печать офсетная. Усл. печ. л. 19. Уч.-изд. л. 25,83. Заказ № Издательская фирма «Физико-математическая литература» МАИК «Наука/Интерпериодика» 117997 Москва, Профсоюзная, 90 E-mail: fizmat@maik.ru, http://www.fml.ru Отпечатано с диапозитивов в ОАО «Чебоксарская типография № 1» 428019, г. Чебоксары, пр. И. Яковлева, 15