/
Text
ИЗБРАННЫЕ ГЛАВЫ ВЫСШЕЙ МАТЕМАТИКИ ДЛЯ ИНЖЕНЕРОВ И СТУДЕНТОВ ВТУЗОВ Л.И.ГОЛОВИНА ЛИНЕЙНАЯ АЛГЕБРА И НЕКОТОРЫЕ ЕЕ ПРИЛОЖЕНИЯ ИЗДАНИЕ ЧЕТВЕРТОЕ, ИСПРАВЛЕННОЕ Допущено Министерством высшего и среднего специального образования СССР в качестве учебного пособия для студентов высших технических учебных заведений МОСКВА сНАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1985
22.143 Г81 УДК 512.86 Головина Л. И. Линейная алгебра и некоторые ее приложения: Учебное пособие для вузов.— 4-е изд., испр.— М.: Наука, Главная редакция физико-математической литературы, 1985.— 392 с. Основное содержание книги составляют теория определителей и краткий курс собственно линейной алгебры. В качестве «приложений» линейной алгебры рассматриваются самые разные вопросы: дается краткое изложение общей теории кривых и поверхностей второго порядка, вводятся основные понятия тензорной алгебры, излагаются основные понятия теории групп и элементы теории представлений групп. В одной из глав книги методы линейной алгебры применяются к основным понятиям физики — принципам относительности, классическому и релятивистскому. Ил. 39. Библиогр. 34 назв. Рецензенты: член-корреспондент АН СССР профессор А. И. Кострикин кандидат физико-математических наук доцент Д. В. Беклемишев Лидия Ивановна Головина ЛИНЕЙНАЯ АЛГЕБРА И НЕКОТОРЫЕ ЕЕ ПРИЛОЖЕНИЯ Редакторы И. М. Яглом, И. В. Морозова Техн. редактор С. Я- Шкляр Корректоры Е. В. Сидоркина, В. П. Сорокина ИБ № 12629 Печать с матриц. Подписано к печати 07.08.85. Формат 84ХЮ87«. Бумага тип. № 3. Гарнитура литературная. Печать высокая. Усл. печ. л. 20,58. Усл. кр.-отт. 20,79. Уч.-изд. л. 19,53. Тираж 18000 экз. Заказ Я» 514, Цена 85 коп. Ордена Трудового Красного Знамени издательство «Наука» Главная редакция физико-математической литературы 117071 Москва В-71, Ленинский проспект, 15 4-я типография издательства «Наука» 630077 г. Новосибирск 77, Станиславского, 25 © Издательство «Наука», Главная редакция ~ 1702030000—132 физико-математической 1 ГУ^ тО\ ЯК—72"85 литературы. 1979; [)о6@2уЬо с изменениями, 1985
ОГЛАВЛЕНИЕ Предисловие 7 Схема зависимости глав 8 Глава I. Определители и системы линейных уравнений . . 9 § 1. Системы уравнений с двумя и тремя неизвестными . . 9 | 2. Перестановки и транспозиции. Определитель л-го порядка 17 § 3. Свойства определителей 20 § 4. Миноры и алгебраические дополнения 27 § 5. Разложение определителя по элементам строки или столбца 29 § 6. Системы п линейных уравнений с п неизвестными . . 32 § 7. Ранг матрицы 34 § 8. Понятие о линейной зависимости 38 § 9. Произвольные системы линейных уравнений .... 41 § 10. Однородные системы 45 § 11. Метод Гаусса 50 Глава II. я-мерное пространство 55 § 1. Что такое поле 55 § 2. Поле комплексных чисел 56 § 3. Определение векторного пространства 62 § 4. Размерность и базис 65 § 5. Изоморфизм векторных пространств 70 § 6. Переход к новому базису 73 § 7. Подпространства векторного пространства .... 76 § 8. Линейные многообразия ......... 78 § 9. Пересечение и сумма подпространств 79 § 10. Определение аффинного пространства 82 §11. Введение координат в аффинном пространстве ... 84 § 12. Переход к новой системе координат 85 § 13. ^-мерные плоскости в аффинном пространстве ... 86 § 14. Выпуклые множества в аффинном пространстве . . 90 Глава III. Линейные операторы ........ 92 | 1. Определение и примеры , 92 § 2. Действия над линейными операторами . 99 § 3. Прямоугольные матрицы 106 § 4. Изменение матрицы линейного оператора при переходе к новому базису , 112
4 ОГЛАВЛЕНИЕ § 5. Ранг и дефект линейного оператора , . , , . . 114 § 6. Невырожденный линейный оператор ...... 115 § 7. Инвариантные поднространства ....... 117 § 8. Собственные векторы и собственные значения линейного оператора ¦ , . • 119 § 9. Спектр линейного оператора 126 § 10. Жорданова нормальная форма • 128 Глава IV Евклидово пространство . 144 § 1. Скалярное произведение 144 § 2. Ортонормированный базис 149 § 3. Ортогональное дополнение 154 § 4. Евклидово (точечно-векторное) пространство ... 157 Глава V. Линейные операторы в евклидовом пространстве 163 § 1. Линейный функционал 163 § 2 Оператор, сопряженный данному ....... 164 § 3 Самосопряженный оператор .....,., 168 § 4. Ортогональный оператор ......... 173 § 5 Унитарный оператор 181 § 6. Произвольный линейный оператор в евклидовом пространстве 183 Глава VI. Билинейные и квадратичные формы .... 187 § 1. Билинейный функционал. Билинейная и квадратичная формы 187 § 2. Приведение квадратичной формы к сумме квадратов 191 § 3. Закон инерции квадратичных форм 194 § 4. Определенные формы 195 § 5. Билинейные и квадратичные формы в евклидовом пространстве 199 § 6. Билинейный функционал в комплексном векторном пространстве 201 Глава VII. Исследование кривых и поверхностей второго порядка 205 § 1. Приведение общего уравнения кривой второго порядка к каноническому виду 206 § 2. Инварианты кривой второго порядка 209 § 3. Определение центра и главных осей центральной кривой. Отыскание вершины и оси параболы 218 § 4. Исследование общего уравнения поверхности второго порядка • 221 Глава VIII. Понятие о тензорах ¦ . 225 § 1. Примеры тензоров ... • • 225 § 2. Определение и простейшие свойства тензоров . . 230 § 3. Операции над тензорами ......... 233 § 4. Тензоры в евклидовом пространстве ...... 237
ОГЛАВЛЕНИЕ 5 Глава IX. Основные понятия специальной теории относительности 241 § 1. Двумерные пространства со скалярным произведением 241 § 2. Полуевклидова плоскость ......... 242 § 3. Псевдоевклидова плоскость ...¦,.,. 248 § 4. Псевдоортогональный оператор 252 § 5. Пространство событий. Принцип относительности Галилея 255 § 6. Принцип относительности Эйнштейна . , 258 § 7. Преобразования Лоренца 260 § 8. Некоторые следствия из формул Лоренца . . . , 264 Г л а в а X. Основные понятия теории групп ..,.¦• 272 § I. Примеры групп. Определение группы 272 § 2. Подгруппа 278 § 3. Группы преобразований. Симметрическая группа л-й степени 280 § 4. Изоморфизм групп , 284 | 5. Разложение группы по подгруппе , , 287 § 6. Нормальная подгруппа ,291 § 7. Фактор-группа , 293 § 8. Прямое произведение групп 295 § 9. Классы сопряженных элементов группы 297 { 10. Классы сопряженных элементов прямого произведения групп .... 300 § 11. Гомоморфизм групп 301 Глава XI. Группы симметрии геометрических фигур . , 304 § 1. Группа движений вещественного евклидова пространства и ее подгруппы 304 § 2. Сопряженные элементы в группе вращений трехмерного пространства 308 § 3. Группа вращений правильного л-угольника Сп . 309 | 4. Диэдральные группы йп . 310 § 5. Группа вращений тетраэдра Т 313 § 6. Группа вращений куба О . . , 315 § 7. Группа симметрии тетраэдра Та . , 318 | 8. Группа симметрии куба Он ....... , 319 $ 9. Заключение 321 Глава XII. Линейные представления конечных групп . . 324 | 1. Определения и примеры ..... ... 324 § 2. Изоморфные представления ........ 330 § 3. Подпредставление 332 § 4. Прямая сумма представлений ........ 333 § 5. Унитарное представление. Приводимые и неприводимые представления 335 § 6. Регулярное представление ......... 339 § 7. Функции, определенные на группе ,341 § 8. Скалярное произведение на группе 344 § 9. Лемма Шура .346 § 10, Следствия из леммы Шура 349
6 ОГЛАВЛЕНИЕ Глава XIII. Теория характеров 354 § 1. Характер представления. Простейшие свойства характеров 354 § 2. Характеры неприводимых представлений 357 § 3. Дальнейшие свойства характеров , 359 § 4. Основное соотношение 360 § 5. Число неприводимых представлений группы , 362 § 6. Представления коммутативной группы 365 § 7. Представления циклических групп ...... 366 § 8. Представления диэдральных групп ...... 367 § 9. Характеры группы вращений тетраэдра 373 § 10. Характеры группы вращений куба и группы симметрии тетраэдра . 375 | 11. Тензорное (кронекеровское) произведение матриц , , 379 § 12. Тензорное произведение векторных пространств . , . 380 § 13. Тензорное произведение линейных операторов . . . 382 § 14. Тензорное произведение представлений (представления прямого произведения групп) 384 § 15. Характеры группы симметрии куба 388 Список дополнительной литературы , 389 Предметный указатель , ;¦ в ,«..•... 391
ПРЕДИСЛОВИЕ Эта книга представляет собой учебное пособие по линейной алгебре, рассчитанное на студентов втузов и естественно-научных факультетов университетов. Она может быть полезной и читателю, желающему самостоятельно познакомиться с основными понятиями линейной алгебры. Глава I является вводной; она содержит необходимые для дальнейшего сведения из теории определителей и систем линейных уравнений. Основными в книге являются главы II—VI, в которых излагается собственно курс линейной алгебры. Остальные главы, по существу, не относятся к линейной алгебре, но их результаты основаны на предыдущем материале (...«некоторые ее приложения»); эти главы могут читаться и не подряд (см. ниже схему зависимости глав). Глава VII посвящена общей теории кривых и поверхностей второго порядка; она имеет целью дополнить и углубить соответствующую часть курса аналитической геометрии, не претендуя на ее замену. Глава VIII, посвященная общим понятиям тензорной алгебры, является довольно конспективной и может служить введением в более обстоятельные изложения той же темы, из числа которых назовем, например, указанные в списке литературы книги [15] и [16]. Несколько необычной для учебника линейной алгебры является глава IX, посвященная специальной теории относительности. При изучении линейной алгебры эта глава может быть и опущена, но опыт преподавания показывает, что обычно она вызывает у слушателей большой интерес. Главы X—XI содержат самые общие сведения из теории групп и описание групп симметрии геометрических фигур и тел. Глава XII—XIII краткое, но достаточно строгое, изложение основных понятий теории представлений групп и теории характеров. Конечно, все эти вопросы уже не относятся к линейной алгебре, но
8 ПРЕДИСЛОВИЕ методы теории групп и, в частности, основанная на линейной алгебре теория представлений групп, играют все большую роль в современной физике и химии, так что учебное пособие по линейной алгебре для втузов не может не затронуть и этих разделов. В настоящее издание книги внесены некоторые добавления, в частности,— параграф о жордановой форме матрицы. От читателя не требуется почти никаких предварительных сведений из высшей математики, предполагается лишь, что он знаком с элементами аналитической геометрии. Используемые здесь понятия математического анализа (производная, интеграл) встречаются только в примерах, которые при чтении книги могут быть пропущены» Содержание настоящей книги составляет несколько расширенный курс лекций, неоднократно читавшийся автором на отделении физхимии химического факультета МГУ. Схема зависимости глав У Глава Ш 1 ' ГлаваУИ 1 ' Глава VI т ГлаваШ т 1 Глава I ¦ 1 4 ГлаваП 1 Глава V т Глава IV Глава IX у Глава X \ ГлаваХ! \ Глава XII \ (Глава XIII Москва, Август, 1978 г. Л. Я. Головина
ГЛАВА I ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ I ЛИНЕЙНЫХ УРАВНЕНИЙ В этой главе содержится вспомогательный материал, относящийся к решению систем линейных уравнений (т. е. уравнений первой степени). Для исследования та* ких систем вводится важное понятие определителя. Результаты этой главы, интересные и сами по себе, и в приложениях к аналитической геометрии, необходимы для понимания дальнейших глав книги, § 1. Системы уравнений с двумя и тремя неизвестными При решении одного уравнения первой степени с одним неизвестным ах = Ь возможны три случая: 1. Если афЪ, уравнение имеет единственное решение *=—• 2. Если а = 0 и Ъ = 0, уравнение имеет бесчисленное множество решений; любое число х удовлетворяет уравнению ах = Ь (так как 0*х = 0) и, значит, является его решением. 3. Если а = 0, но Ь Ф 0, уравнение не имеет решений, так как при подстановке вместо х любого числа в левой части получается нуль, в то время как правая часть отлична от нуля. Из дальнейшего будет видно, что аналогичные три случая имеют место и при решении произвольной системы линейных уравнений. Рассмотрим систему двух уравнений с двумя неизвестными: ахх + Ьху = си а2х +- Ь2у = с2.
Ю ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 Решением такой системы называется каждая пара значений х = а, у = 0, подстановка которых вместо х и у обращает оба уравнения в тождества. Чтобы решить эту систему, умножим первое уравнение на Ь2) второе — на — Ь\ и сложим их; мы получим х(а\Ь2 — аф\) = С\Ь2 — с2Ьх. Отсюда, если а\Ъ2 — а2Ь\ Ф 0, будем иметь х=Щ=Щ. B) Аналогично находим, что у=^^. C) Таким образом, в случае, когда а\Ъ2 — а2Ъ\ ф 0, система A) имеет ед и нет в е н н о е решение. Выражения, стоящие в числителях и знаменателях правых частей равенств B) и C), устроены одинаково. А именно, рассмотрим квадратную таблицу чисел 1 V Такие таблицы называются матрицами. Горизонтальные ряды образующих матрицу чисел называются ее строками, вертикальные — столбцами. Числа а\, Ьи а2, Ь2, составляющие матрицу, называются ее элементами. В нашем примере мы имеем квадратную матрицу второго порядка. Диагональ, идущая из левого верхнего угла матрицы в правый нижний, называется ее главной диагональю. Знаменатели дробей, стоящих в правых частях равенств B) и C), устроены следующим образом: из произведения элементов, стоящих по главной диагонали матрицы Л, вычитается произведение элементов, стоящих во второй, или побочной, ее диагонали: аф2— а2Ъ\, Полученное выражение называется определителем матрицы А (определителем второго порядка) и обозначается так:
§ Ц СИСТЕМЫ С ДВУМЯ И ТРЕМЯ НЕИЗВЕСТНЫМИ Ц Таким образом, по определению, = ах&2 — а2Ьг. й1 Ь1 а2 Ь2 В этих обозначениях числитель дроби, стоящей в правой части равенства B), представляет собой определитель С2 К схЬ2 — с2Ьи получающийся из знаменателя заменой первого столбца столбцом свободных членов, а числитель дроби, стоящей в правой части равенства C),—определитель — #1^2 """ ^2^1» получающийся из знаменателя заменой второго столбца столбцом свободных членов уравнений системы A), Итак, мы нашли, что если а1 ьг а2 ь2 ФО, то х = К V \С2 Ь2 Iе! Ь1 \а2 Ь2 Г у== °1 °2 й1 й2 С'\ С2| &1| *.1 Это — формулы Крамера для решения системы двух уравнений с двумя неизвестными. Пример. Пользуясь формулами Крамера, решить систему уравнений Bх + 5у = 8, Р е ш е н в е. I 85 1-1 1 ,3* + у=--1. 2 5 3 1 8 + 5 2-15 3—1 — 1. У = -=ТГ = — 2-24 13 = 2. Рассмотрим теперь случай, когда *2 Ь2 = афъ — а2Ь1 = О» D)
12 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИИ [ГЛ. 1 Равенство D) можно переписать так*): ал ьл г. е. в этом случае коэффициенты при неизвестных пропорциональны. Если, кроме того, и С2 К = 0, С1 Ь1 т. е. —- = -=¦ С2 Ь2 то и свободные члены пропорциональны коэффициентам при неизвестных, и мы имеем на самом деле одно уравнение с двумя неизвестными — оно допускает бесчисленное множество решений. Наконец, если *о, т. е. если °1 °2 = о, й1_ °2 НО С2 К то уравнения, очевидно, противоречат друг другу и система не имеет ни одного решения. Рассмотрим теперь систему трех линейных уравнений с тремя неизвестными! {ахх + Ъху + схг = йи а2х + Ь2у + с2г = &ъ аъх + Ь3у + сгг = Л3. E) Решением этой системы называется каждая такая тройка чисел х = а, у = [}, г = ч, при подстановке которых все три уравнения обращаются в тождества, Умножив первое уравнение на *8 С8 = Ь2съ — Ьъсь второе- на — \ *1 Ъз ',. = Ь-зс1 — ^1сз> третье — на Ь2 С2 = Ьгс2 — Ь2Сх *) Здесь и да^ее мы считаем, что знаменатели отличны от нуля; случай, когда это не так, рассмотрите сами.
5 1] СИСТЕМЫ С ДВУМЯ И ТРЕМЯ НЕИЗВЕСТНЫМИ 13 и сложив их все, мы получим х{а\Ь2Съ—а1Ь^С2-\-а2ЬъС\—Яг^з+Яз^г—Яз^О = = ^1&2^3 — с1\ЬъС2 + ^2&3<?1 — ^2^1^3 + ^зЬ^ — Йз^2^1 (коэффициенты при у и г, как легко видеть, будут равны нулю). Отсюда, если коэффициент при х отличен от нуля, получаем ._ *ЛУ *1*2<3 ~ «IV* + аАС1 ~ «3*Л + *86Л ' -°86Л' F) Посмотрим, как устроено выражение, стоящее в знаменателе правой части равенства F). Для этого рассмотрим квадратную таблицу (матрицу третьего по- рядка) Будем снова называть главной диагональю диагональ, идущую из левого верхнего угла этой матрицы в правый нижний, и побочной — диагональ, идущую из левого нижнего угла в правый верхний. Знаменатель в формуле F) представляет собой алгебраическую сумму шести членов, каждый из которых Рис. 1. Заявляется произведением трех элементов, взятых по одному из каждой строки и каждого столбца матрицы Л, причем знак плюс имеет произведение элементов,
14 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 принадлежащих главной диагонали, и два произведения элементов, образующих в матрице (равнобедренные) треугольники с основаниями, параллельными главной диагонали (рис. 1,а), а знак минус имеет произведение элементов, принадлежащих побочной диагонали, и два произведения элементов, образующих треугольники с основаниями, параллельными побочной диагонали (рис. 1,6). Такое выражение называется определителем, составленным из матрицы А (определителем третьего порядка), и обозначается так: ах ьг сх а2 К с2 аз ьз сз Таким образом, по определению, А \аг йп 1 3 к \ 6„ 3 С1 С% сп 3 в — #1^3 + #2&зс1 + аФ\сг — #3^1 "~ &Ф\сз — й\ЪъСг. Выражение, стоящее в числителе правой части формулы F), получается из знаменателя, если каждую букву а заменить буквой й с тем же номером, т, е. к К к \Л1 \аг йп 18 К К ь> Ь1 ьг ьл 8 С1 С2 СВ С1 С2 С. 8 И Fа) Аналогично можно показать, что при ОФО из системы E) следуют равенства У п» г "" п ' й О' G) где Д-, 1=1, 2, 3 — определитель, получающийся из определителя й заменой /-го столбца столбцом свободных
§ 1] СИСТЕМЫ С ДВУМЯ И ТРЕМЯ НЕИЗВЕСТНЫМИ 15 членов. Это — формулы Крамера для системы трех уравнений с тремя неизвестными. Пример. Решить по формулам Крамера систему уравнений * + 2*/ + Зг = 7, х - Зу + 2г = 5, X + У + 2=3. Решение. = — 3 + 3 + 4 + 9 — 2 — 2 = 9^0; = — 21 + 15 + 12 + 27 — 10 — 14 = 9, 5+14 + 9-15 — 7 — 6 = 0, = — 9 + 7+10 + 21—6 — 5= 18. 0 = >1 = 1 1 1 7 5 3 2 31 -3 2 1 1 2 31 -3 2 1 Ч #2 = Оз = 1 7 3 1 5 2 1 3 1 1 2 1 -3 1 1 = 71 з| Следовательно, 02 йя * = 7Г = 1> ^ = 7Г = 0, *—т? # О Для того чтобы понять, что такое определитель п-го порядка, рассмотрим снова определители второго и третьего порядков: и |а1 «2 |в8 Ьг Ьг Ьг С1 С2 С8 = й1 агЬ2 — а2Ь1 (8) = а А^з + а2Ь3с1 + аф^ — аф2сх — д^Сд — ахЪъсг. (9) Мы видим, что определитель есть алгебраическая сумма всевозможных произведений его элементов, взятых по одному из каждой строки и каждого столбца.
16 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ (ГЛ: I Каждое такое произведение называется членом определителя. В каждом члене определителя второго порядка расположим множители в порядке следования столбцов: и рассмотрим соответствующие расположения (перестановки) нижних индексов (указывающих номера строк): 1, 2 и 2, 1. В первом произведении эти индексы расположены по возрастанию, и соответствующее произведение входит в определитель со знаком плюс; во втором они, как говорят, образуют беспорядок, или инверсию, 2, 1, и соответствующий член входит в определитель со знаком минус. В определителе третьего порядка шесть членов. Если в каждом из них расположить множители в порядке следования столбцов, то в членах, входящих со знаком плюс, нижние индексы образуют перестановки 1, 2, 3; 2, 3, 1 и 3, 1, 2. Рассмотрим три пары индексов 1, 2; 1, 3 и 2, 3 из первой перестановки 1, 2, 3; числа каждой пары расположены по возрастанию — в этой перестановке нуль инверсий. Во второй перестановке 2, 3, 1 три пары индексов: 2, 3; 2, 1 и 3, 1, две из которых — 2, 1 и 3, 1, образуют инверсии. В третьей перестановке 3, 1, 2 — три пары индексов 3, 1; 1, 2 и 3, 2, из которых две — 3, 1 и 3, 2, образуют инверсии. Произведениям, входящим со знаком минус, соответствуют три перестановки индексов 3, 2, 1; 2, 1, Зи 1, 3, 2, причем в первой, как нетрудно видеть, три инверсии: 3, 2; 3, 1 и 2, 1, а во второй и третьей — по одной; соответственно 2, 1 и 3, 2. Таким образом, со знаком плюс входят те члены, у которых в перестановке индексов четное число инверсий, а со знаком минус — те, у которых это число нечетно.
$21 ПЕРЕСТАНОВКИ И ТРАНСПОЗИЦИИ 17 Для дальнейшего нам будет удобно ввести для определителей второго и третьего порядков новые обозначения: *11 а21 *12 а22 и *11 *21 2 *31 32 **83 I где все элементы определителя обозначены одной и той же буквой а с двумя индексами, первый из которых указывает номер строки, в которой стоит этот элемент, а второй — номер соответствующего столбца. (Элементы, например, первого определителя читаются так: а один один, а один два, а два один, а два два.) Тогда — #пЯ22 — #21#12 Д11 012| ап ап\ аи аи V |°21 °22 «ИЗ 1вИ аз« азз1 = 2 ± я*аа*22Я|,з, где знак плюс стоит перед теми произведениями, в которых перестановка /ь 12, ^четная (т. е. имеет четное число инверсий), и знак минус — перед теми, где она нечетна. Это можно записать еще и так: 31 32 3 = 2(-1)вв«,1а«, 2#г33> где а есть число инверсий в перестановке первых индексов, 1и *2, /з (вторые индексы расположены в порядке возрастания), а суммирование распространяется на все шесть перестановок *ь /2> *з из трех чисел 1, 2, 3. § 2* Перестановки и транспозиции. Определитель л-го порядка Пусть даны п элементов аи а2, ..., ап (например, это могут быть числа 1, 2, 3, ..., я). Как известно, всевозможные расположения этих элементов называются перестановками из п элементов. Всего из п элементов можно составить п\ перестановок (докажите это),
18 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 Если какая-нибудь пара аи ак элементов перестановки расположена в ней так, что элемент с большим номером стоит раньше элемента с меньшим номером, то говорят, что эти элементы образуют инверсию. Пусть нам надо сосчитать число инверсий в какой-то перестановке, образованной числами 1, 2, 3, ..., п (это могут быть номера элементов аи а2, ..., ап). Сделать это можно следующим образом. Сосчитаем сначала число элементов, стоящих впереди единицы — все эти элементы и только они образуют инверсии с единицей. Вычеркнем затем единицу и сосчитаем число элементов, стоящих впереди двойки — это будут все те элементы, которые образуют инверсии с двойкой (не считая уже вычеркнутой единицы, которая тоже может образовывать инверсию с двойкой, но в таком случае эту инверсию мы. уже учли раньше). Затем вычеркнем двойку и сосчитаем число элементов, стоящих впереди тройки, и т. д. Все полученные числа сложим—эта сумма и будет равна общему числу инверсий. Число инверсий в перестановке (*1, х2у ..., /„ обозначается так: [*ь *2> • • •, *п]. Например, [2, 5, 1, 4, 7, 3, 6] = 2 + 0 + 3 + 1 + 0 + 1 = 7. Перестановки с четным числом инверсий называются четными, перестановки с нечетным числом инверсий — нечетными перестановками. Пусть дана перестановка из п элементов аи а2> ..., аи ..., ак> ..., ап. Поменяем местами два ее элемента а{ и аК\ при этом мы получим перестановку аи а2, ... ..., аку ..., аи , ¦., а«. Такая операция перемещения двух элементов перестановки называется транспозицией. Теорема 1. От одной транспозиции четность перестановки меняется (т. е. четная перестановка становится нечетной, а нечетная — четной). Доказательство. Рассмотрим сначала случай, когда меняются местами два соседних элемента а и р перестановки аи а2, ..., аи а, р, Ъи Ь2, ..., Ьт. A0) После транспозиции элементов аир получим перестановку 0ь 02, .. •> аь р, а, Ьи Ъ2г ,,., Ьт. A1)
$2] ПЕРЕСТАНОВКИ И ТРАНСПОЗИЦИИ 19 Так как перестановки A0) и (И) отличаются друг от друга только взаимным расположением элементов а и Р (а взаимное расположение каждого из этих элементов и какого-то другого, так же как и взаимное расположение любых двух из остальных элементов, остались прежними), то число инверсий в перестановке A1) на единицу больше или на единицу меньше числа инверсий в перестановке A0), и значит, одна из этих перестановок четная, а другая — нечетная. Рассмотрим теперь общий случай. Пусть меняются местами элементы аир перестановки аи ..., я*, а, Си ..., ск, р, Ьи ..., Ьт между которыми стоят еще к элементов си с2, ..., ск. Мы можем выполнить транспозицию элементов аир посредством нескольких транспозиций рядом стоящих элементов: поменяем местами а сначала с си затем с С2, и т. д., наконец, с ск (при этом мы сделаем к транспозиций рядом стоящих элементов); затем поменяем местами аир (еще одна транспозиция) и, наконец, поменяем местами р последовательно с скУ с сА.ь и т. д. до С\ (еще к транспозиций рядом стоящих элементов). В конечном счете р станет на место а (и наоборот). При каждой такой транспозиции четность перестановки, как мы уже видели, меняется. А так как она изменится 2к-\- 1, т. е. нечетное число раз, то окончательно нечетная перестановка сделается четной, а четная — нечетной, что и требовалось доказать. Следствие. Число нечетных перестановок из п элементов равно числу четных перестановок (и равно, следовательно, я!/2). Доказательство. Пусть из п! перестановок из п элементов р перестановок четны и ц нечетны. Сделаем в каждой четной перестановке одну и ту же транспозицию, например, поменяем местами первые два элемента. Тогда каждая четная перестановка превратится в нечетную, причем ясно, что все р полученных при этом нечетных перестановок будут разными. А так как общее число нечетных перестановок из п элементов, по предположению, равно ц, то р < д. Точно так же можно убедиться в том, что, наоборот, ц <, р. Следовательно, р = ц,
20 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. I Дадим теперь общее определение определителя п-го порядка. Пусть имеется квадратная таблица, состоящая из п строк и п столбцов (матрица п-го порядка); Л = 1 *22 *2П >. а» Числа а{н называются ее элементами, горизонтальные ряды элементов матрицы называются ее строками, вертикальными — столбцами Определителем, составленным из этой матрицы (определителем п-го порядка), называется алгебраическая сумма всевозможных произведений элементов, взятых по одному из каждого столбца и каждой строки матрицы А. Если в каждом таком произведении (члене определителя) множители расположены в порядке следования столбцов, то со знаком плюс берутся те произведения, у которых перестановка первых индексов четная, а со знаком минус — те, у которых она нечетная. Короче: 1 *21 2 а2п ЛШ 712 = 2(-1I [*Ь«1 *п] ^1Лаг22 • • • Дгпп, где суммирование распространяется на всевозможные перестановки /ь к, ...» К из п чисел 1, 2, 3 п. Так как число перестановок из п элементов равно п\, то определитель п-го порядка состоит из п\ членов. Ввиду следствия из теоремы 1 ровно половина из них, т. е. п\/2, входит в определитель со знаком плюс и столько же — со знаком минус. § 3. Свойства определителей С увеличением порядка определителя число его членов очень быстро растет. Так, определитель четвертого порядка состоит из 24 членов, определитель пятого порядка — из 120, определитель шестого порядка — из 720 членов, и т. д. Поэтому вычислить определитель порядка выше трех, пользуясь только его определением,
$3] свойства определителей 21 практически невозможно. Для того чтобы вычислять такие определители, нам придется изучить их свойства. Прежде всего мы докажем одно вспомогательное предложение. Лемма (о знаке члена определителя). Произведение а{1к1а12к2 ... й{пъп входит в определитель п-го порядка со знаком, определяемым выражением мы будем говорить в таком случае короче: входит со знаком Доказательство. Заметим прежде всего, что если поменять местами два множителя произведения л.*лв<.А.---л<пАп, то как в первых, так и во вторых его индексах произойдет по одной транспозиции, и значит, четность каждого из чисел ['ь к> ¦ ¦ •> *'п] и [йь *2> .. *, &п] изменится, а четность их суммы останется прежней. Пусть нам дано произведение а^а^ ... агпкп. С помощью нескольких транспозиций этих множителей расположим их так, чтобы вторые индексы шли в порядке возрастания. Для этого сначала сделаем транспозицию, при которой на первое место станет элемент из первого столбца, затем такую, чтобы на второе место попал элемент из второго столбца, и т. д. (Так, например, произведение 045014052021033 последовательно преобразуется В 021014052045033, ЗЭТеМ В 021052014045033, В 021052033045014, и, наконец, в 0210520зз0н045.) Если в конечном счете, когда вторые индексы расположатся по возрастанию, первые образуют перестановку [ть т2, ¦.., тп], то рассматриваемый член, по определению, входит в определитель со знаком (_1)[т*»те«-'тп1. ц0 Так как чет. ность суммы [1и 12, ..., /ж] + [*ь *2, .¦., кп] числа инверсий в первых и числа инверсий во вторых индексах при транспозициях множителей не менялась, то четность этой суммы в первоначальном расположении множителей совпадает с четностью числа [пги т2, ¦. *, т„] — числа инверсий в перестановке первых индексов оконча-
22 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 тельного расположения: в нем вторые индексы образуют нуль инверсий. Следовательно1 / |ч[тп1,т«....,тпп] ___ / |\[11,г2,...,1п]+[&1,А„...!Ьп] что и доказывает наше утверждение. Пример. Найти, с каким знаком произведение 032043051015024 входит в определитель пятого порядка: Решение. й = «11 021 031 041 аЫ «12 022 032 042 Об2 0Х3 023 033 043 053 014 024 034 044 054 016 026 035 0*5 055 [3, 4, 5, 1, 2] =3 + 3 = 6, [2, 3, 1, 5, 4] =2+1=3; (- 1)б+з в ^1)9^__1ш Рассматриваемое произведение входит в определитель й со знаком минус. Свойство 1 («равноправие» строк и столбцов определителя) . При транспонировании, т. е. при замене каждой строки определителя столбцом с тем же номером, определитель не меняется. Доказательство. Рассмотрим определитель о = *11 *12 п а2п иП\ ип2 ' ' * "л и транспонированный определитель а = *11 *12 *21 22 О, **1 >П2 строками которого служат столбцы определителя И. Надо показать, что /У = О. Каждый член определителя О является членом и определителя 0\ так как его множители и в определи* теле Ъ' находятся в разных строках и разных столбцах; обратно, каждый член определителя О' будет членом
«31 СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 23 и определителя Л. Таким образом, оба определителя представляют собой «алгебраическую сумму» (т. е. сумму, в которой некоторые слагаемые берутся со знаком минус) одних и тех же членов вида аик^икг • • • а1пЪп* Различие заключается только в том, что в определителе й первые индексы — это номера строк, а вторые — номера столбцов, а в определителе й' — наоборот. Но так как по лемме о знаке члена определителя знак такого произведения как в первом, так и во втором определителе будет одним и тем же: то /У = О. Свойство 2. Если поменять местами две строки или два столбца определителя, то определитель изменит знак, а по абсолютной величине не изменится. Докажем это утверждение, например, для столбцов. Поменяв в определителе |«11 «21 1«„1 «12 • «22 • «Д2- ••«1Р • • • «2Р • ¦апР- ¦ ¦ а1д . •апя- ••«1п| ••«2П •«ПП| местами р-й и <?-й столбцы, мы получим определитель |«11 «21 1«П1 «12 • «22 • «П2- ••«19- .. агд . •«П9- ••«,р.. • «пр • • •«ш 1 •«2* •«ПП1 Каждый член определителя О, будет членом и определителя 02 так как его множители расположены и в Б2 в разных строках и разных столбцах, и обратно. Возьмем какой-нибудь член определителя Ьх\ Щ^и* ... я*рР ... а1яд... а\пП. Так как его множители расположены в порядке следования столбцов в /)ь то он входит в определитель йх со знаком(— 1)['"'"-''р'-»{<?"">Ч. для того чтобы найти знак этого члена в определителе В2, расположим его множители в порядке следования столбцов в Ь2: а111^,2 • • • агдя • • • СЦрр . • • СЦпп
24 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 (элемент а^ содержится в р-м столбце определителя 02, а элемент Я{рр— в ?-м). Первые индексы в определителе Д2, так же как и в определителе 0\, указывают номера строк; поэтому в определитель /J рассматриваемое произведение войдет со знаком (— 1 )[**•**•• "»*0»—»*р»--"М. Но перестановка 1и *2, ..., 1Я, ..., 1Р> ¦ .., 1п получается из перестановки /1, /2, ..., /Р, ..., гч% ..., 1п посредством одной транспозиции, а значит, числа разной четности. Таким образом, каждый член определителя 0\ в определитель С2 входит с противоположным знаком, и значит, /J = — ^ь Для того чтобы доказать соответствующее предложение для строк, перейдем к транспонированным определителям й'х (полученному из определителя 0\) и Оа (полученному из /J). Если определитель 02 получается из й\ перестановкой р-й и #-й строк, то й'г получается из Э[ перестановкой р-го и д-го столбцов, и значит, В'2 =* — ^1- Но по свойству 1 0[ = йх и В'г = 1J, а поэтому #2 = — Дь Следствие. Определитель с двумя одинаковыми строками или с двумя одинаковыми столбцами равен нулю. Для доказательства поменяем местами одинаковые строки (или столбцы) определителя й\ от этого он, конечно, не изменится. А так как, по свойству 2, он должен при этом изменить знак, то 0=—0, откуда /) = 0. Свойство 3. Если все элементы строки или столб- ца определителя умнооюить на одно и то же число, то определитель умножится на то же число. Доказательство проведем, например, для столбцов. Умножив все элементы &-го столбца определителя Я21 ки °22 • ап%- ..а1к . ••°п* • ••°2П •'апп
§3] СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 25 на с, мы получим определитель Ох *11 *1А Чк *гп *п2 4пк равный %(-\р^''^аи1аи2 = с2(-1)[11''2' (ссцкк) . ахпп ..«„], а%кк • • • Я{пп = с#. а'1Лаиг Соответствующее свойство для строк легко доказывается переходом к транспонированным определителям. Таким образом, общий множитель всех элементов строки или столбца определителя можно выносить за знак определителя. Следствие. Определитель с двумя пропорциональными строками или столбцами равен нулю. В самом деле, вынося «множитель пропорционально- сти> строки (столбца) за знак определителя, придем к определителю с двумя одинаковыми строками (столбцами), который равен нулю ввиду следствия из свойства 2. Свойство 4. Если каждый элемент к-го столбца определителя представлен в виде суммы двух слагаемых: аЛк = Ь1к-\-с{кУ г. е. если Ь1Ь+С1к й 1 >.ь, гк + с2к упк то И можно следующим образом представить в виде суммы двух определителей: 1 .. Ь 2 1к В1 пк + 11 321 2 С2к "гп ипк = ^1 + 02. 711 П2 Аналогичное утверждение справедливо и для строк. Доказательство вытекает из равенства и О = 2 (- 1I''-<--|»1 аи1аи% ... (^ + с<кк) агпп — + 2(-1)№'|--Ча1аа<1|...с«дЛ..
26 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 Замечание. Легко видеть, что справедливо и следующее, более общее утверждение: Если каждый элемент к-го столбца определителя О представлен в виде суммы р слагаемых: а^ = а\к + &)к + ... + а?*, то определитель й можно представить в виде суммы р определителей: & 0 = 2 7=1 *11 *21 2 2 >и <ъ "Ш 71 *П\ "п2 <к< Следствие. Определитель не изменится, если ко всем элементам какой-либо его строки или какого-либо столбца прибавить соответствующие элементы параллельного ряда, умноженные на одно и то же число. Действительно, пусть дан определитель Б = ,. а IV а2Р 9 .. а, Чч • • • а2п а ... й ~ ... а пр пч пп Прибавив ко всем элементам его р-то столбца соответствующие элементы д-то столбца, умноженные на одно и то же число с, мы получим определитель 01 = а2Х °22 "а1р+СЫ '-а2Р+Са2Я .. а, <? 2Я апр + СапЯ Ввиду свойства 4 определитель И\ равен .. а. ,. а п ... а пя. пп 1 2Р аШ---апр 9 .. а. пя п Чп + 1 *21 са1д ...а1д са( 24 а2Ч • • • °2П ап1-'-сапя--апд т. е. равен О (второе слагаемое равно нулю как определитель с двумя пропорциональными столбцами).
$ 4) МИНОРЫ И АЛГЕБРАИЧЕСКИЕ ДОПОЛНЕНИЯ 27 § 4. Миноры и алгебраические дополнения Минором М{к элемента а{к определителя О п-го порядка называется определитель (п—1)-го порядка, получающийся из О вычеркиванием 1-й строки и А-го столбца. Алгебраическим дополнением А{к элемента а{к называется его минор, взятый со знаком (— 1)<+*: Лл-(-1)'+ЧИл. Теорема 2. Если все элементы к-ео столбца (строки) определителя О, кроме, быть может> одного, а{к, равны нулю, то определитель В равен произведению а{к на алгебраическое дополнение этого элемента: О = а{кА{к. Доказательство. Рассмотрим сначала частный случай, когда в определителе О все элементы первого столбца, кроме Яц, равны нулю: О = В каждый член определителя О входит в точности по одному элементу из первого столбца; но так как все эти элементы, отличные от ап, равны нулю, то в определителе О все те члены, в которые из первого столбца входит не Ян, а какой-либо другой элемент, равны нулю. Следовательно, о = 2(-1)[1Л*- •1пЧл....-*1 ,71, где индексы 12 ,.., /я принимают значения 2, 3, ..., п. Множитель ап является общим для всех слагаемых, поэтому его можно вынести за знак суммы. С другой стороны, так как единица, стоящая на первом месте, не образует ни одной инверсии, то [1, *2> .»., /„] = = ['2, .*., *п], и значит, 0 = «и2(-1)[|1-|1я1а|.1...а||1», где суммирование распространяется на всевозможные перестановки 12, *з, ¦.., 1и чисел 2, 3, ,.., я, А так как
28 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. I сумма 2(-1)^- Чя,|1...в|я равна определителю (п — 1)-го порядка, получающемуся из й вычеркиванием первой строки и первого столбца, т. е. равна Ми, и Ап = (—- 1I+1Ми = Мп, то Л=а11М11=а1И11. Рассмотрим теперь общий случай, когда все элементы к-го столбца определителя С, кроме а:к, равны нулю, т. е, когда определитель имеет вид о = 2п *22 п й2п *и и12 Ъ л1п Переместим /-ю строку определителя й на первое место, последовательно меняя ее местами с (*—1)-й, (I — 2)-й, и т. д., наконец, с первой строкой. На это потребуется / — 1 транспозиций строк, при каждой из которых определитель умножается на —1. Затем переместим к-й столбец определителя О на первое место, последовательно меняя его местами с (к— 1)-м, (к — 2)-м, и т. д., наконец, с первым столбцом. Для этого потребуется к — 1 транспозиций столбцов, при каждой из которых определитель тоже умножается на — 1. В конечном счете мы получим определитель Дх = О а„ О "Ш отличающийся от определителя й только знаком (— II-1- (— I)*" =(— 1)<+й. Но, как мы показали, определитель /?1 равен произведению ал на определитель (л—1)-го порядка, получающийся из й\ вычеркиванием первого столбца и первой строки, или, что то же самое, получающийся из О вычеркиванием к-го столбца и 1-й строки, т, е.
§ 5] РАЗЛОЖЕНИЕ ОПРЕДЕЛИТЕЛЯ ПО ЭЛЕМЕНТАМ РЯДА 29 и, следовательно, О = (- 1)'+7>, = (- 1У+*а1кМ1к = а<кА<к. Доказанная теорема дает возможность, используя еще следствие из свойства 4, вычислить определитель какого угодно порядка. Призер. Вычислить определитель пятого порядка: 2 0 1 3 11 -11 2 23 0 = | 14 0-1 5 . 2 1 3 12 12-1 3 1 I Решение. Вычитая из первого столбца определителя О удвоенный третий (иными словами, прибавляя к первому столбцу третий, умноженный на —2), из четвертого вычитая утроенный третий и из пятого — третий столбец, получим 0 = 0 0 -5 1 1 4 -4 1 3 2 1 0 2 —4 0 -1 3 -8 -1 6 0 1 5 —1 2 = «13^13 = М- 01+3 —5 1 —4 1 14-1 б -4 1 -8 -1 3 2 6 2 В полученном определителе четвертого порядка будем таким же образом «делать нули»: прибавим к первому столбцу четвертый, умноженный на 5, от второго отнимем четвертый и к третьему прибавим четвертый, умноженный на 4: 0 ° ° *' ] 26-1 19| 0 = 26 -9 13 -1 19 5 2 -12 -1 0 14 2 —9 13 2-12| О 14 Мы пришли к определителю третьего порядка, который уже можно вычислить либо непосредственно, либо сведя его к определителю вта- рого порядка: прибавив ко второй строке удвоенную первую, получим 26 ~-1 191 — П*+* 43 0 26| = (-1)(-1) 13 0 14 значит, определитель В = — 264. 43 261 13 14 = 2 43 13 13 7 = 2C01-169)=264; § 5 Разложение определителя по элементам строки или столбца Теорема 3. Каждый определитель равен сумме произведений элементов любой его строки {столбца) на их алгебраические дополнения.
30 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 Мы докажем, что при всех /, к = 1, 2, , # „ п Д = 1 221 2 °2* п а2п = ацАп + апАп + ... + а1пА1п *т ып2---ал (разложение по элементам 1-й строки) и # = а{кА1к + а2кА2к + ... + апкАпк (разложение по элементам к-го столбца). Для доказательства заметим прежде всего, что если два определителя отличаются друг от друга только элементами одного столбца (строки), то алгебраические дополнения элементов этих столбцов (строк) в обоих определителях одинаковы, так как при вычислении этих дополнений столбцы (строки), которыми отличаются определители, вычеркиваются. Докажем теперь для определителя О справедливость, например, разложения по к-му столбцу. Для этого представим его в следующем виде: о = 1 *21 2 °22 + о + к + 0 .+ о 71 0 + 0 +...+«„ пп I *П1 **П2 • • # ~ ' ~ I • • • I **пь (здесь каждый элемент &-го столбца представлен в виде суммы п слагаемых, п— 1 из которых равны нулю). По свойству 4 (см. замечание на стр. 26) имеем Я = Я1 + Я2 + ...+Дг, где »1 1 221 и1к 0 "т "т "т *21 А *п! ' Оп = 1 *21 п Ш "пЬ Определитель И\ равен произведению элемента ац на его алгебраическое дополнение в этом определителе. Однако так как определитель й{ лишь А-м столбцом
§ 5] РАЗЛОЖЕНИЕ ОПРЕДЕЛИТЕЛЯ ПО ЭЛЕМЕНТАМ РЯДА 31 отличается от определителя й, то это алгебраическое дополнение совпадает с алгебраическим дополнением А\к элемента а\к в определителе й\ Аналогично, О2 = Я2кА2к, ..•> Бп = апкАпк. Мы доказали, что О = ахъАь + а2кА2к + ... + апкАпк. Соответствующее равенство для строк легко получается переходом к транспонированному определителю. Пример. Вычислить определитель четвертого порядка 1—5 1—4 1 ! 0 = 1 * 4~! 5 и ¦ -4 1 —8 —1 ' 3 2 6 2 Решение, первой строки Разложим определитель, например, по элементам Д = (_5)(-ИI+1 + 1(-1I+2 + 1 (- 1)*+4 14-1 51 1—8—1 |2 6 2| 1 -1 5 -4 —8 —1 3 6 2 1 4 -1 -4 1 -8 3 2 6 + + <_4)(-1)"» 1 4 5 -4 1 -1 3 2 2 + = — 5-74 —(—15) — 4(-31)- 33 = = — 370 + 15 + 124 — 33 = — 264, Теорема 4. Сумма произведений элементов любой строки (или столбца) определителя на алгебраические дополнения соответствующих элементов параллельного ряда равна нулю. Доказательство. Пусть дан определитель Я = 21 2 *22 "и к а2Ъ п A2) "Ш *Я2 " "*!" лпк
32 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ (ГЛ. I Рассмотрим другой определитель, йи отличающийся от й лишь тем, что в к-м его столбце повторен 1-й столбец: [*11 \ат °12 ат ... аи . ...а21 . ...ап1. -•аи •• ..ап1.. •в1|»| •агп пп | Определитель Р\ равен нулю, как определитель с двумя одинаковыми столбцами (следствие из свойства 2). Разложив его по элементам /г-го столбца, получим #1 = аиАХк + а21А2к + ... + ап1Апк, где Лл — алгебраические дополнения элементов /г-го столбца определителя й\\ но так как определитель 0\ лишь к-ы столбцом отличается от О, то они будут и алгебраическими дополнениями элементов к-го столбца определителя О. Таким образом, при всех I и к ф I аиА\х + а2гА2к + ... +атАПк = 0. Аналогично, при всех I и к Ф I апАы + а{2Ак2 + ... + а1пАкп = 0. § 6. Системы п линейных уравнений с п неизвестными Рассмотрим систему п линейных уравнений с п неизвестными: ( #11*1 + 012*2 + • • • + #1п*п = Ьи I #21*1 4" #22*2 ~Ь • • • ~Ь #2п*П == ^21 /1 о> ] (Ь) V #711*1 + #п2*2 + • • • + аппХп — &п> Решением системы A3) называется любая совокупность значений неизвестных Х\ = аь х2 = а2, ..., хп = = а„, при подстановке которых все уравнения системы обращаются в тождества. Предположим, что определитель, составленный из коэффициентов при неизвестных
§6] СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИИ 33 системы A3), отличен от нуля | хх л.а 171 й2п ФО. Умножим первое уравнение системы на Лц, второе — на А2и и т. д., последнее на Ап\ и сложим их все. Мы получим уравнение хЛацАц + а21А21'+... + апХАпХ) + + х2(а12Ап + а22А2\ +.... + ап2АпХ) +... ... + *»(а1пАц + а2пА21 + ... + аппАпХ) = = М11 + М« + ... + М»ь (Н) или х{0 = Ми + Ь2А2{ + ... + Мпь A5) так как заключенные в скобки коэффициенты при неизвестных х2у *з, ..., хп в уравнении A4) по теореме 4 равны нулю, а коэффициент при хи ввиду теоремы 3, равен О. При этом правая часть Мм + Ь2А21 + ... + ЬпАп1 = йи где й\ — определитель, получающийся из О при замене первого столбца столбцом свободных членов. (В правых частях равенств A4) и A5) стоит разложение определителя *9! по первому столбцу.) Аналогично уравнению A5), получаем х20 = 02, ..., хпО = Д,, A5а) где 0< есть определитель, получающийся из И заменой *'-го столбца столбцом свободных членов. Система A5) — A5а) является следствием системы A3). Таким образом, мы доказали, что если система A3) имеет решение, то оно будет решением и системы A5) —A5а), и значит, Х1 — "^"» Х2 = *1 • • • » Хп == ~~о~* A6) Формулы A6) называются формулами Крамера. Непосредственной подстановкой этих значений неизвестных во все уравнения системы A3) можно убедиться, что они действительно образуют ее решение. 2 Л. И. Головина
34 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. ! В самом деле, подставляя значения A6) в 1-е уравнение системы A3), будем иметь °а Ъ + а12 Т + ' • * + ат "о" = ТГ[аа (Ми + Ми + • • • • • • + КАт) + в», FИ12 + »И«. + • • • + Мп2) + • • • •••+«гп(Мт + &Лп+---+Мпп)] = = О" [61 («11^11 + а,-2Л12 + • ¦ • + а«пЛ1п) + &2 (аПА21 + + «|Л» + • • • +.атАгп) +--- + К {ацАм + апАп2 + • • • ••• + а1пАпп)] = ТЬ1» = ЬГ Здесь скобки при всех Ък> кроме 6,-, равны нулю по теореме 4, а сумма йцЛп + аг2Лг2 + . . + Я*пЛ<п равна й по теореме 3. Этим доказана следующая Теорема 5. В случае, когда О Ф О, система A3) имеет единственное решение, определяемое по формулам Крамера A6). § 7. Ранг матрицы Снова будем рассматривать таблицы чисел (матрицы), не требуя теперь, чтобы число строк матрицы совпадало с числом ее столбцов. Для таких (вообще говоря, прямоугольных) матриц мы введем важное понятие ранга. Рассмотрим прямоугольную матрицу, состоящую из т строк и п столбцов ([тХп] -матрицу). Пусть К/пи к < п. Выделим в этой матрице какие-нибудь к строк и к столбцов. Из элементов, стоящих на пересечении выделенных строк и столбцов, составим определитель к-го порядка. Все такие определители называются минорами нашей матрицы. Ясно, что из [тХ/г]-матрицы можно составить Ст'Сп миноров к-го порядка. Так, например, из матрицы ГЗ 2 4 21
§7] РАНГ МАТРИЦЫ 35 можно составить С\-С1 = 12 миноров первого порядка— это сами элементы матрицы Л, С\-С\ = 6 • 3 = = 18 миноров второго порядка: 3 2 2 0 3 21 0 4|» 2 1 0 5 » 3 4 ' |2 1 3 4 0 5 > 2 1| 0 1 » 3 2 ' \2 1 3 2 0 1 ' 0 1 | 4 5| > 2 4 ' |о 1 2 4 4 5 0 1 4 1 > » 2 2 0 1 » 2 21 |4 2 4 1|> |5 1 I1 ]| > 5 1 1о и С\ • Сз^-4 минора третьего порядка: 3 2 4 2 0 1 0 4 5 3 2 2 2 0 1 0 4 1 3 4 2 2 1 1 0 5 1 2 4 2| 0 1 1 4 5 1 Нетрудно проверить, что все миноры третьего порядка матрицы А равны нулю, а миноры второго порядка во всяком случае не все равны нулю (отличен от нуля уже первый из выписанных выше миноров второго порядка). Поэтому мы будем говорить, что ранг матрицы А равен 2. Рангом матрицы называется наивысший порядок отличного от нуля минора этой матрицы. Таким образом, если ранг матрицы равен г, то среди миноров этой матрицы есть по крайней мере один минор г-го порядка, отличный от нуля, в то время как все ее миноры порядка г + 1 и выше равны нулю. Ранг матрицы А мы будем обозначать через г (Л). Для вычисления ранга матрицы ее сначала приводят к возможно более простому виду с помощью так называемых элементарных преобразований. Элементарными преобразованиями матрицы называются следующие ее преобразования: 1. Транспонирование, т. е. замена каждой строки столбцом с тем же номером. 2. Перестановка двух строк или двух столбцов. 3. Умножение всех элементов строки или столбца на любое число с, отличное от нуля. 4. Прибавление ко всем элементам строки или столбца соответствующих элементов параллельного ряда, умноженных на одно и то же число. 2*
36 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. I Теорема 6 (об элементарных преобразованиях). При элементарных преобразованиях матрицы ее ранг не меняется. Доказательство. Рассмотрим каждое преобразование отдельно. В первых трех случаях наше утверждение почти очевидно: 1. По свойству 1 определителей каждый минор транспонированной матрицы равен некоторому минору данной матрицы, и обратно. 2. После перестановки двух строк или двух столбцов матрицы Л приходим к новой матрице, каждый минор которой либо равен некоторому минору матрицы Л, либо отличается от некоторого минора матрицы Л только знаком. 3. При умножении всех элементов строки или столбца матрицы на число с одни ее миноры не меняются, а другие умножаются на с; но так как с Ф О, то наивысший порядок отличного от нуля минора этой матрицы не изменится. 4. Рассмотрим матрицу В, получающуюся из матрицы А прибавлением ко всем элементам ее 1-го столбца соответствующих элементов й-го столбца, умноженных на одно и то же число с: Л = 5 = *12 1 и1к Чк *11 *21 итп2 '12 итпг ••• итк аи +са1к .. а2г + Са2к • ¦ а1к ••• ат а2к ••• а2п атг + сап 1-"т1 "т2 ••• "тг ~Т~ "итЬ ••• атЪ ••• атп •* Пусть ранг г (А) матрицы Л равен г. Покажем, что ранг матрицы В не больше чем г. Для этого достаточно показать, что каждый минор матрицы В порядка выше г равен 0. Пусть В будет минор порядка выше г матрицы В. Если Ь не содержит 1-го столбца матрицы В, то он в точности равен соответствующему минору матрицы Л, и, значит, равен 0 как минор порядка выше г, составленный из матрицы ранга г. Если О содержит и 1-й и к-и столбцы матрицы В, то по свойству 4 он тоже равен соответствующему минору матрицы Л, и значит, равен 0,
§ л РАНГ МАТРИЦЫ 37 Наконец, если определитель И содержит 1-й, но не содержит к-го столбца матрицы В, то по свойству 4 его можно представить в виде суммы двух определителей; I) = 0\ + ^2, один из которых равен соответствующему минору матрицы Л, а другой отличается от некоторого минора матрицы Л множителем ±с. (Знак минус здесь получается из-за того, что столбец с элементами а{к может оказаться «не на своем месте». Так, например, Я = *21 241 1 «22 + С*24 «42 + саи а52+С°64 8 Я43 3 *41 2 2Ы йЬ2 3 + С 1 4 4 43 1 *54 *63 Следовательно, каждый из определителей их и 02 равен 0 и О = 0. Таким образом, каждый минор матрицы В порядка выше чем г равен нулю, и значит, гE)< <т(А). Но матрица Л, в свою очередь, получается из матрицы В с помощью элементарного преобразования четвертого типа: чтобы получить матрицу Л, надо к /-му столбцу матрицы В прибавить ее &-й столбец, умноженный на —с. По доказанному, ранг матрицы при этом не увеличивается, т. е. г(А)<г(В). Следовательно, г(А)=г(В). Пример. С помощью элементарных преобразований вычислить ранг матрицы ГЗ 2 1 21 Л= 2 0 -1 1 . ЬО 4 5 1] Решение. Вычитая из третьей строки удвоенную первую, сокращая второй столбец на 2 и вычитая после этого из первого столбца утроенный второй, из третьего — второй и из четвертого — удвоенный второй, последовательно получаем [3 2 1 21 Г 3 1 I 21 Г 0 1 0 01 2 0-1 1 ~ 2 0-1 1 ~ 2 0-1 1 , —6 0 3 —з] 1_— 6 0 3 —З] 1_—6 0 3 —З] где знак ~ указывает, что соединяемые им матрицы получаются одна из другой элементарными преобразованиями и, значит, имеют один И" тот же ранг. Прибавляя далее к третьей строке утроенную вторую, сокращая первый столбец на 2, прибавляя его к третьему и вычитая из четвертого
38 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 и поменяв, наконец, местами первые два столбца, будем иметь 10 1 0 01 ГО 1 0 0] Г1 0 0 0] 20-1 1 ~ 1 0 0 0 ~> 0 1 0 0 . 0 0 0 о] |_0 0 0. 0.1 |_0 О О О] Мы видим, что ранг матрицы А равен 2. § 8. Понятие о линейной зависимости Если обозначить строки матрицы А (см. § 7) через ех = C, 2, 1, 2), е2 = B, 0, -1, 1), е8 = @, 4, 5, 1), то очевидно, что имеет место равенство еъ = 2^1 — Ъе2, понимаемое в смысле поэлементного сложения: каждый элемент строки еъ равен соответствующему элементу строки еи умноженному на 2, без соответствующего элемента строки е2у умноженного на 3. Вообще, если еь е2) ..., ет — строки какой-то матрицы А и, например, ет — а\вх + а2е2 + ,.. + а»-10т-ь A7) где аь аг, ..., ат-\ — какие-то числа, мы будем говорить, что /п-я строка этой матрицы линейно выражается через первые т — 1 ее строк, или что ет является линейной комбинацией строк еи е2, ..., ет-\. Из равенства A7) вытекает, что «1^1 + «2^2 + . . . + ат-1^т-1 — ет = 0, где нуль в правой части понимается как нулевая строка (т. е. как строка, состоящая из п нулей). Мы будем говорить, что строки еи е2, ..., ет матрицы А линейно зависимы, если можно подобрать такие числа ^ь ^> .. •> Т™> не равные нулю одновременно, что 11*1 + Ье2 + • • • + 4™е™ = 0. A8) Если таких чисел *у< не существует, т. е. если равенство A8) имеет место только в том случае, когда все ^ = 0, то говорят, что строки ей е2> ..., ет линейно не- зависимы. Ясно, что если одна из строк матрицы линейно выражается через остальные, то строки этой матрицы меж-
§8] ПОНЯТИЕ О ЛИНЕЙНОЙ ЗАВИСИМОСТИ 39 ду собой линейно зависимы. Обратно, пусть между строками матрицы А имеется линейная зависимость A8). Так как хотя бы одно из чисел ^, например ^т, отлично от нуля, то Уг вт = —: -т-1> ГД11 й21 \-атг Я12 • °22 • атг- ¦¦а1п~ ••агп ' • тп- , о = ап ап Я12- й22 • °Г2- ..а1т\ •а2т\ ¦¦агт\ т. е. в этом случае по крайней мере одна из строк матрицы линейно выражается через остальные. Аналогичное понятие линейной зависимости можно ввести и для столбцов матрицы. Теорема 7 (о ранге матрицы). Если ранг матрицы равен г, то в этой матрице можно найти г линейно независимых строк (столбцов), через которые линейно выражаются все остальные ее строки (столбцы). Доказательство. Пусть дана [пгХп]-матрица А ранга г. Предположим, для определенности, что отличный от нуля минор г-го порядка (так называемый базисный минор) этой матрицы расположен в левом верхнем углу, т. е. что =^0. Докажем, что в таком случае первые г строк матрицы А будут линейно независимы. (Если отличен от нуля не этот, а какой-нибудь другой минор г-го порядка матрицы Л, то линейно независимыми будут именно те строки, которые образуют этот, базисный минор.) Предположим, что, наоборот, эти строки линейно зависимы; тогда одна из них, пусть, для определенности, ег, линейно выражается через остальные: ег = а\ех + а2^2 + . -. + аг^\ег-и Вычтем из г-й строки матрицы А первую строку, умноженную на аь вторую, умноженную на а2, и т. д., наконец, (г—1)-ю, умноженную на аг-ь После таких преобразований г-я строка матрицы А окажется состоящей из одних нулей. При этом определитель Д который, ввиду следствия из свойства 4, не должен был бы меняться, станет равным нулю. Полученное противоречие
40 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 и доказывает линейную независимость первых г строк матрицы Л. Докажем теперь вторую часть теоремы — о том, что все остальные строки матрицы А линейно выражаются через первые ее г строк. Пусть г<к< т и 1 < / < /г,* рассмотрим определитель (г + 1)-го порядка: Он равен нулю при всех к и /: если / < г, то у него два одинаковых столбца, если же />г, то это — минор (г + 1)-го порядка матрицы ранга г. Разложим определитель Д по элементам последнего столбца Д = аиАх +а21А2 + ... + аг1АТ + ак1Аг+х = 0. A9) Алгебраические дополнения Ль А2, ..., Аг> Лг+1 элементов последнего столбца зависят от к, но не зависят от /, так как при их вычислении последний столбец вычеркивается. Кроме того, Лг+1 = О ф 0, и значит, равенство A9) можно разделить на Аг+\\ это дает ак1 = а\ац + а2а2, + ... + «гЯгь А. где коэффициенты аь = — — не зависят от /. Подставляя / = 1, 2, ..., /г, будем иметь акХ = оыаа + а2а21 '+...+ оим, ак2 =¦ а\а{2 + а2а22 + ... +агаг2, ^ап = сс1а1п + а2«2п + . .. + агагп. Но это означает, что к-я строка матрицы А линейно выражается через первые г ее строк: ек = а\е{ + а2е2 + ... + осгег. Следствие 1. Максимальное число линейно независимых столбцов матрицы равно максимальному числу линейно независимых строк, так как при транспони*
§ 91 ПРОИЗВОЛЬНЫЕ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 41 ровании матрицы ее строки становятся столбцами, а ранг матрицы не меняется. Следствие 2. Для того чтобы определитель был равен нулю, необходимо и достаточно, чтобы его строки (столбцы) были линейно зависимы. Действительно, если определитель п-то порядка О равен нулю, то ранг соответствующей матрицы меньше я, и значит, ее строки (столбцы) линейно зависимы. Обратно, если строки (столбцы) определителя линейно зависимы, то ранг соответствующей матрицы меньше я, и этот определитель (л-го порядка) равен нулю. § 9. Произвольные системы линейных уравнений Рассмотрим теперь систему гп линейных уравнений с п неизвестными: #11*1 "Г #12*2 "Г #21*1 "Г #22*2 Г • + #1п*п =Ьь . + а2пхп = Ья, B0) I #т1*1 + #т2*2 + • • • + Я шп^п ^т> где число уравнений не предполагается равным числу неизвестных. Решением системы B0) называется совокупность я значений неизвестных хх = сц, х2 = оьг. . .., хп = ап, при подстановке которых все уравнения системы обращаются в тождества. Система, имеющая хотя бы одно решение, называется совместной; система, не имеющая ни одного решения,— несовместной. Система, имеющая единственное решение, называется определенной; система, имеющая более одного решения,— неопределенной. Рассмотрим две матрицы: матрицу Ау составленную из коэффициентов при неизвестных системы B0), и матрицу В а21 а22 -"а2п Ь2 а Ь Л тпп, тп получаемую из А добавлением столбца свободных членов и называемую расширенной матрицей. Ясно, что
42 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. I г(В)> г(А), так как каждый минор матрицы А будет минором и матрицы 5, но не наоборот. Теорема 8 (критерий совместности системы линейных уравнений). Для совместности системы B0) необходимо и достаточно, чтобы ранг расширенной матрицы В был равен рангу матрицы коэффициентов А. Доказательство необходимости. Предположим, что система B0) совместна, т. е. что существуют такие числа х\ = аь *2 = аг, ..., хп = ап, что Яца1 + я^аг + ... + аыап = Ьи а2\(Х\ + #22а2 + • * • + а2пап = Ь2, ат\а\ + ат2а2 + • • • + ^т«а„ = Ьт. Вычитая из последнего столбца матрицы В первый ее столбец, умноженный на аь второй, умноженный на аг, и т. д., наконец, /2-й, умноженный на ал, мы получим матрицу С = 1 7 ^21 2 *23 "т1 В1П -" ранг которой по теореме об элементарных преобразованиях, равен рангу матрицы В : г(С) = г(В). Но ясно также, что г(С)= г(А)9 так как все ненулевые минеры матрицы С равны соответствующим минорам матрицы Л, и обратно, Следовательно, г (В) = г(А)% Доказательство достаточности. Пусть и предположим, для определенности, что отличный от нуля определитель г-го порядка матрицы А расположен в левом верхнем ее углу: о = г 21 22 *П "г2 7^0. Тогда первые г строк матрицы В линейно независимы, а так как ранг ее в точности равен г, то осталь-
§ 9] ПРОИЗВОЛЬНЫЕ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 43 ные строки матрицы В линейно выражаются через первые г ее строк. Но это означает, что первые гуравнений системы B0) независимы, а остальные т — г ее уравнений «являются их линейными комбинациями», т. е. просто являются их следствиями. В этом случае система на самом деле состоит лишь из г независимых уравнений. Нам достаточно поэтому решить первые г уравнений системы; их решения автоматически будут удовлетворять и остальным т — г уравнениям. Далее возможны два случая: 1. г= п. Тогда систему, состоящую из первых г уравнений системы B0) I #11*1 + #12*2 Г • • • + #1г*Г = ^Ь I #21*1 I #22*2 "Г • • • + #2/"*Г == ^2» I апхх + аг2х2 + ... + аГТхг = ЬГ9 можно решить, например, по формулам Крамера. В этом случае система имеет единственное решение. Она — совместная и определенная. 2. г<л. Возьмем первые г уравнений системы и, оставив в левых частях первые г неизвестных, остальные перенесем в правые части: (#п#1+#12*2 +-.. .+#1Г*г—^1—а1,г+гХг+1—...—а1пхп, I #21*1 + 022*2+• • '+#2г*г—^2~~#2,г+1*г+1—• • •— #2п*п» /01\ I #г1*1 + #г2*2+ • • •тТаггХг — &р #г,г+1*г+1— • • •—агпХп. «Свободным неизвестным» хг+и #г+2, ..., хп можно придавать какие угодно значения, получая при этом соответствующие значения неизвестных хи х2> ... ..., хг из системы B1). Это — случай совместной, но не определенной системы. Общие формулы решения можно получить, если решить систему B1) относительно хи Хъ .. •> *г, например по формулам Крамера. Этим и завершается доказательство теоремы 8: если г(В)=г(А), то система B0)—совместная (определенная или неопределенная), если гE)>г(Л), то система B0)—несовместна.
44 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 Теперь мы в состоянии ответить на вопрос, остававшийся пока открытым: что можно сказать о системе п линейных уравнений с п неизвестными, определитель которой равен нулю. Для такой системы ранг матрицы коэффициентов г<я, так как единственный минор п-го порядка этой матрицы, по условию, равен нулю. Если ранг расширенной матрицы В такой системы тоже равен г, то система будет совместной, но, поскольку /*< <л, неопределенной; если же ранг матрицы В больше г, то система несовместна. Пример. Решить следующие системы уравнений: 1. :х + 2*2+ Злг3= 2, 2. (*1 + 2*2 + 3*3- *4 = О, Х1 — *2 + *3 = О, х± + 3*2 — *3 = —2, ( 3*х + 4*2 + 3*з = 0. Х1 — *2 + *3 + 2*4 = 4, *! + 5*2 + 5*3 — 4*4 = — 4, *! +8*2+ 7*з—7*4 =-8. 3. *! + 2*2 + 3*з — *4 = 0, *1— *2+ *3 + 2*4 = 4, *х + 5*2 + 5*з — 4*4 = — 4, *1 + 8*2 + 7*3 — 7*4 = 6. Решение. 1. Здесь г (А) = 3, г(#) = 3; система совместная, определенная. Так как 1 2 31 1 _1 1 =14^0, 11 3 -!¦ то из первых трех уравнений системы, например по формулам Крамера, находим *1 = —1, *2 = 0, *3 =1. 2. Здесь г (А) =2, г (Я) = 2; система совместная, но яе определенная. Определитель 1 2 1 -1 — 3^0, и из первых двух уравнений системы Г *! + 2*2 = — 3*з + *4, 1*1— *2 = 4 — *8 — 2*4
§1D ОДНОРОДНЫЕ СИСТЕМЫ 45 находим _А А ¦ - А А I где неизвестным х3 и Хк можно придавать любые значения. 3. Здесь г (Л) «= 2, г (В) = 3, и система несовместна, § 10. Однородные системы Однородные линейные уравнения — это уравнения, свободные члены которых равны нулю: I апх1 + а12х2 + ... + а1пхп = 0, I апХх + #22*2 + • • • + а2пХп ~ 0' /22\ V ^7711-^1 *+" ^Ш2^2 "Ь • • • + атппХп. == 0« Система B2) однородных уравнений (или однородная система линейных уравнений) всегда совместна, так как имеет, например, нулевое решение: Х\ = 0, х2 = 0, .,., хп = 0 (т, е, решение, в котором значения всех неизвестных равны нулю). Это следует также из теоремы 8, так как в этом случае, разумеется, г (В) = г (А). Важно выяснить, при каком условии однородная система B2) является неопределенной, а значит,— что бывает особенно важно — имеет и ненулевые решения. Ответ на этот вопрос дает следующая Теорема 9. Для того чтобы система B2) имела ненулевые решения, необходимо и достаточно, чтобы ранг г ее матрицы коэффициентов был меньше п. Действительно, если г = п, то, как видно из доказательства теоремы 8, система B2) имеет единственно е и, значит, только нулевое решение: Если же г<п, то система B2) является неопределенной (ведь несовместной она быть не может), и значит, она имеет бесчисленное множество решений, в том числе и бесчисленное множество ненулевых решений. Из доказанной теоремы непосредственно вытекает
46 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 Теорема 10. Для того чтобы однородная система п линейных уравнений с п неизвестными обладала ненулевыми решениями, необходимо и достаточно, чтобы ее определитель И был равен нулю. Доказательство. Условие О = 0 здесь необходимо, так как если й Ф 0, то система имеет единственное и, значит, только нулевое решение. Это условие также и до ст ат оч но, так как если В = 0, то ранг матрицы коэффициентов системы г</г, и система имеет бесчисленное множество (ненулевых) решений. Пусть Х\ =аь х% = сс2, .»., хп = (Хп — какое-нибудь ненулевое решение однородной системы B2). Это решение можно рассматривать как строку в\ = (аь а2у ..., ап), состоящую из п элементов. Тогда строка св\ = (са\, са2, ..., сап) тоже, очевидно, будет решением системы B2). Далее, если — какое-то другое решение системы B2), то при любых С\ нелинейная комбинация С1е1 + с2е2=(с1а1+С2$и ^2 + ^2, .¦., схап + с2$п) этих решений тоже будет решением системы, так как если вцоы + йг2а2 + ... +аыап = О, 0Ц$\ + «<2р2 + . . . + СЦп^п = О, то и аг\{сха1+с2$1)+а12{сха2+с2$2)+. . .+аы(с1ап+с2$п)=0. Итак, любая линейная комбинация решений однородной системы B2) тоже будет ее решением. Интересно поэтому найти такие линейно независимые решения системы B2), через которые линейно выражались бы все остальные ее решения. Линейно независимая система решений в\у е2, ..., ек уравнений B2) называется фундаментальной,
§10] ОДНОРОДНЫЕ СИСТЕМЫ 47 если каждое решение системы B2) является линейной комбинацией решений еи е2, ..., ек. Теорема 11 (о существовании фундаментальных систем решений). Если ранг г матрицы коэффициентов системы уравнений B2) меньше п, то эта система обладает фундаментальными системами решений. Доказательство. Пусть ранг г матрицы А коэффициентов системы B2) меньше /г, и пусть, для определенности, минор В г-го порядка, стоящий в левом верхнем углу матрицы Л, отличен от нуля: А = *21 0 = *1т ФО. Перенеся свободные неизвестные хг+и ..., хп первых г уравнений системы B2) в правые части, получим систему ( #11*1 + #12*2 4" • • • + а1гХг = — а1)Г+1*г+1 — • • • — #1т1*/1 #21*1 I #22*2 Т" • • • г #2г*г ~ #2,г+1*г+1 • • • #2п*7г> I #г1*1 ~Ь #г2*2 4" ' • • + #гг*г = — аг>г+1*г+1 — • • • — #Г71*п« B3) Придавая свободным неизвестным значения ХГ+\ =. 1, ХГ + 2 = 0» • • •! *П = О, получим соответствующие значения х\ = аь *2 = а<2> ..« ,.., #г = аг первых т неизвестных. Это дает нам строку — решение системы B2) (аь а2, ,.., аг, 1, 0, ,.., 0). Аналогично, придавая свободным неизвестным значения хг+\ = О, л:г+2 = 1, ..., хп = О и вычисляя соответствующие значения неизвестных *1 = Рь *2 = р2, . ..,*,= Рг, ПОЛУЧИМ СТрОКу (Рь 02, ..., Рг, 0, 1,..., 0), и т. д. Так мы найдем всего й = п — г решений системы B2): е\ =(«ь ос2, .,., аг, 1, 0, ,,., 0),
48 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. ! *2=.(Рь рг, • .., Рг, 0, 1,..., 0), B4) ** = F1,62, ..,&, 0, 0, ..., 1). Эти к строк между собой линейно независимы, ибо ранг образованной ими матрицы Го^ аа ... аг 1 0 ... 0 Р2 Р2 ...Рг 0 1 ... 0 1_5Х |2 ... бг о о ... 1 в точности равен к. (В этой матрице есть отличный от нуля минор к-то порядка, например, содержащий по* следние к столбцов.) Покажем теперь, что решения е\, е2, ..., ек B4) действительно образуют фундаментальную систему. Для этого остается показать, что каждое решение системы B2) линейно выражается через еи е2, ..., ек. Итак, пусть е = (#ь Ф2, ..., Ог, Ог+ь ..., Оп) — произвольное решение системы B2), Рассмотрим строку е0 = е — Ъг+\е\ — Ог+г^г — • • ¦ — ^Л. Легко видет, что все элементы, состоящие на последних к местах этой строки, равны нулю, т. е. что ео — (рь ра, . •., рг, 0, 0, ,.., 0). Будучи линейной комбинацией решений, строка е0 сама будет решением системы B2). А так как значения всех свободных неизвестных в е0 равны нулю, то из однородной в этом случае системы B3), определитель которой отличен от нуля, получаем, что и значения всех остальных неизвестных в е0 должны быть равны нулю, т. е. что в0 есть нулевая строка: е0 = е — Ог+1<?1— Фг+2*2 — ... — Ф«А = @, 0, ..., 0), и е = Ог+1 ех + Ог+2 е2 + .,. + ЬпекУ B5) что и требовалось доказать.
|ГО] ОДНОРОДНЫЕ СИСТЕМЫ 49 Заметим, что для того чтобы получить фундаментальную систему решений, мы могли бы придавать свободным неизвестным и какие угодно другие значения, лишь бы соответствующий определитель к-то порядка был отличен от нуля. Так можно найти сколько угодно фундаментальных систем решений, каждая из которых состоит из к = п — г строк. Из результатов следующей главы будет видно, что любая фундаментальная система решений уравнений B2) состоит в точности из п — г решений. Таким образом, можно сказать, что общее решение системы B2) линейных однородных уравнений имеет вид с\ех + с2е2 + ... + скек, B6) где е\% е2> •. •> еЛ какая-то (какая угодно!) фундаментальная система решений, а Си с2> ,.., ск — произвольные числа. Сделаем еще одно, важное для дальнейшего, Замечание. Рассмотрим систему уравнений [ #11*1 I #12*2 "Г • • • Т* #1п*п == ^1> I а21.#1 + #22*2 "Г • • • ~Г #2/г*Л = ^2» /П7\ I #го1*1 + #т2*2 4" • • • + атпхп == "т и соответствующую ей систему однородных уравнений ( #11*1 + #12*2 + • • • + #1п*Л = ^> I #21*1 ~Г #22*2 "Г • • • "Т #2п*Л == *Л /оО\ 1#т1*1 + #т2*2 + • • • + ЯтпХп = 0. Пусть е\ = (аь а2у ..., ап)— какое-то фиксированное решение системы B7) и е2 = (Рь Рг, ¦ • •» Рп) — любое другое ее решение. Тогда разность е\ — е2 = (ах — Рь а2 — р2, ¦.., ап — рп) будет решением системы B8): если ац<х\ + ##а2 + ,.. ... + #<п(Хп =Ь{ и апр1 + а12р2 + •.. + я<»Р» = Ъи то ац (оц—Р0 +ай (а2—Рг) + . ¦ ¦ +#*п (ап—Рп) = &«—&<=0.
50 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. I Далее, если еъ = (^ь Ь> • • •» Ч*)— произвольное решение однородной системы B8), то строка е1 + е3 = •= («1 + Ть «2 + Т2, * •., «п + тг») будет удовлетворять системе B7); если а^оц + ай«2 + ... + а{пап = 6, и Ъ\Ь + я«Т2 + •. • + сЦпЧ* = °> то ац(а1+Т1)+ай(а2+Т2)+ . •. +Ят(ая+т») ==6«+0=.6«. Отсюда следует, что все решения системы B7) можно получить, прибавляя к одному какому-нибудь ее решению всевозможные решения однородной системы B8), Иными словами, общее решение системы B7) равна сумме общего решения однородной системы B8) и произвольного, но фиксированного решения системы B7): если еи е2у *.., ек — фундаментальная система решений однородной системы B8) и е0 — произвольное фиксированное решение системы B7), то общее решение системы B7) имеет вид ео + схех + с2е2 + • • • + скек9 где си с2> * • •> ск — произвольные числа. § 11. Метод Гаусса Формулы Крамера, представляющие большой теоретический интерес, серьезного практического значения, однако,.не имеют, так как их применение приводит к слишком громоздким вычислениям. Практически для решения систем линейных уравнений чаще всего применяется метод Гаусса, состоящий в последовательном исключении неизвестных по следующей схеме. Для того чтобы решить систему уравнений ( #11*1 + #12*2 + • • * + а1пХп = &Ъ I #21*1 Т" #22*2 ~Т~ • • • 4" #2п*л == * /О0\ 1#т1*1 "г #т2*2 ~г • • • "~Г #тм*п — ^т> выписывают расширенную матрицу этой системы: Г«ц а12 •••аШ *21 а22 •••в2п \-ат1 атп2 • * * атпп &2 *» ^
§ И] МЕТОД ГАУССА 51 где чертой отделен столбец свободных членов; затем над строками матрицы В производят элементарные преобразования: разрешается изменять порядок строк (что соответствует изменению порядка уравнений), умножать строки на любые отличные от нуля числа (что отвечает умножению соответствующих уравнений на эти числа) и прибавлять к любой строке матрицы В любую другую ее строку, умноженную на любое число (что соответствует прибавлению к одному из уравнений системы другого уравнения, умноженного на это число). С помощью таких преобразований каждый раз получается расширенная матрица новой системы, равносильной исходной. При этом стараются привести матрицу В к возможно более простому виду, из которого решение системы видно непосредственно. Рассмотрим подробнее метод Гаусса на трех конкретных примерах. 1. %1 *2 "Г %3 == *Л Х\ -р оХ% Х$ = /, Зхх + 4л;2 + Зх3 = 0. C0) Расширенная матрица этой системы имеет вид 1 2 1 —1 1 3 1.3 4 2" 0 —2 0. Вычитая первую строку из второй и из третьей и утроенную первую из четвертой, получим матрицу 1 0 0 0 2 -3 1 —2 3 —2 —4 —6 21 —2 —4 —б] Эта матрица — расширенная матрица системы о#2 ^Х3 = ^, Хо 4#о = — 4, ¦2х, C1) 6лг3 = - 6,
52 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 1 которая получается из заданной системы C0), если первое уравнение вычесть из второго и третьего, а утроенное первое вычесть из четвертого. Поэтому система C1) является следствием системы C0) — каждое решение системы C0) будет удовлетворять и системе C1). Но и обратно, система C0) может быть получена из системы C1) посредством аналогичных преобразований: первое уравнение прибавляется ко второму и третьему, а утроенное первое — к четвертому. Поэтому система C0) будет, в свою очередь, следствием системы C1), и значит, обе системы равносильны — они имеют одни и те же решения. Далее, прибавив утроенную третью строку ко второй и удвоенную третью к четвертой, получим Г1 2 3 0 0 —14 0 1 —4 Ь 0 —14 21 —14 —4 —Ш 3 1 —4 0 21 1 ~4 о] Вычитая вторую строку из четвертой и сокращая ее на — 14, будем иметь 1 2 о о о 1 .0 0 Но это — расширенная матрица системы *2 4*3 = 4, равносильной заданной системе C0), и вначит, решением системы C0) будет Хз=1, *2=— 4+4*3=0, *1«=2—2*2 —3*з = 2—3 = —1, В этом случае ранг расширенной матрицы равен рангу матрицы коэффициентов и равен, очевидно, трем. [ *! + 2*3 + 3*з — *4 = 0, *1 *2 "Г *з "Г *х& == 4, *! + 5*2 + 5*з — 4*4 = — 4, *х + 8*2 + 7*3 — 7*4 = — 8.
*И] МЕТОД ГАУССА 63 Выписав расширенную матрицу этой системы, после очевидных преобразований получим Г1 1 1 и 2 3 -1 1 5 5 8 7 -1 2 —4 —7 0" 4 —4 -8. /->• 0 0 ^0 2 —3 3 6 3 —2 2 4 -1 3 —3 —6 /**/ 1 °~ 4 —4 /**/ —8^ 2 0 -3 0 0 _0 0 3 -2 0 0 —I 3 0 0 01 4 0 о^ откуда 1*1+2*2+3*3—х4=0, (__3х2_2*з+3*4 = 4, и значит, _ _ 4 ___2_ *2 ~"о~ о %3 I #4» *1 — —~" -^*2 <Э*3 + #4 — Г "^3 ^4* Здесь ранг расширенной матрицы равен рангу матрицы коэффициентов и равен, очевидно, двум. ( *1 + ^*2 + ^-^3 — "^4 ==: ^> *х *2 + *3 + ^4 ~ ^> *! + 5*2 + 5*з — 4*4 = — 4, *х + 8*2 + 7*з — 7*4 = 6. Имеем, очевидно, 1 1 1 1 2 3 —1 1 5 5 8 7 —1 2 —4 —7 0" 4 —4 6. />*/ 1 12 3 —1 0—3—2 3 0 3 2—3 1_0 6 4—6 0 4 -4 6^ 1 3 -1 0 —3 —2 0 0 0 1.0 0 0 0 4 0 ил и значит, система несовместна, так как равносильная ей система содержит уравнение (Ь*1+0-*2+0-*з+0-*4=14 (последняя строка). Здесь ранг матрицы коэффициентов равен, как легко видеть, двум, а ранг расширенной матрицы равен трем,
64 ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. I Пример. Методом Гаусса решить однородную систему уравнений *1 + 2*2 + З^з + 4л-4 + 5*5 = О, 2*х + 3*2 + 4*3 + 5*4 + *б =0» 3*х + 4*2 + 5*з + *4 + 2*5 = 0, *1 + 3*2 + 5*з + 12*4 + 9*5 = О, 4*х + 5*2 + 6*з — 3*4 + 3*5 = 0. и найти ее фундаментальную систему решений. Решение. Выпишем расширенную матрицу системы (при этом нулевой столбец можно, конечно, не писать). После понятных преобразований будем иметь 12 3 4 2 3 4 5 3 4 5 1 1 3 5 12 4 5 6—3 5" 1 2 9 3_ /^/ ~ 0 0 0 _0 0 0 0 1о 2 —1 0 0 0 2 —1 —2 1 —3 3 —2 0 0 0 3 4 5" _2 —3 —9 —4 —11 —13 2 8 4 _б —19 —17_ 4 5^ -3 -9 -5 5 5 -5 -10 10_ />/1 1 />и 2 3 0 1 2 0 0 0 0 0 0 _0 0 0 4 5 3 9 —1 1 0 0 0 0 т. е. заданная система равносильна следующей: [ *1 + 2*2 + 3*з+ 4*4 + 5*6 = 0, х2 + 2*3+ 3*4 + 9*5 = 0, ^ *4 + *5 =0. Здесь г = 3, и три неизвестных можно выразить через остальные, например, так: X* = *5, *2 = — 2*з — 3*4 — 9*5 = — 2*з — 12*5, *1 = — 2*2 — 3*3 — 4*4 — 5*5 = *3 + 15*5. Фундаментальную систему можно получить, если свободным неизвестным *з, *5 придавать значения *3 = 1, *5 = 0 (тогда *1 = 1, *2 = —2, *4 = 0) и значения *3 = О, *5 = 1 (тогда хх = 15, *2 = —12, *4 = 1). Это дает фундаментальную систему решений: е, = A, —2, 1, 0, 0), е2 = A5, —12, 0, 1, 1). Общее решение системы имеет вид е = а\ех + а2е2 = (а{ + 15а2, —2а1 — 12а2, аь а2, а2), где «1 и ад — произвольные числа.
ГЛАВА II I л-МЕРНОЕ ПРОСТРАНСТВО § 1. Что такое поле В первой главе мы рассматривали системы линейных уравнений, коэффициентами которых являются числа. Мы намеренно не уточняли, какие именно числа; читатель мог считать эти коэффициенты произвольными вещественными числами — тогда и решения системы будут вещественными. Однако с тем же успехом он мог считать, что это — комплексные числа; тогда и решения системы были бы образованы комплексными числами, но все теоремы из главы I остались бы справедливыми и для этого случая. С другой стороны, можно было бы ограничиться рассмотрением систем уравнений, скажем, с рациональными коэффициентами. Их решения будут образованы тоже рациональными числами, но все предложения первой главы останутся справедливыми. Здесь все дело в том, что вещественные числа (а также комплексные или одни только рациональные числа) можно складывать и перемножать по известным правилам арифметики, получая при этом такие же числа. Это выражают словами: вещественные числа (а также комплексные, рациональные числа) образуют поле. Полем называется множество Р элементов *), для которых определены две алгебраические операции — сложение и умножение (так что сумма а+Ь и произведение аЬ любых двух элементов а и Ь из Р принадлежат Р), причем выполнены следующие условия (аксиомы пол я): 1. а+Ь = Ь-\-а для всех а, Ь из Р (сложение коммутативно). *) Предполагается, что множество Р состоит более чем из одного элемента.
56 Л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II 2. {а-\-Ь) +с=а+ (Ь+с) для всех а, Ь, с из Р (сложение ассоциативно). 3. В множестве Р имеется нуль, т.е. такой элемент О, что для каждого а из Р сумма а + 0 = а. 4. Для каждого а из Р существует такой (противоположный а) элемент —а, что а+ (—а) = 0. 5. аЬ = Ьа для всех а, Ь из Р (умножение коммутативно). 6. (аЬ)с=а(Ьс) для всех а, Ь, с из Р (умножение ассоциативно). 7. В множестве Р имеется единица — такой элемент 1, что для всякого а из Р имеем а • 1 = ач 8. Для каждого отличного от нуля элемента а из Р имеется такой {обратный а) элемент а, что аа~1=1. 9. (а+Ь)с=ас-\-Ьс для всех а, Ъ, с из Р (умножение дистрибутивно относительно сложения). Ясно, что если коэффициенты системы линейных уравнений с п неизвестными принадлежат полю Р> то и решение ее (если оно существует) следует искать среди наборов из п элементов поля Р. Поля, которые на практике встречаются чаще всего,— это поле вещественных чисел, поле комплексных чисел и (реже) поле рациональных чисел. Поле рациональных чисел является, очевидно, частью (или, как говорят, подполем) поля вещественных чисел; последнее же содержится в качестве подполя в поле комплексных чисел. В дальнейшем, говоря о числах, мы всегда будем иметь в виду элементы некоторого фиксированного числового поля Р — обычно это будет либо поле вещественных чисел, либо поле комплексных чисел. Полагая, что с полем вещественных чисел читатель достаточно знаком, мы изложим кратко необходимые для дальнейшего сведения о комплексных числах. § 2. Поле комплексных чисел Комплексным числом называется выражение вида а-\-Ы (или, что то же самое, а+#>), где а и Ъ — любые вещественные числа, а I — некоторый новый символ. По определению, а + Ы = с -\- сН в том и только в том
§2] ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ 57 случае, если а = с и 6 = й. По определению же, а — Ы = а + (--&)/, (а + Ы) + (с+A1) = (а + с) + (Ь + аI и (а +Ы) (с + Л) = (ас — М) + (Ьс + ш/) е. Легко видеть, что так определенные сложение и умножение комплексных чисел коммутативны и ассоциативны (проверьте это!). Комплексное число 0+0* можно обозначить просто через 0: для любого комплексного числа а = а + Ы имеем а + 0 = (а + 60 + @ + 00 = (а + 0) + F + 0) I = = а + Ы = а. Комплексное число — а = (— а) + (— 6)/ будет противоположным а, так как а+(-а) = (а + 6/) + [(-а) + (-6)/]=0. Комплексное число 1 + 0* обозначим просто 1: для любого комплексного числа а = а + Ы произведение а • 1 равно а, так как а. \= (а + 60A +00 = (а- 1-6-0) + + F- 1+а-0)* = а. Далее, для каждого комплексного числа а = а + Ы Ф 0 существует обратное ему число а-1 = -^ 2 —г 2*> а + Ь а + Ь произведение которого на а равно 1: * / \ и-\ I а Ь \ а2 + Ь2 . Ьа — аЬ . , аа_1 = <а + ь*GТь* ~ 7+^ Ч = 7Т^ + ?Т^' = Ь Наконец, сложение и умножение комплексных чисел связаны дистрибутивным законом — это легко проверяется непосредственно. В множестве комплексных чисел рассмотрим числа вида а + 0* — такое число можно обозначить просто через а (выше мы уже сделали это для 0 и 1). Сумма таких чисел а = а + 0/ и 6 = 6 + 0/, равная (а + 00 + F + 00 = (а + 6) + 0/ = а + 6,
58 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. И и их произведение (а + 01) {Ь + 01) =аЬ + 01 = аЪ имеют такой же вид. Таким образом, числа вида а+ 01 = а в поле комплексных чисел образуют подполе, которое можно отождествить с полем вещественных чисел. Заметим, что с • (а + Ы) = (с + О/) (а + Ы) = са + сЫ. Далее имеем @ + I) @ + 0 = — 1 + 01 = — 1. Число 0 +1 можно обозначить просто I. При этом Р = I. I — — 1. Далее, любое комплексное число а + Ы = (а + 00 + @ + Ы) = а + Ь@ + I) можно рассматривать как сумму вещественного числа а и произведения (вещественного) числа Ъ на г, число а называется «вещественной частью», а Ы — «мнимой частью» комплексного числа а + Ы. Число а = а — Ы называется комплексно-сопря- Рис 2 женным к а = а + Ы._Легко _ видеть, что а + E = а + Р> а$ = а(* и что а = а 0 гож и только в том случае, когда а вещественно (проверьте это!). Заметим, что сумма а + а = (а + Ы) + (а — Ы) = 2а и произведение аа = п= (а + &0 (а — &0 = а2 + Ь2 комплексно-сопряженных чисел вещественны. Комплексные числа удобно изображать точками, или, лучше — векторами плоскости. Комплексному числу а + Ы отвечает вектор ОМ, где М — точка с координатами {а, Ь) в прямоугольной декартовой системе координат (рис. 2). Пусть вектор ОМ представляет комплексное число а = а + Ы. Тогда угол <р = хОМ называется аргументом числа а (этот угол определен с точностью до крат- У- 0 ^—*Тр а А м1 х
§2] ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ 59 ного 2я), а г=\ОМ\—его модулем (заметим, что г 2*0). Таким образом, ф и г — это просто полярные координаты точки М. Так как а = гсозф, Ь = г зш ф, то а-\- Ы = Г С05 ф -|- Г 51П ф I = Г (СОЗ ф + I 31П ф) — это так называемая тригонометрическая форма комплексного числа. При этом, очевидно, г= У^а2 + Ь2, соз ф = а . 6 = —, 31Пф = —. Вычислим произведение двух комплексных чисел, заданных в тригонометрической форме. Пусть а = = /*1(С05ф1 + /5111 ф1), [5 = /*2(С05 ф2 + * 51П ф2). Тогда «Р = Г{Г2[ (СОЗ ф1 СОЗ ф2 — 51П ф1 ЗИ1 ф2) + + I (СОЗ ф1 51П ф2 + 51П ф1 СОЗ ф2) ] = = /-1Г2[с05 (ф! + ф2) + / ЗШ (ф1 + ф2)]. Таким образом, при перемножении комплексных чисел их модули перемножаются, а аргументы складываются* Отсюда легко выводится, что при делении комплексных чисел их модули делятся, а аргументы вычитаются. Если а = а + Ь1 = г (соз ф + * зт ф), то комплексно- сопряженное число а = Г (СОЗ ф — I 51П ф) = Г [СОЗ (— ф) + I 31П ( — ф) ] имеет тот же модуль г и противоположный аргумент — ф. Произведение аа = г2, и значит, модуль г комплексного числа а равен}/ аа. Заметим, что если модуль а равен 1 (г = 1), то аа = 1, и значит, а = а. Далее, при любом целом положительном п имеем ап = [г(С05ф + I 51Пф)]п = ГП(С05 Пф + X 31П Пф) — это так называемая формула Муавра. Рассмотрим еще операцию извлечения корня из комплексного числа. При этом мы ограничимся корнями из единицы. Общий случай читателю предлагается рассмотреть самостоятельно. Мы имеем, очевидно, 1 = созО+(зтО. Однако аргумент комплексного числа определен не однозначно, а
60 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II с точностью до кратного 2я,— и здесь нам будет важно, что число 1 можно представить так: 1 = сов 2лк -\-1 зт 2яй, где к — любое целое число: к = 0, ±1, ±2, ... Пусть у 1 = г (соз ф + I зт ф). Тогда, по формуле Муавра, 1 — гп(соз Пф + /зтпф) и, значит, 1 = тп и 2пк = Мф, откуда г = 1 (ибо модуль комплексного числа—вещественное положительное число) и ф = 2лк =—, т. е. п у «/-г 2лк , . . 2пк и г\ 1 п у I = соз Ь I зш—, & = 0, ± I, ± 2, ... 2кк 2тск Положим гк = соз Н*51п—• При&=0,1,2,..., п—1 1 2я , , . 2я 4л , получаем е0=1, ех = соз—+ *51п—, е2 = соз — + . . . 4я л 2(л—1)я . . . 2(п— 1)я + * 51П — , . . ., 8^ = СОЗ —'• [- I 31П— Если изображать комплексные числа точками плоскости (см. рис. 2 выше), то полученные при к = 0, 1, 2, ... ,.., п — 1 значения гк будут расположены в вершинах правильного п-угольника, вписанного в единичную окружность; одна из вершин этого п-угольника находится в точке A,в 0). При остальных значениях к мы не получим новых значений корня из 1, так как, например, еп = соз — П + 1&Ш— п = 1 = е0, 8п+1 = соз -^ (п + 1) + 131П ~ (л + 1) = еь и т. д. — эти значения будут периодически повторяться. Аналогично, в-х = СОЗ ^— -^1 + I 51П ( — -~] = 8Л>Ь 8_2 = 8П_2, и т. д. Таким образом, корень п-й степени из 1 имеет ровно п различных значений. Произведение двух корней п-й степени из 1 тоже есть корень п-й степени из 1 (легко проверить, что еРед ==.
§2] ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ 61 = гр+я). Любая (целая) степень корня п-й степени из 1 тоже будет корнем п-й степени из 1. Рассмотрим несколько примеров. При п = 2 имеются 2 (изображенные на рис. 3) корня из 1: 80 = I И 8Х = С05-у + ГЗШ-^-= — 1; при /1 = 3 — три корня 1. 81 = 1 + *Т/3 е,= — 1 — г Уз расположенных в вершинах правильного треугольника. При п =з 4 корни из 1 — ЭТО 8о =1, 81 = I, 82 = — 1» 8з = —* (они расположены в вершинах квадрата). При п = 6 корни из 1 образуют правильный шестиугольник с вершинами - _! 8 в !+< КЗ «V 2 - 1 + *У з 2 е8= — 1, Пусть во, 8ь ..., Сп-1 — корни /г-й степени из 1. Если возвести 81 в различные (целые, положительные) степени к = 1, 2, 3, ..., п, мы получим по одному разу все корни п-й степени из 1, так как, очевидно, е! 61 — г21 ..«?-! Аналогичным свойством могут обладать и другие корни из 1. Так, при п = 4, возводя в степени 1, 2, 3, 4 корень 88> е3 == — 1 = 82> 83 = I = 8Ь 83: -I, мы получим гъ •¦ е| = 1 = е0 — тоже все корни четвертой степени из 1. Корень п-й степени из 1, при возведении которого в степени к = 1, 2, 3, гтж, п получаются по одному разу все
62 л-МЕРНОЕ ПРОСТРАНСТВО (ГЛ. II корни п-степены из 1, называется первообразным. Так, при я = 4 корни в\ = 1 и е3 = —I являются первообразными, корень же 82 = — 1 первообразным не является, так как г\ = е2, г\ — е0, г\ = е2, г\ = е0. § 3. Определение векторного пространства Мы начнем с примера, хорошо известного читателю. В геометрии важную роль играет понятие вектора, или направленного отрезка. Векторы можно складывать между собой и умножать на числа. Сумма ОС векторов о » > О А В Рис. 4. ОА и ОВ определяется как диагональ параллелограмма ОАСВ (рис. 4, а; это определение можно распространить и на тот случай, когда прямые ОА и ОВ совпадают), а произведение 00 вектора О А на число а опре- деляется из условий: 00= \а\ • О А и векторы 00 и ОА направлены в одну сторону, если а>0, и в противоположные стороны, если а < 0 (рис. 4, б). Но совокупность всех плоских или всех пространственных векторов — это только примеры (хотя и очень важные примеры) векторных пространств. В главе I мы видели, что если имеются два решения е\=(аи а2, ..., ап) и е2=(Рь Рг, ..., М некоторой системы линейных однородных уравнений, то их сумма ех + е2= (а\ + Рь «2 + [Ь, ..., ап + рп) и произведение любого из них, например е\ на произвольное число с (которое естественно считать принадлежащим тому же числовому полю Р, что и коэффициенты уравнений): се\ = (сссь са2, ..., сап) тоже будут решениями той же системы. Аналогичная ситуация, когда имеется "множество каких-то элементов, которые можно склады- ОС=ОВ+ОА
$ 3] ОПРЕДЕЛЕНИЕ ВЕКТОРНОГО ПРОСТРАНСТВА 63 вать между собой и умножать на числа, получая в результате элементы того же самого множества, встречается в математике очень часто. Так, например, складывать между собой и умножать на числа можно многочлены от I с вещественными или комплексными коэффициентами — в результате получаются такие же многочлены. Если складываются и умножаются на числа многочлены, степени которых не превосходят данного числа п, то и полученные при этом многочлены будут степени не выше /г. Складывать между собой и умножать на числа можно и произвольные функции от I — в результате снова получаются функции от /. Если функции, к которым применяются эти операции, непрерывны на каком-то отрезке [а, Ь] (или, скажем, на всей числовой прямой), то и полученные в результате функции обладают тем же свойством. Наконец, разумеется, и просто числа, образующие некоторое поле Р, можно складывать между собой и умножать на числа из Р\ более того, вместо одного числа можно рассматривать пары, тройки и вообще упорядоченные наборы (строки), состоящие из п чисел: (*ь х2у ..., хп) (такие строки выше служили решениями данной системы линейных уравнений, теперь же от них не требуется ничего!). Строки можно складывать: (*1, #2, • . ., Хп) + (Уи У2, • . ., Уп) = = (*1 + Уи х2 + у2, ..., хп + Уп) и умножать на числа: с(хи х2у ..., хп) = (схи сх2, ..., схп), получая всякий раз такую же строку Все это —различные примеры векторных пространств (причем последний пример особенно важен для дальнейшего). Для того чтобы охватить все эти и другие возможные случаи, введем такое Определение 1. Множество Я элементов х, у, 2, ... называется векторным, или линейным, пространством, если для любых двух его элементов х, у опреде-
64 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II лена сумма х + у е /? *) и для каждого элемента л; е /? и каждого -числа а (взятого из фиксированного число- вого поля Р) определено произведение ах&К, причем выполнены следующие условия: 1. х-\-у = у + х для всех х, у е /?. 2. (х + у) + г = х + (у + г) для все* х, у, г& /?. 3. Существует такой (нулевой) элемент Ое/?, что л: + 0 = х для всех элементов х е /?. 4. Для каждого элемента хе^ существует такой элемент — * (называемый противоположны м кх), «/го х+ (—х) = 0. 5. 1 • х = х для всех х е /?. 6. а(|}л;) = (оф)л: для <зсе* а, р е Р и х е Л **). 7. (а + Ю* = &х + Р* для б^* а» Р е Р и а: е /?. 8. а (х + у) = ах + ау для все* а е Р и х, у е К. Элементы векторного пространства называются векторами. Поле р во всем дальнейшем мы будем считать либо полем вещественных, либо полем комплексных чисел и, в соответствии с этим, будем говорить о вещественном или о комплексном пространстве /?. Иногда же, не уточняя, о каком именно поле идет речь, мы будем говорить о векторном пространстве /? над полем Р. Примеры. Можно говорить о векторном пространстве Рп многочленов степени не выше п с вещественными или комплексными коэффициентами, о векторном пространстве С функций, непрерывных на данном отрезке [а, Ь]у о векторном пространстве решений данной системы линейных однородных уравнений, наконец, просто о векторном пространстве строк, состоящих из п (вещественных или комплексных) чисел. Из определения 1 непосредственно вытекают следующие *) Символы е, 5, сг называются знаками включения. Запись а ^ А означает, то а является элементом множества А. Запись ДеВ означает, что множество А является частью множества В (т. е. что каждый элемент а из А принадлежит также и В)\ запись А а В означает, что множество А является правильной частью множества В, т. е. что А содержится в В, с ним не совпадая. **) Чтобы не путать векторы с числами, мы в тех случаях, где может возникнуть недоразумение, условимся обозначать числа греческими, а векторы — латинскими буквами,
$4] РАЗМЕРНОСТЬ И БАЗИС 65 Простейшие свойства векторного пространства. 1. Единственность нуля. Предположим, что в пространстве /? имеются два нулевых элемента, О1 и 02. Тогда, так как для любого х из /? имеем * + 01 = * и х + 02 = х} то, в частности, 02 + °1 = °2 и О1 + 02 = 0Ь откуда, ввиду О1 + 02 = 02 -+- 0Ь получаем О1 = 02. 2. Единственность противоположного элемента. Предположим, что у элемента х имеются два противоположных элемента, у и г; тогда х + у = 0 и х-\-г = 0. Следовательно, У + х ¦{- г — у -\- (х + г) = у + 0 = у и у + х + г= (^ + дО + * = 0 + * = г, откуда у = г. 3. Для каждого элемента х е /? произведение Одг= = 0*). В самом деле, для каждого х имеем 0х= ==@ + 0)х = 0х-\- Ох. Прибавляя к левой и правой частям последнего равенства —Ол:, получим 0 = Оде. 4. Для любого а е Р и 0е/? произведение аО = 0. Действительно, аО = а@ + 0) = аО + аО. Прибавляя к левой и правой частям равенства —аО, получим 0 = аО. 5. Если произведение а*=0, то либо а=0, либо х = 0. В самом деле, пусть а ф 0; тогда х = 1'х = (та)х вт(ах> = т ° = °- 6. Для каждого х элемент (—\)х является противоположным к х. Действительно, х + (—1)*=1.я-{- + (— \)х= [1 + (— 1)]лг = 0 - х = 0, и значит, (—1)* = —х. Ввиду условия 2 определения 1, можно говорить о сумме трех х+-у + г=(х + у) + г (или, что то же самое, х + (у + г)) (и большего числа) элементов из /?. Разностью х — у векторов х и у называется вектор г = х+ (—у). § 4. Размерность и базис Определение 2. Векторы аь а2, ..., ак векторного пространства /? называются линейно зависимыми, если существуют такие числа аь а2, ..., аЛ, «в равные *) Один и тот же символ 0 употреблен здесь и как число (слева) и как вектор (в правой части). Здесь и дальше из контекста всегда будет ясно, что означает символ 0 — число нуль или нулевой вектор. 3 Л. И. Головина
66 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II одновременно нулю, что «101 + а2а2 + • • • + «аЯ* = О- Векторы, не являющиеся линейно зависимыми, называются линейно независимыми. Если векторы а\, а2, ..., ак линейно зависимы: а\ах + а2а2 + <.. + акак = О, и, например, ак ф О, то а1 а2 аА-1 ак = --а1- — а2-...-ч--ак-ъ или ак = \\ах +Ъа2 + ... + Ьк-1<Ь-ь (О а. где 6| == *-. Если имеет место равенство A), то го- ак ворят, что вектор ак является линейной комбинацией векторов аи Д2> ..., я*-ь а также, что вектор ак линейно выражается через аь а2, ..., ак-\. Таким образом, если векторы а\, а2, . ., ак линейно зависимы, то по крайней мере один из них линейно выражается через остальные. Ясно, что верно и обратное, т. е. что если один из векторов линейно выражается через остальные, то все эти векторы в совокупности линейно зависимы. Примеры. На плоскости можно найти сколько угодно пар линейно независимых векторов — линейно независимы любые два неколли не ар ных, т. е. не параллельных одной прямой, вектора. Но любые три вектора плоскости линейно зависимы. В обычном (трехмерном) пространстве любые три некомпланарных (т. е. не параллельных одной плоскости) вектора а, Ь, с линейно независимы (так как если аа + $Ь + ус = О и» например у Ф О, то с=——а— — Ь, и вектор с компланарен векторам а, Ь). Однако любые четыре пространственных вектора а, &, с, й будут линейно зависимыми. (Докажите это.) Определение 3. Векторное пространство Я называется п-мерным, если в нем можно найти п линейно независимых векторов, но больше чем п линейно независимых векторов оно не содержит.
§4] РАЗМЕРНОСТЬ И БАЗИС 67 Размерность пространства — это максимальное число содержащихся в нем линейно независимых векторов. Так, размерность множества всех плоских векторов равна 2, размерность множества пространственных векторов равна 3; понятно, что размерность /г-мерного пространства, по определению, равна п. Размерность пространства /? условимся обозначать через й{К). Пространство, имеющее конечную размерность, называется конечномерным. Пространство, в котором можно найти сколь угодно много линейно независимых векторов, называется бесконечномерным. Примером бесконечномерного пространства может служить множество Р всевозможных многочленов от I или множество С всех функций от /, непрерывных на данном отрезке [а> Ь] (или непрерывных на всей числовой прямой), и т. д. Определение 4. Совокупность п линейно независимых векторов п-мерного векторного пространства /? называется его базисом. Теорема 1. Каждый вектор х линейного п-мерного пространства /? можно представить, и притом единственным способом, в виде линейной комбинации векторов базиса. Доказательство. Пусть еи е2, ...» еп— произвольный базис /г-мерного пространства /? и хе/?. Так как каждые я+1 векторов (п-мерного!) пространства Н линейно зависимы, то зависимы, в частности, и векторы еи е2, ..., еп, х, т. е. существуют такие не равные одновременно нулю числа аь аг, ..., ап, а, что «1^1 + а2#2 + ... + апеп + <хх = 0. При этом а ф 0, ибо если а = 0, то хоть одно из чисел «1, (Х2, •¦, ап было бы отлично от нуля, и векторы еи е2, ¦.., 2п были бы линейно зависимы. Следовательно, ¦ _ а1 а2 ап х — -"*- ~** си ~~~ Со -"—* • • • -"-" ~~~* еп» а. Полагая — ~ = хи будем иметь х = ххвх + х2е2 + .,. + хпеп. Это представление х через еи е2, ..., еп единственно, так как если х = Х\в\ + х2е2 + . • • + хпеп и 3*
68 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II х == У\е\ + У*е2 + ... + упеп, то (У\—Х\)ех + (У2—Х2)е2 + ... + (уп—хп)еп = О и ввиду линейной независимости векторов еХ} е2> ..., еп, У\—Х1 = у2 — х2=... =Уп—хп = О, откуда У\ = Хи у2 = х2, ..., уп = хп. Числа Х\у х2у .,., хп называются координатами вектора х в базисе еХу е2у ..., еп. Таким образом, теорема 1 утверждает, что если задан базис я-мерного векторного пространства /?, то каждый вектор из /? имеет (единет- венным образом определенные) координаты в этом базисе. При этом ясно, что если координаты двух векторов х и у совпадают, то эти векторы одинаковы, так как тогда х = ххех + х2е2 + ... + хпеп = у. Поэтому задавать вектор можно, просто указывая его координаты хи х2, .,., хп. При этом так и пишут: вектор х = == \Х\, Х2, • . ., Хп). Пусть мы имеем два вектора, заданные своими координатами в некотором базисе. Тогда при сложении этих векторов их соответственные координаты складываются: если х = ххех + х2е2 + •.. +хпеп и у = ухех + у2е2 + ... + упеП) то х + У = (*1 + У\)еу+ (х2 + у2)е2 + .., + (хп + уп)еп. При умножении вектора на число все его координаты умножаются на это число: если х = ххех + х2е2 +.,. +хпеп> то ах = {ахх) ех + {ах2) е2 + ... + (о**) еп. У нулевого вектора все координаты равны нулю, так как из равенства ахех + а2е2 + ... + апеп = 0, ввиду линейной независимости векторов ех, е2у ..., еп, вытекает, что ах = а2 = •.. ¦=» ап = 0. Вектор, противоположный х—{хх,х2,..., хп), равен,очевидно, (— хХу —*2,..., —хп). Теорема 2. Если еХу е2, ..., еп —линейно независимые векторы пространства /? и каждый вектор хе/? линейно выражается через еХ) е2, ,, „ еп, то эти векторы образуют базис К.
$ 4] РАЗМЕРНОСТЬ И БАЗИС 69 Доказательство. Векторы ей <?2, ..., еп, по условию, линейно независимы. Остается доказать, что в пространстве /? нет более чем п линейно независимых векторов. Возьмем произвольные т > п векторов из /?: Яь #2, •. •, йт. По условию, каждый из них можно линейно выразить через еи е2, ,.., еп: а\ — ац01 + а2102 + ... + аП101и а2 = а\2в\ + а22^2 + ... + а^п, йт = а\те\ +а2т^2 + ... + аЛт^п. Рассмотрим матрицу Гаи а12 ...а1й11 Так как число строк этой матрицы равно п, то ее ранг не больше чем пу и значит, среди ее столбцов имеется не более чем п линейно независимых. Но так как /п> >п, то т столбцов этой матрицы между собой линейно зависимы. А это значит, что линейно зависимы и векторы аь а2, ..., #т. Мы нашли, что пространство /? п-мерно и ей ^2, ..., еп — его базис. Из теоремы 2 вытекает, что пространство /?я упорядоченных строк из п чисел /г-мерно. Действительно, п строк <?1=A, 0, ..., 0), е2=@. 1, ..., 0), ... ..., еп = @, 0, ..., 1) линейно независимы, так как из равенства а1б1+а2е2+...+апе»= (аь а2> • • •» а„)=@, 0, ..., 0) вытекало бы, что а\ = а2 = ... = аЛ = 0. С другой стороны, каждая строка е= (|ь &*, ..., Ы линейно выражается через ей е2, •. ., ея: е = Ъе\ + \2е2 + ...+ Ьа. Строки *ь е2, .... еп образуют, следовательно, базис пространства /?*. Пространство Рп многочленов степени не выше п имеет размерность п+1. В самом деле, многочлены
70 л-МЕРНОЕ ПРОСТРАНСТВО (ГЛ. II между собой линейно независимы, и каждый многочлен от I степени-не выше п через них выражается очевидным образом. Теорема 3. В конечномерном векторном пространстве каждое множество линейно независимых векторов можно включить в некоторый базис. Доказательство. Пусть векторы ей е2у ..., ек пространства /? линейно независимы. Если каждый из остальных векторов из /? линейно выражается через ей е2у ..., екУ то, по теореме 2, это уже базис. Если же найдется вектор ек+], линейно не выражающийся через еи еь ..., еку то *+1 векторов еи е2у ..., ек, ек+\ линейно независимы. Действительно, если бы имело место равенство «1^1 + а2^2 + ... +акек + аек+{ = 0, то а ф 0, ввиду линейной независимости векторов еи е2 ..., екУ и вектор ек+\ линейно выражался бы через ей е2у ..., ек. Присоединим вектор ек+{ к в\у е2у ..., ек. Если все векторы пространства /? линейно выражаются через еи е2у . ., екУ ек+и то это уже базис. Если же найдется вектор ек+2, не выражающийся линейно через еХу е2у ..., екУ ек+и присоединим его к ним; новая система векторов еи е2у ..., екУ ек+и ек+2 будет линейно независимой, и т. д. Этот процесс не может продолжаться до бесконечности, так как пространство /?, по условию, конечномерно, и, следовательно, в нем не может быть бесконечного множества ей е2у е%у ... линейно независимых векторов. Поэтому, в конце концов, мы получим такую линейно независимую систему векторов в\у е2у ..., екУ ек+\у ..., еП9 через которую уже будут линейно выражаться все остальные векторы из Я. Ввиду теоремы 2 это и будет базис пространства /?, содержащий заданные векторы е\> е2у .,., ек. § 5. Изоморфизм векторных пространств Пусть /? —-л-мерное векторное пространство и еи е2у ..., еп — некоторый его базис. По теореме 1, каждый вектор лее/? однозначно представляется в виде линей-
§ 5} ИЗОМОРФИЗМ ВЕКТОРНЫХ ПРОСТРАНСТВ 71 ной комбинации х = ххех + х2е2 + ... + хпеп векторов ей еь ...» еп. Если вектору х поставить в соответствие строку (*ь *2, .,., х„), то, как мы видели в § 4, при сложении векторов соответствующие им строки тоже складываются, а при умножении вектора на число соответствующая ему строка умножается на то же число. Таким образом, отправляясь от самого общего определения л-мерного векторного пространства, мы пришли к тому, что это пространство «устроено» в некотором смысле так же, как пространство всевозможных строк из п чисел. Значит, все я-мерные векторные пространства над одним и тем же полем Рустроены одинаково; они, как принято говорить, изоморфны между собой. Точный смысл этого термина содержится в следующем определении. Определение 5. Векторные пространства /? и /?' над одним и тем же полем Р (в частности, два вещественных или два комплексных векторных пространства) называются изоморфными, если между их элементами можно установить взаимно однозначное соответствие*) такое, что если х+-+х' (х соответствует х') и У ++ У', где х, у*=%, х', у' <= /?', то х+у++х'+у' и при любом а&Р ах ++ ах' (или, короче, (х+у)/=х/+у/ и (ах)'=ах'). Из этого определения сразу видно, что два векторных пространства, изоморфных третьему, изоморфны между собой. Имеет место следующая Теорема 4. Для того чтобы два векторных прост- ранетва (определенных над одним и тем же полем Р) *) Говорят, что задано взаимно однозначное отображение множества М на множество N (в частности, М на М), если каждому элементу а е Л/ поставлен в соответствие определенный элемент Ъ е #, причем каждый элемент Ь е N поставлен в соответствие одному определенному элементу аеМ. В этом случае говорят также, что между множествами М и N установлено взаимно однозначное соответствие.
72 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II были изоморфны, необходимо и достаточно, чтобы они имели одинаковые размерности. Доказательство достаточности. Пусть даны два /2-мерных векторных пространства /? и /?' над полем Р. Выберем в каждом из них по базису: ^1» ^2> • ¦ • > ^п В А И #1, #2> • • • ?^п В А . Вектору х, имеющему в базисе еь е2, ..., еп координаты хи Х2> ..., хп, поставим в соответствие вектор х' из Я', имеющий те же самые координаты в базисе еъ е2, ..., е'п. Тогда, поскольку при сложении векторов их соответственные координаты складываются, а при умножении на число — умножаются на то же число, будем иметь: если х ++ х\ у ++ у', то х + у ++ х' + у' и для любого ае/7 ах «-> ах\ Следовательно, /?' изоморфно /?. Доказательство необходимости. Для того чтобы доказать, что векторные пространства /? и /?' р аз- ных размерностей не изоморфны между собой, заметим прежде всего, что при «изоморфном» соответствии между двумя пространствами нулевому вектору одного пространства соответствует нулевой вектор другого. Действительно, пусть 0 — нулевой вектор из /? и О' — соответствующий ему вектор из /?', *' — произвольный вектор из /?' и х «-* х', где х е= /?. Тогда, по определению, О + х ++ 0' + х'. Но 0+*=*, а так как х++х' и соответствие между Я и %' — взаимно однозначное, то О' + х' = *', т. е. (У — нулевой вектор пространства /?'. Если пространства /? и /?' изоморфны и векторам аь а2,..., ак из /? соответствуют векторы аи а2, ..., а'ь пространства /?', то «з линейной зависимости векторов аь а2, ,., ак вытекает, что и векторы аи а'2| ..., аА гсже линейно
§6] ПЕРЕХОД К НОВОМУ БАЗИСУ 73 зависимы, и обратно. Действительно, пусть, например, а^! + «2^2 + ... + ^как = 0. Тогда вектору <хха\ + + 0С2.Я2 + ... + «а^а пространства /?, равному 0е/?, в пространстве /?'соответствует вектор а1а1+а2а2+.. .+ +акак и, значит, сс^! + а2я2 + ... + акак = 0'. Следовательно максимальное число линейно независимых векторов в изоморфных пространствах должно быть одинаковым, а значит, размерности этих пространств — равные. (В частности, бесконечномерное пространство не изоморфно никакому пространству конечной размерности.) В силу теоремы 4 единственной характеристикой конечномерного векторного пространства, определенного над данным полем Р, является его размерность. По своей алгебраической структуре все п-мерные векторные пространства над полем Р одинаковы. Можно, следовательно, сказать, что /г-мерное векторное пространство — это пространство всевозможных строк из п чисел. Поскольку мы уже условились, что основное поле Р — фиксированное числовое поле, то м-мерное векторное пространство можно обозначать просто через Нп: одно обозначение для всех я-мерных векторных пространств над одним и тем же полем Р законно, потому что все я-мерные векторные пространства над полем Р одинаковы (изоморфны). § 6. Переход к новому базису Пусть в пространстве /?п имеются два базиса: Первый условимся называть старым базисом, второй— новым. Каждый из элементов нового базиса, по теореме 1, можно линейно выразить через векторы старого базиса ех = апег + а21е2 + ... + ап1еп, е2 = а12ег + а22е2 + ... + ап2еП7 ^ еп = #1п^1 + а2пе2 + . •. + аппеп.
74 л-МЕРНОЕ ПРОСТРАНСТВО (ГЛ. II Можно сказать, что новые базисные векторы получаются из старых с помощью матрицы А = аы (причем коэффициенты их разложений по старым базисным векторам образуют столбцы этой матрицы). Матрица А называется матрицей перехода от базиса е\, е2у ..., еп к базису еи е2, ...,е'п. Определитель матрицы А не равен нулю, так как в противном случае ее столбцы, а следовательно, и векторы е'и е2, .. .,е«были бы линейно зависимы. Обратно, если определитель матрицы А отличен от нуля, то столбцы ее линейно независимы, и значит, векторы еи е2, .. .,еп, получающиеся из базисных векторов еи е2у ..., еп с помощью матрицы Л, линейно независимы, т. е. образуют некоторый базис. Значит, матрицей перехода может служить любая квадратная матрица порядка п с отличным от нуля определителем. Посмотрим теперь, как связаны между собой координаты одного и того же вектора в старом и новом базисах. Пусть х = Х\е} + х2е2 +... +хпеп — в старом базисе и в то же время л: = ххех + х2е2 + ... + хпеп — в новом. Подставляя в последнее равенство вместо еи е2у ...,еп их выражения B) через еь е2, ..., еп, получим х = = х! (апег + а21е2 + ... + ап1еп) + х'$(а12ех + а22е2+..; + + йптРп) + . • • + х'п {а1пех + а2пе2 + ... +аппеп) =(а1;х! + + 012*2 + • • • + а1пх'п) ех-\-{а21х1 + а22х2+ ... + а2пХп)е2+ + ... + (ап1х\ + ап2х2 + ... + аПпх'п) еп- Ввиду единственности разложения вектора х по базису еи е2, ..., еп отсюда следует, что Х1 ^ #11*1 + #12*2 + • • • + #1Л#П, Х2 = #21*1 + #22*2 + • • • + #2П*Л, *п ~ #п1*1 + #п2*2 + • • • + ЯппХп. Таким образом, старые координаты вектора х полу-
§6] ПЕРЕХОД К НОВОМУ БАЗИСУ 75 чаются из новых его координат с помощью той же матрицы Л, только коэффициенты соответствующих разложений образуют строки этой матрицы. Пример. Пусть еь вч — единичные векторы, направленные по осям прямоугольной декартовой системы координат. Повернем оси координат на угол ср против часовой стрелки, и пусть еи ег — новые базисные векторы. Углы, образуемые вектором е[ с векторами в\ и Рис. 5. е2, равны соответственно ф иф-у (рис. 5). Поэтому координаты этого вектора в базисе ей *2 равны соз ф и соз(ф — ---] = 81Пф, значит, е\ = созф-^ + $\пу*е2. Аналогично, углы вектора ег с векторами е\ и е2 равны соответственно у + ф и ф; координаты его в базисе еи е2 равны соз(-у + ф!=— зт ф и соз ф, и значит, е% =* = —-3111 ф- 01+СЮ5 ф. е2г Таким образом, матрицей перехода здесь будет [СОЗф — 51Пф] 31Пф СОЗф]' а выражения старых координат через новые имеют вид Хг = СОЗ ф'ЛГх — 31Пф-ЛГ2, Хг = 31П ф • Хх + СОЗ ф • Х%г
76 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II § 7. Подпространства векторного пространства Определение 6. Подпространство векторного пространства К— это множество Я\ его элементов, само являющееся векторным пространством относительно введенных в К операций сложения и умножения на число. Для того чтобы убедиться в том, что множество /?1 элементов векторного пространства /? является его подпространством, необходимо проверить, что для любых двух векторов х и у из К\ их сумма х+у тоже принадлежит Я\ и что для каждого вектора х из Р\ и произвольного а е Р произведение ах тоже принадлежит Н\. Покажем, что этого и достаточно. Действительно, аксиомы 1, 2 и 5—8 векторного пространства, справедливые в /?, будут выполняться, в частности, и для элементов из Я\. Далее, если какой-то вектор х е Ни то и произведения 0-л; = 0 и (— 1)х = —х тоже принадлежат Ни Следовательно, нулевой вектор принадлежит Н\ и для каждого х из /?1 вектор — х тоже принадлежит Ни Размерность любого подпространства векторного пространства не превосходит размерности самого пространства: ведь линейно независимые векторы подпространства Н\ будут линейно независимыми и во всем пространстве, а значит, максимальное число линейно независимых векторов подпространства не превосходит размерности всего пространства. Примеры. В обычном трехмерном пространстве (рассматриваемом как множество принадлежащих ему векторов) подпространствами будут все плоскости и все прямые, проходящие через начало координат. Подпространствами любого пространства будут само пространство /? и множество, состоящее из одного нуля. В пространстве Рп многочленов степени не выше п подпространствами будут, например, все Рк при к<п — ведь складывая и умножая на числа многочлены степени не выше 6, мы будем получать снова такие же многочлены. С другой стороны, каждое из пространств Рп содержится в качестве подпространства в пространстве Р всех многочленов с вещественными коэффициентами, а это последнее является подпространством пространства С не п р е р ы в н ы х функций,
§ 7] ПОДПРОСТРАНСТВА ВЕКТОРНОГО ПРОСТРАНСТВА 77 Рассмотрим систему линейных однородных уравнений, ранг матрицы коэффициентов которой равен г: ( #11*1 ~Ь #12*2 "Г • • • "Т #1п*Л == *Л I #21*1 "Г #22*2 "Г • • • Т" #2п*Л = ^» /о\ V #т1*1 "Г #т2*2 ~Г • • • ~Г ЯтпХп ^ ^, и пусть в векторном пространстве /?п зафиксирован какой-то базис. Если каждое решение (аь а2, ..., ап) системы C) рассматривать как вектор пространства /?Л, то из результатов § 10 главы I вытекает, что совокупность всех решений системы C) является к-мерным подпространством (где к = п—г) в /?п, базисом которого служит любая фундаментальная система решений^ Покажем, что и, обратно, каждое подпространство векторного пространства в любом базисе определяется некоторой системой линейных однородных уравнений. Действительно, пусть К\ — А-мерное подпространство в #Л и еъ еъ *..,ек — базис /?1# Дополним эту линейно независимую систему векторов /?п до базиса е[9е'2, ... ..., е'к, е'к+и ..., еп всего пространства /?\ Легко видеть, что если хь х2, ..., *п — координаты относительно этого («старого») базиса, то подпространство ^ в этом базисе определяется системой уравнений: *А+1 ^ 0, *М-2 —О, . . ., Хп = 0. Далее, если Х\, х2, .... #п —координаты относительно любого другого («нового») базиса еь ^2, ¦.., еП1 то, как показано в § 6, имеют место, в частности, равенства *Н-1 ^ #А+1,1*1 4* #&+1,2*2 + • • • + #/?-Н,п*п| *п — #п1*1 "Г #л2*2 I • • • "Г #пп*/г> где а,4— некоторые числа, и значит, подпространство /?] в базисе ей вь ..•• еА определяется системой линейных однородных уравнений ( #А+1,1*1 + #Ь+1,2*2 +.•••+ #/г+1,п*п = 0, (#д1*х + #»А +....+ аппх^ = 0.
78 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II § 8. Линейные многообразия Пусть дано векторное пространство /?п, в котором выбран некоторый базис. Рассмотрим (совместную) систему линейных, вообще говоря, неоднородных уравнений: ( 0ц*1 + 012*2 + • • • + а1пхп — Ъъ #21*1 ~Ь #22*2- + • • • 4" #2П*П == &2> D) I ат\х1 Л" #т2*2 г • • • + йтпХп — 0т, ранг матрицы коэффициентов которой равен г, и пусть к = п — г. Определение 7. Совокупность векторов пространства Яп, координаты которых удовлетворяют системе Рис. 6. линейных уравнений D), называется линейным многообразием. Согласно замечанию, сделанному в конце § 10 главы I, общее решение х системы D) равно сумме общего решения х0 соответствующей (т. е. с теми же коэффициентами при неизвестных) однородной системы C) и произвольного, но фиксированного решения а = = (аь #2, ..., ап) системы D). Таким образом, линейное многообразие решений системы D) получается, если к каждому вектору из подпространства решений соответствующей однородной системы C) прибавить один и тот же вектор а (см. рис. 6, где концы векторов, образую-
§ 9] ПЕРЕСЕЧЕНИЕ И СУММА ПОДПРОСТРАНСТВ 79 щих линейное многообразие, принадлежат плоскости я, получающейся из подпространства я0 параллельным переносом на вектор а). Покажем, что и, обратно, если к каждому вектору подпространства Н\ с: Нп прибавить один и тот же вектор а, то получится линейное многообразие. Пусть подпространство Н\ определяется системой линейных однородных уравнений C) и а= (аь аг, ..., ап). Положим йцах + ааа2 +... +а1пап = Ьь {=1,2, .., /г, E) и рассмотрим систему уравнений D). Ввиду условий E), вектор а является одним из решений этой (вообще говоря, неоднородной) системы. Следовательно, линейное многообразие, определяемое системой D), совпадает с заданным множеством Н\ + а векторов. Линейное многообразие D) называется к-мерным, если /г-мерно соответствующее ему подпространство C), § 9. Пересечение и сумма подпространств Определение 8. Пусть в векторном пространстве Н имеются два подпространства Н\ и #2- Их пересечением /?3 = /?1 П^?2 называется множество всевозможных векторов из Н, принадлежащих одновременно и Ни и К*. Легко видеть, что пересечение двух подпространств Н\ и Н2 является подпространством (содержащимся и в Ль и в /?2). Определение 9. Если Н\ и Н2 — подпространства линейного пространства Н, то их с у мм ой /?4 =/?!+ + /?2 называется множество всех векторов вида и + 0, где и&Нх и V е/?2. Сумма двух подпространств является подпространством (возможно, совпадающим с /?). Действительно, если х, у е /?4, то х — щ + 0Ь у = и2 + ^2, где иь и2 е е/?1 и 0ь и2е/?2, итогдах+#= (и{+и2) + (^1+^2), где щ + и2 е /?! и 01 + 02 е #2, поэтому х + у ^ На- Далее, если а е Рг то ах = аих + аVи где аих е Ни а01 е /?2 и, следовательно, ах е На* Подпространство Нх (так же, как и /?2) содержится в На, ибо каждый элемент д: е Н\ можно представить в виде суммы х + 0, где х е /?ь а 0 е Я2-
80 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II Теорема 5. Если Н\ и /?2— подпространства векторного пространства /? и /?3 = /?1 П Къ а #4 — #1 + /?2> то а {Кг) +а(К2) = аш+аш. F) Доказательство. В подпространстве #3 выберем какой-нибудь базис ей е2, е3, <.., е*. G) Дополним множество G) векторов, принадлежащих одновременно и /?ь и /?2, до базиса /?1: *ь е2, .., е*, /*+ь . ••> /р, (8) с одной стороны, и до базиса /?2: «ь е2, ..., е*, ёк+и • * •> #* (9) — с другой (теорема 3). Покажем, что векторы еь е2, ..., ек, /А+1, ¦ .., /р, #л+1, ,.., дя A0) линейно независимы. Тогда, по теореме 2, они образуют базис в /?4> ибо если вектор г е $4, то г =* х + у, где а: е /?ь # е /?2, и значит, л: линейно выражается через векторы (8), а у — через векторы (9). Но тогда вектор г линейно выражается через векторы A0). Допустим, что векторы A0) линейно зависимы: а\е{ + а2е2 +... + акек + Р*+1/а+1 + -.. + (^ + + Т.* +1&+1 + *.. + Ьёя = 0. A1) Тогда вектор а=а1е{+а2е2+.. .+аА+Р*+1/*+1+. • -+Рр/р> равный — {чшВн+х + ..-. + Ыя)» принадлежит одновременно и /?ь и /?2, а значит, и их пересечению /?3. Но в таком случае он должен линейно выражаться через базисные векторы G) подпространства /?3; пусть а=0121+0202+.. .+акек. Отсюда, ввиду единственности разложения вектора а по базису пространства Я\, о«=а<, 1=1, 2, ..., к, и рд+1 = рл+2=,,, = р1)=0.
$ 9] ПЕРЕСЕЧЕНИЕ И СУММА ПОДПРОСТРАНСТВ 81 а тогда из равенства A1) следует, что и, ввиду линейной независимости векторов (9), а»=0, 1=1, 2, ..., к, и Тл+1 = уЛ+2=.#.=^=0. Таким образом, векторы A0) образуют базис пространства /?4, и значит, его размерность равна числу этих векторов: к+(р-к) + (д-к)=р + Ч-к. Но й(Я\)—р, ^(/?2)=9 и й(/?з)=Л. Мы доказали, что сумма размерностей двух подпространств равна размерности их суммы, сложенной с размерностью пересечения. Так, в четырехмерном пространстве #4 два двумерных подпространства #1 н /?2 могут пересекаться по нулевому вектору, и тогда их сумма совпадает со всем пространством; в этом случае равенство F) превращается в 2 + 2 = 0 + 4. Они могут пересекаться по прямой (одномерному подпространству), и тогда их сумма трехмерна; этр соответствует равенству 2 + 2=1+3. Наконец, /?1 и #2 могут совпадать, тогда их пересечение и сумма тоже двумерны, и равенство F) дает 2 + 2 = 2 + 2. Два трехмерных подпространства в Я4 либо пересекаются по плоскости (двумерному подпространству), и тогда 3 + 3 = 2 + 4, либо совпадают: 3 + 3 = 3 + 3. (Другие случаи здесь невозможны, так как сумма этих подпространств не более чем четырехмерна). Если #1 — двумерное, а #2 — трехмерное подпространства в /?4, то либо они пересекаются по прямой: 2 + 3=1+4, либо /?! содержится в#2:2 + 3 = 2 + 3. Определение 10. Если пространство /? является суммой своих подпространств Н\ и /?2, пересечение #3 которых состоит лишь из нулевого вектора, то говорят, что Н\ есть прямая сумма подпространств Н\ и /?2> и пишут Если /? =¦¦ /?1®/?2> то очевидно, что Так, обычное трехмерное пространство /?3 будет, очевидно, прямой суммой любой (проходящей через начало координат) плоскости я и любой не лежащей в этой плоскости (но проходящей через начало) пря-
82 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II мой /. Пространство /?3 распадается также и на сумму любых двух своих несовпадающих (проходящих через начало) плоскостей, но эта сумма не будет прямой. Теорема 6. Если /? = /?1©/?2> то каждый вектор из К единственным способом представляется в виде и + V, где ке Ни V е % Доказательство. Каждый вектор из #, по определению суммы подпространств, представляется в виде и + V, где и^Ки *>^#2. Предположим, что какой-то вектор х из /? разложен в такую сумму двумя способами: X=и^ + V^ = и2+V2^ Тогда вектор щ—щ^ъч—Ъх принадлежит одновременно и /?ь и #2, т. е. он принадлежит Яъ и, значит, равен нулю, откуда и1 — и2 и 02=^1- Пусть Я — какое-то векторное пространство и аи а2, ..., ак е /?. Совокупность всевозможных линейных комбинаций этих векторов а1а1+а2^2+- ..+а>А является, очевидно, подпространством в /?. Мы будем говорить, что это подпространство порождается векторами ах, а2, ..., ак. Его называют также линейной оболочкой векторов аь а2, ..., ак. Нетрудно видеть, что линейная оболочка векторов аи а2, ..., ак совпадает с пересечением всех подпространств, содержащих эти векторы. § 10. Определение аффинного пространства Выше мы неоднократно иллюстрировали общее понятие векторного пространства на примере (обычной) плоскости или (обычного трехмерного) пространства. Однако эти иллюстрации были, строго говоря, не совсем точными — ведь основным понятием той геометрии, которая изучается в средней школе, является точка, и все геометрические образы можно понимать как множества точек, в то время как в определении векторного пространства точки вообще не фигурируют. В школьном курсе геометрии понятие вектора появляется позже понятия точки: вектором там называют упорядоченную пару точек (направленный отрезок) АВ, определяя далее условия равенства векторов и правила их сложения и умножения на число.
§ 10] ОПРЕДЕЛЕНИЕ АФФИННОГО ПРОСТРАНСТВА 83 Нам сейчас придется поступить иначе. Располагая уже определением векторного пространства, мы дополним его, введя в рассмотрение еще и точки. Полученное таким образом множество (векторов и точек) — его называют точечно-векторным, или аффинным, пространством,— будет уже ближе к тому пространству, которое изучается в курсе элементарной геометрии, хотя и не будет еще полностью с ним совпадать. Дело в том, что само понятие «аффинного» пространства предполагает, что это пространство лишено метрики, т. е. способа измерения длин и углов. Оно станет вполне идентичным (во всяком случае для двух-и трехмерного случаев) обычному пространству лишь после введения в нем соответствующей метрики (см. ниже, главу IV). Определение 11. Пусть имеются векторное пространство /? (элементы его по-прежнему обозначаются строчными латинскими буквами) и, кроме того, множество элементов, которые мы будем называть точками (и обозначать прописными латинскими буквами), причем каждой упорядоченной паре точек М, N поставлен в соответствие один и только один вектор х из Я (хотя разным парам точек может быть поставлен в соответствие один и тот же вектор); мы будем писать в этом случае МИ=х. Будем предполагать, что это соответствие между точками и векторами обладает следующими свойствами: 1. Для каждой точки М и каждого вектора х найдется одна и только одна такая точка Ы, что МЫ = х. 2. Для любых трех точек М, N. Р ЖЫ+ЫР^МР'. Все точки и все векторы вместе образуют тогда аффинное пространство. Аффинное пространство называется п-мерным, если л-мерно соответствующее ему векторное пространство/?. Итак, аффинное пространство Л —это множество элементов двух родов: точек и векторов, связь между которыми задается с помощью операции откладывания векторов. Произвольный вектор х можно отложить от любой точки М, получив при этом определенную точку #, и тогда МЫ=х. Точка М называется началом, а точка # — концом вектора МЫ.
84 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II Далее, почти очевидны следующие предложения. 1. Если МN=^Р, то М^ = NР. (Это вытекает из равенства Ш + Л/Р~= МР = М<Э + ()Р.) В частности, так как ММ-\-МЫ=ММ=ММ+МЫЛ то ММ=NN, т. е. все векторы, у которых начало и конец совпадают, равны между собой. Такой вектор NN является нулевым, так как МN-{-NN=МN. 2. Вектор ЫМ является противоположным МЫ, так как МЫ + ЛШ~= ММ = 0. § 11* Введение координат в аффинном пространстве В л-мерном аффинном пространстве А координаты точек можно ввести следующим образом. Выберем какую-нибудь точку О в качестве начала координат* Тогда для каждого вектора х, ввиду условия 1 определения 11, найдется и притом только одна такая точка X, что ОХ = х. Так будет установлено взаимно однозначное соответствие между всеми точками и всеми векторами из_ А: точке X ставится в соответствие вектор х = ОХ, концом которого она является (в обычном трехмерном пространстве это — откладывание всех векторов пространства от начала координат). Далее, в соответствующем А векторном простран* стве Л выберем какой-нибудь базис в\, е2, ..., еп. Тогда каждый вектор х из А будет определяться строкой своих координат: х=(х\, х2, ..., хп). Эти же координаты мы отнесем и соответствующей вектору х точке Х\ будем писать в этом случае: Х(х\, х2, ..., хп). Таким образом, если в л-мерном аффинном пространстве А выбрана система координат (т. е. точка О как начало отсчета и базис е\, е2, ..., еп в соответствующем А векторном пространстве /?), то каждой точке из А будет однозначно сопоставлена строка из п чисел — ее координат. У точки О все координаты будут равны нулю, так как ей соответствует, очевидно, нулевой вектор 0. Если Х(хи х2, ..., хп) и У(уи у2, ..., у»)—две точ- ки аффинного пространства А, то, ввиду равенства, ОХ+ХУ=ОУ имеем 1У=Ш—Ш1 т. е, координа-
$ 12] ПЕРЕХОД К НОВОЙ СИСТЕМЕ КООРДИНАТ 85 ты вектора XV равны разностям у{—х{ координат его конца и начала. Можно показать, что, подобно векторным пространствам, все аффинные пространства одной и той же размерности тоже «устроены одинаково», так что (если зафиксировано основное поле Р) размерность аффинного пространства является его единственной характеристикой. Поэтому я-мерное аффинное пространство мы можем обозначать далее просто через Ап. § 12. Переход к новой системе координат Посмотрим, как преобразуются координаты точки аффинного пространства Ап при переходе к новой системе координат. Пусть сперва изменяется только начало координат, Предположим, что новое начало помещено в точку О', координаты которой в старой системе (аь аг, ..., ап). Для любой точки X из Ап имеем Ш' + Ш = Ш. A2) Координаты вектора ОХ=(х\} х2, ..., хп) — это координаты точки X в старой системе координат; координаты вектора О'Х = (хь х2у ..., хп) — координаты точки X в новой системе; координаты вектора 00'— это координаты точки О' в старой системе, т. е. (аь аг, ..., ап). Из равенства A2) получаем О'Х = ОХ— 00', или, в координатах, \Л» #2, • • •» Хп) = (#1, х2у ..., хп) (ссь а2, ..., ап) и #1 = лч —«{, *= 1| 2, ..., я, г. е. новые координаты точки получаются, если из старых ее координат вычесть координаты нового начала в старой системе координат. Пусть теперь начало координат не меняется, но в векторном пространстве Яп, соответствующем Лп, выбирается новый базис с матрицей перехода Гап а12 ... а1п 1 а21 а22 ••" й2п I (|3) *-аш «па-"*™-"
86 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II т. е. старый базис, образованный векторами еи е2у ..., еп, заменяется новым, составленным из векторов е'г, е2,... ,еП1 где е\ = а11е1 + а2^а + ... + ап^п, I = 1,2, ..., л. Так как координаты точки X — это, по определению, координаты вектора х=ОХ, то, как следует из § 6, старые координаты точки будут выражаться через новые ее координаты по формулам XI =* йцХ1 + #*2*2 + • • • + йщХп* I = 1, 2, *.., п. В общем случае, когда и начало координат О переносится, в точку О'(ось <Х2, . ^., ап),и базису, е2, ..., ел с помощью матрицы перехода A3) заменяется новым, старые координаты хи х2у *.., хп произвольной точки X и новые ее координаты х'ъ х2, ...,*'* связаны соотношениями х% — апхх + а12х2 + ... + а1пхп + а,, I *= 1,2, ..., п. § 13. %-мерные плоскости в аффинном пространстве Пусть в я-мерном аффинном пространстве Ап установлена система координат. Рассмотрим снова (совместную) систему уравнений D), ранг матрицы коэффициентов которой равен г, и пусть й=п—г. Определение 12. Множество всех точек из Лп, координаты которых удовлетворяют системе уравнений D), называется к-мерной плоскостью; одномерные плоскости называются также прямыми, а (п— 1)-мерные плоскости — гиперплоскостями. Понятно, что каждую гиперплоскость (для которой г=1) можно задать всего одним линейным уравнением аххх+а2х2+.. .+апхп=Ь. В обычном трехмерном пространстве гиперплоскости — это обычные плоскости, а на обычной плоскости — это прямые.
$ 13] А*МЕРНЫЕ ПЛОСКОСТИ В АФФИННОМ ПРОСТРАНСТВЕ 87 Можно показать, что при переходе к новой системе координат в Ап точки, удовлетворяющие системе уравнений D), будут удовлетворять некоторой новой системе уравнений, ранг матрицы коэффициентов которой тоже равен г. Пусть я будет ^-мерная плоскость, определяемая системой уравнений D). Соответствующая система C) линейных однородных уравнений определяет некоторую ^-мерную плоскость яо, «проходящую через начало координат». Если все векторы отложены от начала координат, то те векторы, концы которых принадлежат яо, образуют подпространство, а векторы, концы которых принадлежат я, образуют /г-мерное линейное многообразие. Это многообразие получается, если ко всем векторам подпространства яо прибавить один и тот же вектор а. Можно сказать поэтому, что к-мерная плоскость я получается из яо параллельным переносом на вектор а. Это позволяет дать следующее Определение 13. Две к-мерные плоскости параллельны, если определяющие их системы таковы, что соответствующие однородные системы равносильны (имеют одни и те же решения), к-мерная плоскость п\ и 1-мерная плоскость я2 параллельны (при 1>к)у если щ параллельна какой-нибудь к мер ной плоскости, содержащейся в яг (в этом случае определяющие Я] и п2 системы таковы, что однородная система, соответствующая яг, является следствием однородной системы, соответствующей П\). Пусть снова я будет А-мерная плоскость, определяемая системой уравнений D). Общее решение системы D) в векторной форме имеет вид х=а1с1+а2с2+.. .+акск+а; A4) где Хо—ахС1+а2С2+.. .+акск — общее решение соответствующей однородной системы C) и а —некоторый фиксированный вектор (одно из решений системы D)). Если с<=(сп, с<2, ..., сы) при {«в 1, 2, ...» Л и а—(а\, а2, .с., а„), то записывая равенство A4) в координатах, получим параметрические
88 л-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. II уравнения к-мерной плоскости: /=1, 2, «.„ п. с(с1}с2,...,сп) Если ранг матрицы коэффициентов системы D) равен п—I, соответствующую аШиа2,...^п) х(хьх2>...,хп) (одномерную) плоскость выше мы назвали прямой. В этом случае общее решение системы D) в векторной форме имеет вид х=ас+а, A5) Рис. 7. где х0=ас— общее решение соответствующей однородной системы и а=(аь а2, ..., ап)—некоторый фиксированный вектор (рис 7). Если с= {си с2, ..., сп) и х={хи х2> ..., хп), то, записывая уравнение A5) в координатах, получим параметрические уравнения прямой: Х\ = асх + аь Х2 = ас2 + а2, хп=асп+ап которые, исключая параметр а, можно переписать в виде (Это — канонические уравнения прямой. Они имеют смысл и в том случае, если некоторые из знаменателей обращаются в нуль — тогда равны нулю и соответствующие числители). Если в пространстве Ап даны две точки А(аи а2, ..., ап) и В(Ьи Ь2, .¦., &„), то проходящая через них прямая АВ определяется, очевидно, уравнениями х1—а1_хъ — а2_ ь1~а1 ьг-а2 хп~ап Ьп~< A6)
§ 13] Л-МЕРНЫЕ ПЛОСКОСТИ В АФФИННОМ ПРОСТРАНСТВЕ 89 Обозначив равные отношения A6) через р, получим параметрические уравнения прямой АВ: x^=а^+§(Ь^—а^), или *<=A—Р)а«+рЬь '=1, 2, ..., п. Полагая 1—(*=а, будем иметь х{=асц+$Ьи где а+р=1. A7) Если а и (} —вещественные, причем 0 < а < 1 и, значит О < ^ < 1, то говорят, что соответствующая точка х при- принадлежит отрезку А В. Если ранг матрицы коэффициентов системы D) равен п—2, то определяемая ею плоскость двумерна, и общее решение системы в векторной форме имеет вид х=а\С1-\-<Х2С2-{-а, где х0=а\С\-{-а2С2— общее решение соответствующей однородной системы C), а а=(аь а2, ..., ап) —некоторый фиксированный вектор. Если сх = (сн, с#, ..., с{п), 1=1, 2, то координаты точек Х(х\у Хч, ..., хп) этой плоскости определяются формулами хк = сцен + а2с2к + аку к = 1, 2, .,., п (параметрические уравнения двумерной плоскости). Пусть в аффинном пространстве Ап даны две плоскости: й-мерная плоскость я, определяемая системой уравнений D), и /-мерная плоскость я', определяемая системой уравнений ( С11Х1 4" ^12*2 + • • • ~Ь С1пХп == "Ь I ^21*1 "Г ^22*2 ~Г • • • + С2пХп = , /10ч Тогда их пересечение (т. е. множество точек, принадлежащих одновременно и я, и я7) будет определяться системой, состоящей из всех уравнений системы D) и всех уравнений системы A8), и значит тоже будет некоторой плоскостью (которая, в частности, может состоять из одной точки или даже вообще не содержать ни одной точки, если объединенная система окажется не-
90 п-МЕРНОЕ ПРОСТРАНСТВО [ГЛ. IX совместной). Легко видеть, что каждая к-мерная плоскость в Ап является пересечением некоторых г = п—к гиперплоскостей. § 14. Выпуклые множества в аффинном пространстве Определение 14. Множество точек вещественного аффинного пространства называется выпуклым, если вместе с каждыми двумя своими точками А и В оно содержит и все точки отрезка АВ. Легко видеть, что пересечение любого числа выпуклых множеств выпукло. Определение 15. Множество точек аффинного пространства называется ограниченным, если координаты всех его точек в некоторой системе координат в совокупности ограничены (легко видеть, что тогда они будут ограничены и во всех системах координат). Пусть в (вещественном) аффинном пространстве Ап задана гиперплоскость аххх + а2х2+ ...+ апхп = 6. A9) Этой гиперплоскостью все точки из Ап разбиваются на два полупространства: Ах— множество точек, для которых аххх + а,х2 + • • • + апхп ^ &, и А2—множество точек, для которых аххх + а2х2-\-... + апхп^&• Полупространства А{ и А2 пересекаются по самой гиперплоскости A9). Теорема 7. Каждое полупространство аффинного пространства Ап является выпуклым множеством. Доказательство. Пусть точки Р(р1$ /?о, ¦.., рп) и (} = (д19 </2, ..., </л) из Ап принадлежат, например, полупространству Ах\ тогда <*& + а2р2+ • • • +апрп > Ь, ахцх + Д2<72+... +апя^Ь. Если X (хх, х2> ..., хп)—произвольная точка отрезка Р(?, то по формулам A7) х^сс/^ + Р?/» 1=1, 2, ..., я, где а, Р ^ 0 и а + Р==1. Для этой точки X имеем а1хх + а2х2+...+апхп = = ах (арх + р?1) + а2 (ар2 + р?2) +...+ая (арп + &/п) = = а (ахрх + а2р2 +...+ апрп) + Р (а^ + а2ц% +...+ ал<7„)> >сЖ + р& = (а + РN = &, т. е. произвольная точка X отрезка Р($ принадлежит А±.
§ 14) ВЫПУКЛЫЕ МНОЖЕСТВА В АФФИННОМ ПРОСТРАНСТВЕ 91 Гиперплоскость A9), как пересечение выпуклых мнржеств Ах и Л2, является выпуклым множеством. Каждая к-мерная плоскость в Лп, как пересечение нескольких гиперплоскостей, выпукла. Пусть в Ап даны пг полупространств, определяемых неравенствами ( вц*1 + 012*2 + . . . + Дт*п > Ьи I а21хх + а22х2 + ... + а2пхп > Ь2, 20 I атп1х1 "Г #т2*2 Н~ • • • + йтпхп ^ &т* (Все знаки неравенств здесь одного смысла — этого всегда можно достичь, умножая в случае необходимости обе части неравенства на —1.) Пересечение этих полупространств, называемое выпуклой многогранной об- ластью, определяет множество решений системы линейных неравенств B0). Если это пересечение ограничено, оно называется (выпуклым) многогранником м-мерного пространства Л\
ГЛАВА III ЛИНЕЙНЫЕ ОПЕРАТОРЫ § 1. Определение и примеры Определение 1. Говорят, что в векторном прост- ранстве Я задан оператор, или преобразование, ^*), если каждому вектору хе/? поставлен в соответствие определенный вектор зФ(х) или; как мы чаще будем писать, <5Фх*~Я. Оператор (преобразование) А называется линейным, если для любых двух векторов х и у из Я и произвольного числа аЕ/7 1) &(х + у) = Жх + зФуу 2) зФ(ах) = <хзФх. Вектор Ах называется образом вектора х, а вектор х — прообразом вектора Мх при преобразовании Ж. Выберем в пространстве Я базис е\у е2, ..., еп. Тогда если х = Х\в\ + х2е2 + ... + *пе„, то в силу линейности оператора э$< имеем &е{ = х^е, + х2бФег + ... + хп&еп, ь = 1, 2, ..., п. Но так как $Фе{ (где г = 1, 2, 3, ..., п)— это тоже вектор из /?, то $4>е{ можно разложить по базису еи е2} .,, ..., еп\ пусть &е{ = аие{ + а2{е2 + ... + а„<е„, I = 1, 2, ..., п. Тогда ах = хх (апе{ + а21е2 + ... + апХеп) + + х2 {ах2ех + а22^2 +... + я„2еп) + -.. •.. +*п (аи^! + а2пе2 +... +аяявп) = *) На плоскости и в обычном трехмерном пространстве чаще говорят о преобразовании. Мы будем пользоваться и тем, и другим терминами, но чаще —первым из них (оператор).
§ 1] ОПРЕДЕЛЕНИЕ И ПРИМЕРЫ 93 = (яц*1 + 012*2 +... +аыхп) ех + (а2ххх + а22Х2 +... ... + а2пхп) е2 +... + (апХхх + ап2х2 + ... +аппхп) еп. Если хъ х2у ...,хп —координаты вектора бФх в том же базисе ех, е2,.,., еП7 т. е. если ^х = х\е\ + х2е2 + ... + х'пеп, то, ввиду единственности разложения вектора по базису, имеем Х1 ^ а11Х1 + #12*2 + • • • + а1пХП> Х2 == #21*1 ~Ь #22*2 "Т • • • ~ а2пХп> П\ Хп = #п1*1 + ап2Х2 + • • • + аппХП' Таким образом, каждому линейному оператору $Ф в данном базисе еи е2, ,.., еп отвечает матрица Л = B) 1-й столбец которой образован коэффициентами разложения вектора $4>е^ по базису еь е2, ..., еп; при этом коэффициенты разложений A) координат вектора зФх по координатам вектора х образуют строки матрицы А. Если в /г-мерном векторном пространстве /? задан базис, то не только каждому линейному оператору $4> отвечает определенная матрица Л, но и, обратно, каждая квадратная матрица А порядка п может рассматриваться как матрица некоторого линейного оператора. Действительно, пусть ех, е2, ..., еп— базис пространства /?, и пусть дана матрица B) м-го порядка (мы будем писать короче: А=[сик]). Обозначим через $4> оператор, переводящий произвольный вектор х=ххе\ +Х2в2 +... . ¦. + хпеп в вектор $фх = хгег + х2е2 + ... + х'пеп, где х%*=а{Ххх + а{2х2 + ... + а{пхп при г= 1,2,..., п. Покажем, что этот оператор — линейный. В самом деле, произвольный другой вектор у = ухех -\- у2е2 + ... •..+ Упеп он переводит в зФу = у^ + у2е2 + ... + Уп еп, где У1 = ацух + а12у2+ ... + а1пуП} вектор х + у =
94 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III = (*1 + 01)*1+ (х2 + у2)е2 + ...+ (хп + уп)еп — в век- тор зФ {х + У) = г{ех + г2е2 + ... + *»<?», где г, = = Оц(хХг + ух)+ а{2(х2 + у2)+ ... + щп(хп + уп) = = *1 + #г ПОЭТОМУ «яЧ* + #) = <$Фх + зФу. Далее, для любого аб? имеем ах = (а*!)^ + + (а*2)е2 + ... + («*»)^п и ^(а*) = /101 + 12е2 + ... ... + /,*«, где и =аи(ах1)+аг2(ал:2) +... + ащ (ахп) = ах'{. Следовательно, ^ (ах) = а«5^*, и оператор *5#— линейный. Таким образом, если в векторном пространстве /?п задан базис, то каждому линейному оператору отвечает определенная квадратная матрица порядка п и, обратно, каждой такой матрице отвечает определенный линейный оператор. Поэтому линейный оператор и соответствующую ему (в данном базисе) матрицу мы будем обозначать одной и той же буквой: зФ, 38, <&, ...— линейные операторы, Л, В, С, ... — соответствующие им матрицы. Матрица А называется матрицей линейного оператора зФ. Легко видеть, что для всякого линейного оператора^ .5*0 = 0. При этом, если зФх = 0 только при х = 0, то оператор называется невырожденным; если же найдется такой вектор х ф 0, что зФх = 0, то оператор зФ — вырожденный. Пусть А = [агЛ]—матрица линейного оператора $Ф. Рассмотрим систему линейных однородных уравнений ( 011*1 + 012*2 + • • • + й1пХп = 0, I 021*1 + 022*2 + • • • + 02»*п = °> I 0Щ*1 + 0*2*2 + • - • + 0/1*** = 0 Ввиду теоремы 10 из главы I, для существования ненулевого решения этой системы (и значит, для существования ненулевого вектора х=х\е\ + х2е2 + ... + хпеп такого, что бФх = 0) необходимо и достаточно, чтобы определитель матрицы А (обозначим его через \А\) был равен нулю. Следовательно, для того чтобы оператор зФ был невырожденным, необходимо и достаточно, чтобы оп-
§1] ОПРЕДЕЛЕНИЕ И ПРИМЕРЫ 95 ределитель матрицы А этого оператора (в любом базисе) был отличен от нуля. Матрица, определитель которой отличен от нуля, называется невырожденной матрицей. Рассмотрим несколько примеров. 1. Пусть зФ —поворот всех векторов обычной плоскости хОу (короче — поворот плоскости хОу) вокруг начала координат на угол ф против часовой стрелки. Это преобразование линейно, ибо безразлично, сначала ли сложить векторы а и &, а потом повернуть их сумму на угол ф, или сначала повернуть векторы, а потом их сложить (рис. 8); так же безразлично, умножить ли сначала Рис. 8. Рис. 9. вектор а на число а, а затем повернуть его на угол ф или сделать это в обратном порядке (рис. 9). Предположим, что базисные векторы — единичные и взаимно ортогональные. Вектор $$>е — единичный вектор, образующий угол ф с е\ и угол ф — 4г сб2. Следовательно, $4>е\ = соз ф • е\ + зт ф • е2. Единичный вектор зФе2 образует с ех угол-?- + ф,а с ^2 — угол ф.
96 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Следовательно, бФе2 = —8Ш ф • е\ + сов ср • е2. Таким образом, А = С05 ф — 31Пф 31Пф СОЗф] 2. Пусть $$> — поворот обычного трехмерного пространства на угол ф вокруг оси Ог. Если еи е2} еъ — единичные векторы прямоугольной декартовой системы координат, то $Фв\ = соз ф • е\ + 81п ф • е2, зфе2 — —51п ф • в\ + соз ф • е2у зФег = еъ> и значит, матрица этого преобразования СОЗф 81П ф о —з!п ф соз !Пф 0"| эзф О I О \\ 3. В обычном трехмерном пространстве пусть зФа будет ортогональной проекцией вектора а на плоскость хОу. Линейность этого преобразования вытекает из того, что проекция суммы векторов равна сумме проекций слагаемых и что проекция произведения вектора на число равна произведению проекции вектора на это число. Если базис выбран так, как в примере 2, то очевидно, что и следовательно, $фе2 — е2} $Феъ = О, Г1 0 [о 0 01 1 0 о о] А = 4. В обычном трехмерном пространстве пусть б4>а будет вектор, симметричный с вектором а относительно плоскости хОу. Линейность этого преобразования очевидна. При этом зфв\ = ей ^2 = е2} Жеъ = — еЪ1
§П ОПРЕДЕЛЕНИЕ И ПРИМЕРЫ 97 и матрица преобразования имеет вид: Г1 0 01 Л = р 1 о 0 0-1] 5. В пространстве Рп многочленов от I степени не выше п положим &(хA))=х'A). Линейность этого «оператора дифференцирования» вытекает из основных правил дифференциального исчисления. Чтобы найти его матрицу, выберем в качестве базиса, например, векторы е 21' *>еп--{- Тогда бФвъ = 0, зФе\ — е0, зФвъ = еи ..., $4>еп — еп-\ о 1 о... о* о о I ...о и А = 0 0 0... 1 О 0 0...0 6. Обозначим через & так называемый то ж д ест- венный оператор, определяемый равенством: &х = = х для любого * е /?. Тогда &ех = е« для всех / = = 1, 2, ..., я, и следовательно, матрица оператора # в любом базисе имеет вид 0 0 1 5 = о о О ... 01 о... и 7. Обозначим через О так называемый нулевой оператор, определяемый равенством Ох = 0 для всех хей. Матрица этого оператора состоит из одних нулей. Ясно, что операторы 1, 2, 4 и 6 —невырожденные, а операторы 3, 5 и 7 — вырожденные. Теорема 1. При линейном преобразовании вектор* ного пространства каждое подпространство переходит в подпространство. 4 Л. И. Головин*
98 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Доказательство. Пусть #1 — подпространство векторного пространства /?п. Обозначим через зФЯ\ множество всех векторов, являющихся образами векторов из /?1 при линейном преобразовании зФ. Нам надо доказать, что $ФК\ — подпространство. Пусть векторы х и у принадлежат «5#/?ь Это значит, что х=зФх' и у = з4>у\ где х' е /?1 и у' <= Н\. Но тогда х + у = Жх' + бФу' = зФ{х' + */') €=^/?ь так как х/ + г/'<=/?ь и при любом аЕ/7 ах = азФх' = ^ (ах') е бФНи так как ах'е/?ь Таким образом, ^/?1 — подпространство. (Легко понять, что размерность бФИ\ не превышает размерности /?ь) Теорема 2. При линейном преобразовании векторного пространства каждое линейное многообразие переходит в линейное многообразие. Доказательство. Пусть М — линейное многообразие в /?\ Тогда существует такое подпространство К\ и такой вектор а, что М = /?1 + а (см. выше стр. 78). Если $4* — линейный оператор, то зФМ = ^Я\ + $Фа. Ввиду теоремы 1, зФК\ является линейным подпространством и, значит, АМ — линейное многообразие (см. стр. 79). Пусть Ап—п-мерное аффинное пространство и Я"— соответствующее ему векторное пространство, в котором задан линейный оператор Ж. Этот оператор можно следующим образом распространить и на точки из Ап. Предположим, что в Ап выбрана система координат. Тогда, если вектор х = Х\в\ + х2е2 + ... + хпеп при преобразовании $$> переходит в зфх^х^ + х2е2 +...+ хпеПу то, по определению, точка X (х\, *ь^ ..., хп) (конец вектора ОХ = х) переходит в X' (хи хъ .. .}хп) (конец вектора ОХ' = бФх). Из теоремы 2 непосредственно вытекает, что при линейном преобразовании аффинного пространства к-мер- ная плоскость переходит в плоскость (не большей размерности). В частности, прямые переходят в прямые или в точки.
§ 2] ДЕЙСТВИЯ НАД ЛИНЕЙНЫМИ ОПЕРАТОРАМИ 99 § 2. Действия над линейными операторами А. Сложение линейных операторов. Если зФ и $ — два линейных оператора в векторном пространстве /?, то их суммой зФ-\-& называется оператор <ё?, определяемый равенством <&х = зФх + &х для любого х е /?. Легко видеть, что сумма линейных операторов тоже будет линейным оператором. Если линейные операторы зФ и 31 имеют (в некотором базисе) соответственно матрицы А = [а{к] и 5= [Ь{к], то матрицей оператора ^ = зФ + & будет С = [с<к], где с{к = а{к + Ь{к. Матрица С называется суммой матриц А я В. Таким образом, по определению, [а<к] + [Ь{к] = [ол + М- (Разумеется, складывать можно лишь матрицы одного и того же порядка.) Сложение линейных операторов (и сложение матриц) обладает, очевидно, следующими свойствами: 1. зФ + $ = Я + зФ. 2. (зФ + Я)+& = зФ+(& + <&). 3. зФ + О = зФ для любого зФ. 4. Если через —зФ обозначить оператор, определяемый тем, что (— зФ)х =—зФх для всех хе/?, то — зФ будет линейным оператором и (— зФ)+зФ = 0. Матрицу оператора—зФ обозначим через — Л; тогда ясно, что если А = [а(й], то — А = [— ал]. Б. Умножение линейного оператора на число. Если зФ —линейный оператор в пространстве /? и ае?, то произведением зФ на а называется оператор азФ, определяемый следующим образом: (азФ)х = а(зФх) для каждого вектора х из К. Ясно, что азФ— тоже линейный оператор и что его матрица аА получается из матрицы А оператора зФ умножением каждого ее элемента на а: 4»
100 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Матрица аА называется произведением матрицы А на число а. Для умножения линейного оператора на число справедливы, очевидно, следующие тождества: 1. \-зФ = зФ\ 0 • & = 0\ (—1)зФ = —зФ 2. се(И) = («Р)^. 3. (а + $)зФ = азФ+$<5Ф. 4. а(зФ + &) = а^ + а$. Аналогичные тождества справедливы и для умножения матрицы на число. В, Умножениелинейных операторов. Произведением $Ф<& операторов зФ и & называется оператор Ф, определяемый следующим образом: <&х = зФ{Ях) для каждого вектора х из /?. Таким образом, перемножение операторов состоит в последовательном их применении одного за другим; при этом сначала производится преобразование ^, а затем уже полученный вектор &х подвергается преобразованию зФ. Так, если зФ есть поворот плоскости против часовой стрелки на угол ср, а & — поворот (в том же направлении) на угол г}>, то зФ& = &зФ будет поворотом на угол Ф ¦¦+- г|). Если бФ — симметрия плоскости хОу относительно оси Ох, а & — симметрия относительно Оуу то ^2 _ <%2 _ § — тождественное преобразование, а $/>&— *=<%& — симметрия относительно начала координат. Если зФ— ортогональное проектирование обычного трехмерного пространства на плоскость или на прямую, то ^2 = ^. Если зФ— дифференцирование в пространстве многочленов, то оператор зФ2— это взятие второй производной. Произведение линейных операторов тоже будет линейным оператором. Действительно, 1) {&Д)(х + у)г=&(Я(х + у))=**(Дх + Яу) = = ^ (Лх) + зФ[Яу) = {зФ31)х + (зФЯ)у,
§ 21 ДЕЙСТВИЯ НАД ЛИНЕЙНЫМИ ОПЕРАТОРАМИ Ю1 2) (я^) (ах) = &>{$(ах)) = зФ{а$х) = = азФ C$х) = а (<&&) х. Найдем, как выражается матрица С линейного оператора ^ = зФ& через матрицы А = [а{к] и В = [Ь{к] линейных операторов ^ и ^. Имеем 9ек = бФ ($ек) = а (Ь{ке{ + Ь2ке2 + .., + Ьп^я) = = Ь1кЖех+Ь2кЖе2 + ... + Ъпкаеп = Ь1к{апв1+а21е2+... . • . + Яш^н) + &2* («12^1 + ^22^2 + . . . + С1п2еп) + . . # ... +Ьпк(аые1 + а2пе2 + ... + аппеп) = = (а>\\Ь\к + а{2Ь2к + ... + а{пЬпк)ех + + («21&1л + Д22&2* + ... + а2пЬлк) е2 +,,, ... + («п1&1л + ап2Ь2к +,,, + апп®пк) &п> значит, если Ч?ек = си*1 + с2^2 +,.. + спкеп, то с<* = ацЬ\к + а12Ь2к + ... + а{пЬпк, где *, 6 = 1, 2, ..., п. Мы видим, что для того чтобы получить элемент мат- рицы С, стоящий в пересечении ее 1-й строки и к-го столбца, надо каждый элемент 1-й строки матрицы А умножить на соответствующий элемент к-го столбца матрицы В и все полученные произведения сложить. (Говорят и короче: элемент с{к равен произведению «/-й строки матрицы А на к-\\ столбец матрицы В».) Матрица С называется произведением матриц Л и б. Пример. [2 ПГ4 31 [2.4+1-1 2.3+1-21 Г 9 81 [3 511.1 2] = [3-4 + 5.1 3-3 + 5-2] = [17 19> Произведение тех же матриц в обратном порядке равно Г4 31Г2 П [4.2 + 3-3 4-1+3-51 [17 191 |_1 2\\Ъ б] = 11.2+2.3 Ы +2.5.1 = [8 11> Мы видим, что умножение матриц (вообще говоря) не коммутативно. Рассмотрим свойства умножения линейных операторов и умножения матриц.
102 ЛИНЕЙНЫЕ ОПЕРАТОРЫ 1ГЛ. III 1. Если зФ, Я\ <в — линейные операторы, то (зФЯ)<ё> = зФ(Я&). Действительно, для любого вектора хей имеем [(&Я)Ф]х = (аЯ)(9х) = &(Я{9х)) и [зФ {ЯФ)]х= зФ[(ЯФ) х] = &{Я(9х))\ таким образом, умножение линейных операторов (а, следовательно, и матриц) ассоциативно. Произведение (зФЯ)^ = зФ^ЯЩ линейных операторов, состоящее в последовательном их выполнении: сначала Ф, затем Я и, наконец, зФ,— обозначается обычно просто через зФЯ%? — без скобок. 2. Для любого линейного оператора зФ зФ8 = §зФ = зФ. Матрица Е тождественного оператора & (см. выше, стр. 97) называется единичной матрицей. Для любой матрицы А (того же порядка, что и Е) АЕ = ЕА=А. 3. Умножение и сложение линейных операторов сея- заны дистрибутивными законами: (зФ + Я)9 = зФЪ +Я& и Ч?(з* + Я) = ЪзФ +&Я, так как для любого вектора х е /? ((& + Я)Ф)х = (зФ + Я)(<ё>х) = зФ(^х)+Я(^х) = = {ач?)х + {ящх = (&<г? +м>)х и (V (зФ + Я))х = У {{зФ + Я)х) = <&{зФх+Ях) = = V {зФх) + <8 {Ях) = (<ё>зФ)х + (ФЯ) х = \$зФ + Я? Я) х. Аналогичные тождества справедливы и для матриц. Вспомним теперь основные законы сложения и умножения чисел, сформулированные на стр. 55—56 (аксиомы поля). Для сложения и умножения матриц мы доказали справедливость всех этих законов, кроме пятого и восьмого. Пример на стр. 101 показывает, что умножение матриц, а значит, и умножение линейных операторов, вообще говоря, не коммутативно,
§ 2] ДЕЙСТВИЯ НАД ЛИНЕЙНЫМИ ОПЕРАТОРАМИ ЮЗ Что же касается существования линейного оператора, обратного к данному, то справедливо следующее предложение: Для каждого невырожденного линейного оператора $Ф существует такой —обратный к зФ линейный оператор зФ~\ что аж-х = ж-ы = & (и соответственно для каждой матрицы А, определитель которой отличен от нуля, существует такая обратная к А матрица А~1, что АА~{ = А~1А = Е). Докажем это. Пусть зФ — невырожденный линейный оператор, имеющий в некотором базисе еи е2, ..., еп матрицу А. Мы докажем сначала существование обратной к А м а т р и ц ы, т. е. такой матрицы, Л, что АА~1 = А-1 А = Е\ тогда линейный оператор &-1, имеющий в том же базисе ей е2у ..., еп матрицу Л-1, будет обратным к зФ: ведь последовательное применение операторов бФ~1 и зФ одного за другим будет линейным оператором с единичной матрицей, т. е. тождественным оператором. Итак, пусть дана матрица А=[а{}], определитель которой отличен от нуля. Рассмотрим матрицу, составленную из алгебраических дополнений соответствующих элементов матрицы Л: '11 *12 •Ах *712 При транспонировании ее получается матрица Л, называемая присоединенной к матрице Л: 412 '21 ?22 1Ш п2 ^Ш Перемножая данную матрицу Л и матрицу Я, получим \А\ О ... О О | А\ ... О АА = АА = ..\А\Л
104 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III (теоремы 3 и 4 главы I). А следовательно, матрица л-1 _А_ \Л\ будет обратной к Л. Пример. Найти матрицу, обратную к ¦и ¦ -о Решение. Определитель матрицы Л равен 4. Алгебраические дополнения ее элементов: Лп = 2, Л12 = —-2, Л13 = 2, А2\ = —2, А22 « 4, Л23 = —2, Л31 = —8, Л32 Л 10, Л3з = —4 и, значит, Г 2 -2 -81 - Г 1 —1 -41 1=_ -2 4 10 I = -Л— I —1 2 5 . 4 I 2 -2 -4] 2 [ 1 ~1 -2] Заметим, что если операторы $4> и 3$ невырожденные, то таким же будет и их произведение (так как из равенства ($Ф&)х = зФ{$х) = 0 вытекает, что ^х = 0 и, значит, я = 0), причем (а для матриц (АВ)'1 = В-1Л~1), так как Теорема 3. Определитель произведения двух мат- риц равен произведению определителей сомножителей: если ЛВ = С, то |С| = |Л| |Д|. Доказательство. Пусть АВ = «11 «21 аШ «12 • «22 • «П2 • •• «1»" • «2» • • «пп - • Г*11 *»1 Ь»1 *1. • *22 • ьпг ¦ ¦¦ ь1п- ¦•ь2п ¦¦ Кп- = = "С11 С21 -СШ С12 • С22 • СП2 ' • • С1Л •• сгп • • спп^
§2] ДЕЙСТВИЯ НАД ЛИНЕЙНЫМИ ОПЕРАТОРАМИ 105 Тогда, как известно, С1к = Я/А* + а12,Кк +...+ СЦпКк = 2 СЦ$зк. Определитель матрицы С равен 3=1 |С| = п п п 2 а1кьп1 2 «Ла ••• 2 ч^ п п п 2 а*нЬк\ 2 *а;А.2 ••• .2 Чз^зпп ?1 = 1 ;«=1 ^п=1 2 ап'пЬп\ 2 ^А.2'" .2 <ЧАп* Л=1 ;»=1 По свойству 4 определителей его можно представить в виде суммы Э1,Зг,--->Эп а1кЬпг а13шьи% а15пд1п* Д2;А»1 в2*А,1 --•а2]пЬЗп" ап- Ь- л а - Ъ- 0 п-?п Зпп где индексы /1, /2, * *., /« независимо друг от друга пробегают все значения 1, 2, 3, ..., л (всего в этой сумме пп слагаемых). Однако можно считать, что в определителе, стоящем под знаком суммы, все индексы /ь /2, ..« ...» /п различны, так как те определители, у которых имеются одинаковые индексы Д, равны нулю как определители с пропорциональными столбцами. Таким образом, в этой сумме остаются только п\ слагаемых, отвечающих разным наборам /ь /2, ..., /». Вынося теперь за знак определителя общий множитель элементов каждого столбца, получим |С|= 2 6Л1&/«2 • • • Ь/Пп ЗнЗп»чЗп чи Ч)% • • • а2]п апз\ апз\ • • • ап)п где суммирование ведется по всевозможным перестановкам /ь /2, ...»/п чисел 1, 2, ,,,, я,
106 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III В определителе, стоящем под знаком (последней) суммы, переставим столбцы так, чтобы вторые индексы их элементов расположились в порядке возрастания. Это можно сделать посредством нескольких транспозиций столбцов. Так как при переходе от одной перестановки к другой той же четности требуется четное число транспозиций, а при переходе к перестановке другой четности— нечетное число транспозиций (а перестановка 1, 2, ..., п — четная), то определитель в правой части последнего равенства равен (— 1)['||*"—«*п] \А |. Таким образом, получаем |С|«. .2 . (-1)У1,,§ 'п]Ь3аЬ,ш*...Ь,пп1А\=\А\\В\. Следствие, |Л~!| = \А\~Х, что вытекает из равенства 1=|Е| = |ЛЛ-Ч = И||Л-Ч. § 3. Прямоугольные матрицы Матрица, состоящая из т строк и п столбцов, называется [т X п] -матрицей. Можно определить сложение [т X я] -м а т р и ц, полагая 21 12 °22 + я^-1 11 22 2п *-Ь Ь в11 +*11 тпп 2 *21+' 21 + ь. аш + Ьы °2П +Ъ2П + к ,+к а +Ь ^ тпп ' тпп Ш\ ' ТП\ ТП2 ' Ш2 и умножение [тХ^] -матрицы на число а— равенством а 1 2 л1п аа, аа, 2 22 аа аа, аа т\ т2 тп Легко видеть, что относительно этих операций сложения и умножения на число [т X п] -матрицы (в частности, квадратные матрицы порядка п) с элементами из поля Р сами образуют векторное пространство над полем Р. Обозначим [тХ п] -матрицу, у которой эле-
«3] ПРЯМОУГОЛЬНЫЕ МАТРИЦЫ 107 мент /-й строки и к-го столбца равен 1, а все остальные элементы равны нулю, через е^. Тогда ясно, что эти матрицы е*А, где / = 1, 2, ..., т, к = 1, 2, ..., п, линейно независимы и что каждая [тХ я]-матрица является их линейной комбинацией. Следовательно, размерность пространства [т X я] -матриц равна тп. В частности, пространство всех квадратных матриц порядка п имеет размерность п2. Прямоугольную матрицу можно рассматривать как матрицу линейного оператора, отображающего одно векторное пространство в другое. А именно, пусть имеются два векторных пространства Яп и Нм, вообще говоря, разных размерностей п и т, но над одним и тем же числовым полем Р, и предположим, что каждому вектору лсе/?п поставлен в соответствие вектор ^еЛт так, что выполнены следующие условия: 1. зФ{х + у) = &х + ^у, 2. Ж (ах) = азФх для всех х, у е Нп и а е Р. Мы говорим тогда, что $& есть линейный оператор, отображающий пространство Нп в Цт, или линейное отображение /?й в Нт. Выберем в пространстве /?п базис ей е*, ..., в„, а в пространстве /?т базис /ь Ь> ..., /т. Вектор Аеи где 1= 1, 2, ..., /г, принадлежит /?т, и следовательно, его можно разложить по базису /ь /2, ..., Д»; пусть Жех = аии + Я21/2 + • • • +ат\!т9 ЗФе2 = а\2!\ + 022^2 + • • • + Ят2/т, &еп = а\п\\ + а2п{2 + • • • + Ятп/т. Таким образом, линейному оператору ^, отображающему пространство /?п в Нт} соответствует прямо- угольная матрица га. 11 *21 "*12 П *-а я^-1 тп1 т2 столбцы которой образованы коэффициентами разложений векторов е{ по векторам /,-. По аналогий с умножением квадратных частиц можно определить и умножение прямоугольных
108 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III матриц. Такое умножение выполнимо только в том случае, если длина строки левого множителя равна длине столбца правого, т. е. когда число столбцов левого множителя равно числу строк правого. Произведение ЕтХя]-матрицы на [п Хр]-матрицу будет, очевидно, тХр]-матрицей. В частности, произведение [тХя]~ матрицы на [лХ 1]-матрицу, т. е. на столбец, будет Е/лХ П-матрицей, т. е. столбцом, а произведение 1 Хт]-матрицы, т. е. строки, на [тХп]-матрицу будет [1 X п] -матрицей, т, е, строкой. Примеры. 3. [1 ПО 0 7"|. [14 20]. Нетрудно понять «геометрический смысл» операции умножения прямоугольных матриц. Пусть имеются три векторных пространства, вообще говоря, разных размерностей: /?п, /?т, /?р, и пусть даны два линейных оператора: зФу отображающий /?т в /?р, и ^, отображающий /?п в /?т. Оператор зФ&, ставящий в соответствие каждому вектору *е#* вектор бФ(&х) пространства Нру называется произведением операторов $Ф и $. Легко видеть, что $Ф& является линейным оператором, отображающим Кп в /?р, и что если оператору Ж отвечает [/>Хт] -матрица Л, а оператору 33— [тХп] -матрица В, то матрицей оператора $Ф& будет [рХп]-матрица АВ. Как и для квадратных матриц, умножение прямоугольных матриц ассоциативно: А (ВС) = (АВ)С, и дистрибутивно относительно сложения: (А + В) С и = АС + ВС, С (А + В) = СЛ+Сй,— разумеется, если матрицы таковы, что все эти действия над ними выполнимы, Кроме того, если А — произвольная
§3] ПРЯМОУГОЛЬНЫЕ МАТРИЦЫ 109 [тХя]-матрица, то АЕп — А и ЕтА = Л, где Ек — единичная матрица порядка к. Рассмотрим снова систему линейных уравнений #11*1 Г #12*2 "Г • • • "Г #1п*П === &1> | #21*1 "г #22*2 Т" • • • + #2п*П === » I /ОЧ #т1*1 "Т #т2*2 ~Г • • • ~Г #тпл*п — &т* / Обозначим через Л матрицу из коэффициентов при неизвестных этой системы, через X — столбец, составленный из неизвестных, и через В — столбец, составленный из правых частей. Тогда систему C) можно записать в виде одного матричного уравнения АХ = В. Если матрица А квадратная и ее определитель отличен от нуля, то существует обратная к ней матрица А. Умножая обе части последнего равенства слева на Л-1, получим Л-1 (АХ) = А~1В9 откуда X = А~]В. В более подробной записи это — формулы Крамера (ср. выше, стр. 33). Если зФ — линейный оператор в пространстве /?иЛ — его матрица в некотором базисе ек% е^ ..., еп, в котором *=(*Ь *2, ..., *п) И^Х=(хиХг9 ...,*п),ТО формулы A) из § 1 можно записать в виде одного матричного уравнения У = АХ% где X —столбец из координат вектора х, а У — столбец из координат вектора зФх. Наконец, если С —матрица перехода от базиса ей еъ> м,^к (новому) базису еи еа, ..., ^п, ТО Аст = ОЛнов, где Хсг — столбец старых, а Хяов — столбец новых координат вектора х (см. формулы в § 6 главы II). Из последней формулы непосредственно вытекает равенство: Хиоъ—С^Хсл т. е. что новые координаты получаются из старых с помощью матрицы, обратной матрице перехода, что впрочем вполне очевидно и так.
по ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Укажем здесь еше один, практически более удобный, чем изложенный выше, способ вычисления матрицы Л, обратной данной невырожденной матрице Л. Выпишем рядом матрицу Л и единичную матрицу Я и над строками их будем одновременно производить элементарные преобразования до тех пор, пока матрица А не превратится в единичную. При этом исходная единичная матрица превратится в Л". Рассмотрим пример. Пусть нам надо найти матрицу Л, обратную матрице Л = К Л. Выпишем рядом с Л единичную матрицу Е и над строками полученной «объединенной (прямоугольной) матрицы» будем производить элементарные преобразования: сначала отнимем от второй строки утроенную первую, затем разделим вторую строку на —2, вычтем удвоенную вторую строку из первой и, наконец, переставим строки. Так мы получим последовательно: [ЛИ!1~[-3 1|4?]~[!1Ц4]~ I.1 °|Т-Т| Ь 11 —2 1 ]• В последнем «блоке» левая матрица — единичная, а правая равна Л'1. Можно было бы производить элементарные преобразования не над строками, а над столбцами — одновременно матриц Л и Е,— но всегда либо только над строками, либо только над столбца- ми. Во втором случае (при элементарных преобразованиях столбцов) удобнее располагать матрицы «столбиком»: единичную матрицу Е помещать под матрицей Л. Так, в нашем примере мы будем иметь последовательно: Г2 1- 4 3 1 0 [о 1_ -0 1- —2 3 1 0 _-2 1 - 11 3 Т ° 1 1 ± .1 2 2 1 -2 Здесь удвоенный второй столбец вычитается из первого, первый столбец делится на —2, утроенный первый столбец вычитается из второго и, наконец, столбцы меняются местами. После того как верхняя матрица превратилась в единичную, нижняя будет равна Л. Для того чтобы обосновать эти действия, заметим следующее,
§3] ПРЯМОУГОЛЬНЫЕ МАТРИЦЫ 111 1. Умножение произвольной [пХ т]-матрицы Л слева на матрицу В порядка я, получающуюся из единичной матрицы умножением ее /-й строки на число с, равносильно умножению на с /-й строки самой матрицы Л. В то же время умножение матрицы А на аналогичную матрицу В\ поряка т справа равносильно умножению на с /-го столбца матрицы А. (Проверьте это сами.) 2. Умножение [п X т] -матрицы А слева на матрицу С порядка п, получающуюся из единичной матрицы перестановкой ее 1-й и к-й строк, равносильно перестановке 1-й и к-й строк самой матрицы Л, а умножение матрицы А на аналогичную матрицу С\ порядка т справа равносильно перестановке /-го и к-го столбцов матрицы А. (Проверьте и это.) 3. Умножение [лХ т]-матрицы А слева на матрицу Д получающуюся из единичной матрицы порядка п прибавлением к ее 1-й строке к-й строки, умноженной на с, равносильно аналогичной операции над строками самой матрицы А. Так, например, [-3 \\[4 з] = [-2 о]' В то же время умножение матрицы А справа на матрицу йх порядка т, получающуюся из единичной матрицы прибавлением к ее 1-иу столбцу я-го столбца, умноженного на число с, равносильно аналогичной операции над столбцами самой матрицы А, (Докажите все это сами.) Так, например, [I з][~2 ?Ы-2 з]' Пусть теперь А — матрица, обратная Л, тогда АА~1 = Е. Элементарные преобразования над строками матрицы Л равносильны умножению ее слева на некоторые специальным образом подобранные матрицы. На те же матрицы одновременно умножается и матрица В. В нашем примере элементарные преобразования над строками матрицы к Л отвечают таким действиям: [-]Г'][»4][-з°]^= о -[¦ •][• 1Р 4][-з ']•• Но произведение С:][: % -й-.']- равно Е, и значит, правая часть последнего равенства равна Л. Элементарные преобразования столбцов отвечают умножению равенства Л"М = Е (обратите внимание на то, что теперь мы
112 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III А так как произведение написали матрицу А справа) справа на определенным образом подобранные матрицы. Так, в том же примере мы имеем л«л\ 1 °1Г-т °1 Г* -з1[° '1= I.—2 1][ О 1.Ц.0 \]11 О] -и ;][1:][: Ш :]¦ •и :][-т:][: ¦*:] равно Е, то правая часть последнего равенства равна Л. Заметим, что аналогичный прием можно применить и при решении матричного уравнения, скажем, вида АХ = В, где А - - квадратная матрица порядка я, Я —искомая и В —данная [пХт]-матрицы: производим элементарные преобразования строк одновременно матриц А и В до тех пор, пока матрица А не превратится в единичную; при этом матрица В превратится в А В = X. (Сравните это с "методом Гаусса на стр. 50, которым, в сущности, решается матричное уравнение АХ = В, где А — матрица из коэффициентов при неизвестных, X — столбец неизвестных и В — столбец правых частей.) § 4. Изменение матрицы линейного оператора при переходе к новому базису Пусть линейный оператор «я^, действующий в пространстве /?, в базисе еи е2, ..., еп имеет матрицу ^ = [Ън], а в базисе еъ е2, ...,еП9 вообще говоря, другую матрицу Ах = [а\к]. Найдем, как связаны между собой матрицы А и А\. Обозначим через С = [с{к] матрицу перехода от базиса е\9 е2, ...., еп к базису еи е2, .. .,еп. Тогда *\ = сцег + ^2^2 + • • • + сп$ъ% где I = 1,2 п. Будем матрицу С рассматривать как матрицу линейного оператора & в базисе еи е2, ,,., еп. Тогда очевидно, что Фвг — сие1 + с2{е2 + .. + сп\еп = еи и значит, линейный оператор ^ переводит векторы еи е2, ,.., еп соответственно в векторы е[ е2, ..., еп.
$4] ПЕРЕХОД К НОВОМУ БАЗИСУ 113 Определитель матрицы С отличен от нуля (§ 6 главы II), а значит, для ^ существует обратный оператор «87-1 такой, что^1^ ех, Ф^е* = ег, ..., Ф^е'п = еп. По условию, зфе\ = а'це[ + а^е2 + ... + вп1*п. Применяя к обеим частям этого равенства оператор У-1, получим У" 1зфе\ = а'х^ + а^г + • • • + а'теп- Подставляя в левую часть последнего равенства е\ = =($?еи будем иметь <&~1а<&е{ = а'цех + а21е2 + ... + атеп, D) т. е. матрицей оператора Ф'^Ф в базисе еь е*, .<¦, еп является матрица Ау. Но, с другой стороны, матрица этого оператора равна произведению матриц операто* ров У, зФ и Ф в базисе еи е2,..., еп, т. е. Л! = С~*АС. (б) Отсюда, в частности, следует, что определитель матрицы линейного оператора не зависит от базиса: № = |с-мс| - |с-чицс| - |С|-»|Л||С| - |Л| (см. следствие на стр. 106). Пример. В базисе еи е2 преобразование & имеет матрицу А =а = »6^1 г Написать матрицу этого преобразования в базисе е'1~е1 + 2ег е'г=2ех + 3е%. Решение. Матрица перехода здесь С = 2 я г а °^Ратная х ней матрица С" в 2 _ 1 ]• Следовательно, Формулу E) можно получить еще и следующим образом. Как показано в § 3, имеем Дет ==: С»Лнов И /ст :=х ^-*нов» * СТ == **Лс2 И 'ВОВ =8 ^»1ЛнОВ»
114 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Следовательно, СУН0В = Уст = АХСт = АСХнов, откуда УНОв = «= С~1АСХнов. Но Унов = ЛДнов, и значит, А{ = С~{АС. (Легко видеть, что из матричного равенства ВХ = В\Х, справедливого при всех X — если В и В1 одного строения, вытекает, что В = Бь) § 5. Ранг и дефект линейного оператора Определение 2. Пусть Ж — линейный оператор, действующий в пространстве #. Совокупность зФ% всевозможных векторов виде зФх, где хе/?, называется областью значений оператора $4>, или образом пространства /? при преобразовании $Ф, а множество N всевозможных векторов х, для которых зФх = О, — ядром оператора зФ. Покажем, что область значений и ядро линейного оператора $Ф являются подпространствами в /?. Действительно, для области значений это вытекает из теоремы 1, если рассматриваемое в ней подпространство /?1 совпадает со всем пространством /?. С другой стороны, если х, уеЛ^, т. е. если зФх = О и зфу = 0, то и зФ (х + у) = зФх + зФу = 0 и^ {ах) = = аЖх = 0, т. е. х + у&Ы и ах&Ы, и значит, N — подпространство. Размерность области значений оператора зФ совпадает с рангом матрицы А (и называется рангом оператора зФ). Действительно, подпространство зФН порождается векторами зФеи зФеъ ..., зФепу F) где ей е2> ..., еп — любой базис пространства #, и значит, размерность бФН равна максимальному числу линейно независимых векторов в системе F), т. е. равна максимальному числу линейно независимых столбцов матрицы А. Размерность ядра N называется дефектом линейного оператора бФ. Теорема 4. Сумма ранга и дефекта линейного оператора равна размерности п пространства. Доказательство. Если ранг линейного оператора зФ равен г, то среди векторов бФе\, $Фе2> ..., <&еп найдется г линейно независимых, через которые линейно выражаются все остальные. Пусть, для определенности, это будут бФех% бФе2, ..., *Фег.
§61 НЕВЫРОЖДЕННЫЙ ЛИНЕЙНЫЙ ОПЕРАТОР Ц5 Обозначим через Ь подпространство, порожденное в Я векторами еь е2} ..., ег> и покажем, что (г-мерное) подпространство Ь и ядро N пересекаются только по нулевому вектору. Действительно, если х е IП Л^, то *е1, т. е. х = а\ех + а2е2 + .>> + <*&, и хе№, т, е. зФх = а\бФе\ + а2^Фе2 + . -. + агзФег = 0. Но так как векторы бФеи зФе2, ..., зФет линейно независимы, то а\ = = а2 =з... = аг = 0 и х = 0. Покажем теперь, что подпространства Ь и N порождают все Я (т. е. что их сумма совпадает с /?). Пусть х — произвольный вектор из /?. Тогда Лб^ и, следовательно, зФх = $\&е\ + $2<&е2 + ... +$гзФег. Вектор У = 01*1 + $2е2 +-... + $гег принадлежит, очевидно, I, а разность г = х — {/е/^, так как зФг=*зФ(х— у) = *=бФх — ^г/==0. Мы нашли, что х = у + г, где уе1, а2Е^ Таким образом, пространство Я равно прямой сумме подпространств Ь и Ы, г значит, его размерность п равна сумме размерностей этих подпространств. В дальнейшем нам понадобится еще такое Определение 2'. Пусть зФ — линейный оператор, отображающий пространство Я\ в пространство Я2 (вообще говоря, другой размерности). Тогда множество $4>Я\ ^ Я2 всех векторов у из /?2 вида у = зФх> где х е е#ь называется областью значений оператора зФ (или образом пространства Я при отображении зФ), а множество №^Я\ всех векторов х из Я\ таких, что зфх = 0,— его яд ром. Нетрудно видеть, что область значений оператора зФ является подпространством в /?2, а его ядро —подпространством в Я\ (докажите это), § 6. Невырожденный линейный оператор Линейный оператор зФ мы назвали невырожденным, если из равенства зФх = 0 вытекает, что х=0 (§ 1). Далее, в § 1 было показано, что матрица невырожденного линейного оператора в любом базисе имеет отличный от нуля определитель, а в § 2,— что для всякого невырожденного линейного оператора зФ существует обратный линейный оператор бФ~1. Наоборот, если для линейного оператора зФ существует обратный оператор
116 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III $Ф~Х> то этот оператор — невырожденный, так как из равенства $1>х = 0> применяя к. обеим его частям оператор з4>~19 получаем зф-х($4>х) — &~10 = 0; но зФ~х(зФх) — = (зф-х&)х = &х = х, и значит, х = 0. Раяг невырожденного линейного оператора в пространстве /?п = /? равен гс, так как определитель его матрицы отличен от нуля; дефект невырожденного линейного оператора равен нулю. Обратно, всякий линейный оператор ранга п будет, очевидно, невырожденным. Область значений невырожденного линейного оператора п- мерна и, значит, совпадает со всем #: невырожденный линейный оператор отображает /? на все /?. Ядро невырожденного линейного оператора состоит лишь из нулевого вектора. Невырожденный линейный оператор взаимно однозначно отображает пространство К на себя, так как из равенства бФх = зФу вытекает, что бФ(х — у) = 0 и, значит, х — у = 0, т. е. х = у. Под действием невырожденного линейного оператора линейно независимые векторы переходят в линейно независимые. Действительно, если векторы ей е2, ..., ек линейно независимы и ъ\з4<е\ + а2^е2 + ... + икЖек = = Ж (а^1 + а2е2+ ,.. акек) = 0, то а\е\ + а2е2 + ... + акек = 0 и а\ = а2 = ... = ак = 0. Следовательно, если $1 —- невырожденный линейный оператор и подпространство Я\^Я г-мерно, то и подпространство зФЯ\ имеет ту же размерность г. Покажем, что если зФ — линейный оператор ранга г, а 38 — невырожденный линейный оператор, то оба оператора <&& и &з4> будут ранга г. Действительно, область значений (невырожденного) линейного оператора & совпадает со всем пространством; ДЦ = /?, и следовательно, область значений оператора бФ& г-мерна, т. е. ранг оператора $4>& равен г. С другой стороны, область значений ЖК оператора^ г-мерна, а так как оператор ^-невырожденный, то он переводит г-мерное подпространство ${>Я в г-мерное же подпространство &$4-Я, и значит, область значений оператора жзФ тоже г-мерна, т. е. ранг оператора &54> равен г.
17] ИНВАРИАНТНЫЕ ПОДПРОСТРАНСТВА 117 § 7. Инвариантные подпространства Пусть /?1 — подпространство векторного пространства К и ^ — действующий в Я линейный оператор. Образ $Фх вектора х из /?ь вообще говоря, не обязан принадлежать /?ь Особый интерес представляют такие подпространства, векторы которых действием оператора зФ не выводятся из этих подпространств. Определение 3. Подпространство Я\ пространства Я называется инвариантным относительно линейного оператора зФ, если образ зФх каждого вектора х из /?1 принадлежит /?1 (иными словами, если зФК\^Н\). Примеры. 1. Пусть зФ— поворот вокруг оси Ог обычного трехмерного пространства. Инвариантными подпространствами будут, например, плоскость хОу и ось Ог. 2. Если ^ — ортогональное проектирование того же пространства У?3 на плоскость хОу, то инвариантными подпространствами будут: плоскость хОу, все плоскости, проходящие через ось Ог, сама ось Ог и все прямые, содержащиеся в плоскости хОу (и проходящие через начало координат). 3. В пространстве Рп многочленов степени не выше п подпространства Рк при всех к, О < к ^ л, инвариантны относительно оператора дифференцирования. 4. В любом пространстве каждое подпространство инвариантно относительно тождественного и нулевого операторов. 5. В любом пространстве само пространство Я и его подпространство, состоящее из одного нулевого вектора, инвариантны относительно любого линейного оператора. Покажем, что пересечение и сумма подпространств, инвариантных относительно линейного оператора зФ, инвариантны относительно зФ. Действительно, если подпространства /?1 и /?2 инвариантны относительно зФ и ^е^П^г, то хеЯ\ и *е/?2, а значит, Ах^Я{ и Л*е/?2, т. е. Ах(=Я{ Г) #2. С другой стороны, если х е Я\ + /?2, то х = и + у, где иб^ь V е /?2. Но тогда бФи е ки Аю е К2 и зФх = = зФи + ^<=Я{ + #2. Теорема 5. Если зФ — невырожденный линейный оператор и Нх —подпространство, инвариантное относительно зФ, то /?1 инвариантно и относительно зФ~1,
118 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Доказательство. Пусть еи е2у ..., ег — базис подпространства /?!. Тогда векторы зФеи зФе2у ..., зФег, тоже принадлежащие К\ (ввиду инвариантности К\)> линейно независимы (см. § 6), и значит, они тоже образуют базис /?ь т. е. произвольный вектор х^Я\ представляется в виде х = а\зФе\ + а2зФе2 + ... +аг<$Фег. Но тогда и эф~хх = а\ех + <х2е2 +... + агег принадлежит /?ь Сделаем еще одно, полезное для дальнейшего Замечание. Пусть зФ — произвольный линейный оператор, действующий в п-мерном пространстве /?; предположим, что /? распадается в прямую сумму /? = /?1 Ф /?2 своих подпространств /?1 и Н2> инвариант- ных относительно $Ф; еи е2у ..., ет — базис/?! и ег+и ^г+2, ...» еп — базис /?2. Ввиду инвариантности подпространств /?1 и /?2> имеют место равенства зФе{ = ацвх + а2{е2 +... + ЯгА при * = 1, 2, ..., г и зФек = аг+\г кег+\ + аг+2, кег+2 + ... +апкеп при к = г+ 1, г+ 2, ..., п (так как ^е/?! при 1=1, 2, ..., г и зФек^К2 при /г = г + 1, г+ 2, ..., п). Тогда матрица оператора зФ в базисе бь е2) ...Уеп всего пространства имеет вид Га11 а21 *п 0 0 *12- а22- аг2 ' 0 . 0 . • а2г ..агг ..0 ..0 0 0 0 аг ап + 1.Г+1 ,г+1 0 0 0 аг Я* . • +1,г+2 * ,г+2 ..0 ..0 .. 0 • • аг+1.1 • апп Можно сказать, что матрица А «распадается на клетки»: где А\ — матрица оператора зФ в подпространстве /?ь Аг — матрица оператора зФ в подпространстве /?2> а пря-
§81 СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 119 моугольные матрицы в левом нижнем и правом верхнем углах матрицы А состоят из одних нулей. Таким образом, зная матрицы А\ и А2 оператора зФ в подпространствах Н\ и /?2, мы можем составить из них матрицу оператора зФ во всем пространстве /?. Верно и обратное утверждение: если матрица оператора }ф в некотором базисе имеет «клеточный» вид G), то пространство /? очевидным образом распадается в прямую сумму инвариантных относительно зФ подпространств /?1 И /?2. § 8. Собственные векторы и собственные значения линейного оператора В предыдущем параграфе мы познакомились с определением подпространства, инвариантного относительно данного линейного оператора. При этом особый интерес представляют одномерные инвариантные подпространства. Пусть /?1 — такое подпространство и х^Ях (где хфО); тогда ЖхеКи и значит, зФх = Х0х, где Яо — число. Если у— любой другой вектор из Ки то у = ах и бфу = зФ (ах) = а$Фх = а (Х0х) — Я0 (ах) = К0у. Определение 4. Вектор х ф О называется собственным вектором линейного оператора зФ, если найдется такое число Я0> что зФх = Х0х\ это Х0 называется соот- вествующим вектору х собственным значением оператора зф (матрицы А). Как мы только что видели, если Н\ —одномерное инвариантное относительно оператора зФ подпространство /?, то каждый ненулевой вектор из /?1 является собственным вектором оператора $Ф и притом с одним и тем же собственным значением. Обратно, если х — собственный вектор оператора зФ, то порожденное им одномерное подпространство У?1 (состоящее из всех векторов вида ах) будет, очевидно, инвариантным относительно зФ. Как найти собственные значения и собственные векторы линейного оператора! Предположим, что # —собственный вектор, а Х0— соответствующее ему собственное значение линейного оператора зФ, Тогда зФх = К0х.
120 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Выберем в пространстве /? какой-нибудь базис ей е2,... ..., еп, и пусть х = х1е[ + х2е2+ ... + хпеп, а матрица оператора Ж в этом базисе А=[а{к]. Тогда (см. § 1) Жх = (апХ1 + ах2х2 + ... + аихп)ех + + (Я21*1 + ^22*2 + • • • +а2пХп) в2 + . . . ... + (ап\Х1 + ап2х2 +.., + аппхп) еп = = М*1*1 +х2е2 + ... + хпеп), откуда, ввиду единственности разложения вектора Жх по базису еи е2у ...» е„, ((«и — К) х1 + 012*2 + • • • + а1пхп = 0, I а21хг + (а22 — К) х2 + ... + а2пхп = 0, ^ I ап1хг + ап2х2 + ... + (апп - К) *п = 0. Для существования ненулевого решения этой (однородной) системы необходимо и достаточно, чтобы ее определитель был равен нулю: Ники кг ¦Л °12 а22" а»12 •• -К- .. ¦ат •а2п •апп ~\\ (теорема 10 из главы I). Левая часть последнего равенства совпадает со значением при X = Хо определителя \А— ХЕ\ матрицы А— ХЕ, который является многочленом относительно X степени п. Коэффициенты этого многочлена ср{X), называемого характеристическим многочленом матрицы Л, принадлежат, очевидно, основному полю Р. Ниже (теорема 6) будет показано, что многочлен <р(Я) на самом деле не зависит от выбора базиса, и поэтому его можно нааГвать характеристическим многочленом оператора^. Мы доказали, что каждое собственное значение ли- нейного оператора зФ является корнем его характеристического многочлена. Обратно, каждый корень Хо характеристического многочлена оператора зФ будет его собственным значением — соответствующие Хо собственные
§ 8] СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 121 векторы находятся из системы уравнений (8), которая в этом случае обязательно имеет ненулевые решения, так как ее определитель равен нулю. Теорема 6. Характеристический многочлен линейного оператора не зависит от выбора базиса. Доказательство. Пусть фв(А,) = \А— ХЕ\ — характеристический многочлен оператора ^ в базисе ей #2» • • •» 2п- Предположим, что новый базис еи е%% ..., еп получается из старого с помощью матрицы С. Тогда характеристический многочлен оператора бФ в базисе еие2\ • • •» еп фе, (Я) = \(ГгАС - ЛЯ | = | С'1 АС - С~гХЕС\ = = | С Г1 \А - ХЕ11 С | = | А - ХЕ | - Фв (%). Пусть срОО = (-1)ПГ+ (-1)"-|а1Х-1 + ... + о» — характеристический многочлен оператора $Ф. Легко видеть, что а\ равно сумме аи + а22 + .. +апп диагональных элементов матрицы А (эта сумма называется следом матрицы А и обозначается символом 1г А*)). С другой стороны, ап = ф@) есть определитель матрицы А\ поэтому для того чтобы оператор зФ был невырожденным, необходимо и достаточно, чтобы ф@) было отлично от нуля, т. е. чтобы оператор $4> не имел нулевых собственных значений (что, впрочем, ясно и непосредственно). Для тождественного оператора все ненулевые векторы пространства являются, очевидно, собственными (с собственным значением, равным единице). Для нулевого оператора все ненулевые векторы пространства являются собственными (с собственным значением, равным нулю). Найдем собственные значения и собственные векторы преобразования 1 из § 1. Характеристический многочлен I С05 Ф — К — 31П Ф | Ф(Я)= , т 1=А,2-2со5ф.А,+ 1. *) От английского слова 1гасе — след; иногда также употребляют обозначение 5р А от немецкого слова 5риг — след.
122 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Его корни А,1,2 = С05 ф ± 131П ф комплексны. Значит, в вещественной плоскости, и если ф не кратно я, это преобразование не имеет собственных значений. Если ф = 2я&, преобразование является тождественным, и каждый вектор плоскости — собственный (причем X = 1). Если ф = B6+ 1)я, преобразование является центральной симметрией, и каждый вектор плоскости будет собственным с собственным значением, равным —1. В комплексном случае система (8) приводится к уравнению 1х\ + х2 в 0 для собственного значения Х\ = соз ф + / з!п ф и к уравнению 1хг — х2 = 0 — для корня Х2 = соз ф — / з1п ф. Это дает два линейно независимых собственных вектора A, —/) и A, I). Рассмотрим еще одян пример. Пример. Найти собственные значения и собственные векторы линейного преобразования зФ с матрицей -в л- Решение. Характеристический многочлен преобразования бФ\ 1-Я 2 Ф(Я) = 4-Х = А,а-5Я-6. Его корни Я.1 = 6, Л,2 = —1. Собственные векторы находятся из двух систем уравнений: A-*,)*! +2*,.-0. б*!+ D-*,)*, «<* /я 1,2, каждая из которых, поскольку ее определитель равен нулю, сводится к одному уравнению. При К *=* 6 это — уравнение 5*1 — 2х2 = 0, из которого находим: Ху: х2 = 2: 5, и в качестве собственного вектора, соответствующего X = 6, можно взять а{ = B, 5) (или любой вектор, кратный ах). При X ж=х —1 имеем уравнение х\ + х2 = 0, из которого х\: х2 = —1, и соответствующий собственный вектор а2 =* A, —1) (или любой вектор, кратный ему). Особенно простой вид принимает матрица линейного оператора, имеющего п линейно независимых собственных векторов. В самом деле, пусть линейный оператор зФ имеет п линейно независимых собственных векторов 0ь г2, ..., ^п с собственными значениями, соответственно равными %и %2> •••, Лп. Векторы ей е2у ,.., еп примем за базисные, тогда, ввиду равенств зфе{ = ие{ при I = 1, 2, ..., п
§8] СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 123 матрица оператора зФ будет иметь вид ГЯ1 0 [.о 0 . V 0 . .. 0 .. 0 ..к (такая матрица называется диагональной). Верно и обратное: если матрица А оператора зФ в некотором базисе является диагональной, то все векторы этого базиса являются собственными векторами оператора зФ. Однако далеко не каждый линейный оператор в п-мерном векторном пространстве имеет л-линейно независимых собственных векторов. Один из случаев, когда можно утверждать, что базис из собственных векторов («собственный базис») существует, подсказывается следующей теоремой: Теорема 7. Собственные векторы линейного оператора, отвечающие попарно различным собственным значениям, линейно независимы. Доказательство проведем индукцией по числу рассматриваемых собственных векторов. Для одного вектора.* это ясно, так как, по определению собственного вектора, он отличен от нуля (и значит, из равенства ах = 0 вытекает, что а =0). Пусть наше утверждение справедливо для к—1 векторов хи *2,..., *а-ь и предположим, что к собственных векторов отвечающих попарно различным собственным значениям Ки Яг, ..¦> Я*> линейно зависимы: оы*1 + а2х2 + ... + акхк = 0. (9) Применяя к обеим частям этого равенства оператор ^, получим а\&Х\ + а2^*2 + ... + ак^Фхк = 0, или а\к\Х\ + 0^2*2 + ... +аДл = 0. A0) С другой стороны, умножая равенство (9) на Я*, будем иметь «Лл + 02Мз + ... + «ЛЛ — 0- A1)
124 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Вычитая равенство A1) из равенства A0), получим а\ (Кх — Ял) Х\ + (*2 (^2 — К) *2 4" • • • , . . +0&А-1 (Я*-1 — К) *к-\ = 0, а так как, по условию, все А< различны и в силу предположения индукции векторы хи х2, ..., хк-х линейно независимы, то а\ = аг = ... = аА-1 = 0, а тогда из равенства (9) имеем акхк = 0 и ак = 0. Теорема доказана. Таким образом, если линейный оператор зФ имеет п попарно различных собственных значений, то отвечаю- щие им собственные векторы линейно независимы, и матрица этого оператора в соответствующем базисе имеет диагональный вид. Поскольку многочлен с вещественными коэффициентами не обязательно имеет хотя бы один вещественный корень, то в вещественном пространстве не для всякого линейного оператора найдется хотя бы одно одномерное инвариантное подпространство. Однако имеет место следующая Теорема 8. Для всякого линейного оператора, действующего в вещественном пространстве размерности л>2, существует одномерное или двумерное инвариантное подпространство. Доказательство. Если характеристический многочлен оператора зФ имеет хотя бы один вещественный корень, то этот оператор имеет собственный вектор, и значит, в /? существует одномерное инвариантное относительно зФ подпространство. Если характеристический многочлен не имеет веще- ственных корней, мы сошлемся на так называемую основную теорему алгебры комплексных ч исел: Каждый многочлен с комплексными (в частности, с вещественными) коэффициентами имеет хотя бы один (комплексный) корень. В силу этой теоремы (которую мы здесь не доказываем) характеристический многочлен, не имеющий вещественного корня, будет иметь хотя бы один комплексный корень К = а + ф, где р ф 0.
Д8] СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ 125 Решая для этого Я систему уравнений (8), мы найдем соответствующие (комплексные) решения: *1 — Х\ + 1уи г2 = х2 + 1у% • • •> г„ = хп + и/п, и значит, будут справедливы равенства (ап & + и/г) + ам (х% + 1уг) + ... + аг + 1Уп) = = (а +- (р) (хх + 1уд, си (хх + и/х) + а22 (х, + /&) + • • • + а2п (*„ + »'</„) = = (а + ф)(*2 + ад, ап1 & + /г/!) + ап2 (х, + п/2) + ... + апп (хп + 1уп) = ( = (а + ф) (хп + 1уп). Приравнивая действительные и мнимые части, получим две системы равенств: | Яц*1 + «12 *2 + • • • + ащХп = <*Х1 — Рл, I а»л + а22 х2 + ... + а2пх„ = а*г — Рг/2, A2) I ап1*1 + ап2 л2 + • • • + а»»*» = <*хп - р>„ и (аиУ1 + ЯиУ* + • • • + а1пуп = ау1 + Р*ь I апуг + а22*/2 + ... + а2пуп = ау2 + рх2, I ап\У1 + атУг + • • • + аппуп = а«/„ + р*„. Рассмотрим два (вещественных) вектора " = -«161 + х2е2 + ...+ *„е„ И »» г/1^1 + ДО* +... + #„е„. Равенства A2) показывают, что зФи = аи — {№, а равенства A3)—что л^о = ак + ры. Но тогда подпространство Ни порожденное векторами и и V, инвариантно относительно к-, так как если хе/?ь т. е. х= Би + цс, то и &х — \&и -+- т^у = |(а« — р») + г) (ао + 0и) = = (а5 + рч)и+(ач —ДО» принадлежит /?1. Это подпространство двумерно, так как если бы векторы и и и были линейно зависимыми:
126 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III V х=х уи, то мы имели бы $Фи = аи — №= (а — $ч) и, и вектор и был бы собственным вектором оператора $4* с вещественным собственным значением а — $ч. § 9. Спектр линейного оператора Из сформулированной в предыдущем параграфе «основной теоремы алгебры» непосредственно следует, что в комплексном векторном пространстве Я каждый линейный оператор зФ имеет хотя бы один собственный вектор и, значит, в К существует одномерное инвариантное относительно зФ подпространство. Далее, из этой основной теоремы вытекает, что многочлен п-й степени (с комплексными коэффициентами) имеет в точности п (комплексных) корней, среди которых, впрочем, могут быть и равные. Действительно, пусть /(/)—многочлен степени п и /1 — его корень; тогда /@ делится на 1 — 1и т. е. /(/) = {I—'0Ы0» г^е /1(/)—многочлен (л —1)-й степени, тоже с комплексными коэффициентами. Но (} (/) тоже имеет хотя бы один корень /2> и тогда М/) = (/ —^Ы-О» откуда {(() = = (' —*0 (* —УЫО» и т. д. Через п шагов мы получим равенство 1{1) = {1-и){1-12)...{1-(п)с, A4) где 1и и> •.•, ^п — корни многочлена /(/), а с — число. Если множитель / — 1„ входит в разложение A4) к раз, то соответствующий корень 1т называется корнем кратности к, или к-кратным корнем. Покажем теперь, что многочлен /(/) не может иметь корней, отличных от 1\, 1%, ..., /„, в частности, он не может иметь более чем п корней. Действительно, если /0 — корень многочлена /(/), то /(*0)« ц0 - /о (/о - и)... (/о - *») с = о, и значит, одна из разностей /0 — 'ш = 0, откуда и = *т, где т«= 1, 2, ... или п. Пусть теперь ф(Я) — характеристический многочлен линейного оператора зФ и Хи ^2, ..•, К — все его корни (собственные значения оператора зФ)> причем каждый
5 9] СПЕКТР ЛИНЕЙНОГО ОПЕРАТОРА 127 из них взят столько раз, какова его кратность. Мы видели выше (см. стр. 121), что Ф(Я) = (-1)П[ЬП~ («п + «22 + ... апп)Ь»-г + ...], A5) С другой стороны, <р(Ь) = (--1)п(Ь-Ь1) (Я.-Х*) ... (Х-^) — = (-1)п[Г-(Я1+Я2 + ... + иГ + ...]. Следовательно, сумма всех собственных значений %\ + + А* + • • • + ^п оператора зФ равна следу «11 + «22 + •• • + «»п = 1Г Л его матрицы. Но так как след 1гЛ — это один из коэффициентов характеристического многочлена (см.стр. 121), то он не зависит от базиса и поэтому может быть назван следом самого оператора $Ф. Легко видеть, что для любых двух линейных операторов зФ и <% \т{М + Я)=\тМ + \.тЯ. Покажем еще, что Действительно, если А =[а{к], В =[Ь{к], то п п п 1г (&Я) = 2 «1А1 + 2 а2ьЬк2 + • •. + 2 йпкЬкп = А=1 Л=1 Л=1 п / п \ п / п \ = 2 2 «^-=2 2(М») - 1=1 \Л=1 / Ь=1 \*=1 / п п п = 2 Ми + 2 Ь2т2+ ... + 2 Ьптп = 1г (ВЛ). [=1 1=1 1=1 Из доказанного равенства, в частности, вытекает, что для любых зФ, Я (где Я — невырожденный оператор) имеем 1г(Л • аЯ) = 1т {ЖЯ • Л-1) = 1т(^ • ЯЛ'1) = *г^. Отметим еще несколько свойств собственных значений. Пусть ^ —линейный оператор, %{ — его собственное значение и х — соответствующий собственный вектор,
128 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Тогда зФх = Ах Применяя к обеим частям этого равенства оператор $ф, получим зФ{зФх) = бФ{Хх), или к>Н = » К^Фх = Я2*, т. е. %2 — собственное значение оператора зФ2 для того же собственного вектора дг. Аналогично показывается, что при любом натуральном к число Хк есть собственное значение оператора зФк, и для любого многочлена /(/) число ((X)—собственное значение оператора /(^), отвечающее тому же собственному вектору х. Можно доказать и такую более общую теорему: если Ки А,2> ..., Хп — все собственные значения оператора $фу взятые с учетом их кратностей, и /(/)—произвольный многочлен, то {(Х\), /(Хг), ..., !Aп) — это все собственные значения оператора 1(зФ), причем /(^) взято столько раз, какова кратность А,<. Далее, если оператор зФ — невырожденный, то, применяя к обеим частям равенства зФх = Кх оператор <5Ф~1, получим з4>~х($4>х)— зФ~х(\х)у или х = \зФ~хху откуда зФ~хх == К~1х, т. е. Аг1 является собственным значением оператора $Ф~Х с тем же собственным вектором х (ХФО, так как оператор $Ф— невырожденный). Мы видим, что действиям над линейными операторами отвечают соответствующие действия над их собственными значениями. Поэтому набор этих чисел — собственных значений оператора зФ в каком-то смысле определяет этот оператор. Множество всех собственных значений линейного оператора ,$Ф называется его спектром. § 10. Жорданова нормальная форма Этот параграф, несколько более трудный, чем остальные, дальше не используется и при первом чтении может быть пропущен. Пусть бФ — линейный оператор, действующий в векторном пространстве /? размерности л. Как было показано в § 8, если в /? найдется п линейно независимых собственных векторов оператора ^ то в базисе, состоящем из этих векторов, матрица оператора бФ приводится к наиболее простому— диагональному виду 0 0 0 0 ....0 -л
§Ю] Ж0РДАН0ВА НОРМАЛЬНАЯ ФОРМА 129 где Хь %$, ..., ^—собственные значения Л. Так будет, в частности, в том случае, если характеристический многочлен оператора Л имеет п попарно различных корней (см. стр. 123); так будет, как мы увидим ниже, и в случае любого так называемого самосопряженного оператора (как в комплексном, так и в вещественном евклидовом пространстве; см. главу V, стр. 170), и в случае любого унитарного оператора в комплексном евклидовом векторном пространстве (стр. 182). Однако, как уже тоже было сказано выше (§ 8), к такому простому, диагональному виду приводится мат рица далеко не всякого линейного оператора. Рассмот |2 1 рим, например, линейный оператор с матрицей Л*=* д ^ в некотором базисе ех% е2\ характеристический многочлен его ф(Х) = B—кJ имеет два одинаковых корня Хг = = Яа = 2. Собственные векторы этого оператора определяются уравнением 0л;1+1л;2 = 0 (где х, и х2—координаты вектора), или я2 = 0—это только векторы, кол- линеарные ег (ср. стр. 338). Поэтому не существует базиса, образованного собственными векторами оператора ЛУ и, значит, его матрица ни в каком базисе не приводится к диагональному виду. Поэтому возникает вопрос о каком-то другом, достаточно простом виде, к которому можно привести матрицу всякого линейного оператора. В комплексном пространстве таким «простейшим», каноническим видом принято считать так называемую жорданову форму матрицы. Определение 5. Жордановой клеткой называется квадратная матрица вида [¦К 1 0 0 0 Х0 1 0 0 0 О /лЛ = A6) 1_о о о V-! в которой на главной диагонали стоит одно и то же число Я0, над главной диагональю—всюду число 1, а все остальные элементы матрицы—нулевые. Порядок жордановой клетки может быть каким угодно. В частности, он может быть равен и 1; в этом слу- 5 Л. И. Головина
130 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III чае клетка имеет простейший вид: /х* = [10]. Легко видеть, что характеристический многочлен оператора ,9Ч#, матрицей которого служит жорданова клетка A6) порядка я, равен (Хо — Х)п\ он имеет одно собственное значение Ко кратности я, и все его собственные векторы коллинеарны ех. Матрица оператора 5Чв при л>1 ни в каком базисе не приводится к диагональному виду (ср. с примером на стр. 129). Определение 6. Ж орд а но вой матрицей называется матрица вида / = %! ; / ь. • • • » ля I I I ¦ еде /Ха(Л= 1, 2, ..., $) — жордановы клетки {вообще говоря, разных порядков), а все остальные клетки этой матрицы — нулевые (т. е. состоят из одних нулей). Легко видеть, что числа Яь Х2> ..., Я, являются собственными значениями оператора 9 с матрицей /. Конечно, эти значения не обязательно должны быть разными, некоторые из них могут и совпадать. Рассмотрим пример жордановой матрицы пятого порядка: / = Эта матрица состоит из двух жордановых клеток — третьего и второго порядков. Числа аир являются собственными значениями оператора У, характеристический многочлен которого равен (а — ЯK(Р — XJ. Если ви е%, е3, е4, е$ — базис, соответствующий матрице /, то имеем, очевидно, $1в\ = ав\, ^е2 = ае2 + е\, бФег = а^з + ^2» Же* = ре4, Жеь = ре6 + е4, а. 0 0 0 .0 1 а 0 0 0 0 1 а 0 0 0 0 0 Р 0 <г 0 0 1 Р.
§ 10] Ж0РДАН0ВА НОРМАЛЬНАЯ ФОРМА 131 Базисные векторы ех и е4 являются собственными векторами оператора Э с собственными значениями аир соответственно. Их можно назвать векторами н у- левого слоя. Векторы е2 и е$ являются «собственными с точностью до векторов нулевого слоя» ех и е4. Это значит, что, скажем, $Фе2 отличается от ае2 лишь на вектор ех, при пренебрежении которым вектор е2 можно считать собственным. Эти векторы е2 и е*> можно назвать поэтому векторами первого слоя. Аналогично, вектор е% является «собственным с точностью до вектора е2», т. е. с точностью до вектора первого слоя. Можно сказать поэтому, что это — вектор второго слоя. Нашей ближайшей целью будет доказательство следующей важной теоремы. Теорема 9. Матрицу всякого линейного оператора, действующего в комплексном векторном пространстве, можно привести к жордановой форме. Это значит, что базис векторного пространства, в котором действует рассматриваемый оператор, можно выбрать так, что матрица оператора в этом базисе будет жордановой матрицей. Для доказательства теоремы 9 нам понадобится следующая Лемма. Пусть Я — линейный оператор, действующий в векторном пространстве /? размерности п, N — его ядро и ЯН — область значений (см. § 5). Обозначим через М пересечение этих подпространств, т. е. пусть М = N П &%¦ Выберем в М базис хХу х2, ..., хт, дополним его до базиса хх, х2, .., хт, хт+и ..., хк ядра Ы, с одной стороны, и до базиса хх, х2, ..., хт, х'т+1, .. -9х'г подпространства ЯН — с другой. Пусть далее уи у2, ..., ут —прообразы векторов хх, х2ч . .„ хм и гт+х, *т+2, ..., *г — прообразы векторов х'т+и #т+2, • • •, *г при преобразовании Я. (Это значит, что Яу{ = х< при I ¦» 1, 2, ..., ш и Яг\ = Х\ при I = ш + 1, гп + 2, ..., г« Схематически это можно изобразить так: V V V /*ю+ь *т+2, *..,** баЗИС #» Ли *2* • • • > ^тч «I ^ Хт+и *т+2, ...,*г баЗИС Я&) Уъ Уг% • • •? Ут I I | мя-Ц» *-т+2» • • •» *т 5*
132 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Тогда векторы Хц %2> •••» Хт, Хт+\> •••> Хк> Ун У&* •••! Ут* *т+1> *т+2* •••>¦ %г (* ') образуют базис пространства Я. Доказательство. Число векторов системы A7) равно к-\-г\ при этом размерность г подпространства ЗдЯ равна рангу матрицы В (см. § 5), а размерность & ядра УУ (дефект оператора Ю) равна п — г (теорема 4). Значит, число к + г векторов системы A7) равно размерности п пространства $, — и нам остается доказать, что эти векторы линейно независимы. Предположим, что они линейно зависимы, т. е. что имеет место равенство ..-+Р.У.+.Р. + 1г.+,+ ..-+Мг = 0. A8) Применим к обеим частям этого равенства оператор 3$\ а1ЗВх1 + а233х2 + .. • + аи®хк + + Р^/1 + ... + К®Ут + Ря+,«гя+1 + .., + $гЯгг = 0. Но так как $^ = 0 при /=1, 2, ..., /г, $?*// = */ при * = 1, 2, ..., /п и 9Вг1^х'{ при / = /п+1» •••> ^> мы имеем РЛ+...+Р«^Я + Рл1 + Х+1+---+Р^ = 0. Однако векторы х^ х2, ..., хт> х'т+и ..., ^ образуют базис ЗЗН и, значит, линейно независимы, т. е. Р/ = 0 при х = 1, 2, ..., г. Поэтому из равенства A8) следует, что и ввиду линейной независимости векторов х19 х2, ..., хк также и а{ = 0 при 1=1, 2, ..., А. Так как векторы системы A7) линейно независимы, а число их равно размерности пространства /?, то они образуют базис Я. Теперь мы можем перейти к доказательству теоремы 9. Доказательство это мы разобьем на несколько шагов. I. Сначала мы рассмотрим частный случай, когда линейный оператор А, представляемый в некото-
§10] ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА 133 ром базисе матрицей А =[а{к], имеет только одно собственное значение а, т. е. когда его характеристический многочлен имеет вид (а — Х)п. 1. Введем некоторые обозначения. Пусть х — собственный вектор оператора зФ, тогда зФх = ах, или (зФ — <х&)х = 0. Обозначим оператор зФ — о& через <$Фа. Тогда зФах = [зФ — а&)х = 0. Таким образом, оператор ^Фа переводит в нуль, «аннулирует» каждый собственный вектор (и, не считая нуля,— только собственные векторы) оператора зФ. Обозначим через #! ядро оператора ^Фа — оно состоит из всех собственных векторов оператора зФ с добавлением нуля. Далее, обозначим Я\ область значений $ФЛ оператора зФа. Подпространство /?1 инвариантно относительно бФу так как ^ФН\ = зФ(зФаК) =<&<*№%) ~ ^зФаК = /?1 (легко видеть, что зФзФа = ^Фа^Ф)- Так как /? — векторное пространство над полем комплексных чисел, то в (инвариантном) подпространстве /?1 (если /?1 ф 0) найдется собственный вектор оператора $Ф. Этот вектор, поскольку все собственные значения оператора бФ равны а, аннулируется оператором зФа — и значит, он принадлежит ядру Ы2 оператора зФа, рассматриваемого в /?1# Но если ядро Ы2 оператора зФа в Н\ имеет ненулевую размерность, то его область значений /?2 = зфаНх = зФа% имеет размерность, меньшую размерности /?ь и значит, включение /?2 = = ж1Н с= ^а/? = /?!— строгое. Заметим, что М2 совпадает с пересечением Их Л #ь ибо #2 состоит из всех тех и только тех векторов подпространства #ь которые аннулируются оператором зФа\ но из тех же векторов состоит и пересечение Л^ Л /?ь Продолжим это построение. Если подпространства /?р и Л^>, где р = 1, 2, ..., уже определены, обозначим через Nр+^ ядро и через #р+1 область значений оператора зФа в подпространстве /?„. Если Кр Ф 0, то ядро МР+1 имеет ненулевую размерность (ибо наше пространство—комплексное!), и значит, Кр+хС^Яр. Пересечение же Мр П Кр = Л^р+1. Так мы получим (строго) убывающую цепочку подпространств
134 ЛИНЕЙНЫЕ ОПЕРАТОРЫ (ГЛ. III которая, поскольку размерности этих подпространств убывают, должна закончиться нулем. Пусть Ни+г = = ^+1# = 0, но Кк = &&Ф0. Поскольку Як+\ = 0, то ядро Ык+1 оператора $Фа в Як совпадает с Нк. Но из того, что Мк П %к = Л^л+1 =/?А, вытекает, что /?* ^ Ык. 2. Теперь мы будем строить искомый базис пространства Яу начиная с базиса подпространства /?л, и, переходя последовательно от /?Л к /?А-Ь от Як-Х к /?А-2> и т. д., постепенно дополним его до базиса всего пространства 7?. Итак, выберем в подпространстве Як базис хи х2, ... ».., хРх. Перейдем к подпространству Як-и так как Як ^ ^ Л^А, то мы можем дополнить базисхъ х2у ...,хР1 подпространства /?Л до базиса хи х2, ..., хРх> хРх+ъ ..., хр% ядра Ык. Пусть уъ у2, ..., уРх — те векторы из /?А_Ь которые оператором бФа переводятся соответственно в векторы хи х2 ..., хР1. Другими словами, уи ..., уРх — это прообразы векторов хи х2у ..., хРх:^ау< = *, при I = = 1, 2, ..., /?ь Схематически: хг, х2> .. •, хРх, хР1+х, ..., хРм. \ ! Т Уг Уг УРг Как видно из леммы (стр. 131), векторы хъ хъ ..., хРхУ хРх+ъ ..., хРг, у1у у2, ..., уРх образуют базис подпространства Кк-\ (размерность которого равна, следователььо, р{ + р2). Перейдем далее к подпространству /?л_2. В пересечении Л^л = Л^А_1 П #а-1 Уже построен базис л:!, хъ .. >,хР1, л:Р1+1, ...,хРш. Дополним эту систему векторов до базиса Хи Х2у . . . , ХРх> ^р!+1, . . . , Хри #р2+1, . • • , ХРь ядра N^1. С другой стороны, векторы *1> Х2, • • • I ХРц ХРх+и • • •» ХРш* Уъ Уг^ • • •» УРх образуют базис подпространства /?*-ь ПустьуР1+и ••• ••¦> У?* — те векторы (из /?А-0, которые оператором зФа
%Щ Ж0РДАН0ВА НОРМАЛЬНАЯ ФОРМА 135 переводятся соответственно в векторы хР1+и ...,*р2, а гь *2» •••,гР, —векторы (из /?*-2), которые переводятся в векторы уи у2, ..., Ург Схематически это можно изобразить так: /*р2+ь ...,*р, базис Л^, Х|, Х2, •.., ^ри #р,+1, • • • *Р2Ч | 1 х</ь --мУр! базис Яь-х. Ур»+1| • • • У?г Т | ^1» • • • | ^Р1 По лемме векторы Хъ Хъ . . ., Л:Р1, ^р!+1, • . •, Хр2, #р2+1, • • •, #рз, #и Угу • • •» Й^» Ур1+и • • •» #р2» 21» 22» • • •» 2Л образуют базис подпространства /?А_2. При этом очевидно, что Жах{ = 0 при {=1,2,..., рь рх + 1, ..., р2, р2 + 1, •.., р3; &аУ1 — *< при Г— 1,2,..., рь Р1 + 1, ..., р2; ^аг< = {/4 при 1= 1, 2, ..., рх. Это построение мы продолжаем до тех пор, пока не получим базис всего пространства /?. В нем все векторы *« будут векторами нулевого слоя (это — собственные векторы оператора ^), все у{ — векторами первого слоя, г< —векторами второго слоя, и т. д. Для ясности рассмотрим подробнее частный случай, когда к = 3, рх = 2, р2 = 2, р3 = 5, р4 = 7. Здесь базис пространства /? мы получим в виде Х\, *2, Хг, *4, *5> *6> *7| #ь Г/2, Г/з, У*> У5, %Ь *2> Щ, #2. При этом Жах{ — 0 при 1=1, 2, ..., 7; ^ау{ = х{ при ч = 1, 2, 3, 4, 5; ^аг{ — у{ при * = 1, 2; ,&аи1 = г{ при *г= 1, 2, или ^л:{ = ах{ при /=1,2,..., 7; &у1 = а#< + 4-*< при 1= 1, 2, 3, 4, 5, .я^г, = аг, + #< при /= 1, 2; ^^ = сш< + г, при 1=1, 2. Расположим теперь эти базисные векторы в порядке *и Уи ги иь х2, */2, г2, ы2, х3, */3, хА, у4, х5) уъ, *6, х7. Легко видеть, что в этом базисе матрица оператора ^
136 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III приведется к жордановой форме: / = а 1 0 0 0 а 1 0 0 0 а 1 0 0 0а а 1 0 0 0 а 1 0 0 0 а 1 0 0 0а 1 ! | | а 1} I 0 а} 1 • а 1 |0 а ; : 1 1 1 а 1 0 а | 1 1 а | г Все невыписанные элементы матрицы / равны нулю. В общем случае доказательство завершается аналогично. Легко видеть, что в матрице / будет рх клеток порядка А+ 1, р2 — р\ клеток порядка к, р3 — Рч клеток порядка к— 1, ... и, наконец, рк+\ — рк клеток порядка 1. (Конечно, не исключено, что для некоторых г р{+\ = р{} и тогда клетки соответствующих порядков будут отсутствовать.) Общее же число жордановых клеток равно Рх + (Р2 — Р\) + (Рз ~ Рз) + • •. + (р*+1 — Р») = р»+ь а размерность п всего пространства /? равна (А+1)Р1 + *(Р2-Р1) + (*-1)(Рз~Р2) + ... . . . +1 (рк+1 — Рк) = Р\ + Р2 + . . . +Р»+1. Числа рь Р1+Р2, Р1+Р2 + Р3, ...» р1 + р2 + .. . + р* — это размерности подпространств Кк = ^а/?, #л-1 ~ =» ^а^, ...,/?!=* *^а# — они равны соответственно рангам матриц ^«, «5^а~\ • • •• ^а- Обозначив ранг матрицы ^а через Г/ (и через г0 ранг единичной матрицы
$10] ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА 137 порядка п, т. е. полагая г0 = п), будем иметь Р\ — гКу р\ + Р2 = /*-ь Р\ + Р2 + РЗ = /*-2 Р1 + Р2 + ¦ . . + Рк = Ги откуда рк = гх — г2, рк-х = г2 — г3, ..., р2 = гк-х — гА, р1 = ^(=^ — Гк+и так как ^+1^=0). Ранги матриц ^а, ^а, • • •, ^а можно найти непосредственно, по ним определяются числа рь р2, ..., рк)—а значит и вид искомой жордановой матрицы /. Прежде чем перейти к доказательству теоремы в общем случае, рассмотрим пример. Пусть оператор & в некотором базисе еи е^ ег имеет матрицу А = | 0 3 Г2 1 _П = 0 3 —1 1.0 .1 1} Его характеристический многочлен [2-Я 1 -II , ф(X) = I 0 3-Я — 1 = B — X.)' 0 1 1-М 1 1~Я|""B Л) * Собственное значение здесь одно, равное 2, кратности 3. Матрица оператора зФг = бФ — 2<§Г: [0 1 0 1 0 1 -1 -1 -1 Ясно, что А\ = 0, и значит, здесь 6 = 1, г0 = 3, г\ = 1, г2 = 0. Так как /?1 = г\ =» 1 и р2 = г0 — п =* 2, жорданова форма нашей матрицы будет содержать одну жорданову клетку порядка 2 и одну—порядка 1, т. е. это будет матрица Г2 1 01 10 2 0 . |_0 0 2] Далее, если нам надо найти и новый базис, заметим, что .5*2*1 жж 0» ^2*2 «=¦ A, 1, 1)» &&% = (—1, —1, —1). Следовательно, образ #1 = &чЯ пространства /? — это одномерное подпространство с (и 1> П« Ядро N1 оператора^ определяется уравнением 62 — — {1 = 0 (здесь ^2 и 6з — координаты соответствующего вектора). Оно двумерно. Его базис образуют, например, векторы A, 0, 0) и A, 1, 1). При этом 1?1 сг ЛГь В качестве «жорданова базиса» можно взять, следовательно, векторы Х\ =* A, 1, 1), х2 — A, 0, 0) (вектор %ч дополняет базис К\ до базиса Ы\) и у\ « @, 1, 0) (у\ — это прообраз вектора Х\ при преобразовании ^2),
138 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Для контроля проделаем следующую выкладку. В нашем случае матрица С перехода от старого базиса еи е2) е% к новому хи уи х* такова: [1 О П ГО 0 11 110, и значит, С = 0 1 — 1 . 10 0] [1 0 -1] Вычислим произведение С~1АС: [0 0 ПГ2 1 — ПГ1 О П Г2 1 ОН 0 1—10 3—11 1 0 ; оно равно 0 2 0 1 о -1_|Ь) 1 и[_1 0 0] ЬО 0 2] — найденной выше жордановой матрице. II. Перейдем теперь к доказательству теоремы 9 вобщемслучае. 1. Пусть зФ — произвольный линейный оператор, действующий в пространстве К размерности п над полем комплексных чисел, а — одно из его собственных значений и ей е2, ..., ек — базис ядра #1 оператора ^а. Дополним эту систему векторов до базиса ей е2, ..., ек> ек+\, ..., еп A9) всего пространства /?. В базисе A9) матрица оператора Ж имеет вид ... о а, о а 0 а, 2,Ь+1 П 0 *ак,к+1 ик,п 0 0а •А+1,А+1 ак+1,п О а п,к+1 Характеристический многочлен ф(Я) оператора ^, очевидно, таков: <р (I) = (а - Х)А ак+2,к+1 ак+1,к+2 ак+1,п ак+2,к+2 ^ ' • • ак+2,п ап,к+1 ап,к+2 • • • ап ак+1,к+1 ~~ * ' ак+2,к+1 (а-Л)А<ф(^), где Ц(к) = ,-х ак+1,п а ап,А+1 к+2,п -К
§10] Ж0РДАН0ВА НОРМАЛЬНАЯ ФОРМА 139 Рассмотрим образ #\ = зФаН пространства /? при преобразовании ^а- Так как ядро Ы\ оператора зФ* в /? имеет размерность ку то размерность г подпространства /?1 равна п — к. За базис Я\ можно принять любые г линейно независимых образов элементов исходного базиса в\, е2, ..., еп при отображении ^а, т. е. любые г линейно независимых векторов из зФаеи з&ае2> ..., Д0>аеп (см. стр. 114), или, что то же самое, любые г линейно независимых столбцов матрицы зФа. Но матрица эта имеет вид о о лт а, 2, к+1 0 0 *А|Л+1 0 ак+1,к+1~а а лкп к+1,п о п,к+1 Так как первые к столбцов этой матрицы — нулевые, то последние п — к = г столбцов ее линейно независимы; следовательно, они и образуют искомый базис /?1. Обозначим векторы этого базиса через §к+и ё\+2> ¦.. ..., ёп (таким образом, ё< = &ае{ = аие\ + а2{е2 + .,. + + а,-1, <е,-1 + (а« — а) е{ + а^, ,е«+1 + ... + ап{еп при х = »ни+2 п). Найдем матрицу оператора ^ в базисе §к+и ^А+2> *•• ..., ёп пространства /?ь Для этого надо найти образы &§{ базисных векторов #< при действии оператора ^, Но &Ва = Ж (<я^) = &а&е{ = зФа (аиех + а2{е2 +.., . •.+ ««л) = аи^ае\ + а2г^ае2 + ... + ап^аеп. А так как ^а^ = 0 при *'= 1, 2, ..., # и «5^а^ = #< при * = = к+ 1, й + 2, ..., л, то &ё1 = ^й+1, < ёк+1 + Як+2, I ёк+2 + . . . + Япгёп, и значит, матрицей оператора $4> в подпространстве /?1 размерности г = п — к (в базисе й+ь&+2,*..,*») является клетка ак+1,к+1 ак+1,к+2 • • * аА+1,п ик+2,к+1 "А+2.&+2 а А+2,я •аМ+Х ап,Ь+2
140 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III Как видно из п. 1, характеристический многочлен \|)(Я) оператора зФ в К\ равен \, где <р(А,)—ха- (а — л) рактеристический многочлен оператора зФ в /?. Он может все еще иметь корень, равный а, но кратность этого корня будет на к единиц меньше, чем кратность того же корня для оператора зФ в пространстве Я. В то же время ясно, что при переходе к подпространству /?1 все остальные собственные значения оператора ^ не меняются и не изменяют своих кратно* ст е й. Если оператор зФ в К\ имеет собственное значение, равное а, то точно так же, как выше, переходя к подпространству /?2 = зФ\Я> мы можем еще понизить кратность корня а, не меняя кратностей остальных собственных значений. Продолжая это построение, мы придем, в конце концов, к подпространству /?8 = зФаК, в котором оператор ^ совсем не имеет собственных значений, равных а. В этом случае дефект оператора зФа в Я, равен 0, и значит, ранг его равен размерности этого подпространства, т. е. зФаН9 = /?. — оператор зФау рассматриваемый в подпространстве /?„ является невырожденным. В этом случае ранг матрицы зФ8^1 совпадает с рангом матрицы ^ (см. стр. 116). 2. Предположим, что оператор зФ имеет собственные значения аь аг, • • •, «р с кратностями, соответственно равными ки к2, ..., кр. Применяя надлежащее число раз описанный в п. 1 прием, мы можем построить подпространство ЗФ^ЗФ^ . . ЗФа^ЗФа^ • • • *«9П = *'* (где Як = 3$>ахЖа% • • • ЗФщ^З&а^ • • • Зф'оИр), В КОТОроМ оператор зФ совсем не имеет собственных значений, равных оь «2» ..., а*-ь а<+ь ••-, а*. В подпространстве ЯЛ у оператора зФ будет лишь одно собственное значение, равное а*, причем онобудеттойже кратности &,, ч т о и у оператора зФ в пространстве /?. Конечно, подпространство ЗЙЯ инвариантно относительно зФ, так как зФ&Д = &{зФ% е
§Ю] Ж0РДАН0ВА НОРМАЛЬНАЯ ФОРМА 141 ^58^. Оно инвариантно также и относительно каждого из операторов Лаи где / = 1, 2, ..., р. Размерность подпространства $?//?, как видно из построения, равна кратности к{ собственного значения а,. В подпространстве 33^ каждый из операторов Ла^ Лаг9 • • • 9 Л<х. , ^а{л.л * • • •» ^оь является н е в ы р о ж- денным и, следовательно, оператор 33 { как произведение невырожденных операторов тоже будет невырожденным, т. е. Я*(Я;К)=гЯ|/? при всех 1=1, 2, ..., р. Вто же время очевидно, что ЗЗ^ЗЗ^ — Ъ при гф\. 3. Покажем, что если е[, е{, ..., е[ —базис подпрост- ранства $//?, то кг-\-к2 +... -\-кр^п векторов е) (где 1=1, 2, ..., р и для каждого г отвечающие ему / пробегают значения 1,2, ..., кг) образуют базис пространства /?. Так как число этих векторов равно размерности Я, то нам достаточно доказать их линейную независимость. Предположим, что какая-то линейная комбинация векторов е) обращается в нуль. Обозначая сумму всех тех из этих векторов, которые принадлежат 33^, через а0 получим равенство #1 + а2 + • • • + ар ^ 0» где, конечно, некоторые из слагаемых могут и обращаться в нуль. Применим к обеим частям оператор ЗВи учитывая, что йуал = 0 при \Фк, получим $}уЯу = 0. Но так как оператор 33/, действующий в подпространстве 33/Я,—невырожденный, то ау=г0. Таким образом, базисные векторы всех инвариантных относительно Л подпространств ЗВхЯг 33*К, ..., 33рК линейно независимы, и значит, они образуют базис всего пространства К. В этом базисе матрица оператора Л разобьется на клетки: 'Ач \ 1 А*\ > I АР
142 ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. III где А5— это матрица оператора ^ в подпространстве ЯД. Так как оператор зФ в подпространстве ЯД имеет лишь одно собственное значение а^ то, как показано в п. 1, соответствующим выбором базиса в ЯД клетку &$ можно привести к жордановой форме. Тем самым приведется к жордановой форме и матрица оператора з4> во всем пространстве /? (см. замечание на стр. 118). Рассмотрим пример. Пусть оператор бФ в некотором базисе имеет матрицу Л = 0 1 0 0 — 2 3 2 — 1 1 — 1 1 0 2 — 2 -2 2 Его характеристический многочлен Ф(«* -Я -2 1 2 1 з —Я —1 —2 О 2 1-Я —2 0—1 0 2-Я =Я« -6Я8+13Я*-12Я+4= = (X — 1J(Я — 2)а. Собственные значения Я1 « 1 и Яг = 2, оба кратности 2. При этом А1 = А-Е = -1-2 1 2 1 2-1-2 2 6—2—6 1.-1 -3 1 3^ — 1 1 0 0 — 2 2 2 — 1 1 — 1 0 0 2" — 2 — 2 Ь » А\=\ Ранг матрицы Л1 равен 2; значит, существуют два линейно независимых собственных вектора, отвечающих собственному значению, равному 1. Легко видеть, что здесь и ранг матрицы А\ равен 2. Далее, имеем А* = А - 2Е = 2 1 0 0 — 2 1 2 -1 1 — 1 - 1 0 21 — 2 -2 (Ы
НО] ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА 143 А2 — Л2 - 2 — 1 2 --1 2 -1 2 — 1 — 1 1 — 1 1 — 2" 2 — 2 2- А9 — ~-^2 1 — 2 [. 1 — 2 1 — 2 1 1 -1 1 -1 2 — 2 — 2 Ранг матрицы А2 равен 3, значит, существует лишь одномерное подпространство, отвечающее собственному значению, равному 2. Отсюда уже ясно, что искомой жордановой формой матрицы А будет 0 0 0' 0 10 0 0 0 2 1 ю о о 2^ / = Заметим, что ранги матриц А\ и А\ одинаковы и равны 2.
ГЛАВА IV |ЕВКЛИДОВО ПРОСТРАНСТВО § 1. Скалярное произведение Мы определили векторное пространство, в котором можно складывать векторы и умножать их на числа, ввели понятия размерности, базиса, линейного оператора, а теперь в этом пространстве мы введем метрику, т. е. способ измерять длины и углы. Метрику в векторном пространстве удобнее всего ввести, используя понятие с к а л я р н о го произведения. В обычном трехмерном пространстве скалярным произведением двух векторов называется произведение их длин, умноженное на косинус угла между ними. Это скалярное умножение коммутативно: (я, */) = (*/, х), ассоциативно относительно умножения вектора на число: {ах, у)=а(х, У) и дистрибутивно относительно сложения векторов: (х + У> г) = (х, г)-\-(у, г)\ кроме того, скалярный квадрат (х, х) любого ненулевого вектора х положителен. В случае л-мерного векторного пространства у нас нет понятия длины и угла, и мы введем скалярное произведение аксиоматически. Его определение мы дадим для случая, когда основное поле Р есть поле комплексных чисел. Читатель, собирающийся изучать вещественное евклидово пространство, должен всюду, где над числом а из поля Р стоит черточка, просто ее опустить: ведь в том случае, когда число а в е щ^е с т в е н н о (и, кстати сказать, только в этом случае) сс=а. Определение 1. Говорят, что в векторном пространстве /? задано скалярное произведение, если каждой паре векторов х, у из /? поставлено в соответствие число (х, у) ^Р так, что выполнены следующие условия: 1. Для любых двух векторов х и у (*, У) = {У> х\. [(В случае вещественного пространства (х, у) = {у, х).)
Ц] СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ 145 2. Для каждого вектора х и любого аЕ/7 (ах, у) = а(х, у). 3. Для любых трех векторов х, у, г (х + У, г) = (х, г) + (у, г). (Эти условия называются аксиомами скалярного умножения.) Пространство /? называется в этом случае пространством со скалярным произведением. Из условия 1 непосредственно вытекает, что (х, х) = {х, х), т. е. что скалярный квадрат любого вектора х является вещественным числом. Пространство со скалярным произведением, удовлетворяющее кроме условий 1—-3 еще и условию 4. Для любого вектора х скалярный квадрат (х, х)> О, и из равенства (х, х)= О вытекает, что х=0, называется евклидовым векторным пространством*). Из равенств 1—3 легко получаются следующие соотношения: 2/ (х, ау) = (ау, х) =а{у, х) =а(у, х) =а(х, у). (В вещественном случае (х, ау)= а(х, у).) 3/ {г, х + у) = {х + у, г) = (х, г) + (у, г) = = (*, *) + (у, г) = (г, х) + {г, у). Примеры 1. Пусть в л-мерном векторном пространстве Я зафиксирован определенный базис. Тогда-скалярное произведение векторов х « (хи х2, ..., хп) и у = (уи у2, ..., уп) можно определить равенством (*, У) =х1у1 + х292 + ... + Хп1/п A) (в вещественном пространстве (х, у) =» хху\ + х2у2 + . ¦. + хпуп). Справедливость условий 1—4 проверяется непосредственно. 2. В пространстве Р многочленов от / с вещественными коэффициентами и в пространстве С функций, непрерывных на отрезке *) Удовлетворяющее условиям 1—3 «произведение» векторов комплексного векторного пространства, сопоставляющее каждым двум векторам х, #е# комплексное число (х, у), часто называют также эрмитовым скалярным произведением, а то пространство, которое мы назвали евклидовым,— эрмитовым (или унитарный) комплексным векторным пространством. Мы, однако, предпочтем исполь- зрвать здесь более простые и привычные термины «скалярное произведение» и «евклидово пространство»,
146 ЕВКЛИДОВО ПРОСТРАНСТВО [ГЛ. IV [а% Ь], скалярное произведение можно определить равенством ь (*.*) = |*@ *(')*• B) а Справедливость условий 1—3 очевидна, а 4-е следует из того, что непрерывная неотрицательная функция, интеграл от которой равен нулю, тождественно равна нулю. Определение 2. Длиной, пли моду л ем, или нормой, вектора х в евклидовом пространстве называется корень квадратный из его скалярного квадрата Векторы хну, скалярное произведение (х, у) которых равно нулю (а значит, равно нулю и произведение (У> х) ==: (х> У)) > называются ортогональными. В этом случае мы будем также писать х±.у. В любом пространстве со скалярным произведением справедлива «Теорема Пифагора», Если векторы х и у ортогональны, то Действительно, если {х, у) = 0 то, ввиду условий 1-3, \х + у\2=(х + у, х + у) = = (*. *) + (*. У) + (У. *) + (У> У) = М2+ \У\2- В любом евклидовом пространстве справедливо Неравенство Ко ши — Буняков с кого: для любых векторов х, у из Я К*. *I < ММ- Доказательство проведем отдельно для вещественного и комплексного случаев. А. Пространство /? — вещественное. Если абг7, то для вектора х — ау по условию 4 имеем неравенство {х — ау}х — <ху) > О,
$1] СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ 147 из которого, ввиду условий 1 — 3, получаем (х,х)—2а(х, у)+а2(у, у)>0, или |х|*-2а(*, */)+а2|г/|2>0. Это — квадратный трехчлен относительно а. Так как он должен быть неотрицательным при всех значениях а, то он не может иметь двух различных вещественных корней и, значит, его дискриминант неположителен: (*,уJ-М2М2<о, откуда К*. «01 < ММ. что и требовалось доказать. Б. Пространство К — к о м п л е к с н о е. И в этом случае для любых двух векторов #, у из /? и любого (комплексного) числа а {х — ау,х — ау) > О, откуда, в силу условий 1 — 3, получаем (х, х)~а(у,х)—а(х,у)+аа(у,у)>0. Полагая а *= р пт^ъ гДе Р — произвольное вещественное число, и учитывая, что (х, у) (х, у) = | (х, у) |2, будем иметь \х\2-2$\(х,У)\+У\у\2>0' Мы получили квадратный трехчлен относительно Невещественными коэффициентами. Так как он неотрицателен при всех р, то его дискриминант неположителен и, значит, |(*^I2-М2М2<0, что и требовалось доказать. Легко видеть, что равенство | (х, у) \ = \х\ \у\ будет иметь место в том и только в том случае, если для некоторого аЕр имеем х — ау = О, т. е. если векторы х и у пропорциональны: лс=аг/. В вещественном евклидовом пространстве можно определить угол <р между ненулевыми векторами х
148 ЕВКЛИДОВО ПРОСТРАНСТВО [ГЛ. IV и у. По определению, С05*=|!тш- C) Легко видеть, что, ввиду неравенства Коши — Буняковского, | С05 ф | < 1. Из неравенства Коши — Буняковского, если применить его к пространству Р со скалярным произведением A), получается «неравенство Коши»: для любых чисел а/, Ь§ \а151 + а2Ь2 + ...+апЬп\2<: < (М2 + М2 + ...+ Ы2)AМ2 + 1М2+...+ 1Ы2) — для комплексного пространства и <(а* + $+...+а#(ь1 + Ь\ + ...+Ь*) — в вещественном случае, а для пространства С со скалярным произведением B)— «неравенство Буняковского» [ь -та ь ь ]х{1)у{1)<Н\ <|[*@]2^|И0Р<Я, а ^ а а справедливое для любых двух непрерывных функций х{1) и у((). В евклидовом пространстве справедливо так называемое неравенство треугольника: для любых двух векторов х, у е /? \х + у\<\х\ + \у\. Доказательство в вещественном случае очень просто. Пользуясь неравенством Коши—Буняковского, получаем \х+У\2=(*+У> х+у) = \х\*+2(х,у) + \у\>^ <\х\*+2\х\\у\ + \у\*=(\х\ + \у\)*9 откуда \*+у\<\*\ + \у\- Пусть теперь пространство /?— комплексное. Имеем, очевидно, \х + у\2**{х + у,х+у) = {х,х) + [х,у) + {у}х) + [у9у).
5 2] ОРТОНОРМИРОВАННЫЙ БАЗИС 149 Скалярное произведение (дс, у) есть, вообще говоря, комплексное число, пусть (*, у) =а + Ы. Тогда (у, х) =» = (х, у) = а — &*" и (*, У) + (У, х) = 2а<2 ]/^Т"Ь~2 = 2|(*.у)\. Следовательно, |* + </|2<И2 + 2|(*,|/)| + |</|2. а это, в силу неравенства Коши—Буняковского, не превосходит \х\2+2\х\\у\ + \у\2=(\х\ + \у\)\ Таким образом, \х + у\2< (\х\ + \у\J и, значит, \Х + У\<\*\ + \У\. Равенство \ х + у\ = \ х\ + \ у \ будет выполняться, если, во-первых, у = ах (и тогда | (х, у) | =* = | х 11 у |) и если, во-вторых, а = У а2 + Ьа,т. е. если Ь = «= 0 и скалярное произведение (х, у) вещественно и положительно. А тогда (у, х) = (адг, х)=а(х, дг)>0 и а>0. § 2. Ортонормированный базис Определение 3. Базис ви е2, ..., еп евклидова пространства /? называется ортогональным, если (еи ек) = 0 при I ф к. Если, кроме того, |е<| = 1 при 1 = 1, 2, ..., я, то базис называется ортонормированным. Лемма. Попарно ортогональные и отличные от нуля векторы линейно независимы. Доказательство. Пусть векторы хи х2, ..., хм попарно ортогональны: (х{> хк)=0 при гфк, и отличны от нуля. Предположим, что Ъ\Х\ + 0С2Х2 + • « ¦ + &тХт = 0. Умножая обе части этого равенства скалярно на хи 1=1,2 /п, будем иметь «1 (*ь х{) + а2{х2, *<) + ¦, ¦ + ат{хт *,) = 0,
150 ЕВКЛИДОВО ПРОСТРАНСТВО [ГЛ. IV откуда, поскольку (хи хк) = 0 при I = к и (хи х{) Ф 0 при всех / = 1, 2, ..., т, вытекает, что а< = 0 при всех / = 1,2,..., т. Теорема 1. Во всяком евклидовом пространстве /? имеются ортонормированные базисы. Доказательство. Пусть ци #2, ..., ^ — произвольный базис пространства /?. Положим }{ = §х и /2 = = ё2 + а/1, причем а подберем так, чтобы векторы Д и /2 были ортогональны: (й + а/ь/1)-=(й,М+а(/ьМ=0, откуда Так как /1 =^ 0, то знаменатель (/ь /0 последней дроби отличен от нуля. Ввиду линейной независимости векторов #1 и §2 полученный вектор /2 — ненулевой. Допустим теперь, что попарно ортогональные и отличные от нуля векторы /ь /2, ,,., /*_1 уже найдены. Положим и — 8к + ЬхТх + К2и + .. А»-Л-ь и подберем числа А,ь Ая, ¦ .., А*-1 так, чтобы вектор /* был ортогонален к /ь /2, ..., /*_!. Для этого нужно, что бы выполнялись равенства (/», /«) = (А, /0 +*, (/«, /0 = 0 при г = 1, 2, ..., к - 1, откуда Знаменатель (/<, /<) здесь отличен от нуля, так как все векторы и при / = 1, 2, ..., & — 1, по предположению,— ненулевые. Так как векторы §и #2, ..., §к линейно независимы, то и полученный вектор /4 тоже будет ненулевым. Это построение мы будем продолжать до тех пор, пока не найдем последнего (ненулевого) вектора /п = ёп + 1\!\ + Ы2 + . . . + ^п-1/п-Ь ортогонального всем предыдущим векторам /ь /2, ... ,, /п>!. В силу последней леммы векторы /ь /2, ..., /д
§2] ОРТОНОРМИРОВАННЫЙ БАЗИС 151 линейно независимы и, значит, образуют (ортогональный) базис. Если теперь каждый из векторов /, поделить на его модуль, то получится ортонормирован- ный базис, образованный векторами -Л. -Л. -Л. '1ПМ,'а"~1>.Г'','п~|/.|Г Легко видеть, что если первые к векторов 8и #2, ..., §к были попарно ортогональными, то }\ = 8 и й — =#2, . ., !н = 8к> а если они были, кроме того, единичными, то ех = 8и е2 = #2, ...,** = #*. Примененный здесь способ получения ортонормиро- ванной системы векторов из заданной линейно независимой системы носит название процесса ортого- нал изаци и. Замечание. Если /?! — подпространство /? и еи е2, ..., ек — ортонормированный базис /?ь то векторы еь е2, ..., ек можно включить в ортонормированный базис всего пространства. Для доказательства достаточно дополнить еи е2, ., • ..., ен до базиса пространства /? и произвести ортогона- лизацию полученного множества векторов, начиная с ей *2> .. •> е*. Пример. Найти ортогональный базис в пространстве многочленов степени не выше 4, определенных на отрезке [—1, 1]. Решение. В качестве исходного базиса возьмем #о - 1. * - /, #2 <= *2, #з = '3, 8а - <*. Положим /о = 8о = 1 1 * /х = Ях + аА>» Та« как 1^1» /о) = | ' *= 0, то а = 0 и -1 /| - *| - '. 1 Далее, положим /2 ~ #2 + §/о + К/ь Имеем (§2, /0) = Г 141 = -1 1 1 = |; (/о» /о) =|^ = 2, откуда 0 - 1, (л, /х)= | Ли « О, -1 -1 и значит, \>=0. Следовательно,
152 ЕВКЛИДОВО ПРОСТРАНСТВО [ГЛ. IV 1 Пусть /3 = Яз + А./о + |х/1 + \!2. Имеем (^з, /0)= у*(И=0, от куда -1 Я = 0; (^,/1)== |^ = |, (/1,/1)=}^=|, значит, |1 = —§-. -1 -1 и (^з» (л) = П'5 — "з"/3) ^ = °» т' е# г = 0# Следовательно, /з = <3--'- Положим, наконец, /4 = #4 + С/о + лЛ + С/г + р/з. Тогда, по- 1 Г 2 1 скольку (^4> /о) = ] '4<# =-н-» а (/о» /о) = 2» то I = — _.; далее 1 (#4> /0 ^ ] *5<# — 0, значит, т] = 0. Затем имеем -1 <*./.)=М<'--г)л = -т-4- = т51 -1 Х ' И Г / 2 1 \ 2 4 2 8 откуда С = —у; наконец, ($4» /з) = ] '4 М3 — д"ПЛ = 0, т.е. р = 0. Следовательно, '4~* 5 7^ 3;-Г 7 1 + 35* Полученные многочлены /о, /ь /г, /з, А — это (с точностью до множителей) первые пять из так называемых многочленов Лежандра, играющих важную роль в математической физике. Найдем выражение скалярного произведения векторов в координатах. Пусть еь е2) ¦,., еп — произвольный
§2] 0РТ0Н0РМИР0ВАННЫЙ БАЗИС 153 базис пространства Я со скалярным произведением и х = ххех + х2е2 +... +хпепу У = У\е\ + у2е2 + ... + Упеп. Тогда (п п \ п 2 Х\еи 2 Укек = 2 (*1*1, Укв$ = 1=1 А=1 / и=1 п п = 2 ХгУк(еиек)= 2 #гЬ*гУй, где I и А независимо друг от друга пробегают значения 1, 2, ..., /г, а §гк = (еи ек). Если пространство /? евклидово, а 0ь е2, ..., 2„ — ортонор м и р о в а н н ы й базис, то (еи ек) = О при / ф к, (еи е{) = 1 при всех * = = 1, 2, ..., ах и, значит, (*, Г/) = Х^! + Х2*/ + . . . +ХП*/"П. Легко видеть, что, и обратно, если в базисе е1 е2, ... ..., еп скалярное произведение векторов х = ххех + х2е2 + • • • + хпеп и У = У\в\ + у2е2 + ... + Упеп равно _ _ _ Х\У\ + Х2у2 + . • • + *п</«, то этот базис о р т о н о р м и р о в а н н ы й, так как в этом случае (еи е{) = 1 и (еи ек) = О при I ф к. Пусть ех, е2у ..., еп — ортонормированный базис в евклидовом пространстве /? и х = ххех + х2е2 + ... + + хпеп. Умножив обе части последнего равенства ска- лярно на е{, получим (х, е{) = хи т. е. 1-я координата вектора х в ортонормированном базисе равна скалярному произведению х на единичный вектор е{. Это скалярное произведение можно назвать (ортогональной) проекцией вектора х на вектор е{. Таким образом, координаты вектора в ортонормированном базисе — это его проекции на базисные векторы. Пусть /? и У?7 —два м-мерных евклидовых пространства. Если в каждом из них выбрать ортонормированный базис (еь е2у ,,., еп в /? и еи е2, ..., еп в /?')
154 ЕВКЛИДОВО ПРОСТРАНСТВО [ГЛ. IV и поставить в соответствие каждому вектору х из /? вектор х' из /?' с теми же координатами, то, как известно (см. § 5 главы II), сумме элементов из /? будет отвечать сумма соответствующих элементов из /?' и произведению элемента из /? на число — произведение соответствующего элемента из /?' на то же число. При этом, если х = ххех + х2е2 + .,. + хпеп, у = ухех + у2е2 +... + У**п (и значит, х' == ххех + х2е2 + ... +хпе'п, у' = уке\ + у2е2 +... +упе'п), то скалярное произведение (X, у) =Х1У1 + Х&2 + . . . + *п*Л» = (*', У'). Таким образом, пространства /? и /?' устроены одинаково: соответствующие векторы их имеют одинаковые длины (| х | = У(х, х) = К (я7, *') = I *' |), а в случае вещественного пространства и углы между парами соответствующих друг другу векторов равны между собой: ( /^ч (х,у) (х',у') , /\Л соз (х, у) = , ,',. = / ', ;. = соз (*', уг) I Таким образом, вс]е евклидовы векторные пространства над одним и тем же полем изоморфны и, как говорят, «изометричны» между собой, т. е. обладают в некотором смысле одинаковыми метриками; следовательно, единственной характеристикой евклидова пространства над данным полем Р является его размерность. § 3. Ортогональное дополнение Определение 4. Два подпространства Н\ и /?2 евклидова пространства /? называются взаимно ортогональными, если каждый вектор из Н\ ортогонален каждому вектору из Ц2 (мы будем писать в этом случае ПХ±Н2). Так, в обычном трехмерном пространстве проходящая через начало координат плоскость я (понимаемая как множество принадлежащих я векторов) и перпендикулярная к ней (и тоже проходящая через начало) прямая / ортогональны (рис, 10,а), Наоборот, две вза-
§ 3] ОРТОГОНАЛЬНОЕ .ДОПОЛНЕНИЕ 155 имно перпендикулярные в смысле элементарной геометрии плоскости п\ и я2 (рис. 10,6) не будут ортогональными подпространствами в смысле этого определения: ведь из того, что а\ е яь аа2е я2, совсем не следует, что й\ А. а2. Рис. 10. Для того чтобы подпространства #{ и /?2 были взаимно ортогональными, необходимо и достаточно, чтобы все базисные векторы одного были ортогональны всем базисным векторам другого. Необходимость следует из определения 4, для доказательства достаточности предположим, что еи ^2> .-.., еА—- базис Я\ и /ь /2, ••-, !т — базис /?2, причем (еи }}) = 0 для всех / = 1,2,..., к, / = 1, 2, ..., т, тогда для каждого х = х{е{ +х2е2 +... +хкек и каждого у = 1/1/1 + #2/2 +.». +Ут1т скалярное произведение п и значит, эти векторы ортогональны. Покажем, что два взаимно ортогональных подпространства пересекаются только по нулевому вектору. Действительно, пусть /?1 и /?2 —взаимно ортогональные подпространства /?. Если вектор х е Я\ II /?2, то х е €^1 их€/?2; но тогда (х, х) = 0 и, значит, х = 0. Пусть /^ — произвольное подпространство евклидова пространства /?, Выберем в /?1 ортонормированный базис еи е2, ,.., ег и дополним его до ортонормированного
156 ЕВКЛИДОВО ПРОСТРАНСТВО [ГЛ. IV базиса е\9 е2,..., ег, ег+\> .-.,еп всего пространства. Векторы ег+и ..., еп порождают (п —г)-мерное подпространство /?2> очевидно, ортогональное /?ь Покажем, что каждый вектор х из /?, ортогональный /?ь принадлежит /?2. Действительно, если вектор х = ххех + х2е2 +... + хлеп ортогонален /?ь то (х, е,) = х{ = 0 при 1=1,2,..., г, и значит, * = *г+1*г+1 +. • • + хпеп& /?2. Определение 5. Подпространство /?2, образованное всевозможными векторами из /?, ортогональными ко всем векторам из /?ь называется ортогональным дополнением Кх; это подпространство /?2 мы будем обозначать через #г. Легко видеть, что ортогональное дополнение /--мерного подпространства (п — г)-мерно и что ортогональное дополнение к /?^ совпадает с /?ь т, е. что (КI - Кг. Подпространства /?1 и /?^ порождают все # и пересекаются по нулевому вектору. Следовательно, евклидово пространство /? является прямой суммой любого своего подпространства и его ортогонального дополнения: Поэтому каждый вектор х из # однозначно представляется в виде суммы х — у + г, где у&Я\, ге# | (теорема 6 главы II). Вектор у можно назвать ортогональной проекцией вектора х на подпространство К\. В случае вещественного пространства можно определить и угол между вектором х и подпространством /?1 — его естественно считать равным углу между вектором х и проекцией у вектора х на Ки а значит, косинус этого угла равен (*,*/) _ (у + г,у) (у,у) \у\2 \у± [х\\у\ \х\\у\ \х\\у\ \х\\у\ \х\'
§ 4] ЕВКЛИДОВО (ТОЧЕЧНО-ВЕКТОРНОЕ) ПРОСТРАНСТВО 157 Рассмотрим снова систему линейных однородных уравнений: I апхг + а22х2 + ... + а2пхп = О, I ат1Х1 + ат2Х* + • • • + «тпХп = °- Этой системе можно дать следующую геометрическую интерпретацию. В евклидовом пространстве Яп (в ортонормированном базисе) задано т векторов а< = (ап, 5*2, .... й<п), * = 1, 2, ..., т. Задача состоит в том, чтобы найти все векторы х = (хь *2, ..., *п), ортогональные каждому из векторов аи аг, ..., ат. Пусть ранг матрицы А = [а^] равен г. Если вектор х ортогонален ко всем векторам а*, то он ортогонален и к порождаемому ими г-м е р н о м у подпространству /?ь Таким образом, векторы-решения х образуют ортогональное дополнение К^ подпространства Яь Размерность #^ (т. е. максимальное число линейно независимых решений системы D)) равна, как мы видели, п — г. Каждая фундаментальная система решений уравнений D) — это базис подпространства #^-. § 4. Евклидово (точечно-векторное) пространство Пусть Ап — вещественное п-мерное аффинное пространство и Кп — соответствующее ему векторное пространство, в котором введена евклидова метрика (т. е. задано скалярное произведение, удовлетворяющее условиям 1—4 из § 1). В пространстве Ап можно определить расстояние между любыми двумя его точками, М и Л/, полагая его равным модулю вектора ЛШ, а в случае вещественного пространства —и угол, МРМ, считая его равным углу между векторами РМ и РЫ. Пространство Ап с введенной в нем таким образом метрикой называется просто евклидовым пространством (в отличие от введенного выше евклидова векторного пространства*). Таким образом, п-мерное евклидово пространство может быть определено с помощью следующих пяти групп аксиом: I.Аксиомы сложения векторов A—4 на стр. 64), *) Которое, впрочем, для краткости (и если нет опасности смешения этих двух понятий) также называют короче — евклидовым пространством.
158 ЕВКЛИДОВО ПРОСТРАНСТВО ГЛ. IV II. Аксиомы умножения вектора на число F—8 на стр. 64). III. Аксиома размерности: существуют п ли- нейно независимых векторов, но нет больше чем п линейно независимых векторов (ср. стр. 66). IV, Аксиомы, связывающие векторы и точки A—2 на стр. 83). V, Аксиомы скалярного умножения A—4 на стр. 144—145). Можно показать, что все п-мерные евклидовы пространства над одним и тем же полем тоже «устроены одинаково» (изоморфны и изометричны между собой). В частности, при п = 2 это — обычная плоскость, при п = 3 — обычное трехмерное пространство. л) б) Рис. П. Пусть в вещественном пространстве Ап заданы Л-мерная плоскость /?ь проходящая через начало координат: [ ац*1 + <*! А + . •. + а1пхп = О, I VI + Яша** + • • • + ЯтппХп = О (^-мерное подпространство) и точка Х(%и Ъ> •••> Ы- Тогда вектор х = ОХ можно представить в виде х = = у + г, где у е К\ и ге /?;[" (рис, 11, а). Длина вектора
§ 4] ЕВКЛИДОВО (ТОЧЕЧНО-ВЕКТОРНОЕ) ПРОСТРАНСТВО 159 г называется расстоянием точки X от подпространства /?1. Пусть теперь в Ап заданы произвольная 6-мерная плоскость я: ( #11*1 "Т~ ^12-^2 + • • • ~Г &1пХП == #1» а21х1 + а22х2 -(-...+ &2пХп *2> а7П1Х1 + ат2Хг 4" "Т стп^п — ^т и точка X (|ь |2» • ••> 1п). Плоскость я получается из соответствующего ей подпространства ^ = яо, определяемого системой уравнений E), параллельным переносом на некоторый вектор Ь. При этом точка X получается переносом на тот же вектор Ь из некоторой точки Х0 (и, значит, ОХ — ОХ0 + Ь; см. рис. 11,6). Расстояние точки X от к-мерной плоскости я естественно считать равным расстоянию точки Хо от подпространства яо = /?ь (Можно показать, что расстояние точки х от 6-мерной плоскости я — это наименьшее из расстояний точки х от всех точек плоскости я). 6-мерная плоскость л\ и /-мерная плоскость яг ортогональны, если ортогональны соответствующие им подпространства я? и п\. В этом случае каждый вектор ШГ, где точки Му N е я^ ортогонален каждому вектору Р<2, где Р, B е еяг (рис. 12). Пусть в вещественном пространстве Ап выбрана ортонормирование я система координат. Рассмотрим линейное уравнение 01*1+02*2+ ... +апхп =а, F) коэффициенты а\> а2,...,йп левой части которого не равны нулю одновременно. Это уравнение определяет некоторую г и- перплоскость я (см. стр. 86), которая получается из подпространства я0: а\Х1+а2х2+... +апхп = 0 G) (гиперплоскости, проходящей через начало координат) переносом на некоторый вектор 6 «= (&ь &г»« ••»&!»). Координаты вектора Ь удовлетворяют, как мы знаем, уравнению (б): а\Ь1 + а2Ь2 + *.. + апЬп « а Рис. 12.
160 ЕВКЛИДОВО ПРОСТРАНСТВО [ГЛ. IV (см. стр. 79). Последнее равенство, положив а= (аь а2, ¦.¦, ап), можно переписать в виде аЬ = а. (8) Вектор а ортогонален подпространству Яо, так как для каждого вектора х =» (хи х2, .... хп) ЕЛ0 скалярное произведение ах = а&\ + +а2х2 + ...+апХп «¦ 0. Положим Л1 = ± | а [ = ± у а\ + а\ + ... + а*, причем знак здесь выберем так, чтобы а/М = р было неотрицательно. (Если а =я 0, то знак может быть выбран произвольно.) Уравнение называется нормальным уравнением гиперплоскости я. Вектор т = = а/М является, очевидно, единичным вектором (т. е. вектором длины 1), коллинеарным а, и значит, ортогональным Яо. Пусть теперь нам дана точка ХЦи &2, •• •* 1п) и надо найти расстояние точки X от гиперплоскости я. Точка X получается сдвигом на вектор Ь из некоторой точки Х0. Это значит, что ОХ = ОХ0-\-Ь (см. тот же рис. 11, б). Теперь нам остается найти расстояние от точки Х0 до подпространства я0. Представим вектор ОХ0 в виде ОХ0 = у + г, где у е= я0, а г Л я0. Тогда искомое расстояние будет равно длине вектора г. Но вектор г, как и вектор т, ортогональный я0, коллинеарен пг и, значит, найдется такое число Я, что 2 = Хш. Так как вектор т — единичный, то искомое расстояние, равное |г|, равно |А,|. Итак, мы имеем равенство Ш = у + 1т + Ь. Умножим его скалярно на т: ОХ • т = ут + Хт2 + Ьт. а (X Но ут = 0, так как у е Яо, а т Л. я0; т2 = 1 и 6т = Ь • -гт- = -гг . а а (см. (8)). Следовательно, ОА'-т = Я+"д|"> откуда Я = ОХ-то — -тт-. Наконец, скалярное произведение ОХ • /и в координатах равно ё* М ~г*2 М ~г • • • + *д М и значит | ДА + а212 + ¦ ¦ ¦ + апЪп - <* | 1 '~ ]/Ч2+4+ •• + « Таким образом, для того чтобы найти расстояние от точки до гиперплоскости, надо подставить координаты этой точки в левую часть нормального уравнения гиперплоскости и взять полученную величину по модулю. (Вспомните формулу расстояния от точки до прямой на плоскости и от точки до плоскости в пространстве!)
§ 4] ЕВКЛИДОВО (ТОЧЕЧНО-ВЕКТОРНОЕ) ПРОСТРАНСТВО 161 Гиперсферой в евклидовом пространстве Ап называется совокупность всех точек, отстоящих на одно и то же расстояние г (радиус гиперсферы) от некоторой фиксированной точки <? (цен т- ра). Уравнение гиперсферы радиуса г с центром в точке <?(а*, <х2, ..., а„) в ортонормированной системе координат, как легко видеть, имеет вид Следовательно, гиперсфера является частным случаем поверхности второго порядка (ср. главу VII). Гиперсфера 5 касается гиперплоскости я, если она имеет с этой гиперплоскостью единственную общую точку. Задачи. (Задачи 1—7 относятся к четырехмерному пространству; система координат везде ортонормированная.) 1. Найдите расстояние точки (— 1, 3, 5, 1) от начала координат, от координатных осей, от координатных (двумерных) плоскостей и от координатных гиперплоскостей. 2. Найдите точки пересечения прямых х—1_^+3_2г —1_ ^ . а} ~1 3 Г""* 5 • Л ж—1_у+3_« —1_<^17. °' ~2 "Т~~~~ 5 • В) ~~Т~ 4~~5 с гиперплоскостью х + Зу—4г+* = 5. 3. Найдите условия, при которых прямая х—х0 __ у—Уо ^г—20_/— /0 Ь% Ьъ Ъ$ Ь^ принадлежит гиперплоскости а1х+а2у-}-а3г+а^ = A* 4. Докажите, что гиперплоскость, касающаяся гиперсферы, ортогональна радиусу, проведенному в точку касания. 5. Напишите уравнение гиперсферы, имеющей центр в точке E, —1, 4, 0) и касающейся гиперплоскости х—Зу+2+5/ = б. 6. Пересечение гиперсферы (*-5)'+^+(*+5)Н(<-2)*=25 и гиперплоскости 7х—5(/+*+5* = 20 есть некоторая сфера трехмерного пространства. Найдите ее центр и радиус. 7. Напишите уравнение гиперплоскости, проходящей через двумерную плоскость Г х—2^+Зг+б/=2, ^ Зх— у— г+2/=3 и а) проходящую через точку B, 5, —3, 0), б) ортогональную гиперплоскости 2х+0 + 42—*=5. 6 л. и. Головина
162 ЕВКЛИДОВО ПРОСТРАНСТВО 1ГЛ. IV Пусть в л-мерном пространстве Ап даны п попарно ортогональных векторов одинаковой длины аь а2, ..., а«. Тогда натянутым на них (л-мерным) кубом называется совокупность всевозможных векторов вида а{а{ + а2а2 +... + апап> где 0<а< < 1, *«¦ 1, 2 п. к-мерная грань куба — это множество таких его точек, для которых п — к из коэффициентов а«, принимают постоянные значения, равные 0 или 1. 8. Найдите число ^-мерных граней п-мерного куба. 9. Найдите угол между диагональю п-мерного куба (т. е. вектором а\ + а2 + ... + ая) и его ребром а^ (заметьте, кстати, что этот угол не зависит от /). 10 Найдите угол между диагональю «-мерного куба и его Л-мер- ной гранью.
ГЛАВА V ЛИНЕЙНЫЕ ОПЕРАТОРЫ I В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ § 1. Линейный функционал Определение 1. Линейный оператор /, отображающий векторное пространство /? в числовое поле Ру называется линейным функционалом, или линейной функцией. Таким образом, если / — линейный функционал, то для каждого вектора хеЛ определено число /(*) из основного поля Р так, что выполнены следующие условия: 1) 1(х + у)~Пх)+1(у)9 2)!(ах)=а!(х)у где х и у — произвольные векторы из ^, а ае/7. Для того чтобы найти выражение линейного функционала в координатах, выберем в пространстве /? базис еь е2, ...» еп. Если х = х{е{ + х2е2 + ... + хпеп — произвольный вектор из /?, то /(*) = /(*!*! + х2е2 + ...+ хпеп) = = *1/(е0 + х2Це2) +... + *»/(*•). Обозначив }(е{) = а„ где *' = 1, 2, ..., л, получим /(*) = ^1 а! + ^2^2 + хпап. Таким образом, при фиксированном базисе линейный функционал представляется линейной формой*), т. е. выражением вида !(х) = аххх + а2х2 + ..-. + апхп. Если пространство /? евклидово, а базис в\, Зг, ... >.., еп — ортонормированный, то /(*) = (х, а) — скаляр- *) Слово сформа» означает соднородный многочлен», т. е. многочлен, являющийся суммой одночленов одной и той же степени.
164 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ {ГЛ. V ному произведению вектора х и некоторого (зависящего только от \, но не от х) вектора а= (аи аг, ..., ап). Легко видеть, что верно и обратное: если в евклидовом векторном пространстве /? задан вектор а = = {аи аь .., ап), то \{х) = (х, а) —скалярное произведение вектора х и вектора а — является линейным функционалом, так как /(* + */) = (х + у, а) = = (х, а) + (у, а) = !(х) +Цу) и Цах) = (ах, а) = = а(х, а) = а/(х). § 2. Оператор, сопряженный данному Лемма. Если в евклидовом пространстве # (Ху и) = (х, V) для всех векторов х, то и = V. Доказательство. Из равенства (х, и) = (х, V) вытекает, что {хг и — V) = О при всех х. Подставив х = и — V, получим (и — о, и — V) = 0. Но так как пространство /? евклидово, то и — ^ = 0 и а = ^. Пусть /? — евклидово пространство и Ж— линейный оператор в нем. Покажем, что при фиксированном у скалярное произведение /у(х) = ($Фх, у) является ли- нейным функционалом относительно х. Действительно, и (*1 + *2) = № (*< + х2), У) = {&хх + ^*2, у) = = (&хи у) + {&х2, у)=*и{*\) +иы и \у(ах) = (зФ{ах), у) = (оь^х, у) = а{&х, у) = а/у(*Ь Как показано в § 1, найдется такой вектор у' из /?, что при всех х /у(х) = (бФх, у) = (х, у'). Этот вектор у' зависит только от у (не от х\) и можно положить поэтому у' = з4<*у. Вектор &*у определяется вектором у, т. е. Ж*— оператор, переводящий вектор у в новый вектор у' (который мы и обозначаем ^*у). Покажем, что этот оператор — линейный. Действительно, при всех х, у, гей мы имеем (*х, у + г)*-(х,**(у + г)) и №ху у + г) — (^х, */) + (^*, г) — — {*, &*У) + {х, &*г) = (х, &*у±а*г),
§2] ОПЕРАТОР, СОПРЯЖЕННЫЙ ДАННОМУ 165 откуда (х, &*(у + г)) = (х, &*у + &*г) и, ввиду леммы, &*(у + г)=&*(у)+&*(г). Аналогично, если ае/7, то для любых х, уе/? имеем №х, ау) = (*, &*{ау)) и __ №х, ау) = а^х, у) = а(х, &*у) = (х, а*Ф*у), откуда, по той же лемме, зФ*(ау) = аЖ*у, Определение 2. Линейный оператор дф* такой, что при всех х, у е /? (&х,у) = {х,а*у), называется сопряженным $Ф. Легко видеть, что оператор, сопряженныйзФ,— единственный, так как из равенства (х, Яу) = (х, Фу), справедливого при всех х, {/е/?, вытекает (по той же лемме), что &у — Фу при всех у и, значит, & = <&, Пусть Л = [ал]—матрица линейного оператора зФ в ортонормированном базисе ей въ ..., еп, А' = = [ам] —матрица, транспонированная к Л, А* = А'~ = [ам] —матрица, элементы которой комплексно-сопряжены элементам матрицы А'. Обозначим через зФ\ линейный оператор, имеющий в том же базисе матрицу Л*, и покажем, что зФг = ^*, т, е, что зФх и есть оператор, сопряженный Ж. Мы имеем, очевидно, (&е{) ек) = {аие{ + аие2 + ... + ап{ еп, ек) = ак{ и (*!• &геъ) = (**, ЯлА + ак2е2 + •.. + акпеп) = ак1% т, е. («я^**,**) = (**, зФ^ь) при всех *, А. А тогда, если п п X = 2 *^1 И 0 == 2 ДОа, 1=1 &=1
166 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. V ТО / п п \ п Ы*,У)= «5^2 х\ви 2 УкеЛ= 2 *1УкЫе{,ек) \ 1=1 Ь=1 / г,й*=1 И (п п 2 *г*г, ^1 2 Уквк г=1 А=1 п п _ = 2 ХгУк&иЖ^ь)^ 2 хЯкШе1$ек) = Ых,у), т. е. для всех х, */ (^х, у) ={х, &&) и оператор ^ является сопряженным *$#, т. е. зФ\ = «5^*. Таким образом, для каждого линейного оператора з$> в евклидовом пространстве существует и притом только один сопряженный ему линейный оператор •$$*, матрица которого в любом ортонормированном базисе является транспонированной и комплексно-сопряженной матрице оператора Ж. Покажем, что ^** = з4>. Действительно, имеем (*, &**у) = {&*х9 у) = {уГ^х) = (&у, х) = (х9&у) при всех х, у, и значит, опять по той же лемме, &**у = = зФу при всех у, т. е. *$$** = «5#. Свойства оператора, сопряженного данному. 1. #* = «?, так как (*, 8*у) = (Л, у) = (х, у) = (х, #у), и, согласно лемме, <2Г* = в\ 2. (.* +Я) * = ,$** +Я*, так-как (х, (^+Я)**/) == ((.* + *)*, у) = (&х + Ях, у) = = (^*> У) + (Лх, у) = (*, ^*#) + (х, Я*у) = = (*, &*у + Я*у) = (а:, 0** + Я*Ш, и, по лемме, (зФ + 38)* = ^* + Я*. 3. №&)* = Я*^*, так как (*, (•**)•?) = @*Я)*, у) - (*(**), у) = — (Ях, &*у) = (х, а*&у); по лемме, (^Я) * = Я*^*. -
§2] ОПЕРАТОР, СОПРЯЖЕННЫЙ ДАННОМУ 167 4. Если $1>-х существует, то (зФ~1)* = (л^*), так как из равенства ($4>$4>-х) = <& и пп. 3 и 1 вытекает, что (я^-1)* = #*, или (&-1)*&* = #, т. е. что (&*)-*=* 5. Если а—число, то (азФ)* = азФ*9 так как {х, (а&)*у) = {азФху у) = а{ах, у) = _ = а(х, ^**/) = (л;, а^**/), и, по лемме, (оь^)* = а^*. Теорема 1. Если подпространство Я\ инвариантно относительно линейного оператора зФ, то его ортогональное дополнение /?^ инвариантно относительно сопряженного зФ оператора ,&*. Доказательство. Пусть х — произвольный вектор из Н\9 у — произвольный вектор из Ни Тогда №*х, у) = (*, ау) = о, так как ^6^ и, значит, х±.зФу. Следовательно, вектор ^*хе^, и ^инвариантно относительное*. Пусть /(*)— произвольный многочлен с комплексными, вообще говоря, коэффициентами. Обозначим через /(/) многочлен, все коэффициенты которого являются комплексно-сопряженными к соответствующим коэффициентам многочлена /(/). Так, если /(/) = A + ь)Р + + B_/)*+1, то /(/) = A-')'2 + B + 0^+1; если /(/) = 2*2 + 3/-5, то 7@ = /@. и т. д. Теорема 2. Если ср(к) — характеристический многочлен линейного оператора зФ, то характеристическим многочленом сопряженного Ы> оператора зФ* будет у (К). Доказательство. Пусть >(Л) = |Л-ЛД| = ап-к а21 2 *1п 22п 7171 *П1 "п2 Тогда характеристический многочлен оператора зФ* равен | А• - ЬЕ | = | Л' - ХЕ | = | А' - ЯЯ' | = | (А - ХЯ)' | = = Л-ХЕ - аИ-Л Д12 и д1 Д2 пп = ср(Х).
168 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. V Следствие. Если Х\_^~собственное значение опера- тора зФ кратности к, то Х\ — собственное значение оператора зФ* той же кратности к. Действительно, если <р(Л) = (— 1)П(Я —ЯОМ^ —^2) ... (Я —Ят), где Л*, Лз, # #., Лт Ф Ль то Ф(Л) = (- 1)Я(Л-Л1)*(Л-Л2) ... (Х-Лт), где тоже Л2> Аз> » • • » Ат нг* Ль В частности, в вещественном пространстве /? характеристический многочлен линейного оператора зФ* равен характеристическому многочлену оператора $Ф— и все их собственные значения одинаковы (т. е. спектры их тождественны). § 3. Самосопряженный оператор Определение 3. Линейный оператор зф, совпадающий со своим сопряженным, г. е. такой, что зФ* = = «5$, называется самосопряженным. В вещественном пространстве самосопряженный оператор называют также симметрическим, а в комплексном пространстве — эрмитовым. Таким образом, если зФ— самосопряженный оператор, то тождественно при всех х и у из /? (зФх,у) = {х,зФу). Свойства самосопряженных операторов. 1. Тождественный оператор является самосопряженным, так как <§Г* = &. 2 Сумма самосопряженных операторов является самосопряженным оператором, так как если зФ* = зФ и &* = $, то (зФ + @) * = зФ* + ®* = зФ + &. 3. Для того чтобы произведение самосопряженных операторов было самосопряженным оператором, необходимо и достаточно, чтобы эти операторы были перестановочны между собой, т. е. чтобы имело место равенство зФЗЗ = <%зФ. Действительно, если зФ* = зФ и $* = $, то {зФЯ)* = Я*зФ* = &зФ} что равно зФ&
§3] САМОСОПРЯЖЕННЫЙ ОПЕРАТОР 169 в том и только в том случае, если операторы зФ и 33 перестановочны. 4. Оператор, обратный к невырожденному самосопряженному оператору, является самосопряженным, так как если зФ* = зФ, то (зФ~1)* = (зФ*)-1 = зФ~К 5. Если зФ— самосопряженный оператор, то для то- го, чтобы произведение азФ было самосопряженным, необходимо и достаточно, чтобы число а было вещественным, так как в этом случае (<хзФ) * = азФ* = азФ. Теорема 3. Если зФ— самосопряженный оператор и Нх —подпространство, инвариантное относительно зФ9 то и #1 инвариантно относительно зФ. Доказательство. По теореме 1 К^ инвариантно относительно зФ*, но зФ* = зФ, следовательно,/?^ инвариантно относительно зФ. Далее рассмотрим отдельно самосопряженные операторы в вещественном и в комплексном векторных пространствах. А. Пространство /? вещественно. Пусть зФ — самосопряженный (симметрический) оператор в вещественном векторном пространстве и А = = [ал] — его матрица вортонормированном базисе. Тогда матрицей оператора зФ* в том же базисе будет транспонированная к А матрица А' = [ак{] (см. § 2), и так как зФ* = зФ, то А' = А, т. е. а* = ам при всех /, к. Обладающая этим свойством матрица А называется симметрической (она «симметрична относительно главной диагонали»). Пример симметрической матрицы: 1+/2 я ]' Обратно, линейный оператор, имеющий в ортонормиро- ванном базисе симметрическую матрицу, будет, очевидно, самосопряженным. Теорема 4. Все корни характеристического многочлена самосопряженного оператора зФ вещественны. Доказательство. Пусть К = а + ^-комплексный корень характеристического многочлена самосопряженного оператора Л, Тогда, как видно из доказательства
170 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. V теоремы 8 главы III, в пространстве # имеется двумерное подпространство, порожденное векторами и и V такими, что Жи =¦- аи — ру, ^ » рИ + (Х0, где р =5*= 0 и векторы и и у не равны нулю. (Если само пространство Я двумерно и в нем нет собственных векторов, то это подпространство совпадает с /?.) Умножая скалярно первое из равенств A) на V, второе —на и, получим {Жи, V) =а(«, V) — р(а, V) и (и, ^) =$(и, и) +а(и, V). Но так как {зФщ V) = (и, «5^а)> т0 Р(М2+ М2) = 0» и либо М2+|^|2 = 0> либо р = 0, что противоречит предположению. Теорема 5. Матрица самосопряженного оператора в некотором ортонормированном базисе приводится к диагональному виду. Доказательство. Пусть ^1 —один из корней характеристического многочлена самосопряженного оператора зФ. По теореме 4, К\ вещественно. Соответствующий ^1 собственный вектор обозначим через в\\ тогда зФех = Я^ь Вектор в\ можно считать единичным, так как в противном случае его можно было бы заменить вектором г~ — единичным собственным вектором с тем же собственным значением Х\. Обозначим через /?1 одномерное (инвариантное) подпространство, порожденное вектором е\. Его ортогональное дополнение /?^ будет инвариантно относительно ^, и в нем оператор $4> остается, конечно, самосопряженным. Пусть Х2 (вещественное) собственное значение оператора $$> в подпространстве К^\ соответствующий (единичный) собственный вектор обозначим через е2\ тогда Же2 = %2е2. Обозначим через Я2 (инвариантное) подпространство, порожденное векторами ех и е2\. тогда подпространство
$3] САМОСОПРЯЖЕННЫЙ ОПЕРАТОР 171 Яг тоже инвариантно относительно $Ф. Продолжая это построение, мы найдем п попарно ортогональных (и значит, линейно независимых) единичных собственных векторов оператора $4>. В базисе, состоящем из этих векторов, матрица оператора $1> приведется к диагональному виду [о о Геометрический смысл самосопряженного преобразования виден из последней теоремы: если х = ххвх + х2е2 + ... +хпеп — произвольный вектор из /?, то Ах = х{К\ех + х2Я,2е2 + • • • +ХпЬпеп. Таким образом, при соответствующем з4> преобразовании точек точка Х(хи х2, ...» хп) переходит в точку Яз\ р \ $ ЬЛ V Рис. 13. Х'ЦыХи Ал*2, •••» ^Хп) и, значит, в базисе, состоящем из собственных векторов оператора $Ф> оно сводится к п растяжениям вдоль координатных осей с коэффициентами, соответственно равными ЛьА*, ..,А,п (см. рис. 13, на котором изображено действие на фигуру К евклидо-
172 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. V вой плоскости самосопряженного преобразования с собственными значениями %г = -у и Х2 = 2). Б. Пространство /? — комплексное. Пусть $Ф — самосопряженный (эрмитов) оператор в комплексном векторном пространстве и А = [а{к] — его матрица _в ортонормированном базисе. Тогда А' = Л, т. е. а{к = ам при всех 1% к. Такая матрица называется э р м и т о в о й. Таким образом, если А — эрмитова матрица, то ее элементы, симметричные относительно главной диагонали, являются комплексно-сопряженными В частности, элементы главной диагонали вещественны, так как а« = ац при всех /. Пример эрмитовой матрицы: 2 1+* * И 1—* О 3 + 2/. — / 3 — 2/ 1 \ Итак, матрица эрмитова оператора в любом ортонормированном базисе является эрмитовой. Очевидно, что и, обратно, линейный оператор, матрица которого в каком-то ортонормированном базисе является эрмитовой,— эрмитов. Теорема 4' Собственные значения самосопряженного (эрмитова) оператора вещественны. Доказательство этой теоремы для комплексного пространства совсем просто. В самом деле, пусть х — собственный вектор и X — соответствующее ему собственное значение эрмитова оператора ^, тогда (зФх, х) — (х, Жх), или (Я*, х) = (ху %х), откуда Х(х, х) = Я(*, х), и так как (х, х) Ф О, то % = Я, т. е. Я — вещественно. Таким образом, спектр самосопряженного оператора (и в вещественном, и в комплексном пространствах) расположен на вещественной оси. Далее так же, как для вещественного пространства, в комплексном случае доказывается.
§4] ОРТОГОНАЛЬНЫЙ ОПЕРАТОР 173 Теорема 5'. Матрица самосопряженного (эрмитова) оператора в некотором ортонормированном базисе приводится к диагональному виду (где все диагональные элементы вещественны). § 4. Ортогональный оператор В этом параграфе евклидово пространство /? предполагается вещественным. Определение 4. Линейный оператор зФ в вещественном евклидовом пространстве Н называется ортогональным, если (&х, Жу) = (*, у) для всех ху у из /?. Таким образом, ортогональный оператор сохраняет скалярное произведение, и значит, он сохраняет длины векторов и углы между ними. Если $4> — ортогональный оператор и ^*— сопряженный ему оператор, то {х> у) = №х, &у) - (х, Ж*бФу) для всех ху #е/?. Следовательно, ^*^ = ^Г —по лемме из § 2, или а* = а-к При этом равенство зФ* =«5#" является необходимым и достаточным условием для того, чтобы линейный оператор з4> был ортогональным. Отсюда, в частности, видно, что ортогональный оператор-всегда невырожденный. Свойства ортогональных операторов. 1. Тождественный оператор & является ортогональным, так как 8х = х для всякого х, и значит, (8х,8у) = (х9у). 2. Произведение ортогональных операторов является ортогональным, так как если операторы ^ и 36 ортогональны, то {зФЯх, Ж$у) = {Ях, Ду) = (х, у)%
174 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ (ГЛ. V 3. Оператор, обратный ортогональному оператору, тоже является ортогональным, так как если зФ* = бФ~\ то {бФ~х)* = (*Ф*)~1 = (л*-1)-* (см. п. 4 из § 2). 4. Если зФ — ортогональный оператор, то произведение азФ будет ортогональным в том и только в том случае, если а=±1,— это видно из равенства (о^х, азФу) = а2(зФх, зФу) — а2(х> у). Ясно, что ортогональный оператор переводит любой ортонормированный базис в ортонормированный. Покажем, что верно и обратное: линейный оператор зФ> переводящий хотя бы один ортонормированный базис в ортонормированный, является ортогональным. Действительно, пусть ортонормированный базис ей е2, ... ..., еп оператором $Ф переводится в ортонормированный базис еъ е'г> ...,еп. Тогда, если х = ххех + х2е2 + • •. + *п*«, У — У\е\ + У&2 + • • • + </«*«* то зфх = хгег + х2е2 + ...+ зФУ = У А + У А + • • • + Упе'п и (зФху зФу) = ххух + х2у2+... + хпуп = (х, у). Пусть А — [а*] — матрица ортогонального оператора в ортонормированном базисе ей в2у..., еп. Так как под действием ортогонального оператора ортонормированный базис переходит в ортонормированный, то образы зФеи зФе2> ..., зФеп базисных векторов ей е2, ..., еп сами образуют ортонормированный базис. А значит, (зФеи зФек) = 0 при ь ф к и (зФеи ^е<) ===== 1 при всех I, т. е. ацй\к + 02*02* + • • • + йщапь == 0 при гфк и B) а\\ + &\\ +. • • • + Япг = 1 при всех /. Таким образом, столбцы матрицы Л, рассматриваемые как векторы, сами образуют ортонорми- рованную систему. Это же верно и для строк. Действительно, если зФ — ортогональный оператор, то <$Ф* =зФ~х — оператор тоже ортогональный, и значит,
5 4] ОРТОГОНАЛЬНЫЙ ОПЕРАТОР 175 столбцы матрицы Л*, т. е. строки матрицы Л, тоже образуют ортонорм и рова нну ю систему: она* + а<20*2 + .. + Ъпакп = 0 при [фк и C) 0?1 + в?2 + ... + а|п == 1 при всех I. Матрица Л, для которой Л' = А~\ называется ортогональной матрицей; она характеризуется соотношениями B) и (равносильными им) соотношениями C). Мы показали, что матрица ортогонального оператора в любом ортонормированном базисе является ортогональной; обратно, если в каком-то ортонормированном базисе матрица оператора зФ ортогональна: Л = Л', то зФ~х = ^*, и оператор зФ является ортогональным. Теорема 6. Если подпространство %х инвариантно относительно ортогонального оператора <$Ф> то его ортогональное дополнение Н\ тоже инвариантно относительно зФ. Доказательство. Так как зФ— ортогональный оператор, то $4>~{ — зФ*. По теореме 1, подпространство /?^ инвариантно относительно оператора зФ* = <5Ф~Х\ но в таком случае в силу теоремы 5 главы III оно инвариантно и относительно {зф-х)~х = зФ* Теорема 7. Собственные значения ортогонального оператора равны ±1. Доказательство. Пусть х — собственный вектор и X — соответствующее ему собственное значение ортогонального оператора бФ. Тогда (х, х) = {зФх, зФх) — (Хх, Хх) = Х2{х, х), откуда получаем (поскольку (*, х) Ф 0) Я2=1 и Х = ±1. Теорема 8. Определитель ортогональной матрицы равен ± 1. Доказательство. Из равенства АА' « Е следу- Г;,,410,^1 \АЛ1^{АА/1гТ^^и Но так как
176 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. V Выясним, что собой представляет произвольный ортогональный оператор, действующий в (вещественном) л-мерном евклидовом пространстве. Пусть сначала зФ — ортогональное преобразование прямой 7?1 и е^ЯК Тогда зФе е- /?* и, значит, Же = Хе, где X = ±1, т. е. зФе = ±е, и зФ — либо тождественное преобразование, либо центральная симметрия. Пусть теперь $Ф — ортогональное преобразование плоскости /?2 и — его матрица в некотором ортонормирований м базисе. Тогда, как мы знаем, ЯП + аП = 1» а12 + #22 = 1, ^11^12 + ^21^22 = °- В силу первых двух равенств найдутся такие ф и ф, что аи = соз ф, аы — зш ф, и а\ъ = соз Ф, а?2 = зт ф. Но тогда третье равенство дает СОЗ ф«С05 ф + 31П ф«81П ф = СОЗ (\|3 — ф) = О, откуда следует, что п Зя я|? —ф = »2" или Т* В первом случае а\2 = соз ф = — зт ф, аъ = = зт ^) = соз ф, и мы имеем А~Ып<р созф> 1*а' т. е. преобразование зФ — это поворот на угол ф вокруг начала координат. (В частности, при ф == 0 это тождественное преобразование, а при ф = я — симметрия относительно начала координат.) Во втором случае а\2 = зт ф, агг = — соз ф и а _ Г008 Ф 8*п ф1 ~~" [зШф — СОЗфУ Эта матрица — симметрическая, значит, ортогональное преобразование зФ является и самосопряженным, т. е. в некотором (вообще говоря, новом) орто- нормированном базисе ей в% его матрица приводится
14] ортогональный оператор 177 к диагональному виду. Но так как собственные значения здесь находятся непосредственно: откуда А —±1, то матрица преобразования з4> приведи *-В 4 <«> Произвольный вектор х, в новом базисе равный Х\в\ + +х2е2, преобразуется в х' = ххв\ — х2е2. Это — симметрия относительно прямой, определяемой вектором в\ — первым базисным вектором нового базиса (рис. 14), Таким образом, ортогональное преобразование \ плоскости — это либо по во- [ рот вокруг начала коорди- еХ нат на некоторый угол. ср (в частности, тождественное преобразование или центральная симметрия; определитель такого преобразования равен +0» либо — осевая симметрия (с определителем, рав- Рис. 14. ным —1). Из доказанного, в частности, вытекают две теоремы (плоской) элементарной геометрии: 1. Произведение двух осевых симметрии является поворотом вокруг точки пересечения осей симметрии (так как это — ортогональное преобразование с определителем, равным +1). 2. Произведение поворота и симметрии, ось которой проходит через центр поворота, является симметрией относительно некоторой новой оси, проходящей через ту же точку (так как это — ортогональное преобразование с определителем, равным — 1). Перейдем теперь к общему случаю ортогонального оператора, действующего в я-мерном евклидовом пространстве.
178 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. V Теорема 9. Матрица ортогонального оператора в некотором ортонормированном базисе приводится к виду Г11 1 -1 С08ф1 -51П ф 31ПСЦ С05С^ СОЗСр2 -ЗЬПСр 51Л ф2 С05ф2 I 51ПфК СОЗср! (Все остальные элементы этой матрицы равны нулю.) Доказательство проведем методом математической индукции. Мы уже установили справедливость этой теоремы при л=1 ип = 2. Предположим, что теорема верна для всех пространств, размерность которых меньше я, и пусть Я — п-мерное евклидово пространство и зФ— действующий в нем ортогональный оператор. Возможны два случая. 1. Оператор зФ имеет вещественное собственное значение (это обязательно будет так, если п нечетно): Я = ± 1. Пусть е\ — соответствующий (единичный) собственный вектор (тогда зФе\ — ±е\) и /?1 — порожденное вектором ех одномерное подпространство. В силу теоремы 6, (л — 1)-мерное подпространство Яг инвариантно относительно зФ. Ясно, что и в нем зФ будет ортогональным оператором. По предположению индукции, в Я\ можно найти ортонормированный базис е2> ^з, •••> еп> в котором матрица оператора зФ приведется к виду E). Учитывая замечание, сделанное в § 7 главы III, получаем, что (возможно, после соответствующего изменения нумерации базисных векторов) матрица оператора зФ во всем пространстве Я в некотором ортонормированном базисе приведется к виду E). 2. Оператор зФ не имеет вещественных собственных значений. По теореме 8 из главы III, в Л найдется двумерное инвариантное подпространство /?ь По доказан* ному выше, в плоскости /?1 можно найти ортонормиро-
5 41 ОРТОГОНАЛЬНЫЙ ОПЕРАТОР 17Э ванный базис е\> е2, в котором матрица оператора зФ приведется к виду Dа). (Другой случай, D6), здесь невозможен, так как, по предположению, оператор зФ не имеет вещественных собственных значений.) Подпространство Нг инвариантно относительно зФ. По предположению индукции, в /?^ можно найти такой ортонормированный базис е3, *4, ..., еп, в котором матрица оператора зФ приведется к виду E). (В этом случае п обязательно четно, и на главной диагонали этой матрицы совсем не будет чисел 1 и — 1.) Ввиду замечания из § 7 главы III матрица оператора бФ всего пространства /? в ортонормированном базисе ви ^2,..., еп приведется к виду E). Геометрический смысл ортогонального преобразования виден из последней теоремы. Так как каждая матрица вида E) является произведением нескольких матриц вида F) и нескольких матриц вида ¦1 1 . 1 С05 ф — 51П ф 51П ф С08 ф 1 G) то ортогональное преобразование $Ф можно осуществить, произведя последовательно несколько симметрии
180 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. V относительно «координатных гиперплоскостей» (матрица каждого такого преобразования имеет вид F)) и несколько поворотов вокруг «(/г — 2)-мерных осей* (каждый из которых имеет матрицу вида G))—это преобразование представляет собой одинаковый поворот, осуществляемый одновременно во всех двумерных плоскостях, перпендикулярных к (п—2)-мерной «оси» поворота. Объединяя в матрице E) два соседних элемента + 1 или —1 в «клетки» П 0*] ГсозО — $1л01 Г—1 0] Гсозя — з1ля] [О I]~ [з1п0 созО] И [ 0 —1_| [з1пя созя]' мы (возможно, после изменения нумерации базисных векторов) получим четыре типа ортогональных матриц Гсозф — з1пф (заштрихованы «клетки» вида , где <р, в частности, может равняться нулю или я, а в пустых клетках все элементы равны нулю): Для четного д: Г П 0| 0 -1 ^ ь если |Л| = 1, если |Л|=—1. Для нечетного п: Г 1 ь 11111 111 11111 ! и 1 1 ~~1 _ 11 III I I I | И 11111] если | А |=1, если | Л| = — 1,
§б] УНИТАРНЫЙ ОПЕРАТОР 181 § 5. Унитарный оператор В этом параграфе евклидово пространство /? предполагается комплексным. Определение 4'. Линейный оператор зФ, действующий в комплексном евклидовом пространстве, называется унитарным, если (зФх, Жу) = (х, у) для всех х, у из /?. Таким образом, унитарный оператор является аналогом ортогонального оператора. Так же как и ортогональный оператор (в вещественном пространстве), он сохраняет длины векторов и ортогональные векторы переводит в ортогональные. В частности, любой ортонормированный базис унитарный оператор переводит в ортонормированный базис. Верно и обратное: линейный оператор, преобразующий хотя бы один ортонормированный базис в ортонормированный, является унитарным. Легко видеть, что если оператор ^ — унитарный, то Ж4 = бФ'хУ и обратно. Свойства 1—3 ортогональных операторов (см. стр. 173) переносятся на унитарные операторы без изменений. Фактически сохраняется и свойство 4: 4. Если ^ — унитарный оператор, то для того, чтобы оператор азФ был унитарным, необходимо и достаточно, чтобы а по модулю было равно 1, ибо (а&х, аЖу) = асе (&х9 &у) = | а |2 (х, у). Пусть Л —матрица унитарного оператора $Ф в ортонормированном базисе ей Сь • •> еп. Тогда образы Жеи &е2, .-.., Жеп базисных векторов е\9 е2, ,..,*я сами образуют ортонормированный базис: (зФе^^е^ = = 0 при гфк и {зФеи Же{) = 1, т. е. аиа\к + а2№ь + •.. + аыапк = 0 при IФ к, аиаи + а21а21 + ... + ап&п1 = | аи |2 +1 а2112 + ... B') • • • + | ^п(\2 = 1 при всех /. Далее, если зф — унитарный оператор, то оператор #* = ^-1 — тоже унитарный, и значит, столбцы матри*
182 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. V цы Л*, т. е. строки матрицы Л, тоже образуют ортонор- мированную систему: Я*1ЯП + Я*2Я<2 + • • • +<*кпС1{п = 0 ПрИ 1фк, апап + апа1% + ... + а1па1п = C') = \ап\2 + \а12\2+...+\а1п\^1 при I = 1, 2, ..., п. Матрица Л, для которой Л* =Л~1, т. е. матрица, элементы которой удовлетворяют условиям B') (или равносильным им условиям C')), называется унитарной матрицей. Таким образом, матрица унитарного оператора в любом ортонормированном базисе является унитарной. Обратно, если в каком-то ортонормированном базисе матрица оператора зФ унитарна: Л* = Л, то Ж* == ^-1 и оператор зФ является унитарным. Теорема 6 переносится на унитарные операторы без изменений: ортогональное дополнение /?^ подпространства Яи инвариантного относительно унитарного оператора Ж, инвариантно относительно Ж. Теорема 7 принимает такой вид: Теорема 7'. Собственные значения унитарного оператора по модулю равны 1. Доказательство. Пусть х— собственный вектор и X — соответствующее собственное значение унитарного оператора $Ф\ тогда &х = Хх и (Жх, зФх) = (дс, *), Но (ах,&х) = (кх, \х)=*Щх, х) =|А,|2(*, Х)\ а так как (х, х) Ф О (х — собственный вектор, и значит, хфО), то |А,|2= I или 1М = 1- Таким образом, спектр унитарного оператора расположен на единичной окружности комплексной плоскости. Новой является следующая Теорема 10. Матрица унитарного оператора & комплексного евклидова пространства /? в некотором ортонормированном базисе приводится к диагональному виду (где все элементы главной диагонали по модулю равны 1). Доказательство. Пусть К\— одно из собственных значений (унитарного) оператора зФ. По теореме 7', \\х\ = 1. Соответствующий %х (единичный) собственный вектор обозначим через е\. Тогда &е\ = Я^ь
§6] ПРОИЗВОЛЬНЫЙ ЛИНЕЙНЫЙ ОПЕРАТОР 183 Пусть 7? 1 — одномерное подпространство, порожденное вектором в\. Его ортогональное дополнение /?^ инвариантно относительно Ж. Если, далее, Х2 (где |Хг| == 1)—собственное значение оператора & в подпространстве /?^ и ^ — соответствующий (единичный) собственный вектор, то ^е2 = К2^2- Обозначим через /?2 (инвариантное) подпространство, порожденное векторами ех и е*. Тогда подпространство/?^" тоже инвариантно относительно зФ. Продолжая это построение, мы найдем п попарно ортогональных (и, следовательно, линейно независимых) единичных векторов е\, е2у ..., еп— собственных векторов оператора бФ. В базисе, состоящем из этих векторов, матрица оператора $1> имеет диагональный вид Л = ^ О , . . 0" 0 Я2 . . . 0 1.0 0 ХпЛ Все элементы, стоящие на главной диагонали этой матрицы, по модулю равны 1. Отсюда, в частности, видно, что определитель матрицы унитарного оператора в любом базисе (он ведь не зависит от базиса!) по модулю равен 1 (ср. с теоремой 8), § 6. Произвольный линейный оператор в евклидовом пространстве Теорема 11. Всякий линейный оператор з4> в комплексном евклидовом пространстве можно представить в виде & = 3& + №, где 33 и 9 — эрмитовы операторы. Доказательство. Допустим, что такое представление возможно; тогда ^ — 39* + {№)• — & — №* —Л — », так как 38* = 36 и <&*=<&. Из равенств & = 38 + № к&*=гЗ& — ?1? находим, что Я«4<¦* + ¦**> и У = Т^*"^
184 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. V Легко видеть, что операторы 53=1 (Л + Л*) и #=±(л*—Л) действительно являются самосопряженными и что А = =« + «. Представление А = 3$ +1% напоминает разложение комплексного числа на вещественную и мнимую части (ведь самосопряженный оператор имеет вещественный спектр!). Более содержательна, однако, следующая Теорема 12. Каждый невырожденный линейный оператор А в евклидовом пространстве можно представить в виде произведения А— 11%, где %—самосопряженный оператор с положительными собственными значениями (такой оператор называется положительно определенным, или просто положительным), а %—унитарный (а в случае вещественного пространства—ортогональный) оператор (собственные значения которого, как известно, по модулю равны 1). [Такое разложение в произведение вида %% линейного оператора напоминает тригонометрическую форму комплексного числа: если а#0, то а = = г(созф + ^51Пф), где г > 0, а число созф + гзшф по модулю равно 1.] Доказательство. Заметим сначала, что если А—произвольный линейный оператор в евклидовом пространстве, то оператор 9д — А*А (так же, как и А А*) является самосопряженным, так как %ю г=: \*Д/ </С) ==:= %/Ь Л я** */1 Л == %ю» Если оператор «^—невырожденный, то при х^Ои Ах Ф О, а значит (Ах, Ах) > 0. Покажем, что в этом случае все собственные значения оператора !В = А*А положительны. Действительно, пусть Я—собственное значение, а х—соответствующий собственный вектор опера- гора $. Тогда х Ф 0 и Ш — ^х. В этом случае {ЗЗх, х) = = {А*Ах, х) = (Ах, Ах) > 0. Но ($)х, х) = (Кх, х) « = % (х, х). А так как (х, х) > 0, то и X > 0. Докажем теперь само утверждение теоремы. Если оно справедливо, т. е. если оператор А можно предста-
$ 6] ПРОИЗВОЛЬНЫЙ ЛИНЕЙНЫЙ ОПЕРАТОР 185 вить в указанном виде Л = 11%, то оператор $ = Л* Л = (ЧФрЧЪ = ^41*41% = %%. Возьмем в качестве базиса пространства Я тот (орто- нормированный) базис, в котором матрица (самосопряженного) оператора !В = Л*Л приводится к диагональному виду "*1 0 ... О о ь2 -• о в= о о к. (8) где по доказанному все Х{ > 0. Обозначим через % «положительный квадратный корень» из Зд, т. е. оператор %, матрица которого в том же базисе имеет вид С= о у% ..УК А Тогда ясно, что #—положительно определенный оператор и что (ё2 = 33. Если теперь положить Л =• = ЭД#, то оператор Ч~Л%~Х, и нам остается только показать, что оператор 41—эрмитов (в вещественном случае—ортогональный). Но это видно из равенства 41*41 = (ЛЯ^УЛЯ-1 = (<ё'1)* Л*Л%-1 = — и теорема доказана. Аналогично можно доказать, что всякий невырожденный линейный оператор Л можно представить и в виде «^==^1^1, где <61—положительно определенный, а 41х—унитарный (ортогональный) операторы. Можно доказать, что указанное в теореме разложение единственно. В случае вещественного пространства можно сказать, таким образом, что каждое невырожденное линейное преобразование сводится к нескольким симметриям относительно гиперплоскостей, нескольким поворотам
186 ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ [ГЛ. V около (п—2)-мерных «осей» и нескольким растяжениям вдоль попарно ортогональных прямых. Пример. Пусть оператор Л в базисе (ех> е2) имеет невырожденную (| А | = 4 Ф 0) матрицу \-У~2 -3] Произведение лм = ["^ II ["^ -3-1 = [6,У I. -3 \Г2\ [ 2 \Г2\ \Ь}Г2 11. = В — симметрическая матрица, из которой надо «извлечь квадратный корень». Собственные значения В—это ^=16 и Я2=1, Соответствующие собственные векторы ^ = A, V2) и е2==(—К2, 1). В базисе (е'и е2) матрица оператора $ приводится к виду В1 = 0 1 . Значит, «положительный квадратный корень» из нее — это С^= к . . Матрицей перехода от базиса (е19 е2) к базису (е[9 е2) будет Д = , а обратной 1 Г 1 ]Л2] к ней—А = -д- „ . Следовательно, в старом базисе (вц е2) матрица оператора %—это и тогда 2/21 и-ле«-[Ч -у (при этом А— 4%—оператор Л представлен в виде произведения положительно определенного и унитарного операторов).
ГЛАВА VI I БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ Результаты первых пяти параграфов этой главы относятся к вещественному пространству. В последнем, шестом, параграфе они обобщаются на комплексный случай. § 1. Билинейный функционал. Билинейная и квадратичная формы Определение 1. Заданная в (вещественном) векторном пространстве /? функция двух переменных А(х, у)> относящая каждой паре х, у векторов число А(х, у), называется билинейной функцией, или билинейным функционалом, если А{х + у,г) = А(хуг) +А(у,г), А [ах, у) =аА(х, у), А{г,х + у) =А(г,х) +А(г,у), А(х< ау) =аА(х, у), где х% уУ г — произвольные векторы из Я и а— любое (вещественное) число. Таким образом, А(х% у) есть линейный функционал по х при фиксированном у и линейный функционал по у при фиксированном х. Примером билинейного функционала может служить скалярное произведение (*, у) векторов (вещественного) евклидова пространства. Найдем выражение билинейного функционала в координатах. Пусть в пространстве /? задан базис ей е%* ... ..., еп, и пусть х = ххех + х2е2 +...+ хпеп, У = У\е\ + У2в2 +... +упеп.
188 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. VI Тогда А (х, у) - в А (х^ + х2е2 + ... + хпеп, у^ + у2е2 + ... + упеп) = п п = 2 Х1укА{е1уек)^ 2 ЪкХгУь где коэффициенты а{к = Л (е,, ел) зависят от базиса и не зависят от х и у. Таким образом, в заданном базисе билинейный фунщцонал представляется били* п не иной формой, т. е. выражением вида 2 яи*г#л*). Матрица А = [а,А] называется матрицей этой билинейной формы. В частности, скалярное произведение (х, у) представляется билинейной формой п 2 81кХ{Ун, где «№=*(*!>**)• Билинейную форму А (х, у) можно рассматривать как матричное произведение Х'АУ, где X — столбец (и значит, транспонированная к X матрица X' — строка) из координат вектора х, У — столбец из координат вектора у я А — матрица билинейной формы. Найдем, как изменяется матрица билинейной формы при переходе к новому базису. Пусть в базисе #ь #2» «,., еп п А(х,у)= 2 ЪкХгУъ где а{к = А(еиек), и пусть е\у е2у .., еп *— новый базис, в котором п А(х,у)=* 2 ЬщХру'ь где 6рд = ЛD, е'д). Положим А = [о»], В= [6<л] и обозначим через С — = [с<к] матрицу перехода от старого базиса к новому; *) Сам билинейный функционал /(*, у) часто тоже называют билинейной формой.
(И БИЛИНЕЙНЫЙ ФУНКЦИОНАЛ 189 тогда Ьм = А (ер, е'д) ~ ==Л (^1р^1"Т^2Р^2 "Г • • • Т" Спрвщ ^1де1~ГС2д^2 Т" • • • "Г Спчрп) — п п п = 2 С1РскдА (е^ ек) = 2 с\рОкча\к =* 2 с^а^с^. Обозначив с<р через йри получим п ЬРЧ = 2 йрМкСкд- Матрица [с?Р<] = С' является транспонированной к п матрице С = [с,Р]. Далее, так как 2 сцьРкя есть элемент, стоящий в 1-строке и <7-м столбце матрицы АС, то П п / п V 2 АрШкСкя = 2 йр{\ 2 оде*? 1 М=1 1=1 \А=1 / — это элемент, стоящий в р*& строке и #-м столбце матрицы С'АС. Таким образом, В = С'АС. A) Заметем, что так как матрица перехода С (а значит, и С) является невырожденной (т. е. имеет ранг п), то ранг матрицы 5 равен рангу матрицы А (см. § 6 главы III). Таким образом, ранг матрицы билинейной формы не зависит от выбора базиса и может быть назван поэтому рангом самой билинейной формы (билинейного функционала). Приведем еще другой вывод формулы A). В обозначениях § 3 главы III имеем Хст « СХВ0* и Уст == СУ„ов. Далее, из равенства (&&)**=*&*<&* (§ 2 главы V) для матриц вытекает равенство (АВу « В А' — оно справедливо, впрочем, не только для квадратных матриц, и, значит, Х'ст = Хд0ВС\ Следовательно, А (** У) = ^ст^ст^ст == ^воъР ^ст^нов' Но А (х, у) » ХноИадцУхии, и, значит, ^нов = <^Л»С (легко видеть, что из равенства Х'В\У = Х'В%У, справедливого для любой строки X' и любого столбца У, вытекает, что Ъ\ « В2),
190 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. VI Билинейный функционал А(х, у) называется симметрическим, если для всех х и у из /? А(х, у) = А(у, х). В этом случае а{к — А(еи ек)=А(ек} е{) = ак{, т. е. матрица [а,А] соответствующей билинейной формы (в любом базисе) будет симметрической; обратно, если матрица билинейной формы (в каком-то базисе) — симметрическая, то и соответствующий билинейный функционал будет симметрическим (почему?). Примером симметрического билинейного функционала может служить скалярное произведение векторов пространства со скалярным произведением. Последний пример является вполне общим, так как и, обратно, каждый симметрический билинейный функционал А(х, у) удовлетворяет, очевидно, условиям 1—3 из § 1 главы IV и, значит, может быть принят за скалярное произведение. Если в симметрической билинейной форме Л(дс, у) положить у = х, то получится квадратичная форма А\ху х). При этом матрица А квадратичной формы А (х, х) — это, по определению, симметрическая матрица А отвечающей А(х} х) билинейной формы А(х, у). Заметим, что по квадратичной форме породившая ее симметрическая билинейная форма определяется однозначно. Действительно, пусть А ((/, х) = А (х, у) при всех х и у. Тогда А(х + у9 х + у) = А{х,х) + 2А(х, у) + А{у,у), откуда А (*, у) = -~ № (х + У>х + У) ~ А (*. Х)~А (У* УЯ Билинейная функция А (х, у) называется кососимметрической, если А(х,у) =— А(у} х) при всех х, ^е/?, В заданном базисе кососимметри- ческая функция представляется кососимметрической формой п Л (*,*/)= 2 СЦкХ\Уъ, где а{к = А(еи ек)=—А{ек1 е{)=—ак{ при всех I, к и,
§2] ПРИВЕДЕНИЕ К СУММЕ КВАДРАТОВ 191 в частности, а{{ = 0 при всех и Так, в трехмерном пространстве кососимметрическая форма имеет вид Я12 (*1#2 — *Ш\) + 013 (*1#3 ~ хъУ\) + «23 (*2#3 — *3#2) • Пусть А (х, у) — произвольный билинейный функционал. Тогда В (х, у) = -у IА (х> У) + А (У'•*I является, очевидно, симметрическим, а С(х, у)=*-%\А (х9 у)—А{уу х)] — кососимметрическим функционалами. Но А(х,у)=В(х,у) + С(х>У); следовательно, каждый билинейный функционал может быть представлен в виде суммы симметрического и ко- сосимметрическоео функционалов. § 2. Приведение квадратичной формы к сумме квадратов Теорема 1. Пусть А(х, х)—произвольная квадратичная форма в п-мерном векторном пространстве. Тогда найдется такой базис, в котором эта форма приводится к сумме квадратов (т. е, в котором все коэффициенты при попарных произведениях координат вектора х равны нулю). Доказательство проведем индукцией, по числу входящих в форму переменных. Если в А{ху х) входит лишь одна координата, скажем, А (х, х) = апх219 то наше утверждение очевидно. Предположим, что оно справедливо для всех квадратичных форм, зависящих от тп— 1 координат, и рассмотрим квадратичную форму, зависящую от тп переменных: А (х, х) = апхх + 2а12ххх2 + а22х2 + ...+ Если здесь есть хотя бы один квадрат с отличным от нуля коэффициентом, например, если Отт ф О, то соберем все члены, содержащие хт:
192 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. VI и «выделим полный квадрат»: *0>1тХ\Хт "V ^2глХ%Хш ~1? • • • V ^Ят-итХт-хХт ~г ^ттХщ^' = ~ (#1т*1 Ч~ #2т#2 ~Ь • • • 4" #т-1,т#т-1 + ОттХт) ~ итт — ~ (^1т^1 + Ягт^а + • • • + Ят-1,т#т-1J» итт Тогда А (х, х) = ~— (а1пхх + агтх2 + ... + ДттхтJ + В (х, х), итт где квадратичная форма В(х, х) зависит уже только от т— 1 координат: Х\, х2, ..., хт-1. Положим У\ = #Ь #2 = *2> • .-., Ут-1 — *т-Ь Ут = 01т*1 + #2*1**2 + • • • + Дтт*да, |/го+1 = -^т+Ь • • •> Уп :== Хп. Так как определитель 1 0 а1т |о 0 1 й2т 0 0 .. 0 .. азт" 0 .. .0 ...0 .0 ...0 . ашпк ... 0 т/л .0 ...1 то этот переход к новым координатам вызывается переходом к некоторому новому базису — с матрицей перехода, обратной матрице определителя й (см. § 6 главы II). По предположению индукции, форму В(х, х), зависящую от пг — 1 переменных хи х2, ..., х„~и посредством перехода к новому базису можно привести к сумме квадратов. При этом окончательно приведется к сумме квадратов и форма А(х, х). Мы предполагали, что хотя бы один из квадратов входит в форму А(х, х) с ненулевым коэффициентом. Если это не так, т. е. если все а« = 0, то допустим, что, например, а» Ф 0, и положим *1 = #1+#2, Х2 = У1—У2> *3 = #3, ,.., Хп=уп
§2] ПРИВЕДЕНИЕ К СУММЕ КВАДРАТОВ 193 — это соответствует переходу к новому базису #1 — ^1 "Г ^2» ^2 — &\ ^2| ^3 — ^3> • • • | ^п — ^п с матрицей перехода Г1 1 0...(Г| I 1 -1 0...0 О 0 1 ...О I 1_0 0 0 ... 1 Л (определитель этой матрицы равен —2^=0). При этом произведение Х\Х2 обратится в у\ — у\, и мы придем к первому случаю. Мы доказали, что если в я-мерном векторном пространстве Я задана произвольная квадратичная форма, то в /? можно найти такой базис, в котором эта форма приведется к сумме квадратов: А (х, х) = ахх[2 -Ь а2х? + ... + апх'п, B) где хи хъ ... ,хп— координаты вектора х в новом базисе. Коэффициенты а< могут быть и положительными и отрицательными; некоторые из них могут быть равными нулю. Сделав еще одну подстановку У\ах\х\ = г-и если а{ф0 их| = 2], если ^ = 0, приведем квадратичную форму А (х, х) к виду А (х, х) = =ь г\ ± г\ ± ... ± г*т, где коэффициент перед каждым неизвестным гь г2,... ..., гт равен + 1» или — 1, или, после изменения нумерации базисных векторов,— к виду А (х, х) = г\ + г\ + ... + г\ — г\^ — ... — г2р+я. Пример. Квадратичную форму х\ + 2ххх2 + Зд^ + 4хгх3 + -|- 6д:2дс3 + 3*з привести к сумме квадратов. Решение, А (х, х) = (хг + х2 + 2х3)* + 2х\ + 2х2х3 - 4 = = (* + *а + 2*3J - (*, - лг3J + 3^ = г* + г2 - *|. где г1 = х1+х2 + 2х3, г2 = 1/3*г, г3 = *.г — х3. ' Л. И. Головина
194 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. VI § 3. Закон инерции квадратичных форм Приводя квадратичную форму А (х, х) к сумме квадратов разными способами, мы будем получать в формуле B), вообще говоря, разные коэффициенты. Однако имеет место следующее важное обстоятельство: Теорема 2 (закон инерции квадратичных форм). Если квадратичная форма приводится к сумме квадратов в двух разных базисах, то число членов с положительными коэффициентами, так же как и число членов с отрицательными коэффициентами, в обоих случаях одно и то же. Доказательство (от противного). Предположим, что в базисе ех, е2, ..., еп квадратичная форма А (х, х) имеет вид А (х, х) = хг -|- XI + ... -(- хр—хр+Л — ... —Хр+д, C) где х{ — координаты вектора х в этом базисе; и пусть в другом базисе е[, е'2, ..., е'п\ А(х, х) = х'12 + х'22+...+х'к2 —хк\х —...— х'к\т, D) где х\—координаты вектора х в новом базисе. Пусть, например, р> к. Рассмотрим в пространстве /? подпространство #х, порожденное векторами ег, е2, ..., ер, и подпространство /?2, порожденное векторами е'к+1, е'к+2, ... ..., е'п. Так как сумма их размерностей, равная /? + + (п—к), больше п, то их пересечение имеет ненулевую размерность (теорема 5 из § 9 главы II), т. е. существует вектор хфО, принадлежащий НХГ[Н2. Этот вектор можно представить как в виде х = ахех + а2е2 + ... + арер, так и в виде * = Ра + 1^+1 + Р* + 2*А + 2 + • • • + Р„С Для вектора х по формуле C) А(х, х)=а2 + а1+...+а2р>0, так как хотя бы одно из а( Ф 0; в то же время по формуле D) А (х, х) = - р|+1_р«+1_ ... -рк+т < 0
§4] ОПРЕДЕЛЕННЫЕ ФОРМЫ 195 (последнее неравенство — нестрогое, потому что возможно, что к-\- т < п). Мы пришли к противоречию, откуда и следует, что р^й. Аналогично получаем и неравенство р>к. Следовательно, р = к. Так же доказывается, что ц = т. Легко видеть, что сумма р +¦ ц равна рангу г квадратичной формы А (х, х). Разность р — ц называется сигнатурой формы А(х, х). § 4. Определенные формы Определение 2. Квадратичная форма А(ху х) называется по л ожит е ль но (отрицательно) определенной-, если А (х, х) > О (А (ху х) <0) при всех хфОу и положительно (отрицательно) полуопределенной, если А(х, х) > 0 (А(х, х) < 0) при всех х. Так, если А(х} у) = (*, у) — скалярное произведение в евклидовом пространстве, то соответствующая квадратичная форма А{х, х) = (ху х) (скалярный квадрат вектора х) является положительно определенной. Ясно, что положительно определенная квадратичная форма приводится к сумме квадратов с положительными коэффициентами, а положительно полуопределенная форма — с неотрицательными коэффициентами (некоторые из которых могут равняться нулю). Важным условием положительной определенности формы является следующая Теорема 3 (критерий Сильвестра). Для того чтобы квадратичная форма А (х, х) была положительно определенной, необходимо и достаточно, чтобы были положительны все «угловые миноры» матрицы А = [а1Л], т. е. чтобы имели место неравенства А1 = ян > 0, >0, Д3 а11а12й13 >0,...,Дл = |Л|>0. Доказательство проведем индукцией по числу входящих в форму переменных. Для квадратичной формы, зависящей от одной переменной, А (х, х) = аах^ и наше утверждение очевидно. Предположим, что 7*
196 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ (ГЛ. VI оно справедливо для всех квадратичных форм, зависящих от п— 1 переменных, и рассмотрим квадратичную форму А (х, х) = п = V а.кх.хк, зависящую от переменных Х\, х2, ..., хп. 1 Доказательство необходимости. Если представить положительно определенную форму А (х, х) в виде п-1 п-1 А (х, х) ^ а(кх.хк + 2 ^ а1пх.хп + аппх\, п-1 то квадратичная форма В (*'.. х') — 2. «гь*^» зависящая от л—1 переменных хи х%, ..., хп-1 (и рассматриваемая, конечно, в (п— 1) мерном пространстве), будет положительно определенной, так как если В(х', х') ^ О при х' = (хь х2, ..., Яп-ч), то при х = = (*ь х2, ..., хп-\ 0) мы имели бы А(х, х) ^ 0. По предположению индукции, все угловые миноры матрицы квадратичной формы В(х\х) положительны, т. е. Ах = ап > 0, А2 = «11 «12 «12 «22 -А„-1= >0, ... «11 «12 а1,П-1 «12 «22 «2,п-1 ' ¦• *1,п-1 1 •• а2,п-1 •• «п-1,п-1 >о. Остается доказать, что и Ап = \А\ > 0. Мы знаем, что положительно определенная квадратичная форма А(х, х) в некотором базисее1% е2, ...,еп приводится к сумме квадратов Л(д^*) = *'* + *'|+...+*'*. В этом новом базисе определитель ее матрицы равен 1 и, значит, он больше нуля. Однако при переходе к новому базису матрица билинейной формы преобразуется по формуле (стр. 189) В = С АС, где А — ее матрица в старом базисе, В—в новом и С— матрица перехода от старого базиса к новому. Следовательно, |*|- |С| \А\ |С| = |Л| |С|*. E) Но так как \С\ ф 0 и \В\ > 0, то и \А\ «Дя>0. 2. Доказательство достаточности. Предположим, что все угловые миноры матрицы квадратичной формы А(х, х)
§ 4] ОПРЕДЕЛЕННЫЕ ФОРМЫ 197 положительны: А, > О, Д2 > 0 Д„_, > О, Д„ = \А | > О, и Докажем, что квадратичная форма А(ху х) положительно определенная. Из предположения индукции вытекает, прежде всего, положительная определенность квадратичной формы В (*', х') = п-1 = 2 а1кх1хк ог п ~"~ * переменных (в (п—1)-мерном простран- стве). Следовательно, В(х', х') в некотором новом базисе приводится к сумме квадратов: в (*', о = х[2+*;2 +... + х*_г. Сделав соответствующую замену переменных хх, х2у .. , хп-\ и положив, кроме того, хп = хп, мы получим .2 ,2 ,2 А (х, х) = хг +х2 + ... + хп_х + + 2 (ЬЩХ1Хп + Ь2пХ2Х'п + - - . + ^-1.п*'|1-1*п) + ЯпЛ' где 6<л — какие-то новые коэффициенты. Далее имеем + (*2 + Ь2пХ'пУ + • • • + (*п-1 + *п-1,п*пJ + ЬХ*. где, очевидно, 6 = апп — 6*п — Ь\п — ... — Ь\_1п, и, полагая *< + ЬгПХп = уи I = 1, 2, ..., п — 1, а?п = уп (что соответствует переходу к новому базису, с мзтрицей, определитель которой равен единице), получим а(х,х) = !,1+у1+...+у1_1 + ы/1. Определитель матрицы этой квадратичной формы равен Ь, а так как знак его, как видно из формулы E), совпадает со знаком Дп, то Ь > О, и значит, квадратичная форма А (х, х) — положительно определенная. Теорема доказана. Теперь нетрудно найти и условия отрицательной оп- п ределенности квадратичной формы А(х, х) = 2 а{кх\хк. Для того чтобы квадратичная форма А (х, х) была отрицательно определенной, необходимо и достаточно, чтобы квадратичная форма п — А (х, х) = 2 (— аид хьхк
198. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. VI была положительно определенной, а значит — чтобы все угловые миноры матрицы 11 — о,а 42 **22 " ¦ а, _ — аа — а, 2п 71 ^271 т. е. — ал 2 * ' ' *1П были положительны. Но это означает, что |>0, д — п 4Г П А — Г11 °12 а1 — 1 V. и» а2 — я апп I 12 22 Аз = «11 «12 «13 «12 «22 «23 «13 «23 «33 <о,..., т. е. что знаки угловых миноров матрицы А чередуются, начиная со знака минус. Пример. При исследовании на экстремум функции Р(х, у, г) = 2*2 + У7 + Иг2 - 2ху + Ахг - буг -2у + 8г, находим, что ее частные производные обращаются в нули при х = 1, у = 2, г = 0. Второй дифференциал функции Р(х, у, г) имеет вид &Р = 2B4х2 — 24* йу + ^2 + 4Ж;йг — Муйг+\\йг*). В скобках — квадратичная форма относительно дифференциалов независимых переменных их, йу, йг. Угловые миноры ее матрицы ¦2, Д2 = | 1, Дз = 2 - 1 2 — 1 1 -3 2 -3 1 положительны Следовательно, эта квадратичная форма положительно определенная, и заданная функция имеет в точке A, 2, 0) минимум.
§5] ФОРМЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 199 § 5. Билинейные и квадратичные формы в евклидовом пространстве Лемма. Пусть /? (вещественное) евклидово прост- ранство и С= [с{к]—матрица перехода от одного ор- тонормированного базиса еи е2, ..., еп к другому, тожз ортонормированному базису еи е2, .. .,еп. Тогда С — ортогональная матрица. Доказательство. По условию, е\ = сце1 + с2{е2 + ... + сп{еп> I = 1, 2, ..., п. Рассмотрим линейный оператор ^ с матрицей С в базисе е\9 е2, . *., еп. Мы имеем 9в1 = <?!!*!+ с<цег + ... + Сп%еп = еи * = 1, 2, ..., л. Но оператор <й7, переводящий хотя бы один ортонормированныи базис в ортонормированныи же,— ортогональный (см. § 4 главы V). Следовательно, С — ортогональная матрица. Пусть теперь в евклидовом пространстве /? выбран ортонормированныи базис еи е2у ..., епу и пусть дан билинейный функционал А(х, у)у который в этом базисе представляется билинейной формой п А (х, у) = 2 аХкХгук, где х = ххел + х2е2 + ... + хпеп, у = г/^ + #2е2 + ... . .. + У«е„. Рассмотрим линейный оператор ^ с той же матрицей А в том же базисе еи е2, ..., еп. При переходе к новому базису еи е2, ..., ^ с матрицей перехода С матрица А билинейной формы перейдет в С АС, а матрица линейного оператора зФ — в С'1 АС, т. е., вообще говоря, эти матрицы преобразуются не одинаково. Однако если новый базис е[9 е2у .. .уеп — тоже ортонормированныи, то матрица перехода С ортогональна и С = С"!. В этом случае матрица
200 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ, VI билинейной формы А(ху у) и матрица линейного оператора $Ф преобразуются одинаково. Таким образом, в евклидовом пространстве каждому билинейному функционалу соответствует вполне определенный линейный оператор (имеющий ту же матрицу в любом ортонорми- рованном базисе). Если А(х, у) —симметрический билинейный функционал, то соответствующий линейный оператор $4* будет самосопряженным. Но матрица самосопряженного оператора в некотором ортонормированном же базисе приводится к диагональному виду с собственными значениями Хь А2, .,., Хп на главной диагонали. При этом, если п п х = 2 х{еи у = 2 №еи 1=1 ?=1 п то билинейная форма А (х} у) = 2 Ь&хуи а соответствую- щая квадратичная форма А{х, х) приводится к сумме квадратов: ^1*1 ~Ь Х2^2 ~~\~ • • • ~Ь ЛпХп» Пример. Квадратичную форму А (х, х) = бб*2 — 24ху + 59у2 в евклидовом пространстве /?2 переходом к новому ортонормирован- ному базису привести к сумме квадратов. Решение. Характеристический многочлен матрицы А этой формы I 66 — X -12 Ф(*) = | _12 59-Х = Х2- 125Х + 3750. Его корни А,! = 75, \2 — 50. В новом базисе (состоящем из собственных векторов операто.- ра Л, соответствующих собственным значениям к\ и Лг) А(х,х) = 7Ьх'* + 50у'12. Легко видеть, что квадратичная форма А(х> х) тождественно равна скалярному произведению (бФх, х). Выше мы назвали положительно определенным самосопряженный оператор с положительными собственными значениями. Ясно, что для того чтобы самосопряженный оператор $Ф был положительно определенным, необходимо и достаточно, чтобы была положительно
§ 6] ФУНКЦИОНАЛ В КОМПЛЕКСНОМ ПРОСТРАНСТВЕ 201 определенной соответствующая квадратичная форма А(х> х), т. е. чтобы при всех х Ф 0 выполнялось неравенство (зФх, х) = А (х, х) >0. Методами математического анализа можно показать, что наименьшее из собственных значений Хи Х2> ... ..., Хп самосопряженного оператора зФ равно минимуму, а наибольшее — максимуму квадратичной формы А(ху х) = (бФху х) на «единичной сфере». х\ + х\ + .,. ••• +Хп= 1. (Для того чтобы доказать это, надо найти экстремумы функции %хх\ \- Х2х1 -+¦ • • • + ^пх\ при условии, ЧТО х\ + х\ + . . . + Ха = 1.) § 6. Билинейный функционал в комплексном векторном пространстве Билинейный функционал в комплексном пространстве иногда задают определением 1; однако чаще используется следующее Определение Г. Функция А(ху у) двух переменных, заданная в комплексном векторном пространстве /?, называется билинейным функционалом, если для всех х, у, г из /? и любого (комплексного) числа а А(х + уу г) = А(ху г) +А(уу г), А (аху у) = аА (ху у), А (г, х + у) =Л(г, х) +А(гу у)у А (х} ау) = аА [ху у). (В дальнейшем мы будем относить определение 1 только к вещественному пространству, понимая под билинейным функционалом в комплексном пространстве функцию, удовлетворяющую условиям определения Г*).) *) В научной и учебной литературе удовлетворяющую перечисленным условиям функцию А(х, у) двух векторов комплексного линейного пространства чаще называют билинейной эрмитовой, или полуторалинейной, и говорят, что она является линейной по первому переменному х и антилинейной по второму переменному у (или является линейной 1-го рода по переменному х и линейной 2-го рода по переменному у). Мы, однако, и здесь сохраним термин «билинейная форма» (или «билинейный функционал»).
202 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. VI Легко видеть, что в комплексном векторном пространстве билинейный функционал в координатах представляется билинейной формой п А (х, у) = 2 сЦкХ\Ук, где а* = А (еи ек). 1,к=1 В частности, скалярное произведение (х, у) представ- п ляется билинейной формой 2 §гкХгУн* где ёгк= (еиек)\ г,к=1 п в ортонормированном базисе (х, у) = 2 *^« 1=1 При переходе к новому базису с матрицей перехода ?г С = [Сгк] билинейная форма А (х, у) = 2 сЦкХгуь. пре- п образуется в 2 Ьр<кхруя, где Ьрд = А{е'Р, е'д). Если С7 — матрица, транспонированная к С, а С — матрица, комплексно сопряженная к матрице С (все ее элементы являются комплексно-сопряженными к соответствующим элементам матрицы С), и В =[Ьрд]у то В = С'АС. Это можно показать, например, так: в обозначениях § 3 главы III Хст = СХВОв, Уст = СУН0В и А (х, у) =^сИст^с1 ^ = X' С А С? Но А (х.и) = X' А У и» значит, лнови лсти нов по л ^л»*' ^нов^ноь' нов ' Билинейный функционал, а также соответствующая ему билинейная форма А (х, у) называются эрмитовыми, если А (хг у) = А (у, х) при _всех х, у^Н. В этом случае аа = А (еи ек) = А (ек> е<) = ам при всех *, к = 1, 2, ... ..., л, т. е. А = Л*. Очевидно и обратное: если матрица А билинейной формы равна Л*, т. е. если при всех /, к #<* = впи то соответствующий билинейный функционал— эрмитов. Таким образом, для того чтобы билинейный функционал был эрмитовым, необходимо и достаточно, чтобы матрица соответствующей билинейной формы (в любом базисе) была эрмитовой (ср. стр. 172). Пусть А(х, у)—эрмитов билинейный функционал. Положив у = х} мы получим эрмитов квадратичный
§ 6] ФУНКЦИОНАЛ В КОМПЛЕКСНОМ ПРОСТРАНСТВЕ 203 функционал (форму) А(ху х). В этом случае А(х> х) = = А(ху х) при всех хе/?, и значит, эрмитова квадратичная форма принимает только вещественные значения. В комплексном векторном пространстве каждая эрмитова квадратичная форма А (х, х) в некотором базисе приводится к виду А{ху х)=Ъ1\х1\1 + Ъ\х2\2 + ... + 1п\хп\>, F) где все |« вещественны (это нетрудно доказать, видоизменив соответствующим образом доказательство теоремы 1, см. стр. 191), причем если эрмитова квадратичная форма в двух разных базисах приведена к виду F), то число положительных и число отрицательных квадратов в обоих случаях одно и то же. Наконец, определение положительно определенной эрмитовой формы и критерий Сильвестра без труда переносятся на комплексный случай. Пусть теперь /?— (комплексное) евклидово пространство. Аналогично вещественному случаю (см. лемму на стр. 199), можно показать, что матрица перехода С от одного ортонормированного базиса к другому, тоже ор- тонормированному, унитарна. Пусть еи е2у ..., еп — ортонормированный базис в /?, и пусть А(х, у)—эрмитов билинейный функционал, который в этом базисе представляется билинейной формой п А (X, у) = 2 ЯгьХгУъ, где а?А = ам при всех 1У к. Рассмотрим линейный оператор $Ф' с матрицей А', транспонированной по отношению к матрице А билинейной формы А(х, у). Так как эта форма эрмитова, то Л* = А и оператор Ж' — эрмитов, а следовательно, его матрица, в некотором, тоже ортонормированном, базисе е[, е[у ..., еа приводится к диагональному виду В = \ 0 ...0-1 о V--0 о о ... х,. причем все %1— вещественны (§ 3 главы V). Если С — матрица перехода к новому базису, то В = С~ХА'С (§ 4
204 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. VI главы III). А так как матрица перехода С унитарна, то С = С, и значит, _ В = С А С. Далее, так как матрица В диагональная, то она совпадает со своей транспонированной: В/ = В Но В' ^{С'А'СУ = СЛС. С другой стороны, при переходе к базису еъ е2, .. .,е'п матрица Л_билинейной формы А(х, у) тоже преобразуется в САС (см. стр. 202), и значит, в новом базисе она совпадает с матрицей В' = В. Следовательно, в базисе е1Л е9,..., еп билинейна^ форма_Л(х, у) имеет вид А (х, у) = ХхХхУх + Х2х2У2 + ... + К*пУп> где Х<— собственные значения линейного оператора зФ' (а значит, и собственные значения оператора*^); соответствующая квадратичная форма А{х, х) приведется при этом к сумме квадратов: А (х, х) — Л4 \х± I2 + Хг \х212 + ... + Хп \хп | \
ГЛАВА VII ИССЛЕДОВАНИЕ КРИВЫХ И ПОВЕРХНОСТЕЙ I ВТОРОГО ПОРЯДКА В трех первых параграфах этой главы рассматривается вещественное двумерное пространство (плоскость) с обычной, евклидовой метрикой, а в последнем параграфе— трехмерное вещественное евклидово пространство. § 1. Приведение общего уравнения кривой второго порядка к каноническому виду Установим на плоскости прямоугольную декартову систему координат и рассмотрим общее уравнение второй степени !(х, У) = апх2 + 2а12ху + а22у2 + 2а{х+• 2а2у + а = 0. A) Множество точек, координаты которых удовлетворяют уравнению A), называется линией (или кривой) второго порядка. Как известно, при некоторых частных значениях коэффициентов уравнение A) будет уравнением эллипса (^ + ^ = 1),гиперболы^ - ^ = 1)или параболы (у2 = 2рх). Мы докажем, что уравнение A) всегда является уравнением одной из этих кривых: эллипса, гиперболы или параболы (не считая случаев вырождения—лары прямых, если левая часть уравнения распадается в произведение двух линейных множителей, точки или «пустого множества», вовсе не содержащего точек). Обозначим через е\ и е2 единичные векторы, направленные по осям выбранной (прямоугольной) системы координат. Группу старших членов апх2 + 2а12ху + а22уи B) уравнения A) можно рассматривать как квадратичную
206 КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [ГЛ. VII форму от координат ху у вектора (*, у). Как было показано в § 5 главы VI, эта квадратичная форма в некотором (ортонормированном же) базисе е1у е2 приводится к сумме квадратов М'2 + ^'2, C) где ^1 и Х2 — собственные значения матрицы А = \> Я D) а е[ и е2 — соответствующие им собственные векторы. Пусть вектор е± получается из вектора в\ поворотом на угол ф против часовой стрелки. Так как вектор е2 ортогонален еь а е2 ортогонален еи то вектор е2 получается из вектора е2 либо поворотом на угол ф, либо поворотом на угол ф и симметрией относительно начала координат. Во втором случае заменим его на вектор е2 = — е\ который тоже будет собственным вектором матрицы D) с тем же собственным значением %2: если зФе2 = К2е^ то зфе2 = зф \— е2) = —- ^фе2 = — к2е2 == Х2е2. Таким образом, можно считать, что новый базис е\ е2 получается из старого поворотом на некоторый угол ф против часовой стрелки, т. е. что ех = со5 ф • ех + 51П ф • еъ е'г = — 51П ц>-е1 -|- соз у-е2. Но в таком случае старые координаты х, у (вектора, а значит, и соответствующей точки) и новые координаты х\ у' связаны соотношениями X = СОЗ ф • Х/ — 51П ф • у\ E> У = 51П ф • X + СОЗ ф • у\ Подставив значения E) в уравнение A), мы приведем это уравнение к виду М'2 + 12у'2 + 2М' + 262</' + Ь = 0, F) где Ь\. Ъ2,*Ъ — некоторые новые коэффициенты, ^та операция называется отнесением линии к главным осям—
$ I] ПРИВЕДЕНИЕ К КАНОНИЧЕСКОМУ ВИДУ 207 из дальнейшего будет видно, что если линия A) представляет собой эллипс или гиперболу, то новые оси координат параллельны главным осям кривой. Коэффициенты Хи ^2 — это собственные значения матрицы D); их можно найти из уравнения Ф(*) = 12 2 = 0. G) Они вещественны, так как матрица D) симметрическая (теорема 4 главы V). Произведение %{К2 собственных значений равно свободному члену ф@) квадратного уравнения G), т. е. равно определителю 6 = Рассмотрим теперь отдельно два случая: б ф 0 и 6 = 0. I.. 6 = \\\ч ф 0. Преобразуем уравнение F) следующим образом: глее = Ь — -^ ^-. Сделаем подстановку *»" _ Л \ I ,/' __ ,/ I 2 Эта подстановка отвечает переносу начала координат I I при сохранении направлении осей. в точку 1--^, Уравнение F) приведется тогда к виду (8) Предположим сначала, что ЛД2 > 0 (т. е. что б > 0). В эгом случае геометрическое место точек, координаты которых удовлетворяют уравнению (8), представляет собой эллипс (рис. 15,а), если знак с противоположен знаку Ль оно сводится к одной точке, если с = 0, и совсем
208 КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [ГЛ. VII не содержит точек, если знак с совпадает со знаком А,1*). Пусть теперь АД2 < 0 .(т. е. 6 < 0); тогда (8) будет уравнением гиперболы, если с Ф 0 (рис. 15,6), и пары пересекающихся прямых, если с = 0. у\ №, К?0,с<0 Л>0,Л2%с<0 Рис. 15. В случае I линия представляет собой центральную кривую второго порядка (легко видеть, что для содержащей хотя бы одну точку кривой (8) начало координат является центром симметрии). II. б = %\%2 = 0, и пусть, например, К2 Ф 0. Уравнение A) приводится к виду Х2у'* + 2М' + 2Ь2у' + Ь = 0. (9) Если Ь{ Ф 0 то, выделив полный квадрат, будем иметь После переноса начала координат *" = *' + 26, 2К»1 У" = У' + ^- уравнение (9) принимает вид иу'п + 2Ь1Х" = 0. (Ю) *) Вместо «точки», определяемой уравнением \\х + К2у = 0, говорят также о паре «мнимых прямых» у "= ±' |/ , пересекающихся в вещественной (т. е обыкновенной, реально существующей) точке. «Пустое множество точек» Л!* + Х2у 2 + с = 0, где Хь Х2, с —' одного знака, называют также «мнимым эллипсом».
§ 2] ИНВАРИАНТЫ КРИВОЙ ВТОРОГО ПОРЯДКА 209 Это —каноническое уравнение параболы (рис. 16). В случае, когда коэффициент Ъ\ = 0, уравнение (9) приводится к виду и после подстановки принимает следующий иу + с = где с = Ь — —. вид 0, (И) Рис. 16. Это — пара параллельных прямых, если сХ2 < 0, пара совпадающих прямых, если с = 0, и «пустое множество точек» (не содержащее ни одной точки) при с^2>0*). Таким образом, утверждение, сформулированное в начале параграфа, доказано. § 2. Инварианты кривой второго порядка Слово ивариантный значит неизменный. И не а» риантами кривой называются такие выражения, составленные из коэффициентов ее уравнения, которые не меняются при переходе от одной прямоугольной декартовой системы координат к другой такой же системе, т. е. при поворотах осей координат и при параллельных переносах осей. Теорема 1. Для кривой второго порядка A) сумма коэффициентов при квадратах координат 8 = ап + а22, определитель, составленный из коэффициентов при старших членах: *11 *12 *) Уравнение \2у"? + с — 0, где Ь2с > 0, определяет, как иногда Г* говорят, «пару мнимых параллельных прямых»:# = ± I / г-.
210 КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [ГЛ. VII и определитель третьего порядка Д = 1 '12 ¦*12 2 являются инвариантами. Доказательство. Рассмотрим отдельно перенос начала координат и поворот координатных осей. Предположим прежде, что начало координат (при сохранении направлений осей) переносится в точку с координатами (а, Р). Тогда х = х' + а, У = У* + Ь где х' и */'— новые координаты. Подставляя эти значения х и у в уравнение A), получим ап(х' + аJ+2а12(х' + а)(у' + $)+а22(у' + № + + 2а! (*' + а) + 2а2 (</' + р) + а = 0, или апх'2 + 2а12х'у' + а22у/2 + +2(апа + а12р + ах)х' + 2(а12а + а22р + а*)у' + + (аца2 + 2а12а§ + Я22Р2 + 2аха + 2а2р + а) = 0. A2) Мы видим, что группа старших членов вообще не изменилась, отсюда инвариантность 5 и б очевидна. (Заметим, кстати, что коэффициент при х/ равен 2(аиа + + #12? + 0|)= /'*(<*> Р)—-частной производной от левой части уравнения A) по х, взятой при х = а, у = Р; коэффициент при у' равен /;, (а, Р), а свободный член равен /(а, р), так что окончательно преобразованное уравнение принимает вид апх'2 + 2а1%х'у' + а22у'2 +/'х (а, Р) У + + ^(а,Р)/ + /(а, Р) = 0 Для уравнения A2) определитель Д равен 11 Я12 °11а + Л1оР + а1 в12* + С28Р + й1 а11а + а12^ + а1 °1%а + аМР + а2 а11а + Ч^ + ^ + + 2аАа+2а2E + а
§2] ИНВАРИАНТЫ КРИВОЙ ВТОРОГО ПОРЯДКА 211 Вычитая из последней строки этого определителя первую, умноженную на а, и вторую, умноженную на [}, получим *12 22 °12а + С22Р + а2 А проделав такие же операции над столбцами полученного опеределителя, найдем, что он равен 12 т. е. равен старому определителю Д. Таким образом, инвариантность Д при переносах начала координат тоже доказана. Далее, при повороте осей координат на угол ф мы переходим от одного ортонормированного базиса к другому— такому же; следовательно, матрица квадратичной формы апх2 + 2а12ху + а22у2 преобразуется так же, как матрица соответствующего линейного преобразования (см. § 5 главы VI). Но для линейного преобразования с матрицей \а11 ви1 К а22] коэффициенты его характеристического уравнения I 2 *12 а22-Х = № — (ап + а22) X + апа22 — а12 = X2 — §Х + б вообще не зависят от выбора базиса (теорема 6 § 8 главы III). Этим доказана инвариантность 5 и б при поворота* координатных осей. Аналогично, можно доказать и инвариантность определителя Д. В самом деле, если мы перейдем к новому базису ех, е2 е\ = соз ф-гх + 51п ф-еа. е' = — 51П ф-ех + соз ф-еа, где
212 КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА (ГЛ. VII то координаты преобразуются по формулам X = С05 ф • х! — 51П ф • у*, A3) У = 51П ф • X' + С05 ф • у'. В трехмерном евклидовом пространстве /?3 в ортонормирован- ном базисе еи е2у еъ рассмотрим квадратичную форму от трех переменных: ?(х> У. г) = апх2 + 2ах2ху + а^у2 + 2а{хг + 2а2уг + аг\ которая при г = 1 превращается в /(*, у). При переходе к новому базису с матрицей перехода Гсозф — 51'п ф 0] 51П ф С05 ф 0 I [_ 0 0 1] координаты в #3 преобразуются по формулам X = С05 ф • X1 — 51П ф • у\ у = 31Пф • х' + С05ф • у\ A4) Если 1(х, у) при подстановке A3) переходит в Ьпх'* + 2ЪХ2х'у' + Ь22у'2 + 2Ь1х/ + 2Ь2у' + а (свободный член при этом, очевидно, не меняется), то ясно, что Р(х, У> г) при подстановке A4) перейдет в Ьпх'* + 2Ьпх'у' + ЬпУ + 1Ьхх'г' + 2Ъ2у'г' + аг'\ Но при переходе к новому (ортонормированному!) базису определитель матрицы квадратичной формы не меняется, следовательно, для формы Р(х, у, г) имеет место равенство |*и *18 1*1 ьы ь2й ь* Ьг ь* а = «11 «12 «1 «12 «22 «2 ах\ а2 « \ Левая часть его есть определитель Л для /(*, у) в новом базисе ер е2 а правая часть — в старом. Следовательно, и при поворотах координатных осей этот определитель также не меняется. Теорема полностью доказана. По значению б можно судить о типе кривой: если б > 0, перед нами кривая эллиптического типа (эллипс, точка или «пустое множество» — «мнимый эллипс»), если 6 <С 0 — кривая гиперболического типа (гипербола или пара пересекающихся вещественных прямых), если 6 = 0—-кривая параболическо-
§ 2] ИНВАРИАНТЫ КРИВОЙ ВТОРОГО ПОРЯДКА 213 го типа (парабола или пара параллельных прямых, возможно, совпадающих или даже не существующих — «мнимых»). Установленная в теореме 1 инвариантность выражений 5, б и Д облегчает приведение уравнения кривой к каноническому виду. Так, например, в случае центральной кривой, т. е. при б Ф О, уравнение кривой, как мы видели, приводится к виду М2 + Я2е/2 + с = 0, где Ки ^2 — собственные значения линейного оператора с матрицей Г11 °12 . Но для последнего уравнения 1а12 агг\ Д= АхЛ2^> откуда К\к2С = А, или дс = А, и с = -^-. Таким образом, «каноническое», т. е уже упрощенное, уравнение центральной кривой второго порядка, будет иметь вид М2 + ^2 + 4-о. Если б > 0 и А ф О, то наша кривая —эл ли пс или «мнимый эллипа 5на будет эллипсом (вещественным), если Х\ и-у разных знаков, т. е. если ^-у < 0; но так как б > 0 ^1 —одного знака с 5, то это будет, если 5Д < 0. Кривая будет «мнимым эллипсом» в том случае, когда А > 0. Если же б > 0 и А = 0, то кривая представляет собой точку. Если б < 0, то кривая является гиперболой при Д=^0 и распадается на пару пересекающихся прямых при А = 0. Для параболы, уравнение которой приведено к ви- ДУ (Ю), Ю 0 Ьл А = = — М2,
214 КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [ГЛ. VII откуда *, = ±/-А=±1/_4. Здесь Ь\ ф О и, значит, Д Ф 0. В случае пары параллельных прямых (различных, совпадающих или «мнимых») уравнение кривой приводится к виду Х2у2 + с = 0. В этом случае Д = 10 1° |о 0 К 0 01 0 с ; = 0. Соберем результаты двух последних параграфов в следующую таблицу: 6>0 Кривая эллиптического типа ; 6<0 Кривая гиперболического типа 6-0 Кривая параболического типа д^=о А-0 А^0 А=0 А^=0 А=0 5А<0. Эллипс 1 5А>0. «Мнимый эллипс» | Точка (пара пересекающихся в в этой точке «мнимых прямых») Гипербола Пара пересекающихся прямых] 1 Парабола | Пара параллельных прямых (различных, совпадающих или «мнимых») Из этой таблицы, в частности, видно, что определитель Д равен нулю в том и только в том случае, когда кривая распадается на пару (действительных или «мнимых») прямых. Примеры. Определить типы следующих кривых и привести их уравнения к каноническому виду. 1. За;2 — 2ху + З*/2 + 2а — 4г/ + 1 = 0. 2. Зх2 — 2ху + Зу2 + 2х — 4*/ + 2 = 0. 3. х2 + у2 + 2х + 1 =0. 4. х2 + 2ху — у2 — 6а: + 4г/ - 3 *= 0. 5. х2 + 'дку + 2у2 + 2л + 5^ - 3 =0.
§ 21 ИНВАРИАНТЫ КРИВОЙ ВТОРОГО ПОРЯДКА 215 6. х*-2ху + у2 + 4х-6у+\ = 0. 7. *2 + 4ху + 4у2 — 2х — 4у — 3 =0. 8. х2 + 4ху + 41/2 — 2* — 4у + 1 = 0. 9. *2 + 4*(/ + 4#2 + 2х + 4у + 2 =0. Решение. 3 -1 — 1 | = 8 > 0; это —кривая эллиптического типа. Так как 3 —1 II Д = ==-3^0, то кривая не распадается. Поскольку 5 = 3 + 3 = 6 и 5Д = — 18 < < 0, то кривая представляет собой эллипс. Далее, ф(Я) = X2 — 5^ + 6 = А,2-6А, + 8 К = 3± 1, Я-1 = 4, А,2 = 2. 0, Каноническое уравнение кривой /2 . п„'2 3 32 16 4х" + 2у"--%- = 0, или — х'* + — у'2 полуоси этого эллипса Уз Уз 2. 6 = 3 — II I— 1 = 8>0; кривая эллиптического типа. Здесь 3 - 1 Д = ' 1 3 —2 1 —2 2 = 5=^0; кривая не распадается. Так как 5 «= 6 и $Д — 30 > 0, то это —«мни- мый эллипс» («пустое множество» точек). 1 01 3. 6- кривая эллиптического типа. Д = 0 1 = 1 >0; 1 0 1 0 1 0 1 0 1 = 0.
216 КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [ГЛ. VII Эта кривая, уравнение которой можно записать в виде (* + 1J + !/2 = 0, представляет собой точку х = — 1, у = 0 (ее можно также понимать как пару пересекающихся в этой точке «мнимых прямых» х + {у + 1 = 0 и * — а/ + 1 = 0). II 4. 6 = = - 2 < 0; кривая гиперболического типа. Поскольку 1 1 -3 Д = ' 1 -1 •3 2 = -1*0, то это — гипербола. Далее, 5==0, 6 = -2 и ф(Х) = Яа-2; ^ = 1/2, Х2 = -1/2. Каноническое уравнение кривой Уйх'2 — У2у'2 + -2 = 0, или 2 У2/2 _ 2 ~]/2х'2 = 1; полуоси этой гиперболы а = 6 « 0,6. 6 = 4 • 1 = ~ -г < 0; кривая гиперболического типа. Здесь А = 1 4 ¦ 2 2 2 1 -3 = 0 и, значит, кривая распадается на пару пересекающихся прямых. Следовательно, левая часть уравнения кривой распадается на два линейных множителя. Чтобы найти эти множители, можно поступить, например, следующим образом. Уравнение х2 + Ъху + 2у2 + 2х + Ъу -3 = х2 + C</ + 2)х + 2*/2 + 5(/-3 = 0 решим относительно х (так как уже известно, что левая часть уравнения распадаегся на линейные множители, то х будет рационально
§2] ИНВАРИАНТЫ КРИВОЙ ВТОРОГО ПОРЯДКА 217 выражаться через у): ¦(-Г^+,)±("Г^2)' х, = -(/-3, х2 = —2у+\. Левая часть уравнения распадается, следовательно, на множители: (х 4* У + 3) (х + 2у — 1) = 0, и кривая распадается на пару прямых: д: -Н I/ + 3 = 0 и а: 4- 2// — 1=0. е. *= _1 1 = 0; кривая параболического типа. Так-как 1—12 А = | — 1 1 -3 2 —3 1 = -1*0, то это — парабола. Далее, 5 = 2, 6 = 0 и ф(Х)=12 —2Х, ^ = 0, Я2 = 2, &! = +]/у. Каноническое уравнение кривой: 2/2 ± Т/2? = 0, или у'2=±-т= х\ 7, 6 = 1 2 2 4 = 0; кривая параболического типа. Далее 1 2 Д = ' 2 -1 4 -2 2 -3 0, эта кривая распадается на пару параллельных прямых: х + 2у + 1 = 0, * + 2у — 3 = 0. И 21 8. 2 4 = 0; кривая параболического типа. Здесь 1 2 -1 Д = ' 4 -2 2 1 = 0,
218 КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [ГЛ. VII и наша кривая состоит из двух совпавших прямых: Пх,у) = (х + 2у-.\)* = 0, * + 2у-1=0, II 2| 2- 4 = 0; кривая параболического типа. Здесь ,! 2 1 2 4 2 1 2 2 = 0; эта кривая представляет собой «пустое множество» точек. (Ее уравнение можно переписать так: !(х, У) = (х + 2у+\)>+1=(х + 2у+1 + 1)(х + 2у+1-1) =0, говорят поэтому, что она представляет собой «пару параллельных мнимых прямых»). § 3. Определение центра и главных осей центральной кривой. Отыскание вершины и оси параболы В этом параграфе мы будем предполагать, что Д Ф 0, т. е. что кривая не распадается на пару прямых. Пусть дано общее уравнение второго порядка A). Найдем собственные значения к\, Х2 матрицы D) и соответствующие им собственные векторы еи е2. Мы знаем, что в базисе, образованном этими векторами, квадратичная форма а,цх2 + 2а{2ху-\-а22у2 приводится к сумме квадратов к\х'2 + \2уп-, а уравнение A) — к виду F), Собственные векторы е1 и е2 матрицы D) находятся, как известно, из систем уравнений |@11 - К) *1 + ЯцЦх = 0, Ийп - Х2) Х2 + а12у2 = 0, 1ад + (<*22 — К) Ух = о и 1^12^2 + (аг% - К) \)г = о, каждая из которых, поскольку ее определитель *11 12 *12 *22 - \ /=1, 2, равен нулю, сводится к одному уравнению, например, (яц — к\)х\ + аХ2у\ = 0 для первой системы; (а\х — Х2)х2 + а\2у2 = 0 для второй системы.
§ 3] ОПРЕДЕЛЕНИЕ НОВОЙ СИСТЕМЫ КООРДИНАТ 219 Следовательно, для ег = (х1>у1) имеем х+ а для е2 = (х2у у2) Ч~ а12 Таким образом, угловые коэффициенты новых осей координат в старой системе равны (для новой оси ху соответствующей к\) и К2 == Я1 - в11 ап (для новой оси у, соответствующей Я2). В дальнейшем достаточно, как мы видели, лишь переноса начала координат для того, чтобы уравнение кривой привелось к каноническому виду; следовательно, кх и к2 определяют направления главных осей кривой A). Предположим, что мы рассматриваем центральную кривую второго порядка, т. е. что б =т^= 0. Для того чтобы найти центр кривой, т. е. начало ноьой системы координат, воспользуемся следующим элементарным соображением. Мы уже видели, что если, не меняя направлений осей, перенести начало координат в точку (а, &), т. е. если положить х = х' + а, у = у' + р, то уравнение A) приведется к виду апх,Ч2а12^Ча22у,2+/л(а,р)хЧ/;(а,Р)уЧ/(а,р)=0. Рассмотрим систему уравнений ¦ -о-/х (х, У) = <*пх + <*иУ + 01 = 0, 1 , <15) к " 1у (*» У) = ЯцХ + а22у + а.г = 0. Так как ее определитель б, по предположению, не равен нулю, то она имеет (единственное) решение а, р.
220 КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА (ГЛ. VI! Если перенести начало координат в точку (а, [}), то в уравнении кривой исчезнут члены с первыми степенями х', у\ и значит, новое начало координат будет центром кривой. Таким образом, центр центральной кривой второго порядка (эллипса и гиперболы) определяется из системы уравнений A5). Рассмотрим теперь нецентральную кривую второго порядка (при 6 = 0). Так как мы условились, что А ф 0, то это — парабола. Собственные значения матрицы D) пусть будут \\ — 0 и А,2; направления новых осей определяются по-прежнему: йх = -± ±1 = и (для оси Ох., соответствующей А,х = 0) И к2 = — - (для оси Оу\ соответствующей А,2). °12 Новое начало координат, т. е. вершину (а, р) параболы, можно найти следующим образом. Для параболы, заданной каноническим уравнением у2 = 2рх, ось Оу служит касательной в вершине. Новая ось Оу в старых координатных осях имеет угловой коэффициечт ^9 аЛ 1 т* к2 = -^ ^.Так как она служит касательной к параболе в ее вершине (а, A), то к2 должно равняться производной Ух в этой точке. Чтобы найти у'х, продифференцируем уравнение A) по ху считая у функцией от х\ мы получим I* (*. У) + /у (х, у) Ух = 0, или, подробнее, (апх + а12у + ах) + (а12х + а22у + а2) ух = 0, откуда > ^пх + а12у + а{ Ух а12х + а22У + а2 ' Следовательно, в вершине (а, р) параболы ап*+ <*„* +а, откуда (Яна + а12р + а{) + к2{а 2а + а22Ц + а2) = 0,
§ 4) ИССЛЕДОВАНИЕ УРАВНЕНИЯ ПОВЕРХНОСТИ 221 или, короче, /«(а,Р) + *^(«.Р) = 0. Таким образом, координаты вершины (а, р) параболы можно найти, решив систему уравнений, состоящую из уравнения Г'х(х9у)+1ьГу(х9у) = 0 A6) и уравнения A) Выясним геометрический смысл уравнения A6), в более подробной записи имеющего вид (ацх + а12у + а\) + к2(а{2х + а22у + а2) = 0. Это —прямая, принадлежащая пучку, который определяется прямыми й\\Х + ах2у + а\ = 0 и а^* + а22у + а2 = 0. Угловые коэффициенты и - этих прямых равны между собой, так как б = 0, и равны к\\ следовательно, эти прямые параллельны новой оси Ох. Значит, и принадлежащая определяемому ими пучку прямая A6) тоже параллельна новой оси Ох. Но так как она проходит через вершину, то это — ось симметрии параболы, ее главный диаметр. § 4. Исследование общего уравнения поверхности второго порядка В этом параграфе мы будем заниматься только приведением общего уравнения поверхности второго порядка к каноническому виду. Пусть в прямоугольной декартовой системе координат в пространстве задано уравнение /(*, У, г)= апх2 + 2а12ху + а22у2 + 2а13хг + 2а2гуг + аз3г2 + 2а1х + + 2а2у + 2агг + а = 0. A7) Рассмотрим квадратичную форму от трех переменных: апх2 + 2а12ху + а22у2 + 2ахгхг + 2а2Ъуг + аъьг2. В некотором, тоже ортонормированном базисе она приводится к сумме квадратов: М'2 + ^у + \&'\
222 КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [ГЛ. VII При этом уравнение A7) приводится к виду их'2 + %2у'2 + иг'2 + 2Ь1х/ + 2Ь2у' + 2Ь3г' + 6 = 0 Здесь возможны три случая: I. Все А,< отличны от нуля. II. Одно из Хг равно нулю. III. Два из X* равны нулю. Рассмотрим каждый из этих случаев отдельно. I. АДгХз Ф 0. Точно таким же образом, как и в случае кривой второго порядка, можно избавиться от членов первой степени: Ч*'+^)а+Ч*' + ^J+Чг'+4;J+с=0- Сделав подстановку А>1 Л2 Л'З т. е. выполнив некоторый параллельный перенос осей координат, мы получим уравнение их + иу + иг + с = о. Это — уравнение центральной поверхности второго порядка (новое начало координат является ее центром). Будем считать, что с ^ 0 (в противном случае умножим уравнение на —1). При с<0 возможны следующие случаи: 1. и > 0, и > 0, и > О — эллипсоид. 2. и > 0, и > 0, А,3 < 0 — однополостный гиперболоид. 3. Х\ > 0, и < 0, и < 0 — дву по постный гиперболоид. 4. и < 0, Х2 < 0, и < 0 —- «пустое множество» точек (его называют также «мнимым эллипсоидом»). Если с = 0 и все А,< одного знака, получается точка («мнимый конус»); при с = 0 и и разных знаков — конус. II. Один из коэффициентов А,* равен нулю; пусть, например, и = 0. Тогда соответствующим переносом начала координат уравнение поверхности можно привести к виду их + иу + 2Ъъг" + 6 = 0. A8) Здесь возможны случаи 63 = 0 и 63 Ф 0. При 63 = 0 уравнение A8) имеет вид их + иу + б = о. Это — уравнение цилиндрической поверхности, вид которой определяется ее направляющей их + иу + Ь = 0 в плоскости х О'у" (эллиптический цилиндр, гиперболический цилиндр, пара пересекаю- щихся плоскостей, одна прямая, или пара «мнимых плоскостей», пересекающихся по вещественной прямой, «пустое множество» точек, или «мнимый эллиптический цилиндр»). При 63 ф 0 уравнение A8) приводится к виду их + иу + 2Ьъг" = 0.
§ 4] ИССЛЕДОВАНИЕ УРАВНЕНИЯ ПОВЕРХНОСТИ 223 Если Х\%2 > 0, это — эллиптический параболоид, при АД2 < О — гиперболический параболоид. III. Среди чисел Я< два равны нулю, пусть, например, Хг = 0 и Х3 = 0. Уравнение A7) приводится к виду Я,,х'2 + 262*/' + 263г' + 6 = 0. A9) Если 62 = 0 и 63 = 0 — это пара параллельных плоскостей, раз- личных при Х\Ь < 0, совпадающих при 6 = 0 и «мнимых» при ^6 > 0. Наконец, если хотя бы один из коэффициентов 62, 63 уравнения A9) отличен от нуля, положим Ь&" + Ь3г" ЪъУ" - Ь2г" Уь\ + ь\9 Уь\ + ь\* что, как легко видеть, отвечает переходу к новому (тоже ортонорми- рованному) базису с матрицей перехода 0 «2 °з — Ь2 Уь\+Ь\ Уь\+Ь\ При этом уравнение A9) преобразуется в Ьх" + 2 ]Д* + Ь\у" + 6 = 0, а это последнее уравнение, так как у Ь\ + Ъ^фЪ, посредством переноса начала координат преобразуется в Ь1Х"* + 2 уь\ + Ь*р" = 0. Это — параболический цилиндр. Заметим без доказательства, что, как и в случае кривой второго порядка, при преобразовании уравнения поверхности второго порядка можно использовать инварианты. Здесь это будут &1 = «11 +Я22 + < «11 012 I °П а™ I I «12 «22 1 I «13 «33 I «22 «23 «23 «3 3 I 6 = «И «12 «13 «12 «22 «23 «13 «23 «33 (с точностью до знаков — это коэффициенты характеристического
224 КРИВЫЕ И ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА [ГЛ. VII [«и «12 «13 ~|\ «12 «22 «23 I I и определитель «13 «23 «33 _]/ |«11 «12 «13 «1| д «12 «22 «23 «2 «13 «23 «33 «3 Г \а1 а2 а3 а \ Уравнение центральной поверхности приводится к виду ^2 + ЛаУ2 + Ьз22+4- = °- Определитель Д обращается в нуль в том и только в том случае, если поверхность является конической иди цилиндрической (в частности, распадается на пару плоскостей — различных, совпадающих или «мнимых»).
ГЛАВА VIII ПОНЯТИЕ О ТЕНЗОРАХ В этой главе пространство К предполагается вещественным. § 1. Примеры тензоров Прежде чем дать общее определение тензора, рассмотрим несколько примеров. 1. Линейный функционал. Пусть 1(х) —линейный функционал (§ 1 главы V) в п-мерном векторном пространстве /?. Выберем в Й базис еи е2, ..., еп и пусть х = хх в\ + х2е2 + ,.. + хпеп — произвольный вектор из /?. (Номера координат мы условимся теперь писать сверху; целесообразность этого будет видна из дальнейшего.) Тогда 1(х) = аххх + а2х2 + ... + апхп, A) где а{ = 1(е{). Перейдем к новому базису е'и еъ ..., еп и пусть новые базисные векторы получаются из старых по формулам е\ = с\ех + с!е2 + ... + сп{еп = 2 о\еч. к=1 B) В матрице перехода С = 1_П ^2 • • С" C) мы условимся теперь обозначать номер строки — верхним индексом, а номер столбца — нижним. Пусть в 8 Л. И. Головина
226 ПОНЯТИЕ О ТЕНЗОРАХ [ГЛ. VIII п новом базисе х= 2 х'%е'и тогда 1=1 где а\ = / (е\) = / ( 2 &к) = 2 с\1 (ек) = 2 <&*. D) \А=1 / Ь=1 А=1 Таким образом, линейный функционал 1(х) в каждом базисе определяется строкой из п чисел аь а2, ..., ап, причем при переходе к новому базису эти числа преобразуются по формулам D), т. е. точно так же, как базисные векторы B). Примем теперь для сокращения записей следующее соглашение (правило Эйнштейна): если в каком-нибудь выражении один и тот же индекс, скажем х, встречается дважды, один раз наверху и один раз внизу, то имеется в виду, что по этому индексу производится Суммировать ние (в пределах 1=1,2,...; я), а знак суммы 2 в этом 1=1 случае опускается. Так, например, по определению, сЪъ = 2 <&*, № = 2 №, ьЫ = 2 ъ\Ч, и т. п. Ь=1 1=1 г=1 В этих обозначениях равенство B) можно переписать так: ' к е% = С\е^ равенство A) — так: Цх) = а{х\ а равенство D) —так: Аналогично, если в одном и том же выражении имеются по две или более пар одинаковых индексов (каждый из которых стоит один раз наверху и один раз внизу), то мы также всегда будем считать, что по этим индексам производится суммирование, причем все эти ин«
§11 ПРИМЕРЫ ТЕНЗОРОВ 227 дексы независимо друг от друга пробегают значения 1, 2, ..., п. Так, например, п п йтОгр= 2л ЯтОгр, а^р^ = 2^ ^гр;, И Т. П. г,т=1 г,.7=1 2. Вектор. В заданном базисе еь е2, ..., ея каждый вектор х представляется строкой из п чисел (х\ х2у ..., хп) — его координат. В новом базисе в\, е2у ..., еп тот же вектор представляется другой строкой (хп, х'2у ..., #/п), причем если C) — матрица перехода от первого базиса ко второму, то, как было показано в § 6 главы II, хк = с)х'\ E) Это —выражение старых координат через новые. Выразим отсюда новые координаты хп через старые х\ Пусть С1 = [ЬЪ] — матрица, обратная матрице перехода С. Тогда равенство СС-1*=С-1С = Е равносильно тому, что г к г к П > еСЛИ ' = /» С^ = ь^'=@( если 1фи Положим б- = П если * = /, ] (О, если *=^=/ (так называемый символ Кронекера). Тогда ^6* = Ъ\с) = б]. Умножив обе части равенства E) на Ь1 (и, естественно, суммируя по к), мы получим Ь\хк = Ъ\с)х" = б}*" = хи (так как б] = 0 при 1ф\ и б! = 1), или х'{ = &и\ Таким образом, новые координаты хп вектора х получаются из старых его координат х1 с помощью матрицы С"\ обратной матрице перехода С, причем
228 ПОНЯТИЕ О ТЕНЗОРАХ [ГЛ. VIII коэффициенты разложений хп по х* образуют строки матрицы С*1. В двух рассмотренных примерах (линейный функционал, вектор) есть нечто общее, позволяющее заключить их в рамки общего определения. И линейный функционал, и вектор в каждом базисе определяются п числами, соответственно а\> а2, ..., ап и х\ х2, ..., хп, причем при переходе к новому базису эти числа преобразуются линейно — с матрицей С, т. е. т а к же, как базисные векторы, в случае линейного функционала, и с матрицей С-1, обратной матрице С,— в случае вектора. Коэффициенты линейной формы (так же, как координаты вектора) представляют собой пример тензора, если назвать тензором заданную в каждом базисе систему чисел, линейно преобразующихся при переходе от одного базиса к другому. Точное определение этого понятия будет дано ниже; пока же мы только еще добавим, что оба рассмотренных тензора являются одновалентными, так как определяются системами чисел аь а2, ..., ап или хх, х2, ..., хпу зависящими от одного индекса. Коэффициенты линейной формы при переходе к новому базису, преобразующиеся так же, как базисные векторы, образуют тензор ковариантный, т. е. «со- преобразующийся»—преобразующийся одинаково с базисными векторами. Координаты вектора —пример кон- тр ав а р и а нт н о г о, т. е. «противопреобразующегося» тензора. Рассмотрим еще три примера. 3. Билинейный функционал. Пусть в /г-мерном векторном пространстве /? задан билинейный функционал А (х> У) (§ 1 главы VI). Тогда, если х = х*е{ и у = укек — произвольные векторы из /?, то А (х, у) = Л (х*еи укек) = х'укА (еи ек) = а{кх*у\ где а1к —А(еи ек): в заданном базисе еи е2, ..., еп билинейный функционал А(х, у) представляется билинейной формой а{кх{ук (по I и по к суммирование!) от координат векторов х и у с коэффициентами а{к (ср. стр. 188) Перейдем к новому базису еи е'2, ...,еп с матрицей перехода C). Тогда, если х = х'1е\ иу = у*ке'к, то А (х, у) = А (х'Уь у'%) = х'УМ (г!, ек) = <4*'<гД F)
§1] ПРИМЕРЫ ТЕНЗОРОВ 229 где а\к = А (е'и ек) = А (с\е^ сКкен) = с\с\А (е}, ен) = с\ска* G) (ср. стр. 189). Таким образом, билинейный функционал А(х, у) в каждом базисе определяется системой из п2 чисел агА, зависящих от двух индексов, причем при переходе к новому базису эти числа преобразуются по закону G), т. е. по каждому из этих двух индексов так же, как базисные векторы. Это — пример тензора валентности два (зависящего от двух индексов), ков ар и- антного по обоим индексам (дважды ковариант- ного). 4. Линейный оператор. Каждый линейный оператор зФ в /1-мерном векторном пространстве /? в заданном базисе еи е2, ..., еп представляется матрицей Л = = [я1] (здесь опять верхний индекс — номер строки, нижний — номер столбца). При переходе к новому базису е[9 еъ ..., е'и с матрицей перехода С эта матрица А преобразуется в С~ХАС (§ 4 главы III). Вспомним, как выражаются элементы а'к матрицы С~1АС через элементы ак матрицы А. В матрице АС элемент р-й строки и й-го столбца равен а]ск. В матрице С~1АС элемент 1-й строки и к-го столбца — это Ьра?ск, т. е. ак = Ь1раН = с{ь\д1 (8) Таким образом, линейный оператор зФ в каждом базисе определяется системой из п2 чисел а{ку занумерованных двумя индексами, нижним и верхним, причем при переходе к новому базису эти числа преобразуются по формуле (8) — по нижнему индексу, так же как базисные векторы, а по верхнему —с обратной матрицей, «контраваряантно» базисным векторам. Это — еще один пример тензора валентности два (зависящего от двух индексов), в этом случае один раз ковариант- ногой один раз контравариантного (смешанный двухвалентный тензор). 5. Символ Кронекера. Рассмотрим смешанный двухвалентный тензор, координаты которого в некотором
230 ПОНЯТИЕ О ТЕНЗОРАХ [ГЛ. VIII фиксированном базисе еи ^ ..., еп определяются равенствами в1A. если * = /. ; (О, если I Ф \ (см. стр. 227). В новом базисе еъ е2, ..., еп имеем 6'/ = с]Ъ\Ь1 = с% = б). Таким образом, координаты тензора 6) одинаковы во всех системах координат. (Это можно объяснить тем, что в первоначальном базисе еи е2, ..., еп элементы Ь\ составляют единичную матрицу, и значит, соответствующий тензор определяет тождественное преобразование, матрица которого — одна и та же во всех базисах). § 2. Определение и простейшие свойства тензоров Пусть в п-мерном векторном пространстве Я в каждом базисе задана система из пр+я чисел Д^''.'.*? (занумерованных р нижними и ц верхними индексами, которые независимо друг от друга пробегают значения 1, 2, ..., п)\ предположим, что при переходе к новому базису с матрицей перехода C) эти числа преобразуются по закону <!::%=«Ы-. • ¦ • о%ьЫ\ • •. *Х<Ь> ® Тогда мы говорим, что имеем {р -\- ц)-валентный тензор, р раз ковариантный и ц раз контравари- антный. Числа ах^"Л5 называются координатами тензора. Скаляр, т. е. величину, во всех системах координат имеющую одно и то же значение, можно рассматривать как тензор нулевой валентности. Ясно, что если координаты двух тензоров одинаково- го строения (т. е. таких, у которых одинаковы числа ко- и контравариантных индексов) совпадают в одном ка* ком-нибудь базисе, то они совпадают и во всех остальных (и значит, эти тензоры равны), так как при пере-
$ 2] ОПРЕДЕЛЕНИЕ И ПРОСТЕЙШИЕ СВОЙСТВА ТЕНЗОРОВ 231 ходе к новому базису координаты обоих тензоров преобразуются одинаково. Поэтому для того, чтобы задать тензор данного строения, достаточно задать его координаты в какой-нибудь одной системе координат. А это можно сделать без каких-либо ограничений: в качестве координат тензора в данном базисе можно выбрать совершенно произвольные числа. Действительно, пусть в базисе еи е2, ..., еп произвольно заданы лр+9 чисел ак1н»..кр Тогда координаты соответствующего тензора в любом другом базисе найдутся по формуле (9), и нам остается только проверить, что при переходе от любого базисаеи е2,...,епк любому другому базису е1/ъ> • • • Упкоординаты полученного тензора тоже преобразуются по формуле (9). Покажем это на примере трехвалентного тензора ак3. Пусть при переходе от базиса еи е2, ..., еп к базису е\% е2 еп имеем (Ю) *; = '?Чп> а при переходе от базиса еи е2, ..., еп к базису ег, е2, ..., еп — е\=сЧек. (И) Из равенства A0) получаем *& = Ф?в» = в*е» = в*. A2) а из равенства A1) — ^т<^^К = бт^=^ A3) Здесь матрица '[&*] — обратная к матрице [с^, а матрица [#д] — обратная к \с\\- Из равенств A1) и A2) следует, что а из равенств A0) и A3) —что 4 = <?««=<№!=/& ™е ^с?Ъ1- Таким образом, матрицей перехода от базиса.*р е'2, ...,еп к базису ех, е2, ..., еп будет матрица
232 ПОНЯТИЕ О ТЕНЗОРАХ [ГЛ. VIII а обратный к ней - матрица Ш = №11 Мы имеем Из равенства A4) получаем = КО №) {'№ <' = «№«&' = „л". Подставляя это значение а™ в равенство A5), будем иметь «? -эд. ад^- сэд (ад) №) *;Р9-^ж^ т. е. формулы преобразования координат тензора при переходе от базиса е1$ е2, ..., еп к базисуех, е2, ..., еп имеют в точности такое строение, какое требуется. В общем случае доказательство аналогично. Из сказанного вытекает, что если, например, хх — произвольный одновалентный контравариантный тензор, то его можно рассматривать как совокупность координат некоторого вектора. Действительно, если в одном каком-нибудь базисе е\, е^ ..., еп взять вектор с координатами хх, х2, ..., хп, то и во всех остальных базисах координаты этого вектора и заданного тензора совпадут. Точно так же каждый дважды ковариантный тензор ац можно рассматривать, как совокупность коэффициентов некоторой билинейной формы, а каждый смешанный двухвалентный тензор а}— как совокупность элементов матрицы некоторого линейного оператора, и т. д. Тензор, координаты которого не меняют своего значения при транспозиции любых двух индексов из данного множества индексов г, \, ..., т (причем все эти индексы— только верхние или только нижние), называет- ся симметрическим по этим индексам. Примером симметрического тензора может служить совокупность коэффициентов симметрической билинейной формы.
§3] ОПЕРАЦИИ НАД ТЕНЗОРАМИ 233 Свойство тензора быть симметрическим не зависит от выбора базиса Рассмотрим, например, трехвалентный тензор ац, и пусть в базисе еи ^2, ..., #п Тогда в базисе еи е2, ..., еп аи в СгСэЬга81 и а;.. = с^сфга81. Заменяя во втором равенстве а^ на а[3, найдем, что я^ = о^сфта^ Но сумма не зависит от обозначения индекса, по которому производится суммирование; поэтому, заменяя 5 на /, а I на 5, получим Я;г = 0зСфга$1« а^.. Кососимметрическим. по данным индексам I, ],»>и т (только верхним или только нижним) называется тензор, координаты которого а^{*"л<* изменяют знак при любой транспозиции индексов из выделенной группы (не меняясь при этом по абсолютной величине). Свойство тензора быть кососимметрическим по данной группе индексов тоже не зависит от выбора базиса. Примером кососимметрического тензора может служить кососимметрическая билинейная форма. § 3. Операции над тензорами 1. Сложение. Пусть даны два тензора одинакового строения Д^..** и ^м.'".** " сумма пх в каждой системе координат определяется равенством «1Й|...Др Я1Д«...Ар ' «!««...Яр Легко видеть, что сумма двух тензоров будет тензором такого же строения. 2. Умножение. Пусть даны два тензора «1*1... Ар 3^»"^8
234 ПОНЯТИЕ О ТЕНЗОРАХ (ГЛ. VIII какого угодно строения. Произведение их в каждом базисе определяется как совокупность ПР + Я+'+г ЧИсел Лx^^..Л^тxт^...т^ __ ^^^^^...^^~т^т^...т^ * кхк%...крнэ%..-]в кхк%...кр ]\н>..зв Покажем, что произведение двух тензоров — тоже тензор (в нашем случае валентности р + 9 + >* + 5, р + з раз ковариантный и? + г раз контравариантный). Действительно, в новом базисе и а:41*1'"*** = сЫ\... сг*ьЫ: • • • ьУ;1.*'1? «!«!...кр К* Н* кр 1» *» 1д 1x1%. .Лр НЭг<-'Э8 Зх 3% 3$ 8х ё% 8Г П1к,...к8> поэтому. ег1хгг.*Л<рпхт1...тг__ ^/{1гя...{^~/т1тв...тг = ' к1кг...кр]1]%...}8 кхкш...кр Л;*...;8 гггс^г!1 с1Рс*1с** сН8Ъ\хЬ\% Ъ{яЬтхЪт% Ьтг V 1x1%.. Лр ПхПм..Л8 = <& • • • 4Р4' • • • снМ[... ь\яь%... ъ?№"л??гш':. к* кр Зх ;8 *1 1Я Их вг'/4Г,...<рЛаЛ1...Лв Умножение тензоров не коммутативно. Рассмотрим, например, произведение двух одновалентных ковариант- ных тензоров при п = 2. Координаты одного: й! и а2> координаты другого: Ъ\ и 62- Произведение с{к = афк— дважды ковариантный тензор, координаты которого сп == афи С\2 = ахЬ2у с2Х = а2Ьх, с22 = ^2^2- Произведение тех же тензоров в обратном порядке — дважды ковариантный тензор с координатами й1к = Ь{ак: ап = Ъхах = ахЬх( = схх), йХ2 — Ьха2 = а2Ъх{ = с2Х), а21 = Ъ2ах = а^М^ с12), б?22 = Мг = а2Ь2(= с22)щ Он, вообще говоря, отличен от первого. Так как скаляр, т. е. величина, во всех системах координат имеющая одно и то же значение, является тензором нулевой валентности, то при умножении тензора на скаляр (т е. при умножении всех координат тензора на этот скаляр) получается тензор того же строения.
$3] ОПЕРАЦИИ НАД ТЕНЗОРАМИ 235 Вычитание тензоров одинакового строения сводится к умножению вычитаемого на — 1 и сложению (при этом получается, очевидно, тензор того же строения). 3. Свертывание тензоров. Эта специфическая для тензоров операция определяется следующим образом. Пусть дан, например, тензор а1тРЯ. Выделим в нем два какие- нибудь индекса, например, / и р (один наверху, другой внизу), отберем среди всех координат тензора те, у которых эти индексы одинаковы, и сложим их все. Мы получим Ъ' И , 12 , • пгп 11 ь*т;'д — "гщд "т~ "тп2д ~Г • • • "т "тапя — 0т^ — свертку тензора а1тРд по индексам ] и р. Так, например, тензор а)к при п = 2 имеет восемь КООрДИНаТ &ш 012,021,022» а11» а12» а2Ь а22- СверТЫВЭЯ ЭТОТ тензор по индексам I и /, будем иметь а\ь + а1к = Ьк, или, подробнее: Ьх = а\х + а\ъ Ь2 = а{2 + 022- Свертывая тот же тензор по индексам * и ку получим й)х = си т. е. С\ = 011 + 0?2, С2 = а\Х + 022- Покажем, что в результате свертывания тензора получается снова тензор, имеющий на один нижний и на один верхний индекс меньше, чем исходный тензор. Произведем, например, свертывание тензора а^щ по индексам / и р. Пусть а%я = Ь{тя. В новом базисе координаты исходного тензора имеют вид а'Ля = &&№<& Выбрав координаты, у которых Р = \, и просуммировав по / = 1, 2, ..., п, получим Ь'^ = а%ч = сгтс)с[ь\ьи&. Но с]Ы = бл, а блаЙ = йгм = Ь*. Следовательно, В общем случае доказательство аналогично.
236 ПОНЯТИЕ О ТЕНЗОРАХ [ГЛ. VIII Операция свертывания может быть применена к тензору и несколько раз. Так, например, свертывая тензор а$г при п = 2 по индексам * и ц и по индексам к и р, получим тензор а/ = а|#, или, подробнее: п1 лШ I х,211 I „112 _. „212 „I __ „111 \ „211 \ „112 I ,,212 а1 — 11 Т" 21 "Г 11 "Т "Ш» а2 — 12 "Г 22 Т" 12 "Г 22» ^2 „121 | „221 I ^122 • ~222 ~2 „121 | „221 I „122 ! ,,222 а1 — 11 "Т 21 "Т 11 "Г 21» а2 — 12 "Г 22 "Т 12 Т~ 22* При р-кратном свертывании тензора р раз ко- и р раз контравариантного получается, очевидно, инвар и- ант, или скаляр,—величина, не зависящая от выбора базиса. Это—один из способов получения численных инвариантов. Так, при свертывании тензора а), определяющего линейный оператор Л, получаем инвариант а\, называемый следом оператора (след а\—это сумма элементов главной диагонали матрицы А\ его инвариантность мы уже установили в § 8 главы III: а$—это коэффициент при №~х характеристического многочлена оператора Л). Особенно часто операция свертывания применяется по отношению к произведению двух тензоров—по индексам, взятым в разных сомножителях. Если произведение тензоров а) и $,т свертывается по индексам / и Л, мы будем говорить короче, что тензоры а/ и Р/Р1 свертываются по индексам \ и Н. Так, например, при свертывании тензора а{ (определяющего линейный функционал /(*)) с вектором х = (х1, х2, ..¦, хп) получается скаляр а{х1, равный, очевидно, }(х). При двукратном свертывании тензора аи, определяющего билинейный функционал А (х, у) с парой векторов х = (хг, х2, ..., хп) и у = (у1, у2, ..¦,*/"), получается скаляр аих1у*, равный значению функционала А (х, у) для данных векторов х и у. При свертывании тензора а), определяющего линейный оператор Л с вектором х = (х1, х2, ..., хп), получается контравариантный тензор у*=а)х*. Как следует из § 1 главы III, это—заданный своими координатами у1 преобразованный вектор Лх. Пусть даны два тензора а\ и Ь$, определяющие соответственно линейные операторы Л и $. Свертка их
§ 4] ТЕНЗОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 237 по индексам / и Л —смешанный двухвалентный тензор а)Ъ?ь, тоже определяющий, следовательно, некоторый линейный оператор 2). Легко видеть, что оператор 3) равен произведению зФЗИ операторов $$> и $ (в смысле § 2 главы III). Свертка а)Ъ\ тех же тензоров по индексам *' и к соответствует произведению ЗЗдб тех же операторов в обратном порядке. 4. Симметрирование и альтернирование тензора. ПустьА{х{%..лк— произвольный тензор, у которого выделены какие-то к индексов 1и 12, ..., 1к — все только верхние или только нижние. Тогда тензор ('«•«« *к) где, суммирование распространено по всевозможным перестановкам 1\9 12> . • •> и выделенных индексов, будет, очевидно, симметрическим, а тензор — кососимметрическим. Операции получения тензоров Л(М1-"*а) и ^4«'»...«д1 из данного тензора Л^,...^ называются соответственно симметрированием и альтернированием тензораАм9..лкпо индексам *ь *2> ..., **• Так, на стр. 191 билинейный функционал В(х, у) был получен симметрированием, а С(х, у)—альтернированием билинейного функционала А(х, у). § 4. Тензоры в евклидовом пространстве Пусть теперь /?—-п-мерное евклидово пространство. Конечно, все, что говорилось о тензорах в произвольном векторном пространстве, распространяется и на этот случай. Но тензоры в евклидовом пространстве обладают еще и некоторыми специфическими свойствами. В евклидовом пространстве /? для любых двух векторов х, у определено их скалярное произведение (х,у), являющееся симметрическим билинейным функционалом. В заданном базисе еи е$, ..., еп оно представляется
238 ПОНЯТИЕ О ТЕНЗОРАХ [ГЛ. VIII симметрической билинейной формой (*, У) = 8*х*У\ где 8хк= (еи ек). Взятые во всех системах координат величины &К образуют, как мы видели в § 1, дважды ко- вариантный тензор, который называется (ковариантным) метрическим тензором пространства /?. Свертка метрического тензора дш с вектором х = (х\ х2> ,.., хк) *< = е** A6) является одновалентным ковариантным тензором. Числа х{ также определяют вектор х, т. е. в некотором смысле тоже являются его координатами; их можно назвать ковариантными координатами вектора х, в отличие от его контравариантных координат х\ Выясним геометрический смысл ковариантных координат. Так как XI = §гкхк = (еи ек)хк = (е„ ек^) = (еи х), то ковариантные координаты х{ — это проекции вектора х на базисные векторы. (Напомним, что контравари- антные координаты вектора х — это коэффициенты его разложения х = х{е{ по базису еи е2, ..., еп.) В ортонормированном базисе П, если 1= &, й*.= <*1,«*) = {0> если 1фК и значит, х{ = х\ т. е. ко- и контравариантные координаты вектора совпадают. Двойная свертка &{кх*ук метрического тензора §{к с векторами х=(х\ х2, ..., хп) иу= (у\ у2, ..., */п) — это скалярное произведение (х, у); двойная свертка §<кх*хк его с вектором х — скалярный квадрат {ху х) вектора х. Определитель \§{к\ матрицы [§{к] отличен от нуля. Действительно, при переходе к новому базису ранг матрицы билинейной формы, в том числе и матрицы [§{к], не меняется. Но в ортонормированном базисе матрица [^—единичная, и ее определитель равен 1; следова-
§4) ТЕНЗОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 239 тельно, и во всех других базисах определитель матрицы [&а] отличен от нуля. Пусть [§*]— матрица, обратная матрице [§гк] в каком-то фиксированном базисе еи е2, ..., еп. Тогда Ё{к8кз = б] при всех /,/=1,2,..., л. Построим дважды контравариантный тензор, координаты которого в базисе еи е2, ..., еп равны #*; тогда координаты этого тензора во всех остальных базисах определятся по формуле (9). В каждом новом базисе еи е2, ..., еп, ввиду тензорного характера операций умножения и свертывания, будем иметь *"**« = V = б], и значит, координаты тензора §л во всех системах координат образуют матрицу, обратную матрице [§{к]. Тензор 8* называется контравариантным метрическим тензором. Переход от контравариантных координат вектора к ковариантным его координатам по формуле A6) можно назвать опусканием индекса. Чтобы поднять индекс, т. е. перейти от ковариантных координат вектора к его контравариантным координатам, умножим обе части равенства A6) на §** (и, конечно, просуммируем по *); мы получим 8нХг = ён8ш*к = Ь'к*к = х>. Операцию опускания или поднятия индекса в евклидовом пространстве (эта операция носит выразительное название жонглирования индексами) можно применить к тензору любого строения. Пусть дан, например, трехвалентный тензор ак\ один раз ковариантный и два раза контравариантный. Свертка его с метрическим тензором 8*$ = 4 A7) будет дважды ковариантным и один раз контравариантным тензором. Свертка 8р)Ь^к = сНк A8) — трижды ковариантным, а наоборот, свертка дра? = &т A9) — трижды контравариантным тензором. Если оба
240 ПОНЯТИЕ О ТЕНЗОРАХ [ГЛ. VII! базиса ей ^2, ..., еп и еи еъ ... ,еп— ортонормированные, то _ и-!1, если (==к9 ё1к-8г -^ если {фк^ и равенства A7) — A9) последовательно дают а% = Ь\к9 Ъ\н = сЯк, а% = й*Ч Таким образом, а[* = Ь{к = сНк = йк1\ В этом случае ко- и контравариантные индексы при переходе к новому базису ведут себя одинаково, и закон преобразования тензора определяется исключительно его валентностью Последнее можно объяснить еще и следующим образом. Если оба базиса е\, е2, ..., еп и еи е2$ ...,еп ортонормированные, то матрица перехода С от первого базиса ко второму ортогональна, т е. С = С Но тогда Ь\=с\— и в формуле (9) для преобразования, например, тензора ак\ а'кгэ = с* &5#Др", можно заменить одно или оба Ь на с, или, наоборот, с заменить на Ь. Так, заменяя Ь\ на с?, получим п Здесь пришлось использовать знак суммы 2» так 9=1 как индекс <7, по которому происходит суммирование, оба раза стоит наверху. Полагая арг = а$р, получим для а^ закон преобразования в виде а'^ = с&Шадр = ся{с%ь1агРЯу т. е. тензор а^ является дважды ковариантным и один раз контравариантным.. Но его координаты в обоих базисах равны соответствующим координатам тензора ак один раз ковариантного и дважды контравариантного. Так, выше (§ 5 главы VI) мы уже видели, что при переходе от одного ортонормированного базиса к другому, тоже ортонормированному, матрица билинейной формы (дважды ковариантный тензор) и матрица линейного преобразования (один раз ковариантный и один раз контравариантный тензор) преобразуются одинаково.
ГЛАВА IX ОСНОВНЫЕ ПОНЯТИЯ СПЕЦИАЛЬНОЙ ТЕОРИИ I ОТНОСИТЕЛЬНОСТИ Содержание настоящей главы — это всего лишь некоторая интерпретация физических законов. Ясно, что сами эти законы нельзя вывести из линейной алгебры. Впрочем, переход от чисто алгебраических рассмотрений (в первых параграфах главы) к физическим эффектам будет довольно плавным. § 1. Двумерные пространства со скалярным произведением Пусть /?—- вещественное векторное пространство, в котором определено скалярное произведение, т. е. каждой паре векторов х, у. из /? поставлено в соответствие (вещественное) число (*, у), так что: 1) (*.») = (».*)¦ 2) (а*, у)=а(х, у), 3) (х + у, г) = (*, г) + (у, г) при всех х, у, г из /? и всех вещественных а. Заметьте, что мы не требуем выполнения условия 4 (стр. 145). Длиной, или модулем, вектора называется корень квадратный из его скалярного квадрата. При этом, вообще говоря, ненулевой вектор может иметь нулевую и даже мнимую длину. (Если (*, х) = — а2 < 0, то, по определению, \х\ — ш, где а > О, а *' = у — 1.) Если в пространстве /? выбран базис, то скалярное произведение представляется симметрической билинейной формой п (X, У) = 2 ёгкХгУк эт координат векторов х и у. Соответствующая квадратичная форма в некотором (вообще говоря, другом)
242 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ ГГЛ. IX базисе приводится к «сумме квадратов» (X, X) = Х\ -\- Хъ -\- ...-{" Хр — Хр+1 — • • • — Хр+Я (§ 2 главы VI). При этом число р положительных и число д отрицательных квадратов являются инвариантами пространства # (закон инерции квадратичных форм, § 3 главы VI) и определяют его тип. Так, для двумерного пространства (плоскости) У? возможны такие значения р и д: 1) 1') 2) 2') 3) Р Р Р Р Р = 2, = 0, = 1, = 0, = 1, Я- Я Я- Я Я = 0; = 2; = 0; = 1; = 1. В случае I) в некотором (ортонормированном) базисе скалярный квадрат произвольного вектора х = Х\в\ + -\-х2е2 равенх\ + х\, и это пространство евклидово. В случае 1') (х, х) = — х\ — х\, и пространство несущественно отличается от евклидова. В случае 2) (или 2'), что почти то же самое) квадратичная форма (х, х) содержит только один квадрат, и в некотором базисе (х, х) = х\ (соответственно — х\). Такая плоскость называется полуевклидовой. Наконец, в случае 3) квадратичная форма (ху х) в некотором базисе приводится к разности квадратов х\ — х\\ такая плоскость называется псевдоевклидовой. § 2. Полуевклидова плоскость Пусть /? — двумерное векторное пространство с полуевклидовой метрикой и в\9 в2— такой его базис, в котором скалярный квадрат (х, х) произвольного вектора х = х\в\ + х2е2 равен х\. Тогда, в частности, {ей ех) = 0, (е2, е2) = 1 и (еЛ +е2, ех + е2) = 1 = (еи ех) + 2{ех е2) + (е2, е2) = = 2(^^ + 1, откуда (еи е2) = 0
§2] ПОЛУЕВКЛИДОВА ПЛОСКОСТЬ 243 (вектор е\ — нулевой длины, вектор е2 — единичный, е{ и е2 ортогональны). Такой базис условимся называть каноническим. Пусть х = Х[в1 + х2е2 и у = ухе\ + у2е2 — произвольные векторы из /?; тогда их скалярное произведение (х, у) равно *\У\(*ь ех) + (хху2 + х2у{) (еи е2) + х2у2(е2у е2) = х2у2, а модуль вектора х равен | х | = У~& = \х2\. Предположим, что ег, е2 — другой, тоже канонический базис в пространстве Я и — матрица перехода от первого базиса ко второму, т. е. что ех = апех + йс11ег и е2 = я^ + я22^2- Тогда (^, ^) = аи = (еь О = О, откуда а2\ = 0 и D, 4) = 022 = (е2, е2) = 1, т. е. 022= ± !• Таким образом, матрица перехода от одного канонического базиса к другому имеет вид 1о ±11 A) Зафиксируем теперь какой-то канонический базис еи е2 и угол между векторами х = х\вх + х2е2 иу = у^ + + У2^2у по определению, положим равным УЛ-Ъ: Ч Х2 B) Так определенный угол, вообще говоря, не инвариантен относительно перехода к новому (даже каноническому) базису. Посмотрим, какие еще ограничения надо наложить на матрицу перехода для того, чтобы
244 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX угол B) не зависел от системы (канонических) координат. При переходе к новому (каноническому) базису с матрицей перехода A) координаты векторов, х и у соответственно преобразуются в Х\ — #11*1 Г #12*2э *2 — ^ *2 И У\ = #11^1 + #12#2, У* = ± У г, причем знаки у х'2 и #2 одинаковы. Тогда угол между векторами хну в новом базисе в силу определения B) должен быть равен I1. у* аиУ1 + апУ2 аПХ1 + аПХ2 ±У2 ± *2 = а, 5 он будет иметь прежнее значение в том и только в том случае, если ап = ± 1. Поэтому, зафиксировав один какой-то канонический базис, мы дальше будем допускать только такие базисы еи е2, матрицы перехода к которым от базиса еи е2 имеют вид [V ±М C) (мы положили а\2 = у). Легко видеть, что если матрица перехода от базиса еи е2 к базису еъ еъ имеет вид C) и матрица перехода от базиса еъ е2 к базису еъ е2 —тоже вида C), то и матрица перехода от базиса еь е2 к базису е"и е\ будет такого же вида. Обозначим через А0 матрицу Тогда, очевидно, А1===[ о 11 = М о \\> Л2==[о -1.1 ^ [о -\\А<» Ав==[ о -1.1 "ЧО -\\А°[ О 1} Рассмотрим теперь двумерное точечно-векторное пространство, в котором расстояние между точками Х(хи х2) и У {уи У2) считается равным модулю век-
§2] ПОЛУЕВКЛИДОВА ПЛОСКОСТЬ 245 тора ХУ = (у1— хи У2 — Х2) в полуевклидовой метрике, т. е. равным \У2 — *2|- Если представить точки полуевклидовой плоскости точками обычной (евклидовой) плоскости с теми же координатами, то \у2 — *2|—это евклидова длина проекции вектора на ось ординат. (В частности, длина любого отрезка, параллельного еи будет равна нулю.) Две точки, расстояние между которыми равно нулю, назовем параллельными, подобно тому как в евклидовой геометрии параллельными называются прямые, угол между которыми равен нулю; тогда параллельные точки —это точки, принадлежащие одной прямой, параллельной вектору е\. * 0 м \ /' Ц) Рис. 17. Окружность радиуса г с центром в данной точке М(аи ссг), т. е. совокупность всех точек, отстоящих от точки М на одно и то же полуевклидово расстояние г,— это пара прямых, параллельных оси абсцисс и отстоящих от данной точки М на (евклидово) расстояние г (рис. 17, а). Центром такой окружности будет также любая точка прямой, проходящей через М и параллельной тем же прямым. Уравнение окружности радиуса г с центром в точке М(аи аг) имеет вид (*2 — а2J = г2. В частности, уравнение «единичной окружности» (окружности радиуса единица) с центром в начале координат имеет вид *; = !.
246 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX Углом между прямыми называется угол между параллельными им векторами. Если х = (|, 1) и у=(ц, 1)—два вектора единичной длины, то угол между ними равен И—Н-1Ч-8; он измеряется той «дугой», которую эти векторы высекают на «единичной окружности» (рис. 17, б). Заметим, что в полуевклидовой метрике смежные углы равны между собой. Действительно, угол между (единичными) векторами (ху 1) и (у, 1) равен \у — х|; смежный угол — между векторами (—х, — 1) и (у, 1) равен Приведем несколько примеров теорем «элементарной полуевклидовой геометрии». Будем называть треугольником фигуру, образованную тремя точками, никакие две из которых не параллельны. Теорема 1. Большая сторона треугольника равна сумме двух других его сторон. Действительно, так как АВ = А'В\ АС = А'С, ВС = В'С (рис. 18, а) и А'В' = А'С + В'С\ то АВ = АС + ВС, или с = а + Ь. Эту теорему можно считать аналогом теоремы косинусов в евклидовой геометрии. Теорема 2. Больший угол треугольника равен сумме двух других его углов. Для доказательства проведем прямую СЕ \\ В А (см. рис. 18, б). Тогда, очевидно, А.АСЕ = Л, а /-ЕСВ = В. Но /-АСЕ + /-ЕСВ = = АЛСО = С и, значит, С = А + В. Теорема 3. Стороны треугольника пропорциональны противолежащим углам. Для доказательства проведем Си \\ в\ (см. рис. 18, в). Тогда „ СО А = -т- (где Си равно модулю разности абсцисс точек В и С — СО евклидовой длине отрезка СО), В — —, значит, А • 6 = = В • а, откуда а ~ Ь ' (Эту теорему можно считать аналогом теоремы синусов евклидовой геометрии.)
14 ПОЛУЕВКЛИДОВА ПЛОСКОСТЬ 247 Из трех последних теорем видна определенная «двойственность» теорем полуевклидовой плоскости, выражающаяся в равноправии сторон и углов треугольника. Если в формулировках этих теорем заменить слово «сторона» словом «угол», и наоборот, то, из теоремы 1 получится теорема 2, а из теоремы 2 — теорема 1; они двойственны друг другу. Теорема 3 двойственна сама себе. 6) е2 О А г: 1^ в \ ,Е 6) в' с' е% А' О С^Г^< / .^^ А , е1 Рис. 18. Такой двойственности нет на обычной, евклидовой плоскости, на которой имеются параллельные прямые (угол между которыми равен нулю), но нет «параллельных точек» (расстояние между которыми равно нулю). Эта «несправедливость» устранена, в полуевклидовой геометрии, где, наряду с параллельными прямыми, имеются и «параллельные точки». Задачи. Докажите, что в полуевклидовой плоскости 1. Отрезок, соединяющий середины боковых сторон (средняя линия) треугольника, параллелен основанию и равен его половине. I7. Точка пересечения биссектрис двух углов треугольника параллельна противолежащей вершине, причем угол между этими биссектрисами равен половине третьего угла треугольника. 2. В равнобедренном треугольнике середина основания параллельна вершине. 2'. В равнобедренном треугольнике биссектриса угла при вершине параллельна основанию 3. Биссектриса треугольника делит противолежащую сторону на части, пропорциональные двум другим сторонам. 3'. Медиана треугольника делит соответствующей угол на части, пропорциональные двум другим углам.
248 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ (ГЛ. IX 4. Медианы треугольника пересекаются в одной точке и делятся в ней в отношении 2:1, считая от вершины. 4' Биссектрисы треугольника пересекают противоположные стороны в трех точках, лежащих на одной прямой. Эта прямая делит каждый угол между стороной и биссектрисой противолежащего угла в отношении 2*1, считая от стороны. (Легко видеть, что утверждения 1 и Г, 2 и 2', и т. д. двойственны друг другу. Им можно дать и двойственные одно другому доказательства.) 5. Сформулируйте свойства параллелограмма и докажите их. 5'. Дайте определение фигуры, двойственной параллелограмму («антипараллелограмм»). Сформулируйте и докажите ее свойства. 6. Сформулируйте и докажите признаки равенства треугольников. 7. Данный угол циркулем и линейкой разделите на п равных частей. 8. Дайте определение центрального угла, вписанного угла. Покажите, что вписанный угол равен половине центрального угла, опирающегося на ту же дугу, и что угол с вершиной вне круга измеряется полуразностью, а угол с вершиной внутри круга — полусуммой дуг, заключенных между его сторонами. Интересна еще одна фигура, родственная окружности евклидовой плоскости и называемая циклом. Она определяется как геометрическое место точек, из которых данный отрезок виден под данным углом (в евклидовой геометрии, как известно, это определение снова приводит к окружности). Можно показать, что цикл полуевкли* довой плоскости в евклидовой плоскости изображается параболой, однако подробное обсуждение этих вопросов завело бы нас слишком далеко. Вместо этого мы отсылаем читателя к книге И. М. Яглома «Принцип относительности Галилея и неевклидова геометрия». § 3 Псевдоевклидова плоскость Пусть /? — двумерное векторное пространство с псевдоевклидовой метрикой и еи е2— тот его базис, в котором скалярный квадрат произвольного вектора х = =Ххв1 + х2е2 равен х\ — х\. Тогда, в частности, (еие{) = 1, (е2, е2) = —1 и (ех + е2, ех + е2) = 1 — 1 = 0 = = {еи ех) +2(еи е2) + {е2, е2) = 2{еи е2), откуда (е{) е2) = О (т. е. вектор е\ — единичный, вектор е2 — «мнимо-единичный», ех и е2 ортогональны). Такой базис будем на-
§3] ПСЕВДОЕВКЛИДОВА ПЛОСКОСТЬ 249 зывать ортонормированным. В ортонормированном базисе скалярное произведение векторов х = ххех + х2е2 и у = ухех + у2е2 равно (х> У) = ххух (еи ех) + (хху2 + х2ух) (еХу е2) + + х2у2 {е2,е2) = ххух — х2у2у а модуль вектора х равен \х\ = у х\ — х\. Рассмотрим теперь двумерное точечно-векторное пространство, в котором расстояние между точками Х(хи х2) и У (у и у2) считается равным модулю вектора ХУ = (ух—хх, у2 — х2) в псевдоевклидовой метрике, т. е. равным У(Уг — хгJ - (У% - *2J- Окружность рад и ус а г с. центром в точке М(ах, аг)—это совокупность всех точек, удаленных на одно и то же (псевдоевклидово) расстояние г от точки М. Значит, уравнение окружности радиуса г с центром в точке М(ах, ссг) будет иметь вид (*1 — аО2— (х2 — а2J = г2. Таким образом, если точки псевдоевклидовой плоскости представить точками евклидовой плоскости с теми же координатами, то окружность представится гиперболой, если ее радиус г Ф О, и парой пересекающихся прямых при г = 0 (рис. 19). Радиус такой окружности может быть положительным, нулевым или даже «чисто мнимым». Так, уравнение окружности положительного радиуса г = а с центром в начале координат будет иметь вид 2 2 *» Х\ — х2 = а* (гипербола с горизонтальной вещественной осью). Окружность мнимого радиуса г = ах (с тем же центром) имеет уравнение х\ —• х\ = а2
СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX ^ Л4. \\ г'>0 л // /Ж / / / / / / / / 1 \1/- 1 / / // '/ М, 1 \\ \\ ч\ V Рис. 19. г=0 >=0 Рис. 20.
§3] ПСЕВДОЕВКЛИДОВА ПЛОСКОСТЬ 251 (гипербола с вертикальной вещественной осью). Эти два семейства окружностей разделяются окружностью нулевого радиуса Х-± — Х% '==- к) (пара прямых — общие асимптоты обоих семейств гипербол; см. рис. 20). Если векторы х и у ортогональны, т. е. если их скалярное произведение равно нулю: {х, у) = ххух — х2у2 = 0, то *± = ул — угловые коэффициенты этих векторов, рассматриваемых в евклидовой метрике, взаимно обратны и, значит, векторы, ортогональные в псевдоевклидовой метрике, при изображении на евклидовой плоскости по направлению симметричны друг другу относительно биссектрисы I—III координатных углов (см. рис. 21, на котором ехА-е2у ах±.а2, Ьх±Ь2). Каждый вектор, у которого 1^1 = \х2\, ортогонален самому себе и имеет нулевую длину. Для векторов с вещественными длинами 1АГ11 > |лг2|, а для векторов мнимых длин |#1|< <|х2| (см. тот же рис. 21, на котором векторы ей о>и Ь\ имеют вещественные длины, векторы е2, а2у Ь2 — мнимые длины, а вектор с ортогонален самому себе и М=0). Задачи. Докажите, что в псевдоевклидовой плоскости 1. Диагонали прямоугольника равны между собой. 2. Диагонали ромба взаимно перпендикулярны. 3. Сумма квадратов диагоналей параллелограмма равна сумме квадратов его сторон. 4. Средняя линия треугольника параллельна основанию и равна его половине. 5. Медианы треугольника пересекаются в одной точке и делятся в ней в отношении 2:1. 6. Серединные перпендикуляры к сторонам треугольника пересекаются в одной точке.
252 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX 7. Высоты треугольника пересекаются в одной точке. 8. В равнобедренном треугольнике медиана является и биссектрисой и высотой. Сообщим также без доказательства, что в псевдоевклидовой геометрии можно ввести понятие угла так, что для треугольника будут справедливы следующие соотношения: а* = 6* +с2 — 2ЬссЪА (теорема косинусов — но косинус тут гиперболический!) и _о Ъ_ зп А "" зп В (теорема синусов, где синусы — гиперболические). За подробностями отсылаем читателя к той же книге И. М. Яг- лома (см. выше стр. 248). § 4. Псевдоортогональный оператор Линейный оператор $4> псевдоевклидова пространства называется псевдоортогональным, ее- ли он сохраняет скалярное произведение, т. е. если для всех х% у е /? {Жх, зФу) = (х, у). Пусть зФ — псевдоортогональный оператор в псевдоевклидовой плоскости /? и А = — его матрица в ортонормированном базисе ел, е2. Мы имеем зфех = епех + а21е2, бФв2 = #12#1 + #22^2. По определению, (&еи $Фех) = (еи е{) = 1, (&е2, зФе2) = (е2, е2) = — 1 т. е. (бФех, Же2) = (еи е2) = О, 2 2 1 011—021 = 1, 2 2 1 012 — 022 — — 1> Dа) Оц • Й12 — «21 • 022 = 0. D6)
§41 ПСЕВДООРТОГОНАЛЬНЫЕ ОПЕРАТОРЫ 253 Из равенств Dа) видно, что ап Ф О и а22 Ф 0. Из равенства D6) следует, что ап а22 E) Обозначив равные отношения E) через р, получим а21 = ран, F) «12 = Р«22- Подставляя эти значения в равенства Dа), найдем, что а\х - Р2аа = 1, откуда ап = —-=-, §Ч\г — ^22 = — 1, откуда а22 1 G) ± УТ^р*' Таким образом, матрица оператора зФ имеет вид 1 Р Р 1 |_±/1-р2 ± К1 —Р2 . причем, как видно из равенств F), оба элемента первого столбца, так же как и оба элемента второго столбца, берутся с одним и тем же знаком. Матрицу такого вида будем называть псевдоортогональной. Если обозначить через А0 матрицу А> = Р то, как легко видеть, 1 Ах = Р 1 |_)Л-р2 У\-&} Р У\-р К1-Р2 Р 1 1_ ух-рух-р} Л°[ 0 I}'
254 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX р Аа = 1Л_р» /1-Р2 Р _ 1 |_1Л-р2 1Л-рЧ 1 _ Р К1-Р2 К1-Р2 Р _ 1 -41 4 (преобразования ^ и ^2 отличаются от ^0 осевой, а ^з — центральной симметрией). Определители |Л0| = |Л3| = 1, \А{\ = \А2\ = — 1. Заметим, что, поскольку —-;===• ^ 1, то найдется такое ф, уГ=р- = сЬ,р'уг^р"==8Ьф* итогда ГсЬ ф зЬ ф"| зЬ ( Л0 = I Ф зЬ ф"| 1 ф СП ф] Это преобразование называется гиперболическим поворотон. Пусть в псевдоевклидовой плоскости /? имеются два ортонормированных базиса, ей е2 и еъ е2 и А = Д21 ^^ — матрица перехода от первого ко второму. Рассмотрим линейный оператор зФ с матрицей А в базисе еи е2 и покажем, что он — псевдоортогональный. Действительно, по условию, з#>е1 = апе1 + аг\еъ = ег и ^е2 = а12ег + а22е2 = е2. Если х = х{ег + х2е2 и у = ухех + у2е2 — произвольные векторы из У?, то $фх = х^^ + х2^е2 = ххе[ + х2е2 &У = #1^х + 1/2^^2 = У1е1 + У&Ъ-
§ 5] ПРИНЦИП ОТНОСИТЕЛЬНОСТИ ГАЛИЛЕЯ 255 А так как оба базиса ей ^2 и еъ е^ —ортонормирован- ные, то скалярное произведение {Жх, &у) = Х1У1—Х2У2 = {X, У). Значит, оператор зФ — псевдоортогональный, и его матрица имеет вид G). § 5. Пространство событий. Принцип относительности Галилея Предположим, что точка М движется вдоль прямой линии /, на которой установлена система отсчета 5. Это значит, что на этой прямой расположена шкала с соответствующими делениями и в каждой точке прямой имеются синхронизированные между собой часы. Пусть в момент времени I координата точки М равна х. Это обстоятельство, или, как мы будем говорить, «событие», можно отметить на некоторой (двумерной) плоскости Р точкой с координатами (х, I). Плоскость Р называется пространством событий, С течением времени координаты точки в пространстве событий меняются, даже если точка М не меняет своего положения на прямой / — за счет изменения времени I. Таким образом, существование точки в пространстве и времени будет отмечено некоторой линией в плоскости Р. Прямой эта линия будет в том и только в том случае, если точка М движется по прямой / с постоянной скоростью, и тогда ее положение в плоскости Р будет определяться уравнением х = й1 + Ь где Ь = х@) —положение точки в момент / = 0. Если точка М неподвижна на прямой / («движется с нулевой скоростью»), то соответствующая ей в плоскости Р прямая параллельна оси /. Предположим, что вдоль прямой / равномерно со скоростью V движется другая система отсчета, 5', причем в начальный момент времени начала координат обеих систем совпадают: х = хг = 0 при / = 0. Тогда координата х точки М в системе 5 и координата ее х' в системе 5' будут связаны соотношением X = *' + VI,
256 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX При этом считается, что время / в системе 5 и время V в системе 5' одно и то же: для одного и того же события / = V Преобразования х=.х* + VI, (8) / = 1\ или, что то же самое, X* = X — VI, 1' = 1 называются преобразованиями Галилея. Из них дифференцированием по / получаем их их' , или и = и' + о, (9) где и — скорость точки в системе 5, а и'—скорость ее в системе 5'. Это — закон сложения скоростей в классической механике: скорость и точки в старой системе отсчета равна ее скорости и' в новой системе, сложенной с «переносной» скоростью V (скоростью движения новой системы отсчета относительно старой). Дифференцируя по I еще раз, получаем сН2 Ш2 ' Таким образом, ускорения точки М в системе 8 и в системе 8' одинаковы, откуда делается вывод, что одинаковые силы вызывают в обеих системах одинаковые следствия (описываемые вторым законом Ньютона: вызванное силой Р ускорение прямо пропорционально этой силе). Другими словами это выражают, говоря, что за- коны механики инварианты относительно преобразований Галилея (принцип относительности Галилея). Вернемся к формулам (8). Они показывают, что при переходе от системы 5 к системе 5' координаты точек пространства событий подвергаются линейному преобра-
§5] ПРИНЦИП ОТНОСИТЕЛЬНОСТИ ГАЛИЛЕЯ 257 зованию с матрицей [;?]• (Ю) Это обстоятельство наводит на мысль ввзсти в пространстве событий полуевклидову метрику. Тогда расстояние между событиями А(х\, /0 и В(х2, 12) будет иметь определенный физический смысл: оно будет равно | 12 —¦ 1\ | — временному интервалу, протекшему между событиями А и В. Далее, так как переход от одной системы координат к другой задается матрицей A0), то инвариантным окажется и введенное в § 2 понятие угла. Чтобы выяснить его физический смысл, рассмотрим две равномерно движущиеся по прямой / точки Щ и М2. Скорости их обозначим соответственно через их и и2. В плоскости Р их движения определяются прямыми Ш\ и т2. Пусть Ло(*о, и) —точка пере- *АгФЪ>*р> А](Ду,$;) сечения этих прямых (это значит, что при /¦= = /о обе точки, М\ и М2, находились в одном и том же месте прямой / — имели абсциссу х0). Предположим, что при I = 1\ точка М\ имеет абсциссу хи а при I = 12 точка М2 — абсциссу х2. Тогда угол между прямыми тпх и т2 (в полуевклидовой метрике) равен углу между векторами А§А\ и А0А2} где А\(хи ^)> А2(х2, /2) (рис. 22), и значит, он равен Рис. 22. *1~*0 '. —'• и-к = / «2 — «X I — относительной скорости движения этих точек. При такой интерпретации расстояния и угла теоремы 1, 2 и 3 на стр. 246 получают определенный физический смысл, установить который предоставляется читателю. 9 Л. И. Головин»
258 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX § 6. Принцип относительности Эйнштейна Из закона сложения скоростей (9) естественно сделать следующий вывод: если система отсчета 5' равномерно движется относительно 5 со скоростью V и если свет в системе 5 распространяется со скоростью су то в системе 5' его скорость должна быть равна с — V в направлении движения системы 5' и с + о — в противоположном направлении. Однако в 1881 г. американским физиком А. Майкельсоном было экспериментально установлено, что на движущейся Земле солнечный свет распространяется с одинаковой скоростью во всех на- правлениях. После попыток многих ученых как-то согласовать результаты опытов Майкельсона с теорией, в 1905 г. была опубликована фундаментальная работа А. Эйнштейна, в которой излагалась новая теория пространства и времени— так называемая специальная теория относительности. Мы рассмотрим здесь только самые основные, простейшие понятия этой теории. В основу теории Эйнштейна был положен закон по- стоянства скорости света во всех инерциальных*) системах отсчета. Таким образом, принцип относительности Галилея состоит в невозможности установить равномерное движение одной механической системы относительно другой с помощью каких-либо механических экспериментов внутри этой системы. Принцип относительности Эйнштейна утверждает, что это невозможно сделать, исходя не только из механических, но также и из каких-либо оптических явлений (связанных, как известно, с электромагнетизмом). Но приняв закон постоянства скорости света, Эйнштейн вынужден был отказаться от предположения о существовании абсолютного времени, годного для измерения временных интервалов сразу во всех инерциальных системах отсчета. То, что эта относительность времени с необходимостью вытекает из закона постоянства скорости света, *) В физике инерциальной называют такую систему отсчета, в которой тело без действия на него внешних сил движется равномерно и прямолинейно,
§ б] ПРИНЦИП ОТНОСИТЕЛЬНОСТИ ЭЙНШТЕЙНА 259 можно видеть на следующем простом примере*). Представим себе очень большой по линейным размерам поезд, скорость которого сравнима со скоростью света («поезд Эйнштейна»). Пусть в этом поезде у окна находится наблюдатель, который в некоторый момент времени зажигает фонарик, испускающий луч света в потолок. На потолке имеется зеркало, отразившись от которого, луч возвращается к наблюдателю. Путь луча света с точки зрения этого наблюдателя — дважды проходимый отрезок АВ (рис. 23, а). Для наблюдателя же, находящегося вне поезда, путь луча света представится в виде ломаной линии, состоящей из боковых сторон равнобедренного треугольника Л^Лг, высота которого равна АВ (рис. 23, б). Следовательно, путь, проходимый светом, с точки зрения наблюдателя вне поезда, больше, чем для пассажира поезда. А так как скорость Т^Ь- ЩР> 7^5 0СГ 4}& ТЯГ Рис. 23. света постоянна, то время, которое потребуется свету на этот путь по часам наблюдателя вне поезда, будет больше, чем для пассажира поезда: часы внутри поезда о т- стают по сравнению с часами на станции. Закон постоянства скорости света делает относительным и понятие одновременности, что хорошо видно на другом примере. Предположим, что в центре вагона того же поезда Эйнштейна находится наблюдатель, который в некоторый момент времени зажигает фонарик. В дверях вагона имеется механизм, благодаря которому двери открываются, как только до них доходит свет. Наблюдатель в центре вагона увидит, что задняя и передняя двери открываются одновременно. С точки же зрения наблюдателя вне поезда передняя дверь вагона уходит *) Этот и следующий примеры заимствованы из брошюры Л.Д.Ландау и Ю. Б. Румера [18]. 9*
260 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX от светового луча, тогда как задняя идет к нему навстречу. Ввиду постоянства скорости света, с точки зрения наблюдателя вне поезда свет достигает задней двери вагона раньше, чем передней, и она откроется раньше. Более того, даже последовательность событий может быть разной и для этих двух наблюдателей. Так, если (например, из-за неисправности механизма дверей) задняя дверь откроется несколько позже, чем на нее попадет свет, то, если эта разница во времени достаточно мала, наблюдатель вне поезда все-таки увидит заднюю дверь открывающейся раньше, чем передняя, хотя для наблюдателя в центре вагона последовательность этих событий будет обратной. § 7. Преобразования Лоренца Итак, мы вынуждены отказаться от предположения, что время — одно и то же во всех равномерно движущихся друг относительно друга системах отсчета. Мы уже не можем считать, что для одного и того же события /' = I. Как же связаны между собой координаты х% I точки в системе 5 и координаты х\ V ее в системе 5', движущейся относительно 5 равномерно со скоростью V? В классической механике эта связь линейна (преобразования Галилея). Мы сохраним это предположение о ли* нейной зависимости х'у V от х, I — тогда переходу от 5 к 5' будет отвечать переход к новому базису в пространстве событий. Какова же метрика этого пространства? Пусть в некоторый момент времени (начальный для обеих систем 5 и 5х) их начала координат совпадают: х = х' «в 0 при I = /' = 0. Предположим, далее, что при I = /' ее 0 из общего начала координат обеих систем пущен световой сигнал, принятый в системе 5 в точке х в момент I, а в системе 5' — в точке х' в момент времени V. Ввиду постоянства скорости света с |т|-|Я-* откуда х2 — с2!2 —0 и х'2 — сЧ\ = 0. Таким образом, если выражение х2~-сЧ2 A1)
§7] ПРЕОБРАЗОВАНИЯ ЛОРЕНЦА 261 равно нулю в одной инерциальной системе отсчета, то оно обращается в нуль и во всех остальных. Мы сделаем теперь еще одно дополнительное предположение — о том, что выражение A1) вообще является инвариантом, т. е. что оно одинаково во всех инерциальных системах отсчета. Положив х = хх и с1 = х2 (и соответственно х! = х[ и с1[ = х2), мы можем наше пространство событий рассматривать как псевдоевклидову плоскость, в которой выражение A1), равное х\ . г2 является квадратом расстояния точки (хи х2) от начала координат, или, что то же самое, квадратом длины соответствующего вектора. Но базис, в котором квадрат длины вектора имеет такой вид, является ортонормированным (см. начало § 3). Ортонормированным будет по той же причине и соответствующий базис системы 5х, а значит, матрица А перехода от базиса системы 5 к базису 5' псевдоортогональна: 1 р Р 1 \_±У\*-Р ±}Л-рЧ (причем в каждом из столбцов стоит какой-то один знак). Следовательно, ег = *1 + Р'2 Р*1+*2 ±у73р*' ±У\ -р2 Рассмотрим сначала случай, когда оба знаменателя положительны, и матрица А имеет вид д>= р У\-р К1-Р2 Р 1 1ЛЛ-Р1 /1-Р^
262 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX Тогда координаты хи х2 и Хи х2 связаны соотношениями Х1~уг^' *~/ггрГ или, в старых обозначениях, х-$Ж, ( = ^Ш. A2) Выражая отсюда х* и ^ через д; и I, получим формулы *-77%- '~^Т (,3) Каков физический смысл параметра р? Предположим, что в системе 5' покоится точка М\ пусть, например, это будет начало координат х' = 0. По первой из формул A3) для этой точки имеем х — $с1 = 0, или у- = $с. Но у- есть скорость точки М в системе 5, равная, очевидно, скорости V системы 5' относительно 5. Следовательно, V = рс, и р = у-. Подставив это значение р в формулы A2) и A3), получим V х= 7- .. '= / г (И) У^' / сг *--^* <' = -^=-. A5) /"Г ¦/«-? Преобразования A4) и A5) называются преобразованиями Лоренца. Заметим, что формулы A5) получаются из формул A4) простым изменением знака у V.
§7] ПРЕОБРАЗОВАНИЯ ЛОРВНЦА 263 Мы предполагали, что в матрице перехода от базиса ей Ъ к базису еи е'2 все знаменатели положительны. Покажем, как исключить остальные случаи. Если бы во втором столбце матрицы перехода стояли знаки минус (а в первом какие угодно), то мы получили бы формулы л — ]М и, например, при х' = 0, т. е. в начале координат системы 5', увеличению V соответствовало бы уменьшение /, что невозможно, так как при этом последовательность всех событий в точке х' системы 5' была бы обратной последовательности тех же событий в системе 5. Если же знаки минус стоят в первом столбце матрицы перехода (а во втором столбце стоят знаки плюс), то получаются формулы V т- -*' + °г * = --*'+'' от которых к формулам A4) можно перейти, изменив знак у х\ т. е. изменив на противоположное направление оси Ох'. Таким образом, мы можем ограничиться исследованием преобразований Лоренца A4) и A5). Формулы Лоренца имеют смысл лишь при ~- < 1, откуда следует, что |и| < с, т. е. что движение со скоростью, превы- щающей скорость света, невозможно. Если V мало по сравнению с с, то 1/ 1 —^ ^ Ь а тогда х' « х — VI, V « /. Таким образом, при малом, V (по сравнению с с) преобразования Лоренца переходят в преобразования Галилея классической механики.
264 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX Пусть Ох и О/ — координатные оси пространства событий системы 5, Ох' и 01' — оси системы 5' (рис. 24), Как мы знаем, оси Ох' и О/7, если изображать их на евклидовой плоскости, симметричны, друг другу относительно биссектрис ММ' и ЫЫ' координатных углов первой системы. Ось 01' можно рассматривать как график движения начала координат системы 5' относительно 5: для всех ее точек *'=0. Наоборот, ось 01 — это график движения начала координат системы 5 относительно 5'. Тангенс угла наклона оси 01' к Ох по абсолютной величине равен ч" \ \ \ *, \ 1 уг/ уг / / / у ' ' / / /•'• < /'. м' /а" \ у^7 /7 у*' *' / / / / Xх' / ' У^ "^ / / / ч/у А у^Х^. /*' ^ /? * \ ..«•* .•••'\ \ \ \ \ \ , У/ Рис. 24. где — = V — скорость движения системы 5' относительно 5. А так как |у|<с, то тангенс этот по модулю больше единицы, и значит, все временные оси 01 лежат внутри угла МОЫ, а следовательно, все пространственные оси Ох — внутри угла МО№. Для прямых ММ' и ЫЫ' имеем -^г = 1, т. е. |а | = с; во всех системах отсчета это — график движения со скоростью света. § 8. Некоторые следствия из формул Лоренца 1. Правило сложения скоростей. Из равенства A5) получаем Ох й1 — V с сИ их /'-$У'-$ --+1
§ 8] НЕКОТОРЫЕ СЛЕДСТВИЯ ИЗ ФОРМУЛ ЛОРЕНЦА 265 ИЛИ г и — V откуда и = ^ — 4-1 Это — новая формула сложения скоростей. Если и и V малы по сравнению с с, то и* ж и — V, Если и = с, то из формулы A6) получаем " = — = с, -Т+1 и обратно, если и' = с, то и Т+1 (и, значит, из формул Лоренца вытекает закон постоянства скорости света). 2. Относительность одновременности. Предположим, что события А и В в системе 5 происходят в один и тот же момент времени I в точках с разными абсциссами Х\ и х2. Тогда в системе 5' по второй из формул A5) эти события будут происходить в моменты времени ,, -?*! + ' ., -?*.+< к = г т И (г = ¦№ У^?' откуда V /-?
266 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX т. е. события, одновременные в одной системе отсчета, не будут одновременными в другой. При этом разность *2— *1 может быть как положительной, так и отрицательной, в зависимости от знака разности Х\ — *2. (Это хорошо видно на чертеже: если события Л и В одновре* менны в системе 5# то отрезок АВ должен быть параллелен оси Ох, а если они одновременны в системе 5', то он должен быть параллелен оси Ох'.) Больше того, даже последовательность событий может быть в системах 5 и У не одинаковой. Так, на рис. 24 события Л и Л7 одновременны в системе 5 (ЛЛ'||0х), причем Л7 происходит, очевидно, позднее О, а следовательно, и А в системе 5 происходит после О. В системе 5' одновременны события А и А" (ААЦОх'), и.значит, событие Л (вместе с А") предшествует О. Здесь, естественно, возникает такой вопрос: не может ли случиться так, что, например, событие О, в системе 5 послужившее причиной события Л, в системе 5' окажется происходящим после Л, что противоречило бы принципу причинности. Покажем, что на самом деле этого быть не может. Точки, отвечающие событиям, которые в системе 5 происходят после события О,— это все те и только те точки, которые лежат выше оси Ох\ точки, отвечающие событиям, которые происходят после события О в системе 5',—это тачки, лежащие выше оси Ох'. Так как все пространственные оси проходят внутри угла МОЫ' (см. конец § 7) и, очевидно, каждая такая прямая служит пространственной осью некоторой системы отсчета, то пересечение всех полуплоскостей, лежащих выше какой-либо из пространственных осей,— это угол МОЫ, заполненный всеми теми и только теми событиями, которые следуют за О во всех системах отсчета (его можно назвать «областью будущего-»). Аналогично, угол М'ОМ' представляет собой множество всех тех событий, которые во всех системах отсчета происходят до события О («область прошедшего»). Точки же, лежащие в углах МОЫ' и ЫОМ', отвечают событиям, которые в одних системах отсчета предшествуют О, а других — следуют за О. Однако ни одно из этих событий не может иметь своей причиной событие О. Действительно, если событие О послужило причиной со-
§ 8] НЕКОТОРЫЕ СЛЕДСТВИЯ ИЗ ФОРМУЛ ЛОРЕНЦА 267 бытия А(х, I) (см. тот же рис. 24), то какое-то возмущение должно успеть дойти от О до А. Однако это невозможно, так как длина вектора ОА вещественна и, значит, для него во всех системах отсчета х2 — с2/2>0, т.е. х2>сЧ\ откуда т. е. скорость и = -у- такого возмущения должна была бы быть больше скорости света, что невозможно. Аналогично показывается, что для л ю б ы х двух событий А и В закон причинности не нарушается: если А может служить причиной В, т. е. если существует сигнал, распространяющийся (в данной системе отсчета 5) от А к В со скоростью V••< с, то А предшествует В во всех инерциальных системах отсчета. 3. Сокращение длин. Пусть в системе 5 покоится стержень длины /; координаты концов его обозначим Х\ и х2у где Хх < х2\ тогда / === Х2 — Х\, Для того чтобы измерить длину V стержня в системе 5', надо отметить координаты его концов в какой-то (один и тот же!) момент времени V. Если эти координаты х'г и х'2, то по первой из формул A4) _ 4+у*' _ *;+уг У>-7 /'-7 откуда имеем « х2 Х1 I — Х2 — Хг г » » /-7 или, так как длина V стержня в системе 5' равна х%— хи
268 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ (ГЛ. IX Таким образом, длина V стержня в той системе отсчета, относительно которой этот стержень движется, меньше, чем длина его I в той системе отсчета, относительно которой он находится в покое. Поясним этот результат на чертеже. Пусть точка А лежит на пересечении гиперболы Х2 _ сЧ2 в /2 с осью Ох (рис. 25); тогда в системе 5 ее расстояние от начала координат равно /. Если АА'\\0^, то точки А и А' в системе 5 находятся на одном и том же расстоянии / от начала координат. (Это — одна и та же точка, покоящаяся в системе 5, в разные моменты времени.) Но в системе 5' расстояние точки А' от начала координат равно ОА'\ оно мень- ш е ОВ, равного /. Наоборот, точка В, лежащая на пересечении гиперболы х2 — сЧ2 = I2 с осью Ох', в системе 5' находится на расстоянии / от начала координат. Если ВВ'\\ОР9 то точка В' в системе 5' находится от начала координат на том же расстоянии /; одна- рис 25. ко в системе 5 расстояние точки В' от точки О равно ОВ'<ОА = / — релятивистское, т. е. связанное с теорией относительности сокращение длин взаимно. Если V мало по сравнению со скоростью света, то указанное сокращение длин в движущейся системе отсчета настолько мало, что практически обнаружить его невозможно. то разность /Поскольку /' = /1/ 1 —¦пг»'П —^1). /_/'*," = второго порядка относительно ¦и Так, с космической ракеты (при скорости 12 км/сек) диаметр Земли A2 000 км) покажется укороченным всего на 1 см.
§ 8] НЕКОТОРЫЕ СЛЕДСТВИЯ ИЗ ФОРМУЛ ЛОРЕНЦА 269 4. Замедление времени. Пусть в системе 5 на неподвижных в ней часах протекает время Т от 1\ до 12: Найдем значения 1и соответствующее 1\, и 1%, соответствующее и> в одной и той же точке с абциссой х' в системе 5'. По второй из формул A4) 2 * +4 А* ^%\ откуда где Г'= <2 — А — отрезок времени, протекающий в системе 5', когда в системе 5 протекает время Т от 1\ до 12\ значит, г = т тА _ ^ < г. Таким образом, временной интервал V между двумя событиями, происходящими в одной и той же точке системы 3\ которая движется относительно 5, мень* ше, чем время Т, протекшее между теми же событиями в системе 8. Поясним этот результат на чертеже. Рассмотрим гиперболу х2 - сН2 = — с2Т* (рис. 26), и пусть точка Л лежит на пересечении этой гиперболы с осью 01\ тогда ее временное расстояние от точки О, т. е. время, протекшее от события О до Л, в системе 5 равно Г. ЕслиЛЛ'1| Ох, то события Л и Л' одновременны в системе 5, Но в системе 5' время, протекшее от О до Л', равно ОЛ'; оно меньше О В, равного Т. Наоборот, точка В в системе 5' по времени удалена от точки О на интервал ТУ Если ВВ'§Ох?% то события В
270 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ [ГЛ. IX и В' одновременны в системе 5'; однако в системе 5 временное расстояние точки В/ от О равно ОВ' — оно меньше ОЛ, равного Т — лоренцово замедление времени взаимно. Если скорость V мала по сравнению со скоростью света, то это замедление времени в движущейся системе отсчета составляет всего—/—) —оно второго порядка относительно —, и обнаружить его практически не- с возможно. Так, земные сутки покажутся космонавту сократившимися меньше чем на 10000сек- 5. Увеличение массы движущегося тела. Мы не будем рассматривать дальнейших выводов теории относительности; упомянем еще только один феномен —увеличение массы движущегося тела. Если на тело действует постоянная сила, то скорость движения его в обычных условиях возрастает пропорционально времени действия силы. Однако, ввиду существования предельной скорости, эта пропорциональность не может сох- Рис. 26. раняться и при больших скоростях. При скоростях, сравнимых со скоростью света, дальнейшее нарастание скорости замедляется — тело как бы оказывает большее сопротивление действующей на него силе. Можно сказать, что масса тела увеличивается. При этом оказывается, что где т —масса движущегося тела, V — скорость его движения и т0—масса покоя, т. е. масса тела в той систе-
§ 81 НЕКОТОРЫЕ СЛЕДСТВИЯ ИЗ ФОРМУЛ ЛОРЕНЦА 271 ме отсчета, относительно которой оно покоится. Так, в современных ускорителях электрон разгоняется до скорости, отличающейся от скорости света всего на десятки метров в секунду, при этом его масса увеличивается в тысячи раз. (Действительно, если скорость электрона V отличается от скорости света, скажем на 30 м/сек, то масса этого электрона тл /л. т. т __ о_ о ^ о . /.-4 У'-?'-? У*? ". У 30 "зо-ю* = 10001/5т0>2000/п0 — увеличивается более чем в 2000 раз.) Мы рассмотрели движение точки по прямой линии. В общем случае, когда одна пространственная система отсчета движется относительно другой равномерно и прямолинейно, направление этого движения можно принять за направление оси Ох, и тогда в классической механике х' = х — VI, у' = У, г' = г, V = /, а в теории относительности ш x--V^ , , ,, № Пространство событий в этом случае четырехмерно. Сокращение длин (только в направлении движения) и замедление времени в движущейся системе отсчета происходят в том же отношении ш/ л />-*
ГЛАВА X ОСНОВНЫЕ ПОНЯТИЯ I ТЕОРИИ ГРУПП § 1. Примеры групп. Определение группы Рассмотрим множество всех целых чисел. При сложении двух целых чисел получается снова целое число. Если одно из слагаемых равно (целому) числу 0, то сумма равна другому слагаемому: а + 0 = а; для каждого целого числа а противоположное к нему число —а (сумма которого с данным числом а равна 0) тоже является целым. Операция сложения (в частности, целых) чисел коммутативна (а + Ь = Ь + а для любых двух чисел а и Ъ) и ассоциативна ((а + Ь) +с=а+(Ь-{- + с) для любых трех чисел а, 6, с). Далее, если из множества всех целых чисел выделить подмножество чисел, делящихся на данное число к, то и оно обладает такими же свойствами. Это множество тоже «замкнуто относительно «операции сложениям^—сумма любых двух чисел, делящихся на к, делится на к; это множество содержит 0 (нуль делится на любое число); и, наконец, если а делится на к9 то и — а делится на к. Аналогичными свойствами обладают и множество всех рациональных чисел, множество всех вещественных чисел или всех комплексных чисел — каждое из них замкнуто относительно операции сложения; нуль является одновременно числом рациональным, вещественным и комплексным; для каждого (комплексного) числа а имеется противоположное к нему число —а такое, что а + (— а) = 0, причем — а при вещественном а будет вещественным, а при рациональном а —рациональным. Операция сложения в множестве комплексных чисел (а значит, и подавно, в множестве вещественных и в множестве рациональных чисел) коммутативна и ассоциативна. Все это — примеры «групп по сложению».
$ Ц ПРИМЕРЫ ГРУПП. ОПРЕДЕЛЕНИЕ ГРУППЫ 273 Рассмотрим теперь множество всех отличных от нуля вещественных чисел и «операцию умножения> в нем. Произведение любых двух таких чисел — снова отличное от нуля вещественное число; произведение любого числа а на (вещественное, отличное от нуля) число 1 равно а, и для каждого (отличного от нуля!) вещественного числа а имеется обратное ему (и тоже отличное от нуля) вещественное число яг1, произведение которого на а равно 1. Аналогичными свойствами обладает и множество всех отличных от нуля рациональных чисел, множество всех положительных вещественных чисел или всех положительных рациональных чисел, а также множество всех отличных от нуля комплексных чисел или множество комплексных чисел, по модулю равных 1. Каждое из них замкнуто относительно операции умножения, все они содержат единицу и у каждого из их элементов имеется обратный элемент, принадлежащий тому же множеству. Умножение комплексных (а значит, и вещественных, и рациональных) чисел коммутативно (аЬ = Ьа для всех а и Ь) и ассоциативно ((аЬ)с = =а(Ьс) для всех а, Ь, с). Это —примеры «трупп по умножению». Можно привести и более неожиданный пример: группу по умножению образует, например, пара чисел, 1 и — 1. Впрочем, множество, состоящее из одного числа 1 (или 0), тоже образует группу по умножению (соответственно по сложению). Комплексные числа 1,1, —1, —/ также образуют, очевидно, группу по умножению. Складывать можно не только числа, но, например, векторы линейного пространства /?, причем это сложение подчиняется тем же законам, что и сложение чисел: оно коммутативно и ассоциативно, в /? имеется нулевой элемент 0 такой, что х + 0 = х для любого х е #, и для всякого вектора х е /? имеется противоположный ему вектор — х, такой, что х + (— х) = 0. Складывать можно матрицы одного и того же строения (т. е. [т X п]-матрицы, где т и л —какие-то заранее заданные целые положительные числа). Это сложение ассоциативно и коммутативно, имеется нулевая матрица, прибавление которой не меняет второго слагаемого—это матрица, состоящая из одних нулей, и
274 основные понятия теории групп [гл. х для каждой матрицы [а{к] имеется противоположная к ней матрица [—а<*]— такая, что [а<*] + [ — а{к] есть нулевая матрица. Если рассматривать только так называемые целочисленные матрицы (т. е. матрицы с целыми элементами а<А), то и суммой двух таких матриц будет матрица такого же строения, нулевая матрица является целочисленной, и для каждой целочисленной матрицы, противоположной к ней, будет тоже целочисленная матрица. Все это —тоже примеры групп по сложению. С другой стороны, и перемножать можно не только числа, но, например, невырожденные квадратные матрицы одного и того же порядка п с вещественными (или только с рациональными или, наоборот, с комплексными) элементами. Произведение двух таких матриц тоже будет невырожденной матрицей (теорема 3 главы III) с вещественными (соответственно с рациональными, комплексными) элементами; единичная матрица является невырожденной, и у каждой невырожденной матрицы имеется обратная (тоже невырожденная и тоже с вещественными или соответственно рациональными, комплексными элементами). Умножение матриц ассоциативно, однако оно не коммутативно. Множество всех невырожденных матриц порядка п с вещественными (рациональными, комплексными) элементами представляет собой пример некоммутативной группы по умножению. Дадим теперь общее определение группы. Определение!. Группой называется множество О элементов а, Ь, ,.., для которых определена некоторая алгебраическая операция (обычно называемая умножением или сложением), ставящая в соответствие каждой упорядоченной паре а, Ь элементов из О третий элемент с = а°Ь, причем так, что выполнены следующие условия: 1. 5га операция ассоциативна: для любых трех элементов а, Ь, с из О (а° Ь) ос = а° (Ь о с). 2. В О существует «нейтральный» элемент е такой, что а° е = е° а = а для каждого а^С,
§ Ц ПРИМЕРЫ ГРУПП. ОПРЕДЕЛЕНИЕ ГРУППЫ 275 3. Для каждого элемента а из О существует «о б- ратный» ему элемент а такой, что а о яг1 = яг1 ° а = е. Группа, в которой дополнительно выполняется ком- мутативный закон: 4. Для любых двух элементов а, Ъ е О а • Ь = Ь о а, называется коммутативной, или абелевой. Группа, состоящая из конечного числа элементов, называется конечной группой. Число элементов конечной группы называется ее порядком. Группа, не являющаяся конечной, называется бесконечной. В том случае, когда «групповая операция» а°Ь называется сложением и обозначается знаком +, группа О называется группой по сложению, или аддитивной группой. В этом случае «нейтральный элемент» е обычно обозначается символом 0 и называется нулем, а элемент, обратный к а, обозначается через —а и называется противоположным к а. В том случае, когда групповая операция называется умножением, а*Ь обозначается через аЪ, группа называется группой по умножению, пит мультипликативной группой, а нейтральный элемент называется единицей и часто обозначается символом 1. Пользуясь ассоциативным законом, можно определить произведение (сумму) трех и большего числа элементов группы. Так как (аЬ)с=а(Ьс), то имеет смысл говорить просто о произведении аЬс трех элементов, равном, по определению, (аЬ)с = а(Ьс). Так же как для линейных пространств, можно доказать единственность единичного (нулевого) элемента группы и единственность элемента, обратного (противоположного) данному. Заметим, что для каждого элемента а группы (а*)-1= (а-1)*, так как ак (а~г)к = а ... дат1 ... а-1 = е; к раз к раз вместо (аг1)* мы будем также писать аг\ Далее, в каждой (например, мультипликативной) группе однозначно разрешимы уравнения ах=Ь (решением которого, очевидно, будет х = а~1Ь) и уа = Ь (для которого у>=
276 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X = Ьаг1); ясно, что если группа коммутативна, то эти уравнения не различаются и х = у). Еще одним важным примером группы может служить группа вращений правильного многоугольника. Пусть дан правильный п-угольник ЛИг.-.Лп, и пусть О —его центр (сделайте чертеж). Рассмотрим всевозможные повороты плоскости вокруг точки О, при которых этот п-угольник совмещается сам с собой. Таких поворотов, очевидно, п: ао — поворот на АЛ (тождественное преобразование), а\ — поворот на </ —, а2— поворот на,/ — «2, «*••••••• ап-\ — поворот на /_ — {п — 1). По определению, умножение поворотов — это их последовательное выполнение одного за другим: ак о аг = ак+1\ при этом естественно считать, что ак+п = ак для любого ку в частности, ап = ао. Это умножение, очевидно, ассоциативно (и коммутативно). Поворот а0 является единичным элементов группы и а1х = ап-к для всех к = = 0, 1, ..., п— 1. Если положить а\ = а, мы будем иметь а2 = а2, а% = = а3, ..., ап-1 = ап~1 и, наконец, ап — ап = а0. Можно сказать, что эта группа образована степенями одного из своих элементов (или что она «порождается» одним из своих элементов), а именно, элемента а = щ. Такие группы называются циклическими. Группа вращений правильного /г-угольника является циклической группой порядка п\ обозначается эта группа символом Сп. Группа целых чисел (по сложению) тоже является циклической — она порождается одним из своих элементов: ведь 2=1 + 1, 3 = A + 1)+ 1, — 1 есть элемент, противоположный к 1, и т. д. Эта группа является бесконечной циклической группой; обозначается она символом С»,.
§ П ПРИМЕРЫ ГРУПП. ОПРЕДЕЛЕНИЕ ГРУППЫ 277 Рассмотрим еще один пример — группу V самосов мещений, или группу симметрии, ^ромба с (она называется еще клейновской группой четвертого порядка). Пусть дан ромб АВСй (рис. 27). Он переходит в себя при следующих преобразованиях: ЪI — тождественное преобразование, Ь2—симметрия относительно АС, Ъъ — симметрия относительно Вй, Ь4 — симметрия относительно центра О. Произведение (т. е. результат после- рис. 27. довательного выполнения одного за другим) любых двух из этих преобразований — снова одно из них. Эти преобразования образуют группу, которую можно представить следующей «таблицей умножения»: »1 ь* ь3 ь, *1 *1 ь2 ь3 ь, *2 ь* *1 Ьх ь3 ь3 ь3 »« *1 ь2 *4 ь, ь3 Ьг *1 1 (Ассоциативность этого умножения будет вытекать из результатов § 3.) Аналогичную таблицу умножения, где слева стоят левые множители Ьи сверху — правые Ьк, а на пересечении соответствующих строки и столбца — их произведение Ь$кУ можно написать для каждой конечной группы. Таблицы такого рода называются таблицами К э- л и. Легко видеть, что в каждой строке и в каждом столбце таблицы Кэли все элементы стоят по одному разу (так как из равенства Ъ{Ь) = Ь{Ьк умножением слева на ЬГ1 получаем Ь^ = ЬкУ и из равенства 6Д = ЬкЬ{ то- ф
278 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X же следует, что Ь5= Ьк). Ясно также, что если группа коммутативна, то ее таблица Кэли симметрична относительно главной диагонали (т. е. при всех I и к элемент, стоящий в пересечении 1-й строки и к-то столбца, равен элементу, стоящему в пересечении к-й строки и 1-го столбца). § 2. Подгруппа Определение 2. Подгруппой группы О на- аывается совокупность 0\ элементов группы О, сама являющаяся группой относительно заданной в О операции. Так, в аддитивной группе вещественных чисел содержится подгруппа целых чисел, а в ней при любом А — подгруппа чисел, кратных к. Сама группа вещественных чисел содержится в качестве подгруппы в группе комплексных чисел. В мультипликативной группе отличных от нуля комплексных чисел содержится подгруппа вещественных чисел, а в ней — подгруппа рациональных чисел, подгруппа положительных вещественных чисел. Много интересных подгрупп содержит мультипликативная группа невырожденных матриц порядка п {полная линейная группа), например, с вещественными элементами. Отметим, в частности, подгруппу ортогональных матриц и подгруппу унимодулярных матриц (т. е. матриц с определителем, равным 1). Подгруппами полной линейной группы являются также группа матриц с определителем, равным ±1, группа матриц с положительным определителем, группа диагональных матриц, группа скалярных матриц, т. е. матриц вида сЕ, где с ф О — любое число, а Е — единичная матрица, группа треугольных матриц, т. е. матриц, у которых все элементы снизу (сверху) от главной диагонали равны нулю. Для того чтобы убедиться в том, что подмножество 0\ группы О является ее подгруппой, надо прежде всего проверить, что произведение {сумма) любых двух элементов из Ог принадлежит 0\ и что если аЕ 6и той а-1 е (?1. Но этого и достаточно, так как ассоциативный
§2] ПОДГРУППА 279 закон, справедливый во всей группе О, будет выполняться и для элементов из 0\> а элемент е (или 0) как произведение аа~1 (как сумма а+(—а)) тоже будет принадлежать 0\. Пусть дана группа ОиаЕО, Рассмотрим всевозможные степени (положительные и отрицательные) ..., яг2, а-1, е = а0, а, а2, а3, ... элемента а. Они образуют, очевидно, подгруппу — циклическую подгруппу, порожденную элементом а. При этом возможны два случая: либо все эти степени элемента а различны, либо среди них имеются одинаковые, Последнее наверняка будет, например, в любой конечной группе. Пусть, скажем, ат = а\ где т> I, Тогда ат-1 _ е Обозначим через к наименьшую положительную степень, такую что ак = е. Тогда, для того чтобы имело место равенство ап = еу необходимо и достаточно, чтобы мделилось най. Действительно, если п = кз, то ап = (ак)в = е. С другой стороны, если ап = в и п = кр + <7> где 0 < д < к, то, так как ап= =а*р • а7 = ая = е, и /г — наименьшая положительная степень, в которой ак = е, то ц = 0; и /г делится на А. В этом случае элемент а называется элементом к-го порядка. Если все степени элемента а различны, то он называется элементом бесконечного порядка. (Таким будет, например, любой отличный от 0 элемент аддитивной группы целых чисел.) Для того чтобы убедиться в том, что данное множество 0\ элементов конечной группы образует в ней подгруппу, достаточно проверить, что произведение (сумма) любых двух элементов множества 0\ принадлежит 0\. Действительно, в конечной группе каждый элемент а — конечного порядка, и если а е Ог и ак = е (откуда уже следует, что е = а-а*.. .«а принадлежит к раз множеству 0\)9 то ак~1 * а = а - ак~1 = е, и элемент аъ-\ е с1 является обратным к а. Легко видеть, что пересечение двух подгрупп группы О само является подгруппой в О. Каждая группа имеет подгруппу, состоящую из одной единицы (нуля), и каждая группа сама является своей подгруппой (эти подгруппы называются несобственными). Ясно,
280 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X что подгруппа коммутативной группы всегда будет коммутативной, в то время как подгруппа некоммутативной группы может быть и некоммутативной, и коммутативной; так, (некоммутативная) полная линейная группа содержит коммутативную подгруппу скалярных матриц. § 3. Группы преобразований. Симметрическая группа л-й степени Важный класс групп составляют так называемые группы преобразований. Пусть М — произвольное множество. Преобразованием множества М мы теперь будем называть любое взаимно однозначное отображение Р этого множества на себя. Это значит, что для каждого элемента х из М однозначно определен его о б р а з Рх = х' е М, причем каждый элемент х! из М служит образом единственного элемента х, называемого его прообразом. Умножением преобразований называется последовательное выполнение их одного за другим: по определению, (РЯ)х = Р(Ях). Умножение преобразований ассоциативно — это можно доказать точно так же, как доказывалось выше для линейных операторов. (§ 2 главы III), но, вообще говоря, не коммутативно (не коммутативно уже умножение линейных операторов). Роль единицы в этом умножении играет тождественное преобразование Е, ставящее в соответствие каждому элементу х из М его самого. Для каждого преобразования Р множества М существует обратное преобразование Р, ставящее в соответствие каждому элементу х! из М его (единственный по условию) прообраз х\ при этом, очевидно, рр-\ = р-1/> = Ещ Если множество М конечно и состоит из п элементов, то всевозможные взаимно однозначные отображения этого множества на себя называются подстановками, а соответствующая группа преобразований обозначается через 5Л и называется группой подстановок из п элементов, или симметрической группой п-й степени.
§3] ГРУППЫ ПРЕОБРАЗОВАНИИ 281 Рассмотрим симметрическую группу третьей степени 5з — группу всех взаимно однозначных отображений множества, состоящего из трех элементов а, Ьу с,— например, это могут быть числа 1, 2, 3, на себя. Так как из трех элементов можно составить всего шесть различных перестановок: 123, 132, 321, 213, 231, 312, то и число различных подстановок для них равно шести. Обозначать их удобно следующим образом: р _ (I 2 з\ р _ /1 2 3\ п Л 2 3\ **-\1 2 3/' Г»""и 3 2/> 3~ЛЗ 2 1/' р Л 2 3\ р [\ 2 3\ р _ /1 2 3\ Г*-\2 1 3/' б ~ \2 3 1/' в ~~ЛЗ 1 2/' где, например, B 3 А — это такое отображение множества 1, 2, 3 на себя, при котором 1->2 A отображается в 2), 2->-3 и 3->1. Подстановки, отличающиеся только порядком следования столбцов, например, /2 1 з\ /12 3\ \3 2 1/ И \2 3 \Г не считаются различными. Умножение подстановок — это их последовательное выполнение (сначала правого множителя, а затем — левого), поэтому, например, /1 2 3\ /1 2 3) _ /1 2 3\ _ ГвГ2~"\3 1 2/ \1 3 2)~\3 2 \) — г*' ибо в правом множителе 1-^1, в левом 1-^3, следовательно, в произведении 1 -> 3, и т. д. Единицей при этом умножении служит тождественная подста- п /1 2 з\ новка ^1 = ('1 2 зу и Аля кажД°и подстановки имеется обратная ей: Р% = Р^ * 3 ^ ^3» °4 = Р** Рь = ^б> ^в = Л 6' Для того чтобы получить подстановку, обратную данной, надо лишь поменять местами ее строки: /1 2 ЗУ /2 3 'Л/1 2 3\ \2 3 1/ \1 2 Ъ)"~\Ъ 1 2/-
282 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X Группу 53 можно представить такой таблицей Кэли: 6-3 1 Рх р* р3 р* Рь р' \ Рх Рх р2 Ра Р* Рь Ре Рг Рг Рх Р. Рь Р* Р3 Рз Рз Рь Рх Ре Р2 Р4 р4 р< Ре р5 Рх Рз р* р. Рб Рз Р4 Рг Ре Рх Р. Р. ?4 Р8 Рз Рз р8 Группа 53 некоммутативна, так как, например, РаР5 = Р2, а РьРа = Ръ (таблица Кэли этой группы не симметрична относительно главной диагонали). Мы подробно рассмотрели группу подстановок из трех элементов; обратимся теперь к общему случаю. Подстановку из п элементов — например, чисел 1,2,... ,.., п — можно обозначить символом /12 3 ... п V показывающим, что 1 переходит в ось 2 —в аг, и т. д.; здесь аь аг, ..., ап — это те же числа 1, 2, 3, ..., л, но расположенные, вообще говоря, в каком-то другом порядке. Расположение столбцов в этой записи не играет роли и, например, /1 2 3 Л /2 1 3 Л _ /3 1 4 2\ \2 4 3 1/~\4 2 3 1/~Чз 2 1 4/» И Т* А' Число подстановок из п элементов равно, очевидно, /г!,
131 ГРУППЫ ПРЕОБРАЗОВАНИЙ 283 Перемножаются подстановки в общем случае так же, как подстановки из трех элементов. Так, например, 1 2 3 4\/1 2 3 4\_Л 2 3 4\ 2 3 4 1Д4 3 1 2У~~\1 4 2 3/' (Сначала выполняется правая подстановка, а потом левая: здесь 1->4, а затем 4-^1; далее, 2->3, а затем 3->4, и т. д.) Умножение подстановок ассоциативно, но, вообще говоря, не коммутативно. Подстановка 1 2 3 ... п) 1 2 3 ... п) играет роль единицы и называется тождественной подстановкой. У каждой подстановки имеется обратная: /1 2 ...л\-1 /ах а2...а\ Группа подстановок из п элементов (симметрическая группа п-й степени) имеет, очевидно, порядок п\. Подстановки бывают двух типов: четные и нечетные. Подстановка называется четной, если обе составляющие ее перестановки (т. е. верхняя строка и нижняя) — одинаковой четности, и нечетной — в противном случае. Это определение не зависит от способа записи подстановки: если поменять местами ее столбцы, то в обеих составляющих ее перестановках произойдет по одной транспозиции, отчего четность каждой из них изменится, а значит, четность самой подстановки не изменится. Теорема 1. Произведение двух подстановок одинаковой четности является четной подстановкой, а произведение двух подстановок разной четности — нечетной подстановкой. Доказательство. Рассмотрим произведение двух подстановок
284 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X Если подстановки А и В одинаковой четности, то либо они обе четны, либо обе нечетны. В первом случае перестановки а1(Х2...ап и Рфг.-.Рт а также (^(Ь'-.Рп и Т1Т2 • • • Т» — одинаковой четности, и значит, перестановки <Х1а2... ап и уф... Тп — одинаковой четности. Во втором случае перестановки оцаг.-.а» и ^1^2.- • Р» — разной четности, но и перестановки р^ ... Р» и ТГ*Т2 • - • Т» —тоже разной четности, а значит, перестановки а1(Х2...ап и ТФ-..Т» — одинаковой четности. В обоих случаях подстановка ЛВ — четна. Если подстановки А и В — разной четности, то либо подстановка А четна, а В нечетна, либо — наоборот. В обоих случаях перестановки оыаг... ап и уф. •. Т« Раз" ной четности, и значит, подстановка А В — нечетна. Следствие. Все четные подстановки симметрической группы 5« образуют в ней подгруппу. Порядок этой подгруппы равен, очевидно, -у-. Она называется знакопеременной подгруппой симметрической группы л обозначается символом Ап. § 4. Изоморфизм групп В симметрической группе третьей степени 53 имеются три подгруппы второго порядка: {Ри Р2}, {Ри ^з}, {Рь Ра} с таблицами Кэли: Р1 Р* Рг Рг Р* Р* Р, Р1 Рг \ Р» Рг Рг Р, Рг Рз Рг Рг Рг Рг Рг Рг Рг Рг Рг Если рассматривать их независимо от группы 5з, они отличаются друг от друга только обозначениями элементов. В группе 53 имеется еще подгруппа А третьего
ИЗОМОРФИЗМ ГРУПП 285 порядка {Рь Рб, Рв} с таблицей Кэли: Рг Ръ\ Ре Рг Рг \ Ръ\ Рб Рь Рь\ РА Рг Ре Ре \ Рг\ Рь Сравним ее с группой вращений правильного треугольника: Яо ах а2 й° <*о а\ Ч &г «1 02 <к а% <*2 <*о <*1 Эти группы тоже отличаются только обозначениями элементов. Такие группы называются изоморфными; их можно считать одинаковыми, поскольку с точки зрения их «групповых» свойств (т. е. тех свойств, которые единственно изучаются в теории групп) они не различаются между собой. Дадим теперь определение изоморфизма групп. Определение 3. Группы 0\ и 02 называются изоморфными, если между их элементами можно установить взаимно однозначное соответствие, сохраняющее групповую операцию, т. е. такое, что если Хи йб Ои *2, У2 <= 02 то х\ ° У\ «-* х2 * у2. 12 и х{++ х2, у\ ¦у*
280 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X Соответствие -«-*• можно рассматривать как такое (взаимно однозначное) отображение / (скажем, мультипликативной) группы 0{ на (например, мультипликативную же) группу 02, что для всех х, у е С\ Заметим, что если / — изоморфное отображение группы Ох на группу 02, то /(^1) = е2у где еи / = 1, 2 — единица группы 0< и [/ (*Г*)] = [/ М] Для каждого Х\ е 0\. Действительно, пусть х2— произвольный элемент группы С2 и Х\ — такой элемент группы Оь что /(*1) ~*2. Тогда х2 = /(XI) = {(хм) = !(х{)}(ех) = х2}(е1) и *2 = !{хх) =Дад) =1(е1I{х1) =1(е{)х2, а значит, Цех) =е2 — единица группы 02 (ср. стр. 72), Далее, / (^ / С*1) =/(*1*Га) = /&) = «« I С*!1) / {хд = / (Л) = / (О = *» и значит, [/(*1)]-1 = /(*Г1)- Легко проверить, что все группы второго порядка (а также все группы третьего порядка) между собой изоморфны. Но для порядка четыре существуют уже две неизоморфные между собой группы: группа вращений квадрата С* и группа симметрии ромба V. Выше мы назвали циклической группой группу, образованную степенями одного из своих элементов. Можно сказать, что циклическая группа порядка п — это группа, изоморфная группе вращений правильного п-угольника (легко видеть, что все циклические группы одного и того же порядка изоморфны между собой!), а бесконечная циклическая группа — это группа, изоморфная аддитивной группе целых чисел. Заметим еще, что операции в изоморфных группах могут обозначаться по-разному. Так, мультипликативная группа положительных чисел изоморфна аддитивной
§5] РАЗЛОЖЕНИЕ ГРУППЫ ПО ПОДГРУППЕ 287 группе вещественных чисел. Изоморфное соответствие между ними устанавливается отображением 1(а) =1одва, где с Ф 1 — произвольно выбранное фиксированное положительное число. § 5. Разложение группы по подгруппе Рассмотрим сначала следующий пример. Пусть О будет аддитивная группа целых чисел и А — ее подгруппа, состоящая из всех чисел, кратных к. Разобьем группу Она классы, относя к одному классу числа, дающие при делении на к одинаковые остатки. Тогда для того, чтобы два числа х и у попали в один и тот же класс, необходимо и достаточно, чтобы их разность делилась на к и, значит, принадлежала подгруппе А: х—у = кп&А$ откуда х — у + а> где а е Л. Так мы получим, очевидно, к классов, считая одним из классов и подгруппу А. Схематически это разложение группы целых чисел по подгруппе чисел, кратных к> при к = 5 можно представить следующим образом: А П+А 1 Г+Л \3+А Н ... -20, ... —19, ... —18, ... -17, ... —16, —15, —14, -13, -12, -И, —10, -9, —8 -7, -6, —5, —4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 И, 12, 13, 14, 15, 20, ... 16, 21, ... 17, 22, ... 18, 23, ... 19, 24, ... Введем теперь операцию сложения в множестве самих классов. Пусть даны два класса В и С. Выберем в каждом из них по одному элементу (по представите-
288 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X лю), скажем, Ь^В и сеС, и сложим их, а суммой классов В + С условимся считать класс, содержащий сумму Ь + с. Такое определение сложения классов будет иметь смысл, если тот класс, в котором содержится сумма Ь + Су не зависит от выбора представителей Ь и с в классах В и С; проверим, что это действительно так. Если Ъ' тоже принадлежит В, а с'е С, то Ъ-—Ъ' = кп\ и с—с' = кп2у а тогда (& + с).-(&'+.с/)=А(л, + п2) делится на к и, значит, суммы Ь + с и Ь' + с' принадлежат одному и тому же классу. Так определенное сложение классов ассоциативно и коммутативно, ибо этими свойствами обладает сложение в самой группе О. Класс, совпадающий с подгруппой Ау играет роль нуля, так как в качестве представителя из А можно взять нуль, а # + 0 = # при всех § е О. Наконец, для каждого класса В имеется противоположный ему: если ЬбВ, то класс, содержащий —Ъ, будет противоположным к В, так как Ь+(— Ь) = 0 е Л. Поэтому совокупность построенных классов сама образует группу относительно определенного нами сложения классов. Полученная группа (группа классов) называется фактор-группой группы целых чисел по подгруппе чисел, кратных к. Она является, очевидно, циклической группой порядка к. Аналогичная конструкция применима и в общем случае. Пусть О — произвольная, на этот раз мультипликативная группа, и А — некоторая ее подгруппа. Обозначим через хА множество всех элементов вида хау где а^А\ хА называется левым смежным классом группы О по подгруппе А. Каждый элемент у, принадлежащий классу хАу назовем эквивалентным х (будем писать у ~ *). Отметим следующие свойства этого понятия: 1. Каждый элемент х эквивалентен самому себе: х~х (р еф л е кс ив ноет ь отношения ~), так как х = хе^хА. 2. Если у ~ Ху то х ~ у (симметричность отношения ~).
§ 5] РАЗЛОЖЕНИЕ ГРУППЫ ПО ПОДГРУППЕ 28Э Действительно, если у ~ х, т. е. у^хА, то у = ха, где а е Л, а тогда х = уа~1 е #Л, и значит, х ^ у. 3. 5слг/ х ~ у и */ ~ г, го .V ~ г (транзитивность отношения ~). По условию, х ~ у, т. е. х = уаи и г/ ~ г, т. е. у = га2, где аь а2еЛ. Но тогда # = {га2)а\ = 2(а2Я1) е гЛ, и значит, х ~ г. Сделаем теперь отступление общего характера. Предположим, что для элементов некоторого множества М задано отношение ~ (запись х ~ у читается: «х эквивалентно у»), обладающее свойствами рефлексивности (всегда х~х), симметричности (если х ~ у, то у ~ х) и транзитивности (если х ~ у и у ~ 2, то х ~ г)\ тогда говорят, что в этом множестве задано отношение эквивалентности. Примерами отношения эквивалентности могут служить равночисленность конечных наборов предметов, параллельность прямых, подобие треугольников, и т. д. Теорема 2. Если в множестве М задано отношение эквивалентности, то это множество разбивается на непересекающиеся классы эквивалентных между собой элементов. Доказательство. Обозначим через 3(х) множество всех элементов, эквивалентных х (элемент х'^8(х) в том и только в том случае, если х'~ х). Покажем сначала, что если элементы х и у эквивалентны, то соответствующие классы 8(х) и 8 (у) совпадают. Действительно, если х' е 5(х), то х/ ~ х. Но так как х ~ у, то х/ ~ у и, значит, /е5((/). Мы видим, что каждый элемент х' из класса 5(х) принадлежит 8(у). Аналогично показывается, что каждый элемент у' из класса 8 (у) принадлежит 8(х). Следовательно, 5(#) = = 8(у). Покажем, далее, что если элементы х и у не эквивалентны, то классы 8(х) и 8 (у) не пересекаются. Действительно, если г ^ 8{х) () 8(у)> то г ~ х и г ~ у, а тогда х ~ у. Теорема доказана. Вернемся к нашей группе О и введенному в ней выше отношению ~. По теореме 2 группа О разбивается на (непересекающиеся) классы эквивалентных между собой элементов. Эти классы называются левыми смеж- 10 Л. И. Головина
290 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X ними классами группы О по подгруппе Л. Одним из этих классов будет, очевидно, сама подгруппа Л. Если О — конечная группа, то все ее смежные классы по данной подгруппе Л состоят из одного и того же числа элементов (элементы смежного класса хА взаимно однозначно соответствуют элементам подгруппы Л, так как если бы ха\ равнялось ха2, то а\ было бы равно а2). Отсюда вытекает важная Теорема Лагранжа. Порядок подгруппы ко- нечной группы является делителем порядка группы. Доказательство. Пусть О — конечная группа порядка п и Л — ее подгруппа порядка к. Разложим группу О на левые смежные классы по подгруппе А. Если / — число полученных классов, то, поскольку каждый класс состоит из к элементов, общее число элементов группы п — А/, и значит, п делится на к. Число / (тоже являющееся, очевидно, делителем п) называется индексом подгруппы Л в группе О. Каждый элемент § группы О порождает в ней цик« лическую подгруппу {§}, состоящую из всех степеней этого элемента. Порядок подгруппы {§} совпадает с порядком элемента д в группе О. Ввиду теоремы Лагранжа порядок каждого элемента конечной группы является делителем порядка группы. Всякая конечная группа, порядок которой —простое число, является циклической, так как циклическая подгруппа, порожденная в ней любым из ее элементов (кроме е), должна совпадать со всей группой. Аналогично левостороннему разложению, можно построить правостороннее разложение группы О по подгруппе Л (на классы Ах). В коммутативном случае оба разложения совпадают (состоят из одних и тех же классов). В некоммутативной группе левостороннее и правостороннее разложения могут оказаться различными. Рассмотрим, например, разложение симметрической груп* пы 53 по ее подгруппе В = {Ри Р2}. Левостороннее разложение состоит из классов Я, РЪВ = Рф = {Р4, Р5}} РгВ = Р6В = {Рз, Ре},
§6] НОРМАЛЬНАЯ ПОДГРУППА 291 йравостороннее разложение — из классов В, ВР6 = ВРА = {Р4, Ре}, ВРЬ = ВРг = {Р3, Рб}. Б то же время левостороннее и правостороннее разложения группы 53 по ее подгруппе третьего порядка А ;= {Рь Р5, Ре} совпадают: каждое из них состоит из двух классов А = {Рь Р5, Ре} и АР2 = Р2Л = {Р2) Р3, Р4}. § 6. Нормальная подгруппа Обобщим теперь конструкцию, которая в начале § 5 привела нас к понятию группы классов (факторгруппы) аддитивной группы целых чисел. Пусть А — подгруппа произвольной группы О. Образуем всевозможные левые смежные классы группы О по подгруппе А и попытаемся определить умножение этих классов следующим образом: если даны два класса В и С, выберем из них по представителю: (?ей, с е С, перемножим этих представителей и в качестве произведения ВС возьмем тот класс, в котором содержится Ъс. Необходимо только проверить, не зависит ли это определение произведения классов от выбора представителей в них. Итак, пусть Ь' ~ Ь9 с' ~ с\ можем ли мы утверждать, что Ь'с' ~ Ъс} По условию, Ь' = Ьа\ и с' = са2у откуда Ь'с' = Ьа\са2. Если группа О коммутативна, то а\С = са\ A) и Ь'с' = Ьс{аха2), т. е. Ь'с' ~ Ъс. В некоммутативной группе равенство A), вообще говоря, места не имеет. Однако для нашей цели достаточно следующего, более слабого, чем коммутативность, условия: достаточно, чтобы произведение а{с можно было представить в виде са3, где аъ^А, причем а3, вообще говоря, отлично от а\. Если это так, то Ь'с' = Ъс{аъа2), т. е. Ь'с' ~ Ъс, и произведение классов не зависит от выбора представителей в них. Итак, мы будем теперь предполагать, что подгруппа А обладает следующим свойством: для каждого элемента а^А и произвольного элемента § е О найдется элемент !х<=А такой, что а§ = §а. Это значит, что для 10*
292 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X любого а&А и произвольного §бО произведение §~1а§ =¦ йеА Обозначив через 8~1А§ множество всевозможных элементов вида §~1ад, где а^А, дадим следующее Определение 4. Подгруппа А группы О называется ее нормальной подгруппой, или нор- ма л ьны м делителем, или еще инвариантной подгруппой, если для любого элемента §еС Г1А§ Е Л. Теорема 3. Пересечение двух нормальных подгрупп группы О само является нормальной подгруппой О. Доказательство. Пусть А\ и Л2— нормальные подгруппы группы О и Л = Л1ПЛ2. Мы знаем, что Л —подгруппа в С (§ 2). Далее, так как Л^Л1 и Л г Л2, то для любого элемента §бО и 8'1Ае д= 8~1А28 <= Л2, а значит, «гМя = Л1П л2=^=л, т. е. Л — нормальная подгруппа группы О. Теорема 4. Для того чтобы подгруппа А группы О была ее нормальной подгруппой, необходимо и достаточно, чтобы для любого элемента §еС имело место равенство 8-1Ае = А. B) Доказательство. Достаточность условия B) следует из определения 4. Для того чтобы доказать его необходимость, предположим, что Л — нормальная подгруппа группы О; тогда для любого элемента ^еС Г^еЛ, а значит, и §А§-1 = (§"~1)-1Л§-1 е Л, откуда, в свою очередь, следует, что Л ^ §~1А§. Но если ЗГМ^ еЛиЛд §-хА§у то ^Л^ «= Л. Теорема 5. Для того чтобы подгруппа А группы О была ее нормальной подгруппой, необходимо и достаточно, чтобы левые и правые смежные классы группы О по подгруппе А совпадали,
§7] ФАКТОР-ГРУППА 293 Доказательство. Из равенства Г1А§ = А вытекает, что А§ = ВА> т.е. что для любого §еО левый и правый смежные классы, содержащие этот элемент, совпадают. Обратно, если для любого ^еС Ад = #4, то ёА§ = А9 и А —- нормальная подгруппа. Так, в симметрической группе 5з подгруппа А = = {?!, Р$, Рб} будет нормальной подгруппой, подгруппы же {Рь Рг}, {Л> ^з} и {Рь Р4} нормальными не являются. Легко видеть, что при любом п знакопеременная подгруппа Ап является нормальной подгруппой симметрической группы 5П, так как разложение группы 5П по подгруппе Ап (и левостороннее, и правостороннее) состоит из двух классов — самой подгруппы Ап и множества В всех остальных элементов (т. е. множества всех нечетных подстановок). Совершенно аналогично этому в любой группе всякая подгруппа индекса 2 является нормальной подгруппой. В коммутативной группе- любая подгруппа являет- ся} очевидно, нормальной. § 7. Фактор-группа Пусть О — произвольная группа, А—ее нормальная подгруппа и 5 — множество всевозможных смежных класов группы О по подгруппе А (напоминаем, что левые и правые смежные классы в этом случае совпадают). В множестве классов 8 введем операцию умножения, полагая хА • уА = хуА. Так как подгруппа А является нормальной, то произведение хА • уА не зависит от выбора представителей х и у в перемножаемых классах,
294 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП 1ГЛ. X Проверим, что у нас получилась группа. 1. Ассоциативность умножения классов вытекает из ассоциативности умножения в группе О: (хЛ • уА) • гА = (ху)А • гА = (ху)гА = =х(уг)А = хА • (уг)А = хА • (уА -гА), 2. Единичным элементом служит сама подгруппа Л: А . хА = еА • хА = ехА == хЛ, хЛ . Л = хЛ • еА = хеА = хЛ. 3. Обратным к классу хА будет класс дгМ, так как хЛ • х~!Л = хх Л = еА = Л, х-1Л • хЛ = х-[хЛ = еЛ = Л. Полученная группа обозначается через 01А и называется фактор-группой группы С по нормальной под- группе Л. Фактор-группа коммутативной группы коммутативна, так как в этом случае для любых двух классов хА • уА= (ху)А = (ух)А = уА . хЛ. Порядок фактор-группы конечной группы равен индексу нормальной подгруппы Л в группе С, и значит, является делителем порядка п группы О. Фактор-группа симметрической группы 5П по ее подгруппе Лп состоит из двух элементов и является, следовательно, циклической группой второго порядка. Пример. Покажем, что в группе О всех невырожденных матриц порядка п (например, с вещественными элементами) подгруппа А унимооулярных матриц (т. е. матриц с определителем, равным 1) является нормальной подгруппой, и найдем фактор-группу О/А. Унимодулярные матрицы образуют подгруппу в О, так как произведение двух унимодулярных матриц и матрица, обратная унимо- дулярной, являются унимодулярными (теорема 3 главы III). Далее, подгруппа А унимодулярных матриц является нормальной, так как если матрица а е А и, значит, \а\ = 1, то для любой матрицы ^еС
§ 8] ПРЯМОЕ ПРОИЗВЕДЕНИЕ ГРУПП 295 Найдем фактор-группу О/А. Покажем прежде всего, что для того, чтобы две матрицы бис принадлежали одному и тому же смежному классу группы О по подгруппе Л, необходимо и достаточно, чтобы они имели равные определители. Действительно если Ь ~ с, т. е. Ь = са, где аеЛ и, значит, \а\ = 1, то \Ь\ = \с\\а\ = ¦= М- Обратно, если \Ь\ =¦ |с|, то Ь = с(с~1Ь), где \(Г*Ь\ = \с-ЦЬ\ - \с\~*\Ь\ = 1 и, значит, сг1Ь е Л, т. е. Ъ е сЛ и Ъ ~ с. Таким образом, каждый смежный класс С по Л вполне характеризуется определителем входящих в него матриц. Перемножению классов отвечает перемножение произвольных представителей из них, и, значит, произведение классов В (матриц с определителем р) и С (матриц с определителем у) есть класс ВС — матриц с определителем ру. Следовательно, фактор-группа О/А изоморфна мультипликативной группе отличных от нуля вещественных чисел. § 8. Прямое произведение групп Определение 5. Пусть даны группа О и две ее подгруппы 0\ и С2, причем выполнены следующие условия: 1) С?1 и С?2 являются нормальными подгруппами группы О, 2) пересечение С\ П 0% состоит только из единицы е> 3) каждый элемент группы О может быть представлен в виде произведения а\а2, где ах е Ои а2е 02. Тогда группа О называется прямым произведением своих подгрупп 0\ и 02. (Это записывается так: О = = Ох X 02.) Теорема 6. I. Каждый элемент группы 0=:01у^02 однозначно представляется в виде произведения аха2, где ах ^Ох и а2 е С2. II. Каждый элемент а\ е Сх коммутирует с каждым элементом а2 е= 02 (т. е. аха2 = а2а{). Доказательство. I. Предположим, что какой-то элемент группы О двумя способами представлен в виде произведения элементов подгрупп 0{ и С2: аха2 = ЪХЪ2 (где аь Ьх е Оь а2, Ь2 е 02). Умножая обе части последнего равенства слева на &Г\ а справа —на а?1, получим Ы1а1 = Ь2а2 \ C) Но Ь^ах&Сх, а Ь2а2* е02, и, значит, элемент C)
296 основные понятия теории групп [гл. х принадлежит пересечению ОхП^ т. е. он равен е Ы1^ = е= Ъга1г, откуда Ь{ = а\ и Ь2 = а2. II. Пусть #1 €= (?1 и а2 еС2, Рассмотрим так называемый коммутатор этих элементов: а^а^а&г. D) Произведение а^а^ах е С2, так как С2 — нормальная подгруппа, и значит, произведение (яГ1^1^) а2 принадлежит 02. С другой стороны, произведение а1хаха^ принадлежит Ои так как <?1 — нормальная подгруппа, и значит, произведение а ^(а^а^) принадлежит 6\. Таким образом, коммутатор D) принадлежит пересечению 0\ П 02> и потому он равен е: а?а^арг = е. Умножая последнее равенство слева на а2аи получим а\а2 = а2й\, т. е. .любой элемент из 0\ коммутирует с любым элементом из 02. Аналогично можно определить прямое произведение О = С{ X 02 X . • • X 6п п множителей. Здесь все подгруппы С» являются нормальными подгруппами О, пересечение каждой из подгрупп О» с подгруппой, порожденной в С всеми остальными множителями Оь 02, ..., 0<-ь 0{+и ..., Оп, состоит только из единицы, и каждый элемент группы О можно представить в виде произведения аха2... ап, где а» ^ 0{. Легко видеть, что порядок прямого произведения конечных групп равен произведению порядков сомножителей. Теорема 7. Пусть даны две группы А и В\ тогда существует такая группа G, которая является прямым произведением своих подгрупп Ох и С2, соответственно изоморфных данным группам А и В. Доказательство. Будем обозначать элементы группы А буквами а, а'\ ..., элементы группы В — буквами Ь, Ъ' Рассмотрим множество всевозможных пар элементов (а, Ь), где а&А, Ь е В. Произведение двух таких пар, по определению, положим равным (аь Ьг) (а2у Ь2) = (аха2, Ьф2). Легко видеть, что множество О пар (а, Ь) с так определенным умножением является группой, единицей которой служит пара (а0, Ь0), где а0 — единица группы Л, а &о — единица группы В. Множество 0\
§ 9) КЛАССЫ СОПРЯЖЕННЫХ ЭЛЕМЕНТОВ ГРУППЫ 297 пар вида (а, Ь0) образует в 6 подгруппу, изоморфную, очевидно, группе Л, а множество 62 пар вида (а0, Ь) — подгруппу, изоморфную В. Покажем, что группа О является прямым произведен и- е м своих подгрупп С\ и 02. Действительно, пересечение подгрупп 0\ и 02 состоит только из единицы —пары (а0, Ь0). Каждый элемент (а, Ь) из О является произведением элемента (а, Ь0) из 0\ и элемента (а0, Ь) из 02. Наконец, каждая из подгрупп Ох и 02 является в О нормальной подгруппой. Покажем это, например, для О]. Рассмотрим произведение §~Ча'> Ь0)§, где #= (а, Ь) — произвольный элемент из G, а (а\ Ь0) принадлежит 0\. Мы имеем, очевидно, ГЧ*,Ьо)8= 1а,Ь)-Ц*9Ьо)(а,Ь) = = (а-1, б) (а', 6о) (а, Ь) = (а~*а'а} Ь0) е Си и значит, подгруппа 0\ — нормальная. Так, например, прямое произведение А X В двух циклических групп А = {еь о} иВ= {е2, Ь) второго порядка состоит из четырех элементов е «= (еи е2) а = (а, е2), 6 = (еь 6), а& = (а, 6). Легко видеть, что эта группа изоморфна клейновской группе V четвертого порядка. Прямое произведение циклической группы а = {е^ а) второго порядка и циклической группы В = {е2, Ь, Ь2} третьего порядка состоит из элементов е = (*ь е2), а = (а, е2), Ь = (еь 6), аЬ = (а, Ь), б2 = (еи Ь2), аЬ2 = (а, Ь2) и является циклической группой шестого порядка, так как, например, (аЬJ = Ь\ (аЬK = а, (аЬL = Ь, (аЬM = аЬ\ (аЬN = е. § 9. Классы сопряженных элементов группы Определение 6. Пусть О — произвольная (для определенности, мультипликативная) группа и а — один из ее элементов. Каждый элемент Ь вида §~1а§, еде ^еО, называется сопряженным с а. (Условимся писать в этом случае Ь ».а.) Говорят еще, что элементе получается трансформированием элемента а с помощью элемента §. Отметим следующие свойства отношения сопряженности «: 1. Каждый элемент сопряжен самому себе, а« а (рефлексивность отношения «),— так как а = = е~1ае.
298 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X 2. Если элемент Ь & а, то ажЬ (симметричность отношения «)—так как из равенства Ь =* = 8~1а8 вытекает, что а = ёЬ§~1 = (§~1)~1Ь§-1. 3. Если а & Ь и Ь & с, то а & с (транзитивность отношения «). Действительно, из равенств я = ё^Ьёъ Ь = §2 гс§2 вытекает, что а = ё^ё^^ёх = Таким образом, отношение сопряженности « рефлексивно, симметрично и транзитивно, а значит, оно является отношением эквивалентности (см. стр. 289) и определяет разбиение группы О на непересекающиеся классы сопряженных между собой элементов. Множество элементов, сопряженных с данным элементом а (т. е. элементов вида ё~1а§, где ^еО), мы обозначим через К (а). Очевидно, что а&К(а). Классы сопряженных элементов состоят, вообще говоря, не из одного и того же числа элементов. Единица всегда образует отдельный класс, так как ё'1е§ = е при любом §. Вообще, каждый элемент, перестановочный со всеми остальными элементами группы, образует отдельный класс. В коммутативной группе каждый элемент образует отдельный класс, и значит, в коммутативной группе число классов сопряженных элементов равно порядку группы. В некоммутативной группе число классов меньше порядка группы. Порядки сопряженных между собой элементов одинаковы. Действительно, если ак = е и Ь = #-1 а§, то Ьк = $-*а8 • ёа§ ..... §-1а§ = §акё = е% Обратно, если Ьш = е, то и аш = е} и значит, те наименьшие степени, в которых элементы а и Ь равны единице, одинаковы. Пример. В симметрической группе 53 элемент Р{ первого порядка, элементы Р2, Рз, Ра — порядка 2, элементы Р5 и Рб — порядка 3. Единичный элемент Р\ сопряжен только сам с собой. Три элемента порядка 2 сопряжены между собой, так как, например, Элементы Р5 и Рв тоже сопряжены между собой, так как Р2~1Р$Р2 = = Рб. Но элементы Р2, Р3, Ра второго порядка не могут быть сопряжены с элементами Р5 и Рб третьего порядка. Таким образом, группа $з состоит из трех классов сопряженных элементов: {Р.}, {Ръ Р., Р«Ь (Р5, Ре}.
§ 9] КЛАССЫ СОПРЯЖЕННЫХ ЭЛЕМЕНТОВ ГРУППЫ 299 Мы видим, что число элементов в каждом классе делит порядок группы. Теорема 8. Число элементов в каждом классе со- пряженных между собой элементов конечной группы является делителем порядка группы. Доказательство. Пусть О — произвольная конечная группа исеО. Обозначим через М(а) множество всех элементов группы, перестановочных с а, #(а) называется нормализатором элемента а. Проверим, что Ы(а) является подгруппой группы О. Действительно, если 6 е #(а) и с е #(а), то аЬ = Ьа и ас =са, а тогда и а(Ьс) «в (аЬ)с = (Ьа)с = Ъ(ас) «= Ь(са) = (Ьс)а, т. е. и 6сеЛ^(а). Рассмотрим разложение группы С на правые смежные классы по подгруппе N = #(д) и докажем, что между этими классами и элементами, сопряженными с а, существует взаимно однозначное соответствие. Для этого покажем, что если два элемента х и у принадлежат одному и тому же смежному классу О по #, то при трансформировании ими элемента а получается один и тот же элемент Ь (сопряженный с с), и обратно. Пусть элементы хну принадлежат одному и тому же смежному классу О по Л^; тогда у = Нх, где ЛеМ Если х~]ах — Ь, то и у-^ау = х-1к~1аНх = х~1ах = Ь. Обратно, пусть р~хар = Ь и ц~хац = 6. Тогда р = (р?"*1)?» и нам надо показать, что рц~х е ЛЛ Но произведение (РГ1)^^) = Я(Р~1ар)Г1 = ^Т1 = в, и значит, а(рд~1) = (рд~1)а, откуда р? е # и ре^, т. е. элементы /) и (/ принадлежат одному и тому же смежному классу О по N. Так получается взаимно однозначное соответствие между правыми смежными классами группы О по подгруппе N = Л'(а) и элементами, сопряженными с а (элементу Ь = §~'а$, сопряженному с а, соответствует правый смежный класс, состоящий из всех тех элементов # группы О, при трансформировании которыми элемента а получается Ь). Следовательно, число элементов, сопряженных с а, равно числу классов в разложении группы О по подгруппе N(а), т. е. равно индексу нормализатора элемента а в группе и и, значит, является делителем порядка группы (см. доказательство теоремы Лагранжа). Теорема 9. Для того чтобы подгруппа 0\ группы О была нормальной подгруппой, необходимо и достаточно, чтобы она содержала вместе с каждым своим элементом а и весь класс сопряженных с ним элементов К (а). Доказательство этой теоремы непосредственно вытекает из определения нормальной подгруппы. Пересечение 1 нормализаторов всех элементов группы О является подгруппой в О (как и пересечение любого множества подгрупп).
300 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X Оно состоит из всех тех элементов группы, каждый из которых коммутирует со всеми элементами группы, и называется центром группы. Центр группы является, очевидно, ее нормальной подгруппой. § 10. Классы сопряженных элементов прямого произведения групп Теорема 10. Пусть группа О равна прямому произведению 0\ X ^2 своих подгрупп С\ и 02. Тогда, если А\ есть класс сопряженных элементов группы О и а А2 — класс сопряженных элементов группы 02, то всевозможные произведения вида а\а2, где а\^Аи а2&А2, образуют класс сопряженных элементов самой группы О, и обратно, каждый класс сопряженных элементов группы О получается таким образом. Доказательство. Нам надо показать, что если ах « Ъх в группе 0\ и а2 « Ь2 — в С2, то а\а2 « ЪХЬ2 в группе О = 0\ X 02, и наоборот. Пусть Ъх = Вх^гВг и ь* = ё^а^ёч (гДе ё\^0\ и йеОг). Тогда, так как элементы из подгрупп С\ и 02 коммутируют между собой, имеем = (В-гВ^ сл (^й) =" (й^)" аха2 (^2), и значит, 6162 ^ й1^2 в группе О. Обратно, предположим, что элементы аха2 и Ь\Ъ2 прямого произведения С = 0{ X 02 сопряжены в О, т. е. что ЪХЪ2 = в~1а1<*9.В, где ?еО и, значит, § = §{§29 В\^°и В2 е 02. Тогда ЬА = (&&)-1 аха2 (^2) - В^В^а^ВуВ* =¦ откуда, ввиду единственности разложения элементов прямого произведения на компоненты из разных сомножителей, получаем Ь1 = §Г 1а1^1 и Ь2 = ё^а^г» т. е, &1 « аь в группе О1 и 62 ~ я2—в группе 02. Следствие. Если группа Ох содержит р классов, а группа С2 — ц классов сопряженных элементов, то число классов сопряженных элементов группы О = = 0\ X 02 равно рц>
§ П] ГОМОМОРФИЗМ ГРУПП 301 § 11 Гомоморфизм групп Определение 7. Говорят, что группа О гомоморфна группе О', или что имеется гомоморфное отображение / группы С на группу С, если каждому элементу х группы О поставлен в соответствие определенный элемент {(х) группы С (причем каждый элемент группы С поставлен в соответствие хотя бы одному элементу группы О) так, что для всех элементов х, у&О Нху)=Цх)Цу). Как и изоморфизм, это соответствие «сохраняет групповую операцию». Чем же тогда гомоморфизм отличается от изоморфизма? Тем, что здесь отображение группы О на группу С7 не предполагается взаимно однозначным: каждому элементу х группы О отвечает один определенный элемент /(*) из О', но разным элементам из О может быть поставлен в соответствии один и тот же элемент из С, Таким образом, изоморфизм является частным случаем гомоморфизма. Рассмотрим несколько примеров. Группа симметрии ромба V с элементами е, а, Ь, аЬ (и «определяющими соотношениями» а2 = = Ь2 = е, аЬ = Ьа) гомоморфна циклической группе С2 второго порядка с элементами Еу А (А2 = Е): можно положить, например, Пе)=1(а)=Е !(Ь)=((аЬ) = Л. Легко видеть, что произведению любых двух элементов группы О отвечает произведение соответствующих элементов группы 6'. Гомоморфное отображение группы V на группу С2 можно установить и иначе: <р(е) = фF) = Е, ф(а) = ф(а&) = Л, или еще так: $(е) = ур(аЬ) = Е, ф(сг) = фF) = Л. Другой пример. Циклическая группа С$ шестого порядка с элементами е, а, а2, а3, а4, а5 гомоморфна циклической группе С% второго порядка {Е, Л}: Не) - К*2) =- К*4) = Е, !(а) = /(а») = /(а») = Л, и циклической группе С3 третьего порядка {Е} В} В2}: ф(е) = ф(аз) = е, ф(а) = ф(а4) = Б, ф(а2) = ф(а5) = Б2. Каждая группа гомоморфна себе самой (ибо можно положить 1(х) = х для всех элементов хеО). Каждая группа гомоморфна единичной группе (состоящей из
302 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ГРУПП [ГЛ. X одного единичного элемента Е): для доказательства достаточно положить {(х) = Е для всех элементов Легко видеть, что если / — гомоморфное отображение группы О на группу О', то }(е) = е\ где в —единица группы C, а е' — единица группы О' и [/(*)]" = = /г(*~1Ь Это доказывается так же, как соответствующие утверждения для изоморфного отображения (см. § 4). Каким вообще группам может быть гомоморфна данная группа О? На этот вопрос полностью отвечает следующая Теорема о гомоморфизмах. Каждая группа гомоморфна любой своей фактор-группе. Обратно, если группа О гомоморфна группе О', то О' изоморфна фактор-группе группы О по некоторой нормальной подгруппе Н. Таким образом, группы, которым гомоморфна данная группа О это, с точностью до изоморфизма,— все ее фактор-группы и только они. Следовательно,— в случае конечной группы О — порядок каждой такой группы является делителем порядка группы. Доказательство. I. Пусть Я — нормальная подгруппа группы О. Рассмотрим фактор-группу С/Н группы С по Я. Поставим в соответствие каждому элементу х группы С тот смежный класс, в котором содержится этот элемент, т. е. положим 1(х) = хН. Тогда Ну) =^й }(ху) = хуН. Но хуН = хН -уН = /(*)/(</). и значит, !(ХУ) = /(*)/(*/)> т. е, группа С гомоморфна своей факторгруппе С/Н. II. Пусть группа С гомоморфна группе С. Рассмотрим множество Я всех тех элементов группы 6, которые отображаются в единицу ё группы С\ т. е. таких, что /(*) = ё. Покажем, что Я —подгруппа в С. Действительно, если Н\^Н и Л2 ^ Я, то 1(Н{) = е' и }(Н2) =е', а тогда и /(/11/12) = }{к\I(Н2) = е\ т. е. и Н1Н2 е Я. Далее, если АеЯ, то {(Н) = ё и /(/I-1)•= [/(Л)]-1 = ё, т. е. и Л е Я. Эта подгруппа Я, называемая ядром гомоморфизма /, является нормальной, так как если ЛеЯ, т. е. /(/*) =* е\ то для любого элемента # е E /(«гад - /(*-')/№)/(*) = [/о?)]-1*'/^) = *'> и значит, ЯГ1** € Я. Покажем теперь, что фактор-группа С/Н изоморфна (?'. Фактор-группа С/Н образована смежными классами группы С по подгруппе Я. Все элементы ядра и только они, отображаются в единицу группы С. Покажем, что все элементы одного и того же смежного класса С? по Я отображаются в один и тот же элемент группы
§ и] ГОМОМОРФИЗМ ГРУПП 303 С. Действительно, если элементы х и у группы О принадлежат одному и тому же смежному классу по Я, то х = уН, где Н еЯ, а тогда и значит, элементы х и у отображаются в один и тот же элемент группы О'. Обратно, если {(и) = /(у), то 1(и-^) » /(«-¦)/(») = [/(и)]-1 [/(*)] = *' и значит, и"!; еЯ.т, е. не иН, и элементы иик принадлежат одному и тому же смежному классу. Мы установили взаимно однозначное соответствие между элементами группы О' и смежными классами группы О по Я. Покажем, что это соответствие является изоморфным. Пусть х и г/ — элементы группы 0, хН и */Я — содержащие их классы, Х\ = }(х) и г/1 = /((/) —соответствующие им элементы группы 6'. Классу хН фактор-группы О/Н поставим в соответствие элемент Х\ = Цх) группы С/'. Тогда имеем хН++х{ = /(*), уН++у{ = Ку), хуН+-+1(ху). Но хуН = хН . г/Я, а /(**/) = 1(хI(у), и значит, хН.уН++ Цх)Цу), т. е. взаимно однозначное соответствие -<->¦ между фактор-группой С/Я и О' «сохраняет групповую операцию», и значит, группы О/Н и С изоморфны.
ГЛАВА XI ГРУППЫ СИММЕТРИИ I ГЕОМЕТРИЧЕСКИХ ФИГУР В этой главе рассматриваются преобразования обычного трехмерного (евклидова) пространства Я (определение преобразования см. в § 3 главы X). § 1. Группа движений вещественного евклидова пространства и ее подгруппы Определение. Движением называется такое преобразование вещественного евклидова пространства К, при котором расстояния между точками не меняются: если точка Р переходит в Р', а точка (? —в С}\ то расстояние Р'C' равно РС?. Такие преобразования образуют, очевидно, группу, называемую группой движений евклидова пространства, или евклидовой группой. В группе движений пространства /? выделим множество тех движений, при которых некоторая фиксированная точка О (начало координат) остается неподвижной, т. е. переходит сама в себя. Такие движения тоже, очевидно, образуют группу—подгруппу группы движений, называемую центроевклидовой, или полной ортогональной группой. Каждому движению с неподвижной точкой О отвечает определенное преобразование соответствующего векторного пространства: если точка Р переходит в Р', то вектор ОР переходит в вектор ОР\ При этом преобразовании длины векторов не меняются; легко видеть, что не меняются также и углы между векторами, т. е. рассматриваемое преобразование сохраняет скалярное произведение векторов. Покажем, что преобразование зФ евклидова вектор- ного пространства, сохраняющее скалярное произведение^ т. е. такое, что {зФх, Жу) = (х, у) при всех х}
§П ГРУППА ДВИЖЕНИЙ И ЕЕ ПОДГРУППЫ 305 У&К, является линейным (и следовательно, ортогональным) преобразованием, т. е. что $$<(х + у) = = зФх-\- $4>у и $4<(ах) = азФх при всех х, г/е/? и произвольном а. Действительно, имеем №(х + у) — зФх — Жу, з&(х + у) — зФх — Жу) = = №(х + у),&(х + у))-{&х9а{х + у))- — (&у, &{х+у)) — (^(х+#), &*) + №х, Мх) + + (&у, .^х) — (^(х+у), ^*/) + (^х, <&у) + №у, &у) = = (х + у} х + у) — (х, х + у) — (у9 х + у) — {х+у, х) + + {х, х) + (у, х) — (х + у, у) + (х, у) + (у, у) = = {{х + у) — х — у, {х + у) — х — у)=0, откуда (поскольку пространство —евклидово) &(х + у)—&х — &у = 0 и &(х + у) =&х + &у Далее имеем (&{ах) — абФх, ^ (ах) —а*$#х) = (^ (ах), <$^(ах)) — — а (^х, Ж (ах)) — а (^ (ал:), ^х) + а2 (^дс, *5^х) = = (ах, ах) — а(х, ах) —а(ах, х) +а2(х, х) = 0, и значит, ^ (ах) — а^х = 0, т. е. зФ (ах) = а*5^х Таким образом, полная ортогональная группа — это группа всех (линейных) ортогональных преобразований векторного пространства. Пусть теперь к — трехмерное евклидово пространство. Напомним, что матрица ортогонального преобразования трехмерного пространства в некотором ортонорми- рованном базисе приводится либо к виду Г1 0 0 -1 0 СОЗ ф *— 81П ф |_0 81П ф СОЗ ф ^ A) (и тогда преобразование представляет собой поворот вокруг некоторой оси — «новой» оси х), либо к виду Г-1 0 ОТ 0 С05 ф — 5111 ф B) |_ 0 $1пф С08ф^ П Л. И. Головина
306 ГРУППЫ СИММЕТРИИ ГЕОМЕТРИЧЕСКИХ ФИГУР [ГЛ. XI (в этом случае преобразование состоит из поворота вокруг новой оси х и симметрии относительно плоскости, перпендикулярной к этой оси; ясно, что если ф кратно 2лк, то «поворот» представляет собой тождественное преобразование). Определитель преобразования A) первого рода (поворота вокруг какой-то оси, проходящей через начало координат), равен + 1, а определитель преобразования B) второго рода равен —1. Поэтому все преобразования первого рода (вращения) образуют подгруппу полной ортогональной группы, называемую группой вращений (трехмерного) пространства. На плоскости матрица ортогонального преобразования приводится либо к виду [С05 ф — 81П ф1 ^ [1 (Л вшф созф]' ЛИб0К [о -1> В первом случае (преобразование первого рода) это — поворот вокруг начала координат на угол ср; определитель его матрицы равен + 1. Во втором случае (преобразование второго рода) это — симметрия относительно некоторой прямой — «нсвой» оси х, определитель его матрицы равен — 1. Все повороты плоскости образуют подгруппу ортогональной группы— группу вращений плоскости. Ясно, что все рассматриваемые нами пока группы (евклидова, ортогональная, группа вращений) — бесконечны. Дальше нас будут интересовать различные конечные подгруппы полной ортогональной группы и группы вращений, которые могут быть получены следующим образом. Возьмем какую-нибудь (в определенном смысле «симметричную») фигуру плоскости или пространства и рассмотрим всевозможные ортогональные преобразования (или всевозможные вращения), переводящие эту фигуру в себя. Все такие преобразования, очевидно, образуют группу. Мы будем называть ее группой симметрии (соответственно группой вращений) рассматриваемой фигуры (в случае пространства иногда говорят не «фигура», а «тело»). Понятие группы симметрии фигуры является математическим эквивалентом общежитейского представления о «симметричных» и «несимметричных» фигурах, которое
$ 1] ГРУППА ДВИЖЕНИЙ И ЕЕ ПОДГРУППЫ 307 само по себе точного смысла не имеет (поэтому выше мы заключили слово «симметричное» в кавычки): «степень симметричности» фигуры определяется «богатством» ее группы симметрии. Так, например, ясно, что ромб «менее симметричен», чем квадрат,— и группа симметрии ромба содержит всего 4 элемента, тогда как группа симметрии квадрата—8 элементов. (Найдите сами все элементы группы симметрии квадрата; полное описание этой группы, входящей в серию диэдр альныхгрупп и обозначаемой через Д4> дается ниже, в § 4.) А М В Аг *; 6) Рис. 28. Далее, можно сказать, что правильный шестиугольник «более симметричен», чем правильный треугольник. Ведь правильный шестиугольник АВСйЕР переходит в себя при всех тех преобразованиях, при которых переходит в себя треугольник АСЕ (рис. 28, а) —при поворотах (вокруг центра) на углы 120° и 240° и симметриях относительно прямых АО, ВЕ и СР, но, кроме того, шестиугольник переходит в себя еще и при поворотах на углы 60°, 180° и 300°, а также при симметриях относительно прямых МЫ, Р($ и /?5. Группа симметрии правильного треугольника 1K содержит б, а группа симметрии правильного шестиугольника Иь—12 элементов (см. ниже, § 4), «Особенно симметричен» круг, он «гораздо более симметричен», чем любой (даже правильный) многоугольник. Действительно, круг переходит в себя при всех преобразованиях, при которых переходит в себя любой (вписанный в этот круг) правильный л-угольник,
308 ГРУППЫ СИММЕТРИИ ГЕОМЕТРИЧЕСКИХ ФИГУР (ГЛ. XI (рис. 28, б), поэтому группа симметрии круга бесконечна. Легко видеть, что группа вращений круга изоморфна группе комплексных чисел, по модулю рае* ных 1. Действительно, круг переходит в себя при повороте (вокруг его центра) на любой угол а, где а достаточно брать в пределах от 0 до 2я, 0<а< 2я, Повороту ф на угол а поставим в соответствие комплексное число (по модулю равное 1) гф = соз а + *зта; тогда повороту -ф на угол р будет соответствовать число /\> = соз р + 15Ш р, а повороту ф\|) на угол ос + р — число гФЧ, = соз (а + E) + I31П (а + Р), равное, очевидно, произведению гф-/\>. § 2. Сопряженные элементы в группе вращений трехмерного пространства Как известно, осью называют прямую, на которой задано определенное направление, или направленную прямую. Ось, проходящую через начало координат, можно задать некоторым вектором. Говоря о повороте вокруг оси / на угол ф, имеют в виду поворот в положительном направлении, т. е. против часовой стрелки, если смотреть с положительного направления оси /. Пусть сначала О — произвольная группа линейных преобразований трехмерного векторного пространства и ^еО. Элемент & сопряжен с зФ в группе О, если найдется такое ^бО, что 91 = Ф^бФЧ? (и значит, зф = 9>?др8~х). Выясним геометрический смысл понятия сопряженности. Для этого вернемся к равенству D) на стр. 113. При п = 3 оно принимает вид У-1^^ = ацег + а2{е2 + а'ъ1е3, г = 1, 2, 3, и его можно интерпретировать следующим образом: преобразование Я!?-х$4& в базисе еи е2, еъ имеет туже матрицу, что преобразование зФ в базисе е[ = <8еъ е2 = Фе29 еъ = Ъе^ получающемся из базиса е\, е2, еъ посредством преобразования V. Пусть теперь О — группа вращений (трехмерного) пространства. Тогда если ^ — поворот вокруг оси
§ 3] ГРУППА ВРАЩЕНИЙ ПРАВИЛЬНОГО л-УГОЛЬНИКА 309 /, определяемой вектором х (короче, поворот вокруг оси х) на угол ф, то сопряженный поворот зФ = ^ЗЙ?'1 — это поворот вокруг оси *ёх на тот же самый угол ф. Оси х и Фх, где ?еС, называются эквивалентными (относительно группы О). Таким, образом, сопряженные повороты в группе вращений трехмерного евклидова пространства — это повороты вокруг эквивалентных осей на один и тот же угол. Обратно, если <% есть поворот вокруг некоторой оси ху а зФ — поворот вокруг эквивалентной оси ЯЯх на один и тот же угол ф, то повороты $Ф и $ сопряоюены между собой, так как в этом случае § 3. Группа вращений правильного я-угольника Сп Эта группа уже рассматривалась на стр. 279. Правильный п-угольник (рис. 29, а) совмещается сам с собой при п поворотах вокруг его центра на углы 0, — — -2, ..., — (п — 1). Обозначим теперь эти повороты соответственно через ву г, г% гп-\ . Образованная ими Рис. 29. группа является циклической группой порядка п. и обозначается символом Сп. Яегко видеть, что такова же и группа вращений правильной /г-угольной пирамиды: такая пирамида пере- 11а Л. И. Головина
310 ГРУППЫ СИММЕТРИИ ГЕОМЕТРИЧЕСКИХ ФИГУР [ГЛ. XI ходит в себя при поворотах вокруг оси АВ на те же углы 0, Щ, ^.2, ..., Ц- (п - 1) (рис. 29, б). Группа Сп, коммутативна, и значит, число классов сопряженных элементов этой группы равно ее порядку. § 4. Диэдральные группы Вп Диэдральную группу тоже можно интерпретировать по-разному. Например, можно определить ее как группу симметрии того же правильного п-угольника. Тогда к п поворотам вокруг центра на углы 0, —, — 2, ... 2я ..., — (п — 1)добавятся п отражений относительно осей симметрии многоугольника. Покажем, что никаких других элементов эта группа не содержит, т. е. что она состоит в точности из 2/г элементов. Группа симметрии /г-угольника Оп содержит, очевидно, подгруппу Сп, состоящую из всех поворотов вокруг центра. Пусть е, г, г2, ..., гп~1 — все элементы этой подгруппы (напомним, что г — поворот вокруг центра на угол —). Обозначим через 5 отражение относительно одной какой-нибудь фиксированной оси симметрии многоугольника. Тогда в2 = е. Пусть §" — произвольный элемент группы йп. Тогда § есть ортогональное преобразование, определитель которого равен,следовательно, + 1 или — 1. Если \§\ = + 1, то это —вращение, и значит, § = г\ где к = 0, 1, ..., п— 1. Если определитель |^| =—1, то определитель произведения 5§* равен + 1 (так как определитель 5 равен —1), и значит, 5§" е Сп, т. е. 5§" = г\ откуда следует, что § = 8гк. Таким образом, каждый элемент группы 0„ может быть представлен либо в виде г\ либо в виде згк> где к = 0, 1, ,.., п—1. Значит, порядок группы Вп равен 2п. Диэдральную группу Дп можно интерпретировать и иначе: ее можно рассматривать как группу вращений правильного п-угольника, но не в его плоскости, а в пространстве. Тогда гк — это поворот вокруг оси, перпендикулярной плоскости многоугольника и про-
$ 4] ДИЭДРАЛЬНЫЕ ГРУППЫ 311 ходящей через его центр, на угол —к, а 5 — поворот в пространстве вокруг одной из осей симметрии многоугольника на угол п. Наконец, диэдральную группу можно еще рассматривать как группу вращений правильного диэдра— правильной бипирамиды, состоящей из двух одинаковых правильных пирамид, сложенных своими основаниями (рис. 30). Тогда гк — это поворот вокруг оси АВ диэдра на угол — ку а 5-—одно из «опрокидываний» — поворот на угол я вокруг одной из осей симметрии лежащего в основании диэдра многоугольника. При п = 1 диэдр вырождается в отрезок, и группа Ъ{ изоморфна С2. При л = 2 диэдр вырождается в ромб, и группа 02 изоморфна группе симметрии ромба V. При п = 3 получается группа симметрии треугольника; легко видеть, что она изоморфна 53 — группе подстановок трех его вершин. При п > 3 диэд- ральные группы некоммутативны. Найдем классы сопряженных элементов диэдральной группы. При поворотах вокруг горизонтальных осей (осей симметрии многоугольника) вертикальная ось АВ диэдра переходит в ВА (опрокидывается); она является, как говорят, двусторонней осью — ось АВ эквивалентна ВА. Следовательно, поворот вокруг оси АВ на угол а сопряжен с поворотом вокруг оси ВА на тот же угол а, т, е. с поворотом вокруг оси АВ на угол — ос. Таким образом, повороты гк и гп~к сопряжены между собой, причем, очевидно, имеет место равенство (Проверьте сами это равенство, выписав и перемножив соответствующие матрицы!) Никакой другой оси ось АВ не эквивалентна, и поворот г* сопряжен толь- кос гп~к. На*
312 ГРУППЫ СИММЕТРИИ ГЕОМЕТРИЧЕСКИХ ФИГУР [ГЛ. XI Следовательно, при нечетном п повороты вокруг оси АВ разбиваются на классы сопряженных элементов следующим образом: {*}, {г,г»-1}, {/¦*,/¦»-«}, ...Д/-8 ,гг). Число таких классов равно —гр. При четном п повороты вокруг оси АВ разбиваются на классы: {е}, {г, г»-1}, {г\ г-*} \гГ\ г2"+1), \Я Число этих классов равно -у + 1. Далее, при нечетном п все горизонтальные оси вращения эквивалентны между собой (рис. 31, а) —они п1 а) б) Рис. 31. переходят друг в друга при поворотах вокруг вертикальной оси АВ. А так как углы поворотов вокруг всех этих осей одинаковы — они равны я, то все эти повороты сопряжены между собой и образуют один класс сопряженных элементов. При четном п многоугольник имеет оси симметрии двух типов: диагонали и прямые, соединяющие середины противоположных сторон (рис. 31, б). Все первые оси между собой эквивалентны. Все вторые — тоже, но дервые во вторые не переводятся никаким вращением — они не эквивалентны. Значит, при четном п повороты вокруг горизонтальных осей образуют два класса со-
§51 ГРУППА ВРАЩЕНИЙ ТЕТРАЭДРА Т 313 пряженных элементов: {5, 5г2, згА, ..., згп~2} и {5Г, 5/*3, ... ..., 5гп_1}. (Действительно, имеем: г~1(згк)г = = г"-1^/-*)/- = (гп~18)гк+{ = (8г)гк+1 = згк+2- (см. равен- ство на стр. 311)—и значит згк сопряжено с 8Гк+2 при всех к.) Таким образом, общее число классов сопряженных тл П+ 3 элементов в группе Оп при нечетном п равно—?>—, а при четном п оно равно -у -Ь 3. Так, группа /K имеет 3 класса сопряженных элементов, группа #4 имеет 5 классов, а) б) д) Рис. 32. группа #5 имеет 4 класса и группа 06 имеет 6 классов сопряженных элементов. Полезно еще заметить, что диэдральная группа Оп порождается двумя «образующими»: элементами г и з со связывающими их «определяющими соотношениями» гп = е, 82 = е, 8Г8 = г11. Все остальные соотношения между элементами этой группы вытекают из «определяющих соотношений». Так, Например, 8Г28 = 8Г82Г8 = EГ5) EГ5) = Гп~Х • Г" = = гп~2, и т. д. § 5. Группа вращений тетраэдра Г Рассмотрим правильный тетраэдр АВСО. Он переходит в себя при следующих нетождественных поворотах: а) При поворотах вокруг каждой из осей типа АР (рис. 32, а), соединяющих вершину тетраэдра с цент-
314 ГРУППЫ СИММЕТРИИ ГЕОМЕТРИЧЕСКИХ ФИГУР [ГЛ. XI ром противолежащей грани, на углы -^- и -у. Всего таких вращений имеется 4X2 = 8. б) При поворотах на угол я вокруг каждой из трех прямых типа МЫ, соединяющих середины противоположных ребер (рис. 32, б). [Так как МЫ А-ВС, МЫ _!_ ЛД ВМ = МС и АЫ = Ый, то при повороте вокруг прямой МЫ на угол я точка В перейдет в С, С — в В, Л—в В и Я — в А.] Всего, вместе с тождественным поворотом, мы имеем 1+8 + 3= 12 поворотов, при которых тетраэдр переходит в себя. Им отвечают, очевидно, такие подстановки вершин: (АВСй\ 1АВСЭ\ (АВСй\ /АВСО\ (АВСйХ /АВСй\ ХАВСй)' \АСОВ]' [АйВсI \сВОА)> {йВАСГ [вйСА]' (АВСЮ\ (АВСй\ (АВСО\ (АВСй\ (АВСй\ 1АВСИ\ \ОАСВ)> \ВСАо)> \САВо)> [вАйС)' [сйАв)' \ОСВА)ш Нетрудно убедиться в том, что все эти подстановки — четные (проверьте это!), и значит, соответствующие им повороты действительно образуют группу Г, изоморфную, очевидно, знакопеременной подгруппе Л4 симметрической группы 54. Условимся о такой терминологии. Если данная конфигурация переходит в себя при повороте вокруг оси / на угол у (причем -^— это наименьший такой ненулевой угол), то ось / будем называть осью симметрии к-го порядка. Поворот вокруг оси / на угол -^ будем обозначать символом ск (часто и сама эта ось обозначается через сА), поворот на угол -^р 2 тогда естественно обозначить через с\, и т. д. Найдем теперь классы сопряженных элементов группы Г. Каждая из осей симметрии третьего порядка может быть преобразована в любую другую ось третьего порядка при повороте, например, вокруг одной из осей второго порядка. Так, при повороте вокруг оси МЫ (рис. 32, в) точка А переходит вВ, В — в С, С — в В и О в А. Плоскость ВСО переходит в плоскость ВСА,
§8] ГРУППА ВРАЩЕНИЯ КУБА О 315 центр Р грани ВСО — в центр С} грани ВС А и ось АР — в ось й($. Таким образом, все оси третьего порядка (типа АР) эквивалентны между собой, и все повороты вокруг них 2я на углы -^ между собой сопряжены. Число таких поворотов равно 4, и соответствующий классе сопряженных элементов можно обозначить через {4с3}. Точно так же сопряжены между собой и 4 поворота вокруг тех же осей на углы -у; соответствующий класс можно обозначить через |4сз). Но повороты с3 и с\ не сопряжены между собой, так как это — повороты на разные углы. Далее, каждая из осей второго порядка (типа МЫ) переходит в любую другую при одном из поворотов вокруг осей третьего порядка; значит, все оси второго порядка между собой эквивалентны, и три поворота вокруг этих осей на угол я между собой сопряжены. Этот класс можно обозначить через {Зс2}. Учитывая, что тождественное преобразование составляет отдельный класс, мы получим в группе Т четыре класса сопряженных элементов, состоящих из одного {е}, четырех {4с3}, четырех [Ас1\ и трех {Зс2} элементов. § 6. Группа вращений куба О Легко видеть, что куб переходит в себя при следующих нетождественных вращениях: а) При трех поворотах на углы я/2, я и Зя/2 вокруг каждой из трех прямых типа МЫ (рис. 33, а), соединяющих центры противоположных граней (оси симметрии четвертого порядка). Всего таких поворотов 3X3 = 9. б) При двух поворотах вокруг каждой из четырех диагоналей (осей симметрии третьего порядка, рис. 33, б) на углы 2я/3 и 4я/3 (правильный треугольник АСВ' при этом переходит в себя). Всего таких поворотов 2X4 = 8. в) При шести поворотах на угол я — вокруг каждой из прямых типа РB (рис. 33, в), соединяющих середины
816 ГРУППЫ СИММЕТРИИ ГЕОМЕТРИЧЕСКИХ ФИГУР [ГЛ. XI противоположных ребер (оси симметрии второго порядка). Всего, вместе с тождественным преобразованием, мы нашли 1+9 + 8 +-6 = 24 поворота, при которых куб переходит в себя. Из доказываемой ниже теоремы будет вытекать, что это — все вращения, при которых куб переходит в себя. Теорема. Группа О вращений куба изоморфна симметрической группе 54 (и значит, порядок этой группы равен 24). Доказательство. При каждом повороте, при котором куб переходит в себя, каждая его диагональ переходит в одну из диагоналей. У куба 4 диагонали, поэтому каждому вращению куба отвечает определенная подстановка его диагоналей, а произведению вращений — произведение соответствующих подстановок. Остается доказать, что разным вращениям куба отвечают разные подстановки диагоналей. Действительно, если два разных вращения аир куба приводят к одной и той же подстановке диагоналей, то при (нетождественном) повороте оф-1 каждая диагональ куба переходит в себя (хотя, возможно, меняются местами концы некоторых диагоналей). Покажем, что такое вращение, при котором каждая диагональ куба переходит в себя, является тождественным. Предположим, что при повороте «у все диагонали куба перешли в себя. В частности, перейдут в себя диагонали БВ' и ВВГ (рис, 34), а тогда перейдет в себя
§61 ГРУППЫ ВРАЩЕНИЙ КУБА О 317 Рис. 34. и содержащая их плоскость ВВВ'В'. Значит, ось этого вращения либо лежит в плоскости ВВВ'В', причем поворот этот — на угол я, либо к ней перпендикулярна. Но в первом случае переходят в себя только прямые, направленные по оси вращения, и прямые, перпендикулярные к оси. Однако прямоугольник ОВВ'й' — не квадрат, и значит, его диагонали не перпендикулярны друг другу. Во втором случае, т. е. если ось вращения перпендикулярна плоскости ВВВ'В', она совпадает с прямой РО., а тогда не переходят в себя (переставляются) диагонали АС иЛ'С. Таким образом, группа вращений куба изоморфна симметрической группе ^4. Найдем теперь, как элементы группы О разбиваются на классы сопряженных элементов. Три оси симметрии четвертого порядка, очевидно, эквивалентны, и значит, повороты вокруг них на углы я/2 сопряжены между собой. Далее, эти оси являются двусторонними (опрокидываются при поворотах на угол я вокруг других осей четвертого порядка), и значит, повороты вокруг них на углы Зя/2 тоже сопряжены не только между собой, но и с поворотами на углы я/2. Поворот на угол я/2 можно обозначить через с±, поворот на угол Зя/2 — через с\. Мы нашли класс, состоящий из шести элементов, который можно обозначить символом {Зс4, 2>с\), или даже, короче,— символом {6с4}. Все повороты вокруг тех же осей четвертого порядка на углы я/2 • 2 = я сопряжены между собой (и только между собой). Число таких поворотов равно 3, соответствующий класс можно обозначить через (Зс^}. Далее, все оси третьего порядка (диагонали) между собой эквивалентны (переходят друг в друга, например, при поворотах вокруг осей четвертого порядка). При этом каждая диагональ является двусторонней осью (опрокидывается при поворотах вокруг перпендикуляр-
318 ГРУППЫ СИММЕТРИИ ГЕОМЕТРИЧЕСКИХ ФИГУР [ГЛ. XI ных к ней осей второго порядка. Значит, все 8 поворотов вокруг диагоналей на углы 2л/3 и 4я/3 сопряжены между собой. Соответствующий класс можно обозначить через {4с3, 4сд}, или просто через {8с3}. Наконец, шесть осей второго порядка переходят друг в друга, например, при поворотах вокруг осей четвертого порядка, и значит, все шесть поворотов вокруг них на угол я сопряжены между собой. Этот класс можно обозначить {6^2}. Учитывая отдельный класс, образуемый тождественным преобразованием, получаем всего пять классов сопряженных элементов, состоящих из одного {е}} шести {6с4}, трех {3^}, восьми {8сг} и шести {6с2} элементов. § 7. Группа симметрии тетраэдра Та Кроме семи осей симметрии правильный тетраэдр имеет шесть плоскостей симметрии. К 12 вращениям, при которых тетраэдр переходит в себя (и которые отвечают, как мы видели, четным подстановкам его вершин), добавим одну из симметрии, например, симметрию относительно плоскости АйМ (рис. 35) — ей соответствует / \ (АВСО\ (нечетная) подстановка вершин тетраэдра. Если умножить эту симметрию на каждый из 12 поворотов, при которых тетраэдр переходит в себя, мы получим еще 12 преобразований, отвечающих нечетным подстановкам вершин. Среди них будут 6 «чистых» симметрии и 6 произведений поворота и симметрии. Кроме этих 24 преобразований, не существует никаких ортогональных преобразований, при которых тетраэдр АВСй переходит в себя (в частности— никаких вращений, кроме рассмотренных в § 5), так как каждое такое преобразование отвечает определенной подстановке его вершин и, значит, совпадает с одним из уже определенных преобразований. Таким об-
§8] ГРУППА СИММЕТРИИ КУБА Ол 319 разом, группа симметрии тетраэдра Тй изоморфна симметрической группе 54 и, значит, она, изоморфна группе вращений куба О. Поэтому эта группа тоже состоит из пяти классов сопряженных элементов, содержащих 1, 6, 3, 8 и 6 элементов. Найдем, как распределяются элементы группы Та по этим классам. В группе Та класс из трех элементов образуют, очевидно, повороты вокруг осей второго порядка {Зс2}. Класс из 8 элементов состоит из всех поворотов вокруг осей третьего порядка: Dс3, Ас\)\ повороты вокруг осей третьего порядка на углы 2я/3 и 4я/3 в группе Т не сопряжены, а в группе Тл они оказываются сопряженными, так как если 5 — симметрия, скажем, относительно плоскости АМй, а г — поворот относительно оси АР, лежащей в этой плоскости на угол а, то згз есть поворот вокруг той же самой оси АР на угол — а. В нашем случае это доказывается следующим равенством: АВСй) (ЛВСО)(АВСО) _ (АВСй) АСВИ) \АСОВ)\АСВо) ~~ \АОВс)* И ЗНачИТ, 5Г5 = Г. Далее, 6 симметрии относительно плоскостей вида АОМу очевидно, сопряжены между собой (эти плоскости «эквивалентны» — при поворотах переходят друг в друга), они образуют отдельный класс; обозначим его {6а}. Остальные 6 преобразований — произведения поворота и симметрии тоже, следовательно, образуют отдельный класс {6о'}. § 8. Группа симметрии куба Он Кроме 13 осей симметрии куб имеет 9 плоскостей симметрии (и центр симметрии): три плоскости симметрии— такие, как РС}МЫ на рис. 36, а, и шесть диагональных плоскостей— таких, как ОВВ'О' на рис. 36, б. Рассмотрим всевозможные ортогональные преобразования пространства, при которых куб переходит в себя. Те из этих преобразований, определитель которых равен 1 (вращения), образуют подгруппу О (изоморфную, как мы видели, симметрической группе 54), Пусть §¦ — одно из преобразований симметрии куба с опреде-
320 ГРУППЫ СИММЕТРИИ ГЕОМЕТРИЧЕСКИХ ФИГУР [ГЛ. XI лителем, равным—1. Умножив его на центральную симметрию / (преобразование с определителем, равным — 1), мы получим преобразование а с определителем, равным +1, т. е. вращение. Из равенства ]§ = а имеем § = /а. Таким образом, все преобразования, при которых куб переходит в себя,— это всевозможные вращения и всевозможные произведения вида /а, где / — центральная симметрия, а а —вращение. Рис. 36. Покажем, что центральная симметрия / перестановочна с любым вращением и, даже, более того,— с любым линейным преобразованием $Ф. Действительно, для любого вектора х имеем ]х= —х, и, значит. $4> (]Х) = бФ (— X) -^х = 1(<&х), т. е. 5Ф\=\зФ. Тождественное преобразование е и центральная симметрия / в группе Он образуют циклическую подгруппу второго порядка / = {е, /} (/2 = е). Покажем, что группа Он равна прямому произведению своих подгрупп О и I. 1) Подгруппы О и / в группе Он являются нормальными: О как подгруппа индекса 2 (ср. выше стр. 293), а / — как подгруппа, оба элемента которой коммутируют со всеми элементами группы Ок. 2) Пересечение подгрупп О и / состоит из одного единичного элемента. 3) Каждый элемент группы Он представляется в виде произведения элемента из О и элемента из /: если а\ #2, а24 — все 24 элемента группы О, то
§9] ЗАКЛЮЧЕНИЕ 321 элементы группы Оы — это еаи еа2, ..., еа2А и /аь \а2, ..., /а24. Группа Он состоит из 48 элементов. Так как в группе О — пять, а в группе / — два класса сопряженных элементов, то число классов сопряженных элементов группы Он равно 10. Если {я^, а^, ..., йгд} — какой-то класс сопряженных элементов группы О, то в группе Оп ему соответствуют два класса: [аи, аи> ..., а^} и {/а1ж, /аь, ..., /ад. § 9. Заключение Правильным многогранником называется такой (выпуклый) многогранник, все грани которого — равные между собой правильные многоугольники и все многогранные углы которого равны между собой. Еще а) б) в) Рис. 37. в древности было известно, что существует всего пять правильных многогранников: правильный тетраэдр, ограниченный четырьмя правильными треугольными гранями, и имеющий 6 ребер и 4 вершины; куб (или правильный гексаэдр), ограниченный шестью квадратными гранями и имеющий 12 ребер и 8 вершин; правильный октаэдр, ограниченный восемью треугольными гранями и имеющий 12 ребер и 6 вершин (рис. 37, а); правильный додекаэдр, ограниченный двенадцатью пятиугольными гранями и имеющий 30 ребер и 20 вершин (рис. 37, б); и, наконец, правильный икосаэдр, ограни-
322 ГРУППЫ СИММЕТРИИ ГЕОМЕТРИЧЕСКИХ ФИГУР [ГЛ. XI ченный двадцатью треугольными гранями и имеющий 30 ребер и 12 вершин (рис. 37, в). Куб и правильный октаэдр в определенном смысле двойственны друг другу: если соединить центры граней куба, как указано на рис. 38, а, то получится правильный октаэдр, и, наоборот, если соединить центры граней <*>) б) в) Рис. 38. октаэдра, то получится куб (рис. 38,6). Поэтому группа вращений октаэдра изоморфна группе вращений ку- ба (и обозначается эта группа буквой О), а группа симметрии октаэдра — группе симметрии куба Ол. В описанном смысле правильный тетраэдр двойствен сам себе (рис. 38, б); правильные же додекаэдр и икосаэдр двойственны друг другу, и их группы ера- щений изоморфны — обозначается эта группа буквой /, Она состоит из 60 элементов и изоморфна знакопеременной подгруппе А5 симметрической группы 55 пятой степени. Группа симметрии додекаэдра (икосаэдра) 1Н состоит из 120 элементов и является прямым произведением группы / и циклической группы второго порядка. Кроме перечисленных пяти правильных многогранников, в пространстве существует еще «вырожденный правильный многогранник» — правильный многоугольник, который можно рассматривать как многогранник, состоящий из двух равных правильных /г-угольников (двугранник). Циклическая группа Сп есть группа вращений правильного п-угольника, т. е. вырожденного правильного многогранника в содержащей его плоскости, а диэдральная группа Д,— это группа его враще- Н1гй в пространстве,
§9] ЗАКЛЮЧЕНИЕ 323 Существует такая общая теорема: Циклические группы СП} п=1, 2, ..., диэдральные группы /)п, м=1, 2, ..., группа вращений тетраэдра Т, октаэдра {куба) О и икосаэдра {додекаэдра) I — это все конечные подгруппы группы вращений трехмерного пространства вокруг неподвижной точки. «Это,— пишет Г. Вейлъ,— и есть современный эквивалент того перечня правильных многогранников, который дали древние греки»*). Полный список всех конечных подгрупп группы ортогональных преобразований содержит, кроме определенных выше групп симметрии многогранников, еще несколько отдельных групп и серий групп; в этой книге они не рассматриваются **). *) Г. В ей ль, Симметрия (М.: Наука, 1968), стр. 105. **) См., например, ту же книгу Г. Вейля.
ГЛАВА XII ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ I КОНЕЧНЫХ ГРУПП § 1. Определения и примеры Пусть дана группа О, гомоморфная некоторой другой группе О*. Тогда, по теореме о гомоморфизмах, группа О* изоморфна фактор-группе группы О по некоторой нормальной подгруппе Я. Следовательно, группа С* «устроена» в некотором смысле проще, чем группа О; в частности, если группа О — конечного порядка, то порядок группы О* меньше порядка группы О (или равен ему). С другой стороны, группа О* «подобна» группе О: так,если/ — гомоморфизм, отображающий группу О на О*, то из того, что аЪ == с (где а, 6, се О), следует, что /(а)/(&) = !(с) (где /(а), /F), 1(с) = а*)- Говорят, что группа и* представляет группу С/, или, точнее, что гомоморфное отображение / группы О на группу О* является представлением группы С (группой О*). Существует теорема Кэли, в силу которой каждая конечная группа порядка п изоморфна (а изоморфизм есть частный случай гомоморфизма!) некоторой подгруппе группы подстановок из п элементов. В этом случае группа О* устроена в точности так, как группа С, что позволяет назвать это представление группы О группой О* точным представлением. Следовательно, каждая конечная группа может быть точно представлена некоторой группой подстановок. Наиболее интересны для теории и приложений так называемые линейдые представления групп. Говоря о линейном представлении группы О, мы предполагаем, что нам дано (вообще говоря, комплексное) векторное пространство /? размерности п, в котором действуют невырожденные линейные операторы. Эти операторы образуют группу О*, которой гомо-
§П ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 325 морфна наша группа О— группа О* и представляет группу О. Итак, можно дать следующее Определение 1. Гомоморфное отображение Г группы О на группу О* невырожденных линейных операторов, действующих в п-мерном векторном (комплексном) пространстве /?, называется линейным представлением группы О (группой О*). Таким образом, если Г есть линейное представление группы О группой О*, то каждому элементу а группы О поставлен в соответствие невырожденный линейный оператор Г (а) е О*, действующий в пространстве /?, так, что для любых а, Ь&О Г(аЬ) =Г(а) • ГF). При этом, как мы знаем, Г(е)=Еу где е — единица группы О, а Е — единица группы О* (тождественный оператор) и Г(ог1) = [Г(а)]-1 для любого ае=<3 (см. выше стр. 302). Пространство /?, в котором действуют операторы из группы О*, называется пространством представления группы О. Иногда и само это пространство называют представлением группы О. Размерность пространства /? называется размерностью, или, чаще, степенью, рассматриваемого представления. В приложениях вместо операторов часто рассматривают соответствующие им матрицы. Если в пространстве У? выбрать базис, то каждому линейному оператору Г (а) будет отвечать определенная матрица, т. е. каждому элементу а группы С будет поставлена в соответствие (невырожденная) квадратная матрица Г (а)*) порядка п так, что Т(аЬ) =Г(а)Г(Ь). Если пространство /? одномерно, то эти матрицы — первого порядка. В этом случае каждому элементу а группы О поставлено в соответствие (вообще говоря, комплексное) отличное от нуля число Г (а), так что Т(аЬ) =Г(а)ГF). При этом единичному элементу е группы отвечает число 1. *) Здесь и дальше мы обозначаем оператор Г (а) и соответствующую ему в заданном базисе матрицу одной и той же буквой.
326 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII Заметим, что если Г — одномерное представление группы О и элементы а и Ь сопряжены в О : Ь = = с~1ас, то Г (Ь) = Г(с~*ас) = Г (с1) Г (а) Г (с) = = [Г(с)]-1Г(а)Г(с)=Г(а), Тривиальным, но важным для теории примером может служить одномерное представление (т. е. представ* ление степени 1), при котором каждому элементу а группы О поставлено в соответствие число 1, так что Г (а) ев 1 для каждого ае О. Такое представление называется единичным представлением группы О, Если группа О изоморфна группе О*, то представление Г группы О группой С* называется точным; в противном случае представление Г; по определению, неточное. Если О есть группа линейных операторов, то она сама является одним из своих линейных представлений (причем, очевидно, точным); это представление назы- вают основным представлением группы О, Рассмотрим несколько примеров. 1. Найдем все одномерные представления циклической группы С2 второго порядка. Эта группа состоит из двух элементов е и а, причем а2 = е. Пусть Г будет одномерное представление группы С2. Тогда Г(в) = 1. Предположим, что Г(а) = а; тогда Г(а2) = (Г(а)J = = а2. Но так как а2 = е, то Г(а2) =Т(е) = 1, и значит, а2=1, т. е. а = ±1. Это дает два одномерных представления Г1 и Г2 группы С2: С2 | е И7 г2 1 а 1 —1 Здесь первое представление: Г\(е) = 1, Г1 (а) = 1 — единичное (неточное); второе: Г2(е) = 1, Г2(а) == —1— точное. 2. Найдем все одномерные представления группы С4 — циклической группы четвертого порядка. Эта труп-
*П ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 327 па состоит из четырех элементов е, а, а2, а3, причем ал = е. Пусть Г (а) = а. Тогда Г (а2) = а2, Г (а3) = а3, Г(а4) = а4, и значит, а4 = 1, т. е. а=уТ Поэтому а может равняться 1, /, —1, —/э что дает четыре одномерных представления: г* г' г, Г' 4 е 1 1 1 1 а 1 —1 * —1 а2 I 1 —1 —1 а3 1 —1 —1 / первое из которых — единичное; два последних представления являются точными. 3. Пусть V —группа симметрии ромба. Она состоит из четырех элементов е, а, Ь и аЬ = Ьа, причем а2 = = Ь2 = я. Если Г — одномерное представление этой группы и Г(а)=сс, Г(&)=р, то Г(а2)=а2=1 и Г(й2) = р2 = 1, т. е. а = ± 1 и р = ± 1. Это дает четыре одномерных представления (ни одно из которых не является точным): Г.1_!_ IV 1 Г2 1 гя г« 1 1 а 1 1 —1 — 1 Ь 1 —1 1 ' — 1 аЬ 1 —1 —1 1
328 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII 4. Найдем одномерные представления диэдральной группы /?з — $з*). Элементы группы: еу г, г2, 5, зг, $г2. Пусть Г — одномерное представление 03; поскольку г и г2 сопряжены между собой, если Г (г) = а, то Г (г2) = = а2 = Г(г)=а, т. е. а2 = а,— и так как а ф О, то а = 1. Далее, если Г E) = р, то ГE2) = р2 = 1, и р = = ± 1. Это дает два одномерных представления группы 0$: и, !•_ Г1 ! Г2 1 Г 1 1 л2 I 1 5 1 — 1 зг 1 — 1 5Г2 1 — 1 или, короче (поскольку элементы г и г2, а также элементы 5, 5Г и зг2 сопряжены между собой): 1 Яз 14 г2 е 1 1 г, г2 1 1 5, 5Г, 8Г2\ 1 —1 5. Построим двумерное представление группы й3. Эта группа изоморфна группе симметрии правильного треугольника, т. е. йг есть группа преобразований плоскости, а значит, она сама является одним из своих представлений. Найдем матрицы этого (основного) представления. Пусть АВС— правильный треугольник с центром О (рис. 39), Совместим точку О с началом координат, а вершину А треугольника расположим на положительной стороне оси Ох. Обозначим через г поворот вокруг центра треугольника на угол 2я/3, тогда г2 — поворот на *) ~ — знак изоморфизма групп.
§ 1] ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 329 угол 4я/3; через 5 обозначим симметрию относительно оси Ох. Соответствующие матрицы будут иметь вид Т(е) = Б, Г (г) ' 2л С05Т . 2л ¦ $1П-д- 1_ О . 2л" -51ПТ 2л С05-О- -9" -ТУЗ тУ* --«• Ь 2 Г(г2) = 4гз -тгУ5 -4- I. 2 ГEГ) = -4/3 1 ,- 1 Г EГ«) 'И; 4 1 1 ' Ь 2 1 ,_ 1 -о-/3 чг ГГEг) и ГEг2) находятся перемножением матриц: ГEГ) = Г E) • Г (Г) И ГEГ2) = ГE) • Г (Г2).] X Рис. 39. 6. Диэдральную группу Д3 можно интерпретировать и как группу движений трехмерного пространства — как группу вращений диэдра. Если лежащий в основании диэдра треугольник расположить как в примере 5, а ось Ог направить перпендикулярно к плоскости треугольника и если г — это поворот вокруг оси Ог на угол 2я/3, а 5 — поворот вокруг оси Ох на угол я, то 12 л, И. Головина
330 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII соответствующие матрицы будут иметь вид 2 Г(е) п о О 1 [о о г и Г(г) = -4- -т^3 °" 1 - 1 0 Т Т^ ° 1 .- 1 Т^З -^ 0 2 0 0 ГE) Г1 О О = 0—1 О [О 0 -1 Г EГ2) = ГEГ) = * 1 1 /¦- " --тг -К-/3 О 1 2 \уъ 0 -т^ о! 1 Т ° о -и -5-У1 -о- о О -1 Как будет показано дальше (в § 3 гл. XIII), полученное трехмерное представление группы 03 в некотором смысле «хуже» найденных выше одномерных (пример 1) и двумерного (пример 5) представлений этой группы (оно распадается в «прямую сумму» одномерных и двумерных представлений). § 2. Изоморфные представления Определение 2. Пусть Гх « Г2 — два представления группы О в пространствах Н\ и /?2 соответственно, причем размерности пространств Н\ и /?2 одинаковы, т. е. пространства /?1 и /?2 изоморфны (см. § 5 главы II). Представления Т\ и Г2 называются изоморфными (эквивалентными, подобными), если ЖТ\ = Г2Ж, где Ж — изоморфное отображение пространства Я\ на /?2. (Ясно, что изоморфные представления имеют одинаковые степени.)
§ 2] ИЗОМОРФНЫЕ ПРЕДСТАВЛЕНИЯ 331 Равенство ЖГ\ =Г2Ж означает, что ЖГ\(а) = = Г2(а)Ж для любого элемента ае=С, а это, в свою очередь, означает, что для любого вектора х^К\ ЖГ1(а)х = Г2(а)Жх. A) Поясним «геометрический смысл» последнего равенства. Пусть хе^ и у = Жхе= #2. Тогда равенство A) означает, что ЖГ\(а)х = Г2(а)г/, т. е. что если х+-+ у (вектор х^Я\ соответствует вектору у<^К2 при изоморфном отображении Ж пространства /?! на /?2), то \\(а)х +-> Г2(а)уу т. е. образы Т\{а)х и Г2{а)у элементов х и у для любого ае О тоже соответствуют друг другу при отображении Ж: Ж(Г{(а)х) = Г2(а)у. Иными словами, безразлично, отобразить ли сначала вектор хе^ посредством Ж в пространство К2, а потом применить к полученному вектору Жх преобразование, соответствующее элементу а^О, или сделать это в обратном порядке; здесь выполняется следующая «коммутативная диаграмма»: х^>Ж{х) ТЛа)\ |г2(а) Гх (а) х^ Ж 1\ (а) х = Г2 (а) Ж (х) Изоморфное отображение Ж пространства /?! на #2 может быть задано квадратной (невырожденной) матрицей Н. Тогда для каждого аеС соответствующие матрицы Т\(а) и Г2(а) изоморфных представлений Г1 и Г2 связаны соотношением НГх(а) = Г2(а)#, которое можно переписать в виде ^ (а) =ЯГ2(а)Я. Это означает, что если пространство Я\ отождествить с (изоморфным ему) пространством #2 и матрицу Н рассматривать как матрицу перехода к новому базису в этом пространстве, то Т\(а) и Г2(а)—это матрицы 12*
332 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII одного и того же оператора, взятые в разных базисах. Задача. Покажите, что отображения Г1 и Г2: г„,=[;:].г,м=[_;_;].г,„,=[-;-;]. г.и-[;;}г.<и-[-;-!}г.м.[_!_Я являются представлениями диэдральной группы /K, и проверьте, что эти представления изоморфны. § 3. Подпредставление Определение 3. Пусть Г — представление группы О, /? — пространство представления и Н\ — подпространство /?, инвариантное относительно всех операторов, соответствующих элементам группы О (в таком случае говорят, что подпространство РЛ инвариантно относительно группы О). Тогда каждому элементу а €= О можно сопоставить оператор Г (а), действующий в подпространстве /?ь Эти операторы также образуют представление группы О (поскольку, если хе#ь то Т(а)х^Я\ для каждого аеСи равенство Г(аЬ)х = Г(а)Т(Ь)х выполняется для всех векторов хе/?ь так как оно справедливо для любого вектора хе^, а Н\ с: /?). Представление Г\ группы О в пространстве /?1 называется под- представлением представления Г. Пример. Рассмотрим двумерное представление циклической группы С2 второго порядка: (Легко видеть, что (Г(а)J = Т(е) и, значит, это действительно — представление.) Пусть ей е2 — тот базис пространства /?, в котором взяты эти матрицы. Вектор в1 + е2 является собственным для обоих
§4] ПРЯМАЯ СУММА ПРЕДСТАВЛЕНИЙ 333 преобразований Т(е) и Г(а), так как Т(е) (ех + е2) = Г(е)ех + Г(е)е2 = ех + е2, Т(а) (ех + е2) = Г(а)е1 + Г(а)е2 = е2 + е{ = ех + е2. Следовательно, порожденное нм одномерное подпространство /?1 = = {ех + е2) инвариантно относительно группы С2. Соответствующее подпредставление 1\ является одномерным единичным представлением группы С2: Т\ (е) (ех + е2) = ех + еъ Тх (а) (ех + е2) = ех + е2, или, в матричной форме: Тх(е) = 1, Г! (а) = 1. § 4. Прямая сумма представлений Определение 4. Если пространство представления /? группы О является прямой суммой /? = К\ @ /?2 подпространств Я\ и /?2, инвариантных относительно группы О, то в каждом из этих подпространств представление Г определяет по подпредставлению; обозначим эти подпредставления через Т\ и Г2. Говорят, что представление Г является прямой суммой подпредстав- лений Т\ и Г2, что записывается так: г = п © г2. Рассмотрим два примера. 1. Пусть Г —двумерное представление группы С2, введенное в предыдущем параграфе. Мы видели, что подпространство К\ = = {^1 + е2) инвариантно относительно группы С2. Подпространство #2 = {^1 — е2} тоже инвариантно относительно С2, так как Г(е) (ех - е2) « Г(е)ех - Г(е)е2 = ех - е2у Г(а)(ех — е2) = Г(а)ех — Г(а)е2 = е2 — ех = — (^ — е2). В базисе /1 = ех + е2, B = ех — е2—- матрицы нашего представления имеют вид г«--[1 !] ¦ г<4: -Я- Таким образом, рассматриваемое представление является прямой суммой двух одномерных представлений: Г = 1\© Гг, где Г, (в) _ 1, Г,(а) = 1 Г*(е) - 1. Гз(а) = -1.
334 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII 2. Рассмотрим двумерное представление циклической группы С4: г«-[;;].гМ-[!-;].гИ-[-;_1]. гИ-[_; ;; (проверьте сами, что это действительно представление!). Так как пространство представления двумерно, то инвариантные подпространства (если они существуют) одномерны, и значит, для того чтобы найти их, мы должны найти собственные векторы преобразования Г (а)—они будут собственными и для остальных преобразований, поскольку Г (а2) = [Г (а)]2 и Г (а3) = [Г (а)]3. Собственные значения преобразования Г (а) находятся из уравнения ~1 -[|-*+1-0. и значит, К = ± I. При к = / собственные векторы находятся из уравнения — 1Х\ — — х2 = 0, откуда х2 = —1хи и собственный вектор /1 = A, —«). При К = — I собственные векторы находятся из уравнения 1*1 — х2 = 0, откуда х2 = 1хи т. е. /2 = A, 0- Далее, имеем Г(а)/, = «/,, Г(а%=-/„ Г(а»)Л -=—//,. Г(а)/2 = -//2, Г(а*)/2 = -/2, Г(а»)/8 = «•/,. Таким образом, в базисе ^, /2 матрицы представления Г будут иметь вид и представление Г оказывается прямой суммой двух одномерных представлений: 14*) = 1, ГИа)-/, Г,(а2)=-1, Г1(а3)=-/ Т2(е) = 1, Г2(а) = -/, Г2(а2) = - 1, Г2(а3) « I. Легко видеть, что из любых двух представлений группы О всегда можно составить представление, являющееся их прямой суммой. Заметим также, что если представление Т\ группы О изоморфно Г\ и Г2 изоморфно Г2, то прямая сумма Г = П .0 Г2 изоморфна Г7 = Г.10 Г2.
§5] УНИТАРНОЕ ПРЕДСТАВЛЕНИЕ 335 Действительно, пусть /?х, /?ь /?2, #2 — соответственно пространства представлений Гх, Г^, Г2, Г2. Тогда существуют изоморфные отображения #6\ пространства /?! на К[ и 2в2 — пространства Я2 на Я'2 такие, что Пусть, далее, # = Я\ ® Я2 и /?' = /?! ф /^—пространства представлений Г и Г7. Тогда отображение Ж с матрицей Я = о я0 где Яг —матрица отображения 3#ь * = 1, 2, в соответственно выбранных базисах, будет, очевидно, изоморфным отображением пространства /? на /?'. Далее, ясно, что Г = 2^ Г' = г; о] о г;] — матрицы представлений Г и Г', и мы имеем, очевидно, ЯГ \"г 1 ° о] ",1 [Г1 [О О ' Г2. ЧГ! ° 1 . ° н^1~ >; о]| ° ги о я; = г'я, а значит, представление Г изоморфно Г7. Аналогичное утверждение справедливо, конечно, и для любого числа слагаемых Гг. § 5. Унитарное представление. Приводимые и неприводимые представления Определение 5. Представление Г группы О называется унитарным, если в пространстве представ- ления /? можно так определить скалярное произведение, что это пространство станет евклидовым, а все операторы Г (а), где ае О, будут унитарными. Лемма. Каждое представление конечной группы является унитарным.
336 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII Доказательство. Можно считать, что пространство /? — евклидово: мы просто положим, по определению, скалярное произведение векторов х = ххех + х2е2 + ... +хпеп и у = у{ех + у2е2 + ... ... + Уп&п равным (*, У) = *!*/! + Х2у2 + . . . + Хпуп. Ясно, что относительно этой метрики пространство /? будет евклидовым, а базис ей е* . •., еп — ортонормированным, так как (ей е<) = 1 для всех ь и (ей в}) = 0 при ь ф /. Если в этой евклидовой метрике все преобразования Г (а) унитарны, то наше утверждение доказано. В противном случае мы изменим скалярное произведение в /?, полагая, по определению, <*.*>* 2 (Г (а) х, Г (а) у), B) где суммирование ведется по всем элементам а группы О. (В формуле B) <*, */> — новое скалярное произведение векторов х и (/, а (*1 #) — старое скалярное произведение.) Проверим, что функция < , > удовлетворяет всем условиям, которые должны выполняться для скалярного произведения в комплексном евклидовом пространстве. Имеем 1. <У>*>= 2 (Т(а)у,Т(а)х)= 2 (Г (я)*, Т[а)у)=* = 2 (Г (а)*. Г (а) у) = <*,*>. 2. <<**,*/> = 2 (г (<*) («*). Г(а)у) = «2 «(Па)*, Г(а)у) = а2 (г («) *> Г (*)*) = а(х, у>. 3. <*! + *2, */> = 2 (Г (а) (*1 + **>> Г («) У) = = 2 (Г (*) *1' Г («) У) + 2 (Г (*) *«• Г <*> У) = <*!> ^> + <*2> У>. 4. Если вектор х ф О, то так как оператор Г (а) —невырожденный, то и Г (а) л: ф О, а тогда (Г (а)*, Г(а)дг) > 0, и значит, вся сум- ма 2 (Г(а)х, Г (а)*) больше нуля. С другой стороны, если х = О, то <х, д:>, очевидно, равно 0. Таким образом, скалярный квадрат <х, хУ ^ 0 и из равенства <*, х> = 0 вытекает, что х = 0. Покажем, что в новой метрике все операторы, соответствующие элементам группы О, унитарны, т. е. что <ГF)*, Г(Ь)#> = = <#, #> для каждого Ь е О. Действительно, <Г F) *, Г F) у) = 2 (Г И Г F) *¦ Г (а) Г ^ *)•
§5] УНИТАРНОЕ ПРЕДСТАВЛЕНИЕ 337 Но Г (а) Г (Ь) = Г(аЬ), так как Г — представление группы (/, и последняя сумма равна 2 (Г (а&) *, Г(а6)#). Далее, если а пробе- гает все элементы (конечной!) группы О: а = 01, 02, Д3, • • •» а*' а Ь — один из этих элементов, скажем, Ь = а*, то произведения, аЬ = а^, а^Дь ДзДь .. •» ЯлД< — это тоже все элементы группы О, но взятые, вообще говоря, в каком-то другом порядке (из равенства а^а^ = а]а^ немедленно вытекало бы, что ак = а}). Следовательно, 2 (Г (аЬ) х. Г (аЬ) у) = 2 (г («) х> Г И У) = <*• ^> и окончательно <Г(*)*, Г(&)*/> = <*, у>. В дальнейшем, говоря о представлении (конечной) группы, мы всегда будем пользоваться тем, что оно унитарно. Определение 6. Представление Г группы О в пространстве /? называется приводимым, если в /? имеется нетривиальное (т. е. отличное от всего пространства Я и от «пространства размерности 0», образованного нулевым вектором) подпространство /?ь инвариантное относительно О (т. е. инвариантное относительно всех преобразований Г(а), где аеО). Если такого подпространства нет, то представление Г неприводимо. Ясно, что одномерное представление всегда неприводимо. Теорема 1. Пусть Г — приводимое представление конечной группы О в пространстве /? и Н —подпространство #, инвариантное относительно группы О. Тогда найдется такое, тоже инвариантное относительно О, подпространство /?2, что (Таким образом, для того чтобы представление конечной группы было разложимо в прямую сумму под- представлений, необходимо и достаточно, чтобы оно было приводимым.) Доказательство. По лемме мы можем считать пространство /? евклидовым, а все операторы Г (а), соответствующие элементам группы О,— унитарными.
338 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII Тогда ортогональное дополнение /?2 = ^^ подпространства /?1 тоже инвариантно относительно группы О (см. стр. 182) и 7? = /?! ф /?2 (см. стр. 156). Для бесконечных групп последняя теорема, вообще говоря, неверна. Рассмотрим бесконечную циклическую группу — аддитивную группу целых чисел. Отображение Г, ставящее в соответствие числу к матрицу гИ-[1 ?} является (двумерным) представлением этой группы, так как г<«г<41 ?][: н;. ?]-"»+«>¦ Одномерное подпространство {е2} инвариантно относительно всех преобразований Т(к), но для него не найдется инвариантного дополнительного подпространства, так как (двумерное) пространство /? представления Г не имеет никаких других подпространств, инвариантных относительно Т(к). Действительно, собственные значения преобразования Т(к) находятся из уравнения IV Л| = A-ЯJ = 0, и значит, Яь2= 1. Соответствующие собственные векторы удовлетворяют уравнениям О^х + 0*2 = 0, кхх + 0л:2 = 0, т. е. Х\ = 0, а это — только векторы, коллинеарные е2. Теорема 2. Всякое представление конечной группы либо неприводимо, либо является прямой суммой неприводимых представлений. Доказательство. Если представление Г группы С в пространстве Я приводимо, то, по теореме 1, его можно разложить в прямую сумму представлений меньших размерностей. Если какое-нибудь из слагаемых приводимо, с ним поступим так же, и т. д. Этот процесс не может продолжаться до бесконечности, так как размерности слагаемых уменьшаются, а размерность пространства представления конечна. Окончательно наше представление разложится в прямую сумму неприводимых представлений: г = г, ф г2 е... ф г,
§6] РЕГУЛЯРНОЕ ПРЕДСТАВЛЕНИЕ 339 § 6. Регулярное представление Для каждой конечной группы можно построить так называемое регулярное представление, играющее важную роль в общей теории представлений групп. Пусть аь а2, ..., ак — все элементы группы О. Рассмотрим й-мерное векторное пространство /?, элементы базиса которого поставим во взаимно однозначное соответствие элементам группы О; короче говоря, мы просто перенумеруем элементы базиса элементами группы О: еа1У еаг, ..., вак* Далее, положим, по определению, Г(а{)еа1=еар1 Мы получим ^-мерное представление группы О, так как Г(а|)Г(а^0вв = Г(аОе^а8= еа{(а.0з)= е(*^)а,= Г(а4а,-)еав, т. е. для всех базисных векторов еахУ еа„ . • .,еак — а значит, и для всех векторов х пространства /?,— имеем Г(а,)Г(а,)* = Г(а,а,)*; следовательно, Г (а,) Г (а,) =Г(а,а;.). Определенное таким образом представление группы О и называется ее регулярным представлением. Рассмотрим несколько примеров. 1. Регулярное представление группы Сг. Пусть е и а — элементы группы, причем а2 = е*). Пространство представления будет двумерным с элементами базиса ег и еа. По определению, Г(е)ее = ее, Г(е)еа = еа, Т(а)ег = еа9 Г (а)еа = еа> = ег; и соответствующие матрицы имеют вид г<=>-[: % гМ-[«;]. *) Здесь и далее мы часто будем обозначать единицу группы О греческой буквой е, а не латинской буквой е.
340 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII 2. Регулярное представление группы С4. Здесь элементы группы е, а, а2, а3 и базис пространства представления образуют четыре вектора ^е» ^а» ^а*, ^<*»« По определению, Г (а) ее = еа, Г (а) еа = еа*, Г (а) еа. = еа», Г (а) еаг = ее; Г(а2)^е=,^, Т(а*)еа = еа>, ?{а*)е** = ег% Т(а*)еаг = еа; Г (а3) ег = га., Г (а8) еа = ее, Г (а3) е* = *аэ Г (а3) еа« = еа-; соответствующие матрицы имеют вид 10 0 0 0 10 0 0 0 10 и о о и о о о г 10 0 0 0 10 0 .0 0 10. Ч) 0 1 0~ 0 0 0 1 10 0 0 » -0 10 0-М 0 10 0 0 0 10 0 0 0 1 и о о о] 3. Регулярное представление группы V. Элементы группы е, а, Ь и аЬ — Ьау причем а2 = Ъ2 = е; базис пространства представления вы еа, е^, еаь> По определению, Г(а)ее = еа1 Г(а)еа = ее1 Г(а)еь=еаЬ, Г(а)еаЬ = еь; Г(Ь)ее = еь, Г(Ь)еа = еаЬ, Г(Ь)еь = ее, Г(Ь)еаЬ = еа; Т(аЬ)ег — еаЬу Г(аЬ)еа= еь, Г(аЬ)еъ = еа, Т(аЬ)еаЬ — ег\ соответствующие матрицы имеют вид 10 0 0" 0 10 0 0 0 10 Ю 0 0 1. 0 10 0 10 0 0 0 0 0 1 ю о ) о^ 0 0 10" 0 0 0 1 10 0 0 1-0 1 0 0. О О О Г 0 0 10 0 10 0 .10 0 0. 4. Регулярное представление диэдральной группы Бг. Здесь элементы группы е> г, г2, 5, $г, зг2у причем г3=52= — е, Г8 = 8Г2* Базис пространства представления ^е, ^г, &гг\ ^в< &8г> е$г*» Проверьте сами, что соответствующие матрицы имеют вид
§Л ФУНКЦИИ, ОПРЕДЕЛЕННЫЕ НА ГРУППЕ 341 '10 0 0 0 0 10 0 0 0 0 10 0 0 0 0 10 0 0 0 0 1 0 0 0 0 0 0 0 0 10 0 0 0 0 1 0 0 0 0 0 10 0 0 0 0 10 0 0 0 0 10 0 0 0 0 0 0 1_ 0~ 0 1 0 0 0, > » 0 1 0 0 0 .0 0 0 0 1 _0 0 1. 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0. 0" 1 0 0 0 0_ ' » 0 1 0 0 ,0 'о 0 0 0 0 _1 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0" 0 0 0 0 0 0 0 0 1 1 0 0 0 1 0. 0 0 Г 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0. При к>\ регулярное представление приводимо, так как, например, одномерное подпространство, порожденное вектором/ = еах + еа% + • • • + еак, инвариантно относительно группы О: при всех / Г (а{)/ = Г (а«) (еах + еая+ ...+ ейк) = Но а{аи а(а2, ..., агаА—это те же элементы аи а2, ..., ак, только, быть может, взятые в каком-то другом порядке. Следовательно, Г(а<)/ = /. Легко видеть, что в каждой строке и в каждом столбце матрицы регулярного представления один из элементов равен 1, а все остальные элементы равны 0 (докажите это сами). § 7. Функции, определенные на группе Пусть О — произвольная (конечная) группа; предположим, что каждому элементу а группы О поставлено в соответствие какое-то, вообще говоря, комплексное число ф(а). Мы будем говорить тогда, что на группе О задана функция ф. Если естественным образом определить сложение функций: (ф + 'Ф) (а) = Ф (#) + Ф (я) Для каждого а е= О и умножение функции на число: (аф) (а) = аф(а) для каждого ае(?и любого (комплексного) числа а,
342 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII то очевидно, что множество всех комплексно-значных (т. е. принимающих комплексные значения) функций, определенных на группе О, станет векторным пространством. Покажем, что если порядок группы равен й, то это пространство к-мерно. Действительно, пусть элементы группы будут а\, а2у ..., ак\ рассмотрим к функций ф,-(а), где ь = 1, 2, ..., к, определяемых следующим образом: A, если г = /, ф<(а;) = 10, если 1Ф1. Легко видеть, что эти к функций линейно независимый что каждая функция, определенная на группе О, является их линейной комбинацией. В самом деле, если Р— произвольная функция на группе О и, скажем, р(ат) = ат, то, очевидно, к к Р (а) = 2 (Хгфг (а), Т. е. Р = 2 <Хгфг- г=1 1=1 Определение 7. Функция ф(а), определенная на группе О, называется центральной, если для любых двух элементов а, Ь е О ц)(аЬ) = фFа). Пусть ф — центральная функция на группе О. Тогда для любых а, Ь е О имеем <р(Ь~*аЬ) = ц)((Ь-1а)Ь) = ФF(&-»а)) = = Ф((ЬгН)а)=ф(а). Обратно, пусть для всех а, Ъ е О имеет место равенство ф(Ьа&) = ф(а). Полагая Ь^а = ^ (откуда а = Ьс), получим ф(сб) = фF-1а6) = ф(а) = фFс). Итак, если равенство ф(аб) = фFа) выполняется тождественно для всех элементов группы О, то тождественно выполняется и равенство у(Ь~]аЬ) = ф(а), и наоборот. Следовательно, функция ф «я группе С в том и только в том случае является центральной, если она принимает равные значения на всех сопряженных между собой элементах группы. Можно сказать поэтому, что цент-
§7] ФУНКЦИИ, ОПРЕДЕЛЕННЫЕ НА ГРУППЕ 343 ральная функция определена на классах сопряженных элементов группы. Множество всех центральных функций является под- пространством пространства функций, определенных на группе О так как сумма центральных функций и произведение центральной функции на число тоже являются, очевидно, центральными функциями. Теорема 3. Размерность пространства центральных функций, определенных на группе С, равна числу р классов сопряженных элементов этой группы. Доказательство. Пусть Сь С2, ..., Ср — все классы сопряженных элементов группы О. Если/7—произвольная центральная функция на группе О, то она может рассматриваться как функция, определенная на этих классах, т. е. функция, ставящая в соответствие каждому классу С< определенное число Р(С{). Рассмотрим р (центральных) функций г|)Ь г|J, ..., \|)Р, где 10 при I Ф\. Функции \|)*, очевидно, линейно независимы, и каждая центральная функция является их линейной комбинацией: если р -произвольная центральная функция на О и Р(С,) = а,, /= 1, 2, ..., /?, то V Р = 2 а^. 1=1 Значит, размерность пространства центральных функций, определенных на груцпе С, равна числу классов сопряженных элементов этой группы. Выше мы видели, что если Г— одномерное представление группы О, то Г(Ь~1аЬ) = Т(а) для любых а, бе е О; поэтому одномерные представления любой группы являются определенными на ней центральными функциями. Так, для группы Бъ на стр. 328 мы нашли две определенные на ней центральные функции Г] и Г2: Г] тождественно равна 1 и Г2{е) = 1, Г2(Г) = Г2(Г2) = 1, Г2E) = Т2(8Г) = Г2EГ2) = _ ^
344 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII § 8. Скалярное произведение на группе В пространстве функций, заданных на группе О порядка к> определим скалярное произведение, полагая (ф.Ф) = Х 2 Ч> (<*)*(*)• где суммирование распространяется на все элементы а группы О. Проверим, что при этом будут выполнены все аксиомы скалярного произведения: Ь »,Ф) = |^ М Ф (*) = т 2 Ф (д) *'(*) = (Ф. *)• 2. (аф, яр) = т 2 аФ (я) ^Т^) = а(ф> # 3. (Ф1 + Ф8, *) = = Т2[Ф1 И + Ф2 И1?Й = (ФЬ *) + (ф2, *). аеО При этом пространство функций, определенных на группе О, будет евклидовым, так как 4. (Ф,Ф) = 4-2(Р(^)ФЙ = 4-2|Ф^I2>0> и если (ф, ф) = 0, то ф(а) =0 для каждого а е О, и значит, ф ^ 0. Рассмотрим еще несколько примеров. Выше (в § 1) мы нашли 3 представления диэдральной группы Ь$: два одномерных Г*1 = 1 и Г2И=Г2(Г)=Г2(Г2)=1, Г2E)=Г2EГ)=Г2Eг2)=-1. и двумерное, назовем его Г3: г3 (*)=[; ;], г,(г)= Г3 (г1) = 1 4-/з -4- I. 2 -4- 4/31 2 1--~ 2 4/з -4- 2 ^ Г. E) =
§8] СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ НА ГРУППЕ 345 Т3(8Г). 2 1_"~~ 2 4- -4-/3 1 .- 1 —9-/3 -5- , Г3(*г2) = -4- 4-/з' I- 2 1/з 4 Рассмотрим шесть функций на группе 03:- Гь Г2 и функции чи, ^12, ^21, Т22. определенные следующим образом: Тп (*)=!, 7п @ = ~ 4-> ^и ('2) = - 4"» 7и (*)=!. VII И = - 4"' VII E/-2) = - 4"! 7м(в) = 0, У12 М = -4-/3 7х2('-2) = 4-^3. Ти(8) = 0, ^(8г) = -4-/3, Ъ2EГ2)=4-КЗ; 7.1 E) = 0, 7*1 Н = -4-^ 721E') = 4-^ 7м («) = 1, 7гг (') = - 4"> ^га С/-2) = - 4"' 722 E) = - 1, 722 И = 4 • ?22 E/) = 4" (таким образом, ^«— это соответствующие элементы матрицы Гз). Вычислим попарные скалярные произведения этих функций: (Г„Г2) = = -1-И • 1 + Ы + Ы + 1 (- 1) + 1 (- 1) + 1 (- 1)] = 0; (Г2,7и) = 4-[Ы-Н(-4-)+1(-4-)+ C) + (- 1). 1 + (- 1) (- 4~) + (~ 1) (- 4)] = °- Аналогично получаем (Г,, -л,) = (Гь Ь2) = (Гь Т21) = (Гь Т22) = (Г,, Ти) = = (г2)-Г21) = (г2, -ы = о.
346 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII Далее, + 1-0 + (-^)(-4-/з) + (-4)^/з] = 0. D) Аналогично, (Т1Ь Т21> = (Т1Ь Т22) = (Т12, ЬО = = (Т12, Т22) = (Т2Ь Т22)= 0. Все рассматриваемые функции, таким образом, попарно ортогональны.. Скалярные квадраты этих функций равны (г1,г1)^4-A2 + 12 + 12 + 12 + 12 + 12) = 1 = -г и E0 (Г„ Г2) = 4" О2 + I2 + I2 + I2 + I2 + I2) = 1 = + — для одномерных представлений и E") а также и (у21, 721) = (Т22» Тгг) = -§ Для Двумерных представлений. Всюду в знаменателе правой части стоит степень соответствующего представления. Ниже (в § 10) мы докажем аналогичные равенства для общего случая. § 9. Лемма Шура Лемма Шура состоит из двух частей с «Прологом» и «Эпилогом». Пролог леммы Шура*). Пусть Г1! и Г2 —два линейных представления группы О в пространствах Н\ и /?2 соответственно и Ж — линейное отображение прост- *) Что же касается «Эпилога» леммы Шура, то он пояэится у нас только в следующей главе (см. стр. 357).
§9] ЛЕММА ШУРА 347 ранства #{ в /?2. В отличие от отображения, фигурирующего в § 2, Ж не предполагается взаимно однозначным; точнее говоря, каждому вектору х е= /?1 поставлен в соответствие определенный вектор Жх €= /?2) так что Ж(х + у) = Жх + Жу и Ж(ах) = аЖх, но не предполагается, что каждый вектор из /?2 является образом хотя бы одного вектора из /?! и что из равенства Жх = Жу вытекает х = у. Предположим, далее, что ЖТ\ = Г2Ж, т. е. что ЖТ\(а) = Т2{а)Ж для каждого элемента а е О и, значит, ЖТ\(а)х = Г2(а)Жх; для каждого вектора ^е/?1# Последнее означает, что безразлично, сначала ли применить к вектору х оператор Г\(а), соответствующий элементу а группы О, а затем отобразить полученный вектор Г\(а)х в /?2, или сначала отобразить х в 7?2, а потом к полученному вектору Жх; применить оператор Г2(а), соответствующий тому же элементу оеО (см. «Коммутативную диаграмму» на стр. 331). Докажем, что в нашем предположении образ ЖК\ пространства К\ в К2 (т. е. совокупность всевозможных векторов вида Жх, где х е Цх) и ядро N отображения Ж (образованное всеми такими векторами *е/?ь что 2@х = 0), являются подпространствами, инвариантными относительно группы О. То, что ЖК\ в К2 и N в #! являются подпространствами, доказывается совсем просто (ср. стр. 115). Докажем инвариантность этих подпространств. 1. Инвариантность ЖН\. Пусть х^ЖЯи тогда х = =Жх\у где Х\ е #ь Нам надо показать, что вектор Г2{а)х тоже принадлежит ЖН\. Но так как ЖТХ = = Г2Ж, то Г2(а)х = Г2(а)Эвх1 = ЗМ^а)*!, и значит, Г2(а)х&3@Я1. 2. Инвариантность N. Пусть г/ е М, т. е. <Жу = 0. Нам надо показать, что и Т\{а)у ^ N. Но так как 5^Г1 = Г2^, то ЖТх(а)у = Т2(а)Жу = 0у и значит, Г}(а)^ е N.
348 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII Таким образом, подпространства ЖЯ\ е /?2 и N е #\ инвариантны относительно группы О. Лемма Шура, часть I. Если в сформулированных выше условиях (Г\ и Г2— представления группы О в пространствах /?1 и /?2 и Ж — линейное отображение пространства Я\ в /?2 такое, что ЖТ\ = Г2Ж) представления П и Г2 неприводим ы, то либо Ж — О, либо представления Хх и Г2 изоморфны. Доказательство. Так как представления Г1 и Г2 неприводимы, то ни /?ь ни /?2 не могут содержать нетривиальных подпространств, инвариантных относительно группы О. Однако образ ЖК\ пространства Я\ является в /?2 инвариантным подпространством; следовательно, либо ЖЯ\ = 0, либо ЖЯ\ = /?2. Но если ЖЯ\ — 0, то Ж отображает все /?1 в нуль, и значит, Ж = О. Если же ЖЯ\ = /?2, то Ж отображает пространство Я\ н а все /?2 (т. е. каждый элемент из #2 будет образом хотя бы одного элемента из /?1). Далее, ядро N отображения Ж является в /?1 инвариантным подпространством, и значит, либо N = 0, либо N — Я\. Если N = /?ь то все пространство #\ отображается в нулевой вектор, и значит, Ж = О. Если же N = 0, то отображение Ж взаимно однозначно. Действительно, из равенства Жх = Жу вытекает, что Ж(х — у)— О, откуда следует, что х — у^М, и значит, х — у = 0, т. е. х = у. Итак, если Ж ф О, то Ж взаимно однозначно отображает пространство /?1 на все /?2. Так как, кроме того^ это отображение линейное, то оно будет изоморфным отображением /?1 на /?2. В силу равенства ЖГ\ = Т2Ж, представления Г1 и Г2 изоморфны. Лемма Шура, часть II. Пусть Г — неприводимое представление группы О в пространстве Я и Ж — такой линейный оператор в пространстве /?, что ЖТ = = ТЖ\ тогда Ж является гомотетией {т. е. существует такое число X, что Ж = \&). Доказательство. Пусть X — одно из собственных значений оператора Ж> а х ф О — соответствующий собственный вектор. Тогда Жх = Кх, или {Ж — Х&)х = О,
§ Ю] СЛЕДСТВИЯ ИЗ ЛЕММЫ ШУРА 349 Из равенства ЖТ = ТЖ вытекает, что (Ж — №)Т = Т{Ж — %8). Как доказано в «Прологе» (если применить его к оператору Ж — %8 при Кх = /?2 = # и Г1 = Г2 = Г), ядро N оператора Ж— \<8 инвариантно относительно группы О, а так как представление Г неприводимо, то либо N = 0, либо N = /?. Однако равенство N = 0 невозможно, поскольку ненулевой вектор х принадлежит N. Следовательно, N = /?, т. е. все пространство /? оператором Ж— \2> отображается в нулевой вектор, откуда Ж — \8 = 0 и Ж = Х&. § 10. Следствия из леммы Шура Вспомогательное предложение. Пусть Т\ и Г2 — произвольные представления группы О в пространствах /?! и /?2 и Ж — произвольное линейное отображение Я{ в /?2. Тогда являющееся, как легко видеть, линейным отображением #1 б #2> удовлетворяет условию ЖоГ\ = Т2Ж0У т. е. для каждого элемента Ъ группы О ЖоГ1(Ь)=Г2(Ь)Ж0, или, что то же самое, Т11{Ь)ЖъТхф) = Ж<>. Доказательство. Мы имеем Г2~1 (Ь) Ж0Г1 (Ъ) = Г, (*-') Ж0Г, (Ь) = = 2 Т2(Ь-1а^)ЖТ1(аЬ)= 2 Т2((аЬ)^)ЖТ1(аЬ). Но если а пробегает все элементы (конечной!) группы
350 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII С, а 6 — фиксированный элемент этой группы, то произведение аЬ тоже пробегает все элементы группы О только, вообще говоря, в каком-то другом порядке. Следовательно, 2 Г2((аЬ)-1)^0Г1(аЬ) = 5В0. Мы доказали, что [Г2(Ь)]-^оТ{{Ь)=^ или 5»0Г1F)= Г2(Ь)Эв0, где Ь — любой элемент группы О. Следствие из 1-й части леммы Шура. Пусть Г! и Г2 — неприводимые неизоморфные представления группы О в пространствах /?1 и /?2 и Ж — произвольное (линейное) отображение /?! в /?2. Предположим, что в пространствах К\ и /?2 выбраны ортонормиро- ванные базисы, и пусть в этих базисах элементы матриц операторов Г^а), Г2(а) и отображения Ж будут соответственно У{$(а), у\? (а) и Н{у Мы видели, что отображение пространства /?! в /?2 удовлетворяет условию Тогда, по 1-й части леммы Шура, поскольку представления Г! и Г2 не изоморфны, Жц = 0. Элемент /4$, стоящий на пересечении р-й строки и <7-го столбца матрицы Я0, равен К, = 2 2 7$ (а-Ч А«7Й} (а) = 2^/2 7$ М Т# («) ае(? г,; г,з аеО (здесь суммирование ведется по I от 1 до /г2 и по / от 1 до пь где пи 1= 1, 2,— размерность пространства /?*) — и он равен нулю при любом отображении 2/6, т. е. при любых Н15. Следовательно, коэффициент при Н{} в правой части последнего равенства равен нулю при всех /, /: 2тй)(«-1)Й)(«) = 0.
§ Ю] СЛЕДСТВИЯ ИЗ ЛЕММЫ ШУРА 351 (Легко видеть, что если сумма2а^й^- равна нулю при подстановке любых значений Н1Ь то все ее коэффициенты (Хц равны нулю. Действительно, положив, например, Нц = 1, а все остальные Нц = 0, мы получим, что ^ацН1)=а1ии значит, ац = 0, и т. д.) Но выше мы условились (см. стр. 335), что все рассматриваемые операторы унитарны. Следовательно, Г2(а~1) = = [Г2(а)]~1 = [Г2(а)]*. Так как базис в пространстве /?2 — ортонормированный, то элементы матрицы [у)$ (а)] оператора Т{2){а) удовлетворяют условиям: ,уй)(а) = = у${а) при всех I, р. Таким образом, при всех I, / 2тй)Итй>(а) = 0. Если матричные элементы у$, у$ рассматривать как функции, заданные на группе О, то последнее равенство означает, что скалярное произведение любых двух таких функций, взятых для неизоморфных неприводимых представлений, равно нулю: (у%\ У(&) = 0 при всех *, /, р, ц, т. е. что эти .функции попарно ортогональны. Так, в примерах, приведенных в § 8, функции ^ц, «у12, Т2ь Т22 ортогональны функциям Г1 и Г2, а также Г\ ортогональна Г2 (см. равенства C) на стр. 345). Полезно заметить, что поскольку для каждой группы имеется единичное представление Го(а) = 1 для всех аей, то, если ^}{а)—элементы матрицы произвольного (неприводимого) неединичного представления этой группы, то (Т*у, Го) = 2 Уи (а) = 0, т. е. для любых *', / сумма всех значений функции ^ равна нулю. Следствие из 11-й части леммы Шура. Пусть Г — неприводимое представление группы О в (л- мерном) пространстве /? и Ж — произвольный линейный оператор в /?. Тогда, как было показано выше (вспомо-
352 ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП [ГЛ. XII гательное предложение для случая Г1 = Гг = Г, /?1 = = /?2 = /?), линейный оператор ^о=2Г (а-1) Ж (а) в пространстве /? удовлетворяет условию <9#0Г = Г<Э#0> и значит (по лемме Шура, часть II), Жо — гомотетия: 2 Г(а-1M8Г(а) = Хгг. F) Элемент, стоящий на пересечении р-й строки и #-го столбца матрицы 2 Г (от1) <З^Г (а), равен п п 2 2 ^(а-^ЛиулЮ- 2 л« 2 ъч (е-1) Ыа). Элемент, стоящий на соответствующем месте в матрице \<8, равен 6Ряк, где |1, если р = <7, ¦'рд -г 1о. если рфд. Найдем значение X. Для этого вычислим след обеих частей равенства F). След правой части равен 1г(ХЙГ) = Яп След левой части равен 2 ЫР (а))-1 Ж (а)] = 2 1г^ = Л1г^, (см. стр. 127; здесь к — порядок группы О), и так как 1г5#= 2 М^ то *,5=1 п Хл = к 2 $цЬц* п Мы нашли, что Я = — ^ 6^/^ и, значит, элемент, стоящий на пересечении р-й строки и ^-го столбца мат- п рицы Ш, равен Ьт~ 2 ^цНц. Таким образом, мы
§ Ю] СЛЕДСТВИЯ ИЗ ЛЕММЫ ШУРА 353 имеем п г,.7=1 аеб М=1 причем это равенство справедливо при всех Лу. Следовательно, при всех /, /, р, ц 2 Ур1 (а"') ^ (а) = — 6р<Ау- G) (Если равенство 2 ъфц = 2 &Фи выполняется при под- становке любых значений Кц> то 2 («и — Р*.?) Ы) =0 г,; тоже при любых Лу, и значит, ау — Р« = 0, т. е. ау = Р« при всех I и / — см. замечание в скобках на стр. 351.) Пользуясь унитарностью оператора Г(а), равенство G) можно переписать еще и так: Т^Ь (я) 7уд (а) = 4" вР«А/» или G;^ Угр) = — врдб,/, и значит, [0, если р^ц или /т4/, G77 Л|р) = ^ если р = ? и ; = д (ср. с равенствами D), E'), E") на стр. 346).
ГЛАВА XIII I ТЕОРИЯ ХАРАКТЕРОВ § 1. Характер представления. Простейшие свойства характеров Определение 1. Пусть Г — линейное представление группы О в пространстве /?. Для каждого а^О положим %(а) = 1г Г(а). Определенная таким образом на группе О (комплексно-значная) функция уг называется характером представления Г. Если Г — одномерное представление группы О, то для каждого а&С имеем %(а) = 1г Г (а) = Г (а). Выпишем характеры всех определенных выше представлений группы 5з — #з- Пусть ^1 = Г1! и 2B = Г2 — характеры одномерных представлений Г1 и Гг этой группы (см. стр. 328), %г — характер двумерного представления Гз, определенного на стр. 328, -/4 — характер трехмерного представления, указанного на стр. 329 (назовем его Г4) и, наконец, /5 — характер регулярного представления Г5 этой группы (стр. 340). Все эти характеры можно собрать в такую таблицу. XI | Х2 | Хз | Х4 | Хб е 1 1 2 3 6 г 1 1 — I 0 0 /•* 1 1 — 1 0 0 5 1 — I 0 — 1 0 вг ' 1 — I 0 — 1 0 5Г2 1 — 1 0 — 1 0
§ 1] ХАРАКТЕР ПРЕДСТАВЛЕНИЯ 355 Характеры играют очень важную роль в теории представлений. Можно сказать, что характер представления определяет это представление, так как дальше будет показано, что представления с одинаковыми характерами изоморфны. Рассмотрим простейшие свойства характеров. 1. Для любого представления х(^)= п> где е — единица группы С, а п — степень представления. Действительно, Г(е) есть единичная матрица порядка п, и значит, %(е)=иГ(е)=п. 2. Характер является центральной функцией на группе: %{Ь~1аЬ)=%(а). Действительно, х(Ь~1аЬ) = 1г Т{Ъ'хаЪ) = (г Г (а) = х(а) (см. стр. 127). 3. Изоморфные представления имеют одинаковые характеры. В самом деле, если 3€>\ 1 == 12<™ •> то " %х(а)=1гГ{(а)=\г(^Г2(а)Щ=иГ2(а)=Ъ(а). 4. Если представление Г является прямой суммой представлений Г{ и Г2, то характер % представления Г равен сумме характеров ^ и %2 представлений Т\ и Г2: X = XI + Х2- По условию, /? = /?1®/?2, где /?, /?,, /?2 —пространства представлений Г, Гь Г2. Если базис /? выбрать так, чтобы первые пх (где П\ — размерность Кх) векторов принадлежали подпространству /?ь а последние п2 векторов (где л2 — размерность ^2)—подпространству /?2, то матрица представления Г {а) будет иметь вид Т(а) = где Т\{а) —матрица представления Г! в пространстве /?ь о о Г2(а)|
356 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII а Г2(а)—матрица представления Г2 в пространстве /?2. Но в таком случае, очевидно, для каждого аеС х(а)=1гГ(а)={гГ1(а) + 1гГ2(а)=Х1(а)+Х2(а), т. е. X = XI + Х2- 5. Для любого аеО хМ^хМ- Пусть Ки л-2, •. .1 Л» ~ все собственные значения оператора Г (а), причем каждое взято столько раз, какова его кратность. Так как оператор Г (а) — у н и т а р н ы й, то Г(а-1) = [Г(а)]~1 =[Г(а)]*, и значит, собственные значения оператора Г (а-1) совпадают с собственными значениями [Г(а)]*. Но, ввиду следствия на стр. 168, собственными значениями оператора [Г(а)]* будут Ль А2, . . ., Лп (где также каждое собственное значение взято столько раз, какова его кратность). Следовательно, %(а-*) = 1гГ (а-*) = 1г [Г (а)]* = Х1 + Х2+ ... +1п = 6. Если хо — характер регулярного представления Г0 группы О порядка к, то (к, если а = е, Хо(а)==10, если афе. Действительно, пусть а{ = е, а2, ..., аЛ — все элементы группы О, и базис пространства представления образован векторами еах% еа„ ..., 2ад. Так как #1 = е — единичный элемент, то Хо(а1)=1гГ0(а1)= к (п. 1). Если а< ф а{ = е, то так как из равенства ахар = аР вытекало бы, что а^ =
§ 2] ХАРАКТЕРЫ НЕПРИВОДИМЫХ ПРЕДСТАВЛЕНИЙ 357 = е = й\. Следовательно, при I Ф 1 базисный вектор еар оператором Г0(а*) переводится снова в базисный вектор еНар, однако — в вектор, отличный от него самого. Это значит, что для любого р в р-м столбце матрицы Го (а,) единственный отличный от нуля элемент — это единица, стоящая не на главной диагонали, а следовательно, все элементы главной диагонали такой матрицы равны нулю, и значит, след ее равен нулю. § 2. Характеры неприводимых представлений Этот параграф, содержащий дальнейшие следствия леммы Шура, можно назвать ее «Эпилогом». Теорема 1. Характеры неприводимых не изоморфных между собой представлений конечной группы обра- зуют ортонормированную систему функций (отсюда, в частности, будет следовать, что конечная группа имеет конечное число неприводимых представлений). Как и лемма Шура, эта теорема состоит из двух частей: I. Если XI ^ Х2 — характеры неприводимых не изоморфных между собой представлений Тх и Г2 группы О, то (хь Х2)= 0. Действительно, пусть к — порядок группы О. Тогда (Хь XI) = тг 2 *1 (а) хТН = 4" 2 *г Г1 (*) 1ТГГЙ - =-г 2 2 тй} (а) 2 № «о - 4- 2 2 ^ ы'Ш= = 2x2 тй} («) Шь = 2 Ш. •№ - о, 1.5 аеО и так как каждое слагаемое этой суммы равно нулю (см. стр.351). II. Если Г — неприводимое представление группы О с характером х, то (х, %\— 1.
358 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII Действительно, (Х- X) = -Т 2 * МХИ = -|- 2 *г Г (°) ^^^У = п п п ^ "Г 2 2 ?и (а) ^ V;; (а) = — 2 2 Т« И Тя (а) = п = 2 4" 2 т« («) ъПд = п п п = 2 ^гг, 7;;) = 2 G*Ь У") = 2 Т" = ^ г, ;=1 г=1 г=1 так как (?«, ?я) = 0 при * =^/, а Gгг, 7п) = — (см. стр. 353). Теорема доказана. Так, для группы 53 ^ /K (см. таблицу на стр. 354) имеем (Хь Х2) = -§- С1 -Ь 1 Ч- 1 — 1 — 1 — 1> — О, (Х1, Хз) = я=Л.B-1-1) = 0| (Х2Л8)==0, (ХьХ1) = = 4" A + 1 + 1 + 1 + 1 + 1) = 1, (Х2, Ъ) = 1, (Хз, Хз) = Ь Но, с другой стороны, (и Х4) = 4(9+1 + '1 + 1) = 2 и (Хб,х.) = 4-36 = 6^ значит, представления Г4 и Гб этой группы не являются неприводимыми. Найдем скалярный квадрат характера %0 регулярного представления произвольной группы С порядка к Выше мы видели, что Хо(#1)~ ^ и Хо(я<)= О, если / ф 1. Следовательно, (Хо. Хо) = —•*•* = *; отсюда снова получаем, что регулярное представление любой (не состоящей из одной единицы) группы приводимо (ср. стр. 341).
§3] ДАЛЬНЕЙШИЕ СВОЙСТВА ХАРАКТЕРОВ 359 § 3. Дальнейшие свойства характеров Пусть Г — линейное представление группы О в пространстве /? с характером х- Разложим Г в прямую сумму неприводимых представлений Г< — пусть г = Г! е г2 е... © г.. Характер (неприводимого) представления Г* (где I = = 1,2,..., 5) обозначим через х<- Тогда характер представления Г X = XI + Х2 + . . . + X*- Среди представлений Г< могут быть и изоморфные между собой, им отвечают равные характеры. Наоборот, характеры неизоморфных между собой неприводимых представлений не могут быть равными, так как если XI = Х2> то (хь Х2) = (Хь х0= 1, а не 0, как должно быть по п. 1 предыдущего параграфа. Объединяя слагаемые, отвечающие изоморфным представлениям, последнюю сумму можно переписать так: X = таг + ™2Х2 + ... +/и*Х* A) где т,—«кратность» представления Г* (здесь / = 1, 2, ..., ф и представления Гь Г2, ..., Гд попарно не изоморфны). Пусть теперь Г7— произвольное неприводимое представление группы О с характером %'. Рассмотрим скалярное произведение (х'> X) = (х'> 0*1X1 + т2Х2 + ... Л-ЩХч) = ='Мх/> хО+^Мх', хгН.-. + 'Мх'. х*)- Но (х', х«)= °> если г' не изоморфно Г, и (х', х0 = 1, если представления Г' и Г* изоморфны. Следовательно^ скалярное произведение (%\ %) обязательно является целым числом, которое показывает, сколько раз неприводимое представление Г7 Содержится в Г. Следствие 1. Представления Т{ и Г2, имеющие одинаковые характеры, изоморфны, так как каждое неприводимое представление Г7 и в Гь и в Г2 содержится одинаковое число раз (см. конец § 4 гл. XII). Следствие 2. Разложение представления Г в прямую сумму неприводимых представлений VI (с точностью до изоморфизма слагаемых) однозначно.
360 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII Вернемся к (вообще говоря, приводимому) представлению Г с характером %. Из равенства A) вытекает, что скалярный квадрат характера % равен (X. X) = пг\ + т\ + ... +т2д. Следовательно, скалярный квадрат характера всегда является целым числом, которое в том и только в том случае равно 1, если представление Г не приводимо. Можно сказать поэтому, что для того, чтобы пред- ставленые было неприводимым, необходимо и достаточно, чтобы скалярный квадрат его характера был равен 1. (Значит, в частности, представления Гь Г2 и Г3 группы /K неприводимы;) Далее, для того чтобы два неприводимых представления группы были неизоморфны, необходимо и достаточно, чтобы скалярное произведение их характеров было равно нулю (необходимость этого была доказана выше, а достаточность вытекает из того, что если два неприводимых представления изоморфны, то их характеры равны: ^1 = Ъ и> значит, скалярное произведение (хь Хг) = (Хь ь)= 1). Пример. Для группы 53 ~ Оз (см. стр. 354) имеем (XI. Х4) =4" <3~ 1 - 1 ~ 1) =0' (*2' X*) = Т<3 + ] + ] + 1> = 1' (Хз,Х4) = -уб = 1; и представление Г4 равно прямой сумме Гг и Г3. Далее, (Х1.ХБ)=Т-6=г=1' (Х2,Х&)=4==1' (ХЗ,Х5)=42==2' и значит, Х5 = XI + Х2 + 2Хз — регулярное представление Г5 содержит по одному разу каждое из одномерных представлений Г^ и Гг и два раза — двумерное представление Г3. § 4. Основное соотношение Лемма. Пусть Го — регулярное представление группы О. Тогда каждое неприводимое представление Г< этой группы содержится в Го столько раз, какова его степень. Доказательство. Пусть хо — характер (регулярного) представления Г0 и ^ — произвольное неприводи-
§4] ОСНОВНОЕ СООТНОШЕНИЕ 361 мое представление группы О степени л< с характером Х<. Тогда (Х|, Хо) =* 4" И & (*) хЛ^) = х XI (*) ХЛ*Г= Х< (*) = л«- Но, как мы уже знаем (см. § 3), скалярное произведение (х<, хо) показывает, сколько раз (неприводимое) представление Г< содержится в (регулярном) представлении Го. Теорема 2. Сумма квадратов степеней всех не- приводимых {не изоморфных между собой) представлений конечной группы равна порядку группы. Иными словами, если О —(конечная) группа порядка к и пь п2, . ¦ *, пр — степени всех ее неприводимых представлений, то я! + п\ + ... + ^ = к. Доказательство. Пусть Г0 — регулярное представление группы О. Если Гь Гг, ..., Гр — все неприводимые представления группы О, хь Хг> • ••> Хр —их характеры и пъ п2, ..., пр — их степени, а хо — характер регулярного представления Г0, то ХО = «1X1 + X2 + • • • + ПРХр. Скалярный квадрат хо равен (Хо» Хо) = П\ + П\ + . . . + /1р. Но, по доказанному в конце § 2, скалярный квадрат (Хо, Хо) регулярного представления равен к. Следовательно, п\ + п\ + ... + Яр = к. Заметим, что среди чисел щ могут быть и равные. Так, для группы /K имеем П\ = п2 = 1 и л3 = 2. Поскольку порядок группы /K равен 6 и I2 + I2 + 22 « 6, то эти представления Гь Г2 и Г3 — это все неприводимые представления группы /K. Так как у каждой группы имеется единичное представление, то среди чисел пх по крайней мере одно равно 1, Можно доказать, что все /г, являются делителями порядка к группы. 13 Л. И. Головина
362 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII § 5. Число неприводимых представлений группы Лемма. Пусть /(а)—центральная функция, определенная на группе О порядка к и Г — неприводимое представление группы О в пространстве /? размерности п с характером %. Тогда линейный оператор *(/)=2 7НГ(а), а<ЕС действующий в пространстве /?, является гомотетией с к коэффициентом гомотетии, равным — (%, /). Доказательство. Для любого элемента Ь группы О имеем Г-1 (Ь) Ж (/) Г (Ь) = 2 Г-1 (Ь) ЩТ(а)Т (Ь) - = 2 Ш Г Ф-1) Г (а) Г (Ь) = 2 Ш Г (Г1^) = аеО сес = 2 /(Ьа&)ГF-1а&) (так как Да)—центральная функция, то /(а)== ==/F~1аЬ)). Но произведение Ь^аб, где 6 — фиксированный элемент группы О, а а пробегает все элементы группы, тоже пробегает (по одному разу) все элементы группы (произвольный элемент х группы равен х = Ь"х(ЬхЬ'1)Ь\ здесь а = ЬхЬ~1). Следовательно, последняя сумма равна 2ЩГ(а) = Л(/), аеО т. е. для любого Ь е= О г-чь)здг(&)==зд. Из равенства Г~1ЗЮ{1)Т = 2@(}) вытекает, что Ж(})Т = Г<Э#(/). Но тогда из второй части леммы Шура следует, что 3@{{) является гомотетией, т. е. что для некоторого А, 2/(а)Г(а) = МГ. Для того чтобы найти X, вычислим след обеих частей этого равенства, В правой части получим 1г %& = \п.
$ 5] ЧИСЛО НЕПРИВОДИМЫХ ПРЕДСТАВЛЕНИЙ ГРУППЫ 363 След левой части равен *г2/E)Г(а)«21г[Д5)Г(а)] = Следовательно, А, = — (х, /) и Теорема 3. Центральная функция /, определенная на группе О и ортогональная ко всем характерам неприводимых представлений Г< этой группы, тождественно равна нулю. Доказательство. Пусть %\> X* •••> Ъ~характеры всех неприводимых представлений группы в. Предположим, что (х<, /)== 0 для каждого * = 1, 2, .... р. Тогда для каждого неприводимого представления Г< группы 2№)Г|(а) = {(ь/)^ = ^ где О есть нулевой оператор. Покажем, что сумма 2 ТФ) Г (а) = <7 ив том случае, когда представление Г приводимо. Действительно, пусть Г является суммой, например, двух (неприводимых) представлений Г1 и Г2. Тогда в соответственно выбранном базисе матрицы представления Г имеют вид Г(а) = Тг{а) О о г, о :«)]• где Г<(а) —матрица представления Г, в пространстве представления /?,, г = 1, 2. Но так как 2/(а)Г1(а) = 6? и ?1(а)?%{а) = Ощ аес лес 13*
364 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII ТО И = у[ЩГ1(а) О 1 аТб[ О ЩГ2(а)] 2 / («) Г1 аев 0 (в) 2 Па)] 0 Гг(«) 0. Аналогичное утверждение верно и для любого числа слагаемых, т. е. для любого представления Г группы О и любой центральной функции /, ортогональной ко всем характерам неприводимых представлений этой группы, имеем 2/(а)Г(а) = 0\ Пусть теперь Г0 — регулярное представление группы О, аи а2у ..., ак — все ее элементы (а{ =¦ е — единичный элемент), еахУ еа%, ..., еан — базисные векторы пространства представления /?. Применим оператор 2 /(д)Ц(а) (являющийся, по доказанному выше, ну- левым оператором) к вектору еах. Мы получим Но так как векторы еа{ линейно независимы, то }{а{) = = 0 для всех 1= 1, 2, ..., А, и значит, /(а,)=0 для всех а< е О, т. е. функция / на группе О тождественно равна нулю. Теорема 4. Каждая центральная функция на группе О является линейной комбинацией характеров неприводимых представлений этой группы. Доказательство. Пусть У — пространство всех центральных функций, определенных на группе 0, и ух = {%и Х2> •••» %р} —его подпространство,порожденное характерами всех неприводимых представлений, Тогда
§ 6] ПРЕДСТАВЛЕНИЯ КОММУТАТИВНОЙ ГРУППЫ 365 пространство V равно прямой сумме подпространства Ух и его ортогонального дополнения У^\ V = У1 ф V?. Однако Ух = @), так как каждая центральная функция, ортогональная ко всем %<, равна нулю. Следовательно, У = Уи т. е. характеры неприводимых представлений группы О образуют в пространстве всех определенных на ней центральных функций (ортонормированный) базис — каждая центральная функция является линейной комбинацией характеров. Теорема 5. Число попарно неизоморфных неприводимых представлений группы О равно числу классов сопряженных элементов этой группы. По предыдущей теореме, размерность пространства всех центральных функций, определенных на группе О, равна числу неприводимых и неизоморфных между собой представлений этой группы. В то же время размерность пространства центральных функций равна числу р классов сопряженных элементов группы О (стр. 343), откуда и следует утверждение теоремы. Окончательно мы имеем соотношение к = п\ + п\ + ... + а& где к — порядок группы О, п{ — степень неприводимого представления Г{, р — число классов сопряженных элементов группы. Все п< являются делителями к и по крайней мере одно из них равно 1, § 6. Представления коммутативной группы Если группа О коммутативна (и только в этом случае), число р ее классов сопряженных элементов равно порядку к группы. Из равенства к = п\ + п\ + .., + п>1 следует, что все (целые положительные) числа п{ равны 1, т. е. что все неприводимые представления коммутативной группы одномерны, причем число их равно порядку группы. Обратно, если все неприводимые представления группы одномерны, т. е. если все п{= 1, то число р классов сопряженных элементов равно порядку к группы, и группа коммутативна.
366 ТЕОРИЯ ХАРАКТЕРОВ (ГЛ. XIII Итак, для того чтобы группа О была коммутативной, необходимо и достаточно, чтобы все ее неприводимые представления были одномерны (имели степень 1). Из этого результата, в частности, вытекает, что для групп С2, С4, V выше (на стр. 326—327) были найдены все их неприводимые представления. § 7. Представления циклических групп Пусть Сп — циклическая группа порядка п, состоящая из элементов е, а, а2, ..., а7*-1, где а* — е. Так как группа Сп коммутативна, то все ее неприводимые представления одномерны, причем число неизоморфных между собой неприводимых представлений равно п. Пусть Т(а)=а\ тогда Г(а2)=а2, Г(а3)=а3, ..., наконец, Г(ап) = ап = Т(е)— 1. Следовательно, ап=1иа есть корень я-й степени из 1. Положим а = соз— + *81П — • п ' п Тогда 1, а, а2=со5^-2 + /51П^2, ... ...,ап-1 = соз ^ (л - 1) + / 31П ~- (п - 1) — все корни /г-й степени из 1. Это дает п одномерных представлений группы Сп, совпадающих со своими характерами хь Х2> ..., Хп. ! Сп XI %2 Хз Хп | е ... а 1 а а2 ап~1 а2 1 а2 а4 а(п-1J дп—1 1 1 а(п-1J а(я-1Хп-1)
§8] ПРЕДСТАВЛЕНИЯ ДИЭДРАЛЬНЫХ ГРУПП 367 Полученные представления, будучи одномерными,— неприводимы: Так как хь Х2> • • •> %п — различны, то эти п представлений попарно неизоморфны (п. 3, стр. 355). Таким образом, мы нашли все п неизоморфных между собой неприводимых представлений циклической группы Сп. § 8. Представления диэдральных групп Диэдральная группа йп при четном п имеет -§- + 3 классов сопряженных элементов, а при нечетном п число классов сопряженных элементов этой группы равно п + 3 2 ' Для четного п имеем (число слагаемых в правой части равно 4 + -~ —1 = = -?г + 3) — и, значит, группа йп имеет 4 одномерных и -о— 1 двумерных неприводимых представлений. Для нечетного п 2я=12. 2+2* ^ п —— 1 л -4- Ч (число слагаемых здесь равно 2 -{—^ = —у-) — я —1 и группа имеет два одномерных и —д— двумерных неприводимых представлений. I. Рассмотрим сначала случай, когда п = 2т четно. Элементы группы /)„ = 02т выше мы обозначали так: в, Г, Г2, . . ., Г2т~\ 5, 5Г, 5Г2, . . ., 5Г2т-\ Они следующим образом разбиваются на -<?-+ 3 = т + 3
368 ТЕОРИЯ ХАРАКТЕРОВ ГГЛ. XIII классов сопряженных элементов: {е}, {г, г2-1}, {г\ г2-2}, ..., {г*-1, Г+1}, {г-} {5, 5/*2, . . ., 5/-2т-2}, {5Г, 5Г3, . . ., 5Г2т}. Обратим внимание на то, что элементы гт~1 и гт+1 сопряжены между собой. Пусть Г — одномерное представление группы Дг с характером % и Г (г) = %(г) = а. Тогда Г(гм-1)= х^) — а" и Г(/-т+1)= х('т+1) = ат+1. Но характер на сопряженных элементах принимает одинаковые значения; поэтому ат~1 = ат+х. Так как а Ф О, то а2 — 1 иа=±1, Если, далее, Г($) = р, то ГE2) = = (}2 = 1, т. е. р = ± 1. Это дает 4 одномерных представления (совпадающих со своими характерами): Вуп XI Ха Хз Х4 , г 1 1 1 1 г 1 1 — 1 — 1 г2 1 1 1 1 г8 1 1 — 1 — 1 ... г2т-1 1 1 — 1 — 1 5 1 1 5/* 1 — 1 —1 1 5Г2 1 — 1 1 — 1 ... 5Г2™-1 1 — 1 1 или короче, кт XI Х2 Хз Х4 Г* 1 1 (-1)" 5Г* 1 —1 Легко видеть, что эти представления неприводимый попарно неизоморфны. Для того чтобы найти двумерные представления группы #п, заметим, что так как йп является группой
§81 ПРЕДСТАВЛЕНИЯ ДИЭДРАЛЬНЫХ ГРУПП 369 преобразований плоскости, то она сама и будет одним из своих представлений (основным). Выпишем соответствующие матрицы. Если г — поворот вокруг начала координат на угол —, а 5 — симметрия, скажем, относительно оси Ох, то ч5)=[; _;]. г (8/*)= 2я . 2я " С05— & —5111—/? П П . 2я 2я , 51п — к соз -т- л , 2я соз — к п 51П — к п 2я -¦1птл 2я — соз — & 1 где /г = 0, 1, 2, ..., п — 1. Другие представления этой группы можно получить, 2я.0 отнеся элементу г поворот на угол — 2, на угол — -3, ..., наконец, на угол — (т—1). Так мы получим т — 1 = -^ —• 1 представлений Гь Г2, ..., Гт-ь где 2я , . 2я , " соз— пк —в\п—Нк . 2я , 2я #, зт —ЛЛ со$ —пк ГЛEГ") /1 2я соз — Л# 2я " -в'т — Нк . 2я , 2л ,, — з1п — пк — соз — Л& здесь к = 1, 2, ..., т — 1, к = 0, 1, 2, ..., п — 1 (при й = 1 получается выписанное выше представление Г = = Г,). Характер представления ГЛ: Кроме найденных т —-1 представлений Гь Гг, ..., Г т—1» каких- либо новых представлений мы таким путем не получим, так как если 2я элементу г поставить в соответствие поворот на угол — •т = я» то это представление будет приводимым, ибо при таком преобразо-
370 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII вании (центральная симметрия) все векторы пространства являются собственными. При поворотах же на углы — (т _[_ 1^ _ (т _|_ 2), ... ..., и т. д. получатся представления, изоморфные уже найденным представлениям Гл. Итак, мы нашли все ~— 1 двумерных представлений группы Д,. Эти представления не при води мы, так как одномерных подпространств, инвариантных, на- 2я пример, относительно поворота на угол — Л, где Н = =» 1, 2, ..., т — 1, не существует. Ясно также, что найденные представления ГЛ попарно не изоморфны (п. 3, стр. 355). II. Пусть теперь л = 2/п + 1 нечетно. Элементы группы Оп следующим образом разбиваются на классы сопряженных элементов: Найдем сначала два одномерных представления. Если Г(г)= а, то Г(гт)=ат, Г(гт+1)= ат+1, и так как элементы гш и гт+1 сопряжены между собой, то ат = — ат+\ откуда а = 1. Далее, если Г E)== р, то ГE2) = = Р2 = 1 и р = ±1. Так мы получаем два одномерных представления (совпадающие со своими характерами): °2т+1 е XI || 1 Х2 || 1 Г 1 1 г2 1 1 ... ... 2т 1 1 5 1 — 1 вг 1 — 1 ... вг2т 1 — 1 или, короче, °2т-И XI х2 гк 1 1 8Гк 1 — I
§ 8] ПРЕДСТАВЛЕНИЯ ДИЭДРАЛЬНЫХ ГРУПП 371 Двумерные представления этой группы находятся так же, как в случае четного п (см. п. I), А именно, имеем 1\И ГлE/*) = 2я ии • 2я ии С05 Пк — 51П—ЛЯ п п • 2я ии 2я ии 51П — Нк С05—-ЛЛ П П соз —Л6 — з1п-—Лй л п • 2Я !.«. 2я ии -— 51П —й^ — СОЗ Пк я п п ^ где Л = 1, 2, ..., т9 к =0, 1, 2, ,.., /г — 1. Характер Л-го представления Все эти представления неприводимы и попарно не изо- морфны. Выпишем полностью таблицы характеров для групп йАу /)б> ^6- При п = 4 группа /L имеет 4 одномерных и одно двумерное представления. Их характеры: °4 XI ъ Хз XI 1ъ е 1 1 1 1 2 Л'* 1 1 —1 —1 0 Л2 1 1 1 1 —2 5, ВГ2 1 -1 1 —1 0 5Г, 5Г3 1 —1 —1 1 0
372 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII При /г = 6 группа имеет 4 одномерных и 2 двумерных представления с характерами: |Л. XI Ха Хз Х4 Х5 Хв е 1 1 1 1 2 2 ^6 — 1 — 1 —1 г\ г4 — 1 —1 '3 1 1 —1 —1 —2 2 5,5Л2,5Г4 5Г,5Г8,575| I 1 "-1 1 —1 0 0 1 —1 — 1 1 0 0 Наконец, группа /M имеет два одномерных и два двумерных представления. Их характеры: |05 XI Х2 Хз 1 Х4 е 1 1 2 1 2 Л '4 1 1 1 Л 2л | 2 С05 — 1 4я 2соз — Л/-3 1 1 4л 2С05 — 2л 2С05 — вгК Л=0, 1, 2, 3, 4 1 — 1 0 0 ,
§ 9] ХАРАКТЕРЫ ГРУППЫ ВРАЩЕНИЙ ТЕТРАЭДРА 373 § 9. Характеры группы вращений тетраэдра Число классов сопряженных элементов этой группы равно 4, порядок ее равен 12. Так как 12=12+12+12 + 32, то группа имеет три одномерных и одно трехмерное представления. Найдем одномерные представления. Пусть Г(сз) = а. Тогда Г D) = а2 и Г (с?) = а3 = 1. Следовательно, а — кубический корень из 1. Пусть Г(с2) = ^; тогда Г (с1) = р2 = 1 и |5 = ± 1. Но характер каждого неприводимого неединичного представления должен быть ортогонален характеру единичного представления, т. е. 1 + 4а + 4а2 + 3^ = О, или B) 4A+а + а2)+3((*-1)=0. А так как а3 == 1, то при а ф 1 имеем 1 + а + а2 = О, и, значит, ^ = 1 (Заметим, что для неединичного представления а не может равняться 1, так как в этом случае из равенства B) вытекало бы, что р =—3, что невозможно). Итак, мы нашли характеры трех одномерных представлений группы Т: т XI х2 Хз е 1 1 1 4с3 1 а а2 4с2 1 а2 а Зс2 1 1 1 где а = соз-у + г зт-^-. Эти представления неприводи- мы и попарно неизоморфны. Далее, так как группа Т является группой преобразований трехмерного пространства, то она и будет одним
374 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII из своих представлений. Мы не будем находить матрицы этого (основного) представления в каком-нибудь фиксированном базисе, но ограничимся тем, что найдем только характер представления. Это приводит к значительным упрощениям, потому что след матрицы линейного преобразования не зависит от базиса, и мы можем для каждого преобразования выбирать базис так, чтобы его матрица выглядела возможно проще. Особенно удобно принимать ось вращения за одну из координатных осей. Так, если принять ось вращения за ось Ог (а оси Ох и Оу, ортогональные оси Ог и между собой, выбрать произвольным образом), то матрицы поворотов на углы -5- и -я- соответственно будут иметь вид Уз Следы их равны Ог на угол п Уз о о нулю. и Матри ~-Т 4^з о' 1 -¦/- 1 ~тУ3 ~т ° 0 0 1. ца поворота вокруг оси г; -: XI I о о и имеет след, равный—1. Это дает характер трехмерного представления группы Г: т %* е 3 4с8 0 4с! 0 Зс2 —1 1 Соответствующее представление неприводимо, так как <Х4.Х4) = й(9 + 3)=1, и не изоморфно, очевидно, ни одному из предыдущих,
$ 10] ХАРАКТЕРЫ ГРУППЫ ВРАЩЕНИЙ КУБА 375 § 10. Характеры группы вращений куба и группы симметрии тетраэдра Число классов сопряженных элементов группы вращений куба О равно 5, порядок ее 24. Из равенства 24= 12+12 + 22 + 32 + 32 видим, что группа имеет два одномерных, одно двумерное и два трехмерных представления. Найдем их характеры. Группа О изоморфна группе 54 подстановок из четырех элементов. Подстановки бывают четные и нечетные. Произведение двух подстановок одинаковой четности — четно, произведение подстановок разной четности — нечетно. Поэтому для группы 54 (как и для каждой симметрической группы) мы сразу получаем два одномерных представления — единичное и такое, которое всем четным подстановкам ставит в соответствие 1, а всем нечетным подстановкам — 1. Каким же вращениям куба отвечают четные подстановки? Выше мы нашли, что группа О состоит из 5 классов сопряженных элементов, содержащих один, шесть, три, восемь и шесть элементов. Четные подстановки образуют в группе 54 нормальную подгруппу 12-го порядка. Но нормальная подгруппа должна содержать целиком- несколько классов сопряженных элементов. Кроме того, единичный элемент обязательно должен в нее войти. Следовательно, кроме единицы, в эту нормальную подгруппу войдут элементы, образующие классы из восьми и трех элементов. Восемь элементов образуют повороты вокруг диагоналей на углы 2я/3 и 4я/3 —класс {8с3}. Три элемента— это повороты вокруг осей четвертого порядка на угол я — класс {Зс^. Остальные элементы группы: класс, состоящий из 6 поворотов вокруг осей четвертого порядка на углы я/2 и Зя/2,—это {6с4}, и класс, состоящий из 6 поворотов вокруг осей второго порядка—{б^}.
376 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII Итак, характеры одномерных представлений группы О: О XI Ул е 1 1 8с8 1 1 &4 1 1 6с4 1 —1 6с3 1 —1 Чтобы найти характер /4 одного из трехмерных представлений группы О (а она сама является одним из своих трехмерных представлений), снова будем каждый раз ось вращения принимать за ось Ог. Так мы получим матрицы [1 О О"] 0 10, 0 0 1] и о и Г(С3) Г($ = Г(с2) 1 ~ 2 тУз 0 --^з о -1 . 0 1 1_ 0 0 1] Соответствующий характер Х4 (*«)=!> Х4^2) = -Ь 1, Далее, если мы уже имеем одно трехмерное представление группы О, то второе можно получить следующим образом: не изменяя преобразований соответствующих четным подстановкам, все остальные умножим на — 1. Покажем, что при этом мы снова получим представление группы О. Пусть первое (трехмерное) представление обозначено через Г, второе — через Г', и пусть а, Ь^О, тогда Г (аЪ) = Г (а) Г (Ь). Если оба элемента а и Ь отвечают четным подстановкам, то и элемент аЬ тоже отвечает четной подстановке; при этом VIа) =» = Г(а), Г'(Ь)=Г(Ь), Г(аЬ)=Г(аЬ), и значит, Г'(аЬ) = = Г(а)Г(Ь).
§ 101 ХАРАКТЕРЫ ГРУППЫ ВРАЩЕНИЙ КУБА 377 Если элементы а и 6 отвечают нечетным подстановкам, то аЬ по-прежнему четно, и Г7(а) = — Г(а), Г7F) = = -ГF), Г'(аЬ) =Г(аЬ), откуда Г(аЬ) = Г'(а)Г(Ь). Наконец, если элементу а соответствует четная, а элементу Ъ — нечетная подстановка, то элементу аЬ отвечает нечетная подстановка, и мы имеем Г'(а) =Г(а), Г'(Ь) = — ГF), Г(аЬ) = - Г(аЬ), и значит, Г'(аЬ) = ^Г'(а)ГF). При умножении преобразования на —1 его матрица в любом базисе,— а значит, и ее след — умножаются на — 1. Поэтому второе трехмерное представление группы О будет иметь характер Х,(е) = 3, Х5(с3) = 0, Хб0*) = -1, Хь (с4) = — 1, Хб(с2)=Ь Оба трехмерных представления неприводимы, поскольку 1(9 + 3 + 6 + 6) = 1, и не изоморфны между собой: 3-3 + 3-6-6 = 0. Наконец, характер хз двумерного представления можно найти алгебраически. Пусть Хз (е) = 2, х3 (с,) = а, х3 (Ф = 6, х3 (сА = V* Хз (<ч) = в. Запишем условия ортогональности этого характера к четырем, уже найденным: 12 -}- 8а + ЗР + 6у + 66 = 0, I 2 + 8а + 30 - 6у - 66 = 0, 6 — Зр + 6у — 66 = 0, (б -30- 67 + 66 = 0. Складывая и вычитая первые два уравнения, получим 12 + 8а + 36 = 0, (бу +66 = 0.
378 ТЕОРИЯ ХАРАКТЕРОВ (ГЛ. XIII А складывая и вычитая третье и четвертое, будем иметь б — ЗР = О, 6у — 66 = 0. Следовательно, Р = 2, у = б = 0, сс= -1, и значит, характер хз двумерного представления группы О таков: Хз (е) = 2, Хз (с9)- 1, Хз (Ф = 2> Хз (**) = 0, Хз (*2) = О- Легко видеть, что и это представление неприводимо: 1/24 D + 8 + 3-4) = 1. Выпишем полную таблицу характеров группы вращений куба: О ) Х2 Хз XI 1ъ е 1 1 2 3 3 8с3 1 1 — 1 0 0 Зс% 1 1 2 -1 -1 &?4 1 -1 0 1 -1 6с2 1 — 1 0 — 1 1 Группа симметрии тетраэдра Тл изоморфна группе О, и ее таблица характеров идентична таблице характеров группы О:
§ И] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ МАТРИЦ 379 Гй Iе XI || 1 X* 1 Хз 2 ь 1 3 г6 1 3 &3 1 1 — 1 0 0 Зс2 1 1 2 — 1 — 1 6а 1 — 1 0 1 —1 6а- 1 1 —1 0 — 1 1 § 11. Тензорное (кронекеровское) произведение матриц Пусть мы имеем две (квадратные) матрицы Их тензорным (кронекеровским) произведением называется матрица АхВ _ \аВ рв] _ ~ [уВ 6Я| "~ аа аЬ ас $а $Ь $с ар ад аг Рр $д $г ах ау аг $х ру $г уа уЬ ус 6а ЬЬ 6с ур уд уг Ьр Ьд 6/- -У* УУ У* 6* Ьу 6г_| В общем случае определение аналогично: АхВ = | .". . ;-. . .7 |х *21 622 "Лт 1_ т1 т2 * ' ' тптпЛ
380 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII ~апВ а12В...а1пВ-\ а22В...а2пВ — п1 П2 йт>г>В ПП _ "«11*11 • • • «11*Ш «12*11 «11*21 • • • «11*2т «12*21 ' • «12*1т • • «12*2т •¦«1П*11 • • «1п*>. •••«1П*Ш •••«>Лт «12*тт «11*Ш1 ••• «11*тт«12*т1 " «21*11 •••«21*1т «22*]1 • • • «22*1т • «Ш*т1 «2**11 • ••«т*т» ¦•а:Лт -агЛЬпа ¦ • • «п1*тт«П2*т1 п2 тптп .. а Ь л ... а Ь ПП ТП\ ПП ТПТП' Кронекеровское произведение матрицы порядка п и матрицы порядка пг будет, очевидно, матрицей порядка тп. Легко проверяются следующие соотношения: 1) АХОт = Отпу 3) АХ(В + С) = АХВ + АХС, 4) (А + В)ХС = АХС + ВХС, 5) (оЛ)Х(рВ) = (ар)(ЛХВ), где Ок — нулевая матрица, а Ек—-единичная матрица порядка к. Заметим, что след тензорного произведения матриц 1т (АХ#) = апкВ + а221гВ + ... + апп1гВ=1тА -1гВ равен произведению следов сомнооюителей. § 12. Тензорное произведение векторных пространств Здесь мы предполагаем, что читатель знаком с понятием тензора, введенным в главе VIII, и с соответствующими обозначениями. Этот и следующий параграфы можно и пропустить без ущерба для понимания дальнейшего; однако от этого несколько пострадает полнота проводимых дальше доказательств. Если воспользоваться введенными в главе VIII обозначениями, то тензорное произведение матриц Л = [а]] порядка п и В = [Ьрд] порядка т, где верхний индекс — номер строки, а нижний — номер столбца, есть матрица
§ 12] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ВЕКТОРНЫХ ПРОСТРАНСТВ 381 Га\ь\ ... аут а\ь\ ... а^ ... а\Ь\ ... аЩ \а\Ь\ ...а\ь1 а\Ь\ ... а\Ь*, ... а\Ь\ ... а^А а\Ь? ...а\Ь1 а\Ь™...а\Ь1...а\Ь™...аЩ а\Ь\ ...а\Ь1 а\Ь\ ... ар}п ... „«*} ... аУт Г ппЬт ппНт ппит ппит ппНт ппНт элементы а)Ъ\ которой (их можно обозначить короче: с% = а]Ь^) занумерованы двумя парами индексов *, р и /, ц, причем при лексикографическом упорядочении этих пар 11, 12, .,., 1т, 21, 22, ..., 2т, ..., п1, я2, ..., пт верхняя пара определяет номер строки, а нижняя — номер столбца. Пусть матрицы Л = [а]], В = [Ьд] —невырожденные, и пусть А'1 = [а}]9 В = [Ьд]. Покажем, что матрицей, обратной к тензорному произведению АХ В, будет матрица, равная тензорному произведению обратных матриц Л-1 и В-1, т. е. что (ЛХВ)(Л-1Х ХВ) = Етп. Действительно, элемент (/, р)-й строки и (г, 5)-го столбца произведения (Л X В) (Л^1 Х^) имеет вид (а*Д) (ЭД) = (а)а1) (#Й) = 6*6? = 6<3Р (в тензорных обозначениях — по индексам /= 1, 2, ... ..., л и ц = 1, 2, ..., т ведется суммирование), где 8ггр — символ Кронекера (ср. § 1 главы VIII), равный 1, если пары г, р, и г, 5 тождественны, т. е. если I = г и р = 5; и равный 0, если [ ф г или если р ф 8. Таким образом произведение (Л X В) (Л-1 X В ) есть единичная матрица порядка т/г, и значит, матрицы Л X В и Л" X В~1 взаимно обрати ы (откуда, в частности, видно, что если \А\ Ф О и \В\ Ф О, то и \АХВ\ Ф 0). Дадим теперь определение тензорного произведения векторных пространств. Пусть имеются два пространства: /?1 — размерности п и /?2 — размерности т. Выберем в пространствах Кх и /?2 соответственно базисы еи е2, .,. ..., еп и /ь /2, ..., /т и рассмотрим линейное простран-
382 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII ство Я размерности тп с базисом е^к> где /= 1, 2, ... ..., п, к = 1, 2, ..., т. (Заметьте, что мы никак, разумеется, не перемнож аем векторы е, и Д, взятые из разных пространств — базис пространства /? образован просто парами векторов, причем пара еи /л обозначена через е$к). Элементы этого базиса упорядочим лексикографически: е\!\> е\!2> .. ¦, е\!т, е2]и ^2/2, . • •> ^/т, «.., еп!и Ы2, • ¦ .,*„/„ и обозначим еДк через Е1к. (Ясно, что векторы Е{к> взятые в этом, лексикографическом, порядке, можно занумеровать и числами 1, 2, ..., тп; однако нам будет удобнее нумеровать их парами чисел.) Предположим теперь, что в пространстве /?! мы перешли к новому базису еъ е2, ...,е'пс матрицей перехода А=[а|] (и значит, е[ = Dек—пе забывайте о суммировании по индексу к\), а в пространстве /?2 — к новому базису /1, /а, ..., /т с матрицей перехода В = [рр] (и значит, /р = (Зр/Л- По определению, будем считать, что при этом в пространстве Н совершается переход к новому базису с матрицей перехода, равной тензорному произведению АХВ матриц перехода в пространствах /?1 и #2» т. е. что в пространстве /? соответствующий новый базис будет образован векторами Е{Р = е^р = а$грЕы = щфрЫг* (Заметьте, что правая часть формально является произведением сумм а\ек = е\ и Рр7г = /р)- Так определенное пространство К называется тензорным, или кро- некеровским, произведением пространств Кх и #2 и обозначается К\ ® /?2- Из доказанного выше вытекает, что если АХВ — матрица перехода к новому базису в пространстве /?, то обратной к ней будет матрица А X В-1. § 13. Тензорное произведение линейных операторов Пусть имеются два пространства: /?! размерности п и /?2 размерности т, и пусть /? = /?1 ® /?2— их тензорное произведение. Предположим, что в пространстве Я\
§ 13] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ЛИНЕЙНЫХ ОПЕРАТОРОВ 383 задан линейный оператор зФ — двухвалентный смешанный тензор а), при переходе к новому базису преобразующийся по формуле а] = а]агра%, а в пространстве #2 — линейный оператор $ — такой же тензор Ъ^ч преобразующийся по формуле Ь'3 =р.!ртЬГ. (Здесь А = [а]]— матрица перехода к новому базису в пространстве /?ь В = [р}] — матрица перехода в пространст- ве Я„ А = [5)], В = [&])• Рассмотрим кронекеровское произведение А' X В' (где А' — матрица оператора зФ в новом базисе пространства /?ь а В' — матрица оператора $ в новом базисе пространства /?2) и покажем, что элементы этой матрицы получаются из элементов матрицы Л X В по правилу преобразования тензора один раз ко- и один раз контравари- антного. Действительно, имеем а>Ь; = («Яа?) №Ы) = (сфОЖХаХ)- (Здесь о^Ра —' элементы матрицы перехода к новому базису в пространстве /?, ар р™ —элементы обратной матрицы, а суммирование ведется по парам индексов <7, / и р, т.) Мы показали, что кронекеровское произведение матриц при переходе к новому базису преобразуется как смешанный двухвалентный тензор, а значит, оно определяет линейный оператор, действующий в пространстве /?. Этот оператор, обозначаемый через зФХ$> называется тензорным (или кронекеровским) произведением операторов зФ и $. На базисные векторы пространства К он действует так: (зФ X Я) Ец = аЩЕР4 = аЛЪ]еР1ч. (Заметьте, что правая часть формально является произведением сумм а?ер = зфвх и Щ[Я = Я[}). Итак, тензорное произведение линейных операторов не зависит от выбора базисов в пространствах Кх и /?2< По доказанному в конце § 11 след кронекеровского произведения линейных операторов равен произведению следов сомножителей.
384 ТЕОРИЯ ХАРАКТЕРОВ (ГЛ. XIII Докажем теперь тождество АВХСй=(АХ С) {В X Я), C) где А и В — любые матрицы, порядка л, а С и Б — матрицы порядка т. Пусть в каких-то фиксированных базисах пространств /?! и /?2 элементы каждой из матриц обозначены теми же буквами латинского алфавита, что и сами матрицы, но не прописными, а строчными. Тогда {19 к)-и (т. е. стоящий на пересечении 1-й строки и А-го столбца) элемент матрицы АВ — это свертка а]ь1, а (р, <7)-й элемент матрицы Си равен с*й\. Следовательно, элементы тензорного произведения АВХСЭ— это В правой части стоит свертка произведения матриц ЛХСиВХОпо паре индексов /, 5, т. е. элементы обычного матричного произведения (АХС){ВХО). Формула C) доказана. § 14. Тензорное произведение представлений (представления прямого произведения групп) Наша ближайшая задача состоит в следующем. Предположим, что группа О равна прямому произведению своих подгрупп Л и В: 0 = ЛХВ. Спрашивается, как, зная все неприводимые представления групп А и В, найти все неприводимые представления их прямого произведения О? Пусть ГА — какое-нибудь представление группы А и Гв—представление группы Б. Если § = аЬ, где аеЛ, Ь е В — произвольный элемент группы С, то по определению, положим *) ГB) = ГА(а)хГв(Ь). Проверим, что так мы действительно получим представление группы С, т. е. что если 8\ = а\Ъ\ и §2 = = афъ — произвольные элементы группы О (где аиа2^ еЛ, Ьи 62еВ), то Г(8182) =Г(^)ГЫ. *) Читатель, пропустивший §§ 12—13, может считать, что ГЛ(а) и Гв (Ь) — это просто матрицы соответствующих операторов.
§ 14) ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРЕДСТАВЛЕНИЙ 385 Мы имеем ГА (аха2) = ГА (ах) ГА (а2), так как ГА — представление группы Л, и Тв (Ь1Ь2) = ГВF1)ГВF2), поскольку Гв—представление группы В. Пользуясь определением оператора Г и тождеством C) из предыдущего параграфа *), получаем г (&й) = Г (ахЬх • а2Ь2) = Г (аха%• ЪХЪ2) = = ГА (ад)X Гв (&А) = [ГА (Д1) ГА (а2)]х X [Гв F0 Гв F,)] = [ГА (а,) X Гв F,)] [ГА (а2) X Гв (Ь2)] ~ = Г(а161)Г(аА)=Г(^1)ГЫ, т. е. Г — действительно представление группы О. Представление Г группы О называется тензорным произведением представлений ГА и Г* и обозначается символом ГАхГв. Пусть, далее, %А — характер представления ГА, %в — характер Гв и % — характер их тензорного произведения ГАхГв. Тогда, если § = аЬ, где а е Л, Ь <= В, то X @ = X И) = *г Г (аб) = 1г [ГА (а) х Г* F)] = = 1гГА(аIгГвF), т, е, X (8) = ХА (а) Хв F). Это — важная формула, выражающая характер представления прямого произведения групп через характеры представлений сомножителей. Пример. Мы знаем, что группа V = А X 5, где А={е, а} и В={е, Ъ}— циклические группы второго порядка (см. стр. 297). Зная характеры представлений этих групп: в хГ х2в е 1 1 Ъ 1 —1 А 1*' х2А 1 е 1 1 ) | а 1 — 1 *) Читателю, пропустившему §§ 12—13, придется принять эту формулу без доказательства.
386 ТЕОРИЯ ХАРАКТЕРОВ [ГЛ. XIII мы можем составить таблицу характеров их прямого произведения — группы V: V хЬ? XI %2 г$ хГ %2 Х2 е 1 1 1 1 а 1 1 — 1 — 1 Ь 1 —1 1 -1 аЬ 1 —1 —1 1 (разумеется, совпадающую с найденной на стр. 327). Теорема 6. Пусть группа О равна прямому произведению АХ В. Если представления ГА группы А и Гв группы В неприводимы, то и их тензорное произведение Г А х Гв неприводимо *). Доказательство. Пусть хА —характер представления ГА, %в — характер представления Гв, & —порядок группы А и I — порядок группы 5. Пусть, далее, аи а2, ..., ак — все элементы группы А и Ъи Ь2, ..., Ь{ — все элементы группы В. Тогда элементами группы А X В = О будут всевозможные произведения а{Ьи где 1= 1,2, ...,*,/= 1,2, ...,/. Пусть % — характер тензорного произведения ГА X Гв# Вычислим его скалярный квадрат: (Х> X) = = Ш 2 X (а&) Т&Ь~) = ^ 2 ХА (а4) хв (&;) ХА (*) Хв №) = = Т 2 ХА («0 ХА (а*) -у 2 X5 (^) X5 (&;ЫхА, ХА) (хв, Хв). *) Пусть читатель не удивляется, встретив в литературе и прямо противоположное утверждение. Дело в том, что, помимо определенного здесь тензорного произведения представлений двух разных групп существует (несколько похожее на это) определение тензорного произведения двух представлений одной и той же группы (оно тоже будет некоторым представлением этой группы). Для этого, другого, тензорного произведения теорема, аналогичная теореме 6, неверна.
§ И] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРЕДСТАВЛЕНИЙ 387 Но (хл, %А) = 1 и (хл, %в) = 1, так как оба представления Гл и Гв по условию, неприводимы. Следовательно, (Х> X) — Ь и значит, представление ГАХ Г5 неприводимо. Теорема 7. Каждое неприводимое представление группы О = Л X В изоморфно тензорному произведению некоторого неприводимого представления группы, А и некоторого неприводимого представления группы В. Доказательство. Предположим, что число классов сопряженных элементов группы А равно р, а число классов группы В — равно ^, и пусть Г!1, Г^, ..., Гр — все неприводимые неизоморфные между собой представления группы Л, а 1\ , Г2, ..., Тд — все неприводимые попарно неизоморфные представления группы В. Тогда всевозможные тензорные произведения]^1 хГ^ = ГГ8 являются, по теореме 6, неприводимыми представлениями группы О. Число таких представлений равно рц. Число классов сопряженных элементов группы О тоже равно рц (следствие из теоремы 10 § 10 главы X). Значит, если мы докажем, что произведения Гг^н е изоморфны между собой, то это и будут все неприводимые представления группы О, чем наше утверждение и будет доказано. Вычислим скалярное произведение характеров двух таких представлений ГГ8 и ГЛ<. в И 2 ХГА (*<) X? М х№)Х,в(Ь/) = и к I = (хА, х#'(х.в. х?). Так как либо ГА не изоморфно ГА, либо Г* не изоморфно Г, (а, возможно, что имеет место и то, и другое), то по крайней мере одно из скалярных произведений в правой части равно 0. Следовательно, (хг„ х*<) = = 0,— и представления Гг, и ГА/ группы О не изоморфны между собой.
388 ТЕОРИЯ ХАРАКТЕРОВ (ГЛ. ХШ § 15. Характеры группы симметрии куба Эта группа является прямым произведением группы О и циклической группы / второго порядка (см. § 8 главы XI). Она имеет 10 классов сопряженных элементов. В соответствии с разложением 48 = 24 . 2 = (I2 + I2 + 22 + З2 + 32J, группа Он имеет 4 одномерных, 2 двумерных и 4 трехмерных представления. Характеры их определяются следующей таблицей: XI ъ ъ X* Хб Хв X? X? Х9 1 Хю е 1 1 2 3 3 1 1 2 3 3 8с3 1 1 — 1 0 0 1 1 — 1 0 0 Зс| 2 — 1 —1 2 —1 —1 6с± — 1 0 6с2 — 1 0 ¦ 1_, —1 0 —1 0 —1 / 1 1 2 3 3 1 1 —2 -3 -3 8]'с3 1 1 — 1 0 0 1 1 1 0 0 3/с| 2 ~~ —1 —2 6/с4 — 1 0 —1 0 —1 6/ся —1 0 —1 | 0 -1 | Задача. Выпишите таблицы характеров прямых произведений СгХ^з (эта группа изоморфна Сб), С2ХС*, С2 X С5, СгХС* V X С2) йъ X С2| Я4 X С2, Я5 X С2| Я* X С2, Гл = Г X С2.
СПИСОК ДОПОЛНИТЕЛЬНОЙ ЛИТЕРАТУРЫ К главе I 1. Курош А. Л Курс высшей алгебры.— М,: Наука, 1975, К главам II—VII 2. Беллман Р. Введение в теорию матриц.— М.: Наука, 1969. 3. Беклемишев Д. В. Курс аналитической геометрии и линейной алгебры.—М.: Наука, 1974. 4. Гантмахер Ф. Р. Теория матриц.— М.: Наука, 1966. 5. Гельфанд Я. М. Лекции по линейной алгебре.— М.: Наука, 1971. 6. Дьедонне Ж, Линейная алгебра и элементарная геометрия. — М.: Наука, 1972. 7. Ефимов Я, В, Квадратичные формы и матрицы,— М,: Наука, 1975. 8. Ефимов Я, В.у Розендорн Э. Р, Линейная алгебра и многомерная геометрия. — М.: Наука, 1974. 9. Карпелевич Ф. Я., Садовский Л. Е. Элементы линейной алгебры и линейного программирования.—М,: Наука, 1967, 10. Мальцев А. И. Основы линейной алгебры,—М.: Наука, 1970. П. Фаддеев Д. /С., Фаддеева В. Я, Вычислительные методы линейной алгебры. — Физматгиз, 1963. 12. Фрезер Р., Дункан В„ Коллар Л. Теория матриц и ее приложения.—М.: ИЛ, 1950. 13. Халмош Я. Конечномерные векторные пространства,—М.: Физматгиз, 1963. 14. Шилов Г. Е. Математический анализ, Конечномерные линейные пространства,—М,: Наука, 1969, К главе VIII 15. Акивис М. Л., Гольдберг В. В. Тензорное исчисление.—М.: Наука, 1972. 16. Кильчевский Я. А. Элементы тензорного исчисления и его приложения к механике. —М,: Гостехиздат, 1954, К главе IX 17. Борн М% Эйнштейновская теория относительности.—Мл Мир, 1972. 18. Ландау Л. Д., Румер Ю. Б. Что такое теория относительности,— М.: Сов. Россия, 1963. 19. Рашевский Я. К. Риманова геометрия и тензорный анализ, — М.: Наука, 1967, 20. Шварц Дж. Как это произошло,—М,: Мир, 1965.
390 СПИСОК ДОПОЛНИТЕЛЬНОЙ ЛИТЕРАТУРЫ 21. Эйнштейн А. О специальной и общей теории относительности (общедоступное изложение). Физика и реальность.—М.: Наука, 1963, с. 167—235. Собрание сочинений, т. I,— М.: Наука, 1965, с. 530—600. 22. Яглом И. М. Принцип относительности Галилея и неевклидова геометрия.—М.: Наука, 1969. К главам X—XI 23. Александров П. С. Введение в теорию групп.—М.: Учпедгиз, 1951. 24. Вейль Г. Симметрия.—М.: Наука, 1968. 25. Курош А. Г. Теория групп. — М.: Наука, 1967. 26. Холл М. Теория групп.—М.: ИЛ, 1962. К главам XII—XIII 27. Вагнер Е. Теория групп и ее приложения к к вантовомеха ни ческой теории атомных спектров.—М.: ИЛ, 1961. 28. Любарский Г. #. Теория групп и ее применения в физике.— М.: Физматгиз, 1958. 29. Мурнаган Ф, Теория представлений групп. — М.: ИЛ, 1950. 30. Серр Ж. П. Линейные представления конечных групп.—М.:Мир, 1970. 31. Хамермеш М. Теория групп и ее применение к физическим проблемам.—М.: Мир, 1966. 32. Хейне В. Теория групп в квантовой механике.—М.: ИЛ, 1963. 33. Шмидт О. Ю. Абстрактная теория групп (сб. «Избранные труды»).—М,: Изд-во АН СССР, 1959. Задачник 34. Проскуряков Я. В. Сборник задач по линейной алгебре.—М.: Наука, 1974.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абелева группа 275 Аддитивная группа 275 Алгебраическое дополнение 27 Альтернирование тензора 237 Аффинное пространство 83 Базис 67 Базисный миног 39 Билинейная форма 188 Билинейный функционал 187 Вектор 64 Векторное пространство 63 Выпуклое множество 90 Вырожденный оператор 94 Галилея принцип относительности 255 Гаусса метод 50 Гиперплоскость 86 Гомоморфизм групп 301 Группа 274 — вращений 306 — движений 304 — преобразований 280 — симметрии 306 Движение 304 Двусторонняя ось 317 Дефект оператора 114 Диагональная матрица 123 Диэдр 311 Диэдральная группа 310 Евклидово пространство 145, 157 Единичная матрица 102 Единичное представление 326 Жорданова клетка 129 — матрица 130 Закон инерции 194 Знакопеременная группа 284 Изоморфные группы 285 — представления 330 — пространства 71 Инвариантная подгруппа 292 Инвариантное подпространство 117, 332 Инварианты кривой 209 Инверсия 18 Индекс подгруппы 290 Канонические уравнения прямой 88 Квадратичная форма 190 Коварнаятиые координаты вектора 238 Ковариантный тензор 230 Коммутативная группа 275 Конечная группа 275 Контравариантный тензор 230 Координаты вектора 68 — тензора 230 Кососимметрический тензор 233 — функционал 190 Коши — Буняковского неравенство 146 Кривая второго порядка 205 Критерий совместности 42 Кэли таблица 277 Лагранжа теорема 290 Линейная зависимость 38. 65 — оболочка 82 — форма 163 Линейное многообразие 78 — представление 325 Линейный оператор 92 — функционал 163 Лоренца преобразования 260 Матрица 20, 106 — билинейной формы 188 — линейного оператора 94 Метрический тензор 238 Минор 27 Мультипликативная группа 275 Невырожденная матрица 95 Невырожденный оператор 94 Неопределенная система 41 Неприводимое представление 337 Несовместная система 41 Нечетная перестановка 18 — подстановка 2#3 Нормальная подгруппа 291 Нормальный делитель 292 Область значений 114 Образ вектора 92 — пространства 114 — элемента 280 Обратная матрица 103 — подстановка 281 Обратное преобразование 280 Обратный оператор 103 Одномерное представление 326 Оператор 92 Определенная система 41 — форма 195 Определитель и-го порядка 20 Ортогональная матрица 175 Ортогональное дополнение 156 Ортогональные векторы 146 — подпространства 154
392 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Ортогональный оператор 173 Ортонормированный базис 149, 249 Ось 308 — симметрии к-го порядка 314 Отношение эквивалентности 289 Параллельные плоскости 87 Пересечение подпространств 79 Перестановка 17 Плоскость й-мерная 86 Подгруппа 278 Подполе 66 Подпредставление 332 Подпространство 76 Подстановка 280 Поле 55 Полная ортогональная группа 304 Положительно (отрицательно) опреде» ленная форма 195 Полуевклидова плоскость 242 Порядок группы 275 — элемента группы 279 Представление группы 324 Преобразование множества 280 Преобразования Галилея 256 — Лоренца 262 Приводимое представление 337 Присоединенная матрица 103 Произведение матриц 101 — матрицы на число 100 — оператора на число 99 — операторов 100, 108 — преобразований 280 — тензоров 234 Прообраз элемента 92 Пространство бесконечномерное 67 — линейное 63 — представления 325 — событий 255 Процесс ортогонализации 151 Прямая 88 — сумма представлений 333 пространств 81 Прямое произведение групп 293 Прямоугольная матрица 106 Псевдоевклидова плоскость 248 Псевдоортогональный оператор 252 Размерность пространства 67 Ранг билинейной формы 189 — матрицы 35 — оператора 114 Регулярное представление 339 Решение системы 12, 41 Самосопряженный оператор 168 Свертка тензора 235 Сигнатура формы 195 Симметрирование тензора 237 Симметрическая группа 280 — матрица 169 — форма 190 Симметрический тензор 232 Скалярное произведение 144 на группе 344 След оператора 127 Собственное значение 119 Собственный вектор 119 Событие 255 Совместная система 41 Сопряженнные элементы группы 297 Сопряженный оператор 165 Спектр оператора 128 Сумма матриц, 99 — операторов 99 — подпространств 79 — тензоров 233 Тензор 230 Тензорное произведение матриц 379 операторов 382 представлений 384 пространств 380 Тождественное преобразование 280 Тождественный оператор 97 Точка 83 Точное представление 324 Транспозиция 18 Транспонирование определителя 22 Треугольная матрица 278 Унимодулярная матрица 278 Унитарная матрица 182 Унитарное представление 335 Унитарный оператор 181 Фактор-группа 293 Фундаментальная система решений 46 Характер представления 354 Характеристический многочлен 120 Центральная функция 342 Центроевклидова группа 304 Циклическая группа 276 Четная перестановка 18 — подстановка 283 Шура лемма 343 Эйнштейна принцип относительности 258 Эквивалентные оси 309 Элементарные преобразования 35 Элемент бесконечного порядка 279 — 6-го порядка 279 Эрмитов оператор 168 — функционал 202 Эрмитова матрица 172 — форма 202 Ядро гомоморфизма 302 — оператора 114 — отображения 115