Text
                    В. И. СМИРНОВ
КУРС
ВЫСШЕЙ МАТЕМАТИКИ
ТОМ ТРЕТИЙ
ЧАСТЬ ПЕРВАЯ
ИЗДАНИЕ ДЕСЯТОЕ,
СТЕРЕОТИПНОЕ
Допущено Министерством
высшего и среднего специального образования СССР
в качестве учебного пособия для студентов механико-математических
и физико-математических факультетов университетов
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1974


517 C50 УДК 510 @22) 20203—073 053@2)-74
ОГЛАВЛЕНИЕ Предисловие к четвертому изданию 5 Предисловие к девятому изданию б глава ? ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ § 1. Определитель и его свойства . 7 1. Понятие об определителе G). 2. Перестановки A1). 3. Основ- Основные свойства определителя A6). 4. Вычисление определителя B1). 5. Примеры B3). 6. Теорема об умножении определителей B9). 7. Прямоугольные таблицы C3). § 2. Решение систем уравнений 36 8. Теорема Крамера C6). 9. Общий случай систем уравнений C8). 10. Однородные системы D2). 11. Линейные формы D5). 12. п- мерное векторное пространство D7). 13. Скалярное произведе- произведение E3). 14. Геометрическая интерпретация однородных систем E5). 15. Случай неоднородной системы E7). 16. Определитель Грамма. Неравенство Адамара F0) 17. Системы линейных диффе- дифференциальных уравнений с постоянными коэффициентами F4). 18. Функциональные определители F8;. 19. Неявные функции G2). г л а в а и ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ § 3. Линейные преобразования 76 20. Преобразование координат в трехмерном пространстве G6). 21. Общие линейные преобразования вещественного трехмерного пространства (80). 22. Ковариантные и контравариантные афинные векторы (87) 23. Понятие тензора (90). 24. Примеры афинных ор- ортогональных тензоров (93). 25. Случай «-мерного комплексного пространства (95). 26. Основы матричного исчисления (99). 27. Ха- Характеристические числа матриц и приведение матриц к канониче- каноническому виду A04). 28. Унитарные и ортогональные преобразования (ПО). 29. Неравенство Коши — Буняковского A15). 30. Свойства скалярного произведения и нормы A17). 31. Процесс ортогонали- зации векторов A18). § 4. Квадратичные формы f . . , 120 32. Преобразование квадратичной формы к сумме квадратов A20). 33. Случай кратных корней характеристического уравнения A24). 34. Примеры A29). 35. Классификация квадратичных форм A31). 36. Формула Якоби A36). 37. Одновременное приведение двух квад- квадратичных форм к сумме квадратов A37). 38. Малые колебания A39),
4 ОГЛАВЛЕНИЕ 39. Экстремальные свойства собственн^1х значений квадратичной формы A41). 40. Эрмитовские матрицы и формы Эрмита A43). 41. Коммутирующие эрмитовские матрицы A48). 42. Приведение унитарных матриц к диагональной форме A51). 43. Матрицы проектирования A55). 44. Функции от матриц A60). 45. Простран- Пространство с бесчисленным множеством измерений A63). 46. Сходимость векторов A68). 47. Ортонормированные системы A73). 48. Линей- Линейные преобразования с бесчисленным множеством переменных A76). 49. Функциональное пространство L2 A80). 50. Связь между про- пространствами 12 и Z,2 A82). 51. Линейные операторы в L2 A83). ГЛАВА Ш ОСНОВЫ ТЕОРИИ ГРУПП И ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП § 5. Основы общей теории групп 188 52. Группы линейных преобразований A88). 53. Группы правильных многогранников A91). 54. Преобразования Лоренца A94). 55. Пере- Перестановки B01). 56. Абстрактные группы B05). 57. Подгруппа B08) 58. Классы и нормальный делитель B12). 59. Примеры B15). 60. Изоморфные и гомоморфные группы B17). 61. Примеры B19). 62. Стереографическая проекция B20). 63. Унитарная группа и гр>ппа движения B22). 64. Общая линейная группа и группа Ло- Лоренца B28) § 6. Линейные представления групп 232 65. Представление группы линейными преобразованиями B32)f 66. Основные теоремы B36). 67. Абелевы группы и представления первого порядка B40). 68. Линейные представления унитарной груп- группы с двумя переменными B42). 69. Линейные представления груп- группы вращения B49). 70. Теорема о простоте группы вращения B52). 71. Уравнение Лапласа и линейные представления группы враще- вращения B53). 72. Прямое произведение матриц B59). 73. Композиция двух линейных представлений группы B61). 74. Прямое произведе- произведение групп и его линейные представления B64). 75. Разбиение ком- композиции Dj X Df линейных представлений группы вращения B67). 76. Свойство ортогональности B73). 77. Характеры B76). 78. Регу- Регулярное представление группы B81). 79. Примеры представления конечных групп B83). 80. Представления линейной группы с двумя переменными B85) 81. Теорема о простоте группы Лоренца B89). § 7. Непрерывные группы 290 82. Непрерывные группы. Структурные постоянные B90). 83. Бес- Бесконечно малые преобразования B94). 84. Группа вращения B98). 85. Бесконечно малые преобразования и представления группы вращения B99). 86. Представления группы Лоренца C03). 87. Вспо- Вспомогательные формулы C06). 88. Построение группы по структур- структурным постоянным C09). 89. Интегрирование на группе C11). 90. Свойство ортогональности. Примеры C16). Алфавитный указатель 321
ПРЕДИСЛОВИЕ К ЧЕТВЕРТОМУ ИЗДАНИЮ В настоящем издании, в связи с добавлением нового материала, третий том разбит на две части. Первая часть содержит весь мате- материал, относящийся к линейной алгебре, теории квадратичных форм и теории групп. В этой части наиболее существенные добавления относятся к теории групп. Большую помощь при составлении этих добавлений мне оказал Д. К. Фаддеев. Ему, в частности, принадлежит изложение материала, относящегося к выяснению простоты группы вращения и группы Лоренца, построение группы по структурным по- постоянным и интегрированию на группе [70, 81, 87, 88, 89, 90]. При- Приношу ему большую благодарность за помощь в работе над этой книгой. В. Смирнов
ПРЕДИСЛОВИЕ К ДЕВЯТОМУ ИЗДАНИЮ Существенные изменения в настоящем издании внесены лишь в материал, относящийся к функциональному пространству L2. Это связано с тем, что последнее, двадцатое, издание второго тома содер- содержит изложение теории интеграла Лебега и свойств семейства функ- функций, интегрируемых с квадратом. В. Смирнов
ГЛАВА Г ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ § 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 1. Понятие об определителе. Мы начнем настоящий параграф с решения простой алгебраической задачи, а именно задачи о реше- решении систем уравнений первой степени. Рассмотрение этой задачи при- приведет нас к важному понятию об определителе. Начнем с рассмотрения наиболее простых частных случаев. Возьмем сначала систему двух уравнений с двумя неизвестными: 1* #22*2 ¦=~ ^2· Коэффициенты при неизвестных aik снабжены двумя значками, первый из которых указывает, в каком уравнении находится этот коэффициент, а второй значок указывает, при каком из неизвестных он стоит. Решение написанной системы, как известно, имеет вид: X — Мм—-??? . ? _ alib2 Возьмем теперь три уравнения с тремя неизвестными: #11*1 + #12*2 + #13*3 = ЬЬ #21*1 ~Г #22*2 """Г #23*3 === ^2> #31*1 Н~ #32*2 "f" #33*3 = ^3> причем мы пользуемся прежними обозначениями для коэффициентов. Перепишем первые два уравнения в виде: #11*1 + #12*2 = &1 — #13*3> #21*1 ~Т~ #22*2 == ^2 — #23*3*
8 ГЛ. ?. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [1 Решая их относительно неизвестных х{ и х% по предыдущим фор- формулам, будем иметь: ? _ ?? — <* 1 ? _ 0ц (*я 088^а) fo а13^з) 021 2 аа — аа Подставляя эги выражения в последнее уравнение системы, по- получим уравнение для определения неизвестного хг и, наконец, решая это уравнение, будем иметь окончательное выражение для этого не- неизвестного: ? _ аПа22^3 + g12M31 + ^lg21^2 — ДцМвЯ ~ ^L2^21^B ~ МяяД»! /J4 3 «11022^33 + 012023031+013021032 —011^23032-—012021033 — «13022031 Рассмотрим подробно конструкцию этого выражения. Заметим прежде всего, что его числитель может быть получен из знаменателя простой заменой коэффициентов аа при определяемом неизвестном свободными членами ^г·. Таким образом, остается выяснить закон образования знаменателя, который не содержит уже свободных чле- членов и составлен исключительно из коэффициентов нашей системы. Запишем эти коэффициенты в виде квадратной таблицы, сохраняя тот порядок, в котором они стоят в самой системе а п «91 «22 «23 «31 «32 «33 B) Написанная таблица содержит три строки и три столбца. Числа aik называются ее элементами. Первый из значков показывает, в какой строке стоит этот элемент, а второй значок указывает номер столбца. Выпишем теперь знаменатель выражения A): «11«22«33 + «12«23«31 + «13«21«32 — «11«23«32 «12«21«33 — «13«22«31· C) Как мы видим, он состоит из шести членов, и каждый его член есть произведение трех элементов таблицы B), причем в этом про- произведении участвуют элементы каждой строки и каждого столбца. Действительно, эти произведения имеют вид: D) где /?, q, г суть целые числа 1, 2, 3, расставленные в некотором определенном порядке. Таким образом, как первые, так и вторые знаки представляют собою совокупность целых чисел 1, 2, 3, и про- произведения D) действительно содержат по одному элементу из каждой строки и из каждого столбца. Чтобы получить все члены выражения C), надо в произведении D) взять вторые значки /?, q, r в различных
1] § 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 9 возможных порядках. Таких возможных перестановок из вторых значков будет, очевидно, шесть: 1, 2, 3; 2, 3, 1; 3, 1, 2; 1, 3, 2; 2, 1, 3; 3, 2, 1, E) и мы получаем, таким образом, все шесть членов выражения C). Но мы видим, что некоторые из произведений D) входят в выраже- выражение C) со знаком плюс, а другие со знаком минус, и остается лишь выяснить то правило, согласно которому надо выбирать знак. Со знаком плюс, как мы видим, входят те произведения D), у которых вторые значки образуют следующие перестановки: 1, 2, 3; 2, 3, 1; 3, 1, 2, E0 а со знаком минус входят те произведения, вторые значки которых образуют перестановки: 1, 3, 2; 2, 1, 3; 3, 2, 1. E2) Выясним теперь, чем перестановки E0 отличаются от переста- перестановок E2). Назовем беспорядком в перестановке тот факт, что большее число стоит впереди меньшего, и подсчитаем число беспо- беспорядков в перестановках E0· В первой из этих перестановок бес- беспорядков вовсе нет, т. е. число беспорядков равно нулю. Перейдем ко второй перестановке и сравним по величине каждое из чисел, в нее входящих, со всеми следующими. Мы видим, что здесь имеются два беспорядка, а именно число 2 стоит перед числом 1 и число 3 стоит перед числом 1. Точно так же нетрудно убедиться, что и третья из перестановок E0 содержит два беспорядка. Одним сло- словом, можно сказать, что все перестановки E0 содержат четное число беспорядков. Совершенно так же исследуя перестановки E2), мы убеждаемся, что все они содержат нечетное число беспорядков. Мы можем теперь формулировать правило знаков в выражении C), а именно: те произведения D), в которых число беспорядков в пе- перестановке, образованной вторыми значками, есть число четное, входят в выражение C) без всякого изменения. Те же произведения D), у которых перестановки, образованные вторыми значками, со- содержат нечетное число беспорядков, входят в выражение C) с при- приписанным к ним знаком минус. Выражение C) называется определи- определителем третьего порядка, соответствующим таблице чисел B). Не- Нетрудно теперь обобщить предыдущее на случай определителей любого порядка. Пусть имеется я2 чисел, расставленных в виде квадратной таб- таблицы, имеющей ? строк и ? столбцов: ап ап ... а1п #21 &Ш · * * &Чп ап1 ап% *·· апп
10 ГЛ I ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [1 Элементы этой таблицы aik суть заданные комплексные числа, причем значки i и k указывают номер строки и столбца, на пере- пересечении которых стоит число aik. Составим всевозможные произве- произведения из чисел таблицы F) так, чтобы эти произведения содержали по одному числу из каждой строки и из каждого столбца. Эти про- произведения будут иметь вид: ?????^?^..????1 G) где рь ръ ..., рп суть числа 1, 2, ..., п, расставленные в неко- некотором порядке. Чтобы получить всевозможные произведения вида G), нам надо взять всевозможные перестановки вторых значков. Как из- известно из элементарной алгебры, число таких перестановок будет равно факториалу целого числа п: 1 .2-3 ... п = п\ Каждая из этих перестановок будет иметь некоторое число бес- беспорядков по сравнению с основной перестановкой 1, 2, 3, ..., п. Те произведения вида G), вторые значки которых образуют пере- перестановку с четным числом беспорядков, возьмем без всякого измене- изменения, а к тем произведениям вида G), у которых перестановка вторых значков имеет нечетное число беспорядков, припишем знак минус. Сумма всех полученных таким образом произведений и называется определителем п-го порядка, соответствующим таблице F). Эта сумма будет, очевидно, содержать п\ слагаемых. Нетрудно предста- представить это определение в виде формулы. Введем для этого некоторое обозначение. Пусть рь /?2, ..., рп — некоторая перестановка из чисел 1, 2, ..., п. Обозначим число беспорядков в этой перестановке сим- символом \Рь Ръ · · · > Рп1 Тогда данное выше определение определителя, соответствующего- таблице F), может быть записано в виде следующей формулы, при- причем для обозначения определителя мы пишем таблицу F) между вертикальными чертами аи ап ... а1п ···*<,, «о Здесь суммирование распространяется на всевозможные переста- перестановки вторых значков, т. е. на всевозможные перестановки (р19 Ръ · · · > Рп)· Говоря о таблице, как таковой, а не об определителе, из нее составленном, мы ставим эту таблицу между двойными вер- вертикальными чертами.
2] § 1 ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 11 Заметим, что в выражении C) мы в каждом произведении рас- расставили сомножители в таком порядке, чтобы первые значки обра- образовывали основную перестановку 1, 2, 3, и таким образом все наши рассуждения относились к перестановкам, образуемым вторыми значками. Можно, наоборот, поставить в каждом произведении сомно- сомножители так, чтобы вторые значки всегда шли в возрастающем порядке; при этом выражение C) перепишется в виде: ^11^22^33 + #31^12^23 + fl21^32#13 ~ #11«32#23 — ^21^12%, ?31«22?13· (9) Здесь первые значки образуют всевозможные перестановки /?, q, r, причем легко проверить, что правило знаков у членов выражения (9) может быть формулировано совершенно так же, как и выше, но только по отношению к первым значкам. Это приводит нас к тому, чтобы наряду с суммой (8) рассматривать аналогичную сумму вида: 2j (— 1) ? ????\ ...????. A0) (Pl,p2 Рп) Очевидно, что эта последняя сумма состоит из тех же членов, что и сумма (8). В дальнейшем мы увидим, что и знаки ее членов такие же, как и в сумме (8), т. е. так же, как и при «и=3, сумма A0) совпадает с суммой (8). Обратимся, наконец, к случаю ? = 2. При этом таблица имеет вид: ап ап ^21 ^22 и формула \8) дает следующее выражение для определителя второго порядка, соответствующего этой таблице: "" "" - - A1) Из предыдущего непосредственно следует, что для выяснения свойств определителя необходимо познакомиться ближе со свой- свойствами перестановок, к чему мы сейчас и переходим. 2. Перестановки. Пусть имеется ? каких-нибудь элементов, рас- расставленных в определенном порядке. Назовем это перестановкой, образованной из наших элементов. Докажем прежде всего, что таких различных перестановок будет п\ При п = 2 это очевидно, ибо два элемента могут образовывать две различные перестановки. При n = S это непосредственно следует из подсчета перестановок E), где роль элементов играют числа 1, 2, 3. Без труда можно убедиться, что E) дают всевозможные'перестановки из этих трех элементов. Докажем наше утверждение при любом целом ? по закону индукции. Пред-
12 ГЛ. 1. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [2 полагая, что наше утверждение справедливо при некотором п, дока- докажем, что оно справедливо и для числа элементов (#-|-1). Положим, что ? элементов дают п\ перестановок и рассмотрим какие-нибудь (/г —|— 1) элементов, которые обозначим Обратим сначала внимание на те перестановки, у которых пер- первым элементом будет Cv Чтобы получить всевозможные такие пере- перестановки, надо поставить на первое место Q, а затем писать все- всевозможные перестановки из оставшихся ? элементов, и число таких перестановок будет по предположению равно п\ Таким образом, число перестановок из элементов Ck, начинающихся с элемента Q, будет равно п\ Совершенно так же число перестановок из элемен- элементов Ck> начинающихся с элемента Сь будет равно также п\ В общем, число различных перестановок из элементов Ck будет =1.2..../1.(л+1) = (л+1)!, что и требовалось доказать. Мы можем, конечно, считать, что за элементы взяты целые числа, начиная с единицы, чего мы и будем придерживаться в даль- дальнейшем, Назовем транспозицией операцию, которая состоит в том, что в некоторой перестановке мы меняем местами два элемента. Непосредственно очевидно, что из всякой перестановки мы можем получить всякую другую перестановку, совершая не- несколько транспозиций. Например, возьмем две перестановки из четырех элементов 1, 3, 4, 2, 2, 4, 1, 3. Можно перейти от первой из этих перестановок ко второй при помощи транспозиций путем следующего перехода: 1, 3, 4, 2,->2, 3, 4, 1->2, 4, 3, 1-> 2, ? 1, 3. Здесь нам понадобились три транспозиции, чтобы перейти от первой перестановки ко второй. Если бы мы совершали транспози- транспозиции иным образом, то мы могли бы и другим путем перейти от первой перестановки ко второй при помощи транспозиций, т. е., иначе говоря, число транспозиций, необходимых для перехода от одной перестановки к другой, не есть строго определенное число. Можно переходить от одной перестановки к другой при помощи различного числа транспозиций. Но для нас будет существенным доказать, что эти различные числа для двух заданных перестановок будут всегда или все четные или все нечетные. Иначе это выра- выражают, говоря, что эти числа всегда одинаковой четности. Чтобы выяснить это, введем понятие о беспорядке, которым мы уже поль- пользовались в предыдущем номере. Пусть имеются перестановки из ?
2] §1 ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 13 элементов 1, 2, ..., п. Назовем основной перестановкой ту пере- перестановку 1, 2, ..., /?, A2) в которой числа идут возрастающим порядком. Назовем беспоряд- беспорядком в некоторой перестановке тот факт, когда два элемента этой перестановки следуют не в том порядке, в каком они стоят в основ- основной перестановке A2), т. е.> иначе говоря, когда большее число стоит левее меньшего. Назовем перестановками первого класса те перестановки, в которых число беспорядков есть число четное, и перестановками второго класса, — те, где это число есть число нечетное. Основным для дальнейшего будет следующая теорема: Транспозиция меняет кисло беспорядков на число нечетное. Возьмем некоторую перестановку а, Ь, ..., k9 ...,/?, ..., 5 A3) и положим, что мы применяем к этой перестановке транспозиции по отношению к элементам k и /?, т. е. меняем эти два элемента взаимно местами. После такой транспозиции взаимное расположение элементов k и ? относительно элементов, стоящих левее k или правее /?, останется прежним. Изменится лишь взаимное располо- расположение элементов k и ? относительно тех элементов, которые стоят в перестановке между k и /?, а также изменится, конечно, взаимное расположение элементов k и ? одного относительно другого. Под- Подсчитаем общее изменение числа беспорядков. Положим, что между элементами k и ? в перестановке A3) стоит всего т элементов, и пусть эти средние элементы по сравнению с элементом k дают ? порядков и ? беспорядков, относительно же элемента ? дают ьх порядков и Pi беспорядков. Имеем, очевидно: a + p = ai + pi = m. A4) В результате транспозиции порядок перейдет в беспорядок и наоборот, т. е., точнее говоря, если элемент k с некоторым средним элементом до транспозиции был в порядке, то после транспозиции он окажется в беспорядке и наоборот, и то же самое для элемента /?. Таким образом общее число беспорядков у элементов k и ? отно- си!ельно средних элементов до транспозиции было ^ —|— рх и после транспозиции a-J-a^ т. е. изменение числа беспорядков будет Пользуясь A4), можем переписать это число в виде: ? = (? -|- aj) — (т — a -f- т — ax) = 2 (a -j- 4 — m), откуда непосредственно следует, что это число ? будет четным. Остается обратить внимание на взаимное расположение самих элемен- элементов k и р. Если до транспозиции они образовывали порядок, то после
14 ГЛ. Т ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [2 они образуют беспорядок и наоборот, т. е. здесь изменение числа беспорядков равно единице, и таким образом общее изменение числа беспорядков, происшедших от транспозиции, будет числом нечетным. Выясним некоторые следствия, вытекающие из доказанной тео- теоремы. Следствие I. Если выписать все п\ перестановок и в каждой из них произвести транспозицию двух определенных элементов, на- например элементов 1 и 3, то все перестановки первого класса станут перестановками второго класса и наоборот; а в общем получится опять вся совокупность п\ перестановок. Отсюда непосредственно следует, что число перестановок первого и второго класса оди- одинаково. Следствие II. Всякая перестановка может быть получена из основной путем транспозиций. Из доказанной теоремы непосред- непосредственно следует, что первый класс образуют те перестановки, которые получаются из основной путем четного числа транспо- транспозиций, а второй класс — те перестановки, которые получаются из основной путем нечетного числа транспозиций. Следствие III. Выбор основной перестановки совершенно про- произволен. Мы могли бы вместо перестановки A2) выбрать за основ- основную какую-нибудь другую перестановку, при этом, конечно, при определении беспорядков надо сравнивать перестановку с основной, т. е. исходить из того порядка элементов, в котором они стоят в основной перестановке. Нетрудно видеть, что если мы возьмем вместо перестановки A2) за основную перестановку какую-нибудь из перестановок первого класса, то перестановки первого класса останутся по-прежнему перестановками первого класса, а переста- перестановки второго класса останутся перестановками второго класса. Наоборот, если мы за основную перестановку возьмем какую-нибудь перестановку второго класса, то перестановки второго класса станут перестановками первого класса, и перестановки первого класса ста- станут перестановками второго класса. Например, если в шести перестановках из элементов 1, 2, 3 мы примем за основную перестановку 2, 1, 3, то перестановками пер- первого класса будут перестановки: 2, 1, 3; 1, 3, 2; 3, 2, 1. Во второй из этих перестановок мы имеем два беспорядка: 1 стоит перед 2 и 3 перед 2, а в основной 2 стоит перед 1 и 2 перед 3. Перестановками второго класса будут перестановки: 1, 2, 3; 2, 3, 1; 3, 1, 2. В первой из этих перестановок мы имеем один беспорядок по сравнению с основной 2, 1, 3, а именно 1 стоит перед 2. Принимая во внимание сказанное выше, мы можем формулиро- формулировать правило знаков в выражении (8) следующим образом: мы пи*
2] § 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 15 тем перед произведением знак плюс, если перестановка из вторых значков принадлежит первому классу, и знак минус, если пере- перестановка из вторых значков принадлежит второму классу, при- причем за основную перестановку принята перестановка 1, 2, ..., п. Выясним теперь одно из основных свойств определителя. Пере- Переставим в таблице, дающей определитель, первый и второй столбцы. Числа, которые мы раньше обозначали через aik, мы по-прежнему будем обозначать этими же буквами с теми же самыми значками. Вместо таблицы F) будем иметь таблицу: ап ап\ A5) Мы можем теперь, пользуясь определением, выражаемым форму- формулой (8), составить определитель, соответствующий таблице A5). В этой таблице столбцы пронумерованы в следующем порядке: 2, 1, 3, ..., пу и эту перестановку мы должны считать за основную. Она получилась из прежней основной при помощи одной транспози- транспозиции и, следовательно, раньше принадлежала ко второму классу. Таким образом прежние перестановки второго класса станут при новом выборе основной перестановки перестановками первого класса и наоборот. Следовательно, определитель, соответствующий таб- таблице A5), будет суммой тех же слагаемых, которые стоят в фор- формуле (8), но вследствие указанного только что изменения в распре- распределении перестановок вторых значков по классам знаки у членов новой суммы будут противоположны знакам слагаемых суммы (8), т. е. при перестановке двух столбцов величина определителя меняет знак. Мы доказали это свойство, переставляя первый и вто- второй столбцы. Точно такое же доказательство годится и при пере- перестановке двух любых столбцов. Так, например, имеет место формула: 1 2 5 0 7 3 3 6 0 = — 1 2 5 3 6 0 0 7 3 Второй определитель получается из первого перестановкой вто- второго и третьего столбцов. Выясним еще одно свойство определителя. Возьмем некоторое слагаемое суммы (8): (__l)[Pi.Ps Piia\Pia2pi ... апрп. A60 Переставляя порядок сомножителей, мы можем привести в пол- полный порядок вторые значки, но при этом первые значки будут
16 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [3 образовывать некоторую перестановку qv q%, ..., qn, и предыдущее выражение запишется в виде: (-О1*"'2 рп]ад\ая\ ... аЯпП. A60 Переход от A6^ к Aб2) можно совершить при помощи нескольких транспозиций сомножителей. Всякая такая транспозиция будет одно- одновременно транспозицией в перестановке как первых, так и вторых значков. Если число необходимых транспозиций для перехода от A6^ к A60 будет четным, то отсюда будет следовать, что пере- перестановка pv ръ ..., рп принадлежит первому классу, так как она переходит в основную 1, 2, ..., ? при помощи четного числа транс- транспозиций и, следовательно, очевидно, может быть получена из основ- основной также при помощи четного числа транспозиций. Но при этом и перестановка qlf qb ..., qn принадлежит к первому классу, так как она одновременно получается из основной при помощи того же четного числа транспозиций. Точно так же, если р1У рь .„., рп принадлежит второму классу, то и qb qb ..., qn принадлежит вто- второму классу. Отсюда следует, что (-—1)Ipi»ps ря1 =(—1I91.0я.»..$л1, и, следовательно, мы можем написать: Итак, если мы сравним соответствующие слагаемые в суммах (8) и A0), то увидим, что Э1и суммы ъ точности совпадают. В сумме A0) строки играют ту же роль, что столбцы в сумме (8), и из наших рассуждений непосредственно следует, что если в таблице заменить все строки столбцами и столбцы строками, не меняя их порядка, то величина определителя от этого не изменится. Так, например, мы имеем равенство следующих двух определи- определителей третьего порядка: 2 7 2 3 0 1 5 1 б 2 3 5 7 0 1 2 1 6 3. Основные свойства определителя. I. Формулируем прежде всего только что доказанное свойство — величина определителя не меняется при замене строк столбцами. В дальнейшем все, что будет доказано для столбцов, будет годиться и для строк и наобо- наоборот. II. В предыдущем номере мы видели, что перестановка двух столбцов меняет лишь знак у определителя, то же относится и к строкам, т. е. при перестановке двух строк (столбцов) между собой величина определителя меняет лишь знак. III. Если определитель имеет две одинаковые строки, то, пере- переставляя их, мы, с одной стороны, ничего не изменим, а с другой
3] § 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 17 стороны, по доказанному переменим знак определителя, т. е., обозна- обозначая через ? величину определителя, ? = — ? или ? = 0. Итак, опре- определитель с двумя одинаковыми строками (столбцами) равен нулю. IV. Линейной однородной .функцией переменных ?? х^ ..., хп называется полином первой степени этих переменных без свобод· ного члена, т. е. выражение вида: ? (?? хп) = а1х1 где коэффициенты аг не зависят от xs. Такая функция обладает двумя очевидными свойствами: , Хь ..., Хя), Последнее свойство имеет место и для любого числа слагаемых. Обращаясь к формуле (8), мы видим, что каждое слагаемое написан- написанной суммы содержит множителем один и только один элемент из каждой строки. Отсюда следует, что определитель есть линейная однородная функция элементов какой-нибудь строки (или какого- нибудь из столбцов). Следовательно, если все элементы некоторой строки (столбца) содержат общий множитель, то его можно вынести за знак определителя. Величина определителя, соответствующего таблице F), часто обо- обозначается, как мы уже указывали выше, в виде: ап а21 а1п ап1 или, более коротко: \aik\ 0, k = h % ..., ?). Доказанное свойство можно в частном случае записать, например, в виде #11 #12 #13 = k #32 #33 Второе из указанных свойств линейных однородных функций дает следующее свойство определителя: если элементы некоторой строки (столбца) 'суть суммы равного числа слагаемых, то определитель равен сумме определителей, в которых элементы
18 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТРМ УРАВНЕНИЙ [3 упомянутой строки (столбца) заменены отдельными слагаемыми. Так, например: а d g b е h с -\-cr f+r = a d g b e h с f i + a d g b e h c' f ? Отметим еще одно очевидное следствие линейности и однород- однородности. Если все элементы некоторой строки (столбца) равны нулю, то и определитель равен нулю. V. Если из таблицы F) вычеркнуть i-ю строку и k-ft столбец, на пересечении которых находится элемент аш то останется (п—1) строк и столько же столбцов. Соответствующий определитель (п—1)-го порядка называется минором основного определителя п-го порядка, соответствующим элементу aik. Обозначим его через ?^ и составим произведение А„, = (-1р%„ A7) и назовем его алгебраическим дополнением элемента aik. Покажем теперь, что эти алгебраические дополнения являются коэффициентами той линейной однородной функции, о которой мы говорили в пре- предыдущем свойстве, т. е., что для любой /-й строки имеет место формула: b = Anan-{-Ai2an + ...+ Ainain 0=1, 2, ..., ?) A8) и для любого &-го столбца — формула: ? = Aikalk + Aua,k +... + Ankank (A = 1, 2, ..., /?), A9) где ?— величина определителя. Иначе говоря, мы должны показать, что если в сумме (8) мы соберем все члены, содержащие некоторый определенный элемент aikf то коэффициентом при этом элементе будет его алгебраическое дополнение Аш определяемое формулой A7). Обозначим предварительно этот коэффициент через Bik и заметим прежде всего, что этот коэффициент представляет собою сумму произведений из (п — 1) элементов, причем эти произведения не содержат уже элементов i-й строки и k-?? столбца. Возьмем сначала случай i = k=l и выпишем те слагаемые суммы (8), которые содержат элемент ап: ап (- Здесь суммирование должно распространяться на всевозможные перестановки р2, рг, ..., рп из чисел 2, 3, ..., п. В полной переста- перестановке 1, /?2, ..., рп первый элемент единица по отношению ко всем следующим находится в порядке, а потому для числа беспорядков мы
8] § 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 19 имеем: [1> Ръ ··> ??]=*\?* ···> Рп\ причем за основную перестановку в обоих случаях берется та, где числа идут в возрастающем порядке. Мы имеем, таким образом, сле- следующее выражение для коэффициента при ап: я»1= ? (-о1* '.-е»,,,· (Р2,рз ??? Эта сумма подходит под определение определителя, но только по сравнению с исходным определителем отсутствуют первая строка и первый столбец. Отсюда видно, что ?11 = ?11 = (—1I+1А11 = Л11, т. е. при i = k=sl наше утверждение доказано. Перейдем к случаю любых i и k. Будем переставлять /-ю строку постепенно с более высокими строками так, чтобы она попала на место первой строки. Для этого придется сделать (i — 1) перестановок строк. Совершенно так же постепенной перестановкой приведем k~ft сюлбец на место первого столбца. После этих перестановок элемент aik попадет в левый верхний угол на место элемента ап. Строка с номером / и столбец с номером k окажутся на первом месте, а порядок осталь- остальных строк и столбцов не изменится. Полученный выше результат показывает, что после упомянутых перестановок коэффициент при а^ будет равен ?/?. Но нам пришлось применить (/— l)-\-(k— 1) пере- перестановок строк и столбцов попарно, и каждая такая перестановка добавляет множитель (— 1) к определителю, т. е. в общем мы доба- добавили множитель (—\yi-{)-\-(k —l) =(—1)'+*, и, следовательно, окон- окончательное выражение для коэффициента Bik будет: /_. ( что и требовалось доказать. Таким образом мы доказали формулы A8) и A9). Если мы в определителе ? заменим элементы i-fi строки последовательно некоторыми числами cv c2, ..., сп) не меняя осталь- остальных строк, то в формуле A8) множители Ais не изменятся, и вели- величина нового определителя будет ?' = AnCl + Апс% +... + Aincn. B0) В частности, если мы возьмем числа сь сь ..., сп равными элемен- элементам aJb ajb ..., cijn другой строки с номером у, отличным от и то определитель ?' будет иметь две одинаковые строкд /-ю и у-ю, и его величина будет равна нулю: ?' = 0, ?. е. ???? + ???? +... + Ainajn = 0 (? ? j). B10 Точно так же для столбцов: B10
20 ГЛ. ?. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [3 Формулы A9) и B11#2) приводят нас к следующему важному в даль- дальнейшем свойству определителя. Если элементы некоторой строки (столбца) умножить на их алгебраические дополнения и эти произведения сложить, то по- получится величина определителя. Если же элементы некоторой строки (столбца) умножить на алгебраические дополнения соот- соответствующих элементов другой строки (столбца) и эти произ- произведения сложить, то сумма будет равна нулю. VI. Прибавим к элементам первой строки определителя ? эле- элементы второй строки, умноженные на некоторый множитель р. Эле- Элементы первой строки станут равными als-\-pais E=1, 2, ..., я), и в силу свойства IV новый определитель будет суммою двух опре- определителей: прежнего определителя и второго определителя, у кото- которого первая строка состоит из элементов pa%s E=1, 2, ..., ?), а остальные строки одинаковы с ?. Вынося из первой строки /?, получим одинаковые первую и вторую строки, и, следовательно, величина этого второго определителя равна нулю, т. е. вообще величина определителя не изменится, если к элементам некоторой строки (столбца) добавить соответствующие эле- элементы другой строки (столбца), предварительно умножив эти последние на один и тот же множитель. Укажем некоторые обозначения, которыми мы будем пользоваться в дальнейшем. Пусть, как и выше, имеется квадратная таблица чисел F) и пусть /—целое положительное число, не большее, чем п. Вве- Введем следующее обозначение определителя порядка /, составленного из строк таблицы F) с номерами рь /?2, ..., рг и столбцов с номе- номерами qb qb ..., qt I Pi P* ... ? ? #? ft ··· 4? B2) При этом обычно определителем первого порядка, соответствующим какому-либо числу а, называют само это число, т. е. A(pg) = apq. Последовательности целых положительных чисел ри рь ..., рь и qif Яь ...» 4? могут быть расположены и не в порядке возрастания чисел ps и qs. Если в обеих этих последовательностях числа идут в возрастающем порядке, то определитель B2) называется минором порядка / определителя (8). Этот определитель B2) получается из (8) вычеркиванием (п — /) строк и (п — /) столбцов. Пусть номера этих вычеркнутых строк и столбцов в возрастающем порядке суть: гь г* ...» rn_i и sl9 sb ... , sn_t. Минор \si> % ··· sn-i
4] § 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 21 называется минором, дополнительным к минору B2), а выражение: (_ i/i +М-· · · + */+*i + *,+ .-. + */ А(П Г* '·' ГпА B2? называется алгебраическим дополнением минора B2). Для отдельного элемента aik это определение алгебраического дополнения совпадает с прежним определением A7). Алгебраическое дополнение B2t) обозначим через ?a ... 4? Оно вполне определяется заданием определителя B2), т. е. заданием последовательностей номеров его строк рь рь ..., рг и столбцов Яь Я* ··· > Я ? Фиксируем номера строк. Величина определителя ? является, очевидно, однородным полиномом степени / элементов этих строк, и она выражается, как можно доказать, формулой (теорема Лапласа): 1 Л(й "¦ - ")*('· " ?, B3) где суммирование проводится по всевозможным возрастающим последова- последовательностям чисел qif q2, ... , q^ взятых из последовательности 1, 2, ... , п. Число слагаемых в сумме B3) равно числу сочетаний из ? элементов по /: поскольку порядок чисел qs не играет роли, ибо они берутся при составле- составлении суммы B3) только в возрастающем порядке. При / = 1 мы имеем A(fyz=apiqv и формула B3) переходит в формулу A8) при i~pv Легко построить формулу, аналогичную B3) и соответствующую разложению ? по элементам каких-либо выбранных столбцов. Мы не будем в дальнейшем пользоваться формулой B3) и не приводим ее доказательства. 4. Вычисление определителя. Вычисление определителя второго порядка очень просто. Согласно формуле A1) достаточно написать таблицу и взять произведение элементов, стоящих на диагонали, подчеркнутой сплошной чертой, с собственным знаком, и подчеркнутой пунктиром — с обратным знаком.
22 ГЛ. Т ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ Перейдем к определителю треаьего порядка. В раскрытом виде он записан нами в формуле C). Нетрудно проверить, что его можно образовать следующим путем: выписываем таблицу, дающую опреде- определитель, и подписываем под нею еще раз первую и вторую строки. Будем иметь таблицу, содержащую шесть диагоналей, по три эле- элемента в каждой. Берем произведение элементов, стоящих на диагоналях, подчерк- подчеркнутых сплошной чертой, без изменения и на диагоналях, подчеркнутых пунктиром, — со знаком минус. Сумма этих шести произведений и дает определитель (правило Сарруса). Правило это не обобщается на определители более высокого порядка, и там приходится поступать иначе для сокращения вычислений. Полезно, например, пользоваться указанным в предыдущем номере свойством VI опре- определителя. Выясним это на примере. Возьмем определитель четвертого по- порядка 3 5 10 2 14 5 17 4 2 — 3511 Умножаем третью строчку на (—2) и складываем со второй; кроме того, умножаем эту же строчку на 3 и складываем с четверюй и вычитаем из первой. Таким образом, в силу упомянутого свойства, придем к определи- определителю, равному вышенаписанному, причем этот определитель будет иметь в первом столбце три нуля ? = 0 0 1 0 — 16 — 13 7 26 — 11 — 4 4 13 — 6 1 2 7
§ 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 23 Отсюда, разлагая по элементам первого столбца, согласно формуле A9), получим: — 16 —И —6 ?= —13 — 4 1 . 26 13 7 Умножаем третий столбец на 4 и складываем со вторым и затем умножаем его на 13 и складываем с первым. Получаем таким образом: — 94 —35 —6 О О 1 117 41 7 — 94 —35 117 41 = 94-41—35· 117 = — 241. 5. Примеры. I. Пусть требуется вычислить объем параллелепи- параллелепипеда, три ребра которого, выходящих из одной вершины, суть век- векторы А, В и С. Как известно [II, 117], искомый объем выражается скалярным произведением вектора А на векторное произведение (В X С): \/=А(ВХС). B4) При этом объем получается со знаком плюс, если векторы А, В, С дают ту же ориентировку, что координатные оси, и со знаком минус, если упомянутые ориентировки различны. Составляющие век- векторного произведения равны и таким образом скалярное произведение, входящее в формулу B4), будет: Ах (ВуС2 - В2Су) + Ау (BZCX - ВхСг) + А2 (ВхСу - ВуСх). Нетрудно видеть, что эта последняя сумма представляет собою опре- определитель третьего порядка, т. е. V = Ах Ау А, вх ву В, сх Су С. B5) Равенство нулю этого определителя будет нам показывать, что объем равен нулю, иначе говоря, что наши три вектора компланарны, т. е. находятся в одной плоскости. Если мы в определителе переставим две строки (столбца), например первую и вторую, то этим самым порядок векторов А, В, С заменится другим порядком В, А, С и если векторы в прежней последовательности давали ту же ориенти- ориентировку, что координатные оси, то теперь они будут давать уже иную ориентировку, и наоборот. В соответствии с этим величина опреде- определителя изменит знак. Если аналогичным образом в плоскости X У рассмотрим два вектора с соаавляющими (Ах, А^ и (Вх, By), то площадь парал-
24 ГЛ. Т. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [б лелограмма, построенного на этих двух векторах, будет равна опре- определителю второго порядка: Р = Вх Рассмотрим теперь треугольник, координаты вершин которого суть ^ (?? ух), Af2 (лг9, j/2), Берем векторы ? = ???% и В = УИ1М3 с составляющими: Уъ — У\)> МХМЪ ( МхМъ (?2 — xu y% — ух), МхМг (хг — хь уъ — ух)} и площадь нашего треугольника может быть выражена в виде: J Х% —— ?? Х$ ~~~ Х\ ?. 2 J>2 —У\ Уъ —У\ Нетрудно показать, что написанный определитель второго по- порядка можно заменить определителем третьего порядка и написать формулу в следующем виде: Р = У\ Уъ У* 1 1 1 Равенство нулю этого определителя дает условие того, что точки Mlf Мь Мг находятся на одной прямой. Иначе говоря, уравнение пря- прямой, проходящей через две заданные точки (хь у^ и (хь у%), может быть написано в виде: ? ?? х% У У! Уъ 1 1 1 = 0. II. Нетрудно - составить, пользуясь определителями, уравнения не- некоторых геометрических мест. Пусть, например, ищется уравнение окружности, проходящей через три заданные точки: (хь ух), {хь у%) и (лг3, _уз)· Легко видеть, что это уравнение запишется, при помощи определителя четвертого порядка, следующим образом: ? У 1 Уг 1 Уъ 1 Уг 1 B6) Действительно, разлагая по элементам первого столбца, убеж- убеждаемся, что написанное уравнение есть уравнение второй степени,
5] § 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 25 в котором коэффициенты при jc2 и у* одинаковы, и член с произве- произведением ху отсутствует, т. е. уравнению B6) соответствует окруж- окружность. Наконец, если мы в этом уравнении подставим x — xk и y=yk (/s=l, 2, 3), то первый столбец определителя будет совпадать с одним из следующих, и уравнение будет удовлетворено, т. е. ок- окружность действительно проходит через три данные точки. Заметим, что если три заданные точки находятся на одной прямой, то в урав- уравнении B6) коэффициент при (jc2 -f-у*) окажется равным нулю, и уравнению будет соответствовать не окружность, а прямая. Совершенно так же уравнение плоскости в пространстве с осями ОХ, О Y, OZ, проходящей через три заданные точки (хь уи ??), (лг2, у& ?%) и С^з» .Уз» *з)> может быть написано в виде определителя четвертого порядка: X Х\ Х% Х$ У У\ Уг Уг ? ?? ?? ?? 1111 = 0. B7) Если три заданные точки лежа1 на одной прямой, то уравне- уравнение B7) превратится в тождество 0 = 0. III. Рассмотрим определитель Dn порядка п, каждая строчка ко- которого сосюит из степеней некоторого числа, начиная с (п — 1)-й степени и до нулевой включительно: ? - 1 ??-2 1 ??~? ??~2 ?? ? B8) При ? = 1 и 2 будем иметь: Для раскрытия определителя D3 мы заменим в первой строчке этого определителя число хх буквой х. Получим определитель вида: 08 С*) = *3 ?\ хг ? ?* ?* 1 1 1 Разлагая его по элементам первой строки, видим, что Въ{х) есть полином второй степени от х. Если подставить в определитель jc = x2 или х = хъ, то первая строка станет одинаковой со второй или третьей, и величина определителя будет нуль, т. е. квадратный
26 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ^ трехчлен D^(x) имеет корни х% и хг и может быть представлен в виде: ?K (?) = Л3 (х — дг2) (х — хъ), где Л3 есть коэффициент при л:2, т. е. алгебраическое дополнение элемента х* определителя ?>3(лг), стоящего в левом верхнем углу. Отсюда следует А - т. е. Л3 есть определитель D2, составленный из чисел лг3 и .% Окон- Окончательно: Оъ (х) = (^2 — Хг) (х — ^0 (х — х*)- Подставляя x = xlt получим для ZK выражение в виде произведения трех множителей: Совершенно аналогично, имея выражение D3, можно получить выра- выражение для Dg. Оно будет иметь вид произведения шести множителей: Точно так же, при любом ? получим следующее выражение для определителя Dn, который обычно называется определителем Ван- дермонда: — ХЪ) . .. (Xj — Хп) Dn = B9) (??_! — ??) Написанное выражение имеет интересную связь с основным опре- определением определителя. Любой определитель порядка ? может быть записан в виде: Х\п Х\ /г-1 · · · Х\\ ХЪп Х<1 п-\ · · · ХЪ\ C0) Заменим в нем чисто формально каждый элемент xik на х\ \ После такой замены определитель C0) перейдет, очевидно, в определитель Вандермонда B8). Отсюда вытекает непосредственно следующее
5] § 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 27 правило образования суммы, дающей величину определителя C0): в выражении B9) открываем скобки и в каждом из полученных после этого членов заменяем xsk"~x на xks, причем, если такой член не содержит степени некоторого числа xk, то в соответствующем произведении надо добавить множитель х%> который после упомя- упомянутой замены перейдет в xkl. Заметим, что это последнее правило может быть принято за определение определителя. IV. Рассмотрим выражение, с которым нам придется иметь дело в последующем: \\-\-X #12 #13 · · · #1я а31 а>п\ C1) и разложим его по степеням буквы х. Для этого перепишем его предварительно в следующем виде: пц —?- X CL\% —? 0 iZj3 - п%2 +" X #23 " C2) + ° ^32 + X . . . Чп + 0 ... ann + x Каждый из столбцов этого определителя есть сумма двух сла- слагаемых, и, применяя несколько раз свойства IV определителя, мы представим его в виде суммы 2П определителей, столбцы которых уже не содержат сумм. Если во всех столбцах выражения C2) вы- вычеркнуть вторые слагаемые, то мы получим член, не содержащий буквы х, т. е. свободный член в разложении ? (?): ?? ?12 ... aln #21 #22 · · · #2/г C3) Наоборот, если вычеркнуть во всех столбцах первые слагаемые, то получится старший член полинома А(дг), равный х 0 0 ... 0 0 ? 0 ... 0 0 0 ? ... 0 0 0 0 ... *
28 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТВМ УРАВНЕНИЙ [5 Рассмотрим теперь средние члены полинома. Положим, что в столбцах с номерами рь рь ..., ps мы удерживаем вторые слагаемые, а в остальных столбцах — первые слагаемые. При этом каждый столбец с номером pk(k=l, 2, ..., s) будет состоять сплошь из нулей, кроме одного элемента, равного ? и стоящего на главной диагонали, т. е. на пересечении строки и столбца с одинаковым номером. Разлагая полученный определитель последовательно по элементам столбцов рь р2, ..., pS) мы от этих столбцов получим множитель Xs и должны будем вычеркнуть строки с номерами рь Ръ · · · 9 Ps и столбцы с такими же номерами. После каждого такого вычеркивания алгебраические дополнения соответствующего элемента будут равны в точности минорам, ввиду совпадения номера вычерки- вычеркиваемой строки и столбца. Итак, при любом выборе номеров столб- столбцов pk(k=l, 2,..., s) наш определитель будет содержать Xs с коэф- коэффициентом, равным определителю порядка (п — $), получаемому из основного определителя C3) вычеркиванием тех строк и столбцов, на пересечении которых сгоят элементы главной диагонали ар р у ар ро> · · · > ар ? · Обозначим этот определитель порядка (п — s) сим- символом ?? ? ... ? · Он называется обычно главным минором опрвде- р\р\ . · · pSs лителя ?, порядка (п — s). Выбирая числа рь рь ..., ps различным образом, получим в общем окончательный коэффициент при Xs в вы- выражении ? (?\ в виде суммы всевозможных главных миноров порядка \п — s), т. е. где Sk есть сумма всех главных миноров определителя ? порядка k и, в частности, Sn равно ?. Напишем явное выражение для коэф- коэффициента A, 2 , п) k "~~™" ? j ? ? · · · ? и ^~~" - ? ...ай . C4) Здесь суммирование распространяется на всевозможные комби- комбинации из k чисел ql9 qb qk, идущих в возрастающем порядке и взя- взятых среди чисел 1, 2, ..., п. Если бы мы стали суммировать в выражении C4) по каждому значку q} просто по всем значениям от 1 до п> то в перестановке qv qi} ,.., q$ целые числа шли бы
?] § ?. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 29 не только в возрастающем порядке, на и во всех других возможных порядках. Точнее говоря, всякая возрастающая последовательность при суммировании по всем qj от 1 до ? дала бы всего k\ переста- перестановок. Заметим теперь, что при перестановке каких-нибудь двух чи- чисел qi и <7; величина определителя, стоящего в формуле C4), не изме- изменится. Действительно, если мы переставим, например, qt и q%, то, тем самым, в упомянутом определителе переставятся первая и вторая строки и первый и второй столбец, что не повлияет на величину определителя. Таким образом из предыдущего следует, что если мы в выражении C4) будем суммировать по каждому из чисел qj просто от 1 до щ то каждое слагаемое суммы C4) повторится к\ раз, и, следовательно, мы можем написать выражение коэффициента Sk в виде: _ 1 V V У л —?? L L ··· L А 19\ а ft 4k Як C5) 6. Теорема об умножении определителей. В этом номере мы выведем формулу для произведения двух определителей одного и того же порядка. Пусть имеются два определителя порядка п: b = \aik\« C6,) (зад *» If. Составим новый определитель, элементы которого выражаются формулами: cik= ? aisbsk ft *=1, 2, ..., л) C7) и докажем, что этот определитель равен произведению определите- определителей C6i) и (Зб2). Начнем со случая ? = 2. Принимая во внимание формулы C7) и разлагая определитель на слагаемые, согласно свой- свойству IV из [3], получим: Сп СП «11*11 + «12*21 «11*12 + «12*22 «21*11 + «22*21 «21*12 + «22* «11*11 «12*22 «21*11 «22*22 Вынося одинаковые множители из элементов одного и того же столбца, мы получим в первом и чегверюм слагаемом определители L«i 2*22 Ь «22*22 «12*21 «22*21 «11*11 «21*11 «11*12 «21*12 «ц*12 «21*12 «12*21 «12*22 «22* 721 «22*22
30 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ с одинаковыми столбцами, равные нулю. Переставляя еще в одном из определителей столбцы, будем иметь: Си ? = b ,?. ?? ?2? паз ? 2^21 «11 «21 «12 «22 «12 «22 «11 «21 = = «11 «21 «12 «22 (bnbn «11 «21 — ? «12 «22 12*2?) = ^21 *22 что и требовалось доказать. В общем случае порядка ? после применения свойства IV из [3] будем иметь: ? «??^?,? C8) где переменные суммирования su % ... , sn принимают целые зна- значения 1, 2, ..., п. Слагаемые этой суммы могут быть записаны в виде: ··· bs at C9) Если среди чисел sh 52, ... , sn есть одинаковые, то написанный определитель имеет одинаковые сюлбцы, и соответствующее сла- слагаемое равно нулю. Таким образом, мы можем ограничиться рас- рассмотрением таких слагаемых, у которых среди чисел sk нет одина- одинаковых, и таким образом эта последова ? ельность чисел sh % ..., sn представляет собою некоторую перестановку из чисел 1, 2, ..., п. Умножим выражение C9) дважды на (—II*1' *2' '''' 5"], в результате чего оно, очевидно, не изменится, и это выражение можно перепи- переписать в виде произведения двух множителей: als ... als (-
б] 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 31 В первом множителе путем нескольких транспозиций перестановку Sj, % ... , sn приведем к виду 1, 2, ... , п. При каждой транспо- транспозиции величина (—])[?52 sn) и написанный определитель будут лишь менять знак, а весь первый множитель остается без изменения. Таким образом выражение C9) может быть переписано в виде: ап ап а21 аш ani а1п ... ап и, следовательно, возвращаясь к сумме C8), получим: | cik IJ = ? 2 (- II'1' *2 'я1 *V*V ' · где суммирование распространяется на все перестановки slf % ..., sn из чисел 1, 2, ... , п. Написанная сумма есть определитель Ах, т. е. |??·?|7 = ??1, чго и требовалось доказать. Формула C7) для cik сводится к следующему: элементы /-й строки определителя ? умножаются на соответствующие элементы ^-го столбца второго определителя, и эти произведения складываются. Мы знаем, что в определителе можно заменить строки столбцами, не меняя его величины. Следовательно, предыдущее правило умножения строки на столбец можно заменить тремя другими правилами: правилом строка на строку, столбец на столбец и столбец на строку. Формулируем окончательно теорему: пусть имеются два опре- определителя п-го порядка: Составляем новый определитель элементы которого вычисляются по одной из следующих формул: cik— D0,) D00
32 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ cik = Zi asibsk> cik — ? k = l,2, ... , ?). (? D03) D04) s=\ При этом величина определителя \ cik \ равна произведению определителей \ aik \ и \bik\. Пример. Наряду с основным определителем рассмотрим определитель, составленный из алгебраических дополне- дополнений его элементов Согласно приведенной выше теореме выразим произведение I aik I' I Aik I также в виде определителя, умножая строку на строку. Мы будем иметь для этого определителя следующие элементы; cik~ 5=1 В силу свойства V определителя мы получим: ?i* = 0 ПРИ 1фЬ\ сп = Ь9 т. е. ? 0 0 ... 0 0 ? 0 ... 0 0 0 ? ... 0 0 0 0 ... ? или = Ая, т. е. Считая ? отличным от нуля и сокращая на него, будем иметь: D1) Если элементы а^ = аЦ] таковы, что определитель ? равен нулю, то можно указать такие "значения аш сколь угодно близкие а[%\ при которых определитель ? отличен от нуля. Для этих значе- значений aik будем иметь формулу D1), а потому в пределе при aik-+a!jk эга формула будет иметь место и при aik = afk, т. е. эга формула имеет место и при ? = 0. Если выразить ?^? Aik через элементы aijb, то она представляет собою юждество относительно аш
7] § 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 33 7. Прямоугольные таблицы. В дальнейшем мы будем встре- встречаться и с такими таблицами чисел, в которых число строк и столб- столбцов может быть и неодинаково. Рассмотрим такую более общую таблицу: D2) ат\ ... ап Она содержит т сгрок и ? столбцов, причем числа тип могут быть или различны, или равны. Вычеркивая из этой таблицы неко- некоторые строки и столбцы так, чтобы число оставшихся строк и столбцов было одинаково, мы сможем из оставшихся сгрок и столб- столбцов составить определитель. Такие определители назовей определи- определителями, входящими в состав таблицы D2). Наивысший порядок, ко- который они могут иметь, равен, очевидно, наименьшему из двух чисел т й п, а наименьший порядок этих определителей равен единице, причем определители первого порядка суть сами элементы таб- таблицы D2). Положим, что все определители некоторого порядка /, входящие в таблицу, равны нулю. Нетрудно видеть, что тогда и все определители порядка (/-f-1), входящие в таблицу, также равны нулю. Действительно, всякий такой определитель порядка (/-)-1) можно представить в виде суммы произведений элементов его неко- некоторой строки на алгебраические дополнения этих элементов. Но последние с точностью до знака совпадают с некоторыми определи- определителями порядка / таблицы, и, следовательно, все равны нулю. Раз все определители порядка (/-(-1) равны нулю, то так же, как и выше, все определители порядка (/+2) также будут равны нулю и т. д. Итак, если все определители некоторого определенного по- порядка, входящие в таблицу D2), равны нулю, то и все определи- определители более высокого порядка этой таблицы также равны нулю. Введем важное для дальнейшего понятие о ранге таблицы, или, как говорят, матрицы D2). Рангом матрицы D2) называется наивысший порядок определителя этой таблицы, отличного от нуля, т. е. если ранг таблицы есть k, то среди определителей порядка k, входящих в эту таблицу, есть по крайней мере один, отличный от нуля, но все определители таблицы порядка (k-\-l) равны нулю. Пусть наряду с таблицей D2) имеется таблица ьп ьп ... ь1т ьп ьш ... ь2т ъп\ Ьпъ... Ьпт D3)
34 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [7 содержащая ? строк и т столбцов. Образуем т* чисел ? (/, ? = 1, 2, ... , m). D4) Квадратная таблица, составленная из чисел cik, называется обычно произведением прямоугольных таблиц D2) и D3). Докажем теорему, которая является обобщением теоремы об умножении определителей. Теорема. Если т^п, то ?/1 2 где суммирование распространяется на все значения rk из ряда, чисел 1, 2, ... , п, удовлетворяющие указанному неравенству. Если же т^>п, то определитель \cik\f равен нулю. Смысл символов /1 2 ... в Vi га ... rj \l 2 ... т указан в [3]. Второй из них обозначает определитель, составленный из элементов таблицы D3), принадлежащих строкам гь г2, ... , гт и столбцам 1, 2, ... , т. При т = ? сумма, входящая в формулу D5), содержит лишь одно слагаемое, соответствующее гг == 1, г2 = 2, ... , гт — т, и формула D5) выражает теорему об умножении определи- определителей. Рассмотрим случай т<^п. Доказательство формулы D5) будет аналогично доказательству теоремы об умножении определителей. Как и при этом доказательстве, мы имеем: I 2 ... т\ (f s)%,s,...Smr^^ D6) причем каждое из чисел sk может принимать значения 1, 2, ... , /г, и можно отбросить те слагаемые, у которых среди чисел sk есть равные, так как эти слагаемые равны нулю. Возьмем какую-либо определенную последовательность чисел rx <^ rf <\.. <[ гт из ряда чисел 1, 2, ... , ? и выделим из суммы D5) те слагаемые, у кото- которых совокупность чисел siy s2, ... , sm совпадает с совокупностью чисел г?, г2, ... , гт. Мы получим таким образом часть суммы D6): 2 ... т\ Чм,... Jvv···^ <47>
7] ? 1. ОПРЕДЕЛИТЕЛЬ И ЕГО СВОЙСТВА 35 где сумма распространяется на всевозможные перестановки (ti9 tb... , tm) из чисел ri9 гь ... , гт. Умножая каждое слагаемое суммы D7) дважды на (—l)lV's *т\ мы докажем совершенно так же, как и в [6], что эта сумма равна 1 2 ... т\/гхъ...гя i г* ... тт) \\ 2 ... т Чтобы получить всю сумму, входящую в формулу D6), достаточно просуммировать это произведение по всем ?? <^ г% <^ ... <^ гш, что и дает формулу D5). Положим, наконец, что т^>п. Мы можем при этом добавить к таблице D2) (т — п) столбцов, состоящих из нулей, а к таблице D3) — (т — п) строк, состоящих из нулей. Если после такого добавления мы будем вычислять cik не по формулам D4), а по формулам: т ?*=«? ***** & *=1, 2, ... , /и), D8) то получим прежние значения cik, так как добавленные слагае- слагаемые в правой части D8) равны нулю. С другой стороны, после указанного добавления таблицы D2) и D3) превратились в квадрат- квадратные таблицы, которым соответствуют определители, равные нулю, а потому, согласно теореме об умножении определителей, и опре- определитель | cik |f равен нулю, и теорема полностью доказана. Замечание. Если две прямоугольные таблицы имеют каждая т строк и ? столбцов, то, умножая строка на строку: получим определитель | cik \f, величина которого равна нулю при т^>п, а при т^п выражается формулой: ^, /1 2 ... т\ /1 2, ... т Следствие. Пусть имеются две квадратные таблицы порядка ? составленные из элементов aik и bik, а числа cik определяются фор- ??? Р^ · · · ??\ I определителя" | cik |f через миноры определителей |aiA|J и |&^|J. Нетрудно видеть
36 ГЛ. Т. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ что квадратная таблица, которая образует минор С является произведением прямоугольных таблиц: (Pi ?* Pi 4? up ? 'nq. ... ьп Применяя доказанную теорему, мы и получим искомое выражение: ? .·· ??\ Я\ qi qt D9) где rk принимают значения из ряда 1,2,..., я. Пусть RA, RB, Rc — ранги таблиц || alk ||J, || blk ||J и || с1Л ||J. Если, например, RA<^ny и будут, в силу определения /?л, равны нулю, а потому и все С * I равны нулю. Отсюда следует, что Rr<Cl> т. е. \Чх Я* ·.- Яг) С Rq^Ra- Если ранг таблицы ||а,^||" равен w, то, очевидно, Rc ^ /?л, ибо, Rc ^ /г. Совершенно аналогично Rc ^ /?5. В даль- дальнейшем мы покажем, что если определитель | blk |^ т^ 0, то /?с = /?л, а если |???|^0, то RC = RB. § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 8. Теорема Крамера. Установив понятие об определителе и вы- выяснив его основные свойства, мы переходим теперь к применению этого понятия к решению систем уразнений первой степени. Рас- Рассмотрим сначала основной случай, когда число уравнений совпадает с числом неизвестных. Мы можем записать такую систему, содер- содержащую ? уравнений и ? неизвестных, в виде: 0lV*l + ^12*2 + · · · + «?? = К «21*1 + ^22*2 + · · · + ^2 А — К A) причем обозначения коэффициентов такие же, какие мы ввели в [1] для случая трех уравнений с тремя неизвестными. Сделаем одно
8J § 2 РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 37 предположение, а именно будем считать, чго определитель системы, т. е. определитель, соответствующий таблице коэффициентов atk системы, отличен от нуля ? = |???|^0. B) Умножим обе части уравнений системы A) на алгебраические дополнения элементов k-ro столбца этого определителя, т. е. обе части первого уравнения системы умножим на Aik, второго на Агк и т. д. Полученные таким образом уравнения сложим. В результате мы придем к уравнению, в правой части которого стоит сумма а в левой части коэффициент при неизвестном xt выражается суммой Aik<*u + Ачьпц +... + Ankanl (/ = 1, 2, ... , ?). Эта последняя сумма равна нулю при 1фЫ и определителю ? при l=k, т. е. мы приходим к уравнению вида: ? . xk = Aikbt + ?? + · · · + Ankbn. Проделав это для каждого значка k, мы, как следствие уравне- уравнений A), получим систему новых уравнений Ь-хк = А1кЬ1 + АЬ1Ь* + ... + АякЬп (*=1> % ... > п). C) Нетрудно показать, что и, наоборот, из системы C), как следствие, получается система A). Действительно, умножим обе части уравне- уравнения C) на alk и просуммируем затем по всем k от 1 до п. Поль- Пользуясь опять свойством V определителя, мы придем, как нетрудно видеть, к уравнению ?. (???? + %*2 + -.. + ???*?) = ? · К D) что, после сокращения на множитель ?, отличный от нуля, даст нам уравнение с номером / системы A), причем мы можем это проде- проделать для любого /. Итак, системы A) и C) равносильны, и мы можем вместо системы A) решать систему C). Последняя система решается непосредственно и дает одно и только одно решение, вычисляемое по формулам ? Aikh + A2k&2 + ·-· + Ankbn (h 1 9 ? ,кч xk — д \ji—?, ?, ... , ny \p) Заметим, что в силу сказанного в [3] числитель написанного выражения представляет собою определитель, который получается из определителя ? заменой элементов &-го столбца, т. е. коэффи- циенюв aih при xk>* свободными членами bv Мы имеем таким обра- вом следующую теорему;
38 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИИ [9 Теорема Крамера. Если определитель ? системы A) от- лияен от нуля, то эта система имеет одно определенное реше- решение, Шражаемое формулами E). Согласно этим формулам каж- каждое из неизвестных выражается частным двух определителей, причем в знаменателе стоит определитель системы, а в числи- числителе — определитель, который из него получается заменой коэф- коэффициентов при определяемом неизвестном соответствующими свободными членами. При большом числе уравнений пользование теоремой Крамера неудобно, и существуют другие, приближенные, практические спо- способы решения систем многих уравнений со многими неизвестными, на чем мы останавливаться не будем. 9. Общий случай систем уравнений. Рассмотрим общий случай т уравнений с ? неизвестными: Х2 = а21хх + а22х2 +... Xk = — «?+?, i*i + ak+i, 2*2 + ·. · + <tk+i, (?) Для краткости в дальнейших выкладках мы обозначили через Xs всю левую часть уравнения с номером 5. Коэффициенты atk этой системы образуют прямоугольную таблицу, и пусть k — ее ранг. Переставляя строки и столбцы, т. е. переменяя нумерацию уравнений и неизвестных, мы можем достигнуть того, чтобы некоторый опре- определитель порядка /г, входящий в таблицу и отличный от нуля, стоял в левом верхнем углу. Назовем его главным определителем си- системы. Он будет иметь вид: ап ап а1к akl akk G) Составим {т — k) определителей порядка (k-\-l), которые назы- называются характеристическими определителями системы и которые получаются из главного определителя, если к нему добавить одну строку, состоящую из коэффициентов уравнений с номером, боль- большим чем k, и один столбец, состоящий из свободных членов. Уточ-
9] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 39 няя сказанное, определим эти характеристические определители сле- следующими формулами: #11 #12 · · · a\k akk (8) ... , т\ Если k = mf т. е. ранг равен числу уравнений, то характеристи- характеристических определителей вовсе не будет. Рассмотрим наряду с харак- характеристическими определителями другие определители, которые полу- получаются из них заменой в последнем столбце свободных членов левыми частями уравнений: #п ап alk akk (9) ak+s, 1 ak+s. 2 · · · ak+s, k Xk Эти последние определители, кроме заданных коэффициентов aik, содержат ху Но нетрудно показать, что определители (9) тожде- тождественно равны нулю. Действительно, элементы последнего столбца этих определителей в силу ?? = <*,?*? + апхг +... + ???*? состоят из ? слагаемых и, следовательно, всякий определитель (9) может быть представлен, согласно свойству IV из [3], в виде суммы членов следующей формы: ап ?21 aik #2/ ak\ akk ··*/· ak+s, 1 ak+s, 2 · · · ak+s, k ak+s, Легко убедиться, что определитель, стоящий множителем при ? ? равен нулю. Действительно, если J^k, то последний столбец эгого определителя совпадает с одним из предыдущих. Если же j^>ky то упомянутый определитель есть определитель порядка (&-J-1), вхо- входящий в таблицу E), и, следовательно, он равен нулю, так как по предположению * ранг этой таблицы равен k. Вычитая опреде- определители (9), равные тождественно нулю, из характеристических
40 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [9 определителей и пользуясь свойством IV определителей, мы можем представить характеристические определители в следующем виде: ап ап ... alk Ьх — Хх A0) ak+s, 1 ak+s, 2 4k *>k — *k , ... , m\ причем в этой форме они лишь по виду зависят от букв х^ Пред- Предположим теперь, что наша система F) имеет некоторое решение: Подставляя Ху = х1/} в последний столбец определителей A0), мы будем иметь в этом последнем столбце нули, т. е. все характе- характеристические определители должны равняться нулю. Теорема I. Для того чтобы система F) имела хоть одно решение, необходимо, чтобы все характеристические определи- определители (8) были равны нулю. Докажем теперь достаточность этого условия и дадим способ нахождения всех решений системы. Итак, предположим, что все ха- характеристические определители равны нулю. Возьмем их в форме A0) и разложим по элементам последнего столбца. Нетрудно видеть, что алгебраическое дополнение элемента (bk+s — Xk+s) будет равно главному определителю ?, отличному от нуля, и мы можем записать наше условие, что все характеристические определители равны нулю, в виде: где -**.*) = 0 (A + s = A+l, ? + 2, ..., т), A1) а^ — численные коэффициенты, не представляющие для нас никакого интереса. Положим теперь, что мы имеем какое-нибудь решение первых k уравнений системы, и подставим мысленно это решение вместо Xj в тождества A1). При этом все разности Ъх — Хь h — Xb ... , bk — Xk обратятся в нуль, и мы получим после указанной подстановки A.(&jm-***) = 0 или в силу ? ? 0: т. е. оказывается, что если все характеристические определители равны нулю, то всякое решение первых k уравнений системы будет
9] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 41 удовлетворять и всем следующим уравнениям, и нам остается в этом случае решить только первые k уравнений. Перенесем в этих уравнениях все неизвестные с номером, боль- большим k, в правую часть, после чего эти уравнения примут вид: ??? ~Ь апхъ ~Ь · · · 4~ aikxk = bi — аг kJ^xkJti —... — ?>\??? ^21*^1 —— CLofaXo^ —p~ ... —j— a^foXfo ??= ???j —- Q% foj±.\Xfoj^\ ... ^%nXn (\ O\ au\X\ —?— аиаХл —— . . . —— CLuuXu · Ou —— пи ЪллХЬлЛ · · · &bnXn· Будем рассматривать эти уравнения как систему для определе- определения хь х2, ... , хк. Ее определитель ? уже отличен от нуля, и мы можем получить для нее одно определенное решение согласно формуле Крамера. Заметим только, что свободные члены последней системы содержат буквы xk±v ... , хп, которым можно придавать любые значения. Из формул Крамера непосредственно вытекает, что решение системы A2) будет иметь вид: (у=1, 2, ... , А), A3) где as и ?? — некоторые численные коэффициенты и xfc+l9 ... , хп остаются произвольными. Из предыдущего вытекает, что эти фор- формулы и дают самое общее решение системы F) при сделанном предположении о равенстве нулю всех характеристических опреде- определителей. Теорема II. Если все характеристические определители системы равны нулю, то достаточно решить лишь те уравнения системы, которые содержат главный определитель относительно тех неизвестных, коэффициенты которых и составляют этот главный определитель. Это решение может быть произведено по формулам Крамера и дает выражение для k неизвестных (где k — ранг таблицы коэффициентов) в виде линейных функций A3) остальных (п — k) неизвестных, значения которых остаются со- совершенно произвольными. Таким образом получаются все решения системы F). Сравнивая теоремы I и II, приходим к выводу: Теорема III. Необходимым и достаточным условием суще- существования решений системы F) является равенство нулю всех характеристических определителей этой системы. Заметим, что если k — n> т. е. если ранг равен числу неизве- неизвестных, то формулы A3) вовсе не содержат в правых частях ? ? и все неизвестные от ?? до хп вполне* определяются. ? е о ре м а IV. Для того чтобы система имела одно опреде- определенное решение, необходимо и достаточно, чтобы все характе* диетические определители были равны нулю и чтобы ранг таб- таблицы ее коэффициентов был равен числу неизвестных.
42 ГЛ. 1. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [10 Заметим, что все предыдущие рассуждения годятся, очевидно, и для того случая, когда число уравнений равно числу неизвестных, т. е. когда т = п. Пример. Рассмотрим систему четырех уравнений с тремя неизвест- неизвестными д;_3у— 22 = — 1 2х-\- у — 42 = 3 х-\-Ау— 22= 4 5л: + 6у —102= 10. Напишем таблицу ее коэффициентов: 1—3—2 2 1—4 1 4 — 2 5 6—10 Нетрудно убедиться, что все определители третьего порядка, входящие в эту таблицу, равны нулю, и что определитель второго порядка, стоящий в левом верхнем углу, отличен от нуля. Таким образом его можно принять за главный определитель, и ранг системы равен двум. Составляем характе- характеристические определители. Их будет в данном случае два: 1 —3 —1 2 1 3 1 4 4 = 0; ?4 = 1 —3 —1 2 1 3 5 6 10 Оба они равны нулю, и, следовательно, данная система совместна. По- Поэтому достаточно решить первые два уравнения относительно ? и у, пере- перенося 2 направо: х — Зу = 2г — 1 2л:+ у = < Решение получится в виде: 122 — 1 —3 8 1 2 1 2 22—1 42 + 3 — 3 1 1 —3 2 1 причем 2 — произвольно. 10· Однородные системы. Система называется однородной, если в ней все свободные члены Ьг равны нулю. Если такая однородная система имеет характеристические определители, то их последний столбец состоит из нулей, и они все равны нулю. Совершенно оче- очевидно, что всякая однородная система имеет решение
10] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 43 которое в дальнейшем мы будем называть нулевым. Для однородной системы основным является вопрос о том, имеет ли она решения, отличные от нулевого, и если имеет, то какова будет совокупность всех таких решений. Рассмотрим сначала тот случай, когда число уравнений равно числу неизвестных. Система будет иметь вид: апх1 + апхъ + · · · + ????? = 0 = 0 апп*п = A4) Если определитель этой системы отличен от нуля, то, согласно теореме Крамера, эта система имеет одно определенное решение, а именно в данном случае нулевое решение. Если же этот определи- определитель равен нулю, то ранг k таблицы коэффициентов будет меньше числа неизвестных ? и, следовательно, значения (п — k) неизвестных останутся совершенно произвольными, и мы будем иметь бесчис- бесчисленное множество решений, отличных от нулевого. Мы приходим таким образом к следующей основной теореме: Теорема I. Для того чтобы система A4) имела решение, отличное от нулевого, необходимо и достаточно, чтобы ее опре- определитель равнялся нулю. Проведем параллель тех результатов, которые мы получили для неоднородной системы A) и однородной системы A4). Если опреде- определитель системы отличен от нуля, то неоднородная система A) имеет одно определенное решение, и однородная система — только нулевое решение. Если же определитель системы равен нулю, то однородная система A4) имеет решения, отличные от нулевого, но при этом условии неоднородная система A), вообще говоря, вовсе решения не имеет, ибо для того, чтобы она имела решение, необходимо, чтобы свободные ее члены были выбраны так, чтобы они обращали в нуль все характеристические определители. Приведенный параллелизм результатов будет играть в дальнейшем существенную роль. В воп- вопросах физики однородные системы встретятся при рассмотрении соб- собственных колебаний, а неоднородные — при рассмотрении вынужден- вынужденных колебаний, и указанный выше случай равенства нулю определи- определителя будет характеризовать для однородной системы наличие собственных колебаний, а для неоднородной системы — явление резонанса. Переходим теперь к более подробному рассмотрению решений системы A4), когда ее основной определитель равен нулю. Пусть k есть ранг таблицы ее коэффициентов, причем, очевидно, k<^n. Согласно доказанной в предыдущем номере теореме, мы должны взять те k уравнений, которые содержат главный определитель, и решить их относительно к неизвестных. Положим, не ограничивая
44 ГЛ I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [10 общности, что эти неизвестные будут хь ..., xh. Решения получатся в виде: С/=Ь 2, ..., k), A5) где ftq) — определенные численные коэффициенты и xk+li ..., хп могут принимать произвольные значения. Отметим одно общее свойство решения системы A4), непосред- непосредственно вытекающее из линейное!и и однородности этой системы, и которое может быть названо принципом наложения решений, а именно — если мы имеем несколько решений системы: х,=*р, xs=xf; xs=xf; .-; ¦*,=*?> (? = h % ···> ?), (??) то, умножая их на произвольные постоянные и складывая, мы по- получим также решение системы Xs = Clx{s) + C,xf) + Cbx[s) + ... + Clx(sl) E=1, 2, ..., ?). Поступая аналогично тому, как это мы делали для линейных дифференциальных уравнений [II, 27], назовем решения A6) линей- линейно-независимыми, если не существует никаких значений постоянных Q, среди которых есть отличные от нуля, таких, что при всяком s имеют место равенства: Нетрудно построить (п — К) линейно-независимых решений системы таких, что, умножая их на произвольные постоянные и складывая, получим все решения системы. Действительно, обратимся к формулам A5), дающим общее решение системы, и построим на основе этих формул решения следующим образом: в первом реше- решении положим xk+l=l, а все остальные xk+s равными нулю; во втором решении положим хй+а==1, а все остальные xk+s равными нулю и т. д. и, наконец, в последнем (п — К)-ж решении положим хп = 1 и все остальные xk+s равными нулю. Нетрудно видеть, что построенные решения линейно-независимы, так как каждое из них содержит одно из неизвестных равным единице, которое в остальных решениях равно нулю. Обозначим полученные решения следующим образом: Xs Xs , Xs Xs , · .., Xs Xs [S 1, z, . . ., ?). Возьмем теперь какое-нибудь решение системы A4). Оно полу- получается по формулам A5) при некоторых частных значениях:
11] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 45 Непосредственно очевидно, что это решение есть линейная ком- комбинация построенных нами решений, а именно: Мы вернемся к исследованию решений однородной системы A4) й покажем, что при любом выборе линейно-независимых решений их общее число будет равно (п — k). Обратимся к общему случаю т однородных уравнений с ? не- неизвестными. Если т<^пу то ранг k> который не может превы- превышать т, также будет меньше п, и (п — ?) неизвестных останутся произвольными, т. е. если число однородных уравнений меньше числа неизвестных, то система имеет решения, отличные от нулевого. Вообще 4</i и при k = n сиаема будет иметь только нулевое решение. 11. Линейные формы. С вопросом о решении систем уравнений первой степени тесно связано^ исследование систем линейных форм. Под линейной формой переменных xv хь ..., хп мы подразумеваем линейную однородную функцию этих переменных. Пусть имеются т таких линейных форм Уз = asixi + asiX* + · · · + я*/Лг (s = 1, 2, ..., т). A7) Написанные формы называются линейно-зависимыми, если существуют постоянные ?? ?2, ..., am, среди которых есть отличные о г нуля, такие, что имеет место, тождественно относительно переменных xlt хь ..., хп, соотношение: = 0. Если таких постоянных нет, то формы A7) называются линейно~не~ зависимыми. Мы должны в написанном тождестве приравнять нулю коэффициенты при всех переменных xv Таким образом написанное тождество равносильно следующей системе ? равенств: Формы ys линейно-независимы тогда и только тогда, когда эта система однородных уравнений относительно аХ) а2, ..., <хт имеет
46 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [11 только нулевое решение. Полученные выше результаты приводят к ряду следствий, касающихся линейной зависимости форм. Если т^>пу то написанная однородная система имеет наверно не нулевые решения, и формы линейно-зависимы. Для того чтобы формы были независимыми, необходимо и достаточно, чтобы ранг k таблицы коэф- коэффициентов apq был равен числу форм т. Если т = п, т. е. если число форм равно числу переменных, то для линейной независи- независимости необходимо и достаточно, чтобы определитель из всей квадратной (т = п) таблицы apq был отличен от нуля, В этом случае говорят, что имеется полная система линейно-независимых форм. Если m^in и формы A7) линейно-независимы (т. е. если k = m), то при любых значениях ys система уравнений A7) разре- разрешима относительно тех переменных xv коэффициенты при которых образуют определитель порядка k, отличный от нуля, т. е. линейно- независимые формы могут принимать любую совокупность зна- значений ys. Если k = m — n, ю при заданных ys определятся все переменные xv Положим теперь, что k<^m. Соответственно нумеруя формы ys и переменные xv можем считать, что в таблице apq в левом верхнем углу стоит определитель порядка ky отличный от нуля. При этом первые k форм: уь уь ..., Уи линейно-независимы, а каждая из остальных форм yk+t выражается линейно через первые k форм. Действительно, для первых k форм ранг таблицы коэффициентов, равный ky совпадает с числом форм, а потому формы линейно неза- независимы. Если мы возьмем (k-\-l) форму уь уь ..., yh, уш, то ранг их таблицы коэффициентов, равный тоже k, меньше числа форм, так что формы линейно зависимы, т. е. существуют постоян- постоянные ?5 такие, что $хух -f-... -f- %Ун ~h ??+??+? = 0· В этом соотно- соотношении коэффициент ?? должен быть отличным от нуля, так как иначе формы уь уь ..., yk оказались бы линейно-зависимыми, и мы получаем линейное выражение yk+l через первые k формТ Число k мы назовем рангом системы форм A7). Это число, равное рангу таблицы коэффициентов, с другой стороны — равно наиболь- наибольшему числу линейно-независимых форм из системы форм A7). Положим, мы имеем k линейно-независимых форм: уь j/2, ..., yk, где k<^n. Можно считать, что определюель порядка А, стоящий в верхнем левом углу таблицы apq, отличен от нуля. Нетрудно видеть, что можно дополнить систему этих k форм до полной системы ? линейно-независимых форм. Действительно, достаточно для этого положить, например:
12] § 2 РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 47 Определитель полученных k форм будек ?2? 0 0 «12 · an · 0 . 0 . .. alk ¦. *ад .. 0 .. 0 "?; 1 0 fe+l * Ц ? J * ?+1 * 0 . 1 . .. aln .. a,n .. 0 .. 0 0 0 0 0 0 1 Разлагая этот определитель, начиная с элементов последней строки, потом по элементам предпоследней строки и т. д., видим, что его величина равна определителю порядка k, стоящему в левом верхнем углу, т. е. отлична от нуля. Следовательно, формы уь уь ..., упУ действительно, линейно независимы. Итак, всякую систему линейно- независимых форм можно дополнить до полной системы линейно- независимых форм. 12. /t-мерное векторное пространство. Мы дадим полученным выше результатам геометрическую формулировку, которой будем пользоваться в дальнейшем. Для этого введем понятия о векторе в л-мерном пространстве, а именно назовем таким вектором сово- совокупность ? чисел (комплексных), идущих в определенном порядке. Таким образом всякий такой вектор ? характеризуется после- последовательностью ? комплексных чисел, которые называются со- составляющими этого вектора: х{хь хъ ..., хп). Совокупность всех таких векторов образует ?-мерное векторное простран- пространство Rn. Два вектора считаются равными тогда и только тогда, когда все их составляющие одинаковы, т. е. если имеются два вектора и (иь щ, ..., ип) и ? (?? ·?2, ..., ??), то векторное равенство и = ю равносильно следующим ? скалярным равенствам: ul==vl; щ = t;2; ...; ип = vn. Определим операцию — умножение вектора на число и сложение векторов. По определению умножение вектора на число сводится к умножению всех хоставляющих вектора на это число, т. е. если вектор ? имеет составляющие (xiy jc2, ..., хп), то вектор kx имеет составляющие (kxif kx^ ..., kxn). Сложение век- векторов сводится к сложению составляющих, т. е., если имеются век- векторы х{х\у лг2, ..., хп) и у{у\, уъ --->Уп)> то, по определению, сумма х-{-у имеет составляющие (x\-\-yv х*-{-уь ···> Хп^гУп)- Нулевым вектором называется вектор @, 0, ..., 0), у которого все составляющие равны нулю. Обозначим этот вектор символом ?. Мы имеем, очевидно, Ь = 0х, где ? — любой вектор, и х-\-Ъ = х.
48 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [12 Вычитание векторов определяется так: вектор ?—у имеет составляю- составляющие (хх—ух> х%—у%> ..., хп—уп). Мы имеем, очевидно, ? — х = Ь и ?—у = х-\-(—1)д>, т. е. вычитание вектора j; равносильно сло- сложению с вектором у у умноженным на число (— 1). В дальнейшем нам придется часто писать векторные равенства. Всякое такое ра- равенство равносильно ? скалярным равенствам, выражающим тот факт, что соответствующие составляющие обеих частей равенства одинаковы. В дальнейшем мы не будем пользоваться символом ? для нулевого вектора, но надо помнить, что если в векторном ра- равенстве с одной стороны стоит нуль, то этот нуль надо понимать как нулевой вектор. Из данных выше определений непосредственно вытекают обычные свойства сложения и умножения: ? = kxx -f- k%X] k (x -\-y) = kx~{- ky\ kx (k%x) = (k^) x. В сумме векторов с любым числом слагаемых можно, таким образом, переставлять слагаемые и заключать их в группы. Из равенства х -\-у = ? следует ? — ? —у и y=^z — ? и, наоборот, из ? —у = ? следует x=y-\-z. Введем теперь понятие о линейной зависимости и независимости векторов. Векторы *-A) у.B) r(l) ()Q\ будем называть линейно-зависимыми, если существуют такие посто- постоянные Q, ..., Q, не все равные нулю, что Если таких постоянных не существует, то будем называть век- векторы A8) линейно-независимыми. Обозначим составляющие векто- векторов д;(У) через (х^\ х^\ ..., ??). Условие A9), очевидно, равно- равносильно системе ? уравнений с неизвестными Q, С2, ...» Q: Х{1)С -\-х(<2)С 4- -\-хA)С =0 A)-, ? B)^, |^ \ d)n ? хъ 4t^2 ^e-f ···-!-·*« W—и» I B0) ?? ^? "? ?? ^a "?" · · · ? ?? ^? — ?· Пользуясь полученными выше результатами для однородной си- системы, нетрудно вывести из них ряд следствий и придать этим результатам 1еометрическую формулировку. Положим сначала, что 1^>п, т. е. что число векторов больше числа измерений пространства. При этом в однородной системе B0) число уравнений будет меньше числа неизвестных, и эта система, как мы знаем, наверно будет иметь для неизвестных С; решения, отличные от нулевого, т. е. наши векторы будут наверно линейно-зависимыми. Иначе говоря,
12] §2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 49 число линейно-независимых векторов, самое большее, равно числу измерений пространства. Рассмотрим теперь случай ?=?. При этом система B0) будет содержать одинаковое число уравнений я неизвестных и будет иметь решения, отличные от нулевого, тогда и только тогда, когда ее определитель равен нулю, т. е. если в л-мер- ном пространстве мы имеем ? векторов, и составим из /г2 составляю- составляющих этих векторов определитель, помещая, например, составляющие каждого вектора в определенном столбце и считая номер строки совпадающим с номером составляющей, то для линейной независи- независимости векторов необходимо и достаточно, чтобы этот определитель был отличен от нуля. Величина этого определителя имеет аналог с объемом параллелепипеда в вещественном трехмерном пространстве. Мы можем в любом определителе | bik | порядка ? рассматривать элементы каждого столбца (bik, bik> ..,, bnk) как составляющие неко- некоторого вектора b^k\ и при этом величина определителя будет функ- функцией ? векторов 6A), ..., Ь^п\ Равенство нулю этого определителя будет равносильно тому факту, что эти векторы линейно-зависимы. Обозначим величину определителя как функцию векторов ^k) через Вспоминая, что при перестановке двух столбцов величина опре- определителя меняет знак, мы можем утверждать, что функция ? изме- изменит лишь знак, если поменять местами ее два аргумента. Такая функция называется обычно антисимметрической. Нетрудно видеть, например, что определитель Вандермонда Dn, который мы рассматри- рассматривали в [5], есть также антисимметрическая функция своих аргумен- аргументов хь ..., хп. Вернемся к рассмотрению системы B0) и к вопросу о линейной независимости векторов jcA), ..., ?^?\ предполагая ?^?. Обозначим через k ранг таблицы, образованной составляющими xpq\ Если k = [t то, как мы видели, система имеет только нулевое решение, т. е. векторы линейно-независимы. Если же k<^lt то система будет на- наверно иметь решение, отличное от нулевого, т. е. для линейной независимости векторов необходимо и достаточно, чтобы их число равнялось рангу таблицы, образованной их составляющими. Положим теперь, что k<^l, т. е. что векторы линейно-зависимы. Выделим из них те k векторов (возможно, что это можно будет сделать несколькими способами), составляющие которых содержат определитель порядка k, отличный от нуля. Согласно доказанному выше, эти векторы линейно-независимы. Нетрудно видеть, что каж- каждый из остальных векторов может быть выражен линейно через выделенные векторы. Действительно, пусть х^1\ ..., х^ — линей- линейно-независимые вектЪры. Присоединяя к ним какой-нибудь вектор (*+*)9 получим (?+1) векторов, которые будут линейно зависимы,
50 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [12 так как ранг k таблицы их составляющих меньше их числа l=k-\- L Итак, будут существовать постоянные Q(/=l, 2,..., kt k-\-s)> среди которых есть отличные от нуля, такие, что ) = 0. При эк>м наверно Ck+S ? 0, ибо, в противном случае, векторы &\ ..., ?№ оказались бы линейно-зависимы. Из написанного равенства следует: т. e. x(k+s) выражается линейно через д:A), х(*\ ..., x{k). Пусть jcA), ?(*\ ..., ?^?) — ? каких-нибудь линейно-независимых векторов. В качестве примера таких векторов мы можем указать векторы: A, 0, 0, ..., 0); @, 1, 0, ...,0); ...; @,0, 0, ..., 1). B1) Если мы возьмем какой угодно вектор лг, то (п-\-\) векторов х^\ ^\ ..., х^п\ дг, как мы видели выше, наверно линейно-зависимы: причем постоянная С наверно отлична от нуля, ибо в противном случае векторы х^\ х^\ ..., л^л) оказались бы линейно-зависимы. Из предыдущего следует, что любой вектор ? выражается через ? линейно-независимых векторов: Нетрудно видеть, что существует лишь одно определенное выра- выражение ? через х^\ х^\ ..., х^п). Действительно, если бы, кроме написанного выражения, существовало еще одно выражение: в котором есть коэффициенты ?5, отличные от соответствующих as, то, вычитая два написанных соотношения почленно, мы получили бы: («? - ??) *A) + («Ч - fo) XW + · · ¦ + К ~ PJ *(л) = 0, т. е. векторы jcA), x^\ ..., х^п) оказались бы линейно-зависимыми. Если за векторы jcA), jcB), ..., jc(/2) принять векторы B1), то числа as формулы B2) будут, очевидно, совпадать с составляющими xs век- вектора x(xlf x2, ..., хп). В общем случае их можно назвать также составляющими вектора х, если jcA), x^\ ..., х^п) приняты за орты. Придавая числам а5 всевозможные комплексные значения, получим все векторы нашего /г-мерного пространства. Положим теперь, что мы имеем k линейно-независимых векторов ??, *<«, ..., x^k\ B3) причем k<^n. Говорят, что совокупность векторов, получаемых по формуле у = СххЫ + С,х^ + ... + Ckx^k\ B30
12] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 51 где Cs—произвольные постоянные, образует некоторое подпростран- подпространство Lk измерения k. Как и выше, можно показать, что всякий вектор, принадлежащий Lk, единственным образом выражается через jcA), x^\ ..., х{к\ Говорят иначе, что векторы B3) образуют под- подпространство Lk. Заметим, что если какой-нибудь вектор ? принадлежит L& т. е. выражается формулой вида B3t), то вектор cz, где с — любая по- постоянная, также выражается, очевидно, формулой вида B3j), т. е. также принадлежит Lk. Точно так же, если 2A) и z^ принадлежат Lk, то их сумма ?A)-f-?(a) также принадлежит Lk. Отсюда непосред- непосредственно следует и более общее свойство: если некоторые век- векторы ?^\ ?B), ..., ?^?) принадлежат Lk, то их любая линейная комбинация ??«^A)+?2^B)+ ·-· + ??0(?) также принадлежит Lk. Возьмем т каких-нибудь векторов, принадлежащих Lk: У > = c[s)xW + C[s)xW +... + C{ks)x[k) (s = 1, 2, ..., m). B4) В силу линейной независимости векторов B3) соотношение вида «1У1)+«2Уа) + ...+«тУт)==о равносильно системе k однородных уравнений ^-Ua,cf-\-... + *mdqm) = 0 (?=1, 2, ..., ft). Если эта система имеет решения, отличные от нулевого, то векторы B4) линейно-зависимы. В частности, если m^>k, то наверно имеются решения, отличные от нулевого, т. е. всякая совокупность векторов числом больше k из подпространства, образованного векторами B3), будет совокупностью линейно-зависимых векторов. Отсюда непосред- непосредственно следует, что подпространство, образованное линейно-неза- линейно-независимыми векторами B3), не может быть образовано никакой сово- совокупностью линейно-независимых векторов ?^?\ ..., ?^?\ число кото- которых l<^k. Действительно, согласно вышеуказанному, в таком подпространстве не может существовать больше, чем /, линейно- независимых векторов, а с другой стороны, этому'подпространству должны принадлежать линейно-независимые векторы B3), число ко- которых k больше /. Если мы возьмем k каких-нибудь линейно-не- линейно-независимых векторов и^\ и^\ ..., u{k\ принадлежащих Lk, то они образуют, в указанном выше смысле, это же подпространство Lk. Действительно, в силу определения подпространства всякая ли- линейная комбинация принадлежит Lk. С другой стороны, возьмем какой-нибудь вектор у из Lk. Векторы #A\ ..., uSk\ у, числом (k-\-l), принадлежат Lk и, по предыдущему, должны быть линейно-зависимыми и, поскольку и^\ ¦.., и^ — линейно-независимы, коэффициент ?
62 ГЛ. Т. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [12 должен быгь отличным от нуля, т. е. всякий вектор у из Lk выражается через и^\ ..., и^к\ т. е. эти последние векторы дей- действительно образуют Lk. Если в формулах B4) m = k и определитель из коэффициентов С^ отличен от нуля, то векторы у^\ ..., у^ будут линейно-независимыми векторами из Lk, В общем случае не- нетрудно показать, что число линейно-независимых векторов, даваемых формулами B4), равно рангу таблицы С[р\ Выше мы видели, что если вектор ? принадлежит некоторому подпространству I, то вектор cz при любом постоянном с также принадлежит I, и если ?A) и гB) принадлежат L, то (гA) -\-zw) также принадлежат L. Мы могли бы дать новое определение под- подпространства, а именно назвать подпространством такую совокуп- совокупность векторов, чго если ? принадлежит L, то и с ? принадлежит L> и если г^ и z^ принадлежат I, то (z^ -\~ z^) также принадлежит L, Отсюда непосредственно следует, что всякая линейная комбинация векторов, принадлежащих L, также принадлежит L. Мы только что видели, что из прежнего определения подпространства вытекают, как следствие, те свойства, которые сформулированы в новом определе- определении. Покажем и наоборот, что из нового определения вытекает преж- прежнее, т. е. что эти два определения равносильны. Возьмем некоторый вектор jcA), принадлежащий L. По опреде- определению подпространства L векторы Схх{1\ при произвольном Си также принадлежат L Если этими векторами исчерпывается всё L> то мы имеем Lx в прежнем смысле. В противном случае в L входит некоторый вектор х^\ линейно-независимый с х^\ и векторы С\Х^ -\- С^х^\ при произвольных Q и С2, принадлежат L. Если этими векторами исчерпывается всё L, то L совпадает с некото- некоторым L2 в прежнем смысле. В противном случае в L входит некото- некоторый вектор л:C) такой, что хA), д:B), jcC) линейно-независимы. Продолжая так и дальше, мы, путем присоединения конечного числа линейно-независимых векторов x^s\ исчерпаем всё L, так как не существует более ? линейно-независимых векторов. Общее число к этих веюоров x^s) дает нам измерение подпространства L. Если окажется, что k = nf то L совпадает со всем я-мерным пространством. Отметим одно обстоятельство, связанное с образованием подпро- подпространства. Положим, что векторы х^1\ лсB), ..., х^к)—линейно- зависимы. При этом по-прежнему говорят, что формула B3j) опре- определяет некоторое подпространство L. Положим, что среди указанных векторов первые /: х^\ х^\ ..., х^ — линейно-независимы, а каждый из следующих векторов: Х^1\ ..., х^ выражается ли- линейно через первые /. При этом совокупность векторов, определяемых формулой B3^, будет, очевидно, совпадать с совокупностью век- векторов, определяемых формулой: у =
13] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 53 т. * е. подпространство L, образуемое линейно-зависимыми векто- векторами д:A), х{%\ ..., x{k\ имеет размерность /(/<?). Рассмотрим вещественное трехмерное пространство и условимся откладывать векторы от некоторой определенной точки О (начало)* В данном случае л = 3. При k=l подпространство Lt есть неко- некоторая прямая, проходящая через О, a Z,3 есть некоторая плоскость, проходящая через О. 13. Скалярное произведение. Условимся относительно одного обозначения. Если ? — некоторое комплексное число, то символом at будем обозначать число, сопряженное с а, и символом | а | — модуль числа а, так что ??=|?|2. Если ? вещественно, то ? = ? и |?|2 = ?2. Введем теперь новое понятие, которое в дальнейшем будет играть большую роль. Определение. Скалярным произведением двух векторов x(xlf хь ..., хп) и у(у19 у* ..., уп) называется число, равное следующей сумме; 5=1 Мы будем обозначать скалярное произведение символом (дг, у). Имеем: ? ? (*> у) = ? хвУ$\ (у>х) = ? л** откуда следует (у, ?) = (?, у). Назовем два вектора взаимно перпендикулярными или взаимна ортогональными, если их скалярное произведение равно нулю. Поскольку число, сопряженное с нулем, есть также нуль, в условии ортогональности порядок векторов в скалярном произведении роли не играет. Нетрудно видеть, что нулевой вектор @, 0, ..., 0) орто- ортогонален к любому вектору ? Из определения скалярного произведения непосредственно выте- вытекают следующие его свойства: (оа:, у) = ? (?, у); (xt ay) = ? (?, у), где ? — численный множитель. Кроме того: {х+У, -гг) = (at, ar) + Cv, ?); (х9 y + z) = (x9 y) + (x, ?), и этот распределительный закон имеет место для любого числа слагаемых. Из него следует, между прочим: (х+У, ? + ?) = {?, и) + (х, v) + (y9 и) + {у, ?).
54 ГЛ. Т. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [13 Составим скалярное произведение вектора ?(?? хь ..., хп) на этот же вектор: Мы получаем таким образом вещественное число, которое будет поло- положительным для вектора х, отличного от нулевого вектора @, 0,..., 0), и равным нулю для нулевого вектора. Корень квадратный (арифме- (арифметическое значение) из вещественного числа (х> х) называется нормой или длиной вектора X. Обозначая эту норму символом \\x\\, можем написать: ? ii — \?> x) — 2j I Г ? 1 ??(? v\ l/ V I ? s=l Равенство ||jc|| = O равносильно тому, что х есть нулевой вектор. Положим, что имеются три взаимно перпендикулярных вектора х, у и ?, т. е. (X, у) = 0; (Ху *) = 0; (у, ?) = 0. Применяя распределительный закон для скалярного произведения и принимая во внимание написанные равенства, получим: или Эта формула выражает теорему Пифагора. Она справедлива для любого числа слагаемых. Существенно лишь, что эти слагаемые векторы попарно ортогональны. Покажем, что если векторы х^1\ х^\ ..., х^1) попарно ортогональны и среди них нет нулевого вектора, то они линейно независимы. Действительно, положим и покажем, что все числа Cs должны равняться нулю. Умножим обе части этого равенства скалярно на х^к\ где k — одно из чисел 1,2,...,/: ^ Cs (*<*>, *<*>) = 0. В силу того, что векторы х^ попарно ортогональны, (&s\ x^) = 0 при 5 ? ky так что последняя формула дает: Ck(x^k\ jci/f)) = O, т. е. Ck\\x{k) ||2 = 0, откуда, в силу \\х^ ||2>0, следует Сн = 0, и это при любом выборе k.
14] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 55 14. Геометрическая интерпретация однородных систем. Рас* смотрим однородную систему апхх + апхъ + · · · + ??? = ° = О B5) Введем векторы: ?A)(<*??> «?* ···> йш); ·..; ?{?)(???> o-пь ..·> йпп). B6) При этом система B5) может быть записана в-следующем сжатом виде: (jc, аA)) = 0; ...; (х} а(л)) = 0, B7) т. е. дело сводится к нахождению вектора х, перпендикулярного ко всем векторам а(/). Если определитель \aik\ отличен от нуля, то, оче- очевидно, и определитель | aik |, с ним сопряженный по величине, также отличен от нуля. В этом случае векторы а^ линейно-независимы, и система B7) имеет только нулевое решение, т. е. не существует век- вектора (кроме нуля), который был бы одновременно перпендикулярен к ? линейно-независимым векторам (в /z-мерном пространстве). Рассмотрим теперь другой случай, когда определитель системы B5) равен нулю. Положим, что ранг системы будет k. Если составить таблицу из сопряженных элементов, то входящие в нее определители будут по величине сопряженными с определителями, входящими в таблицу аш и ранг сопряженной таблицы будет также очевидно k. Таким образом, по доказанному выше, среди векторов а(;) будет k линейно-независимых, а остальные векторы будут их линейными комбинациями. Не ограничивая общности, можем считать, что эти линейно-независимые векторы суть > ...» «v > \*oj а для остальных будем иметь выражения вида: ?(?+5)===?(?+«)?(?)-|-...-|-?(*4-^?(?) (?-|-s = ?-}-I, k-\-2, ..., ?), где ?(?) — численные коэффициенты. Из последнего непосредственна следует, что если ? перпендикулярен векторам B8), то тем самым он будет перпендикулярен и ко всем векторам aSJ\ Действительно; и вся сумма равна нулю, так как каждое из отдельных слагаемых по условию обращается в нуль. Итак, достаточно решить первые k уравнений системы» Считая, как всегда, что определитель порядка А,
56 гл· ?· ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ ? 4 отличный от нуля, стоит в левом верхнем углу, для искомого векто- вектора ? мы получим (п — к) линейно-независимых решений лгA),..., x^n~k) тем способом, который был указан в [12], и всякое решение будет представлять собою линейную комбинацию этих (п — k) векторов. Можно сказать, что в данном случае векторы, определяемые формулой где Ci — произвольные постоянные, образуют пространство Lk изме- измерения к, которое является подпространством для всего пространства ? измерений. Совершенно так же найденные векторы je*1), х^2\ ..., л^(л~«) образуют некоторое подпространство Mn_k измерения (п — Щ. Подпространство Mn_k ортогонально подпространству Lk в том смысле, что всякий вектор из Mn_k ортогонален всякому вектору из Lk (и, очевидно, наоборот). Подпространство Mn_k состоит из векторов, которые удовлетворяют системе B7), т. е. ортогональны oSl\ а^К ..., aSk\ Нетрудно видеть, что ? векторов а^\ ..., aSk\ jcA), ,.., x^n~k) — линейно-независимы. Действительно, положим, что между ними существует соотношение: ^) = 0. B9) Первая скобка дает некоторый вектор а из Lk, а вторая — некото- некоторый вектор ? из Mn_ki и мы имеем a-f-je = O или а = — х. Но векторы а и ? взаимно-ортогональны, т. е. оказывается, что век- вектор а ортогонален сам себе, иначе говоря (а, а) = 0 или ||а||—0, откуда следует, что вектор а есть нулевой вектор; то же можно сказать и о векторе х. Итак: = 0 и Но векторы аA\ ...» а^к\ по условию, линейно-независимы, и, следо- следовательно, все постоянные cs должны быть равны нулю; то же можно утверждать и относительно ds. Итак, в соотношении B9) все коэф- коэффициенты должны быть равны нулю, т. е. векторы аA), ..., а(А>, jcA), ..., x(n~k) действительно линейно-независимы. Всяки^ вектор ? единственным образом может быть представлен в виде: *=(???<» + · · ·+?*«(*') + (?^A) 4- · · · + W("-ft)). причем первая скобка дает вектор, принадлежащий Lk, а вторая — вектор, принадлежащий Mn_k. Векторы, входящие в состав Мп__& суть, как мы уже упоминали, всевозможные решения системы B7), и таким образом при любом выборе полной системы линейно-неза- линейно-независимых решений число таких решений будет равно (п — k)t т. е. числу измерений Mn_k. Приведенное выше исследование однородной -системы приводит нас к следующему важному результату: Если имеется подпространство Lk измерения k{k<^ri), то яекторы, ортогональные к этому подпространству, образуют
15] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 57 подпространство Mn_k измерения (п — /г), и всякий вектор ? из R^ может быть представлен в виде суммы x—y-\-z, где у принад- принадлежит Lk и ? принадлежит Mn_k. Покажем, что такое представление единственно. Пусть, кроме указанного представления, имеется еще одно: x — u-\-v, где и из Lk и ? — из Mn_k. Надо доказать, что и =у и v = z. Мы имеем: у -\- ? ==· = u-\-*v, откуда у — u = v — ?. Разность у — и принадлежит 1Л> а разность ? — ? принадлежит Mn_k> откуда следует, что вектор у — и ортогонален сам себе, т. е. (у — я,у — и) = О или \\у — и || = 0г откуда у — и = 0 и у = и. При этом из у— и = <о — ? следует, что ? —?. Вектор у, входящий в представление x—y~\-z, назы- называется проекцией ? в подпространство Lk. В указанном представление векторы 37 и ? ортогональны, и теорема Пифагора дает: ||jc ||2 = = II.У ?!2~?|? II2' откуда следует, что ||,у ||^||# ||, причем знак равен- равенства имеет место в том и только в том случае, когда ? есть нулевой: вектор, т. е. когда ? принадлежит Lk, так что у = х. Аналогично \\z || ^ || ? ||, и знак равенства имеет место только в том случае» когда ? ортогонально Lk> т. е. z = x. Подпространства Lk и Мп_ь называются, обычно, дополнительными ортогональными подпро- подпространствами. Если k — n> то Ln есть все Rn, а Мо сводится к одному нулевому вектору. Положим, что мы имеем вещественное трехмерное пространство», о котором мы говорили выше, и пусть k = 2, так что ? — k = =3 — 2=1. Подпространство 12 есть некоторая плоскость Р, про- проходящая через точку О, a Mv есть прямая, проходящая через О и перпендикулярная Р. Всякий вектор может быть единственным образом представлен как сумма двух векторов, из которых один лежит в плоскости Р, а другой — на прямой К- Мы провели гео- геометрическую интерпретацию решения однородной системы в tow случае, когда число уравнений равно числу неизвестных. Совершенно так же можно провести рассуждения и в общем случае, когда число векторов а^ не обязательно равно числу п. Аналогичное замечание относится и к следующему номеру. 15· Случай неоднородной системы. Рассмотрим неоднородную систему: | C0) • ап&хЪ 4" · · · "f" аппхп = Ьп> Ее можно толковать как задачу нахождения вектора x(xit ..., хпу при заданных векторах B6) из системы (*, aW) = bx; ...; (jc, a{n)) = bn. C1)
58 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [15 Если определитель системы отличен от нуля, то теорема Крамера дает один определенный ответ. Положим, что определитель системы равен нулю и ранг таблицы ее коэффициентов равен ky причем опре- определитель порядка k, отличный от нуля, стоит, как всегда, в левом верхнем углу. Наряду с системой C0) напишем систему однородных уравнений, коэффициенты которых получаются из коэффициентов данной системы заменой строк столбцами и всех чисел — сопряжен- сопряженными. Эта новая система будет, таким образом, иметь вид: = 0 C2) *\пУ\ + ЪъпУг + · · · + аппУп = 0. Таблица ее коэффициентов по-прежнему имеет ранг k, и опреде- определитель &-го порядка, стоящий в левом верхнем углу, по-прежнему отличен от нуля. Назовем эту однородную систему союзной с си- системой C0). Как мы видели выше, ее общее решение есть линейная комбинация (п — k) решений (векторов), которые можно получить, например, если решить по теореме Крамера первые k уравнений относительно yl9..., yk> полагая остальные yk+s равными нулю, кроме одного, которое надо считать равным единице. Мы придем таким путем при уш = 1 к системе: . + akkyk = — uk+ltk. Решая эту систему и переходя к сопряженным величинам, получим: ?= дг - (/??=1, 2, .,., «) C3) где и ?^ получается из ?' заменой элементов т-то столбца на ak+li ..., ak+i k· Составим условие перпендикулярности вектора b с составляю- составляющими (bv ..., bn) с вектором у, полученным только что при решении системы C2)
15] ИЛИ § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 59 C4) Заменяя в определителе ?^ строки столбцами и переставляя затем т-ю строку на последнее место при помощи (k — т) перестановок последних строк, получим: «11 «12 * * * «lft (-I)*' * Это есть как раз алгебраическое дополнение элемента Ьт в ха- характеристическом определителе: «и akk и условие C4) выражает как раз равенство нулю этого характери- характеристического определителя. Аналогичным образом при уш=\ мы получим условие ??+5 = 0. Приходим, таким образом, к следующему результату: если определитель системы C0) равен нулю, то для существования решения этой системы необходимо и достаточно? чтобы вектор (bl9 ..., bn) был ортогонален ко всем векторам^ дающим решение однородной союзной системы C2). Общее решение системы C0) будет суммой какого-нибудь ча- частного решения этой системы и общего решения соответствующей однородной системы, которая получается из C0) заменой всех bj нулями. Это общее решение однородной системы будет содержать (п — k) произвольных постоянных. Укажем еще одну, важную в дальнейшем, геометрическую интер- интерпретацию основной теоремы о решении систем. Пусть имеется ? линейных форм с ? независимыми переменными:
60 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [16 Будем считать, что xs могут принимать любые комплексные зна- значения, а (у19 ..., уп) — пусть составляющие некоторого вектора. Если определитель \aik\ отличен от нуля, то при любых значениях ук мы получаем определенные значения xk, и предыдущие формулы дают всё «-мерное пространство у. Положим теперь, что таблица ]\aik\\ имеет ранг г<^п. Не ограничивая общности, можем считать, что определитель r-го порядка, стоящий в левом верхнем углу, от- дачен от нуля. При этом основная теорема о решении систем дает нам следующее: совокупность значений (у19 ..., уп), получаемых по предыдущим формулам, обладает тем свойством, что значения уь ..., уг могут быть произвольными, но если фиксировать эти значения, то значения уг+1У ---,уп получаются вполне определенными, а именно эти последние значения получаются из условия равенства нулю харак- характеристических определителей. На языке геометрии это значит, что предыдущие формулы дают подпространство измерения г, которое образовано теми векторами, которые получатся, если положить одно H3js(s=l, 2, ..., г) равным единице, а остальные — нулю. Итак, если ранг таблицы || aik || равен г, то предыдущие формулы дают совокупность значений (yv ..., уп), определяющих некоторое под- подпространство измерения г. Мы рассмотрели тот случай, когда число линейных форм равно числу переменных xs. Можно взять общий случай yl = anxl-\-...-\-alnxny Уtn tn\ 1 1 * * · I tnn ?* В этом случае эти формулы при произвольных xs определяют в пространстве т измерений подпространство, число измерений кото- которого равно рангу таблицы || aik [| . Доказательство не отличается вовсе от предыдущего. 16. Определитель Грамма. Неравенство Адамара. Пусть имеется т векторов: Составим определитель порядка т из скалярных произведений {ха\ x{k)) и введем для него специальное обозначение: *.B> *-(I)\ />B) V<2)\ /fB> у(Ш)\ хш\ x{l)) (x{m\ x{2)) ... (x{m) Этот определитель называется определителем Грамма вектороз ·*· » ·*" t * * * t Лг * Разберем отдельно случаит = я, т<.п и т~>п, Общий член на-
16] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ писанного определителя имеет вид: 61 При т = п определитель C5) равен произведению определителей 41» 42t 4" ... 42) ... 4«> ... • jc\1> x\2) ... x[n) *^/i xn ··· ^я причем применяется правило строка на столбец. Принимая во внимание не- неизменность величин определителя при замене строк столбцами, можем утвер- утверждать, что второй множитель будет комплексно сопряженным с первым, и, следовательно, величина определителя Грамма C5) при» т = п равна квадрату модуля определителя | ?? |"» образованного составляющими х$ векторов xL, x2t ..., хп. Таким образом, определитель C5) положителен, если указанные векторы линейно независимы, и равен нулю, если они линейно зависимы [12]. При тфп мы имеем две прямоугольные таблицы: 4U r(m) Jm) (Збх) И x\ 1) лгк A?) -(m) C6.) и таблица, входящая в определитель C5), является произведением послед- последних двух таблиц [7]. В силу теоремы, доказанной в [7], определитель C5) равен нулю при т>/г. Но в этом случае векторы jcA), x{2\ ..., х{т — ли- линейно-зависимы [12]. При т<я, в силу указанной выше теоремы, W \rt, г2, ..., rm/ \ 1, 2, ..., m /' "' ) означает миноры таблицы (Збх) и Y\ u 2f '"' m] — миноры таблицы (Зб2). Как и выше, Y[ и '"' т) есть число, сопряжен- \ 1, 2, ..., ш / 1, 2, ..., ж\ I , и последняя формула переписывается в виде: Гц г2> ··· t гт! ное с 1, 2, ..., т C7) Если векторы х{1\ х{2\ .*.., jccm)—линейно-независимы, то ранг таблицы {36J равен m [12], и среди неотрицательных слагаемых, стоящих в правой
62 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [16 части равенства C7), по крайней мере одно слагаемое положительно. Если же упомянутые векторы линейно-зависимы, то ранг таблицы C6^ меньше т, все определители порядка /я, содержащиеся в этой таблице, равны нулю, и из C7) следует, что в этом случае G (jcA), jc<2), ..., хШ))=0. Таким обра- образом, рассмотрение всех трех случаев: т = /г, т>л и т<л приводит нас к следующей общей теореме: Теорема. Определитель Грамма G (хп\ х{2\ ..., хШ)) положителен, если векторы х{1\ хB\ ..., хШ) линейно-независимы, и равен нулю, если они линейно-зависимы. Сейчас мы докажем еще одну формулу для определителя Грамма. Пред- Предварительно условимся в некоторых обозначениях. Пусть ? — любой вектор из #П1 и для него имеет место разложение x=y-\-z, где у принадлежит подпространству, определяемому векторами ха\ х{2\ ..., jc(m), a ?—орто- ?—ортогонален к этому подпространству. Формула, которую мы хотим доказать, имеет вид: B), ..., хШ), jc) = | C8) Принимая во внимание равенства: (x(s\ x) = (JCE\.y); (¦*> ·*E)) = (У> x{S))> которые следуют из ортогональности ? ко всем x(S\ и формулу = (.У» .У) + (*1 z) [Щ> можем написать: i), x{ x(m\ ?) = (x(St\ хП)) (JCA\ JCB)) (JCA), ХШ)) (JCB), X'm)) {i\ У) i2), У) {m\ xB)) (У, x{2)) (x{m\ x{m) (jc{m), y) (y,xim)) (y, y)+ (*,*) Представляя элементы последней строки в вице: о, су· *B))+о, ..., (у, х и представляя определитель в виде суммы двух определителей согласно свойству IV из [3], можем написать: ), jc( , х{т (JCA), (JCB), (JCA), JCB)) (JCB), *B)) (JCA), X{m)) (JCB), X{m)) (Х{2),У) (xm), о (хш\ x[2)) о \ хШ)) \ у) О C9) Вектор у принадлежит подпространству, определяемому векторами ха\ jeB\ ..., JC(m), т. е. линейно выражается через x(S\ и потому, в силу дока- доказанной теоремы: G(xa\ х{2), ..., х{т\ у) = 0. Разлагая определитель формулы C9) по элементам последней строки, мы и получаем формулу C8). Из этой формулы непосредственно следует неравенство G(ха\ х{2), О(jcA), jc<2), ..., х{т). D0)
16] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 63 Отметим, что если векторы xlS) линейно-зависимы, то G(xa\ х'2\ ..., хШ), x) Если x{S)—линейно-независимы, то в неравенстве D0) имеет место знак равенства в том и только в том случае, когда ^ = 0, т. е. когда ? ортого- ортогонален ко всем x{S). Если мы к исходному определителю Грамма (?(jcA>, jcB), ..., JC(m>) при- применим несколько раз неравенство D0), то получим для него следующую оценку: G 112 | || 2 II ?(ТП) 118 || Д. || . При этом надо иметь в виду, что G (хП)) = || х11) ||2. Знак равенства в D1) имеет место в том и только в том случае, когда векторы попарно ортогональны. Считается при этом, что ни один из векторов не есть нулевой вектор. Доказанное неравенство легко приводит к оценке любого определителя. Пусть ? — определитель порядка ? с элементами а^. Будем рассматривать элементы г-й строки этого определителя (я1Х, щ2, ..., #т) как составляющие некоторого вектора x{i) из Rn. Составим новый определи- определитель с элементами uik—сопряженными с % Он равен, очевидно, ?. Умно- Умножая ? на ? по правилу строка на строку, получим определитель Грамма G (jcU), jcB), ..., х{п))у величина которого, в силу теоремы об умножении определителей, равна ??, т. е. равна | ? |2. Применяя неравенство D1), полу- получим" следующую оценку для модуля определителя, принадлежащую Адамару: |?|2^? ?*!*!1· ? 1***1*... ? ?***?1· D2) Если определитель ? имеет вещественные элементы, то можем написать: A2^J>iVj>i*··· J^S*· D3) Если для элементов определителя ? имеет место оценка \а^ (I, Л==1, 2, ..., л), то, очевидно: и D2) дает оценку: ? | ? I s^n 2 Mn. D4) Знак равенства в D2) имеет место, в силу сказанного выше, в том и только в том случае, когда векторы x{i) попарно ортогональны. Можем^получить и другие оценки для определителя Грамма. Они осно- основываются на неравенстве, которое является обобщением неравенства D0). Пусть каждая из букв X, Уу ? обозначает последовательность некоторых векторов из Rn. Неравенство, о котором мы упоминали, имеет вид: G(X, V, Z)G(X)z=:G (?, ?) G (X, ?). D5) В этом неравенстве не исключен случай пустой последовательности век- векторов, т. е. такой последовательности, которая не содержит ни одного вектора. Если W — такая последовательность, то надо считать G(№) = 1.
64 ГЛ. !. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [17 На основе этого неравенства может быть получена следующая оценка определителя Грамма: т - О(х{1\ х{2), ..., *(т))<[П G(xa\ ..., *(*-*\ jc(fe+1), ..., х{т))]т~ , К = I где ?—знак произведения. Многократное применение этой оценки приво- приводит к новым оценкам, в которых определитель Грамма содержит меньшее число векторов. Во всех этих оценках знак равенства имеет место в том и только в том случае, когда векторьг попарно ортогональны. Указанные только что оценки определителя Грамма даны М. К. Фаге (Доклады Ака- Академии наук СССР, 1946 г., т. LIV, № 9). 17. Системы линейных дифференциальных уравнений с по- постоянными коэффициентами. Применим полученные результаты к задаче интегрирования систем линейных дифференциальных уравне- уравнений с постоянными коэффициентами. Напишем такую систему в виде: х\ = D6) x'n = anlx1 -j- ?^?? -j-.. .-f < где Xj — искомые функции от t, ?) — их производные и aik — задан- заданные постоянные. Будем искать решение в виде: x1 = blext; x^ = b^ext; ...; xn = bnekt. D7) Подставляя в систему D6) и сокращая на множитель elt, будем имегь для определения постоянных Ьь ..., Ьп систему уравнений (п\\ — ?) b\ —J— ?^?<% , —X)fe, , ... , -„_„—- s D8) а„А + а„А + · · · + (аПп - ?) ftB = 0. Так как для неизвестных bj мы должны получить решение, отличное от нулевого, определитель написанной системы должен равняться нулю, т. е. для постоянной ? мы получаем уравнение вида: ап — ? ??2 · ·» #? а1п ап1 = 0. D9) Уравнение такого вида называется обычно вековым уравнением. Оно хорошо известно при рассмотрении колебаний механических систем без сопротивления в частном случае, когда таблица коэффи- коэффициентов aik симметрична, т. е. когда aik — akh и все коэффициенты вещественны, о чем мы будем говорить дальше при рассмотрении
17] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 65 малых колебаний. Сейчас мы займемся исследованием системы в общем случае. Уравнение D9) есть алгебраическое уравнение степени ? со старшим членом (— ?)?. Если это уравнение имеет ? различных корней ? = Aj, . .., ? = ?^, то, подставляя каждый из них ? —Ху в коэффициенты системы D8), мы будем иметь ? однородных уравнений для соответствующих не- неизвестных bl9 ..., Ъп с определителем, равным нулю, и сможем по- получить для этих неизвестных решение, отличное от нулевого. Таким образом, по формулам D7) мы получим ? линейно-независимых ре- решений нашей системы D6), и их линейная комбинация даст общий интеграл системы. Если же вековое уравнение D9) имеет крдтныз корни, го решение задачи будет более сложным, а именно — каж- каждому корню уравнения D9) кратности k должны соответствовать k линейно-независимых решений системы D6), причем одно из этих решений будет наверно иметь вид D7), а остальные будут, вообще говоря, содержать еще множителем полином от t. Но в данном слу- случае в отличие от одного уравнения с постоянными коэффициентами [II, 39] может случиться, что не одно, а несколько решений (или даже все), соответствующих упомянутому кратному корню, будут иметь вид D7). Мы не будем более подробно останавливаться на исследовании этого обстоятельства, так как в дальнейшем, пользуясь теорией функций комплексного переменного, применим для решения системы D6) другой метод. Вернемся к рассмотрению векового уравнения D9), которое играет основ- основную роль в нашей задаче. Решение этого уравнения, хотя бы и приближен- приближенное, представляет при больших ? практические трудности, вызванные тем обстоятельстг >ч, что искомое неизвестное ? стоит не в каком-нибудь одном столбце или С1роке, а входит в диагональные члены. Разложение левой части этою } равнения по степеням ? требует больших вычислений, которые нами хказаг'ы выше в [4]. Укажем прием преобразования уравнения D9) к прак- практически более удобному виду, при котором неизвестное ? попадает в один столбец. Прием этот принадлежит акад. А. Н. Крылову и изложен им в ра- работе „О численном решении уравнения, которым в технических вопросах определяются частоты малых колебаний материальных систем* (Известия Академии наук СССР, 1931 г.). Составим линейную комбинацию искомых величин 6 = ?01*1 + ?02*2 + · · · + «0Л-*Л» E0) где аоу— взятые каким-нибудь образом численные коэффициенты. Будем дифференцировать уравнение E0) ? раз по t, заменяя каждый раз в правой части производные x'j их выражениями из системы D6). Мы получим таким образом (л+1) уравнений вида:
66 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [17 Положим, что определитель, составленный из коэффициентов aik, входя- входящих в первые ? уравнений, отличен от нуля. При этом первые ? уравнений ? ?' iin~x\ дадут нам выражение б , у через ?, ?', ... , ii и, подставляя их в послед- последМ дду р j р ?, ?, , i\ , д нее уравнение, будем иметь уравне«ие я-го порядка для ?. Можно непосред- непосредственно произвести это исключение лг^из (я+1) уравнений E1) при помощи определителей. Действительно, перепишем эти уравнения следующим образом: + «0Я*Л = О, где хо = —1, и будем рассматривать эти (я+1) уравнений как однородные уравнения относительно величин xOi х1У ... , хп. Определитель написанной системы должен равняться нулю, что и дает нам искомый результат исключения = 0. E2) аП1 аП2 ··· «ПП Будем искать решение этого уравнения в виде: Подставляя это в первый столбец определителя E2) и вынося из первого столбца за знак определителя множитель ??*, мы придем, сокращая на этот множитель, к следующему уравнению для определения ?: 1 ?01 ??2 ··· аоп ? аи а12 ... а1П ** аЛ1 «?? ... аПП E3) Нетрудно показать, что при нашем предположении уравнение E3) имеет те же корни, что и уравнение D9). Действительно, пусть ? = ?0 есть неко- некоторый корень уравнения E3). Мы имеем при этом для E2) решение вида: E4) где С — произвольная постоянная. При этом первые ? уравнений системы E1) дадут нам и для xj решения вида D7) при ? = ?? р ы т. е. ? = ?0 будет D9) A) дду д у р д () р 0, 0 уд и корнем уравнения D9). Наоборот, если ? = ?0 есть корень уравнения D9), то мы имеем для xj решение вида D7) при ? = ?0, где bj— численные по- постоянные, среди которых есть отличные от нуля. Подставляя эти выражения xjb первое из уравнений системы E1), мы получим и для ? решение вида E4), причем это решение будет наверно отлично от нуля. Действительно, в противном случае мы имели бы ? = ?' = ... = ?(?~1) = ?, откуда, в силу первых ? уравнений системы E1) непосредственно следовало бы ??=??2?= Таким образом, действительно всякий корень ? = ?0 уравнения D9) будет и корнем уравнения E3). Итак, при нашем предположении уравнение E3)
171 § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 67 имеет те же корни, что и уравнение D9). Применение этого метода к чи- численным примерам, а также рассмотрение случая, когда наше предположение не имеет места, можно найти в вышеупомянутой статье акад. А. Н. Крылова. Наиболее простые вычисления получатся, если формулу E0) взять в виде ? = ^. В этом случае уравнение E3) будет иметь вид: 11 0 ... 0 ... ?. = 0.*) am ans ··. апп Вместо системы D6) рассмотрим систему уравнений второго по- порядка вида: xl = a11xl· E5) Хп О,п\Х^ 4" #л2-^2 + · · · + annXn* Такие системы часто встречаются в механике. Если искать их решение в виде Xj = bj cos (kt 4* ?)> то получим для ? уравнение вида: = 0. E6) Постоянные bj определятся из системы, аналогичной системе D8), и ? останется произвольным. -Наконец, для систем вида: х[ = ап хх +... + а1пхп 4- сп х[ +... + с1пх'п It I ' I ! ' E7) ЛГд = ая1ЛГ! + ... 4- аппХп + ^?^ содержащих и первые производные, отыскивая опять решения в форме D7), мы приходим к вековому уравнению вида: яи + сп\ — ?2, ап 4- <^12^ .- CL ^21 4" С^ fl22 4" ^?? — ?2 · · · ?·2/? = 0. E8) J) Удобный метод преобразования векового уравнения был дан А. Д а- нилевским (Математический сборник, т. 2, вып. 1).
68 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [18 Вводя добавочные неизвестные хп+\= хь хп+%= хь · · · 5 хы = хю мы приведем систему E7) к 2п уравнениям первого порядка, из которых ? уравнений получатся из E7) заменой Xj = xn+J и Xj = xn+J (j = 1, 2, ... , ?), а остальные я суть уравнения E9). 18. Функциональные определители. Пусть имеются ? функций от ? переменных хь х^ ... у хп: Ъ (хь хъ · · · > хпУ> Ъ (*ь хь · · ·, хп); · · ·; ?л (?? хг> · · ·, хя)· F0) Функциональным определителем от этих функций по перемен- переменным jc5 называется определитель #-го порядка, элементы которого вычисляются по формулам: aik — ^. Введем специальное обозначе- обозначение для функционального определителя: F1) Z) *2 ¦¦' дхп Мы встречались уже раньше с такими определителями при замене переменных в крагных интегралах [II, 63 и 80]. Если мы имеем за- замену переменных на плоскости х = у(и, ?); ^ = ?(?/, ?), F2) *при которой точка (и, ?) переходит в точку (х> у), то абсолютное значение функционального определителя F3) дает коэффициент изменения площади в данной точке (я, ?) при то- точечном преобразовании F1), причем мы считаем, что в той области, в которой применяется точечное преобразование F2), частные про- производные от функций F2) по и и ? непрерывны, и определитель F3) в нуль не обращается. Аналогичным образом, если имеется точечное преобразование в трехмерном пространстве: x = 9(9i> Чь Ы У = $(Ч1> Чь Ы# * = ? (ft, qb qd), при котором точка с координатами (ft, q^ q3) переходит в точку
18] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 69 (jc, у у г), а объем {Vv) переходит в объем (V), то формула замены переменных в тройном интеграле имеет вид [И, 63]: \ \ \ f(x> У* z) dxdydz =\\ J/[?, ?, ?] ? DI dqx dq% dq9, V V) где n D (y, ?* °>) O(qit q2, qty и ID | дает коэффициент изменения объема в данном месте при переходе от (qi9 qb q9) к (лг, у, ?). Совершенно так же мы могли бы рассматривать одну функцию от одной независимой переменной u=f(x) как точечное преобразо- преобразование на оси ОХУ при котором точка с абсциссой ? переходит в новое положение с абсциссой и. При эгом, очевидно, абсолютное значение производной \f (х)\ характеризует изменения линейного размера в данном месте. Все сказанное выше распространяется и на случай точечного преобразования в я-мерном пространстве и при замене переменных в /z-кратном интеграле [II, 100]. Выясненная на случаях двух и трех измерений аналогия между функциональным определителем и производной имеет своим след- следствием и некоторую аналогию между их формальными свойствами, которую мы сейчас и покажем. Пусть имеется система функций ?? ??> ¦ · · > Уп)> · · ·» ?? (Vi> · · · > Уп)> и положим, что У\> ..., уп не суть независимые переменные, а сами функции от х19 ..., хп, так что в конечном счете функции ?,- будут функциями переменных xt. Мы можем составить три функциональ- функциональных определителя: ?>(?!> ···> ?*) . flfoi» -.-, уЛ) . Р(Уи ·-»> Уп) D (у» ... , уп) · D (??9 ... , хп) » D (xlt ..., хп) · Элементы этих функциональных определителей будут соответ- соответственно Но по правилу дифференцирования сложных функций мы имеем: dxk dyL dxk ' *' * «dyn dxk' и применяя теорему об умножении определителей по схеме строка на столбец, получим равенство, выражающее первое свойство
70 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 118 функционального определителя: D («Pi, ¦·. > Ул) _ D (ъ> - > D (хх, ... , *я) D (у1У ..., (xi9 ..., F4) Это равенство аналогично правилу дифференцирования сложных функций одной независимой переменной. Выясним еще одно свойство функциональных определителей. Систему функций ?,- можно рассматривать как преобразование от переменных x-t к новым переменным <р$: <?? = <??(*?> ··¦> *п) (l = h % ..., ?). F5) Отметим сначала один частный случай, а именно случай так на- называемого тождественного преобразования: Его функциональный определитель будет 1 0 0 ... 0 Q 1 0 ... 0 0 0 1 0 0 0 0 ... 1 = 1. Представим себе, что уравнения F5) решены относительно хг так, что ?? выражены через срг·: *i = *iOPi> .... ?л) (/=1, 2, ..., п> (Щ Преобразование F6) естественно назвать обратным преобразова- преобразованию F5). Если подставить выражения F6) в правые части равенств F5), то получим тождества ?? = ?1; ...; ?? = срл, или, иначе говоря, получим тождественное преобразование. Применим теперь к этому частному случаю формулу F4), причем нам надо будет считать yiz=zxi и ??? = ??, а в левой части формулы F4) мы получим функ- функциональный определитель тождественного преобразования: Е> (Ун ·*- » Ул) _ D (Ун — » Уя) D (??> — » *п) D (??» ···» Ул) ^ (^?· ... » АГл) D (у„ ... , «рл) ИЛИ У/г) F7) т. е. произведение функциональных определителей прямого и об- обратного преобразований равно единице. Это свойство аналогично свойству производной обратной функции для случая одного незави- независимого переменного.
18] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 71 Выясним теперь смысл того условия, что функциональный определитель D(xl} x3t ..., ??) ?*' от функций ъ(х19 ..., ??); ъ(х19 ..., ??); ...; «fofo, ..., ??) по перемен- переменным xs тождественно равен нулю. Положим, что эти функции связаны функ- функциональной зависимостью: F(b> ···> <Рл) = 0, F9) причем это равенство есть тождество относительно независимых перемен- переменных Xj. Дифференцируя его по всем независимым переменным, получим ? тождеств: + ^2 0 G0) Мы можем рассматривать написанные тождества как линейные уравне- уравнения относительно ? величин: причем, очевидно, величины эти не могут одновременно равняться нулю тож- тождественно, так как в противном случае F не содержало бы ни одной из функций <рг·. Таким образом, определитель однородной системы G0) должен равняться нулю, что и сводится к тому, что функциональный определитель F8) равен нулю. Итак, из наличия функциональной зависимости F9) выте- вытекает тождественное равенство нулю функционального определителя F8). Можно доказать и обратное предложение, на чем мы останавливаться не будем, т. е. тождественное равенство нулю функционального определи- определителя F8) является необходимым и достаточным условием зависимости между функциями ?/ (хи ... , хп). *) Рассмотрим в качестве примера три функции от трех независимых пере- переменных 2 I у.% I т у%, #л — у 1 ? | у . 0 „ у. у | у у ? у у /yi \ Нетрудно проверить, что между ними существует следующая зависи- зависимость: Составим для системы функций G1) функциональный определитель: ?* («Pi» ?2t Ъ) _ D (xlt xit хг) Предоставляем читателю показать, что этот определитель обращается тождественно в нуль. *) Заметим, что наши рассуждения относительно системы G0) носят фор-· мальный характер и не являются, строго говоря, доказательством.
72 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [19 19. Неявные функции. Мы доказали в томе I теорему о существовании неявной функции [1, 15,7], определяемой одним уравнением. Обобщим теперь эту теорему на случай системы уравнений. Формулируем сначала доказан- доказанную теорему: пусть x = xQt у=у0—решение уравнения ) = 0 G2) и пусть F(x, у) и ее частные производные первого порядка— непрерывные функции при х = х0У у = у0 и при всех значениях х, у, достаточно близких к ним, и пусть, наконец, частная производная F'y (д-, у) отлична от нуля при x = xQ} y=zy0. При этом уравнение G2) определяет при х, достаточ-но близ- близких к х0, единственную функцию у (х), непрерывную, имеющую производ- производную и удовлетворяющую условию у (xQ)—y0. Как мы уже упоминали, со- совершенно так же можно доказать, что уравнение Ffr,y, «) = О, имеющее решение ? = ?0, y=yOf z = z0, при условии непрерывности функ- функции F(x, у, ?) и ее частных производных первого порядка в окрестности указанных значений и при условии F'z (xQJ yQ} ?^)?§} определяет единствен- единственную функцию ? (?, у)у непрерывную в окрестности ? = х0, у=у0У имеющую производные подгибу и удовлетворяющую условию ? (х0, yQ) = z0. Рассмотрим теперь систему двух уравнений: <р С*, У, г) = 0; ? (?, у, ?) = 0. G3) Пусть эта система имеет решение x = xOiy — y0}z = z0, функции <р(х, у, z)t ? С*» У, ?) ? их частные производные непрерывны в окрестности указан- указанных значений, и функциональный определитель: D (ь ?) = D (у, ?) ду9 ~&? д^_ д^ ду > dz ду dz dz pу G4) отличен от нуля при указанных значениях переменных. При этом си- стема G3) определяет при х, достаточно близких к х01 единственную систему функций у (?), ? (?), непрерывных, имеющих производные первого порядка и удовлетворяющих условию у(хо)—уОу ?(??) — ??. Так как выражение G4) отлично от нуля при х = х0, у=у0, z = zOy то о „ ' dty ?? по крайней мере одна из частных производных -—- или -~ отлична от нуля. Положим, например, что -^- отлична от нуля при указанных значениях пере- переменных. Согласно формулированной выше теореме, второе из уравнений G3) определяет единственным образом функцию г {х, у). Подставляя эту функ- функцию в первое из уравнений системы, получим уравнение с переменными [ *(*, У)] = 0. G5) Чтобы доказать теорему, нам остается только показать, что частная произ- производная от левой части уравнения G5) по у отлична от нуля при х = х0> yz=y0. Эта частная производная выразится формулой: ду)-~ду^дг ду' v "' где (-^Ч есть полная производная от у(х, у, г) по аргументу у. Функция
19] § 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 73 ? (?, у) есть решение второго из уравнений G3), что приводит к тождеству: ? [ЛГ, у, ? (X, у)] ??? 0. Дифференцируя это тождество по у, получим: ~ду+Ъ"ду^°' G7) Умножим обе части G6) на -~- и сложим с тождеством G7), предварительно умножив обе его части на —~-. Мы получим таким образом после элемен- тарного преобразования: дф /*р\ Р(Ъ ?) ^ '\dy)~D(yf гу При ?: = ?·0, ^=^о Функция ? (?, у) обращается в zQ} и при указанных зна- d*b [д<?\ чениях переменных -~- и G4) отличны от нуля, а потому ?-^1 также от- отлична от нуля. Следовательно, уравнение G5) определяет единственную функцию у (х). Подставляя ее вг (х, у), получаем и ? как функцию от х. Это доказательство справедливо для случая нескольких независимых пере- переменных. В общем случае теорема о неявных функциях читается так: пусть имеется система ? уравнений: FA*» ··· » Хтч Уи ··· ? Уп)=0; ...; Fn(xlt ... , хт, ylt ... , уп)=0, G8) имеющая решение xk-xk> У,—У1 [ J G9) пусть Fi — непрерывные функции с непрерывными частными производ- производными первого порядка в окрестности значений G9) и пусть, наконец, функциональный опреоелитель Fn) __ yn) dys dF, дуп dfn d_Fn dy2 ··· dyn (80) отличен от нуля при значениях G9). При этом уравнения G8) при xk, достаточно близких к ??, определяют единственную систему функций У ? (*?> ··· > хп) непрерывных, имеющих производные первого порядка и удо- удовлетворяющих условию уг(х{\\ ... , ^))=>'i(>i. Наметим доказательство этой теоремы. Считая теорему справедливой для системы (п — 1) уравнений (при и=1 и ? = 2 она действительно спра- справедлива), докажем ее для системы ? уравнений. Разлагая определитель (80) по элементам первого столбца, можем утверждать, что хоть одно из алге- алгебраических дополнений этих элементов отлично от нуля при значениях G9), ибо сам определитель при этих значениях по условию отличен от нуля. Соответственно нумеруя функции Fit можем считать, что отлично от нуля
74 ГЛ. I. ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ [19 алгебраическое дополнение элемента 3—-. Это алгебраическое дополнение представляет собою функциональный определитель от функций F2i...tFnf но переменным у2, ... , уп. Согласно теореме для систем (п — 1) уравнений, уравнения: ?(*?> ···> *т>Уи .-•>'л)=0; ...; Fn(xif ..., хт у19 ... ,^л)==0 (81) определяют единственным образом функции ^2 = ?8 (*?> ... ? хт> Уд\ ·.·; Уп = Чп (Хи ·.· · хт> 3?). (82) Подставляя эти функции в первое из уравнений системы G8), получим урав- уравнение для определения yt: Ft {?и ... , xmt yu ъ> ·.. t <Рл) =0. _ (83) Нам остается проверить, что полная производная от левой части этого уравнения по ух отлична от нуля при значениях G9). Эта производная выражается формулой: Подставляя функции (82) в левые части уравнений (81), получим тождества, которые дифференцируем по yt: Обозначим через Аи Л2, ... , Лп алгебраические дополнения элементов пер- первого столбца определителя (80). Умножим (84) на Аи (85) на ?? и вычтем последние тождества из первого. Таким путем мы получим равенство: В правой части первая сумма дает определитель (80), который мы для крат- краткости обозначим просто буквой D, а суммирование по / во второй части представляет собою сумму произведений элементов некоторого столбца D, с номером, отличным от единицы, на алгебраические дополнения соответ- соответствующих элементов первого столбца, т. е. эта сумма равна нулю. Заметим при этом, что дифференцирование по ?5, все равно что дифференцирование по ys. Таким образом предыдущая формула переписывается в виде: При значениях G9) Ах и D отличны от нуля, и, следовательно, то же можно утверждать и относительно производной левой части уравнения (83) по уи и это уравнение дает единственную функцию ух (хи хЛ1 ... , xm)t подставив которую в функции (82), получаем окончательный результат.
19] S 2. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ 75 Частным случаем теоремы о неявных функциях является теорема об обращении системы функций. Пусть имеются уравнения yu=fk (хи - . Хп) (*= 1, 2, ... , л). (86) Положим, что функции /^ непрерывны вместе со своими производными первого порядка в окрестности значений xk = x{g} (k = \, 2, ... , ri)t и при этих значениях функциональный определитель отличен от нуля. При этом уравнения (86) определяют единственным образом Хк(Уи ··· » Уп)> как функции уи ... , уп в окрестности значений у{р =fk (лг^0), ... , x{nh причем эти функции непрерывны, имеют производ- производные первого порядка и xk (у{^\ ... , у™) = ?{?\ Чтобы доказать эту теорему, достаточно рассмотреть уравнения: fk(Xu — » Л"я)— ^fe = ° (*=1, 2, ..., п) и воспользоваться теоремой о неявных функциях, причем в данном случае роль yi играют xk. Если fk суть линейные однородные функции переменных х^ то система (86) имеет вид: Определитель (87) в данном случае сводится к определителю [ ?^? \ из коэф- коэффициентов aki, и возможность однозначного решения системы дается тео- теоремой Крамера.
ГЛАВА II ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 20. Преобразование координат в трехмерном пространстве. Линейным преобразованием с ? переменными называется преобразо- преобразование вида: ?? (ХцХ^ —— ^12*^*2 —— · · · —I— ^\пхп 0) хп = ап1хх ~\- Можно толковать это преобразование как переход от некоторого вектора {хь ..., хп) ?-мерного пространства к другому векгору (x'v ..., ХпУ Можно иначе толковать (х1У ..., хп) как координаты точки в я-мерном пространстве, а преобразование A) — как переход ог одной точки к другой. Можно толковать A) еще и иначе, а именно: считать, что (xv ..., хп) и (x'v ..., Хп) суть составляющие одного и того же вектора (координаты одной и той же точки), но при различном выборе осей Формулы A) дают при этом формулы преобразования составляющих (координат) при переходе от одной координатной системы к другой. Раньше мы неоднократно встречались с форму- формулами вида A) при п = 2 и п = 3. Настоящая глава в своей первой части и будет посвящена под- подробному рассмотрению линейного преобразования вида A). Для большей ясности мы начнем с рассмотрения вещественного трех- трехмерного пространства, а затем перейдем к общему случаю я-мерного пространства и комплексных составляющих. В случае трехмерного пространства мы начнем рассмотрение с того наиболее простого случая, когда преобразованию A) соответствует переход от одних прямоугольных осей к другим таким же. Откладывая векторы от начала координат, мы можем считать, очевидно, (х19 лс2, х%) или. составляющими вектора, или координатами его конца.
20] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 77 Как известно из аналитической геометрии, формулы преобразо- преобразования прямолинейных прямоугольных координат имеют вид: B) где ctik суть косинусы углов, образованных новыми осями с преж- прежними; alk определяются по следующей таблице: C) Как известно, таблица коэффициентов C) обладает в данном слу- случае тем свойством, что сумма квадратов элементов каждой строки и столбца равна единице и сумма произведений соответствующих элементов двух разных строк или разных столбцов равна нулю. Величина определителя \alk\ равна, очевидно [б], объему прямоуголь- прямоугольного параллелепипеда с ребрами, равными единице и направленными по новым координатным осям, т. е. эта величина равна единице, если ориентировки осей одинаковы^ и (— 1), если они различны. Преобразование, дающее обратный переход от {x'v х'^ Хз) к {xif хь х^), будет, очевидно, иметь вид: Х\ === &\\?? —{— (Х<цХ<^ —|— #31-^3 ' ' г I К К ?? «11 «21 «31 ?2 «12 «22 «а 2 Хг «13 «23 «33 Иначе говоря, преобразование, обратное B), получается простой перестановкой строк и столбцов таблицы его коэффициентов. Опре- Определитель этого обратного преобразования, очевидно, равен опреде- определителю преобразования B). Покажем теперь, что упомянутое выше свойство коэффициентов преобразования B) может быть получено при выполнении одного требования, которое непосредственно вытекает из геометрической сущности вопроса, а именно — поставим себе следующую задачу: найги все вещественные преобразования вида B) такие, чго D) Такая постановка задачи дает возможность обобщить рассмотрен- рассмотренные нами выше преобразования па случай пространства с любым
78 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [20 числом измерений. Покажем, что наши преобразования, 1ребуемые новой задачей, совпадают с теми, которые нами рассмотрены были выше, т. е. покажем, что требование D) приведет к упомянутым выше соотношениям для коэффициентов aik. Подставляя выраже- выражения B) в левую часть соотношения D), раскрывая скобки и при- приравнивая коэффициенты при квадратах переменных единице, а при произведении различных коэффициентов — нулю, мы получим как раз шесть соотношений вида: &\каи + а%иач + я3?% = Ьы (k, /=1, 2, 3), E) где Ьн = 0 при кф1 и bkk=l, F) т. е. сумма квадратов элементов каждого столбца равна единице и сумма произведений соответствующих элементов разных столбцов равна нулю. Эти условия называются обычно условиями ортого- ортогональности по столбцам. Таким образом, элементы каждого столбца равны направляющим косинусам некоторого направления и направле- направления, соответствующие различным столбцам, взаимно ортогональны. Отсюда непосредственно следует, что в рассматриваемом случае преобразование B) совпадает с рассмоаренным выше, и свойство ортогональности имеет место не только по отношению к столбцам, но и по отношению к строкам. Формулы B) мы можем толковать не как преобразование коор- координат в неизменном пространстве, а как преобразование простран- пространства при неизменности координатных осей. Положим сначала, что определитель преобразования равен (-)- 1)> т. е. обе системы коор- координатных осей имеют одну и ту же ориентировку/ Мы можем при ^том повернуть пространство, как твердое целое, вокруг начала вместе с осями (X'v Х%, Хг) так, чтобы эти оси совпали с осями (Xif Хь Х3), которые мы считаем неподвижными при этом вращении и к которым мы относим координаты 'всякой точки как до вращения, так и после него. Если некоторая точка ? имела до вращения координаты (хи хь хъ), то в результате вращения эта точка займет новое положение ? и будет иметь новые координаты (х[у х\> х'3). Поскольку точка ? движется вместе с координатными осями (?'? Х'ъ Х'в), координаты {?'? х%, х'%) точки ? относительно осей {Хь Хь Х3), с которыми совпали оси (?'? ?'^ Х'3) в результате вра- вращения, будут совпадать с координатами точки ? относительно осей (X'v X'v X's) до вращения. Мы видим, тагим образом, что формулы B) в случае определителя (-J-1) представляют собой преобразование координат любой точки в резулыате произведенного вращения про- пространства. Положим теперь, что определитель \aik\ равен (—1). Вместо преобразования B) рассмотрим преобразование (t=l, 2, 3).
20] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 79 Его коэффициенты по-прежнему обладают свойствами E), но опре- определитель из коэффициентов уже равен (-{-1), т. е. этому преобра- преобразованию соответствует вращение пространства вокруг начала. Чтобы получить" координаты (x'v х'г, ?'%), нам надо совершить еще преоб- преобразование: а такое изменение знаков у всех координат] есть преобразование симметрии относительно начала. Итак, в случае определителя (— 1) преобразованию B) соответствует некоторое вращение пространства вокруг начала с последующей симметрией относительно начала. · Мы видели выше, что девять коэффициентов aik должны удов- удовлетворять шести соотношениям E). Отсюда следует, что они должны выражаться через три независи- независимых параметра. Укажем на один из возможных выборов этих параметров в случае вращения пространства вокруг начала. Введем в рассмотрение две системы координатных осей: одну Х[у Х'%, Къ — неподвижную, к которой относятся все коорди- координаты, и другую Хь Х%, Хъ, неиз- неизменно связанную с вращаю- вращающимся пространством. Чтобы определить вращение, надо Рис 1# установить три параметра, которые определяли бы по- положение второй системы осей относительно первой. Пусть ON (рис. 1) — пересечение плоскости Х[ОХ'% с плоскостью ????%. Возьмем на этой прямой определенным образом выбранное на- направление, и пусть ? — угол X[ON, отсчитываемый от ОХ[. Введем еще угол § = Х'гОХг и угол ?==?/??1. Эти три угла вполне характеризуют положение второй системы осей относительно первой, т. е. вполне характеризуют произведенное вращение. Будем обозначать его следующим символом: {?, ?, ?}. Из предыдущего непосредственно следует, что наше движение есть результат после- последовательно проведенных трех следующих движений: 1) вращение вокруг оси Х'ъ на угол а; 2) вращение вокруг нового положения оси Х[ на угол ?; 3) вращение вокруг новой оси Хъ на угол ?. Эти три угла называются обычно углами Эйлера. Заметим, что для этих углов мы можем написать следующие пределы их изменения: 0<?<2?; 0<?<?:; 0<?<2?. Если ? = 0, -го движение {?, ?, ?} сводится просто к повороту вокруг оси Х3 на угол ?-[-?, и в этом смысле при любом ? мы
80 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [21 имеем: {а, 0, 7} = {« + ». 0, ?-?}. Это обстоятельство указывает на то, что в некоторых случаях параметры {?, ?, ?} соответствуют вращениям пространства вокруг начала не вполне одиозна*1**^. Различным значениям параметров соот- соответствуют одни и те же вращения. Нетрудно вывести формулы, выражающие коэффициенты а1к ерез тригонометрические функции углов ?, ?, ? [см. 62]. В дальнейшем мы будем иметь и другой выбор параметров, характеризующих вращение пространства вокруг начала, и вернемся еще к углам Эйлера. 21. Общие линейные преобразования вещественного трехмер- трехмерного пространства. Будем рассматривать теперь линейные веще- вещественные преобразования вида B) с любыми коэффициентами, но будем всегда считать, что определитель преобразования отличен от нуля: К* 1^0. G) В этом случае преобразование обычно называется собственным преобразованием. Если оно не удовлетворяет условиям E), то оно связано с деформацией пространства [II, 125]. Заметим, что в пре- преобразовании B) характерным является таблица его коэффициентов, из которой вполне определяется закон перехода от любого вектора с составляющими (?? хь хъ) к новому вектору с составляющими (?'? х'ъ х'^). Обозначим всю таблицу коэффициентов одной буквой 1ап ап ахЛ <*и а22 ?23 , (8) #31 аг2 #за 1 причем мы ставим эту таблицу, как и раньше, между двойными чертами, чтобы отличить ее от определителя. Она называется иначе матрицей. Определитель таблицы (8) будем обозначать символом D(A). Это есть некоторое определенное число. Преобразование B) мы запишем символически в следующем виде: х' = Ах, (9) где х' — вектор с составляющими (x'v х'^ х'%) их — вектор с состав- составляющими (xv хь х%). Преобразование, при котором каждый вектор остается неизмен- неизменным, назовем тождественным преобразованием. Ему соответствует таблица 1 0 011 0 10, A0) 0 0 1
21] §3 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 81 которая называется обычно единичной таблицей, или единичной матрицей, и обозначается символом /. Считая D (Л) ? 0, можем решить уравнения B) относительно (?? хь лг3) и пвлучим формулы: D(A) •(Л) ? 4- О (А)' (?) где Л^ — алгебраические дополнения элементов atk в определителе D{A\ Это линейное преобразование называется обычно преобразо- преобразованием, обратным B), и, если матрица этого последнего обозначена через Л, то матрицу преобразования A1) обозначают через Л. Введем теперь важное для дальнейшего понятие о произведении двух пре- преобразований или произведении двух матриц. Положим, что мы имеем два линейных преобразования, or (xv хь х3) к {х\, х'2У х'з): [ + апхг + апхъ х[ = ЯзЛ + «32^2 + ЯЗЗ^З или х' — A2) и затем от (х{, х'%, x's) к {х[> х%, х"ъ): х\ = bnxi -j- bnx2 -f- ^13-^3 = ЬЪ1х[ или A3) Этот последовательный переход от (хь хь дг3) к (лг{, ?? ?^ и затем от (?'? ?'? х'г) к (jCj, xl, xl) можно заменить непосредствен- непосредственным переходом от (хь хь хг) к {х[У х^У xl), который также будет линейным преобразованием (*=1, % 3). A4) Это последнее линейное преобразование называется произведе- произведением преобразований A2) и A3), причем здесь существенно отме- отметить порядок, в котором производились преобразования» Подставляя выражения A2) в правые части формулы A3), мы и получим фор- формулы A4). Отсюда непосредственно получается выражение элемен- элементов cik таблицы произведения преобразований через элементы таблиц перемножаемых преобразований: 2> (i, A =1,2, 3). A5)
82 ГЛ. ТТ. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [21 Преобразование A4) обычно записывается следующим образом: х"==ВАх. A6) Матрицу С с элементами ciki получаемыми по формулам A5), называют произведением матриц А и В и записывают это в сле- следующем виде: С = ВА, A7) причем в смысле порядка следования преобразований надо читать это произведение справа налево. Принимая во внимание теорему об умножении определителей и формулы A5), мы можем написать для определителей преобразований очевидное равенство: = D(B)D(A)t A8) т. е. определитель произведения преобразований равен произведе- произведению определителей этих преобразований. Нетрудно доказать сле- следующие соотношения, имеющие простой геометрический смысл: АА = А'1А = 1. A9) Заметим, кроме того, что из самого процесса образования обрат- обратного преобразования следует, что преобразование, обратное Л~\ будет преобразование Л. Действительно, решая систему A1) отно- относительно Хь получим, очевидно, опять формулы B). Это можно записать следующим образом: (Л)~1 = А B0) Понятие произведения преобразований может быть распростра- распространено на случай любого числа сомножителей, а именно: результат последовательного преобразования с некоторыми матрицами А, В м С будет новое преобразование с матрицей D: D = CBA B1) Если матрицы Л, В и С имеют элементы аш bik и сш то матрица D, являющаяся их произведением, будет иметь элементы, определяемые по формулам: з dik= ? *???*· B2> Действительно, для элементов матрицы Е=ВА имеем формулы
21] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 83 и, наконец, для матрицы СЕ будем иметь, согласно A5), формулы 3 dik — т. е. как раз формулы B2). Заметим, что в дальнейшем мы будем часто обозначать элементы матрицы А символом {А},* Произведение матриц не подчиняется, вообще говоря, переме,- стительному закону, т. е. вообще В А ? АВУ но, как нетрудно видеть, подчиняется сочетательному закону — сомножители можно соединять в группы: С(ВА) = (СВ)А. B3) В левой его части мы должны матрицу А умножить на В слева и затем полученный результат умножить на матрицу С. В правой части мы сначала должны умножить матрицу В на С, а затем матрицу А помножить на матрицу, полученную в результате только что произведенного умножения. Нетрудно видеть, что в обоих слу- случаях элементы матрицы, получающиеся в окончательном произведении, будут выражаться по формулам B2). Действительно, для левой части это было показано выше. Что же касается правой части, то мы имеем, производя последовательно указанные умножения: ?, что совпадает, очевидно, с B2) при наших новых обозначениях. Отметим еще один важный тип линейных преобразований, а именно рассмотрим преобразования B4) которые сводятся к растяжению вдоль координатных осей, причем численные коэффициенты ku kb k$ характеризуют величину этого растяжения (или_ сжатия). Матрица указанного преобразования имеет, очевидно, вид: | О О О k% О 10 0 Аз1
84 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [21 т. е. все ее элементы, стоящие вне главной диагонали, равны нулю. Такая матрица называется диагональной матрицей, и мы ее будем обозначать символом [kb А2, ?3]. В частности, если числа одинаковы, т. е. если ki = k^ = k^ = kf то преобразование сведется к умножению всех составляющих век- вектора на одно и то же число k, и это будет, очевидно, преобразо- преобразование подобия с центром в начале координат. Всякий вектор, не меняя своего направления (считаем k ^> 0), изменится лишь по длине, причем его длина умножится на k. Такое преобразование будем обозначав ?* = kX> т. е. будем число k считать частным случаем матрицы, а именно будем диагональную матрицу с одинаковыми элементами на главной диагонали IIА 0 0 0 ? 0 B5) |о о k считать числом L· Нетрудно видеть, пользуясь A5), что произведе- произведение таких матриц сводится к обычному перемножению чисел, т. е* [*, А, А].[/, /, /] = [А/, A/, A/]. Вообще легко проверить, что для диагональных матриц имеет место простой закон умножения \К К А3] [4, 4> 4] = [Vi, Аа4, hhl B6) т. е. два растяжения вдоль координатных осей равносильны одному растяжению с коэффициентами, равными произведению соответствую- соответствующих коэффициентов составляющих растяжений. Из формулы B6), между прочим, непосредственно следует, что произведение двух диагональных матриц не меняется при перестановке сомножителей. Пользуясь представлением числа в виде диагональной матрицы B5) и формулой A5), нетрудно видеть, что произведение к А сводится к умножению всех элементов матрицы А на число А. Это произведе- произведение не зависит от порядка семножителей, т. е. = k{A}ik. B7) Мы рассматривали основное линейное преобразование B) как деформацию пространства, при которой вектор с составляющими (х1у хь хг) переходит в новый вектор с составляющими {x'v x'^ х'^). ^Можно, конечно, как мы уже указывали и раньше^ толковать это преобразование и как точечное преобразование, при котором точка
21] § з. линейные преобразования 85 с координатами (хх> хь jc3) переходит в точку с координатами (j?j, Xty Х%)" При определении составляющих вектора мы .могли пользоваться любой сис!емой осей, иначе говоря, любыми ортами, т. е. мы могли взять любые три некомпланарных вектора i, j, ft за основные век- векторы (за оргы), и при этом для всякого вектора ? мы, как известно,, имеем единственное представление вида [II, 114]: ? = xxi -J- x%j -f x3k. B8) Числа xv лс2, хъ и называются составляющими вектора ? во езятой системе координат, определяемой ортами i, j и k. Нашей задачей сейчас является исследовать влияние различного выбора ортов на вид линейного преобразования. Точнее говоря, если в системе координат, определяемой ортами· i, j и ft, некоторое линейное преобразование имеет вид A2), та каким образом будет выглядеть то же самое линейное преобразова- преобразование пространства в другой системе координат, определяемой ортами h> Уь fci? Положим, что новые орты выражаются через старые ?? формулам: ?? = ???? + ?«/+?·* | B9> Заметим, что определитель, составленный из коэффициентов tikr должен быть отличным от нуля. В противном случае векторы il9 jt и k\ оказались бы линейно зависимыми, т. е. компланарными. В но- новой системе координат наш вектор, определяемый формулой B8)> будет иметь уже новые составляющие У\Ч +y%fi +?*?- Установим прежде всего формулу, выражающую новые соста- составляющие вектора через его прежние составляющие. Мы имеем, оче- очевидно, используя выражения B9) новых ортов: i ifsli + W + ts3b) = Xli + xj+ x,k. Сравнивая коэффициенты при ?, j и ft, получим формулы, выра- выражающие прежние составляющие через новые: C0)
86 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [21 Таблица этого преобразования отличается от таблицы преобра- преобразования B9) тем, что строки заменены столбцами. Действительно, в каждой строке таблицы B9) не меняется первый значок, а в таб- таблице C0) это имеет место для второго значка. Обозначая таблицу преобразования B9) через Г, мы будем таблицу преобразования C0) обозначать через 7^** и называть ее транспонированной по отноше- отношению к Т. При этом можно записать формулы C0) коротко в сле- следующей форме: (*?, х* *.) = ?<·>0>?.?,?), C1) причем {хь хь х%) обозначает три составляющие вектора в прежних ортах, a (yl9 уь у%) — в новых ортах. Выражение новых составляю- составляющих через старые будет иметь вид: Ci>У*Уъ) = Т{^~1 (xi9 ?* х9), где Г(*)-1 есть линейное преобразование, обратное Т^*\ Оно на- называется обычно контраградиентным по отношению к Г. Для краткости письма обозначим соответствующую ему таблицу особой буквой U= Г<*К C2) Мы можем, таким образом, утверждать, что при перемене основ- основных ортов, согласно формуле B9), составляющие всякого вектора испытывают линейное преобразование с таблицей U, определяемой по формуле C2). Таким образом, наши два вектора ? (хь х%, х%) и xr (x[t x'v х'ъ), входящие в преобразование (9), после преобразо- преобразования ортов будут иметь уже другие составляющие, определяемые через прежние по формулам: (Уь У* Уг) = U (*i, *2> х*У> (У ? У*> У в) = U(x'v xv x'9). C3) Нашей задачей, таким образом, является установить линейную зависимость между составляющими (уь уь j/3) и (y'v yv у'%). Мы можем совершить переход от вектора (уь у%, _у3) к новому вектору (yv y'v уз) следующим образом: сначала перейти от вектора (^i> Уь Уъ) к вектору (хь хь х$), что в силу C3) совершается при помощи таблицы U~x. Затем перейти от вектора (х1у х2, хг) к век- вектору (х'и х'ъ х%) при помощи таблицы Л преобразования (9) и, наконец, от вектора (x'v x%> x'^) к вектору (у'^у^у^) при помощи таблицы преобразования U. Окончательно мы будем иметь линейное преобразование следующего вида: C4) Это преобразование называется подобным преобразованию (9), и его матрица UAU~l называется подобной матрице А. Формулируем окончательно полученный результат. Если фор- формулы C3) выражают линейное преобразование составляющих
221 § з. линейные преобразования 87 вектора, вызываемое переменой основных ортов, то всякое линей- линейное преобразование пространства, которое в прежних основных ортах имело вид: xf = Ax, будет иметь в новой координатной системе вид: 22. Ковариантные и контравариантные афинные векторы. Положим, что линейное преобразование (9) выражает просто переход от одной системы декартовых координатных осей к другой, т. е. что его коэффициенты суть направляющие косинусы, определяемые по таблице C). В этом случае, как мы видели в [20], транспонированная таблица Л(*> совпадает с обратной таб- таблицей Л и, следовательно, контраградиентная таблица Л*** будет совпа- совпадать с основной таблицей Л, т. е. Л(*1==Л-1; Л(*)-1 = А C5> Рассматривая неизменный по длине и направлению вектор, мы можем,, конечно, утверждать, что его составляющие преобразуются по тем же самым* формулам (9), что и координаты, т. е. *? = «?1*1 +«12*2+ «13*3 1 *i = eaiX1 + flM.ri + aat.*8 \ C6) *3 = «31*1 + «32*2 + «33*8· J Таким образом, вектор вполне характеризуется тремя числами во всякой фиксированной декартовой координатной системе, и при переходе от одной декартовой системы к другой эти три числа (составляющие вектора) преоб- преобразуются по тем же формулам C6), что и координаты. Предположим теперь,, что мы принимаем в расчет не только переход от одной декартовой системы к другой, но вообще всевозможные линейные преобразования координат с определителем, отличным от нуля, что соответствует, как мы выше видели,, произвольному выбору трех некомпланарных векторов за основные орты. Будем, как и выше, наряду с таблицей Л преобразования C6) рассматривать и контраградиентную таблицу К^Л***". В общем случае они будут различ- различными, и мы имеем таким образом возможность двоякого определения век- вектора при любом линейном преобразовании координат. Во-первых, можно определить вектор как тройку чисел, которая преобразуется при переходе от одной системы координат к другой по тем же формулам, что и сами координаты, т. е. по формулам (*;, х'2, ??) = Л (*1Э x2i хв). C7) Такой вектор назовем контр авар иантным афинним вектором, причем общее линейное преобразование C6) называется иногда афинным преобразо- преобразованием. Иначе, можно определить вектор так, чтобы при всяком линейном преобразовании C6) его составляющие испытывали соответствующее контра- градиентное преобразование, т. е. ?, *2> *з) = V (х1У х2, хш). C8) Такой вектор называется ковариантным афинним вектором. В обоих случаях, имея составляющие вектора в какой-нибудь коорди- координатной системе, мы тем самым имеем его составляющие и во всех дру- других системах координат, получаемых из упомянутой пфи помощи любого
?8 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [22 -афинного преобразования. Приведем примеры векторов обоего рода. Прежде всего радиус-вектор, соединяющий две определенные точки пространства, является, очевидно, контравариантным вектором, так как его составляющие в вышеуказанном смысле слова (разности координат его концов) преобра- преобразуются по тем же линейным формулам, что и сами координаты. Приведем еще пример контравариантного вектора. Положим, что координаты точки (хи х21 х3) суть функции некоторого параметра t, и определим вектор ско- скорости, имеющий составляющие (dx_i dxj d t ' dt » dt t Дифференцируя основные формулы C6) no t> убеждаемся непосред- непосредственно в том, что вектор скорости также является контравариантным век- вектором. Дадим теперь пример ковариантного вектора. Рассмотрим для этого не- некоторую функцию точки f {хи х2) Хв) в пространстве и определим в любой координатной системе вектор, называемый градиентом этой функции и опре- определяемый следующими составляющими: df df df dxt' дх2 * dxs' Согласно правилу дифференцирования сложных функций и формулам C6), •будем иметь: т. е. составляющие градиента в осях (хи х2, хг) выражаются через соста- составляющие градиента в осях (x'v x'21 х'3) линейным преобразованием с табли- таблицей А{*} и, следовательно, составляющие в осях (х[у х'2У х$) через составляю- составляющие в осях (хи х^у х$) выражаются линейным преобразованием с таблицей Л(*)-1 = V, т. е. градиент функции есть действительно ковариантный вектор. Нетрудно выразить формулы C7) и C8) через частные производные новых координат по старым и наоборот. Введем обозначения, несколько отличные от предыдущих, которые являются обычными в теории векторов. Будем у составляющих контравариантных векторов приписывать значок сверху, а у ко- вариантных снизу. В соответствии с этим у самих юоординат будем писать значок сверху. Коэффициенты преобразования C6) можно представить в виде частных лроизводных следующим образом: ?^ C9) Элементы контраградиентной матрицы V будут: V - Aik Vlk~ D(A)· ci те же элементы имеет матрица (Л)***, т. е. т. е. можно сначала перейти к обратной матрице, а потом переставить строки и столбцы. При переходе к обратной матрице коэффициент с &
22] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 891 dx{i) будет -., nk) и после транспонирования получим для элементов матрицы V выражения: Пусть u{S) — составляющие контравариантного вектора в координатах. xkk) и uns) — в координатах х'ш. По определению имеем: Точно так же для ковариантного вектора по определению получим: з "Х^ТТТГ US- D2> пх ' 5=1 Заметим, что мы можем пользоваться этими формулами для определения составляющих вектора не только при линейном преобразовании координат, но и в случае самого общего преобразования, когда одни координаты выра- выражаются через другие при помощи любых, вообще нелинейных, функций. Укажем еще на одну возможность определения ковариантного вектора,, причем контравариантный вектор определяется просто как такой вектор, составляющие которого преобразуются по тем же формулам, что и коорди- координаты. Итак, пусть мы имеем некоторый контравариантный вектор u{S) и ко- вариантный вектор vs. Составим сумму произведений: u{1)vt + ul2)v2 + u{S)v3. D3} Нетрудно видеть, что она остается неизменной, или, как говорят, есть скаляр, если u{S) и vs изменяются по соответствующим им формулам D1) и D2). Действительно, будем иметь непосредственно в силу правила дифферен- дифференцирования сложных функций Таким образом, определив контравариантный вектор указанным выше спо- способом, мы можем определить закон изменения составляющих ковариантного^ вектора из требования, чтобы выражение D3) оставалось неизменным. При- Применяя буквально те же вычисления, которыми мы пользовались в предыдущем номере, мы придем к тому, что при инвариантности выражения D3) соста- составляющие vs должны испытывать линейное преобразование, контраградиентное тому, которое испытывают составляющие u{S). Предоставляем читателю пока- показать, что при любом преобразовании координат (не только линейном) вектор скорости является контравариантным вектором и градиент функции — кова- риантным вектором. В заключение сделаем одно замечание по поводу разницы между контра- вариантными и ковариантными векторами, которые были определены выше чисто формальным образом — формулами перехода от одной системы к другой. Пусть ? — некоторый вектор, заданный своей длиной и направлением. Имея.
-90 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [23 орты, мы образуем составляющие вектора по формуле B8). Назовем эти составляющие сейчас контравариантными составляющими и напишем фор- формулу B8) в виде: ^k. D4) Назовем ковариантной составляющей вектора ? на орт / величину пря- прямоугольной проекции ? на /, умноженную на длину /, и аналогично для двух других ортов. Таким образом имеем для каждой системы ортов три ковари- антные составляющие (хи х3, хв). Можно показать, что они преобразуются при переходе от одних ортов к другим как составляющие ковариантного вектора. Действительно, можно показать, на чем мы не останавливаемся, что в данном случае выражение x{l)xl-\-x{2)x2-\-x{3)xSi будет давать квадрат длины вектора ? и таким образом будет оставаться неизменным при преоб- преобразовании ортов. 23. Понятие тензора. Мы переходим теперь к некоторому обобщению понятия вектора, причем сначала будем рассматривать только линейные пре- преобразования координат. Пусть в некоторой координатной системе задана таблица девяти чисел: bik (*\ * = 1, 2, 3). Составим выражение вида: з ? bikua)v^\ D5) с\?е u{i) и vlk) суть составляющие двух контравариантных векторов. Совер- Совершая переход к новым координатам, мы можем в выражении D5) выразить ит и v(k\ через новые составляющие u'{i) и v'{k) и таким образом преобразуем выражение D5) к следующему виду: з з Sbikua)v{k) = У. b'ikut(i)vt(k\ D6) Мы будем иметь, таким образом, и в новой координатной системе таб- таблицу девяти чисел с элементами b'ik. Такая таблица, определенная в любой координатной системе из требования инвариантности выражения D5), назы- называется ковариантным тензором второго ранга. Точно так же, взяв два -ковариантных вектора с составляющими щ и v^ и образовав выражение з D7) мы, задав 'в какой-либо координатной системе таблицу девяти чисел Ь^*к\ будем иметь из требования инвариантности выражения D7) таблицу девяти чисел и в любой другой координатной системе. Это даст нам так называе- называемый контравариантный тензор второго ранга. Наконец, взяв один контра- вариантный вектор с составляющими u{i) и один ковариантный вектор с соста- составляющими Vk и образовав выражение ? ^«'Ч, D8)
23] I 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 9? мы таким же точно путем придем к понятию смешанного тензора второго- ранга. Покажем теперь, каким образом, имея коэффициенты линейного преобра- преобразования координат C6), можно составить формулы, выражающие составляю- составляющие некоторого тензора в новых координатах через его составляющие в преж- прежних координатах. Остановимся сначала на случае ковариантного тензор* второго ранга. Составляющие u(i) и v{k) контравариантных векторов в преж- прежней координатной системе выражаются через составляющие ur{i) и v'{k) в новой координатной системе при помощи линейного преобразования с таблицей Л. Обозначая элементы этой таблицы через {Л}^, мы будем иметь такими образом: з з Подставляя в выражение D5) и определяя коэффициент при произведении? uni)v'(k\ мы получим выражение для составляющей b'ik тензора в новой? координатной системе: з *?*? ? bpq{A-*)pi{A-%k. D9> Для случая контравариантного тензора второго ранга нам совершенно» так же надо будет выразить составляющие ковариантных векторов щ и Vk через новые составляющие. Согласно определению ковариантного вектора, и\ выражается через щ при помощи таблицы Л'** и, следовательно, щ выра- выражается через и\ при помощи таблицы А{*\ транспонированной по отноше- отношению к Л, и аналогично »,·, т. е.: з з Щ= ? №****> »?=? WkPi Подставляя это в выражение D7), получим формулы преобразования для составляющих контравариантного тензора второго ранга: з *'<*¦*>= 2 b{P'q){A}ip{A}kg. E0). ?, 9=1 Точно так же, для составляющих смешанного тензора второго ранга бу- будем иметь следующую формулу преобразования: ?, Q=\ Еслинмы выразим коэффициенты линейного преобразования через част- частные производные dxt{i) dxd) dx{k) И dxnk) и подставим эти выражения в предыдущие формулы, то будем иметь фор- формулы преобразования тензоров второго ранга для случая любого преобразо- преобразования координат. Совершенно аналогично предыдущему можно определить
92 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [23 понятие и о тензоре ранга выше второго, на чем мы останавливаться не о"удем. В предыдущем мы все время имели дело с таблицей, выражающей ли- линейное преобразование трехмерного пространства в некоторых координатных осях. Пусть это будет таблица В и положим, что мы совершили афинное .преобразование координат по формулам (У1уУ2,Ув)=Л(х1, х2ух3), где А есть некоторая таблица с определителем, отличным от нуля. Как было показано выше, в новых координатах наше преобразование пространства «будет иметь таблицу АВА-К Нетрудно видеть, что такое преобразование таблицы В совпадает с ука- указанным выше преобразованием для смешанного тензора второго ранга. Дей- Действительно, применяя правила для перемножения таблиц, будем иметь сле- следующие формулы: и дальше отсюда 2 g% 2 qppr 9=1 p,q=\ Обозначая Ъ$ вместо {В}ш получим как раз формулы вида E1). Упомянем еще о некоторых тензорах частного вида. Положим, что в некоторой координатной системе ковариантный тензор обладает тем свой- свойством, что bik = bki (?, * = 1, 2, 3). E2) Нетрудно видеть, что он будет обладать этим же свойством и в любой другой координатной системе. Действительно, согласно D9): з ?, q=l «ли в силу E2): bki = ? bqp{A-%k{A-%i9 p,q=\ етли, изменяя обозначения переменных суммирования: з *ы= ? bpqiA-lhk{A-lhu P,q=l откуда непосредственно видно, что b'ki действительно совпадает с Ъ\к. Такой тензор называется симметричным ковариантным тензором. Совершенно аналогично определение симметричного контравариантного тензора. Точно так же, если в некоторой координатной системе &;& = — Ьы или b^i>k^=—b^kti\ то то же будет иметь место и в любой другой координатной системе, и соот- соответствующие тензоры называются кососимметрическими. Для смешанного
4] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 93 тензора указанное обст@ятельство уже не будет иметь места, так что, напри- например, соотношение b^ = b$ не будет инвариантным при преобразовании коор- координат. Мы переходим теперь к рассмотрению некоторых частных случаев тензоров. 24. Примеры афинных ортогональных тензоров. В дальнейших при- примерах мы ограничим линейные преобразования координат лишь теми преоб- преобразованиями, которые были рассмотрены в [20] и которые соответствуют переходу от одной декартовой системы к другой. Такие преобразования на- называются обычно ортогональн-ыми преобразованиями трехмерного простран- пространства. Для них, как мы видели выше, контраградиентное преобразование Л(*)-1 совпадает с Л и исчезает разница ковариантного и контравариантного вектора. Точно так же для этих преобразований координат будем очевидно иметь одно только понятие тензора второго ранга. Обозначая таблицу коэф- коэффициентов ортогонального преобразования координат, как и выше, через {Л}г?, получим для формулы преобразования тензора второго ранга следующую формулу: з Ык= ? bpq{A}ip{A}kq} E3) ?, ?=? которая непосредственно вытекает из формул предыдущего параграфа. Будем толковать элементы каждого столбца таблицы || ?^ || как составляющие неко- некоторого вектора. Мы имели, таким образом, три вектора: Ьа) (biU b2lt bu); b^ (bi2} b22, b,2); b^ (bu, b2Bt bu). Будем говорить, что первый из них соответствует оси хи второй — оси ха и третий — оси xz. Сопоставим теперь любому направлению (п) вектор Ь{п) согласно формуле b{n) = cos (/?, хх) ba) +cos (л, х2) b{2) +cos (/г, хг) biS). E4) Возьмем теперь какие-нибудь декартовы оси (х'и х2У ?'?) вместо преж- прежних (xlt x2y дт3), и составим векторы согласно формуле E4), соответствующие направлениям ыовых координатных осей: &'<*> =oos (x'k, x,) b{1) +cos (x'fc, x2) b^ +cos (х'к, хь) b^. E5^ Рассматривая проекции этих векторов на новые координатные оси x[txf2t xrgt будем иметь таблицу девяти чисел || b\k ||, аналогичную таблице || bik ||· Пока- Покажем, что элементы новой таблицы выражаются через элементы таблицы Ь^ как раз по формулам преобразования составляющих тензоров второго ранга. Действительно, рассмотрим, например, элемент Ь\2. Согласно определению это есть составляющая вектора Ь'{2) на новую ось х[. Формула E5) дает: b'{2) =cos (*;, Xi) b^ +cos (*;, х2) b^ +cos (x'2t xb) V*\ E6) откуда видно, что b'i2) есть линейная функция векторов b{i\ и, чтобы полу- получить Ь'12* достаточно в правой части формулы E6) заменить векторы b{i) их проекциями на ось ?'? ?. е. заменить эти векторы следующими выражениями: bd) — на blt cos (x[t ???) + *2i cos (x[, x2)-\-bBicos (x'v x3) (i = l, 2, 3). Заме- Заметим, кроме того, что, согласно таблице B): cos (xrit xfe) = ?/^ = {Л}^. Подставляя эти выражения вместо упомянутых векторов в правую часть формулы E6), будем иметь: з d
94 ГЛ. П. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [24 что как раз и совпадает с формулой E3). Таким образом мы можем утвер- утверждать, что если для трех взаимно перпендикулярных направлений определены три вектора Ьп\ 6*2>, Ь(Ъ) и по формуле E4) определен вектор для любого направления (я), то таблица девяти чисел, дающих проекции векторов b'ik) (й = 1, 2, 3) на оси xnk) в любой декартовой координатной системе, опре- определяет афинный ортогональный тензор второго ранга, т. е. тензор второго ранга, определенный для всевозможных ортогональных преобразований. Заметим, что когда мы говорим, что ЬA) соответствует направлению не- некоторой оси хи то это не значит, что bll) должен иметь направление оси xt. Существенным является лишь формула E4), которая сопоставляет всякому направлению (п) вектор Ь(П), направление которого, вообще говоря, не сов- совпадает с (я). Приведем теперь два примера афинного ортогонального тензора второго ранга. Первый из этих примеров есть известный из теории упругости тензор напряжения. Рассмотрим деформированное упругое тело и проведем в неко- некоторой фиксированной его точке ? бесконечно малую площадку da с нор- нормалью (я). В теории упругости принимают, что воздействие на упомянутую площадку той части упругой среды, которая находится со стороны опреде- определяемой направлением нормали, будет равносильно произведению некоторого вектора bin), зависящего от направления нормали (я), на величину площадки dc Из рассмотрения условий равновесия бесконечно малого тетраэдра, выделен- выделенного из упругого тела, получается равенство E4), из которого непосредственна вытекает, что напряжение есть тензор второго ранга. В любой декартовой координатной системе этот тензор будет характеризоваться таблицей девяти чисел || bik ||, причем, как доказывается в теории упругости, этот тензор будет симметричным, т. е. bik = bki- Иначе говоря, проекция на ось х-г напряжения* действующего на площадку, перпендикулярную к оси xk, равна проекции на ось Xk напряжения, действующего на площадку, перпендикулярную К ОСИ Х(. Перейдем теперь к другому примеру тензора. Рассмотрим некоторое векторное поле С (??). Если выбрать некоторую декартову координатную си- систему (х1У х2, х$) и взять производные от составляющих поля (си с2, с3) по координатам, то мы получим следующую таблицу девяти величин: dcx dct dct dx[ dx~2 dxt 2 dcs dc2 cx dxs dxa E7) Для любого направления (я) определим вектор, соответствующий этому дс направлению, как производную -^-, так что элементы таблицы E7), находя- находящиеся в k-u столбце, будут давать составляющие вектора, соответствующего направлению оси хь. Для любого направления (я) будем иметь формулу [II; 120): ^ ^| || ,^)g- A = 1, 2, 3), ' т. е. определенная нами таблица представляет собою тензор второго ранга. Этот тензор не будет, вообще говоря, ни симметричным, ни антисимметрич- антисимметричным. Но нетрудно его представить в виде суммы симметричного и антисим- антисимметричного тензора, понимая под суммой двух таблиц сумму соответствую- соответствующих элементов этих таблиц.
125] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 95 Предварительно сделаем некоторые общие замечания. Из линейного ха- характера формул E3) вытекает, что если \\bik\\ и || с,·* |1 будут два тензора, то сумма || ftjfc-f-c/fc || также будет тензором. Кроме того, эта же формула сохраняется при перестановке значков, т. е. з bki = ? bqp{A}ip{A}kqt ?, q=*\ так что если некоторые таблицы, определенные для всех осей, дают тензор, то и транспонированные таблицы дают тензор. Положим теперь, что мы имеем некоторый тензор Ц^1!* Мы можем представить его в виде суммы Первое слагаемое представляет собою, очевидно, симметричный тензор, а второе — антисимметричный тензор. Применяя это разбиение к тензору, определяемому таблицей E7), полу- получим его симметричную часть в виде: E8) Если имеется деформация сплошной среды и МС есть вектор смещения, т. е. тот вектор, на который сместилась точка ? среды, то таблица E8) опреде- определяет так называемый тензор деформации. Антисимметрическая часть тен- тензора будет: 1 2 1 2 dct dxty (дсх , дс2 \ \dxidxj' (дсх , dc3 \ 1 2 1 2 'dxj' * дсЛ dx~J> 1 / 2 \ 1 / 2 \ 5^ dxj дсЛ dxj 0, ? /ac2 2\dxt \_fdc, 2 дсЛ dxj' 1 2 1 2 деЛ dxj' Л дсЛ dxj' 1 2 1 2 /Ar, \ax8 0 де3 dxt дс„ ~дТ, E9) Мы уже раньше производили разбиение тензора на две части для частного случая линейной однородной деформации [II, 125] и видели, что в этом случае антисимметрической части соответствовало вращение пространства, как целого (без деформации), вокруг некоторой оси. 25. Случай /^-мерного комплексного пространства. Обратимся сейчас к общему случаю я-мерного пространства. Вектором в таком пространстве мы раньше уже назвали последовательность ? чисел, вещественных или комплексных [12]: ? (х1у х$у ..., хп), причем эти числа называются составляющими вектора х. Мы считаем при этом, что пространство отнесено к определенным ортам: й()H. 0 0);'а«@, 1, .... 0); ...; а<»>@, 0, ..., 1),
96 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ {25 так что х = хха^ + х^ + · · · + *п*{я)· F0) Условие равенства векторов и простейшие действия над ними были определены в [12]. Линейным преобразованием /2-мерного пространства назовем пере- переход от вектора х(хи хь ..., хп) к вектору у(уь у%, ...,_ул) по формулам: Уi = ??*? + ап*ъ + · - · + ainxn (/ = 1, 2, ..., л), F1) или иначе у = Ах, F2) где А есть таблица или матрица || aik ||f преобразования. Если ее определитель D (А) отличен от нуля, то преобразование F2) назы- называется неособькм преобразованием, а матрица А — неособой матрицей (таблицей). В этом случае, решая уравнение F1) относительно xit получим преобразование, обратное F1) или F2): х = А-*у, F3) гле таблица Л имеет элементы причем через D(A) мы обозначаем определитель таблицы А и через Aik — алгебраические дополнения его относительно элементов aik. Дальше, аналогично предыдущему [21], определяется произведение двух преобразований, а именно последовательное применение двух преобразований у = Ах; z = By равносильно одному линейному преобразованию ? = В Ах, которое называется произведением преобразований А и В и таблица которого определяется по формуле: {BA}ik = %{B}is{A}8k. F5) s==l Это произведение зависит, вообще говоря, от порядка сомножи- сомножителей, т. е., кроме исключительных случаев, мы имеем В ? ? ??. Нетрудно распространить определение произведения на случай любого числа сомножителей, причем имеет место сочетательный закон, т. е. сомножители можно соединять в группы: (СВ)А = С(ВА). F6)
26] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 97 Обратное преобразование удовлетворяет соотношениям АА'1 = А~гА = /; (Л) = А, F7) где символом / мы обозначили так называемую единичную матрицу, у которой элементы, стоящие на главной диагонали, равны единице, а остальные элементы — нулю. Этой матрице соответствует тожде- тождественное преобразование у ? = xt A=1, 2, ..., л). Так же, как и выше, определим диагональную матрицу порядка п: [kl9 kb ..., Ая] = *i 0 0 0 A3 0 0 0 ... 0 ... 0 ... 0 0 0 0 ... k, F8) Ей соответствует преобразование: у{ = ktx (/ = 1, 2, ..., ?). Произведение диагональных матриц не зависит от порядка сомно- сомножителей и определяется по формуле u 4, ¦.., /„] = 9, ..., kn] — В частном случае ^1 = ^2 = ... = ^я = ^ мы получим матрицу A 0 0 0 A 0 0 0 A ... 0 ... 0 ... 0 О 0 0 ... k F9) которой будет соответствовать умножение всех составляющих век- вектора на число k. В соответствии со сказанным в начале настоящего параграфа мы будем считать, что матрица F9) является просто числрм k, т. е. будем считать число к частным случаем матрицы. Нетрудно видеть, пользуясь формулой F5), что произведение числа k, трактуемого как матрица F9), на любую матрицу А не зависит от порядка сомножителей и сводится к умножению всех элементов матрицы А на число А: А, G0)
98 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [26 Положим теперь, что мы взяли за основные орты не векторы a^k\ а новые векторы b^k\ которые выражаются через ?(?) по формулам: il«) G1) причем определитель, составленный из элементов tik, не равен нулю. При этом векторы aSH\ наоборот, выражаются линейно через век- векторы Ь^*\ и всякая линейная комбинация векторов aSk^ есть в то же самое время линейная комбинация векторов Ь^ и наоборот. Иначе говоря, векторы b^k\ как орты, образуют то же пространство, что и векторы a{k). Если некоторый вектор ? в системе координат, опре- определяемой ортам а{к\ имеет составляющие (хи ..., хп% то в системе координат, определяемой ортами bk> он будет иметь другие состав- составляющие (x'v ..., хп), которые выражаются через прежние при по- помощи линейного преобразования, контраградиентного преобразованию G1), что можно записать так: (*;, ..., х'я)=Г*}-1(хи ..., хп), G2) где таблица 7(*} есть транспонированная таблица по отношению к таблице Т, соответствующей преобразованию G1). Если мы имели некоторое преобразование пространства, которое в первоначальной координатной системе выражалось формулой F2), то в новой координатной системе это же преобразование будет выражаться формулой yf=UAU~1xFt G3) где Матрица UAU~l называется подобной матрице Л. Основными понятиями в предыдущем изложении являлись поня- понятия вектора и матрицы. Заметим, что иногда рассматривают вектор х(х19 ..., хп) тоже как матрицу, один из столбцов которой, без- безразлично какой, заполнен числами (xiy ..., хп), а остальные эле- элементы матрицы равны нулю. Положим, например, что мы ставим составляющие вектора в первый столбец. Таким образом мы будем иметь представление нашего вектора в виде матрицы: ? о ... о; ? 0 ... О
26] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 99 Иногда такую матрицу, у которой только один столбец содер- содержит элементы, отличные от нуля, обозначают «имволом :< 0 ... О ? ? О ... О О ... О G4) Покажем теперь, что линейное преобразование F2) может быть записано в виде произведения матрицы G4) на матрицу преобразо- преобразования А Действительно, перемножая матрицу G4) на матрицу А по правилу F5) и принимая во внимание, что у матрицы G4) только элементы первого столбца отличны от нуля, мы получим произведе- произведение в виде матрицы, у которой тоже только элементы первого столбца будут отличными от нуля, и эти элементы, как нетрудно ви- видеть, будут Уь = ап т. е. они дают как раз линейное преобразование F2). Мы можем та- таким образом записать это преобразование в виде: = А ?*}, G5) где справа стоит произведение двух матриц. В заключение настоящего номера отметим еще раз общие законы, которым подчиняются действия с векторами в л-мерном пространстве Если ? и у— какие-нибудь два вектора, то вектор z=y— ? с составляющими (yk — xk) является единственным вектором, удовле- удовлетворяющим условию x-\-z=y. Пусть а и Ъ — какие-нибудь числа. Мы имеем: (а-\-Ь)х = ах-\- Ъх\ a (fix) = (ab) дг; а (х -\-у) = ах -f- ay. Для числа единица мы имеем 1jc = jc и Одг = О, где нуль, стоящий справа, обозначает вектор, у которого все составляющие равны нулю. 26. Основы матричного исчисления. В формулах, приведенных в предыдущем номере, матрица входила в качестве нового символа, над которым мы могли производить и некоторые действия, аналогич- аналогичные действиям над обычными числами. Это приводит нас к естествен- естественной мысли построить новую алгебру, которая годилась бы для символов, под которыми мы подразумеваем матрицы. Иначе говоря,
100 ГЛ. П. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [26 мы будем толковать матрицу как новый вид числа, как некоторое гиперкомплексное число. Совершенно так же, как с помощью двух вещественных чисел мы пришли выше к построению чисел новой природы, а именно комплексных чисел вида a -\-ib, так и теперь мы с помощью я2 комплексных чисел aikf расставленных в виде ква- квадратной таблицы, приходим к понятию нового числа — матрицы. Но только надо отметить их существенную разницу. А именно, мы видели, что над буквами, изображающими комплексные числа, можно производить все формальные операции алгебры, известные для вещественных чисел. Для матриц мы получим алгебру, существенно отличную от известной нам алгебры комплексных чисел. Существен- Существенным моментом, который вызывает это отличие, является некем му- тативность умножения, т. е. зависимость результата умножения от порядка сомножителей. Мы переходим сейчас к установлению основных правил алгебры матриц, причем во многих отношениях руководящим путем для нас будут служить те результаты, которые мы получили выше, толкуя матрицу как таблицу линейного преоб- преобразования. Везде в дальнейшем, если не будет оговорено особо, мы будем рассматривать квадратные матрицы одного и того же порядка п. Если А — такая матрица, то, как и выше, ее элементы будем обо- обозначать через {A}ik, Две матрицы А и В считаются равными тогда и только тогда, когда {A}ik={B}ik (/, k=l, 2,..., п\ G6) т. е. когда все их соответствующие элементы одинаковы. Сложение матриц определяется пс формуле: т. е. сводится к сложению соответствующих элементов. Произведение определяется по формуле: G7) G8) Как мы выше видели, вообще говоря, В ? ? АВ, но имеет место сочетательный закон [21]: (СВ)А = С(ВА). G9) Определитель произведения равен произведению определителей перемножаемых матриц: D(A). (80)
26] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 101 Имеет место, очевидно, и распределительный закон: (А + В)С=АС-\-ВС и С(А-\-В)=СА+СВ. (81) Отметим еще одну особенность умножения, а именно произведе- произведение матриц может обращаться в нуль, т. е. в матрицу, у которой все элементы равны нулю, хотя все сомножители и отличны от ну- нуля. В качестве примера приведем произведение двух одинаковых матриц второго порядка 10 0 11 ПО 0 || II О 0 || 1 0 I || 1 0| I 0 0 I · Совершенно так, как было указано в предыдущем номере, вводится понятие обратной матрицы Л, если А — неособая матрица, т. е. если О{А)ф0. Если С = ВА и RA, RB и Rc— ранги матриц А Ву С, то, как мы видели, Rc^Ra [7]· Если В — неособая мат- матрица, то A = B~iCi и, как и выше, можно утверждать, что RA^RC и, следовательно, Rc = RA, т. е. при умножении матрицы А на не- рсобую матрицу В (справа или слева) ее ранг не меняется. Для единичной матрицы / имеет место соотношение В1 = 1В = В, (82) где В — любая матрица. Нетрудно видеть, что матрица А~1 является единственным реше- решением уравнений АХ=1 и XA — U (83) где / — единичная матрица. Действительно, умножая, например, пер- первое из этих равенств слева на А'1 и принимая во внимание G9) и F7), получим Х=А~Х и аналогично для второго уравнения. Отме- Отметим, что если D(A) = 0, то уравнения (83) вовсе не имеют решений, т. е. матрица А не имеет обратной. Действительно, как следствие уравне- уравнений (83), имеем: D(A) D(X)= 1, что противоречит условию D(A) = 0. Напомним также понятие диагональной матрицы, введенное в пре- предыдущем номере, а также того, что всякое число k можно рассмат- рассматривать как частный случай матрицы. Нетрудно ввести понятие целой положительной степени матрицы АР = А-А- · -А. Целые отрицательные степени матрицы вводятся как целые поло- положительные степени обратной матрицы, т. е. Д-Р = (А-у. (84) Имеем, очевидно: = (А*)-1, т. е. А-рАр = АрА~р = 1. (85)
102 ГЛ. IT. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [26 Символ частного двух матриц В не имеет определенного смысла. Мы можем толковать его двояко — или как произведение АВ~1, или как произведение В~1А> причем эти два произведения, вообще говоря, различны, и только в тех частных случаях, когда они совпадают, символ частного имеет определенный смысл. Далее, основным понятием является понятие подобных матриц, ко- которое мы также ввели в предыдущем номере. Отметим некоторые очевидные формулы {СВАТ1 = А-ХВГ1СГ\ (86) СВАС'1 = (СВС~1) (САС~1). (87) Если через Л(*> обозначить матрицу, транспонированную по от- отношению к А, то имеет место формула: (СВАУ*> = Л <*> ?(*> С<*>, (88) которую нетрудно проверить, пользуясь определением умножения. Введем два обозначения. Обозначим через А матрицу, элементы ко- которой суть числа, сопряженные с элементами матрицы А, т. е. {Т}«=1Г},ь (89) причем символом ? обозначаем комплексное число, сопряженное с а, и через А матрицу, которая получается из А, если строки заменить столбцами и все элементы — сопряженными числами, т. е. \A}ik = \A}ki. (90) Матрица А называется иногда сопряженной или эрмитовски со- сопряженной с матрицей Л1). Нетрудно проверить формулу СВА=АВС (91) Предлагаем проверить также следующую элементарную формулу: т. е. что знак обратной матрицы и транспонирования можно менять местами, о чем мы уже упоминали и выше [20]. Отметим еще одну полезную в дальнейшем формулу. Из соотно- соотношения F7) непосредственно вытекает D(A)D{A~l)=\, *) По имени французского математика второй половины XIX века — Ш. Эрмита.
26] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 103 т. е. D{A~l) = D(Arl. (92) Иначе говоря, определитель обратной матрицы обратен по вели- величине определителю основной матрицы. Введем еще понятие квазидиагональной матрицы, являющейся обобщением диагональной матрицы. Выясним это понятие сначала на частном случае. Пусть имеется матрица седьмого порядка вида: Ьп Ьп Ьп 0 0 0 0 hi bn bn 0 0 0 0 hx Ьъг 0 0 0 0 0 0 0 сп сп 0 0 0 0 0 <721 сш О О О 0 0 0 0 dn dn О 0 0 0 0 dn dn Обозначим через В матрицу третьего порядка с элементами bikt а через С и D — матрицы второго порядка с элементами cik и dik. Предыдущая матрица седьмого порядка называется квазидиагональ- квазидиагональной структуры {3, 2, 2} и обозначается символом [Д С D]. Положим вообще, что главная диагональ матрицы порядка я, состоящая из элементов aiit разбита на т частей, причем первая часть состоит из первых kx элементов, вторая из следующих &2 эле- элементов и так далее, так что kl-\-...-\-km = n. Мы можем рассмат- рассматривать первые kx элементов как главную диагональ некоторой матри- матрицы ?? порядка ki\ следующие ?2 элементов — как главную диагональ некоторой матрицы Х2 порядка kq и так далее. Положим, что все элементы нашей матрицы Л, не принадлежащие к матрицам Х& рав- равны нулю. При этом матрица А называется квазидиагональной матри- матрицей структуры {klt ..., km} и обозначается следующим образом: А = [ХЪ Хъ ..., Х^. Правила действия с квазидиагональными матрицами одинаковой структуры отличаются большой простотой. Мы приведем соответ- соответствующие формулы, не останавливаясь на их доказательстве. Оно мо- может быть проведено совершенно элементарно на основе определения действий. Для сложения квазидиагональных матриц одинаковой стру- структуры мы имеем формулу [Хь Хь ..., Xm] + [Yu Уь ..., ??] = Yb **+ Yb ·.·, Хт+ Yml (93) причем одинаковость* структуры равносильна тому, что порядок вся- всякой матрицы Xk совпадает с порядком соответствующей матрицы Yk,
104 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ J27 Точно так же для умножения и возвышения в степень имеем: [Yu К* .... YmUXu X*.... xm] = [YiXu Y*X, YmXm\ (Щ [Хь Хь..., Хт]р = [ХЧ, ХР, ...,Х>Я\ (95) где ?— любое целое положительное или отрицательное число, при- причем, если ? есть целое отрицательное число, то необходимо, конечно, требовать, чтобы определители D{Xk) были отличны от нуля. Правило подобного преобразования матрицы \ХЪ Хь ..., Хт\ при помощи матрицы той же структуры выражается формулой: Отметим геометрический смысл тех линейных преобразований которые доставляются квазидиагональными матрицами. Рассмотрим для простоты случай указанной выше квазидиагональной матрицы седьмого порядка, структуры {3, 2, 2}. Рассмотрим линейное пре- преобразование, соответствующее этой матрице. Если в первоначальном векторе {хь ..., ??) мы имеем: лг4 = х5 = л:6 = ^7 = 0, то и в пре- преобразованном, очевидно, будет: yk = у% = у% =Уч == 0, т. е., иными словами, все векторы, которые принадлежат подпространству, обра- образованному тремя первыми основными ортами, и после преобразования будут принадлежать этому подпространству, и само преобразование будет определяться матрицей третьего порядка В. То же относится к подпространству, образованному следующими двумя ортами, щ наконец, к подпространству, образованному последними двумя ортами. Напомним при этом, что подпространством, образованным век- торами х{1\ ..., х^1\ мы называем совокупность векторов, опре- определяемых формулой ><'> где сь ..., сь — произвольные постоянные. 27. Характеристические числа матриц и приведение матриц к каноническому виду. Подобные матрицы не равны, конечно, между собою в смысле G6), но в геометрическом смысле равносильны в том отношении, что они осуществляют одно и то же линейное пре- преобразование пространства, но выраженное в различных координатных системах. Мы займемся сейчас разысканием инвариантов этих матриц, т. е. таких выражений, составленных из элементов, которые имели бы одинаковое значение для всех подобных матриц. Нетрудно составить один из таких инвариантов. Это будет определитель матрицы. Дейст-
27] § 3. ЛИНРЙНЫЕ ПРЕОБРАЗОВАНИЯ 105 вигельно, пусть А—некоторая матрица и UAU'1— ей подобная, причем U—любая матрица с определителем, отличным от нуля. Мы имеем в силу (80) и (92): Чтобы построить еще другие инварианты, образуем полином ? (?) степени ? от некоторого параметра ?, равный определителю матрицы, которая получается из матрицы А, если мы вычтем из всех ее диагональных членов параметр ?, ?. е. положим ап — ? ?? ... а1п (97) Ц1 Па ПП где alk — элементы матрицы А. Иначе мы можем записать это так: ? (?) = D (А — ?) = D (A — ?/), (98) ибо по условию ? или ?/ есть диагональная матрица, у которой все Элементы, стоящие на главной диагонали, равны ?. Подставляя UAU~X вместо А и принимая во внимание, что любая матрица переместитель- на с числом ? и, следовательно, ?/?^/~1==?, будем иметь: т. е. D(UAU~l ~X) = D(A — ?). (99) Мы видим, таким образом, что полином (97), составленный для матрицы UALTlt совпадает с таким же полиномом, составленным для матрицы А. Иными словами, все коэффициенты полинома (97) cyib инварианты по отношению к подобным матрицам. Старший коэффициент написанного полинома, как легко видеть, равен (—1)п. Отметим особо два его коэффициента, а именно свободный член и коэффициент при (—1)??'1. Первый из них равен, очевидно, определителю, и этот инвариант мы уже отметили и раньше. Что же касается коэффициента при (—?)""^", то, пользуясь результатами [5], мы видим, что он совпадает с суммой диагональных элементов. Эта сум- сумма называется обычно следом матрицы и обозначается следующим образом: где Sp есть начальные буквы немецкого слова «Spur», что значит ??-русски «след» (французское «trace»). Итак, подобные матрицы имеют одинаковый определитель и одинаковый след. Напишем теперь уравнение ?) = 0, A00)
106 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [27 которое называется характеристическим уравнением матрицы А, а его корни—характеристическими числами, или собственными значениями матрицы А. Согласно предыдущему, мы можем сказать, что подобные матрицы имеют одинаковые характеристические числа. Мы уже имели уравнение вида A00) раньше. Поставим теперь следующий вопрос: нельзя ли найти матрицу Vf совершающую преобразование подобия от заданной матрицы А к матрице V~lAV так, чтобы последняя матрица была диагональной матрицей. Иными словами, с точки зрения линейных преобразований пространства, нельзя ли выбрать такие координатные оси, в которых линейное преобразование, характеризуемое в первоначальной системе координат матрицей Д сводилось бы просто в новых осях к пре- преобразованию ъшъ yk = \kxk. Заметим, что мы пишем подобную матри- матрицу в виде VхА V вместо прежнего вида UAU~l, что не имеет, конечно, существенного значения. Мы можем записать наше условие в виде: VlAV=[K К ..·, ??], A01) где искомыми являются элементы матрицы V и числа ??. Можно, очевидно, переписать это условие, умножая обе части слева на V, в виде: AV=V[\b К ...?.]. A02) Определим по формуле F5) элементы обеих частей написанно- написанного равенства со значками ink. Таким образом мы получим л3 урав- уравнений: , 5=1 где aik и vik — элементы матриц А и V. Фиксируя второй значок k и полагая г=1, 2, ..., л, получим ? уравнений, содержащих только элементы vlk, ..., vnk столбца матри- матрицы V с номером k и число ??: ? Wsk = hvik (/ = 1, 2, ..., ?). A03) Если мы будем считать элементы (vlk, ..., vnk) как составляющие некоторого вектора ю^к\ то можем записать предыдущее равенство в виде одного векторного равенства: Л*<*> = ХЛ«<*>. A04) Мы видим таким образом, что разыскание матрицы V, которая приво- приводит матрицу А к диагональной форме, сводится к разысканию таких векторов v^k\ которые воспроизводятся с точностью до численного
27J * 3· ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 107 множителя в результате линейного преобразования, определяемого матрицей А. Этот факт является алгебраическим аналогом того факта современной квантовой механики, согласно которому матричная меха- механика Гейзенберга по существу равносильна волновой механике Шрёдин- гера. Согласно первой точке зрения, существенным вопросом является задача приведения некоторой матрицы (бесконечной) к диагональной форме. Что же касается волновой механики, то здесь основным вопро- вопросом является задача отыскания таких векторов (в пространстве с бес- бесчисленным множеством измерений), которые бы воспроизводились с точностью до численного множителя в результате некоторого линей- линейного преобразования. Предыдущие соображения мы назвали алгебра- алгебраическим аналогом потому, что ограничиваясь пространством с конечным числом измерений, мы приводим наши задачи к чисто алгебраическим задачам. В более же сложных случаях пространства с бесчисленным множеством измерений мы существенным образом выходим из рамок обычной алгебры и нуждаемся в аппарате анализа. Более подробно все эти вопросы будут выяснены впоследствии, причем заметим, что для приложений к физике в рассматриваемом случае конечного чис- числа измерений достаточно ограничиться матрицами А частного типа (эрмитовские матрицы, у которых aki = aik) и, кроме того, матрица U также должна быть определенного типа (унитарная матрица, опре- определение которой будет дано ниже). Здесь мы рассматриваем общий вопрос для любой конечной матрицы, причем ограничимся лишь при- приведением окончательных результатов, не приводя полностью доказа- доказательство. Для тех задач, которые будут интересны в приложениях, вопрос будет решен полностью. Переходим к решению системы (ЮЗ) или A04). В раскрытом виде мы можем записать ее так: A05) («и — К) ^ik + anvu +... + alnvnk = 0 \k) vik -f... + a2nvnk = 0 — ??) vnk = 0. Для того чтобы получить для (vlk9 ..., vnk) решение, отличное от нулевого, необходимо и достаточно, чтобы определитель написанной системы был равен нулю, т. е. необходимо и достаточно, чтобы число Xfe было корнем характеристического уравнения. Разберем под- подробно лишь тот случай, когда это уравнение имеет различные корни. Обозначим эти корни через Хь ..., ??. Подставляя в коэффициенты системы A05) вместо lk первый корень ?^ мы сможем определить из нее элементы первого столбца таблицы V, причем не рассматри- рассматриваем вопроса о том, насколько широк будет выбор этих величин ??. Выберем решение системы каким-нибудь одним определенным обра- образом, лишь так, чтобы оно было отлично от нулевого.
108 ГЛ. П. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [27 Точно так же, заменяя в коэффициентах системы A05) ?? = ?2, мы сможем определить элементы второго столбца матрицы V и т.д. до я-го столбца. Равенства A05) равносильны A02), и чтобы перейти к основному равенству A01), нам надо только, чтобы V имела обрат- обратную матрицу V"l9 т.е. чтобы определитель V был отличен от нуля. Будем доказывать это от противного. Положим, что он равен нулю. Как мы знаем [12], это равносильно тому, что между векторами <о^к\ определяемыми столбцами матрицы V, существует линейное соотно- соотношение: где не все коэффициенты Ck равны нулю. Применим к обеим частям этого равенства (п— 1) раз преобразование, определяемое матрицей А Пользуясь A04), будем иметь ? равенств: n~l Cnv{n) = 0. Принимая во внимание, что не все векторы Ckv^k) равны нулю, можем утверждать, что определитель написанной системы должен равняться нулю: 1 1 ... 1 ?3 ... ?,, n-\ ?-? 2 где числа \к по условию различны. Но последнее равенство проти- противоречит тому, что определитель Вандермонда от неравных чисел отличен от нуля. Таким образом мы доказали возможность приведе- приведения матрицы преобразованием подобия к диагональной форме для то- того случая, когда все характеристические числа матрицы различны. В том случае, когда среди характеристических чисел имеются рав- равные, может случиться, что матрица не может быть приведена пре- преобразованием подобия к диагональной форме. Все же и в этом слу- случае существует наиболее простое или, как говорят, каноническое представление матрицы. Это каноническое представление в том слу- случае, когда матрица приводится к диагональной форме, имеет вид: [??, ?2,..., лл], где Xk — характеристические числа матрицы. Для общего случая сфор- сформулируем лишь результат1). Пусть ? = ? является корнем уравнения ') Его доказательство приводится в специальном дополнении в конце еторой части этого тома,
27] §3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 109 A00) кратности k. Положлм далее, что для всех определителей по- порядка (п—1) таблицы, стоящей в левой части уравнения A00), чис- число ? = ? является корнем кратности kb но не выше, т.е. все эти определители делятся на (? — a)kl, но хоть один из них не делится на (? — ?)** +4. Положим далее, что все определители упомянутой таблицы порядка (п — 2) имеют ? = а корнем кратности kb но не выше, и так дальше, и, наконец, все определители порядка (п — т) имеют упомянутый корень кратности km а хоть один из определи- определителей порядка (п — т—1) уже вовсе не обращается в нуль при ? = ?. То же самое будет, очевидно, иметь место и для определите- определителей более низкого порядка. Можно доказать, что числа ks убывают: k^>kx^>k%^>.. >^>km. Введем следующие положительные целые числа: причем, очевидно, Биномы: (? —?/?; (? — (? — cCfm+\ называются элементарными делителями матрицы А, соответствую- соответствующими корню ? = ?. Мы можем таким образом определить элемен- элементарные делители для всех характеристических чисел матрицы Д в результате чего получим совокупность элементарных делителей: (? _ где A06) A07) и среди чисел Хй могут быть и одинаковые. Выше мы видели, что характеристические числа не меняются при преобразовании подобия. Оказывается, что таким же свойством обладает и совокупность элементарных делителей матрицы. Введем теперь некоторые новые, простейшие матрицы /р (а). Мы подразу- подразумеваем под этим матрицу порядка р, у которой на главной диаго- диагонали везде стоит число а, на следующей нижестоящей диагонали стоит везде единица, а остальные элементы равны нулю: · а 1 0 0 0 0 а 1 0 0 0 0 а 0 0 ... 0 ... 0 ... 0 ... а ... 1 0 0 0 0 а A08)
ПО ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [28 Основным фактом в вопросе о представлении матриц в кано- канонической форме является следующий результат: если матрица А имеет элементарные делители A06), то существует такая матрица U с определителем, отличным от нуля, что UAU-1 = [7Pl (U /Р2 (U ..., /Рр (ХД A09) Заметим,' что если известны все характеристические числа матрицы Д то нахождение матрицы U сводится к элементарным алгебраическим операциям. Если р=1, то под /р(а) мы подразуме- подразумеваем просто число а. Может случиться, что и при наличии одина- одинаковых характеристических чисел все элементарные делители A06) будут простыми, т. е. будут иметь вид: (?-??; (?-?2); ...; (?-??). В этом случае квазидиагональная матрица превращается просто в диагональную матрицу [Хь ..., ??], и матрица приводится к диагональной форме. Нетрудно доказать, что для возможности приведения матрицы к диагональной форме необходимо и достаточно, чтобы ранг таблицы коэффициентов в системе A05) был равен (п — р^), где ?? — крат- кратность корня Xft векового уравнения. При выполнении этого усло- условия система A05) определит pk линейно-независимых векторов (vlky *>%*---> vnk) [?]. Отметим, что матрица U, входящая в формулу A09), определя- определяется не единственным образом. В частности, если d — величина опре- определителя матрицы U, то в формуле A09) можно заменить U на г^— U и U'1 на j/?" С/, ? d т. е. можно считать, что в формуле A09) определитель матрицы U равен единице. Этими указаниями мы и ограничимся в общей задаче приведения матриц к каноническому виду. Мы вернемся к этой зада- задаче в специальном добавлении ко второй части третьего тома. Как уже упоминалось выше, мы будем дальше рассматривать подробно эту задачу для матриц особого типа. 28. Унитарные и ортогональные преобразования. В этом и следующих номерах мы будем пользоваться понятиями скалярного про- произведения и нормы (длины) вектора, которое было введено в [13]. Напомним, что квадрат нормы (длины) определяется формулой:
28] § 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 111 или, в случае вещественных составляющих, Это определение нормы связано с определенным выбором основ- основных ортов, т. е. координатных осей. Мы будем называть координат- координатную систему с указанным выше определением нормы нормальной, или декартовой, системой. Помимо длины вектора было определено еще скалярное произведение двух векторов следующей формулой: (лг, у) = ??У\ + *гУъ + · · · + *пУп- AН) В случае вещественных векторов эта формула принимает более сим- симметричный вид (X, У) = ХгУ\ + *ъУъ + · · · + ХпУп- Из A11) вытекает, что при перестановке порядка векторов величина скалярного произведения переходит в сопряженную, т. е. (у, х) = (^Гу). A12) Два вектора мы назвали перпендикулярными или ортогональными если их скалярное произведение равно нулю. В дальнейшем всегда будем считать, если не оговорено особо противоположное, что мы имеем дело с декартовой системой коор- координат. В связи с этим приобретают особое значение те линейные преобразования, которые соответствуют переходу одной декартовой системы в другую. Мы знаем, что всякому Переходу от одних ор- ортов к другим соответствует линейное преобразование составляющих. Пусть имеется такое преобразование .... *«), (из) причем первоначальная система координат была декартовой. Для того чтобы и новая система была декартовой, необходимо и доста- достаточно, чтобы длина вектора и в новой системе выражалась суммой квадратов модулей составляющих, т. е. \У1? + .~+\УпГ = \*1\* + :.+ \*п\*· ОН) Покажем, что при этом величина скалярного произведения и в новой системе координат выразится формулой, аналогичной A11). Действи- Действительно, положим, мы имели в первоначальной системе координат два вектора x(xlf ..., хп) и xf(x\, ...,х'п\ причем в новой системе им соответствуют векторы У(Уъ ..., Уп) и У'Ы, ·.·. Уп)·
112 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [28 Составим два новых вектора z = x-\~x' и и = ? -}- ix\ которые имеют составляющие (xk-\-Xk) и (xk -J- ix'u). Считая условие A14) выполненным, будем иметь: ? (Уи +yi)(Ум +У'к) = откуда, опять-таки в силу A14), получаем окончательно l ибо ???*?·==??**?·? Точно так же: ) (ук - fa)= и отсюда ? (y'tf* —УкУ'к)=? (*'kXk - xk3c'k). A152) Равенства A15^ и A152) дают т. е. скалярное произведение действительно выражается прежней формулой. Таким образом, если преобразование A13) удовлетворяет условию A14), то оно удовлетворяет и условию A16), т. е. остав- оставляет неизменным величину скалярного произведения. Наоборот, из условия A16) вытекает A14), если положить в A16) x^ = xh так как скалярное произведение двух одинаковых векторов сводится, очевидно, к квадрату длины вектора. Линейные преобразования, удовлетворяющие условию A14) или условию A16), называются обычно унитарными преобразованиями. Если рассматривать вещественное пространство и вещественные матрицы линейных преобразований, то условие A14) сведется просто к условию iJ+!=.«fi + Jfi+... + JfS. A17) и соответственные вещественные преобразования называются орто- ортогональными. Они являются, очевидно, частным случаем унитарных.
28] % 3. ЛИНРЙНЫВ ПРЕОБРАЗОВАНИЯ 113 Переходим, теперь к выяснению основных свойств унитарных пре- преобразований. Напишем для преобразования A13) условие A14) в яв- явной форме, обозначая через uik элементы матрицы U: или ? ? ? («*?*?+· · ·+«*«*·) (й*л+· · ·+«*·*»)=? *?· ?1 · 8> Раскрывая скобки в левой части формулы и приравнивая коэффи- коэффициенты при хрхр единице, а при XpXq(p^q) нулю, будем иметь не- необходимое и достаточное условие для элементов унитарного пре- преобразования в следующей форме: 5>*,|·=1 (? =1.2 ?), A19) т. е. сумма квадратов модулей элементов каждого столбца должна равняться единице и сумма произведений элементов некоторого столб- столбца на величины, сопряженные с соответствующими элементами другого столбца, должна равняться нулю. Иногда эти условия еще записывают так: где ??? суть элементы единичной матрицы, т. е. Выше мы применили к тождеству A18) метод неопределенных коэффициентов. Это является, конечно, достаточным для выполнения тождества. Нетрудно показать, придавая xk частные значения, что тождественность коэффициентов при подобных членах является и необходимым условием. Возьмем определитель D(A) и другой определитель D (Л), состав- составленный из сопряженных элементов. Умножая их по схеме столбец на столбец [6], мы получим, в силу A19), определитель единичной матрицы, т. е. единицу. С другой стороны, очевидно, что оба
114 ГЛ. П. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [28 упомянутых определителя будут выражаться комплексными сопряжен- сопряженными числами, и из сказанного непосредственно следует т. е. квадрат модуля определителя унитарной матрицы равен еди- единице. Иначе говоря, определитель унитарной матрицы по модулю равен единице, т. е. выражается комплексным числом вида е1(?, где ? — вещественно. Введем в рассмотрение матрицу U^*\ транспонированную с U. Ус- Условия A19), которые называются обычно условиями ортогональности по столбцам, могут быть записаны в виде следующего матричного равенства: U{*)U=I, A22) что равносильно U~1=T/i*) = U> A23) т. е. если матрица унитарна, то обратная ей матрица совпадает с эр- митовски-сопряженной матрицей. Преобразование 1Г\ обратное ?/, выражает переход от вектора у к вектору х. Оно также, очевидно, удовлетворяет условию унитар- унитарности A14), т. е. если U — унитарная матрица, то и обратная LT1 бу- будет унитарной. Иными словами, в силу A23), матрица U будет уни- унитарной, и ее столбцы удовлетворяют условию ортогональности. Но столбцы 0 суть строки ?/. Мы можем таким образом утверждать, что в унитарной матрице не только столбцы, но и строки удовлетворяют условиям ортогональности, т. е. наряду с формулами A20) будем иметь также формулы 2>?*^ = ??. A24) Аналогично предыдущему, если матрицы U\ и ?/2 удовлетворяют ус- условию A14), то и их произведение U^Ui также, очевидно, будет удо- удовлетворять этому условию, т. е. произведение двух унитарных матриц есть также унитарная матрица. Укажем две различные формы, в которых можно представить опре- определение унитарной матрицы: |f/Af = |л;|а или (i/jc, ??? = (*, ??, A250 причем в последнем равенстве ? и хг — любые векторы. Отметим теперь те обстоятельства, которые будут иметь место, если унитарная матрица имеет вещественные элементы. В этом случае, как мы уже говорили, она называется ортогональной и соответству- соответствующее ей преобразование — ортогональным преобразованием.
29] § з. линейные преобразования 115 В данном случае вместо формул A20) и A24) мы будем иметь формулы ? ? ? ukP UH = 1pv ? ирь ия* = Ьрг Кроме того, определитель преобразования должен быть, очевидно, вещественным числом, а потому его величина может равняться лишь -+-1. Эти вещественные ортогональные преобразования в л-мерном пространстве являются полным аналогом тех преобразований трехмер- трехмерного пространства, которые мы рассматривали в [20]. В этом вещест- вещественном случае, кроме того, U совпадает с (j(*\ т. е. обратное пре- преобразование U~l получается из U заменой строк столбцами. Отметим еще, что всякое комплексное число е1(?, где ? — вещест- вещественно, рассматриваемое как матрица [el(?y el<9f..., <???], представляет со- собою унитарную матрицу, и если U есть унитарная матрица, то и про- произведение ei(?U есть унитарная матрица. Смысл произведения числа на матрицу указан нами в [25]. 29. Неравенство Коши — Буняковского. Установим в настоящем параграфе одно неравенство, которым нам придется пользоваться в дальнейшем. Оно состоит в следующем: каковы бы ни были вещест- вещественные числа аь а2,..., ат и рь ?2, ...,рт, имеем: ^??*·?^. 026) причем знак равенства будет иметь место тогда и только тогда, ко- когда (xk и $k пропорциональны: -,-^ —— тл- Пусть ? — любое вещественное число. Составим сумму: которая, очевидно, неотрицательна. Знак равенства будет иметь ме- место тогда и только тогда, когда кр, оедо, орцате сто тогда и только тогда, когда и в этом случае, очевидно:
116 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [20 Вообще же говоря, раскрывая в выражении «S скобки, получим трех- трехчлен второй степени S=AP где Написанный трехчлен при всех вещественных ? остается неотрицатель- неотрицательным, откуда следует: АС — В*^0у т. е. В*^АС, что и приводит к неравенству A26). Если АС — ??2 = 0, то трехчлен при некотором вещественном ? должен обращаться в нуль, а при этом, как мы видели, должно выполняться условие A27). Наоборот, при выполнении этого условия в формуле A26) имеет место знак равенства. Положим теперь, что ?? и (?? — комплексные числа. Принимая во внимание, что получим, применяя к последней сумме, состоящей из положительных слагаемых, неравенство A26): A26?) Нетрудно показать, что в данном случае, при комплексных ?? и $k> знак равенства будет иметь место тогда и только тогда, когда | ?? | и | рА | пропорциональны и все произведения ???? имеют одинаковый аргумент. Неравенство A26) применимо не только к суммам, но и к интегралам, как мы об этом уже упоминали раньше [11,161]. Если /j(jc) и/2(лг) — две вещественные функции в промежутке а то неравенство для интегралов имеет вид: [\fx (*)/. (х) Лх]% *? \П (х) ^ · \Г% (х) dx. A26S) ? ? ? Действительно, составим выражение где t — любое вещественное число. Из вида левой части следует, что это выражение ни при каких вещественных I не может быть отрица- отрицательным. Но если трехчлен ??* — 2?? -(- С при всех вещественных ? не отрицателен, то, как известно из элементарной алгебры, АС-~
30J I 3. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 117 0. В применении к предыдущему трехчлену это и дает неравенство A262). Это неравенство для интегралов впервые бьш> доказано В. Л. Буняковским. Для сумм оно встречалось у Коши. 30. Свойства скалярного произведения и нормы. Отмети» теперь некоторые свойства скалярного произведения и нормы. При- Применяя неравенство A26t) и принимая во внимание, что | j/A | = [уА |,, можем написать: K*,jOI ^11*11-11* II· Докажем теперь так называемое правило треугольника II*+jMKII*II-HM|. A29) Мы имеем: И*+*И' = (*+* *+*)=(*, *) + (* *) + (*, У) + (У, X), или, принимая во внимание A28), получим: откуда и следуег A29). В заключение настоящего номера рассмотрим, какое влияние ока- оказывает выбор системы координат на метрику пространства, т. е. на выражение квадрата длины вектора. Положим, что вместо основной декартовой мы берем новую систему координат, причем за основные орты принимаем некоторые независимые векторы Для любого вектора будем иметь: где zk — его составляющие в новой координатной системе. Квадрат длины этого вектора будет выражаться скалярным про- произведением вектора на самого себя, т. е. | ? |2 = (г,**» +... + znz*\ zx*b + ¦ · · + Раскрывая это, согласно вышеуказанным формулам, будем иметь следующее выражение для квадрата длины вектора: ? 1*1'= ? ¦»**!** A30) I, *— 1
118 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [31 где коэффициенты <iik определяются по формулам При перестановке значков они, очевидно, переходят в сопряженные, т. е. 4i = *ik- A31) Сумма вида A30) с коэффициентами, удовлетворяющими условию A31), называется обычно формой Эрмита. Непосредственно очевид- очевидно, что всякое выражение вида A30) при условии A31) будет иметь при всевозможных комплексных zk лишь вещественные значения, так как при ? ? k два члена суммы A30) будут сопряженными, а в чле- членах вида a-kk\zk\*> в СИ^У условия A31), коэффициенты dkk будут вещественными. Кроме того, по самому построению формы Эрмита {130), в данном случае мы можем утверждать, что сумма A30) будет неотрицательной и будет обращаться в нуль только тогда, когда все zk равны нулю. Формула A30) и определяет метрику пространства в новой координатной системе. Метрика A30) будет совпадать с метрикой (ПО) в соответствую- соответствующей декартовой системе, если ?/? = 0 при / ? k и ???=1, или (zSl\ #(*>) = 0 при / ? k и (z{k\ ?^)=1, т. е., иначе говоря, если векторы з№\ принятые нами за орты, будут взаимно ортогональными единичными лекторами (длины единица). В дальнейшем всякую систему взаимно ортогональных и единичных векторов 2?(*)(А?=1> 2,..., /) мы будем называть ортонор миро ванной системой. Заметим еще, что если формула A13) определяет унитарное преобразование для составляющих вектора, то соответствующее пре- преобразование для перехода от прежних ортов к новым будет даваться таблицей контраградиентной ?/. В данном случае, в силу A23), эта таблица будет совпадать с таблицей ?/, а для вещественных ортогональных преобразований она будет просто совпадать с U. 31. Процесс ортогонализации векторов. Положим, что нам даны т каких-нибудь линейно-независимых векторов дгA),.., х{тК Сово- Совокупность векторов вида: где Cft — произвольные коэффициенты, определяет все наше про- пространство, если т = п, и некоторое подпространство Rm измерения т, если т<^п. Покажем, что мы всегда можем построить ортонорми- рованную систему векторов #(*)(?= 1, 2,..п т\ которая образует
81) ? я. линрйиыр прровраэовлния 11& ?? же полпространсгво Rmy что и векторы х(кК Иначе говоря, должны выражаться линейно через ?№ и, наоборот, ?№ должны ныражаться через z^h\ Эти векторы мы можем построить по следую- следующей схеме: У*> = *<·> —(*<»>, »(*) A32) где Вектор z{l) получаегся из У1) простым делением на длину У!) и, следовательно, длина #A) равна единице. Затем строится вектор Уа> по указанной выше формуле. Из самого его определения непосред- непосредственно вытекает, что он ортогонален с z{1): Деля вектор ^B) на его длину, получаем вектор ?{*\ Затем дальше строим вектор У3) по указанной выше формуле. Из нее непосред- непосредственно вытекает, чго он ортогонален с 2A) и ?^\ Действительно, в силу ортогональности гA) и ?^\ получим,, например: Деля вектор у^ на его длину, получаем вектор ?^ и т. д. Все вновь построенные векторы выражаются линейно через Нетрудно видеть и наоборот, что х^к) выражаются через аК*). Для этого достаточно только постепенно решать предыдущие равенства относительно д:A), д:B) и т. д. Заметим также, что ни один из вновь построенных векторов у№ не может обратиться в нуль. Действительно, если бы мы на некото- некотором шаге вычислений получили вектор у&\ равный нулю, то, так как он выражается линейно через x^s\ причем коэффициент при ?№ в этом линейном выражении равен единице, то мы получили бы линейную зависимость между векторами x^s\ что противоречит тому условию, что эти векторы линейно-независимы. Напомним, что если имеется некоторая совокупность попарно ортогональных* векторов, отличных от нулевого вектора, то эти векторы линейно-независимы. Если т — п, то z№ дают полную ортонермированную систему. Если же т<^п, то для получения полной системы декартовых ко- координат мы должны в дополнение к построенным векторам z^k) до- достроить еще (п — т) векторов, которые были бы ортогональны и
120 ГЛ. П. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [32 -между собой и к векторам z{fc). Эти новые единичные векторы должны, таким образом, образовывать подпространство R'n-m измерения (п — т\ ¦ортогональное подпространству Rm [12]. Новые искомые векторы и должны удовлетворять системе уравнений («, *d>) = 0,..., (а, *<"¦>) = 0. Здесь мы имеем систему т однородных уравнений с ? неизвест- неизвестными, причем ранг этой системы равен т, поскольку векторы xik) — линейно-независимы [12]. Эта система имеет (п — т) линейно-независи- линейно-независимых решений, т. е. мы получаем (п — пг) линейнс-независимых векто- векторов. Применяя к ним указанный выше процесс ортогонализации и приводя их длину к единице, мы и получим совместно с z^\ . ..fz{m> полную ортонормированную систему. Сделаем еще одно замечание. Подпространство Rm образованное ортонормированной системой век- векторов z{k), может быть образовано и другой такой же системой. Действительно, достаточно для этого применить к системе векторов zSk) унитарное преобразование. Мы видим, таким образом, что процесс ортогонализации системы векторов может совершаться различным образом, и указанный выше прием дает лишь одну из таких возмож- возможностей. § 4. КВАДРАТИЧНЫЕ ФОРМЫ 32. Преобразование квадратичной формы к сумме квадратов. Рассмотрим в пространстве некоторую поверхность второго порядка, имеющую центр в начале координат Ах* + Ву% + Сг* + 2Z?Jcy + 2Exz + 2Fyz -f- 0= 0. Всегда можно выбрать так новые координатные оси (х\ у\ z')y •чтобы & преобразованном уравнении остались лишь члены, содержа- содержащие квадраты координат, т. е. так, чтобы преобразованное уравнение «мело вид: М'? -f \y'% + h** + 0= 9. Задача сводится к отысканию такого ортогонального преобразо- преобразования, связывающего переменные (xrf у\ /) и (лг, у, г), чтобы сово- совокупность членов второго измерения относительно координат в левой части уравнения привелась к сумме квадратов. Поставим аналогичную задачу для случая вещественного пространства ? измерений. Пусть у нас имеется вещественная квадратичная форма от ? переменных: !,..., Хп)= ^aibXiXh> A34) •причем aik — вещественные коэффициенты, удовлетворяющие условию ¦*« = */* A36)
32] $ 4. КВАДРАТИЧНЫЕ ФОРМЫ 121 В предыдущем примере мы можем считать x = xh y — x^ z = xs я ап = А; ап = В; an = Q an = an = D; alB = an = E; a^ = an==F. Назовем матрицей квадратичной формы A34) матрицу, состав- составленную из элементов aik. Эта матрица будет симметрична, т. е. бу- будет совпадать со своей транспонированной. Положим, что мы преобразуем форму A34) к новым переменным, вводя вместо xk переменные х'ъ причем преобразование это запи- записано в виде: (*„..., хп) = В(х'1,..., х'п), A36) где В есть матрица с элементами bik. Внося выражения A36) в фор- формулу A34), будем иметь: ? = Раскрывая скобки, получим коэффициент при х'рх\(рфц)\ Пользуясь A35), легко видеть, что половина написанного выра- выражения будет равна просто сумме: ? ? ? bh ? aihbkr Таким образом, разбирая аналогично и случай р = д, мы увидим, что в новых переменных квадратичная форма будет иметь вид: Т= ? cik*'iX'k> A37> где ? ? Cik = cki = ? bu ? atsbsk- Суммирование по s дает {AB\tk. Если в множителе Ьп будем* считать t — номером столбца и i — номером строки, то bti будет элементом транспонированной матрицы {B^}it> откуда т.е. преобразованная форма A37) будет иметь матрицу, определяе- определяемую через матрицу А формы в прежних переменных и матрицу В преобразования A36·) следующим образом: A38)
122 ГЛ. It. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [32 Если преобразование A36) ортогонально, то для ортогональной матрицы В транспонированная В^ совпадает с обратной В~\ и мы имеем в этом случае, вместо формулы A38), формулу: С=ВГ1АВ. A39) Таким образом, наша задача о построении ортогонального пре- преобразования A36), приводящего квадратичную форму A34) к сумме квадратов, равносильна задаче построения такой ортогональной матрицы Д чтобы матрица A39) была просто* диагональной матри- матрицей [Хь..., ??], ибо матрица такой формы, которая приводится к сум- сумме квадратов, и есть диагональная матрица, причем ее элементы \k и суть коэффициенты при квадратах хги- Итак, мы должны иметь, как и выше: «ли (НО) Заметим, что в данном случае матрица А не какая угодно мат- матрица, а вещественная симметричная матрица и В должна быть орто- ортогональной матрицей. Будем поступать совершенно так же, как это мы делали выше в [27] при рассмотрении общего случая. Перепишем уравнение A40) в виде: ? Отсюда для элементов &-го столбца матрицы В имеем ? уравне- уравнений. Вводя вектор x(k) с составляющими (blkt..., bnk\ можем пере- переписать последнее уравнение так: Ax^k) = \kx^k\ A42) Перенеся все члены A41) в одну сторону, будем иметь для опре- определения blkf..., bnk систему ? однородных уравнений {аП — ??) b\k -j- 0>\Фъь -f- · · · ~f~ alnPnk === 0 я* А * <hnKk — = 0 A43) Определитель этой системы должен равняться нулю, и для чисел Xk мы получаем алгебраическое уравнение степени п: — ? аи ... а1л <*>П\ = 0. A44)
32] I 4. КВАДРАТИЧНЫЕ ФОРМЫ 123 Это, как мы знаем, и есть характеристическое уравнение матрицы А Докажем прежде всего, что для вещественной симметричной мат- матрицы А уравнение A44) имеет все корни вещественные. Предвари- Предварительно дадим новую форму записи для квадратичной формы. Пусть ? — вектор с составляющими (xh..., хп) — вещественными или комплексными и Л — матрица с любыми элементами aih. Составим скалярное произведение: (??, ?) = Jj ?i (anxi + . ·. + ainxn\ Мы видим, что оно может быть записано в виде: ? (АХ, Х)=== / л ^ikXiXk* A40/ Если выполнено условие аы = aik (akk — вещественны), A46) то это есть форма Эрмита, значения которой обязательно вещест- вещественны. Тот случай, когда А есть вещественная симметричная матрица, есть частный случай условий A46). Если при этом еще составляющие вектора ? вещественны, то формула A45) и дает нам квадратичную форму A34). Перейдем теперь к доказательству вещественности корней урав- уравнения A44). Пусть Xk — некоторый корень этого уравнения. Система A43) дает нам при этом составляющие вектора x^k) (вещественного или комплексного), удовлетворяющего уравнению A42). Умножим обе части этого уравнения справа скалярно на х&К Мы получим: Выражение, стоящее справа, как мы видели, есть число вещест- вещественное, и, следовательно, Xfe есть также число вещественное. Мы доказали таким образом вещественность корней уравнения A44) не только для вещественных симметричных матриц, но и для матриц, элементы которых удовлетворяют условию A46). Такие матрицы называются обычно эр лито в сними матрицами, В рассматриваемом случае коэффициенты системы A43) суть ве- вещественные числа, и мы можем считать, что и составляющие x{k^ — вещественны. Покажем теперь, что если ?? и ?^ — два различных кор- корня уравнения A44), то соответствующие векторы х{р) и х^\ удовлетво- удовлетворяющие уравнению A42),— взаимно ортогональны. Мы имеем по усло- условию: Ах р] =
124 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАЯРАТИЧНЫЕ ФОРМЫ [33 Умножая первое из этих уравнений скалярно на х^\ а второе «а ?(?\ и вычитая, получим: (А**\ хЩ — (хру AxW) = (Xp — Xq)(xP\ **). A47) Покажем теперь, что для любых двух векторов ? и у (вещест- (вещественных и комплексных) имеет место формула (Ах, jr) = (*, Ay\ A48) только элементы матрицы А удовлетворяют условиям A46). Действительно, левая часть формулы A48) дает: ? ? (Ах, y)= l «ли, в силу A46): (Аху у) = ^ Такой же результат даст нам и правая часть формулы A48). Эта формула справедлива, таким образом, и для вещественных сим- симметричных матриц, которые являются частным случаем эрмитовских. В силу A48) левая часть A47) равна нулю, и в силу ?????? мы «имеем (х{р\ лг^) = О, т.е. векторы х{р) и лг<?> действительно ортого- ортогональны. В данном случае это вещественные векторы, и условие их ортогональности сводится к тому, что сумма произведений их со- составляющих равна нулю. Если уравнение A44) имеет различные корни, то мы будем иметь, таким образом, ? взаимно ортогональных вещественных векторов &k\ Уравнение A42) линейное, однородное относительно x(k\ и мы мо- можем умножить решение этого уравнения на любую постоянную, так •что можно считать, что упомянутые выше векторы х^к) имеют длину, равную единице. Составляющие этих векторов образуют столбцы матрицы В. Иначе товоря, эта матрица удовлетворяет условию ортонормированности по столбцам и является ортогональной матрицей. Таким образом наша задача приведения квадратичной формы ортогональным преобразова- преобразованием к сумме квадратов или — что то же — приведения матрицы А к диагональной форме окончена в предположении, что уравнение A44) «имеет различные корни. Числа ?? называют иногда собственными значениями матрицы А, а векторы xSk) — собственными векторами этой матрицы. 33. Случай кратных корней характеристического уравнения. Перейдем ienepb к рассмотрению общего случая, когда уравнение A44) может иметь и одинаковые корни. Возьмем некоторый корень k = \v уравнения A44) и построим соответствующее ему решение
33J I *· КВАДРАТИЧНЫЕ ФОРМЫ 125 уравнения A42). Это будет некоторый вещественный вектор х{{) длины единица. Присоединим к нему еще (п—1) вещественных еди- единичных векторов, которые бы вместе с ним образовывали полную орто- нормированную систему [31]. Переход от основных ортов к этим новым ортам будет, как мы знаем, выражаться некоторым ортого- ортогональным преобразованием над составляющими векторами, и матрица А перейдет в подобную матрицу Al = Bl~1ABl. Соответствующее этой новой матрице уравнение \х A49) будет иметь в качестве решения, соответствующего собственному зна- значению X==Xt (собственные значения не меняются при преобразовании подобия), вектор х^\ который мы приняли за первый орт и который имеет, следовательно, составляющие A, 0,..., 0). Подставляя эта решение в уравнение A49), будем иметь: ^A, 0,..., 0) = (Xlf 0,..., 0), откуда непосредственно следует лля элементов первого столбца ??}??=??; ?1}11 = {?1}11 = ...=?1}?1=?. (???> Покажем теперь, что вещественная матрица ?? будет также сим- симметрична, т. е. будет совпадать со своей транспонированной. Дей- Действительно: Но в силу ортогональности матрицы В{. В?>=ВГ% и Вр-* откуда следует Принимая во внимание формулы A50) и симметричность матрицы мы можем написать: т. е. у матрицы ?? все элементы первой строки и первого столбца обращаются в нуль, кроме, может быть, элемента {?1}11 = ?1> т.е. эта матрица Ах имеет форму: ?, 0 ... 0 0 < ... ?? 0 аи ... а где через а4/* мы обозначили элементы At.
126 ГЛ. 11. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [33 Квадратичная форма ? в новых переменных будет иметь вид: Таким образом мы выделили один квадрат и пришли к рассмот- рассмотрению квадратичной формы с (п—1) переменными или, что аналогично, к рассмотрению соответствующей ей матрицы С\ порядка (п—1), являющейся частью матрицы Ах. Здесь мы можем рассуждать совершенно так же, как и выше, и в подпространстве (п— 1)-го измерения, образованном последними (п— 1) ортами, можем выделить некоторый единичный вектор jc12), являющийся решением уравнения Этот вектор будет, очевидно, ортогонален вектору х{{\ В ре- результате этого второго преобразования орт лсA) сохранится, а осталь- остальные орты перейдут в другие, взаимно ортогональные единичные орты, первым из которых будет х&\ В этих новых переменных квадратичная форма ? будет иметь вид: ? = Продолжая так и дальше, мы приведем, наконец, квадратичную форму к сумме квадратов, т. е. соответствующую ей матрицу к диагональной форме. Это получится в результате применения не- скольких ортогональных преобразований, что, очевидно, равносильно применению одного ортогонального преобразования В, являющегося их произведением. Окончательная диагональная матрица К) будет подобна основной матрице А, и, следовательно, ее характе- характеристическое уравнение ^? — ? 0 ... О О ?*— ? ... О _0 О 0 ... Хл —?
33] ? 4. КВАДРАТИЧНЫЕ ФОРМ.Ы 127 будет совпадать с уравнением A44), иными словами, коэффициенты Xk при квадратах в приведенной квадратичной форме A52) будут корнями уравнения A44), причем каждый кратный корень бу- будет повторяться столько раз, сколько единиц содержит его кратность. Каждый столбец окончательного ортогонального преобразования В дает, как мы знаем, вектор, являющийся решением уравнения A42), причем из самого закона построения следует, что соответствующее значение Xfe совпадает с тем коэффициентом в квадратичной форме A52), который стоит при соответствующей переменной. Укажем более точно это соотношение. В силу A36) ортогональное преоб- преобразование Д удовлетворяющее условию A40), переводит перемен- переменные (x'v..., х'п) в переменные (хъ..., хп). Обратное преобразование /Г1 будет транспонированным по отно- отношению к ?, ?. е. мы будем иметь: и вектор х&\ имеющий составляющие (Ьш..., bnk), будет решением уравнения A42), при X = Xfe. Покажем, наконец, что мы нашли все решения уравнения A42). Прежде всего, из предыдущих рассуждений вытекает, что значение \k должно быть корнем уравнения A44). Возьмем какой-нибудь ко- корень этого уравнения ? и положим для определенности, что его кратность равна трем, причем можно, конечно, считать, что ? == Xt = = ?2 = ?3. Предыдущие рассуждения дают нам для уравнения Ах = \1х A54) три решения: Покажем, что всякое решение уравнения A54) должно быть их линейной комбинацией. Действительно, если бы это было не так, то мы имели бы еще некоторое решение этого уравнения у, линейно- независимое с д:A), х^2) и jcC\ Вектор у может оказаться и ком- комплексным, но в этом последнем случае его вещественная и мнимая части в отдельности должны удовлетворять уравнению A54), так как это уравнение имеет вещественные коэффициенты. Очевидно, что по крайней мере одна из этих частей должна представлять со- собою вектор, линейно-независимый с ^ (?=1, 2, 3). Мы можем таким образом считать, что тот вектор у, о котором мы упоминали выше, есть вещественный вектор. Как мы доказали раньше, он дол- должен быть ортогонален ко всем векторам х№ при &^>3, так как этим последним соответствуют значения ??, отличные от Х1# Таким образом выходит, что вектор у будет линейно-независимым со всей
128 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [33 совокупностью векторов х<к\ т. е. мы имеем (л-{-1) линейно-неза- линейно-независимых векторов, что невозможно. Итак, для всякого корня урав- уравнения A44) кратности т уравнение A54) имеет ровно т линейно- независимых вещественных решений. Подставив в коэффициенты системы A43) вместо ?? некоторый корень ? = ?0 кратноети т, мы получим однородную систему, имею- имеющую т линейно-независимых решений, т. е. ранг этой системы должен равняться (я — т). Иначе говоря, эта система сведется к (п — т) уравнениям. Возьмем какое-нибудь решение этой системы и умножим его на такой множитель, чтобы сумма квадратов чисел, входящих в это решение, была равна единице. Таким образом полу- получим один вектор, соответствующий взятому корню уравнения ? = ?0. Чтобы найти следующий вектор, добавим к (п — т) уравнениям на- нашей системы еще одно уравнение, выражающее ортогональность нового искомого вектора к уже построенному. Таким образом для нахождения составляющих нового вектора будем иметь однородную систему из (п — т~\-\) уравнений. Взяв какое-нибудь решение этой системы и нормировав его опять к единице (длина вектора равна единице), перейдем к нахождению третьего вектора, соответствую- соответствующего тому же корню уравнения ? = ?0. Для этого добавим к основ- основным (п — т) уравнениям системы еще два уравнения, выражающих ортогональность нового искомого вектора к двум, уже полученным, и т. д. — пока не построим ортонормированную систему, состоящую из т векторов, соответствующих корню уравнения ? = ?0 кратности т. Из указанного построения непосредственно вытекает некоторая про- произвольность построения основных решений уравнения A42). Если все корни уравнения простые, то эта произвольность сводится лишь к тому, что все составляющие вектора х^ можно помножить на (— 1). Положим теперь, что уравнение A44) имеет корень кратности т. В этом случае соответствующие т единичных ортогональных векто- векторов, являющихся решением уравнения A42), образуют некоторое под- подпространство Rm измерения т. Мы можем, очевидно, в этом подпространстве выбирать любым образом взаимно ортогональные единичные орты, и все они будут также решениями уравнения A42) при ? = ?0, ?. е. мы можем переходить от одной ортонормированной системы решений к другой, совершая ортогональное преобразование подпространства Rm. Все сказанное относится и к любому другому кратному корню уравнения A44). Для пояснения сказанного обратимся к той задаче, с которой мы начали предыдущий номер, а именно к задаче приведения урав- уравнения поверхности второго порядка к осям симметрии. Положим для определенности, что эта поверхность есть эллипсоид. Случай раз- разных корней уравнения A44) соответствует тому факту, что все по- полуоси этого эллипсоида различны. В этом случае единственный произвол в выборе окончательных осей координат сводится к изме-
34] § 4 КВАДРАТИЧНЫЕ ФОРМЫ 129 нению направления этих осей. Если уравнение A44), которое в рас- рассматриваемом случае будет уравнением третьей степени, имеет два одинаковых корня, то эллипсоид будет эллипсоидом вращения, и две оси симметрии могут лежать как угодно в плоскости, проходящей через центр и перпендикулярной к оси вращения, лишь бы они были взаимно ортогональны, т. е. в данном случае произвол в выборе окончательных осей состоит еще в произвольном ортогональном преобразовании в указанной выше плоскости. Наконец, если урав- уравнение A44) имеет все три одинаковых корня, то наш эллипсоид есть сфера, и наше уравнение не содержит членов с произведениями координат. В этом случае мы вообще можем совершенно произ- произвольно выбирать прямолинейные, прямоугольные координатные оси в пространстве. 34. Примеры. Рассмотрим два численных примера. 1. Привести к осям симметрии уравнение поверхности х\ + 5*1 -f х% + 2х,х2 + дх,хв + 2х2х, = 5. Соответствующая квадратичная форма будет иметь вид: Характеристическое уравнение ее матрицы будет 1 —? 1 3 1 5 —? 1 =0, 3 1 1 —? откуда, разлагая по элементам первой строки: A — ?) [E — ?) A —?)— 1] — A —? —3) + 3[1 —3 E — ?)]=0 или ?8 — 7?2 + 36 = 0. Это уравнение, как нетр}дно проверить, имеет корни ?? = —2; ?2 = 3; ?3 = б, и уравнение нашей поверхности, отнесенное к осям симметрии, будет 2л?'2 -4- Злг'2 -4-блг'2 5= 5 Будем теперь определять элементы ортогональной матрицы; В = b2i Ь22 Ь Мы имеем для них систему A55)
130 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [34 Подставляем сначала ? = lt = — 2, что приводит нас к двум уравнениям 3*ц+ *и + 3*в1 = 0 Ьп + Пи+ *8i = 0. Решение этой системы имеет вид: bn = — kl; Ь21 = 0; bSi = klt где kt — произвольное число. Выбираем его так, чтобы сумма квадратов чисел, составляющих решение, была равна единице. Окончательно получаем: причем можно взять и решение с обратным знаком. Подставляем теперь в коэффициенты системы A55) ? = ?2 = 3. Получаем систему, в которой третье уравнение есть разность первых двух и, таким образом, приходим к двум уравнениям: -2bi2 + Ь Нетрудно найти решение этой системы, нормированное к единице: 12~~/Г 22~ ~~/Г 32""/f' Подставляем, наконец, в коэффициенты системы A55) третий корень. Получаем опять систему, в которой одно из уравнений есть следствие двух других. Решая оставшиеся два уравнения и нормируя полученное решение к единице, будем иметь: ъ =—· ь =— · ь = — В данном случае формулы преобразования переменных имеют вид: Xl~V2Xi ~nXi х, =А=Х \=х +-LX s уз 1 уз ! ]/з" ' _ 1 2 1 •^8 ~~~ —Т=~ Х\ \~ , Хъ "?" " r-lZ X я» 1/ f\ ?/ f\ ~\/(К 2. Привести к осям симметрии уравнение поверхности 2х\ + 6*1 + 2х\ + 8*^3 = 1. В данном случае квадратичная форма запишется в виде: характеристическое уравнение ее матрицы будет 2 —? 0 4 0 б-? 0 4 0 2 —? =0.
35] § 4· квадратичные формы 131 Раскрывая этот определитель, придем к уравнению вида: ?3 — 10?2+ 12? + 72 = 0. Его корни будут ?1 = —2; ?2 = ?3=6, т. е. это уравнение имеет двой- двойной корень. Переходим к определению коэффициентов ортогонального преобразова- преобразования, для которых имеем систему = 0, Подставляя ? = — 2, получим, как нетрудно вычислить, нормированное к единице решение bW *0; * Подставим теперь в коэффициенты системы A55) двойной корень ? =6, для которого мы должны получить два линейно-независимых и взаимно-орто- взаимно-ортогональных решения. При указанной подстановке система сведется к одному уравнению -*12 + *82=0. A55.) Возьмем нормированное к единице решение этого уравнения Для нахождения второго решения заметим, что оно должно удовлетво- удовлетворять как решению A552), так и условию ортогональности с уже найденным решением. Таким образом, мы получаем для его нахождения два уравнения _^13 + _U33==0 или ?18 = #зз = О, откуда нормированное к единице решение будет ?18 = 0; Окончательно ортогональное преобразование будет иметь вид: ?'? X х' =^—х 1 ? 3 = ?2 и уравнение поверхности в осях симметрии приведется к виду* 35. Классификация квадратичных форм. Задачу о приведении квадратичной формы к сумме квадратов можно поставить и в более
1?52 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [36 общем виде, чем это мы делали выше, не требуя обязательно, чтобы линейное преобразование от новых переменных к старым было орто- ортогональным, а именно мы можем поставить задачу следующим обра- образом: требуется привести вещественную квадратичную форму A34) к виду: A56) где Xk суть какие-нибудь ? линейно-независимых вещественных ли- линейных форм переменных xk. При такой постановке задачи коэф- коэффициенты ?? не являются какими-либо определенными числами, как это мы имели выше, но мы можем все-таки высказать некоторое утверждение относительно этих коэффициентов, а именно: число этих коэффициентов, отличных от нуля, должно всегда равняться рангу таблицы, составленной из коэффициентов aik квадратичной формы. Иначе говоря, при любом приведении квадратичной формы к сумме квадратов линейных линейно-независимых форм число квадратов равно рангу упомянутой таблицы. Кроме того, имеет место и еще одно свойство, которое обычно называется законом инерции квадратичных форм, а именно: при любом преобразо- преобразовании вещественной квадратичной формы к виду A56), где линей- линейные формы Xk также вещественны, число положительных коэффи- коэффициентов fJLfe (и число отрицательных коэффициентов ?^ будет всегда одним и тем же. Высказанные соображения будут нами доказаны в конце настоящего номера. Поставленная общая задача о приведении квадратичной формы к виду A56) решается весьма просто выделением полных квадратов. Проведем это на частном примере: ? = ?\ + 4х\ + х\ + 2^*2 — Ьхххь + 8?2??3. Добавляя к членам (х\ + 2xtx2 — 6xtxB) слагаемые (х% + 9*§ — 6л:2л:8), мы получаем полный квадрат и можем записать ? в виде: ? = (Xi + ?2 — Зх3J + 3*| — 8лг| + Нх2л:3. Точно так же, выделяя еще один квадрат, мы приходим окончательно к пред- представлению квадратичной формы в виде A56): ? = <*? + ?, - з*зJ - 2Bх3 -1· х^ + у (х2у. Линейные формы, стоящие в круглых скобках, будут, очевидно, линейно-не- линейно-независимыми. В случае отсутствия в выражении ? квадратов переменных1 вычисление надо проводить несколько иначе. Пусть мы имеем: <р = ах,х2 + Рхг + Qx2 + /?, где а— численный коэффициент, отличный от нуля, ? и Q — линейные формы переменных, не содержащие хх и х2, R — квадратичная форма, также не содержащая xt и х2. Мы можем написать: —(*¦-< ?
36] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 133 Если положить: ?? === "о" 1 хх + ·*"« ~\ ~ ^а = "" ? ^? ^а ~ то получим: <р = aXf — a где ?? — квадратичная форма, не содержащая хх и х2. Выделив два квадрата, мы освободились от двух переменных. Приведение квадратичной формы к виду A56) дает возмож- возможность естественной классификации таких форм. Рассмотрим ряд случаев. I. Положим, что все коэффициенты ?? в формуле A56) поло- положительны. В этом случае форма называется определенно положи- положительной. Нетрудно показать, что она имеет положительные значе- значения при всех вещественных значениях xk и может обращаться в нуль только тогда, когда все xk равны нулю. Действительно, для того чтобы правая часть формулы A56) обратилась в нуль, необ- необходимо и достаточно, ввиду положительности всех ?,?, чтобы все линейные формы xk были равны нулю. Мы получаем, таким образом, для xk систему ? однородных уравнений с определителем, отличным от нуля (формы линейно-независимы), и эта система имеет, следова- следовательно, только нулевое решение. II. Если все коэффициенты \ik отрицательны, то квадратичная форма называется определенно отрицательной. Как и выше, можно показать, что она имеет при всяких вещественных хк только отри- отрицательные значения, причем обращается в нуль только тогда, когда все xk равны нулю. III. Рассмотрим теперь тот случай, когда среди коэффициентов ?? есть равные нулю, а все не равные нулю определенного знака, на- например, положительны. В эгом случае мы будем иметь для формы ? представление вида: A560 где все ?? положительны. Здесь опять значения нашей формы не могут быть отрицательными ни при каких значениях xk, но могут равняться нулю и тогда, когда значения xk отличны от нуля. Дей- Действительно, чтобы получить нулевое значение формы, мы должны написать сиаему т однородных уравнений для xk: Х1 5= Хч =... = Хт = 0, и так как т<^п, тр эта система наверно имеет решения, отлич- отличные от нулевого. Точно так же, если в формуле A56^ все коэффици- коэффициенты ?? отрицательны, то квадратичная форма не может иметь
134 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [35 положительных значений, но может обращаться в нуль и при значе- значениях xk> отличных от нуля. В рассматриваемом случае форма называется знакопостоянной — положительной или отрицательной. IV. Наконец, если среди коэффициентов ?^ формулы A56) имеются как положительные, так и отрицательные, то, как нетрудно видеть, квадратичная форма может принимать как положительные, так и отрицательные значения при вещественных значениях лгА. В этом случае она называется знакопеременной. Предыдущая классификация вещественных квадратичных форм имеет непосредственное приложение к задаче на maxima и minima функции от нескольких переменных. Пусть имеется функция ? неза- независимых переменных хь ..., хп: ф(хь ..., хп\ причем при значениях хх = ...== хп = 0 выполнены необходимые условия maxima и minima, т. е. все частные производные от функ- функции ? по независимым переменным обращаются в нуль. Разлагая нашу функцию в ряд Маклорена, будем иметь: ?(*!, ..., Хп) — ? (?, ..., ?) = ?(??1, ..., ??) + ?, где через ?^, ..., хп) мы обозначили квадратичную форму пере- переменных xky а через ? — совокупность членов измерения выше вто- второго относительно х^. Если квадратичная форма ? определенно положительна, то мы имеем минимум функции в точке хх =... = = ?? = 0. Если она определенно отрицательна, то мы имеем макси- максимум. Если она знакопеременна, то мы не имеем ни минимума, ни максимума, и, наконец, если ? — знакопостоянная форма, то мы имеем дело с сомнительным случаем. Этот результат является естественным дополнением к тому, который мы имели в [I, 163] для случая функции от двух независимых переменных. Переходим к доказательству предложений, высказанных в начале настоя- настоящего параграфа. Пусть имеется квадратичная форма: причем г есть ранг таблицы ее коэффициентов. Составим систему ? линей- линейных форм: ? 1 _<*? _?-|? (S= 1,2,...,?). A57) При составлении выражений этих частных производных мы пользовались условиями ??^ = ?^. Число г есть, очевидно* ранг системы форм A57) jb смысле [ХЦ.
35] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 135 Положим, что ? приводится к сумме т квадратов линейно-независимых форм: У5 = Р*1*1 + Р52*2 + ·.. + $sn*n (? = 1, 2, . . . , Iff), A58) т. е. <Р = ??^? + Wi + ·. · + Рт/пь A59) где ?3 отличны от нуля. Нам надо доказать, что т-=г. Пользуясь выраже- выражением A59), составим линейные формы A57): 1 дер Y-g^-^^y+^^^ + + ^^msym (s = 1, 2,..., ?). A57J Переменные ys могут принимать любые значения, поскольку формы ,A58) линейно-независимы. Поэтому при определении линейной зависимости форм A57^ ys можно считать за независимые переменные, и наибольшее число линейно-независимых форм в системе A57j) должно быть равно рангу таб- таблицы коэффициентов р$ы, где номер столбца к принимает возможные зна- значения: &=1, 2,..., т, и номер строки *=1, 2, ... , п. Элементы каждого столбца этой таблицы содержат общий множитель [х#, отличный от нуля, и потому ранг таблицы \ь$ы совпадает с рангом таблицы ?^-. Поскольку система т форм A58) есть система линейно-независимых форм, этот ранг равен w, т. е. наибольшее число линейно-независимых форм в системе A57Х) или A57) равно т. С другой стороны, по условию, это число равно г, откуда и следует, что т — г. Покажем теперь, что при любом способе представления ? формулой вида A59), где ys — вещественные линейно-независимые формы, число поло- положительных и отрицательных коэффициентов ?5 всегда одно и то же. Будем доказывать это от противного. Положим, что мы имеем два представления ? формулами вида A59), причем число положительных коэффициентов в этих представлениях различно: В этих формулах ?5 и \'s мы считаем положительными. Формы уи...} ут — линейно-независимы, то же можно сказать о формах у[у.,ут. Раз pzfiq, то всегда можно считать, что, например, ? <С q. Покажем, что это приведет нас к нелепости. Присоединим к формам уи..., ут формы ym+1,...t yn так, чтобы получилась полная система линейно-независимых форм [11]. Напишем систему линейных однородных уравнений для ??} ?2,..., хп: Число этих однородных уравнений ? -\- (т — q) + {? — т) = ? — (q —?), и так как q—? > 0, то это число меньше п. Следовательно, написанная однород- однородная система имеет вещественные решения, отличные от нулевого. Возьмем какое-нибудь из этих решений: xs = x's0 (s = l, 2,..., ?). При этих значениях xs мы будем иметь, в силу A61): -Vw.yp+1 — ··. —W™>2 I ~~ Xg+1/J+1 — ... — \тут- ) Отсюда видно, что при xs = xs°' квадратичная форма ? должна обращаться в нуль, и, следовательно, a\=x(s\ кроме уравнений A61), должны удовле- удовлетворять )равнениям:* 0 0
136 ГЛ. ТТ. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [36 Окончательно получаем, что xs = x[s } должны обращать в нуль все формы полной системы линейно-независимых форм: уи у2у..., уп. Но этого не может быть, поскольку в однородной системе относительно хи лг2,..., хп: 3>i = 0; з>2 = 0;...; УяЖо определитель отличен от нуля, ибо формы ys линейно-независимы. Мы пришли к противоречию, что и доказывает закон инерции. 36. Формула Якоби. Приведем без доказательства формулу Якоби, дающую в удобном виде приведение квадратичной формы к сумме квад- квадратов. Для этого введем сначала некоторые обозначения. Положим: (i=l, 2,..., ?), ? = 1; ?1==?1?; ?* = <*ki an al2 ... alk \ akl ak2 ... akk ··· 08ft-i ^W 2, 3,..., ?) Если ранг таблицы коэффициентов aik равен г и определители Аи ?2,..., ?? отличны от нуля, то формула Якоби имеет вид: ?, ft*= 1 xl A62) причем линейные формы Ад,(&=1, 2,..., г) — линейно-независимы. Послед- Последняя формула дает возможность по знакам ?? определить, к какому типу в отношении закона инерции принадлежит форма ?. В частности, если все определители ?? ?2,..., ?? положительны (при этом г = п), из A62) следует, что ? — определенно положительна. Можно доказать и обратное предложение — если <р определенно положительная форма, то все указанные определители должны быть положительны. При применении формулы A62) можно, конечно, нумеровать переменные xs в любом порядке. При перемене нумерации будут меняться, конечно, и ука- указанные выше определители ??, и каждый из главных миноров матрицы I aik I? может быть определителем из последовательности ?? при определен- определенной нумерации переменных xs. Из сказанного выше следует, что у опре- определенно положительной формы ? все главные миноры положительны, но при этом достаточно убедиться в положительности определителей ?,(? = 1, 2,..., ?). Можно показать, что для того, чтобы форма ? была положительной, необходимо и достаточно, чтобы все главные миноры были неотрицательны, т. е. были больше нуля или равны нулю. Здесь недостаточно определения знаков только определителей ?5, а нужно определять знаки всех главных миноров.
37] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 137 Для того чтобы форма <р была определенно отрицательной, необходимо и достаточно соблюдение неравенств (—\)k ?^>0 (&=1, 2,..., ?). Для того чтобы ? была отрицательной, необходимо и достаточно, чтобы главные миноры имели знак (—1)^, где k — порядок минора, или были равны нулю. Доказательство указанных в настоящем номере предложений можно ндйти в книге Ф. Р. Гантмахера „Теория матриц" A953 г.). 37. Одновременное приведение двух квадратичных форм к сумме квадратов. Пусть имеются две квадратичные формы: ? ? Ъ = ? aikxixk\ Ъ = ? bikXiXk, причем ?! определенно положительна, т. е. приводится к сумме ? положительных квадратов. Требуется найти такое линейное пре- преобразование (не обязательно ортогональное), чтобы в результате его обе формы перешли в сумму квадратов. Прежде всего, введем такие новые переменные уь чтобы форма cpt перешла в сумму квадратов. Это можно сделать, например, элемен- элементарным приемом, указанным в предыдущем номере. В новых пере- переменных будем иметь следующие представления квадратичных форм: ? ? ??=? wb ?*= ? Кьуу* k = \ i, k = \ По условию все числа jj^ положительны, и мы можем ввести новые вещественные переменные zk = y^byk. При этом получим формулы вида: ? ? <?? = ? ?*> Ъ = ? bkzizk- Совершим ортогональное преобразование от переменных zk к но- новым переменным /Л, приводящее форму ?2 к сумме квадратов. При этом ?! останется суммой квадратов, так как преобразова- преобразование ортогонально, и мы будем иметь окончательно обе формы в виде суммы квадратов: Числа \k называются иногда характеристическими числами формы ?3 по отношению к форме ?1# Установим теперь то уравнение, которому должны удовлетворять эти числа \k и которое будет вполне аналогично уравнению A44) из [32]. Для этого введем понятие о дискриминанте квадратичной формы, а именно: дискриминантом квадратичной формы назы- называется определитель, составленный из ее коэффициентов..
138 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [37 Положим, что мы преобразуем форму ? с матрицей коэффициен- коэффициентов А к новым переменным при помощи преобразования (*!,...> ??) = ?(*?>.-.> х'п)· Матрица новой формы будет, как известно [32]: и ее определитель вычисляется по формуле Определители /}(?(*}) и D(B\ очевидно, равны, так как соот- соответствующие таблицы получаются одна из другой лишь заменой строк столбцами. Мы имеем таким образом D(C) = D{A)D{B)\ т. е. при линейном преобразовании переменных в квадратичной форме дискриминант формы умножается на квадрат определителя преобра- преобразования от новых переменных к первоначальным. Вернемся теперь к нашим квадратичным формам ?,, ср2 и соста- составим квадратичную форму коэффициенты которой содержат параметр ?. В результа!е преобразования к новым переменным эта форма будет иметь вид: и ее дискриминант в новых переменных выражается, очевидно, про- произведением (?1_?)(?2-?) ... (??-?), A63) а в старых переменных этот дискриминант будет равен определи- определителю с элементами (bik — ??^). Как мы показали, эти два дискри- дискриминанта будут отличаться лишь множителем — квадратом определи- определителя преобразования, не содержащим ? и отличным от нуля. Отсюда непосредственно следует, что оба дискриминанта имеют одинаковые корни относительно параметра ?. Принимая во внимание A63), видим, что числа Xk суть корни уравнения Ьи —??,, bn — i "~ =0. . Ьпп - 4«?
88] I 4. КВАДРАТИЧНЫЕ ФОРМЫ 139 38. Малые колебания. Мы видели выше [II, 20], что движение механи- механической системы, имеющей ? степеней свободы, связи которой не содержат времени и которая находится под воздействием сил, имеющих потенциал, определяется системой дифференциальных уравнений вида: -·' * где ?—кинетическая энергия системы и 13 — заданная функция (силовая функция) от qk, которую мы считаем не зависящей от t. Как мы упоми- упоминали выше, ? есть квадратичная форма от производных q'k от qk по времени ? {4i = *ih), A65) причем коэффициенты суть заданные функции от q^ Положим, что значе- значения q% — 0 обращают в нуль частные производные ~===0 при 01Я=... = 0Я = О (Л = 1, 2 я). A66) При этом система дифференциальных уравнений A64) имеет очевидное решение ^ =... =<7Л = 0, которому соответствует некоторое положение равновесия системы. Функция U определена лишь с точностью до постоян- постоянного слагаемого, и мы можем всегда считать, что она обращается в нуль при qi = ...== qn = 0. В силу условия A66) можно, таким образом, утвер- утверждать, что разложение функции U по степеням q^ начинается лишь с чле- членов второго измерения. Положим, что квадратичная форма, получаемая от этих членов второго измерения, будет определенно отрицательной, откуда сле- следует, что U имеет максим ум при qx = ... = qn = 0, или — что то же — потен- потенциальная энергия (—13) имеет минимум. Как мы доказали [II, 20] при этом положение равновесия qx = ... = qn = 0 будет устойчивым, и при малых на- начальных возмущениях система будет совершать малые колебания около упо- упомянутого положения равновесия, так что q^ во все время движения будут оставаться малыми. Мы можем поэтому при исследовании этих малых ко- колебаний считать, что U сводится лишь к членам второго измерения, т. е. имеет вид: i, k = ? Точно так же мы можем в коэффициентах ащ выражения A65) положить приближенно q^ = 0, после чего эти коэффициенты окажутся заданными числами. Подставляя все это в систему A64), будем иметь систему ? линей- линейных уравнений с постоянными коэффициентами: A68) amq''n + b2iqt + b22q2 + ... -f b2nqn =0
140 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [38 Если мы будем искать решение этой системы в форме гармонических ко- колебаний одной и той же частоты и начальной фазы, но с разными амплиту- амплитудами qk = Ak cos {It + ?) (* = 1, 2,..., я), A69) то, подставляя в систему A68), будем иметь систему уравнений для Ak и ?: (Ьп - ?·??) ?, + (bl2 - ?2?12) ?2 + ... + (bln ~ l*am) An = 0 (b2i - ?2?21) A, + (b22 - ?2?22) A2 + ... + (bm-\2am) An = 0 j —?2??2) Л2+ ... = 0. A70) Для того чтобы эта система имела для Ak решение, отличное от нуле-х вого, мы должны приравнять ее определитель нулю: — 12а12 ... b b21— b22 — bnn~ l2ann = 0. A71) Взяв некоторый корень этого уравнения и подставив в коэффициенты системы A70), мы получим для Ak решения — одно или несколько, которые мы затем можем умножить на произвольную постоянную. Кроме того, фор- формула (Г69) содержит еще произвольную постоянную ?. Мы получаем более отчетливое решение задачи, применяя теорию квад- квадратичных форм. Заметим прежде всего, что по самому существу дела квад- квадратичная форма A65) переменных q'k, выражающая кинетическую энергию при движении, будет определенно положительной формой. Кроме того, в данном случае по условию задачи и форма A67) будет определенно положительной. Как мы видели, можно ввести вместо переменных qk такие новые пере- переменные рь, связанные с прежним линейным преобразованием с постоянными коэффициентами, чтобы в новых переменных квадратичные формы ? и (—U) одновременно привелись к сумме квадратов, причем для формы ? это долж- должно быть чистой суммой квадратов с коэффициентами, равными единице. Заметим при этом, что линейная зависимость для pk и qk приводит к такой же зависимости для р\ и q\. Мы будем, таким образом, иметь: A72) 2> 5=1 где все коэффициенты при p2s положительны, так что мы имели возможность обозначить их через квадраты. Вместо системы A68) мы можем написать уравнения Лагранжа A64) для новых переменных d dt dpk Подставляя A72), будем иметь чрезвычайно простую систему P'* + *V* = 0 (?=1, 2,..., ?). Решения этой системы будут: Pk = Ск cos (??? + фА) (k = 1, 2,..., ?), A73)
39] § 4. квадратичные формы 141 где Ck и <\>k — произвольные постоянные. Обобщенные координаты pk назы- называются главными координатами нашей механической системы. Основные координаты q^ выражаются через них линейным образом с постоянными коэффициентами. Из результатов предыдущего номера непо- непосредственно следует, что числа Xk должны быть корнями уравнения A70). Заметим, что среди них могут оказаться и одинаковые, но и в этом случае формулы A69) дают общее решение задачи малых колебаний в рассматри- рассматриваемом случае. 39. Экстремальные свойства собственных значений квадратичной формы. Рассмотрим задачу приведения вещественной квадратичной формы к сумме квадратов с новой точки зрения. Для простоты ограничимся слу- случаем трех переменных 3 3 ?1 где xk связаны с Xk некоторым ортогональным преобразованием 12xr2 + Ьих'ь х2 = Ь21х[ + Ь22х'2 + Ь2Ъх'ъ A75) ^2 ?" ^3 Для определенности будем считать, что числа Xk идут в убывающем по- порядке, т. е. ?1>?2>?3. A76) Нашей задачей будет определение чисел ?? и коэффициентов Ь^ по зна- значениям формы ? на единичной сфере ЛГ, т. е. на сфере с центром в начале координат и радиусом единица: х\ + х\ + х\ = 1 или х[2 + х? + х'г2 = 1. A77) Каждая точка такой сферы характеризует некоторое направление в прост- пространстве, определяемое единичным вектором, идущим из начала в упомяну- упомянутую точку. Мы можем написать формулу A74) в виде: ? = К (х? + x'i + -*;1) + (?, - ?,) ?'* + (?, - ?,) ??, откуда видно, что на упомянутой единичной сфере К будем иметь: ?==??+(?2_ ??) л:;· + (?, — ??) ^;·. Отсюда непосредственно следует, что ?? есть максимум ? на /<". Этот максимум достигается, очевидно, в точке или, в силу A75), в прежних координатах это будет точка сферы ??' с коор- координатами: ?? = Ьц\ х2 = Ь21; х8 = Ьп. Эта точка определяет вектор, соответствующий первому столбцу ортого- ортогонального преобразования A75), т. е, вектор, являющийся решением уравне- уравнения Ax^lx A78) при ? = ?1# Итак, первое по величине собственное значение квадратичной формы A74) равно максимуму значения этой формы на единичной сфере, а соответствующий собственный вектор хп\ являющийся решением уравне- уравнения A78), есть вектор, идущий из начала в ту точку единичной сферы, где упомянутый максимум достигается.
142 ГЛ. ТТ ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [39 Перейдем теперь к определению второго собственного значения и соот- соответствующего собственного вектора. Положим в формуле х[ =0. Этому уравнению соответствует плоскость, проходящая через начало и перпенди- перпендикулярная к вектору л:A). Сечение этой плоскости с единичной сферой даст окружность *;¦+*;«= ?. На этой окружности мы имеем: <р = КК2 + ?3*32, откуда непосредственно видно, что ?2 есть максимум значений ? на единич- единичной сфере при условии перпендикулярности соответствующих векторов уже найденному вектору ха\ Точно так же, как и выше, докажем, что собст- собственный вектор ??2\ т. е. решение уравнения A78) при ? = ?2, есть вектор, идущий в ту точку, где этот максимум достигается. Имея два вектора, мы получим и третий ?(?\ как перпендикулярный к ним обоим, а собственное значение ?3 будет значением формы ? в той точке единичной сферы, в которой она пересекается с вектором хЫ). Если бы, например, мы имели ?? = ?2, то при отыскании первого макси- максимума формы ? на единичной сфере мы получили бы не точку, а целую окружность, где этот максимум достигается. Предыдущее рассуждение легко переносится и на случай любого числа измерений. Мы приведем для этого общего случая лишь результат, вполне аналогичный предыдущему. Пусть имеется вещественная квадратичная фор- форма ? переменных: _ *. A79) ?, k=\ Единичный вектор в вещественном и-мерном пространстве будет изобра- изображаться совокупностью вещественных чисел, сумма квадратов которых равна единице. Мы будем говорить, что концы таких векторов лежат на единичной сфере, и уравнение этой единичной сферы будет, очевидно: ·*!+ *! + .· · + *„=!. A80) Наибольшее характеристическое число формы ? будет равно максимуму этой формы на единичной сфере A80), и соответственный собственный век- вектор будет определяться вектором х{1\ идущим из начала в ту точку сферы, где ? достигает максимума Для получения второго по величине характеристиче- характеристического числа будем рассматривать единичные векторы, перпендикулярные к уже найденному вектору хП). Среди них найдется такой лсB),который даст наибольшее значение формы «р. Этот второй максимум ?2 и будет равен вто- второму собственному значению формы, а упомянутый вектор xi2) будет соответ- соответствующим собственным вектором. Рассмотрим теперь единичные векторы, перпендикулярные к хA) и хB\ что равносильно присоединению к условию A80) еще двух условий: (jcf 1}, я) = 0 и (xi2\ jc) = 0. Среди них найдется такой, который опять даст форме ? наибольшее значение. Это значение и будет третьим по величине собственным значением формы ?3, а упомянутый вектор будет соответствующим собственным век- вектором и т. д. Мы могли бы расположить собственные значения квадратичной формы не в убывающем, а в возрастающем порядке, так что первое собственное значение было бы наименьшим, следующее — вторым в порядке возрастания
40] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 143 и т. д. При этом мы получили бы задачи, совершенно аналогичные преды- предыдущим, но только везде, где говорилось о наибольшем значении, нам приш- пришлось бы говорить о наименьшем значении. Все предыдущие рассуждения обобщаются также и на случай одновре- одновременного приведения двух квадратичных форм к сумме квадратов. Пусть две квадратичные формы: ? ? приводятся к сумме квадратов при помощи линейного преобразования (хи ..., хп)=В(х[, ..., х?, причем мы считаем, что числа Xk идут в убывающем порядке. При этом Xj будет наибольшим значением ? при условии, что <р=1, причем это наибольшее значение будет достигаться как раз при х1 = Ьц\ *2 = b2i; ...; хп = Ъп1. Аналогично определяются и следующие собственные значения 40. Эрмитовские матрицы и формы Эрмита. В предыдущих параграфах мы рассматривали вещественные симметричные матрицы и отметили, что они являются частным случаем эрмитовских матриц, элементы которых суть комплексные числа, удовлетворяющие соотно- соотношению aki = aik. A81) При i = k это соотношение показывает, что диагональные эле- элементы akk должны быть вещественными. Иначе можно формулировать определение эрмитовской матрицы так: эрмитовская матрица не меняется, если в ней строки заменить столбцами и все элементы сопряженными, т. е. в обозначениях из [26]: Л<*>=Л или А=Л. A82) Матрица А, как мы знаем, называется эрмитовски сопряженной с А Поэтому эрмитовские матрицы иначе называются самосопря- * женными. Выше мы показали [32], что эрмитовская матрица А удовлетво- удовлетворяет при любых векторах ? и у соотношению (Ах, у) = (х, Ау). A83) Это соотношение, как и два предыдущих, может служить опре- определением эрмитовской матрицы. Ошегим еще одно свойство эрмиювских матриц.
144 ГЛ. ТТ. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [40 Пусть А — эрмитовская матрица и U—любая унитарная матрица. Нетрудно показать, что U~lAU будет, как и Л, эрмитовской матри- матрицей. По условию Л(*) = А Надо доказать, что таким же свойством обладает и t/~Mt/. Мы имеем [26]: {U~lAU) (*> = или, принимая во внимание условие для А и унитарный характер ?/, откуда следует ?/(*) = ?/~1, получим: что и требовалось доказать. Можно сказать, что при унитарном преобразовании координат, которое осуществляется для составляющих вектора формулой эрмитовская матрица Л, как оператор линейного преобразования пространства, будет выглядеть в новых координатах в виде U~lAU> и, следовательно, доказанное предложение можно еще формулиро- формулировать так: унитарные преобразования пространства не меняют эрми- товского характера матрицы как оператора. Поставим теперь задачу о приведении эрмитовской матрицы к диагональной форме при помощи унитарного преобразования U-iAU=\K ..·> ?? A84) Как и выше для вещественных симметричных матриц, наша за- задача равносильна задаче решения уравнения вида: ?? = ??, A85) где ? есть одно из чисел \k и составляющие вектора ? дают эле- элементы соответствующего столбца матрицы U. Эти числа \k и соответствующие им векторы x^k) называются собственными значениями и собственными векторами матрицы Л. Собственные значения, как мы знаем, должны быть обязательно корнями уравнения п\\ — ? ?? ... а1п и вм —? ... а2л =а A86) Пусть ? ===== Хд — некоторый корень этого уравнения й д;A) — неко- некоторое решение уравнения A85) при ? = ?1. Это уравнение будет линейным и однородным, так что его решение можно умножать на любую постоянную, и мы можем поэтому считать длину вектора х^ равной единице. Возьмем этот вектор
40] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 145 за первый орт новой координатной системы и достроим каким-нибудь образом еще (п—1) единичных векторов так, чтобы в общем полу- получить ортонормированную систему векторов. Примем эти векторы за новые орты, и пусть Ux — то унитарное преобразование, которое соответствует переходу к этим новым ортам. В новой координатной системе наша эрмитовская матрица А перейдет в новую эрмитовскую матрицу Ai = U[1AU\y причем соответствующее уравнение J\.\X === АЛ? должно при ? = ?1 иметь в качестве решения вектор с составляю- составляющими A, 0, ..., 0). Как и в [33], это обстоятельство покажет нам, что у матрицы ?? все элементы первой строки и первого столбца обратятся в нуль, кроме элемеша, стоящего на пересечении первой строки и первого столбца и равного ?? Из эрмитовского характера матрицы Аг непосредственно следует, что этот элемент Xj должен быть числом вещественным, и отсюда, между прочим, непосредственно следует, что все корни уравнения A86) должны быть вещественными, что мы видели и раньше. Итак, мат- матрица Ах будет иметь вид: ?! 0 ... 0 0 а1) а 1) ? cin% ... апп j. е. это будет квазидиагональная матрица вида где через Q мы обозначили эрмитовскую матрицу порядка (п — 1) с элементами а$. Повторяя предыдущее рассуждение, мы сможем при помощи некоторого унитарного преобразования U<&, произведен- произведенного над ортами, кроме первого орта, привести матрицу Q к такому виду, при котором все элементы ее первой строки и первого столбца будут нули, кроме элемента, стоящего на их пересечении. Упомянутое унитарное преобразование мы можем рассматривать как унитарное преобразование во всем нашем я-мерном пространстве. Это будет квазидиагональная унитарная матрица вида: ?, Щ· В результате этого преобразования наша эрмитовская матрица перейдет в эрмитовскую матрицу вида:
146 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [40 и в раскрытом виде эта матрица будет Xj О 0 ... О О ?2 0 ... О О 0 а$ ..· *й О 0 а% ... а™ Продолжая рассуждать 1ак и дальше, мы окончательно приведем нашу эрмитовскую матрицу к диагональной форме, причем то общее унитарное преобразование (/, которое входит в форму A84), будет произведением тех унитарных преобразований, которые нам придется совершать при указанном выше процессе последовательного приве- приведения матрицы к диагональной форме. Обратимся теперь к уравнению A85). В [33] мы показали, что его решения, соответствующие различным значениям ?, обязательно взаимно ортогональны. Совершенно так же, как и в [33], мы можем показать, что век- векторы, представляемые столбцами матрицы ?/, вместе с соответствую- соответствующими значениями ? дают все решения уравнения A85). Необходимо только при этом иметь в виду одно важное обстоятельство, касаю- касающееся кратных корней уравнения A86). Если, например, уравне- уравнение A86) имеет корень ? = ?? кратности т, то при ? = ?? уравне- уравнение A85) будет иметь т линейно-независимых решений ?{?\ ..., х^т\ Всякая их линейная комбинация с произвольными коэффициен- коэффициентами будет, очевидно, также решением уравнения A85), т. е. уравне- уравнение Ах = \х будет иметь совокупность решений, представляемую подпростран- подпространством, образованным векторами х{1\ ..., х^т\ т. е. определяемую суммой с произвольными коэффициентами Q, ..., Ст. Мы можем выбирав в этом подпространстве любым образом ортонормированную систему т векторов, составляющие которых и дадут нам те столбцы мат- матрицы U> которые соответствуют собственному значению ? = ?1# Здесь мы имеем, следовательно, такой же произвол в выборе матрицы ?/, какой мы имели и в [33] для В. Кроме того, очевидно, мы можем составляющие всякого вектора x^s\ который у нас получился в резуль- результате решения уравнения A85), умножить на численный множи- множитель, по модулю равный единице, т. е. на численный множитель вида ei<? (фазовый множитель). При этом длина вектора останется равной единице и сохранится условие ортогональности зюго вектора к оаальным векторам, входящим в полную систему решений урав-
40] § 4. КВАДРАТИЧНЫЕ ФОРМЫ Й7 нения A85). Наконец, мы можем в матрице U произвольным образом менять порядок столбцов. Это несущественное преобразование сво- сводится, очевидно, к перемене нумерации ортов в новой координатной системе и оно влечет за собой лишь перестановку чисел \k в диаго- диагональной форме матрицы. В дальнейшем всегда будем считать, что эти числа идут в возрастающем порядке. Перейдем теперь к рассмотрению форм Эрмита. Мы будем гово- говорить, чго эрмитовской матрице А соответствует форма Эрмита вида: ? (Ах, *)= ? a**tx» О.87) где х1У ..., хп суть составляющие вектора х. Число (Ах, х) веще- вещественно [32]. Положим теперь, что мы совершили над нашим пространством некоторое унитарное преобразование, причем старые составляющие вектора выражаются через новые по формуле x=Uxf. В новых ко- координатах форма Эрмига A87) будет иметь вид: (AUx\ Uxf). Пользуясь свойством A25Х) унитарных преобразований, мы можем оба вектора, образующих скалярное произведение, помножить слева на унитарную матрицу U ? и, таким образом, получим в новых коор- координатах следующее выражение для формы Эрмига A87): (U~lAUx\ xf). A88) В частности, если унитарное преобразование U преобразует мат- матрицу А к диагональной форме, т. е. имеет место A84), то в новых переменных в нашей форме Эрмита останутся лишь члены, содержа- содержащие произведения х'ц-х'ь и мы будем иметь приведение формы Эрмита к сумме квадратов модулей: (????/*', ?')=?^;*; -f ?**;*; +...+??'??'?· Таким образом, здесь, как и в [32], задача преобразования мат- матрицы А к диагональной форме равносильна задаче приведения со- соответствующей формы Эрмига к сумме квадратов модулей. Вместо формы Эрмига рассматривают иногда так называемую билинейную форму у определяемую следующим образом: ? (Ay, *)= ? *?/??· i, k=\ Если применить опять к пространству унитарное преобразование так, что новые составляющие будут выражаться через старые по прежним формулам, то в новых координатах мы получим; (АУ) x) = (AUyf, Ux!)
148 ГЛ ТТ. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [41 или, в силу свойсгва унитарною преобразования: (????//, ?'). Наконец, если U приводит А к диагональной форме, то в соот- соответствующих координатах билинейная форма приведется к следую- следующему простейшему виду: Заметим, что всякая диагональная матрица с вещественными эле- элементами есть эрмитовская матрица, а потому и матрица U [?1? ..., ??] U, где U—любая унитарная матрица, будет также эрмиговской. Выше мы видели, что и, наоборот, всякую эрмитовскую матрицу мы можем написать в гаком виде. Формы Эрмита делятся, как и вещественные квадратичные формы [35], по знаку характеристических чисел \k. Если, например, все \k положительны, то форма Эрмита называется определенно положи- положительной. Характерным ее свойством является то свойство, что ее значения положительны при всяких xk> и она может обратиться в нуль лишь при xt = . .. = хп = 0. Аналогично определяются знакопостоянные и знакопеременные формы Эрмита. Исследование совершенно аналогично случаю вещественных квадратичных форм и основано на формуле (??, ?) = ???[?[ +... + \хпхп. Формула A83) справедлива для эрмитовских матриц. Если А — любая матрица и А = А^— сопряженная с ней матрица, то вместо A83) будем иметь: (Ах, у) = (х, Ау). A830 Если aik — элементы матрицы Д то у матрицы А элементы бу- будут {A]ik = aki, и формула A830 проверяется непосредственной подстановкой, как и формула A83). 41. Коммутирующие эрмитовские матрицы. Пусть А и В— две эрмитовские матрицы. Посмотрим, при каких условиях и их произ- произведение ВА будет эрмитовской матрицей. Составим матрицу, эрми- товски сопряженную с произведением ВА: или, в силу эрмиговского характера А и В: Для того чтобы ВА было эрмитовской матрицей, необходимо и достаточно, чтобы АВ совпадало с ВА, т. е. чтобы матрицы ком- коммутировали. Положим, что эрмитовские мафицы А и В приводятся
41] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 149 к диагональной форме при помощи одного унитарного преобразова- преобразования ?/: А=[гчхг, ..., ??]?; ?=?-1[?? ..., fcjc/. Нетрудно видеть, что в этом случае они будут коммутировать Покажем теперь, что и наоборот: если две эрмитовские матрицы коммутируют, то их можно при помощи одного и того же уни- унитарного преобразования одновременно привести к диагональной форме, т. е. переместительность эрмитовских матриц является не только необходимым, но и достаточным условием возможности их одновременного приведения при помощи унитарного преобразования к диагональной форме. Итак, положим, что АВ = ВА. Заметим при этом, что и подобные им матрицы будут также коммутировать. Действительно: (С'1 АС)(С iBC) = C-1ABC=C-iBAQ и точно такое же выражение получится для произведения Положим, что за С мы выбрали унитарное преобразование, при- приводящее А к диагональной форме, и подвергли такому же преобра- преобразованию и матрицу В. Новые матрицы будут также коммутировать, и мы можем, таким образом, при доказательстве нашего предложения считать просто, что матрица А уже имеет диагональную форму, т. е. что элементы aik удовлетворяют условию aik = 0 при 1фЫ. A89) Обозначим через bik элементы матрицы В и запишем условие, что наши матрицы коммутируют: ? ? ? aisbsk= ? bisask V> k=\y 2, ..., П). i = l 5=1 В силу A89) условия эти будут иметь вид: (?«-???)*?? = 0 (/, k=l, 2, ..., ?). A90) Если все числа ati различны, то из последних равенств непосред- непосредственно следует, что bik = 0 при Ьфк, т. е. что .матрица В также имеет диагональную форму, и предложение доказано. Перейдем теперь к рассмотрению общего случая, когда среди чи- чисел ац имеются одинаковые. Для определенности предположим, что числа эти распадаются на две группы одинаковых между собой чисел: ап =... = атт; ат+1, т+1 ==.,.== апп. Из формулы A90) непосредственно следует, что в этом случае элементы btk могут *быть отличны от нуля только тогда, когда или оба значка ink больше т или оба они не больше т. Таким
150 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [41 образом, в данном случае матрица В имеет квазидиагональную форму: B = [Bi9 SJ, где В\ — некоторая эрмитовская матрица порядка т и #2 — эрмитов- ская матрица порядка (п — т). В раскрытой форме мы можем на- писагь матрицу В в виде: Мы можем не меняя диагональной формы Д подвергать под- подпространство, образованное первыми т ортами, любому унитарному преобразованию, и то же самое относится к подпространству, обра- образованному последними (п — т) ортами. Выберем эти унитарные пре- преобразования Vx и V2 так, чтобы матрицы В ? и В2 записались в диаго- диагональной форме. В общем мы будем иметь унитарное преобразование всего ?-мерного пространства, имеющее квазидиагональную форму В силу сказанного выше, в новых координатах матрица А со- сохранит диагональную форму, а матрица В примет вид: [?,, ?,??^?, s.]tVi,v9] = [vr1fl,Vi, vrav,], т. е. будет также иметь диагональную форму, и} наше предложение доказано. Если мы теперь построим для наших коммутирующих матриц уравнения ?? = ??; Вх = \ьх, A91) то из предыдущего непосредственно следует, что для обоих этих уравнений мы можем построить одну и ту же систему ? линейно- независимых решений. Эти решения и будут давать столбцы той унитарной матрицы ?/, которая приводит обе наши матрицы к диа- диагональной форме. Иначе говоря, мы можем для двух коммутирую- коммутирующих эрмитовских матриц построить одну и ту же полную систему ? линейно-независимых собственных векторов. Что же касается соб- собственных значений, т. е. значений параметров ? и ?, то они будут, конечно, вообще говоря, различными. Заметим, что из предыдущего еще не следует, что всякий собственный вектор матрицы А будет и собственным вектором мафицы В. Если все собственные значе- значения А и В различны, так что каждому значению Хк и рл соогвет-
42] §4 КВАДРАТИЧНЫЕ ФОРМЫ 151 ствует с точностью до численного множителя только один вектор, то это будет, конечно, так. Но это уже не будет, вообще говоря, иметь места, если среди собственных значений есть одинаковые. Пусть jc(fe) есть полная система собственных векторов матриц А и В, г \k и ??— соответствующие собственные значения. Положим, например, что ?1 = ?2, но ?! ? ?2. При этом векторы С\Х{1) -f- С2л:B) при любом выборе постоянных С\ и С2 будут собственными векто- векторами для Л, но уже не будут собственными векторами для В. Все предыдущие рассуждения легко переносятся и на случай нескольких матриц, а именно: если имеется несколько эрмитовских матриц Ai9 ..., ?? то для того, чтобы их можно было одновре- одновременно привести к диагональной форме при помощи унитарного преобразования, необходимо и достаточно, чтобы они попарно ком- коммутировали, т. е. AiAk = AkAi при любых i и k от 1 до /. 42. Приведение унитарных матриц к диагональной форме. Унитарные матрицы в отношении приведения к диагональной форме обладают свойством, совершенно аналогичным эрмитовским матри- матрицам, а именно: если V есть некоторая унитарная матрица, то всегда можно найти такую унитарную матрицу {/, что матрица U~XVU будет диагональной матрицей. Мы можем записать нашу задачу в следующем виде: VU=U[K ···> ?? A92) где U—искомая унитарная матрица и ?? — искомые числа. Как и раньше для эрмитовской матрицы, столбцам матрицы U будут соответствовать некоторые векторы x^k) и эти векторы должны быть решениями уравнения Vx = \x, A93) где ? совпадают с числами Xk. Отсюда, как и выше, непосредственно следует, что эти числа ? должны быть корнями характеристического уравнения И—'? Vn ... Vln ??1 ??1 ··· ??? — ^ где vik — элементы матрицы V. Заметим прежде всего, что если матрицы V\ и U\ унитарны, то и матрица U\XV\U\ будет унитарной. Действительно, из унитарно- унитарности U\ следует унитарность i/f1, и произведение унитарных матриц есть также унитарная матрица. Возьмем некоюрьШ корень ? = ?? уравнения A94) и, подставив его вместо ? в уравнение A93), определим единичный вектор х^\
152 ГЛ. И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [42 удовлетворяющий этому уравнению, примем этот вектор за новый орт и присоединим к нему еще (п—1) единичных векторов так, чтобы получить ? единичных взаимно ортогональных векторов. Переход от прежних ортов к новым будет равносилен некоторому унитарному преобразованию Ub и наша унитарная матрица V пе- перейдет в подобную ? Соответствующее уравнение будет иметь, при Х = ХЬ в качестве решения вектор с составляю- составляющими A, 0, ... , 0), откуда будет, как и раньше, непосредственно следовать, чго элементы первого столбца матрицы Vt равны все нулю, кроме первого элемента, который равен ?1# Но поскольку в унитарной ма!рице сумма квадратов модулей элементов каждого столбца равна единице, мы можем утверждать, что число ?? по мо- модулю равно единице. Напомним теперь, что в унитарной матрице Vl и сумма квадратов модулей элементов каждой строки также равна единице. Но, как только что показано, первый элемент первой строки Хх равен по модулю единице, и, следовательно, остальные элементы этой строки должны равняться нулю. Итак, в результате первого унитарного преобразования мы привели нашу унитарную матрицу к такому виду, что в ее первой строке и первом столбце все элементы равны нулю, кроме первого: 0 0 О Совершенно аналогичное обстоятельство мы имели выше для эрмитовских матриц. Далее, элементы ?$ образуют унитарную матрицу порядка (п—1). Применяя еще унитарное преобразование, мы сможем и в этой матрице получить нули в первой строке и столбце, кроме первого элемента, который по модулю будет равен единице. В окончательном счете, в результате произведенных двух унитарных преобразований, наша унитарная матрица приведется к виду: О 0 ... О О Х2 О О О О О ... О
42] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 153 Продолжая наше рассуждение так же и дальше, мы приведем нашу унитарную матрицу при помощи некоторого унитарного пре- преобразования к диагональной форме. Отмегим, что из предыдущих соображений непосредственно следует, что все характеристические числа унитарной матрицы будут по модулю равны единице. Так же, как и в [41], можно показать, что если некоторые уни- унитарные матрицы попарно коммутируют, то их можно при помощи одного и того же унитарного преобразования привести к диагональ- диагональной форме. Отметим еще следующий факт. Пусть унитарная матрица U при- приводит некоторую матрицу А к диагональной форме, т. е. пусть U'^AU есть диагональная матрица. Как известно, модуль опреде- определителя U равен единице, и мы можем подобрать вещественное число ? так, чтобы определитель унитарной матрицы еши равнялся единице. При этом унитарная матрица еы{] также будет приводить А к диагональной форме, ибо {еыЦ) == ei<ue'itoLT1AU = U~lAU. Таким образом, всегда можно считать, что определитель унитарной матрицы ?/, приводящей некоторую матрицу к диагональной форме, равен единице. Пример Рассмотрим в качестве примера приведение к диаюнальной форме некоторой вещественной ортогональной матрицы третьего порядка A95) Будем считать, что определитель этой матрицы равен ( + 1), так что этой матрице соответствует некоторое движение трехмерного пространства, как целого, вокруг начала. Характеристическое уравнение для матрицы A95) будет по условию иметь свободный член, равный единице, ибо этот свобод- свободный член совпадает, очевидно, с определителем матрицы. С другой стороны, мы видели, что все корни нашего характеристического уравнения должны иметь модуль, равный единице. Старший член характеристического уравнения будет (— ?K = — ?3, и, следовательно, свободный член уравнения — единица — будет равняться просто произведению корней этого уравнения. Поскольку это уравнение имеет вещественные коэффициенты, возможны лишь два случая, а именно: или это уравнение имеет один корень, равный единице, а два дру- других мнимые, сопряженные с модулем, равным единице, т. е. два других корня будут вида е—??> или уравнение будет иметь корень единица, и оба других корня будут равняться (— 1). Второй случай является частным случаем пер- первого при <? = ?. Собственному значению ? = 1 соответствует вещественный вектор хП), который должен являться решением уравнения V*A) = *A). A96) Иначе говоря, этот ректор не должен меняться при том повороте про- пространства, который определяется матрицей V. Этот вектор, отвечающий вещественному значению ?=1, будет вещественным вектором, и он будет
154 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [42 определять, очевидно, ту ось, вокруг которой повернулось пространство (всякий поворот пространства вокруг начала равносилен вращению вокруг некоторой оси, проходящей через начало). Для определения составляющих этого вектора jcA) через элементы V перепишем уравнение A96) в виде: или, поскольку матрица V вещественна и унитарна, мы можем написать: Вычитая это из A96), будем иметь: (??__ Напишем это равенство в раскрытом виде, причем составляющие вектора хП) обозначим через (гхп, u2V uu). Получим систему уравнений: (??2 —?2?) ?>13 — vsl) ?? — »н) «и ? — ^2з) «и = О 1 =0 = 0 и из нее непосредственно следуют формулы, определяющие направление оси вращения: ип : ип : и31 == (?23 — ??2) : (vu — ??) :(??2 — ?2?). Два других собственных вектора jcB) и x{S) должны, очевидно, удовле- удовлетворять уравнениям Vx{2)r=e^x(i) и Vx^z=e-^x(Z\ A97) и это будут уже векторы с комплексными составляющими. Мы сможем опре- определить ? из того условия, что сумма корней характеристического уравнения равна, очевидно, сумме диагональных членов, т. е. следу матрицы V: причем можно считать, что <р лежит между 0 и ?. Из уравнений A97) следует, что составляющие вектора х{2) можем считать мнимыми сопряженными, поскольку значения ? в уравнениях A97) суть мнимые сопряженные числа. Составим новую унитарную матрицу: и ?{ мы 1 0 0 0 1 V2 1 V2 0 ? i V2 A98) Нетрудно убедиться непосредственно, что элементы столбцов матрицы =UU0 будут равны составляющим векторов \f2 ' V2 ' т. е. будут вещественны. Кроме того, матрица W, как произведение двух унитарных матриц, также будет унитарной матрицей, т. е. W будет ортого- ортогональной матрицей. Применим теперь к матрице V преобразование подобия, пользуясь унитарной вещественной матрицей W. Мы получим:
431 $ 4· квадратичные формы 155 Производя фактически перемножение матриц, получим: A99) 1 0 0 0 COS ? Sin ? 0 — Sin ? COS ? Мы можем всегда считать, что определитель ортогональной матрицы W равен (-|-1), ибо в противном случае мы могли бы умножить эту матрицу на (— 1), от чего соотношение A99) не изменилось бы. Таким образом, матрице W будет соответствовать также некоторое движение трехмерного пространства. Матрица A99), полученная в результате преобразования коорди- координат x~Wx\ подобна матрице Via дает в новых координатах то же пре- преобразование, которое первоначальная матрица V давала в прежних коорди- координатах. Из вида матрицы A99) непосредственно следует, что этой матрице A99) соответствует вращение вокруг новой оси x'iV на угол ?, и сущность нашего преобразования сводится к тому, что мы приняли за ось х'а\ упомя- упомянутую выше, ось вращения, изображаемую вектором хП). Из предыдущего непосредственно вытекает еще одно важное обстоя- обстоятельство, а именно: все вещественные матрицы, которым соответствует пово- поворот пространства на некоторый определенный угол ?, могут быть приведены при помощи преобразования подобия (различного для различных матриц) к одному и тому же виду A99), и, следовательно, все такие матрицы будут подобны между собой. Матрицы, соответствующие различным углам вращения, не могут быть между собой подобны, так как характеристические числа таких матриц 1, ei(9 и е~*? будут наверно различны между собой при различных значениях угла <р. Все эти свойства имеют очень простое геометрическое значение. 43. Матрицы проектирования. Мы переходим теперь к рассмотрению некоторого частного случая эрмитовских матриц. Пусть Rm—некоторое под- цространство измерения /я, образованное т линейно-независимыми векто- векторами уа\ ... , у{т\ Это подпространство Rm представляет собою совокупность векторов вида: где Ck — произвольные численные коэффициенты. Ортогонализируя векторы y{k\ мы можем построить ортонормированную систему векторов, хA\ ... ухш\ которая образует то же подпространство Rm. Мы можем далее дополнить ее до полной ортонормированной системы ? векторов, построив еще орто- орто(Ш+1) (W) нормированную систему д;(Ш+1), ..., jc. Эти последние векторы образуют некоторое подпространство R'n__m из- измерения (п — т)у причем два подпространства RmnR'n_m взаимно ортого- ортогональны в том смысле, что любой вектор подпространства Rm ортогонален любому вектору подпространства R'n_m [14]. Разлагая произвольный вектор ? по ортам x{k): ? = xiXm + · · · + xnxin\ B00) мы можем представить его в виде суммы двух векторов: B01)
156 ГЛ. ТТ. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [43 из которых один принадлежит Rm, а второй R'n_m. Нетрудно видеть, что такое разложение любого вектора ? на два составляющих единственно. Дей- Действительно, положим, что, кроме разложения B01), мы имеем второе разложе- разложение x = u'-\-v' указанного выше свойства. Отсюда и -f- ? = и'-\- vr или и — #' = яг — ?. Вектор, стоящий слева, принадлежит Rm, а справа R'n_mi и, следова- следовательно, и — и' и ? — ?' должны быть ортогональны. Но каждый вектор, ортогональный сам себе, равен, очевидно, нулю [14] и, следовательно, и — и' = 0, т. е. и совпадает с и\ а ? — с ?\ т.е. векторы ? и ? определяются по вектору ? единственным образом. Вектор и пазы* вается проекцией вектора ? в подпространство Rm. Та матрица, которая осу- осуществляет переход от вектора ? к вектору и, называется матрицей про- проектирования в подпространство Rm, и мы ее обозначим через Р# . Вид этой матрицы зависит, конечно, от выбора координатных осей. Если за основные орты мы выберем x{k\ то вектор ? представляется фор- формулой B01), а вектор и — формулой и в данном случае операция проектирования сводится просто к тому, что первые т составляющих остаются прежними, а остальные делаются равными нулю. Соответствующая матрица проектирования будет, очевидно, диагональ- диагональной матрицей вида: Р# =[1, 1, ... , 1, 0, 0, ... , 0], где первые т мест заняты единицами, а остальные нулями. Если бы мы иначе пронумеровали орты, то получили бы только другой порядок элементов, но по-прежнему имели бы диагональную матрицу, состоящую из единиц и нулей. В общем случае при любом выборе декартовых осей матрица проектирования имеет вид: Ря =^[1, ... ¦ 1, 0, ... , 0]?/, B02) т где U есть некоторая унитарная матрица, и собственные значения Р^ равны или нулю, или единице. Наоборот, всякая эрмитовская матрица указанного вида есть матрица проектирования в некоторое подпространство, число измере- измерений которого равно числу собственных значений ?™ , равных единице. т Можно определить матрицу проектирования и иным образом, а именно: матрица проектирования есть такая эрмитовская матрица, которая удовлетворяет соотношению Р2 = Р. B03) Действительно, принимая во внимание, что 12=1 и 02 = 0, нетрудно проверить, что матрицы вида B02) удовлетворяют соотношению B03). Наобо- Наоборот, если некоторая эрмитовская матрица удовлетворяет соотношению BQ3), и мы представим ее в виде: ? = 6?~1[?1, ... , ??] U, то в силу B03): U-i[\\, ... , Х2]?/=?/-Ч\, ... , ??]?/, т. е. ?| = ??(?-:1, 2, ... , ?), откуда непосредственно следует, что ??=*1 или 0. Если все характеристические числа матрицы равны единице, то эта матрица есть единичная матрица, и ей соответствует тождественное преобразование, т. е., иначе говоря, проек- проектирование вектора во все пространство (вектор остается неизменным). Исключая этот тривиальный случай, мы будем иметь у матрицы проектиро- проектирования хоть одно характеристическое число равным нулю и, следовательно,
43] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 157 определитель этой матрицы, равный произведению характеристических чисел, будет также равен нулю, и мы не можем, конечно, говорить об обратной матрице Р. Заметим еще, что непосредственно из определения следует, что матрица проектирования PR не меняет вектора, если он при- _ т надлежит подпространству Rm, и уменьшает длину вектора, если он не при- принадлежит Rm. После этих предварительных сведений перейдем к рассмотрению некото- некоторых действий с матрицами проектирования. Пусть имеются две матрицы проектирования ? и Р5, такие, что их произведение равно нулю, т. е. матрице, все элементы которой равны нулю: Р^ = 0. B04) Возьмем некоторый вектор ? из подпространства R, так что ? ? = ?. Формула B04) даст нам: Но отсюда непосредственно следует, что ? ортогонален к любому век- вектору из подпространства S. Действительно, в противном случае мы могли бы найти в подпространстве S единичный вектор j/, не ортогональный к xf и, принимая его за первый орт, мы имели бы для первой составляющей вектора ? величину, отличную от нуля и при проектировании ? в S эта составляю- составляющая осталась бы неизменной. Таким образом мы видим, что при выполнении условия B04) всякий вектор из R ортогонален всякому вектору из 5, а следо- следовательно, и наоборот. Но тогда наряду с B04) мы имеем и РдР5 = 0. B05) Действительно, для любого вектора у, вектор P^j/ принадлежит S, а по- потому ортогонален ко всем векторам из R, т. е. для любого вектора у мы имеем: Р„Рл; = 0, что и равносильно B05). Наоборот, если два подпрост- подпространства R и S взаимно ортогональны в указанном выше смысле, то имеют место B04) и B05). Рассмотрим теперь сумму двух матриц проектирования: P = PR+PS B06) и положим, что выполнены условия B04) и B05). Покажем, что матрица B06), которая является, очевидно, эрмитовской матрицей, будет также матрицей проектирования. Для этого убедимся, что квадрат ее совпадает с ней самой: откуда, в силу сделанного условия и того, что ? и Р_ суть матрицы проек- проектирования, имеем: Р2 = Р -\-Ps = P. Нетрудно показать, что в рассматриваемом случае матрице ? соответ- соответствует операция проектирования в подпространство (R-\-,S)t которое обра- образуется соединением подпространств RuS в том смысле, что подпространство (R-\-S) образовано совокупностью всех тех векторов, которые служили для образования подпространств R и S, т, е. если векторы JCa>, ... # х{р)
158 ГЛ. ??. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [43 образовывали Rи уа\ ... , yw образовывали 5, то подпространство (R-j-S) будет представляться совокупностью векторов: где Ck и Dk—произвольные постоянные. Предыдущее свойство обобщается и на любое число слагаемых: P = ?S +... + Ps · B07) ? т Если подпространства Sk попарно взаимно ортогональны, т. е. если любой вектор из Si ортогонален к любому вектору из Sj при различных / и у, то сумма B07) представляет собою матрицу проектирования в подпространство (oi + ... + Sm)> образованное всеми теми векторами, которые служили для образования подпространств 5^. В частном случае эта сумма может быть равной единичной матрице ?=?$ + ... + Р$ , и в этом случае обычно говорят о разложении единицы на матрицы проектирования или просто о разложении единицы. Рассмотрим еще произведение двух матриц проектирования B08) Для того чтобы это произведение также было матрицей проектирования, необходимо прежде всего, чтобы это произведение было эрмитовской матри- матрицей, а для этого, как известно [41]г необходимо, чтобы наши матрицы комму- коммутировали V/YV <209> Покажем, что это условие достаточно, т. е. что в данном случае квадрат матрицы Р2 совпадает с самой матрицей Р: или, переставляя матрицы в силу условия B09): что и требовалось доказать. Нетрудно проверить, что при условии коммути- коммутирования B09) матрице B08) соответствует проектирование в подпространство, образованное векторами, общими тем двум совокупностям векторов, которые образуют R и S. Отметим еще один результат, не останавливаясь на его доказательстве, которое не представляет никакого труда, а именно: если подпространство S составляет часть подпространства R, ?? разность P = PR-PS B10) есть также матрица проектирования. Если x{k) суть основные векторы, обра- образующие S, то для получения основных векторов, образующих R} мы должны добавить к вышеуказанным векторам еще один или несколько линейно не- независимых векторов. Эти последние векторы сами по себе образуют неко- некоторое подпространство Г, и матрица B10) в рассматриваемом случаен будет матрицей проектирования в это подпространство. Пользуясь матрицами проектирования, можно формулировать задачу приведения эрмитовской матрицы к диагональной форме вполне однозначным образом и при наличии кратных собственных значений.
43] § 4. КВАДРАТИЧНЫЕ ФОРЧЫ 159 Положим, например, что мы имеем эрмитовск>ю матрицу где U— некоторая унитарная матрица. Положим для определенности, что числа ?/j распадаются на две части, одинаковые между собой, причем пер- первые т чисел равны ?, а остальные (п — т) равны ?: Мы можем, очевидно, переписать нашу матрицу в виде: ? = ??/[1, ... , 1, 0, ... ,O]t/-' + vi/[O, ... ,0, 1, ... , \\U-K Введем в рассмотрение матрицы проектирования PR = U\\, ... , 1,0, ... , 0]?-»; Ps = U[0, ... ,0, 1, ... , l]U-K Соответствующие подпространства /? и 5, очевидно, взаимно ортого- ортогональны, и наши матрицы проектирования в сумме дают единичную матрицу. Мы имеем таким образом в данном случае ? = ??R-\-vP , причем \t = = .·.*=??» = 1* и Xm+1 = ... = Xw==v. В общем случае задача приведения эрмитовской матрицы к диагональной форме сводится к такому разложению единичной матрицы I=PS +... + Ps , B11) ? ?? чтобы наша матрица А могла быть представлена в виде: где ?/г — различные собственные значения нашей матрицы. Таким образом всякой эрмитовской матрице соответствует определенное разложение еди- единицы B11) такое, что эта матрица представляется в виде B12). Нетрудно перевести все предыдущие результаты на язык не матриц, а форм Эрмита. Всякой матрице проектирования ? с элементами pik соот- соответствует некоторая форма Эрмита ? )= 2 pikXiXk9 B13) которая называется иногда особой формой (Einzelform). Символ ? (?) — краткая запись (?^ jc, jc). Если соответствующее подпространство R имеет / измерений и мы выбе- выберем за первые / ортов / единичных взаимно ортогональных векторов под- подпространства R, то в такой координатной системе наша форма B13) будет иметь вид: \ ?') = х[х\ + Х^ +... + Х\х'г Заметим далее, что если матрицы Ps являются разложением единицы, согласно B11), то, выбирая за орты единичные взаимно ортогональные век- векторы в каждом из подпространств Ski мы будем, очевидно, иметь:
160 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [44 и, следовательно, при всяком выборе координатных осей сумма выражает квадрат длины вектора. Мы можем, таким образом, сказать, что задача приведения формы Эрмита А к сумме квадратов равносильна сле- следующим двум равенствам: 4 B14) \?\2=? PSkW- B15) Введение матриц проектирования позволяет, таким образом, формулиро- формулировать задачу приведения эрмитовской матрицы к диагональной форме без всякого специального выбора координатных осей. Это дает в свою очередь возможность перенести предыдущие результаты, с соответственными изме- изменениями, и на случай пространства с бесчисленным множеством измерений, чю и является основной задачей математического аппарата современной квантовой механики. Мы будем говорить об этом лишь значительно позже. Это распространение на случай бесчисленного множества измерений выводит нас из рамок алгебры и существенным образом связано с введением аппа- аппарата анализа. 44. Функции от матриц. Матрица может играть роль аргумента некоторой функции. Мы ограничимся здесь рассмотрением наиболее элементарных функций, а именно полинома от матрицы и рацио- рациональной дроби. Более подробное рассмотрение теории функций матриц мы сделаем впоследствии, после изложения теории функций комплексного переменного. Полином f(A) степени т от переменной матрицы А имеет вид: + ... + *,Ит> B16) где ck — некоторые численные коэффициенты. Значение функции в дан- данном случае есть тоже некоторая матрица, элементы которой выра- выражаются, очевидно, по формулам: {f(A)}ik = cobik + сх {ДЦ + ... + *« {Ат}ш где bik = 0 при 1фк и 8„=1. Можно рассматривать полином и от нескольких матриц, но при этом надо иметь в виду некоммутативность этих матриц при умно- умножении. Общий вид полинома второй степени от двух переменных ма- матриц Л и В будет: f (Л, В) = cQ -f схА -\- сф + с8Л2 + с
$4 КВАДРАТИЧНЫЕ ФОРМЫ 161 Заменим в формуле B16) матрицу А некоторой подобной ей мафицей U~lAU. Принимая во внимание, что (U~lAU)k = (J'1Ak(Ji будем иметь: f(U~lAU) = с0 -f c1LT1AU+... + cmU-1AmU= т. е. /([Г1АЦ)=(Г1 f(A) U. B17) Аналогичная формула будет иметь место и для полинома от не- нескольких матриц /(????/, U-lBU)=U-lf(Ay В) U. B18) Остановимся теперь несколько подробнее на случае эрмитовских матриц. Если А есть эрмитовская матрица, то непосредственно из определения следует, что любая целая положительная степень Аь, а гакже произведение с А, где с — вещественная постоянная, суть также эрмиговские матрицы. Кроме того, сумма эрмитовских матриц есть гакже эрмитовская матрица. Отсюда непосредственно следует, что если в формуле B16) А есть эрмитовская матрица и коэффи- коэффициенты ck — вещественные числа, то и значение функции /(А) будет эрмитовской матрицей. Эга эрмитовская матрица f(A), очевидно, ком- коммутирует с А, и их можно одновременно привести к диагональной форме при помощи некоторого унитарного преобразования. Заметим прежде всего, что если мы подставим в функцию B16) вместо А не- некоторую диагональную матрицу [ки ..., ??], то в результате получим, очевидно, также диагональную матрицу ? ck [?*, ..., ?*] = [/ (??, ..., / (??)], B19) fe = 0 где /(??) есть численное значение нашего полинома при подстановке вместо А числа ?^. Положим теперь, что V есть унитарное преобразование, преобра- преобразующее матрицу А к диагональной форме ..., \n]V~\ В силу B17) и B19) будем иметь: f{A)=V\f{\l\ ..., т. е. V преобразует и /(Л) к диагональной форме, причем /(?^,) суть характеристические числа этой последней матрицы. Перейдем теперь к рассмотрению рациональных дробей. Пусть /х (А) и /2 (А) — два полинома от матрицы А Рассмотрим их частное Ш- B20)
162 ГЛ. It. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [44 Как мы раньше видели, частное двух матриц не имеет, вообще говоря, определенного значения [26], но в данном случае, как не- нетрудно показать, мы получим для частного B20) одно определенное значение, если только определитель матрицы /з(Л) отличен от нуля. Частное B20) можно записать двояко: ? (Л)/а (ЛI или МАрМА). Покажем, что эти два произведения равны между собой: Л(А)МАГ*=МА)-1МА), или, что равносильно: ? (Л) ? (Л) =А (Л) ? (Л). B21) Так как наши полиномы содержат только одну матрицу Л, то они коммутируют, т. е. B21) действительно имеет место, и наше част- частное B20) имеет определенное значение. Нетрудно проверить дальше, что рациональные дроби в случае одной матрицы перемножаются, как и обычные дроби. Действительно: или, принимая во внимание коммутативность: /? (А) /з (А) /. , -* г ... г г /*ч г (Д\\-\ /? (?) ? (А) УГ7Ж/1{А)/з(А)'1МА)А{А)] В качестве примера рассмотрим рациональную дробь вида: V=\=t?> B22) где А — некоторая эрмитовская матрица, т. е. Л(**=А Легко пока- показать, что матрица U будет унитарной, т. е. что = {/-?, B23) Действительно, мы имеем: ?/ A откуда, переходя к транспонированной матрице, получим [26]: или, в силу того, что Д(*) = Л: ?7(*> = A -f ??)-' A - iA) = \=? = U~\ т. e. B23) выполнено, и U есть действительная унитарная матрица. Формулу B22) мы можем записать в виде;
46] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 163 причем, в силу B22), U коммутирует с Л, и значит {. B24) Совершенно так же, как и выше, можно показать, что если U есть унитарная матрица и определитель матрицы U~\-l отличен от нуля, то Л, определяемая формулой B24), будет эрмитовской матрицей. Таким образом, всякую унитарную матрицу, для которой D(U-\- 1) ? ?, можно представить через эрмитовскую матрицу А по формуле B22). 45. Пространство с бесчисленным множеством измерений. Мы переходим теперь к введению понятия о пространстве с бесчис- бесчисленным множеством измерений. Предварительно нам надо ввести поня- понятие о пределе комплексного переменного. Положим, что комплексное переменное z = x-\-yi принимает последовательно значения: zl = xl-\-yxi\ 2a = *a+J>i*; ...; гп = Хп+УпЬ ··· B25) Говорят, что комплексное число a = a-\~bt есть предел последова- последовательности B25), если модуль разности (а — zn) стремится к нулю при беспредельном возрастании п, т. е. | ? — ?? | -> 0 при ? -> оо, и пишут ? = lim zn или zn -> ?. Но Поскольку под радикалом оба слагаемых не отрицательны, условие, | ? — ??\ -> 0 равносильно двум условиям: хп -> а и уп -> Ь. Итак: Xn+yJ + a + bl B26) равносильно хп~* а и уп->Ь. Рассмотрим ряд с комплексными чле- членами: Он называется сходящимся, если сумма его первых ? членов Sn= ? (?» + **0 = (?? + '4 + ... + ?») + (*?+*4 + · стремится к пределу: Sn-+a-\-bi при беспредельном возрастаний ? и этот предел (а~\-Ы) называется суммою ряда. Из определения ^предела следует, что сходимость ряда B27) равносильна сходимости рядов оо оо а=^ак и *=2*» B28)
164 ГЛ. II ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [46 составленных из вещественных и мнимых частей членов ряда B27). Положим, что сходится ряд ?^ B29) составленный из модулей членов ряда B27). В силу очевидных не- неравенств \ak\^Val + b% и \bk\«zVft+n, B30) при этом и ряды B28) будут сходящимися и притом абсолютно схо- сходящимися, а потому и ряд B27) будет также сходящимся, т. е. если сходится ряд B29), то ряд B27) и подавно сходится. В этом случае ряд B27) называется абсолютно сходящимся. Применяя обычный признак Коши, мы можем формулировать необходимое и достаточное условие абсолютной сходимости следующим образом: при любом малом положительном ? существует такое ?, что SV* + »*l<e, B31) если только п^> N и ? — любое целое положительное число. Применим теперь сказанное выше к некоторым частным случаям, которые играют существенную роль в дальнейшем. Рассмотрим ряд вида: f B32) где cnk и ?? — некоторые комплексные числа, относительно которых известно, что ряды ???2 и ???" <233> сходятся. Применим доказанное в [29] неравенство п-\-р п + р п+р {??^???**!9 ???*!"· k=±n k = n k—n Принимая во внимание сходимость рядов B33), мы получаем отсюда, что сумма
45] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 165 будет сколько угодно малой при больших ? и любых /?, т. е. схо- сходимость рядов B33) обеспечивает абсолютную сходимость ряда B32). Рассмотрим теперь ряд ? ??* + ?* ?9 = ? ? + h) («* + U B34) причем по-прежнему будем считать, что ряды B33) сходятся. Ряд B34) можно представить в виде суммы четырех рядов: ?* *?*; Первые два из них сходятся по условию, сходимость же последних двух рядов вытекает из доказанного выше предложения, т. е. сходи- сходимость рядов B33) обеспечивает и сходимость ряда B34). Обратимся теперь к рассмотрению пространства с бесчисленным множеством измерений. Мы назовем вектором в таком простран- пространстве последовательность бесчисленного множества комплексных чисел причем всегда будем считать, что эти числа подчиняются некоторому условию, а именно ряд B35) должен быть сходящимся рядом. Совокупность таких векторов назы- называется обычно пространством Гильберта, который впервые изучал такое пространство. В дальнейшем мы будем для краткости называть его пространством /2. Для векторов пространства /2 мы введем, как и выше, основные операции умножения вектора на число и сложение векторов. Если xk — составляющие лг, то составляющие вектора сх, где с — неко- некоторое комплексное число, считаются равными cxk. Если xk и yk — составляющие векторов ? и у, то составляющие вектора (х-\-у) считаются равными (Хь-\-Ук)- Разность ?—у есть сумма ? и (—1)у 00 (ср. [12]). Раз ряд B35) сходится, то, очевидно, ряд ^ \cxk\* также сходится. Точно так же, если ряды
166 ГЛ. П. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [45 сходятся, то из вышесказанного вытекает, что и ряд также сходится, т. е. последовательности чисел (cxv схь ...) и (Х\-\~Уь лга+^а» ···) определяют векторы сх и х-\-у, если ? и у принадлежат /2. Нулевой вектор есть вектор, все составляющие кото- которого равны нулю. В векторных равенствах он обычно обозначается числом нуль. Операции над векторами подчиняются обычным прави- правилам (ср. [12]): (а-{-Ь)х = ах-\- Ъх\ а (х -\-у) = ах-\- ay; a (bx) = (ab) х. Точно так же, в силу сказанного выше, мы можем для векторов ? и у определить скалярное произведение оо откуда следуют формулы [13] (У> х) = (х> У)\ (?*, у) = а (др, у); (х, ау) = ? (а:, у), (х+У> г) = (х, г)-\-(у, z); (z, x-\-y) = (z, x)-\-(z, у). Сумма ? B36) определяет квадрат нормы (длины) вектора х. Введем следующее обозначение нормы: оо ?? r ia — и ? ||2 (9Ч7\ т. e. || ? || обозначает норму вектора х. Для скалярного произведения имеет место неравенство [30] |(*,;у)|<||х||-Ы1 B38) и совершенно так же, как в [30], выводится правило треугольника II *+* II < II* II+ 11*11- B39) Норма положительна для всякого вектора, кроме нулевого вектора, у которого она равна нулю. Два вектора и и ? называются взаимно ортогональными или просто ортогональными, если их скалярное произведение равно нулю, г. е. (и, «0 = 0 и (ф, и) = 0, причем одно из этих равенств есть следствие другого,
45] S 4. КВАДРАТИЧНЫЕ ФОРМЫ 167 Если векторы xik) (& = 1, 2,..., /и) попарно ортогональны, т. е. если ) x^k}) = 0 при ??/г, то имеем, очевидно: или, что то же самое: \\х{1)+...+х{тЦ\* = \\хA)\\*+...+ \\х(т)\\\ B4°) т. е. квадрат нормы суммы попарно ортогональных векторов равен сумме квадратов норм слагаемых. Естественно назвать это пред- предложение теоремой Пифагора. Из определения нормы непосредственно следует, что если с — комплексное число, то для нормы вектора сх имеем Говорят, что векторы х{1\ х{*\ ..., х(т) B41) образуют ортонормированную систему, если эти векторы попарно ортогональны и норма каждого равна единице, т. е. (*«>, *<*>) = 8,„ где btk = О при / ? k и Ън = 1. Отметим, что при этом формула B40) дает где ak — любые комплексные числа. Ортонормированные системы мо- могут состоять и из бесчисленного множества векторов. В качестве примера приведем основные орты пространства /2: а<!>A, 0, 0, 0, ...); аB)@, 1, 0, 0, ...); а<3>@, 0, 1, 0, ...); ... Для составляющих любого вектора у(уъ Уь .·¦) имеем: Вернемся к конечной ортонормированной системе B41). Скалярное произведение (у, х^) называют часто коэффициентом Фурье век- вектора у относительно ортонормированной системы B41) или величи~ ной проекции у на ось x{k\ Сумма 2 су, *<*>)*<*> вообще говоря, отлична от у. Представим у в виде т v= ?(у, *<*>) *<*> + «. B42)
168 ГЛ. П. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [46 Умножая обе части этого равенства скалярно на х^1) и принимая во внимание ортонормированность системы B41), получим (у, *<'>)=су, *<'>) + («, Х&), т. е. (и, д:(/)) = 0 (/=1, 2, ..., т) или, иначе говоря, вектор и ор- ортогонален ко всем векторам jc(ft) (&=1, 2, ,.., /я). Мы можем гаким образом применить к правой части равенства B42) теорему Пифагора т ^'?+ 11 «II2. B43) B44) откуда непосредственно следует неравенство которое называется неравенством Бесселя. В этом неравенстве бу- будет иметь место знак равенства в том и только в том случае, когда ц = 0, т. е. когда и — нулевой вектор. Это непосредственно следует из B43). Для перенесения последних результатов на случай бесконечных ортонормированных систем нам необходимо ввести понятие предела последовательности векторов и рассматривать бесконечные ряды, члены которых — векторы /2. 46. Сходимость векторов. Пусть имеется бесконечная последо- последовательность векторов v^ (k=l, 2, ...). Будем говорить, что эта последовательность стремится к вектору г>, или что вектор ? есть предел этой последовательности, если при k —> оо || v _ Ю(Ь) || ^ о, т. е. || ? — vik) f -> 0. B45) Обозначая через ?&\ ?&\ ... составляющие i>(fe), а через vb v%, ...— составляющие ?, можем написать условие B45) в раскрытом виде: lim 2 [K-*f ? + ?-^)? + ···] = ?. B46) k-* oo k==l Раз сумма неотрицательных слагаемых должна стремиться к нулю, то то же можно утверждать и о каждом слагаемом, т. е. из B46) следует lim fc-юо — ?, kk) = 0 (да=1, 2, ...), B47) т. е. каждая составляющая ?$ должна стремиться к соответствующей составляющей vm. Подробнее говоря, вещественная и мнимая части ?$ должны стремиться к вещественной и мнимой частям vm [45J.
46] ^ 4. КВАДРАТИЧНЫЕ ФОРМЫ 169 Заметим, что из B46) следует B47), но обратное не верно, т. е. из B47) не следует B46). В качестве примера положим, что вектор <о^ имеет составляющие @, ..., О, 1, 0 ...), причем единица стоит на месте, номер которого равен k. При беспредельном возрастании k каждая из составляющих станет равной нулю, т. е. при любом целом т мы имеем: г^-^0, т. е. г»т = 0 (/# = 1, 2, ...), но в то же время сумма B46) все время остается равной единице. Если последовательность v^k) стремится к г>, то пишут ю^^>ю. Рассмотрим еще пример, когда сходимость имеет место. Пусть ? (vly vb ...) — некоторый вектор. Определим векторы v^ следую- следующим образом: вектор v^ имеет первые k составляющие те же,' что и ?, а остальные его составляющие равны нулю, т. е.: v(k)(vv ?* ..., vk, 0, 0, ...). Нетрудно показать, что O{k)^>v. Действительно, в рассматриваемом случае II *-«<*> И» = ? М> и, в силу сходимости ряда с общим членом | vn р, написанная сумма стремится к нулю при беспредельном возрастании k. Отметим неко- некоторые простые правила, связанные с понятием предела. Если и^ =?> и и v{k)^>v, то Отмегим, что скалярное произведение есть комплексное число и в последней формуле в связи с этим мы написали ->, а не =>. Можно сказать, что эга формула выражает непрерывность скаляр- скалярного произведения. Мы имеем, в силу B34): II (и + ?) - причем, в силу определения предела, \\и — и^ || -> 0 и || ? — ?^ \\ -> 0. Из написанного неравенства следует, что и || (И+ <>)_(«(*>+«,<*>) Ц-» 0, т. е. действительно B(fe)+t»(fe)=>e + u Далее, в силу определения предела, следует: <*> + <*> <*> где || «(ft) || -? 0 и || i(ft) || ->¦ 0. Для скалярного произведения имеем: ?<*))?=(? + ?('). « *=(«, ?)-? {и,
170 ГЛ. П. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [46 откуда или, в силу B38): I (В) v) _ (В(»), „(*)) | < || ? ||. || <(ft) II + II *(ft) II · II «Ml + II *(fc) II · II '(ft) II · Правая часть стремится к нулю, а потому и |(», ©) —(«<*\ «<*>)!-> 0, т. е. (»<*>, *(*>)_>(«, Ф). В частности (в(й), а(к)) ->-(», «), т. е. || «<й!) ||3-> ||я|р или II «(й) 11-41» II· Легко доказать также, что если последовательность числа ck имеет предел с, то cku^k) ^>си. Имеет место также необходимое и достаточное условие существо- существования предела, выражаемое обычным признаком Коши. Формулируем этот признак в данном случае. Пусть имеется последовательность векторов *<*> (ft=l, 2, ...). B48) Для того чтобы эта последовательность имела предел, необхо- необходимо и достаточно выполнение следующего условия: для любого малого и положительного е существует такое N, что B49) если только ? и m"^>N. Покажем прежде всего необходимость условия. Пусть последо- последовательность B48) имеет предел ю. Мы можем при этом написать и отсюда по правилу треугольника Из определения предела непосредственно вытекает, что оба сла- слагаемых в правой части стремятся к нулю при возрастании ? и т, а следовательно, то же самое должно иметь место и для левой части, т. е. условие B49) при этом обязательно должно быть выполнено. Переходим теперь к доказательству достаточности условия B49). По- Положим, что это условие выполнено, и докажем, что последователь- последовательность B48) стремится к пределу. Условие B49) в раскрытом виде может быть записано так: оо <*9 при ? и m^>N% B50)
46] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 171 где v№ — составляющие v{J). Отсюда непосредственно следует, чго при любом 5 мы имеем: \vW — г^т>|^е при ? и т^>?, или, раз- разлагая на вещественную и мнимую части гА") = aW 4- Мп\ •S S ' S можем написать ^ при /? й W>A/, Применяя признак Коши [I; 31], можем угверждать, что ?&% и Ь^ имеют пределы при #->оо. Обозначая их через as и bs, можем уг- верждагь, что v^ имеет пределом комплексное число as-\-ibs. Пока- Покажем прежде всего, что ряд сходится, т. е. что vs являются составляющими некоторого вектора. Удерживая в сумме B50) конечное число первых слагаемых и пере- переходя в этой конечной сумме к пределу по п, будем имегь: м ? I*, —«ГМ*<еа, s= 1 где ? — любое целое число. Переходя в этом последнем равенстве к пределу при ? -> оо, получим: откуда непосредственно следует, что числа vs — v^ образуют состав- составляющие некоторого вектора. То же самое мы знаем и относительно чисел ??\ а следовательно, то же мы можем утверждать и об их сумме, т. е. о числах vs. Таким образом, эти числа суть составляющие некоторого вектора <о} и неравенство B51) можно записать в виде; || *_*<*) || <е, при т^> Ny т. е. Ч)(т) -> ?, и, следовательно, последовательность B48) действительно имеет предел. Каждая составляющая vs вектора ? определяется, очевидно, как предел ?^\ откуда непосредственно следует, что этот предел может быть только один. Рассмотрим теперь бесконечную сумму векторов «W+ «<¦> + .·. B52)
172 ГЛ. IT ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ D6 Она называется сходящейся, если сумма первых ? слагаемых имеет предел в указанном выше смысле при ? —> со. В силу признака Коши, необходимым и достаточным условием сходимости является выполнение неравенства || 8(п+р) _ $(*) || = || ц(*+1) +... + и{п+Я |Х ? B53) при ?^>? и любом р. Отметим, что из непрерывности скалярного произведения [46] непосредственно вытекает следующее: если ряд B52) сходится us — его сумма, a ? — любой элемент /2, то со оо (в, г)= 2 («(ft). *) и (*, «)= 2 (*. «<ft))> B54) т. е., кратко говоря, скалярные произведения (s, z) и (^, s) можно определять почленно. Установим теперь необходимое и достаточное условие сходимости ряда B52), составленного из попарно ортогональных векторов uSk\ Согласно признаку Коши мы должны составить выражение B53), квад- квадрат которого, в силу теоремы Пифагора, раве^ Отсюда непосредственно следует, что для сходимости ряда, состав- составленного из попарно ортогональных векторов, необходимо и до- достаточно, чтобы сходился ряд из квадратов норм членов ряда. Этот результат можно сформулировать и иначе. Пусть х^ (&=1? 2,,..) — бесконечная ортонормированная система. Составим ряд \ B55) где ak — некоторые комплексные числа. Из вышесказанного непосред- непосредственно следует, что необходимым и достаточным условием схо- сходимости ряда B55) является сходимость ряда ? м- Между прочим, из этого непосредственно следует, что перестановка слагаемых ряда B55) не нарушает его сходимости. Можно показать,
47] $ 4. КВАДРАТИЧНЫЕ ФОРМЫ 173 что при этом и сумма ряда не меняется. Положим, что ряд B55) сходится, и обозначим через s его сумму Умножая обе части на х^ и принимая во внимание ортонормирован- ность системы x^k\ получим: al = ($, х^1^) (/ ===== 1, 2, ...). Заменяя ak на ($, х^) и умножая обе часги B55^ скалярно на s, полупим: \\*\\*= ? \(s, ?<*>)|«, B56) т. е. коэффициенты сходящегося ряда B55j) суть коэффициенты Фурье его суммы, и для этой суммы имеет место формула замкнутости B56) по отношению к ортонормированной систе- системе x{k). Вернемся к ряду B52) и положим, чго члены ряда попарно орто- ортогональны и что ряд сходится. Мы можем при этом написать и^ = = <xkx(k\ где ak = \\u^ \\ — числа и х^ образуют ортонормирован- ную систему. Полученный выше результат можег быть записан в виде: 00 I!s II === 2-1 IIи II > т. е. теорема Пифагора верна и для сходящихся рядов, члены кото- которых попарно ортогональны. 47. Ортонормированные системы. Пусть имеется бесконечная ортонормированная система x(k) F=1, 2, ...), B57) т. е. (*<*>, х(*)) = Ъф B570 и у — какой-либо векгор /2. Составим «ряд Фурье» у относительно системы B57): 2 (V, x{k))x{k). B58) Как мы видели [45], для любого конечного т т ? к*
174 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [47 и в пределе при т->оо получим: ? ICv> -^?^?????2* B59) откуда следует сходимость ряда, стоящего в левой части этого нера- неравенства (неравенство Бесселя), и, в силу сказанного в [46], ряд B58) СХОДИ1СЯ. ПОЛОЖИМ B6°) Как и в [46] можно показать, что и ортогонален ко всем теорема Пифагора даег = ? \<J> х(к Мы можем утверждать [45], что знак равенства в неравенстве B59) равносилен тому, что вектор и в формуле B60) есть нулевой вектор. Ортонормированная система B57) называется полной, если не су- существует вектора, отличного от нулевого и ортогонального ко всем x^k)\ она называется замкнутой, если для любого векгора у из /2 имеет место уравнение замкнутости: ь\?= ? к* *(fe))i2· <261) Если система B57) полна, то вектор я, входящий в формулу B60), есть нулевой вектор, и мы имеем разложение: 00 ?= ? С* xik))x(k)> B62) откуда, как мы видели [46], следует уравнение замкнутости B61). Наоборот, пусть система замкнута и вектор и ортогонален ко всем x^k\ т. е. (a, x(k)) = 0 (й=1, 2, ...). При этом из формулы B61) при замене^ на и следует || и ||2 = 0, т.е. и — нулевой вектор. Итак, полнота и замкнутость эквивалентны. Из вышесказанного легко следует, что полнота (замкнутость) системы x^k) равносильна возможности представления любого вектора у рядом B62). Положим, что система B57) замкнута и выведем для любых двух векторов у и ? из /2 обобщенное уравнение замкнутости. Нетрудно видеть, что для векюров y-\-z и у -j- i^r коэффидиен1ы Фурье равны
47J § 4. КВАДРАТИЧНЫЕ ФОРМЫ 175 соответственно (у, x{k)) -f- {?, x{k)) и (у, x{k)) -j- i (z> x(k)). Применяем к y-\-z и у ~\-iz уравнение замкнутости: ? [Су *<*') +'(*> k = 1 Пользуясь уравнением замкнутости для у и ?, получим: 00 ОО X(k)\ ! XT' ?? ? оо откуда и следует обобщенное уравнение замкнутости для полной ортонормированной системы B57): = ? Cv> x(h))(*> x{ B61,) Если у совпадает с ?, то эта формула переходит в B61). Обозначим через ?№ составляющие векторов x^k) (k, 5=1, 2, ...) ортонорми- ортонормированной системы B57) и выпишем их в виде бесконечной матрицы: xf\ B63) Из условий ортонормированности B57Х) непосредственно следуют формулы 2^)^5=??? (?, А=^ 2, ...), т. е. следует ортонормированность столбцов матрицы B63). Выяс- Выясним теперь условия, при которых ортонормированная система B57) будет полной. Сначала установим необходимые условия полноты. Положим, что система B57)^—поЛная, и применим к векторам aSk) @, 0, ..., 1, 0, ...), которые мы ввели в [45], уравнения замкнутости B61) и B61 г)
176 ГЛ II ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [48 Принимая во внимание, что (а(А?\ х^) = х$ и что а(/г) образуют ортонормированную систему, получим: т. е. для полноты ортонормированной системы x^k) необходима ор- тонормированность строк матрицы B63). Покажем, что для полноты достаточно потребовать лишь нормированности строк: 2|^|·=1. B64) Положим, что эти условия выполнены, и докажем полноту системы *<*>. Формулы B64) являются, в силу (а(А), x^) = xf и ||а(А)|| = 1, уравнением замкнутости для векторов cak\ и следовательно, имеем: а^= |] (?<*>, ?^)??. B65) ?=1 Вместе с тем коэффициенты Фурье любого вектора у (уь уь ...) по отношению к ортонормированной системе a*fe) равны составляющим y(k) (k=\y 2, ...) и уравнение замкнутости для у совпадает просто с определением нормы у B36), т. е. система aSk^ — полная. Пусть ? — вектор, ортогональный ко всем х^к\ Докажем, что эго нулевой вектор. Из B65) следует, что (a{k\ v) = 0 (k=l, 2, ...). Поскольку a{k) образуют полную систему, отсюда и следует, что ? — нулевой вектор. Таким образом, при соблюдении условий B64) доказана пол- нога оргонормированной системы x^k\ Сформулируем полученный результат: для того чтобы ортонор мир о ванная система х^ была полной (замкнутой), необходимо и достаточно, чтобы имели место формулы B64) (нор миро ванное ть по строкам матрицы B63)). При соблюдении этих условий будет иметь место и ортогональность строк матрицы B63). 48. Линейные преобразования с бесчисленным множеством переменных. Рассмотрим в кратких чертах линейные преобразова- преобразования с бесчисленным множеством переменных: ? B66) или ?' = ??, B67)
48] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 177 \ где А есть бесконечная матрица с элементами aik. Поставим прежде вс^го условие, чтобы бесконечные ряды, входящие в правые части равенств B66), были сходящимися для любого вектора ? из про- пространства /2. Как мы знаем, это условие будет выполнено, если ряды оо \aik\ \1 l > ?> · · V будут сходящимися при всяком и Можно показать, что это условие не только достаточно, но и необходимо. Если это условие не выпол- выполнено, то ряды, стоящие в правых частях равенств B66), будут сходя- сходящимися не для всего пространства 4, но лишь для некоторой его части. Естественно также поставить условие того, чтобы числа x'k, получаемые в результате преобразования B66), также являлись составляющими некоторого вектора пространства /2, если xk суть составляющие некоторого вектора, т. е. чтобы ряд 00 был сходящимся, если только сходится ряд ? x k\ Если матрица А удовлетворяет обоим вышеуказанным условиям, то соответствующее преобразование А называется ограниченным преобразованием. Смысл этого термина заключается в том, что для такого преобразования можно показать существование положитель- положительного числа ? такого, что х \\\ B68) или в раскрытом виде: оо оо Остановимся на одном частном случае линейных преобразований. Рассмотрим линейное преобразование B70)
178 ГЛ II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [48 причем, как всегда, считаем, что ряды оо 2j I llik I fe= 1 * сходятся при всяком и Введем в рассмотрение векторы д(й) с со- составляющими: пкЬ пкь ..., и положим, что коэффициенты uik та- таковы, что векторы и{к) образуют полную ортонормированную систему. Как мы показали выше, это равносильно ортогональности и норми- рованности таблицы uik по строкам и столбцам, т. е. оо оо ??? п =Ъ Уи й =? B71? 5=1 5=1 Соответствующее преобразование B70) называется в этом случае унитарным. Равенства B70) мы можем записать в виде: B72) Формула замкнутости дает: ОО 00 /2=1 k=\ т. е., как и в случае конечного числа измерений, унитарное пре- преобразование не меняет длины вектора, и в формуле B68) мы можем считать М=\. Систему B70) или, что то же, B72) не!рудно решить относи- относительно xk> если зад?*чные числа х'и таковы, что ряд из квадратов их модулей сходится. Принимая во внимание, что векторы uSk>) (ukii ukb ...) образуют по условию полную ортонормированную систему, получаем в силу B72) у. v'/*(l) I v'«B) I f973\ Л Vjl* —j— ?2» —? ... \ZiiO) ИЛИ B74) Формулы эти показывают, что преобразование, обратное унитарному, получается заменой строк столбцами и всех элементов сопряженными, т. е. здесь имеет место полная аналогия со случаем конечного числа измерений-
48] $ 4. квадратичные формы 179 В общем случае даже ограниченных ма!риц вопрос об обратной матрице и о приведении матрицы к диагональной форме предс1авляет большие трудности и приводит к результатам, которые не имеют своего точного аналога в пространстве с конечным числом измере- измерений. Подробное рассмотрение теории бесконечных матриц проведено в пятом томе. Здесь мы ограничимся указанием лишь некоторых резулыагов. Приведем необходимое и достаточное условие для aik) при котором формула B66) дает ограниченное преобразование. Оно формулируется так: существует такое положительное число М, что при любом целом положительном I и для любых комплек- комплексных чисел jcs(s=1, 2, ...) выполняется неравенство aikXi xk Доказывается и следующее достаточное условие ограниченности пре- преобразования B66): существует такое положительное число ? (не зависящее от i и k), что выполняются неравенства: (*=1, 2, ...). (/=1, 2, ...). Если матрица А определяет ограниченное преобразование B66), то существует единственная матрица Л, также определяющая ограничен- ограниченное преобразование и такая, чго для любых ? и у выполняется ра- равенство (Ах, у) — (х9 Ау), и элементы этой матрицы А выражаются через элементы А по фор- формулам aik = aki. Если А совпадает с Л, т.е. aik = aki, то ограничен- ограниченное преобразование B66) (или матрица А) называется самосопряжен- самосопряженным (самосопряженной). Для ограниченных преобразований имеет место формула; ОО 00 п=\ (АХ} JO= ? ( ? апт*т)Уп= ? Хт (? аптУп)~ \ \ т = \ п = \ k I в= lim 2 ? пптХтУп-
180 ГЛ. И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [49 Отметим один важный частный случай ограниченных операторов, а именно тот случай, когда сходится двойной ряд ? la-l2· B75> ?, т — 1 При этом двойной ряд 00 У ? аптхтУп п, т= 1 абсолютно сходится при любом выборе векторов х(хь хь ...) и У(Уь Уъ ···)· Если, кроме сходимости ряда B75), мы имеем aik = akh то имеет место возможность приведения формы Эрмита к сумме квадратов при помощи унитарного преобразования 2j ^j ?, m = 1 k = \ где ?? — вещественные числа и" вектор ? (zb zb ...) получается путем применения к вектору х(хь х^ ...) некоторого унитарного преобра- преобразования: ?=???. При этом ?^-^0 при ?-*сю (может случиться, что \k = 0 при всех достаточно больших k). Если А и В — две беско- бесконечные матрицы, дающие ограниченные преобразования, то их после- последовательное применение дает также ограниченное преобразование, коэффициенты которого вычисляются по обычным формулам {&4},?=? {B}is{A}sh. ?= 1 Отметим еще, что если последовательность векторов х^ имеет пре- предел х> т. е. если jc(/5) = ^>jc, го Ах^=^>Лх} если А — матрица ограниченного преобразования. Существенно важную роль в приложениях к математической фи- физике играют и неограниченные линейные преобразования. Их иссле- исследование изложено в пятом томе. 49. Функциональное пространство L<i. Мы рассмотрели про- пространство 4, в котором вектор определился бесчисленным множеством составляющих, которые мы нумеровали целыми числами: первая составляющая — хь вторая — х% и т. д. Переходим теперь к рассмотрению семейства L($) комплексных функций f(x)=fi(x)-\-lfb(x)> определенных на измеримом множе- множестве (о и таких, что вещественные функции fx (?) и /2 (х) измеримы на & и принадлежат L3(^)[II, 161—163], откуда следует, что \f(x)\ есть измеримая на & функция и принадлежит^ (<^). Если веществен- вещественные и мнимые части двух функций соответственно эквивалентны, то
49] I 4. КВАДРАТИЧНЫЕ ФОРМЫ 181 функции называются эквивалентными, и они, как элементы функцио- функционального пространства 12(<^), отождествляются, т. е. элементом этого пространства является все множество эквивалентных функций и любая функция этого множества может быть представителем этого множе- множества. Нулевой элемент L%((o) есть функция, эквивалентная нулю на <^,— например, функция, тождественно равная нулю на (о. В дальнейшем вместо L2(^) мы будем писать просю L2. Свойства функционального пространства L2 аналогичны свой- свойствам /3. Элементы L2 можно умножать на комплексные числа и скла- складывать [И, 161]. Скалярное произведение двух элементов f(x) и g(x) определяется формулой B76) 9 и квадрат нормы элемента f(x) — формулой B77) Определение ортогональности — то же, что и для /2, и без изменения повторяются результаты [45]. Сходимость последовательности элемен- элементов /п(х) к элементу f(x) определяется формулой lim ^ \f(x)—fn(x)?dx = 0, B78) ? -*· оо ?> ? и повторяются без изменения определения и результаты [46] и [47], причем надо иметь в виду [II, 161 —163]. Отметим, что если akwbk — коэффициенты Фурье элементов f(x) и g(x) относительно полной ортонормированной системы yk(x) (k=\, 2, ...), т. е. = \ dx; bk = 5 g(x)^Jx)dx, B79) S то имеет место, как и в [47], обобщенное уравнение замкнутости \f{xu(x)dx= 2 akbk. B80) Из сказанного выит следует, что сходимость ряда в L3
182 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [50 есть сходимость в среднем lim $ где sn(x)— сумма первых п членов ряда. 50. Связь между пространствами 12 и ?2· Пусть, как и выше, (Ь=1, 2, ...) B81) — некоторая полная оргонормированная в L2 система. При этом любому элементу из L2 соответствует бесконечная последователь- последовательность ак его коэффициентов Фурье, сумма квадратов модулей кото- которых сходится, и наоборот, любой бесконечной последовательности комплексных чисел ck(k=\, 2, ...), сумма квадратов модулей кото- которых сходится, соответствует определенный элемент L2, для которого ck суть коэффициенты Фурье относительно системы B81) [II, 163]. Таким образом, 9ia система приводит в биоднозначное соответствие элементы L2 и элементы /2* всякому элементу Z,2 соответствует определенный элемент /2, и наоборот [II, 163]. При эюм сохраняются сложение, умножение на число, скалярное произведение (в силу B80)) и норма. Если последовательность fn (?) элементов L2 сходится к элементу/(?), т. е. ||/—fn || ->0 при #->оо, то то же будет иметь место и для соответствующих элементов /2, что следует из равенства норм: 2 \ак-<№\* = \ \f(x)-fn{*)\*dx, где ak и а%] — составляющие элементов /2, соответствующих f(x) и /„D При установлении соответствия между пространствами L2 и /2 мы исходили из определенной полной ортонормированной системы B81). Если взять другую такую же систему ??(*) (* = 1, 2,...), B82) то, конечно, закон соответствия* будет уже иным. Всякая функция системы B82) разлагается в ряд Фурье по B83) = Ь 2, ...), причем ряд, стоящий справа, сходится в 12. Принимая во внимание обобщенное уравнение замкнутости, получим
61J § 4. КВАДРАТИЧНЫЕ ФОРМЫ 183 т. е. матрица U с элементами uik ортонормирована по строкам. При- Принимая во внимание, что ё и полноту системы B81), получаем откуда следует, что таблица U есть таблица унитарного преобразо- преобразования. Нетрудно показать, что и наоборот, всякая таблица унитарного преобразования U приводит согласно B83) к полной ортонормиро- ванной системе B82), если такою же была система B81). Приведем в качестве примера для пространства L2 функций одной независимой переменной на отрезке (— ?, ?) систему функций [И, 174]: ?,(?) = y=eikx (* = 1, 2, ...)· B84) Нетрудно доказать, что это — ортонормированная система. Отметим, что нумерация по k производится здесь не от 1 до оо, а от (— оо) до (-{-об). Такое изменение нумерации несущественно. Пользуясь результатами [II, 169] можно показать, что система B84) — полная. 51. Линейные операторы в ?,2· Положим, что имеет место опре- определенный закон, согласно которому всякой функции f(x) из ^ соответствует некоторая другая функция F(x) из того же F(x) = A[/(x)l B85) где А — символическое обозначение этого закона соответствия, Мы имеем здесь как бы обобщенное понятие функции: роль аргумента играет не любое число из некоторого множества, например, проме- промежутка, а любая функция из Z^O^b и значением функции является также некоторая функция из ?2(<^). Такое соответствие, устанавлива- устанавливаемое формулой B85), называется обычно функциональным операто- оператором. Оператор А называется линейным, если J где а — любое комплексное число, и ограниченным, если существует такое положительное число Ж, что || А/1| ^М\\ /|| B87) при любом /(лг) из L3@).
184 ГЛ. II. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [51 Если последовательность fn(x) сходится к f(x) в L2 и Л— ли- линейный ограниченный оператор, то Afn(x) сходится к Af(x) в L2. Это непосредственно следует из неравенства \\Af-Afn\\^M\\f-fn\\- Нетрудно сформулировать для рассматриваемого случая опреде- определения эрмитовского и унитарного преобразований. Линейный ограни- ограниченный оператор А называется эрмитовским (самосопряженным), если W> «) = (/> Ag) B88) для любых f(x) и g(x) из L2. Линейный оператор U называется унитарным, если он биодиозначно преобразует L2 в себя, U[f(x)} = F(x), B89) и не меняет нормы: II ?//(*) 11 = II/II- Указанная биоднозначность преобразования B89) сводится к следую- следующему: не только всякому элементу f(x) из L2 соответствует опреде- определенный элемент F(x), но и всякому F(х) из L2 соответствует один определенный прообраз f(x). Из этого следует, что для U имеется обратный оператор f/", который по F(x) восстанавливает f(x\ Нетрудно видеть, что U~l — также унитарный оператор. Для унитар- унитарного оператора неравенство B87) можно заменить равенством, поло- положив Ж=1. Легко показать, что унитарное преобразование не меняет не только нормы, но и скалярного произведения, т. е. (i//, Ug) = (f, g) для любых f(x) и g(x) из Lb и что U преобразует всякую полную ортонормированную систему из L2 в такую же систему. Определим еще понятие сопряженного оператора. Оператор Л* называется сопряженным с линейным ограниченным оператором Л, если для любых f(x) и g(x) из L2 имеет место равенство: Можно показать, что для всякого линейного ограниченного опера- оператора Л существует единственный сопряженный оператор Л*. Рас- Рассмотрим пространство L2 функций f(x) одного независимого пере- переменного, определенных на конечном или бесконечном промежутке (а, Ь). В таком 12 линейные операторы часто определяются формулой ъ = \K{x,t)f{t)dt, B90)
51] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 185 где К(х, t) — функция, определенная (измеримая) в квадрате *^х ^b, a^t ^.b. Операторы вида B90) называются обычно интегральными операторами, а функция К(х, t) — ядром оператора. Если ъь \\\К(х, 0|*Лхг<#< + оо, а а Ъ или если существует такое число /?, что §|?^(??, t)\dt^p а b и ^\K(x, t)\dx^p при всех t, ? из (?, b), то формула B90) опре- а деляет линейный ограниченный оператор. Можно показать, что опе- оператор, сопряженный с ограниченным оператором B90), есть также интегральный оператор с ядром К* (х, t) = K(t, x). Примером уни- унитарного преобразования в 12 на промежутке (— оо, -{- оо) является преобразование Фурье: т F(x)=Uf(x)= lim -L· Г e-ixtf{t)dt, п—*· со у 2jz щ) т—* со — ? где lim есть предел функции от х, полученной в результате инте- интегрирования в Ц на промежутке (—со, -J-°°)> т. е. если обозначим то lim l Если f(x) не только принадлежит L2 на промежутке (—оо, ~j-оо), но и суммируема на этом промежутке, то преобразование Фурье можно записать в обычной форме + 00 = ^ J e-ixtf{t)dt Неизменность нормы при преобразовании Фурье имеет вид: *\ fdx=*\ \f{x)\*dx.
186 ГЛ. И. ЛИНЕЙНЫЕ ПРЕОВРАЗОВАНИЯ И КВАДРАТИЧНЫЕ ФОРМЫ [51 Рассмотрим теперь один частный пример. Пусть в пространстве L2 на промежутке (— ?, ?) задан линейный оператор умножения на независимую переменную: A[f(x)] = xf(x). B91) Имеем, очевидно: 114/Т= S 1*П/С*I'<**<*'11/Т. — ? т. е. для оператора B9J) в формуле B87) можно считать М = ъ. Построим линейное преобразование, выражающее оператор B91) в /2, если приняв за основу полную ортонормированную систему B84). Пусть ck — коэффициенты Фурье f(x) относительно системы B84): ck = -±=.^ e-ih*f{x) dx (k = 0, ± 1, ± 2, ...) — ? и c'u — коэффициенты Фурье xf{x): ? c'* = -L· [ e-kxxf(x)dx (k = 0, ±1, ±2, ...). Нам надо построить линейное преобразование (бесконечную матрицу), выражающее с'и через ck. Определим коэффициенты Фурье функции = ± 5 €?<*"*xdx (m = 0} ±1, ±2, ...) Интегрируя по частям, получим / \\k-m bm — i{k_m) при мфк, Ьк = 0. Переписывая выражение c'k в виде: и применяя обобщенное уравнение замкнутости, получим 4-оо = 0, ±1,±2, ...> B92)
51] § 4. КВАДРАТИЧНЫЕ ФОРМЫ 187 где штрих над знаком суммы показывает, что надо исключить сла- слагаемое, соответствующее m = k. Формула B92) и дает линейное пре- преобразование в /2, соответствующее оператору B91) в L2, если за координатные функции в пространстве L2 взяты функции B84). Нетрудно показать, что оператор B91) — самосопряженный. Проведем общее рассуждение для любого линейного ограничен- ограниченного самосопряженного оператора Л, причем будем записывать коэффициенты Фурье в виде скалярного произведения и учтем опре- определение B88) самосопряженного оператора. Введем коэффициенты Фурье ck и c'k для f(x) и Af(x) относительно полной ортонормиро- ванной системы ?? (?): ck = (f> 9k); ci = (Af9 ?,) = (/, АЪ). B93) Введем теперь коэффициенты Фурье функций Лсрт (х) akm = (A9m, ??) = (??, Ар*), B94) откуда следует, что cLmk = akmy ибо по определению <*mk = (A<fk> 9т)· Принимая во внимание обобщенное уравнение замкнутости, формулу для c'k и B94), получим: ? *» 9т) = ? (/> 9т) (9?» A<?k)> т=\ т — \ т. е. схз c'b= ? akmCm (*=1> 2, ...). т = \ Эю преобразование и выражает оператор А в /2, если 9k (х) ПРИ" пяты за координатные функции в Ц. Мы рассматривали в предыдущих параграфах три случая, когда линейный оператор задан на всем 12 и ограничен. Если мы возьмем, например, оператор дифференцирования A [f(x)]=f (x), то он задан не на всем L2, ибо не всякая функция из L2 имеет производную. Кроме того, указанный оператор не ограничен на том множестве функций, на котором он задан. Более подробное и строгое изложение материала последних пара- параграфов будет дано в пятом томе.
ГЛАВА III ОСНОВЫ ТЕОРИИ ГРУПП И ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 52. Группы линейных преобразований. Рассмотрим совокуп- совокупность всех унитарных преобразований в я-мерном пространстве. Все эги преобразования имеют определитель, отличный от нуля, так что для каждого унитарного преобразования Ux, которое вполне харак- характеризуется соответствующей м-атрицей ?/> существует вполне опреде- определенное обратное преобразование U~xx, которое также будет унитар- унитарным [28]. Кроме того, если U^x и U^x— два унитарных преобразования, то и их произведение U%U\X также будет унитарным преобразова- преобразованием. Все эти свойства совокупности всех унитарных преобразований выражают коротко тем, что говорят, что совокупность унитарных преобразований образует группу. Вообще совокупность некоторых линейных преобразований с опре- определителем, отличным от нуля, образует группу, если выполнены сле- следующие два условия: во-первых, если некоторое преобразование принадлежит нашей совокупности, то и обратное преобразование также принадлежит совокупности, и, во-вторых, произведение двух преобразований, принадлежащих нашей совокупности (при любом порядке сомножителей) также принадлежит нашей совокупности, причем множители могут быть и одинаковыми. Принимая во внимание, что произведение всякого преобразования на обратное ему есть тождественное преобразование, мы можем утверждать, что группа обязательно должна содержать тожде- тождественное преобразование, т. е. единичную матрицу. Вообще линейное преобразование вполне определяется своей матрицей, и во всем предыдущем так же, как и впоследствии, мы можем говорить или о группе линейных преобразований, или о группе матриц. Приведем еще примеры групп линейных преобразований. Нетрудно видеть, что совокупность всех вещественных ортогональных преобра- преобразований образует группу. Как известно, эти вещественные ортого-
52] I б. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 1 89 нальные преобразования имеют определитель, равный (± 1). Если взять совокупность вещественных ортогональных преобразований с определителем (-|- 1), то они также образуют группу. Но если мы возьмем совокупность вещественных ортогональных преобразований с определителем (— 1), то они уже не образуют группу, так как произведение двух матриц <: определителем (— 1) дает матрицу с определителем (-f-1)· В частности, если мы рассмотрим группу вещественных ортого- ортогональных преобразований с тремя переменными, то это будет группа, состоящая из чистых вращений пространства вокруг начала и из преобразований, которые получаются в результате такого вращения и преобразований симметрии относительно начала. Если же мы возьмем группу линейных ортогональных преобразований с тремя переменными, с определителем (-}- 1), то это будет группа вращения пространства вокруг начала. Во всех рассмотренных случаях группа содержала бесчисленное множество преобразований, в частности группа вращения трехмер- трехмерного пространства вокруг начала зависела от трех произвольных вещественных параметров — углов Эйлера, о которых мы говорили выше. В качестве следующего примера рассмотрим вращение простран- пространства вокруг оси ? на угол ?. Соответствующие формулы имеют ВИД: х' = Х COS ? — V Sin ? \ у =? sin ? -\-y COS ?. j При возможных значениях вещественного параметра ? в проме- промежутке @, 2?) мы получаем, очевидно, группу, содержащую бесчис- бесчисленное множество преобразований и зависящую от одного веще- вещественного параметра. Введем следующее обозначение для матрицы преобразования: ,, CQS _ sin ? = . B) 9 I sin ?, cos ? Непосредственно очевидно, что произведение двух вращений на угол ?! и ?2 дает вращение на угол (??-(-фа)' ??2?(?? — ??2 ^ <pj C) и точно так же Мы видим, таким образом, что в данном случае все преобразо- преобразования группы или, как говорят, элементы группы попарно комму- коммутируют. Такая группа называется абелевой группой. Кроме того, в последнем примере перемножение двух элементов группы сводится просто к сложению значений параметра ?, соответствующих пере- перемножаемым матрицам.
190 ГЛ Ш ОСНОВЫ TFOPHH ГРУПП [62 Мы можем несколько расширить последнюю ? руппу, взяв не только вращение плоскости ?? вокруг начала, но и зеркальное отображе- отображение, т. е. симметрию, относительно оси F, причем, очевидно, без- безразлично, в каком порядке производить эти операции — сначала вра- вращение вокруг начала, а затем симметрию относительно оси ? или наоборот. Перемена порядка повлияет на результат, но общая сово- совокупность преобразований будет одна и та же при обоих способах. Это будут вещественные ортогональные преобразования с двумя переменными. Общий вид соответствующих матриц будет | d cos ?, — d sin ? II <*d> = | sin ?, cosj' D) где ? — прежний параметр, a d — число, равное ±1. При d=\ мы получаем простое вращение плоскости XY вокруг начала, а при d = —1 получается вращение, после которого производится упомя- упомянутая выше симметрия. Нетрудно проверить, что для произведения матриц D) мы будем иметь следующее правило: В данном случае произведение уже может зависеть от порядка сомножителей, т. е. группа уже не будет абелевой. Точно так же, очевидно, группа вещественных ортогональных преобразований в трехмерном пространстве или даже группа вращения трехмерного пространства вокруг начала не будет абелевой. До сих пор мы приводили примеры групп, содержащих бесчис- бесчисленное множество преобразований (элементов), и соответствующие матрицы содержали произвольные вещественные параметры. Сейчас приведем некоторые примеры групп, содержащих конечное число элементов. Пусть т — некоторое целое положительное число. Рас- Рассмотрим совокупность вращений плоскости XY вокруг начала на углы 0 — 4? 2(m— 1)? ?? ' ?? ' '" ' m Мы будем иметь здесь всего т преобразований, матрицы кото- которых будут cos -^^, — sin (A = 0, I, ..., m— I). Эти преобразования образуют, очевидно, группу, и элементы этой группы суть целые положительные степени одного и того же пре- преобразования, а именно ??? -(Zte)* (* = 0, 1, ..., т - 1). F) т т
53] ? 5 ОСНОВЫ ОБШЕЙ ТЕОРИИ ГРУПП 191 Гакая конечная группа, состоящая из аепеней некоторого преоб- преобразования, называется обычно циклической. Если мы возьмем некоторый угол ср0, не соизмеримый с ?, то преобразования (матрицы) Zkn = Zkn (Л = 0, ±1, ±2, ...) G) образуют также, очевидно, группу. Но эта группа будет состоять уже из бесчисленного множества элементов, гак как ни при каких целых показателях матрица Zk не совпадает с Zo =/. Группа G) будет бесконечной группой, но ее матрицы не содержат никакого непрерывно меняющегося параметра. В данном случае, как говорят, число элементов в группе будет счетным, т. е. мы можем прону- пронумеровать все элеметы группы целыми числами, снабдив всякий элемент группы значком, равным целому числу, так что разным эле- элементам будуг соответствовав разные значки, и всякое целое число будет знаком у некоторого элемента. Эгого нельзя сделать в случае групп, содержащих непрерывно меняющиеся параметры. 53. Группы правильных многогранников. Приведем еще при- примеры конечных групп, причем образуем их из вращений трехмерного пространства вокруг начала. Такие вращения в определенной коор- координатной системе выражаются, как мы знаем, некоторыми линейными преобразованиями координат. Заметим, что когда мы говорим о вра- вращении пространства вокруг начала, то подразумеваем под этим лишь оконча- окончательный эффект перехода из начального положения в преобразованное. Каким пу- путем этот переход совершается, это со- совершенно не входит в наше рассмотре ние. Действительно, всякое линейное преобразование определяет координаты преобразованной точки, но, конечно, ни- ничего не говорит о самом пути преобра- преобразования. Рассмотрение самого пути пре- преобразования совершенно при этом не вхо- входит в рассуждения. Рассмотрим сферу с центром в начале и радиусом единица. Впишем в эту сферу какой-нибудь правильный многогранник, например октаэдр (рис. 2). Поверхность этого многогранника состоит, как известно, из восьми равносторонних треугольников. Рассмо1рим теперь совокупность тех вращений трехмерного пространства вокруг начала, при которых взятый нами октаэдр совмещается сам с собой. Нетрудно видеть, что Совокупность этих вращений образует группу и что эта группа содержит конечное число элементов. Подсчитаем Рис. 2.
192 гл ш. основы теории групп [53 число элементов группы Возьмем какую-нибудь ось октаэдра, соединяющую две противоположные вершины. Октаэдр совместится сам с собой, если мы повернем пространство вокруг упомянутой оси на угол 0, -?, -к, -^. Вращению на угол 0 соответствует, очевидно, тождественное преобразование, т. е. единичная матрица. Обозначим упомянутые четыре вращения вокруг взятой оси через О0 =/, ??, ?2> Оз· (8) Пусть А— одна из вершин октаэдра, лежащая на взятой оси. Введем в рассмотрение пя1ь линейных преобразований при которых октаэдр совмещается сам с собой, а его вершина А совпадает с одной из остальных пяти вершин октаэдра Наряду с четырьмя вращениями (8) составим еще 20 вращений прос1ранства вокруг начала следующего вида· TkS0, TkSl9 TkS%, TkS, (* = 1, 2, 3, 4, 5). (9) Нетрудно проверить, что 24 вращения (8) и (9) различны. Это совершенно очевидно и геометрически, а также может быть доказано следующим путем: пусть TpSq = TPlSqr A0) Преобразования St соответствуют повороту вокруг оси, проходя- проходящей через вершину А, и при этих преобразованиях А остается на месте. Преобразования Тр и ??? при различных значках ? и рх пере- переводят вершину А в различные вершины, и, следовательно, из равен- равенства A0) вытекает, что значки ? и рх должны быть одинаковы, но тогда, очевидно, из этого же равенства будет путем умножения слева на Т~р = Т^\ следовать, что и значки q и qi также должны быть одинаковы, т. е. равенство A0) может иметь место только тогда, когда правая и левая части состоят из одинаковых сомножи- сомножителей. Следовательно, выражения (8) и (9) дают нам 24 различных вращения, при которых октаэдр совмещается сам с собой. Покажем теперь, что этим и исчерпываются все вращения, обладающие этим свойством. Действительно, пусть V—некоторое вращение, при кото- котором наш октаэдр переходит сам в себя. Положим, что при этом вершина А совмещается с некоторой другой вершиной А3 и пусть ?} — то из преобразований Tk, которое преобразует А также в Ау Соста- Составим преобразование T]XV. При этом октаэдр переходит в себя, и вершина А остается на месте. Следовательно, остается на месте и противоположная вершина, и составленное нами преобразование есть одно из вращений 5г вокруг оси, проходящей через вершину Л, т. е. 771Ka=s6>iJ и отсюда V=TjSi. Иначе говоря, всякое вращение,
63] § б ОСНОВЫ ОБШЕЙ ТЕОРИИ ГРУПП 193 при котором октаэдр переходит в себя, должно заключаться среди тех 24 вращений, которые мы составили выше. Итак, окончательно, группа вращения, при которой октаэдр переходит в себя, содер- содержит 24 элемента. Мы можем, очевидно, вписать в сферу единичного радиуса куб таким образом, чтобы радиусы, идущие в центры грани октаэдра, имели своими концами вершины куба ?? сюда непосредственно сле- следует, что группа вращения для куба будет той же самой, что и для октаэдра. Положим, чго мы иначе выбрали положение октаэдра, а именно, что новое положение октаэдра получается из первоначаль- первоначального при помощи вращения, осущеавляемого некоторой матрицей U. Если V есть некоторое вращение, при котором прежний октаэдр переходил сам· в себя, то, очевидно, UVU * будет давать такое вра- вращение, при котором новый оюаэдр будет переходить в себя, и на- наоборот. Таким образом, если группа вращения прежнего октаэдра состояла из матриц Vfe(&=l, 2, ..., 24), то группа вращения нового октаэдра будет просто состоять из подобных матриц UVkLr~l. Иначе говоря, получается подобная группа. Вообще, если совокупность некоторых матриц Vk образует группу, то совокупность подоб- подобных матриц UVkU~l при любой фиксированной матрице U также образует группу. Это нетрудно непосредственно доказать из опре- определения группы, что мы и предлагаем проделать читателю. Вторая группа называется обычно подобной первой. Рассмотрим тетраэдр, поверхность которого состоит из четырех равносторонних треугольников и имеет четыре вершины. Возьмем какую-нибудь ось тетраэдра, соединяющую его вершину А с центром противолежащей грани. Тетраэдр совместится сам с собою, если повернем пространство вокруг упомянутой оси в некотором направ- направлении на угол 0, -^, -?. Пусть So> Slf S% — эти вращения. Далее о о вводим три линейных преобразования Ти Г2, Г3, при которых тетраэдр совмещается сам с собою, а его вершина А совпадает с одной из остальных трех его вершин. Наряду с вращениями SQ) Sly 52 составим девять вращений TkSQy TkSif TkS2 (k=lt 2, 3). Полученные 12 вра- вращений различны, и это суть все вращения, при которых тетраэдр переходит в себя. Рассмотрим теперь икосаэдр, поверхность которого состоит из 20 равносторонних треугольников и имеет 12 вершин. Возьмем, как и выше, какую-нибудь ось икосаэдра, соединяющую его вершину А с противоположной вершиной. Икосаэдр совместится сам с собою, если повернем пространство на угол —^ (? = 0, 1, 2, 3, 4). Пусть Sk — эти вращения. Далее имеем 11 вращений Г/(/=1, 2, ..., 11), при которых икосаэдр совмещается сам с собою, а вершина А пере- переходит в одну из остальных вершин. Полная группа вращений, при
194 гл. ш. основы теории групп [64 которых икосаэдр переходит в себя, состоит из пяти вращений Sk и 55 вращений TiSk. Таким образом, эга группа содержит 60 вра- вращений. Такой же будет и группа додекаэдра, поверхность которого состоит из 12 правильных пятиугольников и содержит 20 вершин. Чтобы убедиться в эюм, надо расположить додекаэдр относительно икосаэдра так же, как это выше мы сделали для куба относительно окааэдра. Рассмотрим еще одну группу, состоящую из вращений трехмер- трехмерного пространства. Пусть в плоскости XY находится правильный л-угольник, центр которого совпадает с началом координат. Возьмем какую-нибудь ось я-угольника, соединяющую его вершину А с про- противоположной вершиной (если я — четно), или с серединой противо- противоположной стороны (если л— нечетно). При вращении плоскости ?? вокруг этой оси на угол 0 и ?, л-угольник совмещается сам с собою. Первое вращение есть тождественное преобразование /, а второе мы обозначим через 5. Кроме того, мы имеем вращения Tk вокруг оси ? на угол —- (А=1, 2, ..., я—1), при которых я-угольник тоже совмещается сам с собою, а его вершина А переходит в одну из других вершин. При k = 0 получаем тождественное преобразование 70 = /. Полная группа преобразований, при которых я-угольник переходит в себя, будет состоять из следующих 2я преобразований: Tk и TkS (k = 0, 1, 2, ..., ?—?). Указанный л-угольник, поверхность которого считается дважды (верх и низ), называется обычно диэдром, а построенная группа — группой диэдра. 54. Преобразования Лоренца. Все примеры групп линейных пре- преобразований, которые мы приводили выше, состояли из унитарных преобразований или из вращений трехмерного пространства (частный случай унитарных преобразований). Сейчас мы изучим некоторую новую группу линейных преобразований, элементы которой уже не являются унитарными преобразованиями. Эга группа играет важную роль в принципе относительности, электродинамике и той части квантовой механики, которая связана с принципом относительности. Рассмотрим четыре переменные ?? х& хЪ) xi9 из которых первые три суть пространственные координаты точки, а последняя перемен- переменная есть время. В связи с основным требованием специального прин- принципа относительности о неизменности некоторой определенной ско- скорости с (скорость света) в случае относительного движения, возни- возникает вопрос о таких линейных преобразованиях упомянутых выше четырех переменных, при которых выражение
54] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 195 остается неизменным, т. е., подробнее говоря, мы должны найти такие линейные преобразования, выражающие новые переменные x'k через прежние xk, чтобы имело место тождество: Рассмотрим сначала тот случай, когда координаты х2 и хг оста- остаются неизменными, и в линейном преобразовании участвуют лишь переменные ?? и х^ Мы должны, таким образом, найти такие линей- линейные преобразования ?? = ????-{-?1???9 ?'^ = ?^?? + ???^ . A1) чтобы *'* — c*x? = xl — Лс|. A2) Введем вместо jc4 новую чисто мнимую переменную уь согласно Формуле Ух — ???· Искомые линейные преобразования должны иметь вид: х[ = апхг -f- а1%у19 у[ = ^ххх + a^ylf A3) где а условие A2) переписывается при этом следующим образом: ?? A4) Коэффициенты аи и а22 должны быть вещественными, a an и а21 — чисто мнимыми. Обозначим поэтому ?12 = /?12 и а21 == /?21. Условие A4) равносильно, очевидно, условию ортогональности преобразова- преобразования A3), и, следовательно, сумма квадратов элементов каждой строки и столбца должна равняться единице. Эго сразу дает pf2 == p|t ===== = afJ — 1 ===== a|2 — 1 и а2п — a|2. Положим a22 == ? и ?12 = ??. Будем считать положительными коэффициенты au и а22, что соответствует неизменности в направлении отсчета хх и х4- ^ы получим таким образом вместо A3) в силу предыдущих соотношений: i» Ух = Условие ортогональности строк даст нам а21==—/??, ?. е. ?12 и ?21 должны быть противоположных знаков. Наконец, условие af1 + af2=l даст
196 ГЛ. III. ОСНОВЫ ТЕОРИИ ГРУПП [54 и окончательно мы приходим к следующим формулам: или, возвращаясь вновь от переменной yt = icx^ к прежней пере- переменной Х? о 'Х^сх, %— \ A5) 1 ?/?—?2 4 ?\ — ? ? Из этих равенств непосредственно следует, что координатная система, которой соответствуют переменные со штрихами, двигается по отношению к первоначальной координатной системе со скоростью v = $c A6) в направлении оси xt. Действительно, если принять х[ постоянным, то получим: ay dxx — $cdxk = Q> т. е. g = pc. Вводя вместо ? скорость ? согласно формуле A6) и заменяя- хх на ? и Xg на ty получим обычную форму преобразования Лоренца с двумя переменными X—Vt j. С2 1 tG *=- .—-,, В предельном случае при с-+оо мы получаем обычные формулы относительного движения классической механики ?? = ? — ??; f — t Нетрудно проверить, что преобразования Лоренца A7), зависящие от одного вещественного параметра ?, образуют группу. Решая уравнения A7) относительно ? и t, получим преобразование, обрат- обратное A7). Покажем, что это будет то же преобразование Лоренца, которое получается из преобразования A7) заменой ? на (—г;). Действительно, решая уравнения A7), будем иметь: откуда непосредственно следует v ??= x' + vt' . t== ~^ Рассмотрим теперь два преобразования Лоренца L\ и ?2, соот- соответствующих значениям параметра v — vx я v = v& Составим их
64] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 197 произведение L<JLV и покажем, что это то>ке будет преобразование Лоренца. Нам надо составить произведение из двух матриц 1 р2с 1 1/1 -И где Применяя обычные правила умножения матриц, получим для про- произведения следующую матрицу: A8) Введем новую величину A9) Нетрудно проверить справедливость тождества: 1 и в результате матрица A8) может быть написана в следующем виде: т. е. ей соответствует также преобразование Лоренца со значением параметра ? = ?9. Таким образом, формула A9) дает правило сло- сложения скоростей в специальном принципе относительности. Если в формуле A9) положить Vi = c9 то, как легко проверить, и для результирующей скорости vb мы будем иметь уг = с, т. е. действи- действительно скорость с не меняется при наложении двух движений. При выводе формул A5) мы фиксировали определенным обра- образом знаки коэффициентов линейного преобразования A1), считая коэффициенты ап и аи положительными. Можно заменить это
198 гл. ш. основы теории групп [64 требование другим, а именно: положительностью коэффициента аи и положительностью определителя апаи — аиаи. B0) Нетрудно видеть, что отсюда, как следствие, получится и поло- положительность коэффициента аи, и наоборот. Действительно, опреде- определитель преобразования A7) равен (-J- 1), т. е. при ап^>0 и опреде- определитель B0) положителен. Если бы мы взяли ап — —? и аи = ау где а^>0, то получилось бы преобразование с определителем (— 1). Условие положительности коэффициента ап равносильно тому, что при фиксированном хх и ??4—^со мы имеем jC4->oo. Можно сказать, что это соответствует неизменности в направлении отсчета времени. Таким образом, формулы дают не все линейные преобразования, удо- удовлетворяющие условию A2), но лишь те, для которых определитель B0) положителен и которые не меняют направления отсчета времени. Обратимся теперь к рассмотрению общего преобразования Ло- Лоренца для случая четырех переменных xk(k=l, 2, 3, 4), причем должно быть выполнено условие: х? + х*Л-х? — c*x'? = x\ + xl-\-xl — с*х\. B1) Будем рассматривать xk(k=\y 2, 3) и jt*(? = l, 2, 3) как де- декартовы координаты в двух различных трехмерных пространствах R и R\ Покажем, что, выбирая соответственным образом координат- координатные оси в этих двух пространствах, мы можем привести общее преобразование Лоренца к тому частному случаю, который был нами рассмотрен выше. Обозначим через ? общее преобразование Лоренца и через 5* частное преобразование Лоренца рассмотренного выше типа. Наше утверждение равносильно тому обстоятельству, что мы можем представить ? в виде T=VSU, B2) где U и V—вещественные ортогональные преобразования, соответ- соответствующие упомянутым выше преобразованиям координат в простран- пространствах R и R'. Введем, как и выше, четыре новые переменные: и аналогичным образом: у[ = х[; y'i = x'i у'г = х'а У1 = 1сх'г Вместо условия B1) получим для новых переменных обычные условия ортогонального преобразования: у? +ла +ла +Х2 = j* +у\ +А+Я B3) Искомое линейное преобразование будет иметь вид: У к = ««Л + Ъф + Ws + W* (* = 1» 2' 3» 4)· B4)
54] § 5. ОСНОВЫ ОБШЕЙ ТЕОРИИ ГРУПП 199 Принимая во внимание, что у^ и у[ должны быть чисто мнимыми, мы можем утверждать, что коэффициенты аЛ1, afe2, аАЗ, при k=l, 2, 3> а также а44 должны быть вещественными, а коэффициенты а41, а42, а43 и аЛ4 при &—1, 2, 3 должны быть чисто мнимыми. Перемена координатных осей в пространстве R равносильна вещественному ортогональному преобразованию над переменными y'v у'%, у'г. Рас- Рассмотрим коэффициенты: ?14 = /?14; ?24 = /?24; ?34 = /?34. Три вещественных числа ?14, ?24, ?34 определяют некоторый вектор, и если мы направление этого вектора примем за новую первую ось пространства R, то в результате соответствующего ортогонального преобразования коэффициенты а24 и а34 обратятся в нуль. Чтобы убедиться в этом, достаточно только заметить, что в силу формул B4) ортогональное преобразование над переменными y'v у'ъ уъ сводится к такому же преобразованию над ?14, ?24, ?34. Итак, будем считать, что это преобразование координат в простран- пространстве К уже совершено, так что мы имеем ?24 = ?34 = 0. Условие B3) показывает, что коэффициенты преобразования B4) должны удовле- удовлетворять обычным условиям ортогонального преобразования. Прини- Принимая во внимание равенство нулю упомянутых выше коэффициентов, получаем, рассматривая вторую и третью строчки, следующие условия: -f- a22a32 где все входящие коэффициенты вещественны. В силу написанных условий два вектора с составляющими (а31, а22, а23) и (?3?, Оз3, а^) будут единичными по длине и взаимно ортогональными по направ- направлению. Если мы в пространстве R выберем эти два вектора за основные орты, направленные по осям Х% и Х& то две суммы **0? + а*аУа + а*з.Уз (А = 2, 3), выражающие скалярные произведения упомянутых выше двух векто- векторов на переменный вектор (yi7 y^ _у3), выразятся просто в виде у% и у& т. е, при таком выборе координатных осей мы будем иметь: Таким образом, окончательно, при сделанном выборе осей в обоих пространствах матрица преобразования B4) будет иметь вид: 0 10 0 0 0 10 a4I a« a48 a44 B5)
200 гл. in основы теории групп [54 Эта матрица получилась в результате умножения первоначальной матрицы на два ортогональных преобразования, которые касались только первых [трех переменных, но которые можно, конечно, рас- рассматривать и как ортогональные преобразования с четырьмя пере- переменными, причем четвертая переменная остается без изменения. При- Принимая во внимание, что произведение двух ортогональных преобра- преобразований также должно быть ортогональным, мы можем утверждать, что элементы матрицы B5) также должны удовлетворять условию ортогональности. Написав условие ортогональности первой строки со второй и третьей, получим <х12 = а13 = 0, и точно так же условие ортогональности четвертой строки со вто- второй и третьей даст нам ? ==? =0 В результате приходим к следующей матрице: ?? 0 0 а14 0 10 0 0 0 10 а41 0 0 а44 т. е. в данном случае мы имеем линейное преобразование которое должно удовлетворять условию Именно таким преобразованием мы и занимались выше, и оно нас и привело к специальным преобразованиям Лоренца вида A5), и, таким образом, формулу B2) можно считать установленной. Заме- Заметим только, что правило выбора знаков при определении преобра- преобразования 5 будет тем же самым, что и выше, если мы потребуем, чтобы общее преобразование Лоренца ? не меняло направления от- отсчета времени и имело определитель больше нуля. Ортогональные преобразования U и V мы всегда можем считать вращениями трех- трехмерного пространства, так что и их определитель будет больше нуля, причем они вовсе не затрагивают четвертой переменной. Мы придем, иким образом, к необходимости того, чтобы д у преобра- преобразования 51 определитель был больше нуля и чтобы это преобразова- преобразование не меняло отсчета времени, т. е. при сделанном предположении относительно общего преобразования ? мы для частного преобра- преобразования придем как раз к тому условию, при котором формулы были выведены. Общие преобразования Лоренца, удовлетворяющие
55] § б. основы общей теории групп 201 поставленным выше двум условиям, называются обычно положи' тельными преобразованиями Лоренца. Из предыдущих рассуждений следует, что соответствующие им матрицы получаются по формуле B2), где 5 — специальное преобразование Лоренца вида A5), a U и V — матрицы вращения трехмерного пространства. Можно пока- показать, что положительные преобразования Лоренца образуют группу, как и преобразования A5). Предыдущие рассуждения показывают, что матрица наиболее общего преобразования Лоренца, определяемого лишь условием B1), может быть представлена по формуле B2), где U и V — вращения и 5—общее преобразование Лоренца с Двумя переменными. Если это положительное преобразование, то из ф°РмУл A5) непосред- непосредственно следует, что D(S)=l, и определитель всякого положи- положительного преобразования Лоренца будет также равен единице, поскольку определители U и V равны единице, причем матрицы ?/, S и У мы рассматриваем как матрицы четвертого порядка. В общем случае преобразования Лоренца второго порядка, как нетрудно по- показать, определитель может равняться (± 1) и, следовательно, общее преобразование Лоренца также будет иметь определитель (± 1). 55. Перестановки. До сих пор мы рассматривали примеры групп, элементами которых являлись линейные преобразования. Понятие группы не связано обязательно операциями линейного преобразова- преобразования и может быть построено и для операций другого рода. Мы пе- переходим сейчас к рассмотрению операций, с которыми уже встре- встречались раньше [2], а именно переходим к рассмотрению переста- перестановок. Выясним сначала некоторые основные факты и понятия, относящиеся к перестановкам. Пусть имеется ? некоторых объектов, которые мы, как и в [2], пронумеруем, т. е. будем просто считать, что эти объекты суть це- целые числа 1, 2, ..., п. Из этих чисел мы, как известно, можем состав-игь п\ перестановок. Возьмем одну из этих перестановок ?? ?* ···> ??· (Щ Числа pk в своей совокупности дают все целые числа от 1 до п, причем в перестановке B6) они расставлены в определенном порядке. Сравним перестановку B6) с основной перестановкой 1, 2, ..., п: 1 2 ... п\ (Р). B7) Переход от основной перестановки к перестановке B6) совер- совершается путем замены 1 на рь 2 на /?2 и так далее. Обозначим эту операцию одной буквой ? и будем в дальнейшем называть ее пере- перестановкой. Определим теперь понятие об обратной перестановке Р~1.
202 гл. ш. основы теории групп [бб Это будет такая операция, которая переводит B6) в основную последовательность, т. е. заменяет рх на 1, /?9 на 2 и так далее. Разъясним эго на частном примере: возьмем л = 5 и рассмотрим перестановку ? 2 3 4 5 \3 2 5 1 4 Обратная перестановка будет иметь вид: 2 3 4 5 2 ? 5 3;(/>)# Нетрудно видеть, что B8) Введем теперь понятие о произведении перестановок. Пусть Рх и Р2 — какие-нибудь две перестановки. Назовем произведением пере- перестановок Р%Рг такую перестановку, которая получается в резуль- результате применения сначала перестановки Ри а затем перестановки Р3. Например, если мы имеем две перестановки 1234 5\ /12345 5 14 3 2)(Р*)й (з 1 5 2 4 то их произведение РгРх будет давать перестановку вида: /1 2 3 4 5\ \4 5 2 1 Непосредственно очевидно, что обратная перестановка Р вполне определяется из условия p~ip == рр~* = / B9) где через / мы обозначили единичную перестановку, при которой каждый элемент заменяется сам собой. Последовательно применяя несколько перестановок, мы можем составить произведение нескольких перестановок ?3?2??· Нетрудно видеть, что такое произведение удовлетворяет сочетательному за- закону, т. е. Действительно, произведя перестановку Рь мы можем затем последовательно производить Р2 и Р3, или вместо этого мы можем заменить это последовательное применение Р9 и Р3 применением одной перестановки (Р3Р2), которая равносильна последовательному применению Р2 и Р3. Заметим, наконец, что единичная перестановка удовлетворяет, очевидно, следующим условиям: 1Р = Р1 = р, C1)
55] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 203 где ? — любая перестановка. Произведение перестановок не будет, вообще говоря, удовлетворять переместительному закону, т. е. про- произведения РъРх и ???? будут, вообще говоря, различными переста- перестановками. Предлагаем проверить это на предыдущем примере. Мы установили, таким образом, основные понятия произведения, обратной перестановки и единичной перестановки, совершенно так же, как это сделали раньше для линейных преобразований (матриц). Можно теперь продолжить эту аналогию и дальше и установить понятие о группе, а именно: совокупность перестановок образует группу, если выполнены следующие два условия: во-первых, если некоторая перестановка принадлежит нашей совокупности, то и об- обратная перестановка также принадлежит нашей совокупности, и, во- вторых, произведение двух перестановок, принадлежащих нашей совокупности (при любом порядке сомножителей), также принадле- принадлежит нашей совокупности. Как и в случае линейных преобразований, единичная перестановка должна обязательно принадлежать группе. Совокупность всех п\ перестановок образует, очевидно, группу. Перейдем теперь к установлению еще другой группы, которая со- составляет лишь часть предыдущей. Заметим для этого, что всякая перестановка может быть выполнена при помощи нескольких транс- транспозиций [2], причем для заданной перестановки число транспозиций может быть различным, но, как мы доказали выше, оно будет всегда для заданной перестановки или четным, или нечетным. Перестановки, состоящие из четного числа транспозиций, образуют сами по себе группу. Группа, образованная всеми перестановками, называется обычно симметрической группой, а группа, состоящая из четных перестановок, т. е. из перестановок, сводящихся к четному числу транспозиций, называется знакопеременной. Рассмотрим теперь перестановки особого типа. Пусть 1Ь /2, ..., 1т — какие-нибудь т различных чисел из первых ? чисел. Положим, что наша перестановка состоит в замене 4 на /3, 4 на 4 и так далее, 1т_х на 1т и, наконец, 1т на 4· Перестановку такого типа назовем циклом и обозначим ее символом D, /2, ..., 1т). Совершая круговую перестановку чисел внутри скобки, мы будем получать циклы: D, /8, ..., /m, 4)» D» 4> · · · > ^т> 4> 4)> · · ·» которые, очевидно, дают ту же перестановку, что и Aи 1Ь ·.., /т). Если т=1, т. е. если мы имеем цикл D), то такой цикл равноси- равносилен, очевидно, единичной перестановке, и его не имеет смысла рас- рассматривать. Цикл из двух чисел D, /2) равносилен, очевидно, транс- транспозиции элементов 4 и 4· Если имеются два цикла без общих элементов, то их произведе- произведение не зависит от порядка сомножителей. Пусть, например, In = 5, и мы имеем произведение двух циклов без общих элементов A, 3) B, 4, 5) и B, 4, 5) A, 3).
204 гл. ш. основы теории групп [56 Оба эти произведения дают, очевидно, одну и ту же перестановку /1 2 3 4 5\ \3 4 1 5 2/ Мы можем всякую перестановку ? представить в виде произ- произведения циклов, не имеющих общих элементов. Чтобы сделать это, возьмем элемент 1 и примем его за первый элемент в цикле. За второй элемент цикла возьмем тот элемент, который получается из 1 при помощи Р. Пусть это будет /2. За третий элемент возьмем тот, который получается из /2 при помощи ? и так далее, пока, наконец, не дойдем до такого элемента, который переходит в 1 при помощи Р. Это и будет последний элемент составленного цикла. Нетрудно ви- видеть, что этот цикл не может содержать одинаковых элементов. Со- Составленный таким образом цикл не исчерпает, вообще говоря, все ? элементов. Из оставшихся элементов возьмем какой-нибудь за первый элемент нового цикла и, как и выше, составим второй цикл и т. д. В качестве примера возьмем перестановку при ? = 6: (А 2 3 4 5 6\ 3 6 4 12 5 Применяя предыдущий прием, можем представить ее в виде про- произведения циклов (\ 2 3 4 5 6\ 3 6 4 12 5/ = О· 3, 4,) B, 6, 5), причем порядок сомножителей справа не играет роли. Нетрудно видеть, что произведение двух транспозиций можно представить в виде произведения трехчленных циклов. Если двух- двухчленные циклы не имеют общих элементов, то мы имеем, как легко проверить: а при наличии общих элементов: D, 4) (А, 4)=(Л, 4> 4). Таким образом, всякую перестановку из знакопеременной группы можно представить в виде произведения трехчленных циклов. Отметим еще, что при перестановке можно в первой строке вместо натурального ряда чисел писать эти числа в любом порядке. Важно лишь, чтобы под каждым числом стояло то число, в которое оно переходит в результате взятой перестановки. Приведем для при- примера две записи одной и той же перестановки: /1 2 3 4 5\_/3 1 5 4 2\ 3 2 5 1 4/ 1б 3 4 12/'
66] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 205 Пусть имеется некоторая перестановка (ах а2 ... lbx h ... b, Обратную перестановку мы можем, очевидно, записать в виде: p.l = /bi h ... bn\ \ах ?2 ... ап) Пусть имеются две перестановки, причем вторую мы запишем двояко: (I 2 ... п\ /1 р=[ ; Q=\^ ^ а \-\* * \сх съ ... сп1 \?? ?2 — dnj \fx /2 ... fn Мы имеем: /1 2 ... n\ldx d, ... dn\fdx d, ... dn\ \ ? r ? / \ 1 О tt I \/> z' z') \cx c2 ... ся/ \i ? ... ? ? \cx сг ... cn/ и, следовательно, r2 ... cn\/dx di ... rfn\ Jdx c?2 *.. йЛ\ Л ·.. fniVi с, ... cj \Л Л ... /J' Из написанного вытекает следующее правило: чтобы получить перестановку QPQ~1) надо в обеих строчках перестановки /1 2 ... ? Р = [ \С\ (·2 · . . С^ совершить перестановку Q. 66. Абстрактные группы. При определении группы мы можем совершенно отвлечься от конкретного значения тех операций, ко- которые в своей совокупности образуют группу и которые в преды- предыдущем были линейными преобразованиями или перестановками. Мы придем, 1аким образом, к понятию абстрактной группы. Абстрактная группа есть совокупность некоторых символов,— таких, что для этих символов определено умножение в том смысле, что дается определенное правило, согласно которому из двух эле- элементов ? и Q совокупности (разных или одинаковых) получается третий элемент, также принадлежащий совокупности, который назы- называется их произведением и обозначается через QP. При этом должны быть выполнены следующие три условия: 1. Перемножение должно подчиняться сочетательному закону; т. е. (RQ)P=R(QP), откуда вообще будет следовать, что мы можем в любом произведении, не меняя, конечно, порядка сомножи- сомножителей, соединять любые сомножители в одну группу. 2. В нашей совокупности должен существовать один и только один такой элемент Е, который, будучи помножен на любой
206 гл. ш основы теории групп [56 другой элемент с той или с иной стороны, воспроизводит этот же самый элемент, т. е. ЕР = РЕ = Р. C2) Будем называть этот элемент единичным элементом. 3. Для любого элемента нашей совокупности ? существует в нашей же совокупности единственный другой элемент Q, кото- который удовлетворяет условию E (Q^rP-1). C3) Из C2) при P=zE вытекает ЕЕ = ЕУ т. е., в силу определения обрат- обратного элемента, элементом, обратным Е, будет сам элемент Е(Е~1 = Е). Можно поставить Э1и условия, определяющие абстрактную группу, в более узкой форме, причем из этих более узких требований остальные уже будут вытекать в качестве необходимых формальных следствий, но мы на этом останавливаться не будем. Вообще огра- ограничимся лишь простейшими и основными фактами, связанными с понятием абстрактной группы. Более подробное рассмотрение теории групп дает материал, который сам по себе может заполнить целую книгу. Нашей целью является лишь сообщить читателю ос- основные понятия и этим облегчить чтение физической литературы, в которой зачастую применяется поня!ие группы и где часто поль- пользуются основными свойствами групп. В дальнейшем вместо ? мы будем писать иногда /. Элемент Q, определяемый соотношениями C3), называется обратным ? и обозначается Р~1. Имеет место, очевидно, соотношение B8), ибо из C3) следует и то, что ? обратно Q. Установив понятие абстрактной группы, перейдем теперь к выясне- выяснению некоторых новых понятий, а также к доказательству некоторых свойств абстрактных групп. Заметим прежде всего, что число эле- элементов в группе, как это мы видели выше, может быть как конеч- конечным, так и бесконечным. Рассмотрим некоторое произведение эле- элементов группы ROP Это будет также некоторый элемент группы. Обратный элемент будет получаться совершенно так же, как и в группе линейных пре- преобразований, а именно он будет: В этом нетрудно убедиться, совершая перемножение и пользуясь сочетательным законом. Пусть ? — некоторый элемент группы. Его целые положительные степени /* = /, Р\ Р3 ... также будут элементами группы. Если существует такое целое поло- положительное число т> что Pm = It то говорят, что элемент будет конечного порядка, причем порядком элемента будет наименьшее
56] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 207 значение целого положительного числа т, при котором Рт==1. При этом среди элементов /, Р, Р2, ..., Р уже не может быть одинаковых. Действительно, из условия р*'¦ = р1\k <^7) непосредственно вытекает Pl~k = L Для конечной группы все элементы будут, очевидно, конечного порядка. Обозначим элементы нашей группы через Ра. Если группа конечна, то можно считать, что значок ? пробегает конечное число целых положительных значений. Если группа бесконечна, то он может пробегать все целые значения [52], может меняться непрерывно и даже он может быть равносилен нескольким значкам, которые непрерывно изменяются. Пусть U—некоторый фиксированный эле- элемент нашей группы. Составим всевозможные произведения ?/Ра. Нетрудно видеть, что при соответствующем изменении значка ? написанное произведение даст нам опять все элементы группы и притом по одному разу. Действительно, из равенства умножением на LT1 слева получаем ??? = ??? т. е. при разных ? и произведение ?/?? различно. Покажем теперь, что это произведение будет обращаться в любой элемент нашей группы. Действительно, равенство иРл = Ра0 равносильно P0L=LT1p(lQ, ?. е. произведе- произведение UPa даст нам элемент Р«о, когда сомножитель Ра будет равняться элементу ?/??? нашей группы. Тот же самый результат мы полу- получили бы, если бы приписали фиксированный элемент U не слева, а справа. Итак, мы получаем следующий результат: если Ра пробегает все элементы группы и U—некоторый фиксированный элемент группы, то произведение UPa (или PaU) также пробегает все элементы группы и притом по одному разу. Рассмотрим частный пример группы. Положим, что группа состоит из шести элементов (группа шестого порядка), и обозначим эти элементы следующим образом: Е, А ?, С, D, F. Закон умножения определим при помощи следующей таблицы: C4) ? А В С D F ? ? А В С D F А А ? F D С В В В D ? F А С С С F D ? В А D D В С А F ? F F С А В ? D
208 гл. ш. основы теории групп [57 Этой таблицей надо пользоваться для определения умножения следующим образом. Если мы хотим, например, составить произве- произведение DB> то должны в первой строке найти В, в первом столбце D и на пересечении соответствующих строк и столбцов найдем эле- элемент Л, который и будет являться произведением DB. Нетрудно проверить, чю при этом будут удовлетворены все те условия, кото- которые мы упоминали при определении абстрактной группы, причем элемент ? будет играть роль единичного элемента. В предыдущих номерах мы имели примеры конкретного осуще- осуществления абстрактного понятия группы. В одном случае роль эле- элемента играло линейное преобразование (его матрица) и перемножение двух элементов сводилось к последовательному применению двух линейных преобразований, т. е. к перемножению соответствующих этим преобразованиям матриц. В другом случае роль элемента играла перестановка, и перемножение двух элементов сводилось к последо- последовательному выполнению двух перестановок. Приведем еще пример конкретного осуществления группы. Пусть элементами являются всевозможные комплексные числа и перемножение двух элементов сводится к сложению соответствую- соответствующих комплексных чисел. В данном случае роль единичного элемента играет число нуль, и элементом, обратным комплексному числу а, является число (— а). Вместо комплексных чисел мы могли бы взять за элементы всевозможные векторы ?(??, хь ..., хп) комплексного ^-мерного пространства Rn и определить умножение элементов, как сложение соответствующих векторов. При этом роль единичного элемента играет нулевой вектор. Иначе можно сказать, что элемен- элементами группы являются векторы из Rn, а групповым действием — сложение векторов. Отметим, что в последних двух примерах резуль- результаты перемножения двух элементов группы не зависят от порядка сомножителей, т. е., как говорят, любые два элемента группы ком- коммутируют. Такие группы называются абелевыми группами [ср. 45]. Простейшим примером абелевой грушы является так называемая циклическая группа, которая состоит из единичного элемента ? и степеней некоторого элемента Р. Если т — наименьшее х целое поло- положительное число, при котором Рт = Е, то циклическая группа содержит т элементов: ?, ?, ?2, ..., Рт~г. Если такого целого поло- положительного т нет, то циклическая группа бесконечна: Е> Р> Р2> ... 57. Подгруппа. Пусть имеется некоторая группа Q и положим, что совокупность ? элементов, содержащая лишь часть элементов группы Q, также образует группу, при сохранении прежнего определения умноже- умножения. В этом случае группа ? называется подгруппой группы G. Нетрудно видеть, что совокупность, состоящая из одного единичного элемента груп- группы О, есть всегда подгруппа. Это — тривиальная подгруппа. В дальней- дальнейшем, говоря о подгруппе мы будем разуметь не тривиальную подгруппу.
67] § 5. основы общей теории групп 209 Обозначим через На элементы подгруппы Я, и пусть Qx — неко- некоторый элемент общей группы G, причем G4 не принадлежит //. Произведения Gi//a, как мы видели выше, дадут нам различные эле- элементы группы О, причем эти элементы не принадлежат //. Действи- Действительно, в противном случае мы имели бы при некоторых значениях <Xj и а2 значка a: QlHai = Ha2, откуда d =//^//i"/» т. е. Qt должно принадлежать Н, что противоречит поставленному условию. Положим теперь, что G\ и G2 cyib два различных элемента общей группы G, не принадлежащих подгруппе Н. Покажем, что совокупности эле- элементов Gi//a и G%Ha или вовсе не имеют общих элементов, или совпадают, т. е. состоят из одних и тех же элементов. Действи- Действительно, если при некоторых значениях значка ? мы имеем G2#a2 = Gi#ai, то отсюда следует G2= G1#ai#aj = G^^, т. е. G3 принадлежит совокупности элементов GiHa> и точно так же Gi при- принадлежит совокупности элементов G2//a. Отсюда следует, что произ- произведения GiHa и G2#a определяют одну и ту же совокупность эле- элементов. Возьмем все элементы На подгруппы Н. Они не исчерпывают всех элементов группы G. Рассмотрим некоторый элемент Qlf не принадлежащий //, и составим всевозможные произведения Gi//a, которые, как мы видели выше, все различны между собою и отличны от Нл. Может случиться, что элементы Нл и GiHu также не исчерпы- исчерпывают всей группы. Возьмем некоторый элемент группы G2, не при- принадлежащий На и Gi//a, и составим всевозможные произведения ?^//?. Как мы видели выше, элементы G2#a будут все различны между собой и будут отличны от элементов На и GiHa, Если элементы Н%> GxHa и G2//a не исчерпывают всех элементов группы G, то возьмем некоторый элемент G3, не принадлежащий указанным выше трем совокупностям элементов, и составим произведения G3#a. Мы полу- получим таким образом новые элемент группы и т. д. Положим, что путем конечного числа таких операций мы исчерпаем все элементы группы G. Пусть для этого потребуется (т—1) элементов Gk. При этом все элементы группы G будут представлены в следующем ВИДе: # (кН Q*ff ..- Gm-? C5) где "значок ? пробегает значения, соответствующие подгруппе Н. Если положим G'k = GkHao, где a0 как-нибудь фиксировано, то сово- совокупность элементов О^//а, как показано выше, будет совпадать с совокупностью Gfc//a. Иначе говоря, в каждой совокупности GkHa (Go = /) любой элемент совокупности может играть роль предста- в и геля Gfe. Отсюда непосредственно следует, что при заданной под- подгруппе На разбиение элементов группы G на совокупности вида C5) вполне определено. Совокупности QkH% называются совокупностями, сопряженными относительно подгруппы На.
210 гл. ш. основы теории групп [57 В рассматриваемом случае C5) подгруппа ? называется подгруп- подгруппой конечного индекса, а именно подгруппой индекса т. Если группа О конечна, то индекс подгруппы ? будет равен, очевидно, частному от деления порядка всей группы О на порядок подгруппы Н, причем порядком конечной группы называется число содержа- щихся в ней элементов. Заметим, что из совокупностей C5) только первая совокупность образуег подгруппу. Каждая из остальных сово- совокупностей QkHa не содержит единичного элемента, а потому не может образовать подгруппы. При построении схемы C5) мы умножали элементы На под- подгруппы ? на элементы Ok группы G слева. Можно было бы произ- производить эго умножение и справа. Вводя вместо Qk другое обозначе- обозначение Oft, мы пришли бы таким же образом к представлению элемен- элементов группы Q вместо схемы C5) в следующем виде: нф ад, вд,..., я.с&_1, C6) при этом индекс подгруппы т не меняется. Совокупности элемен- элементов Gft//a называются иногда сопряженными совокупностями слева, а HJj'h — сопряженными совокупностями справа. Заметим прежде всего, что если ? пробегает все значения, соот- соответствующие подгруппе Ну то элементы Н*1 дают все элементы Н. Эго непосредственно следует из того, что элемент, обратный неко- некоторому элементу, принадлежащему //, также принадлежит Н. Перехо- Переходим теперь к доказательству совпадения индексов у совокупностей, сопряженных справа и сопряженных слева. Возьмем какие-нибудь две различные совокупности из C5), GpHa и GqHa (? ? q)> причем для первой из совокупностей C5) мы можем считать, например, Gp = E. Возьмем обратные элементы: Принимая во внимание сделанные выше замечания, мы можем пере- переписать эти совокупности элементов в виде НаОр~х и HJj^1. Нетрудно видеть, что они не имеют общих элементов. Действительно, если бы мы имели: го отсюда вытекало бы (%1ад=К1нлш=нЛ9, или од = и оказалось бы, что 0^ принадлежит совокупности QpHai> чего не может быть. Таким образом, оказывается, что совокупности на, я.ог1, /да,..., я.од.! будут сопряженными совокупностями справа, так что в C6) можно просто брать G's = Qj\
57] $ 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 211 Рассмотрим некоторые примеры подгрупп. Пусть О—совокуп- О—совокупность вещественных ортогональных преобразований с тремя пере- переменными и ?—совокупность вещественных ортогональных преобра- преобразований с тремя переменными и с определителем (-J-1). Всякое вещественное ортогональное преобразование будет или вращением, т. е. принадлежащим //, или произведением вращения на симметрию относительно начала, которая выражается формулами: *'=-лг, у'=-у; *= — г. (S) C7) В данном случае группа Q может быгь представлена следующей схемой: И%у SH^ C8) или Я., ЯД C9) где Яа обозначает совокупность всех элементов группы Я. В дан- данном случае Яа будет подгруппой индекса 2. Пусгь О—симметрическая группа перестановок из ? элементов, Я—знакопеременная группа, состоящая из четных перестановок. Пусть далее 5*— какая-нибудь определенная нечетная перестановка, например перестановка, состоящая из одного цикла A, 2), т. е. сво- сводящаяся к транспозиции элементов 1 и 2. Мы можем, очевидно, и здесь представить О по схеме C8) или C9). В обоих случаях умно- умножение слева приводит к тому же результату, что и умножение справа. В данном случае знакопеременная группа будет подгруппой сим- симметрической группы с индексом два. Рассмотрим еще конечную группу правильного октаэдра, о кото- которой мы говорили выше. Пусть А — некоторая вершина октаэдра и /—ось, проходящая через эту вершину. Пусть SQ, Slf S2, 5a — вращения на угол 0, ~t ? и -2- вокруг этой оси. Эти вращения образуют подгруппу всей полной группы вращения октаэдра. Обо- Обозначим через Tk(k = l, 2, 3, 4, 5) вращения, переводящие вершину А в остальные пять вершин октаэдра. Мы можем представить полную группу октаэдра по следующей схеме: т. е. подгруппа Sa будет подгруппой индекса шесть. Пусть Gs, Oj1 (s=I, 2, ..., k) — какие-либо элементы группы О. Рассмотрим множество всех тех элементов группы G, которые можно представить в виде произведения элементов Qst Q^1 ($=1, % ..., к). Это множество элементов образует, очевидно, группу, которая является подгруппой для Q или совпадает с О. Говорят, что эта "подгруппа порождается данной совокупностью элементов Gs, O^1 (s = l, 2, ..., k).
212 гл. ш. основы теории групп [58 Б8. Классы и нормальный делитель. Пусть U иУ—некоторые элементы группы. Элемент W= VUV~X называется сопряженным элементу U> Нетрудно видеть, что и наоборот U будет сопряжен- сопряженным с W. Действительно, U=V~lWV. Два элемента Ux и Ub сопряженные с одним и тем же третьим W: ?/9 = V, будут сопряженными и между собой i/a= ViVT1 i/iCViVT1). Совокупность всех взаимно сопряженных элементов группы обра- образует то, что называется классом группы. Класс вполне опреде- определяется одним своим элементом U. Действительно, задав ?/, мы полу- получим весь класс по формуле ???/??\ где Ga пробегает все элементы группы. Таким образом мы можем разбить всю группу на классы. Принимая во внимание основное свойство единичного элемента, фор- формулированное нами в [56], мы имеем: т. е. единичный элемент сам по себе составляет класс. Если элемент U будет порядка т, т. е. если т есть наименьшее целое положительное число, при котором Um = I, то и всякий со- сопряженный элемент QaUOa имеет тот же порядок т, что непосред- непосредственно следует из равенства: Иначе говоря, все элементы одного и того же класса имеют одинаковый порядок. - Заметим, что когда Оа пробегает все элементы группы О, то произведение ???(?^ может давать элементы класса и по нескольку раз. Так, например, если ?/=/, то, как мы видели, указанное произ- произведение всегда дает /. В качестве примера возьмем опять группу вращений октаэдра. Пусть U есть вращение на угол ~ вокруг некоторой оси ApAq окта- октаэдра. Если вращение Tk, принадлежащее нашей группе октаэдра, преобразует ось / в ось /j, причем вершина Ар переходит в Аг и вершина Aq в As, то элемент группы TkUT~kl будет давать враще- вращение на угол -у вокруг оси ArAs. Если, например, Tk преобразует Ар в Aq> то упомянутое произведение будет давать вращение на угол ? вокруг оси AqAp или, иначе говоря, вращение на угол -^~ вокруг оси АрАд. Если Tk преобразует ось АрАд в саму себя, т. е. есть поворот вокруг этой оси, то произведение TkUTkl совпадает с ?/. Таким образом, в данном случае класс элементов, сопряженных
58] I 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 213 с ?/, будет представлять собою совокупность вращений на угол -^- вокруг осей октаэдра. Совершенно так же, если мы возьмем группу вращений трехмер- трехмерного пространства вокруг начала, то, как мы знаем, всякий эле- элемент U этой группы будет представлять собою вращение на некото- некоторый угол ? вокруг некоторой оси. В данном случае класс элемен- элементов, сопряженных с U, будет совокупностью вращений на угол ? вокруг всевозможных осей, проходящих через начало. В тесной связи с понятием класса стоит и другое важное поня- понятие, а именно: понятие о нормальном делителе, к которому мы сейчас и переходим. Пусть Q—некоторая группа и ?—ее под- подгруппа. Пусть Gt — некоторый фиксированный элемент группы О. Рассмотрим совокупность элементов этой группы, представляемых произведением Q&Q;1, D0) где через На мы обозначили переменный элемент подгруппы //, т. е., иначе говоря, На пробегает все элементы подгруппы Н. Нетрудно видеть, что произведения D0) образуют также подгруппу. Действи- Действительно, если взять, например, произведение двух элементов, принад- принадлежащих совокупности D0), то оно также будет принадлежать этой совокупности: и аналогично выполняются остальные условия для образования группы. Подгруппа D0) называется подобной подгруппе Н> и если Ох при- принадлежит подгруппе Ну то подгруппа D0) также состоит из элементов, принадлежащих //, и, как нетрудно видеть, просто совпадает с И. Всякий элемент Нао подгруппы ? может быть получен в этом случае по формуле D0), если мы возьмем Если элемент Ох не принадлежит подгруппе Я, то подгруппа D0) может быть и отличной от подгруппы К Подгруппа ? называется нормальным делителем полной группы Ог если при любом выборе элемента Gx из полной группы О под- подгруппа D0) совпадает с подгруппой //. Мы дальше приведем при- примеры нормальных делителей группы, а сейчас перейдем к выясне- выяснению некоторых новых понятий, связанных с понятием нормального делителя. Положим, что подгруппа ? есть нормальный делитель полной группы О. Для простоты письма будем считать, что эта подгруппа имеет конечный индекс т. В этом случае все элементы группы О могут быть представлены по схеме На, ОХН„ О2Яа> ..., От_хНф D1)
214 гл. ш. основы теории групп [58 где На, как всегда, — переменный элемент подгруппы //. Раз ? есть нормальный делитель, то совокупность элементов QkHaQkl совпадает с совокупностью элементов На> т. е. совокупность элементов QkHa совпадает с совокупностью элементов HaQk. Таким образом, если ? есть нормальный делитель, то разбие- разбиение элементов полной группы на сопряженные совокупности по схеме D1) совпадает с разбиением элементов на сопряженные сово- совокупности по схеме Нф НаОь НаОь ..., HaQm^ D2) Иначе говоря, в этом случае сопряженные совокупности справа совпадают с сопряженными совокупностями слева. Если HaQ есть некоторый элемент нормального делителя, то при любом О0 из Q элемент О0На0О^1 также принадлежит нормальному делителю, т. е. если некоторый элемент принадлежит нормальному делителю, то и весь класс, в который этот элемент входит в основной группе, также принадлежит нормальному делителю. Нетрудно показать и наоборот, что если некоторая подгруппа обла- обладает тем свойством, что, содержа некоторый элемент, она содержит и весь класс, к которому этот элемент принадлежит в основной группе, то такая подгруппа есть нормальный делитель. Обратимся теперь к рассмотрению сопряженных совокупностей в схеме D1) или D2), где элементы На образуют нормальный дели- делитель //. Рассмотрим произведения QiHaQkHa> элементов некоторой сопряженной совокупности QiHa на элементы сопряженной сово- совокупности QkHa'. Мы можем совокупность этих произведений написать в виде: Qt{HaQk)Ha>, QtQkMaHa, Элементы На и Haf содержатся в нормальном делителе //, и то же самое можно сказать и об их произведении. Таким образом, предыдущие произведения мы можем написать в виде: Все элементы этого вида заключаются в одной и той же сопря- сопряженной совокупности D1), а именно в той сопряженной совокуп- совокупности, к которой принадлежит элемент Gflk. Нетрудно также пока- показать, что мы получим таким образом все элементы этой сопряжен- сопряженной совокупности. Короче говоря, если подгруппа есть нормальный делитель, то перемножение одной сопряженной совокупности на дру- другую дает также некоторую сопряженную совокупность. Будем рас- рассматривать каждую из сопряженных совокупностей как некий новый элемент, причем первую из сопряженных совокупностей в схеме D1), C8) будем считать единичным элементом. Предыдущий результат об умножении сопряженных совокупностей даст нам правила умно-
59] § ?. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 215 жения этих новых, введенных нами элементов, причем, как нетрудно проверить, что мы предоставляем сделать читателю, это правило умножения удовлетворяет всем условиям, которые требуются для образования группы, т. е. введенные нами новые элементы при указанном правиле перемножения сами образуют группу, в которой первая из сопряженных совокупностей схемы играет роль единич- единичного элемента. Эта новая группа, порядок которой равен индексу нормального делителя //, называется дополнительной к ? группой или фактор-группой относительно //. Всякая группа О имеет два тривиальных делителя: один состоит из одного единичного элемента и другой совпадает со всей группой. В дальнейшем, говоря о нормальном делителе, мы будем считать, что он отличен от упомянутых двух тривиальных нормальных дели- делителей. Может случиться, что группа не имеет ни одного нормального делителя. Такая группа называется простой. 59. Примеры. 1. Рассмотрим группу G вещественных ортогональных преобразований в трехмерном пространстве. Пусть ?—подгруппа движения, т. е. совокупность ортогональных преобразований с определителем (+1). Пусть, далее, S есть симметрия относительно начала, определяемая форму- формулой C7). Если На есть переменный элемент из /У, то полная группа О мо- может быть представлена по схеме: Hai SHa или Иа% HaS. D3) Если Gx есть любое преобразование из G> то Gj^HqG^1 имеет определи- определитель (+ 1), т. е. принадлежит /У, и И есть нормальный делитель индекса два. Рассмотрим группу, дополнительную к И. Первой из совокупностей D3) соответствует единичный элемент ? этой группы. Произведение двух элемен- элементов из второй совокупности, т. е. двух ортогональных преобразований с опре- определителем (— 1), дает ортогональное преобразование с определителем (-)- 1), которое принадлежит первой совокупности. Если К — элемент, соответствую- соответствующий второй совокупности, то из сказанного следует, что ЛТ2 = Е. Итак, допол- дополнительная к Я группа состоит из двух элементов ? и /f, и ^ = ?, т. е. это есть циклическая группа порядка два. Это будет вообще иметь место при нормальных делителях индекса два. 2. Для симметрической группы перестановок знакопеременная группа будет нормальным делителем индекса два. Выпишем элементы симметрической группы с тремя элементами и обо- обозначим каждый из них одной буквой, пользуясь обозначениями из [55]: Е; Л = B, 3); В = (\, 2); С = A, 3); D=(l, 3, 2); /?=A, 2, 3). Знакопеременная группа, состоящая из перестановок Е, D и F, будет цикли- циклической группой третьего порядка (F=D2 и D=F&I причем /)8 = /?л==Ё» Вся симметрическая группа состоит из трех классов: \Е; НА В и С: Ш D и F. Знакопеременная группа также состоит из трех классов: IE; IID; III F. Нетрудно проверить,,что закон умножения для элементов рассматриваемой симметрической группы совпадает с тем законом, который определяется таблицей C4) из [561·
216 гл. ш. основы теории групп [59 Знакопеременная группа при я = 4 содержит 12 элементов, которые распределяются на четыре класса: IE; И А = A, 2) C, 4); Л2 = A, 3) B, 4); Л = A. 4) B, 3); III В1 = A, 2, 3); Я2 = B, 1, 4); ?, = C, 4, 1); Я4 = D, 3, 2); IV С, —A, 2, 4); С, = B, 1, 3); С3 = C, 4, 2); С4 = D, 3, 1). Второй класс содержит три элемента второго порядка, а третий и чет- четвертый классы — по четыре элемента третьего порядка. Произведение двух элементов второго класса дает, как нетрудно проверить, опять элемент вто- второго класса, и, поскольку все элементы второго порядка попали во второй класс, можно утверждать, что эти три элемента совместно с единичным эле- элементом образуют нормальный делитель рассматриваемой знакопеременной группы. Порядок его равен четырем, а индекс трем. Легко проверить, что элементы В( третьего класса попадут в одну из сопряженных совокупностей элементов по указанному нормальному делителю, а элементы С,- — в другую сопряженную совокупность. Далее нетрудно проверить, что произведение двух элементов третьего класса дает некоторый элемент четвертого класса, а произведение двух элементов четвертого класса дает элемент третьего класса. В дополнительной группе указанному нормальному делителю соответствует единичный элемент Е. Пусть А и В—два других элемента дополнительной группы. Из сказанного выше непосредственно следует, что Л2 = БиВ2 = Л, « непосредственно очевидно, что дополнительная группа, состоящая из эле- элементов ?, ? и Л2, причем Л3 = ?, есть циклическая группа третьего порядка. Отметим, что элементы ? A, 2, 3) и B, 1, 3) нашей основной знакопе- знакопеременной группы образуют циклическую подгруппу третьего порядка, но эта •подгруппа не является элементарным делителем. Если мы пронумеруем вершины тетраэдра в каком-либо порядке, то легко непосредственно проверить, что указанная выше знакопеременная -группа при ? = 4 соответствует тем вращениям, при которых тетраэдр переходит в себя. Всякая перестановка определяет переход одних вершин в другие. Перестановкам третьего класса соответствует вращение вокруг одной из 2? осей тетраэдра на угол —, а перестановкам четвертого класса — вращения о в противоположном направлении вокруг тех же осей и на тот же угол. Так, например, перестановкам A, 2, 3) и B, 1, 3) соответствуют вращения вокруг оси, проходящей через вершину с номером 4. Перестановкам второго класса соответствуют такие вращения тетраэдра, при которых ни одна из вершин не остается неизменной. Можно доказать, что знакопеременная группа при л>4 является простой. 3. Если имеется абелева группа G и ее какая-либо подгруппа Я, то при любом выборе элементов На из Я и Gx из G мы имеем <51Яа = Яа(?1, т. е. G^HaGx1 = На, откуда непосредственно видно, что Я есть нормальный де- делитель, т. е. всякая подгруппа абелевой группы есть ее нормальный дели- делитель. В качестве примера рассмотрим ipynny G сложения векторов в Rm о которой мы говорили в [49]. В качестве подгруппы Я возьмем векторы, принадлежащие некоторому подпространству L^ из Rn @ <С k <c п). Сопряженные совокупности получаются путем добавления к какому-либо вектору ? из Rn всех векторов подпро- подпространства Lk. Если ? принадлежит /,&, то сопряженная совокупность совпадает с под- подгруппой Я. Введем некоторые орты ха\ xi2), ... , xik) в ?fe и орты jc(*+1),. ,. , x{nt в дополнительном подпространстве ??_& Всякая сопряженная совокупность элементов будет состоять, в силу сказанного выше, из векторов: Cix<» + csx<*> + ... + ckx^ + ck+ix^» + ...+ причем ck+it ... , сп имеют фиксированные значения, a cl% cit .... ск — могут принимать любые значения.
60J § 5· основы общей теории групп - 217 Таким образом, всякой сопряженной совокупности мы можем сопоставить определенный вектор из -Мл_#, и, наоборот, всякому вектору из Mn_k соот- соответствует определенная сопряженная совокупность. Сложению двух векторов из каких-либо двух сопряженных совокупностей соответствует сложение соответствующих этим совокупностям векторов из Мп_ь. Иначе говоря, эле- элементами дополнительной группы можно считать векторы из Мп_ь при преж- прежней групповой операции (сложение векторов). В этом примере порядок нормального делителя ? и его индекс равны бесконечности. 60. Изоморфные и гомоморфные группы· Две группы А и В называются изоморфными, если между их элементами можно уста- установить такое соответствие, что каждому элементу из А соответ- соответствует определенный элемент из В и, наоборот, всякому элементу из В соответствует определенный элемент А (биоднозначное соот- соответствие), причем это соответствие таково, что произведению двух каких-либо элементов из А соответствует произведение соответ- соответствующих элементов из В. Если А и В — изоморфные абстрактные группы, то они имеют совершенно одинаковую структуру, т. е. по существу не отличаются одна от другой. Перейдем теперь к установлению нового понятия, которое является обобщением понятия изоморфных групп. Группа В назы- называется гомоморфной группе А, если каждому элементу А соответ- соответствует определенный элемент В, причем каждый элемент из В соот- соответствует хоть одному элементу из Л, и это соответствие таково, что произведению двух элементов из А соответствуег произведение соответствующих элементов из В. В данном случае в отличие от изоморфных групп соответствие не должно быть обратно-однознач- обратно-однозначным, т. е. один и тот же элемент группы В может соответствовать нескольким различным элементам группы А. Если группа В гомо- гомоморфна группе А, и каждому элементу из В будет соответствовать один определенный элемент из А, то эти группы будут и изоморф- изоморфными. Заметим, кроме того, что если элементам Ах и Л2 из А соот- соответствуют элементы ?? и ?2 из В, то по определению элементу ?%?? из А соответствует элемент ?%?? из В. Пусть Ло — единичный элемент из А и Во — соответствующий элемент из В. Нетрудно показать, что и Во будет единичным эле- элементом. Действительно, для любого Ах из А имеем равенство которое приводит к равенству соответствующих элементов из В: причем по определению гомоморфизма В\ можно считать любыкг элементом из В. Последнее равенство показывает, что Во есть еди- единичный элемент группы В. Итак, в изоморфных и гомоморфных груп- группах единичному элементу из А соответствует единичный элеменг
218 гл. ш. основы теории групп [60 «з В. Возьмем теперь два обратных элемента Ах и А" из А, и пусть ?? и Въ — соответствующие элементы из В. Равенство АХА^* = ?~[????=?0, где Ао— единичный элемент, дает, по опреде- определению гомоморфных групп, ???$ = ?%?? = ?0, где по предыдущему BQ — единичный элемент, а потому В% = В\ \ т. е. обратным элемен- элементам из А соответствуют и обратные элементы из В. Положим, что наши группы только гомоморфны, но не изо- изоморфны. Рассмотрим совокупность элементов Са в группе А, кото- которым соответствует единичный элемент Во из В. Если Са соответ- соответствует Во, то по предыдущему Са1 соответствует Щ1 = Во, и вся- всякому произведению Ca2Cai соответствует также В0В0 = В0, т. е. совокупность элементов Са группы А, которым соответствует еди- единичный элемент из В, образует некоторую подгруппу С группы Л. Покажем, что эта подгруппа будет нормальным делителем. Дей- Действительно, пусть Л! — какой-нибудь элемент группы Л и В^ — со- соответствующий элемент из В, Всякому элементу вида А^А^1 соот- соответствует в В элемент ???^?? *, или в силу основного свойства единичного элемента можно утверждать, что всякому элементу вида AxCaAi * соответствует единичный элемент из В, т. е. всякий элемент вида AfiaAll есть один из элементов Са, т. е. он принадлежит подгруппе С, а следовательно, эта подгруппа С есть нормальный делитель. Рассмотрим теперь разбиение группы Л на сопряженные совокупности по схеме Сф АХС9 А»Сде ... D4) Пусть Bk — элемент, соответствующий Ak. Возьмем два элемента AfeQrf и АьСа<ъ принадлежащих одной и той же сопряженной сово-у купности. Им будут соответствовать элементы BkBQ и ВкВ& т. е. один и тот же элемент Bk из В. Элементам из разных сопряженных совокупностей AkCa и АгСа соответствуют элементы Bk и Bv Покажем, что эти последние эле- элементы различны. Действительно, если бы они были одинаковы, то элементу AulAt соответствовал бы единичный элемент Во из В, т. е. элемент ?? ??? должен был бы быть одним из элементов Са9 т. е. мы имели бы Ak1Al=Cao, т. е. Al = AkCaoy что противоречит схеме D4). Итак, если группа В гомоморфна группе А, то сово- совокупность элементов С из Л, соответствующих единичному элементу из В, образует нормальный делитель, и всякая сопря- сопряженная совокупность с этим нормальным делителем представ- представляет собою совокупность всех элементов А, которым соответ- соответствует один и тот же элемент из В. Из определения гомоморфных групп, следует непосредственно, что произведению двух каких-либо элементов из различных (или одинаковых) сопряженных совокупно- совокупностей соответствует произведение тех элементов группы В, которые соответствуют упомянутым сопряженным совокупностям, т. е., короче
61] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП говоря, всякой сопряженной совокупности из А соответствует опре- определенный элемент из В, различным сопряженным совокупностям соответствуют различные элементы из В, и это соответствие устанав- устанавливает изоморфность группы В с дополнительной для Са группой в А, В качестве примера возьмем опять группу вещественных ортого- ортогональных преобразований в трехмерном пространстве и сопоставим каждому такому преобразованию число, равное определителю преоб- преобразования, определив умножение в области этих чисел обычным* образом, как умножения чисел. Выданном случае наша группа будет гомоморфна группе, состоящей из двух элементов (-f-1) и (.— 1)> причем умножение для этих двух элементов определяется обычным образом, как умножение чисел. Роль единичного элемента будет играть (-J- 1). Для этого примера нормальный делитель будет пред- представлять собою группу вращения. Если группа В гомоморфна, но не изоморфна группе А, то со- совокупность элементов группы А> которым соответствует единичный элемент из В, называется обычно ядром гомоморфизма. Мы видели, что ядро гомоморфизма является нормальным делителем группы А. 61. Примеры. 1. Возьмем группу G вещественных ортогональных пре- преобразований в трехмерном пространстве, сопоставим каждому такому пре- преобразованию число, равное определителю этого преобразования, и определим^ групповую операцию для этих чисел как их обычное умножение. При этом группа G'y состоящая из чисел (-f-1) и (— 1) при обычном умножении этих чисел, будет гомоморфной группе О. Единичный элемент (-)- 1) группы G' соответствует вращениям трехмерного пространства из С/. Эти вращения- образуют нормальный делитель, а дополнительной группой является цикли- циклическая группа порядка два [59]. „ 2. Возьмем на плоскости XY правильный треугольник с вершинами: A, 0); (cos 120°, sin 120°); (соз 240°, sin 240°) и образуем группу G, состоящую из вращений плоскости вокруг начала на' угол 0°, 120°, 240°, при которых треугольник переходит в себя, и из сим- симметрии плоскости относительно оси X с последующим вращением на угол, 0°, 120°, 240°. Это будет группа диэдра при п = 3. Выпишем все матрицы, соответствующие элементам этой группы; E = 1 О ? ? а» c=\ 1-4 -т^ -4-?* 4- А = \\ D= 1 0 | 0 -1 1'» В~ 1 1 l__ J_ уз 2 2 1 2 1 2 у УЗ — 1 г ^3 " I | 1 2 2 Если мы o6paTHMQfl к схеме умножения, определенной таблицей C4) из [56], то увидим, что эта схема умножения как раз и соответствует умно- умножению матриц, образующих нашу группу. Выше мы видели [59], чта
220 гл. in. основы теории групп [62 упомянутая схема умножения соответствует также симметрической группе перестановок из трех элементов: ?;Л = B, 3); В = (\, 2); С = A, 3); D=(l, 3, 2); F=(l, 2, 3). D5) Таким образом, если мы будем считать элементы этих двух групп, обо- обозначенные одной и той же буквой, соответствующими, то эти две группы будут изоморфными. Перестановки группы D5) соответствуют перестановкам вершин упомянутого выше треугольника, если их занумеровать соответ- соответствующим образом. Совершенно так же, как об этом мы уже упоминали в [59], группа тетраэдра изоморфна знакопеременной группе при п — 4. 3. Можно указать общий прием построения групп перестановок, гомо- гомоморфных данной группе G. Пусть ? — какая-либо подгруппа группы G конечного индекса п. Напишем соответствующие ей сопряженные совокуп- совокупности элементов: м rrQ tjq fiq Если мы умножим каждую из этих совокупностей справа на некоторый элемент S из G, то произойдет лишь некоторая перестановка порядка этих совокупностей, и будем считать, что эта перестановка и соответствует взятому элементу S из G. Нетрудно показать, что таким образом и полу- получится группа О перестановок, гомоморфная группе G. Для того чтобы элементу 5 из G соответствовал единичный элемент из Gr, необходимо и достаточно, чтобы при умножении справа на S всякая сопряженная совокупность переходила в себя, т. е. чтобы НЛ8 = Н9 и //aSftS = W3Sft (ft = l, 2 я —1), еде На — любой элемент ? и //? также принадл'ежит //. Написанные ра- равенства можно переписать в виде: S = Щ 'Я ; S = (Si 'ЯАГ1 (S; '"„«*>. « из них следует, что для того чтобы элементу S соответствовал единичный элемент из G', необходимо и достаточно, чтобы S одновременно принадле- принадлежало ? и всем подобным подгруппам S^ 1HSk. Если ? — нормальный делитель G, то указанное требование сводится к тому, что S принадлежит //, и группа G' в этом случае изоморфна до- дополнительной группе. Если ? сводится к одному единичному элементу, то труппа G изоморфна группе перестановок G\ которая получается, если элементы группы G: к- о с с умножим справа на любой элемент S из С?, что приведет к некоторой пере- перестановке элементов G. В дальнейшем мы подробно рассмотрим построение групп линейных преобразований, изоморфных заданной группе. 62. Стереографическая проекция. Закончив основы общей теории групп, мы переходим теперь к рассмотрению некоторого частного примера соответствия между группами, играющего важную роль в физике. Предварительно выясним понятие о стереографической проекции, дающей определенный закон соответствия между точками сферы и плоскости. Рассмотрим трехмерное пространство с координатными осями ??? и сферу С с центром в начале и радиусом единица. Пусть 5 — точка «сферы, имеющая координаты @, 0, —1), и ? — переменная точка
62] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 221 на сфере (рис. 3). Прямая SM пересечет плоскость XY в некоторой точке Р, и мы имеем таким обр-азом вполне определенный закон соответствия между точками сферы С и точками плоскости XК, причем точк^е сферы 5 с координатами @, 0, — 1) соответствует бесконечно далекая точка плоскости. Установленное соответствие точек и дает нам стереографическую проек- проекцию сферы на плоскость. Обратимся теперь к выводу формул, дающих стереографическую проекцию. Пусть MN—перпендикуляр из точки ? на ось ?. Мы имеем из подобия треугольников, принимая во внимание, что 50= 1: NM = (l+0NHP. D6) Обозначая через (х, у, ?) координаты точки ? и через (?, ?) координаты Р, смо- сможем написать: NM = (l+zHP, Рис или, проектируя параллельные отрезки ОР и ?? на оси X и ?: * = A+г)а; j, = (l-{-*)p. D7) Уравнение xi-\-y<i-\-z<i = 1 дает нам квадратное уравнение для г: и, решая его, получим: ?= Но для всех точек (?, ?) на конечном расстоянии мы должны иметь ?^>—1, и, следовательно, в предыдущей формуле мы должны брагь (-]-1). Пользуясь еще формулами D7), получим окончательные выражения (дг, уу ?) через (?, ?): х- -. D8) Вместо двух вещественных координат ? и ? на плоскости введем одну комплексную координату ? == ? -|- /?. Обозначая, как всегда, через ? комплексное число, сопряженное с ?, мы можем переписать предыдущие формулы в следующем виде: * ¦ x-b-JL,., ,-1=4. D9) 1+tf 1-fCC Представим комплексное переменное ? в виде отношения двух других комплексных ? и ?: „ С=|. E0)
222 гл. ??. основы теории групп [63 Пары значений ???, отличающиеся общим множителем, т. е. пары вида kl, kt\ и ?, ?, будут давать одно и то же С, г. е. одну и ту же точку плоскости, и пара значений ?^?, ? = 0 будет давать бесконечно далекую точку плоскости. Комплексные числа ? и ? на- называются однородными комплексными координатами на плоскости. Формулы D9) мы можем, пользуясь E0) и отделяя вещественную и мнимую части, переписать в виде: Для любых комплексных значений ? и ? последние формулы дают вещественные (х, у, ?), удовлетворяющие соотношению iy + zi_l=Of E10 как это и следовало ожидать, ибо точка (х> у, ?) находится на еди- единичной сфере. 63. Унитарная группа и группа движения. Рассмотрим теперь некоторое унитарное преобразование над переменными (?, ?): E2) причем в силу унитарности должно быть: ^' + ?'?'=« + ??· F3) Новые значения переменных (If, ?') дадут нам и новую точку на сфере E4) Определитель унитарного преобразования E2), равный, как известно, по модулю единице, будет выражаться некоторым числом вида eif. Умножая все коэффициенты преобразования E2) на е 2 , получим унитарное преобразование с определителем единица. Но при этом %' и ?? умножатся также на е 2. Этот дополнительный множитель совершенно не повлияет на величину ?. Мы можем, таким образом, ограничиться рассмотрением унитарных преобразований E2) при условии, что определитель преобразования равен единице, т. е. ad — bc=\. E5) Даже при этом ограничительном условии два преобразования, коэффициенты которых отличаются знаком, дадут нам значения ?' и ?', отличающиеся знаком, и мы придем при обоих этих преобразо- преобразованиях к одной и той же точке ??,
63] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 223 Если мы подставим в формулы E4) вместо ?' и ?' их выражения E2) и примем во внимание условие E3), то увидим, пользуясь E1), что переменные {х\ у\ zr) выразятся в виде линейных однородных полиномов через (Xj у, ?). В силу E3) знаменатель в выражениях E1) и E4) оказывается одинаковым, и переменные (х, у, ?) испытывают то же самое линейное преобразование, какое испытывают выражения: и = Ц + Ь% ?; = -[-(?? — Щ\ хи) = %1 — Щ E6) при унитарном преобразовании E2). Дальше мы установим точно вид этого линейного преобразования. Установим прежде всего общий вид унитарных преобразований E2) с определителем единица. Обычные условия унитарности дают нам [28]: ас -\-bd = O; cc-\-dd=l. Умножая условие E5) на с и пользуясь первым из написанных условий, получим: — bdd — bcc = су откуда в силу второго условия будем иметь € = —Ь или с== — bt и совершенно аналогично можно показать, что d = u. Мы можем, таким образом, написать все унитарные преобразования с определи- определителем, равным единице, в следующем виде: где а и Ь — любые комплексные числа, удовлетворяющие условию аа-\-ЪЬ=\. E8) Составим теперь выражения E6) с новыми переменными и' -f Ы = 25Y; и' — Ы = Щ\ <& = ?? — ?% или, пользуясь E7): ?? + ? = ?22?? — b%2b\ — 2ab (\l — ??), и' — ft/ = — Ьг2Ц + ?*2?? — 2ab (?? — ??), wr=~аЬ?щ -f- ab2bi + (aa — bb) (U ~ ??). Производя замену 2?? = и -j- iv; 2?? = и — iv; ?? — ?? = w и складывая и вычитая первые два уравнения, получим выражения
у = -i- (?2 -\-b* — a* — b*)x- 224 гл. ш. основы теории групп [63 (w', v\ wr) через (и, vt w), или, что то же, выражения (х^, у\ zr) через (х, у, ?): E9) &) jt 4" * (а^ — а^)^ + (аа — Щ ?. Всякому унитарному преобразованию E7) соответствует некото- некоторое преобразование плоскости XК, а это, в свою очередь, в силу соответствия, устанавливаемого стереографической проекцией, дает некоторое преобразование сферы. В соответствии с этим E9) есть вещественное преобразование, в силу которого уравнение переходит в уравнение Но линейное однородное преобразование E9) не меняет свобод- свободного члена 1, и, следовательно, оно должно оставлять неизменной и левую часть уравнения, т. е. х* 4-У2 4- ^ = х* +/ + <г2· Все эти обстоятельства можно непосредственно получить и из самого вида преобразования E9). Итак, формулы E9) дают веще- вещественные ортогональные преобразования с тремя переменными. По- Покажем теперь, что определитель преобразования E9) всегда равен D~ 1)· Этот определитель есть непрерывная функция вещественных и мнимых частей комплексных переменных а и Ь, которые должны удовлетворять соотношению E8). Но величина определителя может быть только D~ 1) или (— 1), и в силу упомянутой выше непре- непрерывности эта величина должна быть все время D- 1) или все время (— 1). Но при а=\ и Ь = 0 формулы E9) дают нам тождественное преобразование с определителем D~ 1), т. е. действительно опреде- определитель преобразования E9) всегда равен D~ 1)· Итак, линейные пре- преобразования E9) представляют собою вращение пространства вокруг начала. Докажем теперь, что всякое вращение пространства может быть представлено в виде E9). Если мы положим: а=е~ 2 ?; а = е2 ?; b = b = O,
63] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП т. е. возьмем матрицу унитарного преобразования ??? О е то формулы E9) дадут нам: ?' = ? COS ? —у Sin ?, У = ? sin ? -\-y COS ?, 225 F0) F1) т. е. мы получим вращение вокруг оси ? на угол ?, Если теперь возьмем: a = a=cos-|-; = — ? sin у; b = sin-|-, т. е. матрицу унитарного преобразования определим следующим об- образом: ? cos I -isln^- - i sin -| ? C0ST F2) то формулы E9) дадут нам: x' = x, у =y cos ? — ? sin ?, г' =y sin ? -j- -г cos ?. F3) Это будет вращение вокруг оси X на угол ?. Но, как мы знаем [20], всякое вращение с углами Эйлера {?, ?, ?} может быть получено в результате поворота вокруг ? на угол а, последующего поворота вокруг новой оси X на угол ? и после- последующего затем поворота вокруг новой оси ? на угол ?. Обозначим через ?? матрицу третьего порядка, соответствующую преобразованию F1), и через X —матрицу преобразования F3). Поворот вокруг оси ? на угол ? будет осуществляться матрицей Za. При этом новая ось X получится из прежней оси X при помощи этой же матрицы, и поворот вокруг новой оси X на угол ? будет осуществляться, как нетрудно видеть, матрицей ZaXgZaS и первые два поворота осуществляются матрицей ???? ?? iZ0L = ZaXp. Как и выше, поворот вокруг новой оси ? на угол ? будет осу- осуществляться матрицей* г (??)?(??)
226 гл. ш. основы теории групп [63 и окончательно вращение {?, ?, ?} будет осуществляться матрицей или ?????. F4) В предыдущих рассуждениях мы пользовались тем очевидным фактом, что если ?? есть матрица, дающая вращение вокруг некото- некоторой оси /, проходящей через начало, на угол ?, и матрица ? пере- переводит / в ось /1? то вращение вокруг 1Х на угол ср будет определяться подобной матрицей: Заметим теперь, что если Ах и Л2 — два унитарных преобразо- преобразования E7), которым соответствуют ортогональные преобразования E9) иг и ?/2, то произведению А^АХ будет, очевидно, соответствовать также произведение ?/at/i. Таким образом, вращение пространства {?, ?, ?} будет получаться в силу F4) от унитарной матрицы, являю- являющейся произведением трех унитарных матриц: — i-тг 0 О cos ~ — I sin ? cost 0 F5) 0 Итак, всякому унитарному преобразованию соответствует опре- определенное вращение трехмерного пространства, и таким образом по- получаются все вращения. Произведению двух унитарных преобразо- преобразований будет соответствовать произведение соответствующих вращений. Мы можем сказать, что формулы E9) определяют гомоморфизм группы унитарных преобразований с определителем единица с группой вра- вращения трехмерного пространства. Посмотрим теперь, какие унитарные преобразования дают Тожде- Тождественное преобразование, т. е. единичный элемент в группе вращения. Третья из формул E9) дает нам при этом = 0; аа bb—l, откуда |а| = 1 и й = 0. Пусть а = егЬ. Первая из формул E9) дает: Отсюда непосредствен^ следует ? = 0 или it, т. е. а = ±Ь Мы получаем, таким образом, два унитарных преобразования с матрицами — 1 О Е = \ 1 О О 1 о О —1 = -?, которым соответствует единичный элемент в группе вращения.
63] § ?. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 217 Положим теперь, что две унитарные матрицы U и V дают одно и то же вращение. При этом V~XU будет давать тождественное преобразование в группе вращения пространства, т. е. V~XU—E или (— ?), так что ?/= V или U= — V. Заметим при этом, что знак (—) перед матрицей означает, что у всех элементов матрицы надо изме- изменить знак. Предыдущие рассуждения показывают, что унитарные преобразования F7) приводят к одинаковому вращению пространства только тогда, когда они отличаются лишь знаком. Наоборот, если они отличаются только знаком, то, как мы уже упоминали выше и как это следует из формулы F9), они дают одно и то же враще- вращение пространства. Окончательно можем сказать, что группа враще- вращения пространства будет гомоморфна группе унитарных преоб- преобразований E7) с определителем единица, причем одинаковые вра- вращения получаются тогда и только тогда, когда унитарные матрицы отличаются лишь знаком. Матрицы ? и (— Е) образуют нормальный делитель ? группы О—унитарных преобразований E7) с определителем единица. Всякая сопряженная совокупность по этому нормальному делителю ? состоит из двух элементов ?? и (— Gj), где ?? — любой элемент группы. Из сказанного выше непосредственно следует, что группа вращения изоморфна дополнительной к ? группе. Формулы E9) содержат два комплексных параметра а и Ь, кото- которые должны удовлетворять соотношению E8). Каждый из комплекс- комплексных параметров содержит два вещественных параметра а 5= ах -}- Icib b=*bi-\- lb%, и соотношение E8) равносильно следующему: Таким образом, формулы E9) содержат четыре вещественных параметра, которые должны удовлетворять одному соотношению, т. е. формулы E9) содержат три независимых вещественных пара- параметра, как это и должно быть для группы вращения. Параметры а и Ъ называются обычно параметрами Кейли — Клейна. Нетрудно получить их выражение через углы Эйлера. Действительно, перемно- перемножая три унитарные матрицы F5), получим, как мы видели выше, ту унитарную матрицу, которая будет соответствовать вращению с углами Эйлера {?, ?, ?}. Умножая, получим для соответствующих параметров а и b следующие выражения: а = е 2 cos-Ь ? = — le^sinf. F6) Если прибавить* 2? гк ? или ?, то а и b переменят знак, а вра- вращение по существу останется тем же. Это обстоятельство было отмечено уже выше.
228 гл. in. основы теории групп [64 64. Общая линейная группа и группа Лоренца. Мы устано- установили только что тесную связь унитарной группы с двумя перемен- переменными и группы вращения трехмерного пространства. Совершенно аналогичным образом можно установить связь между общей линей- линейной группой с двумя переменными и с определителем, равным еди- единице, и группой Лоренца. Введем четыре переменные хь х2, jc3, х0, и, обращаясь к форму- формулам E1), выражающим стереографическую проекцию, положим в них *=?; у=*%\ *=?. F7) ?0 Aq A.Q Это дасг нам следующие формулы: ?2_ 1 ?? Они определяют ??? с точностью до произвольного общего мно- множителя, и мы можем положить: F8) = 1 (?? — ??); ?3 = ?? — ??. Прежние переменные удовлетворяли соотношению E1^, и, сле- следовательно, в силу F7), новые переменные, определяемые по фор- формулам F8), будут при любых комплексных значениях 5 и ? удов- удовлетворять соотношению х\ + А + х1— *о = О. F9) При унитарности преобразования с ? и ? выражение (U-f-??) оставалось неизменным, т. е., согласно F8), оставалась неизменной переменная хф выражающая сейчас время, и мы получали таким образом вращение трехмерного пространства. Откажемся теперь от унитарности преобразования и рассмотрим общую группу линейных преобразований % l\b ' ? + G0) Будем поступать дальше аналогично тому, как мы поступили в случае унитарных преобразований. Составим выражения: Для новых переменных ?', ?' получим новые ?\ -f ix't = 2?'?'; ?\ — Ьх'ъ =
64] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 229 Подставляя выражения G0) и пользуясь G1), получим: х[ 4* Ix'i = ad (X\ 4" ??? ~Ь be (?? — 4- ас (х0 + *3) + bd (х0 — . х[ — ix'i = be {?? 4- ix<d 4*?^(?? — " С°~ХЗ)> G2) + aa (x0 4- хг) 4- ? ? (??0 — — ЛГз = cd (д?! 4- 1 ^ 4- < откуда непосредственно получаются линейные выражения с веще- вещественными коэффициентами x'k через хк9 которые мы выписывать не будем. Заметим только, что если сложить последние два из урав- уравнений G2), то в выражении для х'о коэффициент при х0 окажется равным -к- (аа -\- ЬЪ 4~ ее -\- dd), т. е. этот коэффициент будет поло- положительным. Новые переменные x'k> как и первоначальные, удовлетворяют уравнению: х? 4" *if + х'ъ — х* = 0· G3) Если в левой части этого уравнения заменить x'k их выражениями через xk, то должно получиться уравнение F9). Но левая часть урав- уравнения G3) может при этом оказаться отличающейся от левой части уравнения F9) на постоянный множитель, т. е. мы будем иметь в данном случае: где k — некоторая постоянная. Пользуясь предыдущими формулами и принимая во внимание, что х[2 4- лг22 4" *з2 — х'о2 = (*\ + *¦*«) (?? — **а) — (?? 4" ^з) (х'о — х'ъ), нетрудно показать, что k = (ad — bc)(ad — be) ==\ad — be |2. Если мы хотим получить k=l, т. е. преобразование Лоренца: х'х + х'ъ + х* ~ х'о2 = х\ + х\ + xl - xl G4) то должны брать линейные преобразования G0) с определителем по модулю, равным единице, т. е. выражающимся числом вида е1!р. Умножая, как и раньше, все коэффициенты преобразования G0) на е 2 , мы, с одной стороны, не изменим величин x'v x%, х'в>
230 гл. in. основы теории групп [64 определяемых по формулам F8)у если в них заменить ? и ? на ?' и ?', ибо эти формулы содержат произведение одной из величин (!Г, ?') на одну из величин A\ ?'), и, с другой стороны, приведем определитель преобразования к единице. Будем, таким образом, рассматривать преобразования G0) с опре- определителем единица: ad — bc=l. G5) Как и в предыдущем номере, мы можем показать, что линейное преобразование, выражающее x'k через xki имеет определитель (+1). Напомним, кроме того, что в нем коэффициент при х0 в выражении х'о — положителен, т. е. это преобразование имеет определитель (~(-1) и не меняет направления отсчета времени, т. е. преобразова- преобразования G2) суть положительные преобразования Лоренца. Итак, окончательно, линейные преобразования при условии G5) дают положительные преобразования Лоренца, которые мы опреде- определили в [54]. Как и в предыдущем номере, поставим теперь вопрос — можно ли получить по формулам G2) любое положительное преобразование Лоренца. Отметим прежде всего, что, как и в предыдущем номере, произведению двух линейных преобразований G0) отвечает про- произведение соответствующих преобразований Лоренца, т. е., точнее говоря: если А и В — два линейных преобразования G0), которые приводят, согласно G2), к преобразованиям Лоренца 7\ и 7^, то линейному преобразованию ВА будет соответствовать преобразова- преобразование Лоренца Г27\. Как мы видели в [54], всякое положительное преобразование Лоренца может быть представлено в виде: Г= VSU, где U и V суть простые вращения трехмерного пространства и S — положительное преобразование Лоренца с двумя переменными. Согласно результатам предыдущего номера, мы можем получить любое вращение при помощи некоторого унитарного преобразования вида G0) с определителем единица. Таким образом, нам остается показать, что мы можем получить и любое положительное преобра- преобразование 5 Лоренца с двумя переменными по формулам G2) при соответствующем выборе линейного преобразования G0). Сравни- Сравнивая G4) с B1) из [54], видим, что сейчас мы считаем с = 1, так что формулы A7) из [54], дающие положительные преобразования Лоренца с двумя переменными, перепишутся в виде: х*= j/тЬЛ *·=??=* G6)
64] § 5. ОСНОВЫ ОБЩЕЙ ТЕОРИИ ГРУПП 231 Введем величину и рассмотрим линейное преобразование G0) частного вида: где /—вещественная постоянная. Определитель его, очевидно, равен единице. В данном случае а = /, d = -y и Ь = с = О. Подставляя это в формулы G2), мы получим как раз преобразование G6), если / удовлетворяет условиям: /2 , 1 I2 1 Это дает непосредственно Р = и±]/Ги1—1. Второе из условий показывает, что при v^>0 надо брать корень для /2, меньший еди- единицы, а при v<^0— больший единицы, и при этом второе условие будет выполняться. Извлекая корень, получаем для / два значения, отличающихся лишь знаком. Мы можем, таким образом, окончательно утверждать, что группа линейных преобразований G0) с определи- определителем единица гомоморфна группе положительных преобразований Лоренца, причем этот гомоморфизм осуществляется форму* лами G2). Как и в предыдущем номере, этот гомоморфизм не будет изоморфизмом, т. е. различные преобразования G0) могут приводить к одному и тому же преобразованию Лоренца. Из формул G2) непосредственно вытекает, что тождественное преобразование в группе Лоренца получается от двух линейных преобразований с матрицами || 1 0 II || — 1 0 t~\Q I I' I 0 -1 и совершенно так же, как и в предыдущем номере, можно показать, что всякое преобразование из группы Лоренца может быть полу- получено лишь из двух линейных преобразований G0), коэффициенты которых отличаются только знаком. Совершенно так же, как и в [63], элементы ? и (— Е) образуют нормальный делитель ? группы линейных преобразований с опре- определителем единица, и группа положительных преобразований Лоренца изоморфна дополнительной к ? группе. Линейные преобразования G0) содержат четыре комплексных коэффициента, связанных условием G5). Таким образом, формулы G2) содержат три произвольных комплексных параметра, или, иначе говоря, шесть произвольных вещественных параметров.
232 гл. ш. основы теории групп [66 § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 65. Представление группы линейными преобразованиями. Пусть О—некоторая группа с элементами Ga, и положим, что каж- каждому элементу Оа соответствует определенная матрица Ла, причем все матрицы Ла имеют один и тот же порядок и их определители отличны от нуля. Положим далее, что это соответствие таково, что всякому произведению Qa2Gai соответствует матрица Аа2Аа1, кото- которая является произведением Ла2 и Ааг В этом случае говорят, что матрицы Аа или соответствующие им линейные преобразования дают линейное представление группы О. Пусть Go— единичный элемент группы и Ао — соответствующая матрица. Поскольку QQQa = = Ga, мы должны иметь А0Аа = Аа, откуда, умножая справа на Ли1, имеем Ло = /, т. е. единичному элементу должна соотвеюъо- вать единичная матрица. Пусть Gai и Ga2 — обратные элементы и At! и Аа2 — соответствующие матрицы. Из равенства Ga2-Gai = G0 следует Аа2Ап1 = /, т. е. обратным элементам соответствуют и обратные матрицы. Из предыдущего непосредственно следует, что матрицы Аа (или соответствующие линейные преобразования) образуют группу А, гомоморфную группе G. Если различным элементам О соответствуют и различные матрицы, то А будет не только гомоморфна, но и изоморфна G. В этом случае говорят, что она дает биоднознаяное линейное представление группы G. Если это не так, то совокупность элементов G, которым соот- соответствует единичная матрица в Л, образует нормальный делитель группы G, и группа А будет изоморфна дополнительной к этому нормальному делителю группе [57]. Если основная группа G сама есть группа линейных преобразо- преобразований, то, очевидно, она сама и дает одно из возможных своих ли- линейных представлений. Сделаем одно замечание по поводу данного определения линей- линейного представления. Пусть нам известно) что всякому элементу Оа соответствует определенная матрица Ла, причем произведению элементов соот- соответствует произведение матриц, но неизвестно, будут ли опре- определители матриц Ла отличны от нуля. Покажем, что если один определитель D(Aao) равен нулю, то и все D(Aa) равны нулю. Действительно, совокупность матриц АаоАа при переменном ? содер- содержит все матрицы, соответствующие элементам группы [56]. Но D(AaoAa) = D(Aao)D(Aa), и произведение равно нулю, так как первый множитель по условию равен нулю. Таким образом, имея закон соответствия, при котором произведению соответствует про- произведение, нам достаточно проверить, что один из определителей D(Aa) отличен от нуля; например, достаточно проверить, что единичному элемету из G соответствует единичная матрица из Л.
65] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 233 Пусть X — некоторая матрица того же порядка, что и матрицы Аа, с определителем, отличным от нуля. Мы имеем: (У А У~^\ (У А У~х\ У А А У ? ./л. /#с)./л ? \^*· ·**? ? ·**¦ } " ' *¦ ¦*"*(! о ft ?^^ * и, следовательно, матрицы ХАаХ~г также дают линейное представ- представление нашей группы G. Такие два подобных представления назы- называются обычно эквивалентными представлениями. Положим, что порядок матриц Аа равен ? и что (xiy ..., х„) суть составляющие вектора в я-мерном пространстве, над которым совершаются преоб- преобразования Аф так что группа А будет ? ЯаХ. {U) Эквивалентное линейное представление у'^ХАаХ~1уу G8) как мы знаем [25], имеет тот смысл, что в упомянутом пространстве вводятся новые оси, причем новые составляющие выражаются через прежние по формулам (у?? · · · > Уп)= ? (??> · · · > Хп)· G9) При этих новых осях линейные преобразования пространства будут уже выражаться по формулам G8), т. е. эквивалентные ли- линейные представления могут быть получены в результате простой замены координатных осей согласно формулам G9). Назовем пере- переменные (хь ..., хп), входящие в формулы G7), объектами линей- линейного представления. Переход к эквивалешному линейному пред- представлению равносилен, таким образом, замене объектов линейных представлений другими при помощи некоторого линейного преобра- преобразования G9) с определителем, отличным от нуля. Пусть имеется линейное представление группы Q при помощи матриц Аа порядка ? и другое линейное представление той же группы при помощи матриц Ба порядка т. Составим квазидиагональ- квазидиагональные матрицы порядка (п-\-т): [Аа, Ва}= Qa flJ. (80) Согласно правилу перемножения квазидиагональных матриц, мы имеем: [Аа2, Б Таким образом, матрицы (80) также дают некоторое линейное представление группы О. Вообще, имея несколько представлений
234 гл ?? основы теории групп [65 группы О при помощи матриц Аа, Ва, Са, мы можем составить и новое представление, пользуясь квазидиагональной матрицей А, О О = [Aa, Ba, Са] = О Ва О О О С„ (81) Заметим теперь, что если мы перейдем к эквивалентному пред- представлению при помощи матриц ХпаХ~г, то квазидиагональный ха- характер матриц, вообще говоря, нарушится, и по виду этого нового представления нельзя уже будет сразу сказать, что оно с точностью до эквивалентного представления составлено из других представле- представлений с меньшим числом измерений по закону (81). Если наше линей- линейное представление Da имеет чисто квазидиагональный вид (80), то оно распадается на несколько линейных представлений Аа и Ва с меньшим числом измерений, т. е. с матрицами меньшего порядка. В этом случае линейное представление называется приведенным. Если некоторое линейное представление Еа не имеет квазидиаго- квазидиагонального вида, но некоторое эквивалентное ему представление ????~? имеет такой вид, то представление Ей называется приводи- мым. Наконец, если не только само представление, но и все экви- эквивалентные ему представления не имеют квазидиагонального вида, т. е. не являются приведенными, то такое представление называется неприводимым представлением. О1метим некоторые условия, при наличии которых можно утвер- утверждать, что представление будет приводимым. Пусть линейное пред- представление состоит из матриц Аа порядка п> которые дают линейные преобразования с переменными {хь х^ ..., хп). Предположим, что все матрицы Ла — унитарные и что подпространство Rr, образованное первыми k ортами, переходит само в себя в результате преобразо- преобразования Aai т.е. если xk+l = xk^ = ... =хп = 0) то и x'k+l = = x'k+i = ,.. = x'n = 0. Иначе говоря, все матрицы Ла имеют вид: На К о а: (82) где А'ь — некоторая матрица порядка k, Al — некоторая матрица по- порядка (п — k), и в левом нижнем углу, имеющем (п — k) строк и k столбцов, стоят везде нули. Рассмотрим пространство R", образован- образованное последними (п — k) ортами. Оно будет состоять из векторов, ортогональных ко всем векторам подпространства Rr> указанного выше. Так как каждое преобразование Аа переводит подпространство R' в себя и в силу унитарности сохраняет свойство ортогонально- ортогональности векторов, то всякий вектор подпространства R" должен в ре- результате преобразования Аа перейти в вектор, 1акже принадлежа- принадлежащий этому подпространаву. Иначе говоря, если хг = .. , = дг^ = О,
65] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 235 то и х[ = .. t = x'k = 0. Отсюда непосредственно следует, что в мат- матрицах (82) и все элементы, стоящие в правом верхнем углу, имею- имеющем k строк и (п — k) столбцов, также должны быть все равны нулю, т. е. матрицы рассматриваемого линейного представления будут: .. о О а: и, следовательно, представление будет приведенное. Положим теперь, что все унитарные преобразования Аа оставляют вообще инвариант- инвариантным некоторое подпространство Ru измерения k(k<^n), где h — порядок матриц Аа. Преобразуем координатные оси так, чтобы под- подпространство Rt было образовано первыми k ортами, что равно- равносильно переходу к эквивалентному линейному представлению и мо- может быть осуществлено при помощи унитарного преобразования. После такого преобразования в силу предыдущего представление окажется приведенным. Мы имеем, таким образом, следующую теорему: Теорема Если линейное представление группы состоит из унитарных матриц, и эти матрицы оставляют неизменным не- некоторое подпространство, то такое представление есть приво- приводимое представление. Вопрос о приводимости или неприводимости представления тесно связан с вопросом о переходе от матриц Аа к подобным матрицам ХАаХ~1, Отметим некоторые частные случаи перехода к эквивалент- эквивалентным представлениям, которые получаются при специальном выборе матрицы X. Построим матрицу X, у которой в первой строке на втором месте стоит единица, а на других местах нули; во второй строке стоит на первом месте единица, а на остальных местах нули, и, начиная с третьей строки, стоят на главной диагонали единицы, а на остальных местах нули, т. е. О 1 0 0 ... О Х = 1 0 0 0 ... О 0 0 10 ..., 0 0 0 0 1 ... 0 0 0 0 0 1 Непосредственно разлаггя, начиная с последней строки, увидим, что D(X) = — 1. Применяя обычные правила умножения матриц, нетрудно проверить, что* если ? есть некоторая матрица, то подоб- подобная матрица ???'1 будет получаться из ? взаимной перестановкой первой и второй строки а также первого и второго столбца. Точ- Точно так же всякая перестановка строк, сопровождаемая такой же
236 гл. ш. основы теории групп [66 перестановкой столбцов, равносильна переходу к некоторой подоб- подобной матрице с помощью преобразования X, которое не зависит, очевидно, от матрицы К. Таким образом, если мы во всех матрицах Аа) дающих некоторое линейное представление группы, совершим одну и ту же перестановку строк и столбцов, то это будет равносильно переходу к эквивалентному представлению. Если можно распределить целые числа 1, 2, ..., ? на два класса так, что на пересечении любой строки каждой матрицы Ла с номе- номером из одного класса с любым столбцом с номером из другого класса стоит нуль, то такое представление будет приводимым. Дей- Действительно, чтобы совершить его приведение, т. е. сделать его при- приведенным, достаточно переставить строки и столбцы так, чтобы строки и столбцы одного класса стояли сплошь сверху и слева, а строки и столбцы другого класса — снизу и справа. В заключение настоящего номера отметим еще тот случай, когда линейное представление группы Q будет первого порядка, т. е. когда все матрицы Аа будут матрицами первого порядка, иначе го- говоря, обыкновенными числами. В этом случае каждому элементу Оа нашей группы соответствует преобразование х' = тах> или, проще говоря, число тф и произведению G2Gi соответствует обычное про- произведение чисел 66. Основные теоремы. Пусть имеется конечная группа G, со- содержащая т элементов Ql} ..., Gm, и пусть А19 ..., Ат — матрицы некоторого порядка п, которые дают линейное представление этой группы. Объекты этого представления обозначим через ? (х^ ..., хп). Рассмотрим выражение: ?(*?, ..·>**)= ? 1^*|3- - (83) В раскрытом виде это будет выражение: 9= ? ? H?*i + .» + 4X)№+. S=\ 1 = 1 где через ?$ мы обозначили элементы матрицы As. Нетрудно про- проверить, что выражение (84) будет формой Эрмита, т. е. в этом вы- выражении коэффициенты при Xpxq и xpxq суть комплексные сопря- сопряженные числа. Кроме того, из формулы (83) следует, что эта форма Эрмита представляет собою сумму квадратов длин некоторых век- векторов, т. е. это будег определенно положительная форма Эрмита [40]. Иначе говоря, совершая некоторое унитарное преобразование y=Ux,
66] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 237 приводящее нашу форму к сумме квадратов- ? 7=1 мы будем иметь все коэффициенты Ху положительными. Совершая еще преобразование Zj = У^Ур в новых переменных будем иметь для нашей формы Эрмита ? выражение в виде суммы чистых квадратов: Ф = ЗД + ... + гл2л. (86) Совершим над переменными (хь ..., хп) некоторое преобразо- вание xf = Akx, (86) принадлежащее к линейному представлению нашей группы. Нетрудно видеть, что при этом форма Эрмита ? не изменится. Действительно: т ;, ..., Хп)= ^\ Но, как мы знаем [56], совокупность преобразований (матриц) A\Ak, A%Ak) ..., AmAk совпадает с совокупностью матриц Аь Л2, ..., Ат; поэтому, если мы выразим преобразование (86) в новых перемен- переменных (гь ..., zn), которые связаны с прежними формулами вида: (гь ..., ??) = ?0 (хь ..., хп), где Во — некоторая матрица, то вместо группы Ak получим подоб- подобную группу В()АкВо1, и все преобразования этой подобной группы не будут менять выражения (85), т. е. не будут менять суммы квад- квадратов модулей, и, следовательно, будут все унитарными преобразо- преобразованиями. Мы показали, таким образом, для случая конечных групп, что всякое линейное представление эквивалентно некоторому уни- унитарному представлению, т. е. представлению, состоящему из унитар- унитарных преобразований. При некоторых дополнительных условиях это свойство сохраняется и при линейных представлениях бесконечных групп, зависящих от параметров, и в дальнейшем, когда будем гово- говорить о линейном представлении группы, мы будем подразумевать всегда унитарное представление. Мы имеем, таким образом, следую- следующую теорему: Теорема I. Всякое линейное представление группы (конеч- (конечной) имеет эквивалентное унитарное представление. Выведем теперь необходимое и достаточное условие приводимости линейного представления. Введем предварительно один новый термин, а именно назовем диагональную матрицу [k, ..., k\ содержащую
238 гл. т. основы теории групп [66 на диагонали одинаковые элементы, кратной единичной матрице. Такую матрицу можно обозначить в виде Ы. Как мы видели выше, в отношении алгебраических операций она эквивалентна числу k. Положим теперь, что у нас имеется приводимое линейное пред- представление некоторой группы. Такое представление осуществляется, например, матрицами вида: ? Вф ??]?-\ где ?— некоторая матрица и внутренняя матрица квазидиагональна. Составим матрицу y==x[k[j //, mI]xr\ где средний квазидиагональный член имеет ту же конструкцию, что и в матрицах Da. Нетрудно видеть, что матрица ? коммутирует со всеми матрицами Da. Действительно: DaY=X[Aak, BJ, Cam]X~i и точно так же YDa = X\kAa> ??? тСа]Х~К Но при умножении любой матрицы на число порядок множите- множителей не играет роли. Кроме того, если числа k, I и т различны, что мы и предполагаем, то матрица ? не кратна единичной матрице. Дей- Действительно, она имеет, очевидно, различные характеристические числа k, I и т. Таким образом мы приходим к следующей теореме: Теорема II. Если линейное представление приводимо, то существует матрица, отличная от кратной единичной матрицы и коммутирующая со всеми матрицами, входящими в упомяну- упомянутое приводимое линейное представление. Покажем теперь, что имеет место и обратная теорема, т. е. Теорема III. Если существует матрица Y, отличная от кратной единичной матрицы и коммутирующая со всеми мат- матрицами Da линейного представления, то такое линейное пред- представление будет приводимым. Итак, по условию теоремы мы имеем для любого значка а: DaY=YDa. (87) Пусть ?— такая матрица, с определителем, отличным от нуля, что все матрицы ZDaZ~l унитарны: ZDaZ~l = Ua. Перепишем пре- предыдущее равенство в виде: Умножая слева на ? и справа на ?~?, получим: т. е- матрица ZYZ коммутирует со всеми матрицами унитарного представления. Эта матрица, очевидно, не кратна единичной, ибо
66] § ?. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 239 если ZYZrl = kI9 то и Y=kL Нам достаточно доказать приводи- приводимость эквивалентного линейного представления Ua. Таким образом доказательство нашей теоремы свелось к тому случаю, когда линей- линейное представление унитарно. Мы будем для простоты письма считать, что само линейное представление, состоящее из матриц Da, унитарно. Пусть Хг — некоторое характеристическое число матрицы Y. Мат- Матрица ?1 = ?1/, как известно [25], коммутирует с любой матрицей и, следовательно, матрица ?—XJ так же, как и У, удовлетворяет условиям (87), т. е. коммутирует со всеми матрицами Da. Нетрудно видеть, что по крайней мере одно из характеристических чисел* мат- матрицы ??=?—??/ будет равно нулю. Действительно, характеристи- характеристическое уравнение для матрицы Yt будет: т. е. оно получается из характеристического уравнения для ? заме- заменой ? на (X-f-Xi), и так как среди характеристических чисел мат- матрицы ? было характеристическое число, равное Х1? то среди харак- характеристических чисел ?? будет хоть одно равное нулю. Следовательно, определитель матрицы Yb равный произведению ее характеристи- характеристических чисел, также будет равен нулю. Мы можем, таким образом, при доказательстве нашей теоремы предполагать все матрицы Da унитарными, и определитель матрицы У, входящей в формулы (87), равным нулю. Рассмотрим совокупность векторов, имеющих составляющие: =Уи Щ · · · +Уп (88) где us принимают любые значения и где yik — элементы матрицы К Поскольку определитель матрицы ? равен нулю, ранг таблицы \\yJk || будет меньше п. Пусть он равен некоторому числу г<^п. В этом случае, как мы знаем [16], формулы (88) определяют некоторое под- подпространство R' измерения г. Рассмотрим левую часть равенства: DaYu=YDati. (89) Вектор Yu имеет как раз составляющиеч(88) и, следовательно, DaYu есть результат применения преобразования Da к некоторому произвольному вектору из подпространства R'. В правой части фор- формулы (89) мы имеем результат применения преобразования ? к век- вектору Dau, т. е. составляющие правой части выражаются тоже по формулам (88), где только вместо иь ... у ип поставлены составляю- составляющие векторы Dauf т. е. правая часть формулы (89) представляет
240 гл ш. основы теории групп [67 собою вектор, принадлежащий подпространству R'. Таким образом мы видим, сравнивая левую часть с правой, что применение преоб- преобразования Da к любому вектору из подпространства R' дает вектор, также принадлежащий этому подпространству. Но, как мы знаем [65], если унитарные преобразования оставляют инвариантным некоторое подпространство, то они образуют приводимое представление, и таким образом теорема доказана. Теоремы II и III показывают, что необходимым и достаточным условием неприводимости линейного представления является тот факт, что не существует матрицы, отличной от матрицы вида Ш, которая коммутировала бы со всеми матрицами, входящими в линейное представление. Из теоремы I непосредственно следует, что в теореме из [6S] нет необходимости упоминать об унитарности представления, и можно вообще утверждать, что если все матрицы некоторого представле- представления оставляют неизменным некоторое подпространство, то такое представление приводимо. Очевидно и обратное утверждение. 67. Абелевы группы и представления первого порядка. Группа О называется абелевой, если все ее элементы попарно коммутируют, т. е. если при любых значках Qa2Qai = GaiQa2 [56]. Пусть ??? и Лп2 — матрицы, соответствующие Оп1 и Gu2 в некотором линейном представлении. Произведению Оп2Оа1 соответствует Ап2Аар а про- произведению QaiQa2 соответствует Ап1Ааг Но упомянутые произведе- произведения совпадают, и, следова!ельно, мы должны иметь: т. е. матрицы, образующие линейное представление абелевой группы, попарно коммутируют. Положим, что представление унитарно, т. е. что все матрицы уни- унитарны. При этом, как известно, существует такое унитарное преобра- преобразование ?/, что все матрицы UAJLt* имеют чисто диагональную форму [42], т. е. в данном случае некоторое эквивалентное линейное представление состоит из чисто диагональных матриц UAa(T* = [k{*\ ..., kf]. Мы видим, таким образом, что в данном случае линейное пред- представление распадается на ? представлений первого порядка Bf = kf (s==1J, ..., ?) Итак, всякое унитарное представление абелевой группы экви- эквивалентно некоторой совокупности представлений первого порядка, причем переход к эквивалентному представлению совершается также с помощью унитарного преобразования,
67] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 241 Рассмотрим теперь ряд примеров представлений абелевых групп, а также некоторые примеры линейных представлений первого по- порядка и не абелевых групп. Пример 1. В качестве первого примера рассмотрим цикличе- циклическую (абелеву) группу порядка т, состоящую из элементов $о = /, S, S\ ..., S-1 (Sm = I). (90) Если элементу 5 соответствует линейное преобразование х' = <*>дг, или, что то же, число ?, то элементам (90) будут соответствовать следующие числа: 1, ?, ?2, ... , ?"*-1. Поскольку Sm = /, мы должны иметь шш=1, т. е. 2km e m где k — некоторое целое число, которое мы можем, очевидно, при- принимать равным одному из чисел ряда 0, 1, 2, ... , т—1. Рассмотрим подробнее случай т = 2. При этом будет: /, 5 и 52 = /, т. е. 5 = 5^!. При k = 0 обоим элементам / и 5 соответствует одно и то же тождественное преобразование х'-=х или число 1; при k=l элементу / соответствует преобразование х' = х, а элементу 5 — преобразование х' = — лг, или, проще говоря, элементу / — число 1, а элементу 5—число (—1). В физических применениях представляется важным тот случай, когда группа состоит из тожде- тождественного преобразования трехмерного пространства и преобразова- преобразования симметрии относительно начала: Мы имеем, очевидно, т = 2. Указанные выше два представления можно назвать тождественным и знакопеременным представлением симметрии относительно начала. Пример 2. Рассмотрим группу вращения вокруг оси Z. Мат- Матрицы этой группы имеют вид: совт - .in Т| ? Sin ? COS ? || и, кроме того, как мы видели раньше, удовлетворяют очевидному соотношению 7 7 7 7 7 Такому же соотношению удовлетворяет также функция е1?. Но надо заметить, что если ? = 2?, то поворот равносилен тож- тождественному преобразованию, и, следовательно, мы должны иметь ?2?/=1, т. е число / должно быть вида l=ki, где k — любое целое число Мы имеем, таким образом, бесчисленное множество
242 гл. ??. основы теории групп [68 линейных представлений нашей группы вращения, причем матрице (91) соответствует число e?kt. Придавая целому числу k всевозможные значения * = 0, ±1, ±2, ... , мы и будем иметь бесчисленное множество линейных представле· ний группы вращения. Пример 3. Рассмотрим теперь группу, состоящую из п\ пере- перестановок над ? элементами. Мы можем каждой перестановке сопо- сопоставить число (+1). Так получится то, что называется симметриче- симметрическим представлением группы перестановок. Иначе, мы можем всякой перестановке первого класса, состоящей из четного числа транспо- транспозиций, сопоставить число (-f-l)> а всякой перестановке второго класса — число (—1). Таким образом получится то, что называется антисиммегрическим представлением группы перестановок. В этом представлении всякой перестановке из знакопеременной подгруппы соответствует число (—|— 1), а остальным перестановкам соответствует число (—1). Можно показать, на чем мы не останавливаемся, что указанными двумя случаями и исчерпываются все возможности ли- линейных представлений первого порядка для группы перестановок, Эта группа имеет и другие представления выше первого порядка. Пример 4. Рассмотрим теперь группу всех вещественных орто- ортогональных преобразований на плоскости, т. е. группу, образованную вращениями плоскости вокруг начала, соединенными с симметрией относительно оси Y. Как мы видели выше [52], матрицы этой группы „, (92) Sin ? COS ? (? где d—l для чистого вращения и d=—1 для вращения, соеди- соединенного с симметрией. Кроме очевидного линейного представления первого порядка, при котором каждой матрице (92) соответствует число (-f-1), мы можем построить еще линейное представление пер- первого порядка, при котором матрице (92) соответствует число (-f-1), если d=ly и число (—1), если d=— 1. Это даст нам действи- действительно линейное представление, так как произведение двух матриц вида (92) соответствует чистому вращению, если d имеет одинако- одинаковые знаки, и вращению с симметрией, если d имеет разные знаки в перемножаемых матрицах. 68. Линейные представления унитарной группы с двумя пере- переменными. Рассмотрим линейные представления унитарной группы с двумя переменными. Эта группа, как мы знаем, имеет вид: х\ = ахх -f- Ьхъ х% — — их ? -?- ay
68] * 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 243 где комплексные числа а и Ъ должны подчиняться условию аа + ЬЬ=1. (94) Построим (т-\-\) величин: *.=*Г; \=*?-1*г ...;*„=*»·. (95) Если мы возьмем % =х'*п-кх'!* и подставим вместо х' и х' их выражения (93), то, очевидно, каждое 5^ выразится линейно через %k и, следовательно, всякому преобразованию из группы (93) будет соответствовать линейное преобразование от переменных ? к пере- переменным ??. Очевидно, что произведению преобразований будет соответствовать произведение преобразований, и мы будем иметь, таким образом, линейное представление группы (93) порядка (т-\-\). Но, как оказывается, это представление не будет унитарным. Чтобы построить унитарное представление, достаточно в каждое из пере- переменных (95) ввести некоторый дополнительный постоянный множи- множитель, и именно вместо формул (95) мы определим переменные по следующим формулам: r\k= *™~ х^= (& = 0, 1, ... , т) (960 и точно так же: где, как всегда, считается 01== 1. Проверим, что при таком определении переменных наше пред- представление будет унитарным, т. е. что т т ?&\? = 2л ЧлЧл· ty7) Действительно, применяя формулу бинома Ньютона, имеем: т т —k 'tn — k (m-Wkl и точно так же Но, в силу унитарности преобразования (93), и, следовательно, имеет место и соотношение (97).
244 гл. ??. основы теории групп [68 Выведем теперь формулы, которые дают в явном виде коэффи- коэффициенты построенного унитарного представления группы (93). С эгой целью несколько изменим предыдущее обозначение, а именно поло- ?, х2 (/=-/, —/+1, ... fj—hj)- (98) В наших прежних обозначениях m = 2j\ и число j будет целым,, если т — четно, и будет равно половине целого нечетного числа, если т — нечетное число. Если, например, т = б, то формулы (98) дают нам следующие шесть переменных: Х\ ???? Х\Х\ В данном случае наши переменные пронумерованы не первыми шестью целыми числами, а дробными числами, которые отличаются ( 5\ /|5\ в друг от друга на единицу и идут от —^ до +«· . Если, на- пример, #г = 4, то мы имеем по формулам (93) пять переменных: Здесь нумерация переменных совершается целыми числами от (— 2) до (-{-2). При всяком фиксированном m = 2j мы будем иметь совершенно такую же нумерацию строк и столбцов в матрицах, которые будут давать линейное представление порядка Bу-|-1) группы (93). Перейдем теперь к определению элементов этих матриц. Мы имеем: ??+ /)!(/-/)! У C/ + OI (У-О! и нам надо представить правую часть в виде линейной комбинации величин ??. Применение формулы бинома Ньютона дает: Zj Z (/ + ?)! С/ — ^ — Если мы будем считать /?! = аэ, когда /? есть целое отрицатель- отрицательное число, то можем в предыдущей формуле производить сумми- суммирование по k и К от (— оо) до (-J- оо), ибо лишние слагаемые будут
68] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 245 содержать в знаменателе множитель, равный бесконечности, и обра- обратятся в нуль. Введем вместо К новую переменную суммирования $=j — k — k\ по которой тоже можно производить суммирование от (— со) до (+ со) по целым значениям или по половинам целых значений, смотря по тому — будет ли j целым числом или половиной целого числа. Мы получаем таким образом л_ ??+s-i К (У+01 (/- ч k\u—k—s)\(j\ik ? Но, согласно (98), мы имеем: и окончательно получаем искомую линейную зависимость в следую- следующем виде: ? — V Vг — n*+s~l VU+W Таким образом, при заданном фиксированном j элементы матрицы линейного преобразования порядка B/+1), соответствующего уни- унитарному преобразованию (93) с матрицей 1а ill — Ь af будут: о, ls lb\ (99). Здесь значки / и 5 пробегают следующий ряд значений: /, 5 = ~/, —7+1, ... ,7—1» ? причем напомним еще раз, что если j есть половина целого числа, то это дает нумерацию строк и столбцов матриц также по полови- половинам целых чисел. Принимая во внимание, что /?! = оо, если ? есть целое отрицательное число, мы получаем следующие пределы сумми- суммирования по k в формулах (99): O; k^l—s; k^J — s; k^j-\-l. A00)
246 гл. ти. основы теории групп [68 Отметим некоторое упрощение в формулах (99), которого можно достигнуть, переходя к подобному представлению. Пусть А — неко- некоторая матрица с'элементами ард и пусть 5 = [8Х, ... , Ьп] — диаго- диагональная матрица. Применяя обычное правило умножения, нетрудно проверить, что матрица S^S будет иметь следующие элементы: Если мы применим теперь это правило для матрицы и примем 8fe = (—l)ft, то в формулах (99) исчезнет множитель' (—1M-/, и в дальнейшем мы будем считать, что этот множитель от- отсутствует. Перейдем теперь к доказательству того, что линейное предста- представление унитарной группы (93), определяемое матрицей с элемен- элементами (99), будет неприводимым: Предварительно докажем две леммы. Лемма I. Если некоторая диагональная матрица, все диаго- диагональные элементы которой попарно различны, коммутирует с матрицей А, то А есть также диагональная матрица. По условию мы имеем: ?[? ··· > ?? = [??> ··· > ЪЛА> где числа 8^ попарно различны. Пусть ард — элементы матрицы А Применяя правило умножения, мы получим из предыдущего условия: apq^q = ^papq ИЛИ apq $q ~ ^р) = °> и, следовательно, ард = 0, если ? ? q, т. е. матрица А — дей- действительно диагональная матрица. Лемма II. Если некоторая диагональная матрица [blf ... , Ьп] коммутирует с матрицей А} в которой по крайней мере один столбец не содержит ни одного нуля, то ЪГ=...= Ъп. Переставляя строки и столбцы, т. е. переходя к подобным матри- матрицам, мы можем достигнуть того, чтобы столбец, не содержащий нулей, стоял на первом месте. При этом диагональная матрица остается по-прежнему диагональной, и наши матрицы по-прежнему будут ком- коммутировать. Таким образом, мы можем считать, обозначая через apq элементы матрицы А, что ?—?. ? ? — 19 #? /? 7е u \L — L> *> * · · > nh и, кроме того, по условию, как и выше: ai\ (^1 — ^i) ==: 0 (^ == Ь ^, ... , П), откуда имеем 81 = ,,,==8Л, и, следовательно, лемма доказана.
68] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 247 Переходим теперь к доказательству неприводимости линейного представления, определяемого матрицами (99). Пусть ? есть некото- некоторая матрица порядка B/-f- 1), которая коммутирует со всеми матрицами получающимися при различных а и Ь, удовлетворяющих усло- условию (94). Для доказательства неприводимости нам надо показать, что ? должна быть кратной единичной матрице. Рассмотрим сначала тот случай, когда ?? = 0 и а = ега. Эти комплексные числа удовле- удовлетворяют, очевидно, условию (94). Пользуясь формулами (99), мы получаем прежде всего, что при этом D Jet О О = 0 при лгы ('=-./.-У+?. а диагональные элементы будут в данном случае (eia 0 Dj\0 e и наша матрица будет иметь вид: ' 0 О Л« О о 0 0 о о о о о о A01) т. е. это диагональная матрица с различными элементами на главной диагонали, при подходящем выборе а. Пользуясь первой леммой, мы можем утверждать, что матрица У, которая должна ком- коммутировать и с матрицей A01), также должна быть диагональной матрицей, т. е. ?=[Ь19 ... , Ьп]. A02) Рассмотрим теперь тот случай, когда числа а и Ъ оба отличны ? а ь\ от нуля, и возьмем первый столбец матрицы Dj \ r -[· Его элементы определятся по формулам (99), если мы там положим s= — j. Неравенства A00) даюг при этом: k^O;k^l-\-j; &<2y; k^j + l (/=—/, —У+Ь .·· , J—h Л откуда видно, что в, данном случае вся сумма, входящая в фор- формулу (99), приведется к одному слагаемому, которое получится при k=j~\-l и будет отлично от нуля. Таким образом, в данном
248 гл. in. основы теории групп [68 ? а Ь\ случае действительно первый столбец матрицы Dj \ ¦= —\ не содер- жит нулей. Но раз диагональная матрица A02) должна коммутиро- коммутировать и с такой матрицей, то, согласно лемме II, все числа Ък одинаковы, т. е. ? кратна единичной матрице. Итак^ матрицы а Ь\ Di{ ? —) дают, действительно, неприводимое линейное пред- J[ — b a) ставление унитарной группы (93). Придавая ] ряд значений у=о, 1, ?, |, 2,... мы получаем бесчисленное множество этих линейных представлений. При у = 0 получается тривиальное тождественное представление, при котором всякому элементу группы (93) соответствует число единица. Рассмотрим теперь при /^>0, каким преобразованиям группы (93) соответствует тождественное преобразование в группе ? а Ь\ представлений D,{ ? -л которое определяется равенствами J { — Ь а) ?\? = ?\? или, что то же, равенствами Полагая / = /, получаем (ах + bx^)v = х^у откуда следует, что Ь = 0, и предыдущее тождество записывается в виде: ?^???-??{+??{-? = ?{+??{~? (/=-/, -/+1, ... , J- h j) откуда a/+lctf~l=l. Но |?| = 1 при b = Q, и последнее равен- равенство переписывается в виде: ?»'=? (/=-/, -у + 1,... ,;-?, У). Если у — половина нечетного числа, то мы можем положить /= — что дает а=1. Если j — целое число, то равенства а2/=1 сводятся к одному а2=1, откуда а = ±1. Таким образом, если у — половина нечетного числа, то тожде- ? ? Ь\ ственное преобразование в группе D} \ г ~~\ соответствует только тождественному преобразованию в группе (93), т. е. в этом а ь) } ? ) случае ?Ы - —} будет биоднозначным представлением группы { — Ь а) (93), Если же у— число целое, то тождественному преобразованию
69] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 249 ? а ь\ группе DA 7 —} соответствуют в группе (93) два преобра- ( — о а) в зования с матрицами Эти преобразования образуют циклическую группу второго порядка, аЪ\ и Df { 7 - 1 является биоднозначным представлением дополни- J (~b a) тельной группы [68]. Иначе можно сказать, что всякому преобразо- ( а Ь\ ванию в представлении D, \ ? - \ при целом у соответствуют ]\—Ъ aJ два преобразования из группы (93), у которых числа а и Ь отли- отличаются лишь знаком. 69. Линейные представления группы вращения. Предыдущие результаты представляются особенно важными потому, что унитарная группа (93) тесно связана с группой вращения трехмерного про- пространства, и полученный выше результат приводит нас к неприво- неприводимым линейным представлениям группы вращения. Всякому унитарному преобразованию (93) соответствует опреде- определенное вращение, причем одновременная перемена знака у а и Ъ дает унитарное преобразование, которому соответствует то же самое вращение. Параметры а и Ь связаны с углами Эйлера соот- соответствующего вращения формулами [63]: cos-yP; b = — ie 2 sin у ?. (ЮЗ) Рассмотрим сначала тот случай, когда ] есть целое число. В этом случае формулы (99) показывают, что одновременная перемена знаков у а и b не меняет слагаемых, стоящих в правой части, так как сумма показателей у a, a b и b будет в данном случае равна четному числу 2/. Таким образом, при этом тем двум унитарным преобразованиям, которые дают одно и то же вращение, соответст- соответствует одинаковая матрица в линейном представлении. Иначе говоря, при целом j каждому вращению с углами Эйлера {?, ?, ?} соответ- соответствует определенная матрица в линейном представлении Dr Вместо ? Ь\ а Ь\ ? - ( обозначим теперь эту матрицу через Dj{*, ?, 7}. * A04) Если / есть половина целого числа, то одновременная перемена знаков у а и b приводит к перемене знака и у всех выражений (99),
250 ГЛ. III. ОСНОВЫ ТЕОРИИ ГРУПП [69 т. е. в данном случае тем унитарным преобразованиям, которые приводят к одному и тому же движению, соответствуют различные матрицы, а именно матрицы, все элементы которых отличаются знаком. В данном случае каждому вращению будут соответствовать также две матрицы, отличающиеся знаком, т. е. в данном случае в A04) перед Dj мы должны поставить два знака. Таким образом, при целом / матрицы A04) дают линейное представление группы вращения. При /, равном половине целого числа, мы не получаем, точно говоря, линейного представления. В данном случае говорят о двузначном линейном представлении. Чтобы найти выражение элементов матриц A04), достаточно в выражениях (99) заменить а и Ъ по формулам A03). Мы полу- получаем, отбрасывая предварительно множитель (— Xf~l\ A -ip. A05) Если воспользоваться переходом к эквивалентному представлению при помощи матрицы Х= 0 0 ... 0 1 0 0 ... 1 0 0 1 ... 0 0 1 0 ... 0 0 то дело сведется к перестановке сгрок и столбцов в обратном по- порядке, т. е. в данном случае к замене / и 5 на (— /) и (— s). Таким образом, вместо формул A05) мы можем написать другие формулы: J^K Ч k — / — A)! (ft — s X COS sin 2k-s+l^ причем, пользуясь теми же соображениями, что и в [68], мы можем отбросить множитель ll~s, •тметим простейшие частные случаи. При / = 0 мы имеем ли- линейное представление первого порядка ? Это есть тривиальное тождественное представление. При j=^-^- мы имеем 2у -J- 1 = 2, и величины ? ? и ? ? будут просто равны
69] 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 261 лг3 и х19 т. е. в данном случае унитарная группа (93) и является своим собственным линейным представлением (с точностью до пере- перестановки строк и столбцов). Для группы движения мы получим двузначное представление второго порядка, определяемое матрицами -4-*(т+«) ? D е 2 cos у ? ie ie 2 sin -к- ? "' sin ?? cosi-P При /=1 мы будем иметь линейное представление третьего по- порядка: ?±2!? _е-««ЁЕ| gift—i I — cos? 2 cos V2 Линейные представления ?)} {?, ?, ?} при целом j дают биодно- значное представление группы вращения. Это следует непосред- непосредственно из того, что каждому Dj {?, ?, ?} соответствуют две ма- матрицы из группы (93), отличающиеся лишь знаками у а и Ьу а таким матрицам, как мы упоминали выше, соответствует одно и то же вращение. Если j — половина нечетного числа, то каждому враще- вращению соответствуют две матрицы из представления Dj {?, ?, ?}, отли- отличающиеся лишь знаком. В частности тождественному преобразованию из группы вращения соответствуют из Dj {?, ?, ?} матрицы ± ?", где ? — единичная матрица порядка Bу —|— 1). Если ограничиться преобразованиями из Dj {?, ?, ?}, достаточно близкими к тож- тождественному преобразованию, то Dj {?, ?, ?} будут однозначным представлением группы вращения. При этом в общих формулах A06) можно ограничиться значениями ?, ? и ?, достаточно близкими к нулю. Но если мы прибавим 2? ? ? или ?, то ввиду того, что s и / суть половины нечетных чисел, все элементы матрицы Dj {?, ?, ?} изменят знак, и мы получим второе представление того же самого по существу вращения. Покажем дальше, что указанные представ- представления суть все изоморфные неприводимые представления группы вращения. Так как представления Dj {?, ?, ?} суть все неприводимые пред- представления группы вращения, то матрица D[ {?, ?, ?} должна быть подобна матрице D {?, ?, ?}, соответствующей вращению пространства с углами
252 гл. in. основы теории групп [70 Эйлера {?, ?, ?}. ? [63] мы видели, что D = ZaXJZv и, производя геремножение матриц, стоящих слева, получим: cos ? cos ? — sin ? cos ? sin ? —cos ? sin ? — sin ? cos ? cos ? sin ? sin ? ?)= sin ? cos ? + cos ? cos ? sin ? —sin ? sin ? + sin ? cos ? cos ? —cos ? cos ? sin ? sin ? sin ? cos ? cos ? и нетрудно проверить формулу: AD\ {?, ?, ?} ?'1 = D ??, ?, ?}, где А = 1 0 1 I 0 —/ О 70. Теорема о простоте группы вращения. Докажем сейчас, что группа вращения есть простая группа, т. е. что она не имеет нормальных делителей [58]. Если бы такой делитель имелся, то в силу сказанного в [63] ему соответствовал бы нормальный дели- делитель группы О преобразований E7) с определителем единица, от- отличный от нормального делителя Я, состоящего из Ей (— Е). Таким образом, остается показать, что группа О не имеет нормальных де- делителей, отличных от //, т. е. надо показать, что если элементарный делитель Н\ группы О содержит матрицу А, отличную от ? и (-—?), то ?? совпадает с G. Отмегим прежде всего, что если Нх содержит некоторую матрицу В, то в силу определения нормального дели- делителя, Нг содержит все матрицы и~1Ви, где U— любая матрица группы О. Выбирая соответавующим образом матрицу ?/, мы можем получить таким путем любую матрицу группы Q, имеющую те же характеристические числа, что и матрица В. Следовательно, чтобы установить, что Нг совпадает с О, достаточно показать, что Ht содер- содержит матрицы с любыми допустимыми характеристическими числами. Эти числа должны иметь вид е1C> и ё~т, где ? — вещественное число, ибо матрица унитарна, и ее определитель равен единице. В силу сказанного выше мы можем вместо матрицы А взять матрицу U~lAU и, таким образом, можем считать, что А есть диаго- диагональная матрица. Итак, дано, что Ht содержит матрицу А = [е1?, ?~1Ср], где ? — веще- вещественно, и ????±1. При этом A~i = [e~i?, е1Ц. Возьмем произволь- произвольную матрицу группы О: и=\\ ху II -у ? При этом
71] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 253 Поскольку подгруппа Нх содержит А и является нормальным дели- делителем, она должна 'содержать и матрицу: Производя перемножение матриц и учитывая равенство хХ-\-у$ = 1, получим следующее выражение следа 5 матрицы У: n29 = 2 — 4р2 sin3?, где p = |j/| может принимать любое значение из промежутка: О ==^р ^ 1, и sin ? ? 0. Характеристические числа (<?/?, e~ia) матрицы У суть корни уравнения: ?2_5?+1=0, т. е. ?2-}-Dр2 sin2cp — 2)?+1=0. При изменении ? от ? = 0 до ? = 1 значения ? будут изменяться от а = 0 до ? = 2?. Введем следующее обозначение: Из сказанного выше следует, что Нх содержит все матрицы На при 0 ^ ? ^ 2?. Теперь уже нетрудно показать, что ? содержит любую ма1рицу ?/(?^>0). Действительно, выберем целое положительное о число ? так, чтобы выполнялось неравенство 0<[—<^2?. При этом Hi содержит ?/?, а потому содержит и Таким образом, ?? содержит матрицы с любыми характеристическими числами и тем самым, в силу сказанного выше, совпадает с G. Таким образом доказано, что группа вращения есть простая группа. Из этого непосредственно следует, что группа вращения не может иметь гомоморфных (не изоморфных) представлений. Действительно, если бы имелось такое представление, то тождественному преобра- преобразованию в группе представлений должны были бы соответствовать в группе вращений преобразования, образующие нормальный дели- делитель, которого, как показано выше, не существует. 71. Уравнение Лапласа и линейные представления группы вращения. Выясним сейчас связь между линейными представле- представлениями групп и дифференциальными уравнениями. Эта связь лежит в основе применения линейных представлений к вопросам современ- современной физики. Мы начнем с наиболее просгого случая уравнения Лапласа [II, 202], который не дасг нам ничего нового и послужит лишь к выяснению общего вопроса. Предварительно установим некоторые общие факты, которые играют большую роль в вопросах
254 гл. ш основы теории групп [71 линейных представлений групп и которые в частных случаях уже известны нам из предыдущих примеров. Пусть группа G, линейное представление которой строится, есть группа линейных преобразований порядка п: Xk = g{klxi + ·.. + g{knXn (* = 1, 2, ..., л), A07) где значок а, характеризующий элемент группы G, пробегает ко- конечную или бесконечную совокупность значений. Положим далее, что существует т функций <Р,С*и ···> хп) (*=1э 2, ···> /я). A08) таких, что при замене независимых переменных по формулам A07) эти функции испытывают также некоторое линейное преобразование (*l> · · ·> Хп) 0 09) E=1, 2, ..., «). Мы имеем здесь матрицу Ла с элементами а$, соответствующую преобразованию A07) группы О. Рассмотрим два преобразования группы Соответствующее преобразование функций A08) будет: <?s (x'tr, ..., дгя ) = 4??2) ?? W,... > *«) +... + a(!$ ym(x'v..., x'n). A109) Подставляя в A102) вместо ys(xv ..., ^) их выражения (ПОД будем иметь непосредственную зависимость у8(х[', ·.., ? ?) через 9s (??> ···> ^я)> дающую матрицу Ааг Мы получим таким образом т Ь*= ? ^2) е. ?., = и формулы A09) определяют, очевидно, некоторое линейное пред- представление порядка т для группы G. В предыдущих рассуждениях мы считали, что функции ?5 линейно-независимы. При этом линейные преобразования A09) определяются вполне однозначно и D(Aa)^?0, ибо в противном случае ys(x[, ¦·., хп) были бы связаны линейной зависимостью. В частном случае, при построении линейных представлений уни- унитарной группы, роль функций <?s играли функции (960.
71] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 255 Положим, что Q есть группа вращения трехмерного простран- пространства, так что #==3, и положим, что функции ?$ ортогональны и нормированы в некотором шаре К с центром в начале, т. е. \ И Ь(?» х* ¦*»)?*(¦*!> ·** хз)dxtdxiахъ = bpq. A11) /с Покажем, что при этом линейное представление A09) группы вращения будет унитарным. Действительно, в результате вращения Оа сфера К перейдет в себя, и определитель Оа, как известно, равен единице. Условие A11) дает нам: к или в силу A09): И И ? <$ Ь C*i» х*> хъ) · ? afj Ь К *1 /1 Переходя к переменным (xv лг2, лг3), мы должны будем, согласно правилу замены переменных в тройном интеграле, заменить просто dx[ dx'% ахъ на dxx dx% dx% и затем интегрировать по тому же самому шару К- В силу условий A11) мы получим: fja#^ = 8M (?, q=h 2, ..·, т\ где, как всегда, bpq = 0 природ н 8да=1, т.е. каждая из матриц А обладает в данном случае свойством ортогональности по строкам, так что транспонированная матрица будет обладать орто- ортогональностью по столбцам, а следовательно [28], и по строкам, т. е. основная матрица будет обладать ортогональностью и по стро- строкам и по столбцам, или, иначе говоря, матрица Аа будет действи- действительно унитарной матрицей для любого значка а. Рассмотрим теперь уравнение Лапласа с двумя переменными или, пользуясь векторными обозначениями, divgradi/=O. A13) Возьмем однородный полином от ? и у степени /: Ъ (*> У) = aoxl + a^-iy +... + akxl~kyk + ... + atf. A14) Покажем, что существуют два линейно-незавиощщ полищща вида A14), которые являются решением уравнения A12), и всякое решение уравнения A12), представляющееся однородным полиномом
256 гл. ш. основы теории групп [/? степени /, должно быть линейной комбинацией этих двух полиномов с постоянными коэффициентами. Действительно, коэффициенты поли- полинома A14) выражаются по формулам ? — 1 д1Ъ (?> У) k~(l — k)lk\ dxl~kdyk ' Но раз этот полином должен удовлетворять уравнению A12), то мы можем двукратное дифференцирование по у заменить двукратным дифференцированием по ? при одновременном изменении знака, так как уравнение A12) можно переписать в виде: d4J__d4J ду2 ~ дха · Таким образом, мы получим для коэффициентов ak выражения следующего вида: dl dl ИЛИ fl* — — (l-k)\k\ т. е. все коэффициенты полинома A14) выразятся через коэффи- коэффициенты а0 и av Это рассуждение показывает нам, что существует не больше двух линейно-независимых однородных полиномов, удовлет- удовлетворяющих уравнению A12). Покажем теперь, что такие два различных полинома действительно существуют. Рассмотрим для этого однород- однородный полином ^ {X у) Раскрывая скобки и отделяя вещественную и мнимую части, получим: ?/ (х, У) = Ь ( где полиномы ?; (?, у) и ф; (х, у) — вещественные однородные поли- полиномы степени /, линейно-независимые друг от друга. Дифференцируя ?/(·*> у)> получим: дх2 т. е. ®i(x> у) удовлетворяет уравнению A12). То же самое, следова- следовательно, можно сказать и о вещественной и мнимой части этого выра- выражения, т. е. полиномы ?? (?, у) и ?; (?, у) и дают нам два искомых решения уравнения A12). Введем полярные координаты ? = Г COS ?; у = Г Sin ?, При этом полиномы cpj и ?^ примут очень простой вид: Ь (*> У) = г1 cos ??, ?, (?, у) = rl sin /?.
71] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 257 Повернем плоскость XY вокруг начала на некоторый угол ?: ?' — ? cos ? —у sin ft, у = х sin ?-j-j/ cos ? A15) Нетрудно видеть, что при этом уравнение A12) останется инва- инвариантным, т. е., точнее говоря, в новых переменных уравнение будет выглядеть совершенно так же: Это можно непосредственно проверить, пользуясь формулами A-15) и правилом дифференцирования сложных функций. Кроме того, ука- указанное обстоятельство непосредственно вытекает из того, что левая часть уравнения A13) имеет определенное значение, не зависящее от выбора осей и, следовательно, имеет одну и ту же форму при любом выборе прямолинейных прямоугольных осей. Полиномы ?? (?\ уГ) и ?? (У, У) должны удовлетворять уравнению A16), а следовательно, и уравнению A12), а потому они должны линейно выражаться через ? ? (х> У) и ?/ (х> У)- Это и дает нам линейное представление группы вращения плоскости. Вместо указанных двух полиномов возьмем два других полинома, которые являются их линейными комбинациями: ?? (?, у) = <?? (х> у) — /?? (?, у); ?? (?, у) = ь (х, у) + % (?, у) или ?? (х> у) = {х — lyI = rle~il<p; ?/ (jc, y) = (x -\- iyI = rleil(p. Эти полиномы испытывают следующее преобразование: ?/ v*^ * У ) — ' — ?/ v*^» УЪ ji {? > У) ·~~~* ? б ^^^ ^ tp/ \·^> «У/> т. е. преобразованию A15) соответствует в линейном представлении матрица е-иь q О еи где угол Ь может иметь любое значение. Из вида матриц непосред- непосредственно вытекает, что это линейное представление имеет приведенную форму, Оно дает два линейных представления первого порядка, опре- определяемых числами е~т и ет. Во всех предыдущих рассуждениях целое число / могло иметь любое значение. Мы получили таким обра- образом те же самые линейные представления группы вращения плоско- плоскости, которые мы имели и раньше в [69]. Перейдем теперь к уравнению Лапласа с тремя переменными
258 гл. hi. основы теории групп [71 или divgrad?/=O. A18) Рассмотрим и здесь однородные полиномы степени / с тремя пе- переменными Ъ С*. У, ?) = ?,?1 + Хх (х, yyz1-* -f Х2 (х, >») *-* +... + *..V)> О19) где ?^ (дг, j>) — однородный полином степени k своих аргументов. Каж- Каждый такой полином Х^(х, jf) содержит (k-\-l) произвольных коэф- коэффициентов, так что в общем однородный полином ?? {?, у, ?) степени / с тремя переменными будет содержать следующее число произволь- произвольных коэффициентов: Подставляя выражение A19) в уравнение A17), получим слева однородный полином степени (/ — 2), и, приравнивая его коэффициенты нулю, получим -—? однородных уравнений с ' ^ ' не- ' неизвестными коэффициентами полинома срг (х, yt z). Мы имеем: 2 2 и, следовательно, по крайней мере B/-|-1) коэффициентов в поли- полиноме ?? (jc, 3;, ^) останутся произвольными, т. е. будет существовать по крайней мере B/-)- 1) линейно-независимых однородных полино- полиномов степени /, удовлетворяющих уравнению A17). Пользуясь тем же методом, чю и для двух переменных можно показа ? ь, что их будет и не больше, чем B/-|- 1), т. е. их будет в точности B/-[- 1). Обо- Обозначим эти полиномы через Ф?}С*> J>> ?) E=1, 2, ..., 2/+1). Если (х\ У, 2>)=U-(x,y, z) есть некоторое вращение трехмерного проаранства вокруг начала, то при этом уравнение A17) остается инвариантным, и полиномы tfs\x> У> z) даю* некоторое линейное представление группы враще- вращения трехмерного пространства, порядка B/-|- 1). В дальнейшем мы подробно изложим теорию этих гармонических полиномов и выведем для них явные выражения. Мы увидим, что их всегда можно выбрать так, что они будут ортогональными и норми- нормированными в любой сфере с центром в начале. При этом доставляе- доставляемое ими линейное представление группы вращения будет унитарным. Можно показать, что это и будет как раз линейное представление, эквивалентное представлению Dt {?, ?, ?}, которое мы построили в [69] Позже мы вернемся к этому вопросу.
721 § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 259 72. Прямое произведение матриц. Пусть имеются две матрицы А = ап ап а Ап и В = hm A20) первая — порядка п и вторая — порядка т. Составим новую мат- матрицу С с элементами Qy-; kv которые получаются от перемножения каждого элемента матрицы А на каждый элемент матрицы В: В данном случае роль первого значка играет совокупность двух аелых чисел A, у), а роль второго значка — совокупность целых чисел (*, /), причем j и А= ?, 2, ..., /? / и /=1, 2, ..., т. Иными словами, мы имеем здесь особый способ наименования строк и столбцов, а именно: строки и столбцы именуются совокупностью двух целых чисел, причем первое число принимает значение от 1 до п, а второе — от 1 до т. Мы можем, конечно, перенумеровать строки и столбцы обычным образом, т. е. простыми целыми числами, которые иду! or 1 до пту причем каждой паре чисел (U /) или (k, I) соог- ве!сгвует определенное целое число при новой нумерации, и если эти пары одинаковы, то и соо1вегствующие целые числа одинаковы. Эту нумерацию простыми целыми 'числами можно делать различным способом. При переходе от одного способа к другому дело сведется к некоторой перестановке одновременно строк и столбцов, т. е. к пе- переходу к подобной матрице, что в дальнейшем не будет иметь ни- никакого значения. Матрица С называется прямым произведением матриц А и В, и )бозначается это обычно следующим образом: С=АХВ. A22) Порядок множителей в этом последнем произведении нового типа не играет никакой роли. Положим, например, что обе матрицы A20) будут матрицами второго порядка. В этом случае их прямое произведение будет мат- матрицей четвертого порядка, которую мы можем написать, например, в следующем виде: /о anbu anbn n ашЬп СП\ 11 ^11; 12 СП\ 21 ^11; 22 с\% 11 ci% 12 ^12; 21 ^12; 22 ; 12 ^21; 21 1; 11 1; 22 !2; И ^22; 12 с№; 21 С22; 22 или, иначе, одновременно переставляя строки и столбцы.
260 гл. ш. основы теории групп [72 Положим, что А и В суть диагональные матрицы ? = [??, ..·> Tut B = [bi9 ..., Ът]. В эгом случае aik = 0 и bjl = O при / ^ k и / ^/, и, следова- следовательно, согласно A21), ^;W отлично от нуля только, если пара чисел (i, j) совпадает с парой чис,ел (k, /), т. е. если матрица С также будет диагональной. На ее главной диагонали будут стоять всевоз- всевозможные произведения чисел ?? на числа ??. Если все ?? и все bt равны единице, то С будет также единичной матрицей. Мы имеем, таким образом, следующую теорему: Теорема I. Прямое произведение двух диагональных мащриц есть диагональная матрица, и прямое произведение двух единич- единичных матриц есть единичная матрица. Докажем также следующую георему: Теорема II. Если А^ и А^ — две матрицы одного и того же порядка п, а БA) и В^ — две матрицы также одного и того же порядка т, то имеет место формула: ? БA)) = АB>ЛA) X В№В№. A23) Заметим, что когда мы пишем две матрицы одного и того же порядка рядом, без всякого знака, то это, как всегда, обозначает обыч- обычное произведение этих двух матриц. Обозначая элементы матриц со- соответствующими малыми буквами с двумя значками внизу, мы имеем, согласно определению прямого произведения: и, пользуясь правилом обычного умножения матриц, получим для эле- элементов левой части равенства A23) следующие формулы: Покажем, что те же формулы получаются и для элементов правой части. Мы имеем по определению обычього умножения: 2 й, по определению прямого произведения: что и совпадает с A24). Перейдем теперь к доказательству последней теоремы о прямом произведении.
73] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 261 Теорема III. Если матрицы А и В унитарны, то и их прямое произведение С=А\В также есть унитарная матрица. По условию теоремы мы имеем: ?«?=^ ^Л=5рг A25> 5=1 S=l Проверим для матрицы С условия ортогональности и нормально- нормальности по столбцам и обозначим: i«ly=l т. е. в силу A21): ? т ? т = ? ? Utp&pfijqfim— ? ?*?&?2 ? Если пары чисел (?? qx) и (р2, ^2) различны, то хоть один из множителей, стоящих в правой части A26), будет'равен нулю, а если эти пары совпадают, оба множителя равны единице в силу A25). Таким образом, ???^?;?2^2 равно нулю, если упомянутые пары не сов- совпадают, и равно единице, если эти пары совпадают, что и доказывает нашу теорему. Мы можем, очевидно, прямое произведение двух матриц умножить еще, в смысле прямого произведения, на третью матрицу и получить прямое произведение трех матриц Л{1) ? л(*) ? Л<3>. Удерживая прежнее обозначение, мы будем иметь для элементов Этой новой матрицы следующие выражения: г —ашаB) пш СШ; Vk'V UW ukk'ull'· Аналогичным образом составляется прямое произведение любого конечного числа матриц, причем это прямое произведение представляет собою матрицу, порядок которой равен произведению порядков пере- перемножаемых матриц. Последовательность множителей не играет роли. 73. Композиция двух линейных представлений группы. Пусть имеется некоторая группа G с элементами Ga и положим, что пост- построены два линейных представления этой группы: 4) ^ (i=*l, 2, _, ?) A27) (A=l, 2, ,,., т) A28)
262 гл. ш. основы теории групп [73 где значок ? пробегает конечную или бесконечную совокупность значений. Обозначим через Л(а) и Б(а) матрицы преобразований A27) и A28) и составим их прямое произведение С(а) = А{а) ? ?(а)# A29) Покажем, что матрицы С(ос) также дают некоторое линейное пред- представление нашей группы Q. Действительно, всякому элементу Qa группы G соответствует матрица С*а); произведению Ga2Qal = Qas будет соответствовать матрица ?>^№*\ которая определяется в силу A23) формулой: Но раз матрицы Л^ и ??(?) дают линейное представление группы, то и, следовательно: C(a2)C(al) = A(a3) X ^(«3), т. е. согласно A29): Оа2)СМ = С(аз1 Таким образом, произведению элементов Ga соответствует как раз произведение соответствующих матриц С^а\ ? эти матрицы дают новое линейное представление группы Q. Заметим при этом, что единичному элементу из G соответствует при этом прямое произве- произведение единичных матриц Л(а) и В^\ т. е. единичная матрица С(а). Составим пт произведений xtyk и подвергнем каждый из сомно- сомножителей преобразованиям A27) и A28). Мы будем иметь: x\yk = (ag>*, -f... + atJxn) ¦ {Ь$У1 +... + btiym\ или, раскрывая скобки: ? т / ? ?® где ^;р«=^Ж т. е. ^слм ?? и yk суть объекты ? линейных представлениях, опре- определяемых матрицами Л(а) и В[а\ то xtyk будут объектами ? ли- линейном представлении той же группы, определяемом матрицами С(а). Если матрицы Л(а) и ??(?) давали неприводимые линейные пред- представления, то матрица С^ не обязательно будет давать неприводимое Линейное представление. В дальнейшем мы подробно рассмотрим тот случай, когда группа Q есть группа вращения трехмерного прост- пространства, а матрицы Л(а) и ??(?) суть различные неприводимые линей- линейные представления этой группы, построенные нами в [69]. Покажем что в этом случае произведение
73] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 263 будет приводимым, и определим, из каких неприводимых представле- ний оно будет состоять. В качестве примера рассмотрим уравнение Шредингера для случая двух электронов, находящихся в поле положительного ядра. Это уравнение имеет вид: 2 = ?"?, A30) где = \- ^»t _+1 ^ (i3i) 2 причем постоянные имеют обычные значения. Второе слагаемое в выраже- выражении V происходит от взаимодействия электронов. Если мы пренебрежем в первом приближении этим взаимодействием, то уравнение будет: (Н1 + Н2)<\> = Е<\>, A32) где Положим, что отдельные уравнения: Я^^Еф; //2? = ?? A33) имеют собственные значения fc\ и Е2 и соответствующие собственные функции я^^^ж, /у>,=ад,. A34) Если мы подставим в уравнение A32): ? = ?? (??» Ун 2?) ' <Ь (-^21 ^2» ^)» то получим, очевидно, в силу A34): № + Я2) ? = ?2//1?1 + ??//8?? = №? + ^.) ???2 = №? + ?.) ?, т. е. уравнение A32) будет иметь собственную функцию ???2, которой будет соответствовать значение (Е1-{-Е2). Левая часть уравнений A33) содержит оператор Лапласа и расстояние точки до начала координат, и, следовательно, эти левые части не меняются, если мы совершим вращение пространства вокруг начала. Может случиться, что характеристическому числу Е = ЕХ в первом из уравнений A33) соответствует несколько собственных функций ??. Все эти функции, являясь решением уравнения, дадут некоторое линейное представление группы вращения, совершенно так же, как в [69J однородные гармонические полиномы давали нам также представление группы вращения. Пусть это будет некоторое представление D^ {?, ?, ?}. Совершенно так же решения второго из уравнений A33) при заданном собственном значении Е = Е2 дадут нам некоторое представление Dj2 {?, ?, t} группы вращения. Произведение ???2» согласно предыдущему, даст нам линейное представление- группы вращения, совпадающее с прямым произведением DjL X Dp, и для физической характеристики соответствующего собственного значения (Е1-{- -\-Е2) уравнения A32) представляется существенным выделить из этого представления те неприводимые представления, на которые оно распадается. Это обстоятельство играет существенную роль в теории возмущений.
264 гл. in. основы теории групп [74 74. Прямое произведение групп и его линейные представле- представления. Понятие о прямом произведении матриц играет роль и в другом вопросе, к которому мы сейчас и переходим. Пусть имеются две группы О и Я, элементы которых обозначим через Оа и //., причем значки ??? пробегают, независимо один от другого, вообще говоря, различные совокупности значений. Определим новую группу F, эле· менты которой определяются как пары элементов из О и Н: причем первый элемент пары есть элемент Q, а второй — элемент Н. Назовем единичным элементом этой группы элемент Fa~ в том случае, когда Оа и ? суть единичные элементы из Q и //, и аналогичным образом определим обратные элементы из группы F. Закон умноже- умножения для группы F определим естественно формулой: Нетрудно проверить, что совокупность элементов /? действи- действительно образует группу. Эту группу F назовем прямым произведе- произведением групп О и Н. Пусть имеется некоторое линейное представление группы Q, осуществляемое матрицами Л(а), и некоторое линейное представление группы //, осуществляемое матрицами В^. Пользуясь формулой A23), как и в предыдущем номере, можно показать, что прямые произведения Q^t ^ _ ^ дают линейное представление группы F. Кроме того, если пред- представления А^ и В^) унитарны, то и представление С^а> ^ группы F будет унитарным [72]. Покажем теперь, что если представления Л(а) и В^ неприво- димы, то w представление С(а» ?) группы F будет неприводимым. Пусть ? — порядок матриц А^ и т — порядок матриц В^\ Матрицы С(а'?) будут иметь порядок пт. Пусть существует некоторая матрица X порядка пт, которая коммутирует со всеми матрицами С(сс· $1 Обозна- Обозначим элементы матриц соответствующими малыми буквами. Мы имеем, следовательно, для любых значков /, у, ? и q, а также для любых ? и ?: ? ?^^^?'^??^^??- ?35) ?=\ k=\ ?=\ k=\ ГДе ?(«)???) >, ?) „ " (?)?.(?) J«> ?) O-kpOlq = СЫ. pq И aik ?? = CtJ; kl- Если мы положим, что G(a) есть единичный элемент группы О, то Л(а) будет единичной матрицей, т.е. а?) = 0 при кфрк а(*)=1, и формула A35) даст: ???·??^ = ????)???·?9' О-36)
74] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 265 и точно так же, полагая, что В^ есть единичный элемент группы В, получим: т Если мы возьмем пт элементов Хщы и закрепим значки ink, то получится т* элементов которые дадут некоторую матрицу порядка т. Обозначим эту матрицу через X^'k\ Точно так же, закрепляя в Хц;ы значки ] и /, получим матрицу Лу»^ порядка п. В силу A36) все матрицы X^>k) коммути- коммутируют со всеми матрицами В^\ образующими неприводимое пред- представление группы Ву и, следовательно, все матрицы X^k) кратны единичной матрице, т. е. элементы х-^ы при фиксированных ink имеют одинаковое значение, если у' = /, и, кроме того, ху.ы = 0, если j ? L Мы можем записать это следующим образом Точно так же из рассмотрения матриц Xty*l) будет следовать: Xtj\ ы = X\j\ \fiik> A382) где, как всегда, Ърд = 0 при pz?q и Ьрр=1. Из сравнения A38Х) и A382) вытекает, что Хц;ы отлично от нуля только в том случае, если i = k и / = /, причем в этом последнем случае все числа Ху;у одинаковы между собой, т. е. матрица X, коммутирующая со всеми матрицами С^\ будет обязательно крат- кратной единичной матрице. Отсюда и вытекает непосредственно, чго линейное представление группы F, определяемое црямым произведе- произведением Л(а) X В^\ будет неприводимым. Можно показать, что таким образом получаются все неприводимые представления группы F. Положим, что Q и ? суть группы линейных преобразований с одним и тем же числом переменных, и предположим, что любые две матрицы Qa и //. попарно коммутируют, т. е. GaH^Hfia. A39) В предыдущих рассуждениях мы считали, что элемент группы F определяется парой элементов (Ga, HX и построили определенный закон перемножения внутри группы F, который описан нами выше. В данном случае мы можем считать элементом группы F просто произведение матриц A39), которое не зависит от порядка. Эта
266 гл. ш. основы теории групп [74 новая группа F изоморфна прежней F. Если Оао и Н$о — единич- единичные матрицы, то и произведение Gao#po = //poGao будет единичной матрицей. Матрица О^1Щ1^=Щ1Оа1 будет, очевидно, обратной произведению C?//?, и мы имеем в силу A39) следующий закон умножения: Оа2 Щ2 · Qat //? ? = ( Ga2 Oa t) (//?2 Щ ?), т. е. все упомянутые выше при образовании группы F свойства в дан- данном случае выполнены, так что произведения A39) можно считать переменным элементом группы F. В качестве частного случая возьмем тот случай, когда Q есть группа вращения трехмерного пространства и ?—группа второго порядка, состоящая из тождественного пре- преобразования / и симметрии 5 относительно начала [57]. В данном случае условия A39) выполняются. Если Оа есть любое вращение пространства, то очевидно GaS=SGa. Группа F в данном случае бу- будет группой всех вещественных ортогональных преобразований трех- трехмерного пространства. Для группы ? мы имели |67] два линейных представления первого порядка: одно тождественное, состоящее из чисел (-)- 1), и другое антисимметрическое, при котором матрице / соответствует (-}- 1) и матрице 5 соответствует (— 1). Если мы возьмем теперь некоторое линейное представление ?} {?, ?, ?} группы вращения, то можем брать прямое произведение матриц этого представления с обоими представлениями группы симметрии относи- относительно начала. В одном случае мы получим линейное представление полной группы ортогональных преобразований, при котором всякому вращению с углами Эйлера {?, ?, ?}, взятому в чистом виде или соединенному с симметрией относительно начала, соответствует одна и та же матрица Dy {?, ?, ?}. Обозначим это представление группы ортогональных преобразований через D] {?, ?, ?}. В другом слу- случае чистому вращению будет соответствовать матрица ?3 {?, ?, ?}, а вращению, соединенному с симметрией, матрица — Dj {?, ?, ?}. Такое представление группы ортогональных преобразований обозна- обозначим через D] {?, ?, ?}. Разберем еще один пример прямого произведения двух групп. Пусть у нас имеются две точки: (?? уь ??) и (х2> Уъ 22). Положим, что группа Q есть группа вращения трехмерного пространства. Наши переменные испьпывают при этом линейные преобразования: (*=1, 2) A40) где таблица gik есть матрица некоторого вращения. Положим дальше, что группа ? есть группа, состоящая из тождественного преобразо- преобразования и из преобразования, коюрому соответствует перестановка
иметь вид: ( 1 ? 75] § б. линейные представления групп 267 номеров 1 и 2 у наших точек. Это последнее преобразование будет 2 1/ E)· A41) Мы имеем, очевидно, S2 = I, и следовательно, эта последняя группа ? будет состоять из двух преобразований: / и 5. Если Qa есть некоторое вращение, го, очевидно, QaS=SGa, так как безраз- безразлично — производить ли нумерацию точек до или после вращения. В данном случае мы получим те же линейные представления для общей группы F> что и выше. Если бы мы вместо двух взяли ? точек, то группа Н, состоящая из перемен нумерации этих точек, имела бы своими элементами линейные преобразования с ? перемен- переменными, а эта группа ? была бы изоморфна группе перестановок из ? элементов. В данном случае точно так же операция вращения и опера- операция перестановки номеров точек буду! комму!ировать друг с другом, и, взяв прямое произведение матрицы линейного представления группы вращения и ма!риц неко!орого линейного представления группы перестановок, мы получим линейное представление общей группы F. 76. Разбиение композиции Dj X Dy линейных представлений группы вращения. Возвратимся сейчас к тому, что мы говорили в [73]. Мы видели там, что если рассмотрим уравнение Шредингера для двух электронов и будем пренебрегать взаимодействием элек- электронов, то собственные функции уравнения Шредингера будут да- давать линейное представление группы вращения, которое получается путем композиции двух линейных представлений группы вращения. Результаты предыдущего номера показывают, что представляется важным уметь разбить такое линейное представление на неприво- неприводимые части. В настоящем номере мы и займемся этим вопросом. Задача математически формулируется следующим образом. Пусть имеются два неприводимых предс!авления Dj {?, ?, ?} и Dy {?, ?, ?} группы вращения. Составим их композицию Dj X Dy, которая также будет давать [73] некоторое линейное представление группы вращения. Требуется выделить те неприводимые части, из которых это представление состоит. Объектами линейного представления Dj порядка B/ -j- 1) будут величины и объектами линейного представления Dy будут величины Л^й~ /-'·? (?3)
268 гл ?? основы теории групп [7б причем (щ, щ) и (?? ?%) подвергаются одинаковым унитарным пре- преобразованиям с определителем (-{-1) [68] Если мы составим B/+1) B/+1) величин >— UmVm'— r ... . ¦ r. то эти величины будут объектами в том линейном представлении группы вращения, которое определяется композицией Dj X Dj>. В дальнейшем мы будем считать*у и / или целым числом, или половиной целого числа, т. е., строго говоря, будем 6paib линей- линейные представления унитарной группы с двумя переменными и опре- дедителем, равным единице. Пусть k — целое число (или половина целого числа), удовлетво- удовлетворяющее неравенству 17-Л <*</+/. A45) Покажем, что мы можем составить из величин A44) такие ли- линейные комбинации, числом 2к-\-1, которые дают линейное пред- представление Dk группы вращения. Составим для доказательства этого утверждения выражение вида: L = (щу2 — u&if (щхх + щх^з~l (vxxt + vtftfJ' ~l, A46) гд§ / — некоторое фиксированное целое число, удовлетворяющее неравенствам: />0; /<27; /<2/. A47) Если переменные (uv щ) и (vlf v^) претерпевают одно и то же линейное преобразование с определителем (+1), т.е. апап — ?12?21=1, то нетрудно ви- видеть, что первый из множителей выражения A46) остается неиз- неизменным. Действительно, Выражение A46) есть, очевидно, однородный лолином от хх и х^ степени 2G+/ — 0· Он состоит, следовательно, из членов вида: -0-' (,«0, 1, .,.
75] § б ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 269 Вводя обозначение /, A48) m"xh-m" ")u»»")i {149) l, .,., А—1, А), мы можем написать выражение A46) следующим образом: i= ? '«"-У*"· A50) т"= — k Коэффициенты ст» будут зависеть от переменных (иг, ??%)(?? ?2), Из выражения A46) непосредственно следует, что ст» есть од- однородный полином, от {иь щ) степени 2/ и однородный полином от (??9 ?? степени 2/, т. е. ст« будет состоять из слагаемых вида: a'pq щ <j~p ц *>?-<> или, принимая во внимание A42) и A43), мы можем утверждать, что ст" будет линейной комбинацией произведений Cm» = ??*№?*?*?'№'=-*> ~*+Ь ..., А-1, А), A51) т т' где коэффициенты d^) не содержат уже мл и vk. Заметим, что в выражении A46) переменные щ и vx входят только или в соедине- соединении с множителем xv или в первом из множителей A46), причем этот первый множитель дает сумму показателей у щ и vlt равную /. Принимая во внимание, что ут" содержит jcf + m", мы можем утвер- утверждать, что в слагаемых суммы A51) сумма показателей у щ и ?? будет k-\-m" -\-1 или, в силу A48), эта сумма показателей будет ]-\~ f Л~т'· ^° Um содержит и{+т и Vm> содержит v(+m\ и от- отсюда непосредственно следует, что каждое из выражений A51) со- содержит лишь те произведения UmVmri для которых т~\-т' = т". Покажем теперь, что линейные комбинации A51) величин UmVm> как раз и дают линейное представление группы вращения, эквива- эквивалентное Dk. Предварительно напомним определение контраградиентного пре- преобразования. Если имеются два линейных преобразования (х'ь ..., x'n) = A(xlf ..., хп) и (у'ь .-.> Уп) = В(уъ ..., уп), то для выполнения равенства необходимо и достаточно, чтобы В было контраградиентно с Af т. ef B A{*)i ( pi] и [40]).
270 гл. ш. основы теории групп [75 Положим, что переменные (щ, и2) и (??> ^2) одновременно под- подвергаются некоторому унитарному преобразованию А с определи- определителем (-\~ 1). Положим, что переменные ?? и лг2 подвергаются при этом преобразованию Л**)", контраградиентному преобразованию А. Из определения контраградиентного преобразования следует, что при этом суммы ??1?? -f- Щ*ъ и остаются неизменными. Кроме того, как мы показали выше, и пер- вый множитель в выражении A46) остается неизменным при ука- указанном преобразовании наших переменных. Таким образом, и вся сумма L останется неизменной, т. е., иначе говоря, в силу A50), переменные ст» -испытают преобразование ??, контраградиентное тому преобразованию С, которое испытают переменные ут». Введем новые переменные т" uk — т" ")\{km")\ v ' Применяя формулу бинома Ньютона, можем написать: (ЩХ1 -f ЩХ$к = (Щ\ 2 *т"Ут"- m" — — k Левая часть последнего выражения остается инвариантной при наших преобразованиях, и, следовательно, то же можно сказать и о пра- правой части, т. е. переменные zm» подвергаются тому же самому пре- преобразованию Bf контраградиентному преобразованию С, что и пере- переменные стп. Но мы знаем, что переменные zm» как раз и дают нам линейное представление Dk группы вращения, если (щ, щ) суть объекты унитарной группы с определителем (-J- 1). Следовательно, наше утверждение доказано. Мы можем таким образом из переменных A44), которые толкуем как составляющие некоторого вектора в пространстве с B/-J- 1)B/-|- 1) измерениями, составить линейные комбинации числом B&-J-1), которые дают линейное представление Dk группы враще- вращения. Принимая во внимание формулу A48) и неравенства A47), мы видим, что числу k можем придавать следующие значения: k=j+f, ;+/-1. ···. У-Г\- 052) Подсчитаем теперь, сколько всего линейных комбинаций из величин A44) нам придется составить. Для определенности будем предпола- предполагать, что /5^/. Упомянутое общее число линейных комбинаций будет:
76] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП ?71 Это есть сумма арифметической прогрессии с числом членов B; + 2/+1)-Bу-2/+1) [ 1=у | 1? и общее число линейных комбинаций будет B/-|-1)B/-|-1), т. е. будет равно числу величин A44). Тот же результат получился бы и при условии j <^f. Полагая для краткости обозначим упомянутые выше линейные комбинации величин A44) следующим образом: wb wb ..., wr, A53) причем будем считать, что эти линейные комбинации расположены в том порядке, который дает линейные представления Dk, где k имеет значения A52). В результа!е некоторого унитарного преобразования с определителем (~f- 1) над переменными (иь щ) и (vl9 v%) мы по- получим новые значения U'mV'm переменных A44) и новые значения w's(s=\, 2, ..., г) переменных A53), причем w's выражаются через ws при помощи квазидиагональной матрицы [DJ+J>, Dj+f-h ...,D,;W4], A54) и каждое Dk соответствует тому унитарному преобразованию, кото- которому мы подвергли {иь щ) и (vh v%). Дальше покажем, что линей- линейные формы A53) величин A44) между собой линейно-независимы. Пусть ? — матрица того линейного преобразования, при помощи кото- которого ws выражаются через переменные A44). Прямое произведение Dj X Dy есгь матрица линейного преобразования для переменных A44), и мы имеем в силу предыдущего: , DJ+f-i, ..., DU-fl] = T{DjXDr)r\ A55) что и дает разложение прямого произведения на неприводимые части. Предыдущую формулу обычно записывают следующим обра- образом: Dj X Df = Dj+f + Dj+f-i +. · ·+ A/-y |. A56) Напомним, что каждое Dk определяется унитарным преобразованием и полностью записывается так: D^ < ? ?· Предыдущий результат обобщается и на случай нескольких сомножителей. Так, например, мы можем написать: + ?>0) ? Dt =
272 гл. ш. основы теории групп [75 Сама матрица Dx есть матрица трегьего порядка [68]. Прямое произведение Dx X Dx будет матрицей девятого порядка, и, наконец, прямое произведение Dxy( Dty( Dx будет матрицей двадцать седь- седьмого порядка. Предыдущая формула показывает, что эта матрица эквивалентна при всяком выборе унитарного преобразования квази- квазидиагональной матрице [?8, ?>2, D%, D» Dl9 Dl9 ?>o]. Порядок этой последней матрицы равен [68]: B. 3 + 1)+ 2 B-2+1)+ 3B-1 + 1)+ B.0+1) = 27. Обратимся теперь к доказательству линейной независимости wS9 как линейных форм от величин A44). Величины ws в прежних обо- обозначениях суть величины ст", но только надо принять во внимание, что при построении ст" мы можем брать различные значения k или, что то же, различные значения /, так что правильнее было бы пи- писать с№„. Как мы видели выше, всякое с^„ выражается'только через те величины UmVm^ для которых т-\-т' = тТ\ Отсюда непосред- непосредственно вытекает, что линейно-зависимыми могут оказаться лишь ст» ПРИ различных /, но одинаковых ??\ Открывая в выражении A46) скобки в двух последних множителях и собирая члены при х\+т''х\~т'', где k определяется формулой A48), мы и получим с точностью до постоянного множителя cWm выраженные через uk и vk. Они будут, очевидно, произведениями (и^ — ЩР\I на некото- некоторый полином от и1у щ, ?»! и iij с целыми положительными коэффи- коэффициентами. Нетрудно видеть, что такие выражения не могут быть при различных· / линейно-зависимыми. Предположим, например, что мы имеем линейную зависимость вида: где /?<^4<^4 и Ч — некоторые постоянные, отличные от нуля. Написанное соотношение должно выполняться тождественно при вся- всяких иъ щ, ?? и т>2. Положим, например, н2 = г^ = х^ = 1. В силу сказанного выше о форме выражений сМ„ мы получим соотношение вида «? («? — ???? (Щ) + *а («? — 1)/2Л («О + *з («? — 1)'·? («?) = °» где pk (tit) — полиномы от щ с целыми положительными коэффи- коэффициентами. Деля предыдущее соотношение на (щ — 1)^ и полагая затем щ=1, получим ^ = 0, что противоречит сказанному выше и доказывает таким образом невозможность линейных соотношений. Раскрывая скобки в выражении A46), мы могли бы, конечно, и фактически построить выражения ws через перемендые A44).
76] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 273 76. Свойство ортогональности. Матрицы, образующие неэквивалентные унитарные неприводимые представления, обладают некоторым свойством, которое называется обычно свойством ортогональности. Им часто поль- пользуются при применении теории групп к физике. Сначала сформулируем это свойство. Пусть имеется конечная группа G порядка т с элементами G» G29 >.., Gm и пусть ЛA), ..., А{т) и В{1), ..., ВШ) -—две системы матриц, дающих линейное представление группы G. Обозначая элементы этих матриц малыми буквами с двумя значками снизу и считая, что указанные два линейных представления неэквивалентные, неприводимые представления и состоят из унитарных матриц, мы будем иметь следующие равенства: т которые имеют место при любых нижних значках. Аналогичные равенства имеют место и~для одного неприводимого, унитарного представления. Пусть порядок матриц A{S)t дающих унитарное, неприводимое представление, равен р. Имеют место следующие формулы: т. е. сумма, стоящая слева, равна нулю, если пары чисел (/, J) и (&, /) раз- т личны, и равна —, если эти пары одинаковы. Доказательство ортогональности основано на теореме III из [66]. Пред- Предварительно напомним понятие умножения для случая неквадратных прямо- прямоугольных матриц. Пусть имеются две матрицы С и D с элементами /* = 1, 2, ...,/?? /у = 1, 2, ...,? \D}ik\h ! о и tW;Z , ?« причем число п2 столбцов матрицы D совпадает с числом строк матрицы С, Элементы произведения DC определим обычной формулой {DC}ik^nj± {D}is{C}sk. 5=1 Новая матрица DC будет иметь, очевидно, п1 строк и пъ столбцов. Формулируем теперь основную теорему. Теорема. Если унитарные матрицы A(S) порядка ? и унитарные матрицы B{S) порядка q дают неэквивалентные неприводимые представле- представления группы G и если некоторая прямоугольная матрица Сер строками и q столбцами удовлетворяет при всяком s условиям Л(^С = С5E) (s=l, 2 m), A59) то С — нулевая матрица, т. е. все ее элементы равны нулю. Рассмотрим сначала случай р = ^, когда С естъ также квадратная ма- матрица. Если определитель С отличен от нуля, то существует С, и из A59) следует
274 гл. ш. основы теории групп [76 т. е. наши два представления эквивалентны, что противоречит условию тео- теоремы. Итак, определитель С должен равняться нулю. Положим, что не все элементы С равны нулю, и обозначим эти элементы через с^. Как известно, линейные формы CtlXl + ... + CtpXp (,= l, 2, ..., ?) определяют при произвольных xs подпространство, число измерений кото- которого равно рангу матрицы С [14], т. е. в данном случае это будет подпро- подпространство с числом измерений ^1 и <Ср. Иначе говоря, это будет действи- действительно не полное пространство ? измерений, а некоторое подпространство R. Напишем A59) как некоторое линейное преобразование над вектором с со- составляющими (xlt ..., Хр)\ А^С(хи ..., хр) = СВ^(хи..., хр) (s = l, 2, ..., т). Слева С (xif ...,xp) есть произвольный вектор из ?>, а вся правая часть, представляющая собой линейное преобразование С над вектором B(S) (xly ..., Хр)> также принадлежит R. Иначе говоря, преобразование A{S) над любым вектором из R дает опять вектор из R. При этом, как мы знаем [66], A{S) дают приводимое представление, что противоречит условию теоремы. Доказательство это остается в силе и при р> q. Тогда ранг матрицы С во всяком случае меньше /?, и линейные формы CilX1 + ... + CigXg (I = 1, % · · · ,р) определяют в пространстве ? измерений некоторое подпространство /?, с числом измерений </?, так что предыдущее доказательство остается спра- справедливым. Положим, наконец, что ? < q, и в условиях A59) перейдем к транс- транспонированным матрицам. Это даст нам В данном случае порядок q матриц B{S)* выше порядка ? матриц ЛE)*, и, как и выше, мы заключаем отсюда, что унитарные матрицы B{S) * остав- оставляют инвариантным некоторое пространство, а следовательно, мы можем соот- соответствующим подбором основных ортов привести их к квазидиагональной форме. При этом и матрицы B{S) будут квазидиагональными, что противо- противоречит условию теоремы. Таким образом, теорема доказана. Мы могли бы не упоминать в условиях теоремы о том, что матрицы A{S) и B{S) унитарны. Как известно, переходя к подобным представлениям, мы можем всегда считать ЛE> и BiS) унитарными, причем переход к подобным представлениям в соотношениях A59) вводит вместо С новую матрицу Си связанную с С соотношением вида: если С1 есть нулевая матрица, то такой же будет и С. Обратимся теперь к доказательству формул A57). Вместо A(S) и B{S) введем обозначения A (Gs) и В (Gs), где Gs — тот элемент группы (?, которому соответствуют матрицы ЛE) и BlS). Пусть X—любая матрица, имеющая ? строк и q столбцов. Введем матрицу т С= 2 A (Gs) XB (G,)-1 A60) s=\ ш покажем, что она удовлетворяет соотношениям A59). Пусть Gt -r какой-либо фиксированный элемент группы G. Мы имеем; т А (С?/) С = 2 Л (G<) А (О,) ХВ (Gs)-K
76] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 275 Но в силу определения линейного представления A (fid A (Gs) = A (QtQs) и В (fit) В (О,) = В (OtGs), и отсюда A (fit) G = f] A (fit0s) XB (Gfi^B (Qt). Элемент Gs пробегает всю группу, то же самое можно сказать и о произведении GtGs, так что предыдущую формулу можно записать в виде: т. е. матрица С, определяемая формулой A60), действительно удовлетворяет соотношениям A59), и, следовательно, эта матрица С есть нулевая матрица Итак, при любом выборе матрицы X имеем: Положим, что в матрице X некоторый фиксированный элемент {?}? равен единице, а остальные нулю. Написанная формула дает нам при этом т 2 {A(Gs)}i/{B(Gsrl}lk=0. В силу унитарности матрица В (Gs) получается из В (Gg)'1 заменой строк столбцами и всех элементов сопряженными, так что предыдущая формула при прежних обозначениях дает 5=1 что и совпадает с A57). Точно так же строя матрицу D= 2 A (Gs) XA (Gs)-\ 5= 1 где ?— любая квадратная матрица порядка р, мы можем показать, что A(GS)D = DA(GS) (8=V,2,...9 m), и в силу теоремы III из [66] можно утверждать, что D кратно единичной матрице, или где число с зависит от выбора X. Положим опять {?}?·=.\1 а остальные элементы X равными нулю, и обозначим через ?? соответствующее значение числа с. Мы можем написать: ? <Л (Qs)}i/iA {Qs) '}» = с/А*. A61) 1
276 гл. ш. основы теории групп [77 Для определения с ? положим / = & и будем суммировать по / от 1 до ? т ? т Рсп = ? ? iA №"l« {A «?,)}//= ? W» Если /==/, то правая часть равна m, а при /^/ она равна нулю. Отсюда €? = — ?;7 и, следовательно, формула A61) переписывается в виде: т {А (Gs)h;{л (Q*rlhk = -у *ufi/i, A62) 1 что и совпадает с A58), если воспользоваться унитарностью матриц A (Gs). Нетрудно видеть, что соотношение A57) имеет место не только для унитарных представлений группы, но и для любых неэквивалентных, непри- неприводимых представлений. Пусть A' (Gs) и В' (Gs) —два таких представления порядков ? и q, a A (Gs) и В (Gs) — эквивалентные им унитарные представ- представления, так что A (Gs) = СИ' (Gs) CjH В (Qs) = С2В' (Qs) Cj\ где Сх и С2 — определенные матрицы, не зависящие от s. В силу унитар- унитарности В (Gs) имеем: в (а,г и формула A57) может быть записана в виде: ' (Gs) C^X (Сг1)* В1 (О,)· С| = 0, откуда, умножая слева на Cjl и справа на (Cf) и вводя произвольную матрицу У=С][1А'(С71)*, имеющую ? строк и q столбцов: 2 5=1 и пользуясь произвольностью У, как и выше, получим: т V1 n^h^ —? Zj aij°ki —? 5=1 Отметим также, что формула A62) имеет место для любого, а не только для унитарного представления, что вытекает из ее доказательства и из того, что в формулировке приведенной выше теоремы не нужно упоминать об унитарности матриц A(S) и BiS. 77. Характеры. Пусть, как и выше, A (Gs) и В (Gs) — два неэквивалент- неэквивалентных, неприводимых представления порядков ? и q группы G с элементами Glt G2t . , Gm Обозначим через X (Gs) и X' (Gs) — следы матриц в этих представлениях, т. е. сумму их диагональных элементов: К @$) =?{? {fl.))a, X' iGs) =?{? (
77] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 277 Эти числа называются характерами упомянутых представлений. У эквива- эквивалентных представлений характеры, очевидно, одинаковы [27], и мы можем считать, что упомянутые представления суть унитарные представления. Формула ортогональности дает: 2 И№)Ь'№M=0. 5=1 откуда, суммируя по / и по k, получаем формулу ортогональности для ха- характеров: JJ X(QsJCW=0. A63) 5 = 1 Точно так же формула A58) дает: т 2 5=1 и, суммируя по I и kt получим 2 X(Gs)T(Gs) = m. A64) 5=1 Пользуясь этими формулами, покажем некоторые теоремы. Теорема 1. Необходимым и достаточным условием эквивалент- эквивалентности двух неприводимых представлений является совпадение всех их характеров. Мы уже упоминали о том, что характеры у эквивалентных (приводимых или неприводимых) представлений одинаковы, и тем самым необходимость условия установлена. Положим теперь наоборот, что дано совпадение системы характеров двух неприводимых представлений, т. е. X(GS)=X'(GS) (s = l, 2, ..., т), и докажем эквивалентность представлений. В силу A64) имеем: откуда вытекает эквивалентность представлений, ибо если бы они были не эквивалентны, то мы должны были иметь равенство A63). Отметим, что по- порядок матриц в эквивалентных представлениях должен быть, очевидно, оди- одинаковым. В соответствии с каждым неприводимым представлением введем в /я-мерном комплексном пространстве Rm векторы с составляющими: ym ym ym В силу A64) эти векторы нормированы и, в силу A63), векторы, соответ- соответствующие неэквивалентным представлениям, взаимно ортогональны Отсюда следует, что не может существовать больше чем т неэквивалентных не- приводимых представлений группы G порядка т. В дальнейшем мы уточ- уточним общее число неэквивалентных неприводимых представлений группы. Обозначим пока это число буквою / Пусть ?(?) (/ = 1, 2, ,.., /) — эти не- неэквивалентные неприводимые представления и V» (tfj), X» (С2), ..., Х«> (Gm) (i = l, 2, ...,"/)
278 гл. ттт. основы теории групп [77 — характеры этих представлений. Пусть имеется некоторое представление ? с характерами: Х(^), X(<?,), ..., X(Gm). В результате приведения представления ? оно изобразится квазидиагональ- квазидиагональными матрицами, составленными из матриц представлений ?(?). Для характе- характеров мы будем иметь таким образом: ? ?= 1 где cti—целые числа, не меньшие нуля, которые показывают, сколько раз представление ?(?> входит в состав представления ? после его приведения. Можно указать формулы для определения коэффициентов я/ по харак- характерам представления ?. Пусть k — одно из чисел 1, 2, ..., /. Умножим обе части A65) на X(k) (Gs) и просуммируем по s. Пользуясь A63) и A64), по- получим: т откуда т ak ^ ? ?х {Gs) хш {Gs)- A66) Эта формула дает для всякого а^ определенное значение, откуда вытекает следующая теорема: Теорема 2. Всякое приводимое представление распадается на един- единственную совокупность неприводимых представлений. Пользуясь формулой A66), нетрудно обобщить теорему 1 и на случай любых, а не только неприводимых, представлений. Теорема 3 Необходимым и достаточным условием эквивалент- эквивалентности двух представлений является совпадение всех их характеров. Необходимость условия отмечалась и при доказательстве теоремы 1. Наоборот, если характеры X (Gs) двух представлений одинаковы, то, со- согласно формулам A66), мы получим одинаковые значения для чисел а^, и оба представления приводятся, следовательно, к квазидиагональной матрице, состоящей из одинаковых неприводимых представлений. При этом, переходя, если нужно, к эквивалентным представлениям, можем считать, что указанные неприводимые представления расположены в квазидиагональной матрице в одинаковом порядке, ибо одна и та же перестановка строк и столбцов равносильна переходу к эквивалентному представлению. Тем самым представления с одинаковыми характерами приводятся к одним и тем же квазидиагональным матрицам, т. е. они эквивалентны. Перейдем теперь к исследованию числа / всех неприводимых, не экви- эквивалентных между собой представлений группы G. Элементы этой группы распределяются по классам. В один и тот же класс входят те элементы, которые получаются из одного из них Gt при помощи формул: GsGtG's1 (s=l, 2, ..., т). Всем этим элементам соответствуют в любом представлении подобные матрицы, имеющие одинаковый след. Пусть г — число классов в группе G, В силу сказанного выше, всякое линейное представление группы G имеет не больше чем г различных характеров, причем каждый характер соответ- соответствует не отдельному элементу, а всем элементам, входящим в некоторый
77| § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 279 класс. Пусть класс Сх состоит из g1 элементов, класс С2—из g2 элементов и, наконец, класс Сг—из gr элементов. Слагаемые суммы A63) будут одина- одинаковыми для элементов одного и того же класса и, обозначая через Х(С#), X (Ck)—характеры, соответствующие элементам, входящим в класс С&, для двух неэквивалентных неприводимых представлений можем переписать A63) в виде: и A64) в виде: 2 Таким образом, для характеров X{i) (Ck) неэквивалентных, неприводимых ? характеров представлений ?(? (/=1, 2, ..., /) будем иметь: 23 X{h) (Ck) X{i2) (Ck)gk = 0 при н ? t2i Введем в пространстве Rn число измерений которого равно г, / векторов с составляющими: уГ^ У^ЧСГ) (?=1, 2,...,/)· Предыдущие равенства показывают, что эти векторы попарно ортогональны и нормированы, а потому и линейно-независимы. Отсюда вытекает, что их число / не больше числа измерений, т. е. l^r. Мы получили теорему: Теорема 4. Число неэквивалентных, неприводимых представлений группы не больше числа классов группы. В следующем номере покажем, что всегда / = г. Поскольку мы только что показали, что /^г, для доказательства равенства / = г достаточно дока- доказать неравенство /^>г. Доказательство этого неравенства связано с введе- введением некоторых новых понятий и соотношений между характерами, которые представляют интерес и сами по себе. Установим еще одно соотношение между характерами любого неприво- неприводимого представления. Положим, что класс Ck состоит из элементов [ft\ G^\ ..., G^· Если Gs — какой-либо элемент группы, то элементы g^ (? = 1, 2, ..., gk) дадут опять все элементы из класса С&, но уже в другом порядке. Отсюда следует, что если мы возьмем совокупность всех произве- произведений элементов, входящих в некоторые классы Ср и Cq\ QfGf («= 1, 2, ..., gp, v= 1, 2, ..., gq), A68) то совокупность элементов G G^G^G = (G G{p)G~l) (G G{q)G~l) будет той же самой. Отсюда следует, что совокупность элементов A68) обла- обладает тем свойством, что если некоторый элемент принадлежит этой совокупно- совокупности, то этой же совокупности принадлежит целиком весь класс, содержащий
280 гл. т. основы теории групп [77 этот элемент, причем каждый элемент этого класса входит в совокуп- совокупность элементов A68) одинаковое число раз Обозначим через apqk целое число, не меньшее нуля, которое показывает, сколько раз элементы класса С# входят в совокупность элементов A68). Иначе это записывают, чисто условно, след>ющим образом: CpCq= 2 apqkCk A69) или = ? apgk (Qi\k) + Qi2k) + · Пусть A (Gs)—матрицы порядка п некоторого неприводимого линейного представления группы G. Образуем сумму матриц, соответствующих элемен- элементам класса Сд, и обозначим эту матрицу через А (С) *k Принимая во внимание, что элементы GsG[k^Gjl при г=1, 2, ..., gk и лю- любом Gs из G дают всю совокупность элементов класса С#, мы видим, что A (C) A (G) О s у #, , матрица A (Ck) коммутирует со всеми матрицами A (Gs). Отсюда следует, что эта матрица A (Gk) кратна единичной матрице [66], так что можем написать: A(Ck) = bkI (* = 1, 2,..., г), A71) где Ьь—некоторые числа. Принимая во внимание определение чисел apq^ т. е. символическую формулу A70), получаем следующее соотношение между числами bfi' = 21 A72) След матрицы A (Ck) равен сумме следов матриц A (G[k)) (i = l, 2, ..., gk), ? e. равен gkX(Ck)- С другой стороны, из A71) следует, что след А С равен nbkj т. е. nbk—gkX(Ck)> откуда и соотношение A72) приводит нас к следующей теореме. Теорема 5. Между характерами любого неприводимого представле- представления, образованного матрицами порядка п, имеют место соотношения: gpX (Cp) gqX (Cq) = ? 2 apqkgkX (Ck). A73) Отметим, что среди классов Ck имеется класс, состоящий только из еди- единичного элемента ? группы G. В любом линейном представлении ему соот- соответствует единичная матрица, след которой равен ее порядку п. Этот класс
78] § б. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП S81 мы будем всегда обозначать через Си так что XfCJ^n, и предыдущую формулу можно переписать в виде: gpX (С?) gqX (Cq) = X (С,) 2 apqkgkX (Ck). A74) Определим теперь значения постоянных apqi. Каждому классу Ср соответ- соответствует некоторый класс СрГ, состоящий из элементов, обратных тем, которые входят в класс Ср. Это следует непосредственно из определения классов и из того, что формула GsGtGjl = Qu приводит к формуле usGj1G-1=zG-i. Класс Ср, может и совпадать с Сру т. е. может случиться, что р' =/?. Во всяком случае классы С и Ср, содержат одинаковое число элеменхов, т. е. gpf=gp. Если в формуле A73) или A74) взжгь qj^-p\ то в правую часть класс Сх будет входить gp раз, а при q^p\ правая часть не содер- с 78, Регулярное представление группы. Мы уже указывали прием представления любой конечной группы при помощи групп перестановок. Всякую группу перестановок мы можем изобразить как группу преобразо- преобразований. Действительно, если имеется, например, перестановка 1, 2, 3, 4 % 4, 3, 1, то ее можно записать в виде линейного преобразования, при котором хг переходит в y2i х% в yit хь в yz и л:4 в у^. ^8 = 0^+0^2+^3 ^4 = 0^+^ +ОЛГ3+О*4. Рассмотрим следующее представление группы G группой перестановок. Умножаем элементы Gu G2f ..., Gm справа на некоторый элемент Gs. Это приводит к некоторой перестановке элементов, т. е. в силу сказанного выше, к некоторой матрице Ps, которая и считается соответствующей элементу G? Это представление называется обычно регулярным представлением группы G Один из элементов C?ft есть единичный элемент группы, который мы, как всегда, будем обозначать буквою В. Этому элементу соответствует единич- единичная матрица Р5, и, следовательно, след этой матрицы равен т, т. е. X (Е) = т При умножении элементов Glt G2, ·.., Gm на любой элемент Gs ни один элемент G^ не остается на месте, т. е. в соответствующей матрице все диа- диагональные элементы равны нулю, и в регулярном представлении X(Gs)=0 при GS^E. Положим, что при приведении регулярного представления оно содержит представление ?(?), о котором мы говорили выше, h^ раз. Мы имеем при этом, в силу сказанного выше: ?d { т при GS =
282 гл. ш. основы теории групп [78 Умножая обе части этого равенства на X{k) (Gs) и суммируя по s, получим в силу A63) и A64): но X{k) (E) равно порядку матриц в представлении ?(?), который мы обозна- обозначим через nk, и X{k) (E)=X{k) (?) = /*?, откуда /г^ = %, и формула A76) може1 быть переписана в виде: i Мы приходим таким образом к следующей теореме: Теорема 6. Регулярное представление содержит каждое неприво- неприводимое представление ?(?) число раз, равное порядку матриц щ в пред- представлении (u{k), и для характеров представлений ?(?) имеет место фор- формула A77). Напишем теперь формулу A74) для представлений ?<^: gpX{t) (Cp)ggX* {Cq)=X* (С,) 2 apqhX«> (Ck)gk} и просуммируем по t от t=l до ? = /: ? ?? (CP) Xit) (СЯ) = ? аРЯ* ? /1 Ы ?\ Принимая во внимание A77), получим: ? ? ?? (Cp) ? /1 т. е. в силу A75): ? [ 0 при q фр\ >(9^(д=? A78) Составим / линейных однородных уравнений относительно хи х21 ..., хг\ ? хяХ'к) (Ся) = ° №=1, 2, ..., /) A79) q=\ и покажем, что полученная система имеет только нулевое решение. Действительно, умножая обе части A79) на X{k) (Cp) и суммируя по k, получим хр, = 0, причем р' может быть любым числом из ряда 1, 2, ..., г. Поскольку система A79) имеет только нулевое решение, число уравнений в этой системе не меньше числа неизвестных, т. е. l^r. Раньше мы дока- доказали неравенство /^г, откуда следует / = г, т. е.: Теорема 7. Общее число неэквивалентных, неприводимых представ- представлений конечной группы G равно числу классов этой группы. Выясним еще одно следствие теоремы 6. Регулярное представление группы G состоит из матриц порядка т. С другой стороны, в силу теоремы 6, оно содержит щ раз каждое представление ?(/?), состоящее из матриц по- порядка nk.
79] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 283 Отсюда следует равенство г что можно формулировать следующим образом: Теорема 8. Сумма квадратов порядков неэквивалентных, неприво- неприводимых представлений <*{k) равна порядку группы G. 79. Примеры представления конечных групп. 1. Рассмотрим абедеву группу C, состоящую из элементов А\А\у где г = 0, 1, 2, ..., т—1; &Ф=0, 1, 2, ..., ? — 1, причем элементы Лх и А2 коммутируют, А™=*^Е; Л"==Д и при i = k = 0 надо считать А%А\ = Е. Каждый отдельный элемщтг_С^обра- зует класс, и все неприводимые представления группы имеют первый поря- порядок. Пусть ? и ?—какие-либо значения корней степени /пи я из единицы. Элементу А\а\ мы сопоставляем число р а1 и таким образом, как нетрудно проверить, получаем представление группы. Придавая аир всевозможные значения упомянутых корней из единицы, получим всего тп различных представлений первого порядка. Общее число классов (т. е. элементов) также равно т/г, и тем самым построены все неэквивалентные, неприводи- неприводимые представления. Аналогично строятся представления и в том случае, когда число „производящих элементов" (т. е. элементов As) не два, а больше. 2. Перейдем к группе диэдра порядка п. Она состоит из 2п элементов F /4г ? TAi ?? 1 9 ? \\ причем: Последние из написанных соотношений непосредственно очевидны из геоме- геометрического смысла вращений Л и Г. Из этого соотношения непосредственно следует соотношение ТА1Т~1 = А~К Положим сначала, чтоп = 2пг~\-\ есть не- нечетное число. Группа будет при этом состоять из (m-f-2) классов. Один из них содержит Е, m классов содержат по два элемента As и A~s (s = l, 2, ..., m), причем A~s = A2l+1~sy и один класс содержит все элементы вида ? и ТА1. Все это легко проверяется при помощи указанных соотношений. Имеются два представления первого порядка. В одном из них каждому элементу сопоставляется число 1. В другом элементу Л сопоставляется 1 и элементу ? число (—1). Пусть, далее, ? —cos \-??? — . Можно по- построить m представлений второго порядка, сопоставляя элементам Л и Г следующие матррщы: (s = 1, 2, ..., m). A82) Написанные матрицы удовлетворяют соотношениям A81) и тем самым дают представление группы, ибо всякое соотношение между элементами Л и Г является следствием соотношений A81). Неприводимость каждого из пред- представлений вытекает из того, что в противном случае представление приве- привелось бы к двум представлениям первого порядка, и матрицы нашего пред- представления должны были бы коммутировать, чего нет на самом деле ни при каком s, в чем легко убедиться. Неэквивалентность представлений A82) при разных s вытекает из того, что при разных s матрицы, соответствующие элементу Л, имеют различные наборы характеристических чисел ?s и е~5. Таким образом построена все ?* ? 0 ? ; г — 0 1 1 0
284 гл. in. основы теории групп [79 }) неэквивалентных, неприводимых представлений. Формула A80) в рас- рассматриваемом примере сводится к следующей: При четном п~2т представление A82), соответствующее значению s~mt имеет вид: и распадается на два представления первого порядка: Л-(-1); Г-(+1) и Л-(-1); Г-(-1). Чтобы получить это, достаточно применить такую матрицу S, что STS'1 приводится" к диагональному вицу, причем характеристические числа мат- матрицы ? равны, очевидно, ± 1. Таким образом при я = 2/л имеются четыре представления первого порядка и (т — 1) представлений второго порядка. Формула A80) принимает вид: 3. Рассмотрим представления группы тетраэдра или, что то же, изоморф- изоморфной ей знакопеременной группы при я = 4 [59]. Группа состоит из четырех классов и порядок ее равен двенадцати. Она должна иметь четыре неэквива- неэквивалентных, неприводимых представления. Порядки этих представлений должны удовлетворять равенству Это уравнение имеет с точностью до порядка слагаемых в левой части единственное решение в целых положительных числах, а именно я ? = п2 = щ = 1; лг4 = 3, т. е. группа имеет три представления первого порядка и одно — третьего порядка. В представлениях первого порядка элементам, входящим в один и тот же класс, соответствует одно и то же число. Нетрудно показать, что в трех представлениях первого порядка классам соответствуют следующие числа; 1_,1; И _1; Щ _И; IV — 1 1_1; II —^ 1; Ш —е; IV — ?8 1_1; и —1; III —?2; IV-?, где 2? . . 2? ? = cos -g- -f- t sin -о- # Неприводимое представление третьего порядка дает сама группа тетраэдра, т. е. группа тех вращений пространства (матрицы третьего порядка), при которых тетраэдр переходит в себя. Если бы это представление оказалось приводимым, то оно должно было бы привести к трем представлениям пер- первого порядка, что невозможно хотя бы потому, что группа тетраэдра не есть абелева группа. Изложенная в последних номерах теория касается конечных групп. Для того чтобы перенести ее на группу вращения, мы должны более подробно остановиться на рассмотрении бесконечных групп, зависящих от параметров. Прежде чем переходить к общему рассмотрению таких групп, мы изложим вопрос о линейных представлениях группы Лоренца. Эти пред- представления, наряду с представлениями группы вращения, будут служить для нас основными примерами бесконечных групп, зависящих от параметров.
80] § 6. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 286 80. Представления линейной группы с двумя переменными. В [68] мы построили линейные представления унитарной группы с двумя переменными, что привело нас к линейным представлениям групп вращения. Аналогично можно построить представления линей- линейной группы с двумя переменными и с определителем, равным еди- единице: , , 'Г**1*** A83) = схг 4 ах В силу сказанного в [64] это приведет нас к однозначным и дву- двузначным представлениям группы положительных преобразований Лоренца. Результаты окажутся существенно отличными от результа- результатов из [68']. Одним из возможных линейных представлений унитарной группы (93) является представление этой группы самой собой, т. е. линейное представление, при котором каждому преобразованию (93) соот- соответствует это же преобразование. Легко видеть, что другим линейным представлением является следующее: каждому преобразованию (93) приводится в соответствие преобразование с комплексными сопря- сопряженными коэффициентами: yx = ayl ~\- byu _y2 = — ftj Но это представление эквивалентно предыдущему, что непосред- непосредственно следует из легко проверяемой формулы: (о ill II а ? ? ? ь II о 11 — 1 of I — ft д|=! —ft ? [?—? ?|| Для группы A83) сопряженное представление у[ = йух -\- Ьу?, у% = Сух -J- dy% A84) не эквивалентно самой группе A83). Чтобы убедиться в этом, доста- достаточно рассмотреть случай Ь=^с = О. При этом матрица преобра- преобразования A83) имеет характеристические числа ? и i а матрица A84) — характеристические числа ? и ? Очевидно, можно выбрать комплексные числа а и d, удовлетворяющие условию ad = 1 так, что совокупность чисел й и d будет отлична от совокупности чисел ? и d, и, следовательно, соответствующие преобразования не могут быть подобными. Таким образом в данном случае мы уже имеем два неэквивалентных представления второго порядка — саму группу A83) и группу (i8 4). О неприводимости представлений будет ска- сказано ниже. Мы можем далее построить представления группы A83) совер- совершенно так же, как этр было сделано в [68]. В формулах (99) надо только заменить а на d и ft на (— с). Эго приведет к следующему
286 гл. ш. основы теории групп [80 представлению порядка B/-f-l), где j — целое неотрицательное число или половина нечетного числа: \c, d)is~~ / i/+Qi U - Qi U + s)\ (j-W J\c, d)isb XaJ+l-kbkck+°-ldJ-*-*(j = 0, 1, 1, i-, ...). A85) Здесь / и 5 пробегают следующий ряд значений: / и s = -/, -7 + 1, ..., ; —1> ? и суммирование по k определяется неравенствами: В формулах A85) надо считать 0! = 1 и 0°=1. При 7 = 0 полу- получается тождественное представление единицей. Кроме представлений A85), мы можем написать непосредственно другие представления, заменив в правых частях A85) числа а, Ь, с и d сопряженными. Соответствующие представления обозначим следующим образом: D,ie*l(/ = o, |, ?, ?, \ A86) \с d)\ ? 2 у Мы можем составить теперь композицию представлений A85) и A86) [73], в результате чего получится повое представление порядка B7+ 1) B7'+ 1)· Обозначим его следующим образом: A87) Пользуясь формулами A85), легко выписать элементы матриц, соот- соответствующих этому представлению. Возьмем два различных пред- представления A87), но так, чтобы порядок их был одинаковым: (а Ъ Ер'д\с d Покажем, что такие два представления не эквивалентны. Положим Ь = с = О. При этом матрица A85) приведется к диагональной мат- матрице с диагональными элементами: Прямое произведение двух диагональных матриц есть диагональная
80] § б. ЛИНЕЙНЫЕ ПРЕДСТАВЛЕНИЯ ГРУПП 287 матрица, и, следовательно, матрицы Ерд и EPltQl при Ь = с = 0 имеют следующие характеристические числа: Вр q ? a^ldP-l{a)^(df-m [ "— " г , -> ..., г - г j \т = — q, — # + 1, ..., q — 1, q) = —Pi> —А+Ь ..., Pi— t, f или, принимая во внимание, что ad=\: Ep,q:a*{afm; EPl, gi:a В качестве а мы можем взять любое комплексное число, отличное от нуля, и можно, очевидно, выбрать это число так, что совокуп- совокупность характеристических чисел матрицы EPt q будет отлична от совокупности характеристических чисел матрицы ЕРи qv что и дока- доказывает неэквивалентность представлений A87) при различных выбо- выборах ] и /. Отметим, что при / = 0 представление A87) совпадает с представлением A85), а при у = 0 оно совпадает с тем пред- представлением, которое получается из A85) при j=f и при замене a, b, с и d сопряженными величинами. Отметим одну особенность представлений A87). Эти представления не эквивалентны унитарным представлениям. Если бы они были эквивалентны некоторым уни- унитарным представлениям, то все характеристические числа любой матрицы представления должны иметь модуль, равный единице, а выше мы видели, что у представления EPt q эти характеристические числа при Ь — с = О равны а%1 (а)ш и могут быть по модулю, оче- очевидно, отличными от единицы. Исключением является лишь пред* ставление ?"OfO, которое является тривиальным тождественным пред* ставлением, при котором каждому элементу группы A83) соответ- соответствует единица. В [66] мы видели, что если некоторое представление, не обяза- обязательно эквивалентное унитарному, приводимо, т. е. эквивалентно некоторому представлению с квазидиагональными матрицами одной и той же структуры, то обязательно существует матрица, отличная от кратной единичной матрицы и коммутирующая со всеми матри- 'цами представления. Таким образом, для того, чтобы доказать, что любое представление A87) не является приводимым, достаточно показать, что если некоторая матрица коммутирует со всеми матри- матрицами представления A87), то эта матрица кратна единичной матрице. Это можно сделать совершенно так же, как и в [68]. Итак, пред- представления A87) попарно неэквивалентны и каждое из них является неприводимым представлением. Часто пользуются определением при- приводимости, отличным ог того, которое мы привели в [68], а именно представление называют приводимым, если все . его линейные
288 гл. ттт. основы теории групп [80 преобразования (пусть их порядок равен п) оставляют инвариантным некоторое подпространство Lk, причем 0<^k<^n. Мы видели [68], что если приводимое в этом смысле предста- представление состоит из унитарных матриц, то оно приводимо и в смысле определения из [65], т. е. эквивалентно некоторому квазидиагональ- квазидиагональному представлению. Если представление не унитарно, то из инва- инвариантности некоторого подпространства не следует приводимость в смысле определения из [65]. Можно показать, что всякое пред- представление A87) группы не только непривЬдимо в том смысле, как это мы доказали, но что оно не оставляет инвариантным никакое подпространство. Кроме того, можно показать, что всякое линейное представление группы A83) или эквивалентно одному из представ- представлений A87), или эквивалентно представлению, имеющему приведенную формулу и состоящему из нескольких представлений A87). В [73] мы видели, что композиция двух линейных представлений группы равносильна перемножению объектов тех линейных пред- представлений, которые входят в эту композицию. Принимая это во вни- внимание, мы можем утверждать, что для представлений A87) объек- объектами представлений являются выражения: ?*». = , ?? ?* · Уг У* — lk=j, j-1, ..., -/+1, -? \k'=f,f-i,..., -/+1, -/Г причем хх и jc2 испытывают преобразование A83), а уь _у2 — пре- преобразование A84). Мы говорили до сих пор о линейных представлениях группы, состоящей из положительных преобразований Лоренца [64]. Эти положительные преобразования составляют лишь часть преобразо- преобразований Лоренца с определителем, равным единице. Кроме того, имеются преобразования Лоренца и с определителем (— 1). Исследование структуры этих более общих множеств преобразований и расшире- расширение линейных представлений группы положительных преобразований Лоренца на случай полной группы Лоренца представляет некоторые особенности по сравнению с группой ортогональных преобразований в трехмерном пространстве. Отметим, что при определении полной группы Лоренца мы можем поставить требование неизменности в направлении отсчета времени. При этом к рассмотренной группе Лоренца надо добавить отражение: Исследование всех указанных вопросов можно найти, например, в книге Картана „Теория спиноров" (Москва, 1947 г.) и в книге Ван-дер-Вардена „Me ? од теории групп в квантовой механике".
81J § 6· линейные представления групп 289 81. Теорема о простоте группы Лоренца. Пользуясь методом, аналогичным тому, который мы применили в [70], докажем сейчас, что группа Лоренца есть проаая группа. Для этого достаточно показать, что у группы Q, состоящей из преобразований A83), нег нормальных делителей, отличных от нормального делителя, состоя- состоящего из матриц ? и (— Е). Пусть имеем такой нормальный дели- делитель Н\, содержащий матрицу А = а Ь с d — bc—\)y отличную от ? и (—Е). Надо доказать, что Нх совпадает с Q. Е^ли Н\ содержит некоторую матрицу В, то подгруппа ?? содержит и все матрицы U~lBU, ,где U—любая матрица из О. Принимая во внимание основной результат о приведении матриц к каноническому виду, а также тот факт, что определитель матрицы ?/, приводящей какую-либо матрицу к каноническому виду, можно всегда считать равным единице [27], мы видим, что достаточно показать, что Н\ содержит, во-первых, матрицы с любыми допустимыми различными характеристическими числами t и Г, где t — любое комплексное число, отличное от нуля и (-{- 1). Отметим, что произведение харак- характеристических чисел матриц группы Q должно равняться единице. Далее, Нх должно содержать матрицы ? и (—Е)} и, кроме того, учитывая случай равные характеристических чисел и двойного эле- элементарного делителя," мы должны еще показать, что Нх содержит матрицы: 111 Oil I—I 011 ||? ?|-1 ? -?|· A88) Возьмем переменную матрицу группы О: II ? ? II Х = \ -? (x*—yz=l) \\z х\\ и составим матрицу: У=Л(ХА'1Х-1)У которая, как и в [70], должна входить в //1# Для следа s матрицы ? получаем выражение: s = 2 + fez? + су* — [(а — df -f 2Ьс\уг. Поскольку А отлична от ? и (— Е), мы не будем иметь одновре- одновременно: Ь = с = О и a = d. Отсюда ясно, что 5 не есть постоянная, и, меняя ? и у, мы можем придавать 5 любые комплексные значе- значения. Характеристические числа матрицы ? определяются из квадрат- квадратного уравнения ?2 — ^? -'- 1=0,
290 ГЛ. III. ОСНОВЫ ТЕОРИИ ГРУПП [82 Таким образом мы можем получать для этих корней любые значе- значения t и f, следовательно, Нх содержит все матрицы с различными характеристическими числами и определителем единица. Далее, Нь очевидно, содержит Е, а также (— ?), которое можно представить в виде произведения: -E=[t, ir*].[-t-\ -?], каждый из множителей которого входит в //х. Матрицы A88) легко представить в виде произведения двух матриц с определителем единица и с различными характеристическими числами, откуда сле- следует, что Н% содержит и эти матрицы. Действительно: 111 Of 11 11 1 О 1 —1 (? ? 0 и ± 1). Таким образом доказано, что ?? должно совпадать с G, т. е. Q не имеет нормальных делителей, отличных от нормального делителя, состоящего из ? и (— Е), и тем самым доказано, что группа поло- положительных преобразований Лоренца есть простая группа. Отсюда следует, как и в [70], что эта группа не может иметь гомоморфных (не изоморфных) представлений. § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 82. Непрерывные группы. Структурные постоянные. Группы вращений трехмерного пространства и группа положительных пре- преобразований Лоренца представляют собою примеры бесконечных групп, элементы которых зависят от параметров, которые могут меняться непрерывным образом. Для группы вращения роль пара- параметров могли играть, например, углы Эйлера. В рассматриваемых случаях группы состоят из линейных преобразований, и зависимость группы от параметров сводится к тому, что элементы матриц, кото- которыми определяются упомяну ? ые линейные преобразования, зависят от этих параметров. В дальнейшем мы будем рассматривать группы линейных преобразований. Положим, что элементы aik матриц линейных преобразований, составляющих некоторую группу G, суть функции г вещественных параметров а1? а2, ..., аг, причем выполнены условия, которые мы сейчас укажем. Положим, что atk cyib однозначные функции пара- параметров as при всех значениях этих параметров, достаточно близких к нулю, и что нулевым значениям параметров ?1 = ?2 = . ., = аг = 0.
82] § 7. непрерывные группы 291 соответствует единичный элемент группы G, который характеризуется условиями: aik = 0 при ? ? k и ан — \. Положим далее, что всякому элементу группы G, достаточно близкому к единичному элементу, соответствуют определенные значения параметров а5, достаточно близкие к нулю. Близость элемента группы к единичному элементу определяется тем, что элементы aik соответствующих матриц близки к нулю при ?^?^ и к единице при l==k. Таким образом, при сде- сделанных предположениях, мы будем име1ь биодиозначное соответствие между элементами группы G, находящимися в определенной окрест- окрестности единичного элемента, и некоторой окрестностью начала коор- координат r-мерного вещественного пространства Тг В дальнейшем мы будем иметь не только такое локальное биоднозначное соответствие, но биоднозначное соответствие в целом, при котором каждому эле- элементу группы G соответствует определенная точка пространства Тп принадлежащая некоторой области V этого пространства, содержа- содержащей начало внутри себя, и, наоборот, любой точке из V отвечает определенный элемент группы G Пока нам потребуется лишь ука- указанное выше локальное соответствие. Символами Оа, Gt3, GT и т. д. мы будем обозначать те элементы группы G, которые соответствуют значениям параметров ?5, ?5, ?5 E=1, 2, ..., rj. При локальной точке зрения надо считать, что параметры достаточно близки к нулю, а элементы группы — к единичному элементу. Рассмотрим произведение каких-либо элементов группы Параметры ?5, характеризующие элемент ??, полученный в результате указанного умножения, суть однозначные функции параметров as и fc ?5 = ?5 (??> К ···> Рл al> <*2> ···> О' A§9) Мы предполагаем, что это суть непрерывные функции, имеющие непрерывные производные до четвертого порядка при всех as и ?5, достаточно близких к нулю. Из того, что нулевым значениям параметров соответствует еди- единичный элемент группы, непосредственно следуют равенства pa, ... , ?/, ?, О, ..., 0) = ?/, ср5 (О, О, ..., 0; аи а2, ..., аг) = а5 откуда дРл ' ' ' (s=l, 2,..., г). A91) ie: = bik при ?, = ?
292 гл. itt. основы теории групп [82 Параметры а5, соответствующие обратному элементу ??1, опреде- определяются, очевидно, из соотношений: <?8(8.19 аь ..., аг; а1} а2, ..., аг) = 0 E=1, 2, ..., г), A92) причем написанные равенства имеют место, если положить все cns и все а5 равными нулю. Функциональный определитель от левых частей уравнений A92) по as равен, в силу A91), единице при ols и а5, равных нулю. Таким образом, в силу теоремы о неявных функциях, уравнения A92) определяют as как непрерывные функции при всех oist достаточно близких к нулю, причем а5 обращаются в нуль при as = 0. Разложим функции A89) по степеням as и ?5, пользуясь формулой Маклорена, причем доведем разложение до членов третьего порядка. Принимая во внимание формулы A90) и A91), получим: +? <#W* + ? 4%. шла + ? #V ?? ?+*w> ?93) ?, k i, k, I ?, k, I где aj% af^k, ? и b\%t ? — численные коэффициенты, s{s) — не ниже четвертого порядка малости относительно а5 и ?5, и суммирование по iy k и / производится от 1 до г. Числа С$ = аЙ} — a{U (s, i, А = 1, 2, ..., г) A94) называются структурными постоянными группы G при принятом выборе параметров as. Если вместо a.s ввести другие параметры а? ?5 = ??(??> ?^ ..., a;) (s=l, 2, ..., г) так, что (os @, 0, .„., 0) = 0, написанные равенства однозначно разрешимы относительно о^ при всех ols, достаточно близких к нулю, и функции ws имеют достаточное число производных, то структур- структурные постоянные в новых параметрах о^ буду г уже другими. Из определения A94) непосредственно следует: СЙ^-Ci?. A940 Кроме того, пользуясь A92) и законом ассоциативности при пере- перемножении элементов группы G, можно доказать еще следующее соотношение между структурными постоянными: ? (С%С$ + СМ + С{йс\)]) = 0 (?, у, ft, t = 1, 2, ..., г). A942) Мы не будем пользоваться этим соотношением и не приводим его доказательства. Вернемся к формулам A93). При а5 и ?5, достаточно близких к нулю, и величины ?5 будут близкими к нулю. Принимая во вни*
82] § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 293 мание формулы A91) и теорему о неявных функциях, можно утвер- утверждать, что уравнения A93) в некоторой окрестности начала коор- координат пространства Тг разрешимы относительно ?5: Ps = <M7i> Ъ ···> Ъ> ??> «* ··> <*/·) (s=U 2, ..., г). A95) Отметим при этом, что условия: ?5 = 0 E=1, 2, .·., г) равно- равносильны условиям: ?5 = ?5 (s=l, 2, . .*, г). Пользуясь формулами A93) и A95), составим две квадратные матрицы S(as) и T(ols) порядка г с элементами Sik(<y.s) и 7",^(as), зависящими от парамет- параметров а5: E, /, А=1, 2, ..., г). A96) Принимая во внимание правило дифференцирования сложных функций и вычисляя производную от *[? по 7л или производную от ?,- по ??, получим: S(as)T(as) = E и T{a8)S(*8) = E, A97) где ? — единичная матрица порядка г. Из формул A91) следует, что S(ols) при нулевых значениях as = 0 обращается в единичную мат- матрицу. Из A97) при этом следует, что и T(ols) обладает этими же свойствами. Нетрудно выразить структурные постоянные Cfk через элементы упомянутых матриц, а именно: С(Р) = (dSPb(as) _ ЖгЩ ИЛИ g) (iZkMi!kM) . A99) Действительно, в силу A93) и A96), получим: U· B00) и, переставляя значки ink, можем написать: откуда и следует непосредственно формула A98). Далее, принимая во внимание A97), имеем: Дифференцируем обе части по <Х| и полагаем затем все Оу равными
ГЛ. HI. ОСНОВЫ ТЕОРИИ ГРУПП [83 нулю. Принимая во внимание, что матрицы S(ols) и T(as) обращаются в единичную матрицу при ols = Q E=1, 2, ..., г), получим: %*W\ , ldTpk(as)\ _ т. е., в силу B01): a<P)=—( ulk \ s откуда, как и выше, следует формула A99). Формулы A93) опре- определяют основную групповую операцию, которая по параметрам ols и ?5 элементов ?? и Go группы Q дает параметры ?5, соответствующие произведению ОМа- Из выражений A93) видно, что при ?/и ?5, близких к нулю, в первом приближении групповая операция сводится к следующей: ?5 = ?5-|-?5, так что в первом приближении группа оказывается абелевой. Если группа в точности есть абелева, то: E=1, 2, ..., г) и в разложениях A93) а« аД, т. е. у абелевой группы все струк- структурные постоянные равны нулю. Для общих групп уже члены второго измерения в разложениях A93) дают уклонение от коммутативности, что и характеризуется наличием структурных постоянных, отличных от нуля. Пользуясь разложением A93), нетрудно получить и разло- разложение параметров as, соответствующих элементу Q'1. Для этого в формулах A93) надо положить ?5 = 0 и заменить ?5 на а5. При- Применяя обычные правила дифференцирования неявных функций, полу- получим: i, k где e[s\ по крайней мере, третьего порядка малости относительно 83. Бесконечно малые преобразования. Пусть, как и выше, имеется непрерывная группа G линейных преобразований порядка /г, определяемая параметрами as(s=l9 2, ..., г). Будем, как и выше, обозначать символом Ga — матрицу преобразования, соответствую- соответствующего параметрам а5, так что линейное преобразование имеет вид: B02) где и — любой вектор п-мерного комплексного пространствами ?—преобразованный вектор. Введем операцию дифференцирования матрицы, а именно: если элементы некоторой матрицы Л суть диф- дифференцируемые функции некоторого параметра ty то производной от
83] § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 295 Матрицы А по параметру t назовем матрицу, элементы которой полу- получаются дифференцированием элементов матрицы А по t, т. е. idA\ d {A}ik \dt\ik dt · Если элементы А зависят от нескольких переменных, то мы будем иметь частные производные. Совершенно так же, если составляющие некоторого вектора z{zb г2, ..., ??) из пространства Rn суть дифференцируемые функ- функции t> то вектор ~ определяется как вектор с составляющими,-^, т, е. дифференцирование вектора сводится к дифференцированию его составляющих [II, 119]. Введем теперь так называемые бесконечно малые преобразования группы Q: Н© 4B03) Символ Ik обозначает, очевидно, некоторую матрицу порядка ? с численными элементами. Обратимся теперь к формуле B02) и положим, что и есть фикси- фиксированный вектор, т. е. его составляющие не зависят от as. Преоб- Преобразованный вектор уже зависит, вообще говоря, от этих параметров, и мы выведем сейчас основные дифференциальные уравнения для этого вектора. Для этого применим к обеим частям B02) линейную операцию, определяемую матрицей ??: где ??=????, и параметры ?5 определяются через <xs и ?5 согласно основной групповой операции A93). Дифференцируем обе части последней формулы по ?? и полагаем затем ?5 = 0, ?. е. ?5 = ?5. Пользуясь определением B03), получим: Первый сомножитель под знаком суммы равен, очевидно, произ- производной от правой части B02) по ?;·, и, принимая во внимание обо- обозначение A96), можем переписать последнюю формулу в виде: =? У1 Если ввести векторы:
296 гл. ш. основы теории групп [83 то предыдущие формулы можно записать в виде линейного преоб- преобразования Y=s*(ois)X, где 5* (а5) — обычное обозначение транспонированной матрицы. Умножая слева на Т* (as) и принимая во внимание A97), получим: или, в раскрытом виде: г д<хр = 2 TJp W h* (? = Ь 2, ;.., г). B04) Для составляющей xk вектора л;, определяемого формулой B02), мы имеем: где {?,·}**— составляющие матрицы Ij. К уравнению B04) для ? мы должны добавить начальное условие, непосредственно вытекающее из формулы B02): х\а$=0 = и, B06) где и — произвольный заданный вектор. Отметим, что величины 7}p(as), входящие в коэффициенты уравнения B04), определяются непосредственно по групповой операции A93). Уравнение B04) при- приведет нас к некоторым соотношениям между /у. Для этого доста- достаточно написать, что вторая производная от ? по ар и aq не зависит от порядка дифференцирования. Из B04) следует: 17jp {s) j Щ или, заменяя величину ·*—· ее выражением из B04) при p = q, по- получим: г Г Г Переставляя справа ? и q и приравнивая полученную правую часть написанной выше, будем иметь следующее следствие системы B05): Ш г г 2?]=0· B07)
83] § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 297 Положим в этом соотношении все а5 равными нулю. Принимая во внимание формулы A99) и тот факт, что T(?S) = E, если все ols равны нулю, получив откуда следуют, в силу произвольности вектора и, следующие соот- соотношения между бесконечно малыми преобразованиями: 7-1 Мы определили Ij и доказали соотношения B08), исходя от за- заданной непрерывной группы Q и пользуясь уравнением B04). По- Покажем, что это уравнение или, что то же, система B05), имеет единст- единственное решение при заданном начальном условии B06). Пусть имеют- имеются два таких решения. В силу линейности уравнения B04) их разность также должна удовлетворять уравнению и должна обращаться в нулевой . вектор при as = 0. Таким образом, надо показать, что решение ? уравнения B04) при нулевом начальном условии равно тождественно нулю. Для простоты письма будем считать г = 3. Пусть л;^, а2, а3) — упомянутое решение. Напишем уравнение B04) при р—\ и в пра- правой части положим ?2 = ?3 = 0. Получится обыкновенное дифферен- дифференциальное уравнение с независимой переменной at и нулевым началь- начальным условием. В силу известной теоремы единственности [11,50], оно тождественно равно нулю, т. е. ? (^ 0, 0) = 0. Напишем теперь урав- уравнение B04) при /? = 2 и в правой части положим а3 = 0. Это обык- обыкновенное дифференциальное уравнение с независимой переменной аа имеет, как мы только что показали, нулевое начальное условие: х(аъ аь 0) = 0 при а2 = 0, а потому, в силу теоремы единственно- единственности х{ъъ а2, 0) = 0. Напишем теперь уравнение B04) при /? = 3. Это обыкновенное дифференциальное уравнение имеет нулевое на- начальное условие: х(сиь а2, а3) = 0 при а3 = 0, и, следовательно, ? (аь ?2, ?3) = 0, что мы и хотели доказать. Таким образом уравнение B04) может приводить только к одно- одному конечному преобразованию B02) при заданных бесконечно малых преобразованиях Ij и заданных Гур(а5), которые определяются груп- групповой операцией A93). Иначе говоря, бесконечно малые преобразования определяют группу. Это будет нам существенно в дальнейшем. Доказа- Доказательство существования решения уравнения B04) основано на одной общей теореме из уравнений с частными производными, которая при- применительно к уравнению B04) формулируется следующим образом: для того чтобы уравнение B04) имело решение при любом началь- начальном условии B06), необходимо и достаточно, чтобы квадратная скоб- скобка, входящая в формулу B07), при любом выборе ? и q была равна
298 гл. ??. основы теории групп [84 нулю тождественно относительно а5. Дальше мы не будем пользо- пользоваться этой теоремой существования. 84. Группа вращения. Рассмотрим в качестве примера группу вращения пространства вокруг начала координат. Соответствующие матрицы третьего порядка зависят от трех параметров. Роль этих параметров могут играть, например, три угла Эйлера. Мы введем сейчас другие параметры аь а2, а3, в которых и будем производить дальше все вычисления. Всякое вращение мы можем рассматривать как вращение против часовой стрелки вокруг некоторой направлен- направленной оси /, выходящей из начала координат, на угол, не превышаю- превышающий ?. При этом два вращения на угол ? относительно противопо- противоположно направленных осей приводят к одному и тому же конечному положению. Мы можем таким образом изобразить всякое вращение вектором из начала, направленным по оси вращения и по длине рав- равным углу вращения. Проекции этого вектора (аь а2, а3) на коорди- координатные оси и будут служить нам параметрами. Если мы возьмем сферу V с центром в начале и радиусом тс и отождествим концы любого из ее диаметров, то между точками 0*?, ?2> аз) сферы V и элементами группы вращения будет уста- установлено биоднозначное соответствие. В данном случае оно будет иметь место не только в окрестности начала координат и единичного элемента группы, но и для всей группы, если взять всю сферу V. Можно выразить все матрицы, входящие в группу вращения, через параметры аь а2, а3 и убедиться в непрерывности и существовании производных, о чем мы говорили выше. Мы не будем выводить формулу A93) для основной групповой операции в рассматриваемом случае, а определим структурные постоянные, вычисляя непосредственно матрицы бесконечно малых преобразований. Для вычисления Д мы можем считать ?2 = ?3 = 0, продифферен- продифференцировать матрицу преобразования по aj и положить затем ctj == 0. Но при ?2 = ?3 = 0 мы имеем вращение вокруг оси X на угол аь что приводит к формулам: ?'2 = jc2 COS aj — хг sin alf ?'? = ?% sin <Xj -\- хъ COS a1# Дифференцируя матрицу этого преобразования по ?? и полагая· затем ах = 0, получим: IIо о of /1= 0 0— 1 L B09) о ? о
85] § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 299 Совершенно аналогично О 0 1 0 0 0 — 10 0 |о— ? о /з= 1 О О О 0 0 B10) После этого мы можем непосредственно вычислить левые части соотношений B08) и тем самым определить структурные постоянные. Это элементарное вычисление приводит к трем следующим соотно- соотношениям: /i/2-Vi=/3; /л —yt=/i; /3/1-/1/3=/2. B11) Если правую часть формулы B02) разложим по степеням а5, ог- ограничиваясь членами первого порядка, то получим с этой точностью: X = и + (а^ + «Л + 4h) п. Таким образом вектор и в результате указанного преобразования ис- испытывает следующее изменение: Каждое слагаемое справа дает изменение и при малом вращении вокруг одной из осей координат. Так, например, мы получаем сле- следующие изменения составляющих (нь иь щ) вектора и при повороте на малый угол ах вокруг оси X: ?%= 0; Ьщ == — При этом, как и выше, мы ограничиваемся лишь членами первого порядка относительно ?1? 85. Бесконечно малые преобразования и представления груп- группы вращения. Сейчас выясним связь сказанного выше о бесконечно малых преобразованиях с представлением группы вращения. Мы бу- будем подразумевать биоднозначное представление в окрестности тожде- тождественного преобразования матрицами F(oLiy ?2, ?3) порядка ?, причем элементы матрицы считаются непрерывными и дифференцируемыми функциями параметров &h ?2, ?3. Каждое вращение D может быгь по- получено в виде произведения конечного числа вращений из упомянутой окрестности, и произведение соответствующих матриц представления дает представления и для D. Но таким образом в целом может по- получиться и многозначное представление группы вращения, поскольку при непрерывном изменении параметров вращения можно, возвращаясь к исходному вращению, получить для него новое представление. Это, например, было раньше при двузначном представлении полной груп- группы вращения [69]. Для матриц F*(alt a2, a3) мы имеем ту же групповую операцию, что и для самих вращений, а следовательно, и те же структурные
300 гл. ш. основы теории групп [85 постоянные. Для группы G матриц F(ah ?2, ?3) можно составить бес- бесконечно малые преобразования Ik. Это будут некоторые матрицы по- порядка п, связанные соотношениями B11). Если удастся найти матрицы Ik) то можно написать для вектора ? из Rn дифференциальные урав- уравнения B04), ибо Tjp(ols) определяются лишь групповой операцией. Эти уравнения могут иметь при заданном начальном условии B06) только одно решение; только это решение, очевидно, и может быть тем преобразованием X = F(zh ?2, а3)д, которое дает представление группы вращения в окрестности тожде- тождественного преобразования. В рассматриваемом случае г = 3, и если в уравнении B04) пе- перейти к составляющим вектора х, то получатся Ъп уравнений для ? составляющих вектора Х%, ..., Хп). В дальнейшем для нас будет важно лишь то, что уравнение B04) не может иметь более одного решения при заданном начальном ус- условии B06). Как уже говорилось выше, это можно формулировать так: представление группы вращения вполне определяется своими бесконечно малыми преобразованиями 1Ь 1Ь /3. Таким образом все сводится к определению бесконечно малых преобразований представления, к чему мы и переходим. Вместо иско- искомых матриц 1и /2, /3 вводим новые матрицы: B = i/8. B12) Легко проверить, что для них, вместо B11), получаются следу- следующие соотношения: B13) В представлении матрицами F(ol19 ol>, ?3) должно заключаться, в частности, и представление абелевой группы вращения вокруг оси ?, элементам которой соответствуют матрицы F@, 0, ?3). При помощи соответствующего выбора ортов все эти матрицы одновременно пре- преобразуются к диагональной форме, ибо неприводимые представления абелевой группы суть представления первого порядка. Для векторов, которые при этом играют роль ортов, преобразование /^@, 0, а3) бу- будет иметь вид [69]: F @, 0, / или, полагая /= —im и обозначая ? через vmi
85] § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 301 Поскольку мы поставили условие однозначности представления только в окрестности а5 = 0 (s=l, 2, 3), мы не должны считать т ц^лым числом. Отсюда получаем, основываясь на определении /3: Итак, Аъют = тют B14) т. е. <от есть собственный вектор оператора А3, соответствующий собственному значению т. Если таких собственных векторов несколь- несколько, то через vm обозначаем один из них. Докажем теперь следующую лемму: Лемма. Если некоторый вектор ? есть собственный вектор оператора А3, соответствующий собственному значению а, то вектор ???, если он отличен от нулевого, есть также собст- собственный вектор А3, соответствующий собственному значению (а + 1), и аналогично А^о есть собственный вектор А3, соответ- соответствующий собственному значению (а — 1^. По условию леммы Агю=-аю, мы получаем в силу B13): Аъ (Ах<о) = (?? А3 + ??)? = ?? (А3г>) + Axv = = ?? (??) -f- ??<? = (? + 1) ??? и совершенно аналогично ?3(?2*0 = (?— 1) ?%?. Число различных собственных значений А3 не больше п. Среди этих значений имеется одно или несколько с наибольшей веществен- вещественной частью. Обозначим это собственное значение или одно из них, если их несколько, через у, и пусть Vj — соответствующий собствен- собственный вектор (один из них, если их несколько). В силу леммы вектор A]Vj должен был бы относиться к собственному значению (J +1), но, согласно определению у, такого собственного значения у А3 нет и, следовательно, мы должны иметь: ^0. B15) В силу доказанной выше леммы векторы: если они отличны от нуля, относятся к собственным значениям (/—1), (J — 2), ... оператора А3. Последовательность векторов B16) должна, конечно, привести к нулевому вектору, поскольку число различных собственных значений у А3 не больше п. Докажем теперь формулу где pk — некоторые целые числа. В силу B15) она верна при #=/, причем ру = О, а за i>y+1 можно взять, например, нулевой вектор. Положим теперь, что формула B17) верна при некотором из указанных
302 гл. in. основы теории групп [85 kf и докажем ее для значения (k—1), на единицу меньшего. Имеем в силу'B13), B16) и B17): AiVk.x = ?? (A&k) = (A%Al + 2 Л3) vk = = Л2 (Axvk) + 2 A9vk = Л2 (pkvk+1) + 2kvk = (pk + Щ vk. Отметим, чго при k=j мы не пользуемся при этом формулой ибо р^ = 0 при k=j. Таким образом формула B17) доказана, и чис- числа pk определяются из соотношений: Pft-i = Pft + 2?; р, = 0 (k=j, j-\, ...). Проводя последовательные вычисления, получаем: Р*=У(/+!)-*(*+IX Л^ = [/(/+1)-А(^ + 1)К+1 (k=j,j-l, ...)· B18) Пользуясь этим равенством, определим значок 5 первого из векторов B16), равного нулю, т. е. ^ = 0 и вектор г>5+1 отличен от нулевого. Из B17) при этом следует ps=0, т. е. Это квадратное относительно 5 уравнение имеет корни s=j и 5 = — (у+^)· Значение s=j не годится, ибо вектор Vj отличен от нулевого и не входит в последовательность B16). Таким образом в последовательности B16) векторы Vj, Vj_b ... , *L/+i, v-j B19) отличны от нулевого, и A$)_j = 0. Число этих векторов равно B/ —j— 1), откуда видно, что ] есть или целое неотрицательное число, или половина нечетного положительного числа. Если 2у-(-1==л, ?? мы можем принять векторы B19) за основные орты в пространстве Rm если же 2j-\-\<^nt то они образуют в Rn некоторое подпрост- подпространство L2y+i· Положим, что мы имеем последнее. Каждый вектор <ок из последовательности B19) удовлетворяет уравнению: A,vk = kvk (ft =у, у—1, ... , -у+ 1, -;). Далее мы имеем A^ok = vk^9 причем ^y_j = O, и формулу B18). Тем самым операторы Ль Л2 и Л3 переводят подпространство Lv+l в себя, и данные формулы вполне определяют указанные операторы в под- подпространстве ?2/+?· Больше того, из формул B16) и B18) непосред- непосредственно следует, что никакое подпространство Lk, лежащее в L2y+i и для которого 0<^Л<^2/-(- 1, не остается инвариантным при приме- применении операторов Л1; Л& Лз· Определив Ak) мы можем для подпрост-
86] §7. НЕПРЕРЫВНЫЕ ГРУППЫ 303 ранства Ly+i построить уравнения B04), которым должен удовле- удовлетворять вектор x = FJ(*b ?2, ?3) и B20) искомого представления в подпространстве ?2/+?· Это представление не может оставлять инвариантным никакое подпространство Lk> вхо- входящее в L2y+i, т. е. представление неприводимо в Ly+b ибо если бы это было так, то и всякое As, в силу их определения, должно было бы оставлять инвариантным Lk, что, как мы только что видели, не имеет места. Если 2у —(- 1 ===== п, то приведенное рассуждение относит- относится ко всему Rn. При 2/-|-1<^л мы отделили ог общего представ- представления в Rn неприводимое в указанном смысле представление по- порядка By~f-l), т. е. оно не оставляет инвариантным никакое подпро- подпространство Lk при 0 <^k<^2j-\-1. Из наших рассуждений непосред- непосредственно вытекает, что существует только одно с точностью до по- подобных представлений неприводимое представление данного порядка. Но в [69] мы у^ке построили унитарные неприводимые представле- представления любого порядка. Тем самым они исчерпывают всевозможные неприводимые пред- представления, и указанные выше представления, основанные на постро- построенных в ?,2/+? операторах Л5, должны быть им подобны. Векторы B19) можно умножать на произвольные численные мно- множители, отличные от нуля. При этом в соотношениях B16) и B18) также появятся численные множители. Указанные множители мож- можно подобрать так, чтобы иметь окончательно следующие соотношения: — k(k—l) vk_h B21) причем Vj+l = 0 и v_j_i = 0. При таком выборе множителей получатся те представления, которые мы построили в [69], исходя от величины ?? хх х2 /(У + ОЦУ01 V Указанное выше построение дает возможность из любого предста- представления выделять его неприводимые части. Все сводится к отысканию собственных векторов Vj оператора Л3 с наибольшим собственным значением и построению B16). 86. Представления группы Лоренца. Рассмотрим группу линей- линейных преобразований с определителем единица: х{ = axt -f- bxi (ad —be = I) B23) x'2 = cxx -\- dx%.
304 гл. ш. основы теории групп [86 Матрица преобразования содержит четыре комплексных коэффици- коэффициента, между которыми имеется одно соотношение. Произвольными остаются три комплексные величины, что сводится к шести веще- вещественным параметрам. Введем эти параметры, принимая следующее обозначение для матрицы преобразования: |f где 1 + («з («5 Мы получаем шесть бесконечно малых преобразований Гк, которые легко построить. Например, для построения 1\ надо в матрице А положить все а5, кроме аь равными нулю, продифференцировать матрицу по <*! и затем положить ?1 = 0. Таким образом, будем иметь: Л-1! °.|; ?-?? ?; Л-! о —: 10 ? 0 0 -?\ op 0 1 о о feS= о о / о Структурные постоянные ОД входящие в соотношения B08), по самому их определению должны быть вещественными и могут быть найдены из этих соотношений: 1 ??1', ?1 ; р, q=\, % .... 6). При этом надо отметить, что между матрицами Tj не существует линейного соотношения (кроме тривиального) с вещественными коэффициентами, поэтому можно получить следующие пятнадцать равенств: /;/3 - /;/; = 24 /;/; - rj[ = 2/; /;/5 _ гъгх = - 24 /;/; - rj[ = - 24 /;/; _ /;/; = - 24 /^ - /;/; = 0, /;/; — /;/;=24 /?/;—/;/?=?, /;/; ;/; гл = 2/; - /5/; = - 2/;
86] § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 805 Если Ik (k = l9 2, ..,, 6) — бесконечно малые преобразования для любого представления исследуемой группы, то между ними также имеют место пятнадцать соотношений с теми же коэффициентами ОЛ Если мы введем обозначения B25) /3 — Ц, = 2ДХ; /в — ?/? = 2?2; Л — Ц% = 4?3, то упомянутые пятнадцать соотношений записываются в следующем виде: ApBq-BqAp = 0 (p,q=l, 2, 3) B26) и, кроме того, л3 л! — лиз=аь ад — ад=ви АъАг — Л2Лз = ~ Аь B27) ДА — #2#3 = — Въ B28) Л! Л2 — А^А! = 2 Л3, ВуВ* — ??? = 2^3· Отметим, что соотношения B26) и B27) выполняются тривиально, если взять матрицы /*, ибо при этом Ла? = О (k=l, 2, 3). Соотно- Соотношения B27) совпадают с соотношениями B13) и рассуждения преды- предыдущего номера остаются по существу в силе. Мы применяем напи- написанные соотношения для бесконечно малых преобразований любого линейного представления группы B23). Если Vj — собственный век- вектор оператора Л3, относящийся к наибольшему собственному зна- значению, то имеется Bу —(— 1) собственных векторов <uk (k=J, j—1,... ..., —7+1» —J) оператора Л3, которые преобразуются операто- операторами Аь Л2, Л3 согласно формулам B21), причем г>у+1 = О и ^^==0. Пусть L^ — подпространство, образованное всеми собственными векторами оператора Л3, относящимися к собственному значению j. Покажем, что если вектор ? принадлежит L^\ то и векторы Bqv (^=1, 2, 3) принадлежат 1(/). Действительно, в силу B26): Л3 E^) = Bq (Л3Ф) = Bq (/*) =jBqv, откуда и следует, что Bqv есть собственный вектор Л3, соответ- соответствующий собственному значению j (или нулевой вектор), т. е. Bqv входит в L(;X В L(;) мы можем повторить наши рассуждения из [85], заменяя операторы Ak операторами Bk. Следовательно, можно по- построить в 1(У) ряд векторов Vjk» (k'=tftf— I,...,—У+1>—'f)> которые преобразуются согласно формулам B21) при замене j на / и А^ на В^ Каждый вектор Vjk> при повторном применении опе- операции Л2 дает B/-J-1) векторов vkk> (k=j,j — lMii, — y-j- 1,— Д
306 гл. ш. основы теории групп [87 Таким образом окончательно получается Bу —|— l)B/-f-1) векторов <ukk', для которых имеют место соотношения: B29) Эти формулы определяют в пространстве с числом измерений B/ —]— 1) B/-|-1) операторы Лр и ?? и согласно формулам B25) определяются операторы Ik, после чего уравнение B04) может при- приводить лишь к одному линейному представлению группы. Это есгь то представление, которое мы строили в [80]. В последних номерах мы следовали изложению, приведенному в книге Ван-дер-Вардена „Метод теории групп в квантовой механике". 87. Вспомогательные формулы. Вернемся к формулам из [82]. Мы имеем: причем ?5 выражается через as и % согласно формулам A89) или A92), ко- которые определяют основную групповую операцию. Составим матрицу, зави- зависящую от переменных as и ?5, ?. е. элементов группы Ga и Q^. Обозначим эту матрицу символом 5 (G^ &?), и элементы ее определим следующими фор- формулами: ' * Sik (<7?, Оа) = -3i (/, k = 1, 2, ..., г). B31) Мы уже рассматривали эту матрицу в [82] при ?5 = 0, т. е. при Ga=E, где ? — единичный элемент группы. Изучим свойства этой матрицы. Из ее определения непосредственно следует: S((?p, Я)=/. B32) Докажем еще формулу: S (С?р> Оа) · S (Е, G,) - S (Б, G?Ga). B33) Положим Ga = Gа„С7ал, так что ?? - ???? = (<?рс?в„) ??, = ????, (?? = ????,,). Применяем правило дифференцирования сложных функций откуда 5 (Op, ??,,??,) = 5 (?,, ??,) s (??? оа„).
87] § 7. непрерывные группы 307 Положив в этом равенстве Gp = ?, Ga,, = Gg и Ga, = Ga, получим равен- равенство B33). При Ga=Gpl получим выражение матрицы, обратной матрице S(E, Go): ? S-*(E, Gp) = S(Gp, Gp*)· B34) Матрица S (E, G^) в обозначениях из [82] будет S (?5) и обратная матрица будет ? ф5). Сейчас мы их будем обозначать символами S (G^) и Г ((/?): S (?, Gp) = S (??); 5-i (?, ? = ? (Gp). B35) Мы имеем: 5 (Op) Г (? = ? (? 5 (Ор) = Е. B36) Формула B33) дает: 5(О3, Ga) = S (?, GT) S-» (?, Gp) = S (GT) S-i (G ), B37) и соотношение B31) может быть записано в виде: % иЩТ*Щ. B38) 5=1 Умножая обе части на Tmi (GT) и суммируя по /, получим, в силу B36): ^. B39) 2 1=1 Дифференцируем B38) по ?/: 5, P = l S откуда, выражая ^^- согласно формуле B38): 5, р, 9 = 1 5= 1 Переставляя в правой части k и /, пользуясь независимостью левой части от порядка дифференцирования и переставляя переменные суммирования s и qt получим: ]
308 гл. ш. основы теории групп [87 Умножим обе части на произведение Stf (Go) Skg (Go) Ты (???) и просумми- просуммируем по /, k и I от 1 до г. Принимая во внимание B36), получим равно- равносильную систему равенств: 2 k, /=1 От этих равенств легко перейти к предыдущим, умножая обе части на произведение Тщ (Go) Tgkx (Go) Silh (GT) и суммируя по /, g и h. В послед- последнем равенстве левая часть зависит только от ?5, а правая — только от ?^. Таким образом, ввиду произвольности Ga в формуле B30) и тем самым независимости ?5 и ?5 обе части последней формулы должны равняться одной и той же постоянной, и, в частности: s <o^s <пЛ* дТм Меняя значки, можем написать: B40) Если положим в этом тождестве Ga = E} т. е. 0^ = 0 (s = 1, ..., г), и при- примем во внимание, что S(E)v=E, то получим: Сравнивая с формулой A99) из [82], мы видим, что С\$ суть структурные постоянные, определенные нами выше. Умножая обе части B40) на Tji (Ga) Tkm (<?*) и суммируя по i и k, получим в силу B36): (OJ. B41) Вернемся к формулам B07) и B08). Формула B08) получается, как мы видели, путем приравнивания нулю квадратной скобки формулы B07) при as = 0 (s—?,...,?). Пользуясь B41), легко показать, что из B08) вытекаетt что квадратная скобка формулы B07) равна нулю и при любых ae. Второе слагаемое этой скобки представим в виде: 2 J] I, ft=i i, k=i
881 § 7· непрерывные группы 309 причем мы не выписываем аргумента С?а у Г. Заменяя у вычитаемого ] на k и k на у, получим: Преобразуя первое слагаемое скобки формулы B07): -4^\?, Л\ согласно B41), получим непосредственно тот же результат, но с обратным знаком. Наряду с матрицей 5 (Gp Ga) рассмотрим матрицу 5' ((/«, Ga), эле- элементы которой определяются формулами: 5^=sS' (Go. <7a). B42) Совершенно так же, как и выше, можно доказать формулы: S'(E, Ga)=/, S'(GpGa, E) = S'(Gp, GJS'(Gat ?), которые нам понадобятся в дальнейшем. 88. Построение группы по структурным постоянным. В настоящем номере мы в общих чертах коснемся вопроса о построении групповой опе- операции и группы линейных преобразований по заданным структурным по- постоянным С\%\ которые удовлетворяют соотношениям A94Х) и A942). Это построение основано на одной теореме из теории уравнений с частными производными, о которой мы упоминали выше. Сформулируем сейчас эту теорему. Пусть имеется следующая система дифференциальных уравнений с ча- частными производными: Щ = Xik (Xif ""Хп] Zl> -' Zm) {Ш) (?=1, 2, ..., т; /г=1, 2, ..., ?). Напишем, пользуясь этой системой, условие того, что •? с Оно имеет, очевидно, вид: т dzs dxi dxfc ^d dzs dxk *
310 гл. ??. основы теории групп [88 или, заменяя ^- и -^~- правой частью системы B44), получим: Это равенство является соотношением между переменными х& ??. Теорема. Если функции Хф в окрестности значений xk = ?{?\ zi = zfy (и при этих значениях) непрерывны и имеют непрерывные частные произ- производные, которые входят в соотношения B45), и все эти последние соот- соотношения выполняются тождественно относительно х^ %и то система B44) при начальных условиях имеет решение и притом единственное. Тождественное выполнение всех соотношений B45) при наличии указан- указанных условий непрерывности называется обычно условием полной интегри- интегрируемости системы B44). Опишем теперь схему построений групповой опе- операции и группы линейных преобразований по заданным структурным постоянным. Итак, пусть заданы постоянные Cjy^, где f, k, р= 1, 2,..., г, причем эти постоянные удовлетворяют соотношениям A94Х) и A942). Если решить систему B41) относительно частных производных, то можно проверить, что упомянутые соотношения являются условиями полной интег- интегрируемости системы B41). Таким образом, существует единственная матрица ?((/?) с элементами Tpn(Ga) (/?, q=\, 2, ..., г), которая обращается в еди- единичную матрицу при иа = Е, т. е. при as = 0 (s = 1, 2, ..., г), и удовле- удовлетворяет системе B41). Имея ? (<7?), мы можем построить и обратную матрицу 5 (??) = Г (<7а). Для построения групповой операции обращаемся к систе- системе B38). Правые части этих уравнений — известные функции ?5 и ?5 (s=l, 2, ..., г). Можно проверить, что система B41) выражает условия полной интегрируемости системы B38). Следовательно, существует единственное решение системы B38), которое удовлетворяет начальным условиям Построенное решение и дает групповую операцию. Начальные условия вы- выражают тот факт, что элемент ??, определяемый формулой B30), обращается в Ga при ?5 = 0 (s = l, ..., г). Переходим теперь к построению группы линейных преобразований, т. е. группы матриц заданного порядка по струк- структурным постоянным, причем, как указано выше, мы имеем уже матрицу ? (Ga). Как мы показали в [83], условия полной интегрируемости B04) или системы B05) сводятся к тождественному равенству нулю квадратной скобки уравнения B07) при любом выборе значков, а эти последние условия вы- выполнены, как мы показали в [87], если матрицы 1$ удовлетворяют соотно- соотношениям B08). Таким образом, решение задачи должно начинаться с построе- построения матриц /5 заданного порядка, удовлетворяющих соотношениям B08). Это сложная алгебраическая задача. Имея матрицы IS1 мы можем уже утверждать, что система B05) имеет единственное решение, удовлетворяющее начальным условиям B06). Это решение и дает группу матриц с заданными структурными постоянными [\
89] § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 311 Можно показать, что интегрирование системы B41) при начальных усло- условиях ? (?")=/ сводится к интегрированию системы обыкновенных линейных дифференциальных уравнений с постоянными коэффициентами. Сформулируем соответствующий результат. Построим систему линейных обыкновенных диф- дифференциальных уравнений с постоянными коэффициентами: где bik = Q при 1фк, &н = 1 и ?1( ?2, ..., аг считаются заданными постоян- постоянными. При этом функции Tikia^^Wtk @ удовлетворяют системе B41) и начальному условию Г (?)==/. Подробное рассмотрение вопроса о построе- построении непрерывной группы по заданным структурным постоянным так же, как и исследование других вопросов теории непрерывных групп, можно найти в книге Л. С. Понтрягина „Непрерывные группы". 89. Интегрирование на группе. В [76, 77] мы доказывали ряд соотно- соотношений, которые содержат суммы некоторых величин, зависящих от элементов группы, причем суммирование распространялось на все элементы 1руппы. В случае непрерывной группы суммирование заменяется интегрированием по параметрам, определяющим элементы группы. Положим, что непрерывная Fpynna G такова, что при некотором выборе параметров, этой группе в ве- вещественном r-мерном пространстве Тг определяемой параметрами alf ос2, ..., аг, соответствует ограниченная замкнутая область V (область вместе с ее границей), так что всякому элементу из G соответствует определенная точ- точка К и наоборот. Внутри области V функции <ру(?о ..., ??; ait ..., ar)f опре- определяющие групповую операцию, считаются непрерывными и достаточное число раз дифференцируемыми. Кроме того, эти функции и их производные считаются непрерывными вплоть до границы V. Зависимость параметров ??, соответствующих элементу С?, от параметров as также считается непре- непрерывной. Группы с такими свойствами называются обычно компактными. Для определения интегрирования на группе рассмотрим определитель матри- матрицы S' (Gg, Ga) [87] и введем для него следующее обозначение; B46) Из B43) непосредственно следует: ?'(?, С?а) = 1, B47t) ?' ((????, ?) = ?' ((??, Ga). ?' (Gai ?). B472) Обозначая V (G^) = ?' (<7?, ?), можем написать: ?' (Q G) —Ь' (G&G*> B4&) Отсюда, принимая во внимание, что ?'(?) = ?'(?, ?) = 1, получаем: ?' (О, Ga) == ь, fQ . B49) Введем еще одно «обозначение: W (GJ = ?' (?-1, C7J. B50)
312 ГЛ. III. ОСНОВЫ ТЕОРИИ ГРУПП [89 В силу сделанных выше предположений и и' (Ga) есть непрерывная функция в замкнутой области V. Она не обращается в нуль, ибо есть также непрерывная функция. Принимая во внимание, что и'(Е) = \, можем утверждать, что ur (Ga) и ? (Ga) — положительные функции. То же можно утверждать, в силу B48), и относительно ?' (<7о, Ga). Пусть/(C/a) ==/(aj, ..., ar) — любая непрерывная в замкнутой области V функция. Определим интеграл от этой функции на группе G формулой: (аи ..., аг) и' (Ga) daL ...dan B51) где интеграл, стоящий справа, есть обычный интеграл по области V. Дока- Докажем, что такой интеграл обладает следующим свойством левой инвариантности: или в координатах $/(«1 «r)e' B52) ...dar, B53) где Op — любой фиксированный элемент группы G. Для доказательства за- заменим в интеграле, стоящем в левой части, переменный элемент Оа пере- переменным элементом ??, полагая Ga = GaG8, причем область изменения параметров 8,, ..., Ьг по-прежнему V. Определитель преобразования будет и' (Ga)' и мы получим: Это и совпадает с B53). Замена в правой части Ga на Gb несущественна. Аналогично строится правоинвариантный интеграл. Введем определитель матрицы 5 (Go, Ga): B54) Как и выше, имеем: ? (Gp, Ga) = ?(??, E) = l, где Z(Ga) = A(E, Ga). Вводится положительная функция . . / Х-» \ А А / V» *~* 1 \ B55) B56)
89] § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 313 и интеграл определяется формулой: \/ (аи ···» <*/·)« (Оа) dat... darz=z f / (Ga) doa. B57) ? q Волна сверху знака дифференциала отличает этот интеграл от интеграла B51)» При этом имеет место свойство правой инвариантности: B58) Докажем теперь, что замена Ga на С? под знаком подынтегральной функции влечет преобразование левоинвариантного интеграла в правоинва- риантный и обратно. Дифференцируем равенство G? = GaG^ записанное в параметрах, по aSi причем во всех дальнейших формулах мы считаем G0=(?-1; 5=1 'ар* и, принимая во внимание B46) и B45), получаем: Можно дать другое представление этого определителя. Из равенства = 1 следует или, меняя местами G и С?: ¦ »' (Од) B60) B61) Обращаемся теперь к интегралам. Совершая обычным образом замену переменных интегрирования, получим, пользуясь B60): I /(«1. ¦ J dp» ...dp, /(?? ...,Pr)K'(Ga)^rdpI...dpr. Сокращая на и' (Ga) и заменяя переменный элемент G* переменным элемен- элементом Gat получим: 1...i/ar=f/(a1, ..., а,) и' ... dar B62) Совершенно так же, принимая во внимание формулу B61), получим: (??· -? «г) И' (О.) if^ ... €far = J/(alf ..., ar)u(QJdai...dar. B63)
314 ГЛ. Ш. ОСНОВЫ ТЕОРИИ ГРУПП [89 До сих пор мы не использовали компактности группы. Область V может быть и бесконечной. Но при этом надо предполагать функцию /(аи ..., <*г) такой, что все написанные интегралы имеют смысл. Сейчас, пользуясь ком- компактностью, мы докажем, что и (Ga) = и' (Ga). Для этого рассмотрим опре- определитель B64) где (?? = ^ и докажем формулу „ О*»)- B65) Мы можем написать: где GV = G~K '?^?' ??? Wk , а потому г 1 ??? г i 'J-! =D(GV, 0.,) D (Op, О.,.), откуда и следует B65). Положив в этой формуле <2р = ??, получим D (Е, Оа„ О.,) = D (Е, О..) D (Я, О„„). B66) Если мы введем численную функцию элемента: ? (Ga) = D (?, (??), B67) то, в силу B66), можем написать: ? (Ga,,Ga,) = ? (Gа„) ? (Сга,), B68) т. е. перемножение элементов означает умножение соответствующих значе- значений функции ? (Ga). Мы имеем, очевидно: ? (?) = 1 И ? (<3?) ? (<?- !) = 1, B60) ? функция ? (Ga) непрерывна и положительна в замкнутой области V. Используя компактность группы, докажем сейчас, что ? (<7?) = 1 для лю- любого элемента Gа. Положим, что для некоторого элемента Ga мы имеем ? (Gg) ? 1. Если, например, ? (G?) < 1, то в силу B69): ? (С?) > 0, и мы можем считать всегда, что ? (<7?) > 1. При этом ? ((?*) = [? (G^Y1 — ОО При П — СО. Это противоречит тому, что непрерывная в замкнутой области V функция ? (<7?) должна быть ограниченной. Переходим теперь к установлению связи между м(Gа) и и'(Gа). Пусть ?=? ? = о? (Gaae) аа = ??-??? <??=ggj. Мы имеем: ду ^^(Ор, OJ. Но, с другой стороны:
89] т. е. Г т. е. § 7. НЕПРЕРЫВНЫЕ ГРУППЫ ? (Gat С?а) = D (GaGat Ga) · ?' (Ga) Ga). Полагая G?=(?-1, получим: ? «??, Ga) = D(E, QJ-A'(Qa,Qz*), 315 при любом Ga, ибо ?((??) = 1. Таким образом для компактных групп лево- инвариантный интеграл B51) совпадает с правоинвариантным интегралом B57). Кроме того, из B62) или B63) следует, что этот интеграл совпадает также с интегралом \(аи ... , ar) U' (Ga) da, ... dar Для некомпактных групп левоинвариантный интеграл может быть отличным от правоинвариантного. В качестве примера рассмотрим группу линейных преобразований вида: где ах и а2 меняются от (— оо) до ( + схз). В данном случае г = 2 и V есть вся плоскость. Композиция двух преобразований дает: т. е. 2; alf aj^ 2; «?, «2)= Единичному элементу соответствуют параметры a1==a2 = 0. Элементе?^1 имеет параметры ?? = — aif ?2 = — a2e~~ai* Вычисляем функциональные оп- определители: 1,0 = *·'; b'(Ga) = ^ai; u'(Ga)=e-a>> ?'(??> Ga) = ? (Gp, G?) = 0, ea* It ^???2 0, 1 Левоинвариантный интеграл имеет вид: — оо —оо и правоинвариантный интеграл: -|-оо 5 / (?? — 00 —00 Отметим, что при доказательстве равенства правоинвариантного и лево* инвариантного интегралов, т. е. равенства и (Ga) = и' (С/а), можно требование компактности группы заменить другим требованием. Пусть G' — подгруппа, состоящая из элементов G, которые имеют вид: а,0О?0? B70)
316 гл. ш. основы теории групп [90 или получаются из таких элементов путем их перемножения, причем Ga и ?? — любые элементы G. Нетрудно видеть, что если некоторый элемент <3? содержится среди элементов B70), то и обратный элемент G~l содержится среди элементов B70). Точно так же и элемент G^G (??, при любом выборе (?? из G, содер- содержится среди элементов B70). Иначе говорят, что подгруппа о' порождается элементами B70). Из сказанного выше следует, что G' является нормальным делителем G. Подгруппа G' приводится к единичному элементу в том и только в том случае, если все элементы B70) суть единичные элементы, т. е. в том ? только в том случае, когда G есть абелева группа. Подгруппа G' может ъ совпадать с G. В частности, это будет иметь место, если G есть не абелева, простая группа. Подгруппа G' называется обычно коммутантом группы G. И Из определения B68) и B69) следует, что ? (GJ3 G~1G^1) = 1, что ? (G ) = 1 для всех (?т из G' и что ? (С?а) имеет одинаковое значение для всех элементов, принадлежащих одной и той же совокупности по группе G', т. е. что функция ? (Ga) имеет определенное значение для всякого элемента дополнительной к G' группы. Если G' совпадает с С?, то ? (Ga) = 1 при любом (?а из G. То же имеет место, если упомянутая выше дополнительная группа компактна. Но раз ) = 1, то и (GJ = 90. Свойство ортогональности. Примеры. Свойство правой и левой инвариантности интеграла аналогично в случае конечных групп тому свой- свойству, что при переменном элементе Gs и фиксированном элементе (?/ произ- произведение GsGt или GfGs пробегает по одному разу все элементы "группы. Этим свойством мы пользовались при доказательстве того, что всякое представление группы эквивалентно унитарному представлению и при дока- доказательстве свойств ортогональности. Пользуясь инвариантным интегралом, можно доказать аналогичные предложения и для компактных групп. Если A (G^—унитарные матрицы, дающие неприводимое линейное представление компактной группы G, и В (Ga) — унитарные матрицы, дающие неэквивалентное неприводимое представление, то, обозначая, как всегда, двумя значками снизу элементы матриц, мы будем иметь следующие формулы, выражающие ортого- ортогональность неэквивалентных неприводимых унитарных представлений: {А «?«)}</ {ВШ)ы и (Ga) da,... dar = 0. B71) Для одного неприводимого представления получим (Ga) da,... dar, B72) ==b-i^iL С a где р — порядок матриц. Точно так же для характеров: ? я где ? и q —порядок матриц A (Ga) и В (Ga), имеют место следующие свойства: ч ... d<xr = 0, B73) r=\ a U (Ga) dat... dar = \и (Ga) d*x ... dar. B74)
90] § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 317 1. Перейдем к рассмотрению примеров. Пусть G — абелева группа вращения плоскости вокруг начала. Дленеег=1 и единственный параметр ? дает величину угла поворота. Будем ечитать, что ? принадлежит промежу- промежуток @, 2?), причем концы этого промежутка отождествляются. Последова- Последовательные вращения на углы аи ? приводят к вращению на угол ? —j—а, причем^ вычитая, если надо, 2?, мы должны привести эти суммы к указанному про- промежутку» В рассматриваемом случае функциональные определители ? (Go, ??) и ?'((/?, Ga) сводятся к производной от ? + ? по ? или а, равной единице, так что a (Ga) = и' (GJ = 1. Мы знаем, что группа Q имеет неприводимые унитарные представления первого порядка eima (m = 0, ±1, it 2,...), и фор- формулы C57) и C58) дают известные формулы: 2тс 2тс С eimp-hwfa = С ei(mi -т2) Ча = ( ри тх ? т2у 2? при тх = /и2. о Отметим, что в силу необходимости приведения суммы ? + ? к промежутку (О, 2?), мы имеем некоторую особенность в непрерывности и определении производных этой суммы в тех случаях, когда для ? и ?, лежащих внутри промежутка @, 2?), сумма оказывается равной 2?. 2. Рассмотрим группу вращения трехмерного пространства и применим параметры, несколько отличные от тех, о которых мы говорили в [84]. Пусть пространство повернулось на угол ? вокруг оси, которая образует углы ?, ? и ? с осями координат ?, ? и ?. Введем четыре параметра: а0 = cos ;г- ?; ах = cos ? sin ~- ?; а2 = cos ? sin ^ ?; аь = cos ? sin ~- ?. B76) Они связаны соотношением Единичному преобразованию соответствуют значения tfo= I, al = a2 = ai = 0. Мы можем принять aXt a2y аг за параметры. При этом а0 считается их функцией. Если произвести последовательно вращения, определяемые параметрами (aOf 0j, a2i a8) и (b0, bu b2i bg)t то параметры результирующего вращения (с0, си с2, св) определятся, как нетрудно проверить, формулами: с0 = aobo — a^i — a2b2 — агЬ&, с2 = аф2 — aj>z + a2b0 + azbly t ? t ? t и h Л~ h h -\- h ' ^ Считая а0 функцией аи a2i a8, получим, в силу B77): откуда -^-? = 0 для ?. Пользуясь этим, мы можем легко составить функцио- функциональный определитель при Ьо = \, Ь1 = Ь2 = Ьй = 0: D а0 —а8 а2 D (bit b2i — ?2 ах aQ
318 гл. hi. основы теории групп [90 Инвариантный интеграл имеет вид: \ / («?, ал, аг) Х = da, da, dab. B79) J Y\ — a\ — a\ — a\ Область V есть сфера с центром в начале координат и радиусом единица. Отметим, что формулы B78) непосредственно получаются из правила умно- умножения кватернионов причем единицы /, ] и k подчиняются следующему закону умножения: Нетрудно установить связь между параметрами (а01 аи а2, ав) и углами Эйлера ?, ?, ?. Приведем соответствующие формулы: а0 = cos у ? cos у (а + ?)»* «2 = sin у ? sin ? (? — ?); ai = sin у ? cos у (? — ?)? аз = cosy ? sin у (? + ?). Инвариантный интеграл в параметрах (?, ?, ?) записывается при этом в виде: / (?, ?, ?) sin ? sin2 у (а - ?) da d$ ??, B80) I причем 0 ^ а < 2?, 0 ^ 8 < ?, 0 ^ ? < 2?. Отметим, что в интеграле B79) функция I I ?, |/1_??_??_?. обращается в бесконечность, если ? = ?. Это связано с тем, что в форму- формулах B76) для ait a2t аь вместо ? стоит sin у ?. Отметим в связи с этим, что те свойства, о которых говорилось в [89] в связи с определением компакт- компактности, должны быть выполнены лишь при некотором выборе параметров. При перемене параметров эти свойства могут уже потеряться. Кроме того, для группы вращения трехмерного пространства будет иметь место особенность в непрерывности и определении производных, о которых мы уже упоминали в конце первого примера в связи с группой вращения плоскости вокруг начала. Отметим еще, что совпадение инвариантных интегралов для группы вращения пространства может быть непосредственно связано с тем, что это — простая не абелева группа. 3. Легко непосредственным вычислением проверить совладение лево- инвариантного и правоинвариантного интеграла для группы Лоренца, которая, как мы видели, гомоморфна группе линейных преобразований с определи- определителем единица: t , . J о ?-t" ? «. 1 (? flfl2 = 1), B81) ?%^?2?±-\-???% ? Единичному элементу соответствуют значения #0 = #3 = 1, ai-=a2-=^. Можно считать а0 функцией alt ?2, ?? и принять за параметры веществен- вещественные и мнимые части величин аи а2 и аь—1. Групповая операция сводится к умножению матриц второго порядка, и мы имеем: ». B82)
90] § 7. НЕПРЕРЫВНЫЕ ГРУППЫ 319 Если положить ak=-a'k-\-ia'fr (k — 0, 1, 2, 3), то параметрами группы будут V а2' аз' аГ' а2» аз* Полагая Далее ^? = ?^ + ??^ и сл = 7^-[~г*7л> мы для 0ПРе~ деления инвариантного интеграла должны вычислить функциональные опре- определители: D Gi> Ъ> Тз> Tf» 7?, 7?) ппи о, ft, *, R, «, ?. ft, , ^(Pi» Pa» Рз» Pi» Рл Ps) J 2 x 2 3 или 72> 7з» 7?» 7?» 7?) При aj = ?^ = af == aj == aj === 0; ?^ = 1, ^ («?, «?, «?? «Г, причем несуществен тот факт, что «3 = 1, а не нулю для тождественного· преобразования группы. В обоих случаях мы получаем один и тот же инва- инвариантный интеграл: » а2> «3, «?? «?, ??) >ъ l ^„a ^«? ^?2 rftt3» ^?? rf«J d«i- B83) I- Область Кесть полное шестимерное пространство. Совпадение инвариантных, интегралов связано с тем, что для группы B81) подгруппа G\ образованная производящими элементами GJ3 G^^1, о которой мы говорили в [89], сов- совпадает с самой группой. Нетрудно показать, действительно, что G' не сво- сводится к тождественному преобразованию или к нормальному делителю, обра- образованному элементами ? и (— ?). Фактическое вычисление плотности в инва- инвариантном интеграле B83) можно просто провести на основании леммы, в которой используется понятие аналитической функции нескольких комплекс- комплексных переменных (см. главу IV второй части этого тома). Лемма. Пусть ws = us-f-ivs (x = 1, 2, ..., k) суть аналитические функции комплексных переменных zs=zxs-\-iys (s ===== 1, 2, ...,/г). При этом функциональный определитель функций (uuvl9 ..., Uk,vk) no переменным (х1Уу1У ..., х^Ук) ровен квадрату модуля функционального определителя функций по (wu ..., Wk) no переменным (zl9 ..., гь). Мы имеем (см. главы I и IV второй части этого тома) дщ _ и можем написать: D(UuOu...t UkiVk) где dvt дщ r~~di an Ьц al2 bl2 ... ахь b^ — bn an—bi2 a12 ... —bik alk — bki aki— bkk <*kk дщ h дщ lk~~dxk* lk dxk' Добавляя к каждому нечетному столбцу четный, умноженный на/,полу- на/,получим определитель: сп bn ci2 bi2 ... cik b icn an ic12 a12 ... icik a cki icki bkk akk
320 ГЛ. III. ОСНОВЫ ТЕОРИИ ГРУПП [90 Далее, отнимая от каждой четной стороны строки нечетную, умноженную на /, получим; Cli #11 0 Тп Cki bki 0 Cki c12 b12 о Tl2 ck* bk* о ^ ... clk btk ... 0 c1k ... сум #да ... 0 Ckk Вынося налево все нечетные столбцы и наверх все нечетные строки, •будем иметь: сп с12 ... clk bn b12 ... blk c*i Cki 0 Ck2 0 ... cak ... cM ... 0 #21 #22 ·« ^•· ·· *2ft • bkk 0 0 ... 0 откуда и следует D(xuyu...t Ckk cTk cTk СЛЛ D(wu ..., />(«ll .··, «*) Переходим к вычислению функции и (С?а) в инвариантном интеграле. Для этого, согласно лемме, надо вычислить функциональный определитель: «ли D (Ьи b2t Ьл) D (Си с2, сь) при ?0 = ?8 = 1; Ь1=^Ь2 = 0 при а0 = аь = 1; ах = а2 = 0. D (elf a2, a3) Из соотношения аоав — ata2 = О следует: dcii dct2 r Далее имеем: B84) B85) v 8 — h * _ J* — О* д ___ и откуда и следует B83). Тот же результат мы получим и на основании фор- формулы B84)
АЛФАВИТНЫЙ УКАЗАТЕЛЬ Абелева группа 189, 208, 240 Адамара оценка 63 Алгебраическое дополнение 18, 21 Антисимметрическая функция 49 Бесселя неравенство 168, 174 Билинейная форма 147 Буняковского неравенство 116, 117 Вандермонда определитель 26, 49 Вековое уравнение 64, 65 Вектор, ковариантная составляющая 90 — ковариантный афинный 87 —, контравариантная составляющая 90 — контравариантный афинный 87 Векторы взаимно ортогональные 53 — в л-мерном пространстве 47 — линейно-независимые 48, 49 Гомоморфные группы 217 Градиент функции 88 Грамма определитель 60 , оценки 63 Группа абстрактная 205 — вращения, простота 252 — диэдра порядка ? 283 — компактная 311 — линейных преобразований 188 — перестановок 203 знакопеременная 203 — простая 215 — циклическая 191 Дискриминант квадратичной формы 137 Дифференцирование матрицы 294 Замкнутости уравнение" 174, 176 обобщенное 174, 175 Изоморфные группы 217 Индекс подгруппы 210 Интеграл левоинвариантный 312 — правоинвариантный 312 Интегральный оператор 185 Квадратичная форма, закон инерции знакопеременная 134 знакопостоянная 134 , матрица 121 определенно отрицательная 133 положительная 133 Класс группы 212 Коммутант группы 316 Коммутирующие зрмитовские матри- матрицы 148 Композиция линейных представлений 261 Контраградиентное преобразование 86 Крамера теорема 38 Лапласа теорема об определителях Линейное преобразование 76, 96 Линейные формы 45 линейно-зависимые 45 линейно-независимые 45 , полная система 46, 47 Линейный оператор 183 Лоренца преобразование 196 общее 198 положительное 201 Матрица (таблица) 80 — диагональная 84, 97 — единичная 80, 81, 97 — квазидиагональная 103 — кратная единичной 237, 238 — неособая 96
322 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Матрица подобная 98 — проектирования 156 — прямоугольная 33 — самосопряженная 179 — сопряженная (эрмитовски) 102 — транспонированная 86 — эрмитовская 123 Минор определителя 18, 20 главный 28 Неявные функции, теорема 73 Норма (длина) вектора 54, 166 — функции 181 Нормальный делитель группы 213 Обратный элемент группы 206 Обращение системы функций 75 Объекты линейного представления 233 Ограниченное преобразование 177 Определитель, вычисление 21 —, обозначение 10, 17 —, правило знаков 14, 15 —функциональный 68 Ортогональные преобразования 112 Параметры Кейли-Клейна 227 Перестановка 11 — обратная 201, 202 — основная 13, 14 Пифагорова теорема 54, 167, 172 Подгруппа 208 — подобная 213 Подобная группа матриц 193 Подпространство дополнительное ор- ортогональное 57 — пространства векторов 51, 52, 104 Полином от матрицы 160 Полная система векторов 174 функций 182 Полнота векторов, условие 176 Порядок группы 210 — элемента группы 206, 207 Предел переменного вектора 168 Представление линейное группы би- однозначное 232 вращения 249 и уравнение Лапласа 253 неприводимое 234 приведенное 234 унитарной с двумя перемен- переменными 242 эквивалентное 242 Представление линейное прямого произведения групп 264 Преобразование неособое 96 — обратное 81 — подобное 86 — прямоугольных координат 77 — симметрии относительно начала 79 — собственное 80 — тождественное 80, 97 Преобразования группы бесконечна малые 295 Приведение матриц к канонической форме ПО унитарных к диагональной форме Проекция вектора в подпространство 57, 156 Произведение матриц 82 прямоугольных 34 — перестановок 202 — преобразований 82, 96 Пространство Гильберта 165 Прямее произведение групп 264 матриц 259 Ранг матрицы 33 — системы форм 46 Рациональная дробь от матрицы 161 Регулярное представление группы 281 Сарруса правило 22 Система линейных уравнений 36, 38 — однородная 42 1 интерпретация 55 ______ __> линейно-независимые решения 44 , нулевое решение 42, 43 — - союзная 58 , принцип наложения реше- решений 44 Скалярное произведение векторов 53, 111, 166 функций 181 Сопряженные относительно подгр>п- пы совокупности 209 Сочетательный закон для матриц 83 Степень матрицы 101 Структурные постоянные группы ?5?
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 323 Тензор второго ранга ковариантный 90 - контравариантный 90 • смешанный 90, 91 — деформации 95 — напряжения 94 Транспозиция в перестановке 12 Треуюльника правило 117 Умножение определителей 29 Унитарные преобразования 112, 178 Унитарный оператор 184 Фактор-группа 215 Функциональный оператор 183 Фурье коэффициенты 167 Характеристические числа км ти ной формы 137 матрицы 106 унитарной 153 Характеристическое уравнение м рицы 105, 106 Характеры представлений 276, 211 Шредингера уравнение 263 Эйлера углы 79 Элементарные делители 109 Эрмита форма 118 Эрмитовский оператор 184 Ядро гомоморфизма 219 — оператора 185
Владимир Иванович Смирнов Курс высшей математики, том III, часть I М., 1974 г., 324 стр. с илл. Редактор И, Е. Морозова Техн. редактор А, П. Колесникова Корректора О. А. Бутусова и Т. Д. Доверман Печать с матриц. Подписано к печати 12/VI I974 г. Бумага 60Х901/16, тип. № 3. Физ. яеч. л. 20,25. Условн. печ. л. 20,25. Уч.-изд. л. 19,34. Тираж 50 000 экз. Цена книги 84 коп. Заказ № 223. Издательство «Наука» Главная редакция физико-математической литературы 117071, Москва, В-71, Ленинский проспект, 15 Отпечатано в ордена Трудового Красного Зна- Знамени Ленинградской типографии № 2 им. Евге- Евгении Соколовой Союзполиграфпрома при Государ- Государственном комитете Совета Министров СССР ?? делам издательств, полиграфии и книжной тор- торговли, 198052, Ленинград, Л-52, Измайловский пр., 29, с матриц ордена Трудового Красного Знаме· ни Ленинградской типографии № 1 «Печатный Двор» имени А. М. Горького Союзполиграф- Союзполиграфпрома при Государственном комитете Со- Совета Министров СССР по делам издательств* полиграфии и книжной торговли Ленинград,. Гатчинская ул., 26.