Author: Кострикин А.И.  

Tags: алгебра  

Year: 1977

Text
                    AM. КОСТРИКИН


ВВЕДЕНИЕ В АЛГЕБРУ
и

А. И. КОСТРИКИН
ВВЕДЕНИЕ В АЛГЕБРУ
Допущено Министерством высшего и среднего специального образования СССР в качестве учебника для студентов университетов
ИЗДАТЕЛЬСТВО <НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
Москва 1977
517.1
К 72
УДК 512.8
АННОТАЦИЯ
В основу учебника положен курс лекций по высшей алгебре, читавшийся в течение ряда лет на механико-математическом факультете МГУ. В книге изложены, наряду с традиционными вопросами, общие свойства отображений множеств и бинарных отношений, группы преобразований,структурные свойства простейших групп, встречающихся на практике, элементы теории представлений, вопросы делимости в кольцах, первичные сведения о конечных полях и о полях алгебраических чисел. Кроме большого числа примеров в тексте, в книгу включено более 200 упражнений, многие из которых снабжены краткими указаниями к решению.
Книга, написанная в соответствии с новой программой по алгебре, является учебникохМ для студентов младших курсов университетов и пединститутов.
20203-126
14 053(02)-77
© Главная редакция физико-математической литературы издательства «Наука», 1977
ОГЛАВЛЕНИЕ
Предисловие.................................................. 8
Советы читателю..............................................II
ЧАСТЬ I. ОСНОВЫ АЛГЕБРЫ............................ 13
Дополнительная литература ....................... 13
Глава 1. Истоки алгебры ................................... 14
§ 1.	Алгебра вкратце................................... 15
§ 2.	Некоторые модельные задачи........................	19
1.	Задача о разрешимости уравнений в радикалах ... 19
2.	Задача о состояниях многоатомной молекулы .... 21
3.	Задача о кодировании сообщения...................22
4.	Задача о нагретой пластинке......................23
§ 3.	Системы линейных уравнений. Первые шаги............23
1.	Терминология.....................................24
2.	Эквивалентность линейных систем..................26
3.	Приведение к ступенчатому виду...................28
4.	Исследование системы линейных уравнений.........29
5.	Отдельные замечания и примеры....................32
§ 4.	Определители	небольших	порядков ...................33
Упражнения...........................................37
§ 5.	Множества и	отображения ..........................  38
1.	Множества	..................................38
2.	Отображения .....................................41
Упражнения..........................................46
§ 6.	Отношения эквивалентности. Факторизация отображений 47
1.	Бинарные отношения...............................47
2.	Отношение эквивалентности........................48
3.	Факторизация отображений.........................49
4.	Упорядоченные множества..........................51
Уп	ражнения.........................................52
§ 7.	Принцип математической индукции ...................53
§ 8.	Арифметика целых чисел.............................57
1.	Основная теорема арифметики......................57
2.	НОД и НОК в Z....................................59
3.	Алгоритм деления в Z.............................59
Упражнения..........................................61
Глава 2. Арифметические линейные пространства. Матрицы . 62
§ 1.	Арифметические линейные пространства................62
1.	Мотивировка ......................................62
2.	Основные определения..............................63
3.	Линейные комбинации. Линейная оболочка ...........65
4.	Линейная зависимость..............................67
4
ОГЛАВЛЕНИЕ
5.	Базис. Размерность..............................68
Упражнения..........................................71
§ 2.	Ранг матрицы ......................................72
1.	Возвращение к уравнениям.........................72
2.	Ранг матрицы.....................................73
3.	Критерий совместности............................76
Упражнения..........................................77
§ 3.	Линейные отображения. Действия с матрицами.........79
1.	Матрицы и отображения............................79
2.	Произведение матриц.............................82
3.	Квадратные матрицы..............................84
Упражнения..........................................90
§ 4.	Пространство решений ..............................92
1.	Решения однородной линейной системы..............92
2.	Линейные многообразия. Решения неоднородной системы 95
3.	Ранг произведения матриц.........................97
4.	Классы эквивалентных матриц......................98
Упражнения.........................................102
Глава 3. Определители ....................................104
§ 1.	Определители: построение и основные свойства.....104
1. Построение методом полной индукции..............104
2. Основные свойства определителей.................108
Упражнения.........................................114
$ 2.	Дальнейшие свойства определителей................115
1.	Разложение определителя по любому столбцу .... 115
2.	Свойства определителей относительно столбцов . . . . 116
3.	Транспонирование определителя..................117
4.	Определители специальных матриц.................120
5.	К построению теории определителей...............123
Упражнения.........................................124
§ 3.	Применения определителей.........................125
1.	Критерий невырожденности матрицы ...............125
2.	Вычисление ранга матрицы.......................129
Упражнения ........................................130
Глава 4. Алгебраические структуры (группы, кольца, поля) 133
§ 1.	Множества с алгебраическими операциями . . . 0 . . . 133
1.	Бинарные операции...............................133
2.	Полугруппы и моноиды ...........................134
3.	Обобщенная ассоциативность;	степени.............136
4.	Обратимые элементы..............................138
Упражнения.........................................138
§ 2.	Группы ...........................................139
1.	Определение и примеры ..........................139
2.	Системы образующих..............................142
3.	Циклические группы..............................143
4.	Симметрическая и знакопеременная	группы.........146
Упражнения.........................................155
§ 3.	Морфизмы групп....................................156
1.	Изоморфизмы.....................................156
2.	Гомоморфизмы....................................160
ОГЛАВЛЕНИЕ
5
3.	Словарик. Примеры ..............................162
4.	Смежные классы по подгруппе.....................164
5.	Мономорфизм Sn ->GL (и).........................168
Упражнения.........................................171
§ 4.	Кольца и поля....................................172
1.	Определение и общие свойства колец..............172
2.	Сравнения. Кольцо классов вычетов...............176
3.	Гомоморфизмы й идеалы колец.....................178
4.	Понятие о факторгруппе и о факторкольце........179
5.	Типы колец. Поле................................183
6.	Характеристика поля ............................187
7.	Замечание о линейных системах ..................190
Упражнения......................,..................192
Глава 5. Комплексные числа и многочлены...................194
§ 1.	Поле комплексных чисел...........................194
1.	Вспомогательная конструкция ...................194
2.	Комплексная плоскость...........................196
3.	Геометрическое истолкование действий с комплексными числами...........................................197
4.	Возведение в степень и извлечение корня.........200
5.	Теорема единственности..........................203
Упражнения . . ,...................................205
§ 2.	Кольцо многочленов..............................206
1.	Многочлены от одной переменной..................207
2.	Многочлены от многих переменных.................212
3.	Алгоритм деления с остатком.....................216
Упражнения.........................................218
§ 3.	Разложение в кольце многочленов .................220
1.	Элементарные свойства делимости................220
2.	НОД и НОК в кольцах............................224
3.	Факториальность евклидовых	колец...............226
4.	Неприводимые многочлены........................229
Упражнения.........................................232
§ 4.	Поле отношений ..................................233
1.	Построение поля отношений целостного кольца .... 233
2.	Поле рациональных дробей.......................236
3.	Простейшие дроби...............................238
Упражнения.........................................241
Глава 6. Корни многочленов............................... 243
§ 1.	Общие свойства корней........................... 243
1.	Корни и линейные множители	. ..................243
2.	Полиномиальные функции.........................246
3.	Дифференцирования кольца	многочленов...........248
4.	Кратные множители...............................250
5.	Формулы Виета...................................253
Упражнения........................................255
§ 2.	Симметрические многочлены........................257
1.	Кольцо симметрических многочленов.............257
2.	Основная теорема о симметрических многочленах . . . 258
3.	Метод неопределенных коэффициентов............261
6
ОГЛАВЛЕНИЕ
4.	Дискриминант многочлена........................265
5.	Результант ....................................267
Упражнения................*........................271
§ 3.	Алгебраическая замкнутость поля С.................272
1.	Формулировка основной теоремы..................272
2.	Поле разложения многочлена.....................274
3.	Доказательство основной теоремы................278
§ 4.	Многочлены с вещественными	коэффициентами.........282
1.	Разложение на неприводимые множители в R [X] . . 282
2.	Проблема локализации корней многочлена.........283
3.	Устойчивые многочлены..........................289
Упражнения.........................................290
ЧАСТЬ II. ГРУППЫ. КОЛЬЦА. МОДУЛИ .........................293
Дополнительная литература..............................293
Глава 7. Группы ..........................................294
§ 1.	Классические группы малых размерностей............294
1.	Общие определения..............................294
2.	Параметризация групп SU (2), SO (3)............296
3.	Эпиморфизм SU (2) ->SO(3)......................298
4.	Геометрическое изображение группы SO (3).......300
Упражнения.........................................301
§ 2.	Действие групп на множествах......................301
1.	Гомоморфизмы G-+S(Q)...........................301
2.	Орбиты и стационарные подгруппы точек..........303
3.	Примеры действий групп на множествах...........305
4.	Однородные пространства........................309
Упражнения.........................................310
§ 3.	Некоторые теоретико-групповые конструкции.........312
1.	Общие теоремы о. гомоморфизмах групп...........312
2.	Разрешимые группы..............................316
3.	Простые группы ................................319
4.	Произведения групп.............................321
5.	Образующие и определяющие соотношения .........324
Упражнения.........................................330
§ 4.	Теоремы Силова....................................332
Упражнения.........................................338
§ 5.	Конечные абелевы группы.........................  339
1.	Примарные абелевы группы.......................339
2.	Основная теорема о конечных	абелевых группах . . . 343
Упражнения.........................................346
Глава 8. Элементы теории представлений....................347
§ 1.	Определения и примеры линейных	представлений . . . .’351
1.	Основные понятия...............................351
2.	Примеры линейных представлений.................356
Упражнения.........................................361
§ 2.	Унитарность и приводимость .......................362
1.	Унитарные представления........................362
2.	Полная приводимость............................365
Упражнения.........................................368
ОГЛАВЛЕНИЕ
7
§ 3.	Конечные группы вращений..........................369
1.	Порядки конечных подгрупп в SO (3).............369
2.	Группы правильных многогранников	....372
Упражнения.........................................375
§ 4.	Характеры линейных представлений..................376
1.	Лемма Шура и ее следствие ......................376
2.	Характеры представлений ....................... 379
Упражнения.........................................385
§ 5.	Неприводимые представления конечных групп........386
1.	Число неприводимых представлений...............386
2.	Степени неприводимых представлений	. ...389
3.	Представления абелевых групп...................391
4.	Представления некоторых специальных	групп .... 394
Упражнения.........................................397
§ 6.	Представления групп SU (2) и SO (3)...............400
Упражнения.........................................404
§ 7.	Тензорное произведение представлений..............404
1.	Контрагредиентное представление ............... 404
2.	Тензорное произведение представлений............406
3.	Кольцо характеров...............................410
4.	Инварианты линейных групп.......................413
Упражнения.........................................418
Глава 9. К теории полей, колец и модулей..................420
§ 1.	Конечные расширения полей........................420
1.	Примитивные элементы и степени	расширений .... 420
2.	Изоморфизм полей разложения....................424
3.	Конечные поля .................................427
4.	Формула обращения Мёбиуса и ее	применения .... 431
Упражнения.........................................437
§ 2.	Отдельные результаты о кольцах ..................438
1.	Новые примеры факториальных колец...............438
2.	Теоретико-кольцзвые конструкции................443
3.	Теоретико-числовые применения..................445
Упражнения.........................................449
§ 3.	Модули ..........................................452
1.	Первоначальные сведения о модулях...............452
2.	Свободные модули...............................457
3.	Целые элементы кольца .........................460
Упражнения.........................................461
§ 4.	Алгебры над полем................................462
1.	Определения и примеры алгебр....................462
2.	Алгебры с делением (тела)......................465
3.	Групповые алгебры и модули над	ними....468
4.	Неассоциативные алгебры........................475
Упражнения.........................................480
Дополнение. Жорданова нормальная форма матриц .... 482
Предметный указатель......................................493
ПРЕДИСЛОВИЕ
Эта книга написана без всяких претензий на оригинальность. Ее цель—отразить в систематическом изложении реально сложившийся за последние годы курс алгебры, читаемый студентам механико-математического факультета Московского университета. Вполне естественная эволюция стандартных программ привела к необходимости хотя бы частичной модернизации учебной литературы по алгебре.
К сожалению, живая ткань лекций при письменном изложении обросла столь многочисленными деталями и так деформировалась, что невольно вспоминается ироническое высказывание Бернарда Шоу: «Учебник можно определить как книгу, непригодную для чтения. Тем, что я остался совершенно необразованным человеком, я обязан тому, что никогда не мог читать учебники. И время, которое мне полагалось тратить на чтение учебников, я тратил на чтение настоящих книг—книг, написанных людьми, которые действительно умеют писать, чего никогда не бывает с авторами учебников» (1933 г., Из лекции, прочитанной в Гонконге). Слабое утешение состоит в том, что Б. Шоу, мыслящий весьма парадоксальными категориями, говорил не о математике.
Формально книга разделена на две части, которые в первом приближении отвечают курсам алгебры, читаемым соответственно в первом и третьем семестрах. В части II предполагается, что читатель свободно владеет теорией абстрактных векторных пространств и линейных операторов, — материалом, который изучается в курсе линейной алгебры и геометрии второго семестра. Впрочем, арифметические линейные пространства векторов-строк излагаются в главе 2, ряд понятий линейной алгебры определяется по ходу дела в тексте, а небольшое дополнение содержит геометрическую теорию приведения матрицы к жордановой нормальной форме. Таким образом, книгу можно изучать независимо от других источников.
Значительная роль отведена упражнениям, помещенным в конце большинства параграфов. При наличии прекрасных сборников задач по алгебре казалось неразумным делать упор на числовые расчеты, поэтому упражнения носят преимущественно теоретический характер
ПРЕДИСЛОВИЕ
9
и служат развитию основной темы. В ряде случаев на них имеются ссылки в основном тексте, но все такие упражнения снабжены подробными указаниями к их решению. Рекомендуется в эти указания заглядывать пореже и только после настойчивых самостоятельных попыток решения.
Вероятно, трудно рассчитывать на то, что весьма скромного количества лекционных часов окажется достаточным, чтобы охватить содержание всей книги. Это особенно относится к части II, материал которой нельзя отнести к традиционному по своему характеру. Этот материал дает достаточно пищи интуиции, но кое-какие «деликатесы» (вроде теоремы Силова, инвариантов линейных групп, представлений группы вращений или неассоциативных алгебр) сознательно рассчитаны на любителей в качестве основы для дополнительных занятий.
По-видимому, после изучения довольно трудной главы 7 следует ориентироваться либо на элементы теории представлений (глава 8), либо на общую теорию колец, модулей, полей, частично затронутую в главе 9 (углубляться в структурные вопросы мы не имели возможности). Первый вариант кажется более предпочтительным не только из-за своей геометрической направленности и близости к курсу второго семестра, но и потому, что знание основных фактов теории представлений групп весьма полезно математикам, специализирующимся не обязательно по алгебре. Крайне желательно идею представлений групп, выраженную в книге на незначительном конкретном материале, закрепить более содержательным спецкурсом. В качестве примерных тем можно назвать теорию Галуа; группы, порожденные отражениями, включая кристаллографические группы; представления компактных групп и т. д. С другой стороны, глава 9 с ее теоретикочисловым уклоном в большей степени отвечает существующим учебным планам. Какой бы вариант ни был избран, он заложит фундамент для последующего изучения алгебры*).
В этом месте следует четко оговорить одно обстоятельство, не столь очевидное для студента-первокурсника. Курс высшей алгебры, вопреки своему названию, ни в коей мере не отражает всего многообразия современной алгебры. Именно поэтому книга названа введением в алгебру. Еще одно назначение этого введения — быть поставщиком понятий и результатов, необходимых в других математических курсах. Насколько важно научиться алгебраическому языку, можно понять, лишь попробовав обойтись без него в самостоятельных занятиях математикой.
*) Небольшие списки дополнительной литературы, не претендующие на полноту, помещены в начале каждой части книги.
10
ПРЕДИСЛОВИЕ
Несмотря на свой элементарный характер, традиционный курс алгебры представляет определенные трудности для усвоения из-за навязываемого им формального характера мышления. Автор постоянно Имел это в виду и стремился подчеркнуть связи алгебры с другими разделами математики. Достойно сожаления, что за пределами книги остались элементы теории категорий и частично упорядоченных систем. Но представлялось совершенно неразумным уподоблять вводный курс конгломерату абстрактных понятий, неизвестно для чего заготавливаемых впрок и убивающих интерес к предмету изучения ввиду беглости изложения.
Многие из мыслимых вариантов обязательного курса алгебры, ограниченного и направляемого стандартной программой, «проигрывались» на механико-математическом факультете МГУ. Можно надеяться, что настоящая реализация в книжной форме одного из последних вариантов курса окажется полезной для студентов и преподавателей других вузов, а также для лиц, впервые приступающих к самостоятельному изучению алгебры. Разумеется, порядок и полнота изложения в лекционном курсе материала книги будут находиться в сильной зависимости от конкретной обстановки и от сложившихся традиций преподавания.
Автор многим обязан опытному коллективу преподавателей кафедры высшей алгебры МГУ и благодарит тех, кто дал ряд полезных советов по изложению курса. Все последующие конструктивные предложения и сообщения о замеченных неточностях или опечатках будут приняты с большой признательностью.
А. Кострикин Звенигород, июль 1976 г.
ЧИТАТЕЛЮ
Согласно общему плану, изложенному в предисловии, схема зависимости глав имеет следующий вид:
8
9
(пунктирная стрелка указывает на слабую зависимость). Понятно, что искушенному читателю (скажем, преподавателю или студенту второго курса) будет нетрудно начинать чтение практически с любого места, естественно, — при наличии готовности обращаться время от времени к определениям в предыдущих параграфах и главах. Не все новые понятия вводятся в абзацах, начинающихся словом «Определение». Подробное оглавление и предметный указатель помогут найти нужное место в книге.
Каждая глава разбита на несколько параграфов, а каждый параграф— на несколько пунктов с собственными названиями. Внутри параграфа теоремы, предложения, леммы, следствия имеют свою собственную нумерацию: теорема 1, теорема 2, лемма 1, лемма 2, ... С этой примитивной, но весьма наглядной и экономной нумерацией при ссылках на утверждения из другого параграфа приходится писать теорема i § j или даже теорема i § j гл. к, однако это не вызывает неудобств.
Конец доказательства (или его отсутствие) отмечается знаком |.
Для сокращения используются простейшие логические символы. Знак импликации => в записи А => В имеет простую смысловую нагрузку, что «Д влечет В» или «из А следует В», в то время как «А&В» означает эквивалентность высказываний А и В (... тогда
12	СОВЕТЫ ЧИТАТЕЛЮ
и только тогда, когда ...). Квантор всеобщности У служит заменой выражения «для всехъ. Остальные обозначения понятны из контекста.
Ниже приводится целиком греческий алфавит с указанием произношения букв. Наблюдаемая здесь путаница досадна, поскольку буквы греческого алфавита весьма употребительны в математике.
ГРЕЧЕСКИЙ АЛФАВИТ
А а	В ₽	Г V	А 6	Е е	Z с	н Т]	0 0
Альфа	Бета	Гамма	Дельта	Эпсилон	Дзета	Эта	Тэта
I 1	К х	л %	М и	N V	S В	О о	П л
Йота	Каппа	Ламбда	Мю	Ню	Кси	Омикрон	Пи
р р	2 о	Т т	Г V	Ф ср	X X		Q (о
Ро	Сигма	Тау	Ипсилон	Фи	Хи	Пси	Омега
«Алгебра щедра — зачастую она дает больше, чем у нее спрашивают»
(Д а л а м б е р)
ЧАСТЬ I
ОСНОВЫ АЛГЕБРЫ
Эту часть можно считать алгеброй в миниатюре. Фундаментальные понятия группы, кольца, поля, непривычные для начинающего студента, вводятся по возможности неформально и в минимальных дозах, хотя общее количество производных понятий получается довольно большим. Их не нужно запоминать: они станут привычными после самостоятельной работы над задачами и упражнениями. Для удобства выделяется несколько наиболее употребительных алгебраических систем (группы (Z, + ), Sn, Ап, GL(n), SL(n); кольцо многочленов; поля Q, R, С и Zp), на фоне которых демонстрируется язык алгебры. По традиции и по соображениям преемственности между школой и вузом вначале излагается техника матриц и определителей, используемая для отыскания и исследования решений систем линейных уравнений. На этом пути естественным образом возникают и основные алгебраические структуры.
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
1.	ван дер Варден Б. Л., Алгебра, «Наука», 1976.
2.	Виноградов И. М., Основы теории чисел, «Наука», 1972.
3.	Дэвенпорт Г., Высшая арифметика, «Наука», 1965.
4.	Курош А. Г., Курс высшей алгебры, «Наука», изд. 7—12. 5.|Ленг С., Алгебра, «Мир», 1968.
б. Проскуряков И. В., Сборник задач по линейной алгебре, «Наука», 1974.
7. Фаддеев Д. К., Соминский И. С., Сборник задач по высшей алгебре, «Наука», 1972.
14
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
Глава 1
ИСТОКИ АЛГЕБРЫ
С чего начинается алгебра? С некоторым приближением можно сказать, что истоки алгебры кроются в искусстве складывать, умножать и возводить в степень целые числа. Формальная, но далеко не очевидная и не однозначная замена чисел буквами позволяет действовать по аналогичным правилам в пределах гораздо более общих алгебраических систем. Стало быть, попытка ответить исчерпывающим образом на поставленный вопрос увела бы нас не только в глубь веков, в тайны зарождения математической мысли. Более трудная часть ответа была бы связана с описанием основных структур алгебры наших дней: групп, колец, полей, модулей и т. п. Но этому как раз и посвящена вся книга, так что цель главы 1 кажется пока недостижимой.
К счастью, под абстрактной оболочкой большинства аксиоматических теорий алгебры скрываются вполне конкретные задачи теоретического или практического характера, решение которых служило в свое время счастливым, а иногда и неизбежным поводом к далеко идущим обобщениям. В свою очередь, развитая теория давала импульс и средства к решению новых задач. Сложное взаимодействие теоретических и прикладных аспектов теории, присущее всей математике, в алгебре проступает весьма отчетливо и делает в какой-то мере оправданным принятый нами концентрический стиль изложения.
После кратких общих замечаний, связанных с историей предмета, мы сформулируем несколько задач, предваряющих содержание последующих глав. Одна из этих задач послужит отправной точкой для изучения систем линейных уравнений, теории матриц и теории определителей. Мы изложим метод Гаусса и получим первые сведения о решениях линейных систем.
Уже на этом этапе полезно ввести стандартные обозначения и терминологию, для чего мы дадим сжатый обзор теории множеств и отображений.
Будут введены важные понятия отношения эквивалентности и факторизации отображений. Далее, в связи с разъяснением принципа математической индукции устанавливаются элементарные комбинаторные соотношения.
АЛГЕБРА ВКРАТЦЕ
15
§ U
Наконец, приводимые в последнем параграфе простейшие арифметические свойства системы целых чисел не только используются в дальнейшем, но и являются прототипом для построения аналогичной арифметики в более сложных алгебраических системах.
Материал этой главы не выходит далеко за пределы школьной программы. От читателя требуется лишь готовность встать на несколько более общую точку зрения. Чтение можно начинать с § 3.
§ 1. Алгебра вкратце
В наши дни не без основания говорят об «алгебраи-зации» математики, т. е. о проникновении идей и методов алгебры как в теоретические, так и в прикладные разделы математики. Такое положение вещей, ставшее совершенно отчетливым к середине XX столетия, наблюдалось отнюдь не всегда. Как всякая область человеческой деятельности, математика подвержена влиянию моды. Мода на алгебраические методы вызвана существом дела, хотя увлечение ею иногда переходит разумные границы. А так как алгебраическая оболочка, затмевающая содержание,— не меньшая беда, чем элементарное забвение алгебры, то не случайно достоинством той или иной книги уже считается (вполне резонно) умение ее автора избежать перегруженности алгебраическим формализмом.
Если отвлечься от крайностей, то алгебра издревле составляла существенную часть математики. То же самое следовало бы сказать и о геометрии, но мы скроемся за крылатой фразой Софи Жермен (XIX век): «Алгебра — не что иное, как записанная в символах геометрия, а геометрия — это просто алгебра, воплощенная в фигурах». С тех пор положение изменилось, но, кажется, «признано, что «природа» математических объектов есть, в сущности, дело второстепенное и что довольно неважно, например, представили ли мы результат в виде теоремы «чистой» геометрии или при помощи аналитической геометрии в виде алгебраической теоремы» (Н. Бурбаки).
В соответствии с принципом «важны не математические объекты, а отношения между ними» алгебра определяется (несколько тавтологически и совершенно непонятно для непосвященного) как наука об алгебраических
16
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
операциях, выполняемых над элементами различных множеств. Сами алгебраические операции выросли из элементарной арифметики. В свою очередь, на основе алгебраических соображений получаются наиболее естественные доказательства многих фактов из «высшей арифметики»—теории чисел.
Но значение алгебраических структур — множеств с алгебраическими операциями далеко выходит за рамки теоретико-числовых применений. Многие математические объекты (топологические пространства, дифференциальные уравнения, функции нескольких комплексных переменных и др.) изучаются путем построения надлежащих алгебраических структур, если и не адекватных изучаемым объектам, то, во всяком случае, отражающих их существенные стороны. Нечто подобное относится и к объектам реального мира.
Определенное мнение на этот счет было высказано более 45 лет назад одним из творцов квантовой механики П. Дираком: «... Современная физика требует все более абстрактной математики и развития ее основ. Так, неевклидова геометрия и некоммутативная алгебра, считавшиеся одно время просто плодом воображения или увлечения логическими рассуждениями, теперь признаны весьма необходимыми для описания общей картины физического мира».
Алгебраические средства весьма полезны при исследовании элементарных частиц в квантовой механике, свойств твердого тела и кристаллов (в этой связи особенно важна теория представлений групп), при анализе модельных задач экономики, при конструировании современных ЭВМ и т. д. и т. п.
В свою очередь, алгебра питается живительными соками других дисциплин, в том числе математических. Так, например, гомологические методы алгебры выросли из недр топологии и алгебраической теории чисел.
Не удивительно поэтому, что облик алгебры и точка зрения на алгебру менялись в разные эпохи. Мы не имеем возможности проследить подробно за этими изменениями не только из-за недостатка места, но главным образом потому, что описание истории предмета должно быть конкретным,— требование, которому можно удовлетворить лишь при основательном знакомстве с самим предметом.
§ 1J
АЛГЕБРА ВКРАТЦЕ
17
Ограничимся схематическим перечислением имен и периодов.
Древние цивилизации Вавилона и Египта. Греческая цивилизация. «Арифметика» Диофанта (III в н. э.).
Восточная цивилизация средних веков. Сочинение уроженца Хивы Мухаммеда ибн Муса ал-хорезми (ок. 825 г.) «Хисаб ал-джабр ва-л-мукабала».
Арифметические действия на множествах целых и рациональных положительных чисел. Алгебраические формулы в геометрических и астрономических расчетах. Формулировка задач на построение (об удвоении куба и трисекции угла), занимавших алгебраические умы в гораздо более позднее время.
Алгебраические уравнения первой и второй степени. Возникновение самого термина «алгебра».
Эпоха возрождения и Ренессанса.
Фибоначчи (Леонардо из Пизы) (ок. 1170—1250)
С. Ферро	(1465—1526)
Н. Тарталья	(1500—1557)
И. Кардано	(1501—1576)
Решение общих алгебраических уравнений 3-й и 4-й степени.
Л. Феррари Ф. Виет Р. Бомбелли
(1522—1565) (1540—1603) (1530—1572)
Создание современной алгебраической символики.
XVII—XVIII вв.
Р. Декарт П. Ферма И. Ньютон Г. Лейбниц Л. Эйлер Ж. Даламбер Ж.-Л. Лагранж Г. Крамер П. Лаплас Вандермонд
(1596—1650) (1601 — 1665) (1643—1727) (1646—1716) (1707-1783) (1717—1783) (1736-1813) (1704—1752) (1749—1827) (1735—1796)
Возникновение аналитической геометрии— прочного мостика между геометрией и алгеброй.
Оживление деятельности в теории чисел.
Развитие алгебры многочленов. Интенсивные поиски общих формул для решений алгебраических уравнений. Первые подходы к доказательству существования корня уравнения с числовыми коэффициентами.
Начала теории определителей.
XIX в. — начало XX в.
К. Ф. Гаусс	(1777—1855)
П. Дирихле	(1805—1859)
Э. Куммер	(1810—1893)
Л. Кронекер	(1823—1891)
Доказательство основной теоремы о существовании корней уравнений с числовыми коэффициентами. Интенсивное развитие теории алгебраических чисел.
18
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
Р. Дедекинд	(1831-1916)
Е. И. Золотарев Г. Ф. Вороной А. А. Марков П. Л. Чебышев Ш. Эрмит Н. И. Лобачевский А. Гурвиц	(1847—1878) (1868—1908) (1856—1922) (1821—1894) (1822—1901) (1792—1856) (1859—1919)
А. Руффини Н. X. Абель К. Якоби Э. Галуа 0. Риман Б. Коши К. Жордан Л. Сйлов	(1765—1822) (1802—1829) (1804—1851) (1811—1832) (1826—1866) (1789—1857) (1838—1922) (1832—1918)
Г. Грассман	(1809—1877) Д. Сильвестр	(1814—1897) А. Кэли	(1821 — 1895) У. Гамильтон	(1805—1865) Дж. Буль	(1815—1864) С. Ли	(1842—1899) Г. Фробениус	(1849—1918) Ж. Серре	(1819—1885) М. Нётер	(1844—1922) Д. А. Граве	(1863—1939) А. Пуанкаре	(1854—1912) Ф. Клейн	(1849—1925) У. Бернсайд	(1852—1927) И. Шур	(1885—1941) Г. Вейль	(1885—1955) Ф. Энриквес	(1871 —1946) Дж. Нейман	(1903—1957) Д. Гильберт	(1862—1943) Э. Картан	(1869—1951) К. Гензель	(1861—1941) Э. Штейниц	(1871—1928) Э. Нётер	(1882—1935) Э. Артин	(1898—1962) Дж. Биркгоф	(1884—1947) Н. Бурбаки «Элементы математики».	
Поиски методов приближенного решения алгебраических уравнений. Условия на коэффициенты, обеспечивающие заданное расположение корней.
Решение проблемы о неразрешимости общих уравнений степени п^=5в радикалах. Развитие теории алгебраических функций. Создание теории Галуа. Начала теории конечных групп, преимущественно на базе групп перестановок.
Интенсивное развитие методов линейной алгебры.
Возникновение, после открытия кватернионов, теории гиперкомплексных систем (такие системы теперь называются алгебрами). В частности, в связи с развитием теории непрерывных групп (групп Ли) были заложены основы теории алгебр Ли. Важными главами математики стали алгебраическая геометрия и теория инвариантов. В XIX в. математика еще не достигла тонкой дифференциации и многие крупные ученые творчески работали в различных ее областях.
Первая половина XX столетия была отмечена коренной перестройкой всего здания математики. Алгебра, отказавшаяся от привилегии быть наукой об алгебраических уравнениях, решительно встала на аксиоматический и гораздо более абстрактный путь развития.
Вошел в обиход язык теории колец, модулей, категорий, гомологий. Многие разрозненные теории уложены в общую схему универсальной алгебры. На стыке алгебры и математической логики родилась теория моделей. Старые теории обновились, расширив область своих применений. Примером здесь могут служить современная алгебраическая геометрия, алгебраическая топология, алгебраическая Х-теория, теория алгебраических групп. Несколько ярких взлетов испытала теория конечных групп.
§2]
НЕКОТОРЫЕ МОДЕЛЬНЫЕ ЗАДАЧИ
19
Вся алгебра находится сейчас в состоянии динамического развития. Крупные заслуги в этом принадлежат советским математикам. Высокий уровень алгебраических исследований в нашей стране многим обязан таким ученым, как Н. Г. Чеботарев (1894—1947), О. Ю. Шмидт (1891—1956), А. И. Мальцев (1909—1967), А. Г. Курош (1908—1971), П. С. Новиков (1901 — 1975).
§ 2. Некоторые модельные задачи
Формулируемые ниже четыре задачи стоят на разных уровнях. Первые три, сами по себе тоже неравноценные, предназначены исключительно для мотивировки исследования полей разных типов, линейных пространств, групп и их представлений, т. е. тех алгебраических теорий, о которых речь будет ниже. «Решениям» этих задач посвящено много специальных монографий. Четвертую задачу, предваряющую изучение линейных систем, полезно попробовать тут же решить, не заглядывая в следующий параграф, где приводится нужное рассуждение.
1.	Задача о разрешимости уравнений в радикалах.
Из элементарной алгебры известна формула
= (1)
для решений xlt х2 квадратного уравнения ах2 + Ьх + 4“ с — 0.
Уравнение третьей степени x3 + ax24-^ + ^ = 0 подстановкой —у а приводится к виду х3 + рх + с = 0. Это приведенное уравнение всегда имеет три корня х19 х2, х3. Если положить
D = —4р3 — 27</2,	е =	,
« = V+	V= У(2)
(кубические корни выбираются так, что uv = —Зр), то можно показать, что
%! = -!-(« + у), х2 = -|-(е2ы + е'и), х3 = у (е«4-е2у). (3)
Формулы (2) и (3), называемые формулами Кардано
20
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
(1545 г.) и ассоциирующиеся также с именами других итальянских математиков эпохи Возрождения (С. Ферро, Н. Тарталья), равно как и формула (1), справедливы при любых буквенных коэффициентах a, b, с, р, qt которым можно придать, например, произвольные рациональные значения. Аналогичные формулы были найдены для корней уравнения четвертой степени и на протяжении почти трехсот лет предпринимались безуспешные попытки «решить в радикалах» общее уравнение пятой степени. Лишь в 1813 г. А. Руффини (в первом приближении) и в 1827 г. Н. Абель (независимо и совершенно строго) доказали теорему о том, что общее уравнение хп + а1хп~1 + ... + ап = 0 при п > 4 неразрешимо в радикалах. Фундаментальное открытие в этой области было сделано двадцати летним Эваристом Галуа в 1831 г. (оно стало известным лишь в 1846 г.), когда он дал универсальный критерий для разрешимости в радикалах любого (например, с рациональными коэффициентами), а не только общего уравнения степени п.
Каждому многочлену (уравнению) степени п он сопоставил поле разложения и конечное семейство (мощности не более /г!) автоморфизмов этого поля, называемое теперь группой Галуа поля (или исходного многочлена). Хотя мы и лишены возможности останавливаться более подробно на теории Галуа, в гл. 7 будет выделен чисто внутренними свойствами специальный класс так называемых разрешимых групп. Оказывается, что уравнение степени п с рациональными коэффициентами разрешимо в радикалах в точности тогда, когда разрешима соответствующая ему группа Галуа. Пусть, например, дано уравнение пятой степени х5—ах—1=0, где а — некоторое целое число. Ему отвечает группа Галуа Ga, зависящая каким-то сложным образом от a. Go—циклическая группа порядка 4 (а все циклические группы разрешимы по определению) и уравнение х5.—1=0, конечно, разрешимо в радикалах. Напротив, Gt имеет то же строение, что и симметрическая группа S6 порядка 120, а последняя, как показано в гл. 7, неразрешима. Следовательно, неразрешимо в радикалах и уравнение х5—х — — 1=0.
Отметим в заключение, что для практических нужд возможность выразить корень алгебраического уравне-
§ 21	НЕКОТОРЫЕ МОДЕЛЬНЫЕ ЗАДАЧИ	21
пия в явном виде через радикалы существенного значения не имеет; более актуальны разные приближенные методы вычисления корней. Но это обстоятельство не умаляет красоты достижения Галуа, оказавшего сильнейшее идейное воздействие на последующее развитие математики. Начать с того, что именно Галуа заложил основы теории групп. Установленное Э. Галуа взаимно однозначное соответствие между подполями поля разложения и подгруппами его группы Галуа в XX веке обогатилось новыми абстрактными конструкциями и стало незаменимым средством исследования математических объектов.
2.	Задача о состояниях многоатомной молекулы. Каждую молекулу можно рассматривать как систему частиц — атомных ядер (окруженных электронами). Если в начальный момент времени конфигурация системы близка к равновесной, то при определенных условиях частицы, входящие в систему, всегда будут оставаться вблизи положений равновесия и не будут приобретать больших скоростей. Движения такого типа называются колебаниями относительно равновесной конфигурации, а система— устойчивой. Известно, что любое малое колебание молекулы вблизи положения устойчивого равновесия является суперпозицией так называемых нормальных колебаний. Во многих случаях удается определить потенциальную энергию молекулы и ее нормальные частоты, принимая во внимание внутреннюю симметрию молекулы. Симметрия молекулярной структуры описывается точечной группой молекулы. Различные реализации этой конечной группы (ее неприводимые представления) и связанные с этими реализациями функции на группе (характеры представлений) определяют параметры колебаний молекулы.
Например, молекуле воды Н2О (рис. 1) отвечает четверная группа Клейна (прямое произведение двух циклических групп второго порядка), а молекуле фосфора Р4 (рис. 2), имеющей вид правильного тетраэдра, в вершинах которого расположены атомы фосфора,— симметрическая группа S4 порядка 24. Неприводимые представления этих групп будут изучены в гл. 8. В настоящее время развитие структурной теории молекул трудно себе представить без помощи теории групп.
22
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
Гораздо более ранние применения теории групп относятся к кристаллографии. Еще в 1891 г. великий русский кристаллограф Е. С. Федоров, а затем немецкий ученый А. Шёнфлис нашли 230 пространственных кристаллографических групп, описывающих все имеющиеся
в природе симметрии кристаллов. С тех пор теория групп постоянно используется для исследования влияния симметрии на физические свойства кристалла.
3.	Задача о кодировании сообщения. В конструировании автоматических систем связи, наземных или космических. обычно в качестве элементарного сообщения берется упорядоченная последовательность — строка (или слово) 6Z = (6Zlt tf2, . . ., ап) длины и, где az = 0 или 1. Так как обычные операции сложения и умножения по модулю 2 хорошо приспособлены для выполнения на электронной машине, а сами символы 0, 1 удобны для передачи в виде электрических сигналов (1 и 0 отличаются фазой разделенных по времени сигналов или их наличием и отсутствием), то неудивительно, что поле GF (2) (см. § 4 гл. 4) — необходимый атрибут специалиста по переработке информации. Иногда удобно использовать в качестве az элементы других конечных полей.
С целью исключения влияния помех (атмосферных разрядов, космических шумов и т. д.), способных превратить 0 в 1 и обратно, приходится брать а достаточно длинным и использовать специальную систему кодирования— выбор такого подмножества (кода) SQ передаваемых строк (кодовых слов) из всего их множества S, чтобы было возможно восстановить а по полученному искаженному слову а', при условии, что произошло не слишком много ошибок. Так возникают коды, исправляющие ошибки. Алгебраическая теория кодирования, сильно развившаяся за последние годы и предложившая много остроумных
§ 3]
СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. ПЕРВЫЕ ШАГИ
23
методов кодирования, имеет дело в основном со специальными линейными кодами, когда выбор So связан с построением специальных прямоугольных матриц и решением систем линейных уравнений, коэффициенты которых принадлежат заданному конечному полю. Простой пример такого кода будет приведен в гл. 5.
4.	Задача о нагретой пластинке. Плоская прямоугольная пластинка с тремя отверстиями (рис. 3) используется в качестве клапана одного фантастического устройства для получения низких температур. На клапан
Рис. 3.
нанесена квадратная сетка (решетка). Ее вершины, лежащие на четырех контурах, называются граничными, а все остальные вершины — внутренними. Непосредственное измерение показывает, что при любом нагревании или охлаждении температура в каждой внутренней вершине является средней арифметической величиной от температур ближайших четырех вершин — неважно, граничных или внутренних. Ожидается, что детали устройства, соприкасаясь с различными участками контуров, сообщат соответствующим граничным точкам указанную на рис. 3 температуру. Возможно ли это, а если возможно, то однозначно ли при этом распределение температуры во внутренних точках?
§ 3. Системы линейных уравнений. Первые шаги
Линейные уравнения ах = Ь и системы вида
ах + Ьу = е, cx + dy = f
с вещественными (действительными) коэффициентами а, Ь, с, d, е, f «решаются» в средней школе. Наша цель —
24
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
научиться оперировать с системой линейных алгебраических уравнений (или коротко: с линейной системой) самого общего вида:
^11^1	^12-^2 “!“••• + ^1п^п ~ ^1»
Я21Х1Я22Х2 4“ • • • ~\~а2п^п ~ ^2»	(2)
*4" ^/й2^2 4~ • • • 4" ^тп^п ~ Ь/тг
Здесь т и п— произвольные целые положительные числа. Будучи, казалось бы, чисто количественным, усложнение, получающееся при переходе от (1) к (2), имеет на самом деле принципиальное значение. Системы вида (2) встречаются буквально во всей математике и так называемые линейные методы, конечным продуктом которых часто являются решения линейных систем, составляют ее наиболее развитую часть. Достаточно упомянуть, что теория систем вида (2) послужила в конце XIX века прототипом для создания теории интегральных уравнений, играющей исключительно важную роль в механике и физике. Решение большого числа практических задач на ЭВМ также сводится к системам (2).
1.	Терминология. Следует обратить внимание на весьма экономное и удобное обозначение коэффициентов системы (2): коэффициент а^ (читается а-и-жи; например, а12 есть а-один-два, но никак не а-двенадцать) стоит в Z-м уравнении при /-й неизвестной х,-. Число &z называется свободным членом i-ro уравнения. Система (2) называется однородной, если ftz = 0 для Z = l, 2, ..., т. При любых Ь; линейную систему
^и-^1 Н" ^12^2 4-... 4- а1пхп ~
^21^1 4“^22-^2 4“ • • • 4“ ^2п^п	0,	(2')
4“ ^/л2^2 4- ... 4- ^тп^п О называют однородной системой, ассоциированной с системой (2), или еще — приведенной системой для системы (2).
Коэффициенты при неизвестных составляют прямоугольную таблицу
аи а12 • • • ат
а21	а22	• • • а2п	(3)
ат1 ат2 • • • атп
§3]
СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. ПЕРВЫЕ ШАГИ
25
называемую матрицей размера тхп (mxn-матрицей или квадратной матрицей порядка п при т = п) и сокращенно обозначаемую символом (az/) или просто буквой А. Естественно говорить об Z-й строке (aZ1, ai2, ...» ain) матрицы (3) и о /-м столбце
a2f
ат / который в дальнейшем, ради экономии места, будет изображаться строкой, заключенной в квадратные скобки: [ai/> а2/> • • •» amj\ В случае квадратной матрицы говорят еще о главной диагонали, состоящей из элементов ап, а22> •••> апп- Матрица (az/), у которой все элементы вне главной диагонали равны нулю, обозначается иногда символом diag(ап, а22, ...,апп) и называется диагональной матрицей, а при ап = а22 = ... =апп = а — символом diag„ (а) (скалярная матрица). Для обозначения матрицы diag„ (1), называемой единичной матрицей, обычно используется символ Еп или буква Е, когда размер матрицы фиксирован.
Наряду с матрицей (3) рассматривают еще расширенную матрицу (at-j | системы (2), получаемую из (3) добавлением столбца [дх, Ь2, ..., Ьт] свободных членов; для ясности он отделен от остальных столбцов вертикальной чертой.
Если каждое из уравнений системы (2) обращается в тождество после замены неизвестных xz числами xz, то набор из п чисел %2, •••, х°п называется решением системы (2), a xz — i-n компонентой решения. Говорят также, что набор х[, х2, .. ., х°п удовлетворяет всем уравнениям системы (2). Система, не имеющая ни одного решения, называется несовместной. Если же у системы есть решения, то она называется совместной и притом — определенной, коль скоро решение единственно. Решений может быть и более одного: тогда система называется неопределенной. Совместна ли данная система линейных уравнений, а если совместна, то каковы все ее решения,— вот ближайшие вопросы, на которые нужно получить ответ.
26
ИСТОКИ АЛГЕБРЫ
[ГЛ. И
Посмотрим еще раз на задачу п. 4 § 2. Пронумеруем все внутренние точки пластинки произвольным образом от 1 до 416 (именно столько их на рис. 3), добавим к ним 204 номера граничных точек и, в соответствии с заданным правилом вычисления температуры t[ во внутренней точке с номером /, составим 416 соотношений типа
У___
с	/	+	+
---- 4
Л
Пусть, скажем, a, Ь, с^416, a d > 416. Тогда это соотношение можно переписать в виде линейного уравнения
сЛ~ е~^d
с правой частью t^ — —273, —100, —50, 0, 50, 100 или 300 (возможны и другие варианты). Взятые вместе эти уравнения составят квадратную линейную систему вида (2) с п = /и = 416. Коэффициенты при неизвестных равны 0 (их большинство), —1 или 4.~Является ли эта система совместной и определенной? Мы получили иную, математически точную формулировку задачи качественного характера. Вопрос о существовании и единственности весьма типичен для многих разделов математики, связанных с изучением физических явлений.
2.	Эквивалентность линейных систем. Пусть нам дана еще одна линейная система «того же размера»
^1%! + a'L2x2 + ... + aLnxn = b[, - - •	...........- - • -	(2')
+ • • • + ^тп^п ~ Ьггг
Будем говорить, что система (2'),получена из (2) при помощи элементарного преобразования типа (I), если в системе (2) все уравнения, кроме f-го и й-го, остались прежними, a /-е и /?-е уравнения поменялись местами. Если же в (2') все уравнения, кроме z-го, те же, что и в (2), а /-е уравнение системы (2') имеет вид
(ал + сак1) х, + ... + (ain + сакп) xn = b{ + cbk,	(*)
где с — какое-то число (т. е. =	+ b'l — bi+cb^,
то полагаем, что к системе (2) применено элементарное преобразование типа (II).
Линейные системы (2) и (2') называются эквивалентными, если обе они либо несовместны, либо совместны и обладают одними и теми же решениями.
Условившись обозначать эквивалентность систем (а) и (Ь) символом (а) ~ (Ь), мы замечаем, что (а) ~ (а), из
1| -| СИСТЕМЫ ЛИНЕЙНЫХ УРАБ НЕНИЙ. ПЕРВЫЕ ШАГИ 27
(//) ~ (Ь) следует (Ь) ~ (а), а из (а) ~ (&) и (Ь) ~ (с) следует (л) ~ (с).
Достаточный признак эквивалентности систем содержится в следующем утверждении.
Теорема 1. Две линейные системы эквивалентны, если одна получается из другой путем применения конечной последовательности элементарных преобразований.
Достаточно доказать эквивалентность системы (2) и системы (2'), полученной из (2) путем применения одного элементарного преобразования. Заметим, что система (2) получается из (2') также в результате применения одного элементарного преобразования, поскольку эти преобразования обратимы. Другими словами, в случае (I), переставив еще раз местами уравнения с номерами i и k, мы вернемся к первоначальной системе; аналогично в случае типа (II), прибавив к /-му уравнению в (2') /?-е, умноженное на (—с), мы получим /-е уравнение системы (2).
Докажем теперь, что любое решение (%1, ...,л£) системы (2) является также решением системы (2'). Если было произведено элементарное преобразование типа (I), то сами уравнения вообще не изменились (изменился только порядок их записи). Поэтому числа х°19 х°2, .. ., х°П9 удовлетворявшие им ранее, будут удовлетворять им и после преобразования. В случае элементарного преобразования типа (II) уравнения, кроме /-го, не изменились, и поэтому решение (х°п х°2, ...,%„) им по-прежнему удовлетворяет. Что касается /-го уравнения, то оно приобрело вид (*). Так как наше решение удовлетворяет /-му и й-му уравнениям системы (2), то
4" • • • 4"= bь ^ki^i 4- • • • 4"^kn^n. ~ bk‘
Умножив обе части последнего тождества на с и прибавив его к первому, мы получим, группируя члены, тождество вида (*) с xz = x-.
В силу отмеченной выше обратимости элементарных преобразований проведенное рассуждение показывает также, что, обратно, любое решение системы (2') будет решением системы (2).
Осталось заметить, что несовместность одной системы влечет несовместность другой (рассуждение от противного). |
28
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
3.	Приведение к ступенчатому виду. Путем последовательного применения элементарных преобразований можно перейти от заданной системы уравнений к системе более простого вида.
Во-первых, заметим, что среди коэффициентов alt имеется хотя бы один, отличный от нуля. В противном случае не имело смысла упоминать о неизвестной хг. Если ап = 0, поменяем местами (преобразование типа (I)) первое уравнение с таким j-м, что а71#=0. Теперь коэффициент в первом уравнении при первой неизвестной отличен от нуля. Обозначим его через ап. Вычтем из /-го уравнения (i = 2, 3, ..., т) новой системы первое уравнение, обе части которого умножены на такой коэффициент ch чтобы после вычитания коэффициент при х± обратился в 0 (/тг—1 элементарных преобразований типа (II)). Очевидно, что для этого нужно положить с^а^/а'п. В результате мы получим систему, в которой Xj входит только в первое уравнение. При этом может оказаться, что вторая неизвестная также не входит во все уравнения с номером />1. Пусть xk—неизвестная с наименьшим номером, которая входит в какое-нибудь уравнение, не считая первого. Мы получим систему
а'пХ' +...........+	a'lnxn = Ь'и
а'2кхк + • • • +а'2пхп --=Ь'г,
a'mkxk+ ...+a'mnxn = b'm, k>\, а'п#=0.
Не обращая теперь внимания на первое уравнение, применим ко всем оставшимся те же рассуждения, что и ранее. После ряда элементарных преобразований исходная система примет вид
Лц*1 +..................~)га1пХп = ^1»
&2kXk “I".......+ ^2пХП “^2,
fl3Zxz + ... +а'зпхп
Ят1хI “Ь • • • ^тпХп = Z>fc>l, Яи^О,
Разумеется, здесь d[j = aljt b[ = b'19 ибо первое уравнение не затрагивалось.
§3]
СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. ПЕРВЫЕ ШАГИ
29
Будем применять этот процесс до тех пор, пока возможно. Ясно, что мы будем вынуждены остановиться, когда станут равными нулю не только коэффициенты при очередной неизвестной (скажем s-й), но и коэффициенты при всех следующих неизвестных вплоть до n-й. В конце концов система (2) примет вид
......................=	К
^2k^k +..........^2п^п = ^2»
'^l+..........+ ^п=Ь3,
. . 2........._•••!’	(4)
^rs^s "Г" • • • -\~агпХп = ЬГ9
О = Ьг+1,
0 = bm.
Здесь ana2ka3l.. .ars =^=0, 1 < fe </<... <s. Может оказаться, что г = т, и поэтому уравнений вида 0 = bz в системе (4) не будет. Про систему уравнений вида (4) говорят, что она имеет ступенчатый вид.
Это название не является общепринятым: здесь можно было бы говорить о трапецевидном или о квазипгреуголь-ном виде и т. п., что не так уж существенно.
Теорема 2. Всякая система линейных уравнений эквивалентна системе, имеющей ступенчатый вид.
Доказательство непосредственно вытекает из предшествующих рассуждений. |
Элементарные преобразования иногда удобно производить не над системой, а над ее расширенной матрицей (aZ/-|bz). Точно так же, как и теорема 2, доказывается
Теорема 2'. Всякую матрицу можно при помощи элементарных преобразований привести к ступенчатому виду. |
4.	Исследование системы линейных уравнений. Ввиду теорем 1 и 2 вопросы совместности и определенности достаточно исследовать для систем ступенчатого вида (4).
Начнем с вопроса о совместности. Очевидно, что если система (4) содержит уравнение вида 0 = bt с bt=£0, то эта система несовместна, так как равенство Q = bt нельзя удовлетворить никакими значениями для неизвестных.
30
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
Докажем, что если таких уравнений в системе (4) нет, то эта система совместна.
Итак, пусть bt = 0 при t > г. Назовем неизвестные xk> хь> • • • > xs, с которых начинаются первое, второе, ..., r-е уравнения, главными, а остальные неизвестные, если таковые имеются,— свободными. Главных неизвестных по определению всего г.
Придадим свободным неизвестным произвольные значения и подставим их в уравнения системы (4). Тогда для xs получится одно уравнение (r-е) вида axs — b с a = ars =^=0, которое имеет единственное решение. Подставляя найденное значение xs = x°s в первые г—1 уравнений и поднимаясь так снизу вверх по системе (4), мы убедимся в том, что значения для главных неизвестных определяются однозначно при любых заданных значениях для свободных неизвестных. Нами доказана
Теорема 3. Для совместности системы линейных уравнений необходимо и достаточно, чтобы после приведения к ступенчатому виду в ней не оказалось уравнений вида 0=bt с bt=£0. Если это условие выполнено, то свободным неизвестным можно придать произвольные значения; главные неизвестные — при заданных значениях для свободных—однозначно определяются из системы. |
Выясним теперь, когда система будет определенной, в предположении, что введенное нами условие совместности выполнено. Если в системе (4) имеются свободные неизвестные, то система заведомо неопределенна: мы можем придать свободным неизвестным любые значения, выражая через них (по теореме 3) главные неизвестные. Если же свободных неизвестных нет и все неизвестные, стало быть, главные, то по теореме 3 они определяются из системы однозначно, так что система является определенной. Остается заметить, что отсутствие свободных неизвестных равносильно условию г = п. Мы доказали следующее утверждение.
Теорема 4. Совместная линейная система (2) является определенной тогда и только тогда, когда в полученной из нее ступенчатой системе (4) выполняется равенство r — n.f
При пг = п линейную систему, приведенную к ступенчатому виду, можно записать еще и так (треугольный
I ||
СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ. ПЕРВЫЕ ШАГИ
31
/и//)):
^11^1 +^12Х2 “Г • • •	~ ^1»
^22^2 4” • • • 4“ ^2п^п	^2»	(^)
^пп^п п*
если не заботиться о том, чтобы выполнялось условие п,..=^0 для всех /. Действительно, запись (5) означает, что в системе fe-e уравнение не содержит неизвестных xz с i < fe, а это условие заведомо выполнено для систем ступенчатого вида.
Заметим на будущее, что матрица (azy) с элементами aij=Q при />/ называется верхней треугольной. Аналогично определяется нижняя треугольная матрица.
Из теорем 3 и 4 вытекает
Следствие 1. Линейная система (2) в случае т = п является совместной и определенной тогда и только тогда, когда после приведения к ступенчатому виду получится система (5) с апа22.. .апп^0. |
Обратим внимание на тот факт, что это условие не зависит от правых частей системы. Поэтому при т = п система (2) тогда и только тогда совместна и определенна, когда это верно для ассоциированной с ней однородной системы (2'). Но однородная система всегда совместна; она имеет, например, нулевое решение =	...
..., < = 0.
Условие alta22.. .апп 0 означает, что однородная система обладает только нулевым решением. Мы приходим к иной форме следствия 1, не связанной с ее ступенчатым видом.
Следствие Г. Линейная система (2) в случае т = п является совместной и определенной тогда и только тогда, когда ассоциированная с ней однородная система (2') имеет только нулевое решение. |
Специального внимания заслуживает случай п > т.
Следствие 2. Совместная система (2) при п>т является неопределенной. В частности, однородная система при п> т всегда имеет ненулевое решение.
Действительно, в любом случае г^т, поскольку в системе (4) не больше уравнений, чем в системе (2)
32
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
(уравнения с тождественно равными нулю левыми и правыми частями отброшены). Поэтому неравенство и > т влечет п > г, что по теореме 4 означает неопределенность системы (2). Остается заметить, что неопределенность однородной системы равносильна существованию у нее ненулевого решения. |
Часть полученных нами результатов отражена в следующей таблице.
	Тип линейной системы			
	общая	однородная	п > т неоднородная	п > т однородная
Число решений	0, 1, 00	1, 00	0, 00	00
5.	Отдельные замечания и примеры. Изложенный нами метод решения систем линейных уравнений называется методом Гаусса или методом последовательного исключения неизвестных. Весьма удобный при небольших п9 он годится и для осуществления на ЭВМ, хотя по разным причинам более практичными зачастую оказываются другие способы решения, например, итерационные. Это особенно относится к тому случаю, когда коэффициенты даны, а решения ищутся с определенной степенью точности. В теоретических исследованиях, однако, первостепенное значение приобретают формулировка условий совместности или определенности линейной системы, а также нахождение общих формул для решений в терминах коэффициентов и свободных членов — без приведения системы к ступенчатому виду. В какой-то мере одному из этих требований отвечает следствие Г.
Пример L Вновь обратимся к задаче о нагретой пластинке из § 2. Как мы видели в п. 1, интересующий нас вопрос выражается в свойствах вполне конкретной линейной системы (для определенности назовем ее НП) с довольно большим числом неизвестных //. Следуя критерию, сформулированному в следствии Г, рассмотрим однородную линейную систему ОНП, ассоциированную с НП. Другими словами, температура всех граничных точек пластинки принимается теперь равной нулю. Пусть е—номер внутренней точки с максимальным значением | te |. Тогда из условия
§ 4]
ОПРЕДЕЛИТЕЛИ НЕБОЛЬШИХ ПОРЯДКОВ
33
вытекает, что | te | = | ta | = (tb I = I I = I *d I- Сдвигаясь на один шаг решетки в любом из четырех направлений, мы будем проходить через точки с тем же значением |//| = Ие|, пока не достигнем граничной точки с нулевой температурой. Значит, | te | = 0, а поэтому и // = 0 для всех I. Итак, система ОНП имеет лишь нулевое решение, и, стало быть, НП—- совместная и определенная линейная система. Задача о нагретой пластинке в первоначальной ее постановке тем самым решена.
Пример 2. Дана линейная система
*1.......................=1,
х2...................= 1,
— Xi—х2+*з.................=0,
хп — 2 %п — 1 + *П — 0*
Очевидно, что это совместная определенная система, уже приведенная к ступенчатому (треугольному) виду. Только, решая ее, нужно двигаться не снизу вверх, а сверху вниз. Решением является по определению последовательность первых л чисел Фибоначчи flt ..., fn. Эти числа связаны с одним ботаническим явлением, так называемым филлотаксисом (расположением листьев на растениях). Однако при п=1000 или даже при произвольном п хотелось бы указать общее выражение (аналитическую формулу) для n-го числа Фибоначчи. Вы можете возразить, сказав, что у вас хватит терпения указать и /1000, следуя индуктивному определению этих чисел. Но это не будет математическим решением вопроса. В гл. 2 и 3 мы укажем два выражения для fn, хотя, конечно, эту конкретную задачу можно решить и более прямыми средствами.
Замечание. Иногда бывает удобнее находить решения линейной системы, не приводя ее к ступенчатому виду. Это особенно относится к тому случаю, когда матрица системы содержит много нулей. Небольшая практика здесь предпочтительнее длинных объяснений.
§ 4. Определители небольших порядков
Излагая метод Гаусса, мы не слишком заботились о значениях коэффициентов при главных неизвестных. Важно было лишь то, что эти коэффициенты отличны от нуля. Проведем теперь более аккуратно процесс исключения неизвестных хотя бы в случае квадратных линейных систем небольших размеров. Это даст нам пищу для размышлений и исходный материал для построения общей теории определителей в гл. 3.
2 А. И. Кострикин
34
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
Как и в § 3, рассмотрим систему двух уравнений с двумя неизвестными
^11^1 ~Ь ^12-^2	^1»	/|\
#21^1 4” ^22^2 = ^2
и постараемся найти общие формулы для компонент xj, х°2 ее решения. Назовем определителем матрицы
||«11 «12 |1
|1 «21 «22 II
выражение апа22—а21а12 и обозначим его символом l^i а12|‘ Тем самым квадратной матрице сопоставляется число
I 011 012 I = ЯцЯ22 ^21^12 •	(2)
| «21	«22 J
Если мы попытаемся исключить х2 из системы (1), умножив первое уравнение на а22 и прибавив к нему второе, умноженное на —а12, то получим
|аи аМх =Ь1ам — Ьга12.
I «21 «22 I 1	1 22	2 12
Правую часть также можно рассматривать как литель матрицы ^12|. Предположим, что Тогда мы имеем
опреде-
«22
| &1	«12 |	| «11	|
_ I __даа I аналогично х2 = *ап Ьг' .	(3)
1 «н «и	2 «и «12	' '
I «21 «22 I	I «21 «22 I
Имея формулы для решения системы двух линейных уравнений с двумя неизвестными, мы можем решать и некоторые другие системы (решать системы = находить их решения). Рассмотрим, например, систему двух однородных уравнений с тремя неизвестными:
а11%1 4" ^12^2 4“ #13*3 =
#21*1 4“ #22*2 4“ #23*3 = 0.
Нас интересует ненулевое решение этой системы, в котором, следовательно, хоть одно из xzy=0. Пусть, например, х8^0. Разделив обе части на —х3 и положив
9 4]
ОПРЕДЕЛИТЕЛИ НЕБОЛЬШИХ ПОРЯДКОВ
35
=— х^Хд, — х2/х8, запишем систему (4) в том же виде;
а11У1 4" ^12^2	^18 >
&21У1 4“ ^22^2 ~ ^28»
что и (1). При предположении Г11 012 =£ О формулы (3) | #21	#22 |
дают
У1
*1
*3
#13 #12
#28	а22
а11	#12
#21	#22
у* = ~т.
а11	а18
#21 #28
#11 °12
#21	#22
Неудивительно, что мы определили из системы (4) не сами хх, х2, х8, а только их отношения: из однородности системы легко следует, что если (xj, х8, х8)—решение и с—любое число, то (cxj, сх°2, сх°3) тоже будет решением. Поэтому мы можем положить
I #13 #12 I X = _________ I а11 °13 I X = I a±1 a±Z I
I #28 #22 I ’	2 I #21 а23 I ’	3 I #21 #22 I
и сказать, что любое решение получается из указанного умножением всех xz на некоторое число с. Чтобы придать ответу несколько более симметричный вид, заметим, что всегда
I a b I 16 а I |с d|“ — jd с I ’
как это непосредственно видно из формулы (2). Поэтому (5) можно записать в виде
Эти формулы выведены в предположении, что j ^121 #= 0. Нетрудно проверить, что доказанное утверждение верно, если хоть один из входящих в выражения (6) определителей отличен от нуля. Если же все три определителя равны нулю, то, конечно, формулы (6) дают решение (а именно нулевое), но мы не можем утверждать, что все решения получаются из него умножением на число (рассмотрите систему, состоящую из двух совпадающих уравнений Xi + x^Xg^O).
36
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
Перейдем теперь к случаю системы трех уравнений с тремя неизвестными:
^11Л1 + ^12^2 4” ^13^3 ~ ^1>
^21Л1 4“ ^22^2 4" ^23^3 ~ ^2» «зЛ 4” ^82^2 4“ &33%3 ~ ^3*
Мы хотим исключить из этой системы х2 и х3, чтобы получить значение для хг С этой целью умножим первое уравнение на clf второе на с2, третье на с3 и сложим их. Подберем clf с2, с3 так, чтобы в получившемся уравнении члены с х2 и х3 обратились в 0. Приравнивая к нулю соответствующие коэффициенты, мы получим для clt с2 и с3 систему уравнений
^12^1 4“ ^22^2 4" ^32^3 = 0,
^13^1 4" ^23^2 4" ^33^3 = 0»
относящуюся к тому же типу, что и (4). Поэтому можно взять
с = 10,22 йз2 I с = И12 йз21 с — Н12 0,22 1
1 I «23 а33 I ’	2 I «13 а33 | ’	3 I «13 «23 I
После очевидных изменений мы получаем для xt выражение
ь,р22 М—ь,Р12 а13|+ь3р12
11 азг а33 I 2 I а32 а33 I I а22
«13 |
«23 I
(7)
Коэффициент, стоящий при хх, называется определителем
матрицы
а11	«12	а13
«21	а22	«23
«31	«32	а33
и обозначается
«и а12 а13
«21	а22	«23
«31	«32	а33
Таким образом, за берем выражение
определитель третьего порядка мы
а11	«12	«13
«21	а22	«23
«31	«32	а33
___ п I а22 а23 I ________п I fl12 Л13 I | п 1^12 «13 I
11 I «32 «33 I 21 I «32 «33 I ’’’ 31 I «22 «23 I
#11^22^33
4-^12^23^314-^13^21^32	^11^23^32	^12^21^33
^13^22^31»	(8)
задаваемое при помощи определителей второго порядка. Легко заметить, что правая часть в равенстве (7) полу-
I «I
ОПРЕДЕЛИТЕЛИ НЕБОЛЬШИХ ПОРЯДКОВ
37
•пц'теп из коэффициента при х, заменой ап на Ьи а21 на l>t и а81 на Ь3. Поэтому- равенство (7) можно записать
и виде а11	«12
«21	а22
«31	а32
«13		«12	«J3	
«23	—	^2	«22	«23	
«33		Ьз «32 «33	
Предположим, что коэффициент при х1 отличен от нуля. Тогда, проведя аналогичные вычисления для х2 и х3, мы придем к формулам
\	«12	«13 Z?2	О>22	«23 Ьз	«32	«33		«11	^1	«13 «21	^2	«23 «31 Ьз «33	—	V	—	«и л12 Ьг «21	«22	^2 «31	«32	^3	
«11	«12	«13 «21	«22	«23 «31	«32	«33	, Х2	«11	«12	«13 «21	«22	«23 «31	«32	«33	» лз	«11	«12	«18 «21	«22	«23 «31	«32	«33	
(9)
Очевидно, что те же самые рассуждения применимы к системе из четырех, пяти и т. д. уравнений с тем же числом неизвестных. Для этого нам надо сначала вывести формулы, аналогичные (6), для решений однородной системы трех уравнений с четырьмя неизвестными; потом в системе четырех уравнений с четырьмя неизвестными исключить х2, х3, х4, умножая уравнения на с2, с3, с4 и складывая их. Мы найдем значения cz- (i=l, 2, 3, 4) из системы трех однородных уравнений.
Коэффициент, получающийся при хг и строящийся из определителей третьего порядка по образцу (8), мы назовем определителем четвертого порядка. Проводя те же рассуждения с х2, х3, х4, мы найдем для xt формулы, аналогичные (9). Так можно продолжать неограниченно. Уверенность в том, что мы когда-нибудь достигнем цели, нам дает общий принцип, широко используемый в математике, а именно, принцип математической индукции (см. § 7).
УПРАЖНЕНИЯ
1.	Формулу (8) легче запомнить, если воспользоваться наглядным правилом знаков для выписывания произведений, входящих в разложение определителя третьего порядка (рис. 4). Найти аналогичное правило для определителя четвертого порядка*
38
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
2.	Показать, что все шесть членов в разложении определителя третьего порядка не могут быть одновременно положительными.
Рис. 4.
+
3.	Квадрат площади параллелограмма, построенного по радиусам-векторам точек Р, Q с прямоугольными координатами (а, 0) и (у, 6) (рис. 5), выражается по формуле
л2_ |а2 + ₽2 ау + ₽6| а -|aV + ₽6
(В этом особенно легко убедиться, если воспользоваться такой системой координат, чтобы точка Р лежала на оси Ох.) Найти аналогичную формулу для квадрата объема параллелепипеда в трехмерном пространстве, используя определитель третьего порядка.
§ 5. Множества и отображения
В предыдущих двух параграфах мы встретились с множествами элементов разной природы, равно как и с отображениями множеств. Множество решений данной системы линейных уравнений или правило, ставящее в соответствие каждой матрице второго порядка ее определитель,— это лишь частные проявления того круга формальных понятий, знакомство с которым, хотя бы на интуитивном уровне, полезно для дальнейшего.
1.	Множества. Под множеством понимают любую совокупность объектов, называемых элементами множества. Множества с конечным числом различных элементов могут быть описаны путем явного перечисления всех их эле
* 5J	МНОЖЕСТВА И ОТОБРАЖЕНИЯ	39
ментов; обычно эти элементы заключаются в фигурные скобки. Например, {1, 2, 4, 8}—множество степеней двойки, заключенных между 1 и 10. Как правило, множество обозначается прописной буквой какого-либо алфавита, а его элементы—строчными буквами того же или другого алфавита. Для некоторых особо важных множеств приняты стандартные обозначения, которых стоит придерживаться. Так, буквами N, Z, Q, R обозначают соответственно множество положительных целых чисел (натуральные числа), множество всех целых чисел, множество эациональных чисел и множество вещественных чисел. Лри заданном множестве 3 включение a£S указывает на то, что а—элемент множества 3; в противном случае пишут a(£S. Говорят, что S—подмножество множества Т или SczT (3 содержится в Т), когда имеет место импликация
х g S, Vx =Ф х € Т.
(По поводу обозначений см. раздел «Советы читателю», стр. 11.) Два множества 3 и Т совпадают (или равны), если у них одни и те же элементы. Символически:
S = T 4Ф SczT и T(=S
(<Ф — «тогда и только тогда, когда» или «влечет в обе стороны»). Пустое множество 0, совсем не содержащее элементов, по определению входит в число подмножеств любого множества. Если ЗсТ, но 3=^0 и S^=T, то 3—собственное подмножество в Т. Для выделения подмножества ЗсТ часто используют какое-либо свойство, присущее только элементам из 3. Например,
{nCZ|n = 2m для некоторого m$Z}
— множество всех четных целых чисел, а
N = {ngZ|n > 0}
— множество натуральных чисел.
Под пересечением двух множеств 3 и Т понимают множество
ЗпГ = {х|х€3 и х$Т}>
а под их объединением — множество
ЗиТ, = {х|х^З или х С Т}.
40
ИСТОКИ АЛГЕБРЫ
[ГЛ. I
Пересечение S П Т может быть пустым множеством. Тогда говорят, что S и Т—непересекающиеся множества. Операции пересечения и объединения удовлетворяют тождествам типа
/?n(sun = (/?ns)u(/?nn, яи($пП = (Яи$)п(Яит),
проверку которых мы оставляем читателю в качестве упражнения. Картинки
помогут провести несложное рассуждение.
Разностью S\T множеств S и Т называется совокупность тех элементов из S, которые не содержатся в Т. При этом, вообще говоря, не предполагается, что TaS. Вместо S\T пишут также S — Т.
Если Т — подмножество в S, то символ S\T обозначает еще дополнение к Т в S. Положив Я =S\T, будем иметь: PftT = 0t £UT = S. Обратим внимание на соответствие между операциями пересечения, объединения, дополнения и логическими связками «и», «или», «нет».
Пусть далее X и Y—произвольные множества. Пару (х, у) элементов х£Х, y£Y, взятых в данном порядке, будем называть упорядоченной парой, считая при этом, что (хх, уг) = (х2, у2) тогда и только тогда, когда хх = х2, у1=у2- Декартовым произведением двух множеств X и Y называется множество всех упорядоченных пар (х, у):
XxY = {(х, у)\х £ X, у £Y}.
Пусть, например, R — множество всех вещественных чисел. Тогда декартов квадрат R2 = RxR есть просто множество всех декартовых координат точек на плоскости относительно заданных координатных осей. Аналогичным образом можно было бы ввести декартово произведение ^хХгХХз трех множеств( = (ХххХ2)хХ3^Ххх(Х2х X Х3)), четырех и т. д. При Хх =-- Х2 = ... = Xk пишут сокращенно Xk ^ХхХх . .. X X и говорят о k-й декарто
| В]	МНОЖЕСТВА И ОТОБРАЖЕНИЯ	41
вой степени множества X. Элементами Xk являются последовательности, или строки (хп х2, . .., xk) длины k.
Чтобы почувствовать различие между множествами X X Y и X U Y, возьмем за X и Y множества конечной мощности (cardinality — англ.)
| X | = Card X - п, | К | = Card Y - т.
Тогда
\XxY\ = nm, а | X U Y | = п + т — | X П Y |.
Если это не ясно, то нужно перечитать заново все определения.
2.	Отображения. Понятие отображения или функции играет центральную роль в математике. При заданных множествах X и Y отображение f с областью определения X и областью значений Y сопоставляет каждому элементу х С X элемент f (х) g У, обозначаемый также символом fx или fx. В случае Y = X говорят еще о преобразовании f множества X в себя. Символически отображение записывается в виде f: X—>У или X-^Y. Образом при отображении f называется множество всех элементов вида f (х):
Imf = {f(x)\x£X} = f (X)czY
(Im — от image—англ.). Множество
/-1
называется прообразом элемента z/gK. Более общо, для Y^czY положим
f-1(V0) = {x€X|/(x)€r0}= U Г1 (У).
£/еУ0
Если f/gy\Imf, то, очевидно, f~1(y} = 0>
Отображение f: X—>У называется сюръективным (surjective—франц.) или отображением на, когда 1т/ = У; оно называется инъективным (injective—франц.), когда из х^=х' следует f (х) =^= f (x'Y Наконец, f: X—^Y—биективное (bijective—франц.) или взаимнооднозначное отображение, когда оно одновременно сюръективно и инъективно.
Равенство f = g двух отображений означает по определению, что их соответствующие области совпадают:
42
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
f	ё
X—>У, X —*У, причем f(x)=g(x), Vx£X. Сопоставление <аргументу» х, т. е. элементу х£Х, значения f (x)£Y принято отображать при помощи ограниченной стрелки: x^f(x).
Пусть, например, fn — число Фибоначчи (см. § 4) с номером п. Соответствие п н-> fn определяет отображение N —> N, не являющееся ни сюръективным, что очевидно, ни инъективным, поскольку /г= =/2=1. Если R +— множество положительных вещественных чисел, то отображения /: R —► R, g: IR —> R + , h: R+ —► R + , определенные одним и тем же правилом xi—>х2, все различны: f ни сюръективно, ни инъективно, g сюръективно, но не инъективно, а отображение h биективно. Таким образом, задание области определения и области значений —существенная часть определения отображения (функции).
Единичным (или тождественным) отображением ех: X —► X называется отображение, переводящее каждый элемент х£Х в себя. Если X — подмножество в Y: ХсУ, то иногда бывает полезным специальное отображение — вложение Г. Х—^У, которое каждому элементу х£Х сопоставляет тот же самый элемент, но уже в множестве У. Отображение f: X—>Y называется сужением (или ограничением) отображения g: X' —+Y', когда ХаХ',УсзУ' и f (х) = g(x), Vx g X. В свою очередь g называется продолжением отображения /. Например, вложение I: X —>У есть ограничение единичного отображения	У —> У.
Нам представится также случай говорить о функциях многих переменных. Полезно уяснить себе, что введенное выше понятие декартовой степени Хп множества X дает возможность говорить о функции f(xx, ...,хп) многих переменных xzgX, Z=l, ..., п, как об обычном отображении f: Хп —► У.
Произведением (суперпозицией или композицией) двух отображений g: U—>7 и f: V—>W называется отображение fog: U—>17, определенное условием
(fog)(«) = f(g(u)),Vu€t/.
То же самое наглядно изображается треугольной диаграммой
И
И ч
МНОЖЕСТВА И ОТОБРАЖЕНИЯ
43
Про эту диаграмму говорят, что она «коммутирует» (или коммутативна), т. е. результат перехода от U к W не зависит от того, сделаем ли мы это прямо при помощи fog или воспользуемся промежуточным этапом V. Заметим, что композиция определена не для любых отображений f и g. Надо, чтобы в предшествующих обозначениях у них было общим множество V. Но композиция двух преобразований множества X в себя всегда имеет смысл.
В дальнейшем вместо fog мы будем писать просто fg. Ясно, что
fex—f> eYf=f
для любого отображения f: X—>Y. Проверка этого свойства очевидна.
Важное свойство композиции (произведения) отображений выражает следующая
Теорема 1. Композиция отображений подчиняется закону ассоциативности. Это значит, что если h: U —>V, g: V—^W, f: W ->T—три отображения, то
f (gh) = (fg) h.
Доказательство. Наглядно все необходимые рассуждения содержатся в следующей диаграмме:
где а = gh, $ = fg- В соответствии с формальным определением равенства отображений нужно просто сравнить значения отображений f (gh): U—и (fg)h: U— в произвольной «точке» u^U. Но, согласно определению композиции отображений, имеем
(/ (gh)) и = f ((gh) u) — f(g (hu)) = (fg) (hu) = ((fg) h) и. |
Композиция отображений X—>X, вообще говоря, некоммутативна, т. е. fg^=gf. В этом легко убедиться на примере, когда Х = {а,Ь\ — множество из двух элементов, f(a) = b, f(b) = a, g (а) = a, g(b) = а. Другой пример: f и g—постоянные отображения из X в X, т. е.
44
ИСТОКИ АЛГЕБРЫ
(ГЛ. 1
значения f(x) и g(x) не зависят от х. Тогда f^=g => =*>fg^gf-
Некоторые функции имеют обратные. Предположим, что f: X—>Y и g: Y—>Х— какие-то отображения, так что композиции fg и gf определены. Если fg = eY, то f называется левым обратным к gf, a g—правым обратным к f. Когда произведения в любом порядке являются единичными отображениями:
fg = ev, gf = ex,	(1)
то g называется двусторонним обратным (или просто обратным} отображением для f или к f (a f—обратным отображением к gf) и обозначается символом f-1. Итак, f(u) = v &
Предположив существование еще одного отображения g*-. Y—>-Х, для которого
fg' = eY, g'f = ex,	(Г)
мы, опираясь на равенства (1), (Г) и на теорему 1, получим
g’ = exg' = (gf) g' = g (fg') =- geY=g.
Таким образом, двустороннее обратное отображение к /, коль скоро оно существует, определено однозначно. Это и служит оправданием для обозначения f”1.
Теорема 2. Отображение f: X—>Y тогда и только тогда имеет обратное, когда оно взаимно однозначно (биективно).
Д о к а з а те л ь ств о теоремы опирается на следующую лемму, представляющую самостоятельный интерес.
Лемма. Если f: X—gf: Y——любые отображения, для которых gf = ех, то f инъективно, a g сюръективно.
В самом деле, пусть х, х'£Х и f (х) = f (%'). Тогда X = ех (х) = (gf) x = g (fx) = g(fx') = (gf) x' = ex (x') = x'. Ста-ло быть, f инъективно. Если, далее, х—любой элемент из X, то x = ex(x) = (gf)x = g(fx), а это доказывает сюръективность gf.
Возвращаясь к теореме 2, предположим вначале, что f обладает обратным g = f~1. Тогда из равенств (1) и из леммы вытекает как сюръективность, так и инъективность f. Другими словами, f биективно. Обратно, предположив f
МНОЖЕСТВА И ОТОБРАЖЕНИЯ
45
$ 5]
биективным, мы для любого y£Y найдем единственный элемент х£Х, для которого f(x) = y. Положив g(y)=x, мы определим отображение g: Y—>Х, обладающее свойствами (1). Значит, f~1 = g. I
Следствие. Из биективности отображения!: X —>Y вытекает биективностъ f~1, причем
=	(2)
Пусть, далее, f: X—>-У, A: Y—>-Z—биективные отображения. Тогда биективна и их композиция hf, причем
(3)
Доказательство. По теореме 2 биективностъ f влечет существование f"1, что в силу той же теоремы эквивалентно биективности f~*. Симметричность условий (1), переписанных в виде ff~l = eyt f~1f = ex, дает равенство (2). Далее, по условию и по теореме 2 существуют отображения f"1: Y—Л"1: Z—и их композиция
Z—>Х. Из равенств
(hf) (f-'h-Ч = ((hf) f-1) А-1 = (h (ff-'))h-'--hh-i = ez, (f~1h~1)(hf) = f~1(h~1(hf)) = f~1((h~1h)f) =f~*f =ex
вытекает, что !~Чг~1—обратное отображение к hf. |
Отображение «следования» о:’ N—►N, определенное правилом а(м) = м+1, инъективно, но не сюръективно, поскольку первый элемент (единица) не принадлежит Imo. Интересно, что для конечных множеств подобная ситуация невозможна.
Теорема 3. Если X—конечное множество и преобразование f: X—>Х инъективно, то оно биективно.
Доказательство. Нужно лишь показать, что f сюръективно, т. е. для любого элемента х£Х найдется х' с f(x') — x. Положим
^(х) = /(/...(М)...) = НР-Ч),	£ = 0, 1,2,...
В силу конечности X в этой последовательности элементов должны быть повторения. Пусть, скажем, fm (х) = fn (х), т > п. Если п > 0, то из f (fm~xx) = f (fn~1x) и из инъективности f следует равенство fm~l (х) = f"”1 (х). Повторив достаточное число раз сокращение f, мы придем к элементу х' =(х) с требуемым свойством: / (х')=х. |
46
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
Как легко понять, сюръективное преобразование конечного множества в себя также биективно.
Несколько слов о мощности. Считается, что два множества X и Y имеют одинаковую мощность тогда и только тогда, когда существует биективное отображение f: X— Множества той же мощности, что и N (или Z), называются счетными.
УПРАЖНЕНИЯ
1.	Пусть □ = {+, —, + + , Н—, —К , + + +, •••} — множество всех конечных последовательностей плюсов и минусов, a f: Q—►Q — преобразование, переводящее элемент (o = a>1©2...(DngQ в (•/== (o1o)1(D2(o2...(Dncon, где (&k = —» если со^ = +, и со^ = +, еслисо^= = —. Показать, что в f (fa) любой отрезок длины > 4 содержит ++ или	.
2.	Имеет ли отображение f: N—>N» заданное правилом правое обратное? Указать для f два левых обратных отображения.
3.	Пусть f: X—►У — отображение и 8, Т — подмножества в X, Показать, что	।
f (S и Т)=f (S) U f (Т), f (8 n T) a. f (8) П f (T).
Привести пример, показывающий, чго последнее включение нельзя, вообще говоря, заменить равенством.
4.	Символом д* (8) = {Т | Та 8} обозначается множество всех подмножеств множества 8. Если, например, 8 = {sx, s2, .... $л} — конечное множество из п элементов, то 5*(8) состоит из пустого множества 0, из п одноэлементных множеств рх}, {s2}, ..., из п(п—1)/2 множеств <{$/, Sy | 1 i < и т. д., вплоть до T = S. Какова мощность множества д* (S)?
5.	Пусть f: X—► Y — отображение и b = f(a) для некоторого а£Х. Прообраз
f-1(b) = f-1(f(a)) = {x\f(x) = f(a)\
иногда называют еще слоем над элементом	Показать, что все
множесгво X является объединением непересекающихся слоев (разбиение множества X). Предупреждение: символ(6) не следует ассоциировать с обратным отображением, которого может и не быть.
6.	Показать, что конечная декартова степень счетного множества является счетным множеством.
0]
ОТНОШЕНИЯ ЭКВИВАЛЕНТНОСТИ
47
7.	Символом S ДТ обозначается симметрическая разность двух множеств S и Т:
S Т
S ЛТ
Показать, что
SAT = (S\T)U(T\S).
5ДТ = (ЗиГ)\(5ПП.
§ 6. Отношения эквивалентности. Факторизация отображений
Эквивалентность систем линейных уравнений, введенная нами в § 3, наводит на мысль посмотреть на это понятие в общем плане, тем более что эквивалентностями
разных типов мы пользуемся неосознанно как в логических рассуждениях, так и в обыденной жизни.
1. Бинарные отношения. Для любых двух множеств X и Y всякое подмножество OczXxK называется бинарным отношением между X и У (или просто на X, если У = Х). Для упорядоченной пары (х, у) € О используют обо-
Рис. 6.
значение хОу и говорят, что х находится в отношении Оку. Это удобно, поскольку, например, упорядо-
чение «<» на множестве вещественных чисел R является
бинарным отношением на R, состоящим из всех точек плоскости R2, которые лежат выше прямой х—у = 0(см. рис. 6); громоздкое включение
(x,t/)€O(O = <)
заменяется обычным неравенством х < у.
Каждой функции f: X—+ Y сопоставляется ее график— подмножество
Г (/) = {(*» г/)|х€Х.!/ = /(х)}аХхГ,
48
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
являющееся отношением между X и Y. Изучение на JR2 графиков функций R.—входит в курс математического анализа. Понятно, что не каждое отношение О может служить графиком какого-либо отображения X—>У. Необходимое и достаточное условие заключается в том, чтобы каждому х € X отвечал ровно один элемент у с хОу, Фактически задание X, Y и графика Г(/) восстанавливает f.
2. Отношение эквивалентности. Бинарное отношение на X называется отношением эквивалентности, если для всех х, х', х"€Х выполнены условия:
(i)	х~х (рефлексивность)',
(ii)	х~х' => х'~х (симметричность)',
(iii)	х~хг, х’~х" => х~х" (транзитивность).
Запись а b выражает отрицание эквивалентности элементов а, Ь£Х.
Подмножество
х = {х' X | х' ~х} с X
всех элементов, эквивалентных данному х, называется классом эквивалентности, содержащим х.
Так как х~х (см. (i)), то действительно х£х. Любой элемент х' ^х называется представителем класса х. Справедливо следующее утверждение.
Множество классов эквивалентности по отношению ~ является разбиением множества X в том смысле, что X является объединением непересекающихся подмножеств (это разбиение можно обозначить символом л~(Х)).
В самом деле, так как х£х, то X = U х. Далее, __	хеХ
класс х однозначно определяется любым своим представителем, т. е. х = х' ФФ х~х'. В одну сторону: х~х' и х"£х => х"~х => х"~х' =>х"€х' =>хсх'. Нох~х'=> => х'~х (см. (ii)). Поэтому выполнено и обратное включение х'сх. Значит, х'=х. В другую сторону: так как xgx, то х'=х =£> х£х' => х~х'.
Если теперь х'Пх"=И=0 и х£х' Ах", то х~х' их~х", откуда в силу транзитивности (iii) имеем х'~х" и х'=х". Значит, различные классы не пересекаются. |
§6]
ОТНОШЕНИЯ ЭКВИВАЛЕНТНОСТИ
49
Пусть П = R2 —вещественная плоскость с прямоугольной системой координат.
Взяв за свойство принадлежность точек Р, Р'£П одной горизонтальной прямой, мы получим, очевидно, отношение эквивалентности с классами — горизонтальными прямыми (рис. 7). Гиперболы Гр
(рис. 8) вида ху = р > 0 определяют отношение эквивалентности в области П + сП точек Р (х. у) с координатами х > 0, у > 0. Эти геометрические примеры наглядно показывают, что верно следующее обратнее утверждение.
Если имеется какое-то разбиение л (X) множества X на непересекающиеся подмножества Сх, то Сх будут классами эквивалентности по некоторому отношению эквивалентности ~.
В самом деле, по условию каждый элемент х£Х содержится точно в одном подмножестве Са. Достаточно считать х~х' в том и только в том случае, когда хи/ лежат в одном и том же подмножестве Са. Очевидно, это отношение ~ рефлексивно, симметрично и транзитивно, т. е. является отношением эквивалентности. Далее, х£Са => х = Са, поскольку по определению ~ мы имеем включение хсСа, а Саах следует из того, что различные Ct попарно не пересекаются. Стало быть, л(Х) = л~(Х). S
3. Факторизация отображений. Ввиду установленного выше взаимно однозначного соответствия между отношениями эквивалентности и разбиениями множества X принято разбиение, отвечающее отношению эквивалентности обозначать символом Х/~ и называть фактормножеством S относительно ~ (или по отношению ~). Сюръективное отображение
р: х*-+р(х) = х	(1)
называется естественным отображением (или канонической проекцией) X на фактормножество Х/~.
50
ИСТОКИ АЛГЕБРЫ
[ГЛ. I
Пусть X, Y—два множества и f: X——отображение. Бинарное отношение О/.
xOfx' & f(x) = f(x'), Ух, х'£Х,
очевидно, рефлексивно (f (х) = f (х)), симметрично (/ (х') = =f (х) => f (х) = f (х')) и транзитивно (f (х) = f (х') и f (х') = =/(х") =£ f (x) = f (х")). Таким образом, Of—отношение эквивалентности на X. Соответствующие классы эквивалентности х являются слоями (прообразами) в смысле упражнения 5 § 5. Другими словами,
х = {х'|/(х') = /(х)}.
Отображение f: X—>Y индуцирует отображение Х/0/—определенное. правилом
Йх) = Нх),	(2)
или, что то же самое,
fa W = /(*),	(2')
где р—естественное отображение (1). Так как х = х' & & f (x) — f (%'), то соотношение (2), задающее /, не зависит от выбора представителя х класса х. В таких случаях говорят, что определение / является правильным или корректным. Коммутативная диаграмма
наглядно описывает факторизацию (разложение)
f = f.p	(3)
отображения f в произведение сюръективного отображения р и инъективного отображения f. Инъективность J вытекает из того, что
f (^1) = f (^й) f (*1) = t (*2) Х1 “ Х2*
§6]	ОТНОШЕНИЯ ЭКВИВАЛЕНТНОСТИ	51
Биективность f равносильна сюръективности f. Заметим, что если ff: X/Of—+Y—еще одно отображение, для которого выполнено соотношение (3): f'p = f9 то из (х)= = f'(px) = (f'p)x=f(x) = f (х) (см. (2)) следует на самом деле равенство f' = f. Стало быть, отображение f9 делающее указанную выше треугольную диаграмму коммутативной, единственно.
4. Упорядоченные множества. Упорядочением множества X (или порядком на X) называется бинарное отношение < на X, обладающее свойствами рефлексивности (х^х), антисимметричности (если х^у и у^х9 то х = у) и транзитивности (если х^у и y^Zz9 то х^г). При x^Zy и х=£у пишут х < у. Вместо х^у используется также обозначение у^х. Пара элементов х, х' может и не находиться в отношении Если, однако, х^х' или х' ^х для каждой пары элементов из Х9 то X называется линейно упорядоченным множеством (или вполне упорядоченным множеством, цепью и т. д.). В общем же случае говорят о частичном порядке на X.
Множество X = 3* (S) подмножеств множества S (см. упражнение 4 § 5) с обычным отношением включения RcT между подмножествами, а также множество N натуральных чисел с отношением d | п (п делится на d) являются примерами частично упорядоченных множеств.
Пусть X — произвольное частично упорядоченное множество, х и у его элементы. Говорят, что у накрывает х, если х < у и не существует г с условием х < z < у. В случае Card X < оо тогда и только тогда х < у (т. е. х и у сравнимы), когда найдется цепочка элементов х= =х19 х2, ..., хп_п хп = у9 в которой х/+1 накрывает xz. Понятие накрытия удобно при изображении конечного частично упорядоченного множества X плоской диаграммой. Элементы множества X изображаются точками. Если у накрывает х, то у помещается выше х и х соединяется с у прямолинейным отрезком. Сравнимость у и х изображается «понижающейся» ломаной, соединяющей у с х, причем таких ломаных может быть несколько. Несравнимые х и у не соединяются. На двух из приводимых диаграмм (см. рис. 9) изображены «отрезок» натурального ряда чисел и множество 5* ({a, b9 с}) (N—естественное
52
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
линейно упорядоченное множество, а упорядочение на 3* (S) было введено выше).
Наибольшим элементом частично упорядоченного множества X называется элемент п£Х такой, что для всех х£Х, а максимальным — элемент т£Х, для которого из т^х^Х следует х = т. Наибольший элемент
всегда максимален, но не обратно. Максимальных элементов может быть много, но наибольший элемент, если он существует, определен однозначно. Те же замечания относятся к наименьшему и минимальному элементам. На рис. 9 две диаграммы слева имеют наибольшие и наименьшие элементы. На диаграмме справа три максимальных элемента, один наименьший, но нет наибольшего элемента.
Теория частично упорядоченных алгебраических систем (булевы алгебры, решетки) насыщена содержательными результатами, занимает важное место в алгебре, но мы не имеем возможности ее касаться. Этот параграф преследует скромную цель: познакомить читателя с еще одним естественным бинарным отношением и дать представление о диаграммах, которые помогут в будущем понять взаимное расположение подгрупп в группах или, скажем, расположение подполей в полях.
УПРАЖНЕНИЯ
1.	Показать, что фактормножество R.2/—, получающееся из геометрической картинки на рис. 7, и любая прямая /, пересекающая ось Ох, находятся в биективнохм соответствии.
2.	Положить Р (х, у) — Р (%', у') длч точек вещественной координатной плоскости R2 в точности тогда, когда х'—х g Z и у' — у £ Z.
§ 7]
ПРИНЦИП МАТЕМАТИЧЕСКОЙ ИНДУКЦИИ
53
Доказать, что — является отношением эквивалентности и что фактормножество R2/— геометрически изображается точками на торе (поверхности кренделя; см. рис. 10).
У^ (0,1)'*
о
W
(f,O)
Рис. 10.
Показать, что множества из двух, трех и четырех элементов соответственно 2, 5 и 15 различных фактормножеств.
Пусть -----отношение эквивалентности на множестве X и
-> Y — отображение, для которого х ~ х’ => f(x) = f (*')• Пока-
3. имеют
4.
Г-
зать, что это условие совместимости f с — (более слабое, чем рассмотренное в п. 2) позволяет правильно определить индуцированное отображение f: хь—>/(х), из X/— в У, приводящее к факторизации f = f *р, но f уже не обязано быть инъективным. В чем заключается условие инъективности /?
5.	Изобразить диаграммами частично упорядоченные множества: I) ^({а, Ь, с, d}); 2) множество всех делителей целого числа 24 (отношения порядка указаны в тексте).
§ 7. Принцип математической индукции
Считается, что нам известно множество N = {1, 2, 3, ...} всех натуральных (или целых положительных) чисел. На самом деле отправной точкой для изучения N служит аксиоматика Пеано (1858— 1932). Из его трех аксиом (мы их не приводим) вытекают свойства сложения, умножения и линейного упорядочения (см. п. 4 § 6) натуральных чисел, точнее, системы N U {0}. В частности, доказывается интуитивно ясное утверждение: в каждом непустом множестве S cz N имеется наименьший элемент, т. е. натуральное число s£S, меньшее всех остальных чисел в S. С учетом этого утверждения из аксиом Пеано извлекается следующий
Принцип индукции. Предположим, что для каждого n(EN мы имеем некоторое утверждение М(п).
54
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
Предположим также, что мы располагаем правилом, позволяющим установить истинность М (Z) для данного I при условии, что М (й) верно для всех k <1 (в частности, подразумевается, что мы можем проверить истинность Тогда М (п) верно для всех ngN.
В самом деле, допустим, что подмножество
S = {s|sgN, М (s) неверно} с: N непусто. Согласно вышесказанному S содержит наименьший элемент s0. Тогда утверждение М (s0) ложно, а М (s) истинно для каждого s < $0. Это, однако, противоречит нашему предполагаемому умению доказывать истинность M(s0).|
Здесь не место для всестороннего обсуждения принципа математической индукции. Мы ограничимся замечанием, что он отражает, так сказать, суть натурального ряда, а познание последнего не сводится к чему-либо существенно более простому.
Стоит еще обратить внимание на одно обстоятельство. Именно, непременным моментом «доказательства методом полной индукции» является установление базиса индукции, т. е. проверка того, что свойство или утверждение выполнено для небольших п. Без такой проверки можно приходить к произвольным умозаключениям типа «все студенты — одинакового роста». Вот и рассуждение. Пустое множество студентов и множество из одного студента обладают этим свойством. Делаем предположение индукции, что им обладает любое множество из ^п студентов. В множестве из n + 1 студентов первые п и последние п студентов — одинакового роста по предположению индукции. Эти множества пересекаются по подмножеству из п—1 студентов тоже одинакового роста. Значит, все п+1 студентов одинакового роста. На самом деле первое содержательное утверждение относилось бы к множеству из любых двух студентов, а здесь-то оно как раз и неверно. Каким же длинным должно быть основание индукции? Обычно это ясно из доказательства. В нашем элементарном примере важным является условие непустоты пересечения двух множеств, т. е. выполнение неравенства п—1^1, откуда п^2.
В более сложных ситуациях, в особенности, когда приходится определять или строить объект по индукции
§ 71	ПРИНЦИП МАТЕМАТИЧЕСКОЙ ИНДУКЦИИ	55
при помощи рекуррентных соотношений (как мы собираемся строить в гл. 3 определители матриц), приходится проявлять особую заботу о базисе индукции. С другой стороны, нельзя впадать в иную крайность: убедившись в истинности М (k) для всех k из достаточно длинного отрезка	натурального ряда, делать необос-
нованный вывод (это будет так называемая неполная индукция) об истинности М (п) для всех ngN.
Вот два обескураживающих примера.
1. П. Ферма полагал, что все числа вида Fn = 22n + 1, п = 0, 1, ... (числа Ферма) — простые. Первые пять чисел Ферма —простые, но для Fb Эйлер нашел разложение /^ = 4 294 967 297 = 641-6 700 417. Настойчивые усилия получить при помощи новейших ЭВМ хотя бы одно новое простое число Ферма пока не увенчались успехом. Одним из последних «достижений» в этом направлении является проверка того, что /г1в45 делится на 5-21947 + 1.
2. Исследование при n= 1,2, ..., 40 чисел вида п2 —п + 41 (многочлен, предложенный Эйлером) способно склонить к мысли о простоте этих чисел при любом п (о простых числах см. § 8). Однако 412 — 41 +41 =412.
Примеров такого рода можно приводить сколь угодно много.
В рассуждениях по индукции иногда самое важное — придать надлежащую форму доказываемому утверждению. Предположим, что нужно найти сумму
рк(п)= 1* + 2* + 3*+ ... + (n—l)* + n*; k= 1,2, 3.
Задача значительно облегчится, когда вам скажут, что предполагаемый ответ содержится в выражениях:
Если до />! (п) нетрудно додуматься (это сделал еще Гаусс в малолетнем возрасте), то вид рг (п) и р3(п} уже не так тривиален, а соотношение
А («) +А («) = 2 р("+1)у
вообще нужно было бы искать по какому-то определенному плану. В данном случае такой план указать можно, но не в этом дело. Для обоснования всех указанных выше соотношений нужно провести прямыми вычисле
56
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
ниями шаг индукции от п к п + 1. Оставим это читателю в качестве полезного упражнения.
Кстати, в этом упражнении пригодится так называемая биномиальная формула
(a + by = an+[ i ) ап-1Ь + ••• + (*)	. +b". (1)
Здесь под а п b подразумеваются произвольные числа, а биномиальный коэффициент (jQ при одночлене an~kbk имеет вид
(п\— п]	_n(n—1) ... (п —6+1)
{kJ k\(n — 6)!	6(6 — 1) ... 2-1	•
Полезно дополнить (2) соглашением 0! = 1 и ( " ) = О при k < 0. Отметим еще, что
( п \___/ п \
\n—k)	\ 6 у
(свойство симметричности биномиальных коэффициентов).
Формулу (1), очевидно, верную при п= 1, 2, мы докажем индукцией по п. Считая ее справедливой для всех показателей <+, умножим обе части соотношения (1) на а + b. Получим
(a + b)”+1 = (a + b)"(a + b) =
= an(a + b)+ ... + an~kbk (а + Ь)+ ... +bn(a + b) =
=an+l + anb+ ... + (" an+2~kbk-l + (, п Л an+1~kbk +
\ К 1 I	\ К 1 J
Приведение подобных членов показывает, что коэффициентом при одночлене an+l~kbk будет
( п I (п\_
\6-iJ "Ц 6 J “
__ п!	| п! _ п\ Г 1	| 11
*“(6—1)! (п-6+ 1)! ' 6! (п — 6)! “(6— 1)! (/i-6)![n-6-hl +6J —
_ п!	п-Н	(п+1)!
(6—1) I (п —А;)! ’ Л(/г-/г+1)~“61 (п + 1-6)! “	k
§ 8]
АРИФМЕТИКА ЦЕЛЫХ ЧИСЕЛ
57
т. е. как раз биномиальный коэффициент вида (2) с верхним индексом, увеличенным на единицу. Тем самым справедливость формулы (1) доказана для всех ngN.
Если записать
(a + b)n==(a + b) (a + b).. .(а + Ь),
присвоив каждому множителю справа номер от 1 до /?, и посмотреть на те подмножества номеров 1 f 2 < ...
которые отвечают при умножении одночлену an~kbk, то мы придем к выводу, что есть не что иное, как число всех подмножеств мощности k множества из п элементов. Несколько старомодный термин — число Сп— jQ сочетаний из п по k — выражает по существу то же самое.
В частности, мощность множества 3* ({sn . . ., (см. упражнение 4 § 5) равна ( J ) + (?) + •••+ (n2 j) + (”) ’ Но, полагая а = Ь=Л в формуле (1), получим

Таким образом, Card 5s ({s^ s2........s„}) = 2".
Доказательство теоремы или построение обьекта иногда удобно проводить, опираясь на более сложные формы индукции. Например, принцип «двойной индукции» заключается в следующем. Пусть любым натуральным числам тип отвечает некоторое утверждение У (т, п), причем: (i) У (/и, 1) и У(1, п) истинны для всех т и п\ (ii) если У (k—1, /) и У (k, I—1) истинны, то У (fc, /) также истинно (эквивалентно: (ii)' если У (k', Г) истинно при всех k' Г kf Ц-/' < то У (kt I) также истинно). Тогда утверждение У (/и, и) истинно для всех натуральных тип.
§ 8. Арифметика целых чисел
Задачей этого параграфа является краткое описание тех простейших свойств делимости целых чисел, на которые удобно по разным поводам ссылаться в дальнейшем. Дополнительные факты будут приведены в гл. 5, где теория делимости переносится на более общие алгебраические системы.
1. Основная теорема арифметики. Целое число s называется делителем (или множителем) целого числа п, если
58
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
п = st для некоторого t^Z. В свою очередь п называется кратным s. Делимость п на s обозначается символом s | и, а отрицание делимости—символом s \ п. Делимость — транзитивное отношение на Z. Если, далее, т\п и n|m, то n = ±m, и целые числа и, т называются ассоциированными. Целое число р, делители которого исчерпываются числами ± р, ±1 (несобственные делители), называется простым. Обычно в качестве простых берутся положительные простые числа > 1.
Фундаментальную роль простых чисел вскрывает так называемая
Основная теорема арифметики. Каждое положительное целое число п 1 может быть записано в виде произведения простых чисел: п=^ ргр2.. .ps. Эта запись единственна с точностью до порядка множителей.
Собрав вместе одинаковые простые множители и изменив обозначения, получим запись п в виде n=p!‘pl2.. .pkk, ez > О,	Для любого рационального числа а=
= n/m£Q имеет место аналогичное разложение, но с показателями ez как положительными, так и отрицательными. Заметим, что множество
Р = {2, 3, 5, 7, 11, 13, ...}
всех простых чисел бесконечно (теорема Евклида). Действительно, если бы существовало лишь конечное число простых чисел, скажем plt р2, . ..,Ро то по основной теореме число с = ргр2 ... pt + 1 делилось бы по крайней мере на одно из pz. Без ограничения общности считаем с = р1с1. Тогда р1(с'—р2 ... pt) = 1, а это невозможно, поскольку делителями единицы в Z являются лишь ±1. I
Доказательство основной теоремы откладывается до гл. 5. На первый взгляд, ее вообще не надо доказывать, настолько она кажется очевидной. Между тем, хотя речь идет о мультипликативных свойствах (свойствах делимости) целых чисел, основную теорему невозможно доказать, не используя одновременно операций умножения и сложения в 2. В качестве иллюстрации этого утверждения рассмотрим в N подмножество S = {4&4-1 | k = 0, 1, 2, ...}. Оно замкнуто относительно умножения: (4/гх +1) (4/г2 -Н) = 4&3 + 1. Индукцией по п £ S нетрудно установить существование разложения (первая часть основной теоремы) =	где qi—далее неразложимые эле-
менты из S. Мы назовем их квази простыми числами. Выпишем несколько таких чисел: 5, 9, 13, 17, 21, 49. Вторая часть основной теоремы для системы S не верна, поскольку, например, число 441 £ S имеет два существенно разных разложения в произведение квази-
§ 8]
АРИФМЕТИКА ЦЕЛЫХ ЧИСЕЛ
59
простых чисел:
441 =9-49 = 212.
2. НОД и НОК в Z. Любые два целых числа п и т можно записать в виде произведения одних и тех же простых чисел
п = ± р*>ръ ... pakh, т=± Р^р1‘... pfy, если условиться допускать нулевые показатели (как всегда, считая р?=\). Введем в рассмотрение два целых числа
НОД(п, /п) = р?р?.. .pty, HOK(n, =	•-р**,
(1) где у{ = min (a,-, 0Z), 6; = max (а,., 0,), t=l,2.k.
Так как d\n => d=±p*1.. .p^k, 0^a(- ^a,-, то из определяющих соотношений (1) вытекают следующие утверждения.
(i) НОД(п, m)|n, НОД(п, т) |т, и если din, dim, то d|HOfl(n, т).
(ii) n|HOK(n, т), /п|НОК(п, tn), и если п|м, т]и, то НОК (я, т)]и.
Свойства (i) и (ii) оправдывают сокращенные обозначения наибольшего общего делителя (НОД) и наименьшего общего кратного (НОК) целых чисел п, т. При п > 0, т > О выполнено соотношение
НОД (п, т) • НОК (п, т) = пт.	(2)
Целые числа п, т называются взаимно простыми, если НОД(п, т)—\. В этом случае соотношение (2) принимает вид НОК (п, т) = пт.
3. Алгоритм деления в Z. При заданных a, b^Z, Ь > 0, всегда найдутся q, г £ Z такие, что
a = bq-)-r, О^г <6
(если считать лишь Ь=^0, то будет выполнено неравенство О^г < р|).
В самом деле, множество S = {a—bs\s^Z,a—bs^Q), очевидно, непусто (например, а—Ь(—а2) > 0). Стало быть, S содержит наименьший элемент; обозначим его г —а—bq. По условию г^О. Предположив г^Ь, мы
60
ИСТОКИ АЛГЕБРЫ
[ГЛ. 1
получили бы элемент r-r-b = a—b(q+l)$S, меньший чем г. Это противоречие устраняется лишь при г <Ь. |
Проведенное несложное рассуждение дает также предписание (алгоритм) для нахождения частного b и остатка г в конечное число шагов. Алгоритм деления в Z используется для иного определения НОД, а следовательно, и НОК, если принять во внимание соотношение (2).
Именно, при заданных целых числах п, /и, одновременно не равных нулю, положим
J = \nu-\-mv\u, ygZ}.	(3)
Выберем в J наименьший положительный элемент d= = nuQ-\-mvQ. Используя алгоритм деления, запишем п— =dq + r, O^r<d. Ввиду выбора d включение
г = п—dq — п— (nuo + mvo) q = n (1 —uQq) + т (— voq) С J влечет равенство г = 0. Стало быть, d\n. Аналогично доказывается, что d\m. Пусть теперь d'—любой делитель чисел пит. Тогда
d' | n, d' | т => d' | nuQ, d' \ mvQ => d' | (nu0 +mvQ) => d' |d.
Итак, d обладает всеми свойствами наибольшего общего делителя, и поэтому d = HCMI(n, т). Мы приходим к следующему утверждению.
Наибольший общий делитель двух целых чисел п, т, не равных одновременно нулю, всегда записывается в виде
НОД (п, т) = пи + mv\ u,v^Z.	(4)
В частности, целые числа п, т взаимно просты тогда и только тогда, когда
nu-\-mv=^\	(4')
при некоторых u,v£Z. В
Было проверено, что взаимная простота п, т влечет соотношение (4'). Обратно, если п, т таковы, что имеет место (4'), то d |п, d\m => d\nu, d\mv => d|(пи + mu) => => d | 1 => d = ± 1.
Доказательство соотношений (4) и (4') довольно эффективно. Нужно взять любой положительный элемент из множества J (см. (3)), а затем уменьшать его при помощи алгоритма деления до тех пор, пока не получится наименьший элемент, который и будет наибольшим общим делителем.
§8]
АРИФМЕТИКА ЦЕЛЫХ ЧИСЕЛ
61
УПРАЖНЕНИЯ
1.	Каждое простое число имеет вид 4k1 или 4k— 1. Используя мультипликативность множества S из п. 1, доказать бесконечность множества простых чисел вида 4k— 1. (Указание. При любом натуральном и число 4и1— 1 имеет по крайней мере один простой делитель р вида 4k— 1, причем р > п.)
2.	Доказать, что существует бесконечно много простых чисел вида 4&+1, опираясь на следующее нетривиальное утверждение (см. п. 1 § 2 гл. 9). Если п, т £ Z, НОД (и, т)=1, и если р — простое число, делящее п24-/и2, то р = 4^4-1. (Указание. Положить п = 2 и т = р1р2 ... pSt где pL.ps— различные простые числа
вида р/ = 4/?/4-1. Тогда всякий простой делитель р нечетного числа п2-\-т2 имеет вид 4&4-1, причем р не принадлежит множеству {Pl. Р2. •••. Ps}’)
3.	Если натуральное число и делится в точности на г различных простых чисел plt ..., prt то количество чисел, меньших п и взаимно простых с п, равно
/ ч Л И ЛИ \ Pl J \ Рг )
Функция ф: N—называется функцией Эйлера. Проверить справедливость формулы для значений ф (п) при п<:25 и при п—рт (см. также п. 4 § 1 гл. 9).
4.	Используя биномиальную формулу, индукцией по и доказать, что если р — простое число, то пр — п делится на р при любом п £ 2. (Указание. В случае неудачи рекомендуется обратиться к § 4 гл. 4, где содержится доказательство, использующее «высокие» соображения.)
Глава 2 АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА. МАТРИЦЫ
Прямоугольные матрицы, введенные в § 3 гл. 1, встречаются настолько часто, что с течением времени возник самостоятельный раздел математики—теория матриц. Ее становление относят к середине прошлого века, но полноту и изящество она приобрела позднее, вместе с развитием линейной алгебры. До сих пор теория матриц остается важным инструментом исследования, хорошо приспособленным и к запросам практики, и к абстрактным конструкциям современной математики. Здесь будут изложены простейшие результаты теории матриц.
Название главы, возможно, порождает иллюзию, что описание чисто алгебраических объектов мы собираемся переложить на плечи геометрии. Фактически же речь идет лишь об удобном и экономном выражении свойств матриц и решений линейных систем на языке, заимствованном из геометрии. Понятия пространства, вектора, линейной зависимости, ранга системы и т. п., являющиеся общепринятыми, развиваются ровно настолько, насколько они необходимы для наших непосредственных целей. Геометрической интуиции отведена более почетная роль в других курсах.
Между прочим, линейные пространства нам нужны еще и для того, чтобы можно было говорить о линейных отображениях, спутниками которых являются матрицы. Именно композиция отображений (см. п. 2 § 4 гл. 1) приводит наиболее естественным путем к понятию произведения матриц.
§ 1. Арифметические линейные пространства
1. Мотивировка. В связи с системами линейных уравнений нам приходилось рассматривать строки длины п, в которые вкладывался разный смысл. Это были строки (aZ1, ai2, ain),	матрицы A = (azy) размера
§ 1] АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА	63
mxn и решения (х£, х°2, ...» х°п) линейной системы с матрицей А. Приведение в § 3 гл. 1 системы или матрицы к ступенчатому виду включало, помимо элементарного преобразования типа (I), два важных акта: умножение строки на число и сложение двух строк. Те же действия можно производить и с решениями однородной линейной системы. Действительно, если (х{, х2, ..., х'п) и (%i,	•••> х'п)—два решения системы
Я/Л + ^i2X2 +------\~ainxn =	/ = 1, 2, ..., /и,
а а, р—два любых вещественных числа, то строка
(ах; + р%;', ах; + р%2, . . ., ах; + Р^)
тоже будет решением нашей системы:
(ах[ + р%0 +
+ ai2 (а%; + р/г) 4- ... + tn (ах'п +	=
= а (аах[ + ai2x2 + ... + aitlx'n) +
+ Р (aiiXl + ai2X2 + • • • + ainx'ri) — 0.
С другой стороны, любая строка, что бы она ни выражала, является элементом «универсального» множества R" — n-й декартовой степени множества R вещественных чисел. Поэтому желательно изучить общий объект, свойства которого автоматически переносились бы на матрицы и на решения однородных систем.
2. Основные определения. Пусть п — какое-то фиксированное натуральное число. Арифметическим линейным пространством размерности п над R называется множество Rn (его элементами являются векторы-строки или просто векторы), рассматриваемое вместе с операциями сложения векторов и умножением их на скаляры—вещественные числа. Скаляры обозначаются строчными буквами латинского или греческого алфавита, а векторы — заглавными латинскими буквами, как матрицы. По существу на вектор X = (xn %2, ..., хп) можно смотреть как на lxn-матрицу. Пусть Y = (ylt у2, ..., уп)—еще один вектор, К — скаляр. По определению
X + Y = (xl + y1, х2 + у2.....хп + уп),
XX = (Ххп Хх2.......Ххл).
64
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
Нулевой вектор (0, 0, ..., 0) обозначается в дальнейшем обычным символом нуля 0. Далее, R1 принято отождествлять с R.
Формальные правила действий с вещественными числами, безусловно известные читателю, переносятся на IR". Их перечисление, хотя и скучное, дает точное представление о том, что следует понимать под абстрактным векторным пространством, которое изучается в более позднем курсе линейной алгебры и геометрии:
ЛПг: Х+У=У+Х для любых векторов X,	(закон ком-
мутативности^
ЛП2: (Х4-У)4-2 = Х + (У + 2) для любых трех векторов X, К, (закон ассоциативности);
ЛП3: существует специальный (нулевой) вектор 0 такой, что Х + 0 = Х для всех XglR'1;
ЛП4: каждому X^IR” отвечает противоположный (или обратный) вектор —X такой, что Х + ( — Х) = 0;
ЛП6: IX = Х для всех X£R";
ЛПв: (аР)Х = а(рХ) для всех a, pgIR, X£R";
ЛП7: (а + Р) Х = аХ + рХ (дистрибутивность относительно скаляров) ;
ЛП8: а (X + У) = аХ + <zF (дистрибутивность относительно векторов).
Единственность векторов 0 и —X, о которых говорится в ЛП3 и ЛП4, равно как и другие простые следствия из указанных правил (или аксиом, если имеется в виду абстрактное векторное пространство), мы не будем выводить, считая их достаточно прозрачными.
Мы назвали R" пространством размерности л, но само понятие размерности приобретет смысл лишь в конце параграфа после небольшой подготовки. Происхождение термина «линейное пространство» разъясняется в курсе аналитической геометрии, где устанавливается взаимно однозначное соответствие между точками (векторами) пространства—декартовой плоскости и их координатами (х, у). Сложению векторов по правилу параллелограмма и умножению их на числа соответствуют как раз действия с векторами-строками в IR2.
Наряду с линейным пространством векторов-строк (хп х2, хп) длины п рассматривается также арифметическое линейное пространство векторов-столбцов высоты п

— [Х1, х2,
• •.
X
п
g 1) АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА	66
как мы их условились обозначать в § 3 гл. 1. Понятно, что различие между ними чисто условное, но мы вскоре убедимся, что полезно иметь оба варианта арифметического пространства. Из контекста обычно ясно, о каких векторах, столбцах или строках, идет речь, поэтому никаких специальных обозначений не вводится.
Пусть V—непустое подмножество в R". Будем называть V линейным подпространством *) в R", если
X, Y$V => aX + pygV	(1)
для всех а, р g R. В частности, нулевой вектор всегда содержится в V. Скажем, совокупность всех векторов-строк (хп ..., хп_19 0) с компонентой хп = 0 является подпространством; его принято отождествлять с R"”1. Имеем цепочку, как принято говорить, канонически вложенных подпространств
0cRc:R2c:... czR^cR".
Решения однородного уравнения хг + х2 + ... + хп = 0 составляют подпространство в R", п>1, отличное от нулевого и от всего пространства R". Ниже приводятся другие примеры.
3. Линейные комбинации. Линейная оболочка. Пусть Хх, Х2, ..., Xk—векторы арифметического линейного пространства Rn и ах, а2, ..., ak—скаляры. Вектор X = ахХх + а2Х2+-.. -\-akXk называется линейной комбинацией векторов Xz с коэффициентами az. Например, (2, 3, 5, 5) —3(1, 1, 1, 1) + 2(1, 0, -1, —1) = (1, 0, 0, 0). Пусть, далее, Y = рхХх + Р2Х2 + ... + рАХА—линейная комбинация тех же векторов Xz с коэффициентами pZf а а, р € R. Тогда
аХ + рУ = а (ахХх + <х2Х2 + . . . + осАХА) +
+Р(Р1х1+р2х2+...+РЛ) =
(аах + РР1) Хх + (аа3+ РР2) Х2 + • • • + (аал + РРл) Х&
— снова линейная комбинация векторов Xz с коэффициентами aaz + ppz. Мы видим, что множество всех линейных комбинаций данной системы векторов Хх, Х2, ..., ХА является линейным подпространством в R”. Обычно его
♦) Это определение выглядит пока не очень Удовлетворительным, но в конце параграфа мы скажем несколько слов в его защиту.
3 А. и. Кострикин
66
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА (ГЛ. 2
обозначают символом <Хх, Х2, ..., Хл> и называют линейной оболочкой системы векторов Х19 Х2, Xk. Говорят еще, что пространство <Хх, Х2, ..., Xk> натянуто наХх, X2i ...tXk или порождено векторами Хх, Х2, ..., Xk.
Можно определить линейную оболочку любого подмножества ScR", понимая под <S> совокупность всех линейных комбинаций конечных систем векторов из S. Ясно, что если V—подпространство в R", то <У> = У: любая линейная комбинация векторов из V принадлежит V. В частности, Sc: У => <5>сзУ, т. е. линейную оболочку <S> можно определить как пересечение всех подпространств, содержащих данное множество S векторов из R":
<S> = П V.	(2)
SCV
На первый взгляд не очевидно, что стоящее в правой части (2) пересечение Л У какого-то семейства подпространств будет подпространством. Но если X, Y£ Л У, то X, Y £У для каждого подпространства У, входящего в семейство. Значит, аХ©0У €У для всех а, 0 g R, а это и дает нужное включение аХ + 0Уё Л У.
Напротив, объединение U (JV подпространств U и V, вообще говоря, не является подпространством, как показывает хотя бы пример подпространств =	0)|X£R}, V = {(0, X) | X£R}-в R2. Линейная
оболочка <U UV> называется суммой подпространств U и V:
U+V==<UUV> = {u + v | u£U, v^V}.
Если (7П^ = 0, то говорят, что сумма U-\-У—прямая, и пишут U ©V. Пусгь У = У1фУ2 и Х = Х1 + Х2 = Х{ + Х2 —два выражения вектора Х£У в виде линейной комбинации векторов Хь Х[^Уг и Хъ'Хг^Уъ- Тогда имеем Хх —Х1 = Х2-—а так как У1П^2 —О, то Xx = Xj, Х2 — Х'2. Обратно, если запись Х = Хх + Х2, X/gV,, £=1,2, единственна для каждого вектора Х£У, то сумма V = Vi + V2 — прямая (оставим это в качестве упражнения). Более общо, сумма У подпространств Ух, ..., V^czfR" называется прямой суммой У==Ухф.. .©У*, если каждый вектор X£V имеет однозначное выражение вида X ==Хх© ... ©X* с Х,£У/.
Пример 1. В R" рассмотрим два множества:
Уи={(*1......0.........°)l
и
vCT = {(0...°-
О < т < п. Непосредственно проверяется, что Uт, Ут— подпространства в Rw, причем Uт-\-Ут = Кп hUтПУт==0. Значит, = Uт фV©.
$ 1] АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА 67
Пример 2. В R" рассмотрим так называемые единичные векторы-строки
=	0,	0), £2 = (0, 1..0), ..., Еп = (0, 0..1). (3)
Каждый вектор Х = (хь х2, . . хп) однозначно записывается в виде X =	+ х2Е2 + ... + хпЕп. Поэтому
R" = <£t> © <Е2> © ... ф <Еп>.
Единичные векторы-столбцы будем обозначать символами
£О) = [], 0, ..., 0J, £(2) = [0, 1, ..0], ..., £(п) = [0, 0, ..., 1]. (3')
4.	Линейная зависимость. Система векторов Xlf .. Xk пространства R" называется линейно зависимой, если найдутся k чисел ап а2, ...» ал, одновременно не равных нулю и таких, что
(Z1X1 + <х2Х2 © ... +	= 0	(4)
(справа стоит нулевой вектор). Будем говорить также, что линейная зависимость (4) нетривиальна. Если же сс1Х1©а2Х2 + ... ©алХл = 0 => аг = а2= .. . =а* = 0, то векторы Xn Х2, ..., Xk называются линейно независимыми.
Пример 2 в п. 3 показывает, что единичные векторы Elf Е2, Еп линейно независимы. Один вектор X #= 0, очевидно, всегда линейно независим, поскольку ZX = 0, X =# 0 => А, = 0. Далее, свойство системы Хп ..., Xk быть линейно независимой никак не связано с порядком векторов, так как слагаемые azXz в равенстве (4) могут быть переставлены произвольным образом.
Теорема 1. Имеют место следующие утверждения:
(i)	система векторов {Хг, ..., Xk} с линейно зависимой подсистемой сама линейно зависима;
(ii)	любая часть линейно независимой системы векторов {Xlt ..., Xk} линейно независима;
(iii)	среди линейно зависимых векторов Хх, ...» Xk хотя бы один является линейной комбинацией остальных;
(iv)	если один из векторов Хп ..., Xk линейно выражается через остальные, то векторы Хг, ..., Xk линейно зависимы;
(v)	если векторы Х19 ..., Xk линейно независимы, а векторы Хх, .Xk, X линейно зависимы, то X—линейная комбинация векторов Х19 ...» Xk;
з*
68
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА (ГЛ. ft
(vi)	если векторы ...» Xk линейно независимы и вектор Xk+1 нельзя через них выразить, то система Хи ..., Xk, Хл+1 линейно независима.
Доказательство, (i) Пусть, например, первые s векторов ..., Xs, s<k, линейно зависимы, т. е.
а1Хг + ... + asXs = О,
где не все az равны нулю. Положив тогда а5+1 = ... = ал = 0, получим нетривиальную линейную зависимость
ot1X1 + ... + а(УХ5 + а(5+1Х(5+1 + ... -|-алХА = 0.
Утверждение (ii) непосредственно следует из (i) (рассуждение от противного).
(iii)	Пусть, например, а^Ов соотношении (4). Тогда

аА-1 у
-----Ab — 1’ “ft
(iv)	Пусть, например, Xft==P1X1+ ... + рА_1Хл_1. Положив а1 = Р1, ...,	ak = —1, придем к соот-
ношению (4) с коэффициентом аА=/=0.
(v)	Нетривиальное соотношение
₽1Х1+ ... + P*Xft + pX =0
с Р#=0 дает в силу (iii) то, что нужно. Если, однако, Р = 0, то pj =...== рА = 0, поскольку Хр .. ., Xk по условию линейно независимы.
Утверждение (vi) непосредственно следует из (v). |
5. Базис. Размерность. Дадим теперь важное
Определение. Пусть V—подпространство в IR". Система векторов Х±....Хг 6 V называется базисом для V
(или в V), если она линейно независима и ее линейная оболочка совпадает с V:
<Х,....Xr> = V.
Из определений базиса и линейной оболочки системы векторов следует, что каждый вектор X € V записывается единственным образом в видеХ =aiX!-|- •.. +arXr. Коэффициенты ap .... ar € R называются координатами вектора X относительно базиса Хп ..., Хг.
Как мы уже видели, линейно независимые единичные векторы (3) порождают Стало быть, Et, ..., £„) — базис пространства R". Но этот так называемый стан
г п
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА
69
дартный базис—далеко не единственный базис в R". Например, векторы
Е{ = ЕЬ Е'2 = Е1 + Е21 E'3 = E1 + E2 + E3i ...
..., tEn = E1-j-E2 + ... + Еп
тоже составляют базис пространства R" (проверьте это аккуратно). С другой стороны, пока не ясно, каждое ли линейное подпространство в R" обладает базисом, а если да, то будет ли количество базисных векторов постоянным. Ответ на оба вопроса оказывается положительным. Наши рассуждения будут основаны на следующей лемме.
Лемма. Пусть V—подпространство в R" с базисом Х19 ..., Хг и Y19 У2, ..., Ys—линейно независимая система векторов из V. Тогда s^.r.
Доказательство. Как и все векторы из V, Y19 ...
..., Ys являются линейными комбинациями базисных векторов. Пусть
Y-^ =	4" ^21-^2 4" • • • 4“ «Г Лг,
К2 == 2^1 4“ ^22^2 Ч" • • • 4“ ^Г2^Г»
^^Х. 4“ ^23^2 4" • * • 4-
где atj—какие-то скаляры (являясь координатами векторов Yj, они однозначно определены, но это пока несущественно для нас). Рассуждаем от противного. Предположим, что s > г.
Составим линейную комбинацию векторов Yj с коэффициентами хр
4~ • • • 4~ s= (^ir^i 4~^12^2 + • • • 4-^is^s) 4” • • •
... 4- (arlXi 4- ar2x2 4- ... 4- arsxs) Xr
и рассмотрим систему из г линейных уравнений с s неизвестными:
^11^1 4“ ^12'^2 4- • • • 4“
arlxt 4-ar2x24---НгЛ = 0-
Так как по предположению s > г, то применимо следствие 2 § 3 гл. 1, согласно которому наша система обладает ненулевым решением (х^,	•••, *s)- Мы при
70
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
ходим к нетривиальной линейной зависимости
XiY1 + XtY2+...+xosYs==0, наличие которой, однако, противоречит условию леммы. Значит, s<r. |
Теорема 2. Каждое подпространство VczRn обладает конечным базисом. Все базисы пространства V состоят из одинакового числа г^.п векторов {это число называется размерностью пространства V и обозначается символом diniRV или просто dimV).
Доказательство. Если V = 0, то доказывать нечего. Считаем, что V#=0. Пусть мы нашли в V линейно независимую систему векторов Хг, ..., В качестве А\ можно взять любой ненулевой вектор из V. Если линейная оболочка <А\, ..., Xky не совпадает с V, то выберем в V вектор Xk+l^<Xlf ...,ХА>. Другими словами, не является линейной комбинацией векторов Xlf . .., Xk. По теореме 1 (vi) система Л\, ..., Xk, Xk+1 линейно независима. Мы могли бы продолжать неограниченно процесс расширения линейно независимой системы, но все ее векторы Xz- лежат в R" = <£'1, £2, ..., Е„>, а по только что доказанной лемме всякая линейно независимая система в R" содержит не более п векторов. Стало быть, при некотором натуральном г^.п линейно независимая система ..., Xk, ..., Xr£V станет максимальной, т. е. мы получим линейно зависимую систему Xt, ..., Хп X, каков бы ни был вектор Х#=0из V. По теореме 1 (v) будем иметь включение X С <Хг, ..., Хг>. Значит, 7 = <Х1, . .., Хг>, и векторы А\, .. ., Хг составляют базис для V.
Предположим теперь, что Ух, ..., Уу—еще один базис для V. По лемме мы имеем неравенство s^r. Поменяв местами системы Xv ...» Хг и , Ys, мы получим по той же лемме неравенство r^s. Стало быть, s = r, и теорема доказана. |
Заметим, хотя в этом и нет большой необходимости, что все наши рассуждения одинаково относились как к пространству строк, так и к пространству столбцов.
Итак, с каждым линейным подпространством V в R" ассоциируется целое положительное число г ^п, которое мы назвали размерностью V: г = dimV. В частности, dimR" = n. Этот важный числовой параметр пространства
§ 1] АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА	71
можно характеризовать разными другими способами (см. упражнения). Один из вариантов определения размерности основан на понятии ранга системы векторов. Именно, если Х2, ...} — какая-то, возможно бесконечная, система векторов в арифметическом линейном пространстве то, как мы знаем, размерность линейной оболочки <ХП Х2, . ..> не превосходит п. Ее называют рангом системы {Хх, Х2, ...}:
rank Х2, ...} = dim<Xx, Х2, ...>.
Несколько слов в оправдание термина «линейное подпространство». Выберем в линейном подпространстве Vc:R" какой-нибудь базис ,..., Хг. Тогда X = ахХх + ... . ..+агХг для каждого X^V, и множество V находится во взаимно однозначном соответствии с множеством всех координатных строк (ах, ..., аг) длины г (или координатных столбцов [ап.. аг] высоты г). Кроме того, при этом соответствии линейная комбинация векторов переходит в линейную комбинацию строк. Стало быть, выбор любого базиса в V позволяет нам интерпретировать V как арифметическое векторное пространство Кг, вложенное неким способом в п^г.
УПРАЖНЕНИЯ
1.	Пусть V, Vi и V2—подпространства в причем Ус:У1 + И2. Всегда ли верно, что V = V П +	^2? Что можно сказать про это
соотношение в частном случае С2 V?
2.	Пусть И—подпространство в Если V=U ф W—разложение в прямую сумму, то подпространство W называется дополнением к Z7, a U — дополнением к W в V. Однозначно ли определено дополнение к U в К? Сравнить W с теоретико-множественным понятием дополнения (см. § 4 гл. 1).
3.	Показать, что векторы Х1==(1, 2, 3), Х2 = (3, 2, 1) линейно независимы; рассмотреть линейную оболочку V = (Xi Х2>; показать, что вектор Х = (—5, 2, 9) содержится в К, и найти его координаты в базисе Хь Х2; найти в R3 хотя бы одно дополнение к V.
4.	Показать, что система векторов Xlt ..., Хп из R" тогда и только тогда порождает когда она линейно независима.
5.	Показать, что всякую линейно независимую систему векторов Xi, ..., Xk из подпространства V CZ R" можно вложить в некоторую базисную систему для V,
72
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
6.	Пусть U и V—подпространства в Доказать, что если П У = 0, то dim (C/+V) = dim U + dimV.
7.	Найти ранг системы векторов (0, 1, 1), (1,0, 1), (1, 1, 0).
§ 2. Ранг матрицы
1. Возвращение к уравнениям. В арифметическом ли* нейном пространстве столбцов высоты tn рассмотрим п векторов
А(/> = [а1/, а2/, .... amJ], j=l, 2....п,
и их линейную оболочку V == <Л(1), Л(2), ..Л(л>>. Пусть дан еще один вектор В==[Ьи Ь2,	Спрашивается,
принадлежит ли В подпространству УсК™, а если принадлежит, то каким образом его координаты blf ..., Ьт (относительно стандартного базиса (3') § 1) выражаются через координаты векторов Л(/). В случае diml/ = n вторая часть вопроса относится к значениям координат вектора В в базисе Л(1),	А(п). Мы берем линейную ком-
бинацию векторов Л(/) с произвольными коэффициентами Ху и составляем уравнение x^(1)+ ... +х„Л(Л) = В, Наглядный вид этого уравнения
fi12
&т2
а1п
а2П
атп
(1)
есть лишь иная запись системы из т линейных уравнений с п неизвестными:
а11Х1 + fll2^2 + • • • + атхп =
^21Л1 4“ ^22^2 4- ... 4- ^2п^п ~ ^2>
........................................... (2)
amlXl 4* ат2Х2 + • • • 4" атпХп —
Именно такую систему мы и встретили впервые в § 3 гл. 1. Там же были введены простая и расширенная матрицы
Он а1а ... а±п
а21	’ а2П
ат1 &т2 • • • атп
. (А|В) =
ап а12 ... а1п
а21 а22 • • • а2п Ь2
ат1 ат2 • • • атп
(3)
РАНГ МАТРИЦЫ
73
f S]
линейной системы (2). Первое впечатление таково, что мы вернулись к исходным позициям, потеряв время и ничего не выиграв. На самом же деле мы располагаем теперь рядом важных понятий. Осталось приобрести навыки в обращении с ними.
В этом месте удобно условиться в обозначениях. В дальнейшем для сокращения записи мы часто будем п
обозначать сумму $i + s2 + • • • + значком 2 si- При этом sn	sn — величины произвольной природы
(числа, векторы-строки и т. д.), для которых выполнены все законы сложения чисел или векторов. Правила
п	п	п.	п	п
2 (Sz4-G)= 2«z+ 2g
t=l	i=\	i=\	i=l	i=l
достаточно понятны, чтобы их нужно было разъяснять. Будут рассматриваться также двойные суммы
пт	п / т \ т / п \
2 2^47= X (	) = SaZ/>
/=1 i=l /=l\t=l	J	/ i,l
в которых порядок суммирования (по первому и по второму индексу) можно выбирать по своему желанию. Это легко понять, если расположить величины aif в прямоугольную матрицу размера тхп: в нашей воле начинать суммирование элементов матрицы по строкам или но столбцам.
Другие возможные типы суммирования будут разъясняться в нужном месте.
2. Ранг матрицы. Назовем пространством столбцов прямоугольной матрицы А размера тхп (см. (3)) введенное выше пространство У = <Д(1), Д<2), ..., Д(П)>, которое мы будем обозначать теперь символом УДД) или просто УДв—вертикальный). Его размерность гДЛ) = . :(iimVe назовем рангом по столбцам матрицы А. Аналогично вводится ранг по строкам матрицы А: гг(А) =
dimV,, где Ve = <Alt Д2, ..., Аот> —подпространство в Кл, натянутое на векторы-строки 4z = (aZ1, а/2, ..., afn), i 1, 2, ...» т (г — горизонтальный). Другими словами,
г, (Л) = rank {Л(1>,	..., 4%
гг(Л) = гапк {Лп А2, .... AJ
74
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
— ранги систем векторов-столбцов и соответственно векторов-строк. По теореме 2 § 1 величины гв(Д) и гДД) определены правильно.
Следуя определению, данному в § 3 гл. 1, будем говорить, что матрица Д' получена из А при помощи элементарного преобразования типа (I), если A's = At, A't = As для какой-то пары индексов s =7^/ и A; = Af для Если же A'i = Ai для всех /=#=$ и Дз = Д^Д-%ДО s=/=Z, XgR, то говорим, что кД применено элементарное преобразование типа (II).
Заметим, что элементарные преобразования обоих типов обратимы, т. е. матрица Д', получающаяся из А при помощи одного элементарного преобразования, переходит снова в А путем применения одного элементарного преобразования, причем того же типа.
Лемма. Если матрица Д' получена из прямоугольной матрицы А путем применения конечной последовательности элементарных преобразований, то имеют место равенства:
0)гг(Л') = гДЛ);
(ii) гв(Л') = гв(Л).
Доказательство. Достаточно рассмотреть тот случай, когда Д' получена из А путем применения одного элементарного преобразования (сокращенно э. п.).
(i) Так как, очевидно, <ДХ, ..., А5, ..., At, ..., Дот> = = <ДП ..., До ..., Д5, ..., Дгл>, то э. п. типа (I) не меняет гг (Д). Далее, Д'=--Д5 + ХД^ => AS = A'S — ХД, и, следовательно, <ДХ, ..., As + kAt, ..., At, ..Ат> = <ДХ,... ..., As, ..., Ait ..., Дг/г>, так что г, (Д) не меняется и при э. п. типа (II).
(ii) Пусть Д'(/), /=1,	—столбцы матрицы Д'.
Нам нужно доказать, что
п	п
2М‘м	2М'(М.
/=1	/=1
Тогда всякой, в том числе и максимальной, независимой системе столбцов одной матрицы будет отвечать независимая система столбцов с теми же номерами другой матрицы, чем и устанавливается равенство гДД') = = гв (Д). Заметим еще, что в силу обратимости элементарных преобразований достаточно доказать импликацию
РАНГ МАТРИЦЫ
75
п
в одну сторону. Пусть, например, 2^/Д(/) = 0. Тогда, /=1
заменяя в (1) ху на Ху и все на 0, мы видим, что (>4,^2, ..., Х„) — решение однородной системы ОС, ассоциированной с линейной системой (2). По теореме 1 гл. 1 это решение будет также решением однородной системы ОС', получающейся из ОС при помощи э. п. типа (I) или (II) и имеющей своей матрицей как раз матрицу Д'. Так как система ОС' кратко записывается в виде 2хуД'(,)=0, то мы приходим к соотношению 2 ^jAf (/)=0. Н
Основным результатом этого параграфа является сле
дующее утверждение:
Теорема 1. Для любой прямоугольной т х п-матри-цы А справедливо равенство гв(Д) = гДД) (это число называется просто рангом матрицы А и обозначается символом rank Д).
Доказательство. По теореме 2 § 3 гл. 1 конечным числом элементарных преобразований, совершаемых над строками Аь матрицу А можно привести к ступен-
чатому виду:
А =
^11	• • •	a\k	• • •	•	• •	ais	•	• •	&ln
О	...	a2k	•..	a2l	...	a2s	.	• •	a2n
0	...	0	...	a3i	...	a3s	...	tz3n
0	...	0	...	0	...	ars	...	arn
0...0...0...0 ...0
(4)
0 ... 0 ...0 ...0 ...0
с ana2^3Z ...	Согласно лемме
гДД) = гв(Л), гДД) = гДД),
так что нам достаточно доказать равенство (Д) = г, (Д).
Столбцы матриц А и А с номерами 1, k, I, ..., s, отвечающими главным неизвестным хх, xk, xz, ..., xs линейной системы (2), будем называть базисными столбцами, Эта терминология вполне оправдана. Предположив наличие соотношения
М(1)++ MU) + • • • + М(5) = о,
76
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ТЛ. 2
связывающего векторы-столбцы А(1> = [ап,О, 0], Л(Л) = [а1А, а2к, 0, ..., 0], Ли) = [пи, uas, ...,	0, . *., 0]
матрицы (4J, получим последовательно: A,arj = 0, М3/ = 0, Ча2Л = °> Каи = °, атак как
то Ах == Afr = ht = ... = А* = 0. Значит, rank {Л(1), Л(Л), Л(П, ..., Ли)} = г и гв (Л) > г. Но пространство Vt, порожденное столбцами матрицы Л, отождествляется с пространством столбцов матрицы, которая получается из Л удалением последних т—г нулевых строк. Поэтому гДЛ) = = dim Ve dim Rr = г. Сопоставление двух неравенств показывает, что гв (Л) = г (неравенство гв (Л) г вытекает также из того очевидного соображения, что все столбцы матрицы А являются линейными комбинациями базисных; проделайте это самостоятельно в качестве упражнения).
С другой стороны, все ненулевые строки матрицы А линейно независимы: любое гипотетическое соотношение
АХЛХ + А2Л2 + • • • + hrAr — 0, AzgR, как и в случае со столбцами, дает последовательно Аха1Х = 0, А2а2й = 0, ..., Ararj=0, откуда АХ=А2=... = Аг=0. Стало быть, гг(Л) = г = гв(Л). |
3. Критерий совместности. Ступенчатый вид матрицы Л, дающий ответ на ряд вопросов относительно линейных систем (см. § 3 гл. 1), содержит элементы произвола, связанные, например, с выбором базисных столбцов или, что эквивалентно, с выбором главных неизвестных системы (2). В то же время из теоремы 1 и из ее доказательства извлекается
Следствие. Число главных неизвестных линейной системы (2) не зависит от способа приведения ее к ступенчатому виду и равно rank Л, где А—матрица системы.
Действительно, мы видели, что число главных неизвестных равно числу ненулевых строк матрицы Л (см. (4)), совпадающему, как мы видели, с рангом матрицы Л. Ранг определялся нами совершенно инвариантным образом. Этими словами выражается тот факт, что ранг матрицы служит ее внутренней характеристикой, не зависящей от каких-либо привходящих обстоятельств. |
РАНГ МАТРИЦЫ
77
В следующей главе мы получим эффективное средство для вычисления ранга матрицы А, устраняющее необходимость приведения А к ступенчатому виду. Это, несомненно, повысит ценность утверждений, основанных на понятии ранга. В качестве простого, но полезного примера сформулируем критерий разрешимости линейной системы, речь о котором шла еще в гл. 1.
Теорема 2 (Кронекер—Капелли). Система линейных уравнений (2) совместна тогда и только тогда, когда ранг ее матрицы совпадает с рангом расширенной матрицы (см. (4)).
Доказательство. Совместность линейной системы (2), записанной в виде (1), можно трактовать (с этого начинался настоящий параграф) как вопрос о представлении вектора-столбца В свободных членов в виде линейной комбинации векторов-столбцов 4^ матрицы А. Если такое представление возможно (т. е. система (2) совместна), то Д€<4(1), ..., 4(я)> и rank {4(1>, ..., 4(«>}=гапк {4(1>, ... ..., 4(и), В}, откуда rank А=гв (4)=гД(4 |B))=rank (4 | В) (см. формулировку теоремы 1).
Обратно, если ранги матриц 4 и (4 | В) совпадают и ..., 4(/Л| — какая-то максимальная линейно независимая система базисных столбцов матрицы 4, то расширенная система ..., А('г\ В} будет линейно зависимой, а это по теореме 1 (v) § 1 означает, что В — линейная комбинация базисных (и тем более всех) столбцов А^>. Стало быть, система (2) совместна. |
УПРАЖНЕНИЯ
1. Доказать теорему 1, не приводя tn Хи-матрицу А=(ац) к ступенчатому виду. (Указание. Пусть dimV2(A) = r, dimVtf(A) = s. Выбрать г базисных строк; без ограничения общности можно считать, что ими являются первые г строк А2, ...» Аг. Рассмотреть укороченную гхи-матрицу A = [Ai, А2> •••» Аг], составленную из первых/-строк матрицы А. Выбрать в A t базисных столбцов, / = dimVe(A). 11усть ими будут А(1>, ..., А<*К Так как V9 (А) с: Rr, то i г. Для каждого столбца А(*\ k > /, нужно найти скаляры Xj, .XfgR. такие, что А<*> = Х1А<1>-|- ... 4-Х*А(*>, т. е. а^= ЬрСЦр, р=1
При I < г это наверное так, ибо имеется соотношение A<ft>=X1A(I>+...
78
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
для укороченных столбцов. При i > г использовать выражение Ai — Ц1Д1+ ... + ргЛг для *‘й строки через первые г строк.
г	г t	i г
Из него следует, что aik= 2 М*«гл=2 Hi У ^«zP= У У Hz«^= /=1	/=1	р=1	р=1	/=1
t
= 2 ^paip' Установленная линейная зависимость столбцов показы-р=1
вает, что s^t, а так как /<:г, то s^r. Рассмотреть, далее, так
называемую транспонированную матрицу
*А =
«и
«12
«1П
«21 • • • «ОТ1
«22 • • • ат2
а2п • • • атп
размера лХ/и. Имеют место равенства г, (*Л) = гв(Л), rfl (М) = гг(Л), поэтому по доказанному r^s. Стало быть, r = s.)
2. Как и в случае строк, перестановку столбцов с номерами s и t матрицы А называют элементарным преобразованием (э.п.) типа (I), а прибавление к s-му столбцу /-го столбца, умноженного на скаляр Л,— э.п. типа (II). Указать ступенчатый вид матрицы А по столбцам. Элементарными преобразованиями столбцов привести матрицу А (см. (4)) к виду
о
'о
_	_	_ __	г
где аи = ац, а22= «2й. «зз = «зь • • •> «гг = ars\ JJ а,7 / 0.
t=i
3. Показать, что при а0 Ф 0 квадратная матрица
Л =
0	0	...	0	0	а0
1	0	...	0	0
0	1	...	0	0	а2
0 0 ... 1 0
0 0 ... 0 1 ап
имеет ранг п.
$3]
ОТОБРАЖЕНИЯ. ДЕЙСТВИЯ С МАТРИЦАМИ
79
4.	Условие равенства рангов двух матриц
выразить геометрическим свойством множества п прямых на плоскости.
§ 3.	Линейные отображения. Действия с матрицами
1.	Матрицы и отображения. Пусть R" и Rm—арифметические линейные пространства столбцов высоты п и т соответственно. Пусть, далее, A = (aty) — матрица размера тхп. Определим отображение фА: R"—>RW, полагая для любого X = [хп х2, ..., х„] g R”
<Рл (Х) = Мш + х2А(2)+ •  •	(1)
где Д(1), ..., А(п) — столбцы матрицы А (сравнить с (1) §2). Так как они имеют высоту т, то в правой части (1) стоит вектор-столбец Y = [у19 у2, ..., ут] С Rm. Более подробно (1) переписывается в виде
j= 1. 2, ..т. (Г)
Если X = X'+ X" = [x[+Xi, х’г + Хг....х'п + Хп], ТО
ч>л(х'+х") = S (х;+х';)л«>=2 х;л«->+2	=
Z=1	i=l	i=l
= Фл(Х') + Фл(Х’).
Аналогично
Фл № = 2 Кх,А “> = X 2 Xi А = Хфд (X), X € к. i=l	t=l
Обратно, предположим, что <р: R"—^ROT— отображение множеств в смысле § 5 гл. 1, обладающее следующими двумя свойствами:
(i) ф(Х'+Х") = ф(Х') + ф(Х") для всех X', X" £R";
(ii) ср (XX) = Хф (X) для всех XgR”, XgR.
Тогда, обозначив стандартные базисные столбцы (см. п. 3 § 1) пространств R" и R"1 соответственно символами ...
и Е(^,	мы воспользуемся свойствами
80
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
(i), (И) в применении к произвольному вектору X = =[хх, х2, ..., х„] = 2 XjE*!' с R":
7=1
Ф (X) = ф ( 2 XjE'i''} = 2 Xj<f (ЕП (2) \/=1	/	7=1
Соотношение (2) показывает, что отображение <р полностью определяется своими значениями на базисных векторах-столбцах. Положив
т
Ф = S aijEm = [°1/. агр • • • > «»/] = Л<У> ё R", (3) i— 1
мы обнаруживаем, что задание ф равносильно заданию прямоугольной матрицы А = (а/7) размера тхп со столбцами Л(1), ..., А(п}, а соотношения (1) и (2) фактически совпадают. Стало быть, можно положить ф = фл.
Определение. Отображение ф = фл: R"—>Rm, обладающее свойствами (i), (ii), называется линейным отображением из R" в Rw. Часто, в особенности при п = т, говорят о линейном преобразовании. Матрица А называется матрицей линейного отображения фл.
Пусть фл, фл'—два линейных отображения R"—>R/n с матрицами А = (а^) и Аг = Тогда равенство фл= — Фл' равносильно совпадению значений фл (X) = фл\(Х) для всех X € R". В частности, А' = фл* (Е^) = фЛ (Е^)-^= = A{J\	откуда а'ц = а^ и А' = А.
Резюмируем наши результаты:
Теорема 1. Между линейными отображениями R" в Rm и матрицами размера тхп существует взаимно однозначное соответствие. |
Следует подчеркнуть, что бессмысленно говорить о линейных отображениях S—>7" произвольных множеств S и Т. Условия (i), (ii) предполагают, что S и Т—подпространства арифметических линейных пространств R71, Rm.
Обратим внимание на специальный случай m — 1, когда линейное отображение ф: Rn—>R, обычно называемое линейной функцией от п переменных, задается и скалярами alt а2, . .., ап:
Ф(Х) = Ф(хх, х2....х„) = а1х1 + а2х!64-... +а„х„. (4)
5 3]
ОТОБРАЖЕНИЯ, действия с матрицами
81
Наша терминология отличается от той, которая принята в средней школе, где (в случае одной переменной х) линейной называют функцию х\—>ах-\-Ь.
Линейные функции (4), равно как и произвольные линейные отображения IR."—при фиксированных п и т можно складывать и умножать на скаляры. В самом деле, пусть <рл, срв: R"——два линейных отображения. Отображение
ф = асрл + Р<рв: R"—а, определяется своими значениями:
<р (X) = сс<рл (X) + р(X).
В правой части стоит обычная линейная комбинация векторов-столбцов.
Так как
Ф (X' + X") = аФл (X' + X") + Рфя (X' + X") =
= а {ФЛ (X') + фл (X")} + Р {фв (X') + Фв (X")} =
= {афл (X') + рфв (X')} + {аФл (X") + Р<Рв (X")} =
= Ф(Х') + ф(Х");
Ф (XX) = афл (XX) + Рфв (XX) = аХфл (X) + рХФв (X) -
=.Х{афл (X) + рфв (X)} = Хф (X)
(здесь мы неявно пользовались правилами ЛП2—ЛП, из § 1), то ф—линейное отображение. По теореме 1 можно говорить о его матрице С: ф = фс. Чтобы найти С, выпишем, следуя (3), столбец с номером j:
[с1/( ciJt	cmJ\ = С» = фс (£АЛ) =
= афл (£}/>) + Р<Рв (£,?’) = «Л + РВ‘» =
= [аа1у + рЬ17, аа2/ + рЬ2У, .... ааму + р6иУ].
Матрицу С = с элементами czy = aazy + pfczy естественно назвать линейной комбинацией матриц А и В с коэффициентами аир:
а
«и ... а1п
^11
+ ₽
• • •
ат1 • • • атп
• • • ^тп
||ъап + Р&п ... аа1п + 0&1п
II ^ат1 + РЬ/Л1 ... аатп + рь тп
(5)
82
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
Итак,
афд + Рфв = <РаЛ+р5.	(6)
Особенно часто нами будет использоваться тот факт, что линейные комбинации линейных функций снова являются линейными функциями.
В заключение этого пункта отметим, что если правила JlFli—ЛП8 из § 1 для линейных пространств переписать, заменив всюду векторы-строки X, Y, Z на матрицы размера mxn, то в соответствии с определяющим соотношением (5) получатся правила ЛМХ—ЛМ8, которые дают основание говорить о линейном пространстве матриц размера тхп. Если угодно, его можно считать компактной записью линейного пространства строк длины тп (строки разбиты на отрезки длины и, расположенные друг под другом).
2. Произведение матриц. Соотношения (5) и (6) выражают согласованность действий сложения и умножения на скаляры в множествах матриц размера тхп и отображений R"—>[R'\ В случае произвольных множеств имеется еще важное понятие произведения (композиции) отображений (см. п. 2 § 5 гл. 1). Разумно ожидать, что композиция двух линейных отображений должна выражаться неким согласованным образом в терминах матриц. Посмотрим как это делается.
Пусть <рв: R"—>R5, фл: Rs—— линейные отображения, срс = Фл ° Фа—их композиция:
Вообще говоря, нам следовало бы предварительно проверить, что ф = Фл°Фв — линейное отображение, но это довольно ясно:
(i) <р (Х'+Х")=фл(фв(Х'+Х")) = фл(фв(Х')+фв(Х"))= = Фл (Фв (*')) + Фл (Фв (X")) = Ф (X') + Ф (X");
(ii) ф (XX) = фл (фв (XX)) = фл (Хфв (X)) = ХФл (Фв (Х))= = Хф(Х); поэтому по теореме 1 с ф ассоциируется вполне определенная матрица С.
§ 3]
отображения, действия с матрицами
83
Действие отображений на столбцы в цепочке ф д	Ф^д
запишем в явном виде по формуле (Г):
г. = 2 <W* = S aik 2 bkJXj = 2 ( S <Ъ Л/)*/• Л=1	/г=1	/=1	/=1 V=1 J
С другой стороны,
п
Zi = 2 CijXj, 1 = 1,2, ..., m. /=i
Сравнивая полученные выражения и памятуя о том, что Xj (/ = 1,2, ...,п) — произвольные вещественные числа, мы приходим к соотношениям
Cij = ^aikbkj,	(7)
Будем говорить, что матрица С=(с/у) получается в результате умножения матрицы А на матрицу В. Принято писать
С = АВ.
Таким образом, произведением прямоугольной матрицы (ait^ размера mxs и прямоугольной матрицы (bkj) размера sxn называется прямоугольная матрица (с^) размера mxn с элементами задающимися соотношением (7). Нами доказана
Теорема 2. Произведение двух линейных отображений с матрицами А и В является линейным отображением с матрицей С = АВ. Другими словами,
<Ра<Рв = <Рлв- I	(8)
Соотношение (8) — естественное дополнение к соотношению (6).
Мы можем забыть о линейных отображениях и находить произведение АВ двух произвольных матриц А, В, имея в виду, однако, что символ АВ имеет смысл только в том случае, когда число столбцов в матрице А совпадает с числом строк в матрице В. Именно при этом условии работает правило (7) «умножения i-й строки Л, на /-й
84
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 8
столбец BU\ согласно которому
Сц = (аа.а/,) [&х/.М =	(9)
Число строк матрицы АВ равно числу строк матрицы А, а число столбцов—числу столбцов матрицы В. В частности, произведение квадратных матриц одинаковых порядков всегда определено, но даже в этом случае, вообще говоря, АВ=£ВА, как показывает хотя бы следующий пример:
И1?2|НСМ1"Н11«11
Умножение матриц, конечно, можно было бы вводить многими другими способами (умножать, например, строки на строки), но ни один из этих способов не сравним по важности с рассмотренным выше. Это и понятно, поскольку мы пришли к нему при изучении естественной композиции (суперпозиции) отображений, а само понятие отображения относится к числу наиболее фундаментальных в математике.
Следствие. Умножение матриц ассоциативно:
А (ВС) = (АВ) С.
Действительно, произведение матриц соответствует произведению линейных отображений (теорема 2 и соотношение (8)), а по теореме 1 § 5 гл. 1 произведение любых отображений ассоциативно. К тому же результату можно прийти вычислительным путем, используя непосредственно соотношение (7). |
3. Квадратные матрицы. Пусть 7Hn(R) (или Мп) — множество всех квадратных матриц (aif) порядка п с вещественными коэффициентами а^-.
Единичному преобразованию е&п: R"—>-Rrt, переводя-
щему каждый столбец X £ R" в себя, соответствует, оче-
видно, единичная матрица
1 О о
о 1 о
о о
1

Можно записать E = (6k/)f где ( 1, если k = j, если А=/=/,
S3]
ОТОБРАЖЕНИЯ. ДЕЙСТВИЯ С МАТРИЦАМИ
85
— символ Кронекера. Правило (7) умножения матриц, в котором следует заменить bkJ на бАу, показывает, что справедливы соотношения
ЕЛ = Л = ЛЕ, УЛ€Л1я(К).	(10)
Матричные соотношения (10), полученные вычислительным путем, вытекают, конечно, из соотношений е<р=ф=<₽е для произвольного отображения <р (см. п. 2 § 5 гл. 1), если воспользоваться теоремой 1 и равенством (8) с <рл= —Ф> Фв” Фв=е-
Как мы знаем (см. (5)), матрицы из Мп (R) можно умножать на числа, понимая под А.Л, где Л = (а,7), матрицу (ЧД
Но умножение на скаляр (число) сводится к умножению матриц:
AX = diagn (Х)*Д = Л diag„ (X),	(Н)
где
diag„ (А) = А£=
А о ... о
О А ... 0
О О ... А
— известная нам скалярная матрица (см. § 4 гл. 1).
В равенстве (И) отражен легко проверяемый факт перестановочности diag„ (X) с любой матрицей А. Весьма важным для приложений является следующее его обращение.
Теорема 3. Матрица из Мп, перестановочная со всеми матрицами в Мп, должна быть скалярной.
Доказательство. Введем матрицу Ez/, в которой на пересечении /-й строки и /-го столбца стоит 1, а все остальные элементы—нулевые. Если Z = (zZy)— матрица, о которой идет речь в теореме, то она перестановочна, в частности, со всеми EZy«:
ZEij — EijZ, i, j= 1, 2, ..., n.
Перемножая матрицы в левой и правой частях этого равенства, мы получим матрицы
п , п о о ... о
О ... 2] i ... 0
о о ... о
2/1 2/2 • • • 2уи
</)
86	АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
с единственным ненулевым /-м столбцом и соответственно с единственной ненулевой i-й строкой. Их сравнение немедленно приводит к соотношениям zki = 0 при k^i и Меняя i и /, получаем требуемое. |
Отметим еще соотношения X (АВ) = (М) В — А (кВ), которые непосредственно вытекают из определения умножения матриц на скаляры или, если угодно, из соотношений (11) и из ассоциативности умножения матриц.
Для данной матрицы А С Мп (R) можно попробовать найти такую матрицу В g Мп (R), чтобы выполнялось условие
АВ = Е = ВА.	(12)
Если матрица В существует, то условию (12) в терминах линейных преобразований отвечает условие
<рл<Рв = е = фдфл>	(12')
означающее, что фв = фл1— преобразование, обратное к фл. Согласно теореме2§5 гл. 1, <рд1 существует тогда и только тогда, когда фл—биективное преобразование. При этом Фл1 определено однозначно. Так как ФЛ(0) = 0, то биек-тивность фл означает, в частности, что
Х=#0, XgR" =3> фл(Х)#=0.	(13)
Пусть теперь фл — какое-то биективное линейное преобразование из в R". Обратное к нему преобразование фл1 существует, но, вообще говоря, не ясно, является ли оно линейным. Чтобы убедиться в линейности фл\ мы введем векторы-столбцы
X = Фл1 (X' + Xм)-Фл1 (Х')-фл1 (X"),
Г = Флт (kY')-kttf(Y')
и применим к обеим частям этих равенств преобразование фл. В силу его линейности получим
Фл (X) = ФЛ (Фл1 (X' + Х"))-фл (Фл1 (Х'))-Фа (ФЯ1 (X")), Фл (Y) = Фл (Фл1 (ХУ'))-Чл (Фл1 (У'))-
Так как флфл1 = е, то
ФЛ (X) = е(Х’ + Х")—е (Х')-е (X") = 0.
Фл(П = ет-^(У') = 0,
§3]
ОТОБРАЖЕНИЯ. ДЕЙСТВИЯ С МАТРИЦАМИ
87
откуда, в соответствии с импликацией (13), находим, что X, Y—нулевые векторы. Таким образом, выполнены свойства (i), (ii) из п. 1, определяющие линейные отображения. Имеем срд1 = фв, где В — некоторая матрица. Переписав условие (12') в виде	(см. (8))
и снова воспользовавшись теоремой 1, мы придем к равенствам (12).
Итак, матрица, обратная к А С Мп (R), существует в точности тогда, когда преобразование фл: R" —> R" биективно. При этом преобразование фл1 линейно. Биектив-ность фл равносильна условию, что любой вектор-столбец УСК" записывается единственным образом в виде (1)
Y - фл (X) = х.А(1> + х2А(2) + ... + хпА<">,
где Л(1), Л(2), ..., А(п)—столбцы матрицы А (сюръективность фл приводит к существованию X, для которого Y = Фл(^)> а инъективность фл дает единственность X: если У = Фл(Х') = Фл(Х"), то фл (Х'-Х") = Фл (X') -— фл (Х") = 0, откуда, согласно (12), X'—Х" = 0). Значит, R" совпадает с пространством столбцов Ve (Л) = <Л(1), ... ..., Л^я)> матрицы Л, так что rank Л = dim R" = п.
Если матрица, обратная к Л, существует, то, согласно вышесказанному, она единственна. Ее принято обозначать символом Л“х. В таком случае (см. (12'))
ФЯ1 = фл-..	(14)
Квадратную матрицу Л, для которой существует обратная матрица Л"1, называют невырожденной (или неособенной). Невырожденным называют и соответствующее линейное преобразование фл. В противном случае матрицу Л и линейное преобразование фл называют вырожденными (или особенными).
Резюмируем полученные нами результаты.
Теорема 4. Квадратная матрица А порядка п является невырожденной тогда и только тогда, когда ее ранг равен п. Преобразование фл1, обратное к фл, линейно и задается равенством (14). |
Следствие. Невырожденность фл влечет невырожденность фл-i и (Л“1)“1 = Л. Если А, В, ..., C,D—невырожденные пхп-матрицы, то произведение АВ...CD также невырождено и (АВ.. .CD)~1 = D~~1C~‘1.. .В~1А-\
88
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА (ГЛ. 2
Для доказательства достаточно сослаться либо на следствие теоремы 2 § 5 гл. 1, либо на симметричность условия АА~1 = Е — Л-ХД. |
Явную формулу для Д-1 мы укажем в гл. 3. Сейчас лишь заметим, что фактическое вычисление Л”1 для матрицы А с числовыми коэффициентами или вычисление произведения двух матриц хотя бы по методу, указанному в конце этой главы, обычно требует выполнения большого числа операций. На практике встречаются матрицы порядка и = 100 и более. Если А и В — две такие матрицы, то для вычисления С = АВ нужно найти п2 элементов с/у по формуле (7) (или (9)), что в каждом случае требует 2n—1 умножений и сложений чисел. Всего нужно произвести (2п—1)па операций, т. е. около двух миллионов операций при п — 100. Для современных ЭВМ это сравнительно легкая задача, но реальные трудности возникнут, если потребуется найти степень Ат матрицы А с показателем т 1000. Здесь по определению Ат — ААт~1; фактически Ат = AkAm~kt O^k^m,— легкое следствие ассоциативности (см. следствие теоремы 2), как это будет показано в гл. 4 в более общем контексте. Для вычисления Ат используют разные дополнительные приемы, либо основанные на специфике матрицы Л, либо заимствованные из курса линейной алгебры. В качестве иллюстрации рассмотрим три примера.
Пример 1. Если
<4 = diag|a1, ...» а,,} =
... 0
0 ...
то, очевидно,
||аГ ... 0
X'* = diag{a$n,...,an} = |........
II 0 ... а"1
Пример 2. Пусть
Тогда индукция по т показывает, что
ат — Ьт ат с------т—
а — b
Ьт
Ат =
где ———=aw-’1 + a'»-2&4- . • • + a&CT"a + ^w“1. a = b имеем
|1 а с ||т _|| ат mam-Yc^
II0 aj ““|| 0 ат J’
В частности, при
Пример 3. Индукцией по т нетрудно убедиться в том, что
m-я степень матрицы
0
§31
ОТОБРАЖЕНИЯ. ДЕЙСТВИЯ С МАТРИЦАМИ
89
имеет вид
т __ II f т -1 ”11 f т

(15)
где целые числа /о = О, fL=l, /2 = 1, ^ = 2, ••• определяются рекуррентным соотношением fm+i = fm + Это не что иное, как числа Фибоначчи (см. пример 2 в конце § 3 гл. 1).
Введем матрицу

~ 5"
с определителем 1 (см. § 4 гл. 1), где
Kl~ 2
Небольшое вычисление показывает, что
Но если три произвольные nxn-матрицы Д, В, С, из коих В — невырожденная, связаны соотношением А — В-^СВ, то
Ат = В-’1СВ>В-1СВ-В-1СВ.. ,в-1св = в-1ств
(внутренние множители ВВ~1, замененные на Е, «сократились»), В нашем случае, с учетом примера 1 и соотношения (15), имеем
(звездочками отмечены не интересующие нас члены).
Сравнивая коэффициенты матриц в левой и правой частях этого равенства, получаем для числа Фибоначчи с номером т значение
хГ—1 (А-ь/бХ” /1—К5\”1 я= П	2 / \ 2 / I
90
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
Мы видим, что fm-— li при больших т (геометрическая про-
У 5
/1—1/' 5 \от грессия), поскольку lim I ---) =0.
zn-*oo \	2	/
Нами получено довольно много правил действий с квадратными матрицами порядка п. Имеются в виду правила JIMj—ЛМ8 (см. замечание в конце п. 1), ассоциативность (следствие теоремы 2), (10) и теорема 4. Обратим еще внимание на так называемые законы дистрибутивности:
(A + B)C = AC + BCf С(А + В) = СА + СВ, (16) где Д, В, С—произвольные матрицы из Mrt(R).
Действительно, полагая Д = (а/у), В = (6/у-), С=(с/у), мы получим для любых / = 1, ..., п равенство (используется дистрибутивность в R!):
п	п	п
(aik + ^ik) ckJ = 2 aikckj + bikCkj, k=l	k=l	A=1
левая часть которого дает элемент gjj матрицы (Л + В)С, а правая—элементы htJ и h'it матриц АС и соответственно ВС. Второй закон дистрибутивности (16) проверяется совершенно аналогично. Необходимость в нем обусловлена некоммутативностыо умножения в
Законы дистрибутивности
(ф+Ф) £ = ф£+Ф£, Е(ф+Ф) = £ф+£Ф	(16')
для линейных отображений <р, гр, £ из К" в R” можно не доказывать, ссылаясь на соответствие между отображениями и матрицами, но можно, в свою очередь, выводить (16) из (16'), поскольку в случае отображений рассуждение столь же просто:
((Ф + Ф) В) (X) = (Ф + ф) (IX) = ф (U)+Ф (ВХ) =
= (ф£) (X) + (Ф1) (X) = (ф|+Ф£) (X), X е К”.
УПРАЖНЕНИЯ
1.	Даны отображения:
a)	[хх, х2.хп] н->[х„, ..., х2, хх];
б)	|хъ х2, .... хп] [х1( xf, .... хй];
в)	[хь х2, .... х„] н-> [хх, х2+х2.Xi-J-Xg 4-...+х„].
§ 3]
отображения, действия с матрицами
91
Какие из них являются линейными?
2. Проверить, что
Д=|а ^|» ad—be 5^ 0	А-1
В частности, ad—bc=l => Д“1 = ||
1
ad— be
d —b
—с
. Существует
ли
Д-1 при ad—Ьс = О?
3. Доказать, что для любой матрицы
выполнено соотношение
A2 = (a + d)A — (ad—bc)E
(другими словами, А является «корнем» квадратного уравнения х2 — (а + d)r + (ad—be) = 0).
4.	При ad—be	Q использовать соотношение упражнения 3 для
нахождения обратной матрицы Д-1.
5.	Доказать, что
та
1
0
m(m—1) , .
—------ ab + тс
mb 1
II1	а	с ||
Найти для	О	1	6	обратную матрицу.
Цо	0	1||
6.	Проверить, что
7. Доказать, что если
™ 1“
8. В приложениях большую роль играют марковские (или сто-хает ическ ие) -матр и цы:
п P=(Pij), Ptj^Q, S P‘f=l> i=l>2..................«•
t=i
Линейные отображения <pP, ассоциированные с марковскими матрицами, обычно применяют к специальным так называемым вероятностным векторам-столбцам
* = [*1.....хп], х,-^0, 2х,= 1.
i=i
92
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА (ГЛ. 2
Согласованность этих определений, диктуемых естественно-научными задачами, видна из следующих утверждений, которые нужно доказать хотя бы при л = 2.
а)	Матрица Р£Л1Л(К) является марковской в точности тогда, когда вместе с любым вероятностным вектором X вектор РХ также является вероятностным (здесь PX = q>p (X)).
б)	Если Р — положительная марковская матрица (р/у > О, V I, /), то любому вероятностному вектору X отвечает положительный вероятностный вектор РХ (все компоненты строго больше нуля).
в)	Если Р и Q — марковские матрицы, то марковской будет также матрица PQ. Это означает, в частности, что любая степень Р* марковской матрицы является марковской.
§ 4. Пространство решений
1.	Решения однородной линейной системы. Из вводных замечаний в начале §§2,3 следует, что система линейных уравнений с матрицей А размера тхп и столбцом В € К7* может быть записана коротко в виде
<Рл(Х) = В,	(1)
ИЛИ
АХ = В	(1')
(в левой части стоит произведение матриц размеров тхп и пх 1).
Представив на минуту, что т~п и квадратная матрица А порядка п — невырожденная (см. п. 3 § 3), мы получим, и притом единственное, решение системы (Г), умножая обе части матричного соотношения слева на А~> Х =	= Эта удобная
символическая запись решений определенной квадратной системы не избавляет нас от вычислений, поскольку матрица Л”1 нам заранее не дана. Но не откажем себе в удовольствии заметить, что матричный аппарат, развитый в § 3, доставляет по меньшей мере эстетическое наслаждение. Воспользуемся им теперь для обозрения всех решений системы (1). С этой целью рассмотрим сначала ассоциированную однородную систему, когда В = [О, 0, ..., 0]-0.
, Ядром линейного отображения <рл: R" —назовем множество
ПРОСТРАНСТВО РЕШЕНИЙ
93
f 4]
(Ker—от kernel—англ.). Другими словами, КегФл — множество решений однородной системы с матрицей А. На самом деле, КегФл— подпространство в R" (называемое пространством решений однородной линейной системы), что уже отмечалось в начале § 1 и что легко следует из линейности отображения Фл:
X', Х"ёКегФл =» Фл(аХ' + рХ") =
= аФл (Х') + рФл (X") = 0 => аХ' + рХ"ёКегФл.
В свою очередь, образ Im <рл отображения Фл является подпространством в R/”: если В' = Фл(Х'), В" = Фл(Х")ё С Im Фл, то и
аВ' + РВ" = аФл (X') + рФл (X") = Фл (аХ' + РХ") ё Im Фл.
Совместность системы (1) равносильна тому, что В ё 1тФл. Пусть
s = dim Ker Фл, г = dim Im Фл
— размерности пространств КегФл и 1тФл. Из определения размерности в § 1 следует, что s^n, г^т. В то же время поскольку всякая линейно независимая система Фл (Х(1)), ..., Фл (Х(Л)) в Im Фл может получиться только из линейно независимой системы Х(1), ..., X(k} в R". Более точную информацию дает
Теорема 1. Имеет место равенство г+ s = n. Далее, число г = dim Im Фл совпадает с рангом матрицы А (и по этой причине г называется рангом линейного отображения Фл).
Доказательство. Выберем базис Х(1), ..., X(s> подпространства Кег Фл cz R" и дополним его до базиса Х{1), ..., Х(5), Х(5+1>, ..., Х(п> всего пространства R". Это всегда можно сделать, как показывает доказательство теоремы 2 § 1 (и упражнение 5 § 1). Для любого вектора X = 2 ё IR" имеем
Фл(Х)= 2а/Фл(Х(/’)=а,+1<рл(Х(’+1,)+ • • • + «яФл (Х<">), так что ImФл = <фл(Xw+1)), .... Фл(Х(,,))> и r<n-s. Векторы Фл(Х(,8+1>), .... Фл(Х<п)) линейно независимы, поскольку из 0= 2 «лФл (Х(А>) = Фл ( У айХ(*’\ еле-
1 /
94
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА, [ГЛ. 2
дует, что 2 а/Д(А) € Кег срл, а это в силу выбора /e>s + 1
Х(5+1), .. Х(п) возможно только при а5+1 = ... =ал —0. Значит, г = п— s. Далее, по определению фл для X = [хп ..., хп] имеем
Фл (Х) = х1Л(1)+ ... +хпА(/1), т. е. 1тфл=<Л(П, ..Л(ге)>.
Но размерность линейной оболочки <Л(1), ..., Л(л)> столбцов матрицы Л как раз и есть rank Л. Я
Частный случай теоремы 1 нам уже встречался: если Л — невырожденная квадратная матрица порядка и, то Л и фл имеют максимально возможный ранг п.
Чтобы найти базис пространства решений однородной линейной системы АХ = 0 ранга г, выберем в Л г базисных столбцов (практический способ выбора указан в следующей главе). Перестановкой столбцов или, что равносильно, перенумерацией неизвестных можно добиться, чтобы базисными были г первых столбцов Л(1), ..., Л(г). Любая система из г+1 столбцов Л(1), ... ..., Л(г), Л(А), k > г, будет линейно зависимой, и на основании теоремы 1 (v) § 1 можно выписать систему соотношений:
х^Аш + х<М(2) + ... + х?>Л(г) + Л<*> = 0, k = r + 1, г+ 2, ..., п.
Векторы-столбцы
Х(1)-[х1г+1), хГГ), •4Г,1>, 1,0, .... 0],
Х(2) = [х<г+2>, х^^\ ..., х<г+2), 0,1, ..., 0],
(^)
х^,	..., х<">, 0, 0,	1]
в количестве п — г штук, очевидно, линейно независимы (из-за специального вида своих последних п — г компонент) и, будучи решениями системы (1), составляют по теореме 1 базис пространства Кег фл всех ее решений.
Любой базис пространства решений однородной линейной системы АХ = 0 ранга г называется фундаментальной системой решений. Систему (2) называют еще нормальной фундаментальной системой. Согласно следствию теоремы 1
§ 4]
ПРОСТРАНСТВО РЕШЕНИЙ
95
§ 2	ее ранг s^dimlmcp^^n — г равен числу свободных неизвестных линейной системы.
Некий «геометрический» смысл систем линейных уравнений вскрывает следующее утверждение (нам оно в дальнейшем не понадобится).
Теорема 2. Всякое подпространство VcRn размерности s является пространством решений некоторой однородной линейной системы ранга г = п—s.
Доказательство. Пусть V = <Л(1), ..., Л(5)>. Как и в доказательстве теоремы 1, дополним линейно независимую систему Л(1), ..., Л(^ до базиса Л(1), ..., Л(5), Ли+1), ..., Л(/й всего пространства R". Любой вектор-столбец Х = [хг, ...» xn]CR" записывается однозначно в виде
= дх',	(3)
/ = 1
где Л — квадратная матрица порядка п, составленная из столбцов Л(/), и Х' = [х[,	х'п]. Так как столбцы
Л(1), Л(л) линейно независимы, то гапкЛ = п и по теореме 4 § 3 существует матрица Л“1 = (а/7), обратная к Л. Имеем
[п __
2 ауХ/,
Следствие теоремы 4 § 3 показывает, что гапкЛ"х = п, поэтому любые г ее строк линейно независимы. Стало быть, однородная система
п
fe = s+l,
имеет ранг г = п — s. Но множество решений этой системы состоит как раз из тех векторов-столбцов X вида (3), у которых х'+1 = 0, .. ., x„ = 0t т. е. в точности из векторов подпространства V. |
2.	Линейные многообразия. Решения неоднородной системы. Пусть V—подпространство в R* и Х°—фиксированный вектор из R". Множество
V + X° = {X + XO\X€V} = XO + V
96
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
называется линейным многообразием типа V и размерности, равной dimV. Геометрическая картинка
иллюстрирует это в общем-то ясное понятие: V 4-Xе есть пространство V, перенесенное (сдвинутое) на вектор Х°. Подпространство V в R"—тоже линейное многообразие, отвечающее сдвигу на вектор Х° = 0. Два линейных многообразия типа V совпадают в точности тогда, когда они получаются из V сдвигом на векторы X', X" такие, что X'—X" £ V (проверка этого утверждения предоставляется читателю).
В частности, если X' — произвольный вектор линейного многообразия У4-Х°, то V-j-X' совпадает с V-|-Xo.
Пусть, например, V = <£<n, Е(2\ £<8’> с R5, Х° = - [0, 0, 1, 1, 0], Х' = [0, 0, О, 1, 0]. Тогда
У + Х° = У + Х' = {[%, у, 2, 1, 0]|х, у, zgR).
Обратимся к неоднородной системе линейных уравнений (1). Предположим, что система (1) совместна, т. е. (по теореме 2 § 2) ранги матриц А и (Л | В) совпадают. Пусть X° = [xi, ..., %п] — какое-нибудь фиксированное решение этой системы, так что <рА(Х°)—В. Если X'—любое другое решение системы (1), то фл(Х'—Х°) = д>д (X') — —(рл (Х°) = В — В = 0. Значит, разность Х" — Х'—Х° двух решений неоднородной системы (1) всегда Шляется решением соответствующей однородной системы и X' = — Х" + Х°. Обратно, если фл(Х) = 0, то
Фд (X + Х°) = <Рд (X) + фд (Xе) = о + В = в.
Таким образом, верно следующее утверждение.
Теорема 3. Решения совместной неоднородной линейной системы заполняют линейное многообразие типа V, где V = Кег <рл —линейное подпространство решений соответствующей однородной системы.
sn
ПРОСТРАНСТВО РЕШЕНИЙ
97
3.	Ранг произведения матриц. Действие произведения т .. . офф отображений условно можно изобразить диаграммой
поясняющей в случае линейных отображений линейных пространств импликацию:
Фф ((/) <= <р (V) rank фф rank <р.
Далее, базис пространства ф((7) отображается на базис-пространства фф (U), откуда
rank фф rank ф.
Значит, rank фф^min {rank ф, гапкф}.	(4)
Но rank фл = rank А и rank АВ = rank флв = rank флфв, поэтому неравенство (4) приводит к следующему полезному утверждению.
Теорема 4. Ранг произведения матриц не превосходит ранга каждого из множителей:
rank ABt^.min {rank A, rank В}. |	(4')
Следствие 1. Если В и С—невырожденные квадратные матрицы порядков тип соответственно, а А— произвольная тхп-матрица, то
rank ВАС — rank А.
Доказательство. По теореме 4 имеем
rank ВАС rank В А —
= rank В А (СС-1) = rank (ВАС) С"1 < rank ВАС,
4 А. И. Кострикин
98
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
откуда rank ВАС = rank В А. Аналогично устанавливается равенство rank В А = rank А. |
Следствие 2. Квадратная матрица А порядка и, имеющая правую или левую обратную матрицу, является невырожденной.
Доказательство. Предположим, что АВ = Е для некоторой матрицы В порядка п. Так как rank£ = n, то неравенство (4') переписывается в виде п <2 min {rank A, rank В}, откуда следует, что rank А = = rank В = п. Но это условие равносильно невырожденности А и В (см. теорему 4 § 3). Аналогично устанавливается невырожденность Айв случае существования матрицы С, для которой СА = Е. |
Согласно следствию 2, линейное преобразование срл: К"—►	обратимое справа и слева, имеет двусто-
роннее обратное, что свидетельствует о коренном различии между линейными преобразованиями и общими отображениями множеств (см. упражнение 2 § 5 гл. 1).
4.	Классы эквивалентных матриц. Как и в п. 3 § 3, обозначим через Esi матрицу размера тхт, в которой на пересечении s-й строки и Z-го столбца стоит 1, а все остальные элементы — нулевые (такие матрицы называются иногда матричными единицами).
Введем, далее, в Мт (R) так называемые элементарные матрицы:
(I)	Ess — Ett-\-Est-\-Eis —
1
’ 0	]
1
1	’ о
S t*.
1
I 4)
ПРОСТРАНСТВО РЕШЕНИЙ
99
(III) FHX)==E + (X-l)E4S = diag{l.......1, X, 1, .... 1},
X =7^ 0.
Пусть А—произвольная /пх «-матрица. Тогда непосредственно проверяется, что матрица A' = FA получается из А посредством элементарного преобразования (э. п.) над строками типа (I) или (II) в зависимости от того, будет F = Fs<t или Е = ЕЛ>1(Х). В случае F = Fs(k) будем говорить об э. п. типа (III) (умножение s-й строки на X). Аналогично матрица Л" = АЕ получается из А посредством э. п. столбцов. Мы уже знаем из п. 2 § 2 и из упражнения 2 § 2, что э. п. типов (I) и (II), совершаемыми над строками и столбцами, матрица А приводится к диагональному виду. Так как
— Ft (ах) F а (ая) ... Fг (аг)
0
1 о
о
полу-
15)
то привлечение э. п. типа (III) дает возможность чить из А матрицу вида
11£' °11 II 0 о||
(нули обозначают здесь матрицы размеров гх(«—г), (т—г)хг и (т — г)х(п—г)). Таким образом,
о||,	(6)
4*
100
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА
[ГЛ. 2
где Pt (соответственно Qy)— элементарные матрицы порядка т (соответственно /г). Не раз отмечалось, что элементарные операции обратимы. Это согласуется с существованием обратных матриц
(Fs,t)-l = Fs,t, =	FA^-^FA^1).
В соответствии со следствием теоремы 4 § 3 матрицы P = PsPs_r ... и Q = QxQ2 ... Qt тоже обратимы: Р-^РГ1 ... РЛР8-\ Q-^QT1 ... Q^Qr1. Заметим, что Pf1, Qyl—элементарные матрицы.
Две матрицы Д, В размера тхп назовем эквивалентными и запишем Д~В, если найдутся невырожденные матрицы порядков тип соответственно такие, что B = PAQ.
Как легко понять, ~ является отношением эквивалентности: (i) Д~Д (Р = Ет, Q = En)\ (ii) А~В => В~А, поскольку B = PAQ =$> А = P"1BQ~1; (iii) B = P'AQ', C = P"BQ" => C = PAQ, где P = P"P', Q = Q'Q”. Согласно общим принципам (см. § 6 гл. 1), множество всех тхп-матриц разбивается по отношению ~ на непересекаю-щиеся классы эквивалентных матриц. Так как ранги эквивалентных матриц равны (см. следствие 1 теоремы 4), то рассуждение, приведшее нас к равенству (6), показывает, что в качестве представителей классов можно брать матрицы (5). Мы получаем следующее утверждение.
Теорема 5. Множество матриц размера тхп разбивается на P = min(m, п)+1 классов эквивалентности. Все матрицы ранга г попадают в один класс с представителем (5). |
Следствие. Всякая невырожденная пхп-матрица записывается в виде произведения элементарных матриц.
Действительно, все невырожденные матрицы порядка п попадают в один класс с представителем — единичной матрицей, поскольку их ранги равны п. Соотношение (6)
psps-i ••• PiAQiQt	=
переписанное в виде
Л = Рг1 ... P&PAQi1 ... QAQA, (7)
дает нужное утверждение. |
Не утверждается, что запись А в виде произведения элементарных матриц единственна, но сам факт сущест-
ПРОСТРАНСТВО РЕШЕНИЙ
101
новация такой записи весьма полезен. В частности, его можно использовать для отыскания обратной матрицы. В самом деле, из (7) мы находим:
... QtPsPs-i ••• P^QP-
Так как каждой из матриц Ph Qj отвечает элементарное преобразование, то цепочка преобразований
/ { А -> Рг{ РгА — ... -> Ps ... Р. \PS ... Р.А —
Р$ • • • I Ps • • • PiAQi £ Qi у ♦ • •
• • • ► Ps • • • Р± £ Ps ••• РMQi • • • Qt £ Qi • • ♦ Qt
реально осуществима, хотя число s + / всех преобразований может быть и большим. Волнистыми черточками отделены для памяти интересующие нас произведения — результаты элементарных преобразований над строками (в левой части) и над столбцами (в правой части) единичной матрицы. При г < п мы приходим к выводу, что А — вырожденная матрица и обратной не имеет. При г = п нам остается перемножить Q и Р, чтобы получить Л"1. Заметим, что порядок преобразований над строками и над столбцами можно менять.
Рассмотрим два примера. Для матрицы
имеем
1	2	3
0 — 3 —6
7	8	9
->F3>1(-7)F2,1(_4)
1	2	3
0—3 — 6
0 —6 —12
—2) ^зл (—7) ^2,! (-4)
Так как в правой части стоит ступенчатая матрица ранга 2, то и rank Л = 2. Значит, Л— вырожденная матрица.
102
АРИФМЕТИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА [ГЛ. 2
Из цепочки
	0 0 0 1		10 0 0		10 0 0		
	10 0 0		0 0 0 1	1	Г"»	15	0 10 0		
Е	0 10 0	* F 1,2	0 10 0		^2,зЛ,2	0 0 0 1	—	
	0 0 10		0 0 10		0 0 10		
							10 0 0
							0 10 0
				* F3,4*2,3*		1,2	0 0 10
							0 0 0 1
находим
0	0	0	1	|-1	0	1	0	0
1	0	0	0		0	0	1	0
0	1	0	0	= F 3(4F 2,3? 1,2 =	0	0	0	1
0	0	1	0		1	0	0	0
(на практике произведения F2>3Flt2, ^3,4^2,3^1,2 сразу выписывались бы в явном виде).
Вычисление обратной матрицы новым методом, называемым иногда (Р, (^-приведением матрицы к нормальному виду (5), довольно удобно, хотя говорить о его преимуществах и недостатках на основании рассмотренных простых примеров преждевременно: нам не понадобились даже все преобразования FSti,	FS(K).
УПРАЖНЕНИЯ
1.	Получить правила действий с транспонированными матрицами (см. упражнение 1 § 2)
*(А4-В) = *А + *В;
*(АВ) = *В-*А.
2.	Доказать прямым рассуждением с матрицами, что rank АВ «С < min {rank A, rank В}-. (Указание: Обратить внимание, что если у матрицы В базисными являются столбцы с номерами /ь ..., /г, то все столбцы матрицы АВ выражаются линейно через столбцы (AB)(ft>, fc = /i, у у /г- То же самое относится к транспонированной матрице
3.	Доказать неравенство Сильвестра
dim Кег фф< dim Кег ф-|-dim Ker ip
для любых двух линейных отображений R" -X- IRC (У к а-зание. Рассмотреть ограничение ф = ф|г отображения ф на любое подпространство V CZ Очевидно, что КегфС Кег ф. Стало быть, по теореме 1 (мы уже знаем, что V можно интерпрети-
$ п
ПРОСТРАНСТВО РЕШЕНИЙ
103
ропать как IR*, k^m, поэтому теорема 1 применима) dim V—гапкф= ~ dim Ker ф «С dim Ker ф, откуда dim V—dim ф (V) dim Ker ф. Полагая V = ф (Rn) = Im ф, получаем окончательно: dim Кег фф= - п — rank фф=(я —rank ф)+^1т V—rank ф)^б1тКегф4^1т Кегф.) 4. Доказать, что всякое линейное отображение ф: IR* —► R1® ранга г записывается в виде суммы ф = ф1+...+фг отображений Ф/ ранга 1.
5. Найти ранг матрицы
А =
Х1У1 хгу2
х^ х2у2
Х1Уп
х2Уп
ХпУ1 Хпу2 ... хпуп
(Указание. Показать, что А = [хх, ..., хп] (ylt ..;, уп).)
Глава 3
ОПРЕДЕЛИТЕЛИ
Формулы (3) и (9) из § 4 гл. 1 для решений квадратных линейных систем порядков п = 2, 3 наводят на мысль о существовании подобных формул при любом п.
В конечном счете речь идет о правильной интерпретации в каждой из упомянутых формул числителя и знаменателя. Мы будем смотреть на них как на значения некоторой «универсальной» функции det: Afn(R)—из множества квадратных матриц порядка п в R. Эффективное построение функции det (определителя) даст ответ также на многие другие, вопросы о матрицах, поднятые в гл. 2. На самом деле роль теории определителей в математике гораздо шире затронутой нами темы, и каждое из применений этой теории подсказывает собственный путь ее построения. Один из наиболее естественных подходов— геометрический, основанный на аналогии «определители матриц—объемы многомерных фигур» (см. упражнение § 4 гл. 1) и на внешних п-формах. Так как для этого нужно чуточку больше геометрии, то мы остановимся на «аналитическом» пути *).
§ 1. Определители: построение и основные свойства
1. Построение методом полной индукции. Будем считать, что определитель 1х 1-матрицы (ап) равен числу «и. Определители матриц размеров 2x2 и 3x3 вводятся соответственно формулами (2) и (8) из § 4 гл. 1. В по-
*) Аналитических способов изложения теории определителей имеется много. В этой главе, как и в § 4 гл. 1, мы придерживаемся записок лекций И. Р. Шафаревича (МГУ, ротапринтное издание 1971 г.)# полагая, что лишнее упражнение на метод индукции полезно само по себе. Во всяком случае, практически важные способы вычисления определителей матриц получаются довольно быстро, хотя, возможно, изложение, основанное на формуле «полного развертывания определителя» (см. § 3 гл. 4), несколько проще (Курош А. Г., Курс высшей алгебры).
§ I)	ПОСТРОЕНИЕ И ОСНОВНЫЕ СВОЙСТВА	Ю5
слсднем случае определители 2 х 2-матриц намеренно оставлены «нераскрытыми». Тем самым подчеркивается базис индукции, которую мы собираемся применить для построения определителей пхп-матриц.
Пусть определители матриц порядков 1, 2, п—1 уже введены. Назовем определителем матрицы А = (а^У{ величину
Р =	• • • +(-1)’’ЧЛ	(Г)
где Dk—определитель матрицы порядка п—1:
fl12 • • • а1п
ak -1, 2 • • •	П
ak + l, 2 • • • ak + l,n ’
ati2 • • • апп
получающейся из А вычеркиванием первого столбца и k-и строки.
Легко убедиться в том, что выражение (1) при п=2, 3 согласуется с выражениями (2), (8) из § 4 гл. 1. Определитель матрицы A = (aty) (иногда говорят также: детерминант матрицы Д) обозначается символами |Д|, | |i или det A (det—от determinant — англ.). Вертикальные черточки используются преимущественно тогда, когда матрица А выписывается в явном виде.
Если в матрице А вычеркнуть i-ю строку и /-й столбец, а расположение остальных элементов оставить прежним, то получится квадратная матрица (п—1)-го порядка. Ее определитель обозначается через и называется минором матрицы Д, соответствующим элементу а/7.
В новых обозначениях формула (Г) приобретает вид
detX =auMu—а21М21+ ... + ( — \)n~lanlMnl. (1)
Словами она выражается так: определителем квадратной матрицы п-го порядка считается алгебраическая сумма произведений элементов первого столбца на соответствующие миноры, причем произведения берутся с чередующимися знаками.
Если вместо первого столбца взять fe-й, а миноры Mit заменить на то, как мы увидим дальше, получится выражение, отличающееся от det А самое большее знаком.
106
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
В дальнейшем, как и в гл. 2, символами
^4/ — (а^, ^12»  • • > о1я),	i=l,2, ..., п,
Л('> = [а1У,а2у, ...,anJ\, j = l,2,...,n, будут обозначаться соответственно i-я строка и /-й столбец матрицы Л = (а,у). Сама матрица А представляется либо как объединение своих строк:
Л = [Л1( Л2, ..., Л„]
(столбец строк), либо как объединение своих столбцов:
Л=(Л(1>, Л % .... Л(п>)
(строка столбцов). Условимся впредь строки и столбцы «X «-матрицы Л называть также строками и столбцами определителя | aif | порядка п.
Согласно определению, | | = det—функция, сопоставляющая квадратной матрице Л некоторое число | Л |— = де!Л. Наша задача — изучить поведение этой функции при изменении строк или столбцов матрицы Л, рассматриваемых как элементы (векторы) линейного пространства R". Если угодно, для нас det Л—сокращенное обозначение (в духе п. 2 § 5 гл. 1) функции
det [Лх, .... Л„] или detH4 ..., Л<л))
п переменных, коими являются векторы из R”.
Произвольную функцию S>: [Лх, .... An]y~^S)(A1, ... .... А„) мы будем называть полилинейной, если она линейна по каждому аргументу Л,-, т. е.
S>(Alt .... аЛ,-+рЛ<, •••. Л„) =
=а^(Лх.......л;......ЛЛ-Р^Л,, ...,л;, ...» л„)
(сравнить с п. 1 § 3 гл. 2). Та же функция называется кососимметрической, если
Й>(Л(, ..., Aj, Л,-+1, ..., А„) =
= —^)(А1, .... Л/+1, А,-, .... Л„),	—1. (2)
Замечание 1. Из определения линейных функций (см. (4) § 3 гл. 2) можно заключить, что функция S) полилинейна ровно тогда, когда при фиксированных Лlt .... Л,_х, Л,+1, .... Л„ и при Ai = X = (x1.х„)
f 1]
ПОСТРОЕНИЕ И ОСНОВНЫЕ СВОЙСТВА
107
мы имеем
..., Дп) = а1х1 + а2х2+...+а„лг„,
где alf ...» ап—скаляры, не зависящие от xlf хп.
Замечание 2. Кососимметричность полилинейной функции S) эквивалентна выполнению соотношений
0(At, .... At_lt X, X, Ai+i, .... Ап) = 0,
(2')
В самом деле, положив Ai — Ai+l = X в (2), мы придем к (2'). Обратно, при X = А,-\- Л,+1 из (2') вытекает в силу полилинейности S) соотношение
Л,-, Ah +	Л/+1, Л;+1, ...) +
+ Ло Л,-+1,	+	Л,.+1, л,., ...) =
= Д- + А+1, A + A+i> ...) = 0.
Первые два члена равны нулю (положить в (2') соответственно X = Ai и Х = Д/+1), поэтому равна нулю сумма двух последних членов, что является лишь иной записью соотношения (2).
Те же определения и замечания относятся к функции &)(А(1),	Д(л)) векторов-столбцов. Более того, усло-
вие (2) кососимметричности применимо к любой функции S): Мп—где Мп—декартова степень некоторого множества М,
В дальнейшем нам понадобится
Лемма 1. При перестановке местами любых двух аргументов кососимметрическая функция меняет знак на п ротивоположный.
Доказательство. Пусть переставлены f-й и /-й аргументы, причем i < j. Проводим индукцию по числу k~j — i—1 аргументов между переставляемой парой. При fe = 0 утверждение леммы совпадает с определением кососимметрической функции. Пусть лемма верна при всех / — i—1<&. Тогда
Xh Xi+1.......Xy_v Xj, =
=	Хг+1, Xt, .... Xy_1( Xf, ...) =
= £>(..., X1+1, Xy, ..., Ху_п X,-, ...) =
=	Xy, X,-+£....Xy.u X,., ...). в
108
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
2. Основные свойства определителей. Введенное нами понятие определителя пока неэффективно. Нам предстоит получить ряд свойств определителей (точнее, функции det), удобных как с теоретической, так и с вычислительной точек зрения.
Тривиальное соотношение det (а + b) = det а + det b для определителей первого порядка может привести к ошибочному заключению, что оно верно и для определителей порядка п (указать пример при п = 2). Случай п = 2 подсказывает более точную интерпретацию рассматриваемого соотношения:
| ax'i +	а/2 + р41 = (ах[ +	_ (ах, + рх;) =
I fl21	а22 I
= а (4а22—4а21) + Р (x?a22—х2'а21) =
= а|х* хЧ + р х*
|021 fl22 I 021 022
Мы еще замечаем, что
ап a12 I _________ а21 а22 ’
021 а22 I	ЩИ 012 1
Таким образом, имеются основания предполагать, что справедлива
Теорема 1. Функция А det А на множестве Mtl (R) обладает следующими свойствами:
DI. det Л — полилинейная функция строк матрицы Л, т.е. определитель матрицы является линейной функцией элементов любой строки Af.
D2. det Л — кососимметрическая функция строк матрицы А (другими словами, определитель равен нулю, если какие-то его соседние строки совпадают).
D3. det Е = 1.
Доказательство. Используем индукцию по п. Для п= 1,2 свойства D1—D3 проверены. Будем считать, что ими обладают все определители порядка <п. Докажем D1—D3 для определителей порядка и, исходя из формулы (1). Мы начнем со свойства D3.
D3. Если
1 о о 1
о о
А = Е =
О 0 ... 1
ПОСТРОЕНИЕ И ОСНОВНЫЕ СВОЙСТВА
109
то в формуле (1) будет ак = 0 при i Ф 1 и alt = 1, поэтому det£^M1P Определитель Л4П имеет то же строение, что и det£, но его порядок равен п—1. По предположению индукции мы можем считать, что Л4П = 1 и, стало быть, det£ = l.
Свойства DI, D2 мы докажем в несколько более общей ситуации, описываемой следующей леммой.
Лемма 2. Пусть	Mn(R)~+ R—функция, зада-
ваемая формулой
=	+ . +(—1)п~1ап/Мп/ (3)
(по предположению индукции все определители Mkj порядка п — 1 нам известны, поэтому функция S>j задана корректно).
Тогда имеют место утверждения:
Dyl. — полилинейная функция строк матрицы А;
Dy2. S>j — кососимметрическая функция строк матрицы А,
Доказательство. Dyl. Чтобы подчеркнуть переменный характер элементов i-й строки, положим xs~a/S9 s = 1, ..., и:
#11	...	.. аЛп
Минор Ми не зависит от хо хЛ, так что <ху= (—l)z-1MZy—константа. Любой другой минор Mkj, k^i, содержит в качестве одной своей строки (х,, ..., Xy_lt х/+1, ...» хп), а все другие его строки постоянны. По предположению индукции Mkj—линейная функция переменных хр ..., Ху_г, х/+1, хп, т.е., согласно замечанию 1,
= 2 aksxs9 k=^i. s¥=/
Положив теперь о^= 2 (~1)ьЧА/» s=/=/\ мы пРиДем k ф i
110
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
к выражению
®/И)=2(-1)*-1ай/Мл/ =
= ауху4- 2 (-1)*"АУ 2 “лЛ = k=£i	/
= ауху4- 2 ( 2.	2 «а.
означающему, что <2)у(Л)—линейная функция элементов xv .хп i-й строки матрицы А.
Dy2. В соответствии с замечанием 2 в п. 2 удобнее доказывать равенство й>у(Л) = 0 для матрицы
аи • • • aij • • • ат
ХХ ... X; ... Хп
Xi ... Xj ... хп
ап1 • • • anj • • • апп
с двумя одинаковыми строками А,- — Ai+l = (хх, ..., ху,...
хп). Минор M.kj, k=£i, i4-1, тоже содержит две одинаковые соседние строки (хх, ..., ху_х, ху+1, ..., х„) длины п— 1. Поэтому по предположению индукции Л4йу = 0, k =/= i , i4-l. Формула (3) переписывается в виде
®у (Л) = (-1)‘-»хуМ/у 4-(-1)<хуМ/+1,у.
Но, очевидно, М(1У = М(+11У. Стало быть,
й>у(Л) = (-1)'-*ху(Л«/у-М/+1,у) = 0. |
Положив j = 1 в формуле (3) и сравнив получившееся выражение с формулой (1), мы придем к равенству
^)х(Л) = 4е1Л.	(4)
Следовательно, свойства DI, D2 определителей содержатся в утверждении леммы. Теорема 1 доказана. |
Распишем более подробно свойство D1:
DI', det [Лх, .... ХЛ,-.Л„]=Лае1[Л1....Л,-,.... Л„],
т.е. при умножении некоторой строки Л,- определителя на X сам определитель умножается на X. В частности,
I 1]	ПОСТРОЕНИЕ И ОСНОВНЫЕ СВОЙСТВА	Щ
умножая все строки на X, получаем
det ХЛ = Х» det Л.
D1". Если при некотором I все элементы в А,- имеют вид aij—a'{-\-a'j, то det Л=det/Г+det Л", где Л)=Л}=ЛУ для j^i и Ai = (a[.....а'п), A"t = (ai...а"п).
Из теоремы 1 вытекает еще несколько простых утверждений, которые мы сформулируем в виде свойств определителей, но доказывать будем для любой функции @>Jt заданной формулой (3). Переход к определителям обеспечивается равенством (4).
D4. Определитель с нулевой строкой равен нулю.
Пусть, например, Л( = (0, 0......0). Тогда и 2Л,=
= (0, ..., 0). Следовательно, по Dyl:
^)у(Л) = ^у(Л1( .... Л,-, ...» Л„) =
= ^/(4.......2Л,.,	.... Л„) =
= 2Ду(Л1......Л,-......Л„) = 22>У(Л),
откуда 3)j (Л) = 0. |
D5. При перестановке любых двух строк (а не только соседних) определитель меняет знак на противоположный.
Для любой функции &>} (Л) это свойство вытекает из Dy2 и из леммы 1. |
D6. Если в квадратной матрице А две строки совпадают, то ее определитель равен нулю.
Берем опять произвольную функцию S)y (Л). Поменяв местами две совпадающие строки Л5, At в Л, мы получим ту же матрицу А. С другой стороны, согласно свойству D5 (точнее, свойству Dy5 для £ЭУ), £5У (Л) примет противоположный знак. Таким образом, £>у (Л) = —Dy (Л), откуда 23>j (Л) = 0 и S>j (Л) = 0. |
D7. Определитель не меняется, если над его строками совершать элементарные преобразования типа (II).
Достаточно рассмотреть случай применения одного элементарного преобразования. Пусть после прибавления к s-й строке матрицы А ее /-й строки, умноженной на X, получилась матрица А'. Тогда в соответствии с свойствами D1 и D6 (точнее, Dyl и Dy6 для £2>у) имеем
©у(Л') = ^у(Лх......Л14-ХЛ<, ..., Л„) =
= ®у(..., Л,, ...)+ Wy(..., Аи ..., Ait ...) =
=^У(ЛХ, ..., Л„) = ©ДЛ). |
112
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
Доказанные свойства дают возможность сравнительно просто вычислить определитель порядка п. Один из методов заключается в следующем. Матрицу А = (а^) следует привести элементарными преобразованиями к треугольному виду (см. § 3 гл. 1). Пусть мы получим матрицу
А
а11	а12 • • • а1п
О #22 • • • а2п
О 0	... апп
(5)
Предположим, что в процессе приведения было совершено q элементарных преобразований типа (I) и какое-то количество преобразований типа (II). Так как последние не меняют определителя (свойство D7), а каждое преобразование типа (I) умножает его на (—1), то с1е1Л^ = (—I)# det Д*). Мы докажем, что
det Л =апа22.. .апп.
В таком случае
det А = (—!)’апа22 ... апп.	(6)
Это и будет одной из формул для вычисления det Л.
Докажем формулу для det Л индукцией по п. Так как а21= ... =a„i = 0, то, согласно (1), det Л = апМи, где
Ми =
°22 О
^23
^33
а2п
а3п
О 0	... апп
— определитель порядка п—1. По предположению индукции =_а22а33 ... апп. Поэтому det А = аиМп = = #11^22 • • • ^пп‘
*) Следует отметить, что мы могли бы привести матрицу А к ступенчатому виду при помощи одних только элементарных преобразований (строк) типа (II), не меняющих знака определителя, тогда нам в доказательстве не пришлось бы использовать множитель (-—1)4.
$ 1J	ПОСТРОЕНИЕ И ОСНОВНЫЕ СВОЙСТВА	ИЗ
Теперь, опираясь на формулу (6), мы установим важный факт, касающийся роли свойств D1—D3 определителя. Именно, имеет место
Теорема 2. Пусть 3): Мп (R)——функция, обладающая следующими свойствами:
(i) S) (Д) является линейной функцией элементов каждой строки матрицы Д^Л1„(К);
(ii) при перестановке двух соседних строк &>(А) меняет знак (другими словами, <2>(А)—полилинейная кососимметрическая функция строк матрицы).
Тогда существует такая не зависящая от А константа р, что
<2) (Д) = р - det Д»
Число р определяется из соотношения р-=@)(Е), где Е— единичная матрица.
Доказательство. По лемме 1 <S>(A) меняет знак на противоположный при перестановке любых двух строк, т. е. при любом элементарном преобразовании типа (I). Далее, рассуждение, совершенно аналогичное тому, которое было проведено при доказательстве свойства D7, показывает, что S) (Д) не меняется, если строки матрицы Д подвергнуть элементарному преобразованию типа (II).
Приведем матрицу А при помощи элементарных преобразований к треугольному виду (5), где, конечно, некоторые из ait могут равняться нулю. С четом вышесказанного мы имеем две формулы
det Л=(—1)« det Л =(—!)« аиааа.. (см. (6)), ®(Л) = (— 1)«^>(Л),
где q—число элементарных преобразований типа (I), совершенных при переходе от Л к Л. Нужное нам равенство 3) (Л) = р• det Л является, очевидно, следствием формулы
S>(A) = ^(E)-a11...ann,	(7)
которую мы сейчас и докажем (собственно говоря, (6)— следствие (7), поскольку при S) — det в силу свойства D3 будет &>(Е) = 1).
114
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
Согласно условию (i) теоремы, мы можем вынести апп за знак S)'.
all •••	а1п
®{А) = апп®(
i 0 I! О
ап-1, л-1 ап-1,п
О	1
Применим теперь к А элементарное преобразование типа (II): вычтем из z-й строки, стоящей под знаком S)
матрицы, последнюю строку, умноженную предварительно на ain. При этом элементы последнего столбца обратятся в нуль (кроме апп=1), а все другие элементы матрицы останутся без изменения. Применим то же самое рассуждение к предпоследней строке вновь полученной матрицы и т. д. Каждый раз очередной элемент ан выносится за знак S) и рассуждение возобновляется. Проделав его п раз, мы убеждаемся в том, что


1 ... О
О ... 1
),
а это и есть формула (7). И
Итак, свойствами D1 — D3 функция det характеризуется однозначно. По этой причине мы отнесли их к основным свойствам определителей. Можно было с самого начала назвать определителем функцию обладающую свойствами D1 — D3, но в таком случае нужно установить ее существование. У нас существование обеспечивается самой конструкцией функции det—формулой (1).
Имея в виду дальнейшие применения теоремы 2, мы не включили в ее формулировку нормировочное условие £>(Е)=1.
УПРАЖНЕНИЯ
1.	Используя формулу (1) и правило знаков в разложении определителя третьего порядка (упражнение 1 § 4 гл. 1), выписать полностью все произведения, входящие в разложение определителя четвертого порядка. Обратить внимание на общее число членов в разложении и попробовать найти закономерность в распределении знаков.
5 2]
ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ
115
2.	В правую часть формулы (1) входит п слагаемых. В свою очередь каждый минор записывается в виде линейной комбинации п—-1 своих миноров порядка и —2 и т. д. Всего в разложение определителя det(azy) порядка п войдет п (п— 1).. .3-2• 1 = л! (эн факториал) произведений вида 2.. .ai п со знаком + или —.
12	П
Показать, что
п (П-1)
det(a(y) = aua22 ...	2 anlan_li2.. ,aln-|- ...
3.	На основе замечаний в предыдущем упражнении, примененных к определителю det(azy) с azy=l для i, /=1, 2, ..., п, показать, что в разложение любого определителя порядка п ровно половина произведений ai^1al 2 .. п входит со знаком +.
4.	Кососимметрическую функцию Д: R3—трех переменных х, у, z:
Д(х, у, z) = (y — x)(z — x)(z — y) записать в виде определителя третьего порядка.
§2. Дальнейшие свойства определителей
1.	Разложение определителя по любому столбцу. Теперь мы в состоянии ответить на вопрос, который невольно вставал еще при построении функции det: играет ли первый столбец особую роль в рекуррентной формуле (1) для определителя n-го порядка? Ответ содержится в следующей формуле:
ае1л=2(-1гч7м(7.	(1)
Для доказательства достаточно применить теорему 2 § 1 к функции 3>} из леммы 2 § 1. Мы получаем соотношение
(Л) = £>,(£)-det Л.
Но, согласно формуле (3) § 1,	= (— iy-1. Стало
быть, £0У(Л) = (—iy-1deti4. После умножения обеих частей этого равенства на (—l)'-1 мы имеем de^ = = (—I)/-1 й)у(Л), что является лишь иной записью формулы (1). Эта формула становится еще более симметричной, если ввести так называемое алгебраическое дополнение = ( — 1)'+ZM,7 элемента а(7 определителя det Л. Сформулируем полученный результат.
116
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
Теорема 1. Определитель матрицы А равен сумме произведений всех элементов некоторого столбца на их алгебраические дополнения
detX=		(2)
1 = 1
В этом утверждении все столбцы играют уже одинаковую роль. При / = 1 оно превращается в исходное разложение (1) § 1, вводящее понятие определителя. О формулах (1) и (2) говорят, что они дают разложение определителя по j-му столбцу.
Возникает соблазн сравнить (2) с аналогичной суммой п
по второму индексу: У а^Ац. Вскоре мы увидим, что получается то же самое значение det Л.
2.	Свойства определителей относительно столбцов. В качестве применения теоремы 1 мы можем получить целую серию новых свойств определителей.
Теорема 2. Свойства D1 — D7 из § 1 имеют место не только относительно строк, но и относительно столбцов определителей.
Доказательство. Как было условлено с самого начала, det А = det [Ар ..., Ап] = det (А(1),	A(w)).
Из § 1 видно, что свойства D4—D7 являются совершенно формальными следствиями свойств D1—D3, и, стало быть, доказав их аналоги для столбцов, мы автоматически получим и остальные свойства относительно столбцов. Но нормировочное свойство D3 занимает особое положение и не относится ни к строкам, ни к столбцам. Таким образом, нам остается рассмотреть свойства DI, D2. Докажем их индукцией по порядку п определителя.
Будем исходить из формулы (2). Она прямо показывает, что det А является линейной функцией элементов /-го столбца, поскольку алгебраические дополнения А^ от этих элементов не зависят. Тем самым свойство 1 доказано.
Докажем свойство D2 — кососимметричность функции det(A(1), ..., А(п)). При п=1 свойство D2 бессодержательно. Прип = 2 его легко проверить непосредственно:
I:	;j=«d-ta=-|; ;|.
ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ
117
Пусть п > 2. Предположим, что переставлены столбцы A(k} и A{k+1}. Воспользуемся формулой (2) с /=#£, Л+1. В минор Мij (или в алгебраическое дополнение Л/у) входят оба столбца А(к\ Л(А+1), но в укороченном виде: без элементов aikt а^к+1. По предположению индукции при перестановке двух столбцов каждый минор меняет знак. Значит, и
det (..Л<*>, A{k+X\ .. .) = — det (..., Л<*+», Л(А>, ...). |
3.	Транспонирование определителя. Напомним понятие, введенное в упражнении 1 § 2 гл. 2. Прямоугольная матрица размера nxm, у которой z-й столбец, i = 1, 2, ...
m, совпадаете f-й строкой матрицы Л размера тхп, называется транспонированной к Л. Транспонированная к Л матрица обозначается через *А или Л'. Следовательно, если Л = (я/;), *Л = (а,7), то а^ = а^. Так,
1 5
*111 2 3 411	2 6
|| 5 6 7 8||	3 7 ’
4 8
Столбец можно считать транспонированной строкой [х1( . . Хи] = /(^1..................Хп).
В случае квадратных матриц говорят также, что определитель
«11	«21 • • • ап1
а12	а22 • • • ап2
а1П а2П • • • аГ1П
получен транспонированием определителя det Л. Наглядно операцию транспонирования матрицы (определителя) порядка п можно представлять в виде поворота матрицы (определителя) вокруг неподвижной оси—главной диагонали. Поворот вокруг второй (неглавной) диагонали гораздо менее употребителен.
Теорема 3. Определитель транспонированной матрицы совпадает с определителем исходной матрицы
det М = det Л.
Доказательство. Рассмотрим функцию
7ИЛ(К)—являющуюся композицией Л	*Л н-> det tA
118
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
функции перехода к транспонированной матрице и функции det. Функция ^обладаетсвойствами (i), (ii), сформулированными в теореме 2 § 1. В самом деле, по только что доказанной теореме 2 функция М det обладает свойствами D1—D7 относительно столбцов матрицы М, т. е. относительно строк матрицы А. Таким образом, —полилинейная кососимметрическая функция строк матрицы. По теореме 2 § 1 имеем S>(4) = <©(£). det А = = det *Е-det А. Но *£ = £, и поэтому detf£=l. Стало быть, <2>(4) = det4. |
В соответствии с теоремой 3 строки и столбцы определителя равноправны: свойства, выраженные в терминах строк, выражаются также в терминах столбцов, и обратно. Например, наряду с теоремой 1 о разложении определителя по столбцу справедлива
Теорема Г. Определитель матрицы А равен сумме произведений всех элементов любой фиксированной строки на их алгебраические дополнения:
det А = 2 I /=1
Можно добавить к этому следующий критерий: если какая-то строка (какой-то столбец) определителя det А является линейной комбинацией остальных строк (остальных столбцов), то det 4 = 0 (см. свойства DT, D1" и их аналоги для столбцов).
Следующие два примера служат иллюстрацией полученных нами свойств определителей.
Пример 1. Определитель
	1	1	... 1	
	*1		• • • хп	
—	xl	*2	• • • Хп	= Д(*Ь хг	х„),
п-1	п-1	п-1
Х1 Л2 • • • Лц
связываемый с именем Вандермонда, вычисляется по формуле Д (Xj—Xi),	(
или, в более подробной записи,
= (Хз — Xi) (xs—Xl). . .(х„—Xi) (х3—х2).. .(хл — х2).. .(xn —X„_i).
§ 2]
ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ
119
В частности, при попарно различных элементах хх, хп определитель Вандермонда отличен от нуля. Этим его свойством часто пользуются. По теореме 3 имеем также
1	V	v2	И"1
1 Хх ... ХХ
1	V	V2
А .	*	Х2	Х%	, . .	Х‘2
1 Хп Xfi ... Хп
Для доказательства формулы (3) применим индукцию по п. Считая, что Дда, т < п, вычисляется по формуле (3), и опираясь на свойство D7, вычтем из каждой f-й строки определителя А„ (i—1)-ю строку, умноженную на хх:
	11 ... 1	
	0 Х2—Л'!	... Хп— vt	
д„=	0 xl —Х2ХХ	... Хп — ХпХх	•
л	vn-2v	у'1”1 vn“2y
и Л2	—Л2	Xi • . . Хп —Хп хх
Напрашивается мысль разложить теперь Дл по первому столбцу, а в получившемся определителе порядка п—1 вынести из/-го столбца (/ = 1, 2, ..., п— 1) за знак определителя общий множитель Ху+х—хх (свойство D1' для столбцов). Мы придем к выражению
1 1 ... 1
— (ХП *1) (ХП -1	*1) • • • (Х2	Х1)	2	3
vH-2 „П-2	„П-2
Хг Х3 ► . . Хп
= (*И — *1)(*Л-1 — *1)-• -(*2 — АГТ)-А (Х2, Х3,	Х„),
совпадающему с (3), поскольку Д (*2...*В)=	П (X,—Xi).
a<i<l<n ' Пример 2. Матрица А = (а/у)
по предположению индукции
вида
О — Д12 — а13
аХ2
О
— fl23
а13
а23 О
а1п а2П аЗП
4 =
а1п а2п азп • •• О
называется кососимметрической (о ее определителе тоже говорят, что он кососимметрический). Другими словами, *4 = —4. С учетом теоремы 3 имеем
det 4 = det М = det (— 4) = (— l)w det 4,
откуда fl+(•—I)"-1] det 4 =0. При нечетном n получаем det 4=0, т. e. определитель любой кососимметрической матрицы нечетного порядка равен нулю.
120
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
4. Определители специальных матриц. Чем больше нулей среди элементов матрицы А и «чем лучше» они расположены, тем легче вычислять определитель det Л. Это интуитивное представление находит в некоторых случаях точное количественное выражение. Например, мы знаем (см. п. 2 § 1), что определитель треугольной матрицы (верхней или нижней) равен произведению элементов, стоящих на главной диагонали. Другой важный частный случай содержит
Теорема 4. Для определителя D порядка п + т, у которого на пересечении первых п столбцов и последних т строк стоят нули, имеет место формула
&1п а1, п + 1 ••• а1, п + т
ап1 ••• апп ап, п + 1	ап, п + т
0	... 0 Ьц ... Ь1т
^11 • • • Ь1т
bmi ...Ьтт
^11 ♦ • • &1П
ап1 • • • апп
0	... 0 bmi ... bmm
(определитель в левой части этого равенства называется кеазитреугольным или определителем с углом нулей).
Доказательство. Зафиксируем сначала п (п + т) элементов а^ и рассмотрим определитель D как функцию элементов bkl, которые образуют квадратную матрицу В порядка т. На полученную функцию можно смотреть как на функцию матрицы В: D = S)(B).
Ясно, что полилинейность и кососимметричность определителя D относительно последних т строк эквивалентна тем же свойствам @)(В) относительно строк матрицы В. Значит, правомерно применить к @)(В) теорему 2 § 1, согласно которой <3) (В) = 3) (£)-det В. По определению функции имеем
&)(Е) =
а11	•••	aln	alt	п + 1	•••	а1,п + т
ап1	*•*	Gna	ап,	п + 1	•••	ап, п + т
0	...	0	1	...	о
О	...	О	0	...	1
Разложим £Э(Е) по последней строке (см. формулу (2)), затем по предпоследней и т. д. Повторив эту операцию т
S 21
ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ
121
раз, мы убедимся в том, что S) (£) = det А, где
А =
а11 • • • а1п
ап1 • • • апп
Окончательно получаем: D =	(В) = det А - det В. |
В новых обозначениях формула из теоремы 4 принимает более компактный вид
det|g g || == det Л-det В.
(4)
Здесь А и В — квадратные матрицы, а нулевая матрица 0 и матрица С — прямоугольные. Опираясь на теоремы 3 и 4 или на рассуждения, использованные в ходе доказательства теоремы 4, мы без труда устанавливаем, что
det|c j| = det Л-detB. |
Иногда пытаются написать в точности такое же выражение для . ,||С ЛII	„	.,
определителя det К , хотя сразу же напрашивается простейший
I 0	1 |	«	Т-)	гг
контрпример К 0|—I. Все дело в знаке. Правильный ответ получается путем перестановки строк или столбцов, приводящей мат-рицу]в о| К ВИДУ |с АI ИЛИ |о £|-
Более простые рассуждения основаны на той же теореме 2 § 1; которую мы неоднократно использовали. Действительно,
ЛО|Н<
Далее по формуле (1), примененной т раз, находим
О ... 1 О О
= (— 1 )<« + г)+(« + 1)+•••+(« + 2«) д = (_ 1det А. Окончательно приходим к выводу, что если Л, В — квадратные матрицы порядков п и /и соответственно, то
det||s о|| = (—O^det A‘dets.	(5)
122
ОПРЕДЕЛИТЕЛИ
(ГЛ. 3
Формулы (4) и (5) охватываются общей теоремой Лапласа о разложении определителей. Эта теорема, однако, употребляется сравнительно редко, и мы на ней не останавливаемся. Не спешим мы и с выводом так называемой теоремы о полном развертывании определителя (см. § 3 гл. 4), которая приносит мало пользы с вычислительной точки зрения.
Весьма важное утверждение об определителях матриц содержит следующая
Теорема 5. Пусть А и В—квадратные матрицы порядка п. Тогда
det ДВ = det Д-det В.
Доказательство. Согласно формулам (7) и (9) § 3 гл. 2, выражающим коэффициенты ctj матрицы (cz/)= = ДВ = (а,7)(Ь,7) через коэффициенты матриц А и В, i-я строка (АВ)/ записывается в виде
(АВ)/ = (А/В“\ А/В^, .... Д(В<Л)); А/ВЧ> = SazA/.
Л=1
Фиксируем матрицу В и для любой матрицы А положим (Д) = det АВ.
Докажем, что функция удовлетворяет условиям (i), (ii) теоремы 2 § 1. В самом деле, мы знаем, что det АВ—линейная функция элементов i-й строки (АВ)/:
det АВ = \А/В™ + A^ZB'«> + ... + КпА/В‘п\
Поэтому
® (Д) = 5^/	aik 2Ьм*а«»
/= 1 k = 1	ftssl /=1	Л=1
П
где щ=	—скаляр, не зависящий от элементов
/ = 1
i-й строки А/ матрицы А.
Мы видим, что @>(А) линейно зависит от элементов i-й строки матрицы А.
Поменяем далее Д, и At местами. Так как s-я и i-я строки матрицы АВ имеют вид
(Д5В(П, ..., Д,В'Л)),
(ДГВ’1>....AtB™),
i 21
ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ
123
то при этом они тоже поменяются местами и, значит, по теореме 1:
Д„ At, ...)==®(A) = tetAB =
= det [..(ДВ)„ .... (AB)t, ...] =
= -det[..(AB)t, (AB)S, ...] =
=	At, ...,AS,
Таким образом, выполнены оба условия теоремы 2 § 1, согласно которой 3) (Д) = 3)(Е)- det А. Но по определению S) (Е) = det ЕВ = det В. Отсюда вытекает искомая формула. В
5. К построению теории определителей. Теоремы 1 и 2 из § 1 дают по существу аксиоматическое описание функции det, хотя начинали мы с чисто конструктивного ее задания.
Еще один путь для построения теории определителей подсказывает теорема 2. Именно, пусть мы имеем функцию S): Л7л (R.)— обладающую следующими свойствами:
(i)	3) (АВ) =	(А)*@) (В) для любых матриц Я, B£Mn(R);
(ii)	@)(FS t)=—1 для каждой элементарной матрицы Fs t (см. п. 4 § 4 гл. 2);
(iii)	(Я) = Х для верхней треугольной матрицы вида

Утверждается, что g) = det. В самом деле, воспользовавшись свойством (i) в применении к матрице
мы получим S>(B) = (—1)Д.(—1) = Х. Это значит, что Й>(^(Х)) = Х для элементарной матрицы Fs(k). Согласно (iii), 3)(FS t(k))=l для элементарной матрицы FSt / (X) с s < t. Так как
1 • t W • t — s(k)t
то и 3) (Fft s (X)) = 1, а поэтому 3) (Fs t (X)) = 1 при любых индексах s £ t.
124
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
Итак, S>(^,t)=-1, ®(^Н(Л)) = 1 и ^)(Г5(Х)) = Л. Поскольку любая матрица Д£Л1„(К) записывается в виде Д = || Е 0||
= Р J J Q, г<я, где Р и Q — произведения элементарных матриц (см. рассуждения перед теоремой 5 § 4 гл. 2), свойство (i) позволяет эффективно вычислить ёй(А).
Пусть матрица А' получена из А умножением s-й строки As на X или прибавлением к Д5 строки Д/ с номером /. Тогда, как отмечалось в гл. 2, А' = Fs (К)- А или же A' =FSt t (!)• А. В первом случае имеем S) (А') =	(А), а во втором jg) (Д') = S) (Л). Иначе говоря,
(А) — полилинейная функция строк матрицы Д.
Если далее ДА получена из А перестановкой строк с номерами s и /, то A'' = FSttA, откуда (Д') = &> (Pg, (А) =—&) (А). Значит, (Д)—кососимметрическая функция строк матрицы Д.
Наконец, S) (Е) = (Fg 0)) =1 •
Мы видим, что функция обладает основными тремя свойствами DI —D3 определителей. Стало быть, по теореме 2 § 1	(A) = det Д.
Читателю предлагается выдвинуть и обосновать собственные варианты аксиоматического описания функции det.
УПРАЖНЕНИЯ
1.	Целые числа 1798 = 31-58, 2139 = 31-69, 3255 = 31-105, 4867 = = 31-157 делятся на 31. Без всяких вычислений показать, что определитель четвертого порядка
17 9 8
’	2 13 9
3 2 5 5
4 8 6 7
также делится на 31.
2.	Показать, что любой кососимметрический определитель \ац\ четвертого порядка с является квадратом целого числа. (Замечание. Это верно для любого кососимметрического определителя.)
3.	Доказать соотношение det ДВ = det A -det В (теорема 5) путем приведения элементарными преобразованиями типа (II) над строками вспомогательной матрицы С=|	| размера 2лх2п к виду Сй =
II £ Д II
= 0 ДВ Г (Указание. Воспользоваться равенством det С = = detCA и соотношениями (4), (5).)
4.	Показать, что \АВ) = *В*А для любых прямоугольных матриц Д, В размеров /пХг и гХл.
5.	Показать, что det В"МВ = det Д для любой квадратной матрицы Д£Л1л(К) и любой обратимой матрицы В^Л1Я(1И).
• 3]
ПРИМЕНЕНИЯ ОПРЕДЕЛИТЕЛЕЙ
125
6. Пусть
1	0 ...	О	О	О
—1	Х2	1 ...	О	О	о
Сп (^1>
О О О ... Хл_2 1 о
О О О ... —1	1
О О О ... О —1
Показать, что det СЙ«ХЛ det Cn-x + det Сй-2. При Xi = A2==. . .=ХЙ=1 найти численное значение detCn. (Указание. Вспомнить пример 3 из п. 3§3 гл. 2 и обратить внимание на тот факт, что detСп(1, ..., 1)» «(-l)"-idetC„(-l, ..., -1).)
7. Показать, что определитель пхп-матрицы
Дп —		2	—1	0	0 ...	0	0	0 —1	2	—1	0 ...	0	0	0 0	—1	2	—1 ...	0	0	0 0	0	0	0 ...	—1	2	—1 0	0	0	0 ...	0	—1	2
равен п + 1.
§ 3. Применения определителей
1. Критерий невырожденности матрицы. В § 3 гл. 2 квадратная матрица А названа невырожденной, если существует обратная к ней матрица Д”1. Применяя теорему 5 § 2 к соотношению AA~l = A~1A = Е, мы получаем, что det Д-det А~1= 1. Стало быть, определитель невырожденной матрицы отличен от нуля и
det Д“х-(det Д)"1.
Наряду с матрицей А рассмотрим ее присоединенную (или взаимную) матрицу
ду =
Лц ... Ап1
Ain ... Апп II
Чтобы получить Д7, надо поставить на место каждого элемента а^ матрицы А его алгебраическое дополнение Д/у (г, / = 1, ...,п), а затем перейти к транспонированной матрице.
126
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
Теорема 1. Матрица А$Мп (R) невырождена (обратима) тогда и только тогда, когда det Д=/=0. Если det Д =#=0» то Д"1 = (det Д)”1 Ду, или, в более подробной записи:
-^11	^П1
аи • •• а1п Ц”1 det Л ”* det Л
ani • • • апп II  ^1п det Л ’ det Л
Доказательству теоремы предпошлем лемму.
Лемма. Пусть A g M„(R). Имеют место соотношения
+	• • • +an»4/» = ®//det А,	(1)
+ a2i^2/ + • • • + ani^nj — А>	(2)
где 6ij—символ Кронекера (при i^=j говорят о разложении определителя det А по чужой строке или соответственно по чужому столбцу).
Доказательство. При / = / утверждение леммы совпадает с теоремами 1 § 2 и Г § 2. Поэтому остается рассмотреть случай i Ф j, когда 6zy = 0. С этой целью введем матрицу
а11 ^12 • • • а1п
А [Дп • • •, Д/» • • *» Д<> •»•» Ди]
ail ai2 • • • ain
ail ai2 • • • a in
anl an2 • • • ann
получающуюся из A = [..., A(, Ay, ...] заменой /-Й строки на t-ю (t-я строка остается на месте). Как и у всякой другой квадратной матрицы с двумя одинаковыми строками, det.4' = O. С другой стороны, алгебраическое дополнение A'jlt (k = 1..п) образуется путем зачерки-
вания /-Й строки А'у = А{ и А-го столбца определителя, так что A'jb= AJk. Формальное разложение определителя матрицы A' — (a'st) по /-й строке даст нам соотношение
О = det А = 2	= 2
. 1	k “ 1
совпадающее с соотношением (1) в формулировке леммы.
ПРИМЕНЕНИЯ ОПРЕДЕЛИТЕЛЕЙ
127
Второе соотношение получается из аналогичных соображений, относящихся к столбцам. |
Обращаясь к доказательству теоремы, мы просто замечаем, что левая часть соотношения (1) есть не что иное, как элемент матрицы C = AAV:
сп • • • С1П ап • • •
Сп1 • • • спп I II • • •
ат Дп ... Ап1
апп II ^1п • • • Ann
Согласно соотношению (1) (cZy) = (6/у- det Д) = (det Д) Е. Таким образом,
AAV--= (det А)Е,
откуда при det Д=£0 получаем
(det Д)-1 (ДД v) = A (det Д)-Мv = Е.
Левая часть соотношения (2) является выражением элемента матрицы С' = ДУД. Так как правые части в (1) и (2) совпадают, то в случае deM^O мы приходим к соотношениям
A (det Д)"1 Дv = (det Д)”1 А^А -=Е,
означающим, что Д"1 = (det Д)-1Дv. |
Следствие 1. Определитель равен нулю тогда и только тогда, когда его строки (и столбцы) линейно зависимы.
Этот критерий, частично уже известный нам (см. конец п. 3 § 2), мог бы быть доказан гораздо раньше, но в нем не было необходимости. Рассуждение: по теореме 1 равенство det А = 0 эквивалентно вырожденности матрицы Д, а вырожденность по теореме 4 § 3 гл. 2 эквивалентна условию rank Д < п (пхп— размер матрицы Д), характеризующему в силу теоремы 1 § 2 гл. 2 матрицы с линейно зависимыми строками (столбцами). |
Теорема 1 имеет скорее теоретическое значение. С вычислительной точки зрения, в особенности при больших размерах матриц, для отыскания матрицы Д""1 удобнее пользоваться методом (Р, ф)-приведения, описанным в следствии теоремы 5 § 4 гл. 2.
Выведем теперь формулы для решения системы из п линейных уравнений с п неизвестными, ради которых, в частности, и была первоначально развита теория определителей.
128
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
Следствие 2 (формулы Крамера). Если линейная система
®11Х1 4" • • • 4“ а1пХп ~ ^1»
^П1Х1 4“ • • • 4 ^ппХп ~
имеет отличный от нуля определитель (т. е. det (а2у)=^0), то ее единственное решение задается формулами
G11 • • •	• • • aln
xk =
anl ♦ ♦ •	• ann
an • • • aik • • • am
fe = 1, 2, ..., n
cini . ..	. ann
(числитель Dk получается заменой k-го столбца в D = det(aij) столбцом свободных членов).
Доказательство. По теореме 1 матрица А = (а1}) обратима. Поэтому, записав нашу систему в виде АХ = В9 мы, как и в § 4 гл. 2, получим
откуда
у °   /_____
“ det А •
Именно такое выражение в числителе мы получим, разложив определитель Dk по А-му столбцу (см. (2)).
Выполнение всех преобразований в обратном порядке показывает, что набор (DjdetA, Dn/detA) действительно является решением нашей системы. |
Заметим, что формулы (3), (9) из § 4 гл, 1 совпадают как раз с формулами Крамера при п — 2 и 3 соответственно. Удобные при небольших п, формулы Крамера несут в общем чисто теоретическую функцию. Например, их применение к линейной системе из примера 2 в п. 4 § 3 гл. 1 дает (с учетом равенства det Л = 1) выражение для числа Фибоначчи
1	0 0 ... О 01
0	1 0 ... О 01
—1—11... О 00
0 0 0 ... —1 1 0 о о О .. ♦ — 1 —1 о
в 3]
ПРИМЕНЕНИЯ ОПРЕДЕЛИТЕЛЕЙ
129
Понятно, что оно весьма далеко от того явного выражения для fn, которое мы нашли в конце § 3 гл. 2.
2. Вычисление ранга матрицы. В §§ 2 и 4 гл. 2 содержится все необходимое для описания совокупности решений общей прямоугольной системы линейных уравнений. Важнейшая роль в этом описании принадлежит понятию ранга матрицы. Нам осталось лишь перевести его на язык теории определителей, чтобы получить в свое распоряжение еще один метод вычисления ранга и удобное средство для выражения факта линейной независимости системы векторов арифметического линейного пространства Rm.
Итак, пусть
0ц ... а1г ... ain
ari • • • агг • • • агп
ат1 • • • атг • • • атп
— произвольная прямоугольная матрица размера /пхп с коэффициентами	Под минором /?-го порядка
матрицы А, как обычно, понимается определитель матрицы элементов, стоящих в Л на пересечении отмеченных k разных столбцов и k разных строк; min (n, tri}.
Пусть ранг матрицы А равен г. Согласно теореме 1 § 2 гл. 2, это значит, что г — максимальное число линейно независимых строк и максимальное число линейно независимых столбцов матрицы А. Обращаясь к теореме 5 § 4 гл. 2 и ее следствию, мы замечаем, что
л-аГ»' 21е’
где В и С—невырожденные матрицы размеров /пх/п и пхп соответственно, записываемые в виде произведения элементарных матриц. Так как у матрицы ^|| имеется отличный от нуля минор М = \ЕГ |^1 порядка г, нонет ненулевых миноров порядка > г, и так как это свойство сохраняется при элементарных преобразованиях строк и столбцов, то мы приходим к следующему утверждению.
Теорема 2. Ранг любой тхп-матрицы А равен наибольшему порядку ее отличных от нуля миноров. |
5 А. И. Кострнкнн
130
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
Любой отличный от нуля минор максимального порядка матрицы А называется ее базисным минором. Столбцы (соответственно строки) матрицы А, пересекающие данный базисный минор, называются, в соответствии с терминологией из гл. 2, базисными столбцами (соответственно базисными строками). По-прежнему интерпретируя строки и столбцы /пхп-матрицы А как векторы пространств R" и соответственно, а также используя основные свойства линейно независимых систем векторов (их дополняемость до базиса; см. упражнение 5 § 1 гл. 2), легко понять, что отыскание хотя бы одного базисного минора можно существенно упростить, сведя его к последовательному рассмотрению так называемых окаймляющих миноров. Именно, если найден отличный от нуля минор М k-ro порядка матрицы Л, то следующий шаг заключается в проверке лишь тех миноров 1)-го порядка, из которых М получается вычеркиванием одной строки и одного столбца. Если же такие миноры, окаймляющие М, равны нулю, то гапкЛ = &. (Почему? Это означало бы по теореме 2, что любой столбец матрицы А выражается линейно через k выбранных столбцов.) В противном случае следует перейти к минорам, окаймляющим какой-нибудь один ненулевой минор порядка &+1.
Метод окаймляющих миноров достаточно практичен, особенно тогда, когда мы хотим знать не только ранг, но и те столбцы или строки матрицы Л, которые составляют максимальную линейно независимую систему. При элементарных преобразованиях эта информация, конечно, утрачивается.
УПРАЖНЕНИЯ
1.	Показать, что выполнены следующие соотношения: (AB)V = BVAV; (U)V = *(AV); (M)V = X"-1AV;
(AV)V=((let
2.	Выразить rank Av через rank А.
3.	Доказать, что квадратная система линейных однородных уравнений тогда и только тогда обладает нетривиальными решениями, когда определитель системы равен нулю.
4.	Опираясь на результаты п. 1 § 4 гл. 2 и на следствие 2 тео. ремы 1, показать, что фундаментальная система решений однородной
I ч
ПРИМЕНЕНИЯ ОПРЕДЕЛИТЕЛЕЙ
131
I нс i ими
а11х1 + • • • + а1пхп — О,
1*1+ •• • + ал-1, n*n = 0
рннгн r~n — 1 будет состоять из одного вектора-столбца Xе =	-D2, D3t ..., (—1)"-Х£>л],
I до /)/ —определитель матрицы, получающейся из Л = (а/у) вычерки-iuiiiiicm ее i-го столбца. Любое решение системы имеет вид Х — лХ°.
5.	Пусть А = (ац)£Мп (IR) и (п — 1) | ац | < | оц | для всех i # /. Доказать, что det А 0. (Указание. Предположив противное, носпользоваться критерием, сформулированным в упражнении 3. Именно, если [Х1,...,хл]—нетривиальное решение линейной системы 0 и х\ — его компонента, имеющая максимальный модуль, то из Дг-го уравнения akkx°k + 2 akjxl = ® следует оценка (n —1)| akk 11 x°k |=
-•(л— 1)1 2 akjx°i I < (n~~ 1) I akk 11 *fe|, Дающая нужное противо-I i^k I
pr’iiie.)
6.	Доказать следующее утверждение. Пусть Л = (а,у), B = (bki)— мшрнцы размеров пХт и т'Хп соответственно, и пусть С = ЛВ* Инда
| уммнрование в правой части проходит по всем n J возможным комбинациям по п элементов {jlt /2, ...» jn} из 1> 2, ..., т. В част-и» н । it, det С = det Л -det В при т = п и detC = O при п > т. (Указа-п и и. Так как С= (Qy), сц = 2 aikbkj> то многократное применение пра-iiiHiii разложения определителя по строке (теорема 1* § 2 гл. 3)
/ПК11
	alk3 • 	
a2ki	а2Йа • '	агкп
ank\	anki • -	•• °nftn
• - bknnt
। ни суммирование происходит по всем попарно различным klt ..., knt I l|iii Л1 с л таких индексов нет, и, следовательно, detC = O. Если же а» и|( io ..., Лл—выборка элементов {jlt ..., /л}, взятых в
V
132
ОПРЕДЕЛИТЕЛИ
[ГЛ. 3
каком-то порядке из 1,2, ..., т. Следует собрать все члены, соот* ветствующие фиксированной комбинации {/ь	/„}, и при помощи
теоремы о полном развертывании определителя получить

•	• • ankt	aljl • • • anj\
....................•	'bknn —..............
•	• • ank„	a1)n ... anJn
alj\ •  •	fyll • •  fr/in
av„ • • • anjn bj„l    bJnn
где
n
7.	Используя предыдущее упражнение, показать, что если А — /иХл-матрица над IR, /л^л, то
det МД = 2 м2» м
т \ л )
где М пробегает по всем
минорам порядка л матрицы А.
Глава 4
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ (группы, кольца, поля)
В предыдущих главах накопилось довольно много конкретного материала, который необходимо осмыслить с более общих позиций. С этой целью мы введем и изучим, пока на элементарном уровне, фундаментальные для всей алгебры понятия группы, кольца и поля.
§ 1. Множества с алгебраическими операциями
1. Бинарные операции. Пусть X — произвольное множество. Бинарной алгебраической операцией (или законом композиции) на X называется произвольное (но фиксированное) отображение т: ХхХ—+Х декартова квадрата Х'* = ХхХ в X. Таким образом, любой упорядоченной паре (а, Ь) элементов а, Ь£Х ставится в соответствие однозначно определенный элемент т(а, Ь) того же множества X. Иногда вместо т(а, Ь) пишут атЬ, а еще чаще бинарную операцию на X обозначают каким-нибудь специальным символом: *, о, • или 4-. Последуем и мы тому же пути, называя а-b (или просто ab без всякого значка между а и Ь) произведением, а а + &—суммой элементов а, Ь£Х. Понятно, что эти названия в большинстве случаев условны.
На X может быть задано, вообще говоря, много разных операций. Желая выделить одну из них, используют скобки (X, *) и говорят, что операция * определяет на Д' алгебраическую структуру или что (X, *)—алгебраическая система. Так, например, на множестве Z целых чисел, помимо естественных операций +, • (сложения и умножения), легко указать получающиеся при помощи + (или )и- «производные» операции: пот = п-[-т— пт, н*т —п—т и т. д. Мы приходим к различным алгебраическим структурам (Z, +), (Z, •), (Z, о), (Z, *).
Наряду с бинарными алгебраическими операциями не 'iHiiiciiM интереса гораздо более общие n-арные операции (унарные при п=\, тернарные при п = 3 и т. д.), равно
134
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
как и их комбинации. Связанные с ними алгебраические структуры составляют специальную теорию универсальных алгебр. Впрочем, мы упоминаем об этом только для того, чтобы лишний раз подчеркнуть принципиальную важность для математики казалось бы частных разделов теории универсальных алгебр — алгебраических структур с бинарными операциями.
В направлении конструирования разных бинарных операций на множестве X также, очевидно, открывается неограниченный простор фантазии. Но задача изучения произвольных алгебраических структур слишком обща, чтобы она представляла реальную ценность. По этой причине ее рассматривают при различных естественных ограничениях.
2. Полугруппы и моноиды. Бинарная операция * на множестве X называется ассоциативной, если (а*Ь)*с~ = а*(Ь*с) для всех а, Ь, с£Х', она называется коммутативной, если a*b = b*a. Те же названия присваиваются и соответствующей алгебраической структуре (X, *). Требования ассоциативности и коммутативности независимы. В самом деле, операция * на Z, заданная правилом п*/п=—п—т, очевидно, коммутативна, но (1*2)*3 = (—1—2)*3= —(—1—2)—3 = 0=/=4= 1*(2*3), так что условие ассоциативности не выполняется. Далее, на множестве Afn(R) всех квадратных матриц порядка п>1 определена операция умножения — ассоциативная, но некоммутативная (см. п. 2 § 3 гл. 2).
Элемент е£Х называется единичным (или нейтральным) относительно рассматриваемой бинарной операции *, если е*х = х*е = х для всех х£Х. Если е'—еще один единичный элемент, то, как следует из определения, е’ =е’ *е = е. Стало быть, в алгебраической структуре (X, *) может существовать не более одного единичного элемента.
Множество X с заданной на нем бинарной ассоциативной операцией называется полугруппой. Полугруппу с единичным (нейтральным) элементом принято называть еще моноидом (или просто полугруппой с единицей).
Как и для всякого множества, мощность моноида Л4 = (А4, *) обозначается символом CardAf или |А1|. В случае конечности содержащихся в нем элементов говорят о конечном моноиде М порядка |М|.
III
МНОЖЕСТВА С АЛГЕБРАИЧЕСКИМИ ОПЕРАЦИЯМИ
135
Приведем несколько примеров полугрупп в моноидов.
I)	Пусть Q — произвольное множество и М (Q) — множество всех его преобразований (отображений Q в себя). Из свойств множеств и отображений, отмеченных в § 5 гл. 1, следует, что М (ЭД — моноид. Имеется в виду, конечно, тройка (М (Q), о ,	), где о —естественная
композиция отображений, а — тождественное отображение.
Выделим тот частный случай, когда Q — конечное множество из | Q | = п элементов, обозначаемых просто натуральными числами 1, 2, ...,/г. Каждое преобразование f:Q—>Q определяется указанием упорядоченной последовательности 1/(1), /(2), . ..,/(п), где в качестве образа /(/) может стоять любой элемент из Q. Не исключаются совпадения /(t) = /(j) при i Ф j. Выбирая всевозможные последовательности, мы получим ровно пп преобразований. Значит, | М (Q) | = Card М (Q) = nn. Пусть, скажем, п = 2. Элементы е, f, g, h моноида М ({1, 2}) и их попарные произведения полностью задаются двумя таблицами:
е f ё h
1 2
1 2
2 1
1	1
2	2
е f ё h
е f g ft е f g h f e h g g g g g h h h h
Непосредственно видно, что M ({1, 2}) —некоммутативный моноид.
2)	Пусть снова Q —- произвольное множество и (Q) — множество всех его подмножеств (см. упражнение 4 § 5 гл. 1). Так как (ЛПВ)ПС = ЛП(ВПС) и (ЛиВ)1|С = Ли(ВиС), то на^(Й) определены две естественные ассоциативные бинарные операции. Очевидно, что 0(JA=A и ЛП^=Л. Мы имеем два коммутативных моноида (^(Q), П, 0) и (5* (ЭД» U> ЭД- Как известно, |^5(Q)| = 2ZI, если | Q | = п.
3)	(Мп (IR), +, 0) —коммутативный моноид с нейтральным элементом—нулевой матрицей, а (Мп (R), -, £) —некоммутативный моноид с нейтральным элементом — единичной матрицей £. Это непосредственно вытекает из свойств сложения и умножения матриц, с которыми мы познакомились в гл. 2.
4)	Пусть пZ = {пт | т g z} — множество целых чисел, делящихся на п. Ясно, что (nZ, +, 0) — коммутативный моноид, а (лй, •) — коммутативная полугруппа без единицы (п > 1).
5)	Множество Рп (R) стохастических матриц порядка п (см. упражнение 8 § 3 гл. 2) является моноидом с обычной операцией умножения матриц.
Подмножество S' полугруппы S с операцией * называется подполугруппой, если x*y£S' для всех x,y£S'. В этом случае говорят еще, что подмножество S'czS замкнуто относительно операции *. Если (М, *)—моноид, а подмножество M'czM не только замкнуто относительно операции *, но и содержит единичный элемент,
136
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
то М' называется подмоноидом в М. Например, (nZ, •) — подполугруппа в (Z, •), a (nZ, +, 0)—подмоноид в (Z, +, 0). Всякий подмоноид моноида Af(Q) называется моноидом преобразований (множества Q).
3. Обобщенная ассоциативность; степени. Пусть (X, •) — произвольная алгебраическая структура с бинарной операцией •, которую мы ради простоты будем опускать, записывая ху вместо х-у. Пусть, далее, х19 ..., хп — упорядоченная последовательность элементов из X. Не меняя порядка, мы можем многими разными способами составлять произведения длинь! п. Пусть 1п—число таких способов:
= 1 . XjX2>
/3 = 2: (XjX2) х3, х, (х2х3),
I4 — 5: ((xrX2)Х3) Х4, (Xj(х2Х3))х4, xi ((^2-^з)	^1(^2 OV'a))»
(хгх2) (х3х4); и т. д.
Очевидно, что, перебирая всевозможные произведения х± ... xk, xk+1 ... хп длин k и п—k, 1	— 1, а за-
тем соединяя их нашей бинарной операцией в данном порядке, мы исчерпаем все 1п возможностей. Замечательно, что в моноидах (и полугруппах) расстановка скобок оказывается излишней.
Теорема 1. Если бинарная операция на X ассоциативна, то результат ее последовательного применения к п элементам множества X не зависит от расстановки скобок.
Доказательство. При п=1,2 доказывать нечего. При п = 3 утверждение теоремы совпадает с законом ассоциативности. Далее рассуждаем индукцией по п. Предположим, что п > 3 и что для числа элементов < п справедливость утверждения установлена. Нам нужно лишь показать, что
(*1 . . . Хь) • (Xfc + i . • • хп) = (Х* . . . Xz) • (X/ + i ... xn) (1)
при любых fe, Z, 1 ^.k, l^.n—1. Мы выписали только внешние пары скобок, поскольку по предположению индукции расстановка внутренних скобок несущественна. В частности, х±х2 ... xk — (.. .((ххх2)х3)..	—произ-
ведение, называемое левонормированным. Различаем два случая:
a)	k = n— 1. Тогда (xt ... xn^Jxn = (.. .(ххх2) ... • • -xn-i)xn—левонормированное произведение.
I И
МНОЖЕСТВА С АЛГЕБРАИЧЕСКИМИ ОПЕРАЦИЯМИ
137
б)	fe<n—1. Ввиду ассоциативности имеем
(л-, ... хк) (хк+1 .. .хп) = (xv. .хк) ((хк+1..	х„) =
= ((*! •••**) (Х*+1 • • • *П-1)) Хп =
=	. (ХхХ2) . . . Хк) Х^+1) . . .Хп-1) хп,
т. е. снова левонормированное произведение. К тому же виду приводится и правая часть доказываемого равенства (1). |
В § 2 гл. 2 был введен знак суммирования Очевидно, его можно использовать и в любом аддитивном коммутативном моноиде. В мультипликативном моноиде аналогом служит знак кратного произведения:
2	3	я	/п-1 \
П Xi = XjX2, П Xi = (х,х2) х3( П X/ = ( П Xi ) х„.
1=1	1=1	i=l	\£=1 J
В силу теоремы 1 при записи (или при вычислении) произведения элементов хтх2 ... хп моноида скобки излишни. Единственная забота должна проявляться о порядке множителей, да и то лишь в случае, когда они не все перестановочны между собой. В частности, при хх = х2 = ... = х„ = х произведение хх ... х обозначают, как и при действиях с числами, символом х\ называя его n-й степенью элемента х. Следствием теоремы 1 являются соотношения
хтхп=хт + п9 ^хт)п==хтп9 щ, П	(2)
В моноиде (М, -,е) для любого х£М полагают еще х° = е.
Степеням хп£(М, •, е) в моноиде (7И, +, 0) соответствуют кратные пх = х-\-х-\-...-\-х элемента х. Правила (2) становятся правилами для кратных:
тх + пх = (т-\-п)х, п(тх) = (пт} х. (2')
Отметим еще один полезный факт. Если ху = ух в моноиде М, то
(ху)п = хпуп, п = 0, 1, 2, ...	(3)
В частности, это всегда так в коммутативном моноиде. Соотношение (3) доказывается индукцией по и:
(ху)п = (ху)п~1 (ху) = (х""1 у”"1) (ху) = (х"”1 у1"1 х) у =
= (хп~1 хуп~')у = (X"’1 х) (уп~1у) = хпуп.
138
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Более общо, опираясь на соотношение (3) и используя индукцию по т, получаем
Аналогично
п (* + */) = пх + пу, п = 0,1,2,...,	(3')
и(х1+...+х/й) = пх1+...+пх/й,	n = 0, 1, 2, ... (4')
Обычно моноид (А4, *,е) называют мультипликативным, а (Л4, +, 0)—аддитивным. Аддитивная запись используется преимущественно в коммутативных моноидах.
4. Обратимые элементы. Элемент а моноида (Л4, •, е) называется обратимым, если найдется элемент b £ М, для которого ab*=e = ba (понятно, что элемент b тоже будет обратимым). Если еще и ab'=e = b'a, то b'=eb' = = (ba)b' = b (ab') = be = b. Это дает нам основание говорить просто об обратном элементе a~L к (обратимому) элементу а£М: а~1а = е = аа~1.
Разумеется, (а^1)~~1 = а. Понятие обратимого элемента моноида служит, очевидно, естественным обобщением понятия обратимой матрицы в мультипликативном моноиде (Mn(R), .,£).
Так как (хг/)(£/”1х"’1) = х(уу”1)х”1 = хех’’1 = хх’1 = е и аналогично (у-^х"1) (ху) ~е, то (ху}"1 = у~х х~1. Стало быть, множество всех обратимых элементов моноида (М, - ,е) замкнуто относительно операции • и составляет подмоноид в М.
УПРАЖНЕНИЯ
1.	В п. 1 в качестве примера на Z вводилась операция *: п*т = = — п— т, коммутативная, но неассоциативная. В алгебраической системе (Z,*) выполняются соотношения: (и*т)*т = п, т*(т*п) = = п. Пусть теперь нам дана произвольная алгебраическая система (X, *), в которой (х * #)* у = х, у*(у*х) = х для любых х,у£Х. Доказать, что х*у = у*х, т. е. операция * коммутативна. (Никаких указаний к решению не дается, поскольку это одно из самых бесполезных упражнений в книге. Но все-таки!)
2.	Показать, что
K(R) = ^=(eV)€Afn(R)l 2^ = 0, i=l,2, ..„4
I	/=1	J
* 2)
ГРУППЫ
139
— полугруппа с обычной операцией умножения матриц. Является ли (M°n (R), •) моноидом?
3.	В мультипликативном моноиде М выбирается произвольный элемент t и вводится новая операция *: x*y~xty. Показать, что (Л4, ♦) —полугруппа и что обратимость элемента t в М — необходимое и достаточное условие, при выполнении которого (Л4, *)—моноид с нейтральным (единичным) элементом Z*1.
4.	Показать, что множество Z с операцией о: лот = л + ^4-+ пт = (1 +«) (1 +т)—1 является коммутативным моноидом. Что служит в (Z, о) нейтральным элементом? Найги в (&, о) все обратимые элементы.
§ 2. Группы
1.	Определение и примеры. Рассмотрим множество GL(n, R) всех квадратных nxn-матриц с вещественными коэффициентами и с отличным от нуля определителем. Согласно теореме 5 § 2 гл. 3 det А =/=0, detB=/=0 =Ф deti4B=/=O. Мы видим, что A, BgGL(n, R) => АВ €GL(и, R); далее (АВ)С = А (ВС) и существует выделенная матрица Е такая, что Л£ = ЕЛ = Л для всех A g GL (n, R). Кроме того, у каждой матрицы А € GL (и, R) имеется «антипод»—обратная матрица Л-1, для которой ЛЛ^ = Л-М =Е.
Множество GL (n, R), рассматриваемое вместе с законом композиции (бинарной операцией) (Л, В)»—> ЛВ и называемое полной линейной группой степени п над R, можно было бы коротко определить, следуя терминологии § 1, как подмоноид всех обратимых элементов моноида (M„(R), •,£). Но этот подмоноид настолько важен, что он заслуживает специального названия и дает веский повод ввести общее
Определение. Моноид G, все элементы которого обратимы, называется группой. Другими словами, предполагаются выполненными следующие аксиомы:
(G1) на множестве G определена бинарная операция: (х, у)^ху\
(G2) операция ассоциативна: (xy)z = x(yz) для всех х, у, z£G\
(G3) G обладает нейтральным (единичным) элементом е: хе = ех = х для всех x^G\
140
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
(ГЛ. 4
(G4) для каждого элемента x£G существует обратный х"1: хх~1 = х~1х = е.
Удивительно, что одна из старейших и богатейших по результатам областей алгебры, играющая фундаментальную роль в геометрии и в приложениях математики к вопросам естествознания, основывается на столь простых аксиомах. Небольшой анализ показывает, что их можно еще упростить, но эта задача для нас не принципиальна.
Группа с коммутативной операцией называется, естественно, коммутативной, а еще чаще—абелевой (в честь норвежского математика Абеля). Самый термин «группа» принадлежит французскому математику Галуа — подлинному создателю теории групп. Идеи теории групп «носились в воздухе» (как это часто бывает с основополагающими математическими идеями) задолго до Галуа и некоторые из ее теорем в наивной форме были доказаны еще Лагранжем. Гениальные работы Галуа оказались непонятыми, и возрождение интереса к ним началось только после книги Жордана «Курс теории перестановок и алгебраических уравнений» (1870 г.). Лишь к концу XIX века в теории групп «совершенно отказываются от фантазии. Взамен этого тщательно препарируется логический скелет» (Ф. Клейн, «Лекции о развитии математики в XIX столетии»).
Для обозначения числа элементов в групце G (точнее, мощности группы) используются равноправные символы CardG, | G | и (G:e). Почти все сказанное в § 1 о моноидах переносится на группы. Следует лишь производить надлежащую замену слов. В частности, подмножество Ha:G называется подгруппой в G, если е g Я; /ц, h2 £ И => =>/1^2 С Я ий^Я =>/г""1 £//. Подгруппа HaG—собственная, если Н=£е и H=£G.
Приведем несколько примеров групп.
1)	В уже известной нам полной линейной группе GL (nt R) рассмотрим подмножество SL (n, IR) матриц с определителем 1:
SL (л, R) = {4£GL(n, R) | det А = 1}.
Очевидно, что E£SL(n, R). Согласно общим результатам гл. 3 об определителях, det А — 1, det В = 1 => det АВ = 1 и det/l-1^ = (det/l)“1=l. Поэтому SL (n, R) — подгруппа в GL (n, R); она носит название специальной линейной группы степени п над R. Ее называют еще и унимодулярной группой, хотя к последней часто причисляют матрицы с определителем ± I.
I 21
ГРУППЫ
141
Надо сказать, что группа GL (n, R), будучи вместилищем многих интересных групп, является для математиков разных поколений как бы нескончаемым источником новых идей и нерешенных задач.
2)	Используя рациональные числа вместо вещественных, мы придем к полной линейной группе GL (п, О) степени п над Q и к ее подгруппе SL (п, О). В свою очередь SL (и, 0) содержит интересную
подгруппу SL (п, Z) целочисленных матриц с определителем 1. Теорема 1 § 3 гл. 3, предлагающая явную формулу для коэффициентов обратной матрицы, показывает, что SL (n, Z) действительно является группой. Группы SL(n, Q) и SL (n, Z) занимают почетное место в теории чисел. Частично упорядоченное множество (см. п. 3 § 6 гл. 1) рассмотренных подгрупп группы GL (л, IR) изображается помещенной здесь диаграммой (рис. И).
3) Положив в примерах 1) и 2) л=1, мы придем, во-первых, к мультипликатив-
GLfo4)
Рис. 11.
ным группам R* = IR\{O} = GL, (1, R), Q* =
= Q \ {0} =GL (1, Q) вещественных и рациональных чисел. Эти группы, очевидно, бесконечны. Так как в (Z, •» 1) обратимыми эле.
ментами являются только 1 и —1, то GL(1, Z) = {± 1}. Далее, SL (1, IR) = SL (1, Q) = SL (1, Z) = l. Но уже при л = 2 группа SL (2, Z) бесконечна: ей принадлежат, например, все матрицы
/1 т\ fl 0\ (т т—1\
U J - U J - и 1 )>
Отметим еще бесконечные аддитивные группы:
(R,+,0), (Q,+,0), (Z,+, 0).
4)	Пусть Й— произвольное множество, a S (Й)— множество всех биективных (взаимно однозначных) преобразований /: й й. Обратившись к результатам § 5 гл. 1 об отображениях множеств (теоремы 1, 2 и следствие теоремы 2), мы немедленно делаем заключение, что S (й)— группа с естественной бинарной операцией, являющейся композицией преобразований. Разумеется, S (Й) —подмоноид всех обратимых элементов моноида М (Й) из примера 1) § 1, но это обстоятельство мы не склонны подчеркивать. Сама по себе группа S (й) и в особенности различные ее подгруппы, называемые группами преобразований,— стартовая площадка, с которой начинаются всевозможные применения теории групп. Достаточно упомянуть о знаменитой «Эрлангенской программе» Ф. Клейна (1872 г.), положившей понятие группы преобразований в основу классификации различных типов геометрий. Взяв за Й линейное пространство мы придем к «большой» и мало обозримой группе S (Rn). Но в S (R") содержится подгруппа обратимых (биективных) линейных преобразований фд: R" находящихся во взаимно однозначном соответствии с невырожденными матрицами А порядка п (см. § 3 гл. 2).
Таким образом, получается вложение GL(n, R) в S (Rrt).
Смысл этого вложения станет яснее, когда будет введено важное понятие изоморфизма групп.
142
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
2. Системы образующих (этот пункт при первом чтении можно пропустить).
Имея подмножество S группы G, попробуем выбрать подгруппу ЯсО, содержащую S и такую, что для всякой подгруппы /CczG из будет вытекать включение Яс/(. Двух минимальных подгрупп Я, Я' подобного рода быть не может:
ScH, ScH' => ЯсЯ'сЯ => Н' = Н'.
Итак, минимальная подгруппа Я должна совпадать с пересечением всех подгрупп, содержащих S, если только это пересечение будет подгруппой в G. Но имеет место несложная
Теорема 1. Пересечение П Я/ любого семейства
\Hj\iZl} подгрупп группы G является подгруппой.
Доказательство. Пусть е—единичный элемент группы G. Свойства её ПЯГ; х,г/ё ПЯГ => ху£ ПЯ,; хё ПЯ/ =Ох“1ёПЯ/, характеризующие всякую подгруппу, выполнены в ПЯХ- потому, что они выполнены в каждой из подгрупп Я,- в отдельности. |
Возьмем теперь в качестве семейства	веете
подгруппы, которые содержат данное подмножество Sc:G. Тогда их пересечение
<S>= П Я
Sc Н
в силу теоремы 1 и сделанных выше замечаний будет как раз минимальной подгруппой, содержащей S. Мы назовем <S> подгруппой, порожденной множеством S в группе G, a S — множеством образующих подгруппы <S>. На первый взгляд <5> задается неэффективно, поскольку нужно перебирать все подгруппы, содержащие S. Необходимости в этом однако нет, как показывает простое утверждение, вытекающее из теоремы 1.
Следствие. Подгруппа <S>a:G совпадает с множеством Т9 состоящим из единичного элемента е и всевозможных произведений
tJz • • - tn> п = 1, 2, 3, ...,
где либо	ё S, либо ё 5, 1 i п.
Действительно, так как . tn ё К ... t'm £ Т =Ф гп+т = . . . tnt[ ...гт$т и е г =$>
ГРУППЫ
143
$ 21
—> Gx-. ./J”1 =/п1. •-^Г1 € Л то множество Т является подгруппой в G. С другой стороны, каждая подгруппа Я, содержащая все xzgS, должна содержать все их обратные xf1 и, стало быть, все произведения вида Поэтому Н^Т и Т совпадает с пересечением всех таких подгрупп. |
Следует заметить, что далеко не все произведения /г/2.. Лп будут различными элементами подгруппы <S>, даже если условиться (что естественно) заменять встречающиеся пары ааг1, а"1а взаимно обратных элементов единичным элементом. В общем при |S|> 1 вопрос о равенстве произведений trt2 ... tn труден и вкратце будет обсужден лишь в гл. 7.
Каждая группа G порождается какой-нибудь системой образующих S: за S можно взять, например, всю группу G. Ради простоты рассмотрим группу G, порожденную конечным множеством S своих элементов (такие группы называются конечно порожденными). Удаляя из S «лишние» элементы, которые записываются в виде произведения оставшихся (и их обратных), мы придем к минимальной системе образующих М группы G. Это значит, что <M> = G, но <AT>=#G, если система М' получена из М удалением хотя бы одного элемента. Пусть, скажем, М = {gfi, ..., g^}. Тогда вместо G = <M> пишут также G = <gn g2, ..., gd>. При d= 1 говорят о циклической группе.
3. Циклические группы. Если G — произвольная группа и g—ее элемент, то по определению <g>—циклическая подгруппа в G.
В соответствии с теоремой 1 и свойствами степеней элементов в моноидах естественно ожидать, что любая циклическая группа <а> с образующей а является абелевой группой вида <tz> = {an|nCZ} или <a> = {na|n£Z} (эта запись не означает, что все элементы ап или па различны) в зависимости от того, какую группу мы рассматриваем— мультипликативную или аддитивную. Так оно и есть, но нужно условиться в обозначении (a~l)k^a~k и доказать следующее утверждение.
Теорема 2. Каковы бы ни были m, n£Z, атап = ат+п, (ат)п = атп
(соответственно та + па = (т + п) а, п (та} = (пт) а).
144
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Доказательство. При неотрицательных /л, и см. соотношения (2), (2') в п. 4 § 1. Если т < 0, п < 0, то т' = —т >0, п' = —п > 0 и
атап = (аг1)"1' (а-1)"' = (a~1)tn'+n' = а~{,п'+п''> = ат+п.
При т' — —т >0, п > 0 имеем
атап = (а"1)т/аГ1 = (а-1.. .а"1) (а. . .а) =
т'	п
= an-rnt (или (а~1)т'-п, если т'^п) = ат+п.
Аналогично рассматривается случай т > 0, п < 0. Равенство (ат)п = атп вытекает из предыдущего и достаточно очевидно из определения степеней. |
Простейшим примером циклической группы служит аддитивная группа целых чисел (Z, + , 0), порожденная обычной единицей 1 или —1. Легко проверить, далее, что матрица ||* J| порождает в SL(2, Z) бесконечную циклическую подгруппу. Множество {1,—1} является по умножению циклической группой порядка 2.
Пример циклической группы порядка п получится, если рассмотреть все вращения на плоскости вокруг некоторой точки 0, совмещающие с собой правильный n-угольник Рп с центром в точке 0. Очевидно, что эти вращения образуют группу; под их произведением следует понимать последовательное выполнение преобразований. Наша группа Сп содержит вращения ф0, <рг, ...» фп-1 против часо-v	л 2л	. 2л „
вой стрелки на углы 0, —, ..., (п—1) — . При этом ф^ = ф$, а из геометрических соображений видно, что ф-1 = ф^~5 и Ф^ = Ф0 (единичное преобразование). Итак, |С„| = п и С„ = <ф!>. Заметим, что циклическая группа Сп является собственной подгруппой группы Dn всех преобразований симметрии n-угольника Рп (т. е. совмещений Рп с собой).
Пусть снова G — произвольная группа, а — некоторый ее элемент. Имеются две возможности: 1) Все степени элемента а различны, т. е. т^п => ат^ап. В этом случае говорят, что элемент а С G имеет бесконечный порядок. 2) Имеются совпадения ат = ап при /л=И=п. Если, например, т > п, то ат~п=^е, т. е. существуют положительные степени элемента agG, равные единичному элементу. Пусть q—наименьший положительный показатель, для которого ач = е. Тогда говорят, что а — элемент
ГРУППЫ
145
ft 2]
конечного порядка q. В конечной группе G (Card G < оо) все элементы, разумеется, будут конечного порядка»
Предостережение. Слово «порядок» в математике многозначно. Мы говорили раньше о квадратных матрицах порядка п (матрицах размера пХл), но невырожденная матрица А, рассматриваемая как элемент группы GL (и, IR), имеет также порядок (возможно, бесконечный) в только что указанном смысле. Каждый раз будет ясно из контекста, о чем идет речь.
На фоне приведенного выше примера циклической группы порядка п следующее утверждение почти очевидно.
Теорема 3. Порядок любого элемента aGG (G—абстрактная группа) равен Card<a>. Если а—элемент конечного порядка q, то
<&> = {е,а,	и ak = e <=> k = lq, /£Z.
Доказательство. В случае элемента бесконечного порядка доказывать нечего. Если а—порядка q, то по определению все элементы е, а, а2, ..., а^1 различны. Любая другая степень ak совпадает с одним из этих элементов, т. е. <д> = {е, а, ..., В самом деле, воспользовавшись алгоритмом деления в Z (п. 3 § 8 гл. 1), запишем показатель k в виде
k = lq^r, Q^r^q—1,
после чего, оперируя со степенями по правилам, изложенным в теореме 2, получим
ak = (a<i)lar = ear = ar.
В частности, ak = e => r = 0 =^> k = lq. |
Свойство цикличности группы, очень полезное и удобное, не всегда задано априорно: иногда его приходится доказывать. В качестве примера рассмотрим следующее
Предложение. Перестановочные элементы а, b произвольной группы G, имеющие взаимно простые порядки s, /, порождают в G циклическую подгруппу порядка st
<а, by = <afc>.
Доказательство. В самом деле, D = <а>f) <fe> — е, поскольку для любого элемента d С D, имеющего какой-то
146
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
порядок q, по теореме 3 имеем
й = а1 = Ы ds = (as)1 = е, dt = (bty=e =£ q\s, q\t,
а из взаимной простоты s, t следует, что q=\. Если, далее, п = |<а&>|, то (см. соотношение (3) § 1)
anbn = (ab)n = е => ап = b~n gD = е => ап = е, Ьп = е =>
=» s|n, t\n => HOK(s, t)\n => st\n, поскольку st = НОК (s, t) НОД (s, /). Но (аЬу*=(а*У (Ь*У=е (теорема 2), так что п | st и, следовательно, n = st. Остается заметить, что
<а, &> = {az^|0<i^s—1, O^J^t—1} =>
Card <а, by^Zst,
а так как <ab> с <а, 6> и Card <а&> = st, то <а, &> = - <ab>. |
К циклическим группам мы еще вернемся, а сейчас рассмотрим более основательно специальный тип групп преобразований, на которых особенно наглядно иллюстрируются введенные нами понятия.
4. Симметрическая и знакопеременная группы. Пусть Й— конечное множество из п элементов. Поскольку природа его элементов для нас несущественна, удобно считать, что Й=р,2,	Группа 5(й) (см. выше при-
мер 4) всех взаимно однозначных отображений Й—>Й называется симметрической группой степени п (иначе: симметрической группой на п символах или на п точках) и чаще обозначается через Sn.
Ее элементы, обычно обозначаемые строчными буквами греческого алфавита, называются перестановками.
Замечание. Иногда элементы группы Sn называют подстановками, используя термин «перестановка» в качестве синонима расположения чисел 1, 2, ...» п в каком-то фиксированном порядке. Так как между такими упорядочениями чисел и элементами группы Sn имеется взаимно однозначное соответствие, а слово «перестановка» ассоциируется в сознании скорее с действием, чем с застывшим упорядочением, то подстановки у нас из употребления исключены. Впрочем, ниже мы будем говорить, например, о подстановке числа в многочлен, но это служит лишь дополнительным аргументом в пользу указанного терминологического соглашения.
Если нужны еще какие-то доводы, то их можно найти, по меньшей мере, в двух источниках: а) в научной литературе; б) в учебнике П. С. Александрова «Лекции по аналитической геометрии» («Наука», 1968, стр. 767).
I И
ГРУППЫ
147
В развернутой и наглядной форме перестановку л: /►~>л(/), /=1, 2, ...» п, изображают двухрядным символом
/1 2
Vi Ч
н \
in) ’
полностью указывая все образы:
1 2 ...п
л. J J
Н ^2 ♦ • •
где *\ = л(&), А=1, ..., п,— переставленные символы 1, 2, п. Как всегда, е—единичная перестановка (хотя е—буква латинского алфавита): e(i) = i, Vi.
Перестановки a, перемножаются в соответствии с общим правилом композиции отображений: (от)(/) = = о(т(0). Например, для перестановок
__/1 234\	_/1 234\
\2 34 \) ’ Т”~\432 1/
имеем
1 234
1432
В то же время
__ /1 23 4\ /1 234\	/1 234Х
\4 3 2 1 у \ 2 3 4 1 /	\ 3 2 1 4/ *
так что от=/=то.
Иногда, наряду с группой G удобно рассматривать так называемую противоположную группу. Если G— группа относительно бинарной операции о: (/, g)i—»/og, то она является также группой относительно операции *: (/, g) i—g о f. Группу с противоположной операцией обозначают G°p. Этот факт отражает симметрию аксиом групп, в которых говорится о двусторонних обратных и о двусторонних единицах. Аксиома ассоциативности также симметрична. В частности, на группе Зл₽ устанавливается правило перемножения двух перестановок в привычном направлении слева направо. Если бы мы писали io или i° вместо о/ = о (t), то это было бы привычным и для нас.
148
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Найдем порядок группы Sn. Перестановкой а символ 1 можно перевести в любой другой а(1), для чего существует в точности п различных возможностей. Но, зафиксировав о(1), мы имеем право брать в качестве а (2) лишь один из оставшихся п—1 символов (всего различных пар о (1), о (2) имеется (п— 1)+(п—1)+... +(п—1) = = п(п—1)), в качестве о(3)—соответственно п—2 символов и т. д. Всего возможностей выбора о(1), о (2), ... ..., о(п), а стало быть, и всех различных перестановок получается п (п— 1).. .2 -1 =п! («эн»-факториал). Таким образом,
CardS„ = 1| = (S„:e) = п!.
Разложим теперь перестановки из Sn в произведения более простых перестановок. Идею разложения поясним схематически на примере указанных выше перестановок a,
Перестановка о, кратко записываемая в виде о = (1234) или, что то же самое, в виде о = (2341) = (3412) = (4123), носит название цикла длины 4, а перестановка т = = (14) (23) — произведения двух независимых (непересе-кающихся) циклов (14) и (23) длины 2. Заметим, что а2 = (13) (24), о* = (о2)2 = е, т2 = е.
Переходя к общему случаю, назовем две точки i, / £ Q эквивалентными относительно циклической подгруппы <n>cSrt или просто ^-эквивалентными, если / = л*(/) = = л (... л (/) ...) для некоторого sgZ. Так как Sn — конечная группа, то каждая ее подгруппа тоже конечная. По теореме 3 в случае Card<n> = 7 можно считать 0^s<^. Мы имеем дело с рефлексивным, симметричным и транзитивным отношением (см. п. 2 § 6 гл. 1), поскольку i = л° (f) = e(t); j = л* (i) => i = л“* (/) и /==л^(4)г й = л*(/) => k = ns+t(i). В соответствии с общим свойством отношений эквивалентности получаем разбиение
Q = Q1U-.. Ufy	(1)
I» 2)
ГРУППЫ
149
множества Q на попарно непересекающиеся классы I2t,	которые принято называть еще я-орбитами.
Название это вполне обосновано. Каждая точка i С Q принадлежит в точности одной орбите, и если то состоит из образов точки i при действии степеней
элемента л: i, л(0, л2 (Z),	л**"1 (Z). Здесь Zft =	—
длина л-орбиты йл. Очевидно, что /л^<? = Саг(1 <л> и «*(/) = /, причем lk—наименьшее число, обладающее этим свойством. Положив
«* = (« n(i)...
/ i л (Z)
\л (Z) л2 (Z)
I.-2
Л k
z.-1
Л k
(0\ (О/
мы придем как раз к перестановке, называемой циклом длины lk.
Вопрос вкуса и удобства — писать (123...Z) или (1, 2, 3, . .., Z), разделяя символы запятыми. Цикл лл оставляет на месте все точки из множества Q\Q^, а л (/) = лл (/) для любой точки / € Это свойство дает нам основание называть л5, ло s=#Z, независимыми или непересекающимися циклами. Так как я1* (1} = i для i (Е то л^ = е.
Итак, с разбиением (1) ассоциируется разложение перестановки л в произведение
л = л1л2...л/?,	(2)
где все циклы перестановочны: л = лгл2... яр = ~ Л/’1Л/2 * * ’ П1р*
Можно считать, например, что Zx Z2	1т >
>Z„+1=...=Zp=l.
Если цикл nk = (i) имеет длину 1, то он действует как единичная перестановка; естественно такие циклы в произведении (2) опускать:
л = л1л2.. .лт; /л>1,	(3)
Например, перестановку
/12345678\9
\2345 1 768j
мы запишем в виде
л = (12345) (67) (8) = (12345) (67).	(4)
150
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Некоторую неловкость вызывает то обстоятельство, что (12345) (67) можно интерпретировать как перестановку из Sn при любом п>7, однако при фиксированном п никакой неоднозначности нет.
Более точно, пусть наряду с разложением (3) мы имеем еще одно разложение л = а1а2...аг в произведение независимых циклов, и пусть i—символ, не остающийся на месте при действии л. Тогда л, (/)=^Ь 04 (/)=/=/ для одного (и только одного) из циклов ло ..., лда и одного из at, ..., аг. Имеем
л^(£) = лл(1) = а?(0,	* = 0, 1, 2, ...
Но цикл однозначно определяется действием его степеней на любой символ, который не остается на месте. Следовательно, л, = аР Далее применяется индукция по пг или г.
Итак, нами доказана
Теорема 4. Каждая перестановка в Sn является произведением независимых циклов длины 2. Это разложение в произведение определено однозначно с точностью до порядка следования циклов. |
Компактная запись (3) перестановки л, о которой говорится в теореме 4, удобна по многим причинам. В частности, она позволяет легко найти порядок перестановки.
Следствие 1. Порядок перестановки {—порядок циклической подгруппы <л>) равен наименьшему общему кратному длин независимых циклов, входящих в разложение л.
Доказательство. Ранее уже отмечалось, что независимые циклы в разложении л = л1л2...лот перестановочны, или, как еще говорят, коммутируют. Поэтому, согласно соотношению (4) § 1,
ns =	s — 0, 1,2, ...
Так как циклы лр ..., лт независимы (они действуют на разных множествах Qv QOT), то п^ = е Ф=>	= е
для fe=l, ..., т. Стало быть, q—общее кратное порядков циклов лл, которые, как мы видели, совпадают с их длинами lk. Если q— наименьшее натуральное число, для которого то д = Саг(1<л> и g = HOK(Zn ...,/л) —
ГРУППЫ
151
целое число, определенное в п. 2 § 8 гл. 1. См. также предложение в конце п. 3. |
Например, мы сразу можем сказать, что порядок перестановки вида (4) равен 10. А каков максимальный порядок элементов из S8? Перебирая разбиения числа 8 на положительные слагаемые, расположенные в неубывающем порядке, мы приходим к выводу, что порядками элементов Ф е в 38 служат целые числа 2, 3, 5,. 6, 7, 8, 10, 12, 15. В качестве элемента максимального порядка 15 можно взять, например, перестановку л = (12345)(678).
Определение. Цикл длины 2 называется транспозицией.
Любая транспозиция имеет вид'т ==((/) и оставляет на месте все символы, отличные от г, /. Из теоремы 4 вытекает
Следствие 2. Каждая перестановка является произведением транспозиций.
В самом деле, в силу теоремы 4 достаточно записать в виде произведения транспозиций каждый из циклов. Но это можно сделать, например, так:
(12 ... I— 1/) = (1Z)(1/— 1) ... (13)(12). |
Утверждение следствия 2 можно выразить иначе, воспользовавшись понятием системы образующих группы (см. п. 2)
S„ = <(12), ...,(1п), (23), ...,(2n), ...,(п-1н)>.
Разумеется, эта система образующих не является минимальной. Например,
Ss = <(12), (13), (23)> = <(12), (13)>.
Далее, ни о какой единственности записи перестановки через транспозиции не может быть и речи: транспозиции, вообще говоря, не коммутируют, а их число не является инвариантом перестановки. Например, в S4 имеем
(123) = (13)( 12) = (23)( 13) = (13)(24)( 12)( 14).
Впрочем, неединственность разложения видна из равенства от2 = о для любых транспозиций а и т. Тем не менее один инвариант разложения перестановки через транспозиции все-таки существует. Чтобы обнаружить его по возможности естественным способом, рассмотрим действие Sn на функциях.
152
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Определение. Пустьл gS„H f (Хх, .. .,Х„) — функция от любых п аргументов. Полагаем
(л о f)(Xx...Xn) = f (X„-.	Хя-« <„>).	(5)
Говорят, что функция g — nof получается действием л на f.
Например, если л = (123) и f (Хх, Х2, Х8)= Хх + 2ХЦ-+ЗХ8, то (ло/)(Хх, Ха, Х3) = Х3 + 2Х? + ЗХ82.
В соответствии с § 1 гл. 3 функция f называется кососимметрической, если то/ =—f для любой транспозиции xgSn, т. е.
/(•••.	....X,-,	X,-....Xz, ...).
Лемма. Пусть а, р—любые перестановки из Sn. Тогда
(аР)о/ = ао(ро/:).
Доказательство. В соответствии с определяющим соотношением (5) имеем
((ар)о/)(Хх....Х„) = /(Х(ар>-.(1ь •••. Х(а₽)-,(я)) =
= f (Хф-«а-«М1>,	X(p-ia-i)(n)) =
= f	<<х—*i>» •••, Xp-i(a-in)) =
=(ро/)(Ха-.(П......Xa-i(n) )=(ао(6 о/))(Хх...Х„). |
Теорема 5. Пусть л — перестановка из Sn,
л = тхт2 ... тА	(6)
— какое-нибудь разложение л в произведение транспозиций. Тогда число
= (-!)*,	(7)
называемое четностью л (Иначе: сигнатурой или знаком л) полностью определяется перестановкой л и не зависит от способа разложения (5), т. е. четность целого числа k для данной перестановки л всегда одна и та же. Кроме того,
М = еаев	(8)
для всех а, р g S„.
Доказательство. Возьмем произвольную кососимметрическую функцию f от п аргументов X,..........Х„.
§2)
ГРУППЫ
153
По лемме действие л на f сводится к последовательному применению транспозиций тЛ, т^, ..тр т. е. к A-кратному умножению f на —1:
л о f = (тх ... тА_х) о (тЛ о f) =
=	... Tft_x) О f =...=(— 1)7 = 8Я/.
Так как левая часть этого соотношения зависит от л, но не от какого-либо его разложения, то и отображение 8*. ль—»ея, заданное равенством (7), должно полностью определяться перестановкой л при условии, конечно, что f—не тождественно равная нулю функция. Но мы знаем, что существуют кососимметрические функции, не равные нулю;* например, определитель Вандермонда ДП(Х1, ...» Хп) порядка п.
Применение к такой функции f перестановки ар по правилу, изложенному в лемме, дает
м/ = («0) of = ao(Po/) = ao (epf) = ер (а о f) = = ер (ба/) = (еа8р) f,
откуда получается соотношение (8). |
Определение. Перестановка лgSn называется четной, если ея=1, и нечетной, если ея =— 1.
Из определения вытекает, что все транспозиции — нечетные перестановки.
Следствие 1. Все четные перестановки степени п образуют подгруппу Ana.Sn порядка п\/2 (она называется знакопеременной группой степени п).
Доказательство. Согласно (8), еар= 1, если еа = = 8Р= 1, и 8я-1 = 8Я, поскольку ее = 1. Так как Ап — подмножество в Sn, то все аксиомы группы выполнены.
__ Запишем Sn в виде объединения 5„ = Д„иЛл, где Ап — множество всех нечетных перестановок степени л. Отображение Sn в себя, определенное правилом
Р(12)* лн-»(12)л,
биективно. (Оно инъективно: (12) а = (12)0 => а = 0; далее применить тецрему 3 § 5 гл. 1. Можно просто заметить, что (р<12))2 — единичное отображение.) Так как 8(12)я = 8(12)8я = — ея, то р(12)Л„ = А„, p(1S)X„ = А„. Зна
154
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
чит, число четных перестановок в Sn совпадает с числом нечетных перестановок, откуда | Лп|=у|sn|=~. |
Следствие 2. Пусть перестановка n£Sn разложена в произведение независимых циклов длин llt /2, ..1т. Тогда
Действительно, по теореме 5 имеем ел = 8л...я = = еЛ1...ея^. Кроме того, &лк = (—поскольку записывается в виде произведения lk—1 транспозиций (см. доказательство следствия 2 теоремы 4). Окончательно
т
ея = (- 1У*-’ • • •(- I)'"-' = (- 1)‘='	• I
В заключение, чтобы отдохнуть от серьезных вещей, рассмотрим известную игру в «пятнадцать». Пятнадцать пронумерованных плоских квадратных фишек одинакового размера размещены на квадратной доске, разделенной на 16 полей того же размера, что и фишки.
ч	i-2	h	ч		1	2	3	k
Ч	16	Ч	ig		5	6	7	8
ч	Чо	41	^12		9	10	11	12
Чз	Чч	Чз			/J	1k	15	
а)				Рис. 12.				
Остается свободным одно поле, используя которое можно двигать фишки по горизонтали и по вертикали (не снимая с доски). Требуется от произвольно заданного расположения фишек (см., рис. 12, а; свободным полем в начальном состоянии можно считать нижний правый угол) перейти к правильному расположению (см. рис. 12, б). Когда такой переход возможен? Элементарная теория групп убила эту игру в самом ее «салонном» расцвете. С рисунками а) и б) ассоциируется перестановка л£316. Нетрудно убедиться (рекомендуется все-таки убедиться), что правильное расположение достижимо тогда и только тогда, когда четность перестановки л равна 1, т. е. л6Л16.
*2J
ГРУППЫ
155
УПРАЖНЕНИЯ
1.	Показать, что если M — <S> — моноид, порожденный множеством 8 и каждый элемент s£8 обратим в М, то М — группа.
2.	Группа —это моноид G с нейтральным элементом, в котором уравнения вида ах = Ь, уа = Ь однозначно разрешимы при любых a, b£G. Доказать это утверждение.
3.	Показать, что множество Аг (R) так называемых аффинных преобразований	хь->ах + ^(а, 6gR; а 0) вещественной
прямой R образует группу с законом умножения фв,ьфсх = фас, ad+b В группе AHR) содержится подгруппа GL(1, R), оставляющая точку х = 0 на месте, и подгруппа «чистых сдвигов» хн->x-\-b.
4.	Группа SL (2, содержит элементы A	=
порядков 4 и 3 соответственно. Показать, что <АВ>— бесконечная циклическая подгруппа в SL (2, Z). Таким образом, произведение двух элементов конечного порядка в группе G не обязано быть элементом конечного порядка. А как обстоит дело в абелевой группе?
5.	Доказать, что группа G четного порядка | G | = 2л обязательно содержит элемент g е порядка 2. (Указание. Рассмотреть разбиение G на пары g, g"1.)
6.	Доказать, что 8п = <(12), (13), ..., (1л)>.
7.	Доказать, что 8„ = <(12), (123 ... л)>.
8.	Доказать, что знакопеременная группа Ап, л^З, порождается циклами длины 3, причем на самом деле
Ап = <(123), (124)..(12л)>.
9.	Найти знак перестановки
<1 2	3 ...л — 1 л\
п-1 п-2 ... 2 1/
10.	Пусть Q = p,2, ...,л}, QxQ — декартов квадрат. Будем называть пару (i, /)£QxQ инверсией относительно перестановки а£8п (короче: а-инверсией), если i < /, но ст (0 > ст (/). Положим
Па (/)—а (0
Так как (ст (/)—ст (£))/(/— 0—отличное от нуля рациональное число, являющееся отрицательным в точности тогда, когда (£, /)—а-инвер-сия, итак как a: Q——биективное отображение, то sgna = (—1)Л, где k—общее число a-инверсий. Если t = (i/)—транспозиция, то
156
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
sgn т= — 1. Как легко видеть,
“ ( ... о (/) ... a (i ) . • • ) '
так что о-инверсия (i, j) перестает быть инверсией относительно перестановки то, где т = (о (j) о (г)) — транспозиция. Показать, что найдутся k транспозиций Tlt ..., т>, для которых T^T/f-x.. .т1о = е—единичная перестановка. Стало быть, о = тх.. .t^-jT^ и sgn о = (— 1)А = = ео—два равноправных обозначения одного и того-же инварианта перестановки; sgn—от signum (лат.) — знак. Мы получили еще один удобный способ определения знака перестановки. Скажем, относительно перестановки (4) множество инверсий состоит из пяти пар (1,5), (2,5), (3,5), (4,5), (6,7), так что sgnn= — 1. Практически дело сводится к подсчету в нижней строке перестановки л количества чисел /, больших f, но стоящих перед г, для 1 = 1, 2, ..., п— 1.
11.	Доказать, что непустое подмножество Н конечной (мультипликативной) группы G является подгруппой, если Н замкнуто относительно умножения. Значит, в данном случае требования существования в Н единичного элементами обратного h"1 для каждого h£H излишни.
12.	Какую систему образующих можно предложить для мультипликативной группы (Q + , .) положительных рациональных чисел? (Указание. Использовать основную теорему арифметики из § 8 гл. 1.) Существует ли в (<Q + , •) конечная система образующих?
13.	Доказать, что/г-я степень nk цикла л = (12.. .ri)£Sn является произведением б/ = НОД(п, k) независимых циклов, каждый из которых имеет длину (? = HOK(n, d) = n'd.
14.	Пусть Л, B£Mn(R) и (АВ)т = Е для некоторого целого числа т. Верно ли, что (ВА)т = Е?
§ 3. Морфизмы групп
1.	Изоморфизмы. Как уже отмечалось ранее, три вращения ф0, (рп ср2 против часовой стрелки на углы 0°, 120°, 240° переводят правильный треугольник Р3 в себя. Но имеются еще три осевых преобразования симметрии (отражения) ф2, ф3 с указанными на рис. 13 осями симметрии 1 — Г, 2—2', 3—3'. Всем шести преобразованиям симметрии соответствуют перестановки на
$3]
МОРФИЗМЫ ГРУПП
157
множестве вершин треугольника. Мы получаем
<Ро~е, Фх~ (123), ф2~(132)
~ (23), я|)2 ~ (13),	% - (12).
Так как других перестановок степени 3 нет, то можно утверждать, что группа D3 всех преобразований симметрии правильного треугольника обнаруживает большое сходство с симметрической группой 53.
В том же смысле близки друг другу циклические группы Сп (см. пример в п. 3 § 2) и <(12 ... n)>aiSn. . Эти факты, а также общие размыт- f ления о группах не могут не приво
дить к весьма естественному вопросу Рис. 13. о наиболее существенных свойствах групп. На первый взгляд полная информация содержится в таблице умножения группы G, называемой таблицей Кэли:
gl	g2 ..	. . gn ....
glgl	glg2 • 	- • glgn ••••
82g!	8282 • 	• g2gn ••••
gngl	gng2 • •	• gngn • • • •
Действительно, многие закономерности группы можно уловить из рассмотрения ее таблицы Кэли или, что то же самое, — матрицы M = (mZy) (размера пхп, если n = (G:e)) с элементами т^ = gigjfzG. Мы замечаем, например, что в каждой строке и каждом столбце матрицы М любой элемент группы G встречается ровно один раз (см. ниже доказательство теоремы 2). Группа G абелева тогда и только тогда, когда матрица М—симметрическая, т. е. mZy = myZ. Этот список свойств можно было бы продолжить, но все-таки сравнивать две таблицы для групп G, G' одинакового порядка довольно затруднительно, потому что вид матрицы М зависит от нумерации (расположения)
158
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
(ГЛ. 4
элементов группы, а уж в случае бесконечных групп ситуация еще более усложняется.
Самый правильный и самый радикальный подход к различению (или, напротив, к отождествлению) групп G и G' предлагает понятие изоморфизма.
Определение. Две группы G и G' с операциями * и о называются изоморфными, если существует отображение ft G—► G' такое, что;
(i) f(a*b) = f (а) о f (b) для всех at b£G\
(ii) f биективно.
Факт изоморфизма групп часто обозначается символически G G'.
Отметим простейшие свойства изоморфизма.
1)	Единица переходит в единицу. Действительно, если е—единица группы G, то е*а = а*е = а, и значит, f (е) о f (а) = f (a)of (е) = f (a)t откуда следует, что f (е) = е'— единица группы G'. В этом рассуждении использованы, хотя и частично, оба свойства f. Для (i) это очевидно, а свойство (ii) обеспечивает сюръективность f, так что элементами f(g) исчерпывается вся группа G'. |
2)	f =	В самом деле, согласно 1),
f (а) о f (а"1) = f (п*а“1) = f (е) = е' — единица в G', откуда
f (а)”1 = f (я)"1 о е’ = f (а)"1 о (/ (а) о f (д-1)) =
= (/ (а)"1 о f (а)) о f (а-i) = е’ о f (a~l) = f (а-1). I
3)	Обратное отображение	G' —*G {существующее
в силу свойства (ii)) тоже является изоморфизмом.
В силу следствия теоремы 2 § 5 гл. 1 надо убедиться лишь в справедливости свойства (i) для f~l. Пусть а’, Ь’ . Тогда ввиду биективности f имеем a' = f(a), b' — f {b) для каких-то a, b£G. Поскольку f—изоморфизм, а’ о b' = f (а) о f (b) = f{a*b). Отсюда имеем а * b — = f~1(a'ob'), а так как в свою очередь a = f~1(a'), b = f~1{b'), то f-1 (а' о b') = f-1 (а')*/-1 (b')- I
Несложная проверка показывает, что установленное нами соответствие — между группами D3 и S3 является на самом деле изоморфизмом.
В качестве изоморфного отображения f мультипликативной группы (R + , •) положительных вещественных чисел на аддитивную группу (R, +) всех вещественных чисел может служить /=1п. Известное свойство логарифма In ab = In а + In b как раз моделирует свойство (i) в определении изоморфизма. Обратным к f служит отображение х е*.
§3]
МОРФИЗМЫ ГРУПП
159
Докажем теперь две общие теоремы, иллюстрирующие роль изоморфизма в теории групп.
Теорема 1. Все циклические группы одного и того же порядка (в том числе и бесконечного) изоморфны.
Доказательство. В самом деле, если <g> —бесконечная циклическая группа, то все степени gn образующей g различны, и мы получим изоморфизм f: <g>—► —>(Z, +), полагая gn н-» f (gn) = n. Биективность f очевидна, а свойство f (gmgn) = f (gn) + f (gm) вытекает из теоремы 2 § 2.
Пусть теперь G = {e, g, ..., g'7"1} и G' = {e', g', ... ..., (g')*7”1}— две циклические группы порядка q (операции в G и G' не различаем). Определим биективное отображение
gk*-+(g')k, fe^O, 1,
Полагая n + m = lq + rt Q^r^q—1 для любых п,т = = 0, 1, ..., q— 1 и рассуждая, как при доказательстве теоремы 3 § 2, будем иметь
f(g"+m) = f(gr) = (g'Y = (gfY+m = (gfY(gf)m = f(gn)f(gm)l
Теорема 2 (Кэли). Любая конечная группа порядка п изоморфна некоторой подгруппе симметрической группы Sn.
Доказательство. Пусть G — наша группа, п = | G |. Можно считать, что Sn — группа всех биективных отображений множества G на себя, так как природа элементов, переставляемых элементами из 5„, несущественна.
Для любого элемента а € G рассмотрим отображение La'. G—+G, определенное формулой
La (g) = ag.
Если e = glt g2t	— все элементы группы G, то а,
ag2, '-">agn будут те же элементы, но расположенные в каком-то другом порядке (вспомним таблицу Кэли!). Это и понятно, поскольку
agi = agj => «-1 (agi) = cr1 (agf) =»
=> (a~la) gt. = (a-1a) gj => gi = gj.
Значит, La—биективное отображение (перестановка), обратным к которому будет Lj1 — La-i. Единичным отображением является, естественно, Le.
160
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Используя вновь ассоциативность умножения в G, получаем Lab (g) = (ab) g = a (bg)=La (Lbg), t. e. Lab=LaoLb.
Итак, множество Let ..., Lgn образует подгруппу, скажем H, в группе S (G) всех биективных отображений множества G на себя, т. е. в Sn. Мы имеем включение Hc:Sn и имеем соответствие L:	La£H, обладающее
по вышесказанному всеми свойствами изоморфизма. |
Теорема Кэли, несмотря на свою простоту, имеет важное значение в теории групп. Она выделяет некий универсальный объект (семейство \ п= 1, 2, ...} симметрических групп) — вместилище всех вообще конечных групп, рассматриваемых с точностью до изоморфизма. Фраза «с точностью до изоморфизма» отражает сущность не только теории групп, стремящейся объединить в один класс все изоморфные группы, но и математики в целом, которая без таких обобщений была бы лишена смысла.
Положив G' = G в определении изоморфизма, мы получим изоморфное отображение ср: G —-> G группы G на себя. Оно называется автоморфизмом группы G. Например, единичное отображение ев‘ g>—*g (далее обозначаемое просто через 1) — автоморфизм, но, как правило, G обладает и нетривиальными автоморфизмами. Свойство 3) изоморфных отображений показывает, что отображение, обратное к автоморфизму, тоже будет автоморфизмом. Если, далее, ср, ф—автоморфизмы группы G, то (сроф) (ab) = == ср (ф (ab)) = ср (ф (а)ф (Ь)) = (ср о ф) (а)- (ср о ф) (Ь) для любых a,b£G. Стало быть, множество Aut(G) всех автоморфизмов группы G образует группу — подгруппу группы S(G) всех биективных отображений G—+G.
2. Гомоморфизмы. В группе автоморфизмов Aut (G) группы G содержится одна особая подгруппа. Она обозначается символом Inn(G) и называется группой внутренних автоморфизмов. Ее элементами являются отображения
Ia- gf+agcr1.
Небольшое упражнение показывает, что Iа действительно удовлетворяет всем свойствам, требуемым от автоморфизмов, причем 1а1 = 1а-ч Ie = 1—единичный автоморфизм, 1а 0 Л>=Лй> (потому что (/о о Ib) (g)=Ia(Ib(g))=Ia(bgb~1) = = abgb-'cr1 = abg (ab)-1 = Iab (g)).
Последнее соотношение показывает, что отображение f: G —+Inn(G)
§3]
МОРФИЗМЫ ГРУПП
161
группы G на группу Inn(G) ее внутренних автоморфизмов, определенное формулой f(a) = Ia, a^G, обладает свойством (i) изоморфного отображения: f (а) о f (b) = f (ab). Однако свойство (ii) при этом не обязано выполняться. Если, например, G — абелева группа, то aga~l = g для всех a, g^G, так что 1а = 1е, и вся группа Inn(G) состоит из одного единичного элемента Iе. Это обстоятельство делает естественным следующее общее
Определение. Отображение f: G—>G' группы (G,*) в (G', о) называется гомоморфизмом, если
f (a*b) = f (а) о f (b), V a, b С G
(другими словами, в определении изоморфизма опущено свойство (ii)).
Ядром гомоморфизма f называется множество
Ker/ = {ggG | f (g) -=е' — единица группы G'}.
Гомоморфное отображение группы в себя называется еще ее эндоморфизмом.
В этом определении от / не требуется не только биективности, но и сюръективности (т. е. быть отображением «на»), что, впрочем, не очень существенно, поскольку всегда можно ограничиться рассмотрением образа Im/czG', являющегося, очевидно, подгруппой в G'. Главное отличие гомоморфизма / от изоморфизма заключается в наличии нетривиального ядра Кег/, являющегося, так сказать, мерой неинъективности /. Если же Кег/ = {е}, то /: G—>1ш/ — изоморфизм.
Заметим, что
f(a} = e', f (b) = е' => / (a* b) = f (a) о / (b) = e’ о e' = e' и
f (a-1 W («)-1 == (H-1 == *'•
Поэтому ядро Kerf—подгруппа в G. ПустьH — Kerf gG. Тогда (мы теперь опускаем знаки * и о):
f (ghg-1) = f(g)f <h) f (g)’1 = f (g) e' f (g)-‘ = e',
Vh£H, g£G,
t. e. ghg-i^H и, значит, gHg~1cH. Заменив здесь g на g-1, получим g~1HgczH, откуда HcgHg"1. Стало быть,
Vg$G.
6 А. И. Кострикип
162
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Подгруппы, обладающие этим свойством, называются нормальными (еще их называют инвариантными подгруппами или нормальными делителями). Итак, нами доказана
Теорема 3. fldpa гомоморфизмов всегда являются нормальными подгруппами. |
Значение этого факта мы оценим в должной мере значительно позднее. Заметим пока, что далеко не всякая подгруппа нормальна в G. Например, в S3 циклическая подгруппа <(123)> = Л3 нормальна, а <(12)> = {е, (12)} таковой не является (не рекомендуется называть <(12)> «ненормальной подгруппой»),
3. Словарик. Примеры. Стоит отметить, что термины «сюръективное отображение» (отображение «на»), инъективное (отображение рложения), биективное (взаимно однозначное отображение), применимые к отображениям любых множеств (без операций), в случае групп (и в случае других алгебраических систем) заменяются соответственно терминами эпиморфизм (гомоморфизм «на»), мономорфизм (гомоморфизме единичным ядром), изоморфизм (взаимно однозначный гомоморфизм—эпиморфизм и мономорфизм одновременно). Имеется тенденция к замене гомоморфизма термином морфизм. Этот словарик полезно иметь в виду при чтении математической литературы, но на первых порах желающие могут обойтись двумя терминами: изоморфизм и гомоморфизм с добавлениями «в» и «на».
В дополнение к рассмотренным выше приведем еще несколько примеров морфизмов групп.
1)	Аддитивная группа целых чисел Z гомоморфно отображается на конечную циклическую группу <g> порядка q, если положить /: п\—>gn (см. теорему 2 § 2). В этом случае, очевидно, Ker f = =	В самом деле, ясно, что с: Ker f. Обратное вклю-
чение следует из теоремы 3 § 2.
2)	Отображение /: R—= SO(2) аддитивной группы вещественных чисел на группу Т вращений плоскости с неподвижной точкой О, задаваемое формулой f (X) = Ф^ (Ф^ — вращение против часовой стрелки на угол 2лХ), гомоморфно. Так как Ф^ °Фц, = Фх+ц,> а вращение на угол, целочисленно кратный 2л, совпадает с единичным вращением (на нулевой угол), то Кег/ = (2л/г |	Говорят также, что f —
гомоморфизм R на окружность S1 единичного радиуса, поскольку имеется взаимно однозначное соответствие между Ф^ и точкой на S1 с полярными координатами (1, 2лХ),	< 1.
3)	Полная линейная группа GL (п) вещественных матриц А (т. е. матриц с коэффициентами в R) с не равным нулю определителем det А гомоморфно отображается на мультипликативную группу R* отличных
МОРФИЗМЫ ГРУПП
163
а з]
от нуля вещественных чисел, если положить f = det. Условие гомоморфизма f (AB) — f (Л) f (В) — лишь иная формулировка теоремы 5 § 2 гл. 3. По определению SL(n) = Kerf.
4)	Рассмотрим циклическую группу С2 = <—1> = {1, — 1} порядка 2.
Если угодно, ее можно задать абстрактно таблицей Кэли:
1 —1
С2: 1	1 -1
— 1 —1 1
Отображение Sn—при помощи известной нам функции e==sgn: л н-» гя (знак перестановки л) является гомоморфизмом симметрической группы Sn на С2. При этом, согласно определению знакопеременной группы, Кеге=Лп.
5)	Бесконечная группа может быть изоморфна своей истинной (собственной) подгруппе. В самом деле, аддитивная группа (Z, +) содержит собственную подгруппу /гй = {nk | k£ z}, где п>1 — фиксированное натуральное число. Легко проверяется, что отображение gn: Z—определенное соотношением gn(k) — nk, является изоморфизмом. Попутно заметим, что Z и nZ—бесконечные циклические группы, в которых образующими служат соответственно 1 или — 1 и п или —п; поэтому gn и отображение — nk исчерпывают все изоморфизмы Z—>nZ.
6)	Группа Aut(G) и даже отдельный неединичный элемент cp£Aut(G) могут служить источником важных сведений о группе G. Вот яркий пример такого рода. Пусть G—конечная группа, на которой действует автоморфизм ср порядка 2 (ср2=1) без неподвижных точек:
а Ф е => <р (а) / а.
Предположим, что <р (а) а"1 = (р (Ь) Ь"1 для каких-то a, b£G. Тогда после умножения этого равенства слева на ср(Ь)-1 и справа на а получим ср (б)”1^ (а) = Ь~1а, т. е. ср(6~xd) = Ь~1а, откуда Ьж1а = е nb = a. Итак, ф(а)а~1 пробегает вместе с а все элементы группы G, или, что равносильно, любой элементg£G записывается в виде^ = <р(а)а~1. Но в таком случае <р (g) = <p(<p(a)) Ф(ц-1) = Ф2 (а) ср (а"’1) = а(р (а)“1 = = (<р (а)	Итак, (р совпадает с отображением
Зная это, получаем аЬ = у (а-1) ср (^“1) = <р (a~1b-1)^=(a~1b'-1)~1 =Ьа, т. е. группа G оказывается абелевой! Кроме того, (G:e)—нечетное число, ибо G состоит из е и непересекающихся пар элементов gj, erl=<p(g<>-
7)	Насколько можно изменить операцию на группе, не меняя, в смысле изоморфизма, самой группы, показывает следующий пример (см. также упражнение 3 § J). Пусть G — произвольная группа, / — ее какой-то фиксированный элемент. Введем на множестве G новую операцию:
(g. ft)b^g*ft = g/ft.
Непосредственно проверяется, что (gx * g2) * g8=g1 * (&2 *£з)> т« в. операция * ассоциативна. Кроме того, g *	=	*g = g и
£*	= а это значит, что{С#*} —
6”
164
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
группа с единичным элементом = Элементом, обратным к g в (б, *}, служит g-1 = t~1g~1t~1. Отображение f: gi—>gt"1 устанавливает изоморфизм групп (б, •} и (б, *}, т. е. f (gh) = f(g)* f (h).
Все указанные примеры служат, между прочим, иллюстрацией к одному общему правилу: изучение морфизмов группы G дает значительную информацию о самой группе G.
4. Смежные классы по подгруппе. Из определения гомоморфизма f: G —> G' и из рассмотренных нами примеров видно, что все элементы множества
a Ker f = {ab |b С Ker f}, a£G,
отображаются в один и тот же элемент f (а) группы G': f (ab) = f (a) f (b) = f(a)e' = f (а). Обратно, если f (g) = f (a), TO	=	=	= откуда =
= b€Kerf и g = ab ^.aKer f. Этот факт указывает на целесообразность разбиения G на подмножества вида a Ker f. Изучим такое разбиение в общем случае независимо от гомоморфизмов.
Определение. Пусть Н — подгруппа группы G. Левым смежным классом группы G по подгруппе Н (коротко G по Н) называется множество gH элементов вида gh, где g—фиксированный элемент из G, a h пробегает все элементы подгруппы Н. Элемент g называется представителем смежного класса gH.
Аналогично определяются правые смежные классы Hg. Иногда левые смежные классы в нашем смысле называются правыми, а правые—левыми. Важно придерживаться лишь одной какой-нибудь терминологии. Если Я = Кег/— ядро гомоморфизма, то gH = Hg ввиду нормальности Н в G (см. п. 2). Заметим, что одним из смежных классов является сама подгруппа Н = Не = еН, Никакой другой смежный класс подгруппой не является. Действительно, если gH — подгруппа, то e^gH, откуда e = gh, g = h~*> и gH =
Теорема 4. Два левых смежных класса G по Н совпадают или не имеют общих элементов. Разбиение G на левые смежные классы по Н определяет на G отношение эквивалентности.
Доказательство. Пусть классы gjl и gji имеют общий элемент а = gxht = g2h2. Тогда g2=^g1h1h21, а любой элемент gji класса gji имеет вид g^h^h = gji', где
МОРФИЗМЫ ГРУПП
165
5 3]
/Г	£Н. Значит, gflczgji. Аналогично доказы-
вается, что всякий элемент из класса gji содержится в g2H, и, стало быть, grH = g2H.
Так как любой наперед заданный элемент g С G содержится в gH, то проведенное рассуждение показывает, что G представляется в виде объединения непересекаю-щихся левых смежных классов по подгруппе И:
G= {JgiH.
Согласно общему принципу, изложенному в § 6 гл. 1, это разбиение индуцирует на G отношение эквивалентности, которое определяется очевидным образом:
а ~ b фф а~гЬ С Н.
Если угодно, в рефлексивности, симметричности и транзитивности этого отношения можно убедиться непосредственно: а~а, поскольку а~Аа = е£Н; а~Ь <==> а~гЬ = h фф	£Н & b~cr, а~ b, b~c =$> b~1a^=h1,
c~^b = h2 => c~La = c~1bhi = h2h1 С H —> а ~ с. В
Аналогичное утверждение имеет место для правых смежных классов.
Разложение на смежные классы возникает естественным образом в группах перестановок. Пусть, например, G = Sn — симметрическая группа, действующая на множестве Й = {1, 2, ..., п}. Если рассмотреть совокупность Н элементов лС8„ таких, что л(п) = п, то, как нетрудно убедиться, Я —подгруппа в S„, которую можно отождествить с Sn_1. Пусть т0 = е, tz = (f/г)—транспозиция, переводящая п в i (/= 1, 2, ...,п—1). Ясно, что
= U т^8п_1.
k =0
Рассмотрим разложение 53 в левые и правые смежные классы по подгруппе <(12)> = S2:
83 = {е, (12)} U {(13), (123)} U {(23), (132)};
S3 = {е, (12)} U {(13), (132)} U {(23), (123)}.
Мы видим, чго множество левых смежных классов gS2 не совпадает с множеством правых смежных классов S2g'. Тем не менее между множествами {gH} и {Hg‘} всегда имеется биективное соответствие, при котором
x = gh£gH <-> х"^ = (zHg~\
166
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Действительно, если, например,	Tog,1=ga/i21^t
и g1H = g2H. В частности, если {е, х, у, z,...}—множество представителей левых (соответственно правых) смежных классов у то {е, х"1, у"1, z"1,...}—множество представителей правых (соответственно левых) смежных классов. Мощности этих множеств совпадают. |
Множество всех левых смежных классов G по Н условимся обозначать символом G/Н (или (G/H)h если возникает необходимость рассматривать одновременно множество (G/H)r правых смежных классов G по Н). Для мощности CardG/# этого множества используется название «индекс подгруппы Н в G» и вводится специальное обозначение (G://), хорошо согласующееся с обозначением (G:e) порядка |G| группы G (число смежных классов по единичной подгруппе). Так как отображение Н —*gH взаимно однозначно (вспомните доказательство теоремы Кэли и отображение Lg), то Card gH = (Н:е). Таким образом, имеет место легко запоминающаяся формула
(G:e) = (G:tf) (Я:е),
из которой вытекает классическая
Теорема 5 (Лагранж). Порядок конечной группы делится на порядок каждой своей подгруппы. |
Следствие. Порядок любого элемента делит порядок группы. Группа простого порядка р всегда циклическая и с точностью до изоморфизма—единственная.
Действительно, порядок любого элемента g$G совпадает с порядком порожденной им циклической подгруппы <g> (теорема 3 § 2). Если, далее, | G | = р — простое число, а Н — неединичная подгруппа, то делимость р на \Н\ означает, что \Н\ = р9 откуда H = G. Стало быть, G совпадает с циклической подгруппой, порожденной любым элементом g^e. Все циклические группы данного порядка изоморфны (теорема 1). Это дает право говорить об единственности. |
В связи с теоремой Лагранжа возникает искушение для каждого делителя т порядка п группы G искать в 6 подгруппу порядка т. Но для этого в общем-то нет оснований. Желающие могут проверить, что в знакопеременной группе порядка 12 нет подгрупп порядка 6.
Но в некоторых группах «обращение теоремы Лагранжа» справедливо. Например, имеет место
МОРФИЗМЫ ГРУПП
167
# 3J
Теорема 6. Всякая подгруппа циклической группы есть снова циклическая группа. Подгруппы бесконечной циклической группы (Z, +) исчерпываются (бесконечными) группами (mZ, +), mgN, а подгруппы циклической группы порядка q находятся во взаимно однозначном соответствии с (положительными) делителями d числа q.
Доказательство. Будем для разнообразия рассматривать произвольную циклическую группу Л = <а> и аддитивной записи. Каждый ее элемент, стало быть, имеет вид ka, где k£Z или же & = 0, 1, q—1, если А— конечная группа порядка q (см. теорему 3 § 2). Пусть В — ненулевая подгруппа в А. Если ka£B для какого-то /г 0, то и —ka£B. Среди всех элементов ka£B с положительными k выберем элемент та, где т—наименьшее.
Записав любое &>0 в виде£ = /т + г, 0^г</п, мы видим, что из ka£B следует ra = ka 1(та)£В, т. е. r = Q. Значит, В =	— циклическая группа.
Все бесконечные циклические группы изоморфны (теорема 1). Возьмем в качестве образца аддитивную группу (Z, +). В данном случае образующими служат 1 или — 1, так что по доказанному любая подгруппа в (Z, +) определяется натуральным числом т и имеет вид
mZ = <m-1> = {0, ±т, ±2т, . ..}.
Очевидно, что все эти подгруппы бесконечны.
Пусть теперь <а> = <0, а, ..., (q— 1)а>, qa = 0. Мы знаем, что В = <0, та, 2та, ... >, где т С N, причем sa £ В, sgN ==> s = mt. Утверждается, что т делитq. Действительно, пусть q = dmA-r, O^r < т. Тогда
Q = qa = d (та) + га,
откуда га = —d(ma)£B. Минимальность т влечет г = 0, и мы имеем q = dm. Таким образом,
В = {0, та, 2та, ..., (d— 1) та} = mA
— подгруппа в А порядка d. Когда т пробегает по всем положительным делителям числа q, то же самое делает d, и мы получаем ровно по одной подгруппе каждого порядка d, делящего q. |
Следствие. В циклической группе <а> порядка q подгруппа порядка d | q совпадает с множеством элементов b g <а> таких, что db = 0.
168
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Доказательство. Если dm = q, то Ь£В = тА и db = O. Обратно, пусть Ь = 1а£<а> и db = O. Из условия dla = 0 следует, что dl = qk = dmk, откуда l = mk nb=^ = la = k(ma) £тА. |
5. Мономорфизм Sn—^GL(n). Напомним, что мономорфизмом групп G—>G' называется изоморфное вложение G в G'.
Теорема 7. Существует мономорфизм f: Sn —>GL (n) такой, что матрица	имеет определитель
Ц (я)| = ел.
Доказательство. Любую матрицу (а,у) размера пхп мы запишем в виде объединения столбцов: (az/)^= = (Л(1), Л(2), ...» Д(га)). Пусть, в частности,
— столбцы единичной матрицы £. Определим отображение f: Sn—^GL(n), полагая
(л) = (£(л(1)),£(л(2)),	(1)
Таким образом, f (л) есть nxn-матрица, в каждой строке и в каждом столбце которой стоит ровно одна единица, а остальные места заняты нулями. Легко сообразить, что /(л)СОЬ(п).
Пусть о, л — произвольные перестановки, л = ат—их произведение. По определению в Z-й строке матрицы f (q) = (ais) и в /-м столбце матрицы f (т) = (bkl) отличными от нуля элементами будут соответственно а^ a-i (Z)= 1 и feT(/), i = 1. Поэтому для матрицы f (о) f (т) == (cz/) условие cZi у =# О эквивалентно о”1 (Z) = ?(/), т. е. i = Gx(j) = =л (/), а это как раз и означает, что f (a) f (x) = f (от). Следовательно, f — гомоморфизм.
Свойство Кег/ = е очевидно, поскольку непосредственно из (1) видно, что f(n)=E => л = е. Стало быть, f — мономорфизм.
Наконец, мы знаем, что определитель — кососимметрическая функция своих столбцов. Поэтому |/(л)| = =^g(£(L),..., Е{п})— кососимметрическая функция аргумен
МОРФИЗМЫ ГРУПП
169
§3]
тов Е(1>, ..., Е{п}. Из (1), определения действия Sn на g (см. (5) § 2) и из доказательства теоремы 5 § 2 мы усматриваем, что
ея|/ (л) | = ея-£(£(1), ..£’(п)) = (nog) (Е(1), ..£^) =
= g (ЕСЛ-ЧО) 9 .,. > Е(л-Чп))) _ I £(1), f Е(п> I = det Е = 1.
Стало быть, | f (л) | = ел.|
Матрицы вида /(л), JigSrt, называются матрицами перестановок. Ограничение мономорфизма f на Ап является мономорфизмом в SL(n, R). Композиция fob отображений L: G—>Sn (теорема 2) и f: Sn—>GL(m) приводит к мономорфизму G —>GL (м) для любой конечной группы G. В случае S3 отображение f выглядит следующим образом:
	1 0 0		0 1 0		0 0 1	
е<—>	0 1 0	, (12)->	1 0 0	, (13)^	0 1 0	
	0 0 1		0 0 1		1 0 0	
	1 0 0		0 0 1		0 1 0	
(23) ->	0 0 1	, (123) 1—>	1 0 0	, (132) •—>	0 0 1	
	0 1 0		0 1 0		1 0 0	
При помощи теоремы 7 легко доказывается так называемая теорема о полном развертывании определителя.
Теорема 8. Определитель
«и
Д21
det А =
«12 . . .	«1п
а22 • • •	а2п
ап1
аТ12 • • ’ апп
можно записать в виде алгебраической суммы п! произведений (называемых членами определителя)'.
det А = вл ^л(1), 1 Ящ2), 2 • • • яЯ(л),(2)
Доказательство. Обозначим через | 4(1), ..., pi), ду+.d, . .,>24(п)| определитель, получающийся из |Л| заменой столбца Л(у) с номером / на столбец E{i} единичной матрицы. Формула разложения определителя по элементам /-го столбца показывает, что для алгебраического дополнения А^ элемента aLj определителя | А | = |Л(Х), ..., Л(л)| имеется выражение в виде определителя порядкам:
Ао - | Л..., Л E(Z), 4(7+п, ...» А(п> |,
170
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
откуда снова по той же формуле получаем
det	Л(1)> • • •	А{'+"...4(w)|.
i	i
Если применить этот прием сначала при / = 1, затем (к Каждому из п слагаемых) при / = 2 ит. д., то для det Л будем иметь выражения, содержащие соответственно л, п2, и, наконец, пп определителей:
det А = 2	11E{il)’Л(2>> • • • > А{п) I=
Д(3>_____Л<«>| =
=‘ 2 Ч. 21 ЕМ..................А-п} !=•••
• • • =	5 .	1 а«Ч. 2 • • -%.«I£(,1). ЕМ> • • • >E{in} I-
11^2,
Здесь z\, /2, in пробегают любые наборы чисел 1, 2, п (в том числе с повторениями). Используя все пп различных отображений л: {1,2, .. ., п} —>{1,2, ..., п\ (см. пример 1) из п. 2 § 1), где л(1) = /1, ..., л (и) = /„, мы перепишем выражение для det Л в виде
det Л = 2	1 ^(2), 2 • • • ал(л), п | Е^», Е™», ..., Е^ |
л
(суммирование проходит по всем л). Остается заметить, что если л (/) = л (/) для каких-нибудь двух различных индексов i и /, то в определителе	£<л(«))|
два столбца совпадают и, значит, он равен нулю. Следовательно, определитель	...,	только
тогда отличен от нуля, когда отображение л взаимно однозначно, т. е. является перестановкой. Но в таком случае по теореме 7 мы имеем |Е(Я(1)), ..., Е^п^ | — = \f (л)| = ея. |
Замечание. Конечно, теорему 8 нетрудно доказать индукцией по п непосредственно, без всякого упоминания о группах, хотя знаки перед членами определителя имеют в конечном счете теоретикогрупповую природу. Теорема 7 представляет независимый интерес.
Обратим внимание на тот факт, что теорему 8 можно положить в основу теории определителей (что часто и делается). Именно, задав определитель det А формулой (2), мы получили бы все его свойства, включая формулу разложения det А по элементам первого (или /-го) столбца, которая была для нас в гл. 3 отправным пунктом.
§3]
МОРФИЗМЫ ГРУПП
171
УПРАЖНЕНИЯ
1.	Доказать, что с точностью до изоморфизма существует лишь конечное число р (п) групп данного порядка п. (Указание. Оценить сверху число различных таблиц Кэли порядка п. Формальные рассуждения с использованием теоремы 2 ограничивают р (п) числом М!\	о	гт
( различных подмножеств в Sn из п элементов. На самом деле \ п } р (п) значительно меньше, но хорошей оценки, приближающейся к точной, пока не найдено.)
2.	Используя упражнение 7 § 2, показать, что каждая конечная группа может быть вложена (т. е. для нее существует мономорфизм) в конечную группу с двумя образующими.
3.	Доказать, что в любой группе подгруппа индекса 2 обязательно нормальна. (У к а з а н и е. Разложить G по Н сначала в левые, а затем в правые смежные классы с теми же представителями.)
4.	При помощи упражнения 3 попробуйте доказать, что с точностью до изоморфизма S3—единственная неабелева группа порядка 6.
5.	Попробуйте убедиться, что на диаграмме (рис. 14) изображены все подгруппы знакопеременной группы Л4. Символом обозначена
так называемая четюрнбя группа (или группа Клейна) У4 = ^, (12)(34), (13)(24), (14)(23)}, а возле других вершин диаграммы поставлены образующие циклических подгрупп.
6.	Показать, что все группы порядка 4 абелевы и о точностью до изоморфизма исчерпываются группами перестановок U = <(1234)>,
172
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
V4 или же группами матриц:
л  и:
—! Oil 11—1 о о 1 |г И о—1
С GL (2, R),
С GL (2, R).
Выписать в явном виде изоморфизмы (7 —V4—(Указание. Если х2 = е для любого элемента x£G, то abab = e	ab =
= b~1a~1 = b (b~1)2 (a-^a — beea^ba.)
§ 4. Кольца и поля
1. Определение и общие свойства колец. Алгебраические структуры (Z, +), (Z, •) выступали у нас в качестве самых первых примеров моноидов, причем на (Z, +) мы смотрели позднее как на аддитивную абелеву (фактически циклическую) группу. В повседневной жизни, однако, эти структуры чаще всего объединяются и получается то, что в математике называется кольцом. Важный элемент элементарной арифметики заключен в дистрибутивном (или сочетательном) законе (а-]-Ь')с — ==ac + bc, кажущимся тривиальным только в силу приобретенной привычки. Попытавшись, например, объединить алгебраические структуры (Z, +), (Z, о), где пот= = n+m+nmt мы уже не заметим столь хорошей согласованности между двумя бинарными операциями. Прежде чем переходить к дальнейшим примерам, дадим точное определение кольца.
Определение. Пусть /(— непустое множество, на котором заданы две (бинарные алгебраические) операции + (сложение) и • (умножение), удовлетворяющие следующим условиям:
(К1) (Л, +)—абелева группа;
(К2) (К, •) —полугруппа;
(КЗ) операции сложения и умножения связаны дистрибутивными законами (другими словами: умножение дистрибутивно по сложению):
(a + b)c — ac-[-bc, с(а + Ь) = ca + cb
для всех a, Ь,
Тогда (К, +, •) называется кольцом.
Структура (Л, +) называется аддитивной группой кольца, а (К, •) — его мультипликативной полугруппой.
§4]
КОЛЬЦА И ПОЛЯ
173
Если (Д, •) — моноид, то говорят, что (Д, +, •)—кольцо с единицей.
Единичный элемент кольца принято обозначать обычной единицей 1. Существование 1 часто вносится в определение кольца, но мы этого делать не будем.
В приложениях и в общей теории колец (а такая теория, и притом чрезвычайно развитая, существует) рассматриваются алгебраические системы, в которых аксиома (К2) либо совсем устраняется, либо заменяется другой — в зависимости от конкретной задачи. В таких случаях говорят о неассоциативных кольцах. Пока у нас будут только обычные (ассоциативные) кольца. Это значит, что мы можем опираться на теорему 1 § 1 и не заботиться о расстановке скобок в произведении а^.. .ak любого числа k элементов кольца.
Подмножество L кольца К называется подкольцом, если
x,y£L => х—y^L и xy£L,
т. е. если L—подгруппа аддитивной группы и подполугруппа мультипликативной полугруппы кольца.
Ясно, что пересечение любого семейства подколец в Д является подкольцом (рассуждения те же, что и в случае групп) и, стало быть, имеет смысл говорить о подкольце <71>с:Д, порожденном подмножеством ТсК. По определению <Т>— пересечение всех тех подколец в Д', которые содержат Т. Если с самого начала Т было подкольцом, то <Т’> = Т.
Кольцо называется коммутативным, если ху = //хдля всех х, у С Д' (в отличие от групп, коммутативное кольцо не принято называть абелевым!)
Понятие кольца в том виде, как оно введено нами, является весьма широким. Более того, класс коммутативных колец, кажущийся на первый взгляд довольно специальным, был предметом усиленного изучения в течение многих десятилетий и в настоящее время теория коммутативных колец переплетается с алгебраической геометрией — красивой математической дисциплиной, пограничной между алгеброй, геометрией и топологией.
Примеры. 1) (2, +» •)—кольцо целых чисел с обычными операциями сложения и умножения. Множество /nZ целых чисел, делящихся на т, будет в 2 подкольцом (без единицы при т>1). Ана
174
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
логично кольцами с единицей являются Q и R, причем естественные включения Z CZ Q CZ R определяют цепочки подколец кольца R.
2)	Свойства операций сложения и умножения в Мп (R), введенные и подробно изученные нами в гл. 2, позволяют утверждать, что Мп (R) — кольцо с единицей 1=Е. Оно называется полным матричным кольцом над R, а также кольцом квадратных матриц порядка п (или размера п\п) над R. Это один из самых важных примеров колец. Так как при п > 1 матрицы, как правило, неперестановочны, то Мп (R) — некоммутативное кольцо. Оно содержит в качестве подколец кольца Мп (Q) и Mn(Z) квадратных матриц того же порядка над Q и над Z соответственно. Вообще Мп (R) насыщено всевозможными подкольцами. Время от времени некоторые из них будут возникать у нас естественным образом. Заметим еще, что можно рассматривать кольцо квадратных матриц Мп (К) над произвольным коммутативным кольцом К, поскольку при сложении и умножении двух матриц А, В£Мп(К) будет снова получаться матрица е коэффициентами из /С, а законы дистрибутивности в Мп(К) являются следствиями аналогичных законов в 'Л. Все это прямо вытекает из формальных правил действий с матрицами, подытоженных в конце пп. 1 и 3 § 3 гл. 2.
3)	Наряду с кольцом матриц в различных разделах математики широко используется также кольцо функций. Именно, пусть X— произвольное множество, К— произвольное кольцо. Пусть, далее, КХ = {Х—>К}— множество всех функций (или, что то же самое, отображений) f:X—рассматриваемое вместе с двумя бинарными операциями — поточечной суммой f+gu поточечным произведением fg, определяемыми следующим образом:
(/+g) (*)=/(*)©£(*).
(fg)(x) = f(x)Q>g(x)
(ф и 0 —операции сложения и умножения в /С). Это, очевидно, не та композиция (суперпозиция) функций, которая привела нас в случае линейных отображений к кольцу Мп. Скорее, мы становимся здесь на точку зрения, принятую в математическом анализе, когда, например, при X = R, ft = R, произведением функций tg и sin будет tg-sin: хн» tgx-sin x, а не tgosin: xh-> tg (sin x).
Без труда проверяется, что КХ удовлетворяет всем аксиомам кольца. Так, в ви у дистрибутивности* операций в К имеем
(/ W1O W = f MQh (x)®g (x)Qh (х)
для любых трех функций f, g, h£Kx и любого х£Х, а это по определению поточечных операций дает (f+g) h = fh-\-gh. Справедливость второго дистрибутивного закона устанавливается аналогично. Если 0, 1 — нулевой и единичный элементы в К, то
0х: х 0,	1 х: х н-» 1
— постоянные функции, играющие роль нуля и единицы в Кх. В случае коммутативности К кольцо функций Xх также коммутативно.
КОЛЬЦА и поля
175
§ 4]
Кольцо К содержит разнообразные подкольца, определяемые специальными свойствами функций. Пусть, например, X = [0, 1] — замкнутый интервал в R и K = R. Тогда кольцо R^0, всех вещественных функций, определенных на [0, 1], содержит в качестве подколец кольцо R^^1^ всех ограниченных функций, кольцо R^®np^ всех непрерывных функций, кольцо ^диф1^ всех непрерывно дифференцируемых функций и т. д., поскольку все отмеченные свойства сохраняются при сложении (вычитании) и умножении функций.
Каждому числу agR отвечает постоянная функция а%\ хь—>а, и отображение вложения at~^ax позволяет рассматривать R как подкольцо в R*. Словом, почти каждому естественному классу функций соответствует свое подкольцо в R\
4)	На любой аддитивной абелевой группе (Л, +) соотношением ху — 0 для всех %, у£А устанавливается структура кольца с нулевым умножением.
Многие свойства колец являются переформулировками соответствующих свойств групп и вообще — множеств с одной ассоциативной операцией. Например, атап = ат+\ (ат)п = атп для всех неотрицательных целых /и, п и всех а^Д (сравнить с соотношением (2) § 1). Другие свойства, более специфические для колец и вытекающие прямо из аксиом кольца, моделируют, по существу, свойства Z. Отметим некоторые из них. Во-первых,
а-0 = 0-а = 0 для всех	(1)
Действительно, а + 0 = а => а(а-\-0) = аа => а24-а*0= = а2 =>а2 + а-0 = аа + 0=>а-0 = 0 (аналогично 0-а = 0).
Теперь, предположив на момент, что 0=1, мы получим а = а-1 =a-Q = 0 для всех а^Д, т. е. Д состоит только из нуля. Стало быть, в нетривиальном кольце Д всегда 0 =# 1. Далее
( — d)-b = a ( — b) = — (ab),	(2)
поскольку, например, из (1) и аксиомы дистрибутивности следует
0 = а-0 = а(д — b) = ab + a(— L) =>	— Ь) = — (ab). (3)
Так как —(—а) = а, то из (2) получаем равенства (—а)(— b) = ab (например,(—1)(—1)= 1), —а — (—
Аксиома дистрибутивности имеет своим х следствием общий закон дистрибутивности п т
(а1+ • • •	1 + • • • + Ьт) = S	(4)
i = 1 / = 1
176
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
в чем нетрудно убедиться рассуждением по индукции, сначала (при т=1) по и, а затем по т. Используя теперь (1), (2) и (3), получим
п (ab) = (па) b = a (nb)
для всех n£Z и а, Наконец, отметим биномиальную формулу (бином
Ньютона)
(а + Ь)п = 2 ( П } а'Ьп~\	(5)
1= о \ 1 /
справедливую для всех а, но только в коммутативном кольце /\. При доказательстве (5) нужно, опираясь на (4), действовать так же, как и в § 7 гл. 1, где рассмотрен частный случай /< = Z.
2.	Сравнения. Кольцо классов вычетов. Согласно теореме 6 § 2 ненулевые подгруппы группы (Z, +) исчерпываются группами mZ, где т пробегает множество N натуральных чисел. Но множество mZ, очевидно, замкнуто не только относительно операции сложения, но и относительно операции умножения, удовлетворяя всем трем аксиомам кольца. Таким образом, верно следующее утверждение. Каждое ненулевое подкольцо кольца Z имеет вид mZ, где /ngN.
Попробуем теперь, используя подкольцо mZcZ, построить ненулевое кольцо, состоящее из конечного числа элементов. С этой целью введем
Определение. Два целых числа и, п' называются сравнимыми по mod/и (словами: по модулю т), если при делении на т они дают одинаковые остатки. При этом пишут п = п' (т) или п == п' (mod m), а число т называют модулем сравнения.
Получается разбиение Z на классы чисел, сравнимых между собой по modm и называемых классами вычетов по mod/n. Каждый класс вычетов имеет вид
{r}m = r + mZ= {г + mk\k^Z}9
так что
Z={OUlHlUU---U{m-lU (6)
Мы замечаем, что классы вычетов—это смежные классы аддитивной группы Z по подгруппе mZ, а разбиение
КОЛЬЦА и поля
177
§ 4]
(6) соответствует разложению из теоремы 4 § 2. По определению, п = п' (т) ФФ п— п' делится на т. Удобство записи п = п'(т) для отношения делимости т | (п — п') состоит в том, что с такими сравнениями можно оперировать совершенно так же, как с обычными равенствами. А именно, если k = k'(m) и / = Z'(m), wk ±l = k'±Г (т) и kk' еен 1Г (т).
В частности, k = k'(m) =£> ks = k's(tri) для любого s£Z.
Таким образом, каждым двум классам {k }т и {I }т9 независимо от выбора в них представителей k, /, можно сопоставить классы, являющиеся их суммой, разностью или произведением, т. е. на множестве 1т=^1т7, классов вычетов по модулю т однозначным образом индуцируются операции ф и О:
Так как определение этих операций сводится к соответствующим операциям над числами из классов вычетов, т. е. над элементами из Z, то \Zm, ф, О} будет также коммутативным кольцом с единицей 1 +mZ. Оно называется кольцом классов вычетов по модулю т. При небольшом навыке (и фиксированном модуле) индекс т опускают и пишут k вместо {k\m, так что
Йф/ = ГН, kQl = kl.
Высший этап освоения с Zm, кажущийся на первый взгляд кощунственным, но представляющий явные технические преимущества, заключается в том, что отказываются от черточек и кружочков и оперируют с каким-нибудь фиксированным множеством представителей по модулю т, чаще всего — с множеством {0, 1, 2, т—1} (оно называется приведенной системой вычетов по модулю т). Скажем, в соответствии с этим соглашением, —k = m—k9 2(m—1) = — 2 = т—2.
Итак, конечные кольца существуют. Приведем три простейших примера, указывая отдельно таблицы
178
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4.
сложения и умножения:
	+	0 1	0 1	+	0 1 2	. |0 1	2
Z2:	0	0 1	0	0 0	Z3: 0	0 1 2	ООО	0
	1	1 0	1	0 1	1	1 2 0	1 0 1	2
				2	2 0 1	2 0 2	1
+	0 1	2 3	0	1 2 3
Z4: 0	0 1	2 3	0	0	ООО
1	1 2	3 0	1	0	0 2 3
2	2 3	0 1	2	0	2 0 2
3	3 0	1 2	3	0	3 2 1
Кольцо вычетов Zm издавна привлекало внимание теоретико-числовиков, а в алгебре служило отправным пунктом для разного рода обобщений.
3.	Гомоморфизмы и идеалы колец. Отображение /: п*-*{п}т обладает в силу (7) следующими свойствами: f (k +1) = f (k)®f (Z), f (kl) = f (k)Qf (l). Это дает нам основание говорить о гомоморфизме колец Z и Zm в соответствии с общим определением.
Определение. Пусть (К, +, •) и (/С, ф, 0) — кольца. Отображение /: /С—называется гомоморфизмом, если оно сохраняет все операции, т. е. если
f(a + b) = f(a)®f(b), f (ab) — f (a)Qf (b).
При этом, конечно, f (0) = 0' и f (па) = nf (a), n£Z. Ядром гомоморфизма f называется множество
Кег/ = {«еК1Н<0 = 0Ъ
Ясно, что Kerf — подкольцо в К- Но это отнюдь не произвольное подкольцо. Действительно, если L — Ker fc/<, то L-xsL (поскольку f (lx) = f (l)Of (x) = 0'0/ (x) = O' для всех l^L) и x-LsL для всех x(EK- Стало быть, LKaL и KLa.L. Подкольцо L, обладающее этими свойствами, называется (двусторонним) идеалом кольца /С. Итак, ядра гомоморфизмов всегда являются идеалами.
Как и в случае групп (см. словарик в п. 3 § 3), гомоморфизм f:	называется мономорфизмом, если
Kerf = O, эпиморфизмом, если образ совпадает с /С:
Imf = f(K) = {a'€K' |a' = f(а)}=К',
$ 4]	КОЛЬЦА и поля	179
и изоморфизмом, если отображение f мономорфно и эпи-морфно. Факт изоморфизма колец кратко записывают в виде К =К' 
Рассмотренное выше отображение /: ш—>	является
очевидно, эпиморфизмом Z—с ядром Ker f — mZ. При построении Zm неявным образом как раз и использовался тот факт, что mZ—идеал кольца Z. Мы видим, что в кольце Z каждое ненулевое подкольцо является идеалом—случайное обстоятельство, которому нет места, скажем, уже в матричном кольце Mt(Z): множество
{б)|а’ ₽>
является подкольцом, но не идеалом в M2(Z).
Пример mZ подсказывает способ построения идеалов (возможно, не всех) в произвольном коммутативном кольце К: если а — какой-то элемент из /(, то множество аК всегда является идеалом в К. Действительно,
ах + ay = а (х + у), (ах) у = а (ху).
Говорят, что аК—главный идеал, порожденный элементом
Если брать кольца только с единицей, то идеалами будут подгруппы аддитивной группы кольца, выдерживающие умножение слева и справа на элементы кольца, а в определение гомоморфизма f: К—целесообразно внести условие /(1) = Г, При эпиморфизме это условие, конечно, автоматически выполняется.
Изоморфные кольца тождественны по своим алгебраическим свойствам, и только те свойства колец представляют подлинно математический интерес, которые сохраняются при изоморфных отображениях. Именно это обстоятельство имелось в виду, когда кольцо Zm мыслилось то как множество классов вычетов по модулю т, то как множество произвольным образом выбранных представителей этих классов.
4.	Понятие о факторгруппе и о факторкольце. Нормальные подгруппы групп и идеалы колец имеют общее происхождение—они являются ядрами гомоморфизмов. Это обстоятельство находит свое выражение и в общности конструкции факторобразований, на чем мы собираемся
180
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
вкратце остановиться. Дальнейшие подробности будут обсуждены во второй части книги.
Начнем с групп. Отношение эквивалентности ~ на группе G, определенное разложением G в смежные классы по нормальной подгруппе Н9 обладает одним замечательным свойством. Именно, если a, b — произвольные элементы группы G и а ~ с, b ~ d, то по определению (см. доказательство теоремы 4 § 3) имеем = £ Н9 Ь~Ы = /z2 С Н, откуда
=	= (cr^d = (b~yd) = h[h2^H
и, стало быть, ab ~ cd. Здесь использовано свойство нормальности Н в G:	€ Н. Итак,
а ~ с, b ~ d => ab ~ cd.
Фактически это означает, что операция умножения на группе G индуцирует операцию умножения на фактормножестве G/~ (см. п. 3 § 6 гл. 1), которое мы условились обозначать символом G/H.
Имеет смысл говорить о композиции (об умножении) произвольных подмножеств Л, В группы G, понимая под АВ множество всех произведений ab с а^А.Ь^В. Ксса-циативность в G влечет соотношение
(Л В) С = {(яЬ) с} = {а (Ьс)} = Л (ВС),
и подмножество HczG является подгруппой в G в точности тогда, когда H* = Hf H~l = {h-r\h€H\aiH.
С этой точки зрения смежный класс аН равен произведению одноэлементного множества {я} на подгруппу Н. Произведением смежных классов аН9 ЬН является множество аН-ЬН, которое, вообще говоря, не обязано быть снова смежным классом по И. Рассмотренное в п. 4 § 3 разложение S3 по Н = {е, (12)} показывает, например, что
//.(13) Н = (13) Н U (23) Н.
Совсем иная ситуация получается, когда Н — нормальная подгруппа группы G. Так как gH=^Hg для всех g£G, то
аН-ЬН = а(НЬ)Н = а (ЬН) Н = аЬН* = аЬН>
причем рассуждение, приведенное выше, показывает, что смежный класс аЬН не зависит от представителей а, b
кольца и поля
181
§ 4]
смежных классов аН, ЬН. Свойства аН-ЬН = аЬН, Н-аН = аН • Н = аН, а~'Н-аН = аН-а~1Н = еН = Н
показывают, что справедлива
Теорема 1. Если Н—нормальная подгруппа в G, то операция умножения аН-ЬН = аЬН наделяет фактормножество G/Н строением группы, называемой факторгруппой G по Н. Смежный класс Н служит единичным элементом в G/Н, а а~гН = (аН)~1—элементом, обратным к аН. |
В случае конечной группы G порядок факторгруппы G/Н определяется по формуле
не вызывающей удивления после всего сказанного и после теоремы Лагранжа (п. 4 § 3).
В случае аддитивно записываемых абелевых групп бинарная операция на G/Н вводится соотношением
(а + Н) + (& + Н) — (а + b) + Н.
Соответственно G/Н часто называют группой G по модулю Н, а в применении к паре G = Z, H = mZ употребительно также выражение «группа Z по модулю т».
Переходя к построению факторкольца К/L кольца К по идеалу L, будем исходить из того, что «основу» кольца составляет аддитивная абелева группа. Поэтому за элементы K/L следует брать смежные классы a + L (называемые классами вычетов по модулю идеала L), сложение которых осуществляется по обычному правилу:
(a + L) = (а 4-Ь) +^>	(8)
e(a + L) = — a + L.
В качестве произведения тех же классов берем
(a + L)O(b+L) = ab + L.	(9)
Важно быть уверенным, что это умножение определено правильно, т. е. не зависит от выбора представителей соответствующих классов. Пусть а' = а + х, Ь' = Ь+у,
182
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
где х9 y£L. Фогда a'b' = ab + ay + xb' ^ab-^z,
где z = ay-\-xb'£L9 поскольку L—двусторонний идеал. Поэтому а'Ь' лежит в одном смежном классе с элементом ab, а это и значит, что произведение (9) определено правильно. Для краткости положим a = a + L, так что
афЪ = а + Ь, aQb = ab.
В частности, б = £ и 1 = 1+£ (если единица 1 имеется в /<). Нужно еще убедиться, что для множества Д = Д/L ~ = {я|а(ЕД}» рассматриваемого с операциями ф, О, выполнены все аксиомы кольца, но это довольно очевидно, поскольку операции над классами вычетов в Д сводятся к операциям над элементами из Д. Скажем, дистрибутивность проверяется так:
(а ф Ь) О с = (а + &) О с = (а + Ь) с = ас + Ьс =
= ас ф Ьс = а О £ Ф Ь& с.
Все это показывает, что отображение
л:
является эпиморфизмом колец Д —► Д' с ядром Кег л = £. От частного примера факторкольца Zm = ZlniZ и эпиморфизма Z—мы пришли к аналогичной ситуации в произвольных кольцах.
Стоит заметить, хотя это и выходит за рамки нашей непосредственной цели (разъяснения конструкции Z,n с общеалгебраической точки зрения), что все гомоморфные образы кольца Д исчерпываются, по существу, фак-торкольцами Д по соответствующим идеалам. Действительно, если f: К—►Д' —гомоморфизм и f (Д) — образ К относительно f; то, рассматривая f (К) a Кг вместо Д', мы придем к эпиморфизму. Чтобы не усложнять обозначений, считаем с самого начала f эпиморфизмом, т. е. полагаем = Согласно общему принципу, изложенному в п. 3 § 6 гл. 1, f определяет отношение эквивалентности Of на Д; в данном случае Of задается разбиением Д на смежные классы а + Кег f = Са. Отображение f устанавливает биективное соответствие /' между
кольца и поля
183
§ 4]
элементами а'£К' и классами Со, а именно f'(Ca) = a', если a' = f(a). При этом
Г (Ра + Сь) = Г (Ca+b) ^f(a + b) = f(a) + f (b) =
= f'(Ca) + r (Cb),
Г (Ca-Cb) = f' (Cab) = f (ab) = f(a)-f (b) = f' (Ca) • /' (Cb),
так что биективное отображение f'— изоморфизм (для простоты операции сложения и умножения в Д, в кольце классов вычетов Д/Ker f и в Д' обозначаются одинаково:
и •).
По сути дела нами доказана
Теорема 2 (основная теорема о гомоморфизмах колец). Любой идеал L кольца К определяет (при помощи формул (8), (9)) структуру кольца на фактормножестве К/L, причем KJL является гомоморфным образом кольца К с ядром L. Обратно, каждый гомоморфный образ Д' = ДД) кольца К изоморфен факторкольцу Д/Кег /.
Замечание. Правая часть формулы (9), вообще говоря, не совпадает с произведением классов вычетов a-[-L и b-j-L в теоретикомножественном смысле. Например, при	L = 8z целое число
24g 16 + 8Z не содержится в (4 + 8%)2, поскольку (4 +8s) (44-8/) = 16м.
5.	Типы колец. Поле. В хорошо известных нам числовых кольцах Z, Q и R из ab = 0 следует, что либо а— О, либо Ь = 0. Но кольцо квадратных матриц Мп этим свойством уже не обладает. Используя матрицы (см. доказательство теоремы 3 § 3 гл. 2), мы приходим к равенствам EijEki^=Q при /=4=/г, хотя, конечно, £/7у=0 и £АгУ=0. Заметим, что Е^Е^^Е^^Ъ. Можно было бы приписать столь необычный для элементарной арифметики феномен некоммутативности кольца Мп, но это не так. Как мы видели в п. 2, в коммутативном кольце Z4 выполнено равенство 2 О 2 = 0, вопреки общеизвестной истине «дважды два — четыре».
Вот еще два примера.
Пример 1. Числовые пары (a, b)(a, Z?gz, Q или К) со сложением и умножением, определенными формулами
(Ci, bl)-\-(a2i b2) = (a1-\-a2> 61 + ^2),
(«ь ^)-(а2, b2) = (a1a2t ЬЪЬ2),
образуют, очевидно, коммутативное кольцо с единицей (1, 1), в котором мы снова встречаемся с тем же явлением; (1» 0) • (0, 1) = (0, 0) = 0.
184
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Пример 2. В кольце вещественных функций (см. пример 3 в п. 1) функции f: xi—» | х|+х и g: xi—» | х| — х таковы, что /(х) = 0 для х 0 и g (х) = 0 для х 0, а поэтому их поточечным произведением fg будет нулевая функция, хотя f 0 и g 0.
Определение. Если ab = O при а=£0 и b=^Q в кольце Д', то а называется левым, а b — правым делителем нуля (в коммутативном кольце К говорят просто о делителях нуля). Сам нуль в кольце /<=£0—тривиальный делитель нуля. Если других делителей нуля нет (кроме 0), то К называется кольцом без делителей нуля. Коммутативное кольцо с единицей 1=/=0 и без делителей нуля называют целостным кольцом (кольцом целостности или областью целостности).
Теорема 3. Нетривиальное коммутативное кольцо 1\ с единицей является целостным тогда и только тогда, когда в нем выполнен закон сокращения:
ab = ас, а=£0 Ь = с
для всех а, Ь, с£К.
В самом деле, если в К имеет место закон сокращения, то из ab = 0 = a-0 следует, что либо 6Z = 0, либо а=/=0, но Ь = 0. Обратно, если К—область целостности, то ab = ac, а=^0 =Ф а(Ь—с) = 0 => Ь — с = 0 => Ь=^с. |
В кольце К с единицей естественно рассматривать множество обратимых элементов: элемент а называется обратимым (или делителем единицы), если существует элемент аг1, для которого аа~1 = \ =а~1а. Точнее, следовало бы говорить об элементах, обратимых справа или слева (ab=\ или Ьа=1), но в коммутативных кольцах, а также в кольцах без делителей нуля эти понятия совпадают. Действительно, из ab = 1 следует aba = a, откуда а (Ьа—1) = 0. Так как а=/=0, то Ьа—1=0, т. е. Ьа=1.
Нам известно, например, что в кольце Мп обратимые элементы—это в точности матрицы с отличным от нуля определителем. Обратимый элемент а не может быть делителем нуля: ab = 0=> a~1(ab) = Q —> (а“1а)& = 0=>
1-Z? = 0 => Ь = 0 (аналогично ba = 0 => Ь=0). Неудивительно поэтому, что имеет место
Теорема 4. Все обратимые элементы кольца К с единицей составляют группу U (К) по умножению.
В самом деле, так как множество U (К) содержит единицу, а ассоциативность по умножению в /< выполнена,
§4]
кольца и поля
185
то нам нужно только убедиться в замкнутости множества U (К), т. е. проверить, что произведение ab любых двух элементов а и b из U (К) будет снова принадлежать U (К). Но это очевидно, поскольку (ab)"1 = (ab-b^cr1 = а (bb"1) ст1 = а-1 -а~1 = асг1 = 1), и, значит, ab обратим. В
Нетрудно видеть, что t/(Z) = {±l}— циклическая группа порядка 2.
Мы получим весьма интересный класс колец—так называемые кольца с делением, или тела, заменив в определении кольца аксиому (К2) на существенно более сильное условие (К2'): относительно операции умножения множество К* = /(\(0} является группой. Кольцо с делением, стало быть, всегда без делителей нуля и каждый ненулевой элемент в нем обратим. Операции сложения и умножения становятся почти полностью симметричными в коммутативном кольце с делением, которое называется полем. Итак, дадим еще раз
Определение. Поле Р—это коммутативное кольцо с единицей 1 =#0, в котором каждый элемент а=£0 обратим. Группа P* = U(P) называется мультипликативной группой поля.
Поле представляет собой гибрид двух абелевых групп — аддитивной и мультипликативной, связанных законом дистрибутивности (теперь уже одним ввиду коммутативности). Произведение ab"1 записывается обычно в виде дроби (или отношения, частного) у , которую для экономии места на бумаге изображают еще посредством косой черты а/b. Следовательно, дробь а/b, имеющая смысл только при Ь#=0, является единственным решением уравнения Ьх = а. Действия с дробями подчиняются несколь- ,
ким правилам:
4 = 4 о ad = bc о а
а , с _ad-\-bc
b ' d~~ bd 9
а— а а
а с __ас
b d bd9
b, d 0,
b, d=£0, b¥=o,	(10)
b, d=£0,
a,	b=^=0.
186
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
Это обычные «школьные» правила, но их надо не запоминать, а выводить из аксиом поля, что, впрочем, не представляет никаких трудностей. Вот рассуждения, достаточные для получения второго из правил (10). Пусть х = а)Ь и y=^c/d—решения уравнений Ьх = а и dy=-c. Из этих уравнений следует: dbx = da, bdy = bc =^> => bd(x + y) = da + bc t = х + у = (da + bc)/bd — единственное решение уравнения bdt =da + bc.
Подполем F поля Р называется подкольцо в Р, само являющееся полем. Например, поле рациональных чисел Q — подполе поля вещественных чисел R.
В случае F а Р говорят также, что поле Р является расширением своего подполя F. Из определения подполя следует, что нуль и единица поля Р будут содержаться также в F и служить для F нулем и единицей. Если взять в Р пересечение Fr всех подполей, содержащих F и некоторый элемент а£Р, не принадлежащий F, то Ft будет минимальным полем, содержащим множество {F, я} (рассуждение такое же, как для групп в п. 2 § 2). Говорят, что расширение Ft поля F получено присоединением к F элемента а, и отражают этот факт в записи Рг = F (а). Аналогично можно говорить о подполе Рг — F (а19 ..., ап) поля Р, полученном присоединением к F п элементов аи ..., ап поля Р.
Небольшая проверка показывает, что Q (1^2) совпадает с множеством чисел а-}-Ь ]/2, a, b£Q, поскольку (	2 )2 = 2 и 1/(а-|-& )^2) =
= (а/(а2—262)) —(^/(а2 — 2Ь2))]/Г2 при	/ 2 # 0. То же самое
относится к О(/з), Q (Y 5) и т. д.
Поля Р и Р' называются изоморфными, если они изоморфны как кольца. По определению /(0) = 0 и / (1) = 1' для любого изоморфного отображения f. Не имеет смысла говорить о гомоморфизмах полей, так как Кег/=#0 =$> ==> f(a) = O, а^=0 => f (l) = f (aa~L)^f (a) f (а~ъ) == = Q.f(a-^=O f (b) = f -b) = f (1) f (b) == Q - f (b) =Q, Vb => Кег/ = Р. Напротив, автоморфизмы, т. е. изоморфные отображения поля Р на себя связаны с самыми глубокими свойствами полей и являются мощным инструментом для изучения этих свойств в рамках так называемой теории Галуа.
Понятие расширения полей вполне созвучно извечному стремлению человечества увеличивать запас используемых
кольца и поля
187
§ 4)
чисел. Довольно медленный процесс, который условно изображается диаграммой: {один}-алл* {один да один есть два} -алл* N {N, 0} -алл-*- Z -алл* Q -алл* Q (]Л2) -алл* R и который продолжался вплоть до наших дней, привел к чрезвычайно разветвленной сети полей, весьма далеких от привычных числовых. Не все этапы этого процесса были чисто алгебраическими. Скажем, переход от рациональных чисел к вещественным (или действительным), основывающийся на понятии непрерывности и полноты (существование пределов у последовательностей Коши), и поныне разбирается в курсах математического анализа. В то же время совершенно аналогичная конструкция полей р-адических чисел, которой мы здесь не касаемся, и выросший на ее основе современный р-адический анализ—достойные детища трех областей—теории чисел, алгебры и анализа.
6.	Характеристика поля. В п. 2 было построено конечное кольцо классов вычетов Zm с элементами
б,	1, 2, ...» т— 1
и операциями = k-l = kl сложения и умножения (мы отказываемся от значков ф и ©)• Если m = st, s > 1, t > 1, то S't=m = 0, т. е. s и 7—делители нуля в Zm.
Пусть теперь т = р — простое число. Утверждается, что Zp—поле (из р элементов). Для р==2, 3 это прямо видно из таблиц умножения, выписанных в п. 2. В общем случае достаточно установить существование для каждого s обратного элемента s' (целые числа s и s' не должны, очевидно, делиться на р).
Рассмотрим элементы
s, 2s, ..., (р—l)s.	(11)
Они все отличны от нуля, так как s=£0(modp) => => fes^O(modp) при fe = l, 2, р—1. Здесь используется-простота р. По той же причине элементы (11) все различны: из ks = ls, k <1, следовало бы (Z—k)s=*Ot что неверно. Итак, последовательность элементов (11) совпадает с последовательностью переставленных каким-то
188
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
образом элементов
1,
В частности, найдется s', l^s'^p—1, для которого s's = 1. Но это и значит, что s'*s = l, т. е. s' — обратный к s элемент. Нами доказана
Теорема 5. Кольцо классов вычетов Zm является полем тогда и только тогда, когда т = р — простое число. |
Следствие (малая теорема Ферма). Для любого целого числа т, не делящегося на простое число р, имеет место сравнение
= J (mod р).
Доказательство. Мультипликативная группа Z*p имеет порядок р—1. По теореме Лагранжа (см. § 3) р—1 делится на порядок любого элемента из Zp. Таким образом, 1 —	т. е. тР~г—1 = 0. |
Малую теорему Ферма нетрудно доказать непосредственно при помощи теории сравнений, перемножая все элементы последовательности (11).
Поля Z2, Z3, Z6, ..., столь не похожие на известные нам поля Q, Q (1^2), R, заняли в алгебраической иерархии полей место, вполне сопоставимое по своему значению с местом, давно отведенным для Q. Дело здесь вот в чем. Пусть Р — поле. Как мы уже отмечали, пересечение П Р[ любого семейства подполей {Р, | i£l\ будет i
под полем в Р.
Определение. Поле, не обладающее никаким собственным подполем, называется простым.
Теорема 6. В каждом поле Р содержится одно и только одно простое поле Ро. Это простое поле изоморфно либо Q, либо Zp для некоторого р.
Доказательство. Допустив существование двух различных простых подполей Р', Р" с: Р, мы неизбежно придем к выводу, что их пересечение P'f]P" (очевидно, непустое, поскольку 0 и 1 содержатся как в Р’, так и в Р") будет полем, отличным от Рг и Р“. Это, однако, невозможно ввиду их простоты. Стало быть, простое подполе Рьс: Р единственно.
§4]
КОЛЬЦА И ПОЛЯ
189
В Ро наряду с единичным элементом 1 содержатся все его кратные п- 1 = 1 + ... + 1. Из общих свойств операций сложения и умножения элементов в кольцах (см. конец п. 1) следует, что
s.l + M = (s + 0-l, (s-l)(M) = (s/)-l; s, /gZ. (12)
Поэтому отображение f кольца Z в Р, определенное правилом /(n) = nl, является гомоморфизмом, ядро которого, будучи идеалом в Z, имеет вид Kerf = /nZ. Если т = 0, то f — изоморфизм, и дроби (s-1)/(£-1), имеющие смысл в Р (поскольку Р — поле), образуют поле Ро, изоморфное Q. Оно и будет простым подполем в Р.
Если же т > 0, то, очевидно, отображение /*, определенное по правилу
f*: k = {k}m^f(k),
будет изоморфным вложением	По теореме 5 это
возможно только тогда, когда т = р— простое число. Стало, быть, f*(Zp) — простое подполе в Р. |
Определение. Говорят, что поле Р имеет характеристику нуль, если его простое подполе Ро изоморфно Q; Р — поле простой (или конечной) характеристики р, если PQ^Zp. Соответственно пишут char Р=0 или char Р=р > 0.
Вместо Zp обозначением «абстрактного» поля из р элементов служит обычно или GF (р) (Galois Field —поле Галуа). Следует иметь в виду, что существует конечное поле GF (q) с q = pn элементами, где р — простое, а п — любое целое положительное число. К этому интересному вопросу мы вернемся в гл. 9, а сейчас ограничимся лишь примером поля из четырех элементов {0, 1, а, р}:
GF (4):
0 1 а Р
1 0
Р а
Р а 1 0
•	0	1	а Р
0	0	0	0 0
1	0	1	а Р
а	0	а	Р 1
Р	0	Р	1 а
0 1 а р
0
1
а
а
0
1
Чем являются аир, нас пока не интересует. Рекомендуется проверить выполнение закона дистрибутивности. Иногда нулевую характеристику называют бесконечной в соответствии с ее интерпретацией как порядка эле
190
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
мента 1 в аддитивной группе поля Р. Аналогично конечная характеристика р—общий порядок любого ненулевого элемента в аддитивной группе:
рх=х+...+х = р(1-х)=1-%+... + Ьх =
- (1 + ... + 1) х = (р. 1)х = 0.
7. Замечание о линейных системах. Настала пора окинуть мысленным взором изложенную в предыдущих главах теорию систем линейных уравнений и выросшую из нее теорию определителей. Коэффициентами в линейных уравнениях и элементами матриц у нас были числа — рациональные или вещественные, но специфика этих чисел никак не использовалась. Нет никаких препятствий к тому, чтобы взять теперь вместо чисел элементы фиксированного поля Р. При этом и результаты должны формулироваться в терминах поля Р: компоненты решения линейной системы и значения функции det будут лежать в Р. Метод Гаусса решений систем линейных уравнений, теория определителей, правило Крамера остаются справедливыми (без существенных изменений) для произвольного поля Р.
Пример 1. Пусть нам дана однородная система линейных уравнений ЛХ=0 с квадратной матрицей
12	3 4
A = (aif) =
-10 13 14 15
12 —9 14 15
12 13 —8 15
и столбцом неизвестных Х = [х1, х2, х3, х4]. Прямые вычисления показывают, что det А =23-113. Следовательно, при azy, £ Р, где Р — любое поле характеристики нуль или характеристики р Ф 2, 11 (в этом случае целые числа 1, 2, 3, 4, —10, ..15 заменяются на соответствующие классы вычетов), система является определенной и имеет только тривиальное решение Х = 0.
Если charP = 2 (скажем, P = Z2), то из сравнения
12	3 4
— 10 13 14 15
12 —9 14 15
12 13 —8 15
10 10
0 10 1
0 10 1
0 10 1
(mod 2)
мы заключаем, что ранг системы равен двум и система допускает два независимых решения Xi = [l, 0, 1, 0], Х2 = [0, 1, 0, 1]. Во избежание недоразумений следовало бы писать Xr = [I, б, 1,6], Х2 = [б, 1,0, 1 ], но мы считаем себя достаточно подготовленными к восприятию упрощенной записи.
§4]
КОЛЬЦА И ПОЛЯ
191
Если char Р.= 11, то из сравнения
12	3 4		12 3 4	
— 10 13	14 15		12 3 4	к
12 —9	14 15	=	12 3 4	(mod 11)
12 13 —8 15		12 3 4	
вытекает, что система имеет три независимых решения
Х1 = [9, 1, о, 0], Х2 = [8, 0, 1, 0], Х3 = [7, 0, 0, 1].
Как мы видим, ответ существенно зависит от рассматриваемого поля Р, но анализ системы ничем не отличается от обычного. Стало быть, одно из преимуществ перехода от R и Q к произвольному полю заключается в устранении дублирования сходных рассуждений. Но имеются к тому и более веские причины.
Говоря о полной линейной группе, мы до сих пор считали ее группой всех невырожденных матриц с коэффициентами из Q или R. Совокупность квадратных матриц размера п х п с коэффициентами в произвольном поле Р составляет кольцо матриц Мп (Р), а подмножество всех невырожденных матриц А £ Мп (Р) (матриц с det А =И=0) приводит к понятию полной линейной группы GL (n, Р) над полем Р. Варьируя поле Р, например, полагая P = F^, можно естественным путем получить ряд важных групп (см. гл. 7). _
Поля типа R,Q, 0(1^2) и пр. называются обычно числовыми полями, Поле F^—пример нечислового поля: было бы неправильным называть его элементы числами лишь на том основании, что они часто отождествляются с элементами множества {0, 1, ...,р—1}.
В § 2 гл. 1 ставилась задача (под номером 3) по использованию конечных полей в теории кодирования. Мы приведем сейчас маленький пример на эту тему.
Пример 2. Для передачи призыва МИРУ МИР в принципе достаточно повторения четырех элементарных сообщений М = (0, 0), И = (1, 0), Р = (0, 1), У = (1, 1), интерпретируемых как векторы-строки двумерного линейного пространства F2 над полем F2 = Z2 = {0, 1} из двух элементов. Но во время передачи в канале связи возникают помехи (замены символа 0 на 1 или 1 на 0), в результате которых на приемный конец канала может прийти, например, сообщение РИМУ РИМ. Согласно фундаментальной теореме Шеннона, за счет увеличения длины элементарных сообщений (т. е. за счет скорости передачи) влияние помех устранимо. Пусть, скажем, из условий передачи известно, что'в каждом элементарном сообщении длины пять происходит не более одного искажения. Возьмем тогда в линейном простран-
192
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
[ГЛ. 4
стве S=fI подмножество 50 = {М = (0, 0, 1, 1, 0), И = (1, 0, 0, 1, 1), Р = (0, 1, 1,0, 1), У = (1, 1, О, 0, 0)} так называемых кодовых векторов. Из таблицы
Кодовые векторы	00110	10011	01101	1 1000
Векторы, получаемые из	00010	00011	00101	01000
кодовых векторов в ре-	00100	10001	01001	10000
зультате искажения	00111	10010	01100	11100
	01110	10111	ОПП	11001
	10110	поп	11101	пою
видно, что множества искаженных векторов из разных столбцов не пересекаются, и, стало быть, возможно правильное декодирование, т. е. восстановление истинного сообщения.
Мы получили код So, исправляющий одну ошибку. Переходя к пространствам F” достаточно большой размерности п, можно сконструировать аналогичный код, способный безошибочно передать весь русский алфавит, т. е. любой текст. Чтобы декодирование не свелось к длительному и очень медленному перебору, So приходится выбирать специальным образом. Для этого существует множество приемов, в том числе и чисто алгебраических, основанных на использовании конечных полей
УПРАЖНЕНИЯ
1.	Развивая идею примера 2) из § 1, показать, что множество (Q) с операциями
А + В = (А U В)\(А П В),	=	А, В £ Q,
является кольцом с единицей, все элементы аддитивной группы которого имеют порядок два.
2.	Установить коммутативность произвольного кольца, в котором каждый элемент х удовлетворяет уравнению х2 = х. Верно ли это при условии х9 = х?
3.	Изоморфны ли поля 0(]/2), 0(}^5)?
4.	Образуют ли идеал необратимые элементы кольца: 1) Zle; 2) Z24?
5.	Показать, что эпиморфный образ коммутативного кольца является коммутативным кольцом.
6.	Если А —кольцо с единицей и L—идеал, то факторкольцо К/L тоже имеет единицу.
7.	Любое конечное целостное кольцо К является полем.
КОЛЬЦА и поля
193
§ 4]
8.	Пусть р — простое число и К — коммутативное кольцо с единицей такое, что рх = 0 для всех х £ К. Показать, что тогда
(х+у)рт=хрт+урт, zn=l,2, ...
(Указание. Использовать индукцию по т и то обстоятельство, что биномиальный коэффициент , 0 < k < р, делится на р.)
9.	Доказать, что кольцо /С, состоящее из пяти элементов, либо изоморфно Z6, либо является кольцом с нулевым умножением.
10.	Множество Т =	[ a, b £ верхних треугольных мат-
риц образует подкольцо в M2(Z)< Убедиться в этом и дать описание идеалов кольца Т.
11.	Элемент х 0 кольца К называется нильпотентным, если xzz = 0 для некоторого и £ N. Показать, что:
(i)	нильпотентность элемента х влечет обратимость элемента 1— х в любом кольце с единицей;
(ii)	кольцо ZCT = Z//nZ содержит нильпотентные элементы в точности тогда, когда т делится на квадрат натурального числа > 1.
12.	Доказать, что в коммутативном кольце К с единицей и бесконечной мощности | К | не может быть конечного числа п 1 необратимых элементов 0. (Указание. Использовать рассуждение от противного. Пусть N — {ах, ..., ап} — множество всех 0 необратимых элементов кольца /С. Отображение рх: и-» хсц является биекцией N—> N для любого х g Л\(А^ U {0})- Ядро Кегр отображения р: хн->рд. бесконечно.)
13.	Пусть К— произвольное ассоциативное кольцо с единицей 1 и а, Ь—его элементы. Показать, что
(1 — ab) с= 1 =с (1 — ab) => (1 — ba) d = 1 — d (1 — ba), где d=l -\-bca, т. е. обратимость 1 — ab в влечет обратимость 1—Ьа> Чему равен элемент 1 +adb?
14.	Показать, что матрицы |_с a, b £ Z3 образуют поле
из 9 элементов и что мультипликативная группа этого поля — циклическая, порядка 8.
15.	Способен ли код So (из примера 2 в конце параграфа) исправить две ошибки?
7 А. И. Кострикин
Глава 5
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
В этой главе будут рассмотрены вполне конкретные алгебраические системы, частично известные из школьной математики, но заслуживающие того, чтобы остановиться на них несколько подробнее. Точка зрения, выработанная в предыдущей главе, позволит нам бросить свежий взгляд на традиционное «поле деятельности» алгебры прошлых веков. В то же время на примере многочленов станут более понятными и осязаемыми такие проблемы, как расширение колец и однозначность разложения на простые множители в целостных кольцах (областях целостности).
§ 1.	Поле комплексных чисел
Упорством, достойным лучшего подражания, в истории математики отмечена длительная борьба сторонников и противников «мнимых» чисел, источником которых служит алгебраическое уравнение
х2+1-0.	(1)
Можно занять упрощенную позицию и ограничиться формальной записью решений уравнения (1) в виде —1. Но такое не мудрено было сделать и в более далекие времена; оставалось лишь придать смысл указанной записи. Мы будем решать эту задачу на разных уровнях. Вначале приведем некоторые эвристические соображения.
1.	Вспомогательная конструкция. Нам хочется расширить поле вещественных чисел R так, чтобы в новом поле уравнение (1) обладало решением. Моделью такого расширения может служить множество Р всех квадратных матриц
(2)
Утверждается, что Р — поле (сравнить с упражнением 14 § 4 гл. 4).
§ 11
ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ
195
В самом деле, в Р содержатся нуль 0 и единица Е кольца Ma(R).
Далее из соотношений
а *1Ш	с d|		а-{-с b -]- d II
-ь а|| + |	—d с|	—	— (64-d) а+с||’
	I а b		1	— а — 611
	| — b а		|-(-6) -а||’
Ii а *111	с d		ас—bd	ad-}-be
II-b а (И	— d с		-(ad-}-be) ac—bd
(3)
вытекает замкнутость Р относительно операций сложения и умножения. Ассоциативность этих операций является следствием их ассоциативности в М2. То же самое относится и к законам дистрибутивности. Таким образом, Р—подкольцо в М2. Осталось доказать существование в Р матрицы, обратной к любой матрице (2) с определителем |_£	| = а2 + Ь2 0 (коммутативность Р выте-
кает из формул (3)). Прямо по формуле для коэффициентов обратной матрицы (см. теорему 1 § 3 гл. 3) или путем решения линейной системы
ах—by — 1, bx + ау = О,
возникающей из условия
IU «114
И ?!
находим, что
II а b|| -1 II с d\\	а «	— Ъ
II —& а|| — II— d с || * ГДе C~a2+b2’ d~a2+b2'
(4)
Используя правило (5) § 3 гл. 2 умножения матриц на числа, мы любой элемент поля Р запишем в виде
Щ *|| = aE + bJ, где a, b^, J=|_, J|. (5) Поле Р содержит подполе {аЕ \ а € R} R, а соотношение J2 + E = q
показывает, что элемент J g Р «с точностью до изоморфизма» является решением уравнения (1). Ни о какой мистике вокруг «мнимой величины J» здесь не может быть и речи.
196
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
Не поле Р, однако, называется полем комплексных чисел, а некий изоморфный ему объект, элементы которого изображаются точками плоскости. Желание иметь геометрическую реализацию поля Р не случайно, если вспомнить, что и поле R для нас не отделимо от «вещественной прямой» с фиксированной на ней точкой, изображающей 0, и фиксированным масштабом, определяемым положением числа 1.
2.	Комплексная плоскость. Итак, мы хотим построить поле С, элементы которого были бы точками плоскости R2, а сложение и умножение точек, подчиняясь всем правилам операций в поле, решали бы нашу задачу. Выберем на декартовой плоскости прямоугольную систему координат с осью абсцисс х и осью ординат у. Будем писать (а, Ь) для точки с абсциссой а и ординатой Ь. Для точек (а, Ь) и (с, d) определим сумму и произведение по правилам
(а, Ь) + (с, d) = (а + с, b + d), (a, b) (с, d) = (ac—bd, ad-\-bc)
(6)
(использование тех же знаков +, •, что и в поле R, не должно приводить к путанице). Прямая, но довольно утомительная проверка убедила бы нас в том, что так определенные операции наделяют множество пар (точек плоскости) строением поля с нужными свойствами. В этой проверке, к счастью, нет необходимости. Сопоставление
HU ‘II
точкам плоскости С элементов построенного ранее поля Р и беглый взгляд на формулы (3) и (6) убеждают нас в том, что мы имеем дело с изоморфизмом и что, следовательно, множество С является полем. Оно и называется обычно полем комплексных чисел. Имея в виду геометрическую реализацию этого поля, С называют еще комплексной плоскостью.
Выбранная нами ось абсцисс, т. е. множество точек (а, 0), ничем не отличается по своим свойствам от вещественной прямой, и мы полагаем (а, 0) = а. Нуль (0, 0) и единица (1, 0) поля становятся при этом обычными вещественными числами. Для точки (0, 1) на оси ординат
§ 1]
ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ
197
вводится по традиции обозначение i «мнимой единицы», являющейся корнем уравнения (1): i2 = (0, 1) (0, 1)= ~ (—1 ,0) = —1. Произвольное комплексное число z = (х, у) запишется теперь в привычном виде
? = х + й/, х, у£ R,
(7)
весьма близком к виду (5) элементов поля Р. Заметим, что Q о: R cz С. Поэтому С — поле нулевой характеристики (см. п. 6 § 4 гл. 4).
3.	Геометрическое истолкование действий с комплексными числами. Ось абсцисс комплексной плоскости обычно
называется вещественной (или действительной) осью, ось ординат— мнимой осью, а числа iy. лежащие на ней,— чисто мнимыми числами, хотя слово «мнимое» и утратило свой первоначальный смысл. Соответственно в записи (7) х — вещественная часть, а iy—мнимая часть комплексного числа г. Рассмотрим отображение, которое сопос-
Рис. 15.
тавляет каждому комплексному числу г = х + iy комплексно сопряженное с ним число z = x— iy (операция комплексного сопряжения). Геометрически оно сводится к отражению комплексной плоскости относительно вещест
венной оси (см. рис. 15). Весьма примечательно, что спра-
ведлива
Теорема 1. Отображение z\—>z является автоморфизмом порядка 2 поля С, оставляющим на месте все вещественные числа. Сумма и произведение комплексно сопряженных чисел являются вещественными числами.
Доказательство. Утверждение х = х. xgR, очевидно из определения комплексно сопряженного числа. В частности, 0 = 0 и 1 = 1. Столь же очевидно утверждение о порядке: (z) = z. Нам остается проверить соотно
шения
21 +	+ z2, z±z2 = zvz2.
(8)
198
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
но они следуют прямо из формул (6), которые нужно только переписать в виде
(•^14” ^//i) 4- (*^2 Ч/2)= (*^14~ х2) 4“ J (У14- у2)>	/д\
(^i 4” iy%) * (-^2 4- iy2) — (^1^2 У1У2) 4~ i (-^1^2 4-	•
Частным случаем формул (9) является утверждение о сумме и произведении числа z = x+iy и комплексно сопряженного с ним числа z: z-\-z = 2x, zz=--x2 + y2. |
Замечание. Автоморфизм г 1—>z выделяется среди многих других автоморфизмов поля С тем, что он—единственный непрерывный автоморфизм (переводящий близкие точки плоскости С в близкие). Мы не уточняем и не доказываем это утверждение.
Модулем (или абсолютным значением) комплексного числа z — x-\-iy называется неотрицательное вещественное число |z| = j/ zz =Ух2+у2. Положение точки z на плоскости, как известно, вполне определяется заданием ее полярных координат: расстояния г = | z | от начала координат до г и угла ср между положительным направлением оси абсцисс и направлением из начала координат на z (см. рис. 15). Угол (р называется аргументом числа z и обозначается символом arg z= ср = arctgy/x. По определению argz может принимать любые положительные и отрицательные значения, но при заданном г углы, отличающиеся на целое кратное 2л, соответствуют одному и тому же числу. Аргумент не определен для числа 0 с модулем 101 = 0. Отношения «больше» или «меньше» бессмысленны в применении к комплексным числам, т. е. их нельзя соединять знаком неравенства: в отличие от вещественных чисел, аргумент которых принимает лишь два главных значения 0 (положительные числа) и л (отрицательные числа), комплексные числа не упорядочены.
Полярные координаты г и ср определяют х и у по известным формулам
x = rcosq?, y = r sin ср, z = r (cos ср + г sin ср). (10) Это так называемая тригонометрическая форма числа z. Операция сложения комплексных чисел z, z' просто выражается в декартовых координатах, а именно — по правилу параллелограмма, или, что равносильно, по пра-
$ 1]
ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ
199
вил у сложения направленных отрезков (векторов), выхо-
дящих из начала координат и соответствующих числам г, г' (см. рис. 16). Из этой же картинки, сравнивая стороны треугольника с вершинами в точках 0, г и z4-z' (и отождествляя абсолютные значения с соответствую-
щими геометрическими длинами), получаем важное не-
равенство
|^ + z'|<|z| + |z'|. (И)
Заметим, что неравенство (И), которое можно было бы записать в более общей форме
И—I2' KI 2±2' К121 + 12'Ь
совершенно аналогично соответствующему неравенству
для вещественных чисел.
Операция умножения комплексных чисел удобно выра-
жается в полярных координатах.
Теорема 2. Модуль произведения комплексных чисел z, z' равен произведению модулей, а аргумент—сумме аргументов множителей
|zz' | = |z|-|z' I, argzz'= argz4-argz'. (12)
Аналогично | z/z' | = | z |/| z' |, arg z/z'= arg z—arg zr. Доказательство. Действительно, пусть тригонометрической формой (10) для z и z' будет
2 —г (cos ср 4- i sin ср), z' = г' (cos ср' + i sin ф').
Непосредственным умножением или же по формуле (9) получаем
zz' = г г' [(cos ф cos ср' — sin ф sin ф') +
4- i (cos ф sin ф' 4- sin ф cos ф')], а это соотношение при помощи известных формул приводит к тригонометрической форме числа zz':
zz' — | z | • | z' | • [cos (ф 4- ф') 4- i sin (ф 4- ф')].
200
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
Если, далее, z" = z]z', то z = z'z'. Поэтому, используя доказанные формулы (12) для произведения z'z”, мы получим из них формулы для дроби z/z'. |
В частности, z"x = |z|”1 [cos(— ф) + г sin (—ср)]. Чтобы получить г”1 на комплексной плоскости (см. рис. 17),
надо, следовательно, применить к z инверсию относительно окружности единичного радиуса с центром в 0 (это даст точку z'), а затем — отражение относительно вещественной оси (или автоморфизм z'h-»z').
Фактически утверждения о модуле произведения и модуле суммы легко вытекают без обращения к геометрической интуиции из теоремы 1. В самом деле, во-первых,
| zzr |2 = zz'zz' = 22'22' = 22-2'2' =
= |z|2|z' I2,
откуда [ 22' I = I 2 I • I 2' |. Далее, заметив, что | z | = J/A2 4- г/2	}Ас2 —
= | х |, мы получаем
|1+z|2 = (1+z)(1+7) = 1+(z+7) + z7=
= l+2x+|z|2<l+2|z| + |z|2 = (l+|z|)2,
откуда | 1 4-z | «С 1 + | z |. Если теперь z 7= 0 и z'‘ ф 0, то
|z + z' | = | z (1 -f-z-V) I = | 2 I-1 l+z-^' |<
C| 2 |.(1 + 1	|) = | 2 I (1 + | 2 |-i I 2' |) = | z Ц-l z' |.
Из полученных результатов мы можем извлечь некий общий принцип: обычная форма (7) комплексных чисел приспособлена к выражению их аддитивных свойств, а тригонометрическая форма (10) — к выражению мультипликативных свойств. Нарушение этого принципа приводит к чрезвычайно сложным формулам, затуманивающим суть дела.
4. Возведение в степень и извлечение корня. Из формулы (12) для умножения комплексных чисел, заданных в тригонометрической форме, вытекает так называемая формула Муавра
[г (cos ф + i sin ф)]л = rn (cos пф + i sin пф), (13)
§ 1]
ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ
201
справедливая для всех (в иной записи: |z«| = |z|'2, argzn = n-argz). Частный случай формулы (13) при г = 1, биномиальная формула (1) § 7 гл. 1 и соотношения
f2 = —1, i3 = —f4=l,	=
дают возможность получить выражения синусов и косинусов кратного угла:
cosncp=	cosft“2*(p-sin2*(p,
k>0
sin nep = у (—cos"“1“2*cp-sin2*+1 <p. о
(14)
Справедливости ради стоит заметить, что частным случаем формул (14) при п = 2 мы воспользовались ранее — в ходе доказательства теоремы 2.
\ п
1 -]— j . В анализе доказы-
вается, путем разложения функций комплексной переменной в степенные ряды, формула Эйлера'.
= cos ср-Н sin <р,	(15)
из которой вытекают все полученные нами результаты. Стоит только заметить, что
(ф + ф<)	(е/ф)л = /Лф
Тригонометрическая форма комплексного числа г сводится к записи ? = | г |-?ф.
Далее, мы хотели бы научиться извлекать корни произвольной степени из комплексных чисел, и основной вопрос, который здесь возникает—а всегда ли это можно делать? Оказывается, что всегда, и формула Муавра дает, по существу, полное решение этого вопроса. Пусть нам дано комплексное число z = r (соэф + г sin ф), а мы хотим найти число z'= г'(cos ф'+ Z sin ф') такое, что (г')л=г. Выражая (г')л по формуле Муавра, а затем сравнивая в обеих частях равенства (?')л = z модули и аргументы, мы находим (г')л = г и мф' = ф + 2л/г (слагаемое 2irtfe — плата за неполную определенность аргумента). Итак,
г'=У7, ф'=1₽±^
v * v п
202
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
(ГЛ. 5
(под г подразумевается арифметическое значение корня п-и степени из положительного вещественного числа). Корень У z, стало быть, существует, но определен неоднозначно. При k = 0, 1, ..., п—1 для z' будет получено п различных значений, причем ими исчерпываются все корни, поскольку из k = nq-\-r, Q^r^n—1, следует

Нами доказана
Теорема 3. Извлечение корня п-й степени из комплексного числа г = | z | (cos ср + i sin <р) всегда возможно. Все п значений корня п-й степени из г расположены в вершинах правильного п-угольника, вписанного в окружность с центром в нуле и радиуса z |:
i/7=/|7r(cos^“+<sin’±^),	(16)
« '1 I, . . п— 1. I
Следствие. Корни п-й степени из 1 выражаются формулой
ут = е=соз — -Hsin —, 6 = 0, 1.п — 1. (17)
И	к	п 1	п ’	’	v '
Они расположены в вершинах правильного п-угольника, вписанного в окружность с центром в нуле и радиуса 1. |
Из (16) и (17) непосредственно видно, что вещественных корней z будет ноль, один или два, а корней д/1—один или два.
Корень п-й степени из 1 называется примитивным (или первообразным), если он не является корнем из 1 никакой меньшей степени. Таковыми будут, например,
е = e1 = cos-И * sin— и
1 п ' п	11 1
Любой другой корень ek является степенью примитивного eA==ef,
что опять-таки видно из формулы Муавра. Более того, 8Аег = еА+г, если k + l брать по модулю п. В частности, е£г = е„_А, е0=1. Уже искушенные в теории групп, мы
§ 1]	ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ	203
замечаем, таким образом, что корни п-й степени из 1 составляют циклическую группу <е> порядка п.
Тем самым получена еще одна реализация циклической группы порядка п. По теореме 6 § 3 гл. 4 все ее подгруппы находятся во взаимно однозначном соответствии с положительными делителями d числа п. Для каждого d\n в <е> имеется ровно одна подгруппа (ed ) порядка d. Корень ет будет примитивным тогда и только тогда, когда <gOT> = <e>, т. е. Card <е/л> = и, а это возможно только при т, взаимно простом с п. Например, при п=12 примитивными корнями будут е, е5, 87, е11. В случае простого п = р все корни из единицы, отличные от 1,— примитивные. С алгебраической точки зрения, без учета геометрического изображения, все примитивные корни данной степени п равноправны.
Возвращаясь к вопросу об извлечении корня степени п из произвольного комплексного числа z=#0, заметим, что если г' — какой-нибудь фиксированный корень ^скажем, z' = ^cos-—-Н, то все другие корни имеют вид z'&k, /г = 0, 1, ..., п — 1. Это утверждение находится в соответствии с формулой (16).
5. Теорема единственности. Преимущество поля С перед IR мы сможем оценить полностью лишь впоследствии, но уже один тот факт, что С содержит все корни из 1, оправдывает повышенный интерес к комплексным числам. Возникает естественный вопрос, насколько широко семейство полей, обладающих аналогичными свойствами. Оказывается, что справедлива следующая теорема единственности поля комплексных чисел.
Теорема 4. Пусть К—поле, изоморфное R (в частности, /С = К), Р—расширение, получающееся из К присоединением корня j уравнения х2 4-1=0. Тогда Р изоморфно С.
Доказательство. По определению, данному в п. 5 § 4 гл. 4, Р = К (J)— минимальное подполе некоторого поля F, содержащее Д’ и j. Так как поле F дано, то мы можем рассматривать элементы вида а + jb с a, b g /<, где произведение и сумма понимаются в смысле операций, определенных в F. Различным парам а, b£I\ соответствуют различные элементы a + jb, поскольку
204
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
в противном случае нашелся бы равный нулю элемент a'+jb' с а'У=0 или Ь' У=0. Если Ь' = 0, то, очевидно, и а' = 0. Если же Ь' =£0, то получаем ] = — а'/b' что абсурдно:	а в R уравнение х2 +1 = 0 нераз-
решимо; стало быть, Используя только равенство j2 =—1 и действуя в поле F, мы получим формулы
(«1 + А) + («2 + jb2) = (а, + а2) + /	+ &2),
(«х + /\) • A +/А) = (ОА—Мг) +1 («А + аг\)-
Кроме того,
(a + /b)-1 = s^24-/^^5 при а2 + 62¥=0.
Это показывает, что множество {a + jb\a, Ь£Д}, содержащееся в Р, замкнуто относительно всех операций ц F и образует, следовательно, поле. Ввиду минимальности Р имеет место равенство
P = {a + jb\a, b£K}.
Далее, формулы (18) в точности совпадают с формулами (9).
Если f: К—>R—данный нам изоморфизм, то отображение
/*: a + jb^(f(a), f (b)),
сопоставляющее элементам поля Р точки комплексной плоскости С с координатами / (a), /(b), будет по вышесказанному изоморфизмом полей Р и С. |
Одно поле Р, содержащееся в М2, мы рассматривали в п. 1. Но таких полей существует, конечно, сколь угодно много (в следующем параграфе будет приведена еще одна конструкция). По доказанному они все изоморфны. Заметим, что в формулировке теоремы 4 следовало бы писать х2+Г = б, где Т, б—единичный и нулевой элементы поля Д. Скажем, в поле Р а М2 мы имеем J2 + 1 =б, где 1 = Е и б — нулевая матрица.
В поле С, кроме Q и R, содержится много других подполей. Особенно интересны расширения поля Q, получающиеся присоединением какого-либо элемента из С, не содержащегося в Q.
§ 1]	ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ	205
Пример (квадратичное поле). Пусть d—отличное от нуля целое число, возможно отрицательное, такое, что У d^Q. Поле Q ( У d) cz С называется вещественным квадратичным при d > 0 и мнимым квадратичным полем при d < 0. О поле Q (упоминалось в § 4 гл. 4. Рассуждение, дословно повторяющее ход доказательства теоремы 4, если заменить там / на У d, а соотношение /2=—1 на (У^ d)2 = d, показывает, что
Q(/”2) = {a + & У~д | a, b С Q}-
В частности, формулы (18) переписываются в виде
(#i + &i / d) Н-(а2 + ^2 У d) — (ai + а2) + (^i + ^2) V~d,	qgj
(#1 + ^1 P<^)(^2~h^2 Г d) = («1^2 + b^b2d) 4- (агЬ2 + a2bi) У^ d.
Далее,
(а + & ]/~3) 1 = a2 — db2+a2—db2
при а-}-Ь УН 7= 0 (т. е. при а и &, одновременно не равных нулю).
Пользуясь (19), легко проверить, что отображение
f: a + b y'l^a — b V"d
является автоморфизмом поля Q (У~Э) (аналог комплексного сопряжения). Нормой числа а = а-\-Ь Уd называется число
N (а) = а2 — db- — af (а).
Очевидно, что 7V(a) = 0 ФФ а = 0. Далее, так как / — автоморфизм, то
N (сф) = аР/ (ар) = ар/ (а) / (Р) = а/ (а) • Р/ (р) = Н (a)-N (Р).
В частности, 7V (а)-М (а_]) =/V (аа”1) —/V (1) = 1. Поэтому норма обладает существенными свойствами (квадрата) модуля в поле С.
УПРАЖНЕНИЯ
1.	Найти все комплексные числа z, по модулю равные 1, при которых г2 + (1 +0 z принимает чисто мнимые значения. Изобразить соответствующее геометрическое место точек на плоскости С.
2.	Что можно сказать о поле R (б), которое получено из R. присоединением комплексного числа д, удовлетворяющего равенству б4 = —1?
3.	Пусть А, В g Мп (IR). Опираясь на теорему 1, доказать, что det (А + iB) = det (Л — iB) (черта означает сопряжение).
4.	Пусть А, В £ Mn(R),
с=|з “лЦе'»-»-
206
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
Применяя к вещественной матрице С элементарные преобразования первого и второго типа над полем комплексных чисел С, показать, что
det С = | det (A + iB) |2.
5.	(Г. Полна и Г. Сеге). Используя упражнения 3 и 4, дать объяснение следующему «странному» факту. Однородная квадратная линейная система
^пг1 + • • • + ^mzn =
.................... (*) dnizi + • • • + dnnZn — 0
с комплексными коэффициентами ^z = aAz + r^Az и неизвестными = имеет нетривиальное решение (zlf .... z„) в точности тогда, когда det (dkj) = а + ib — 0 (см. общие замечания по этому поводу в п. 7 § 4 гл. 4). Это условие приводит к двум уравнениям а = 0, Ь — 0, связывающим 2п2 вещественных величин а^, Ьм- С другой стороны, систему можно представить в виде системы 2п линейных однородных уравнений с 2п вещественными неизвестными xh yi- Теперь условие нетривиальное™ решения запишется в виде равенства нулю одного вещественного определителя размера 2пх2п, что даст лишь одно уравнение между Ь^. Как согласовать между собой эти два результата?
6.	Имея в виду, что автоморфизмы квадратичного поля Q (К d) должны оставлять на месте рациональные числа, найти автоморфизмы этого поля. (Ответ. Единичное отображение и a-\-b pCdi—> ^a-b /”2)-
7.	Чему равна сумма всех корней степени п > 1 из 1? Что можно сказать о сумме примитивных корней степени 12 и степени 15 из 1?
8.	Найти и изобразить геометрически ядро и образ отображения (R, +)—>(!&*, •), С* = С\{0}, определенного соответствием (см. формулу (15)).
§ 2. Кольцо многочленов
Наряду с линейными системами, рассмотренными нами в гл. 2 и 3, многочлены составляют старый и хорошо изученный раздел традиционной алгебры. На языке многочленов формулируются или решаются самые различные задачи математики. Тому есть множество причин, и одна из них заключается в свойстве универсальности кольца многочленов, на чем мы коротко остановимся в пп. 1, 2.
§ 2]	кольцо МНОГОЧЛЕНОВ	207
Пусть —коммутативное (и, как обычно, ассоциативное) кольцо с единицей 1, А—некоторое его подкольцо, содержащее 1. Если t С /С, то наименьшее подкольцо в /<, содержащее А и t, будет, очевидно, состоять из элементов вида
а (0 =	+ <М2 + • • • + antn,	(*)
где as g А, п gZ, 0. Мы обозначим его символом А [/] и назовем кольцом, полученным из А присоединением элемента t, а выражение (*) — многочленом от t с коэффициентами в А. Что понимать под суммой и произведением многочленов, видно из простейших примеров:
я (/) + b (/) = (а0 + a-J + а2Р) + (&0 +	+ ^2) ~
— (#0 + Ь0) + (#1 + ^1) t + (#2 + ^2) ^2> a(tyb (0 = а Д + (а*Ьл + а Д) t +
+ (аД + а1Ь1 + аД) t2 + (a1b2 + a2bj t* + a2b2 .
Очевидно, что приведение подобных членов основано на попарной перестановочности всех элементов ah bJt tk.
Теперь самое время вспомнить, что I — наугад взятый элемент кольца /<, и поэтому внешне различные выражения (*) могут на самом деле совпадать. Если, скажем, Л = О, /=1^2, то /2 = 2 и /3 = 2/—соотношения, которые никоим образом не вытекают из формальных правил. Чтобы прийти к привычному понятию многочлена, необходимо освободиться от всех таких побочных соотношений, для чего под t следует понимать произвольный символ, не обязательно содержащийся в %. Он призван играть чисто вспомогательную роль. Гораздо большее значение имеют правила, по которым составляются коэффициенты выражений a(t) + &(/), a (t)b(t). Имея в виду эти предварительные замечания, перейдем к точному определению алгебраического объекта, называемого многочленом, и собрания таких объектов—кольца многочленов.
1.	Многочлены от одной переменной. Пусть А — произвольное коммутативное кольцо с единицей. Построим новое кольцо В, элементами которого являются бесконечные упорядоченные последовательности
/ =	/1. Л, •••).	(1)
208
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
такие, что все fit кроме конечного их числа, равны нулю. Определим на множестве В операции сложения и умножения, полагая
f + g=(f<>, fl, fz, •••)+(g0, gl, gz, •••) =
= (fo + go, fl+gl, fz + gz, •••)> f-g = h = (h9, hv ht, ...),
где
ЙА= 2 fig;, 6 = 0, 1, 2, ... i + j = k
Ясно, что в результате сложения и умножения получаются снова последовательности вида (1) с конечным числом отличных от нуля членов, т. е. элементы из В. Проверка всех аксиом кольца (см. § 4 гл. 4), кроме, разве, аксиомы ассоциативности, очевидна. В самом деле, поскольку сложение двух элементов из В сводится к сложению конечного числа элементов из кольца А, (В, +) является коммутативной группой с нулевым элементом (0, 0, 0, ...) и элементом —/ = (—/0, —f19 —f2, ...), обратным к произвольному / = (/0, /и	Далее,
коммутативность умножения следует непосредственно из симметричности выражения элементов hk через и gj. Это же выражение показывает, что в В выполнен закон дистрибутивности (f + g) h = fh.'A' gh. Что касается ассоциативности операции умножения, то пусть
f = fz, •••). g=(g„,gi, gz, •••). h = (h0, hlt h2, ...) — три произвольных элемента множества В. Тогда fg = = d = (d0, dv d2, ...), где dt= 2 figj, l = ®, 1, 2, ....
i + j=l
a (/g)6 = d6 = e = (e0, elt e2, ...), где es = 2 d(hk = l + k=s
= z 2=s (. 2=z figj ^hk = .+^k=s figihk- Вычисление f (gh) дает тот же результат. Итак, В — коммутативное ассоциативное кольцо с единицей (1, 0, 0, ...).
Последовательности (а, 0,0, . ..) складываются и умножаются так же, как элементы кольца А. Это позволяет отождествить такие последовательности с соответствующими элементами из Л, т. е. положить а = (а, 0, 0, ...) для всех а^А. Тем самым А становится подкольцом
§ 2]	КОЛЬЦО МНОГОЧЛЕНОВ	209
кольца В. Обозначим далее (0, 1, 0, 0, через X и назовем X переменной (или неизвестной) над А. Используя введенную на В операцию умножения, находим, что
Х = (0, 1, 0, 0, ...),
X2 = (0, 0, 1, 0, ...),
Хп = (0, 0....0,	1,0, ...).
Кроме того, ввиду (2) и ввиду включения АсВ имеем (0, 0,	0, а, 0, .. .) = аХ" = Х”а.
Итак, если fn — последний отличный от нуля член последовательности / = (/0, flt ....	0, 0, ...), то в новых
обозначениях
f = if о, • • •, L-г, 0, о,. . .) + fnXn = (/0) , 1„-г, 0, о,. . .) +
+	+ f„X" = А,+ftx + /2х2 +... + fnxn. (3)
Такое представление элемента f однозначно, поскольку /0, • • •, fn в правой части (3) — это члены последовательности (/0, ..., fn, 0, ...), которая равна нулю тогда и только тогда, когда f0 = ... = /я = 0.
Определение. Введенное выше кольцо В обозначается через А [X] и называется кольцом многочленов над А от одной переменной X, а его элементы—многочленами (или полиномами).
Конечно, присвоение фиксированной букве X названия переменной или неизвестной — не очень удачное терминологическое изобретение, но оно привилось, поскольку не приводит к недоразумениям.
Мы намеренно ввели заглавную букву X, чтобы отличить наш специально выделенный многочлен f = X от теоретико-функциональной переменной х, пробегающей какое-то множество значений (чисто временное соглашение, придерживаться которого в будущем не обязательно). Более привычной является запись многочлена f в виде
f(X)^aQX- + a1X^+^.+an,
т.	е. по убывающим степеням X. В дальнейшем мы будем писать так, как это представится удобным. Элементы ft (и а;) называются коэффициентами многочлена f. Многочлен f — нулевой, когда все его коэффициенты равны нулю.
210
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
Коэффициент f0 при X в нулевой степени называется еще постоянным членом. Если /п=#=0, то fn называют старшим коэффициентом, а п—степенью многочлена и пишут /г = deg/. Нулевому многочлену приписывается степень -- ОО (- ОО + (—оо) =- ОО, - ОО 4“ П = — оо, —оо < п для каждого ngN). Многочлены степени 1, 2, 3, ... называются соответственно линейными, квадратичными (или квадратными), кубичными и т. д.
Роль единицы кольца А [X] играет единичный элемент 1 кольца А, рассматриваемый как многочлен нулевой степени. Непосредственно из определения операций сложения и умножения в А [X] следует, что для любых двух многочленов
/ = ^ + ЛХ+...+/„Х". g = g<, + giX+...+gmX” (4) степеней п и т соответственно имеют место неравенства deg(f+g)<max(degf, degg), deg (fg) deg f4-degg. (5) Второе из неравенств (5) на самом деле заменяется равенством
deg (fg) = deg f + degg
всякий раз, когда произведение f„gm старших коэффициентов многочленов (4) отлично от нуля, поскольку
fg = f oga + (f0& + Ш X+...+	X»*”.	(6)
Но это значит, что верна
Теорема 1. Если А—целостное кольцо, то и кольцо А [X] является целостным. |
Место кольца многочленов среди коммутативных колец отчасти поясняет следующая
Теорема 2. Пусть коммутативное кольцо К содержит А в качестве подкольца. Для каждого элемента t ё К существует единственный гомоморфизм колец П/. А [X] —► —►/С такой, что
ПДа) = я, УаёД, ПДХ) = Л	(7)
Доказательство. Предположим сначала, что такой гомоморфизм Пе существует. Так как Щ (fz) = для каждого коэффициента многочлена f, записанного в стандартном виде (3), и ITf (Xй) = (Щ (Х))й = tk (свойство го
§2]
КОЛЬЦО МНОГОЧЛЕНОВ
211
моморфизма и условие (7)), то
щ (П = 1Ш+Л* + •.  + / л»)=f0+f. 4- fnt", (8)
т. е. IIt (/) определен однозначно и выражается формулой (8). Обратно, задав отображение Щ формулой (8), мы, очевидно, удовлетворим условию (7) и получим гомоморфизм колец. Это ясно для отображения аддитивных групп колец, а что касается умножения, то применение nt к произведению (6), а затем использование (общего) закона дистрибутивности дает
nt (fg) = fogo + (fogi + Ш *+••• + (fngj tn+m = / /i	\ / m	\
= 2	2^ =Щ(/)-п^). i
V=o	/ \J=o	J
Результат применения отображения IIf, определенного формулой (8), к многочлену f = f(X) называется подстановкой I в f вместо X или (с некоторой натяжкой) просто значением f при X = t, так что IIf (/) =	Знать Щ (/) —
значит уметь вычислить значение f при X = t. Гомоморфизмы Щ, х£А9 служат связующим звеном между функциональной и алгебраической точками зрения на многочлен. По определению линейный многочлен X—с = (—с9 1, 0, ...) никогда не равен нулю, но ассоциированная с ним функция х*-*х—с принимает нулевое значение при х — с. Другой пример: отличный от нуля многочлен Х2 + Х с коэффициентами из поля F2 (где 1 + 1= 0) представляет нулевую функцию/: F2—►Fa, поскольку 02+0 = 0 и 12 + 1 = 0.
Элемент называется алгебраическим над А, если ПД/) = 0 для некоторого / С А [X]. Если же Щ: Д[Х] —► —+/<—изоморфное вложение (мономорфизм), то t—трансцендентный над А элемент. В случае Л = О и 7<=С говорят просто об алгебраических и трансцендентных числах. Примерами трансцендентных чисел являются е и л, определяемые в анализе, а примерами алгебраических чисел — ]/*2, КЗ, К2 + Кз.
Чтобы измерить отклонение кольца	полу-
ченного в начале этого параграфа, от кольца многочленов А [X], введем в рассмотренное ядро Jf = KerIIf гомоморфизма П/ из теоремы 2. Согласно (7), Щ действует тождественным образом на А, поэтому Л ЛЛ = 0. Кстати,
212
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
= если t—трансцендентный над А элемент. По теореме о гомоморфизмах для колец (теорема 2 п. 4 § 4 гл. 4):
Л[/]~Л[ад.	(9)
Изоморфизм (9), собственно говоря, служит выражением универсального свойства кольца многочленов А [X]. Более полным образом универсальность кольца многочленов видна из следующего утверждения, обобщающего теорему 2.
Теорема 3. Пусть А и К—произвольные коммутативные кольца, t—элемент из К и ср: А—— гомоморфизм, Тогда существует, и притом единственное, продолжение ср до гомоморфизма А [X] —► К кольца многочленов А [X] в К, переводящего переменную X в t.
Доказательство является незначительным видоизменением доказательства теоремы 2 и оставляется читателю в качестве упражнения. |
2. Многочлены от многих переменных. Если в ситуации Да/С, рассматривавшейся в начале параграфа, взять произвольные п элементов t19 ..., и рассмотреть в /С пересечение всех подколец, содержащих A, t19 . .., tn, то мы получим кольцо А [/п ..., /„]. Формальная запись его элементов подсказывает, как и в случае п=1, необходимость введения в обиход кольца многочленов от п переменных. Делается это очень просто. Вспомним, что конструкция кольца В = А [X] включала произвольное коммутативное кольцо А с единицей. Мы можем теперь заменить в нашей конструкции кольцо Л на В и построить кольцо С = В[У], где Y — новая независимая переменная, играющая по отношению к В ту же роль, что и X по отношению к А. Элементы из С однозначно записываются в виде	bj£B, причем В отождествляется с под-
кольцом в С, а именно—с множеством элементов bY° = fe-l. Так как, в свою очередь, Ь^^а^-Х1'— однозначная запись элементов bj £ В, то любой элемент из С имеет вид
k i
аи$А,
1 = 0 /=0
причем подразумевается (по смыслу конструкции), что О/у перестановочны с Х и Y, а переменная X перестановочна с У. Кольцо С называется кольцом многочленов
§ 2]	кольцо МНОГОЧЛЕНОВ	213
над А от двух независимых переменных (от двух неизвестных) X и У.
Повторив достаточное число раз эгу конструкцию, мы получим кольцо Л[ХП Хл] многочленов (полиномов) над А от п независимых переменных (или неизвестных}
......Хп.
Набор (in ..., i„) € N" из п целых неотрицательных чисел	in (N = NU{0}) условимся сокращенно обо-
значать символом (i). Тогда любой элемент f g А [Х\, ... .... Х„] запишется в виде
/ =	a(i^A,	(10)
(0
где X(Z) = Xi1.. .Х^—одночлен (или моном), так что f — линейная комбинация одночленов с коэффициентами из А. В соответствии с определением многочленов все коэффициенты аи} в (10), за исключением конечного их числа, равны нулю. Единственность записи (10) непосредственно вытекает из следующего утверждения.
Многочлен f равен нулю тогда и только тогда, когда равны нулю все его коэффициенты ац.,л . При п=1 это уже отмечалось в ходе построения кольца А [X], а при п > 1 проще всего использовать индукцию по п. Именно, мы можем записать
1п
где
— многочлены от меньшего числа переменных. Утверждение для п= 1 и предположение индукции показывают, что / = о « bir=0, & ^...1и_л = 0,	.... in).
Теперь естественно считать два многочлена f, g€ € Л [Xjl, ..., Х„] равными, если совпадают их коэффициенты при одинаковых одночленах (согласно вышесказан-ному (ц, .... in) (/;...../„) xi' ...Х1^ х{'... ху
Под степенью многочлена f относительно Xk понимается наибольшее целое число, обозначаемое deg^/, которое встречается в качестве показателя при Хл в a{i}X{i)
214
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
с a(Z)=j£0. Например, многочлен 1 + Х + ХУ3 + Х2У2 имеет степень 2 относительно X и степень 3 относительно Y. Целое число ц + ... + in называется (полной) степенью одночлена XV... Х‘«. Степенью deg f (или полной степенью} многочлена f будет максимальная из полных степеней его одночленов. Полагаем degO = — оо. О старшем по степени члене многочлена f не имеет смысла говорить, поскольку таких членов (одночленов) может быть несколько.
На кольцо Л [Хп ..., Хга] переносятся многие результаты, полученные нами в п. 1 для А [X]. Например, опираясь на теорему 1 и используя индукцию по п, мы сразу же убеждаемся в том, что справедлива
Теорема Г. Если А—целостное кольцо, то и кольцо Л [Хп ..., Х„] является целостным. В частности, кольцо многочленов от п переменных над любым полем Р целостно. |
Пусть, далее, А — подкольцо коммутативного кольца К и ti9 ..., tn — элементы из /С. Тогда соответствие
П/.,.... f (X,...Х„)	f (^, .... tn), Vf € А [Х1( .... Х„],
определяет гомоморфизм А [Хх.....Х„] —► К (сравнить
с теоремой 2). При этом говорят о подстановке tt.t„
в / или о значении f при X1 = tl......X„ = tn. Если
Кег П/,..i = 0, то , tn называются алгебраически
независимыми над А элементами кольца X- В случае алгебраически зависимых элементов tu tn найдется ненулевой многочлен /€Л[Хх, .... Х„], для которого
.... и = о.
Наконец, теореме 3 отвечает аналогичная
Теорема 3' (универсальность кольца многочленов). Пусть А и К—коммутативные кольца, t19 ..., tn — элементы из К и ср: Л——гомоморфизм колец. Тогда существует, и притом единственное, продолжение ср до гомоморфизма <pZltА [Хп ..., Х„] —* К, переводящего Xz в th 1 i п.
Доказательство проходит параллельно конструкции самого кольца Л[ХП Х„], т. е. по индукции. Основываясь на теореме 3, естественно предположить, что мы располагаем гомоморфизмом <pZ1, A [Xn ..., X^-J —продолжающим ср и таким, что <р/х...tn^ (Xz)^
= ti9 1	— 1. Заменяя в теореме 3 кольцо А на
§2]
кольцо МНОГОЧЛЕНОВ
215
Л[Хх, ..., и гомоморфизм <р — на ф/пtn_v а также используя то обстоятельство, что Л[Хх, ..., Хп] =
Л[Хг, ..X^-JfXJ, мы находим искомый гомоморфизм q)/lt .... /п =	переводящий Хп в tn. Един-
ственность ... tn не нуждается в проверке, поскольку ф/ь полностью определяется действием на Л и на элементах Xv ..., Хл, порождающих А [Хп ...» Х„]. |
С'л е д с т в и е. Любой перестановке л £Sn, действующей на множестве {1, 2, ..., п}, отвечает однозначно определенный автоморфизм л: /н-> л/ кольца А [Хх, ..., Хп], тождественный на А и такой, что
(n/)(Xn ..., Хп) = /(Хл-чп, ...» Хя-1(п)).
Доказательство. Положим в формулировке теоремы 3 /С = Л [Хп •.., Xrt], = Хд-i (1),	= Хл-1 (л),
и возьмем в качестве ф ограничение единичного отображения ек на А. В результате получится гомоморфизм л = ф^..tn кольца Л[ХП Х„] в себя (т. е. эндо-
морфизм), а так как лл'1 = л”хл = 1, 1 = 1 и лр = лр (проверка проведена в лемме из § 2 гл. 4), то л — автоморфизм.
Полезным уточнением теоремы Г служит
Теорема 4. Пусть f и g—произвольные многочлены от п переменных над целостным кольцом А. Тогда
deg (f^) = degf + degg.
Доказательство. Назовем однородным многочленом или формой степени т многочлен Л(Хх, ..., Хи), все члены которого имеют одну и ту же полную степень т. Формы степеней 1, 2, 3 называются соответственно линейными, квадратичными и кубичными формами. Объединяя вместе все входящие в f (или, как еще говорят, встречающиеся, имеющие ненулевые коэффициенты) одночлены одной и той же степени, мы однозначно представим многочлен f = 2а(/)^0> в виДе суммы нескольких форм fm различных степеней
f =	+fk, k = degf.
Если теперь
g = £o+&+•••+&. * = degg,
216
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
то, очевидно,
f g = fog« + (f о£ + f i£o) H-+ fkgl
(это похоже на соотношение (6), но Д-, gy имеют там другой смысл), откуда degfg^.k + 1. По теореме 1 из /А#=0, gi ¥= 0 следует /Agz #= 0, т. е. deg (fg) = deg (fAgJ = k +1 = = degf + degg. |
3. Алгоритм деления с остатком. У колец многочленов от одной и от большего числа независимых переменных имеются не только общие свойства, старательно подчеркиваемые нами в п. 2, но и существенные различия. Одно из этих различий мы немедленно обнаружим, обратившись к описанию идеалов кольца многочленов. Мы видели (см. п. 3 § 4 гл. 4), что в кольце Z каждый идеал — главный, т. е. имеет вид mZ. Доказательство этого факта основывалось на сравнении чисел по величине посредством механизма, именуемого алгоритмом деления с остатком и описанного для Z еще в п. 3 § 8 гл. 1. Оказывается, что совершенно аналогичный алгоритм (или алгорифм) имеет место и в кольце А [X] над целостным кольцом А (для А = К это известно фактически из курса элементарной алгебры: вспомните деление уголком!).
Теорема 5. Пусть А — целостное кольцо и g—многочлен в А [X] со старшим коэффициентом, обратимым в А. Тогда каждому многочлену /€Д[Х] сопоставляется одна и только одна пара многочленов q, г g А [X], для которых
f = qg + r, tegr<Atgg.	(11)
Доказательство. Пусть
f — aQXn + а1Х'г”1 + ... +
g = bQX” + b1X'*~'+...+bm,
где aQbQ^0 и Ьо|1. Применим индукцию по п. Если п = 0 и т = deg g > deg f = 0, то положим q = 0, r = f, а если п = т = 0, то г = 0 и q = aob^. Допустим, что теорема доказана для всех многочленов степени < п (п > 0). Без ограничения общности считаем т^п, поскольку в противном случае возьмем q = Q и г=[. Раз это так, то
f !=a<fa1Xn~m-g + f,
§2]
кольцо МНОГОЧЛЕНОВ
217
где deg f < п. По индукции мы можем найти q и г, для которых f~=qg-^rt причем degr<m. Положив
q = aobv1Xn-mg + q, мы придем к паре многочленов с нужными свойствами.
Обращаясь к свойству единственности частного q и остатка г, предположим, что
qg + r = f = q'g + r'.
Тогда (/—q)g = r—г'. По теореме 1 имеем: deg(r—г')= = deg (</'— <?) + degg, что в наших условиях возможно только при г' = г и q' = q (напомним, что degO =— оо и что —оо4-т = —оо).
Наконец, приведенные рассуждения показывают, что коэффициенты частного q и остатка г принадлежат тому же целостному кольцу Д, т. е. f, gg/4[X] q, г € Л [X]. |
Замечание. Процесс евклидова деления многочлена f на g упрощается, если g—унитарный многочлен, т. е. его старший коэффициент равен единице (unit—единица, англ.). Делимость f на унитарный многочлен g эквивалентна равенству нулю остатка г при евклидовом делении f на g.
Следствие. Все идеалы кольца многочленов Р[Х] над полем Р — главные. ,
Доказательство. Пусть Т—какой-то ненулевой идеал в Р[Х]. Выберем многочлен t = t(X) минимальной степени, содержащийся в Т. Если f — любой многочлен из Т, то деление с остатком на t (Р— поле, поэтому нет нужды заботиться об обратимости старшего коэффициента у t(X)) даст нам равенство f = qt-\-r, deg г < deg t. Из него следует, что г С Т, поскольку /, t, qt—элементы идеала. Ввиду выбора t нам остается заключить, что г = 0. Значит, f(X) делится на t (X) и Т = (t) = tP[X], т. е. Т состоит из многочленов, делящихся на t (X). | Что касается колец многочленов от нескольких независимых переменных, то уже в R [X, У] идеалы заведомо не исчерпываются главными.
П р"и м е р. Множество
T = {Xf+Yg\f, g^RlX, Г]}, состоящее из многочленов h (X, Y) таких, что А (О, 0) = 0, очевидно, является идеалом в R [X, У]. Так как lglR[X, Y], то из Т =
218
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
= t (X, Y) R [X, У] следовало бы включение t(X,Y)£T. Поэтому /(О, 0) = 0 и, стало быть, deg t 1. Применяя теперь теорему 4 к равенствам
Х = /«, Y = tvt
мы найдем, что deg и = deg v = 0, т. е. и, ugR. и Y = u~1vX — противоречие, показывающее, что идеал Т не является главным.
Следствие теоремы 5 удобно для явного описания изоморфизма (9). В качестве примера докажем утверждение, по сути дела дополняющее собой теорему 4 § 1.
Теорема 6. Поле комплексных чисел С изоморфно факпгоркольцу R [Х]/(Х2 + 1) R [X].
Доказательство. Согласно (9) С == R[Z] ^R[X]/J, где ^ = {f€R[X]|f(O = O}. Так как a + ib^O при (а, Ь) Ф (0, 0), и так как i2 +1 = 0 X2 +1 € J, то из рассуждений, доказывающих следствие теоремы 5, без труда вытекает, что J = (Х2+ 1) R [X].
Элементами факторкольца R[X]/J являются смежные классы (а + ЬХ)~\- J; at bgR; соответствие a + ibt-*> t—>(a + bX) + J устанавливает изоморфизм между С и R[X]/J. |
УПРАЖНЕНИЯ
1.	Многочлены /(Х) = Х? + ЗХ4 + ^3 + 4Х2-ЗХ-1, g(X) = = Х2 + Х4-1 можно считать принадлежащими кольцу Z[X] или, скажем, кольцу Z5[X] в зависимости от того, как интерпретировать их коэффициенты. Применяя алгоритм деления с остатком, показать, что в первом случае f(X) не делится на g(X), а во втором—делится. Возможна ли реализация противоположного варианта?
2.	Доказать при помощи теоремы 3, что если F—поле, то группа всех автоморфизмов кольца F[X] изоморфна группе преобразований X и—> аХ + Ь, где a, b£F и о 0.
3.	Показать, что многочлен f^F[X±.Х„] является формой
степени ш (см. доказательство теоремы 4) тогда и только тогда, когда f(tXlt ..., tXn) = trnf (Xlt ..., Хп), где i — новая переменная.
4.	Показать, что число различных одночленов от п независимых переменных полной степени m равно I * I . (Указание. Установив соотношение
ЙА k m )'
применить индукцию по т.)
КОЛЬЦО МНОГОЧЛЕНОВ
219
§ 2]
5.	Возвращаясь к определениям п, 1, рассмотрим- совокупность А [[X]] так называемых формальных степенных рядов f (Х)==^а^Х1 от переменной (неизвестной) X или, если угодно, последовательностей (л0, «1, ^2, ...) с любым, возможно бесконечным, числом коэффициентов а[ Ф 0, принадлежащих коммутативному кольцу Л* Действия с формальными степенными рядами из A f[X]] проводятся по тем же правилам, что и действия с многочленами:
(S +(2	=2 &+*»•)
(S^z)-(26/x/)=Sc*xft> с*= 2 а‘ь/‘
i + j=k
Показать, что множество А [[X]], рассматриваемое вместе с этими операциями, является ассоциативным и коммутативным кольцом с единицей 1 =(1, 0, 0, ...).
Так как в степенной ряд / = 2 входят сколь угодно высокие степени Xi переменной X, то вместо степени deg /, не имеющей теперь смысла, естественно рассматривать порядок, <о (/)— целое число, равное наименьшему индексу л, для которого ап Ф 0 (полагают еще о(0) = + оэ).
Показать, что
(i) to(/—g) Sa min {со (f), <a(g)}; (ii) «»(/g)Saw (/) + «(£).
Если A — целостное кольцо, то со (/g) = со (/) + со (g). В частности, вместе с А целостным является и кольцо A [1XJ].
Показать также, что А [X] — подкольцо в А [[X]].
6. Многочлены и степенные ряды часто используются в качестве производящих функций различных числовых величин. Смысл оперирования с ними поясним на двух простых примерах*
а)	Установить соотношение
k
Elт\ / л \ /т^п\
\ i ) \k — i ) ~ \ k J ’
i = 0
исходя из биномиальной формулы	Xz = (1Х)п в Z [X] и
очевидного разложения (1 + X)W (I +Х)п = (1 4-Х)/л
б)	Найти число 1п всевозможных расстановок скобок в произведении длины л элементов множества с одной бинарной операцией. С этой целью удобно ввести производящую функцию —формальный степенной ряд
/(Х) = 2/nXn=X-|-X2 + 2X3-h...,
1
220
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
начальное коэффициенты которого были вычислены еще в п. 3 § 1 гл. 4. Из очевидного рекуррентного соотношения
л-1
k=\
вытекает, что I (Х)2 = 1 (Х) — Х. Решая это квадратное уравнение, находим
(знак перед радикалом определяется условием [1п > 0). Но если степенной ряд f(X) таков, что fr=]-]-hX, r£N, то
°° Р”1 /1	1
/(Х)=1+У Д (——«) (W
*Г1Ь=о V г ' \
(«разложение в ряд Тейлора», которое можно принять пока на веру). В нашем случае г = 2, Х = — 4, и простая подстановка дает окончательное выражение
1 _ 1 (^-2\ п~ п п— 1 ) ’
Предлагается провести все промежуточные выкладки.
7. Кольцо А [[X, Г]] формальных степенных рядов от двух независимых (но перестановочных между собой) переменных Xt Y состоит из выражений У а/уХ'УЛ . Проверить, что
£>о
В [[Г]]=Л [[X, Г]]=С[[Х]],
где В = Л[[Х]], С = А [[У]] (повторение конструкции кольца многочленов многих переменных). Показать, что целостность Л влечет целостность кольца Л [[X]].
§ 3. Разложение в кольце многочленов
1. Элементарные свойства делимости. В разных местах, начиная с гл. 1, мы затрагивали вопросы делимости в кольце Z целых чисел, но так называемая основная теорема арифметики у нас оставалась пока недоказанной. Теперь настала пора не только заполнить этот пробел, но и распространить соответствующие утверждения на более широкий класс колец. В первую очередь нас интересует кольцо многочленов Р[Х] над полем Р.
§3]
РАЗЛОЖЕНИЕ В КОЛЬЦЕ МНОГОЧЛЕНОВ
221
Начнем с произвольного целостного кольца К. Обратимые элементы в К были названы нами делителями единицы. Часто их именуют еще регулярными элементами. Совершенно очевидно, что многочлен f С А [X] обратим (регулярен) в точности тогда, когда deg/ = O и f = f0— обратимый элемент кольца Д, поскольку fg=l => —> degf+ degg=deg 1 =0.
Говорят, что элемент Ь£К делится на а£К (или b кратен а), если существует такой элемент с£К, что Ь=ас (это обозначается а|Ь). Если а\Ъ и Ь\а, то а и b называются ассоциированными элементами. Тогда Ь = иа, где и|1. В силу сделанного выше замечания ассоциированность многочленов /, £ € Д [X] означает, что они отличаются лишь обратимым множителем из Д.
Элемент р£К называется простым (или неразложимым), если р необратим и его нельзя представить в виде p = ab, где а, b — необратимые элементы. В поле Р каждый ненулевой элемент обратим и в Р нет простых элементов. Простой элемент кольца А [X] называется чаще неприводимым многочленом.
Отметим следующие основные свойства отношения делимости в целостном кольце К.
1)	Если а)Ь, с, то al с. Действительно, мы имеем b = ab', с = Ьс', где b', с' С /<. Поэтому с = (ab') cr = a (b'd),
2)	Если с\а и с\Ь, то с\(а±Ь). В самом деле, по условию а = са', b — cb' для некоторых a', b' С К и ввиду дистрибутивности а ±2 Ь = с(а' ± Ь').
3)	Если а\Ь, то а\Ьс. Ясно, что b = ab' => Ьс = = (ab')c = a(b'c).
Комбинируя 2) и 3), получаем
4)	Если каждый из элементов bt, b2, ..., Ьт£К делится на а£К, то на а будет делиться также элемент Ь1с1А~Ь2с2-\- • • • + Ьтст, где сх, с2, ..., ст — произвольные элементы, |
Определение. Говорят, что целостное кольцо К—кольцо с однозначным разложением на простые множители (или К—факториальное кольцо), если любой элемент ау=0 из Д’ можно представить в виде
a = uptp, ... pr,	(I)
где и—обратимый элемент, а р1( р2, .... рг—простые элементы (не обязательно попарно различные), причем из
222
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
(ГЛ. В
существования другого такого разложения a^=vq1q2.. .qs следует, что г = s и при надлежащей нумерации элементов pi и q,- будет
<7i = "iPp .. •> qr = urpr9
где	иг—обратимые элементы.
Допуская в равенстве (1) значение г = 0, мы принимаем соглашение, что обратимые элементы в Д тоже имеют разложение на простые множители. Ясно, что если р — простой, а и—обратимый элемент, то ассоциированный с р элемент ар тоже простой. В кольце Z с обратимыми элементами 1 и —1 отношение порядка (п<д) дает возможность выделить положительное простое число р из двух возможных простых элементов ± р. В кольце Р [X] удобно рассматривать унитарные ( = с единичным старшим коэффициентом) неприводимые многочлены.
Справедлива следующая общая
Теорема 1. Пусть К—произвольное целостное кольцо с разложением на простые множители. Однозначность разложения в К (факториальность Д') имеет место тогда и только тогда, когда любой простой элемент р£К, делящий произведение ab£K, делит по крайней мере один из множителей а, Ь.
Доказательство. Пусть ab — pc. Если
а = Па<. 6 = П^. с1Рл
— разложения а, Ь, с на простые множители, а К—кольцо с однозначным разложением, то из равенства Цл/ЦЬ/ = = рЦс* следует, что элемент р ассоциирован с одним из а; или &у, т. е. р делит а или Ь.
Обратно, установим однозначность разложения в Д, где p\ab =$> р\а или р\Ь. Рассуждая по индукции, допустим, что разложение всех элементов из Д с числом простых множителей единственно (конечно, с точностью до порядка множителей и их ассоциированности). Докажем теперь это для любого элемента п=й=0, который может быть разложен на п + 1 простых множителей. Именно, пусть
п+ 1	т+ 1
а = 11р;= Пг/	(2)
1=1	у=1
§3]
РАЗЛОЖЕНИЕ В КОЛЬЦЕ МНОГОЧЛЕНОВ
223
— два разложения элемента а с пг^п. Условие теоремы, примененное к р = рп+1, дает нам, что рп+1 должен делить один из элементов гт+1, Без ограничения общности (ибо это вопрос нумерации) считаем, что рп+11 rm+v Но rm+i— простой элемент, поэтому гт+1 = ирп+1, где и—обратимый элемент. Опираясь на закон сокращения в К (теорема 3 § 4 гл. 4), получаем из (2) равенство п	т
Пр£ = иПг/. В левой его части стоит произведение п z=i	/=1
простых множителей. По предположению индукции пг = п и оба разложения отличаются лишь порядком простых элементов, снабженных, возможно, какими-то обратимыми множителями. И
В произвольном целостном кольце К элемент а#=0 вообще не обязан допускать разложение типа (I). Что более интересно, имеются целостные кольца, в которых разложение на простые множители хотя и возможно, но не является однозначным, т. е. условие теоремы 1, кажущееся тривиальным, не всегда выполняется.
Пример. Рассмотрим мнимое квадратичное поле Q ( К—5) (см. пример в п. 5 § 1), а в нем — целостное кольцо Д = (а+6 У—5| a,	Норма N (а-\-Ь У—5) — а2 + 5Ь2 каждого отличного от нуля
элемента а£К — целое положительное число. Если а обратим в Д, то N (а)-1 = N (а-1)^^, откуда W(a)=l. Это возможно лишь при 6 = 0, а=±1. Таким образом, в Д, как и в Z, обратимыми элементами являются только ±1. Если a = ea1a2.. .ar тЬ 0, е=±1, то N (а) = N (ai).. ,N (аг). Так как 1 < /V(az-)£N, то при заданном a число множителей г не можег неограниченно расти. Стало быть, разложение на простые множители в Д возможно.
Вместе с тем число 9 (да и не только оно) допускает два существенно различных разложения на простые множители:
9 = 3-3 = (2 + К~5) (2— /=5).
Неассоциированность элементов 3 и 2i У—5 очевидна. Далее, <V(3) = = (2 ± К—5) = 9. Поэтому из разложения a = a1a2 для а = 3 или 2± К-5 с необратимыми аг, а2 следовало бы 9=7V (a)=W (а3) N (a2), т. е. N (az) = 3, i = 1,2, что невозможно, поскольку уравнение х3Н~5//2 = 3 с х, j/g Z неразрешимо. Этим доказана простота элементов 3 и 2± V — 5.
Рассмотренный пример содержит в зародыше большой круг вопросов, частично остающихся пока нерешенными, о квадратичных полях Q (У d). Их изучение входит в круг обязанностей, алгебраической теории чисел.
224
КОМПЛЕКСНЫЕ ЧИСЛА И‘'МНОГО ЧЛЕНЫ
[ГЛ. б
Прежде чем устанавливать при помощи теоремы 1 факториальность тех или иных колец, мы введем важные вспомогательные понятия, представляющие независимый интерес.
2. НОД и НОК в кольцах. Пусть Д'—целостное кольцо. Под наибольшим общим делителем двух элементов a, b g/C мы будем понимать элемент d (£ Д', обозначаемый символом НОД(а,Ь) и обладающий двумя свойствами:
(i)	d\a, d\b',
(ii)	c\a9 c\b => c\d.
Ясно, что вместе c d свойствами (i), (ii) обладает любой ассоциированный с ним элемент. Обратно, если end — два наибольших делителя элементов а и Ь, то будем иметь c\d, d\c, так что end ассоциированы. Обозначение НОД (а, Ь) относится к любому из них, т. е. в этой записи ассоциированные элементы не различаются. С учетом такого соглашения к определяющим свойствам (i), (ii) наибольшего общего делителя добавятся следующие:
(iii)	НОД (а, Ь) = а <=> а\Ь\
(iv)	НОД (а, 0)=-а;
(v)	НОД (ta, tb) = t НОД (а, &);
(vi)	НОД (НОД (а, &), с) = НОД (а, НОД(&, с)). Проверка их не вызывает никаких трудностей и оставляется читателю. Свойство (vi) позволяет также распространить понятие НОД на произвольное конечное число элементов.
По аналогии с НОД (и, Ь) вводится дуальное понятие наименьшего общего кратного т = НОК(я, Ь) элементов а, b € К, также определенного с точностью до ассоциированности двумя свойствами:
(i') а\т, b\m'f
(И') а|с, Ь\с => т\с.
В частности, полагая c — abt получаем, что m\ab.
Теорема 2. Пусть для элементов а, b целостного кольца К существуют НОД (я, Ь) и НОК (а, Ь). Тогда'.
а)	НОК (а, *0 = 0 & а-0 или Ь = 0.
б)	а,Ь=£0, т = НОК(а, Ь), ab=dm => б!=НОД(а,6).
Доказательство. Утверждение а) вытекает непосредственно из определения НОК (я, Ь). Для доказательства б) нам нужно убедиться, что элемент d, определенный равенством ab — dm, обладает свойствами (i), (ii). В самом деле, (Г) => т — а'а, m = b'b. Значит, ab=
§3]
РАЗЛОЖЕНИЕ В КОЛЬЦЕ МНОГОЧЛЕНОВ
225
r=dm = da'at откуда после сокращения на а, допустимого в любом целостном кольце, имеем b = da', т. е. d\b. Аналогично ab = dm = db’b => a = db', т. е. d\a. Мы пришли к (/).
Далее, пусть a = fa", b = fbn. Положим c = fa"b". Тогда c = ab" = Ьа"—общее кратное а и Ь. Согласно свойству (ii'), с = с’т для некоторого с' € Д, откуда fc'tn = fc = f2a"b" = = ab = dm, т. e. d = fc' и f \d. Мы пришли к (ii). |
Из свойств (i), (ii), (i'), (ii') или из теоремы 2 нельзя извлечь ни способа вычисления, ни доказательства существования НОД (я, Ь) и HOK(fl, Ь). Теоремой 26) устанавливается лишь соотношение между ними.
Предположим теперь на время, что Д—факториальное кольцо. Обозначим через 3 множество простых элементов в Д такое, что всякий простой элемент из Д ассоциирован с одним и только с одним элементом из 3, Рассматривая разложения двух элементов а, /?€ Д, удобно считать, что в них входят одинаковые элементы из 3\ но некоторые, возможно, с нулевыми показателями, т. е.
а^ирг-.-р/, b = vpt...p',
u|l, v|l; А,>0,	1 < i< г.
При помощи теоремы 1 получается легко запоминаемый
Признак делимости. Пусть а, b—элементы факториального кольца К, записанные в виде (3). Справедливы утверждения'.
1)	а | b тогда и только тогда, когда kj f= 1,2,..., r\
2)	НОД (a, b) = p\x.. .psr> где st- = min {kh 1Д, i = = 1, 2, ..., r,
3)	HOK (a, b) = р{1.. .p\r, где ti = rnax{kh li}, = 1, 2, ..., r. |
Таким образом, в качестве sz нужно брать наименьший из двух показателей kh lh а в качестве —максимальный. В частности, элементы а, Ь£К взаимно просты, т. е. НОД (а, &)=-1, в точности тогда, когда простые множители, входящие в разложение одного элемента, не входят в разложение другого. Недостаток этого признака делимости заключается, конечно, в том, что на практике бывает весьма трудно получить разложение вида (3). Даже в случае Д = 2 (этим не предвосхищается факториаль-
8 А. И. Кострикин
226
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
ность Z) приходится довольствоваться незначительными вариациями метода прямого перебора простых чисел, меньших данного числа п. Тем более приятно, что в факториальных кольцах, о которых пойдет речь ниже, имеется эффективный способ вычисления НОД (я, Ь) и НОК(я, Ь).
3. Факториальность евклидовых колец. Алгоритм деления с остатком в Z и Р[Х] (см. п. 3 § 8 гл. 1 и п. 3 § 2) делает естественным рассмотрение целостного кольца К, в котором каждому элементу а=^0 поставлено в соответствие неотрицательное целое число б(ц), т. е. определено отображение
6: JC\{O} = K*— N U {0}, так, что при этом выполняются условия:
(El) 8(аЬ)^8(а) для всех а, &=/=0 из К\
(Е2) Каковы бы ни были a, b£ К, Ь^О, найдутся q, г	(q—«частное», г—«остаток»), для которых
a = qb + r; 6 (г) < 8(b) или г = 0.	(4)
Целостное кольцо К с этими свойствами называется евклидовым кольцом. Полагая 6 (а) = |а | для a^Z и 8(а) = = dega для а = а (X) € Р [X], мы приходим к выводу, что Z и Р[Х]—евклидовы кольца.
В евклидовых кольцах существует способ нахождения НОД (а, Ь), называемый алгоритмом последовательного деления или алгоритмом Евклида и заключающийся в следующем. Пусть даны ненулевые элементы а, b евклидова кольца К- Применяя достаточно большое (но конечное) число раз предписание (Е2), мы получим систему равенств типа (4) с последним нулевым остатком:
a = qlb + rl, 6 = ftG + г2, f\ = q3r2 + Г3,
6(G)
6(G)
6(G)
< 6 (£>) < 6(G), <6(G),
(5)
G-a Qk^k-i FG, ^л-i — 4k+irk^
6(G) < 6(g~i),
G+i — О*
Это действительно так, поскольку строго убывающая цепочка неотрицательных целых чисел 6 (b) > S (гх) > > S (г2) >... должна оборваться, а обрыв может произойти только за счет обращения в нуль одного из остатков.
§ 3]
РАЗЛОЖЕНИЕ В КОЛЬЦЕ МНОГОЧЛЕНОВ
227
Утверждается, что последний отличный от нуля остаток гк является как раз наибольшим общим делителем элементов а и b в смысле определения, данного в п. 2. В самом деле, по условию rk\rk^r Двигаясь в системе (5) снизу вверх и используя свойство 4) отношения делимости, сформулированное в п. 1, получим цепочку rk \ rk_19 rk\rk-2, • • •, гк\гг, rk\r1 и, наконец, гк\Ь, rft|a. Стало быть, rk—общий делитель элементов а и Ь. Обратно, пусть с—любой другой делитель тех же элементов. Тогда с | ги и, двигаясь теперь в системе (5) сверху вниз, мы получим цепочку отношений делимости с | г2, с | г3, ..., с | rk. Последнее из них окончательно убеждает нас в том, что НОД (а, Ь) существует, причем имеет место равенство
гл = НОД (a, ft).	(6)
Обратим, далее, внимание на то обстоятельство, что каждый остаток ri в системе (5) выражается в виде линейной комбинации с коэффициентами в /< двух предыдущих остатков rz-1 и rz_2. При этом гг выражается через а и Ь: 1\ = а—qfi, а г2, выражаясь через ft и г19 тем самым является опять линейной комбинацией а и ft. Последовательная подстановка в rz выражений rz_t и rz_2 через а и ft даст нам при i = k выражение
= аи + bv	(7)
с какими-то элементами и, v£K.
Сопоставляя (6) и (7) и принимая во внимание теорему 26), получаем следующее утверждение.
Теорема 3. В евклидовом кольце К любые два элемента а, b имеют наибольший общий делитель и наименьшее общее кратное. При помощи алгоритма Евклида можно найти такие и, и € /С, что будет выполнено соотношение
НОД (a, b) -=au + bv.
В частности, элементы а, ЬC^ взаимно просты тогда и только тогда, когда существуют элементы и, для которых
аи + Ьо—\. |
Следствие. Пусть a, ft, с—элементы евклидова кольца К*
228
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
(i)	Если НОД (a, b) = 1 и НОД (а, с) = 1, то НОД (а, bc)= 1.
(ii)	Если а\Ьс и НОД (а, Ь)=1, то а\с.
(iii)	Если Ь\а, с\а и НОД(Ь, с) = 1, то Ьс\а.
Доказательство, (i). Согласно теореме 3, имеем равенства аих + bvx = 1, аи2 + cv2 = 1. Перемножая соответственно их левые и правые части, находим а(аихи2 + + bu2v1+culv2) + bc(v1v2)= 1, что и дает нужное утверждение.
(ii)	Имеем au + bv=lt откуда ac-u + (bc)v = c. Но bc = aw, поэтому c = a(cu + wv), т. е. а} с.
(ii	i) Согласно свойству (ii') НОК,
Ь\р, с\а => НОК(Ь, с)\а => Ьс\а, поскольку Ьс = НОД(Ь, с) НОК(Ь,с) и НОД(Ь, с)=1 по условию. |
Читатель легко распространит утверждение теоремы 3 на случай произвольного конечного числа элементов евклидова кольца.
Непосредственным шагом к установлению факториаль-ности евклидова кольца служит
Лемма. Всякое евклидово кольцо является кольцом с разложением (т.е. любой элемент а=£0 из К записывается в виде (1)).
Доказательство. Пусть элемент а£К обладает собственным делителем b\ a = bct где b и с—необратимые элементы (другими словами, а и b не ассоциированы). Докажем, что б (/?) < б (а).
В самом деле, согласно (Е1), непосредственно имеем б (Ь)	6 (Ьс) = б (а). Предположив выполнение равенства
= мы воспользуемся условием (Е2) и найдем г с b = qa + r, где б (г) < б (а) или же г = 0. Случай г = 0 отпадает ввиду неассоциированности а и Ь. По той же причине 1—qc^=Q. Стало быть, снова по (Е2) (с заменой а на Ь) имеем
б (а) = б (&) б (Ь (1—qc)) = b(b — qa) = 6(r) < б (а)
— противоречие. Итак, б(Ь)<б(а).
Если теперь а = аха2.. .ап, где все ai необратимы, то am+iam+2-' ‘ап — собственный делитель атат+1.. .ап, и по доказанному
6 (а) = 6 (а,а2.. ,а„) > 6 (а2.. .ап) >...>6 (а„) > 6(1).
§ 3]	РАЗЛОЖЕНИЕ В КОЛЬЦЕ МНОГОЧЛЕНОВ	229
Эта строго убывающая цепочка неотрицательных целых чисел имеет длину п^б(а). Значит, имеется максимальное разложение а на простые множители. |
Теорема 4. Всякое евклидово кольцо К факториально (~К обладает свойством однозначности разложения на простые множители).
Доказательство. С учетом леммы и критерия фак-ториальности, содержащегося в теореме 1, нам остается показать, что если р — простой элемент кольца /<, делящий произведение Ьс каких-то элементов b, то р делит либо Ь, либо с.
Действительно, при Ь = 0 или с = 0 доказывать нечего. Если же Ьс=£О и б/ = НОД(Ь, р), то d, будучи делителем простого элемента р, либо равен 1 (точнее, является делителем 1), либо ассоциирован с р. В первом случае b и р оказываются взаимно простыми, и утверждение (ii) следствия теоремы 3 позволяет заключить, что р\с. Во втором случае d = up, u|l и, значит, р\Ь. |
Следствие. Кольца Z и Р [X] факториальны (Р— произвольное поле).
Факториальность кольца многочленов Р [Хх, .. ., Хл], n > 1, уже не являющегося евклидовым, устанавливается в гл. 9. Там же приводятся дополнительные примеры евклидовых колец.
4. Неприводимые многочлены. Специализируя данное ранее определение простого элемента, еще раз подчеркнем, что многочлен f ненулевой степени из кольца Р[Х] называется неприводимым в Р[Х] (или неприводимым над полем Р), если он не делится ни на какой многочлен ggP[X], у которого 0 < degg < deg f. В частности, всякий многочлен первой степени неприводим. Совершенно очевидно, что неприводимость многочлена степени > 1 или разложение его на неприводимые множители — понятия, тесно связанные с основным полем Р, как это показывает уже известный нам по построению комплексных чисел многочлен X2 + 1 = (X + i) (X — i). Многочлен X4 + 4 приводим над Q, хотя об этом и нелегко догадаться:
X4 + 4 = (X2 — 2Х + 2) (X2 + 2Х + 2).
Оба множителя справа неприводимы не только над Q, но и над R, будучи приводимыми, однако, над С.
230
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. В
Как простых чисел в Z (см, § 8 гл. 1), так и унитарных (т. е. со старшим коэффициентом 1) неприводимых многочленов над произвольным полем Р бесконечно много.
В случае бесконечного поля Р это ясно: достаточно рассмотреть неприводимые многочлены вида X—с, с£Р.
Если же поле Р конечно, то годится рассуждение Евклида. Именно, пусть уже найдены п неприводимых многочленов р19 ..., рп. Многочлен f = ргр2... рп + 1 имеет хотя бы один унитарный простой делитель, поскольку deg/^n. Обозначим его через рп+1. Он отличен от ... ...,рп, поскольку из pn+1 = ps для какого-то s^Zn еле-довало бы ps | (f—p!.. .р„), т. е. pj L |
Так как многочленов заданной степени над конечным полем — конечное число, то можно сделать следующее полезное заключение.
Над любым конечным полем существуют неприводимые многочлены сколь угодно высокой степени. |
Это утверждение качественного характера будет уточнено в главе 9.
Неприводимые многочлены над полем Q играют особую роль в теории полей алгебраических чисел. Так как умножением на подходящее натуральное число от многочлена из Q [X] всегда можно перейти к многочлену из Z [X], то естественно уточнить сначала связь между свойствами приводимости над Q и над Z. Имея в виду другие приложения, мы докажем одно общее утверждение о многочленах над факториальным кольцом /<. Назовем содержанием многочлена f = а0 + агХ + ... + апХп g К [X] наибольший общий делитель d = d (/) всех его коэффициентов. До сих пор мы говорили о НОД (а, Ь) двух элементов, но свойства (i) — (vi) НОД позволяют без труда распространить это понятие на любое конечное число элементов целостного кольца. Если d (/) — обратимый элемент в /С, то многочлен f называют примитивным.
Лемма Гаусса. Пусть К—факториальное кольцо и f9 £б/<[Х]. Тогда
d(fe)«d(f)-d(g).
В частности, произведение двух примитивных многочленов снова будет примитивным многочленом (здесь и ниже равенства понимаются с точностью до ассоциированности).
$ 3]	РАЗЛОЖЕНИЕ В КОЛЬЦЕ МНОГОЧЛЕНОВ	231
Доказательство. Начнем с последнего утверждения. Пусть
f	+ • • •	ё = Ьо + biX + • • • ^~ЬтХт
— примитивные многочлены из /<[Х], произведение fg которых не является примитивным. Существует, стало быть, простой элемент делящий d(fg). Выберем наименьшие индексы $, /, для которых p\as, p\bt. Такие индексы найдутся ввиду примитивности fug. Коэффициентом при Xs+i в fg будет
Так как as_t и при i >0 делятся на р по условию и p\cs+t по предположению, то мы имеем соотношение pu = asbt + pv,
из которого следует, что р |оД. Ввиду факториальности 1( имеем p\as или p\bt—противоречие, доказывающее наше утверждение.
Переходя к общему случаю, запишем произвольные многочлены Д g€.K\X] в виде
f = d(f)f0, g=A(g)g„
где /о» £о — примитивные многочлены. Так как fg = = d(f)d(g)-fogo и по доказанному d(/ogo)^l, то, стало быть, d(/g)»d(/)d(g). |
Следствие. Многочлен f € Z [X]» неприводимый над Z, продолжает оставаться неприводимым и над Q (deg f > 0).
Доказательство. Согласно следствию теоремы 4 Z—факториальное кольцо, поэтому к Z[X] применима лемма Гаусса. Предположим, что f = gh, где f£Z[X], a g, /i£Q[X]. Умножая обе части этого равенства на наименьшее общее кратное знаменателей всех коэффициентов у g и h, мы перепишем его в виде af = bgQhG, где a, b£Z и g0, Ло — примитивные многочлены над Z. По лемме Гаусса a d (/) = b (в данном случае без ограничения общности ассоциированность заменяется на равенство), так что получается разложение f = d (/) g0/z0 над Z. Остается вспомнить о неприводимости f в Z [X]. |
Критерий неприводимости (Эйзенштейн). Пусть
f (X) = X" +	. + ап.гХ + ап €Z [X]
232
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
— унитарный многочлен над Z, все коэффициенты аи ... ..., ап которого делятся на некоторое простое число р, но ап не делится на р2, Тогда f (X) неприводим над Q.
В самом деле, предположив противное и воспользовавшись следствием леммы Гаусса, мы запишем f в виде произведения двух унитарных многочленов над Z:
f (X) = (X* + blXs~1 + . ,.+bs) (X* + c1Xt~1 + ... +ct)f st > 0,
это разложение сохранится и в факторкольце Z[X]/(p)~ ^Z^fX], элементы которого получаются из целочисленных многочленов взятием их коэффициентов по модулю р. По условию az=0, где az —класс вычетов по модулю р, соответствующий целому числу ah Но кольцо Z^fX] факториально (следствие теоремы 4). Сравнивая два разложения:
XsXt = {Xs + bxXs-1+ .. .ИХ^^Х'-^ ...), s + t = п, мы неизбежно приходим к заключению, что fez = 6 = Cy, т. е. все коэффициенты bh Cj делятся на р. В таком случае an = bsct делится на р2 — противоречие, устанавливающее справедливость критерия Эйзенштейна. |
Примечание. Критерий действует и в том случае, когда старший коэффициент а0 отличен от 1, но не делится на р.
Пример. Многочлен / (X) =	Х4-Х^“’2+ ... +Х+1 непри-
водим над Q при любом простом р.
Достаточно заметить, что вопрос о неприводимости f(X) эквивалентен вопросу о неприводимости многочлена
+...+UXZ,).
все коэффициенты которого, кроме старшего, делятся на р в первой степени (свойство биномиальных коэффициентов, отмеченное в упражнении 8 § 4 гл. 4) и к которому, следовательно, применим критерий Эйзенштейна. I
УПРАЖНЕНИЯ
1.	Показать, что
п Z + т Z = Z • НОД (п, т), п% = Z-НОК (п, т).
ПОЛЕ ОТНОШЕНИЙ
233
§ 4]
2.	Пусть ft g—унитарные многочлены из Z [X]. Показать, что в выражении НОД(/, g) = fu-\-gv с п, v£z[X] можно считать deg и < deg g, deg v < deg /.
3.	Являются ли кольца % [У—З] и Z8 [X] факториальными?
4.	Разложить на неприводимые множители в Z [X] многочлены Хп —1 при 5^п^12.
5.	Доказать, что неприводимые множители однородного многочлена
f (XY) = а0Хл + а±Хп -iY + ...+an-rXY^ - * + anY« g Q [X, Y ] однородны в f (X, Y) неприводим тогда и только тогда, когда неприводим многочлен f(X, 1) = а0Хп 4-а1Х',-’1+ ... 4-nn_1X + nn£Q [X].
6.	Пусть Р — поле и /(Х)= У а;Х*—формальный степенной ряд
из Р[[Х]] (см. упражнение 5 § 2). Условие а0 0 или, что эквивалентно, со (/) = О необходимо и достаточно для существования степенного ряда g (X)gP [[X]], обратного к f: fg=l. Например, (1 — Х)~1 = = Xz. С точностью до ассоциированности X — единственный про-
стой элемент в Р ИХ]]. Кольцо Р [[X]] факториально. Обосновать эти утверждения.
7.	Показать, что det (х/у) = 2 елхл <п»1 • •	(n>, п — неприводи-
мый однородный степени п многочлен от п2 независимых переменных XQ. (Указание. Рассуждая от противного, предположить, что det (xiJ)=g1 (..., Xjj, ...)g2(..., xZy, •••)• Так как det (х/у)—линейный однородный многочлен от переменных, стоящих в одном фиксированном столбце, то один из множителей gn g2 является линейным однородным многочленом от xzy, 1 i и, при фиксированном /, в то время как другой совсем не зависит от xzy,	Аналогичные
рассуждения сохраняются при замене столбцов на строки. Пусть, скажем, хи входит в gv Тогда g2 не содержит xzy,	откуда
следует, что g2 не содержит xzy, 1 Z, i^n, т. е. g2 — константа.)
§ 4. Поле отношений
1.	Построение поля отношений целостного кольца. В предыдущих двух параграфах было установлено много свойств, общих для Z и Р [X]. Наша ближайшая цель — вложить Р[Х] в поле, причем сделать это нужно самым экономным способом, образцом для которого может служить вложение Z в Q. Фактически нисколько не сложнее
234
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
решать точно такую же задачу для произвольного целостного кольца А.
Рассмотрим множество ЛхЛ* (Л* = Л\{0}) всех пар (а, Ь) элементов а, Ь^А с Ь=/=0. Это множество разобьем на классы, полагая пары (а, Ь) и (с, d) принадлежащими одному и тому же классу, как только ad = bc\ в записи: (a, b)~{c, d). Ясно, что всегда (а, Ь)~(а, Ъ). Далее, {а, Ь)~ ~(с, d) <=> (с, d)~{at Ь) и, наконец, (a, b)~(c, d), (с, d)~ ~{е, f) => (а, Ь)~(е, /). Действительно, имеют место равенства ad = bc, cf = de9 откуда adf = bcf = bde, т. e. d{af— be)=^O. Ho d=/=0, и в силу целостности кольца А получаем af = be, что и означает (a, b)~(e, f). Итак, отношение ~ рефлексивно, симметрично и транзитивно, т. е. (см. § 6 гл. 1) оно является отношением эквивалентности на множестве Ах А* и, следовательно, определяет разбиение Ах А* на непересекающиеся классы.
Пусть Q (Л) — множество всех классов эквивалентности или, что то же самое, Q (Л) есть фактормножество АхА*/~ множества Л х Л* по отношению эквивалентности ~. Будем обозначать символом [а, Ь] класс, в котором лежит упорядоченная пара (а, Ь). По определению
[а, b] = [c, d] <=> ad = bc.	(1)
Если на множестве ЛхЛ* задать операции сложения и умножения формулами
(а, Ь) + (с, d) = (ad + bc, bd)\ (а, b) (с, d) = {ас, bd)
(а это возможно, поскольку в Л из b=H=O, d=/=0 следует bd=#O), то эти бинарные операции можно перенести на Q (Л). В самом деле, нам нужно показать, что
. ,	. .. I (a,b) + (c,d)~(a',b') + (c,d),
(а , b )~(а, о) =» S , . ч	, ,ч . ..
I (а> b)-[c, d)~(a , b )•(<?, d).
То же самое выражается соотношениями (ad-\-bc) b'd — (a'd-\-b'c) bd, ac-b'd = a’c-bd,
истинность которых прямо вытекает из условия a'b—ab'. Аналогичный результат получим, заменяя (с, d) на (с', d’), где cd’ = c’d. Мы приходим к заключению, что на Q(A) операциями сложения и умножения, не зависящими от
ПОЛЕ ОТНОШЕНИЙ
235
$ 4J
выбора представителей в классах эквивалентности, будут [a, b] + [с, d] = [ad + be, bd]; [a, b] [c, d] = [ас, bd]. (2) Здесь следовало бы писать [а, Ь] Ф [с, d] и [л, Ь] О [с, d], но без ущерба для ясности Ф и О заменены обычными знаками суммы и произведения.
Убедимся теперь в том, что Q (Л), рассматриваемое вместе с операциями (2), есть поле. Действительно, например, из соотношений
[а, ft] + ([c, d]4-[e, /]) = [а, ft] + [cf + de, df] =
= [adf + bef + bde, bdf],
([a, ft] + [c, d])4-[e, /] = [ad4-ftc, bd]-j-[e, f] = = [adf + bef + bde, bdf]
вытекает закон ассоциативности для операции сложения. Ассоциативность умножения очевидна. Далее, соотношения
([a, ft] 4-[с, d]) • [е, f] — [ade + bce, bdf], [a, ft][e, f] + [c, d][e, f] = [adef + bcef, bfdf] — — [(ade + bee) f, (bdf) f]
и условия (1) равенства классов эквивалентности показывают, что выполняется закон дистрибутивности. Столь же просто проверяется коммутативность операций сложения и умножения. Нулем для сложения является [0, 1] ([О, l]+[a, ft]=[a, ft]), а единицей для умножения—[I, 1]. Далее, —[а, &] = [—a, ft], поскольку [a, ft] + [—а, Ь] — = [0, &2] = [0, 1]. Все это вместе взятое означает, что Q(A)—коммутативное кольцо с единицей. Если [а, &]=£ #=[0, 1], то а#=0 в А, стало быть, [ft, a]£Q(A) и [a, ft] [ft, a] = [l, 1], так что мультипликативным обратным к [a, ft] =/= [0, 1] служит [ft, а]. Тем самым показано, что Q (А) — поле.
Сопоставление йн»[а, 1] определяет инъективное отображение f: А—>Q(A), которое на самом деле является (моно)морфизмом колец (f (а 4- ft) = f (а) 4- f (ft), f (ab)= -f(a)f(b)‘, a^=b =$>f(a)=£f(b)). Для любого элемента x = [a, ft]CQ(A) имеем
[ft, l]x = [a, 1],
так что x есть «отношение» f (a)/f (ft) элементов из f (Л). По этой причине Q (Л) называется полем отношений кольца Л.
236
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
Удобно отождествить каждый элемент а£А с его образом f(a) = [a, 1] С Q (Л), т. е. заменить А на f(A). Можно поступить несколько иначе: заменить каждый из элементов [a, l]€Q(/4) на а С Л, оставив без изменения все другие элементы поля Q(X), и произвести надлежащие замены в формулах (2). Именно, следует положить а + [Ь, с] = [ас + b, с]; a[b, c] = [ab, с].
В результате целостное кольцо А окажется с самого начала подкольцом поля, изоморфного Q(X) и изображаемого обычно тем же символом ф(Л). После такого отождествления разумно называть элементы [а, Ь] дробями и писать короче и в привычной форме
[«. H =
Введенные выше правила действий с классами [а, /?] повторяют, как нетрудно догадаться, правила действий с дробями в поле (см. (10) в п. 5§ 4 гл. 4). Нами доказана
Теорема 1. Для каждого целостного кольца А существует поле отношений (или поле частных, поле дробей) Q(X), элементы которого имеют вид а/b, а^А, 0=?^&€Л. Действия с дробями подчиняются правилам (1), (2), где следует положить [а, Ь\ = а/Ь. В
Конструкция полей отношений довольно часто используется в математике. Ее естественность оправдывается хотя бы тем, что поле Q есть не что иное, как поле отношений Q (Z) кольца Z. Легко видеть (проверьте это!), что (?(Л)^А, если А — поле.
Замечание. Можно доказать, что если целостное кольцо А есть подкольцо поля Р, в котором каждый элемент х записывается в виде отношения а/b элементов а£А, 0 =^b (Е А, то P^Q(A). Например, Q(j/rf) = = Q(Z[/d|).
2.	Поле рациональных дробей. Пусть Р — поле, Р [X] — кольцо многочленов над Р. Поле отношений Q(P[X]) кольца Р[Х] обозначается символом Р(Х) (смена квадратных скобок на круглые) и ' называется полем рациональных дробей от переменной X с коэффициентами в Р.
Следует заметить, что поле рациональных дробей Р(Х) всегда содержит бесконечное число элементов, а его характеристика совпадает с характеристикой поля Р. Поле
§41
ПОЛЕ ОТНОШЕНИЙ
237
PF(X) доставляет пример бесконечного поля характеристики р > 0.
Каждая рациональная дробь поля Р (X) записывается (притом многими способами) в виде f/g (или если не стремиться к экономии бумаги), где /, g—многочлены из кольца Р[Х], g=^Q. По определению f/g = f1/g1 ФФ fgi= ^f±g. Естественно назвать f числителем, a g знаменателем дроби f/g. Дробь не меняется, если ее числитель и знаменатель умножаются на один и тот же ненулевой многочлен или сокращаются на любой общий множитель. В частности, целое число (положительное или отрицательное) deg/ — degg не зависит от представления ненулевой рациональной дроби в виде отношения (частного) f/g двух многочленов. Это число называется степенью дроби. Рациональная дробь от переменной X называется несократимой, если ее числитель взаимно прост со знаменателем. С точностью до множителя из Р, общего для числителя и знаменателя, любая рациональная дробь f/g однозначно определяется некоторой несократимой дробью. В самом деле, деление f и g на НОД(/, g) приводит к несократимой дроби, а равенство = двух несократимых дробей, выраженное в виде fgl = f1g, дает f = cflt с£Р, g = cgi (использовать следствие теоремы 4 § 3).
Если deg (f/g) = deg f — degg<0, то (несократимая) дробь f/g называется правильной (нулевой многочлен причисляется к правильным дробям, поскольку мы условились считать degO=—оо).
Теорема 2. К/аждая рациональная дробь из Р (X) однозначно представима в виде суммы многочлена и правильной дроби.
Доказательство. Алгоритм деления с остатком, примененный к числителю и знаменателю дроби f/g, дает равенство f = qg+ г, где deg г < degg. Теперь f/g q + г/g есть искомая запись, сравнение которой с любой другой записью того же типа f/g = q + r/g (q, г, g € Р [X], deg г < deg g) приводит к соотношению
_q — q = r/g—r/g = (rg—^gVgg-Так как q—q£P[X], а
deg ((rg—~rg\/gg) = deg (rg—rg) — deg g— degg <0, то это возможно лишь в случае q — q = Q и r/g=r/g. |
238
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
3.	Простейшие дроби. Правильная рациональная дробь flg£P(X) называется простейшей, если g = pn, п^\,
р = р (X)— неприводимый многочлен, причем deg / < < degp.
Основной теоремой о рациональных дробях является
Теорема 3. Каждая правильная рациональная дробь может быть разложена, и притом единственным образом, в сумму простейших дробей.
Доказательство распадается на две части — существования разложения и его единственности.
I. Пусть f/g£P(X)—данная нам правильная рациональная дробь, в которой без ограничения общности многочлен g можно считать унитарным. Предположим, что g = g1g2 — произведение двух взаимно простых унитарных многочленов. Согласно результатам § 3 имеет место соотношение
1 =“1£1 + «2Й2
с некоторыми и., иг £РГХ1. Умножив обе части на f, получим
Если fu1 = qg2 + v2, degu2 < degg2, то
/ = ^2 + ^1.	(3)
где v1 = qg1 + fu2. Так как dega2<degg2, a degf<degg— в силу условия правильности дроби, то (3) может выполняться только при deg < deggr
Разделив обе части соотношения (3) на g^, мы получим разложение дроби f/g в сумму двух дробей
f/g^Vi/gi + vJg»
причем обе дроби в правой части — правильные. Если в какой-нибудь из этих дробей знаменатель gz есть снова произведение двух взаимно простых многочленов, то к этой дроби можно применить предыдущие рассуждения и получить для нее разложения такого же типа Действуя таким образом, мы придем в конечном счете к сумме
1 g
т
(4)
f 4]
ПОЛЕ ОТНОШЕНИЙ
239
ПОД (ah pz) = 1, deg az < nz deg ph где знаменателями являются степени неприводимых унитарных многочленов pit входящих в разложение g:
g = p"'pn2‘ ... рп«	(5)
tn
(Pi^Pj при 1=#/).
Правильную дробь а/рп мы подвергнем дальнейшему расщеплению. Так как по условию dega<ndegp, то алгоритм деления с остатком приведет нас к системе равенств
Г1 = ЯгРп~2 + г2,
Гп-2— Яп-1Р~^~Гп-1’ п-1 = Яп’
где deg?z<degp для всех частных qif ..., qn. Мы видим, что
а = qj”-' + q2pn~* + ...+qn_lp + qn, откуда
а  Я\ I Яъ ।	। Яп—i । Яп
рП	р 1 р2 "I • • • "Г" рП^1~Г рП
Так как deg^z<degp, то дроби qjp1 являются простейшими.
II. Переходя к вопросу о единственности разложения, предположим, что, кроме полученного нами представления, т / п1 \
-=X ( У )’ de§ а<7 < de§ Pi g	Pl J
правильной дроби f/g в виде суммы простейших дробей имеется еще одно разложение
f и ( V'1 h \ Т_ V' ( V' bkl i
в котором, возможно, встречаются слагаемые bktIqlk со знаменателями qlk, не .входящими в (6). Добавляя, если
240
КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ
[ГЛ. 5
нужно, в оба выражения для f/g слагаемые с нулевыми числителями и bklt а затем вычитая одно выражение из другого и приводя подобные члены (с одинаковыми знаменателями), мы придем к тождеству
на Pi. Но НОД
Здесь + ц и при i>m за взяты какие-то qkt a Nj выбраны такими, что
N- ^^=7^=0.	(8)
м
Умножая тождество (7) на	мы получим полино-
i = 1 миальное тождество
м
(«1, N. — bi, Wx) П/’Г' + /’1Ы = 0-
1 = 2
Вид многочлена и нас не интересует. Важно то, что из м этого тождества следует делимость (ab Nt—
i = 2	1
м	\
П рГ*’. Pl = 1. поэтому pt I (alt Ni -
1 = 2	/
— bt,Nt). Остается вспомнить, что deg(a1>yVi— £>i, ^max {degai, л\, degfe), Af,}<degp). Стало быть, aj, — — bi, w, = 0, вопреки предположению (8). |
Доказательство теоремы 3 вполне конструктивно (если считать известным разложение (4)) и может быть использовано для фактического представления правильной дроби в виде суммы простейших дробей.
Заметим, что если g=(X—c)"h, /г(с)#=О, то f _	। f— bih
g (X — c)K-r(X— c)nh'
Положив Ьг = f (c)/h (с), мы получим f(c) — b1h(c) = O и, стало быть, f—b1h = (X—c)^ (см. § 1 и гл. 6). Таким образом, f-bih_________________________fi
(X.—c)nh ~(X—c)n~4i‘
§4]	ПОЛЕ ОТНОШЕНИЙ	241
Применяя к этой дроби тот же прием, мы понизим еще на единицу показатель при X—с в знаменателе и т. д. После п шагов мы придем к разложению
п А
g~ (X—c)nh~~ h + (Х—сУ ’ bk£P-
Если h (а значит, и g = (X—c)nh) полностью разлагается на линейные множители, то, отщепляя по очереди простейшие дроби bki!{X—с^к и используя при этом свойство единственности, мы несколько другим путем придем к результату, сформулированному в теореме.
В том случае, когда все неприводимые множители pz в (4) линейны или квадратичны и, следовательно, простейшие дроби имеют вид
(Х — с)п ИЛИ (X* + aX + b)n ’ Ь> с> е€ Р> (9) удобно также пользоваться методом неопределенных коэффициентов. Он заключается в том,х что следует записать fig в виде суммы дробей вида (9), умножить -обе части равенства на g и уже в полученном соотношении между многочленами придать X подходящие значения из Р для определения коэффициентов d, е, ... Как будет вытекать из результатов следующей главы, метод неопределенных коэффициентов действует без ограничений, если Р — поле комплексных или вещественных чисел. Именно над этими полями простейшие дроби чаще всего и рассматриваются, выступая в роли технического инструмента при интегрировании рациональных функций.
УПРАЖНЕНИЯ
1.	Построить поле отношений R ((A)) кольца R. [[X]] формальных степенных рядов от X с коэффициентами в поле R. Опираясь на упражнение 6 § 3, показать, что каждый элемент поля R. ((X)) имеет вид так называемого мероморфного степенного ряда
ср (Х) = «_/лХ-^ + а_те+1Х-^ + 1+ ...
... +a>1X-1 + (7o + aiX + «2X2+ ..., а/€IR,
в котором допускается конечное число отрицательных показателей.
242	КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ	[ГЛ. 5
Другими словами, ф (X) =Х“/Я/(Х), где /(X) —обычный степенной ряд из R [[X]].
2.	Будем понимать под R (X, Y) (соответственно R ((X, F))) поле отношений кольца многочленов R [X, F] (соответственно целостного кольца R [[X, К]]; см. упражнение 7 § 2). Показать, что
R(X, n = {R(X)}(r) = {R[X]}(r).
Изоморфны ли поля R ((X, К)) и {R ((X))} ((К))? (Ответ. Нет.)
3.	Пусть бесконечная последовательность вещественных чисел а0, «1, а2, ... периодична, начиная с некоторого члена. Показать, что степенной ряд f (X) = я0 + aiX +	+ • • • записывается в виде
рациональной дроби из R (X).
Глава 6
КОРНИ МНОГОЧЛЕНОВ
Займемся тем, ради чего в прошлом изучали алгебру,— корнями многочленов. Эта область перестала быть доминирующей в алгебре, но ее важность никем не оспаривается. Дело в том, что многие задачи математики в конечном счете сводятся к вычислению отдельных корней конкретных многочленов или к качественному описанию их совокупности. Нам удастся затронуть лишь простейшие свойства корней, но их, во всяком случае, будет достаточно, чтобы в полной мере оценить особое место, занимаемое полем С комплексных чисел.
§ 1.	Общие свойства корней
1.	Корни и линейные множители. Пусть коммутативное кольцо А с единицей содержится в целостном кольце К.
Определение. Элемент называется корнем (или нулем) многочлена f € А [X], если f(c) = O. Говорят также, что с—корень уравнения [(х) = 0.
Необходимость рассмотрения колец, содержащих А собственным образом, станет понятной, если вспомнить, что многочлен f(X) = X2+\ над R не имеет нулей в R, но f (г) — О, i £ С = R [f]. Сначала мы рассмотрим, однако, случай К = А.
Теорема 1 (теорема Безу). Элемент с^А является корнем многочлена f С А [X] тогда и только тогда, когда X—с делит f в кольце Л[Х].
Доказательство. Эта теорема—часть более общего утверждения, которое мы могли бы доказать давно. А именно, алгоритм деления с остатком (теорема 5 § 2 гл. 5) гласит, что f (Х) = (Х— с) q (X)+r (X), где degr(X)< <deg(X—с) = 1. Значит, г (X) — константа. Подстановка с вместо X (т. е. применение отображения Пс из теоремы 2 § 2 гл. 5) дает f(c) = r, так что всегда
f(X) = (X-c)q(X) + f(c).	(1)
В частности, /(с) = 0	f (X) = (X—-с) q (X). |
244
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
Деление многочлена f (X) с коэффициентами в целостном кольце А на линейный многочлен X—с удобно осуществлять по так называемой схеме Горнера, более простой, чем общий алгоритм деления с остатком. Именно, пусть
f (X) — а0Х” + а1Хп'~1 + ... + ап, а^А.
Согласно формуле (1)
q(X) = bbX"-' + b1Xn-*+ ... +Ьп_1У bj^A.
Сравнивая в этой формуле коэффициенты при одинаковых степенях X (начиная со старших), мы после небольшого преобразования получим
*о = °о		bk = bk-ic + ak			f (c)=fe„_ic+a„
(2)
так что заодно вычисляется значение f при X =с. Рекуррентные формулы (2), в которых и заключается «схема Горнера», удобны при счете.
Ввиду теоремы 1 естественно ввести следующее более общее
Определение. Элемент с£А называется k-кратным корнем (или k-кратным нулем) многочлена f £ А [X], если f делится на (X—c)k, но не делится на (X—c)k+1. Корень кратности 1 называется простым корнем (соответственно при k = 2 и 3 говорят о двойном и тройном корне).
Итак, с£А — корень кратности k многочлена f С А [X] тогда и только тогда, когда f (X) = (X—c)kg (X), где НОД(Х—с, g(X))-l. Последнее условие в силу формулы 1 выражается также неравенством g (с) Далее, ввиду теоремы 1 § 2 гл. 5 замечаем, что deg f = k + deg g, откуда fe^deg/. Имеет место важная
Теорема 2. Пусть А — целостное кольцо, f=^=Q — многочлен из А [X] и с1, ...» сг—его корни в А кратностей соответственно kY, ..., kr. Тогда
ПХ)--=(Х-ф ... (X—cr)krg(X), g(X)€4[X], g(c()=/=0, i = 1, ...» г.
ОБЩИЕ СВОЙСТВА КОРНЕЙ
245
S 1]
В частности, число корней многочлена f € А [X], рассматриваемых вместе с их кратностями, не превосходит степени многочлена
... -\-kr^idegf.	(3)
Доказательство. Достаточно перейти к полю отношений Q (Л) (если кольцо А не было полем с самого начала) и воспользоваться однозначностью разложения на простые множители (в данном случае на X—cv ... .... X—сг) в кольце Q(/4)[XJ (результаты §§ 3 и 4 гл. 5). Однако необходимости в столь мощном оружии сейчас нет. Будем рассуждать прямо.
Так как deg/ = (fe1 + ... +fer) + degg, то неравенство (3) — следствие делимости f на (X—сх)*‘ ... (X—cr)kf, которую мы установим индукцией по г. При г — 1 доказывать нечего. Пусть мы уже знаем, что
f(X) = (X-c^ ... (X-crJ'->h(X).
Так как у нас сг—с1=^0, ...,сг—сг_х#=0 и А — целостное кольцо, то элемент сг не является корнем многочлена (X—. .(X—cr_l)fc'—». Но сТ—^-кратный корень многочлена /, т. е. /(X) —(X—сг)* и(Х). Поэтому h(cr)~0. Соответственно /г(Х) = (Х—сг)5ц(Х), s^.kr. Имеем
(Х-с,)Ч(ХН(Х) =
= (X-Ф... (X-с,(X—cr)s v (X).
Используя закон сокращения в целостном кольце А [X], приходим к заключению, что s = kr. |
Без предположения о целостности кольца А теорема 2 перестает быть верной, как показывает пример многочлена f(X) = X3 над кольцом Z8: f (0) = f (2) = f (4) = f (6) = 0. Разложение f на простые множители в Z8[X] также неоднозначно: f - X3 = X (X —4)2 = (X —2) (X2 + 2Х + 4) = = (X —6) (X2 —2Х + 4).
Из теоремы 2 вытекает
Следствие. Дса многочлена f, g С А [X] степени ^.п, принимающие одинаковые значения при подстановке п + 1 различных элементов из целостного кольца А, равны: f = g-
246
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
Доказательство. Положим h = f—g, так что deg/i^n. По условию h(c1) = ... = h(cn+1) = 0 для попарно различных элементов q, сп+1£А, т. е. многочлен h степени имеет не менее п+1 корней. Полученное противоречие с неравенством (3) можно устранить, лишь признав, что /1 = 0. |
2.	Полиномиальные функции. Следствие теоремы 2 позволяет решить затрагиваемый ранее (см. п. 1 § 2 гл. 5) вопрос о соотношении теоретико-функциональной и алгебраической точек зрения на многочлены. Каждому многочлену f € А [X] ставится в соответствие функция
f: at->f(a), Va$A.
Множество всех таких функций составляет кольцо Дро1 полиномиальных (или целых рациональных) функций, являющееся подкольцом кольца функций АА = {А— с поточечным сложением и умножением (см. пример 3 в п. 1 § 4 гл. 4 и теорему 2 § 2 гл. 5). Совершенно аналогичным образом вводятся полиномиальные функции от нескольких независимых переменных.
Как уже отмечалось ранее, отличный от нуля многочлен Х2 + Х£ €F2[X] определяет нулевую функцию. Вообще, если f (Х)= = (ХР— X) g (X) — многочлен над конечным полем из р элементов, то нулевая функция, поскольку хр—х = х(хр~1—1) = 0 для всех Лишь в случае deg/^p—1 многочлен [X] определяется своей функцией J. Произвольный многочлен f g [X] можно заменить однозначно определенным редуцированным многочленом f* степени <р—1, взяв в качестве f* остаток от деления / на Хр— X. Тогда, очевидно, f =f*.
В случае бесконечных полей или целостных колец ситуация значительно проще.
Теорема 3. Если А — целостное кольцо с бесконечным числом элементов, то отображение кольца многочленов А [X] на кольцо полиномиальных функций Дро1, определяемое соответствием является изоморфизмом.
Собственно говоря, это есть переформулировка следствия теоремы 2, поскольку речь идет лишь о том, что многочлену f += 0 сопоставляется ненулевая функция f, т. е. f (а) =#0 хотя бы для одного а£А. На самом же деле f имеет не более чем п нулей в А, если degf = п. | На основании теоремы 3 кольцо многочленов над бесконечным полем Р отождествляют с кольцом полиноми
$ 1]	ОБЩИЕ СВОЙСТВА КОРНЕЙ	247
альных функций (обозначаемых f (х) с малой латинской буквой х), и остается только решить вопрос о том, как по ] (а фактически по нескольким значениям многочлена /) восстановить в явном виде сам многочлен.
Точная постановка задачи «интерполяции» заключается в следующем. Пусть &0, blt ..., bn (соответственно с0, с\, •••> сп) — п + 1 произвольных (соответственно различных) элементов поля Р. Требуется найти многочлен f € Р [X] степени п такой, что f (cz) = bit i = 0, 1, ..., n. Согласно следствию теоремы 2 решение задачи, если оно существует, единственно. Но один многочлен f с заданными свойствами всегда существует, как показывает интерполяционная формула Лагранжа
п
h (А —Ср).. .(X —Q-!) (X — Ci + 1)..,(X — Cn)
Впрочем, существование и единственность решения сразу усматриваются из линейной системы
1	• * • +^л“^0»
аос^ + а1с2~1+ ... +ап = Ьп
для коэффициентов а0, ..., ап искомого многочлена f. Определитель этой системы, являющийся определителем Вандермонда, отличен от нуля, и ai находятся по правилу Крамера. Удобство формулы (4) заключается в ее простоте и легкости запоминания. Некоторые преимущества иногда имеет интерполяционная формула Ньютона
f (X)=u04-u1 (X—с0)+• • •
(Х-с0) (X—q).. 4X-cn_J,	(5)
где коэффициенты u0, ult и„ определяются путем последовательной подстановки значений X — сй, Х = с1, ... ..., Х — с„. Интерполяционные формулы (4), (5) находят практическое применение при вычислении и графическом изображении функции <р: R—>R, заданной таблично или полученной из опыта. Зная из каких-нибудь косвенных соображений, что функция <р ведет Себя на интервале / вещественной прямой R достаточно хорошо, стараются приближенно изобразить ср на 1 такой «гладкой» функцией как полиномиальная.
248
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. б
При этом используют в качестве так называемых «узлов интерполяции» часть точек с0,	, сп внутри ин-
тервала /, в которых (и только в них) известны значения Ф (£/) = &/. Тонким вопросам выбора узлов интерполяции и разработке общих методов приближения функций посвящены целые разделы математики. Стоит отметить, что применение интерполяционных процессов сыграло большую роль в развитии теории трансцендентных чисел (определение алгебраических и трансцендентных чисел см. в § 2 гл. 5), так что здесь смыкаются интересы теории функций, теории чисел и алгебры.
Отметим в заключение, что каждой рациональной несократимой дроби f/g € Р (X) (см. § 4 гл. 5) и каждому расширению FzdP с, бесконечным числом элементов сопоставляется рациональная функция f/g: F{f/g)—>F с областью определения F(fjgU получающейся из F удалением конечного числа элементов — нулей многочлена g в F. Можно доказать, что при указанных условиях
у-
отображение	взаимно однозначно. Нам это
утверждение не потребуется. Интуитивно оно ясно. Несмотря на это соответствие, нужно делать четкое различие между рациональными функциями и рациональными дробями. Рациональная функция хн-> 1/х не определена в точке х = 0, в то время как вопрос об определимости рациональной дроби \/Х вообще не возникает.
3.	Дифференцирования кольца многочленов. Функциональная точка зрения на многочлены делает естественным следующее определение. Пусть
f (X) = я0Х" +а1Х"-' + ... +ап^Х + ап
— многочлен степени п над полем Р, Его производной
$ I)	ОБЩИЕ СВОЙСТВА КОРНЕЙ	249
называется многочлен
Г (Х) = па0Хп~1 + (п —i)a,Xn^+ ... + a„_t.	(6)
Если P = R— поле вещественных чисел, a f— связанная с f полиномиальная функция, то определение (6) производной совпадает с обычным ее определением как предела
lim 7(x+Ax)-£(x)t
Ах -> О
В случае же произвольного поля Р говорить о каких-либо свойствах непрерывности полиномиальной функции бессмысленно (что такое сходящаяся последовательность в Z„?) и нужно исходить из формального определения (6).
Имеют место хорошо известные из анализа соотношения
(а/+₽£)' = pg7, а, р £ Р,	(7)
(fgY = f'g+fg'-	(8)
Соотношение (7) прямо вытекает из (6) и из определения суммы многочленов. Используя (7) и определение произведения многочленов, проверку (8) можно свести к тому случаю, когда f = Xk, g = Xl:
(Xk+ 9' = (k +1) Xk+= (kX^1) X1 + Xk (IX1-1) =
= (XkY Х1 + Х*(Х1)'.
Обобщением (8) служит легко доказываемая индукцией по k формула k
(fift- • •/>)'= S ft- • -fi-ififi+i ---fk-
i= 1
В частности,
(fkY = kfk^f\	(9)
Соотношения (7), (8), переписанные в терминах отображения	(говорят также, что ^ — оператор
дифференцирования), наводят на мысль ввести в рассмотрение для произвольного кольца Д отображение S): К—^Д, обладающее свойствами
(и + и) -= @)и + @)и,	(7')
(uv) = (@)и) v + и (@)о).	(8')
Такого рода отображения кольца Д в себя, называемые
250
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
дифференцированиями, весьма полезны для изучения К, а их множество Der(/C) оказывается интереснейшим объектом, вводящим в обширную область математики (группы и алгебры Ли).
Обобщением (8') служит формула Лейбница
S>m(uv)= 2 (7) &>ku	(8")
л=о '
получаемая индукцией по 1 (применение <£) к (8"), использование (8 ) и соотношение (^J + l ^) = (	)
дадут (8") при /п+1).
В случае /С = Р[Х] из соотношений (7'), (8'), дополненных правилом
= W, непосредственно вытекает, что £>f (X) = ff(X) ФХ.
Стало быть, любое дифференцирование кольца многочленов Р [X] определяется заданием единственного многочлена ФХ. При ФХ = 1 мы получаем обычный оператор дифференцирования .
4.	Кратные множители. Результат /n-кратного применения отображения к f (X) обычно обозначается символом f{m)(X). Очевидно, что
f (Х) = а0Хп+а1Хп~1+...+ап => f^(X) = n\aQi ftn+i) (Х) = 0.
Если Р — поле нулевой характеристики, то deg/'= deg/—1..
Однако для полей конечной характеристики р это уже не так, поскольку
(XkP)'^kpXkP-l==Q.
Все же некоторую пользу из рассмотрения производной можно извлечь и в общем случае. Разделив произвольный многочлен f£P[X] на (X—c)2t с£Р, Pz^P, а затем записав (линейный) остаток в виде (X—с)$ + г,
| 11	ОБЩИЕ СВОЙСТВА КОРНЕЙ	251
где s, rgF, мы придем к соотношениям / = (Х—с)Ч + | (X— c)s + r, f = (Х—г)[2/ + (Х—c)t'] + s. Подставив в них значение Х = с, получим r = f(c), s = f' (с), т. е.
f (X) = (Х-с? t (X) + (X—c)ff (c)+f (с).
Мы пришли к следующему утверждению.
Теорема 4. Пусть Р—произвольное поле и F — любое его расширение. Многочлен f [X] имеет кратный корень c£F тогда и только тогда, когда f (с) = f' (с) = 0.1
Пр и мер 1. В любом поле характеристики р многочлен Хп — 1 имеет лишь простые корни, если п не делится на р. Действительно, корни производной пХ*1"1 не могут быть корнями Хп — 1.
Далее предполагается, что Р — поле нулевой характеристики и без ограничения общности под Р можно понимать одно из полей Q, R или С. Унитарный неприводимый многочлен pi (X) в разложении
f(X) = Xp1(X)ft*.. .p( (X)ft,‘ ... pr(x)kr,	(10)
многочлена f(X) g Р [X] называется (по аналогии с определением кратного корня) /ггкратным множителем для f. Ранее уже говорилось о том, что получить разложение (10) па практике довольно сложно. Опишем вкратце метод, основанный на понятии производной и дающий возможность узнать, содержит ли f (X) над данным полем Р (или над его расширением) кратные множители.
Теорема 5. Пусть р (X)—k-кратный неприводимый множитель многочлена f^P[X] I, degp (X)^ 1). Тогда p(X) будет (k—\)-кратным множителем производной f'(X). В частности, при k=l f' не делится на р (X).
Доказательство. По условию f (X) = р (X)kg(X), где НОД(р(Х), g(X))=l, т. е. g(X) не делится на р (X). Применяя правила (8) и (9), находим
Г (X) = р (X)*-1 [kp' (X) g (X) + р (X) g' (X)].
Достаточно показать, что многочлен, стоящий в квадратных скобках, не делится на р(Х). Если бы это было не так, то на р(Х) делился бы многочлен kp' (X) g(X), что, однако, невозможно (см. следствия теорем 3 и 4 §3 гл.5), поскольку g(X) не делится на р(Х), adeg/sp'(X)< <degp(X). |
Понятно, что в ходе доказательства существенно использованы и неприводимость р(Х), и условие charP = 0.
252
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
Следствие 1. Для многочлена f (X) с коэффициентами в поле Р характеристики нуль следующие два условия эквивалентны:
(i) f имеет в некотором расширении F^P поля Р корень с кратности k\
(ii) /(»(с) = о, 1 </</?—1, но f(k'(c)^Q.
Для доказательства нужно k раз применить теорему 5, имея в виду линейный множитель р(Х) = Х—с и с самого начала заменяя, в случае необходимости, Р на его расширение F, содержащее корень с, |
Следствие 2. Если многочлен f £Р [X] степени 1 имеет разложение (10), то разложением для наибольшего общего делителя f и его производной f будет
нод(л W>-1p2(X)^-i...Pr(xA-1 (ii)
(НОД всегда можно считать унитарным многочленом).
Действительно, по теореме 5 каждый из простых делителей Pi (X) многочлена f (X) с каноническим разложением (10) входит в разложение /'(X) с показателем ki—1, т. е.
Г (X) = р, (Х)*--1 р2 (X)*1-1.. .р, (X)*'-1. и (X), где НОД (и, р^ = 1, 1 i г (предполагается, что Pi(Xy =1). Поэтому по известному нам признаку делимости (см. п. 2 § 3 гл. 5) мы заключаем, что НОД (/, /') вычисляется по формуле (11). |
Используя выражение (11) для НОД(/, /'), мы получаем средство освободиться от кратных множителей, входящих в разложение /(X). Именно, многочлен
g (X)=поД¥Гл=Pi (X) Pi (X)... pr (X)
содержит те же простые делители, что и /(X), но с единичной кратностью. Важно отметить, что многочлен g (X) можно найти, не зная фактически разложений для f и а лишь используя алгоритм Евклида.
Пример 2. Многочлен f (X) — X5 — ЗХ4-|-2Х3 + 2Х2 — ЗХ + 1 и его производная /' (Х) = 5Х4— 12Х3 + 6Х2 J-4X —3 имеют в качестве НОД унитарный многочлен X3 — ЗХ2-{-ЗХ —1=(Х—I)3. «Свободный от квадратов» многочлен g (X)=f (Х)/(Х — 1)3 = X2 — 1 = (Х — 1) (Х-|- 1) имеет два корня ± 1. Таким образом, f (Х) = (X— I)4 (Х+ 1) обладает корнем 4-1 кратности 4 и простым корнем —1.
| I]	ОБЩИЕ СВОЙСТВА КОРНЕЙ	253
5. Формулы Виета. В связи с теорией систем линейных уравнений мы уже имели случай упомянуть о благотворном влиянии на ее развитие хорошей системы обозначений, приведшей, в частности, к определителям. ?>го заслуга математиков XVIII и начала XIX вв. Но гораздо раньше, когда алгебра еще отождествлялась с. «анализом уравнений», решающее усовершенствование алгебраических обозначений у Ф. Виета и у Р. Декарта коснулось теории многочленов и алгебраических уравнений. От частных типов уравнений с числовыми коэффициентами, скрывавшими общие закономерности, был совершен смелый переход к уравнениям с буквенными коэффициентами. Новый способ записи нередко порождает новые результаты. У Декарта это завершилось революционным применением алгебры к геометрии. Мы остановимся на более скромном достижении его предшественника Виета.
Предположим, что унитарный (со старшим коэффициентом =1) многочлен /£Р[Х] степени п имеет в поле Р или в некотором его расширении п корней q, с2, .. ., сп, среди которых, возможно, есть и одинаковые. Тогда в соответствии с теоремой 2 справедливо разложение
/(Х) = (Х-С1)(Х-с2)...(Х-С„).
Запишем f (X) в обычном виде по степеням X:
f (X) - X" +д1Х'2"1 + • • • +аЛХ"-*+ ... +ant
для чего перемножим все двучлены X—q и приведем подобные члены. Тогда для коэффициентов а19 .ап получатся выражения через корни clf ..., сп:
at = — (q + с2 -|- . . . + сп),
ak = (—^k. .2	(12)
Ч < Ч <••• <
ап = (—\Усус2.. .сп.
Формулы (12) называются формулами Виета,
Если бы многочлен f не был унитарным, т. е. имел старший коэффициент «0=^=1, то формулы, аналогичные (12), давали бы выражения для отношений az/a0.
254
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
Формулы Виета, устанавливающие явную связь между корнями и коэффициентами произвольного (унитарного) многочлена, замечательны тем, что их правые части не меняются при любых перестановках корней си ..., сп. Это дает нам повод ввести понятие симметрической функции, подобно тому как в связи с определителями оказалось удобным рассматривать общие кососимметрические функции. Согласно определению, приведенному в следствии теоремы 3' из п. 2 § 2 гл. 5, элемент л симметрической группы Sn действует на функцию f (хп ..., хп) от п аргументов по правилу
(л?) (Хх....Х„) =f	...» Хя-1(п)).
Функция f называется симметрической, если = / для всех	Примером симметрических функций служат
так называемые элементарные симметрические функции sk:
.... Х„) =	5	Х1,Х1г...Х1	(13)
1 < *1 < Ч < ... < ik < П
Они позволяют переписать формулы (12) в виде
ak = (-Vfsk(<\, сп), /е= 1, 2, ..., и, (12') так что с точностью до знака коэффициент ak многочлена f есть значение функции sk на множестве корней многочлена /. Обратим внимание на тот факт, что по определению ak£P, хотя корни q, ..., сп, вообще говоря, лежат в некотором расширении FzdP. Вопрос о существовании F мы сейчас не затрагиваем. Но иногда разложение многочлена на линейные множители является прямым следствием свойств поля Р.
Пример. Рассмотрим многочлен ХР-1—1 над конечным полем F^. Мы знаем, что	для всех xgFp, т. е. все ненулевые
элементы — корни многочлена ХР~1— 1. Стало быть, имеет место разложение
1 = (Х —1) (X—2).. .(X —(р— 1)).	(14)
Предполагается, что мы уже настолько освоились с полем F^, что без труда различаем двойственную природу чисел 1, 2, ..., р—1 как обычных элементов из Z и как элементов поля Fp = Z/pZ (представителей классов вычетов {i J^). Из (7), (6) и (8) получаем
$*(!> 2, ...» р—1)^0(modр),	£=1,2, ..., р —2,
...» р—1)^=—1 (modp).
I n
ОБЩИЕ СВОЙСТВА КОРНЕЙ
255
Последнее соотношение, переписанное в виде
(р_ I)! 4-1 = о (mod р)	(15)
Н КИК тиковое известное под названием теоремы Вильсона, выражает фактически необходимый и ^'достаточный признак простоты целого •пн лп р. Действительно, выполнение (15) для простых р мы только чго доказали. С другой стороны, р=^рхр2 => (р — 1)!=р3/
(р — 1)1 + 1 ^0 (mod р!> => (р— 1)! +1 ^0 (mod р). I
УПРАЖНЕНИЯ
1.	Будет ли кольцо полиномиальных функций над полем из р моментов целостным?
2.	Пусть Р— бесконечное поле и f—ненулевой многочлен из P|X|, ...» Хп]. Опираясь на теорему 3 и используя индукцию по п, доказать существование ах, . ..,ап£Р, для которых f (alt ..., ап) 0. Эго дает изоморфизм Р [Хх,	с кольцом полиномиальных
функций от п переменных над Р.
3.	Ненулевой многочлен	•••» степени < р по каж-
дой переменной обладает сформулированным в упражнении 2 свойством: f(alt . ..,ал)^0 для некоторых а19 ...tan£Zp. Показать, что любой многочлен f^Zp[Xif ...» Хп] можно записать в виде
п
f(Xlt ..Л„) = 2 gi (Х1.....Хп) (XP-Xi)+f*(Xi......Х„),
(=1
где /*— редуцированный многочлен (degx /* <: р— 1, 1 = 1,2,...,/:) степени deg deg f. Сделать обоснованное заключение, что отображение fi—>/ = /* является эпиморфизмом кольца Zp[Xlt Хп] на кольцо полиномиальных функций от п переменных над Zp с ядром п
(х?-х<)гр1хъ
i=i
4.	Теорема (Шевалле). Пусть f (Хх,..., Хп)—однородный многочлен (форма) над Zp степени г < п. Тогда уравнение f (xlt . ..,*„)= 0 имеет хотя бы одно нетривиальное решение. (Указание. Так как /—форма, то, очевидно, /(0, . ..,0) = 0. Рассуждая от противного, предположить, что (аи ..., ап) (0, ...» 0) => f (alt ..., ап) ф 0. При помощи упражнения 3 и малой теоремы Ферма вывести отсюда, что редуцированным многочленом для g(X1, ...,ХП)=1—f (Xlt ... ...,X„)^-i будет g*(Xb ...,Хл) = (1-ХР-Ч...(1-ХР-1). Но
degg = (p— l)deg/ = (p— 1) г < (р— 1) п = degg*.
Полученное противоречие доказывает теорему.)
256
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
Несколько изменив рассуждение (вычислив сумму
2	£(*1»	Двумя способами), доказать, что общее
Хи ^^xnEZp число решений всегда делится на р.
5.	Пусть f (хъ ...,хп)— целочисленная квадратичная форма. Теорема Шевалле (см. упражнение 4), сформулированная на языке теории сравнений, утверждает, что при сравнение
f(xlf ..., x„)^0(modp)
имеет ненулевое решение. Проверить, что все решения сравнения х2 —2г/2 = 0 (mod 5) тривиальны и, следовательно, условие г < п существенно.
6.	Показать, что НОД (f', /)=1, если charP = 0, f—неприводимый над полем Р многочлен и /'— его производная.
7.	Доказать, что /'=0 => / = const для многочлена f (X) над полем нулевой характеристики и /'=0 => f(X) = g(Xp) для многочлена f (X) над полем характеристики р >0 (g—некоторый другой многочлен).
8.	Из п. 3 мы знаем, что каждое дифференцирование кольца многочленов Р [X] имеет вид Ти: f uf\ а£Р[Х]. Установить справедливость утверждений:
(i)	множество констант (то, что переходит при дифференцированиях в нуль) — подкольцо в Р |Х];
(ii)	произведение TuTVt вообще говоря, не является дифференцированием, но если charP = p>0, то степень (Ти)р—дифференцирование;
(iii)	коммутатор [Та, Tv] = TUTV — TVTU всегда является дифференцированием вида Тто, где w = uv'— u'v.
9.	В случае кольца многочленов Р [Хь ..., Хп] от п переменных естественно ввести оператор частного дифференцирования по k-й переменной:
; X1.1 X‘k Х1п^1кХ1*	Х‘к~'х‘п.
дХк * к... п й • ft... п
(i)	Показать, что множеством констант для служит кольцо многочленов Р [Хь ..., Х^ ..., Хп] от п— 1 переменной.
(ii)	Пусть f (Хь .. ., Хп)— форма (однородный многочлен) степени т. Убедиться в справедливости тождества Эйлера
У. Xk^L- = m.f(X1........Хп).
СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ
257
§ 2]
Обратно, если charP = 0, то тождеству Эйлера удовлетворяют только формы степени т=1, 2, 3, ...
10.	Показать, что отсутствие линейных множителей у многочлена Хп	[^] равносильно выполнению условия
(1 +2 в«) * °- При п 3 неприводимые многочлены над Z2 исчерпываются следующими: X, X-|- 1, Х2 + ХЦ-1, хз + х+1, х3 + х2 + -|- 1. Выписать все неприводимые многочлены над Z2 при п = 4 и 5 (их будет соответственно 3 и 6).
11.	Исходя из сравнения
Xе — Х2-Н X2 (Х-|-1) (Х2-|-Х+I) (mod 2)
установить неприводимость многочлена X5. — Х2Ц-1 над Q. (Указание. Применить следствие леммы Гаусса (§ 3 гл. 5) и предыдущее упражнение, а также сослаться на факториальность кольца Z2[X].) Аналогично доказать неприводимость многочлена Хб— X—1 над Q, перейдя к сравнению по mod 3.
§ 2.	Симметрические многочлены
1.	Кольцо симметрических многочленов. Следуя определению симметрических функций, которое было дано в конце предыдущего параграфа, мы введем аналогичное понятие в кольце А [Хп ..., Х„] многочленов над целостным кольцом А. Теорема 3 § 1, распространенная на многочлены и функции многих переменных, как-будто делает такое перенесение излишним. Но следует учесть, что в этой теореме целостное кольцо А коэффициентов бесконечно, а нам хочется иметь универсальную конструкцию.
Итак, вновь обращаясь к следствию теоремы 3' из п. 2 § 2 гл. 5, мы ставим в соответствие каждой перестановке л С Sri автоморфизм л: А [Хп ..., Хи] —► —+А [Хх, ..., XJ, переводящий произвольный многочлен /С^[Хх, . ..,Х„] в многочлен л/:
(лЛСХ., ...,ХЛ) = /(ХЯ-Ч1), ...,Хл-Чл)).
Многочлен f называется симметрическим, если л/^/для всех л£5и. Как и для функций, вводятся элементарные симметрические многочлены sk:
sA(xnxj- 2 xGxG...xr>
KG <Ц<..
A=l,2, ...,n. (1)
9 А. И. Кострииин
258
КОРНИ многочленов
[ГЛ. 6
Строго говоря, следовало бы рассмотреть многочлен
f (У) = (У-XJ (У-х2)... (У-Х J =
= У"--£1У'г-1 + $2У'1-2 + .. . +(—	(2)
над А [Хп XJ от новой переменной У и заметить, что sk — симметрический многочлен, поскольку левая часть тождества (2) не меняется при любых перестановках линейных множителей У — X,, ..., У — Хп.
Обратим внимание на то обстоятельство, что после подстановки нуля вместо Хп в обе части тождества (2) мы получим (У — XJ ... (У — X^J У = У" —(s^y*-1 +... • • • +(— I)""1 (^„-^оУ, где ($fc)0 — результат подстановки Хп = 0 в sk. Сокращая обе части на У (на основании теоремы 3 §4 гл. 5, примененной к А [Хп..., Хп, У]), приходим к тождеству
(У-Х,) (У-Х2)...(У-Хп^) =
~Yn'1 — (s1)Q Y^+ ... +(-l)-i(sn_1)0.	(3)
Сравнивая (2) и (3), мы приходим к выводу, что (sJo,... . .., (s„-7)0—элементарные симметрические многочлены от п—1 переменных Хх, ...tXn^v
Так как, далее, л — автоморфизм кольца Д[ХИ ... ...,ХЛ], то любые линейные комбинации симметрических многочленов и их произведения будут снова симметрическими многочленами. Это значит, что множество всех симметрических многочленов образует кольцо, являющееся подкольцом кольца Л[ХП ..., Х„]. Наша ближайшая цель — разобраться, как устроено это подкольцо.
2.	Основная теорема о симметрических многочленах. Оказывается, что наиболее общим способом получения симметрических многочленов является следующий. Нужно взять произвольный многочлен g б А [Уп .. ., Уп] и подставить вместо У\, ..., У„ соответственно ..., sn. Получившийся в результате многочлен
f (*1....Xn) = g(sl(X-t....Хп), (X,...........Х„))
будет, конечно, симметрическим.
Заметим еще, что одночлен У4’1 ... У'и, входящий в g, 1	п
переходит при подстановке УЛ = $ДХП ...,ХП) в однородный многочлен от Хп ...,ХП степени 1\ + 2/2-|-... ... +nin, поскольку deg sk = k. Сумму + 2i2+ .. . + nin
СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ
259
I И
называют обычно весом одночлена Y1* ... Yln. Весом мно-1	п
гочлена g(Ylt . .Yn) естественно считать максимум весов одночленов, входящих в g.
Основное утверждение о симметрических многочленах выражает
Теорема 1. Пусть f € А [Хп . .., Хп]—симметрический многочлен полной степени т над целостным кольцом А. Тогда существует, и притом единственный, многочлен Л [У^, ..KJ веса т, для которого
f(Xlt .... %„) = £(«!..Sn).
Доказательство будет состоять из двух частей.
I. Доказательство существования многочлена g. Используем индукцию по двум параметрам п и т (см. § 7 гл. 1). При п== 1 теорема очевидна, поскольку sl = X1 и f (X1) = f(sl). Предполагая утверждение о существовании g доказанным для многочленов от ^п—1 переменных, будем в случае п переменных рассуждать по индукции относительно m = degf. Так как при /7г = 0 доказывать нечего, то полагаем т > 0 и считаем установленным существование g для любого многочлена степени <т.
Пусть теперь f (Хг, . . ., Хп)— заданный симметрический многочлен степени т. Положив Х„ = 0, будем иметь по предположению индукции
№........Хп_и O) = gl((S1)o...(«„-Л),
где g± — какой-то многочлен из Л [К,, ..., веса (степень f при подстановке Хп = 0 могла понизиться), a (sJo, • • •, (5и-1)о — элементарные симметрические многочлены от Хп ...,Хп_1 (см. (3)). При этом, очевидно, deg£1(^1,	Стало быть, многочлен
/1 (*1. • • •. Хп) = f (Хр Х„)—g, ...........(4)
имеет полную степень по Xlt ..., Хп не более т и (как разность двух симметрических многочленов) является симметрическим. Кроме того, /ДХ^ ..., Хп_г, 0) = 0, откуда вытекает, что Хп делит f1 = Xn-f°t Но в силу симметричности fr = л'1^ —Хл(л) (л"1/0), Ул^5п, т. е. содержит в качестве множителей Хп Х2, . .., Х„, а значит и их произведение sn=-- ХгХ2 . . . Хп. Итак,
fAXi.....X„) = s„.f2(Xp	(5)
260
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
где f2— снова симметрический многочлен—на этот раз степени degf2 = deg—n^Ztn— п. По предположению, индукции существует многочлен g2 (Ylt ..., Yn) веса
— п, для которого f2 (Хп . .., Хп) = g2 (slt ..., $„). Учитывая (4) и (5), для f получаем выражение
f(Xlt .... X„) = gI(sl, •••,	+	....s„),
и существование многочлена g = gi (Уц • • •» Yn) + +	(^i> • • • > веса	установлено. Так как
deg / = m, то вес многочлена g не может быть меньше т и, следовательно, равен в точности пг.
II. Доказательство единственности. Если бы существовали два не равных друг другу многочлена gi, g2 С условием f = gj (slt .... s„) = g2 ..sn), то
мы имели бы многочлен g(Y\, . ..,	для
которого g($x, . ..,s„) = 0. Другими словами, slt ...,sn оказались бы алгебраически зависимыми над А в смысле определения из п. 2 § 2 гл. 5. Покажем (снова индукцией по и), что это не так. Действительно, рассуждая от противного, выберем многочлен g(Ylf ..., Yn) минимальной степени, обращающийся при подстановке Yk = sk в нуль. Рассматривая g как многочлен от Yп над A[Ylt ..., Уп-х], запишем его в виде
g(Vi.....Yn) =
= go (Л.....rn_t) + ... +gk (Ylt .... Yn, k = deg„g.
Если g0 = 0, to g = Y„h, где h£A [Уп .... Y„J. По предположению snh.(s1, .... s„) = 0, а так как кольцо A [Xv X„] — целостное (теорема Г § 2 гл. 5), то отсюда вытекает равенство h(slt s„) = 0. Это, однако, невозможно, поскольку degh(Ylt .... Y п) = degg(yt, ... ...,Yn)—1. Стало быть, go=/=0. Рассматривая теперь тождество
£o(®i.......«л-1)+-.-+Ял(«1.....5„-1)«л =
= g(s1, ..., s„) = 0 в А [Хп ..., Х„|, подставим 0 вместо Хп. Тогда все члены, кроме первого, обратятся в 0, и мы получим
£о ((*$1)о» *’•> (*$и - i)o) ~
где ($х)0, ...» (s/J_1)0 — элементарные симметрические многочлены от переменных Хп Хп.г (см. (3)). Они, по
& 2]
СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ
261
предположению индукции, алгебраически независимы над Л. В то же время у нас gQ=^0. Полученное противоречие завершает доказательство единственности, а вместе с тем — и всей теоремы 1. |
Заметим, что доказательство первой части теоремы было конструктивным и его можно использовать для фактического нахождения многочлена g. Кроме того, из рассуждений следует, что коэффициенты искомого многочлена g лежат в подкольце кольца Л, порожденном коэффициентами заданного многочлена f. В частности, при A = Z коэффициентами многочленов f и g будут целые числа.
Следствие. Пусть f(X) Хп+	.
...+ап_1Х-\-ап—унитарный многочлен степени пот одной переменной X над полем Р, имеющий п корней cv .. .,сп в некотором большем поле Fz)P. Пусть, далее, h(X19 ..., Хп) — произвольный симметрический многочлен из Р[Хх, ..., Хл]. Тогда его значение hfa, ..., сп), получающееся при подстановке c-t вместо Xh f = l, .п, будет принадлежать полю Р.
Доказательство. В самом деле, по основной теореме о симметрических многочленах найдется многочлен giY^ ...,/„)€ Р|УХ, К„] такой, что 1г(Х19 ... ...,Xn)=.g(S1(Xu ...,Хп)------s„(Xlf .... Х„)). Поэ-
тому h (q, ..., с„) = g (s, .... с„), ..., s„ (clt .... с„)), а так как в соответствии с формулами Виета (12) § 1 5л(с\, ... •••, cn) = (-\)kakeP, ТО и g(—a„ .(—V)nan)€P. I
3. Метод неопределенных коэффициентов. Существует несколько различных доказательств основной теоремы о симметрических многочленах, а соответственно — и методов выражения заданного многочлена f через элементарные симметрические многочлены. Чтобы описать один из таких наиболее употребительных методов, введем новый тип симметрических многочленов. Для определенности будем брать в качестве А кольцо Z или поле R. Пусть и = Xi*... Х„"— какой-то одночлен. Условимся называть v монотонным одночленом, если	in. Обозна-
чим через S (у) сумму всех различных одночленов в семействе п\ одночленов вида iw, n£Sn. Иначе говоря,
S(v) =
2 ^v, xtSn/H
262
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
где условие n^Sn/H означает, что л пробегает множество представителей левых смежных классов лН группы Sn по подгруппе И = {% ^Sn\%v = v} (следует провести простую проверку, что определенное таким образом подмножество И действительно является подгруппой). Например,
рк(Х, XB) = S(X*) = X*+X*+...+X*, k^O, (6) есть так называемая степенная сумма. Здесь, очевидно, H-=Sn_v Далее, S(X1X2.. .Xk) = sk(Xlt ..., Хп) (с чем совпадает здесь /7?). Ясно, что S (а) — однородный симметрический многочлен той же полной степени, что и и. Так как S (v) = S (от), VogS„, то естественно рассматривать лишь суммы S (у) с монотонными одночленами и. По смыслу ясно также, что любой симметрический многочлен f над А является линейной комбинацией с коэффициентами из А многочленов типа S (у):
f = 2^5 (у).
Обычно такая запись получается моментально («на глазок»). Таким образом, задача сводится к выражению S (у) через элементарные симметрические многочлены.
Условимся располагать одночлены в S (у) лексикографически (по принципу построения словаря), т. е. таким образом, что одночлен v = Х\'Х2*... Х^1 предшествует одночлену (или больше одночлена) w = X[lXfr. . . Х& (v > до) в точности тогда, когда последовательность — /\, г2 — /2» • • • > in— !п имеет вид 0, . . ., 0, /, . . ., где t > О (справа от t могут стоять и отрицательные разности Ч — 1 /)• Лексикографический принцип расположения членов применим, понятное дело, не только к S (v), но и к любым многочленам	..., Хл]. Высшим (или
первым) в лексикографическом смысле членом суммы S (v) с монотонным одночленом v будет v. Для монотонного одночлена и =	. Х„п мы имеем право рассмотреть
произведение
^ = <1~Х2~'3- • X-7’'nV’ si~si(Xlt .... Х„), (7) в котором высшим членом будет опять-таки
v =	. .(Xv . .хп_1)‘п-1~'п(х1.. .X„A
1 2J
СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ
263
(чтобы получить высший член в произведении, надо брать высший член в каждом из множителей). Отсюда вытекает, что высший член разности S(y)—gv будет ниже, чем v. Значит,
S(v)—gv = ^n’wS(w),
где n'w£Z, а суммирование ведется по множеству монотонных одночленов w < v. Полные степени v и всех w совпадают.
Теперь вырисовывается следующий метод выражения S (у) через элементарные симметрические многочлены. Пусть dega = m. Берутся все «монотонные» разбиения
т=/1+/2+•••+/„.
целого числа т, такие, что w = Х[хХ^.. .Х^п < v. Рассматривается множество Му всех таких одночленов w. Для каждого w£Mv составляется одночлен gw (см. (7)). Мы уже знаем, что
S(0=£v+ 2	(8)
где nw—какие-то целые числа. Неопределенные коэффициенты nw (отсюда и название: метод неопределенных коэффициентов) находятся путем последовательных подстановок в (8) вместо Xlt ..., Хп каких-нибудь целых чисел, обычно нулей и единиц. Значения gvi gw и S (и) при этом известны, и для nw получается заведомо совместная система линейных уравнений.
Пример. v = X3b 5(v)=/?3(Xb ..., Хп), п^З, gv = sl,
Mv		X1X2*3
gw	Sl$2	$3
Уравнение (8) в данном случае имеет вид
Рз = 31 +	+ bs3.
Если Х1 = Х2=1, Х/ = 0 при i > 2, то р3 = 2, Si = 2, s2 = l, $з = 0-Если же = Х2 — Х3 = 1, X/ = 0 при i > 3, то р3 = 3,	= 3, s2 = 3,
S3 — 1. Из получившейся системы
2 = 23 + а-2-1 + &-0,
3 = 33 + а-3-3 + Ь-\
находим а = —3, Ь = 3, т. е. р3 —З^^Ц- 3s3.
264
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
Для выражения степенных сумм pk(Xu ..., Хп) в виде многочленов от $2, .sn имеются более удобные формулы, называемые формулами Ньютона:
Pk—Pk-iS1+pk-2s2 + ...
^.+(-i)k-1p1sk^ + (-l)kksk = 0 (9)
при 1
Pk Pk-lSl ~i~Pk-2S2 + • • •
•••+(-l)n-1PA-n+A,-1 + (-l)',A-nsn = 0 (10)
при k > n.
Чтобы их доказать, воспользуемся очевидными соотношениями
Х?-51ХГ+ ... + (—1)"”15л_1Х/ + (—1)"5п = 0, получающимися при подстановке Y = Xt в (3). Умножая каждое из этих соотношений на Х^~п (k^n): X^S1X^+ ... + (-\)^Sn_1Xkrn+1+ (-iysnX^n= 0 и производя затем суммирование по i от 1 до и, мы получим не только формулу (10), но и формулу (9) при k = n (р0 = Х?+ ... +Хп = п). Рассмотрим, далее, симметрический однородный многочлен fki п степени k^Zn (или —оо, если п = 0):
.... Х„) =
= Pk—Pk-1s1+   .+(-1)Ь1РД-1+ • • • +(—
Используя индукцию по г = п—kt докажем, что fk,n тождественно равен нулю. Для r = Q этот факт был только что установлен. Полагая Хп = 0 и замечая, что получающиеся при этом симметрические многочлены (sz)0, (Р/)о совпадают с многочленами sz и ph определенными для п—1 переменных Хп ..., Хп_х (см. (3) и (6)), мы приходим к равенству
•••. Хп_„ 0) =
= (Р*)о —	(«1)о+ ••• +(-Dft-1(Pi)o (Sft-l)o +
+ (-l)^(sft)n = kn-1(X1. .... Х„_1) = 0, ибо п—1—k — r— 1 < г, и применимо предположение индукции.
§2]
СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ
265
Соотношение fk, п (Хх, ..., Х„_х, 0) = 0 показывает, что многочлен fk,n делится на Хп: fktn = Xnfv Используя симметричность fkt п (см. соответствующее рассуждение в доказательстве первой части теоремы 1), получим
.... Хл) = 5„(Хх, .... xn)-g(x1...Х„),
что возможно, однако, лишь при g = 0, поскольку degs„ = n, a deg/*, n = k < п. Итак, fkt „ = 0, и доказательство формулы (9) завершено.
4. Дискриминант многочлена. Рассмотрим в кольце Р[Хх, ..., Хп] многочлен
А„= П [Xi-Xj),
1 < / < i < п
который, очевидно, можно представить в виде определителя Вандермонда
1 1	... 1
X. Х2	... Хп
уП-1 уП-1	уП-1
Л2 . . Ад
(11)
Так как определитель является кососимметрической функцией своих столбцов, то л (Дл) = еяДл— знак перестановки л£5л. Но в таком случае Д*—симметрический многочлен и по основной теореме его можно выразить в виде многочлена от элементарных симметрических функций
Д2п = ПРС— XjY = Dis(s1( .... s„).
Многочлен Dis от ^(Xj, ...» Х„), ..., s„(Xn ..., Хл) называется дискриминантом семейства Хх, ..., Хл. Его коэффициенты, очевидно, лежат в Z. При подстановке x^F вместо Xz, /=1, 2, ..., п (F — какое-то расширение поля Р), можно говорить о дискриминанте семейства любых п элементов поля F. Если не все хи ..., xn£F различны, то дискриминант этого семейства обращается в нуль, поскольку хотя бы один из множителей %,—Xj будет равен нулю. Способностью Dis выделять этот случай и объясняется сам термин дискриминант.
Удобный способ получения дискриминанта основан на интерпретации Д^ как произведения определителя (11) на транспонированный определитель: Д^ = ДЛ*ДЛ (вспомним, что det М = det А для любой квадратной матрицы Л).
266
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
Действуя по правилу умножения матриц, мы сразу же
находим
Dis(sn . . ., sn) =
п	pt	р2
Pl	Р2	Рз
Р2	РЗ	Р1
... Рп-1 •• Рп
... Рп + 1
(12)
рп-1 Рп Рп + 1 • . • Ряп-2
где pk—известные нам степенные суммы (6). Вычислив pk по рекуррентным формулам (9) и (10), мы придем к явному выражению для Dis (sn sn). В частности, p1 = s19 p2 = sl — 2s2, так что
12 s i
s s2 2s =«1 —4s2-	(13)
Пусть нам дан теперь унитарный многочлен f(X) = X- + a1X^+ ... +ап_1Х + апеР[Х], имеющий в Р или в некотором его расширении F п корней clf ..., сп. Как мы знаем из формул Виета, ak = = (—• • •. сп).
Определение. Дискриминант семейства корней с19 .. ., сп многочлена /, или, что равносильно, значение дискриминанта Dis(sn ..., s„), получающееся при подстановке (—V)kak вместо^, называется дискриминантом многочлена f и обозначается символом D(/). Он называется также дискриминантом алгебраического уравнения f (х)=-хп + а1хп~1+ . . . +ап_1х + ап = 0.	(14)
Ясно, что D (/) С Р (вспомним в этой связи следствие теоремы 1). Как видно из определения дискриминанта, справедливо также
Предложение. D(/) = 0 тогда и только тогда, когда уравнение (14) имеет кратные корни {хотя бы один корень кратности k > 1). |
С учетом следствия 2 теоремы 5 § 1 мы имеем теперь два способа, не требующих выхода за пределы основного поля Р, решить, обладает или нет многочлен f£P[X\ кратными корнями. Но значение дискриминанта заключается не только в этом. Скажем, формула (13), примененная к квадратному трехчлену f (X) == Х2 + аХ + Ь с вещественными коэффициентами а\ Ь, дает D(/) = а2 — 4Ь —
§ 2]
СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ
267
выражение, известное из Элементарной алгебры. В частности, от знака D (/) зависит вещественность или комплексная сопряженность корней уравнения %2-\-ax-\-b = 0.
В качестве примера вычислим еще дискриминант так называемого неполного кубического уравнения
f(x) = x^^ax + b = 0.	(15)
В данном случае s4 = 0 и вычисление р^ по рекуррентным формулам дает ^1 = (у1 = о, p2 = s\ — 2s^ = — 2а, p3 = sl — 3$iS2 + 3s3 = —36, pi = st — 4SiS2 + 4SiS3 + 2s2 = 202. Следовательно, по формуле {12) имеем
D(/) =
3	0
0	—2а
—2а —36
—2а
—36
2d1
= — 4а3 — 27 b2.
(16)
Выражение D (/) приобретает более сложный вид (по сравнению с (16)) в случае полного кубического, уравнения х3 + а1х2 + а2^ + «з = 0, однако от его рассмотрения мо>кно избавиться, как показывает следующее общее рассуждение.
Перейдем от аргумента х к у = х-\-^-. Подставляя х = у — в уравнение (14) и используя биномиальную формулу, мы находим, что
g(y) = f {у-^-]==Уп + ауп-2+ ... =0,
(17)
т. е. в новом уравнении коэффициент при уп~1 равен нулю. Зная корень у о уравнения (17), 14 ы легко найдем также и корень
*о = Уо—• — исходного уравнения (14). Поэтому без ограничения общности можно считать 64 = 0.
Если пытаться найти общую формулу для решения уравнения (15) (в чем преуспели средневековые математики Сципион дель Ферро, Кардано и др.), то неизбежно ц игру будет вводиться дискриминант (16) (см. формулы (2) § 2 гл. 1).
5. Результант. Основное свойство D(f), сформулированное в предложении и:з предыдущего пункта, интерпретируется также как признак наличия общих корней (или общих множителей) у многочлена f и его производной f'. В основе этого признака лежит в конечном счете алгоритм Евклида. Это дает основание полагать, что имеется аналогичный критерий, позволяющий непосредственно по коэффициентам любых двух многочленов /, gg решить вопрос о том, обладают они общим множителем или не обладают,
268
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
Итак, пусть
f (X) = aQXn + аД"-1 + ... + ап^Х + ап, g (X) = ьох-+м*-1 + • • • + ьт^х + Ьт
— два многочлена с коэффициентами в поле Р. Здесь п > 0, т > 0, но не исключается возможность того, что ао = 0 или Ьодо-
определение. Результантом Res(f, g) многочленов fug называется однородный многочлен (однородная полиномиальная функция) от их коэффициентов (степени т относительно а0, ап и степени п относительно ЬЛ, .... Ьт) вида
т строк
п
k строк
В этом определении результанта содержится некое утверждение о его степенях как многочлена. Но оно непосредственно вытекает из свойств определителей: если заменить в первых т строках на tait то Res(/f, g) = = Z/nRes(/, g), после чего остается сослаться на упражнение 3 § 2 гл. 5.
Выведем теперь основные свойства результанта.
Resl. Res(/, g)=0 тогда и только тогда, когда ао = О = Ь^ или же f и g имеют общий множитель в Р [X] степени > 0.
Убедимся сначала в том, что условие «ao = O = feo или же f и g имеют общий множитель в Р[Х] степени > 0» выполняется тогда и только тогда, когда найдутся многочлены flt gl9 одновременно не равные нулю, для которых fgi + fig = Q, deg^Cn, deggjCm. (18)
Действительно, пусть h — НОД (f, g), deg h > 0. Тогда f = hfi, g =—hgt и, следовательно, fgi+gf\ — 0. Кроме того, degf1<n, degg!<m, так что (18) имеет место. При а„ = 0 — Ьо мы можем положить = f, gt = —g.
§ 2]
СИММЕТРИЧЕСКИЕ МНОГОЧЛЕНЫ
269
Обратно, предположив при выполнении (18), что НОД (f, g) = 1, мы ввиду факториальности Р [X] (см. § 3 гл. 5) придем к импликации fgl==—gfi=5>f\fi, g\gt-Стало быть, deg/<n, degg<m, откуда aQ = O = bo.
Мы докажем теперь эквивалентность условий (18) и Res(f, g) = 0. Положив
/1^с0Х--1 + с1Х«“2+...+с„_1, g1 = d0X^ + d1X^+... + dm_1
и вычислив по формальным правилам коэффициенты многочлена /gi + Zig степени + —1, мы запишем условие (18) в виде квадратной однородной системы линейных уравнений с (п + т) неизвестными d0, d19 ..., dm_l9 cQ9 cn • • •» en-i:
^0^0	...............4" *Vo.........= 0,
.... • И-• • • = Z1Q\
^2^0 aid± ~F ^0^2	• • • *4“ ^2^0	^1^1 ~b ^0^2 ==
Определитель матрицы системы (19) (точнее, определитель транспонированной матрицы) совпадает как раз с Res (f9g). Стало быть, система (19) имеет ненулевое решение в точности тогда, когда Res(/, g) = 0, а всякое ненулевое решение приводит к паре многочленов f19 g19 удовлетворяющих условию (18). |
Res 2. Пусть многочлены fug полностью расщепляются на линейные множители в Р[Х]:
f(X) = a0(X—aj.. .(X—ал), g(X) = b0(X-₽1)...(X-PJ.
Тогда п	т
Res (f, g) = а? Пg(а,-) = (-!)-« bS Ц f (₽7) = 1=1	/=1
=	П (а,—р/).
i. i
Доказательство. Ясно, что указанные здесь формулы, если они верны, должны носить универсальный характер, не зависящий от частных типов многочленов f9 g. Эта несложная «философия», в природу которой мы не хотим здесь вдаваться, позволяет нам ограничиться
270
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
рассмотрением «общего случая», когда, скажем, все g •, g(an) и все f (jJJ, .. ., f (BJ попарно различны.
Далее, так как Res(g, f) = (— 1)'лл Res (f, g) (см. определение), то достаточно убедиться в справедливости соотношения Res (/, g) =	z). С этой целью введем
новую переменную Y и над полем рациональных дробей Р(У) рассмотрим многочлены /(X), g’(X)— Y. Из определения результанта, где следует заменить bm wabin—Г, получается, что
Res (/, g— У) = (— \)na™Yn + ... +Res(/, g)
— многочлен степени п относительно Y со старшим коэффициентом (— 1)па%1 и с постоянным членом Res(/,g’). Многочлены f (X) и g(X) — g(az) с общим корнем ai делятся на X—az. Ввиду свойства Res 1 имеем Res(/, g—g(a,)) = 0.
По теореме Безу многочлен Res(/, g—Y) должен делиться на g(az) — Y,	Так как все g (az) у нас
п
различны, то Res (f9g—Y) =	Ц (g(az)— Y). При У = 0
i= 1
получаем нужное выражение. |
Данное в п. 4 определение дискриминанта перенесем на случай неунитарных многочленов, полагая
D(f)^a20n~2 П («,—ау)2= Га?'хП (“,—«/)]2, «о¥=0.
Res3. Имеет место формула
п (п- 1)
D (/) = (-!) 2 ai1 Res (f, f).	(20)
Действительно, согласно Res 2,
Res (/, Г) = й"-’ПГ (“/)•
i= 1
Но
Г (а,) = а0 П (а, —«у),
что является простым следствием подстановки X=--ai в общее выражение
п ___
f'W = a0^ П(Х-аД
i=l/¥=t
р-1	/
t= 1	I
§2]	СИММЕТРИЧЕСКИЕ МНОГОЧЛЕ НЫ	271
получаемое дифференцированием произведения f (X) = п
= ао П —а/)- Таким образом, п
Res (/, f) = а^-! П II (а, —а,) =
1=1 /=#1
п (rt — 1)	п (п- 1)
= а0(-1) 2 аГ2П(«,—«/)2=«о(-1) 2 D(f). I
i <i
Формула (20) дает явное выражение для дискриминанта.
УПРАЖНЕНИЯ
1.	При помощи формул Ньютона (9), (10), показать, что
—1 (modp), если т делится на р—1, 0(modp), если т не делится на р—1.
2.	Пусть clt с2, с3— комплексные корни многочлена X3 — Х-{-1, Что можно сказать о расширении Q (с?9 4-49 + d!9)?
3.	Многочлен / (Хь ...» Хп) над полем Р характеристики /2 называется кососимметрическим (или знакопеременным), если (я/)(Хь ..., Хл) = ел/(Х1, ..., X„),	(как всегда, 8Я —
знак перестановки). Примером кососимметрического многочлена может служить = JJ (X/ — Ху). Показать, что любой кососимметрический 1<Л
многочлен /^Р|Хр Хп| имеет вил f = &n-g, где g — симметрический многочлен. (Указание. Рассмотреть f как многочлен относительно Хп с коэффициентами в Р 1ХЬ .Хл-1]. Обратить внимание, что в силу кососимметричности / = 0 при Х„ = Х„_1 и, стало быть, f делится на Хп — Xn_t.)
4.	Используя свойство Res2 и факт существования поля разложения многочлена (см. теорему 2 в следующем параграфе), показать что
Res(/g, А) == Res (/. ft)-Res(g, h).
5.	Из упражнения 4 и из Res 3 вывести формулу:
D (/#) = D (/) D (g) [Res (f,g)]\
6.	Чему равен результант Res (/(X), X —а)?
п 1)
7.	Показать, что D(X" 4~а) = (—I) 2
272
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
8.	Пусть / (Х) = Хп”14-Хп“а+ ... + 1. Используя соотношение Хп— 1 ==(Х— 1) f (X) и предыдущие упражнения, показать, что (п- 1) (п-2)
D (/)==(—1)	2	П«-2.
§ 3. Алгебраическая замкнутость поля С
1.	Формулировка основной теоремы. Пусть Р — поле и f—произвольный многочлен над Р. Как уже отмечалось в п. 2 § 1, поведение полиномиальной функции f: Р—ассоциированной с /, существенно зависит от поля Р. В частности, = коль скоро deg/>0 и к Р применимо следующее
Определение. Поле Р называется алгебраически замкнутым, если каждый многочлен из кольца Р [X] разлагается на линейные множители.
То же самое можно выразить другими словами: поле Р алгебраически замкнуто, если неприводимыми над Р являются лишь многочлены степени 1 (линейные многочлены).
Если любой многочлен f £Р [X] обладает в Р по крайней мере одним корнем, то поле Р алгебраически замкнуто. Действительно, тогда f (X) = (X—a) h (X), а £ Р, h£P[X], но по условию для многочлена h в Р тоже существует хотя бы один корень, т. е. h (X) = (X—b) г (X), Ь$Р, г^Р[Х]. Продолжая этот процесс, мы придем в конце концов к полному разложению f на линейные множители. Так как f — произвольный многочлен, то поле Р удовлетворяет определению алгебраической замкнутости.
Хотя и справедливо утверждение о том, что для всякого поля Р существует расширение Р^Р, являющееся алгебраически замкнутым полем (теорема Штейница), на первых порах все же трудно воспринять не только конструкцию алгебраически замкнутого расширения, но и саму идею такого расширения. Тем более приятно, что мы фактически располагаем ярким и очень важным примером алгебраически замкнутого поля, как об этом гласит так называемая «основная теорема алгебры». Именно, справедлива
Теорема 1. Поле комплексных чисел С алгебраически замкнуто.
§ 3]	АЛГЕБРАИЧЕСКАЯ ЗАМКНУТОСТЬ ПОЛЯ С	273
Сформулируем еще раз это фундаментальное утверждение, теперь уже в терминах корней:
П роизвольный многочлен f (X) степени с комплексными (или вещественными) коэффициентами имеет ровно п комплексных корней, считаемых со своими кратностями.
Громкий титул «основной» теорема 1 приобрела еще в те времена, когда решение алгебраических уравнений было одним из главных занятий алгебраистов. В наши дни теорема 1 относится к числу рядовых, хотя и важных утверждений.
Впервые строгое доказательство «основной теоремы» было предложено Гауссом в 1799 г. С тех пор появилось много вариантов доказательства, различающихся между собой, так сказать, степенью алгебраичности. Необходимость опираться на свойства непрерывности полей R и С (иначе: на их топологию) проявляется в той или иной форме; есть даже совсем неалгебраическое и совсем короткое доказательство, основывающееся на довольно глубоком понятии аналитической функции комплексной переменной. Ниже приведено доказательство, по духу наиболее алгебраическое из доступных нам. Самым естественным было бы, пожалуй, доказательство, использующее средства теории Галуа, но этим кратким упоминанием о нем мы и ограничимся.
Неалгебраическая часть доказательства теоремы 1 заключена в следующих двух леммах.
Лемма 1 (лемма о модуле старшего члена). Пусть
f (X) = а.Хп + аЛ"-1 + ... + ап^Х + ап (1)
— многочлен степени п^ 1 с произвольными комплексными коэффициентами. Тогда для полиномиального отображения	поля С в себя можно указать такое поло-
жительное число г С К» что яри 121 > г будет выполнено неравенство
|<70г"| >	. +an_1Z + a„|.
Доказательство. Положим А = max (| ах |,.. ., |а„|) и г=-р^-|+1. Если взять |г|>г^1, то получим | а01 > । г 1  откуда, согласно правилам действий
274
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
с модулями комплексных чисел (см. § 1 гл. 5), будем иметь
. ..+|a„-1||z| + |a„| = |a1zn-1| + ... + \an_1z\ + |ал|>
>|a1zn-,+ ...+a„_1z + a„|. В
Следствие. Пусть многочлен (1) степени 1 имеет вещественные коэффициенты. Тогда для всех x£R, достаточно больших по абсолютной величине, знак (вещественного числа) f(x) совпадает со знаком «старшего члена» aQxn. |
Лемма 2. Многочлен нечетной степени с вещественными коэффициентами имеет хотя бы один вещественный корень.
Доказательство. Ввиду нечетности п старший член а*хп полиномиального отображения f: IR—► R будет принимать при положительных и отрицательных х С R разные знаки. Взяв эти значения х достаточно большими по абсолютной величине, мы, согласно следствию леммы 1, можем утверждать, что и f (х) будет иметь разные знаки. Если, например, а0 > 0, то f(—г) < 0, а /(г)>0, где г — вещественное число, взятое из доказательства леммы 1. Из курса математического анализа известно (и это нетрудно доказать непосредственно), что полиномиальное отображение f непрерывно (иначе: целая рациональная функция хн->/(х) непрерывна). Непрерывная функция f обладает тем свойством, что на отрезке —г^х^г она принимает любое промежуточное значение между f (— г) и /(г). В частности, для какого-ю с с |с|^г будет f(c) = O. То же рассуждение годится и для а0 < 0. |
На этом геометрически и интуитивно ясном утверждении наши неалгебраические рассуждения заканчиваются. Следующий этап мы проведем в контексте, не имеющем прямого отношения к С, и предъявим конструкцию, представляющую самостоятельный интерес.
2.	Поле разложения многочлена. Как это часто бывает, «взгляд со стороны» на хорошо известный пример дает возможность лучше понять его и перейти к разумным обобщением. Вспомним о реализации поля С в виде факторкольца R [Х]/(х2+1) R [X] (теорема 6 § 2 гл. 5).
АЛГЕБРАИЧЕСКАЯ ЗАМКНУТОСТЬ ПОЛЯ С
275
§ 3]
Заменив здесь R на произвольное поле Р, а Х2+1—на любой многочлен f£P[X], мы придем к «кольцу классов вычетов по модулю (/)» или, что то же самое, к фак-торкольцу P[X]/(j), где (f) = f-P[X]—идеал в Р[Х]. Идеал (/) состоит из всех многочленов, делящихся на /, и является, согласно следствию теоремы 5 § 2 гл. 5, самым общим идеалом в Р[Х]. Аналогия между кольцами Z и Р [X] простирается на соответствующие кольца классов вычетов Z„ = Z/(n) и Р[Х]/(/). Полезно повторить основные этапы построения Zn в § 4 гл. 4.
Элементами факторкольца Р [Х]/(/) служат классы вычетов g = g-|-(/), каждый из которых можно представить в виде г + (Л, где deg г < degКак и в случае Z, доказательством служит все то же деление с остатком: если g^qf + r, то g + (f) - г + qf + (/) + (f), поскольку qf€(f). Легко видеть, что элементы а, а£Р, образуют в P\X]/(f) подкольцо, изоморфное полю Р. Далее, приводимость многочлена f над Р, т. е. возможность записи его в виде f = fj29 где f^P[X] и 0 < deg ft < deg f, влечет существование нетривиальных делителей нуля в P[X]/(f); именно fz¥=0, i=l, 2, но fj2 =	= ~f = 0.
Предположим теперь, что f — неприводимый многочлен. Если deg г < deg f (г 0), то НОД (г, /) = 1 и = 1 для некоторых и, v £Р[Х\ (см. теорему 3 §3 гл. 5). Иными словами,
к+(/)}{« + (f)} - ги + (f) = 1 -vf + (Л = 1 (Л, откуда
ги = ги~ Г.
Стало быть, любой элемент г =^=б обладает в P[X]/(f) обратным и = г~1. Это замечание показывает, что в случае неприводимого многочлена f факторкольцо P[X]/(f) является полем, содержащим подполе, изоморфное Р.
Обратим вниманиенаспециальный элемент X € P[X]/(f). Для любых aQialf .. ., а1П£Р имеем
т
2 «Д*=2^+(ЛНХ+(ЛР =
Л=0	k
=2Ж+(/)} {X*+(/)} = J 2 акхк !+(/) = k	\ k J	k
276
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
Короче, если g(Y) = ^akYk £ Р[К], то g(X) = g(X). Запись g(X) имеет, конечно, смысл при отождествлении Р с изоморфным ему полем, содержащимся в Р [X]/(f). В частности,
/ (X) = HX)=f+(f) = (/)=o,
т. е. элемент X € Р [Х]/(/) является корнем многочлена (/).
Итак, справедлива
Теорема 2. Кольцо классов вычетов (факторколъцо) является полем тогда и только тогда, когда f — неприводимый над Р многочлен. |
Следствие. Для любого неприводимого многочлена f (X) над полем Р существует расширение F^P, в котором f (X) имеет по крайней мере один корень. За F можно взять поле, изоморфное P[X]/(j). |
В соответствии с установившейся терминологией принято говорить, что расширение F получено присоединением к Р одного корня с многочлена f: F = P(c). При этом /(Х) = (Х—c)g(X), где g'C^fX]. Нам представилась реальная возможность построить расширение поля Р, в котором многочлен f полностью распадается на линейные множители.
Определение. Пусть Р — поле, f — унитарный (не обязательно неприводимый) многочлен степени п из Р [X]. Тогда расширение F z? Р называется полем разложения f над Р, если f (X) --= (X — cj ... (X — сп) в F [X] и F = Р (сг, ..., сп), т. е. F получается из Р присоединением корней clf . .., сп многочлена f.
Теорема 3. Для всякого унитарного многочлена f € Р [XJ степени и > 0 существует хотя бы одно поле разложения.
Доказательство. Условие унитарности несущественно и используется только для удобства. Пусть
HX)^/1(X)...fr(X)
— разложение f на неприводимые унитарные множители в Р(Х). Согласно следствию теоремы 2 существует расширение Р^Р, в котором имеется хотя бы один корень многочлена ft. Этот корень сг будет, разумеется, корнем и для f. Пусть уже найдено расширение PkZD ... idP^P,
§ 3]	АЛГЕБРАИЧЕСКАЯ ЗАМКНУТОСТЬ ПОЛЯ О	277
над которым f имеет разложение
f (X) = (X-q)... (X—ck)gl (X).. .gs (X)
c k (не обязательно различными) линейными множителями, k < п. Применив опять следствие теоремы 2 к полю Р* и к неприводимому унитарному многочлену gl € Pk [X], мы построим поле Pk+1^Pk, позволяющее отщепить линейный множитель X—сл+1 с ck+l € Pk+1 многочлена gl (X), а следовательно, и многочлена f(X). Продолжая действовать подобным образом, мы придем к полному разложению f на линейные множители над некоторым расширением Рп:зР. Либо Рп, либо какое-то его подполе F и будет полем разложения для f. Не исключено, что F совпадает с Р. |
Доказательство теоремы 3 содержит слишком много произвола, чтобы можно было говорить о единственности поля разложения многочлена f\ и хотя на самом деле поле разложения с точностью до изоморфизма определено однозначно, доказать это довольно трудно. Нам это дополнительное свойство полей разложения пока не понадобится.
Примеры. 1) Квадратичное поле Q ( d) — поле разложения многочлена X2 — d.
2)	Если присоединить к Z2 корень 0 неприводимого многочлена Х2 + Х+1, то получится поле Z2(0) = {O, 1, 0, 1+0} из четырех элементов, изоморфное как noAioZ2 [Х]/(Х2 + Х + 1), так и полю GF(4) из п. 6 § 4 гл. 4. Заметим, что Х2 + Х+1 =(Х —0) (X —02), т. е. Z2 (0) — поле разложения многочлена Х2 + Х + 1.
3)	Многочлен Х2+1 неприводим не только над IR, когда его полем разложения будет С, но и над некоторыми другими полями, например нaдZз. Пусть 02 = — 1 (если угодно, 0 = Х + (Х2+ 1)Z3 [X] — элемент поля классов вычетов Z3 [Х]/(Х2 +1)). Так как Х2+1== = (X — 0) (X — 02), то Z3 (0) = -{а + ^О | a, b£Z3}— поле разложения для Х2 + 1 над Z3. Между прочим, Z3 (0) изоморфно полю матриц J а|’ а’ ^3’ из Упражнения 13 § 4 гл. 4. Вот соответствующее отображение: а + ЬОн-^| + 6	о|- Обратим внимание
на тот факт, что Z3 (0)* = <Х>, К — 1 +0, Х2= —0, Л3= 1 — 0, V =— 1, Х6 = — 1 — 0, Х6 = 0, А,7 = — 1+0, Л8=1, т. е. мультипликативная группа поля Z3 (0) не только абелева, но и циклическая.
4)	Согласно критерию Эйзенштейна многочлен X3—2 неприводим над 0. Так как не все его корни вещественные, то Q не может быть полем разложения. На самом деле полем разложения для X3—2 служит Q(p/2,e), где е —примитивный корень
278
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
степени 3 из 1:
Х3-2 = (Х-|/2)(Х-е |/2)(Х-е2 j/2).
3. Доказательство основной теоремы. Из предыдущего пункта нам потребуются лишь определение поля разложения и утверждение теоремы 3.
В соответствии с замечанием, сделанным непосредственно после определения алгебраически замкнутого поля, необходимо установить существование хотя бы одного комплексного корня у многочлена (1). Предположим сначала, что все его коэффициенты вещественные, причем без ограничения общности будем считать я0=1, йп#=0. Пусть
deg/ = 2^n0,
где и0— нечетное целое число. Если т = 0, то по лемме 2 многочлен f имеет корень—даже вещественный. Применяя индукцию по т, будем считать теорему доказанной для всех многочленов с вещественными коэффициентами, степень которых имеет вид 2mfn'Q с т'—1 (на нечетный множитель По никаких ограничений не накладывается).
Рассмотрим поле разложения F многочлена (X2 + l) X X существующее по теореме 3 и содержащее С в качестве подполя. Пусть ult и2, ...,ип — корни многочлена f в F. Рассмотрим в F элементы
UiUj + а (uz + «/),	(2)
где а — какое-то фиксированное вещественное число. Следовало бы писать у/у (а), но мы этого делать не будем, чтобы не усложнять обозначения. Число и' элементов вида (2) равно
(п \ ,г 0 ____2/яП0 (2ллЛ0 1)_ С)т-1п'	/о\
П-\2)=-------2--“-------2-----П°’ W
где По — нечетное целое число.
Многочлен
М*) = п (X-vz7) = X"'H-6lXn'-1 + ...+&n' 1 < i < / < п
из кольца F [X] имеет степень п', а его корнями по определению являются все элементы (2). В соответствии с формулами Виета (12) § 1 коэффициентами Ьх, ..., Ьп> много
§3]
АЛГЕБРАИЧЕСКАЯ ЗАМКНУТОСТЬ ПОЛЯ С
279
члена fa (X) будут с точностью до знака элементарные симметрические функции sk от yzy. Подставив в «л(ц12, у1з» •••> yn-i,n) выражения элементов yzy через
. ., ип, мы получим функцию
/1Й (ир ..., u„) =	(• • •. «,«/ + a (Ui + Uj), ...),
k = 1, . . ., л',
которая тоже является симметрической. В самом деле, для любой перестановки	(Зл — симметрическая
группа степени п) имеем
~ ^Л (П)^Л (/) 4~	(^Л <4) Т (/)) ~ &31 (Г), Л (/)
(или 1’л(р, л (о» если л (О >я (/•))» так что л индуцирует перестановку л на множестве элементов вида (2). В силу симметричности s*(v12, у13, • • •» J не меняется при перестановке аргументов, поэтому
(л/гй) (Up .. ., ип) = sk (jw12, jw13, ...,	„) =
= sk (u12, u13, ..., v„_b „) = hk (Up ...» u„).
Заметим, что hk(u19 ...,un) есть значение при Xz=uz, i=l, ..л, симметрического многочлена hk(Xlf ...» Xn) ,c вещественными коэффициентами, зависящими только от a £ R.
По основной теореме о симметрических многочленах (теорема 1 § 2) найдется многочлен ЯЛ(УП ..., /п) с вещественными коэффициентами такой, что hk(Xt, . .., Хп) = =&(«!(*!.  • •. Х„).....s„(Xt, ...» х„)). Стало быть,
(— ))kbk = hk(ult .... u„) =
и„), . ..,s„(uu . ,.,ип)) =
= £л(—............(— l)”an)€R
(напомним, что az — коэффициенты рассматриваемого унитарного многочлена f С R [тр-
итак, коэффициенты bk многочлена fa(X) оказались вещественными при любом agR. Так как deg/tf = n' = = 2"1~1п'о (см. (3)), то по предположению индукции fa имеет хотя бы один комплексный корень, который, конечно, должен совпадать с одним из Меняя находящийся в нашем распоряжении параметр a g R, мы будем получать другие многочлены fa (X) с вещественными коэффициентами. Но каждому из них соответствует пара
280
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
индексов i < / (зависящая от а) такая, что элемент v^= +а	£ F содержится в подполе С поля F.
Так как различных пар индексов i < j всего Q), а вещественных чисел бесконечно много, то найдутся два различных вещественных числа а, а' с одной и той же отвечающей им парой индексов, скажем 1=1, / — 2 (это вопрос нумерации корней . ..,u„), для которых
uYu2 +а (ui + и2) = с, и1и2+а' (ыл-\-и2) = сг, а=£а',
будут комплексными числами. Из системы уравнений (4) следует, что и
Q_ Qf	£_ 0Г’
и. +	----; ,	= с — а---,
1 1	2 а —а '	1 2	а—а
принадлежат полю С. Коль скоро это так, элементы и2 будут корнями квадратного многочлена
(X — uj (X— и2) = X2 —	+ и2) X + иги2
с комплексными коэффициентами. По известным формулам
«1> »2 = -Ц1 2 “2	U1U2,
так что и2 тоже оказываются комплексными числами. Таким образом, для рассматриваемого многочлена f (X) с вещественными коэффициентами найдены даже два комплексных корня.
Пусть теперь
f (X) = a0X"	+ ... Ч-^-Л +ап
— многочлен степени п с произвольными комплексными коэффициентами (можно считать а0=1, но это неважно). Заменяя все az комплексно сопряженными числами, мы получим многочлен
T(X) = aQXn+alX^1+ ... +ап^Х+ап,
Введем многочлен
е (X) = f (X) f (X) = е0Х2п+е1Х2п~1 + ... + е2а
S 3]
АЛГЕБРАИЧЕСКАЯ ЗАМКНУТОСТЬ ПОЛЯ О
281
степени 2п с коэффициентами
ek = S aiah =	1, ...,2n.
i+i=k
Так как операция сопряжения zi—>z является автоморфизмом порядка 2 поля С (теорема 1 § 1 гл. 5), то = 2	а это означает, что ek g R. По доказан-
ному многочлен е(Х) с вещественными коэффициентами имеет хотя бы один комплексный корень с:
J(c) = e(c)=O.
Отсюда вытекает, что либо [(с) = 0, и теорема доказана, либо f(c) = O, т. е.	. + ал_1с+ал = 0.
Применяя к обеим частям этого равенства автоморфизм комплексного сопряжения, получим aoq" +а1ся“1 + ••• ... +an^lc+an = 0t т. е. f(c) = O. |
Алгебраической замкнутостью поля С (а также фактом существования поля разложения многочлена) удобно пользоваться при решении различных задач.
Пример. Пусть S0(f)— множество всех различных корней многочлена f g С [X], a Si(f)— множество всех его «единиц»: dg g Sj (/) <=> f(d) = l, Пусть теперь f, g—какие-то многочлены из С [X]. Требуется показать, что
So(f) = Sofe), Sl(f) = Sl(g) => f(X) = g(X).
Так как, очевидно, 50 (/) П 51(/) = и, то, согласно результатам § 1, достаточно показать, что | So (/) (J (/) |	1, где n = degf.
По теореме 1
/(Х) = а»П(Х-с/)Ч Z(X>—1 =а0 Й (X—dy)<7,^0, 4= 1	/ = 1
где
2s, = n = 2z/. v + n=|S0(f) и S1(/)|.
В соответствии с теоремой 5 § 1 имеем
v	_ 1 и	,	<
/(Х)'=(/(Х)-1)'=П(^-с/) ' II (х-</7) MX),
4=1	/=1
так что (и— v) + (n — H)=2(s/-“	<ideg/(X)' =n— I.
Стало быть,
v + pi и -f-1.
282
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
§ 4.	Многочлены с вещественными коэффициентами
1.	Разложение на неприводимые множители в 0?[Х]. Из теоремы 1 § 3 следует, что каждый многочлен f степени п в С[Х] может быть записан, и притом единственным образом (с точностью до перестановки множителей), в виде
f(X)=a(X-c1)(X-c8)...(X-cn),
где а=£0, clf • ••fcn— комплексные числа. Пусть теперь f (X) = Хп + а1Хп~1 + ... +ап_1Х + ап — унитарный многочлен с вещественными коэффициентами alt . .., ап и с — какой-то его комплексный корень: c = u-\-iv, v=^0. Применяя к соотношению f (с) = 0 автоморфизм комплексного сопряжения, как мы это делали при доказательстве теоремы 1 § 3, получим, что и /(с) = 0, поскольку а^а^ Стало быть, f (X) делится на многочлен второй степени g (X) = (Х—с) (X—F) = Х*-(с + с) X +сс =
= Х2 — 2uX + (u2 + v2)
с отрицательным дискриминантом D (g) = 4u2—4 (u2 + v2) = = —4t>2 < 0. Условие D(g)<0 необходимо и достаточно для неприводимости над R квадратного многочлена
Если, далее, k — кратность корня с многочлена f (X) и l^k— кратность корня с, то f (X) делится на l-ю степень многочлена g(X):
f(X)=g(X)lq(X).
Частное q (X) двух многочленов из R[X] будет тоже многочленом из R [X], причем при k > I элемент eg С будет его корнем кратности k — I, в то время как с корнем не является. Мы видели, однако, что это не так. Значит, k = l (предположение l^k рассматривается аналогично), т. е. комплексные корни всякого многочлена из R [X] попарно сопряжены. Мы приходим к заключению, что для элементов факториального кольца R [X] справедливо следующее утверждение.
Теорема 1. Любой унитарный многочлен f £ R [X] степени п разлагается единственным образом (с точностью до порядка множителей) в произведение т^п
§ 4] МНОГОЧЛЕНЫ С ВЕЩЕСТВЕННЫМИ КОЭФФИЦИЕНТАМИ 283
линейных многочленов X—cif соответствующих его вещественным корням ct1 . .., ст, и (п—m)/2 квадратных многочленов, неприводимых над R и соответствующих парам комплексно сопряженных корней. |
Замечания. 1) Неприводимый многочлен из R[X] либо линеен, либо квадратичен, с отрицательным дискриминантом.
2)	В обозначениях теоремы 1 имеет место соотношение п- т
D(/) = (-l)~|D(f)|,
т. е. знак дискриминанта определяется числом пар комплексно сопряженных корней. Это соотношение получается либо непосредственно из определения дискриминанта, либо при помощи формулы, содержащейся в упражнении 5 § 2.
3)	Простейшие рациональные дроби в поле R (X) имеют вид (9) § 4 гл. 5.
2. Проблема локализации корней многочлена. Будем смотреть на многочлен f € R [X] как на вещественнозначную функцию хн->/(х) вещественного аргумента х, изображая последнюю графиком на плоскости с прямоугольной системой координат хОу. Вещественным корням многочлена f (X) (или нулям функции f (х)) отвечают абсциссы точек пересечения графика с осью х.
Первый важный вопрос, с которым обычно сталкиваются на практике, это вопрос о границах вещественных корней, т. е. об интервале а < х < Ь, внутри которого должны содержаться все вещественные корни заданного многочлена f. Собственно говоря, из леммы 1 § 3 мы уже знаем, что при |х| >	1 (ло — старший коэффициент, А = max {|	|, . . ., | ап |}) функция f (х) не обра-
щается в нуль, даже если бы мы вышли на комплексную плоскость. Более точные границы корней указаны в упражнениях 1—4.
Более общая проблема локализации (отделения) корней многочлена заключается в том, чтобы для каждого из вещественных корней указать интервал, внутри которого находится только один этот корень. Впервые удовлетворительное, хотя и несколько громоздкое решение этой задачи было достигнуто Штурмом в 1829 г. Мы
284
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. в
ограничимся доказательством более частных результатов, имея в виду, что полное решение проблемы локализации корней (особенно если учитывать все корни, включая комплексные, когда речь идет не об интервалах, а об областях на комплексной плоскости С) дается дорогой ценой, и ее упрощение для тех или иных специальных классов многочленов — предмет особой заботы специалистов. Мы совершенно не касаемся методов вычисления «локализованного корня» с заданной степенью точности. Современная вычислительная математика располагает для этой цели широким арсеналом средств. Входить в детали было бы здесь неуместно.
К счастью, во многих случаях можно довольствоваться грубой качественной картиной расположения корней. Существенную информацию дает построение графика функции x*—*f(x), значения которой вычислены (например, при помощи схемы Горнера) хотя бы в целочисленных точках оси х.
У^
Корни алгебраического уравнения f (х) = 0 следует ожидать между экстремальными точками (или в экстремальных точках), являющимися в свою очередь корнями алгебраического уравнения f'(х) = 0 более низкой степени. Рассмотрение графика позволяет, во всяком случае, получить оценки снизу для числа отрицательных и положительных вещественных корней — именно оценки, а не точные значения, поскольку, вообще говоря, колебания функции xi—> f (х) в каких-нибудь узких интервалах могли быть нами не учтены.
Замечательно то обстоятельство, что оценки сверху для тех же величин получаются из очень простых соображений, подмеченных Декартом еще в 1637 г. Введем следующее
§ 4] МНОГОЧЛЕНЫ С ВЕЩЕСТВЕННЫМИ КОЭФФИЦИЕНТАМИ 285
Определение. Пусть
«О, Я/..	.......%	(0 < '1 < Ч <
(1)
— все ненулевые коэффициенты многочлена f (X) = а9Хп-]-+	. €К[Х], выписанные в данном порядке.
Если aikaik+l < 0, то говорят, что на (fe-j-l)-M члене имеет место перемена знака. Общее число перемен знаков в последовательности (1) обозначается символом L(f).
Ясно, что всегда O^Z>(/)^deg/, причем L{—f)= = L(f). Заметим также, что L (/) = L (aXk + ^itXn~^ + ...), где показатель k удовлетворяет единственному условию k > п — iY и аа^ > 0. Если 1(/) = 0, то, очевидно, f не имеет положительных корней. С другой стороны, у f может не быть положительных корней и в том случае, когда L(/) = deg/. Пример: /(Х) = Х2— Х+1. Все же, как мы увидим, символ L (/) имеет прямое отношение к числу положительных корней многочлена /.
Лемма. Если с > 0, то L((X—с) /) = £(/) + 1 +2$, где s£Zt s^O.
Доказательство. Предполагается, конечно, что /#=0, так что символ L(f) имеет смысл. Если deg f = 0, то L(f) = O, и лемма верна с s = 0. Рассуждая по индукции относительно deg/, предположим, что лемма доказана для всех многочленов степени < п. Пусть deg/ = п и
/ = aQXn akXn~k. -}-an_1X + ant
где ak—первый после aQ отличный от нуля коэффициент, если таковой имеется (k^ 1). Так как £(—f) = L(f), то без ограничения общности считаем aQ > 0. Положим
g(X) = akXn~k+ ... +ап_1Х + ап.
Ясно, что
L(f) = L(g) + e9	(2)
где
Снова предполагается, что g=^=0, иначе доказательство для / очевидно. Положим еще для дальнейшего
(X-c)g(X) = akX^^ + h(X)
(заметим, что g#=0 =$> й#=0).
286
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
По предположению индукции и ввиду равенства (2) L((X-c)g(X)) = L(g)+l+2t = L(f) + l-e + 2t. (3) Имеем также
(Х-с) f = aQXn (X-c) + (X-c)g =
= aQXn + 1 — aocXn-\-akXn + 1~k + h,(X). Если k >1,то, очевидно, L((X—c)f) = 2— & + L((X—c)g), поскольку c>0 (2 — в—число перемен знаков в последовательности а0, —аос, ak). С учетом (3) получаем
L((X —c)f) = L(f)+l+2s, где s=t+l— 8>0.
Остается рассмотреть случай k=l:
(Х-с) f = aQXn + l + (а1 — аос) X- + ft (X). Если и — aQc имеют одинаковые знаки, то
L ((а, - aQc) Хп + h (X)) = L ((X - с) g) и
L((X-c)f) = s + L((X-c)g) = L(f)+l+2sf s = t.
Если аг и аг — аос имеют противоположные знаки, что возможно лишь при аг > 0 и 8 = 0, то
L ((^ - а.с) X» + h(X)) = L((X-c)g)±\ =
= L(f) + l+2/±l и
L ((Х-с) /) = 1 + L ((а.-а.с) X" + h (X)) = L (/) + 1 + 2s, где s=t или /+1. Наконец, если аг — aQc = 0, что опять-таки возможно лишь при аг > 0 и 8 = 0, то
L ((Х-с) f) = L (я0Х" + 1 +h (X)) = L (a^ + h (X)) = = L((X-c)g) = L(f)+\+2st s = t. |
При помощи доказанной леммы легко получается правило знаков Декарта.
Теорема 2. Число положительных корней многочлена f с вещественными коэффициентами совпадает с L (f) или меньше его на четное число.
Доказательство. Пусть clt c2t ..., ctJl — положительные (не обязательно различные) корни многочлена
§ 1] МНОГОЧЛЕНЫ С ВЕЩЕСТВЕННЫМИ КОЭФФИЦИЕНТАМИ 287
f (X) = aQXn + . .. + an_vXv, где по условию ао>Ои an_v— последний отличный от нуля коэффициент. Вспоминая вид канонического разложения многочлена (теорема 1), мы можем записать:
f(X) = (X-cJ...(X-cm)g(X),	(4)
где g(X) = aQXn~m+ ... + bXv, aQ > 0, b > 0 (v^O). Так как aQ и b—одного знака, то L(g) = 2t— четное число. Принимая во внимание лемму и разложение (4), получаем цепочку равенств
L((X-cl)g)==\+2(s1 + t),
L ((X -с2) (X -q) g) = 1 + 2 (sx +1) + 1 + 2s2 =
= 2 + 2 (sx + s2 + /),
L (/) — m + 2 (Sj + Sj + ... sm +1).
Последнее из них как раз и выражает утверждение теоремы. |
Итак, всегда	Мы остановимся теперь на
практически важном случае, когда из каких-либо соображений заранее известно, что все корни многочлена f вещественные. Тогда имеет место уточнение теоремы Декарта.
Теорема 3. Если все корни многочлена f вещественные, то для числа m(f) = m его положительных корней, с учетом кратностей, справедливо равенство m(f) = L(f).
Доказательство. Можно было бы довольно легко вывести теорему 3 из теоремы 2, но столь же просто (и притом поучительно) независимое доказательство, на котором мы и остановимся.
По известной теореме Ролля из анализа (или теореме о среднем) между корнями а' и Ь' нашего многочлена f (X) найдется число a'<c<b', для которого f' (с) = 0. Отсюда следует, что все корни производной f' (X) вещественны и т (/*') ~т (/) или m(f)—1. В самом деле, пусть ct < с2 < . .. < сг—корни многочлена f кратностей п19 п2, ..., пг, так что Я1+и2+ • • • + nr = deg/ = n. По теореме 5 § 1 производная f имеет корни с19 с2, ...,сг кратностей пг—1, п2—1, ..., пг—1, а в промежутках между ними по теореме Ролля еще хотя бы по одному корню c'L, с\, ..., cr_Y. Всего получается —1)+...
288
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
... + (пг—1)4-г—1 =п — 1 вещественных корней. Так как <tegf' = n—1, то других корней у /' и нет. Пусть, далее, < 0, а с19 ...,сг—все положительные корни кратностей п19 ..., nr: nt-]- ... + пг = т = т (f). Положительными корнями производной /'(X) будут корни с19 ...,сг кратностей nt—1, . . . , Пг—1, КОрНИ С/, ..., с' и, возможно, еще корень т. е. число их =	—1 или т(/),
как и утверждалось. Аналитическим выражением этого факта служит почти тавтологическая формула
=	е = ^ (1 — (— •)“</)+га (/,))-	(5)
Заметим еще, что если
f (X)-^aQXn+an_vXv,	(6)
где an_v — последний отличный от нуля коэффициент, то, в соответствии с записью (4),	= (—1)%-с1з.. .citnb, где
cik > 0 и b > 0. Другими словами,
(-l)-^^_v>0.	(7)
Рассуждая теперь по индукции относительно п = deg f, допустим, что теорема доказана для всех многочленов степени < п. Если в (6) v > 0, т. е. ап = 0, то f (Х) = =x-fi(x), причем m(f) = m(f1) — L(f1)~L(f)(m(fl)— — HfJ—по индукции). Остается рассмотреть случай «„=7^0. Пусть
/' (X) = па„Хп-1 + ... + рап-цХ14-1,	=# 0.
Тогда
L(f) = L(D + b, 6 = 4(1-4чГи|)=° или L
Z \	| ипиП-1Х I /
Но мы знаем (см. (7)), что (—> 0 и (—I)"1 l/x>a„_g > > 0. Поэтому 6 = у(1 — (—l)'n|/>+,n V'») и, стало быть, 6 = е. Так как по предположению индукции L (/') = т (fr), то окончательно имеем L(f) = m (}') + «, или, сравнивая с (5),
Следствие (частный случай теоремы Бюдана — Фурье). Пусть все корни многочлена! вещественны. Тогда число его корней, лежащих в интервале (а, Ь), равно
§4) МНОГОЧЛЕНЫ С ВЕЩЕСТВЕ ИНЫМИ КОЭФФИЦИЕНТАМИ 289
где
fa(X) = f (Х-\-а) = £ ТХ*’
О < k < п
fb(X) = f(X+b)= £
О < k < п
— разложения в ряд Тейлора (см. упражнение 3).
Доказательство. По определению число m(fa) положительных корней многочлена fa равно числу корней заданного многочлена f, больших чем а. То же замечание относится к fb. Следовательно, число корней многочлена/, за-ключенных между а и b (а < /?), о равно разности tn (fa) — т (fb)9	о
которая по теореме 2 выража- __________0 0___________х
егся в виде L (fa) — L (fb). |	о	х
3. Устойчивые многочлены. У ни-	о
тарный многочлен
/(Х) = А« + ^-1 + ...	рнс. 18.
• • • +
с вещественными коэффициентами называется устойчивым, если все его корни лежат в левой полуплоскости:
f (X) = О, X = а + /*Р => а < О
(см. рис. 18). Терминология ведет свое происхождение из теории дифференциальных уравнений. Получаемые там критерии асимптотически устойчивого поведения физической (а в более широком смысле— механической, технической или экономической) системы в окрестности положения равновесия требуют, чтобы
lim е^ = 0,	(8)
t -> + 00
где X—произвольный корень многочлена ассоциированного с дифференциальным уравнением порядка п с постоянными коэффициентами. Так как по формуле Эйлера (см. (15) § 1 гл. 5)	=
= eai (cos р/ + i sin р/), то доминирующим членом является eai и условие (8) эквивалентно неравенству а < 0.
Возникает своеобразная проблема локализации — проблема Рауса — Гурвица*), когда непосредственно по коэффициентам много
*) Фактически поставленная гораздо раньше (1868 г.) английским физиком Д. К. Максвеллом и решенная для небольших степеней русским инженером И. А. Вышнеградским, который занимался задачей устойчивости регуляторов (1876 г.)*
10 а. И. Кострикин
290
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
члена f надлежит выяснить, является ли он устойчивым. Эта алгебраическая задача была решена еще в 1895 году. Критерий Рауса — Гурвица гласит: многочлен f устойчив тогда и только тогда, когда выполнены неравенства
Гх > О, Г2 > 0, ..., Г„ > 0,	(9)
где аА	1	О	О	О	0	...	О
а3	а2	а±	1	О	0	...	О
Г ___ а5 а4 °3	а1 1	... О
k~~	а7	aQ	а5	а4	а3	а2	...	О
а2Й-1 °2fc-2 fl2fc-3 fl2&-4 G2/e~5 a2k - 6 • • • ak
(предполагается, что as = Q при s> n).
He пытаясь доказать теорему Рауса—Гурвица (это более уместно делать в других курсах), мы обратим внимание на то обстоятельство, что ее формулировка своим изяществом целиком обязана теории определителей. Далее, согласно теореме 1, при выполнении условий (9) многочлен f (X) представляется в виде произведения множителей вида X-f-u, X2-j-^X + tt/c и > 0, и > 0, w > О, а это значит, что все коэффициенты устойчивого многочлена f (X) положительны:
ах > 0, а2 > 0, . ..,ал>0.	(10)
Таким образом, условия (10) необходимы для устойчивости многочлена f (X). Не являясь в общем случае достаточными, они позволяют, однако, приблизительно вдвое понизить число детерминантных неравенств (9). Это удобно, так как вычисление определителей—трудоемкое дело.
Пример. При п = 2 система неравенств Гх > 0, Г2 > 0 эквивалентна более простой: а± >0, а2 > 0, что, между прочим, видна из формул для корней квадратного уравнения.
При п = 3 все сводится к неравенствам аг >0, а2 > 0, а3 > 0 ata2 > а3, поскольку Г3 = a3(aYa2— а3).
Наконец, отметим, что критерий Рауса —Гурвица не решает всех вопросов, связанных с устойчивостью, поскольку па практике речь идет о многочленах и о дифференциальных уравнениях, коэффициенты которых зависят от параметра. В терминах самого параметра должны формулироваться и условия устойчивости, что представляет собой задачу совсем иной природы.
УПРАЖНЕНИЯ
1. Пусть /(Х) = ц0^л + а1^Лв1+ • • • + лп —вещественный много-
член степени п. Показать, что знание верхних границ положитель-
ных корней многочленов
ИХ), X»f , /(-X). X»/ дает
нижние и верхние границы как положительных, так и отрицательных корней многочлена / (X).
§ 4] МНОГОЧЛЕНЫ С ВЕЩЕСТВЕННЫМИ КОЭФФИЦИЕНТАМИ 291
2. В обозначениях упражнения 1 пусть aQ > 0, т — наименьший индекс, для которого ат < О, В —максимум среди абсолютных величин отрицательных коэффициентов. Показать, что
с<1 + ^/в7^
для всякого положительного вещественного корня многочлена f (X), (Указание. При х > 1 исходить из оценки
хп - т +1  1	хп - т + 1
f(x)^a^-B	---> - х__{	[а^-* (х-1)-В].)
3 (формула Тейлора). Пусть Р — поле нулевой характеристики, a g Р. Для любого многочлена f £ Р [X] степени п имеет место формула
f(X) = f(a) + f^(X-a)+^ (X —а)2 + ...	(Х-а)».
(Указание. Продифференцировать k раз формальное выражение / М = 2	(Х — ау и положить Х — а.)
4. Показать, что если f (а) > 0, /' (а) > 0, ...,	(а) > 0 для
вещественного многочлена f (X) степени п с положительным старшим коэффициентом а0, то / (с) = 0, с > 0 =Ф с < а. (Указание. Применить упражнение 3.)
5.	Воспользовавшись правилом знаков Декарта, найти знак дискриминанта многочленов X5 — X2+l, X3—6Х — 9 (см. замечание в конце п. 1).
6.	Могут ли многочлены X6 — X—1 и X3 + ^A4-6^Q [X] иметь общие комплексные корни? Напомним (см. упражнение 10 § 1), что многочлен X5 —X—1 неприводим над Q.
7.	Показать, что корни многочлена f (X) = X6 + uX4 Ц- иХ3 + w g
g IR [X] co свободным членом w ф 0 не могут быть все веществен-
ными. (Указание. Удобно перейти к взаимному многочлену
J и далее воспользоваться формулами (12) § 1 и (9) § 2. j 8. Ясно, что если целочисленный многочлен f (X) = aQXn + ...
.	имеет корень с g Z, то с делит свободный член ап =
= /(0): /(0 = 0 => °п = с(—	—	«л-i)- Показать,
что одновременно с—1 делит /(1) = 2а/ и делит f(—1) = =2 (— 1	(У к а з а н и е. f (X) = (Х-с) g (X) => g (X) £ Z [X].)
Применить эти соображения к отысканию целых корней многочлена Х4 + Х3-Х2 + 40Х— 100 (ответ: с = 2).
10*
292
КОРНИ МНОГОЧЛЕНОВ
[ГЛ. 6
9.	Убедиться в том, что
fm~Xn + aiXn-'+.Z[X), /(0 = 0, c£Q => cgz.
(У казание. Если c = a/b — несократимая дробь, то ап/Ь~ — агап -1— — a2a«-2Z> — ,..—апЬп~\) Что можно сказать о рациональных корнях целочисленного многочлена со старшим коэффициентом а0 96 1?
10.	Любой многочлен f (X) с f (х)	0 для всех х g R можно
представить в виде
f(X)=g(X)* + h(X)\
где g, h g R [X]. (Указание. При помощи теоремы 1 разложить f (X) на множители вида (X + а)2 4- Ь2 и воспользоваться формальным тождеством
(ра + q2) (/•’ + sa) = (pr + qs)* + (ps — qr)\ вытекающим из соотношения
I P + iq 121 N- Is P = I (p + iq) (r + is) P).
11.	Получить самостоятельно критерий устойчивости многочленов степеней 3 и 4. При л=^4 записать его в виде неравенств: at > 0, а* > 0, а1а9>а3, а3 (а^—а9) > а[а4. (Указание. /(Х)==Х3 + + aX24-W + c = (X2 + aX + ₽)(X + 0), где a = a + 0, Ь = р-|-а0, с =»Р0, причем а, Р, 0 £ R. Устойчивость f (X) эквивалентна устойчивости пары многочленов X2 + aX-|~P, Х + 0, т. е. выполнению неравенств a > 0, Р > 0, 0 > 0. Легко проверяется, что эта система эквивалентна системе неравенств a > 0, b > 0, с > 0, ab — с > 0. Аналогичные соображения применить к вещественному многочлену четвертой степени.)
«Последнее время все более распространенной становится течка зрения, что многие области математики являются не чем иным, как теорией инвариантов специальных групп»
(С оф у с Ли, 1893)
ЧАСТЬ II
ГРУППЫ. КОЛЬЦА. МОДУЛИ
Содержание второй части можно квалифицировать как весьма серьезное, но, надо надеяться, не слишком абстрактное продолжение первой части. Новых понятий вводится сравнительно немного. Читатель встретит своих старых знакомых по главе 4, которые введут его в область гораздо более содержательных понятий. Самое пристальное внимание рекомендуется уделить изучению примеров, которым отведена добрая четверть текста (скажем, материал § 1 гл. 7 и § 3 гл. 8 естественно отнести к примерам). Помимо всего прочего, подбор примеров рассчитан на то, чтобы перебросить мостик между алгеброй и другими разделами математики. Если в результате у читателя окрепнет чувство единства математики, то цель, поставленную автором во второй части книги, следует считать достигнутой.
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
1.	Атья М., Макдональд И., Введение в коммутативную алгебру, «Мир», 1972.
2.	Барти Т., Биркгоф Г., Современная прикладная алгебра, «Мир», 1976.
3.	Белоногов В. А., Фомин А. Н., Матричные представления в теории конечных групп, «Наука», 1976.
4.	Б о р е в и ч 3. И., Шафаревич И. Р., Теория чисел, «Наука», 1972.
5.	Б у р б а к и Н., Алгебра (модули, кольца, формы), «Наука», 1966.
6.	Вейль Г., Классические группы, их инварианты и представления, ИЛ, 1947.
7.	Джек обе он И., Алгебры Ли, «Мир», 1964.
8.	Дьедонне Ж-, Мамфорд Д., К ер рол Дж., Геометрическая теория инвариантов, «Мир», 1974.
294
ГРУППЫ
[ГЛ. 7
9.	Же л обе п ко Д. П., Компактные группы Ли и их представления, «Наука», 1970.
10.	Калужнин Л. А., Введение в общую алгебру, «Наука», 1973.
11.	Каргаполов М. И., Мерзляков Ю. И., Основы теории групп, «Наука», 1972.
12.	Кириллов А. А., Элементы теории представлений, «Наука», 1972.
13.	Кон П., Универсальная алгебра, «Мир», 1968.
14.	Курош А. Г., Лекции по общей алгебре, «Наука», 1975.
15.	Любарский Г. Я., Теория групп и ее применения в физике, Физматгиз, 1958.
16.	Мальцев А. И., Алгебраические системы, «Наука», 1970.
17.	Н а й м а р к М. А., Теория представлений групп, «Наука», 1976.
18.	Понтрягин Л. С., Непрерывные группы, «Наука», 1973.
19.	Постников М. М., Теория Галуа, Физматгиз, 1963.
20.	Серр Ж--П., Линейные представления конечных групп, «Мир», 1970.
21.	Серр Ж.-П., Курс арифметики, «Мир», 1972.
22.	Фейт Ч., Кольца, модули, категории, «Мир», 1976.
23.	Херстейн И., Некоммутативные кольца, «Мир», 1972.
24.	Холл М., Теория групп, ИЛ, 1962.
Глава 7
ГРУППЫ
Настоящая глава развивает понятие группы, введенное в главе 4. В первую очередь акцент делается не на абстрактных группах, коим посвящено много специальных руководств, а на изучении разного рода естественных «действий» групп. Именно конкретные реализации групп послужили толчком к развитию общей теории групп и создали ей репутацию полезного инструмента математического исследования.
На фоне частных (но, заметим, важных) примеров еще настоятельнее становится идея рассмотрения (гомо-, эпи-, изо-) морфизмов групп, равно как теоретико-групповых конструкций, позволяющих сводить изучение сложных объектов к более простым.
§ 1.	Классические группы малых размерностей
1.	Общие определения. Курс линейной алгебры и геометрии снабжает нас новыми образцами групп, которые заслуживают того, чтобы остановиться на них чуть подробнее. Выделение в группах преобразований аффинных,
§ 1]
КЛАССИЧЕСКИЕ ГРУППЫ МАЛЫХ РАЗМЕРНОСТЕЙ
295
евклидовых и эрмитовых пространств подгрупп, оставляющих на месте фиксированную точку (например, начало координат), приводит к так называемым классическим группам GL(n), SL(n), O(n), SO (/г), U(n), SU (и). Отметим, что их истинное место — среди так называемых групп Ли. Следовало бы добавить по крайней мере еще симплектическую группу Sp (и), но мы не ставим своей целью описание всех классических групп; это делается в других книгах. При небольших п говорят о классических группах малых размерностей. С группами GL (и), SL (п) мы имели случай встречаться ранее (см. часть I). Желая избежать большой зависимости от геометрии, напомним, что выбор ортонормированного базиса в пространстве приводит к эквивалентному матричному определению ортогональной и унитарной групп:
О (п) - (Л С Мп (R) | М • А - А • 'А - £},
SO (п) = {Л СО (п) | det Л = 1},
U (п) = jА £ Мп (С) | Л* • А = А • Л* = £}, SU (/г) = {Л € U (п) | det Л = 1}.
Здесь Л* = *Л— матрица, получающаяся из А = (а^) транспонированием и заменой коэффициентов а^ комплексносопряженными числами а^. Группы SL(n), SO(n), SU (и) носят название специальных (линейных, ортогональных и унитарных). В частности,
О(1) = {±1}, S0(i) = ob
U (1) = {ei<f 10< Ф < 2л}, SU(1) = {1}, SO (2) = Л cos<₽ ~sint₽ ||0^ф<2л1^и(1).
v J III Sin ф COS Ф | I	)
Изоморфизм между группами SO(2) и U(l) задается естественным соответствием
cos ф — sin ф || sin ф cos ф II
Так как геометрическим изображением комплексных чисел 0^ф<2л, является окружность S1 единичного радиуса в R2, то говорят еще, что группа SO (2) и окружность S1 топологически эквивалентны. Точный смысл этой терминологии разъясняется в курсе геометрии.
296
ГРУППЫ
ГГЛ. 7
Замечательная и гораздо менее очевидная связь существует между группами SU (2) и SO(3). Остановимся предварительно на геометрическом изображении группы SU(2), которое приведет нас впоследствии к геометрическому изображению группы SO(3).
2.	Параметризация групп SU (2), SO (3). По известной теореме Эйлера каждый элемент группы SO(3) собственных вращений трехмерного евклидова пространства IR3 является вращением вокруг некоторой неподвижной оси. Скажем, матрицы
Ii COS ф
= sin ф
II 0
— sin ф
COS ф о
° II 01 ill
О О cos 6 —sin О sin 6 cos О
(1)

1 о О
отвечают вращениям вокруг осей Oz и Ох соответственно на углы ф и 9. Используя параметризацию вращений углами Эйлера ф, 0, г|) (О^ф, гр < 2л, 0^0<л), геометрический смысл которых нас пока не интересует, любую матрицу А € SO (3) можно записать в виде
А — ВфСоб^,
(2)
где С0, В^—указанные выше матрицы (1). Пусть, далее,
e|esu(2).
Имеехм
g‘ = 'g
||« V I b «I
II 6 II—V
-Ц-

Так как g€U(2) <=> g* —g~l, то 6 = а и у — — 0. Таким образом, любая матрица g из SU(2) имеет вид
£=|-Т	1«12 + |0|3 = 1.	(3)
Обратно, если g—матрица вида (3), то, очевидно, g € SU(2). Значит, каждый элемент группы SU(2) однозначно определяется парой комплексных чисел а, 0, таких, что |а|2 + |0|3 = 1. Если положить a = aj4-«a2, 0 = 0x4-102 с аА, i — V — b то условие |a|s4-|0|a= 1, переписанное в виде
a?4-aa4-0?4-₽S=l,
§ 1]
КЛАССИЧЕСКИЕ ГРУППЫ МАЛЫХ РАЗМЕРНОСТЕЙ
297
дает основание говорить, что группа SU (2) топологически эквивалентна (гомеоморфна) сфере S3 в четырехмерном вещественном пространстве R4.
Обратим внимание на унитарные матрицы
^Ф —	е 2	0	, Со =	е cosy 0	0 i sin у 0
	0	е *		Zsin ~2	cos у
(4)
Как доказывается в курсе линейной алгебры (а в данном случае проверяется непосредственно), для унитарной матрицы g вида (3) существует унитарная матрица и такая, что
g^ubyU'1	(5)
л
с 2 , определяемым из квадратного уравнения
V —2а^ + 1 -0.
Отметим также, что любой матрице (3) при =^0 можно
придать вид
я(ф, 0, гр) = ЬуСвЬ^ =
0 cos 2“
о i sin -у ll 2
i <£±1 е 2
i
♦ е 2
. . о ' V
I sin у • е 2
о
COS у ’ е
, (6)
где
0<ф<
2л,
0<0 < л, —2л<Сф < 2л *).
Достаточно положить
|a| = cosy, Arga = ^i^, | р | = sin у, ArgP = 5L_|±Ht
используя то обстоятельство, что каждое комплексное число z задается двумя вещественными параметрами | z | и arg г (Argz—главное значение аргумента arg г).
Теперь мы готовы приступить к решению основной задачи этого параграфа.
*) Из дальнейшего будет видно, что ср, 6, гр—те же углы Эйлера. Унитарным матрицам ±g ставится в соответствие одно и то же вращение в R3, поэтому область изменения гр сжимается до полуинтервала [0, 2л).
298
ГРУППЫ
[ГЛ. 7
(7)
3.	Эпиморфизм SU (2) —> SO (3). Поставим в соответствие каждому вектору х = х1е1 + х2е2 + хае3 трехмерного евклидова пространства R3 с нормой N (х) = xf + х2 + х3 комплексную матрицу второго порядка
нх=\\ Хз. * hi—
Пространство матриц вида (7) состоит из всех эрмитовых матриц с нулевым следом (fHx = Hx, tr//^ = 0), причем соответствие между векторами х £ R3 и матрицами НХ^М2 является, очевидно, взаимно однозначным. В частности, базисным векторам е2, e3gR3 соответствуют баj зисные матрицы hk = He :
ч? ih чи «!• ч; ч
//х x1h1 -j- x2h2 Ч x3h31 Al2	^^1» R •
Заметим, что каждому линейному оператору Ф+: Нхъ->Ну на MJ с матрицей А в базисе (8) будет отвечать вполне определенный линейный оператор Ф: х|н-»у на R3 с той же матрицей А в базисе elt e2f e3f поскольку Hax = aHxt НХ+Х' = НХ + НХ'. Так как никакие другие базисы в дальнейшем не используются, то мы будем иногда отождествлять операторы и соответствующие им матрицы.
Пусть теперь g—фиксированный элемент группы SU (2).
Рассмотрим отображение
Ф+: Hx*->gHxg~\	(9)
Так как следы подобных матриц совпадают, то 1гФ^ (Нх) = = tr Нх = 0. Кроме того, gr*=tg = g“1, поэтому
= (g-1)* H*g*=gHxg~l
и, следовательно, Ф^ (Нх) € MJ:
Ф+(ЯХ)=|| Уа. г/1'НМ = Я х’ hi—»г/2	— Уз II у
где у — (ylt у2, уа) £ R9. Из определяющих равенств (7) и (9) видно, что
Ф£ (Ншс+а.Х') = аФ+ (Нх) + а'Ф+ (И,).
Стало быть, отображение Ф^ (соответственно Ф^) — линейный оператор на MJ (соответственно на R9).
$ 1] КЛАССИЧЕСКИЕ ГРУППЫ МАЛЫХ РАЗМЕРНОСТЕЙ 299
Покажем, что Ф?: R3—>-R3—ортогональный оператор. В самом деле,
W (Фг (х)) = N (у) = yl+yl + yf = - det Ну=—det Ф*(НХ) = = — det gHxg~r = — det Нх — х? + х3 + xf = N (х),
т. е. Ф^ сохраняет норму, а следовательно, и скалярное произведение. Пока не ясно, меняет ли Ф£ ориентацию пространства R3, что зависит от знака detcp^. Мы знаем лишь, что det®^=±l.
Как следует из определения,
ф|,(ф^)=й(г2ад)^=
= (&&) нх to)’1=4>glga (Нх),
причем Ф£ — единичная ортогональная матрица порядка 3
11 € SU (2). Значит, соответствие
для Е =
Ф: g^»<bg
(или Ф+: gi—>Ф£)
является гомоморфизмом SU (2) в 0(3). Ядро Кег Ф=КегФ+ состоит из унитарных матриц g, для которых Ф£ = Ф£. Другими словами,
Ke^ = {g£SU(2)|gtf = tfg, УН$ЛЩ =
= {geSV(2)\gh/ = h/g9 /=1, 2, ЗЬ
где h2, h3 — базис (8) пространства MJ. Прямая проверка показывает, что
g = | if -₽ll’ Shj = hjgt 1</<3 => g = ±E => | —р а
=> КегФ = {±£}.
Посмотрим теперь на образы унитарных матриц (4) при гомоморфизме Ф. Проведем вычисления для Ф+ в базисе (8):
= (cos ф) ft, + (sin ср) h2, bvh2b^ = (— sin ф) hr + (cos ф) h2, bfph^bfp1 — h2.
Значит (здесь мы свободно переходим от Ф+ к Ф и от матриц—к операторам), Ф6ф = Вф (см. (1))—вращение трехмерного евклидова пространства R3 на угол ф вокруг оси Ох3 (или /г8). Если ф и и выбрать такими.
300
ГРУППЫ
[ГЛ. 7
чтобы выполнялось соотношение (5), то, поскольку Ф — гомоморфизм, будем иметь
Ф^ = ФдФ^Ф-1 и det Ф^ = det Фа-1-(det Фп)-1 — 1.
Это показывает, что на самом деле Ф — гомоморфизм SU (2) в SO(3).
Аналогичным образом проверяется, что	— вра-
щение на угол 0 вокруг оси Oxv Теперь для любой матрицы А SO (3) имеем
А = ВфСоВф = фьфф^фьф = Фьфсеьф = фа «р, е,
Стало быть, образ 1шФ содержит всю группу SO(3), и нами доказана
; Теорема 1. Группа SO (3) является гомоморфным образом группы SU (2) при гомоморфизме Ф: gi—с ядром Кег Ф = {±£}. Каждое вращение из SO(3) отвечает ровно двум унитарным операторам g и —g из SU(2). |
4.	Геометрическое изображение группы SO (3). Из теоремы 1 непосредственно вытекает
Следствие. Группа SO(3) топологически эквивалентна (гомеоморфна) трехмерному проективному вещественному пространству R(P3).
В самом деле, мы видели в п. 2, что элементы из SU (2) находятся во взаимно однозначном соответствии с точками сферы S3 в четырехмерном вещественном пространстве R4. Линейным операторам ±gCSU(2) отвечают диаметрально противоположные точки на S3, которые при гомоморфизме Ф склеиваются (отождествляются). Получается одна из моделей проективного пространства R (Р3). В
В курсе линейной алгебры и геометрии проективное пространство R (Рп) определяется как множество прямых пространства Rw + 1, проходящих через начало координат О. Каждая такая прямая пересекает единичную сферу S3 с центром в О ровно в двух диаметрально противоположных точках. Заданием одной из этих точек прямая однозначно восстанавливается. Это и значит, что пространство R (Рп) может быть определено как факторпространство единичной сферы Sn изКп + 1 по отношению, устанавливающему эквивалентность диаметрально противоположных точек сферы Sn. В нашу задачу сейчас не входит задание топологии на R (Рп).
Мы пришли к довольно неожиданному результату. На сфере S3 и на проективном пространстве R (Р3) устанавливаются структуры группы: в первом случае —SU (2), во втором —SO (3). Всякая попытка задать структуру непрерывной группы на S2 или на R (Р2) окончится неудачей (результат, не относящийся к нашей теме).
Согласно теореме 1 и ее следствию, группа SO(3) «в два раза меньше», чем группа SU (2). Существование эпиморфизма SU(2) —>SO(3) делает естественным вопрос о существовании мономорфизма SO(3)—> —>SU(2). Мы увидим в гл. 8, что ответ на этот вопрос оказывается отрицательным.
$2]
ДЕЙСТВИЕ ГРУПП НА МНОЖЕСТВАХ
301
УПРАЖНЕНИЯ
1.	Заполнить лакуны в доказательстве теоремы 1, т. е. провести фактическую проверку (без ссылки на курс линейной алгебры и геометрии) всех мелких утверждений, начиная с равенства (2).
2.	Используя геометрическое изображение группы SU (2), показать, что
(0, 1,0,0) * (0,0, 1,0) = (0,0, 0, 1)	(0,0, 1,0)*(0, 1,0, 0)
(произведение точек на S3). Те же точки (0, 1,0,0), (0,0, 1,0), рассматриваемые на R. (Р3), перестановочны.
3.	Показать, что если коэффициенты унитарных матриц
Ki (0 = t . . i cos у i sin у =	. t t
l Sin у COS у
/
COS у
Sin у
. t
-Smy t
COS у
/<з(0 =
i --e *	0
-f—
0 e 2

продифференцировать матрицы
no t и положить затем f = 0, то получатся
к=41-? о|=4‘-
составляющие базис пространства Л12 косоэрмитовых матриц
к II ‘fe3
II

с нулевым следом: К* =—К, trA--0.
§ 2. Действие групп на множествах
1. Гомоморфизмы О—►S(Q). Теория групп началась для нас в гл. 4 с примеров групп преобразований — подгрупп группы S(Q) всех взаимнооднозначных отображений множества Q на себя. Этот подход соответствует как историческому пути развития теории групп, так и значению групп преобразований в других областях математики. Так называемая абстрактная теория групп, являющаяся порождением более поздней эпохи (первая половина нашего столетия), далеко отошла от групп преобразований, но многие ее понятия несут на себе отпечаток старого времени. Именно, источник этих понятий чаще всего покоится на идее реализации (представления)
302
ГРУППЫ
[ГЛ. 7
данной группы G в 5(й), где й—подходящим образом выбранное множество. Под реализацией G в 5(й) удобно понимать любой гомоморфизм Ф: G—>5(й). Если — преобразование из 3(Й), отвечающее элементу g£G, то Фе = — единичное преобразование й —> й и Ф^ Ф^оФл; g, h£G. Образ Ф^(х) точки (элемента) х$Й относительно преобразования Ф^ часто обозначается просто символом gx, что дает право говорить об отображении (g\ х) i—» gx декартова произведения (G, й) в й. Правильнее было бы писать gox или g*x, чтобы не получалось путаницы с умножением в G, но большей частью в этом нет необходимости. Отмеченные выше свойства преобразования Ф^ записываются в виде
(i)	ех=-х,	х£й;
(ii)	(gh) x = g (hx)', g, h$G.
Всякий раз, когда имеется отображение (g, x)>—>gx декартова произведения Схй в й, удовлетворяющее свойствам (i), (ii), говорят, что группа действует (слева) на множестве й, а й является G-множеством. С другой стороны, имея G-множество й, мы посредством формулы
®g(x)=gx, Х$£1,
для каждого g£G определим отображение Фг: Й—>-£2, причем из (i), (ii) следует, что Ф: g*—>Ф^ будет гомоморфизмом G в S (й). Говорят еще (в особенности, когда |й|<оо), что с действием G на й ассоциировано представление (Ф, Й) группы, G в группу перестановок. Ядро КегФ называют ядром действия группы G. Если Ф — мономорфизм (иначе: если gx = x, Ух£й => g = e), то говорят, что группа G действует эффективно на множестве й.
Замечание. Каждое действие G на й индуцирует действие G на й* = йх ... ХЙ по очевидному правилу: £-(Хр ..., хл) = (gpq, ..., gxk). Кроме того, имеется индуцированное действие G на множестве всех подмножеств 5*(й) (см. упражнение 4 § 5 гл. 1). Полагаем g0 = 0, а если Т—непустое подмножество в й, то gT = {gt 11 £ Т\. Свойства (i), (ii) проверяются непосредственно. Легко понять, что Т и gT имеют одинаковую мощность, так что G индуцирует действие на подмножествах одинаковой мощности.
§2]	ДЕЙСТВИЕ ГРУПП НА МНОЖЕСТВАХ	303
2. Орбиты и стационарные подгруппы точек. Две точки %, x'^Q называются эквивалентными относительно группы G, действующей на Q, если x'=gx для некоторого элемента g£G. Свойства рефлексивности, симметричности и транзитивности, легко получающиеся при помощи (i), (ii) (см. п. 1), показывают, что мы имеем дело с истинным отношением эквивалентности, разбивающим Q на непересекающиеся классы эквивалентности. Эти классы эквивалентности принято называть G-орбитами. Орбиту, содержащую элемент х0 б £2, естественно обозначать символом G(x0); таким образом, G (х0) = {gxQ | g С G}. Используются, однако, и другие обозначения, подчеркивающие особенности того или иного действия G на Q. Понятие орбиты пришло из геометрии. Если, например, G = S0(2)— группа вращений на плоскости вокруг начальной точки О, то орбитой точки Р будет служить окружность с центром в О, проходящая через Р, а множество Q = R2 будет объединением концентрических окружностей, включая окружность нулевого радиуса (точка О). Для нас понятие орбиты также не является новым. Мы им пользовались в гл. 4 при разложении перестановки л в произведение независимых циклов. В качестве G бралась циклическая группа <л>.
Пусть х0—фиксированная точка в Q. Рассмотрим множество
St (х0) = {£ € G |gx0 = х0} <=G.
Так как ех0 = х0, a g, h С St (х0) => ghr1 £ St (х0), то St(x0) — подгруппа в G. Она называется стационарной подгруппой (или стабилизатором) в G точки х0 С Q и часто обозначается символом СХу Для рассмотренного выше действия группы SO (2) на R2 имеем St (О) = SO (2) и St(P) = e, если Р^О. В общем случае
gx0=g'x0 <=> g-1g'€St(x0)	g'€gSt(x0).
Стало быть, левые смежные классы gSt(x0) группы G по стационарной подгруппе St(х0) находятся во взаимно однозначном соответствии с точками орбиты G(x0). В частности,
Card G (х0) = Card (G/St (х0)) = (G:St (х0)).	(I)
Здесь, как и раньше, G/St(x0)—фактормножество G по St(x0), a (G:St(x0)) — индекс подгруппы St(x0) в G.
304
ГРУППЫ
[ГЛ. 7
Мощность Card G (х0) часто называется длиной G-орбиты точки х0.
Из (1) и из теоремы Лагранжа следует, что длина любой орбиты относительно конечной группы G является делителем порядка группы. В
Обратим еще внимание на то обстоятельство, что точку х0 в правой части соотношения (1) можно заменить на любую точку Xq€G(x0). Действительно,
Card G (х0) = Card G (Хо) = (G: St (Хо)).
Более сильное утверждение о стационарных подгруппах заключается в следующем. Пусть х'—gx0. Тогда
St (xi) gxQ = St (xi) 4 - 4 = gx0, откуда
g-1St (x'0)gx0 = x0, t. e. g-'St (x;)gczSt (x0).
Аналогично,
gSt (xJg^cSt (xi), поскольку
St (x0) g-’xi = St (x0) x0 = x0 = g-'x*.
Значит, имеет место равенство
St (xj) =gSt (Xo)g-1 - {ghg-1| ft g St (x0)}.
В духе примера 1, рассматриваемого ниже, две подгруппы Н, Н' ^G называются сопряженными, если Н' = gHg"1 для некоторого g^G. Сформулируем полученные результаты в виде теоремы.
Теорема 1. Пусть группа G действует на множестве Q. Если две точки х0, Xo€Q лежат в одной орбите, то их стационарные подгруппы сопряжены:
x'0 = gx„ => St (х^) = gSt (x0)g-1.
Если, далее, G—конечная группа и
й = Йх U й2 U • • • U Йг
— разбиение й на конечное число орбит с представителями xv х2, ..., хг, то
|Й|= 2(G:St(x,)). 0	(2)
§ 2]
ДЕЙСТВИЕ ГРУПП НА МНОЖЕСТВАХ
805
Формула (2) лежит в основе многих применений «метода орбит» к конечным группам.
3, Примеры действий групп на множествах. Мы остановимся лишь на примерах, относящихся собственно к теории групп.
Пример 1 (действие сопряжением). На Q = G определяется действие любого элемента g £ G посредством формулы
Xt-^l glxj^gxg-1, VxgG.
Можно было бы писать = но мы предпочли воспользоваться старым нашим обозначением из п. 2 § 3 гл. 4 для внутреннего автоморфизма /£, отвечающего элементу g^G.
Действие g, отождествленное с действием Inn (G), называется сопряжением (или трансформированием). Его ядром служит центр группы G:
Z(G) = {zeG|//z) = z, 4g£G} = {z€G\zg = gz, Vg£G}.
Орбита элемента xgG = Q, обозначаемая здесь символом xG, называется классом сопряженных элементов или просто сопряженным классом, содержащим х. Если a, Ь£х°, то иногда пишут а^Ь. Для стационарной подгруппы St (%), называемой в этом случае централизатором элемента х, чаще используется обозначение С(х) (или Св (х), если нужно выделить группу G).
Действие сопряжением, согласно замечанию в конце и. 1, переносится на подмножества и подгруппы в G. Два подмножества Н, Тc:G сопряжены, если T^gHg'1 при некотором g£G. Пусть Н — подгруппа в G. Принято говорить, что
я (Я) - st (Я) = {g е G \gHg-i = Н}
— нормализатор подгруппы Н в G. В частности, Н <]О (Н— нормальная подгруппа в G), если N(H) = G, что согласуется с определениями в гл. 4. В соответствии с соотношением (1) длина орбиты IIе (число сопряженных с Н подгрупп) совпадает с индексом нормализатора N (Н) в G. I
Пусть, далее, G — конечная группа и xf, ..., х°—ее сопряженные классы, причем первые q из них —
306
ГРУППЫ
[ГЛ. 7
одноэлементные:
= г = 1, ...» <7 (хА = ё).
Тогда Z(G) = {xn х2, xq), а соотношения (1) и (2) переписываются в виде
\х?\ = (G:C(xz));	(1')
\G\ = \Z(G)\ + 2 (G:C(xz)).	(2')
i=q + 1
Пусть, скажем, G = S3. Тогда г = 3, q = 1 (т. е. Z (S3) = е) и S3 = H U {(12), (13), (23)1 U {(123), (132)}
— разбиение 53 на сопряженные классы. Размеры этих классов (длины орбит) делят 6 = |3Я |, как и предписывается соотношением (Г). Соотношение (2') приводит немедленно к следующему интересному утверждению.
Теорема 2. Всякая конечная р-грута G {группа порядка рп>\9 р — простое число) обладает центром Z(G)^e.
Доказательство. Если G — абелева группа, то G = Z(G) и доказывать нечего. В противном случае г > q9 (G:C (хд) = Pni,	1 при i > q9 и соотношение (2), пере-
писанное в виде
p" = |Z(G)|+ S рп‘, £=а+1
показывает, что | Z (G) | делится на р. О
Существование неабелевой р-группы установить легко. Достаточно рассмотреть группу верхних треугольных матриц
। II1
0
I ||о
а с II
1 ь1\а, b, c£Zp
0 1||
с коэффициентами в конечном поле кз р элементов.
Пример 2 (сдвиг). Определенное формулой La(g)=ag отображение La: G—+G, которое мы использовали при доказательстве теоремы Кэли (см. § 3 гл. 4), обычно называют левым сдвигом на а. Так как eg — g и (ab) g = a (bg), то левые сдвиги задают действие G на себе, которое индуцирует действие на подмножествах
§2]	ДЕЙСТВИЕ ГРУПП НА МНОЖЕСТВАХ	307
группы G. Пусть, в частности, Н — подгруппа и G/H— множество левых смежных классов gHt g(zG.
Ясно, что отображение
(х, gH)t->x(gH) = (xg)H
определяет действие LH группы G на G/Н. Ядром KerLH этого действия является множество {x^G\L^ {gH) — gH, ygeG\ = {xeG\L^(gH) = gH,ygeG} = {xeG,xgH = gH. Vg£G\.
Другими словами, x£KerLH Ф» g~lxg€.H Для всех gCG или, что эквивалентно, x^gHg~v, ^g^G.
Таким образом,
Ker LH = П gHg~l geG
— наибольшая нормальная подгруппа группы G, содержащаяся в Н. Эффективность действия G на G/Н равносильна отсутствию подгруппы К^Н,	нормаль-
ной в G.
Во всяком случае, любую подгруппу Н индекса п в G можно использовать для представления (LH, G/H) группы G перестановками L* на смежных классах G по Н. Это представление (возможно, неточное) гораздо более экономно, чем то, которое получается посредством применения теоремы Кэли.
Пример 3 (транзитивные группы). Группу перестановок Gc:Sn, действующую на множестве й^ {1, 2, ... ..., п}, называют транзитивной, если орбита G- некоторой (а следовательно, и любой) точки i g Й совпадает с й. Другими словами, действие Схй—>й транзитивно на й, когда для каждой пары точек i, j Сй найдется по крайней мере один элемент g£G с g(i)=j.
Пусть й^ —совокупность упорядоченных ^-элементных подмножеств в й. Группа G, действующая на й, индуцирует действие на ЙМ; если при этом имеет место транзитивность на й^, то G называется k-транзитивной на Й. Скажем, симметрическая группа Sn /г-транзи-тивна на й, а знакопеременная группа Ап (п — 2)-транзитивна.
Любая группа G действует транзитивно на множестве G/Н левых смежных классов G по Н (см. пример 2). Действительно, если g,//, gjH—два смежных класса, то
308
ГРУППЫ
[ГЛ. 7
gjgi1 (gi^) —g/H- Тем более удивительно, что о ft-транзитивных группах при ft > 5 известно очень мало. Существует даже (недоказанная) гипотеза К- Жордана столетней давности, что всего таких групп две: Sn и Ап.
Мы собираемся получить любопытные количественные результаты о транзитивных группах, которые понадобятся нам в дальнейшем. Пусть G—транзитивная группа на й. Стационарную подгруппу St (/) точки i^Q обозначим символом Gz. Нам известно (см. теорему 1), что если i = gi(V), то	i = l, 2, п (gt = e).
Кроме того, элементы g, можно выбрать в качестве представителей левых смежных классов G по Gx:
G = G1Ug2G1U ••• Ug„Gr	(3)
В частности, |G| = n|G1|, что согласуется с общими результатами о длинах орбит (см. п. 2).
Теорема 3. Пусть G—транзитивная группа на Й, и для любого g£G пусть N (g) — число точек в й, остающихся на месте при действии g. Тогда:
(i) 2 N (g) = I G | (поделив обе части равенства (i) на geG
| G |, получаем, что «в среднем» каждый элемент оставляет неподвижной одну точку);
(ii) если G — 2-транзитивная группа, то
2 Af(g)2 = 2|G|.
geG
Доказательство, (i). Имеем
2 n (g) = 2 г (/), g$G	/=1
где Г(/) — число элементов в G, оставляющих на месте символ j. Другими словами, Г (/) = | Gy |. Но в силу транзитивности | С, | = [1 = |	|, где gj взяты из раз-
ложения (3). Стало быть,
п	п
2 лчя) = 2 |оу|= 2 |ox|=n|Gx| = |G|.
gsG	/=1	1= 1
(ii) Условие 2-транзитивности G означает, что на множестве Q1 = Q\{1} стационарная подгруппа Gx действует транзитивно, т. е. Ох-орбитами будут (1) и Qx. Пусть
§2]	ДЕЙСТВИЕ ГРУПП НА МНОЖЕСТВАХ	309
ЛГ(х)— число точек в неподвижных при действии x^G1. Соотношение (i), примененное к паре (G\, QJ, дает
2 N'(х) = |GJ. Xt
Так как N (х) = 1 + N' (х) для х € G,(добавляется точка 1), то имеем
2 A^(x) = 2|G1|. хе Gt
Точно такие же соотношения справедливы для всех других Gf.
2 N (x) = 2|Gy| = 2|G1|.
X € Gy
Суммируя по /, получаем
2 2 ^(x) = 2/ifGJ = 2|G|.
7= 1 xceGy
Слева N (х) считается по одному для каждой подгруппы Gy, в которой содержится х. Но х оставляет на месте N (х) точек и, следовательно, содержится ровно в N (х) подгруппах Gy. Это означает, что каждый элемент х вносит в сумму член N (х)2. С другой стороны, любой элемент т/gG, не содержащийся в объединении U Gy, переставляет все точки, так что N (у) = 0. Поэтому можно написать соотношение
2 A4g)2=2 2 2V(x) = 2|G|. | geG	/= 1 xc Gy
4. Однородные пространства. Для геометрии особый интерес представляет тот случай, когда Й— топологическое пространство (например, прямая IR или сфера S2), G — так называемая непрерывная (или топологическая) группа, а действие (g, х) н—> gx подчиняется разумному требованию:
(iii) f (g, x) = gv —непрерывная функция двух переменных g и х. Группа С, действующая на Й так, что выполняются свойства (i), (ii) из п. 1 и (iii), называется группой движений пространства й. При этом могут быть движения, сохраняющие какую-нибудь метрику на Й. Пространство Й называется однородным, если G действует на Й транзитивно в смысле примера 3, т, е. все точки из Й принадлежат одной Сгорбите.
310
ГРУППЫ
[ГЛ. 7
Из общих соображений пп. 1—2 ясно, что имеется взаимно однозначное соответствие между точками однородного пространства Q и смежными классами G по одной из стационарных подгрупп Н. При этом движению g£G пространства Q отвечает отображение g'H к—> н-> gg'H на множестве G/H.
Рассмотрим с новой точки зрения хорошо известный нам из § 1 пример группы SO(3). Группу SO(3) удобно представлять себе действующей на двумерной сфере S2 единичного радиуса. Очевидно, что любой паре точек Р, Q£S2 отвечает некоторое движение (вращение), переводящее Р в Q, т. е. S2 — однороднее пространство с группой движений SO (3). Стационарная подгруппа St (Р) любой точки P£S2 оставляет неподвижной всю ось, проходящую через Р и центр О сферы. Поэтому St (Р) SO (2) —группа вращений плоскости, перпендикулярной к оси ОР.
Так как элементы группы SO (2) отождествляются с точками окружности S1 единичного радиуса, то группу SO(3) можно представлять себе в виде пирога, слоями которого являются единичные окружности, «пронумерованные» точками двумерной сферы: SO (3)/8Х ж S2. В этом случае говорят о расслоении (о проекции р: SO (3)—>S2) с базой S2 и слоем р~\Р) » S1, P£S2. Точный смысл всех этих понятий разъясняется в курсах геометрии и топологии, поэтому мы ограничимся сказанным.
УПРАЖНЕНИЯ
1.	Пусть Ф и Ф' — гомоморфизмы группы G в S (Q) и S (Q') соответственно. Тогда определенные ими действия на Q и на Q' называются эквивалентными, если существует биективное отображение а: Q—>Q', делающее диаграмму
а
Й — М а 1ФЙ Й —й'
коммутативной при всех g£G. Таким образом, ф^ = оф^о“1. Доказать, что каждое транзитивное действие группы G эквивалентно действию G на левых смежных классах по некоторой подгруппе Н. (Указание. Взять в качестве Н стационарную подгруппу точки 1£Й, воспользоваться разложением (3) и положить o(i)==giG1.)
2.	Опираясь на теорему 2, доказать, что все группы порядка р2 (р—простое число) абелевы.
3.	Показать, что центр группы Р, приведенной в конце примера 1, имеет вид
||10с
Z(P)=J 0 1 о
Цо о 1

§ 2]
ДЕЙСТВИЕ ГРУПП НА МНОЖЕСТВАХ
311
Найти сопряженные классы группы Р. (Указание. Обратить внимание, что все элементы группы Р имеют вид
II1 1 °
g — A'BfQk, где Д= 0 1 О
II0 0 1
В= О 1 1
I!1 0 1
С= О 1 о
Цо 0 1
1 о о
О 0 1
если g(£Z(P), то Cp(g) = <g>Z(G), |О (g) | = р2.)
4.	Пусть п—натуральное число. Запишем его в виде суммы n = Hi4-n2-|----\-пт с п2	пт 1. Число всех таких
разбиений с т= 1, 2, ... обозначим через р (и), так что р(3) = 3, р (4) = 5 и т. д. Разложение л = л1л2---л,я каждой перестановки л^5„ в произведение независимых циклов (см. § 2 гл. 4) однозначно определяет разбиение числа п. Показать, что сопряженные классы группы Sn находятся в биективном соответствии с разбиениями числа и. (Указание. Если ogSn и л = лх.. .лЛЛ, то олц-1 = =ол1о“1.. .ол^о-1; далее,o-(ixi2..	= (h) а(i2).. .а(1Л)) для
любого цикла	длины k).
5.	Пусть перестановка	записывается в виде произведе-
ния г циклов длины 1, s циклов длины 2, t циклов длины 3 и т. д., так что п = гЦ-2« + 3/+ ... Показать, что мощность сопряженного класса в Snt содержащего перестановку л, выражается формулой
п\
1 rr!2<ys!3//l...
6.	Пусть группа G действует на множестве Q. Назовем подмножество Г CZ Q инвариантным относительно G (или G-инвариантным), если для Bcexg£G их£Г. Например, инвариантными множествами при действии SO (2)х^2—► R2 являются концентрические кольца.
Показать, что всякое инвариантное подмножество в Q является объединением орбит, причем G-орбита любого элемента есть не что иное, как наименьшее инвариантное подмножество, содержащее х.
7.	Показать, что для группы G с подгруппой Н действие HxG—>G, определенное сдвигом (A, g)i—>Ag, задает разбиение G на правые смежные классы G по /7.
312
ГРУППЫ
[ГЛ. 7
8.	Видоизменив доказательство теоремы 1, получить соотношение '(G:Q)=T^T S N(s)’
1	1 geG
где r(G:Q)—число орбит группы перестановок G, действующей на множестве Q. (Указание. В сумме 2 N (g) каждый элемент подсчитывается | St (х) | раз. Стало быть, элементы, лежащие с х в одной орбите, вносят в 2 N (S) вклад, равный (G:St(x))X Х| St (х)| = | G |).
§ 3. Некоторые теоретико-групповые конструкции
Этот параграф, в особенности п. 1, представляет известные трудности, и к нему нужно возвращаться несколько раз, чтобы на конкретных примерах усвоить небольшое число абстрактных понятий.
1. Общие теоремы о гомоморфизмах групп. Мы видели в § 4 гл. 4, что с каждой нормальной подгруппой К группы G ассоциируется некая новая группа G/Д, которая была названа факторгруппой группы G по Д. Так, наряду с эпиморфизмом Ф: SU (2) —> SO (3), описанным в § 1, естественно ввести факторгруппу SU (2)/{±Е} и сравнить ее с образом 1тФ=-8О(3). Как нетрудно догадаться, SU (2)/{±Е} ^SO (3), но чтобы каждый раз не проводить рассуждения заново, полезно установить ряд общих фактов о подгруппах, гомоморфизмах и факторгруппах. Впредь запись Д <] G означает, что К—нормальная подгруппа в G.
Теорема 1 (основная теорема о гомоморфизмах). Пусть ф: G—+H—гомоморфизм групп с ядром К = Кег ср. Тогда К—нормальная подгруппа в G и Обратно, если К <j G, то существуют группа Н (а именно G/К) и эпиморфизм л: G—ядро которого совпадает с Д (л часто называют естественным отображением или естественным гомоморфизмом).
Доказательство. Мы уже знаем, что Кегф = =^K<]G. Определим отображение ср: G/K—+H, полагая
Ф (gK) = Ф (g) •
Если gx/< = g2/<, то gr’g^tf, ф(^Г^2) = ^и> стало быть, Ф (gi) ~ Ф (£г)> а это значит, что отображение ф опреде
S3] НЕКОТОРЫЕ ТЕОРЕТИКО-ГРУППОВЫЕ КОНСТРУКЦИИ 313
лено корректно (т. е. не зависит от выбора представителя смежного класса). Так как <р (gj/C-ga/O = <р (gxga/C) = = Ф (£1£2) = Ф (Si) Ф (g2) = Ф (SiK) Ф (&К), то ф—гомомор-физы. На самом деле ср — мономорфизм, потому что из Ф (giK) = ф (g2K) следует q> (gx) = ср (ga), откуда Ф_(^Г1йа)= = е, g^g2 € Д и gjt = g2K. Ясно также, что Im ср = Im ср. Поэтому ср является искомым изоморфизмом G/К на Im ф.
Обратно, пусть К <] G. Возьмем в качестве л функцию, которая сопоставляет любому элементу из G его смежный класс по Д, т. е. положим л (g) ^=gK- Ясно, что все требуемые свойства выполняются, д
Следует заметить, что заданием ядра гомоморфизм определяется неоднозначно. Например, автоморфизмы gi—>g и gi—>g-1 абелевой группы простого порядка р>2 различны, но ядра их совпадают ( = е).
Имея гомоморфизм р: G —^Gt и подгруппу Hc:G, естественно посмотреть на ограничение р|# и на образ подгруппы Н относительно этого гомоморфизма. Следующая теорема значительно упрощает анализ всех возможных ситуаций.
Теорема 2 (первая теорема об изоморфизме). Пусть G — группа, Н и К—се подгруппы, причем К нормальна в G. Тогда	— подгруппа eG, содержащая К.
Далее, пересечение Н П Д является нормальной подгруппой в Н, а отображение
Ф:
— изоморфизмом групп:
НК/К^Н/НПК.
Доказательство. Условие Д <] G, переписанное в виде gK = Kg, g£G, означает, в частности, что hK — I(h для всех h£H. Множество ЯД = {hk |h ё Н, состоит из некоторого числа смежных классов ЯД: ЯД =.• = U ЙД. Заменив здесь йД на Д/i, мы придем к равенству
ЯД- U hK= U Kh = KH. h$H hzH
Очевидно, что единичный элемент е, содержащийся в Я и Д, содержится также в ЯД. Далее,
314
ГРУППЫ
[ГЛ. 7
= й"1 (hkh~1)~1 g НК, поэтому обратные ко всем элементам из НК лежат в НК- Наконец, НК-НК = Н-КН -К^ —Н• НК-К — НК, т; е. множество НК замкнуто относительно умножения. Мы видим, что подмножество HKciG является подгруппой в G.
Так как К^НК и К <] G => К <] НК, то имеет смысл говорить о факторгруппе НК/К. Пусть л: G—>G/K — естественный эпиморфизм и л0 = л |я—ограничение л на Н. Его образ Imn0 состоит из смежных классов hK, h£H, т. е. из всех смежных классов G по К, имеющих представителей в Н. Другими словами, 1тл0 = Ж//(. Итак, мы имеем эпиморфизм
я0: Н—+НК/К.
Его ядро Кегл0 состоит из h^H, для которых л0(/г) = = hK = К — единица в НК/К. Но hK = K &h£H [}К, откуда Кег л0 = Н П К. Как всякое ядро гомоморфизма, НГ\К — нормальная подгруппа в Н (чю без труда проверяется непосредственно).
По основной теореме о гомоморфизмах (теорема 1) соответствие л0: /г(НГ\К) •—» л0 (Л) =/г/С устанавливает изоморфизм Н/Н П К^ HKIK- Так как л0 — биективное отображение, то ср= л^1: hK ь-> h (Н П К) также является изоморфизмом групп НК/К и Н/Н[\К- I
Коль скоро имеется первая теорема об изоморфизме, то должна существовать и вторая. Так оно и есть, но мы сформулируем лишь облегченный ее вариант, носящий специальное название.
Теорема 3 (теорема о соответствии). Пусть G — группа, Н и К—ее подгруппы, причем K<]G и Кс:Н. Тогда Н = Н/К—подгруппа в G = G/K и л*: Н »—> Н является биективный отображением множества Q (G, К) подгрупп в G, содержащих К, на множество Q(G) всех подгрупп группы G. Если Н g Q (G, К), то Н <] G Н < G, причем	_ _
G/H^G/H = (G/K)/(H/K).
Доказательство. Пусть /7gQ(G, К). Из определения G/К непосредственно вытекает, что Н/К —-подгруппа в G/К. Чтобы убедиться в инъективности отображения л*: Н »-> Н, рассмотрим две подгруппы Н19
§ 3] НЕКОТОРЫЕ ТЕОРЕТИКО-ГРУППОВЫЕ КОНСТРУКЦИИ 315
Я2 £ й (G, /(), для которых HJK = Н2/К- Тогда hr g =» => hAK = h2K9 h2£H2 => ht=^-h2kt а так как К cz Н2, то откуда Н}сН2. Аналогично проверяется включение Н2аНг Стало быть, Н1 = Н2,
Установим теперь сюръективность отображения л*. Пусть Н gQ(G) и Н — множество тех элементов в G, из которых состоят все смежные классы по К—элементы группы HczG. Тогда, в частности, К^Н и at b £Н => => аК, ЬК^Н =Ф аЬК = аКЬК£Н =>ab£H и а^Н =>
аК^Н => a~rK = (а/С)"1 €Н => а~г£Н. Стало быть, Н — подгруппа в G, причем H = H/K (обычно Н называют прообразом в G подгруппы И £G).
Довольно очевидна импликация Н 6 Q (G, K)t Н <] G => => Н О G, формально вытекающая из равенств gK‘hK-(gK)~1 = ghg~1K = hfK^H для __всех g£G9 h£H. Но по тем же причинам И <]G => ghg~1K = ^gK-hK-(gK)-'==h'K ghg-'ZH H<\G.
Наконец, в ситуации H^Q(G9 К), Н <]G, подсказанному можно рассмотреть два естественных эпиморфизма
л: G —► G/К; л: G —► G/H
(^(g) = gH9 где g = gK£G) и их композицию—эпиморфизм
а = лол: G —► G/И,
определенный правилом a (g) = Mg) = gH. Имеем: К er а = {g € G | а (g) = И} = {g £ G | g g H} = {g g G | gK = hK для некоторого h£H} = H. Следовательно, по основной теореме о гомоморфизмах отображение gH н-> gH является изоморфизмом между G/Н и G/Н. |
Пример 1. Пусть n = dm—натуральнее число с делителем d > 1. Очевидно, что п Z cz d 2 и отображение хн+ является эпиморфизмом аддитивных групп:
Z—^d^/nz = {d/4-nZ | i = 0, 1, m—1}
с ядром /nZ. По теореме 1 имеем изоморфизм
Z== 21d^,!
316
ГРУППЫ
[ГЛ. 7
(что довольно понятно и так). При помощи теоремы 3 находим Z/dZs(Z/nZ)/(dZ/nZ), т. е. Zd^Zn/Zm.
Вспоминая теорему 5 § 3 гл. 4, мы приходим к утверждению, что все подгруппы и факторгруппы циклической группы сами являются. циклическими группами.
Этот результат можно получить, конечно, и без теорем о гомоморфизмах.
Пример 2. Выделим в симметрической группе S4 подгруппы:
V4 = p, (12) (34), (13) (24), (14) (23)} < S4 (см. упражнение 4 §2), Sa = je, (12), (13), (23), (123), (132)}
(в данном случае З3 — стационарная подгруппа точки i = 4). Так как, очевидно, S3f]V4 = e, то для подгруппы H = S3y4 по теореме 2 имеем
H/V<~S3/S9f]V^S9.
В частности, | Н | = | V4 | |S3 | = 24, т. е. H = S4. Итак, 34 обладает подгруппой, изоморфной S3, и аналогичной факторгруппой. Применяя теорему 3, мы получаем описание множества Q (54, V4) подгрупп в S4, содержащих У4:
Q(S4, V4) = {V4 < (12) > V4, < (13) > V4, < (23)> V4, Л4 = < (123)> Г4, S4}.
Обратим внимание на то обстоятельство, что для любого делителя d числа 24 в S4 имеется хотя бы одна подгруппа порядка d. В частности, имеется ровно четыре подгруппы <(123)>) <(124)>, <(134)>, <(234)> порядка 3 и три подгруппы <(12)> 1Z4, <(13)> V4, < (23)> У4 порядка 8 (это так называемые 3-силовские и 2-силовские подгруппы). Собственных (т. е. # е и 54) нормальных подгрупп всего две: У4 и А4.
Действительно, если /< <1 S4 и ХП^4 # то /С Z)V4, потому что неединичные элементы в У4 все сопряжены относительно S4. Обращаясь к множеству Q (S4, |/4), мы видим, что Л = |/4 или Л4. Если же Kf|V4 = £?,	то
Л<54, У <] S4 KV4<]S4,
и остается принять, что КУ4 = 84, К S3. Но Ss содержит транспозицию, а все транспозиции сопряжены в 34 и порождают S4. С другой стороны, они должны содержаться в К. Полученное противоречие показывает, что случай 7<П1/4 = е невозможен.
2, Разрешимые группы. Выражение
[л,	=
называемое коммутатором элементов х, у группы G, служит корректирующим членом, необходимым для того, чтобы поменять местами х и у:
ху — [х, у] ух.
Если х и у перестановочны, то [х, у] = е. Интуитивно
§3] НЕКОТОРЫЕ ТЕОРЕТИКО-ГРУППОВЫЕ КОНСТРУКЦИИ ЗП
ясно, что чем больше в группе G коммутаторов, отличных от е, тем значительнее отклонение закона умножения в G от коммутативного. Пусть М — множество всех коммутаторов в G. Коммутантом (или производной подгруппой} группы G называют подгруппу G' ( = G(1) — [G, G]), порожденную множеством М (см. п. 2 § 2, гл. 4):
G' = <[x, у] | х, y^G>.
Хотя [x, y]~1=yxy~1x-1=[y, x]—коммутатор, произведе-ние двух коммутаторов быть им уже не обязано, так что G' состоит из всевозможных произведений вида
IX. л] IX. у2] • • • X.. у*] с х,-, у,- е g.
Конечно, в каждом конкретном случае желательно иметь более точное описание коммутанта G'.
Пример. G = Sn. Коммутатор |сс, Р^офа-1^-1 любых двух перестановок a, P£S„ является, очевидно, четной перестановкой. Поэтому	Далее,
(ii) W	= (ii) (ik) (ii) (Ik) = (ijk),
а так как тройными циклами (ijk) порождается вся знакопеременная группа Ап (см. упражнение 8 § 2 гл. 4), то мы приходим к выводу, что 5п = Лл.
Отметим, что S'n <] Sn и факторгруппа Sn!S'n абелева.
Возвращаясь к общей ситуации, мы рассмотрим произвольный гомоморфизм гр^пп ср: G—► G. Так как
ф (IX у]) = Ф (хух-'у-1) = <р (х) ф (у) ф (х)-1 ф> (у)-1 =
= [ф(х), Ф (у)],
то <р (G')c(G)', причем ф (G') = (G)', если ф — эпиморфизм. Пусть теперь К—нормальная подгруппа в G и <р = /д: хн-— внутренний автоморфизм группы G, индуцирующий какой-то эндоморфизм на Д. Согласно сказанному выше /д(Д')сД' при любом a£Gt а это означает, что
Д<0 К' <G.	(1)
В частности, O'<]G. Докажем теперь общее утверждение, вскрывающее внутренний смысл понятия коммутанта.
Теорема 4. Любая подгруппа K<^G, содержащая коммутант G' группы Gt нормальна в G. Факторгруппа G/G' абелева и G' содержится в каждой нормальной
318
ГРУППЫ
[ГЛ. 7
подгруппе К, такой, что G/К абелева (в частности, максимальный порядок абелевой факторгруппы G/К равен индексу (G\G')).
Доказательство. Если gfzG и G'c/<, то
=	*]*€G'7< = K, так что К <j G.
Далее, из условий G'c7<, К <] G, выполняющихся, в частности, при K = G' (см. (1)), следует, что \аК, ЬК] = аК-ЬК-cr'K-tr'K-aba-'b-'K = [а, т. е. коммутатор любых двух элементов факторгруппы G/К равен единичному элементу ( = /<). Стало быть, G/K — абелева группа. Обратно, если /<<]G и факторгруппа абелева, то
[а, Ь\К = [аК, ЬК] -К
для всех a, b£G. Значит, [а, и G' поскольку G' порождается коммутаторами. |
Замечание. Мы знаем теперь две важные нормальные подгруппы любой группы G: центр Z(G) и коммутант G'. Связь между ними, вообще говоря, слабая, но общая закономерность такова: чем «ближе» G к абелевой группе, тем больше Z (G) и тем меньше G'. Более интересен следующий факт.
Факторгруппа G/Z (G) неабелевой группы G по центру Z(G) не может быть циклической.
Действительно, если G/Z (G) — циклическая группа, то G = U azZ(G) и любой элемент из G имеет вид g = alz, i
z C Z (G). В таком случае [g, h] = [alz, a'z'] = a‘+J-f~S[z, z']~ =e для любых двух элементов g, h£G, G’ =e и G — абелева группа, вопреки предположению. |
В G' также можно рассмотреть коммутант (G')' = G", называемый второй производной группой (вторым коммутантом) группы G. Продолжая этот процесс, мы определим k-ю производную группу G{k} = (G(A"1))'. Согласно (1), G(k) <] G и, тем более, G(A) <] G(/f-1). Получается ряд нормальных подгрупп
G > G(1) > G(2) >...[> G{k) > G<*+1> >...	(2)
с абелевыми факторгруппами G{k}/G(k+1}.
Группа G называется разрешимой, если ряд (2) обрывается на единичной подгруппе, т. е. G{jn} = e для неко
§ 3] НЕКОТОРЫЕ ТЕОРЕТИКО-ГРУППОВЫЕ КОНСТРУКЦИИ 319
торого наименьшего индекса т—ступени разрешимости группы G. Очевидно, что любая абелева, в том числе циклическая группа является разрешимой ступени 1. Кроме того, в любой разрешимой группе G ступени разрешимости т имеется абелева нормальная подгруппа =£е, а именно G(m~u. Как показывают рассмотренные примеры, 54 = Д4, A4 = V4, V4 = e. Стало быть, знакопеременная группа А4 — разрешимая ступени 2, а симметрическая группа S4 — разрешимая ступени 3.
Своему названию разрешимые группы обязаны теории Галуа, о чем уже упоминалось в п. 1 § 2 гл. 1. Разрешимость группы S4 и всех ее подгрупп служит причиной разрешимости в радикалах алгебраических уравнений степени п^.4. Более детально с этими вопросами можно познакомиться по дополнительной литературе, рекомендованной в начале части II.
3. Простые группы. Существуют группы ^^совпадающие со своим коммутантом и, стало быть, не являющиеся разрешимыми. Более того, мы сейчас установим существование неабелевых групп, в которых вообще нет нетривиальных (=^е и G) нормальных подгрупп. Такие группы принято называть простыми.
Лемма. Любая нормальная подгруппа К группы G является объединением некоторого множества сопряженных классов группы G.
Действительно, если x^K<\Gt то и gxg~l £ К для всех g$G. Следовательно, вместе с каждым элементом х£К в К содержится целиком класс сопряженных элементов х° и /С= U хр. I £ € /
Теорема 5. Знакопеременная группа Аб—простая. Доказательство. Действительно, в группе Аб, помимо единичной перестановки е, имеется 15 элементов порядка 2 (по три элемента этого вида в стационарной подгруппе каждой из точек 1, 2, 3, 4, 5), 20 = 2 \ q] элементов (ijk) порядка 3 и 24 = 4! элемента
(1 ЧЧЬЧ) порядка 5. Элементы порядка 2 все сопряжены: они, очевидно, сопряжены в Sb, а так как стационарная подгруппа (относительно действия сопряжением) элемента (12) (34) содержит нечетную перестановку (12), то сопряжение может быть осуществлено четными перестановками.
320
ГРУППЫ
[ГЛ. 7
То же самое относится к элементам порядка 3. Но элементы порядка 5, сопряженные в S4, в группе А4 распадаются на два класса с представителями (12345) и (12354). В самом деле, (45) (12345) (45)’1 - (12354), а централизатором (= стационарной подгруппой) элемента (12345) в ЛБ служит циклическая группа порядка 5, порожденная этим элементом. Итак, мы имеем таблицу
1	15	20	12	12
е	(12) (34)	(123)	(12345)	(12354)
В нижней строке указаны представители сопряженных классов, а в верхней — мощности этих классов.
Пусть теперь Д—нормальная подгруппа в ЛБ. Согласно лемме
|Д|-61.1 + 62.15 + 53.20 + 64.12 + 6б.12, где 6Х=1 (так как и 6z = 0 или 1 при / = 2,3,4,5. Нетрудно убедиться в том, что условие на | К | быть делителем порядка | ЛБ | = 60 (теорема Лагранжа) оставляет лишь две возможности:
а)	б2 = 63 б4 = б5 = 0; Д— единичная подгруппа,
б)	62 = б3 = 64 = 65 = 1; Д = Лб.
Это и доказывает, что Л5 — простая группа, g
Индукцией по п теперь можно установить, что простыми являются все группы Ап, 5 (результат Э. Галуа). Так как подгруппы разрешимых групп разрешимы (Hc:G => //(Л)с=С(Л), fe=l, 2, ...), то из теоремы 5, во всяком случае, следует, что симметрическая группа Sn неразрешима при п^5.
Теорема 6. Группа вращений SO(3) является простой.
Доказательство. Согласно теореме 3 достаточно убедиться в том, что любая нормальная подгруппа Д группы SU(2), содержащая ядро {ч- Е} эпиморфизма Ф: SU(2)—>SO(3) (см. п. 3 § 1) и отличная от {±£}, совпадает с SU(2). Соотношение (5) § 1 можно интерпретировать по-новому, сказав, что в каждом сопряженном классе группы SU (2) содержится диагональная матрица d<p = b2y = diag {е‘ф, е"/ф}. Так как по лемме К является объединением некоторого семейства сопряженных классов
§ 3] НЕКОТОРЫЕ ТЕОРЕТИКО-ГРУППОВЫЕ КОНСТРУКЦИИ 321
группы SU (2), то без ограничения общности считаем Для некоторого <р > 0 такого, что sin<p=H=0.
В К должен содержаться также любой коммутатор
о
О
g-] = d<p(W£-1) = а Р
—р а
j О
I 0 ei(p
I ос |2 + / ₽ |2 е‘2<₽	*
*	|а|2 + |р|2е“‘'2ф
а —Р
Р а
где |а|2 + |р|2 = 1 (см. (3) § 1). Для следа матрицы [dq>,g] получаем выражение
tr [dy, g] - 2 | а р +1 р р (е^ + е~^) = 2 (1 — 2 | р р sin* <р).
Здесь |р| принимает любое значение из отрезка [0, 1] и sin ф=И=О. Снова в силу (5) § 1 найдется унитарная матрица /i£SU(2) такая, что /г[б?ф, g]^'1 = d$ = = diag	причем Так как е% е~'^—корни
характеристического уравнения
X2 4- (4 | р р sin2 ср —2) X 4-1 = О матрицы [d(p, g], то, заставляя |р| пробегать значения от 0 до 1, мы получим для ip любую точку на отрезке [О, 2ф]. Итак, в К содержится любой элемент и определенный параметромз|) сопряженный класс при 0	i|)^2<p.
Поскольку для всякого о > 0 найдется натуральное чи-
сло п, удовлетворяющее условию 0 < яр =2ф, можно утверждать, что в К содержится наперед заданный элемент do = d§. |
Уже из теорем 5 и 6 видно, что в классе простых групп содержатся важные для приложений группы как конечные, так и бесконечные. Может показаться удивительным, но до сих пор нет разумного описания всех конечных простых групп и не ясно, можно ли его получить.
4. Произведения групп. Сейчас мы рассмотрим конструкцию, позволяющую по заданным группам строить новые группы. В различных частных случаях эта конструкция нам уже встречалась.
Назовем (внешним) прямым произведением произвольных групп А и В множество Ах В всех упорядоченных
322
ГРУППЫ
[ГЛ. 7
пар (а, 6), где а£А, Ь^В, с бинарной операцией
(аг, Ъг) (а2, bt) = {а1а2, bJJ.
Строго говоря, следовало бы писать (а19 b1)^(a2, b2) = = (^0^,	где о, □, *—бинарные операции на Л,
В и Ах В соответственно, но для упрощения записи все операции условимся обозначать точкой (впрочем, опуская и ее). При аддитивной записи групп, например абелевых, естественно говорить о прямой сумме ЛФВ.
В Ах В содержатся подгруппы А хе, ехВ, изоморфные соответственно А и В (еще одна условность: единичные элементы в А и В обозначаются одним символом е). Отображение <р: Ах В—>ВхЛ, заданное равенством <р ((а, b)) = (b, а), очевидно, устанавливает изоморфизм групп Ах В и В х А. Если у нас есть три группы А, В, С, то можно говорить о прямых произведениях (ЛхВ)хС и Лх(ВхС). Положив ф(((а, Ь),с)) = (а, (Ь,с)), мы легко убеждаемся в том, что
(ЛхВ)хС^Лх(ВхС).
Свойства коммутативности и ассоциативности прямого произведения дают нам возможность говорить о прямом произведении любого конечного числа групп Gn G2, ..., Gn и писать
G\ х Go X ... X Gn = П Gz, i = i
не указывая явно посредством скобок, в каком порядке берутся попарные прямые произведения (мы превращаем тем самым множество всех групп в коммутативную полугруппу, элементами которой являются группы).
Теорема 7. Пусть G—группа с нормальными подгруппами А и В. Если А П В = е и АВ = G, то G^AxB.
Доказательство. Из равенства AB = G следует, что любой элемент g^G записывается в виде g = ab, где а£А, Ь£В. Если еще g = a1b1, а^А, ЬГ£В, то ab = = a1bi => а^а = b^b"1 £А(]В = е. Следовательно, = а, Ь± = Ь, и мы приходим к выводу, что запись g = ab однозначна. Далее, Л <] G => k =a(ba~1b~1) = aa' С Л; В <| G=> =^k = (aba'~1) b~1~b'b~1 С В, т.е. коммутатор/? С Л П В = е— единичный элемент и, стало быть, ab = ba.
§3] НЕКОТОРЫЕ ТЕОРЕТИКО-ГРУППОВЫЕ КОНСТРУКЦИИ 323
Определим теперь отображение <р: G—>ЛхВ, полагая Ф (ё) = Ь) для любого g = ab. Согласно вышесказанному, Ф (gg') = Ф (aba'b') = ф (aa'bb') = (aar, bb') = (а, Ь) (а', Ь')=
Ф (ab) Ф (</£') = Ф (g) Ф (£')• Далее, q(ab) = (e, е) <=>
-е, Ь = е, т. е. Кег ф = е. Эпиморфность ф очевидна. Таким образом, ф удовлетворяет всем свойствам изоморфного отображения групц. |
Группу G, удовлетворяющую условиям теоремы 7, принято называть (внутренним) прямым произведением своих подгрупп Л, В. Отличие от внешнего прямого произведения состоит в том, что G содержит в качестве прямых множителей сами группы Л, В, а не просто их изоморфные копии Л хе, ехВ. Разумеется, внешнее прямое произведение G = AxB является также внутренним произведением подгрупп Л хе, ехВ, и при некотором навыке можно не делать различия между ними, употребляя сокращенное словосочетание «прямое произведение».
Некоторую информацию о гомоморфизмах прямых произведений дает
Теорема 8. Пусть G = AxB, и пусть Л}<]Л, ВХ<]В. Тогда A^xB^G и Gl^xB^ ^(А/А^х^В/В^. В частности, G/A^B.
Доказательство. Пусть л: Л—>Л/ЛГ и р: В—>B/BY — естественные гомоморфизмы. Определим отображение ф: G—> (Л/Лг)х (B/BJ посредством соотношения гр (ab) = (л (а), р(Ь)). Непосредственно проверяется, что Ф — гомоморфизм с ядром Кегф = Л1хВ1 и образом (Л/Л^ХСВ/В,). I
Как и в теории векторных пространств, легко доказать, что если G — группа с нормальными подгруппами Gn ..., Gn, то G^J1G/ в том и только в том случае, когда G = <Gn ..., G„> и Gy П <6Г, ..., Gy, ..., G„> =е для всех / (шапка - над Gy означает, что компонента Gy опущена). То же самое выражается следующим свойством: G—прямое произведение своих нормальных подгрупп Gv ..., Gw, коль скоро каждый элемент g £G допускает, и притом однозначную, запись в виде g = g±. . .gn, g^G,-. Прямое произведение п экземпляров группы Н называют еще п-й прямой степенью и обозначают символом Нп = --^Нх...хН. В Нп выделяется специальная подгруппа— диагональ А = {(1г, 1г, ..., h)\h£H}, изоморфная Н.
11*
324
ГРУППЫ
[ГЛ. 7
Если в теореме 7 опустить условие В <] G, то мы придем к понятию полупрямого произведения: G — AB, А Л В = е, А <] G (иногда пишут G = А х В). В это определение следовало бы внести еще описание действия подгруппы В автоморфизмами на нормальной подгруппе Л, что обычно и делается в каждом конкретном случае.
В виде прямых и полупрямых произведений представляются многие известные нам группы. Например, Sn — полупрямсе произведение нормальной подгруппы Ап и циклической группы <(12)> порядка 2: Sn — AnxZ%. Используя обозначения из примера 2 п. 1, можно записать: Л4 = V4x<(123)>	(Z2xZ2)xZ3; S4 = l/4xS3 =
as (Z2xZ2)X(Z3\Z2). Еще одну пример: группа Л(1, 0?) аффинных преобразований R. —> R. (см. упражнение 3 § 2 гл. 4) является полупрямым произведением нормальной подгруппы сдвигов и подгруппы GL(1, IR) преобразований, оставляющих точку х = О на месте.
5. Образующие и определяющие соотношения. Вопрос о системах образующих группы G уже обсуждался в § 2 гл. 4. Мы возвращаемся к нему, чтобы взглянуть на некоторые известные нам группы с новой точки зрения. Из результатов гл. 4 вытекает, что для циклических групп нет необходимости составлять громоздкие таблицы Кэли. Условная запись
С„ = <с1с” = е>	(3)
дает всю необходимую информацию об абстрактной циклической группе Сп порядка л; подразумевается, что Cn = {e, с, с2, . .., с""1}, причем	при s + /</i
и csc* = при	С другой стороны, любая
циклическая группа является с точностью до изоморфизма гомоморфным образом одной-единственной группы (Z, +). Универсальной в этом смысле группой для всевозможных прямых произведений А = <^г> х .. . X <аг> циклических групп порядков nlt . .., пГ (п; — натуральное число или символ сю) будет служить r-я прямая степень Zr = Z® ... ®Z (см. п. 4) с образующими
zz = (O, ..., 1, ..., 0), / = 1, 2, ..., г,
и композицией
2	4" 2 i%i ~ 2 4~ /) %i “ 01 4“	’ • • > 4* О*
Отображение zzi—>az, 1 г, однозначно продолжается до гомоморфизма групп (з\, s2, ..., sr)^ .. .asrr
§3| НЕКОТОРЫЕ ТЕОРЕТИКО-ГРУППОВЫЕ КОНСТРУКЦИИ 325
и ядром Кег ср = m±Z® ... ©mrZ (см. теорему 8), где //?/- -nh если nz-<oo, и mz = 0, если nz = oo.
По аналогии с (3) можно записать
/4 = <ап аг\аТ1==е, .=
молчаливо предполагая, что образующие ai9 ..., аг еще и коммутируют. Принято называть di'=e, ..., а™г = е определяющими соотношениями абелевой группы A, a Zr— свободной абелевой группой ранга г (или с г свободными образующими z19 ..., гг). Очевидно, что
А Zr ФФ (я?...а*г = е Ф> Sx = ... = sr = 0).
Если теперь Fd — произвольная группа, порожденная d образующими flt ..., fd, то каждый ее элемент f записывается (возможно, многими способами) в виде
f =	V€{1, 2.....d},Sj^Z, (4)
где	/ = 1, 2, k—1. Это всегда достигается
элементарными заменами = fl+i9 f°i = e и fje = efj = fP
При выполнении условия f = e фф ... =sk = Q для каждого f, записанного в виде (4), говорят, что Fa-свободная группа, порожденная d свободными образующими. Элементы группы Fd обычно называются словами в алфавите {flt f^1, ..., fd, f^1}. Несократимая запись (4) слова f и его длина / (?) = | $i | +1 s21 + • • • +1s J однозначно определены: в противном случае пустое слово e = ff~1 (единичный элемент в Fd) имело бы длину > 0. При данном d две свободные группы Fd и Gd, порожденные свободными образующими flt . .., fd и git ..., gd соответственно, изоморфны: достаточно положить Ф(7х)==^/> ^.d, а для произвольного слова f вида (4) считать
фмй-.-й /г
(единицы в Fd и Gd обозначаются одинаковыми символами). Если, однако, Gd не является свободной группой, то Ф будет всего лишь эпиморфизмом с ядром КегФ, состоящим из тех слов, которые при подстановке f zi—*gj переходят в единичный элемент группы Gd. Это универсальное свойство (возможность продолжения fi*-+gi9
326
ГРУППЫ
[ГЛ. 7
1	до эпиморфизма Ф: Fd —>Gd для любой группы
Gd с d образующими) можно принять за определение свободной группы Fdt но мы не будем на этом задерживаться.
Чтобы свободные группы не казались мистическими объектами, приведем некоторые их конкретные реализации.
d=l. Fi^(Z1 +) — свободная абелева группа ранга 1, или, что то же самое, бесконечная циклическая группа.
d = 2. Пусть Z[t]—кольцо многочленов от / с целыми рациональными коэффициентами. В специальной линейной группе SL (2, Z [/]) рассмотрим подгруппу F, порожденную матрицами
Докажем, что F — свободная группа. Легкая индукция по k показывает, что элемент
Wk = Aa‘B^...AakB\ ah
имеет вид
w +	Il
где вк = oCiPi. . .алрл, а точками обозначены одночлены меньшей степени относительно t. Ясно, что Wk^E. Произвольный элемент группы F записывается либо в виде	либо в виде W = B^WkAa. Если W = Е,
то Wk = B-?>A-a, что, однако, невозможно (сравнить степени при &>1, а при k=l сделать непосредственную проверку).
Небольшое дополнительное рассуждение показывает, что при подстановке t=m, где т—любое целое число ^2, группа F продолжает оставаться свободной.
Введем теперь следующее
Определение. Пусть Fd—свободная группа с d свободными образующими /\, ^>tfdf S = {wh — некоторое подмножество элементов W[ (/х, ..., fd) £Fd и =	— наименьшая нормальная подгруппа в Fd,
содержащая S (пересечение всех нормальных подгрупп, содержащих S). Говорят, что группа G задана d образую
§31 НЕКОТОРЫЕ ТЕОРЕТИКО-ГРУППОВЫЕ КОНСТРУКЦИИ 327
щими а19 ..., ad и соотношениями (al9 .. ., ar) — &, i g /, если существует эпиморфизм л: Fd—>G с ядром К такой, что = X^k^d. При этом пишут
С = <д19 ..., ad\wi(alf ..., ad) = e,
и называют G конечно определенной группой, коль скоро Card I < оо. Сама группа Fa «свободна от соотношений», чем и объясняется ее название. Из определения следует, что любая группа Н с d образующими blt ..bd, которые удовлетворяют тем же соотношениям (Ьг, ..., bd)=e, i С /, и, возможно, некоторым другим, является гомоморфным образом группы G. В частности, |//|<JG|.
Пример 1 (группа диэдра). Группа G = <a, b | а3 = b2 = abab = е> с двумя образующими и тремя соотношениями имеет порядок | Q |<16, поскольку ba = a-4)-1 = (a3)~1a2b-(b2)~1 = a2b и G, во всяком случае, исчерпывается элементами е, a, a2, b, ab, а2Ь. Так как для перестановок (123), (12), порождающих S3, выполняются соотношения (123)3= = (12)2 = (123) (12) (123) (12) = е, то отображение <р: G—>S3, определенное соответствием а н-> (123), b н-> (12), будет изоморфизмом G = S3. Стало быть, симметрическая группа З3 задается двумя образующими и тремя соотношениями. Напомним, что З3 отождествляется также с группой всех преобразований симметрии правильного треугольника.
Полная группа преобразований симметрии правильного п-уголь-ника Рп называется группой диэдра (диэдральной группой) и обозначается символом Dn. Вращение
11	cos 0 — sin 0 II ^“||sinO cos 0 Ji
многоугольника в его плоскости на угол 0 = 2л/п вокруг центра О, расположенного в начале прямоугольной системы координат, порождает циклическую группу <//> порядка п. В Dn содержится еще отражение ^ = |q	многоугольника Рп относительно оси, прохо-
дящей через центр и одну из вершин.
По определению с$2 = е. Различные преобразования симметрии
е, Л. Л\ ..^Лп~1\	Л&, .... Лп-'&	(5)
328
ГРУППЫ
[ГЛ. 7
в количестве 2п штук исчерпывают всю группу Dn. В самом деле, всякое преобразование симметрии определяется своим действием на вершины 1, 2, ...,п многоугольника Рп. Если какое-то преобразование переводит 1 в k, то оно должно либо сохранять тот же циклический порядок вершин, как это делает либо менять его на обратный, как это делает	Поэтому никаких элементов, кроме (5),
в Dn нет. Заметим, что преобразование совпадает с поскольку оба этих преобразования обращают порядок вершин и переводят 1 в п. Таким образом, имеют место соотношения
<Лп = е, &2 — et	—
Это означает, что Dn является гомоморфным образом группы
G = <a, b| ап = b2 = abab = e>.
Но, как и в случае п=3, получаем ba = a~^b =ап~1Ь} так что любое слово в алфавите {а, Ь, Ь-1} сводится либо к а1, либо к М, п— 1. Стало быть, | G | «С 2п, а ввиду вышесказанного должен иметь место изоморфизм G~Dn. Тем самым получено задание группы диэдра образующими и определяющими соотношениями. Отождествим G с £»„:
£)я = <а, b\an = e, b2 — e, (ab)2 = e>.
Так как <а> <J Dn и Dn/<a> —циклическая группа, то на основании теоремы 4 для коммутанта Dn группы Dn имеем включение Dnd<a>. Но a2 = aba~1b~l = [a, b] £ D'n и при п нечетном D'n = = <а>, а при п четном Рл/<а2>=<а, д> = И4 —прямое произведение двух циклических групп порядка 2, откуда Drt = <a2>. В зависимости от четности п меняются также центр Z (Dn) группы Dn и число г ее сопряженных классов.
Приведем готовые (и легко проверяемые) таблицы:
п = 2т. D'n = <a2>, (Dn:D'n) = 4, Z (Dn) = <am>, r = m-[-3
§3] НЕКОТОРЫЕ ТЕОРЕТИКО-ГРУППОВЫЕ КОНСТРУКЦИИ 329
Стоит подчеркнуть, что вид определяющих соотношений (их левых частей в записи Wj = e) существенно зависит от выбора системы образующих группы. Например, диэдральная группа Dn порождается любыми отображениями относительно двух прямых, пересекающихся под углом л/т. Поэтому
Dn = <gi, ga|gi=gi = (gig2)n=e>.
Если исходить из прежнего задания, то можно положить gi = ab, g2=b.
Пример 2 (группа кватернионов). В отличие от предыдущего примера мы с самого начала определим группу кватернионов Q8 (название разъясняется в гл. 9) образующими и соотношениями:
Q8 = <at /?|а4 = е, Ь2 = а2, bab-1 — a~1>.
Снова ba = a~1b = a?b и, поскольку b2 = a2t любое слово в алфавите {а, а-1, 6, Ь-1!- приводится к виду а8Ь*, 0^s<;3, 0 t «С 1, так что | Q8 К 8.
Можем ли мы утверждать, что |Q8|=8? Да, но только после того, как будет предъявлена группа из 8 элементов, две образующие которой связаны теми же соотношениями, что и а, Ь. Такую группу порождают матрицы
-<! н? ;и
Действительно,
44 = Е, В2 = А2, ВАВ-^А-1
и
?!• < Л Ф? ;! ч? >
Отображение а н-> А, b н-» В определяет изоморфизм Q8 <Л, В>. Заметим, что а2 £ Z (Q8), и так как факторгруппа по центру неабелевой группы не может быть циклической (см. замечание в п. 2), то <a2> = Z(Q8). Все группы порядка 4 абелевы, поэтому Q8/Z(Q8)~
—прямое произведение двух циклических групп порядка 2. Стало быть, коммутант Q8 совпадает с Z (Q8) и (Q8:Qe) = 4. Сведения о сопряженных классах содержатся в таблице:
1	1	2	2	2
е	а2	а	b	ab
Конечно определенные группы, простейшие примеры которых мы рассмотрели, встречаются в разных областях математики, например, в качестве так называемых фундаментальных групп многообразий. Не удивительно, что еще многие относящиеся к ним вопросы остаются открытыми.
330
ГРУППЫ
[ГЛ. 7
УПРАЖНЕНИЯ
1.	Вспомним определение из п. 2 § 3 гл. 4 внутреннего автоморфизма la\ gi—^aga-1 и группы Inn (G) CZ Aut (G). Показать, что Inn (G) < Aut (G) и Inn(G) = G/Z(G), где Z(G) —центр группы G. Факторгруппа Out (G) = Aut (G)/Inn (G) называется группой внешних автоморфизмов.
2.	Пусть Н и Д' —подгруппы группы G. Показать, чю | НК | X X | Н П К | = | Н | • | К | (аналог формулы, известной из теории линейных пространств). Показать, далее, что множество НК будет подгруппой тогда и только тогда, когда НК = КН\ в случае К <1 G это условие автоматически выполняется.
3.	Показать, что в конечной разрешимой группе G найдется цепочка подгрупп e — GQа6гС ... CZ Gn = G, где Gj-r < Gz-, 1<л^п, и каждый индекс (Gf-:G/-1) = p<- является некоторым простым числом.
4.	Составим для симметрической группы S4 таблицу
1	3	6	8	6
е	(12)(34)	(12)	(123)	(1234)
аналогичную той, которую мы использовали в ходе доказательства теоремы 5. Опираясь на те же рассуждения, повторить данное нами в примере 2 описание нормальных подгрупп группы S4.
5.	Доказать простоту знакопеременной группы Ап, п^5, следуя набросанной ниже схеме рассуждений.
а)	В нормальной подгруппе К <] Ап, К ф е, следует взять перестановку л # е, оставляющую на месте максимально возможное число k символов из Q = {1, 2, ..., /г}. Если k = п — 3, то л = (ijk) и К = Ап (см. упражнение 8 § 2 гл. 4), поэтому считаем k < п — 3.
б)	Если л = (123...)... —разложение л на независимые циклы, то четность л и условие k < п — 3 влекут k^n — 5. Возможно еще, что л = (12) (34)... состоит из независимых циклов длины 2.
в)	В любом случае рассмотреть коммутатор [л, о] = лол-1о-1 # е с о = (345) и проверить, что он оставляет на месте более k символов. Это противоречит выбору k и доказывает утверждение.
6.	Показать, что Z (А х B) = Z(A) X 2(B).
7.	Если Ki, К2 <] G, /Ci П Къ = е, то G изоморфна некоторой подгруппе в (G/Ki) X (G/K2)- Верно ли это?
§3] НЕКОТОРЫЕ ТЕОРЕТИКО-ГРУППОВЫЕ КОНСТРУКЦИИ 33J
8.	Пусть K<\G — A X В. Доказать, что либо подгруппа К абелева, либо одно из пересечений К П А К П В нетривиально. Дать пример группы А X В с нетривиальной нормальной подгруппой К такой, что К Л А = е и К П В = е Тем самым из /(<]Я хВ, вообще говоря, не следует, что К = (К П^)Х(КП В).
9.	Является ли группа кватернионов Q8 полупрямым произведением каких-то двух своих собственных подгрупп?
10.	Показать, что Н <| Q9 для любой собственной подгруппы Яс(?8.
II.	Показать, что группы D4 и Q8 не изоморфны. (Указание. Подсчитать число элементов порядка 2 или воспользоваться результатом упражнения 10.)
12.	Показать, что Aut (Z)4)	Z)4 (так как | Z (П4) | = 2, то, согласно
упражнению 1, | Out (G) | = 2).
13.	Все комплексные корни из 1 степеней plt i = 0, 1, 2, ..., образуют бесконечную группу С (р00). Она называется квазицикличе-ской, поскольку любое конечное число ее элементов порождает циклическую группу. Проверить это и показать, что
С (р00) = <alt а2, а3, ... | а± = 1,	= а,-, i = 1, 2, 3, .. .>.
14.	(J. Monthly 80, № 9 (1973).) Пусть
G = <a, b | aba = ba2b, а? — е, b2”-1 —
где n £ |M. Доказать, что n =1, т. e. b = e. и фактически G =-- <« | az = e> — циклическая группа порядка 3. (Указание. aba = ba2b = ba~1b => —> ab2 — aba-a~1b = ba~1b-a-'lb = ba-‘l-aba = b2a. Сделать отсюда заключение, что ab — ba и, следовательно, с учетом других соотношений, b = е.)
15.	Дополнить деталями следующее формальное определение свободной группы Fn с п образующими. К алфавиту Л = nf1, ... ..., ап, состоящему из п букв аъ ..., ап и их «антиподов» fli1, .. ., Цд1, добавляется символ е. Пусть S — множество всех «слов», получающихся выписыванием этих 2п -|- 1 символов в любом порядке в строки конечной длины. В словах допускаются повторения символов. Под произведением uv двух слов и, v понимается приписывание слова v к концу слова и. Обратным к и —ар ... а^т, 8^ = ±1, k ==
1	т
= 1, ..., т, называется слово и-1 = а; т ... а,”81, е~Т =е. На S вво-/Л	* 1
дится отношение эквивалентности — . Именно, два слова считаются эквивалентными, если одно получается из другого в результате при
332
ГРУППЫ
[ГЛ. 7
менения конечного числа следующих элементарных преобразований:
ее aiai1 — е,
ар —
еа; ~ а;у
В каждом классе эквивалентности содержится одно-единственное «несократимое» (кратчайшее) слово. На классах эквивалентности по отношению ~ определена ассоциативная операция умножения (и обращение классов), индуцированная умножением слов. Единицей будет класс эквивалентности «пустого» слова е. Множество классов эквивалентности с данной операцией умножения и есть как раз свободная группа Fn с п образующими ...» ап (свободная группа ранга п).
Пример. По «восьмерке», охватывающей своими петлями два столба, бегает в разных направлениях мальчик с ниткой, укладывая последующие витки поверх предыдущих. Пройденные им пути с начальными и конечными точками в центре между столбами интерпретируются, очевидно, как элементы свободной группы F2 ранга 2.
аЪЪа^Ь"1 Рис. 19.
Несократимым словам отвечают натянутые нитки, освобожденные от тривиальных петель сц-1,	М*-1, b-^b. На рис. 19 участки а и а”1,
b и Ь"1 изображены геометрически различными лишь для наглядности. Наш пример реализует F2 в виде совокупности классов «гомотопически эквивалентных путей» (топологическая терминология) лемнискаты. В этом смысле фундаментальной группой лепестка, изображенного на рис. 21 (стр. 375), будет свободная группа Е5.
§ 4. Теоремы Силова
В п. 4 § 3 гл. 5 мы обращали внимание на тот факт, что в конечной группе G порядка |G| может и не быть подгруппы порядка d, делящего | G|. Минимальным таким примером служит пара G — Ait d — 6.
ТЕОРЕМЫ СИЛОВА
333
§ 4]
Так как в неабелевой простой группе не может быть подгрупп индекса 2 (ввиду их нормальности), то по теореме 5 § 3 в знакопеременной группе А5 порядка 60 нет подгрупп порядка 30. На самом деле в нет также подгрупп порядков 20 и 15. (Почему? Воспользуйтесь соображениями, изложенными в примере 2 п. 3 § 2.) На этом фоне особенно замечательными выглядят общие закономерности, установленные более ста лет назад норвежским математиком Силовым. Они относятся к р-груп-пам (с которыми мы встречались в § 2), содержащимся в качестве подгрупп группы G. Существование элемента порядка р в абелевой группе, порядок которой делится на р, было подмечено еще О. Коши.
Пусть |G| = pwm, где р — простое число, а т—целое число, взаимно простое с р. Подгруппу Р cz G порядка | Р | = рп (если таковая существует) будем называть силов-ской р-подгруппой группы G. Как и в п. 3 § 2, под W (Р) понимается нормализатор подгруппы Р в G.
Теорема 1 (первая теорема Силова). Силовские р-подгруппы существуют.
Теорема 2 (вторая теорема Силова). Пусть Р и Р±—любые две силовские р-подгруппы группы G. Тогда найдется элемент a£G, для которого Р1 = аРа~'1. Другими словами, все силовские р-подгруппы сопряжены.
Теорема 3 (третья теорема Силова). Для числа Np силовских р-подгрупп группы G имеют место равенство Np = (G:N(P)) и сравнение Np 1 (mod р).
Доказательства теорем 1—3 служат иллюстрацией общих методов и соображений, изложенных в § 2. Начнем с теоремы 2.
Доказательство теоремы 2. Итак, пусть силовские р-подгруппы в G существуют и Р — одна из них. Пусть, далее, Рг — произвольная р-подгруппа группы G, не обязательно силовская. Заставим Рг действовать левыми сдвигами на множестве G/P = (j g^P левых смежных i
классов G по Р (ограничение действия G на G/Р, описанного в § 2). Согласно результатам п. 2 § 2 длина любой орбиты относительно Рг делит порядок | Рг | = р*, k^.n. Таким образом,
334
ГРУППЫ
[ГЛ. 7
где pk*, р\ ...—длины орбит. Так как НОД (m, р) = 1, то хотя бы одна орбита имеет длину pki=i, т. е.
Р1-аР = аР	(1)
для некоторого элемента a=gi^G (это похоже на доказательство теоремы 2 § 2). Переписав соотношение (1) в виде
Р^аРа"1 = аРа~1, мы приходим к заключению, что
Рг с аРа'1	(2)
(поскольку аРа"1— группа). В частности, если Рг—силов-ская р-подгруппа, то | Рг | = | Р | и из (2) следует, что Р-^аРсг1. |
Доказательство теорем 1 и 3. Теорему 1 можно интерпретировать как следствие теоремы 3, ибо Np = = 1 (mod р) => Np=£0, a Np #=0 ФФ S =/= 0, S—множество всех силовских р-подгрупп группы G.
Что касается теоремы 3, то равенство Np=(G\N (Р)) прямо вытекает из сопряженности силовских р-подгрупп (теорема 2) и из общего утверждения о длине орбиты HG в § 2. К сравнению A^=l(rnodp) мы придем, рассмотрев несколько более общую ситуацию. Именно, пусть | G | = рЧ, где s^n (/ может делиться на р), и пусть Np(s)—число всех подгрупп порядка ps в G. Оказывается, что имеет место сравнение Np (s) ez= 1 (mod p); в частности, G содержит подгруппы любого порядка р5, s = = 1, 2, ...,м, и N р(п) = N р.
Рассуждаем следующим образом. Действие левыми сдвигами группы G на себе индуцирует, согласно замечанию в конце п. 1 § 2, действие G на множестве
с G 11 7И ] = р5}
всех р5-элементных подмножеств ..., gps}. Напомним, что g-{gi, ..., gp4 = {ggx, .. ., ggps}. Множество Q раз-бивается на G-орбиты Qz: Q = (J Qz, так что
i
|Q| = 2lQ/h |Gz| = (G:Gf), i
где G; = {g C G | gM{= A4J—стационарная подгруппа некоторого представителя М,- €
§ 4 J
ТЕОРЕМЫ СИЛО В А
335
vi
Так как GZMZ = A1Z, то Mz = U Gzgz/—объединение /=i
нескольких правых смежных классов G по Gz. Поэтому
| Mz | = vz | Gz 1, откуда |GZ| = /A^ps. В случае | Gz | < ps имеем | Qz | = ps~Sl't = 0 (mod pt)\ равенства । Gz | и | Qz | = t эквивалентны. Получаем
=	2 IQ.-Kmodp/).	(3)
k P J	|й,.|=/
Согласно вышесказанному | Qz | = t => | Gz | =	==>
=> Mz = Gzaz	—некоторый элемент из G) и, стало
быть, ai1Mi = aT1Giai = Pt — подгруппа порядка ps). Орбита Qz исчерпывается некоторым числом левых смежных классов gPj группы G по Pz.
Обратно, каждая подгруппа Н с G порядка | Н | = ps приводит к орбите й' = {gH Ig- € G} длины t. Различные подгруппы Ht с | Hi | = ps приводят к различным орбитам Qz, поскольку из Hi = gHj следует e = ghj, откуда g-^=h]x^Hj и Hi = Hj. Таким образом, имеется взаимно однозначное соответствие между подгруппами порядка ps и орбитами Qz длины t. Сравнение (3) переписывается в виде
PS* W 2 I I tNp (s) (mod pt), (4)
где следовало бы писать Np(s, G), чтобы подчеркнуть зависимость Np(s) от G.
До сих пор специфика группы G не играла никакой роли. Если взять за G циклическую группу порядка pst, то для нее Np(s, G) ^ 1 (теорема 5 § 3 гл. 4), и поэтому
f'fj) ^=М (modp/).	(5)
Так как левые части сравнений (4) и (5) по одному и тому же модулю pt совпадают, то имеем
t = tNp (s) (mod pt),
а это и дает искомое сравнение Np (s) = 1 (mod p), |
Хотя фактически доказано больше, чем требовалось, мы не намерены этим воспользоваться, отсылая интересующихся к специальной литературе.
336
ГРУППЫ
[ГЛ. 7
Пример. Пусть G = SL (2, Zp) — группа всех 2х2-матриц с определителем 1 над полем Zp из р элементов. Из разложения
GL(2,	[j, 1|SL(2, Zp)
полной линейной группы GL (2, Zp) в смежные классы по SL (2, Zp) следует, что
|GL(2, ^)| = (р— 1) | SL (2, Zp)\.	(6)
Рассматривая GL (2, Zp) как группу автоморфизмов двумерного векторного пространства V над Zp, легко найти порядок | GL (2, Zp) |. Действительно, GL (2, Zp) действует на множестве пар ^’i, v2}- базисных векторов. Образом может быть любой отличный от нуля вектор fi£V (их всего р2—1 штук), а при всяком выборе образом v2 может быть любой вектор /м из VX</1> (таких векторов имеется р2—р штук). Стало быть, | GL (2, Zp) | = (р2 — 1) (р2—р), что в сочетании с (6) приводит к формуле
ISL (2, Zp)\ = p(p2-]).
По крайней мере две силовские р-подгруппы группы SL (2, Zp) мы находим сразу:
Ми “кМ' ”l'“64
В соответствии с теоремой 3 имеем
np = (G:N(p))=l+kp> 1,
а так как
i; ми; nr mi; ми
и, следовательно, нормализатор N (Р) содержит подгруппу
я = {|о ^l|a’ ^Zp’
порядка р (р— 1), то остается единственная возможность
^(Р) = Я, ^=1+р.
Между группой
in ;и IMI- i?;i' ii ?! i;:i)
и симметрической группой S3 непосредственно устанавливается изоморфизм
ТЕОРЕМЫ СИЛОВЛ
337
§ 4]
(обе группы имеют одинаковое задание образующими и соотношениями). При р>2 группа G = SL(2, Zp) имеет центр Z(G) = ’J±J£’} порядка 2. Факторгруппа PSL(2, Zp)= G/Z (G), которую естественно называть проективной специальной группой (она является группой преобразований проективной прямой ZpPT = Р1 (V) = {0, 1,	р — 1}U{00})>
играет важную роль в алгебре со времен Галуа. Дело в том, что при р > 3 группа PSL (2, Zp) простая, и это, наряду с Ап,— один из самых ранних примеров конечных простых групп.
Обратимся снова к общему случаю и получим одно полезное уточнение теорем Силова.
Теорема 4. Справедливы следующие утверждения:
(i) силовская р-подгруппа Р группы G нормальна в G тогда и только тогда, когда N
(ii) для того чтобы конечная группа G порядка |G|^ = рпд. • >pnkk являлась прямым произведением своих силовских рГподгрупп Ри ..., Pk, необходимо и достаточно, чтобы все эти подгруппы были нормальны в G.
Доказательство, (i) Все силовские подгруппы, отвечающие данному простому делителю р порядка | G |, по второй теореме Силова сопряжены, и если Р — одна из них, то Np=l <=> хРх~1 = Р, Vx£G P<\G.
(ii) Если G = Рг х ... X Pk—прямое произведение своих силовских подгрупп, то Pi <] G, как любой прямой множитель. Значит, условие нормальности необходимо.
Пусть теперь PZ<|G,	т. е. Np. = 1. Заме-
тим, во-первых, что
x£PzAPy, i¥=j => xpSi = e,	xptj = e =4> х = е.
Стало быть, Pi n Pj = е, а отсюда для любых xt С Ph Xj С Pj имеем
/ (x^-xf1) х-1 - xjxy"1 € Pj
[xz, Ху] = <	, -i	z n => [xz, xA = e,
J l хДхуХ/х/^х^СЛ ?J
т. e. элементы xz и xy- перестановочны.
Представим на минуту, что единичный элемент e£G записан в виде е=--угу2 ... yk, где yi^Pi—элемент порядка Щ-р1^. Положив JJ и воспользовавшись i =# /
перестановочностью ух, ..., yk, получим
•••	=	••• 4гё = !//.
338
ГРУППЫ
[ГЛ. 7
Но так как а и взаимно просты, то ya.i= yaj = e => yj = e* Это верно при любом j, и, стало быть, равенство е= =У1У2 ••• Ук возможно лишь при уг = у2= ... = yk = e.
С другой стороны, каждый элемент x^G порядка r^rir2 ••• rk> = записывается в виде
х = х1х2 ... xk9 | <xz> | = rh	(7)
Достаточно положить xi = xtir'i, где показатели определяются условиями
k r'i = r/rh 1 = 2 hr’i-1 = 1
Если теперь х = х[х2 ... x'k—другая запись х в виде произведения ргэлементов, то в силу перестановочности xit х\ с различными нижними индексами будем иметь
е = (ад ... 4) (ад» ••• ^"^-ад^-ад"1 ••• ад;1, что, как было показано выше, влечет равенства адг1 -
=	= е, т.е. х[ = х19 Х2 = х2> ..., x'k = xk.
Итак, каждый элемент группы G записывается, и притом единственным образом, в виде (7), т.е. (см. § 3) G = P^...xPk. |
Замечание. Нормальная силовская р-подгруппа Р группы G характеристична в G, т. е. инвариантна при действии любого автоморфизма cp^Aut(G). Действительно, | ф (Р) | --= | Р |, поэтому ч(Р) — силовская р-под-группа, и, стало быть, ф(Р) = Р, если Np--=1. Достойно замечания также то, что аналоги силовских подгрупп прослеживаются в алгебраических структурах, далеких от конечных групп.
УПРАЖНЕНИЯ
1.	Найти число силовских 5-подгрупп в А6.
2.	Проверить, что множество Р матриц
±iu=:i- с:-ц. ни л
над Z3 составляет группу, изоморфную группе кватернионов Q8 и являющуюся силовской 2-подгруппой в SL(2, Z3). Показать, что P<SL(2, Z3).
3.	Показать, что группы S4 и SL (2, Z3) неизоморфны. Будут ли изоморфны группы PSL (2, Z3) и Л4?
КОНЕЧНЫЕ АБЕЛЕВЫ ГРУППЫ
339
5 6J
4.	Доказать, что всякая группа G порядка pq (р < q — простые числа) является либо циклической, либо неабелевой с нормальной силовской ^-подгруппой, причем последнее возможно тогда и только тогда, когда q—1 делится на р. В частности, все группы порядка 15 циклические.
5.	Получить заново (см. § 3 гл. 6) сравнение (р—1)!Ц-1^0 (mod р) для простого р путем прямого подсчета числа N? силовских р-подгрупп в симметрической группе S?.
§ 5. Конечные абелевы группы
В абелевой группе все подгруппы нормальны. Из этого очевидного факта и из теоремы 4 § 4 непосредственно вытекает, что любая абелева группа А порядка | А | = = рп^рп2-. -Рьк допускает разложение
Д = Л(р1)хЛ(р2)х...хЛ(рй)	(1)
в прямое произведение своих силовских подгрупп А(р^). Прямые множители А (рг), ..., A (pk) часто называют примарными компонентами абелевой группы. Разложение (1) определено однозначно: каждая компонента A(pi) есть просто множество всех ргэлементов (элементов в А, порядками которых служат степени простого числа pz).
Наша цель заключается в том, чтобы абелеву группу А представить в виде прямого произведения простейших групп, каковыми являются циклические. Если па порядки циклических групп не налагать никаких ограничений, то требование однозначности такого разложения невыполнимо, как показывает простейший пример:
А = <д | aQ = е> = <а3> х <а2>.
Однако возможный произвол в разложении весьма ограничен, так что конечный результат (теорема 3) выглядит вполне удовлетворительным.
1.	Примарные абелевы группы. Впредь будем иметь в виду, что если абелева группа А порождается своими подгруппами В, С, то на самом деле А = ВС; кроме того, Л = ВхС тогда и только тогда, когда = е (см. п. 4 § 3).
В отличие от общего случая, циклическая группа СрП порядка рп неразложима, т. е. ее нельзя представить в
340
ГРУППЫ
[ГЛ. 7
виде прямого произведения циклических групп меньшего порядка. Действительно, если Ср« = <а> и = то в цепочке
СрП zd СрП-1 3) ... о Ср о е
содержатся все подгруппы группы СрП. Любые две из них	Y обладают нетривиальным пересечением
ХПУ^Ср и потому не могут служить компонентами прямого разложения.
Теорема 1. Каждая конечная абелева р-группа является прямым произведением циклических групп.
Доказательство. Рассуждая по индукции и предполагая теорему доказанной для всех абелевых р-групп порядка < р", мы выберем в нашей группе Л, | А | = рп, элемент а^е максимального порядка ргп и перейдем к факторгруппе А = Al<a>. Так как | А \-рп~т<рп, то по предположению индукции
Л = Лхх ... X Лг,	(2)
где Л/=<Ь/> = <Ь/<а» = ^<а>, Ь^а>, ..., bf^ta) циклическая группа порядка pws	.
... +тг = п—т. По определению
— т. —	л пг.
be 1=е = <а>, т. е. bf = az Е<а>,	р)
и хотя каждый элемент х С А имеет вид
x = bki ... bkrr-ak,
запись эта, вообще говоря, не единственна. Мы должны «подправить» элементы Ь^А так, чтобы показатели sz в (3) были равны нулю. Сделать это нетрудно. Вспоминая, что т^пг, и возводя обе части соотношения (3) в степень рт~"\ получим пг—пг, s -о * e = af ,
откуда Si = tiPmi (теорема 3 § 2 гл. 4). Если теперь положить az = b,a_z', то (3) перейдет в соотношение
а?т‘ = е, 1	(£><«/> П <а> — е),	(3')
§ 5]
КОНЕЧНЫЕ АБЕЛЕВЫ ГРУППЫ
341
причем ai=ai<ay=bi<a'>=bi и, следовательно, <az>=4/( Снова
bt	k и
х = а^ ... аггак
для любого х^А, причем эта запись уже единственна. В противном случае получится соотношение
... av/av = e9 0<vz < pmi, 0^v<pm,
(не все vit v равны нулю), которому при эпиморфизме А —> А соответствует соотношение а]1 ... avrr = e, В условиях прямого разложения (2) оно эквивалентно системе а*'=е9	или, что то же самое,	Но,
согласно (3'), это возможно лишь при vz = 0, а тогда и v — 0.
Полученное противоречие показывает, что
А = <«!> х ... х <аг> х <а>. I
Замечание. Приведенное доказательство теоремы 1 похоже на геометрическое доказательство теоремы о жордановой нормальной форме матрицы нильпотентного линейного оператора (см. Дополнение).
Важным дополнением к теореме 1 служит
Теорема 2. Если конечная абелева р-группа А разложена двумя способами в прямое произведение циклических подгрупп:
А = А1 х ... X Ar = Br х ... X Bs,
то r = s и порядки | Л/1 совпадают с порядками |В7| при некотором упорядочении последних.
Доказательство. При | А | — р теорема, очевидно, верна. Используем индукцию по | А |. Удобно с самого начала упорядочить компоненты Ai и Bj так, чтобы их порядки не возрастали:
4 = <«<>, |<а,>| = /Л,
т^т^..	. — тг = 1; v'
В/==<Ь/>, | <&/>| = А	,5)
Из соотношений
(хуУ = хРуР, (хр) -1 = (х~1)р,
342
ГРУППЫ
[ГЛ. 7
справедливых в любой абелевой группе (см. (3) § 1 гл. 4), вытекает, что множество
Ар={хр\х^А}
р-х степеней всех элементов из А образует подгруппу в Л, не зависящую от какого-либо разложения А в прямое произведение. С другой стороны, если
а/ ... а1я ... drr = х =	... Ь[* ... bfsst
то, с учетом (4) и (5), имеем
да ... да = х^=да ... да.
Стало быть,
<ах> х ... х <aq> = Ар = <Ьх> х ... х <bt>, где а^аР, bj = bpf—элементы порядков рт‘~1 и //7"1 соответственно. Так как | Ар | < | А |, то по предположению индукции q = t и т1—1	—1, . . ., mq—1 = nq—1,
откуда т1 = пи . .., mq = nq. Замечая еще, что |Л9+1Х...хЛг|	|Bt+lx . . . XBJ=P5-', q = i,
мы получаем
рт' + ’ ’ • +тяр'-о = | Л | = рт'+ • ‘ ’ +тяр*-<1.
Значит, s = r, и все утверждения теоремы доказаны. |
Порядки рШ1, ..., pmr циклических прямых множителей называются инвариантами (или элементарными делителями) конечной абелевой р-гру ппы А. Если две абелевы группы Л, В имеют одинаковые инварианты, то А = Avx .. .xAr, B =	A^Cp^^Bi,
и система изоморфных отображений <pz: Л/—^Bz индуцирует изоморфизм ср: ф((ап ..., аг\) = (Ф1 (aj, ..., срг(аг)) между группами Л и В. Стало быть, теорема 2 гласит, что своими инвариантами группа А определяется с точностью до изоморфизма. В частности, имеет место
Следствие. Число неизоморфных абелевых групп порядка рп равно числу р (п) разбиений
п = п1-\-п2-\- ...+ пп пЛ^ п2^. . да>1,	|
§5]
КОНЕЧНЫЕ АБЕЛЕВЫ ГРУППЫ
343
Целочисленная функция р (и) встречалась нам при описании классов сопряженных элементов в симметрической группе Sn (см. упражнение 4 § 2). Абелева группа порядка рг с инвариантами р, ..., р обычно называется элементарной абелевой группой. Такая группа А характеризуется условием А? = е. Отдав предпочтение аддитивной записи, мы замечаем, что абелева группа А с рА=0 (р — простое число) является векторным пространством над конечным полем Fp из р элементов. Действительно^ если отождествить элементы из Fr с классами вычетов k по модулю р (^p = Z^ и положить ka = kat а^А, то мы придем к заданию действия Fp на А, превращающее А в векторное пространство над Fp. Это действие определено правильно, потому что из k = k' следует (k—k')a= = 1 (pa) = 0. Разложению А в прямую сумму циклических подпространств соответствует разложение векторного пространства в прямую сумму одномерных подпространств (теорема о базисе). Итак,
A^Zrp = Zp®...®Zp.
Насколько велик произвол в выборе одномерных базисных подпространств даже при г = 2, видно из примера в § 4: Zp допускает р (р 4- 1) различных разложений.
2.	Основная теорема о конечных абелевых группах. Опираясь на разложение (1) и на его единственность, а также на теоремы 1 и 2, мы непосредственно приходим к следующему основному утверждению об абелевых группах.
Теорема 3. Всякая конечная абелева группа А является прямым произведением примарных циклических подгрупп. Любые два таких разложения имеют по одинаковому числу множителей каждого порядка.
Заимствуя терминологию из теории векторных пространств, мы скажем, что элементы ах, . . ., аг порядков dlf . . ., dr составляют базис абелевой группы А, если каждый элемент х£ А единственным образом записывается в виде
х = а^а^ ... O^ij^dk, k=l,...,r.
Разумеется, в таком случае
А = <а1> х ... X <яг>, | А | = d±d2 ... dr, (6)
344
ГРУППЫ
[ГЛ. 7
и теорема 3 эквивалентна утверждению о существовании во всякой конечной абелевой группе А базиса, элементы которого примарны (т. е. их порядки являются степенями простых р, делящих | А |), причем система {dlt d2, ...,dr} не зависит от выбора базиса. По этой причине, как и в случае примарных групп, числа d19 , .., dr называют инвариантами или элементарными делителями группы А. Иногда говорят еще, что {dlt ..., dr}—тип конечной абелевой группы А.
Выпишем все инварианты, расположив их в строки, которые отвечают различным простым делителям порядка | 4|:
Pi", Pi", Pi“, nu>n12>n13> ..
Рг", р"", Ргг\ • • • ;	«21 > «22 > «23 > • • •;
Pkkl> Pk,t2> Pkk3> • • •; «*1 > «*2 > «аз > • • •
Можно считать, что все строки имеют одинаковую длину /, если дополнить некоторые из них единицами.
Целые числа
т/ = рУрУ    p"kkfi i =1 • 2........l>
называются инвариантными факторами (или множителями) абелевой группы А. По построению
| А \^пг1т2 ... mh m7+i |ту, j = 1, 2, ..., I— 1. (7) От разложения (6), переписанного в виде
А = «ап> х ... х <aftl>) X ... х (<a1Z> х ... х <а4г»,
мы перейдем теперь к разложению
А = <мх> х <и2> х ... X <wz>	(8)
с прямыми циклическими множителями порядков т19 т29 ..., mz. Для этого достаточно положить
М/ = а1/«а/ • • • а>Ф
и сослаться на предложение в конце п. 3 § 2 гл. 4.
Для примарной группы А прямые разложения (6) и (8), очевидно, совпадают, но в общем случае разложение (8) более экономно по сравнению с (6) (I ^.r ^kl),
§5]
КОНЕЧНЫЕ АБЕЛЕВЫ ГРУППЫ
345
причем в (8) сразу выделен элемент наивысшего порядка mt\ порядки всех других элементов группы А делят первый инвариантный фактор /п1. Целое число тх называют еще показателем (или экспонентой) группы А. Абелева группа А является циклической тогда и только тогда, когда ее показатель совпадает с порядком | А |.
Остается добавить, что вопрос о существовании абелевой группы А с заданными инвариантными факторами т19 т2, .mt не возникает: достаточно рассмотреть (в аддитивной записи) прямую сумму циклических групп Zmi) • • •» ^'гп1*
В качестве примера перечислим все абелевы группы порядков 16 и 36.
|Л| = 16 = 24, р(4) = 5: Z16, Z8®Z2,
^4®Z2®Z2, Z* = Z2 ф Z2 ф Z2 ф Z2.
1 Л I = 36 = 22-32	Элементарные делители	Инвариантные факторы
^4 ф	= Z36	4, 9	36
^2®^2®^9	— ^18 ф ^2	ьо о	18, 2
^4 ф ф Z3	^12 ф ^3	4, 3, 3	12, 3
^2 ф ^2 ф ^3 ф *3 ~ ^0 Ф ^0	2, 2, 3, 3	6, 6
Рассмотрим еще один пример. Запишем группу Z72®Z84 в терминах инвариантных факторов. Сначала каждое из циклических слагаемых мы выразим через циклические примарные компоненты:
Z72 = Z8®Z0, Z84 = Z4 ф Z3 ®Z7.
Далее, соберем все примарные компоненты
^72 ® ^84 = (^8 Ф ^4) ф (Z9 ® Z3) ф Z7
(прямая сумма силовских р-подгрупп). Теперь осталось выделить по одному циклическому слагаемому максимального порядка в каждой примарной компоненте и повторить этот процесс с оставшимися слагаемыми:
^72 ф ^84 = (^8 Ф ^9 Ф %l) ф (^4 Ф ^з) = ^594 ф ^12-
Если проделать то же самое с группой Z3e©Z168, то получится аналогичный результат.
Значит,
^72 ф ^84 — ^30 ф ^108
(строго говоря, всюду следовало бы ставить as вместо знака равенства).
В частности, отметим, что показатели обеих групп равны 504.
346
ГРУППЫ
[ГЛ. 7
УПРАЖНЕНИЯ
1.	Доказать теорему 1 или даже первую половину теоремы 3, не переходя к фактогруппам. (Указание. Начало такое же. Далее к циклической группе <а> максимального порядка пг в А следует добавить максимальный прямой множитель В. Если <д>\В = А, то все доказано. В противном случае рассмотреть элемент с £ А, не содержащийся в <а> X В, но такой, что cP £ <а> X В для простого показателя р. Дальнейшие рассуждения проводить в группе <с, <а> х В>, стараясь получить для нее разложение <а> X В', В' => В.)
2.	Получить разложение конечной абелевой группы А на примерные компоненты, не прибегая к теоремам. Силова и, конечно, не используя теоремы 3. В частности, чтобы при n = d1d2 ... d^, di = p\i (pi — различные простые делители), получить разложение
Zdi Ф Zch Ф • • • Ф %dk
циклической группы (Z„, -|-), можно использовать пример 1 из п. 1 § 3 или предложение из п. 3 § 2 гл. 4.
3.	Показать, что в конечной абелевой группе А для любого d\ | А | существует по крайней мере одна подгруппа порядка d (обращение теоремы Лагранжа).
4.	Показать, что при надлежащем упорядочении инварианты любой подгруппы являются делителями инвариантов абелевой группы.
5.	Если АфАзгВ^В, где А и В — конечные абелевы группы, то А = В.
6.	Если А, В, С—конечные абелевы группы и АфС^ВфС, то А ^В.
7.	Показать, что абелева группа с инвариантными факторами mlf ..., mi не может быть порождена менее чем I элементами.
8.	Конечная абелева группа порядка п, не делящегося на квадрат целого числа > 1, является циклической.
9.	Перечислить все неизоморфные абелевы группы порядка 72.
10.	Изоморфны ЛИ Группы Z12@Z72 и ^18® ^48?
Глава 8
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
Точным определениям теории линейных представлений групп мы предпошлем две близкие по духу задачи.
Задача 1. В (т + 1)-мерном пространстве Vm вещественных однородных многочленов
f(x, у) = а„х", + а1х'л-,у+ ... + ат_1ут~1х + атут
(или, скорее, полиномиальных функций (х, у) н-> f (х, у)) степени т выделяется множество решений двумерного уравнения Лапласа
дх2 ' ду-
(*)
в частных производных (см. упражнение 9 § 1 гл. 6). Опе-п	д д2 , д2
ратор Лапласа Д=зт4-^ линеен: г г	дх2 1 ду2
Д(а/+0£) = аД/+|ЗД£, Va, ₽ € R.
Поэтому решения уравнения (*) образуют некоторое подпространство Нт пространства Vгп. Непосредственно проверяется, что
bf = 2 [(ffi—k)(tn—k— /г = 0
Следовательно,
Д/ = 0 <=> (tn—k) (m—k— 1)ал + (/г + 2) (k + l)ak+2 = 0, — 2,
и все коэффициенты ak выражаются через два из них, скажем, через aQ и aL. Таким образом, dim Нт ^2.
Но два линейно независимых решения можно указать сразу. Действительно, распространив по линейности действие оператора Д на многочлены с комплексными
348
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
коэффициентами, будем иметь
Д (x + iy)m = m(tn— 1) (х + ^)/я-2 +
+	1) (x + h/)ot~2 = 0,	i2 = — 1.
Выделяя вещественную и мнимую части, получим
Zm (X, у) = (x + iy)m = ит (х, у) + ivm (х, у), откуда
&urn + i&vm = Дгда = 0 => Дист = 0, Д^ = 0.
Итак,
Hm = <um(x, у), vm(x, y)>R.
Интерпретируя теперь х, у как координаты вектора в евклидовой плоскости (R2 с фиксированной прямоугольной системой координат, посмотрим, что произойдет при ортогональной замене координат—повороте плоскости R2 вокруг начальной точки на произвольный угол 0:
х' = фв (х) = х cos 0—у sin 0, у' = Фо (у) = х sin 0 + у cos 0.
Известное из анализа (и легко проверяемое для многочленов) правило дифференцирования сложных функций дает
= -^2 cos2 0 — 2	cos 0- sin 0 + sin2 9,
дх 2 дх2	дхду	ду2 ’
АА = ^4 sin2 0 + 2	cos 0 • sin 0 +cos2 9,
ду'2 дх2 1 дхду	ду2 9
откуда
d2f d2f _d2f d2f дх'2 ' ду'2 дх2 * ду2
Это значит, что уравнение (*) остается инвариантным при ортогональной замене переменных или, как мы еще могли бы сказать, при действии группы 5О(2) = {Ф0}. В частности, многочлены ит(х', у'), vm(x', у') будут решениями уравнения (*) и как таковые они будут линейно выражаться через um(xt у), vm(xt у). Таким образом, группа SO (2) действует на пространстве решений уравнения Лапласа. При этом говорят о двумерном вещественном линейном представлении
ф</я): фен-»ф(от) (0)
группы SO(2).
ГЛ. 8]
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
249
Обратившись опять к комплексным многочленам, мы замечаем, что
х' + iy' =xeiQ + iyeiQ~ ei0 (x + iу) t
(x' + iy')m = ei,nQ (x 4- iy)m.
Сохраняя за комплексифицированным линейным оператором Ф(/л) (0) его прежнее обозначение, будем иметь
Ф<"”(9): zm^z'm=eimezm.
Так называемые одномерные унитарные представления Ф('л): ф0|_mgZ, группы SO (2) играют важную роль в анализе.
Заметим, что действие Ф индуцирует действие группы SO (2) на всем пространстве Vm9 и с этой точки зрения Нт — инвариантное подпространство в Vт.
Задача 2. Оценка числа возможных органических соединений, например в химии циклических углеводородов, сводится к следующей отвлеченно-житейской задаче. Сколько можно изготовить различных	е
ожерелий длины п из неограниченного запаса жемчужин q различных цветов? /
Попытаемся (вслед за Г. Полиа) ////^\\\] ответить на этот вопрос, считая, что tiff J 7 j j ожерелья ориентированы, т. е. пере- \	/
вернутое ожерелье, вообще говоря, не отождествляется с исходным. Заме-
тим, что нитяных отрезков с нанизан- Рис 2о ными на них п жемчужинами имеется
всего qn (число слов длины п в свободной полугруппе с q образующими). На множестве этих отрезков действует циклическая группа <о> порядка п с образующей о == (12 ... и) циклически переставляющей жемчужины на каждом отрезке. Ожерельем естественно считать <о>-орбиту отрезка или, если угодно, некоторое множество концентрических окружностей (рис. 20). Вторая интерпретация более наглядна. Она связана с изоморфизмом
Ф: о ф (о) =
2л cos — п
. 2л
— sin---
п
. 2л sin---
п
2л cos---
п
350
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
который уже встречался нам ранее и который будет назван позднее двумерным линейным вещественным представлением группы <о>. Искомое число г ожерелий выражается формулой из упражнения 5 § 2 гл. 7
п- 1
л=о
Еслис?|п, то элемент ad порядка n/d оставляет на месте те отрезки (и ожерелья), которые распадаются на d периодов длины n/d (см. в этой связи упражнение 13 § 2 гл. 4). Поэтому N(ad) = qd, a N (<jk)==qUGPAn> kK Величине N (рк) с НОД (/г, k)=d в сумме ^№(ок) отвечает ровно ср (у) слагаемых (ср — функция Эйлера). Это означает, что
d\n 4
Переход к физически различным (неориентируемым) ожерельям связан с дополнительными отождествлениями элементов в посредством обычного двумерного линейного представления группы диэдра Dn. Попытайтесь сделать это самостоятельно.
Не только в рассмотренных примерах, но и в реальных физических задачах линейные представления групп возникают самопроизвольно, как отражение той или иной симметрии. Соответственно идеи и язык теории представлений весьма естественны. Так, примеры, приводимые в § 1, касаются хорошо известных зацач и не дают как будто ничего нового. Между тем сам факт появления их «под одной крышей» должен наводить на полезные размышления.
Цель, преследуемая теорией представлений, двоякая: 1) чисто математическая, диктуемая отчасти желанием использовать дополнительный аппарат для исследования самих групп; 2) прикладная, иллюстрируемая, скажем, ярким ее вкладом в кристаллографию и в квантовую механику. Ни один из этих аспектов по существу не отражен в настоящей главе, цель которой более чем скромная — сказать нечто содержательное о теории представлений, основываясь исключительно на доступном нам материале из линейной алгебры и из теории групп.
§ 1] ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ 351
§ 1. Определения и примеры линейных представлений
1. Основные понятия. Строго говоря, мы уже занимались теорией представлений, когда рассматривали (в § 2 гл. 7) действие групп на множествах. Возьмем теперь в качестве множества векторное пространство V размерности п над полем /< и выделим в группе S (V) всех биективных преобразований Vt—>V подгруппу GL (V)— группу обратимых линейных операторов на V (или группу автоморфизмов пространства V). Ясно, что при любом выборе базиса .., еп} в V группа GL(V) становится обычной матричной группой GL(n, К), которую можно считать группой автоморфизмов арифметического линейного пространства Кп. Каждому линейному оператору c^CGL(V) при этом отвечает матрица А = (а,-/) такая, что
п
JlCj = 2 aijeh aij € ТС, det А =^= 0.
Определение 1. Пусть G — какая-то группа. Всякий гомоморфизм Ф: G —* GL (V) называется линейным представлением группы G в пространстве V. Представление называется точным, если ядро представления КегФ состоит только из единичного элемента группы G, и тривиальным (или единичным'), если Ф(£)=<£ — единичный оператор для всех элементов g£G. Размерность dim^F называется также степенью представления. При R или С говорят соответственно о рациональном, вещественном или комплексном представлении группы G.
Таким образом, линейное представление — это пара (Ф, V), состоящая из пространства представления V (или G-пространства) и гомоморфизма Ф: G—>GL(V). По определению
Ф(е) = ^— единичный оператор;
Ф (g^) = Ф (g) Ф (^) Для всех g, h£G.
Условившись действие линейного оператора Ф(£) на вектор v$V обозначать g*v, мы придем к соотношениям g * (и + у) = g•» и + g * v, и, v С V, g*(hv) = k(g*v), e*v = v,	(1)
(gh) %v = g*(h*v),
352
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
имитирующим свойства линейных операторов, причем последние два соотношения заменяют то, что выражено выше значком Ф (сравнить с (i), (ii) в § 2 гл. 7). Соотношениями (1) в линейном представлении (Ф, V) на первое место выдвигается G-пространство V, что бывает удобно делать по тем или иным причинам (например, когда V—не абстрактное линейное пространство, а какая-то его конкретная реализация).
С другой стороны, пространство V можно и не упоминать, если под линейным представлением понимать попросту гомоморфизм Ф группы G в матричную группу GL(/z,/С). По-прежнему Ф^ = Ф^ФЛ, но здесь Ф^—невырожденная матрица, причем фе = Е — единичная матрица. Матричная интерпретация более приемлема с вычислительной точки зрения, но она менее инвариантна и лишена пространственной наглядности. На самом деле важно владеть (несложным) искусством свободного перехода от G-пространств к матричным представлениям и обратно.
Напомним в этой связи хорошо известный из курса линейной алгебры факт, что две матрицы Л, В, отвечающие одному и тому же линейному оператору в различных базисах, подобны: В = САС~1 (С—матрица перехода от одного базиса к другому). В случае представлений, когда речь идет о группе линейных операторов, зависимость от выбора базиса учитывается следующим образом.
Определение 2. Два линейных представления (Ф, V), (Т, IF) группы G называются эквивалентными (изоморфными или подобными), если существует изоморфизм векторных пространств о: V—>IF, делающий диаграмму
V
Ф(£) |	| V®
V-^W
коммутативной при всех g£G, т. е.
Т (§)а-пФ(§), g£G,
или, что равносильно,
4/(g) = a®(g)a-i	(2)
(сравнить с определением эквивалентности действий группы на множествах, данным в упражнении 1 §2 гл. 7). Будем
§ 1] ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ 353
иногда писать Ф « Т для эквивалентных и Ф ф Y для неэквивалентных представлений.
Приведем еще два варианта определения 2.
а)	Терминология G-пространств. Пусть G — группа и V: (g, u)h-»g*u, W: (g, до) g □ w—два G-пространства с действиями *, □, удовлетворяющими условиям (1). Изоморфизм о: V—векторных пространств является изоморфизмом G-пространств, если
gaa(v) = o(g*0	(2')
для всех g^G и c/gV. Говорят еще, что отображение а перестановочно с действием G.
б)	Матричная терминология. Если V — <уг, ... . .v„>, W = <доп ...» до„> и Фг Ч^—матрицы линейных операторов Ф(&), Т (g) относительно выбранных базисов, то условие эквивалентности (2) выражается в виде
Ч^=СФ/?-\	(2")
где С—некоторая невырожденная матрица, одна и та же для всех g^G. Коэффициенты всех рассматриваемых матриц принадлежат одному полю /С.
Отношение подобия матриц, выраженное условием (2"), есть отношение эквивалентности, разбивающее множество Мп (Л) на непересекающиеся классы. Соответственно и представления группы G разбиваются на классы эквивалентных представлений. Из дальнейшего будет ясно, что для теории представлений интересны и существенны именно классы эквивалентных представлений.
Обращаясь вновь к курсу линейной алгебры, попытаемся более наглядно представить себе действие группы Ф (G) на пространстве V. Относительно линейного оператора Л: V в V может существовать инвариантное подпространство U\ u£U ==><Au£U. Дополнив произвольный базис	в U до базиса всего пространства V =	..., ek, ek+x, ..., епу, мы увидим, что
матрица оператора Л в базисе , еп} примет блочнотреугольный вид:
Но' У-
Блок Аг соответствует инвариантному подпространству U, а блок А2—факторпространству V/U. Если Ао — нулевая
354	ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ	[ГЛ, 8
матрица, то Л=ЛХ + Л2— прямая сумма блоков и V = = U Ф W — прямая сумма инвариантных подпространств. Существование собственного инвариантного подпрост-
ранства относительно Л всегда обеспечено, коль скоро основное поле К алгебраически замкнуто (см. § 3 гл. 6). Если, например, /С = С— поле комплексных чисел, то найдется вектор vgV, и#=0, для которого Лу = Ху. Здесь X — корень характеристического многочлена
= l tE — A | = tn — (tr A) t*"1 + ... + (— 1)" det A
(Л— произвольная матрица линейного оператора Л). Это соображение позволяет выбрать в V базис, относительно которого Л принимает треугольный вид
Xi
О Хп
с характеристическими корнями Х1( Х2.....Х„ по диаго-
нали. Несколько более тонкий анализ заканчивается приведением А к жордановой нормальной форме J (Л) (см. Дополнение) — прямой сумме жордановых клеток
А 1 О
О А 1
о о
ООО
А
(mxm — размер клетки, X—один.из характеристических корней).
Заметим, что если АЧ = Е, то JqmtK = Em—единичная т х /n-матрица для каждой жордановой клетки Jm,x матрицы Л, а это, очевидно, возможно только тогда, когда т= 1 и X—корень степени q из 1 (по-прежнему считаем /С=С). Значит,
Ах О
Аз
А" = Е =» СЛС-! =
, ь?=1,	(3)
О Х„
§ 1] ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ 355
для некоторой обратимой матрицы С. То же самое следует из более простого критерия диагональности линейного оператора Л с матрицей А и характеристическим многочленом fA(t) = tQ—1 без кратных корней.
Все эти соображения, относящиеся к изолированному линейному оператору Л\ V —>V, полезно иметь в виду при переходе к группе Ф(§), g^G, линейных операторов.
Определение 3. Пусть (Ф, V)—линейное представление группы G. Подпространство U cz V называется нн-вариантным (или устойчивым) относительно G, если Ф (g)и € U Для всех u^U и всех g £ G. Нулевое подпространство и само пространство V представления Ф относятся к тривиальным инвариантным подпространством. Представление, обладающее лишь тривиальными инвариантными подпространствами, называется неприводимым. Представление приводимо, если у него имеется хотя бы одно нетривиальное инвариантное подпространство.
Согласно сказанному выше, в случае приводимого представления (Ф, V) с инвариантным подпространством U пространство V обладает базисом, относительно которого
ф£=
Фе ф«
О ф"е
(4)
для всех g^G, Так как Ф^ = Ф'Ф^, Ф'в = ЕкИ ®'g(U)a:U9 то отображение Ф': gt--определяет представление на U, называемое под представлением в Ф. На фактор-пространстве V/U также определено представление. Оно называется факторпредставлением и задается матрицами Ф'е, g£G.
Если базис в V можно выбрать так, что все матрицы Ф£ в (4) — нулевые, то говорят о разложимом представлении Ф, а точнее—о прямой сумме представлений ф = ф'4-Ф". Разложение (Ф, V) в прямую сумму осуществимо в точности тогда, когда инвариантное подпространство UczV имеет дополнительное инвариантное подпространство W, так что V = U Ф W— разложение в прямую сумму подпространств и	Ф(1Г)с=1Г. Если это так, то
ф'=ф|у, Ф" = Ф|]17—ограничения Ф на U и на W соответственно.
Линейное представление (Ф, V) называется неразложимым, если его нельзя выразить в виде прямой суммы двух
356
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
нетривиальных подпредставлений. Говорят также о неразложимом G-пространстве V.
Последовательно расщепляя, если это возможно, V, U, W и т. д. в прямые суммы инвариантных подпространств, мы придем к прямой сумме	... Ф Vr
нескольких инвариантных подпространств (соответственно к прямой сумме Ф = Ф(1)+...+Ф(Г) нескольких представлений). При надлежащем выборе базиса в V матрицы линейных операторов примут вид
ф£> о ... О
ф _ о ф^2> ... о
О 0	... Фй°
Определение 4. Линейное представление (Ф, V) группы G, являющееся прямой суммой неприводимых представлений, называется вполне приводимым. Аналогичная терминология применяется по отношению к G-пространствам.
Интуитивно ясно, что неприводимые представления играют роль строительных блоков, из которых конструируются произвольные линейные представления. Вполне приводимые представления получаются в результате применения простейшей конструкции — прямой суммы. Из дальнейшего будет видно, что во многих случаях этого достаточно для описания всех представлений. Заметим, что некоторые важные для физики группы, такие, как группа Лоренца, имеют бесконечномерные неприводимые представления. Естественно, что они никак не сводятся к конечномерным и должны изучаться отдельно.
2. Примеры линейных представлений. Мы ввели все существенные понятия теории представлений. Осталось наполнить их реальным содержанием, для чего на первых порах весьма полезно познакомиться (и основательно разобраться) с приводимой ниже серией примеров.
Пример 1. Полная линейная группа GL (и, К) над полем имеет по определению точное неприводимое линейное представление степени п с пространством представления V — Kn. На этом же пространстве действует любая линейная группа Н cz GL (п, К) — точно, но, возможно, приводимо.
Аналогичные замечания относятся к другим классическим группам, указанным в § 1 гл. 7. Скажем, унитарная группа U (п) дей
$ 1] ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ 357
ствует неприводимым образом на эрмитовом пространстве, а ортогональная О (и)— на евклидовом. Это непосредственно следует из доказываемого в курсе линейной алгебры более сильного утверждения, что группы U (n) и О (и) действуют транзитивно (в смысле примера 3 из п. 3 § 2 гл. 7) на множестве векторов единичной длины.
Пример 2. Заставив действовать GL (л, /С) на векторном пространстве Мп(К) матриц порядка п по правилу Ч'д: Хн->/Х G4£GL(n,/С), Х£Мп(К)), мы без труда убеждаемся в том, что +	=	+	и =	Поэтому (У,
Мп (X)) —линейное представление степени л2. Пусть —подпространство матриц
О ...	... О
О ... xni ... О
с единственным отличным от нуля столбцом X<z). Как легко проверить, это подпространство инвариантно относительно Уд, A £GL (л, X), неприводимо и изоморфно (как GL (и, /^-пространство) естественному пространству Кп, на котором действует GL (л, К). Таким образом,
(*)=<’(*)© ... фС(ю
— разложение в прямую сумму п изоморфных GL(n, &)-подпространств, чему соответствует разложение
У =	. +у(п)
в прямую сумму п эквивалентных представлений. Символически этот факт записывают в виде
Мп (К) = пМр (К); Т И пЧ'»1».
Пример 3. Определим теперь действие Ф группы GL (л, К) на Мп(К), положив Фд: Хн^АХА"1. Снова (Ф, Мп (К)) — линейное представление степени л2. Если Х = (х/у), то, как обычно, п
trX = 2xZt — слеД матрицы X. Хорошо известно, что tr(aX + pK)=
= a tr X 4- Р tr Y (линейность функции tr) и tr Фд (X) = tr X. Отсюда следует, что множество Mn(k) матриц с нулевым следом является инвариантным подпространством относительно Ф. С другой стороны, фд(ЛЕ) = ЛЕ и trXE = nX. Таким образом, в случае поля К нулевой характеристики имеет место разложение в прямую сумму GL(n, X)-подпространств
Л4„(К) = <£>фЛ1й(К)	(5)
размерностей 1 и л2—1 соответственно. Заметим, что при п = р и K — Zp разложение типа (5) отсутствует, поскольку в этом случае trE = O.
Согласно определению, жорданова нормальная форма J (X) матрицы X является не чем иным, как удобным и простейшим представителем GL (л, С)-орбиты, содержащей X. Ограничение Ф на любую
358
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 3
подгруппу Н cz GL (и, /() делает естественным вопрос о канонических представителях Я-орбит.
Пример 4. В предыдущем примере положим X = IR и ограничим Ф на ортогональную группу О (п). Так как А б О (n) 4=> М = = 4-1, то *Х = вХ, е=±1,	=	=
Следовательно, пространство представления Мп (IR) группы О(п) записывается в виде суммы О (п)-подпространств
М„ (R) = <£>к ф Mi (R) Ф М„ (R)
— одномерного пространства скалярных матриц, (п-(-2) (п — 1 )/2-мерного пространства симметрических матриц с нулевым следом и п(п—1)/2-мерного пространства кососимметрических матриц. Хорошо известно взаимно однозначное соответствие между симметрическими (кососимметрическими) матрицами и симметрическими (соответственно кососимметрическими) билинейными формами. Действие О (и) на <£>R®AfJ(R') и на Мп (R) переносится на пространства соответствующих форм. Теорема о приведении квадратичной формы q(x) к главным осям есть не что инее, как возможность выбора в О (п)-орбите, содержащей q (х), диагональной формы У] Л/xf с вещественными 1/, определенными однозначно с точностью до перестановки.
Заменяя R на С и О(л) —на унитарную группу U (и), мы придем к разложению
Мп (С) = <£>с Ф Mi (С) Ф Мп (С)
в прямую сумму U (я)-подпространств скалярных, эрмитовых с нулевым следом и косоэрмитовых матриц. Случай п = 2 был подробно разобран в § 1 гл. 7.
Пример 5. Пусть G — группа перестановок, действующая на некотором множестве Й с числом элементов ] й| = п > 1, т. е. Gc:Sn. Векторное пространство
У = <£/1 f
над полем К нулевой характеристики с базисом, занумерованным элементами множества Q, мы превратим в G-пространство, полагая ® (g) f У = 2 ^'ф te) «i = У ^-<«^(1) \ i € Q	/ i 6 Q	i G Q
(i н->£ (/)—действие перестановки g^G на igQ). Так как (gh) (i) = = g (h (i)), то получается линейное представление степени п группы G. Оно никогда не является неприводимым, поскольку
S ^i*.g*1	(6)
i G Q	(X<i+... +	= 0	j
— разложение в прямую сумму одномерного и (п— 1)-мерного инвариантных подпространств (если char& = p>0 и р | и, то прямой суммы уже не получится).
Выделим два частных случая.
a)	G = S„. Мономорфизм Sn—>GL(zi, IR), построенный в п. 5 § 3 гл. 4, совпадает с нашим линейным представлением Ф, если
§ 1] ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ 359
взять в качестве е/ i-й координатный столбец Е(/). Разложение (6) показывает, что для Sn существует более экономное вложение Sn —>
>GL(n—1, Q). Позднее будет доказана неприводимость этого линейного представления степени п—1 (даже над полем С).
б)	Регулярное представление. Пусть G —произвольная конечная группа. Положив Q = G, мы получим так называемое регулярное G-пространство V = <eg\ g£G> и соответственно регулярное представление (р, V) группы G: p(a)eg = eag для всех a, g£G. Если угодно, регулярное представление в несколько иных обозначениях нам уже встречалось при доказательстве теоремы Кэли (§3 гл. 4), но нас интересовало тогда не пространство V, а множество его базисных векторов. Значение регулярного представления конечной группы G заключается в том, что оно содержит все неприводимые представления G, рассматриваемые с точностью до эквивалентности (см. § 5).
Пример 6. Представление степени 1 — это просто гомоморфизм Ф: G —> К* группы G в мультипликативную группу поля К (К — одномерное векторное пространство над собой). Так как мультипликативная группа поля абелева, то КегФгэб', где G' — коммутант группы G (теорема 4 § 3 гл. 7). Заметим, что эквивалентность двух одномерных представлений Ф', Ф" (с одинаковым пространством представления) равносильна их совпадению, так как аФ' (^)а~1 = Ф*(^г) => => Ф' (g)—Ф"(g) => Ф' = Ф". Пусть gn —е. Тогда Ф (g)n = Ф (gn) = = ф(е)=1, т. е. Ф(£) — корень из единицы. Ядро любого одномерного представления может быть нетривиальным даже для циклической группы 6. Если, например, G = Z4 и K = Z13, то КегФз)224. С другой стороны, в случае К = С любая циклическая группа имеет точное одномерное представление.
a)	G = (Z, +)• Представление &i—при |Х|^ 1 точно. Если | А | = 1, то по формуле Эйлера Х = е2Ш0, 0£IR, и ядро отображения fci—>е2ш6А отлично от нуля только при
Группа Z обладает неразложимыми комплексными представлениями сколь угодно высокой степени, которые, однако, не являются неприводимыми. Достаточно сослаться на теорему о жордановой нормальной форме матрицы и рассмотреть отображение
k 1—> Jm, 1 —
1 1 0 ... О О I* 01 1 ... 0 0
0 0 0 ... 1 1
О 0 0 ... 0 1
2Ш
б)	G=<a| ап —еУ. Пусть е = е п —примитивный корень степени п из 1. Из п одномерных представлений
ф(/п): aki—>&mkt	т = 0, 1, ..., и—1,	(7)
точными будут ср (и). Отметим интересный факт: циклическая группа порядка п имеет ровно п попарно неэквивалентных неприводимых представлений над С. Все они одномерны и имеют вид (7).
Действительно, нужно убедиться лишь в том, что у конечной циклической группы нет неприводимых над С представлений размер
360
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
ности > 1. Но перед определением 3 отмечался тот факт, что любой линейный оператор Ф (g) конечного порядка диагонализуем над С. В данном случае это равносильно полной приводимости представления Ф. Если dimO = r, то Ф распадается в прямую сумму т одномерных представлений. I
Для циклической группы конечного порядка получено по существу описание всех комплексных линейных представлений. С точностью до эквивалентности
где Ф(т)—одно из представлений вида (7).
Нашей целью является установление подобных закономерностей в общем случае.
Пример 7. Уже в предыдущих примерах чувствовалась сильная зависимость свойств линейного представления Ф группы G от основного |поля К. Внесем дополнительную ясность в этот вопрос.
Циклическая группа 6 = <а\аР — е> простого порядка р, действующая на двумерном векторном пространстве V = <vlf v2> над произвольным полем К характеристики р по правилу a*vt = ulf a*v2 = = У1 + р2» определяет неразложимое представление (Ф, V)
а*н->Фа = ||ф	0<£<р —1.
В самом деле, матрица Фа имеет характеристический корень 1 кратности 2. Поэтому разложимость Ф в прямую сумму двух одномерных представлений означала бы существование обратимой матрицы С, для которой СФдС"1 = ||^ 01 = Е. Но тогда Фа = С~1£С = £, что не так.
Пусть, далее, G — (a | а3 = е>—циклическая группа порядка 3 и K = R. Двумерное представление ^, V), V = <vlf v2>t заданное в указанном базисе матрицей
неприводимо, поскольку характеристический многочлен + / +1 этой матрицы не имеет вещественных корней. Если же V рассматривать над С, то, естественно, V разлагается в прямую сумму одномерных G-подпростр анств
V = <»1 + е " Ч> © <^i + et>2> и	___
“•-ч; ч: =г1-Таким образом, при расширении поля свойство неприводимости представления может утрачиваться.
$ 1] ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ 361
В дальнейшем, за редким исключением, основное поле К будет полем комплексных чисел (наиболее важным с практической точки зрения) или же произвольным алгебраически замкнутым полем нулевой характеристики.
УПРАЖНЕНИЯ
1.	Группа SO (2) задается своим естественным двумерным представлением
/тчгIIcos 0 —sin 01|
Ф <0)=|lsinO СО50Г
неприводимым над R. Проверить, что
АФ* (0)А-! =
?90
О е-ю
;hGL(2’c)-
Значит, Ф' — прямая сумма двух неэквивалентных (в данном случае просто различных) одномерных представлений.
2.	Неприводимо ли при л = 2и 3 GL(n, С ^пространство Л4®(С) в разложении (5)? (Ответ: да.)
3.	Пусть Ф и — неприводимые комплексные представления циклической группы <а|а"=е> порядка п. Показать, что
1	I 1. если
— уф (ak) ¥ (a*) = < n ~
п v v '	| 0, если Ф at
*=о
4.	Опираясь на упражнение 3, убедиться в справедливости следующего утверждения. Любую комплекснозначную функцию f на конечной циклической группе <а|а" = е> можно записать в виде разложения «по элементарным гармоникам»
п-1	ал?
/(«*)= 5 е = е п .
«Коэффициенты Фурье» ст вычисляются по формуле
1
fe=0
5.	Из формулы для числа ожерелий (см. начало главы) вывести элементарные следствия: a) qP — q as 0 (mod р) (малая теорема Ферма; см. § 4 гл. 4); б) ^q(d) = n, d । n
362
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
§ 2.	Унитарность и приводимость
1.	Унитарные представления. Напомним, что в курсе линейной алгебры невырожденная форма (и, у)н-»(и|у) на векторном пространстве V над С называется эрмитовой, если
(«Iv) = (VI и),
+	| ш) = а (и | до) + р (у | до),	(1)
(и|и)>0 для всех v=£0
(как всегда, zi—»z—автоморфизм комплексного сопряжения). Пространство V, рассматриваемое вместе с невырожденной эрмитовой формой (и|у), называется эрмитовым пространством. Его вещественным аналогом служит евклидово пространство со скалярным произведением, задаваемым невырожденной симметрической билинейной формой. Взяв базис е19 ..., еп в V, мы запишем форму (и|у) для u = ^uieit v =	в виде
Матрица Н = (h£j) удовлетворяет условию Тг^ = Кл и называется также эрмитовой. Мы уже пользовались такой терминологией в § I гл. 7.
Существует ортонормированный базис (определяемый условием (^|^) = б/7), относительно которого
(и | у) = S Ufli.
1=1
Линейный оператор Л: V—сохраняющий эту форму, т. е. обладающий свойством (Ли | Ло) = (и | у), называется унитарным оператором. В вещественном случае ему соответствует ортогональный оператор. Условие унитарности, записанное в матричном виде A-fA = E с А = (а^), М = = Д* = (яу..) нам уже встречалось в гл. 7. Обозначив через Л* линейный оператор с матрицей М = Л*, выразим условие унитарности в виде Л-Л* = $ = А*-Л.
Группу всех унитарных матриц (группу унитарных операторов или просто унитарную группу) принято обозначать известным нам символом U (п). По определению U (п) с GL (и, С), и если представление Ф: G —>GL (и, С)
УНИТАРНОСТЬ И ПРИВОДИМОСТЬ
363
$2]
таково, что 1тФ с Щ/г), то (Ф, V) называется унитарным представлением.
Теорема 1. Всякое линейное представление (Ф, V) над С конечной группы G эквивалентно унитарному представлению.
Доказательство. Выберем в пространстве представления V группы G какую-нибудь невырожденную эрмитову форму Н: (и,	v) = ^lhiJuiv/ (запись
относительно некоторого базиса /х, ..., fn пространства V) и рассмотрим форму (и|у), получающуюся из Н (и, v) «усреднением» по G:
(«IV) = I G I-1 S н (ф (g) и, Ф (g) v).	(2)
gG G
Множитель |G|-1 несуществен и поставлен лишь для того, чтобы в случае унитарности И имело место равенство (u\v) = Н (и, v). Так как
#(Ф^)«. ф (g) v) = H (Ф (g) v, Ф (g) и),
Н (Ф(£)(сш + 0у), Ф(£М =
= Н (аФ (g) и + ₽ф (g) V, Ф (g) w) =
= аН (Ф (g) и, Ф (g) ш) + РЯ (Ф (g) v, Ф (g) ui), Н (Ф (g) v, Ф (g) v) > О
для у=#0 и всех g^G, то форма (2) удовлетворяет условиям (1) и является, следовательно, невырожденной эрмитовой формой.
Кроме того (и это самое главное),
(Ф (g) и IФ (g) v) =
= |С|-12^(Ф(^Ф(^«. ®(g)®(h)v) =
heG
= IG Г1S# (Ф (g/i) и, Ф (g/i) v) =
= \G\~l^H	Ф(0 v) = (и Iи),
t&G
т. е. оператор <I>(g) при любом g£G оставляет форму (и | у) инвариантной. Выберем в V орто нормированный относительно формы (и | у) базис ех, . .., еп. Тогда в этом базисе матрицы Ф^ операторов Ф(£) будут унитарными. | Замечания. 1) Утверждение теоремы 1 не вытекает автоматически из известного нам факта, что каждая отдельная матрица с gm = e подобна унитарной diag{Хь . . с Х?г=1.
364
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
2)	В вещественном случае совершенно аналогичное рассуждение показывает, что представление (Ф, V) эквивалентно ортогональному.
3)	По многим причинам унитарные представления играют важную роль в приложениях теории представлений, и весьма замечательно, что теорема 1 продолжает оставаться справедливой для гораздо более широкого класса компактных групп таких, как U (н) и О(н). Доказательство то же самое, но суммирование по элементам группы заменяется интегрированием (по некоторой мере) на группе. Вспомним, что компактная группа SU (2) геометрически не отличима от трехмерной сферы S3, и поэтому имеет смысл говорить, например, о ее объеме. Вообще, существует значительный параллелизм в теории представлений конечных и компактных групп, но мы лишены возможности на этом останавливаться. Из примера 6а) § 1 видно, что представления некомпактных групп (например, G=Z) унитарными быть не обязаны.
В заключение отметим, что хотя доказательство теоремы 1 конструктивно, было бы не очень практичным использовать его для отыскания унитарной реализации имеющегося представления. Например, для группы G, порожденной элементами alf	достаточно добиться
унитарности матриц Фар . ..,Фа. Тогда и группа <ФД1, ... ,Ф^> = Ф(б) будет унитарной.
Пример 1. Симметрическая группа Sg = <(12), (123)> обладает двумерным представлением Ф, содержащимся в качестве прямого слагаемого в естественном трехмерном представлении (см. пример 5 § 1). Именно, если Ф (л) е, = ея(i>, i = l, 2, 3, и fi = e1 — e3f /2 = £2—е3, то
Ф((12))А = е2-е3 = /2,	Ф((12))/2 = е1-е3 = /1,
Ф((123))Л = е2-е1 = -Л + /2, Ф((123))/2 = е3—ех = —
Так как л = (123)'(12)^, где i = 0, 1 или 2 и j = 0 или 1, то без труда получаются все матрицы Чгя = Ф(л)|^
«и- rr:i.
<|23Н ! IL
Из соотношений det	= 1 и (123)3 = е следует, что
для некоторой невырожденной матрицы С. Сопряжение при помощи С не должно нарушать свойства унитарности матрицы II 1II.
$2]
УНИТАРНОСТЬ И ПРИВОДИМОСТЬ
365
Линейным условиям
нм
удовлетворяет матрица
-fl-
Теперь мы имеем возможность выписать известные нам унитарные представления группы S3: единичное Ф(1), Ф<а>: я i—> sgn (л) = ± 1 и только что полученное двумерное представление Ф(3) « У. Для последующих ссылок удобна таблица:
ф	е	(12)	(13)	(23)	(123)	(132)
ф(1)	1	1	1	1	1	1
ф(2)	1	— 1	— 1	—1	1	1
ф(3)	II1 °||	11° ч	11° 2 * * * * * 8||	11°6-1II	II80 II	Це-1 011
	|о 1|	h о||	Це-1 о||	|е 0 ||	1|0е-1|	II0 е||
Пример 2. Естественное ортогональное представление бесконечной группы, а именно SU(2), доставляет эпиморфизм Ф: SU(2)t—> н-> SO(3), построенный в § 1 гл. 7.
2. Полная приводимость. Из определений и замечаний, сделанных в § 1, ясно, насколько фундаментальным является следующее утверждение.
Теорема 2 (теорема Машке). Каждое линейное представление конечной группы G над полем К характеристики, не делящей |G| (в частности, нулевой), вполне приводимо.
Напомним, что утверждение теоремы 2 означает разложимость (Ф, V) в прямую сумму неприводимых представлений. Собственно говоря, классическая теорема
Машке гласит следующее.
(М) Каждое G-инвариантное подпространство UcV обладает G-инвариантным дополнением W:
V = U®W.	(3)
Мы будем доказывать именно это утверждение, из которого теорема 2 следует автоматически. Действительно, либо представление (Ф, V) неприводимо, и тогда нечего доказывать, либо существует собственное G-инвариантное
366
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
подпространство U, и тогда справедливо разложение (3) с некоторым G-подпространством W. В этом случае dim U < dim V, dim W < dim V, Применяя к U и W те же рассуждения и используя индукцию по размерности, получаем требуемое разложение на неприводимые компоненты. |
Переходим к доказательству утверждения (М). Нас по-прежнему больше интересует случай поля /С = С, поэтому полезно привести два независимых рассуждения.
Первое доказательство (/< = С). Согласно теореме 1 существует невырожденная эрмитова форма (и | и) на пространстве представления V, инвариантная относительно линейных операторов Ф(§). Для каждого подпространства U cz V существует ортогональное дополнение
L/1 = {у $V | (и | у) = 0, Vu£U}t
и по известной теореме из курса линейной алгебры v=u®u\
причем (U1-)1 = U. Предположим теперь, что U — С-под-пространство в У, т. е. Ф (g) U с U для всех g € G. Так как Ф(^)|и— автоморфизм, то любой элемент и С U записывается в виде u = (&(g)u't u'£U. Остается воспользоваться инвариантностью формы
v^U1- => (м | Ф (g) у) = (Ф (g) ы'|Ф (g) v) = (u'| v) = 0.
Стало быть, v^U1- =$>	Положив W = U\
придем к разложению (3). |
Второе доказательство. Пусть, как и прежде, U — инвариантное относительно действия G подпространство в V. Рассмотрим прямую сумму
v=u®u',
где W— произвольным образом выбранное дополнение к U. Вообще говоря, I/' не является G-инвариантным. Рассмотрим оператор проектирования V—определенный соотношением
для всякого вектора v = u + u'. Имеем
v—pv^U, S*(U) = 0, 3^ = 5*.	(4)
УНИТАРНОСТЬ И ПРИВОДИМОСТЬ
367
* 2J
Введем теперь «усредненный» линейный оператор
= | G |-12S ф <А) (h"1)
h$G
(деление на | G | по условию возможно). Имеем
Ф(£)^0 = ^0Ф(£), *g€G.	(5)
Действительно,
ф (g) ^Ф (Г1) = IG Г1 s Ф (g) ф (ft)	(/I-1) ф (g-1) =
heG
= |G|-i2®(g^)^((g^)“1) =
heG
=|G|-i2®(0^®(^1) = ^g,
teG
что и приводит к соотношению (5). Положим
F = ^G(V) = {^|^V}.
Согласно (5) O(g)^=Q(g,)5iGu = «^GQ(^)^=5iGy'=tiy' g W для всякого w£W, так что векторное подпространство W а V является на самом деле G-подпространством.
Осталось показать, чтоУ = С^Ф1Г— прямая сумма 6-подпространств. Так как Ф (ft"1) v—5*Ф (ft"1) v £ U (см. (4)), то v — Ф (ft) ^Ф (ft-1) v = Ф (ft) {Ф (ft"1) v — 3*Ф (ft"1) у} € £Ф(1г)и = и (инвариантность U). Следовательно,
V—?Gv = I GI’1 2	—
heG
и мы получаем v = u-\-w с w = PGv g W, т. е. V = U + W.
Далее, Ф^"1)^ U ^(ft-^-O (см. (4))=» => Ф(/г)5>Ф(/1"1) U— Q => ^*G (С/) = 0. Стало быть, v — — PGv = u£U => ?G(v—5\?и) = 0, откуда 3*Gv = 3y2Gv для всех u£V. Это значит, что <^G—проектирование на W вдоль U:
^G(U)^Qt 3*g = ?g.	(6)
Теперь v € U A W => ^Gv = 0, поскольку v С U, и v = 3^Gvf, поскольку v^^G(V)=^W. Используя (6), получаем 0 = = ?GV = ?G(?Gv') = ?fy' = ?Gv'==v => t/A^ = O. |
Было бы неосторожным сделать более сильное заключение об однозначности разложения на неприводимые компоненты (неприводимые G-подпространства): У = Угф ФК2Ф... ®Vr. Если, например, Ф(§)^<^—единичный
368
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
оператор для всех g£G, то любое прямое разложение V на одномерные подпространства будет разложением на неприводимые компоненты, а таких разложений бесконечно много. Другое дело, если мы сгруппируем все изоморфные неприводимые компоненты:
v=ur®
Так как мы не различаем изоморфные G-пространства, то можно считать
^ = ^0^©...©^ = ^,
у уфуф,,.фу w	w	О	ООО"
где tii—кратность вхождения неприводимой компоненты Vi в разложение V. Мы увидим, что кратности определяются однозначно.
УПРАЖНЕНИЯ
1.	Всякое одномерное непрерывное представление группы (R, +) (когда близким числам соответствуют близкие операторы) имеет вид Ф(а>: /н-где а — комплексное число. Показать, что Ф(а> унитарно тогда и только тогда, когда aglR. (Указание. Продифференцировать равенство е*а^а* = 1 по t и положить / = 0.)
П гт	ж t 4. II COS/ — Sin/II	/Ю . X
2.	Ядро гомоморфизма /: / н->	cos/ ГРУППЫ +) на
SO(2) состоит из чисел / =2лт,Z. Таким образом, SO(2) = !R/2nZ и каждому неприводимому унитарному представлению Ф (согласно результатам § 4 оно обязательно одномерно) группы SO(2) отвечает неприводимое унитарное представление Ф: /4-2nmi—> Ф (/), 0^/ <2л, группы IR, для которого Ф (2л)= Ф (0)= 1. Вывести из упражнения 1, что Ф = Ф(Л), В сочетании с замечанием 3) в п. 1 это означает, что всякое неприводимое представление группы SO(2) имеет вид ф (л) (/) = е/пГ, Проверить, что
2л
elkt.eUt dt — $ki
о
(сравнить с соотношением в упражнении 3 § 1: порядок п заменен «объемом» 2л группы SO(2)). В анализе система функций служит классическим примером полной ортонормированной системы периодических функций (или функций на окружности S1 — SO(2)). С этого начинается обширная теория рядов Фурье.

КОНЕЧНЫЕ ГРУППЫ ВРАЩЕНИЙ
369
§ 3]
3.	При помощи теоремы Машке доказать, что любое точное комплексное двумерное представление неабелевой конечной группы неприводимо.
4.	Пусть Ф: G—► U (n), Т: G—> U (и) —эквивалентные унитарные неприводимые представления конечной группы G. Доказать, что найдется унитарная матрица U, для которой С7Ф^[7"1 = ЧГ^, yg£G. (Указание. По условию СФ^С”1 = ЧГ^ для некоторой матрицы С = (cf;)£GL (n, С). Операция Лн» A* = tA, примененная к СФ^.=. = 4^0, дает Ф£1С* = С*^1, откуда Ф^1С*С = С*СФ^1. По лемме п
Шура С*С = Х£. Далее, 2 I cki 12 = ИР, и U = р(-1С—иско-/?=1
мая унитарная матрица.)
§ 3. Конечные группы вращений
В этом параграфе речь пойдет о конечных подгруппах группы S0(3). Зная их, мы заодно получим ортогональные неприводимые представления таких групп, как Д4, S4, Дв, причем в легко запоминаемой геометрической оболочке. При первом чтении можно опустить п. 1 и доказательство (весьма конспективное) теоремы 2, но тому, кто пожелает проверить прочность усвоения общей идеи «действия группы» (§ 2 гл. 7), будет полезно познакомиться с содержанием всего параграфа.
1.	Порядки конечных подгрупп в S0(3). Согласно теореме Эйлера из курса линейной алгебры, всякий элемент Л € S0(3),	является вращением (поворотом) в ев-
клидовом пространстве R3 вокруг некоторой оси. Другими словами, имеются ровно две точки на единичной двумерной сфере S2, остающиеся неподвижными при действии Л\ точки пересечения сферы и оси вращения. Эти две точки называются полюсами вращения Л.
Пусть теперь G — конечная подгруппа в S0(3), aS — множество полюсов всех неединичных вращений из G. Ясно, что G действует как группа перестановок на множестве S. Если х—полюс для некоторого вращения Л У=<£, Л£С, то при любом ЭВ £G имеем
(ЗВ ЛЗВ -1) ЗВх = ЭВ-Лх = ЗВх.
т.	е. ЗВх — полюс для ЗВ ЛЗВ"1 и, стало быть, Обозначим через Q множество всех упорядоченных пар (Л. х),
370
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
где ЛбС, Л=И=(^, *— полюс для Л. Пусть, далее, Gx — стационарная подгруппа (стабилизатор) точки х, т. е. подгруппа в G всех элементов, оставляющих х на месте. Если
~ Gx U Sz^x U • • • U ёт^рх
— разложение G в левые смежные классы по Gx, то G-орбитой точки х будет множество
G (х) = {х, g2x, .. .,
с числом элементов | G (х) | = тх. По теореме Лагранжа N = тхпх, где N = | G |, пх = | Gx | (по сравнению с § 1 гл. 7 обозначения несколько изменены). Заметим, что пх — порядок циклической подгруппы в G, каждый из элементов которой является вращением вокруг оси, проходящей через х. Говорят, что пх — кратность полюса х или что х есть пх-полюс.
Каждому элементу из G соответствует два полюса, поэтому | Q | = 2 (7V—1).
С другой стороны, для каждого полюса х имеется пх—1 элементов из G, отличных от е и оставляющих неподвижным полюс х. Следовательно, число пар (Л, х) равно сумме
|й| =
Взяв за (л\, . ..,хл} множество полюсов, по одному из каждой орбиты, положив ni~-nx , mt = mx и заметив,
i	I
что пх=^пх =ni для всех x£G(xz), мы получим
I
k	k
xeS	£=1	i=i
Таким образом,
k
2V—2 =	mt).
i=i
Разделив на N обе части равенства, будем иметь
§ 3]
КОНЕЧНЫЕ ГРУППЫ ВРАЩЕНИЙ
371
2
Предполагаем М>1, так что 1^2—^-<2. Так как nz^2, то	а П0ЭТ0МУ Л должно равняться
2 или 3.
Случай 1. k = 2. Тогда
2—, N \	«1/ \ n2J 9
или, что равносильно,
2 =----— тл+т..
«1 п2 11	2’
откуда = т2 = 1, п1 = п2 = N. Стало быть, G имеет в точности одну ось вращения и G = CN—циклическая группа порядка N.
Случай 2. k = 3. Пусть для определенности <ln2<Zn3. Если /гх^3, то мы имели бы з	з
t=l	i=1
что невозможно. Таким образом, п1 = 2, и уравнение (1) записывается в виде
1..1
2 * N п2*п3
Очевидно, п2^4 => —+ —^4-—противоречие. Поэто-му п2 = 2 или 3.
Если п2 = 2, то п3 = -^~ = т (N должно быть четным) и m1 = m2 = mi т3 = 2. Эти данные соответствуют группе диэдра Dm (см. пример 1 п. 5 § 3 гл. 7)
Если п2 = 3, то
_1_ . _2_ = ±
6 + N п3 ’
и мы имеем лишь три возможности:
2') /г3 = 3,	N =12,	/nx = 6,	/и2 = 4,	/п3 = 4;
2") /г3 = 4,	Af = 24,	т1= 12,	/п2 = 8,	т3 = 6;
2'") ^з = 5,	N = 60,	тг = 30,	/па = 20,	/и3=12.
372
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Соберем все эти данные в таблицу:								
	N	Число орбит	1S1	Порядки стабилизаторов			
	п	2	2	п	п			(2)
	2т	3	2т 4-2	2	2	т	
	12	3	14	2	3	3	
	24	3	26	2	3	4	
	60	3	62	2	3	5	
Нами доказано следующее утверждение.
Теорема 1. Пусть G—конечная подгруппа в SO(3), отличная от циклической и диэдральной. Тогда для ее порядка N имеются лить три возможности: М=12, 24 или 60. Другие ограничения на группу G содержатся в таблице (2). |
2. Группы правильных многогранников. Существование групп порядков 12, 24 и 60, содержащихся в SO(3), доказывается совсем просто. С точностью до подобия существует лишь пять (известных с античных времен) правильных выпуклых многогранников в евклидовом пространстве R3: тетраэдр Д4, куб Пв, октаэдр Д8, додекаэдр О12 и икосаэдр Д20:
^4	^8
&20

§ 3]
КОНЕЧНЫЕ ГРУППЫ ВРАЩЕНИЙ
373
Если центр правильного многогранника М поместить в начальную точку пространства R3, то вращения из SO(3), совмещающие М с собой, составят конечную подгруппу. При этом, однако, возникает не пять, а всего лишь три различные (= неизоморфные) группы вращений, поскольку для куба и октаэдра, а также для додекаэдра и икосаэдра они одинаковы. Это очень легко объяснить геометрически. Если соединить отрезками середины смежных граней куба, то эти отрезки будут ребрами вписанного в куб октаэдра. Всякое вращение в fe3, оставляющее куб инвариантным, переводит в себя вписанный октаэдр, и обратно. Аналогичное замечание относится к паре додекаэдр— икосаэдр. В таблице ниже Af0—число вершин многогранника, Л\ — число ребер, N2— число граней, р — число сторон (ребер) каждой грани, a v— число граней, сходящихся к одной вершине. Как и ранее, N— порядок соответствующей группы.
	Ао	Ai	^2	ц	V	N
Тетраэдр	Д4 Куб	□, Октаэдр	Д 8 Додекаэдр	....	012 Икосаэдр	.	.	.	.	Д го	4 8 6 20 12	6 12 12 30 30	4 6 8 12 20	3 4 3 5 3	3 3 4 3 5	12 24 24 60 60
В соответствии с геометрической теоремой Эйлера о многогранниках AZ0 — N1 + N2 = 2. Общее число полюсов равно Мо + Л\ + N2 = 2N1 + 2. При любом вращении, переводящем многогранник в себя, данное ребро аД совмещается с любым другим аД или с bzaz, так что N = 2Nl. Заметим еще, что {|i, v} = {n2f п3}, где п2, п3 — введенные в п. 1 кратности полюсов.
Пусть, далее, Т — группа тетраэдра, О — группа куба (октаэдра) и I — группа икосаэдра (додекаэдра).
Элементами Т являются вращения на углы вокруг четырех осей, соединяющих вершины с центрами противоположных граней, вращения на угол л вокруг каждой из трех осей, соединяющих середины противоположных ребер, и единичное вращение.
374
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
В группе О, кроме единичного, имеются вращения на углы л/2, л, Зл/2 вокруг трех осей, соединяющих центры о	g,	2л
противоположных граней куба, вращения на углы , О 4л	«
—- вокруг четырех осей, соединяющих экстремально про-тивоположные вершины, и вращения на угол л вокруг каждой из шести осей, соединяющих середины диагонально-противоположных ребер.
Правильный тетраэдр вписывается в куб и остается инвариантным относительно некоторых вращений из О порядка 3 и 2. Вместе с единицей их набирается 12 штук и они составляют как раз группу Т. Следовательно, То:0, а так как |О:Т| = 2» то Т<0.
Каждому элементу из О соответствует ровно одна перестановка на множестве, состоящем из четырех больших диагоналей куба. Из равенства порядков групп |О| = = | S41 = 24 следует их изоморфизм: O^S4.
Соответственно Т^АЛ.
Упражнение 2 показывает, что I А&.
Возвращаясь к доказательству теоремы 1, заметим, что при п1 = 2, /?2 - а23 ^3 имеются две четырехэлементные орбиты G(pJ = {р1г р2, р3, Pi}, G (^) = {qt, qt, q3, q,} полюсов, где р/ и qt— противоположные точки на сфере S'1. Если Да—тетраэдр с вершинами ph то его группа преобразований симметрии Т° содержит G. Из |G| = 12 следует, что Д4— правильный тетраэдр, т. е. Д1 = Д4 и Т° = G = Т.
При п3 = 3, п3 — 4 берем шестиэлементную орбиту G (рх) =	pej полюсов, которые разбиваются на
пары, поскольку i=£3 =5> п, =^4. Эти три пары точек на сфере S2 мы берем за три пары противоположных вершин октаэдра Д,. Как и в предыдущем случае, | G | = = 24 => Дв = Д8 (в том смысле, что Д,—правильный октаэдр) и O° = G = O.
Наконец, при nt = 2, пг = 3, п3 = 5 строится икосаэдр Дао с вершинами pz, взятыми из орбиты G(pj) ={ра,.. .,р20}. Снова | G | = 60 влечет правильность икосаэдра Д20 и совпадение групп: l° = G = l.
Осталось заметить, что любые два правильных многогранника одного и того же типа, вписанные в сферу S-, получаются друг из друга некоторым вращением (замена
КОНЕЧНЫЕ ГРУППЫ ВРАЩЕНИЙ
376
§ 3J
системы координат). Этим устанавливается сопряженность в SO(3) изоморфных подгрупп. Соберем полученные результаты в виде теоремы.
Теорема 2. Все конечные подгруппы в SO(3) исчерпываются с точностью до изоморфизма группами Сп> Dni ngN; Т = Д4, О = S4 и 1^Л5. Любые две изоморфные конечные подгруппы сопряжены в SO(3). |
Следствие. Указанные в теореме 2 изоморфизмы дают неприводимые трехмерные ортогональные представления групп Л4, S4 и А6. |
Используя теорему 2 и эпиморфизм <D:SU(2)—>-SO(3) (теорема 1 § 1 гл. 7), мы легко придем к описанию всех конечных подгрупп группы SU (2) (можно действовать и в обратном порядке). Любая такая группа G*, отличная от циклической, является прообразом некоторой конечной подгруппы GczSO(3). Возникают так называемые бинарные группы*.
D* = Ф’1 (Г>„), Т* = Ф-1 (Т), О* = Ф”1 (О), I* = Ф-i (I) — бинарная группа диэдра, бинарная группа тетраэдра, бинарная группа октаэдра и бинарная группа икосаэдра. Бинарные группы, равно как и ортогональные представления Ф: SU (2)—>SO(3) в целом возникают естественным образом при описании состояний физической системы частиц со спином.
УПРАЖНЕНИЯ
1.	В группе икосаэдра I, помимо единичной подгруппы, имеется 15 сопряженных циклических подгрупп порядка 2, 10 сопряженных циклических подгрупп порядка 3 и 6 сопряженных циклических подгрупп порядка 5. Доказать, что I — простая группа.
(У казание. Посмотреть на доказательство теоремы Г/j 5 § 3 гл. 7.)
2.	Установить изоморфизм между группами I и Аб. (Указание. Используя сопряженность всех /• /\^\ элементов порядка 2, показать, что они располагают- С/ xj ся в «букете» (рис. 21) из пяти попарно непересека- рис 2j ющихся (точнее, пересекающихся по е) сопряженных силовских подгрупп порядка 4. Группа I действует на «букете» сопряжением. Это действие точно, поскольку 1 —простая группа (см. упражнение 1).)
376
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
(ГЛ. 8
3.	Если Я—конечная подгруппа нечетного порядка в SU (2) или SO (3), то Я—циклическая. (Указание. Применить теорему о гомоморфизмах к случаю Ф: SU (2) —► SO (3).)
4.	Если конечная подгруппа Z/czSU (2) не является прообразом какой-либо подгруппы GcSO (3), то | Н | ss 1 (mod 2).
5.	Показать, что с точностью до сопряжения
6.	Что общего имеют между собой бинарная группа икосаэдра I* и группа
SL(2, Z6) = ||“ *||ad-te=l; a, b, с, ?
7.	Пусть атомы q различных сортов (q < 200) располагаются всевозможными способами (без учета каких-либо химических связей) в вершинах правильного многогранника М. «Молекулы», получающиеся друг из друга поворотом вокруг некоторой оси, не различаются. Пусть f(M, q) — число различных «молекул». Получить формулы:
/(□.. <7)=-^-(<7в+17<73 + 6),
/(Д8, q) = -^(q*+3q*+12q+8).
(Указание. Применить соображения, использованные при подсчете числа ожерелий (задача 2 в начале главы).)
8.	Показать, что подсчет числа различных раскрасок граней М красками q сортов приводит в случае тетраэдра Д4 к той же формуле, что и в упражнении 7, а в случае куба и октаэдра формулы поменяются местами.
§ 4. Характеры линейных представлений
1.	Лемма Шура и ее следствие. В основе всякой содержательной математической теории лежит обычно несколько сравнительно несложных (но тонких) соображений. Одним из краеугольных камней теории представлений является следующее утверждение.
Теорема 1 (лемма Шура). Пусть (Ф, V), (Y, W) — два неприводимых комплексных представления группы G
ХАРАКТЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ
377
$4]
и or: V—>-W—линейное отображение такое, что
T(g)o = o®(g), Vg£G.	(1)
Тогда:
(i) если представления Ф, ¥ неэквивалентны, то о = 0;
(И) если V = 1Г, Ф = Т, то о =
Доказательство. При о = 0 доказывать нечего. Считаем поэтому п=/=0 и полагаем V0 = KeracV.
Так как оФ (g) = T (g) ovt = 0 при любом v0€Ve, то Ф (ё) У о = ^о. т- е- подпространство Vo инвариантно относительно G. Ввиду неприводимости (Ф, V) имеем Ve = 0 или Va = V. Равенство Vo — V невозможно, поскольку о#=0. Стало быть, Кега = 0.
Аналогично, полагая Im ос W, будем иметь u»i£W\=$> ^(ё')а'1 = Чг(г)<7(У1) = сг(Ф(г)У1) = ^€W7!, так что Wi—инвариантное подпространство в W. Снова о^=0 =Ф	а поскольку (V, W) — неприводимое
представление, остается единственная возможность W1—W.
(i) Так как Кего = 0, Imo = lF, то о: V—»W—изоморфизм, и условие (1) есть не что иное, как условие эквивалентности представлений Ф, ¥ (см. § 1, определение 2). Утверждение (i) доказано.
(ii) По условию о: V——линейный оператор на V. Пусть X—одно из его собственных значений; оно существует, поскольку основное поле С алгебраически замкнуто. Линейный оператор о0 = о—М* имеет нетривиальное ядро (в нем содержится собственный вектор) и удовлетворяет равенству T(g)G0 = o0®(g). По ранее доказанному о0 = 0, т. е. о = 1^?. |
Следствие. Пусть (Ф, V), (Т, 1F)—два неприводимых представления над С конечной группы G порядка | G | и 0: V —>- W — произвольное линейное отображение. Тогда «усредненное» отображение
o = -±]'£4(g)rf>(g)-1
ge G
обладает следующими свойствами:
(i) Ф 7ft Т =$• о = 0;
(ii) V = W, Ф = ¥ =Ф о = М>, ь =
378
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Доказательство. Имеем
Т (g) оф (g)’1 = IG |-1 2j (g) Y (h) стФ (h)-i Ф (g)’1 = = |G|-1S1If(g/i)^(g/i)’1 = |G|'1 2 ^(ОоФЮ’^о» n	i e G
так что T (g)a= аФ (g), Vg^G. По лемме Шура сразу получаются оба утверждения, причем уточнение, касающееся константы X, вытекает из соотношений
(dimV)X = trX^’ = tra = |G|“1 2 tr Ф (g) стФ (g)-1 = gets
= |G|-1 2 tro —tra.
g£ G
Здесь мы воспользовались известным свойством функции следа: tr(L4C,"1 = tr Д. |
Нам понадобится матричная формулировка следствия. С этой целью выберем в пространствах V, W какие-нибудь базисы:	W = <fj | j £ J>.
Запишем в этих базисах наши отображения (отождествляя их с соответствующими матрицами):
Фг= (фй-(g)), 47=	(g)),
ст = (Ст/,), о = (ст/,); 1, i' € 1, j, j’ €
Согласно определению о,
O// = |G|-1	2	>l’J7-(g)<T/'l-<Prz(g"1).	(2)
g€G, i* e/, /'€ J
Отображение о: V—>W у нас совершенно произвольное. Мы можем взять
СТ/i = 0» ^(/>	*о)»	(3)
Утверждению (i) следствия тогда отвечает соотношение |G|-1 2 i|’//.(g)-4’<.i(g"1) = 0, Vi, /0, j, j0 (4) ggG
(Ф и ¥—неэквивалентные представления).
Если теперь V = W и Ф = ’F, то
~ tra о „ ~	. tro &fl о
a — dimy^ — dimV-dimV
ХАРАКТЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ
379
$ 4]
Сравнивая полученное выражение с (2), получаем
IGI"1 У <р/г (g)	У 6//6/'га/'г,
geG, i‘, Г	i', Г
откуда в силу произвола в выборе о (см. (3)) приходим к выводу, что утверждению (ii) следствия отвечает соотношение
( .
|G|-1 S <₽//.(§) <PV(£-1) = | diml/’ если 'о	(5)
g€G	( 0 в противном случае.
В соотношениях (4) и (5) заключена вся нужная нам информация. |
2. Характеры представлений. С каждым комплексным конечномерным линейным представлением (Ф, У) группы G связывается функция
Хф: G—>С, определенная соотношением
X®(g) = trO(g), g£G,
и называемая характером представления. Ее обозначают также символом Ху или просто %, если ясно, о каком представлении идет речь.
Пусть	— матрица, отвечающая оператору
Ф(£) в некотором базисе пространства V, а
(n = dimV)—ее характеристические корни, взятые с учетом кратностей.
По определению п	п
Хф (g) = Ху (g) = S Ф/z (g) = S К-i=l	i=l
Если С — любая обратимая матрица, то
tr СФ/7-^tr Фг
Но мы знаем, что всякое представление ^F, эквивалентное Ф, имеет вид gt—>СФ^С“1. Поэтому характеры изоморфных (эквивалентных) представлений совпадают. Это замечание показывает, что понятие характера определено правильно.
380
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Отметим еще ряд элементарных свойств характеров.
Предложение. Пусть хф—характер комплексного линейного представления (Ф, V) группы G. Тогда:
(О X®(<?) = dimV;
(И) X®(AgA-1) = x®(g), Vg, h£G, т.е. хф—функция, постоянная на классах сопряженных элементов группы G;
(iii) Хф (g-1) = Хф (g) для любого элемента g£G конечного порядка (черта означает комплексную сопряженность)-,
(iv) прямой сумме Ф = Ф'+Ф" представлений отвечает характер %ф = хф, + х .
Доказательство. Действительно, хф(е)=ДФ(е)= = tr S == dim V.	Далее, хф (AgA-1) = tr Ф (AgA-1) =
= tr Ф (А) Ф (g) Ф (А)-1 = tgФ (g) = хф (g)- Для доказательства (iii) заметим, что
gm = е => Ф (g)m =
и если Хх, ..., Х„—характеристические корни оператора Ф^), то XJ......X*—характеристические корни опера-
тора Ф^)*. В частности, X?* = 1, l^iscCn, и, стало быть, | X; | = 1, X,- — Xf1. Поэтому
ХФ (g-1) =tr ф (g’1) = ф (g)-1 = 2 V =
=2х, = (2х,-)=М?).
Наконец, в случае Ф = Ф'4-Ф" мы знаем, что при надлежащем выборе базиса в пространстве представления V все матрицы Ф^, g € G, примут вид
откуда (гФг — t^g-|-tr®g. Это и значит, что x®(g) = = Xo-(g) + X®~(g)- I
Заметим, что при п = dim V = 1 будет хф (g) = ф (g). но при п > 1 характер х® не является гомоморфизмом G в С*.
Пример 1. Рассмотрим группу SU (2) в ее естественном двумерном представлении. Пусть %—соответствующий характер. Согласно
§ 4]
ХАРАКТЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ
381
(5) § 1 гл. 7, любая матрица g£SU(2) сопряжена с матрицей
0<ф < 2л,
так что классы сопряженных элементов группы SU (2) параметризуются вещественными числами <р из указанного интервала. В соответствии со свойством (ii) характеров имеем
z ф_ -i ф Х(§)=Х(^ф^-1) = Х(%)=г 2 +е a=2cosy.
При каноническом представлении Ф: SU (2)—^SO(3) матрица переходит в матрицу
cos ф — sin ф О
В == sin ф	cos ф 0 ,
О 0	1
ф
которая также служит удобным представителем в классе сопряженных ортогональных матриц группы SO (3). Очевидно, что
Хф (Вф) =1 +2 cos ф-	(6)
Формулой (6) мы воспользуемся позднее.
Множество C° = {G —>С} всех функций из G в С наделено естественной структурой векторного пространства над С: для ап а2€<С, хп Х2€С° под а^+а.х, пони-мается функция со значениями
(aiXi + a2X2) (g) = “xXi (g) + “2X2 (g).
Функция из C° называется центральной, если она постоянна на сопряженных классах группы G. Центральные функции образуют, очевидно, векторное подпространство в С°, которое мы обозначим символом Xq (G). Вообще говоря, XC(G}—бесконечномерное пространство, но если в группе G имеется лишь конечное число классов сопряженных элементов С1( Са, ..., Сг (так будет всегда для конечной группы G), то пространство Xq (G) конечномерно. Например,
Хс(С) = <Г1,Га, ...,ГГ>С,
где
J 1, если g£Ct,
Г' (^)“\0, если g^C/.
382
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
По доказанному (предложение (ii)) характеры группы G принадлежат пространству Х^ (G). Мы увидим, что натянутое на них подпространство на самом деле совпадает с Xq (G), по крайней мере для конечной группы G.
Далее предполагаем, что группа G конечна. Превратим CG в эрмитово пространство со скалярным произведением
(О, т)0=-г^|- £ о(g)x(g), а, тес°.	(8)
g€G
Легко проверяется, что форма (о, т)н->(о, т)б удовлетворяет всем свойствам невырожденной эрмитовой формы. Ее сужение на подпространство Xq(G)czCg оказывается весьма полезным инструментом, в особенности при изучении характеров линейных представлений.
Теорема 2. Пусть Ф, Т — неприводимые комплексные представления конечной группы G. Тогда
J 1, если (Хф. Хт)о = |0> если
Доказательство. В матричных обозначениях имеем
Хф (g) = 2 Ф/< (g). Xv (g) = 2	(g)-
Полагая z0 = f, /0== / в соотношении (4), а затем суммируя по i и / (в допустимых для i и j пределах), получим
о = | G I"1 2	(g) Ча (g-1) =
g, i, i
= I g Г 2 (2%> (g)} (2 q>,7 (g"1)) =
=|G|_1 2 X4r(g)Xo(g"1) =
geG
= ] G | 1 2 Хф	Хф (ё) = (Хф» Хф)с
geG
для любых неэквивалентных неприводимых представлений Ф, Т группы G.
J 4]	ХАРАКТЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ	383
Используем теперь (при i0 = i, = /) соотношение (5): 1=	= Sc (S<P//(g)) (S<P(7(g-1)} =
^I^T1 S Хф(5’)Хф(^"1) = (ХФ. ХФ)о-
geG
Так как характеры изоморфных представлений совпадают, то и (Хф, Хт)о=1 при I
Соотношение (9) называется (первым) соотношением ортогональности для характеров.
Следствие. Пусть
V-^®...®^	(10)
— разложение комплексного G-пространства И в прямую сумму неприводимых G-подпространств VЕсли W — какое-то неприводимое G-пространство с характером % то число слагаемых Vz в (10), изоморфных W, равно (Xv, х^)0 и не зависит от способа разложения (кратность вхождения W в G-пространство V). Два представления (два G-пространства) с одним и тем же характером изоморфны.
Доказательство. Как мы уже отмечали ранее (предложение (iv)), Хг^Ху1 + • • •+Xyft, и поэтому
(хрг» Х^)о (Xyt» Хдег)о® • • • ® (Xvft» Хдег)с*
По теореме 2 справа стоит сумма из k нулей и единиц, причем число единиц совпадает с числом G-подпространств V h изоморфных W. Но скалярное произведение (xF, %W)G вообще не зависит от какого-либо разложения (см. определяющее соотношение (8)), так что одновременно нами доказана инвариантность кратности вхождения W в С-про-странство V.
Два G-пространства V, V с одним и тем же характером x = XF = Xv' содержат в своем разложении любое слагаемое, изоморфное данному неприводимому С-простран-ству W, одинаковое число раз, а именно (х, X^)g- Поэтому в разложениях k	i
на неприводимые прямые слагаемые мы можем считать l = k, V'L Vh 1 i fe. Следовательно, изоморфны и сами G-пространства V, V', f
384
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Замечания, сделанные после доказательства теоремы Машке, и следствие теоремы 2 дают возможность выразить характер /ф любого комплексного линейного представления (Ф, V) конечной группы G в виде целочисленной линейной комбинации
хФ = 2
i=-1
Здесь Ш;—кратность, с которой неприводимое представление (Ф;, V,) входит в разложение (Ф, V), так что Ф,- Фу при i Ф ]. Используя соотношение ортогональности (9), мы можем написать:
(ХФ. ХФ)о= 2 т}.	(11)
Стало быть, скалярный квадрат (хФ, %ф)0 характера хФ любого комплексного представления Ф всегда является целым числом, равным 1 в точности тогда, когда Ф — неприводимое представление. |
Мы пришли к замечательному результату. Характеры, или «следы представлений», несущие скудные сведения о каждом отдельном линейном операторе Ф(§), выражают существенные свойства их совокупности {Ф (g) | g £ G}, т. е. свойства самого представления Ф.
Пример 2. Убедимся в неприводимости над С представлений групп А4, S4 и Дб вращениями трехмерного пространства. Для этого надо вернуться к следствию теоремы 2 § 3 и воспользоваться формулами (6) и (11). Представление Ф, описанное в § 3, показывает, что если л — перестановка порядка qt то Ф (л) — поворот на угол 2л
k—, НОД(k, q)—\, вокруг некоторой оси. Поэтому значения характера Х = Хф вычисляются непосредственно по формуле (6):
. . , , „	,2л „	, п . 1 + / 5	1 - /"5
X (л)= 1+2 cos Л —=3, —1, 0, 1,—, ------------g---,
если соответственно </=1, 2, 3, 4, 5(&=±1), 5(&=±2). Заметим, что
lie О ОII	у—
l+!_5=tr 0 е~х 0 =е + е-1+1,	-~о —-=е2 + е~24-1,
2	||0 0	1||	2
2Jlt
е = е 6 .
$4]
ХАРАКТЕРЫ ЛИНЕЙНЫХ ПРЕДСТАВЛЕНИЙ
386
Вычисление порядка перестановки л по ее разложению на независимые циклы описано в следствии 1 теоремы 4 § 2 гл. 4. Распределение элементов по сопряженным классам содержится в таблицах (для А4 см. упражнение 8 § 2 гл. 7, для S4 см. упражнение 4 § 3 гл. 7 и для Л6 см. доказательство теоремы 5 § 3 гл. 7). Вот те же таблицы, дополненные значениями характера %:
л4	1	3	4	4
	е	(12)(34)	(123)	(132)
X	3	—1	0	0
«4	1	3	6	8	6
	е	(12) (34)	(12)	(123)	(1234)
X	3	—1	—1	0	1
	1	15	20	12	12
	е	(12) (34)	(123)	(12345)	(12354)
X	3	—1	0	(1 + Кб)/2	(1- /5)/2
Соотношения
(X, Х)л=^-{ьЗ«+3(-1р+4.0« + 4.0«}.=1,
(X. х)5.=^{ Ь32 + 3(-1)2 + 6(-1)2 + 8-02 + 6.12)- = 1, if	/1-1- l/""5 \ 2
(X, Х)а=60 11'32+15(-1)2 + 20-02+12 (	/ +
+1<^Д)}=1
показывают, что представление Ф с характером у неприводимо над О (см. (11)).
УПРАЖНЕНИЯ
1.	Пусть Ф, Т — неприводимые комплексные представления конечной группы G. Получить обобщение теоремы 2:
I I ~1	Xiy (^g) Хф (g) = ф. .
13 А. И. Кострики и
386	ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ	[ГЛ. 8
Здесь й —произвольный элемент группы G; 6ф ^ = 1 или 0 в зависимости от эквивалентности или неэквивалентности Ф и ^.(Указание. Переписать соотношение (4) и (5) в виде
б *6
I G Г-1£ Ъ>(g) <PZ./(g“l) =вф,
Умножить обе части на (h) и просуммировать по /, приняв во внимание равенство / (/г) ф//о (g) = ф^/п (hg). В получившемся со-/ отношении
I г, 1 У’ .	,	..	. tft/ W б/olo
I о|-12я1Ш(лй')ф/<,г(г-1)=5ф, т.——
положить /o = fc, i0 = G а затем суммированием по i и k перейти к характерам.)
2.	Применить критерий неприводимости, основанный на характерах, к представлению Ф(8) группы S3 из примера 1 п. I § 2.
3.	Доказать при помощи леммы Шура, что все неприводимые представления над О абелевой группы Q одномерны. (У к а з а н и е. Пусть Ф — неприводимое представление, h — элемент из G. Ввиду коммутативности Ф (g) Ф (h) = Ф (h) Ф (g), у g£G. Положив о = Ф (h) в лемме Шура, получим Ф (h) = Это верно для любого h £ G. Для неприводимого Ф остается единственная возможность — быть одномерным.)
4.	Если группа G обладает автоморфизмом т, то с каждым линейным представлением (Ф, V) этой группы ассоциируется еще одно представление (Фт, V), определенное по правилу Фт (g) = Ф (т (g)). Проверить, что это действительно так, и показать, что неприводимость Ф влечет неприводимость Фт. Как правило, Фт ~ Ф, но бывают случаи, когда получается новое представление. Что следует ожидать в случае внутреннего автоморфизма?
Пусть б = Л5 и Ф — представление, рассмотренное в примере 2. Отображение т: л i—> (12) л (12)”1 является (внешним) автоморфизмом группы А6, переставляющим классы с представителями (12345) и (12354). Множества значений характеров % и получаются друг из друга перестановкой местами (1+ К 5)/2 и (1—	5)/2. Показать,
что характеры хт и X неэквивалентны.
§ 5. Неприводимые представления конечных групп
1.	Число неприводимых представлений. В случае конечных групп предыдущие рассмотрения позволяют ответить на принципиальные вопросы теории представлений. Одной из основных является следующая
5] НЕПРИВОДИМЫЕ ПРЕДСТАВЛЕ НИЯ КО НЕЧ НЫХ ГРУПП 387
Теорема 1. Число неприводимых попарно неэквивалентных представлений конечной группы G над С равно числу ее классов сопряженных элементов.
Доказательство теоремы содержится в леммах 1 и 2, если заметить, что число г сопряженных классов группы G мы интерпретируем как размерность пространства Xq (G) центральных комплекснозначных функций на G (см. (7) § 4). Так как характеры линейных представлений—центральные функции, то они порождают в Xq(G) линейное подпространство некоторой размерности По теореме 2 § 4 характеры неприводимых представлений составляют ортонормированный базис (в метрике (*, *)0) этого подпространства. Стало быть, интересующее нас число совпадает с s и. оно не превосходит г. Осталось установить равенство s = r.
Лемма 1. Пусть Г—центральная функция на конечной группе G и (Ф, V) — неприводимое представление над С с характером %ф. Тогда для линейного оператора
Фг = У Г (ft) Ф (ft): V—-V
heG
имеем Фг = где
(Г—центральная функция, определенная равенством г&)=г&)).
Доказательство. Так как Г—центральная функция, то
Ф (g) ФгФ (g)-1 = 2 Г (А) Ф (g) Ф (ft) Ф (g"1) =-heG
= 2 г (gftg-1) ф (gftg-1) = 2 г (о ф (о=Фг. h е G	t е G
Итак, ФГФ (g) = Ф (g) Фг, Vg € G. Лемма Шура (теорема 1 § 4), примененная к случаю о = Фг, показывает, что фг = Вычисляя след операторов, стоящих в обеих частях этого равенства, находим
XX®(e) = XdimV = trX^ = tr®r= 2 Г(ЛЦгФ(Л) = heG
= |G|J|G|-1 2 ХФ(Л)ГШ = |С|(ХФ, Г)с. |
( heG	)
13
388
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Лемма 2. Характеры Хп	всех попарно не-
эквивалентных неприводимых представлений группы G над С образуют ортонор мированный базис пространства Хс (G).
Доказательство. По теореме 2 § 4 система Xi> • ••,%$ ортонормирована и ее можно включить в орто-нормированный базис пространства Xq(G). Пусть Г — произвольная центральная функция, ортогональная ко всем (%z, Г)о = 0. Тогда по лемме 1 линейный оператор Ф(р, отвечающий представлению Ф(/) с характером х/, равен нулю.
По теореме Машке всякое комплексное представление Ф можно разложить в прямую сумму
Ф = /n^(1) + ... + т£Ф{5}
с некоторыми кратностями mlt ..., ms. В соответствии с этим разложением для оператора Фг, определенного соотношением
Фг = 2 Г(/г)Ф(Л), heG
имеем
Фг — /п1Фг ) 4“ • •• 4” ^т^Фр) — 0.
В частности, это относится к линейному оператору рг, где р — регулярное представление (см. пример 5 § 1). Но в таком случае будем иметь (обозначая временно единичный элемент группы G символом 1, чтобы избежать сочетания ее)
о = РГ (*,) = 2 г (/I) р (й) ег = S Г (Л) eh Г (Л) = 0, heG	heG
Vh^G,
откуда Г = 0 и, следовательно, Г = 0. |
Пример. Теорема 1, примененная к симметрической группе S3, утверждает, что эта группа обладает ровно тремя неприводимыми комплексными представлениями. Искать их не нужно: таблица в конце п. 1 § 2 содержит всю необходимую информацию. Заметим, между прочим, что квадраты степеней представлений Ф(1), Ф(2), Ф(3> удовлетворяют соотношению 12 + 12-]-22 = 6 = | 53 |. Сейчас мы увидим, что и в общем случае выполняется аналогичное соотношение.
§ б] НЕПРИВОДИМЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП 389
2.	Степени неприводимых представлений. Рассмотрим несколько более подробно регулярное представление (р, <eg\S € G>c)- Обозначим через Rh матрицу линейного оператора р-(/г) в данном базисе {eg|g€G}. Так как р (h)eg = ehgt то все диагональные элементы матрицы Rh при /гу=е равны нулю и tr Rh = 0. Стало быть,
XP(^) = |G|. ХР(Л)==О,	(1)
Пусть теперь (Ф, V) — произвольное неприводимое представление группы G йад С. Как показывает следствие теоремы 2 § 4, кратность вхождения Ф в р равна скалярному произведению (%р, хф)о- Согласно (1) (хР. Хф)о= lGl” 2 Хр(/г)хф(Л) = |ОГ1хр(е)Хф^) =
h е G
= |С|-‘|0|Хф(е) = <11тК (2)
Мы видим, что каждое неприводимое представление (рассматриваемое с точностью до эквивалентности) входит в регулярное с кратностью, равной своей степени. По теореме 1 имеется г попарно неэквивалентных неприводимых представлений
ф(1), ф(2),	, ф(г)
(г — число сопряженных классов группы G), которым соответствуют характеры
А/ V	А/ * А/ .   А/
Л1» А2» • • • > Лг» Л/ Лф(/)» степеней
пп п2, nr; n,= Xi(e).
Обычно за Ф(1) берут единичное представление, так что Xi(g)=l, Vg^G. Соотношение (2) показывает, что
р-п1Ф(1)+ .. . +/ггФ(г),
откуда
Xp = «iXi+ • • • +«гХг-
В частности,
IG | = хР (е) = ид! (е) + • • • + пд, (<?) = и? + • • • +
Мы пришли к следующей теореме.
390
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Теорема 2. Каждое неприводимое представление Ф(0 входит в разложение регулярного представления р с кратностью, равной своей степени nt. Порядок | G | конечной группы G и степени nlt ..пг всех ее неэквивалентных представлений связаны соотношением
2n? = |G|-l	(3)
i — 1
Для групп небольшого порядка красивого соотношения (3) достаточно, чтобы найти все степени пи пг, хотя в общем случае нужны, конечно, дополнительные соображения.
Сведения о характерах неприводимых представлений (или короче: о неприводимых характерах) удобно записывать в виде таблицы
	е	ga	ga	• • • gr
Xi Х2	«1	Xifo) Xi (ga)	... Xifer) «г	Xafe) Хг(§з) ... Xa(gr)
Хг	«r Xr (ga) Xr (ga)	Xr (grL
называемой таблицей характеров. В ее верхней строке стоят представители всех г сопряженных классов gp группы G. Например, таблица характеров группы S3 имеет вид
е (12) (123)
Xi	I	1	1
Х2	1	—1 I
Хз	2	0-1
(сравнить с таблицей в конце п. 1 § 2).
Как всегда, обозначим символом C(g) = CG(g) централизатор в группе G элемента g£G. Мы знаем, что |C(g) ||gG| = |G| (см. п. 2 § 2 гл. 7). Поэтому соотношение (9) § 4 (первое соотношение ортогональности),
§5] НЕПРИВОДИМЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП 391
переписанное в виде
у Xi (g?) Xk (gj) _ 1 у IGI	—7~} —
Й /|C(gy)l /|C(g/) | ~ I G| fy r
= T5T S I g? I %< (gj) ъ (g;)	Xi (g) Xk (g) =
1	1 /=1	11 geG
*=(Xb Xk)<3=&ik>
означает, что г x r-матрица
M =
Xz (g/) \
/ |C(gy) | J
унитарна по строкам. Но унитарность по строкам равносильна унитарности по столбцам (М.-*М	—
так что
xz(g/) Xz(gt) д
i V\C(g/)\ /|C.(gA)| ~ jk'
или в более подробной записи: '	_____ J 0, если g и h не сопряжены,
2L X/(g) X/(ft) — | । qg (g) । в противном случае. |
Соотношение (4) называется вторым соотношением ортогональности для характеров.
3.	Представления абелевых групп. Описание неприводимых пр!едставлений циклических групп в примере 6 § 1 допускает следующее естественное обобщение.
Теорема 3. Каждое неприводимое представление конечной абелевой группы А над С имеет степень 1. Число таких попарно неэквивалентных представлений равно порядку | А |. Обратно, если каждое неприводимое представление группы А имеет степень 1, то А—абелева группа.
Доказательство. Число г классов сопряженных элементов абелевой группы А совпадает с ее порядком, поэтому первые два утверждения вытекают из теоремы 2 (см. также упражнение 3 § 4). Положив, далее, в соотношении (3) все nt равными 1, мы получим г = | А |, что равносильно коммутативности группы. |
392
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Определение. Пусть А — абелева группа. Множество
А = Нот (Д, С*)
гомоморфизмов группы Д в мультипликативную группу С* поля комплексных чисел, рассматриваемое вместе с поточечной операцией умножения
(Х1Х2) И = Xi (я) Х2 («)
(Х/ёА а$А), называется группой характеров группы А над С (х‘1 = х)-
Теорема 4. Группы А и А изоморфны.
Доказательство. Из теоремы 3 мы знаем, во всяком случае, что | А | = |Д |. Согласно результатам § 5 гл. 7, группа А допускает разложение
Д = ДгХ Д2Х ... X Д*
в прямое произведение циклических групп А^^а^ (неважно каких, примарных или нет; мы выбираем мультипликативную запись закона умножения в Д). Если | Д/| = §/ и ez-—примитивный корень $,-й степени из 1, то каждому элементу а = а{*а%.. .alk из А отвечает характер ХаёД, определенный соотношением
%<»(«?«?• • .а'и) = ег^ег2^.. .e^k.
Очевидно, что %a%a,==%aa, (см. определение). Если
а = а\'а**.. .а'л =# at'iat2.. .а^ = а'9
1 2 k 1	2	*
то существует индекс i с /,=/=/;. Тогда
Ха (а,) = е'/ тД в< = Ха' (а,).
Следовательно, все характеры Ха попарно различны и отображение а н-» Ха устанавливает требуемый изоморфизм между А и Д. |
Метод доказательства теоремы 4 дает, очевидно, явную конструкцию всех неприводимых представлений абелевой группы.
Пример. Пусть V^n—элементарная абелева группа порядка 2", Х~"ее неприводимый комплексный характер, отличный от еди-
§ 5] НЕПРИВОДИМЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП 393
яичного, т. е. у (а)	1 для некоторого a^V^n, Тогда Кег % = В аг
и имеет место разложение V =В[)аВ на смежные классы
по В, так что
Х(а‘Ь) = (-1У,	1=0, 1.
В частности, четверная группа (Клейна) И4, о представлениях которой упоминалось в задаче 2 § 2 гл. 1, имеет следующую таблицу характеров:
е a b ab
Xi 1
Хг 1
Хз 1
Х4 1
1 1 1
-1 1 -1
1 — 1 —1
—1 —1 1
Результаты о представлениях абелевых групп позволяют получить некоторую информацию и о представлениях произвольных конечных групп.
Теорема 5. Представления степени 1 конечной группы G над С находятся в биективном соответствии с неприводимыми представлениями факторгруппы G/G' (G' — коммутант группы G). Их число равно индексу (G\Gr).
Доказательство. Сделаем сначала общее замечание. Пусть G — произвольная группа, К — ее нормальная подгруппа. Если Ф — представление группы G с ядром КегФзэЛ, то можно определить представление Ф факторгруппы G//C, полагая
Ф(^) = Ф(В), g€G.
Корректность этого определения очевидна _(см. доказательство теоремы 1 § 3 гл. 7). Далее, КегФ = КегФ//<. В частности, при 7< = КегФ получается точное представление Ф.
Обратно, всякое линейное представление Т группы И индуцирует представление Ф группы G, допускающей эпиморфизм л: G—+H. Достаточно положить
Ф (g) = Т (Л (g)).
394
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Так как л—эпиморфизм, то Ф (G) = Y (Н) и Ф, Т одновременно приводимы или неприводимы. По теореме о соответствии (теорема 3 § 3 гл. 7) Кег Ф = л”1 (Ker V). С любым одномерным представлением Ф группы G ассоциируется абелева (а точнее, циклическая) группа Im Ф, так что КегФгэС'. Доказательство теоремы получается теперь в результате простого, соединения теоремы 3, сделанного выше замечания и теоремы 4 § 3 гл. 7. |
4.	Представления некоторых специальных групп. Хотя в принципе для получения всех неприводимых представлений конечной группы G достаточно разложить ее регулярное представление (теорема 2), на практике это вызывает значительные трудности и приходится избирать обходные пути. Обычно бывает проще построить сначала таблицу характеров, а затем уже конструировать сами представления (см. в этой связи § 1 гл. 9). Впрочем, в тех сравнительно несложных примерах, которые приводятся ниже/прибегать к каким-либо ухищрениям нет необходимости.
Пр и мер 1. Пусть G — произвольная 2-транзитивная группа перестановок, действующая на множестве Q= = {1, 2, ..., и}, и>2 (см. пример 3 § 2 гл. 7). Пусть, далее, Ф — естественное представление группы G на пространстве У = <ех, е2, ..., епУ с действием ®(gr)ez = e^(Z) (см. пример 5 § 1). Как нетрудно понять, значение хф(£) совпадает с числом N (g) точек i (= базисных векторов ez), остающихся неподвижными при действии g. По теореме 3 § 2 гл. 7 имеем
S Хф (g) Хф(^) = 2 Хф (g)2 = 2 N (gy = 21G I, g e G	ge G	ge G
что, очевидно, переписывается в виде
(Хф, Хф)0 = 2.	(5)
Сравнивая (5) с соотношением (11) § 4, мы приходим к заключению, что Ф — прямая сумма двух неприводимых представлений (2=1 + 1—единственная запись 2 в виде суммы квадратов натуральных чисел). Но нам известно также, что Ф = Ф(1) + ЧГ, где (Ф(1), U) — единичное представление, а 4е — (п — 1)-мерное представле
§ 5] НЕПРИВОДИМЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП 395
ние, действующее на пространстве W = —ent е2—eni... ..., en-i—еп>- Если бы разложение V = U Ф W можно было продолжить за счет разложения W, то неприводимых слагаемых получилось бы больше двух. Таким образом, имеет место следующее нетривиальное утверждение.
Естественное линейное представление (Ф, V) двукратно транзитивной группы перестановок G над полем С является суммой единичного представления и еще одного неприводимого представления, |
В частности, каждая из групп Sn, п>2; Ап9 п>3, обладает неприводимым представлением Т над С степени п—1с характером вычисляемым по формуле
Хт(£) = ЛЧ£)-1- 	(6)
Как было показано на примере группы S8 (пример 1 п. 1 § 2), матрицы находятся без особого труда. Для вычисления значений xv(g} по формуле (6) достаточно знать цикловую структуру перестановки g.
Небольшая иллюстрация:
А4 е (12) (34) (123) (132)
Хф. 3	—1	0	0
S4 е (12) (34) (12) (123) (1234)
3	-1	10—1
А6 е (12) (34) (123)	(12345)	(12354)
ХМр. 4	0	1	—1	—1
Пример 2. Неприводимые представления знакопеременной группы At. Мы соберем уже известные нам факты. Группа А1 имеет четыре класса сопряженных элементов.
396
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Представители классов и их мощности указаны в двух верхних строках таблицы
	1	3	4	4
	е	(12) (34)	(123)	(132)
Х1	1	1	1	1
Хг	1	1	8	е-1
Хз	1	1	е-1	е
' Х4	3	—1	0	0
Коммутант А'4={е, (12)(34), (13) (24), (14)(23)}^V4 имеет индекс Зв Л4, и поэтому Л4 обладает тремя одномерными представлениями Ф(1) =	Ф(2) = Х2> Ф(3> = Хз
(с ядром А4 и с е3= 1, 8#= 1) и одним трехмерным представлением Ф(4) (12 = 12 4- 12 + 12 4- З2). Сравнив таблицы для Л4 из примера 1 и из примера 2 § 4, мы убедимся в том, что представление Ф(4) с характером эквивалентно представлению Ф группы Л4 вращениями (группа тетраэдра) и представлению Т, связанному с 2-транзитивностью группы Л4.
Пример 3. Неприводимые представления симметрической группы S4. Две верхние строки таблицы
	1	3		6	8	6
	е	(12)(34)	(12)	(123)	(1234)
Xi	1	1	1	1	1
Х2	1	1	—1	1	— 1
Хз	2	2	0	—1	0
Х4	3	— 1	—1	0	1
Хб	3	— 1	1	0	—1
взяты из упражнения 4 § 3 гл. 7. Представление Ф(1) = = Xi — единичное. Представление Ф(2)=х2 задается четностью (знаком) перестановок из S4. Так как (S4:S4) = 2 (пример из п. 2 § 3 гл. 7), то одномерных представлений больше нет. Двумерное представление Ф(3) с характером /3 и. с ядром V4<]S4 получается из соображений, изложенных в доказательстве теоремы 5 и в примере 2 п. 1 § 3
§5] НЕПРИВОДИМЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП 397
гл. 7. Представление Ф(4) с характером %4 отвечает вращениям куба (см. таблицу для S4 из примера 2 § 4). Представление Ф(5) = Т с характером %5 (см. таблицу в примере 1) связано с 2-транзитивностью группы S4. Оно эквивалентно также представлению, отвечающему всем преобразованиям симметрии тетраэдра Д4 (вращения 4-отражения; именно эти преобразования важны при описании колебаний молекулы фосфора (задача 2 § 2 гл. 1)).
Пример 4. Неприводимые представления группы кватернионов Qe. О группе все сказано в примере 2 п. 5 § 3 гл. 7. Там же приведено (но не названо своим именем) двумерное неприводимое представление Ф(^ с характером %б.
	1 1		2	2	2
	е	а2	а	b	ab
Xi	1	1	1	1	1
Х2	1	1	— 1	—1	1
Хз	1	1	—1	1	—1
Х4	1	1	1	—1	—1
Хб	2	—2	0	0 .	0
Четыре одномерных представления имеют своим ядром коммутант <а3> и определяются из таблицы в примере п. 3.
УПРАЖНЕНИЯ
1.	Получить соотношение (4), выписывая в явном виде выражение ^у = (1\, X/)g для коэффициентов разложения Г/ = 2О/Х/ базис-/.
ной центральной функции Г/ (см. (7) § 4) через неприводимые характеры.
2.	Проверить (и вспомнить об изоморфизме между векторным пространством V и сопряженным к нему пространством V* линейных функций), что отображение т: А 5, определенное условием
ат(х) = х(я)>
задает изоморфизм абелевой группы А на А. (Указание. Из ат (Х1Хг) = аТ (Xi)flT (Хг) следует, что ат —характер группы А. Так
398
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
как (аа')х = ах (а')х , то т—гомоморфизм А в А. Далее,
Кегт = {а£А ] а? (%) = % (п)= 1, ух€^} =>Кегт = е,
а | А | = | А | = | А | =фт—изоморфизм).
Это упражнение вместе с теоремой 4 устанавливает часть так называемого закона двойственности для конечных абелевых групп. Аналогичный, но гораздо более глубокий закон двойственности для топологических абелевых групп, приводящий к важным следствиям, был установлен в 30-х годах Л. С. Понтрягиным.
3.	Доказать, что если конечная абелева группа А допускает точное комплексное неприводимое представление, то А — циклическая группа.
4.	Пусть А — конечная абелева группа, В —ее подгруппа. Доказать, что любой характер группы В продолжается до характера группы А и число таких предложений равно индексу (А:В).
5.	Обосновать фразу перед заключительными скобками в примере 3 п. 4.
6.	Чему равна средняя величина У, X (g) значений ком-
6 плексного характера х на элементах конечной группы G?
7.	Собрать из разных мест (см. пример 2 п. 2 § 4, упражнение 4 § 4, пример 1) таблицы, относящиеся к группе Аб, в сводную таблицу характеров
	1	15	20	12	12
	е	(12) (34)	(123)	(12345)	(12354)
Xi	1	1	1	1	1
Х2	3	—1	0	4 а+гб)	4(1-/5-)
Хз	3	—1	0	у (1-/5)	4 (1+ /5)
Х4	4	0	1	—1	—1
Хб	*	*	*	*	*
Дать описание неприводимых представлений с характерами Xi, %2, Хз> Х4- Заполнить последнюю строку таблицы, используя второе соотношение ортогональности (4) для характеров. (Ответ: 5, 1, —1, О, 0.)
§51 НЕПРИВОДИМЫЕ ПРЕДСТАВЛЕНИЯ КОНЕЧНЫХ ГРУПП 399
8.	Пусть Р =	0<i, /,	—1} — группа порядка р3,
рассмотренная в упражнении 3 § 2 гл. 7; И = <е0, еи'..^-i>q — комплексное векторное пространство размерности р; е—примитивный корень степени р из 1; Л,	ftk— линейные операторы на V,
определенные соотношениями
^•=ez+1,	=	=	0</«ср —1
(нижние индексы у базисных элементов берутся по модулю р).-Показать, что отображение
ф(А): Л|->Л, Вн-хЯ*,
задает линейное неприводимое представление группы Р. Представления Ф(1>,	ф^-1) попарно неэквивалентны и вместе с р3 одно-
мерными представлениями (р2 — индекс коммутанта Р' = <О в Р) исчерпывают все неприводимые комплексные представления группы Pt
9.	Дополнить вычислениями следующее рассуждение. Пусть Dn = <a, b\an = et b2 = e, bab-^a-1} — группа диэдра порядка 2л, свойства которой (включая описание классов сопряженных элементов) даны в примере 1 п. 5 § 3 гл. 7. Так как <а> <] Dn, то отображениями	&I—>1 и он>1,	—1 задаются два одномерных
2П.1
представления. Пусть е = ел —примитивный корень степени л из 1. Тогда отображение
Но' М- -К ill
будет определять представление степени 2* Представление Ф(7> неприводимо при / = 1, 2, ..., £“"2"“] ([а]) —целая часть вещественного числа а). При л = 2лг представление Ф(/л) распадается в прямую сумму двух одномерных представлений:	—1, Ьн->1 и —1,
6н->— 1. Это согласуется с тем фактом, что коммутант D'2m имеет индекс 4 в D2m и D2m/D2tn ее Z2XZ2. Все указанные представления неприводимы и составляют полное множество неприводимых комплексных представлений группы диэдра. Найти вещественную реализацию представлений Ф^. Указать в явном виде изоморфизм (эквивалентность) Ф(/> « ф(Л)> k > mt j^m.
10.	Кристаллографические группы (к задаче 2 •§ 2ргл. 1). Пусть Е—л-мерное евклидово пространство и V—ассоциированное с ним векторное пространство с евклидовым скалярным произведением. Всякому движению d пространства Е отвечает ортогональное линейное преобразование dcO(n), причем так, что d^^d^. Группа D
400
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
движений пространства называется кристаллографической группой, если D-орбита произвольной точки дискретна (не имеет предельных точек) и существует компактное множество М cz £, для которого D(44)= (J d (М) = Е. Справедлива теорема Шенфлиса — Бибербаха, de D
согласно которой кристаллографическая группа D содержит п независимых аффинных переносов, порождающих в D нормальную подгруппу L, и D D/L — конечная группа (точечная кристаллографическая группа). Всего геометрически различных точечных кристаллографических групп при п = 3 имеется 32. Среди них, очевидно, должны быть группы, содержащие отражения (несобственные движения). Из условий кристаллографично.сти следует, чго всякое собственное вращение из D изображается матрицей, подобной
cos 0 sin 0 0
А =
— sin 0 0
cos 0 0
0	1
с tr А = 1 +2 cos 0£ Z- Опираясь на теорему 2 § 3 и на отмеченное соображение, показать, что при и = 3 точечными кристаллографическими группами без отражений будут лишь циклические Съ С2, С3> С4, Св, диэдральные D2, D3, D4, De, группа тетраэдра Т и группа куба (октаэдра) О.
§ 6. Представления групп SU (2) и SO (3)
Частью «физического» мышления являются конкретные образы, связанные с представлениями группы SO (3). Действие SO(3), отражающее симметрию многих физических задач, с математической точки зрения интересно, в частности, тем, что оно индуцирует действие на пространстве реше-д2 д2 д2
ний уравнения А/ = 0, где А =	— дифферен-
циальный оператор Лапласа. Двумерный аналог этой задачи был рассмотрен в самом начале главы (задача 1).
Всякий элемент группы SO(3) является произведением нескольких операторов , Со вида (1) § 1 гл. 7. Но не действует на г, а Со — на х. Поэтому инвариантность уравнения Д/ = 0 относительно В(р и Со вытекает из тех выкладок, которые были проведены в двумерном случае. Мы приходим к заключению, что уравнение Д/ = 0 инвариантно относительно всей группы SO (3) или, что то же самое,
Д/-0 => Д(ву)-0, Vg€SO(3),
§ 6]
ПРЕДСТАВЛЕНИЯ ГРУПП SU (2) И SO (3)
401
где —функция, определенная соотношением
(фгЛ (х, у, z) — f (g-1 (х), g'1 (у), g-1 (z)).	(1)
По условию для ортогонального преобразования g’1 с матрицей (Я/7)? столбец новых переменных имеет вид
g~*	(X)		«11	«12	«13	X	
g~l	(У)	=	«21	«22	«23	У	•
g-1	(г)		«31	«32	«83	Z	
Согласно (1),
(фг(флЛ) (х> У> 2) = (флЛ (g~l (*), ё'1 (У), g-1 (2))= = /(/I-1 (£->(*)), h-'(g-i(y)), h~'(g-'(z))) = ^((gh)"1 (х), (gh)-1 (у), (gh)-1 (z)) = (0>gZJ) (x, у, z).
Стало быть,
Ф Фь = Ф ь g h gh’
т. е. линейные операторы Ф^, g^SO(3), действуют на функциях так, что отображение Ф: gi—»Ф^ является представлением группы SO(3). Этот весьма естественный способ построения представлений (фактически примененный нами ранее при рассмотрении симметрических функций с действующей группой Sn)t годится в принципе для широкого класса групп и относится к типичным методам функционального анализа. Нужно лишь, исходя из конкретных условий, выбрать надлежащее пространство функций и затем разложить его на неприводимые инвариантные подпространства (задача гармонического анализа).
В случае группы SO(3), когда все неприводимые представления конечномерны (общий факт для компактных групп), за функции берутся однородные многочлены
f (х, у, г) = 2as, I xSy'z"1-*-1
s, t
фиксированной степени т (т = 1, 2, 3, . . .). Они образуют пространство Рт размерности + (см. упражнение 4 § 2 гл. 5). Так как	то условие Д/ = 0
/mA о	. .
эквивалентно ( \ линейным условиям на коэффициенты aStt, Решения f£Pm уравнения Д/ = 0 называются одно
402
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
родными гармоническими многочленами (гармоническими полиномами) степени т. Ввиду линейности оператора Д они образуют подпространство Нт размерности —
—	=	(У нас <2/п4-1, но на самом деле
имеет место равенство). Согласно вышесказанному Нт инвариантно относительно действия Ф = Ф(/П) группы SO(3). Оказывается, справедлива теорема о том, что пространство Нт представления Ф(|Я) неприводимо над С и любое неприводимое над С представление группы SO (3) эквивалентно одному из представлений (Ф(Я2), Я^) нечетной размерности 2т +1. Вместо того чтобы доказывать эту теорему, мы, ограничившись сказанным, обратимся к группе SU(2), где несколько легче получить семейство неприводимых представлений. Ввиду наличия естественного эпиморфизма SU (2) —* SO (3) с ядром из матриц ± Е (см. § 1 гл. 7) всякое представление Т группы SO(3) можно считать также представлением SU (2) (см. доказательство теоремы 5 § 5), удовлетворяющим так называемому условию четности*.	При этом, разумеется,
будет также выполняться равенство ЧГ_^. = ЧГ^ для всех £^515(2). Обратно, при выполнении условия четности представление Т группы SU (2) является одновременно представлением группы SO(3). Физический смысл имеют и «двузначные» представления SO(3), т. е. представления группы SU (2), не удовлетворяющие условию четности. К их числу относится, например, обычное двумерное (спинорное) представление.
Отметим еще, что любое неприводимое представление группы SO(3), отличное от единичного, является точным, как это прямо вытекает из простоты SO (3) (теорема 6 § 3 гл. 7).
Теорема 1. Пусть Vn = <xkyn~k | k = 0, 1, ..., n>c — пространство однородных многочленов степени п от двух комплексных переменных с действием ЧГ(") на нем группы SU(2), определенным по правилу
(4?>f)(x,y)==f(ax—$y, fix + ay)
для каждого элемента
HI-? У’
§ 6]	ПРЕДСТАВЛЕНИЯ ГРУПП SU (2) И SO (3)	403
Тогда (Ч^, V„)—неприводимое представление SU(2) размерности п+1. При п четном (Чг(л), V„) является также неприводимым представлением группы SO(3).
Доказательство. Предположим, что многочлен
f(x,y) = 2 akxkyn~ll^0 k = 0
содержится в некотором инвариантном подпространстве UcVn. Тогда также
У (е~‘’с')кakxkyn~k = е 'п 2	f)(x,y)	,
k =0	ф
где — элемент из SU(2) вида (4) § 1 гл. 7. Так как Ф — произвольное вещественное число из интервала (0, 2л), то можно составить линейную систему с определителем Вандермонда, из которой следует, что
f(x, y)£U => xky"-keU	(2)
для любого одночлена с коэффициентом п^=/=0. Но если xkyn~k£U для какого-то kt то и
ak Рл”лх,я+ ... =(ах—fiy)k (^x + ay)n~k=^xffgl)(xkyn~k) ё U *
Взяв g с ар#=0, мы придем в силу (2) к включению xn£U, которое в свою очередь дает нам
V ( п (“Р)л"5 Xs yn~s £U.
s=0 S 1
Так как (” )«*(—p)n-'s^=0, то xsyn~s^U, s = = 0,1, ...,п. Стало быть, U = Vп, и неприводимость (ЧГ(Л), доказана.
Далее
(xkyn~k) = (— x)k (— y)n~k = (—1)” xkyn~\
так что при п = 2т выполнено условие четности (см. замечание выше) и (ЧГ(2да>, V2m) можно считать неприводимым представлением размерности 2п+1. |
На самом деле ЧГ(2,Л) эквивалентно представлению Ф(,я) группы SO (3) на пространстве однородных гармонических, многочленов степени т, но мы на этом не останавливаемся,
404
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
как и не пытаемся (хотя это возможно) выбрать в Vn такой базис, чтобы представление ЧГ(лП стало унитарным. Отметим только, заимствуя терминологию из тензорного анализа, что представление Т(л) группы SU(2) реализуется также в классе ковариантных симметрических тензоров ранга п. Полную и достаточно прозрачную теорию представлений компактных групп, включая SU (2) и SO(3), обычно развивают в рамках инфинитезимального метода, опирающегося на соответствие между группами и алгебрами Ли.
УПРАЖНЕНИЯ
1.	Построить 2т +1 линейно независимых однородных гармонических многочленов степени т.
2.	Показать, что всякий однородный многочлен f£Pm записывается в виде линейной комбинации с коэффициентами, зависящими от х2-\-у2z2, гармонических многочленов степеней т, т—2, т— 4, ... (Указание. Сравнивая размерности, получить разложение в прямую сумму пространств
Рт = Нт © (x2+y2 + z2) Hm_2®(x2 + y2 + z2)2 Нт^ ©...)
3.	Вывести из упражнения 2, что всякая полиномиальная функция g: (X, Y, Z)i—»g(x, yt z) на сфере S2: x2 + у2 + z2 = 1 разлагается по сферическим функциям — ограничениям гармонических многочленов на S2.
4.	Показать, не обращаясь к полному описанию неприводимых представлений группы SO(3), что гомоморфизм т: SO(3) ->SU(2) может быть только тривиальным. (Указание. Ввиду простоты SO(3) нетривиальность т означала бы, что т —точное представление степени 2. Но, как видно из примера 3 п. 4 § 5 или из описания конечных подгрупп в SU (2) (см. § 3), даже ограничение т ~ q не может быть точным.)
§ 7. Тензорное произведение представлений
1.	Контрагредиентное представление. Пусть (Ф, V) — представление группы G над полем С. Введем в рассмотрение дуальное пространство V* (пространство линейных функций на V) и положим
(ф*(^)7)(у)=/(ф(§"1)у); fev*, v$v. (i)
ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРЕДСТАВЛЕНИЙ
405
§ 7]
Линейность оператора Ф*(£) проверяется немедленно. Выберем, далее, в V и Р дуальные базисы:
У =	.....еп>, Р = <Л.........fn>,
Матрица линейного оператора Ф*(&) в базисе flt .fn является транспонированной к матрице оператора Ф(^“1) в базисе elt ..., еп\
=	(2)
Так как
= *ФЛ- X g- X = Ш- хФб- 0 =
то соотношением (2) (или (1)) определяется, вообще говоря, новое линейное представление (Ф*, V*) группы 6; оно называется представлением, контрагредиентным (или дуальным) к (Ф, V). Необходимость рассмотрения таких представлений возникает каждый раз, когда группу, действующую на векторах (контравариантные тензоры), мы заставляем, как это фактически уже было в § 6, действовать на координатах векторов (ковариантные тензоры). Как нетрудно видеть хотя бы из (2), (Ф*)*^Ф. Представления, контрагредиентные друг к другу, могут и не отличаться или быть эквивалентными. Если, например, (Ф, G) — вещественное ортогональное представление, то ф* = *Ф-1 = Ф^. Но в общем случае представления Ф* и Ф не эквивалентны, как показывает простейший пример: С3 = <а | а3 = е>; Ф (а) = е, Ф* (а) = е-1 (е2 + е + 1 = 0).
Для конечной группы G точный критерий эквивалентности контрагредиентных представлений получается на языке теории характеров. Так как характеристические многочлены матриц А и М совпадают:
det (Х£ —М) - det <(1Е — Д)= det (Х£ — Л),
то из элементарных свойств характеров (предложение § 4) вытекает, что
Хф. (g) = Хф (ё)-
В частности, представление Ф с характером, принимающим только вещественные значения, эквивалентно Ф*.
406
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Разумеется, всегда
(Хф*» Хф*)б = (Хф> Хф)с>
так что Ф*, Ф одновременно приводимы или неприводимы.
2.	Тензорное произведение представлений. В курсе линейной алгебры и геометрии (см. также упражнение 1) доказывается следующее утверждение.
Теорема 1. Пусть V, W—векторные пространства над полем Р. Тогда существуют векторное пространство Т над Р и билинейное отображение т: VX W —>Т, удовле-вотряющее условиям:
(Т1) если vl9 ..., v^V линейно независимы и wlt ...
k
•••»	то У t(uz, Wj) = 0 =$> до1 = 0, ..., шл = 0;
(Т2) если w19 ..., wk£W линейно независимы, то 2== о => = о, • •i, vk=
i
(ТЗ) т—сюръективное отображение, т. е.
Т = <т (v, w) | v С V, w
Кроме того, пара (т, Т) универсальна в том смысле, что, какова бы ни была пара (т', Т'), состоящая из векторного пространства Т' и билинейного отображения x':VxW —► Tf, найдется единственное линейное отображение а: Т —»Т\ для которого (v, w) = o (r(v, w)), v£V, |
Предположив существование двух универсальных пар (т, Т), (т', 7"),_ мы легко обнаруживаем, что линейные отображения о: Т—>Т', o': Т'—>Т являются на самом деле взаимно обратными изоморфизмами: о'оа = вг, а о о' =еТ'. Таким образом, Т ^Т', причем изоморфизм о: Т ->Т обладает свойством, указанным в формулировке теоремы.
Пару (т, Т), однозначно определенную, с точностью до изоморфизма, по заданным векторным пространствам V, W, называют тензорным произведением этих пространств. Записывая T = V ® PW, или просто Т = V ® W, мы должны еще помнить, что векторное пространство Т снабжено билинейным отображением (v, w) i—» v ® w декартова произведения Vx№ на T, удовлетворяющим условиям (Т1) — (ТЗ). Итак, элементами тензорного произведения V0U7
s 7] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРЕДСТАВЛЕНИЙ 407
служат формальные линейные комбинации с коэффициентами из Р упорядоченных пар v®w с v^V, w£W. При этом предполагаются выполненными следующие условия:
+	® w—vi ® w — v2 ® w = 0,
v ® (шх + ^2) —®	— и ® ^2 = 0,	(3)
kv ® w—v®kw = 0, к^Р
(к (v ® w) = kv ® w = v ® kw).
Непосредственно из теоремы 1 видно, что биективные отображения v ®	® v, (и ® v) ® w 1—>и ® (v ® ш),
v ® kt—>k®vt~>kv устанавливают изоморфизмы, называемые каноническими, векторных пространств:
V ® W W ® V,
(U ®V)®W	®(V®W),
V®P^P®V^V.
Выполнены также законы дистрибутивности:
(U © V) ® W (U ® W) Ф (V ® Г), U ® (V: Ф W) (U ® V) Ф (LT® W).
В тензорном анализе, откуда ведут свое происхождение рассматриваемые здесь понятия, изучаются тензорные произведения специального вида:
V* ® ... ® V* ® V ® ... ® V. р	я
Их элементами являются тензоры типа (р, р), р раз ковариантные и q раз контравариантные. При выборе дуальных базисов ех, ..., еп в V и е1, .еп в V* элементы ® , .. ® ер ® е}1 ® ... ® е/ составляют базис пространства тензоров типа (р, q). Обычно под тензором понимается просто набор координат	в этом ба-
зисе с указанием правил замены координат ^при переходе от одной базисной системы к другой. Именно так получается интерпретация на тензорном языке (фактически на языке матриц) таких понятий как билинейная форма и линейный оператор. Ограничившись этими краткими напоминаниями, которыми мы не намерены в полной мере
408
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
воспользоваться, обратимся к интересующему нас вопросу о представлениях.
Пусть Л\ V—S3\ W—>W— линейные операторы. Их тензорным произведением называется линейный оператор
Л® S3'. V® W-+V® W, действующий по правилу
(Л 0 S3) (V ® w) = Ли ® S3w	(4)
(далее по линейности: (Л ®	® юА = ^Ло1® S3Wi).
Ясно, что это определение согласовано с соотношениями (3). Например,
Л (t'i + t'a) ® Лох ® 33w—Ло2 ® 93w =
= (Лу1 + Лу2) ® S3w—Лох ® S3w—Ло2 ® S3w = Q.
Поэтому действие Л ® S3 на V ® W задано корректно. Отметим также непосредственно вытекающие из определения (4) соотношения:
(Л 0 S3) (4? 0 Ф) = Л£ 0 ЗЗФ,
(Л + £) 0 33 = Л® 33 + % ® S3,
Л ®{33 + Ф) = Л ®33+Л®Ф, Л®133 = КЛ ®33 = X (Л 0 S3).
Проверку их оставляем читателю.
Пусть, как прежде, V = <ех, ..., ел>, W = </\, ..., fm>. Матрицу А® В размера пт х пт оператора Л 0 S3 в базисе К ® fl.....е1 ® fm. e2®f1......е2 ® fm, ...
... en®fi, •••» en®fm}
мы получим, замечая, что
= 2 a<'<er,	= 2 ₽/-/f/'»
, И ® (ez <8> fj) =	® h-
Стало быть, с Д = (а,.Э, ^=(Рл/) имеем
А ® В =	=
апВ а12В ... а1пВ 0С21^ 0^22^ • • •
• •. о^ппВ
§ 7] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРЕДСТАВЛЕНИЙ 409
В частности, имеем формулу для следа
tr А ® В = an trB + a22 tr В+ ... + апп trB = trA-tr В. (5)
Отметим попутно, что
det А 0 В = det (А 0 Ет) (Еп 0В)==
= det А 0 Ет • det Еп 0 В = (det А)т (det B)nt
так что невырожденность операторов Л и S3 влечет невырожденность их тензорного произведения Л 0 S3.
Пусть теперь (Ф, V), (Т, W)—два линейных представления группы G с характерами хФ и соответственно. Определим естественным образом представление (Ф 0 Т, V 0 W), полагая
• (Ф 0 *F) (g) = Ф (g) 0 Ч' (g), G.
Из общих свойств тензорного произведения линейных операторов и из формулы (5) вытекает, что отображение Ф ® Т будет действительно задавать представление группы G с пространством представления V 0 W и с характером
Хф ® ~ ХфХф-	(6)
Будем говорить, что (Ф ® T, V® W)—тензорное произведение представлений (Ф, V) и (V, W). При Т = Ф, W = V говорят также о тензорном квадрате. В правой части формулы (6) стоит обычное поточечное произведение центральных фуНКЦИЙ ХФ И Хчг.
Совершенно очевидно, что если U — G-инвариантное подпространство в V, то и U 0 W будет G-инвариантным подпространством в V 0 W. Аналогичное замечание относится к G-инвариантным подпространствам в W. Но из неприводимости V и W вовсе не следует неприводимость V 0 W, как показывает пример тензорного квадрата Ф(3) 0 ф(з) двумерного представления группы S8 (см. таблицу в п. 2 § 5). В самом деле, dim^ Ф(3) ® Ф(3) = 4, а максимальная степень неприводимого представления группы S3 равна 2.
Задача эффективного описания неприводимых представлений, содержащихся в Ф 0 Т и, более общо, в тензорном произведении Ф(1) ® Ф(2) ® ... 0 Ф{р} нескольких линейных представлений, имеет принципиальное значение,
410
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
поскольку многие важные и весьма естественные представления групп возникают как тензорные произведения. Именно с этой точки зрения нужно смотреть на представления групп SU (2) и SU (3) (см. § 6), а также на примеры 3 и 4 п. 2 § 1. Инвариантные подпространства симметрических и кососимметрических ковариантных (или контра-вариантных) тензоров постоянно встречаются в различных геометрических приложениях. Рассматриваемая задача привлекательна в особенности тогда, когда справедлива теорема о полной приводимости представлений.
3. Кольцо характеров. Для простоты ограничимся случаем конечной группы G и поля С. Пусть Ф(1), Ф(2), ... ..., Ф(/) — полное множество попарно неэквивалентных неприводимых представлений группы G над С и %2, ... ..., —соответствующие им характеры (г — число классов сопряженных элементов в G). Нам известно, что
Ф ® V ^тхФ(1)4- ... 4-m/D(r),
где кратности /nz зависят только отФ и Y. По формуле (6)
ХфХчг = т1Х1+ . ..+/пдг.
Пусть Х% (G) — множество всевозможных целочисленных линейных комбинаций характеров Xi> ..., %г. Мы доказали ранее, что ..., %г—ортонормированный базис пространства (G), поэтому Х% (G)c:Xq (G) является, во всяком случае, свободной абелевой группой с образующими Xi, • • •, Хг- Ее элементы называются обобщенными характерами группы G. Истинными характерами будут лишь комбинации 2т/Х/ с
Из предыдущего видно, что тензорное произведение представлений индуцирует на X z (G) бинарную алгебраическую операцию—коммутативную, ассоциативную, подчиняющуюся законам дистрибутивности. Короче говоря, справедлива
Теорема 2. Обобщенные характеры образуют коммутативное ассоциативное кольцо Х% (G) с единицей—единичным характером хг
Xq (G) называют коммутативной ассоциативной алгеброй размерности г над С. Строение кольца Х% (G) (алгебры X(q (G)) полностью определяется структурными констан
§7] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРЕДСТАВЛЕНИЙ	411
тами—целыми числами т^ из соотношений
xzX/=Sm‘/x*-	(7)
В частности, равенства т^ = т^, m.ij = 8kj отражают свойства коммутативности Х% (G) и единичности %г Согласно (7),
X/ (g) X/ (g) = s m‘iXk (g). Vg c G.
Умножив обе части этого соотношения на	про-
суммировав по g£G и воспользовавшись первым соотношением ортогональности для характеров, получим
mi‘i = тзт £ к № (g)- 	(8)
11 geo
Таким образом, структурные константы выражаются в терминах самих характеров.
Из (8) можно извлечь одно несложное утверждение. Именно,
т'и = fir Xz X/ Х1 = ТбТ S X/ (g) X/ (g) = 1 g	g _______
= TgT £ Xz (g) X/ (g) = (Xz. X/)o.
g
где х/ = Хф(>— характер представления, контрагредиент-ного к (см. п. 1). Таким образом, единичное представление входит в качестве компоненты в разложение ф«’> ® ф7> тогда и только тогда, когда Ф(0 эквивалентно представлению ф</') = ф(/)* (в противном случае = = (ХьХ/)о = 0). |
Отметим еще, что тензорное произведение одномерного представления Ф(П и произвольного неприводимого представления Ф(7> всегда является неприводимым представлением той же размерности, что и Ф(Л Это довольно понятно без всяких объяснений, а формально вытекает из критерия неприводимости характеров. Если Х==ХФо’>®ф(/>= Х/Хл то Xz '(g)— комплексный корень
412
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
некоторой степени из 1 и (g) % (g) = 1, а поэтому (%. Х)о = т^г Ц X/ (£) X/ (g) li (g)	=
i
= T^T S X/ (g) X/ (g) = (X/. X/)g = 1 • К g
Пример 1. G = S3 (см. таблицы в п. 1 § 2 и в п. 2 § 5):
ф(1) 0 Ф<3) ~ ф(2) Q ф(3) ~ ф(3).
Пример 2. G = S4 (см. пример 3 п. 4 § 5): ф(2) ® ф<4> » ф<5), ф<2> 0 Ф<б> « Ф(4\
Наконец, докажем следующую любопытную теорему, служащую обобщением теоремы 2 § 5 о разложении регулярного представления.
Теорема 3. Пусть х = Хф—характер точного представления (Ф, V) конечной группы G над полем комплексных чисел С, принимающий на G ровно т различных значений. Тогда каждый неприводимый характер х* входит с ненулевым коэффициентом в разложение хотя бы одного характера x° = Xi, х, X2, •••> X7”"1- Другими словами, всякое неприводимое представление содержится в разложении некоторой тензорной степени Ф®' = Ф ® ... ®Ф, —1, любого точного представления Ф.
Доказательство. Пусть соу = х (£>)> / = 0, 1, ... . . . , т—1,— различные значения, принимаемые характером х на G, причем соо = х (е) = deg Ф. Пусть, далее,
Gj = к € О | X (g) = X (gj) =
Ввиду точности представления Ф имеем
Сй = КегФ = Н.
Пусть —неприводимый характер группы G, не входящий в разложение ни одного из характеров Тогда
т— 1	____
0 = |G|(x/, Х*)о= 2 (X (£/))' 2 XHg) = 2^T7, 1=0
О i ^tn— 1, — однородная система линейных уравнений относительно
§7]
ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРЕДСТАВЛЕНИЙ
413
т, = с определителем geGz
1 1 ... 1
det (со/) =
С00 С0А ...
, m-1 г т-1 л т-1
(О0	• tom-l
отличным от нуля (определитель Вандермонда). Таким образом, Ту = 0, j = 0, 1, ..т—1, т. е.
2 ХИ£-1) = О, / = 0, 1..........т— 1.
В частности,
0=2 ХА(£-1) = хИе)
getfo
— противоречие, доказывающее теорему. |
В случае регулярного представления р, очевидно, т=2.
4. Инварианты линейных групп. Линейной группой степени п мы, как обычно, называем любую подгруппу в GL(n, Д'), где Д'—некоторое поле. В дальнейшем можно считать К = R или С. Если G — абстрактная группа и Ф: G—^GL(n, С) — ее линейное представление, то пару (G, Ф) мы тоже будем называть линейной группой. Линейные преобразования Ф^ действуют на столбцы переменных %i, .. ., хп:
(*i)	I
: =ф, : .
(Хд)	%п
Они переводят любую форму (однородный многочлен) f степени т снова в форму степени т:
<®gf) (Л....хв) = f (Фй- (хх), ..., Фй-, (х„)).
Различные частные случаи этого действия нам уже встречались (см. § 6). Отображение Ф определяет представление группы G на пространстве Рт форм над С степени т (или ковариантных симметрических тензоров ранга т).
Определение. Форма f € Рт, остающаяся неподвижной при действии ФЙ(Ф/ = Л VggG), называется (целым) инвариантом степени т линейной группы (G, Ф).
414
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
На самом деле нужно было бы брать остающийся на месте при действии Ф (G) многочлен от коэффициентов «общей» формы степени т. Так поступают в общей теории инвариантов, но мы для простоты ограничимся данным определением. Если в качестве f взять рациональную функцию, то можно прийти к ^понятию рационального инварианта. Важным является также понятие относительного инварианта ft когда
где	— множитель, зависящий от элемента g£G.
Ясно, что любое множество {fv f2, ...} инвариантов линейной группы (G, Ф) порождает в С[хх,	под-
кольцо C[fx, /2, ...] инвариантов.
Рассмотрим небольшое число примеров.
Пример 1. Квадратичная форма х?+ *2+•»•и любые многочлены от нее являются целыми инвариантами ортогональной группы О (п).
Пример 2. Элементарные симметрические многочлены sx (хх, ... ..., х„), ..., sn (xlt . .., хп) являются целыми инвариантами симметрической группы рассматриваемой вместе с каноническим мономорфизмом Ф: Sn —>- GL (и). Основная теорема о симметрических многочленах утверждает, что инварианты $х, ..., sn степеней 1,2,..., п алгебраически независимы, а полиномиальными (рациональными) функциями от них исчерпываются все целые (рациоцаЛьные) инварианты группы (Sn, Ф).
Относительными инвариантами линейной группы (Sn, Ф) служат кососимметрические многочлены: <Dnf = (det Фя) f = znf- Мы видели (упражнение 3 § 2 гл. 6), что любой кососимметрический многочлен f имеет вид f = &n-g, где = Д (х/—ху), a g—произвольный сим-/ < i
метрический многочлен, т. е. абсолютный инвариант.
Пример 3. Представлению Ф^ X—^АХА"1 степени п2 полной линейной группы GL (п, К) с пространством представления Мп (К) (см. пример 3 § 1) отвечает система из п алгебраически независимых инвариантов —коэффициентов характеристического многочлена матрицы Х = (хф. К ним относятся, в частности, хорошо известные нам инварианты trX = 2*i7 и det X.
П р и м е р 4. На квадратичную форму f (хх, ..., хп) = 2 aijxixp записанную в виде f (хь ..., хп) = *хЛх, А = (ац) = *А, X = [хх, ... ..., хп], действует ортогональная' группа О (п):
C£O(/i) => (C”V)(xi> ...,хл) = ЧСХ)4(СХ) =
= tXiCACX = tX (С-МО) X.
В этом случае принято говорить об инвариантах квадратичной формы f относительно О (п): 1гЛ, ..., det Л. Для бинарной квадратичной формы ах2 -\-2bxy су2 инварианты а-\-с и ас — Ь2, характеризующие
§7] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРЕДСТАВЛЕНИЙ 415 метрически различные классы кривых второго порядка, известны еще из курса аналитической геометрии.
Пример 5. Симметрическую группу S3 рассмотрим как линейную группу степени 2, используя представление Г, эквивалентное представлению Ф(3) из таблицы в конце п. 1 § 2: г~-|5	г,„=ц; ;|, «+«+-»
^эквивалентность осуществляется посредством сопряжения
15 «г
Пусть «, v—независимые переменные, линейно преобразующиеся посредством Га:
г(12з> (и) = еи, Г(123)(у) = е-1и; Г(23)(м) = и, Г(23)(0 = и.
Так как
Г(123) (ио) = ГЙз) («) Гааз) (v) = e.~1u-ev = uv,
Г\23) (uv) = vu = uv,
Г(123) (“8 + у3) = (е~ 1“)3 +. (ей)3 = и3 + V3,
Г(23) (и3 + У3) = V3 + и3 = и3 + Ц3,
то группа (S3, Г) имеет формы
/! = uy, /2 = ц3 + у3	(9)
степеней 2 и 3 в качестве своих инвариантов.
Далее, группа S3 действует естественным образом на многочленах f(xlt х2, х3) от трех независимых переменных:
х2, x3) = f (ха_>(1), ха_,(2), хо-1(3)).
Положив
« = х1 + ех2 + е2х3, у = X! + е2х2 + ех3,	(10)
мы увидим, что
Га(и) = ха-1 (1) + еха- 1 (2)"Ь	(З)4
В частности,
Г(123) («) = х3 + ехх + е2х2 = ей, Г(23) (и) = хг + ех3 + е2х2 = и, Г(123) (У) = Х3 + 8% + 8ХХ = 8- Ч Г(23) (у) = ХХ + 82Х3 + 8Х2 = U,
т. е. действия Га на и, и и а на хь х2, х3 согласованы. При подстановке (10) в инварианты (9) последние перейдут в симметрические функции от хь х2, х3, которые по теореме 1 § 2 гл. 6 можно выразить через элементарные симметрические функции Si = Si(xlt х2, х3).
416
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
Небольшое упражнение показывает, что
/1=	4"Л'2_НЛ'3 “1“ (с 4“ Б2) (х 1Х2 “I" Х1Хз 4-^2Л'з)==^1 — 3$2>
Л = 2 (Л1 + %2 + Хз3) —
—• 3 (xix2 Х1^з-|-^1Х2_ЬХ1Хз-|-Х2Хз-|~Х2Хз)4-12Х1Х2Хз = 2$i — 951®2~|-27S3.
Специализируем значения /1} /2, взяв за xlf х2, х3 три корня неполного кубического уравнения
х3 + рх + <7 = 0.
Тогда $! = (), s2 = p, s8 = —q и, следовательно,
?1 — —Зр, 12— — 21q.
(П)
Но из (9) следует, что
v =
'ч /а=и»+4.
и * и3
Все радикалы выбираются такими, что после подстановки значений (11) получатся формулы
с величиной D =.—4р3 —27g2 —дискриминантом нашего кубического уравнения (см. (16) § 2 гл. 6). Так как и и v теперь известны, то из линейной системы	'
Х1 + ех2 4-е2х3 = и, xi + e2x2 + ex3 =и, Х14" х2-р Х3 =0 находятся сами корни. Мы пришли довольно естественным путем к формулам Кардано, о которых упоминалось в задаче 1 § 2 гл. 1.
Последний пример не случайно устанавливает связь между инвариантами группы S3, являющейся группой Галуа общего кубического уравнения, и формулами Кардано. Теория Галуа в значительной мере связана с изучением инвариантов полей (и соответствующих им групп), порожденных корнями алгебраических уравнений.
Отметим некоторые факты, относящиеся к системе образующих кольца инвариантов. Пусть w—произвольная форма от п независимых переменных хх, Конечная группа G с линейным представлением Ф степени п действует как группа перестановок на множестве
й = {Фг(ау) | g € G}.
§7]	ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРЕДСТАВЛЕНИЙ 417
Ясно, что любая однородная симметрическая функция | G | (или, возможно, некоторого делителя числа | G |) элементов из Q будет инвариантом линейной группы (G, Ф). Если теперь взять в качестве w переменную xh то добудет корнем алгебраического уравнения
п (Х-Фг(х,)) = о, get?
коэффициенты которого являются инвариантами группы (G, Ф). Таким образом, каждая переменная является (алгебраической) функцией инвариантов. Если бы алгебраически независимых инвариантов было меньше чем и, то мы выразили бы xlt ..., хп через меньшее число алгебраически независимых переменных, а это невозможно. Следовательно, мы доказали (если можно назвать доказательством столь смелое обращение с алгебраической зависимостью величин) одну из важных теорем теории инвариантов.
Теорема 4. Конечная линейная группа степени п всегда обладает системой из п алгебраически независимых инвариантов. |
Для группы (S3, Г) такими инвариантами являются формы (9).
Можно было бы дополнить теорему 4 утверждением о том, что все кольцо целых инвариантов конечной группы степени п порождается п алгебраически независимыми инвариантами /\, /2, ..., fn и, как правило, еще одним инвариантом fn+1 (являющимся алгебраической функцией первых п инвариантов). Другими словами, все остальные инварианты являются многочленами от f19 ..., fnt fn+i. Этот факт справедлив для многих других линейных групп, как дискретных, так и непрерывных.
Общая теория инвариантов, развитая в середине XIX века трудами Кэли, Сильвестра, Якоби, Эрмита, Клебша, Гордана и других, а затем испытавшая второе рождение в нескольких фундаментальных работах Д. Гильберта, в наши дни стала частью алгебраической геометрии и теории алгебраических групп. Постоянный интерес к теории инвариантов обусловлен также широкими возможностями ее применений во многих областях механики и физики.
14 А. И. Кострикип
418
ЭЛЕМЕНТЫ ТЕОРИИ ПРЕДСТАВЛЕНИЙ
[ГЛ. 8
УПРАЖНЕНИЯ
1.	Доказать теорему 1, следуя обозначениям, используемым в ее формулировке, и нижеприводимому наброску рассуждений.
а)	Если У = <ег.... еп>Р, W = <fi, /от>р, то (Tl) — (ТЗ)
эквивалентны в совокупности единственному условию: векторы т (е/, /у), 1 z «С л, 1 лг, составляют базис пространства Т.
б)	Для любого л/л-мерного пространства Т над Р отображение т можно определить соотношением т (v, оу)=2	гДе£7/» 1
К/— базис в Г* Согласно а), пара (т, Т) удовлетворяет условиям (Т1)—(ТЗ), и все пары получаются таким способом.
в)	Для всякой пары (т', Г') с билинейным отображением т': Vx W —ьТ' определим линейное отображение о: Т —>Т*, полагая ° (S yifgij) = 2 Vz/T' (ei, fj).
Согласно б) и в), т'(и, ау) = 2а/Р/т ff> = o (S а$/£'7)= = о(т(п, w)). Обратно, если о (т (у, ^)) = тл(п, ш), то o(gZy) = = tf(T (eif fy)) = T"(ez, /у).
2.	Показать, что в системе (Т1) — (ТЗ) можно опустить условие (Т1) или (Т2), а при априорном предположении dim Т = пт для определения тензорного произведения достаточно оставить одно из трех условий.
3.	Доказать соотношение det (А® В) = (det A)m (det В)п для квадратных матриц А, В порядков лит соответственно с комплексными коэффициентами, используя возможность их приведения к треугольному виду. (Указание. Существуют невырожденные матрицы С и D такие, что
Поэтбму
А'®В' = (С ® D)(A ® В) (С-1 ® D-i) = (C® О) (А® В) (С ®D)~1
— треугольная матрица с диагональными коэффициентами а$у, которые будут собственными значениями матрицы А' ® В', а следова-
тельно, и А ®В. Имеем: det (A® B)=JJ a/Py=f	/ JJpy\"=
= (det A)m (det В)п.)	‘	‘
§ 7] ТЕНЗОРНОЕ ПРОИЗВЕДЕНИЕ ПРЕДСТАВЛЕНИЙ 4)9
4.	При помощи формулы (8) и таблиц в п. 1 § 2, п. 2 § 5, п, 4 § 5 проверить, что справедливы разложения
ф(3) ® Ф(3> « фЧ) 4-ф(2) 4-ф(3)
для тензорного квадрата двумерного представления Ф(?) симметрической группы S3 и
ф(в) ® Ф(б> » ф<1)4-Ф(2)4-Ф(?) + Ф(4)
для тензорного квадрата двумерного представления ФФ группы кватернионов Q8.
5.	Представления прямого произведения групп. Пусть имеются две группы Gf Н с линейными представлениями (Ф, V), fP, IF), Тогда, полагая
(Ф® ’Р,)^.А) = Ф(^)®'Р(Л),
где ft—элемент прямого произведения GxH групп G, Н, мы заставим Gx Я действовать на тензорном произведении V ®qIF’ как обычно,
(Ф te)® W) (v ® оу) = Ф (g) v ® ¥ (A) w,
Проверить, что так определенное отображение Ф ® Т: GxH—>GL(V ® W)
является представлением группы GXH с характером Хф® ф=ХфХф. Доказать следующее утверждение. Пусть Фи), ..., Ф(г) (соответственно	4r(tS)) — все неприводимые представления группы G
(соответственно Н). Тогда представления Ф(/) ® TG) группы GxH неприводимы и все неприводимые представления группы GxЯ исчерпываются представлениями Ф(/> ®	1 «с i «с г,
6.	Формы ху, хп + уп являются инвариантами двумерной линейной группы диэдра
ми|? ip. —
(см. упражнение 9 § 5). Показать, что любой другой (целый) инвариант группы (Dn, Ф) имеет вид многочлена от ху, хп+уп.
7.	Проверить, что группа кватернионов, рассматриваемая в своем двумерном неприводимом представлении, не обладает квадратичными и кубическими инвариантами. Что можно сказать о формах х2у\ х4+*/4?
Глава 9
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
Повторное рассмотрение алгебраических структур, уже изучавшихся ранее, мотивируется следующими соображениями. Во-первых, кажется желательным в какой-то мере пополнить содержательными утверждениями наши сведения о полях и кольцах, опираясь, там, где это необходимо, на солидную теоретико-групповую базу. Во-вторых, результаты главы 8 о представлениях групп естественным образом включаются в общую теорию модулей над кольцами, и было бы жаль не упомянуть об этом хотя бы в краткой форме. Фундаментальное понятие модуля важно само по себе и достойно изучения в гораздо более широком аспекте, но для этого читателю рекомендуется обратиться к другим источникам.
§ 1. Конечные расширения полей
1. Примитивные элементы и степени расширений. Если F — поле, содержащее подполе Р, то F называется также расширением поля Р (см. § 4 гл. 4). Мы ограничимся вначале простейшим случаем, когда расширение F = Р (0) получено из поля Р присоединением (внутри заданного поля F) единственного элемента 0 С F. Говорят, что Р (0) — простое расширение поля Р, а 0 — примитивный элемент этого расширения. По своему смыслу Р (0) — поле отношений целостного кольца Р[0]. Элемент 0 трансцендентен над Р (см. § 2 гл. 5) тогда и только тогда, когда расширение Р (0) изоморфно полю рациональных дробей. Если, однако, Q —алгебраический элемент, то Р (0) Р [Х]/(/ (X)) (см. (9) § 2 гл. 5 и следствие теоремы 5 § 2 гл. 5). Здесь / (X) — неприводимый многочлен степени п> 0, корнем которого является 0. Обратно, если f £ Р [X] — неприводимый многочлен, то каноническим образом строится (см. § 3 гл. 6) поле F, в котором f обладает хотя бы одним корнем 9. Из построения видно,
§ 1]	КОНЕЧНЫЕ РАСШИРЕНИЯ ПОЛЕЙ	421
что F отождествляется с множеством элементов вида ао + «10+• • •n = deg/.
Для элементов кольца Р [9] это очевидно (разделить g(X) на f (X) с остатком и подставить Х = 0); деление же в Р [0] осуществляется так: если g(X) ^а^ + а^Х 4-... • • •то неприводимость f влечет равенство г!ОД(/, g) = 1 и существование многочленов и (X), v(X) степени<п, для. которых fu~\-gv = Г, отсюда g (0) v (9) = 1 и l/g(0) = v(0). Число п можно считать размерностью векторного пространства
Р = <1, 0,	9"-%
над Р с базисными элементами 1, 0, ..., О'1"1.
В случае произвольного расширения Fzd Р также целесообразно рассмотреть F как векторное пространство над Р. Его размерность dimpF (возможно, бесконечную) мы обозначим через [Р:Р] и назовем степенью расширения F над Р. Если Р = Р(0), то [Р:Р] называется также степенью примитивного элемента. Понятно, что для трансцендентного элемента Q£F семейство 1, 0, 02, ... линейно независимо над Р и [Р (0), Р] = оо. С другой стороны, из сказанного выше вытекает следующее утверждение.
Теорема 1. Пусть F — какое-то расширение поля Р. Элемент 0 £ F алгебраичен над Р тогда и только тогда, когда [Р (0): Р] <оо. Кроме того, алгебраичность 0 влечет равенство Р(0) = Р[0]. |
Назовем K^FzdP двухэтажной башней расширений. Она позволяет говорить о трех векторных пространствах: К/P (X над Р), К/F (К над F) и F/P (F над Р). Их размерности связаны соотношением, аналогичным соотношению индексов подгрупп.
Теорема 2. В башне расширений K^FzdР степень [X: Р] конечна тогда и только тогда, когда конечны степени [Х:Р] и [Р:Р]. В случае их конечности справедливо соотношение
[tf:P] = [K:F][F:P].
Доказательство. Предположив сначала конечность [X: Р] и [Р:Р], выберем Р-базис f19 ..., fm в F/P и Р-базис е19 ..., еп в К/F. Тогда любой элемент xgX
422
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
записывается в виде x = с a^gF. В свою очередь ^7=^Pijfi с pijgP. Следовательно, x = ^plyfie/9 и мы видим, что тп элементов ffy линейно порождают К над Р. Предположим наличие линейной зависимости ^i.Pijfiej = ^ ПРИ некоторых рц^Р. Тогда
0 = 2 Pijfiej = 2 ( 2 Pi] f i V/ => hi	3 \ i /
=> Pijf i = 0 => Pjj = 0 i
для всех i = 1, ..., m\ j = 1, ..., и, поскольку e19 •. .,en линейно независимы над F, a f19 .. ., fm линейно независимы над P. Стало быть, тп элементов fjCj составляют базис векторного пространства К/P и [К*.Р] = пт~ = [«-.F][F:P].
Обратно, неравенство [/<:Р]<оо влечет конечность [F:P], поскольку F/Р— подпространство пространства К/P. Если	..., аг\ — Р-базис для /С, то произвольный
элемент х € /С будет линейной комбинацией а19 ..., аг с коэффициентами в Р и тем более — с коэффициентами в F. Над F число линейно независимых элементов среди ai9 ...9аг может лишь уменьшиться. Таким образом, [ZC:Fj<oo. |
Следствие. Пусть F—расширение поля Р9 А — множество всех тех элементов из Ft которые алгебраичны над Р. Тогда А—подполе в F, содержащее Р.
Доказательство. Каждый элемент t g Р является корнем линейного многочлена X — /£Р[Х], так что РсЛ. Пусть, далее, и, о^А. Тогда по теореме 1 имеем [Р (и)9 Р] < оо . Элемент v, алгебраический над Р, будет алгебраическим и над Р(и), т. е. [Р(и, v):P(u)] = = [Р (и) (v): Р (и)] < оо . Согласно теореме 2, [Р (и9 v): Р] — = [Р(и9 v):P(u)][P(u):P]<oo.
Так как и — v9 uv £ Р (и, v)9 то, снова по теореме 1, имеем и — v9 uv$A9 т.е. А — подкольцо в F. Оно является полем, поскольку 0=^и£А ==>[P(z/“1): Р]=^[Р (и): Р] < <оо. I
Расширение F z> Р называется алгебраическим над Р, если все элементы из F алгебраичны над Р. Каждый элемент а алгебраического расширения является корнем некоторого отличного от нуля унитарного (т. е. со стар
КОНЕЧНЫЕ РАСШИРЕНИЯ ПОЛЕЙ
423
§ 1]
шим коэффициентом 1) многочлена fgP[X], зависящего от а. Если f(a) = 0 и g(a)=/=0 для любого 0=#g€P[X] с deg g < deg f, то f=fa называется минимальным многочленом элемента а. Минимальный многочлен неприводим над Р, однозначно определен и его степень совпадает со степенью элемента а (часто многочлен, получающийся из минимального умножением на константу, также называется минимальным). Все различные корни многочлена fa считаются сопряженными с а. Объяснение этой терминологии дает ниже теорема 3. Если charP = 0, то число различных корней совпадает с deg (см. § I гл. 6), но в общем случае это не так (см. упражнения 4 и 5).
Согласно полученным результатам, расширение F Р конечной степени [F: Р] является конечным алгебраическим, т. е. оно получается из Р присоединением конечного числа алгебраических элементов ап ..., ат. Обратно, всякое конечное алгебраическое расширение F=P(alt..ат) имеет конечную степень. В самом деле, /л(ал) = 0, /Л£Р[Х]. Элемент ak, алгебраический над Р, будет, естественно, алгебраическим и над Р (cq, ..., Значит, [Р (ап ..., ал):Р(ап ..., ал_г)] < оо и, в соответствии с теоремой 2,
[Р:Р] = [Р(а1, aJ:P] =
гп
= П Г Р («и •• •» аА):Р (ар..., аА_,)]<оо. | /с= I
Во многих случаях (в частности, когда charP^O) конечное алгебраическое расширение является простым. В рассматриваемых нами случаях существование примитивного элемента устанавливается непосредственно.
Пример. Поле F = Q(Y%, ]/з) как векторное пространство над Q четырехмерно: F = <1, 1^2,	K6>Q, т. е. каждый эле-
мент записывается в виде линейной комбинации а = а-\-Ь]б2 -р Н-с/3 +d /б' с рациональными координатами a, b, с, d. С другой стороны, F = <1, 0, 02, 03>q, где 0= Y2+ Гз. Действительно, Кг =_Ае-|-уО3. Гз=у0-уе«, /б=—|-+4е2- при-митивный элемент 0 имеет минимальный многочлен /0(Х) = Х4— — 10Х2 +1 с корнями
0(,)=е= у2+ Уз, 0<2>= У1 — /з, 0<»)=—у"2+ /зГ
0(«> = — У~2— У~3.
424
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Обратим внимание на тот факт, что F является полем разложения многочлена fQ (X), причем
/7 = 0 (0(D, 0(2), 0(3), 0(4)) = О(е<')),	/=1, 2, 3, 4.
В общей теории Галуа таксе поле было бы названо нормальным. Диаграмма подполей поля F
похожа на диаграмму подгрупп четверной группы Г4, и это не случайно. Если мы рассмотрим произвольный автоморфизм Ф: F—+F (см. п. 5 § 4 гл. 4), то из соотношений Ф (%4-г/) = Ф (х) + Ф ((/), ф (ху) = Ф (%) Ф (у), ух, y£F, следует, что Ф полностью определяется своим действием на примитивный элемент 0. Далее, Ф(а) = а, ya£Q, поэтому
Ф (0)4 — 10Ф (0)2 + 1 = Ф (04— 1О02 + 1) = Ф (0) = 0.
Значит, Ф(0) —один из корней 0(/>, 1 = 1, 2, 3, 4, и-мы приходим к заключению, что группа всех автоморфизмов Aut(F/Q), называемая также группой Галуа G (F/Q) или G (/е), имеет порядок 4 = [F:Q]. Групп порядка 4, с точностью до изоморфизма, всего две: циклическая Z4 и Z2XZ2^^4- Непосредственные вычисления показывают, что Aut (F/Q) = Г4.
Легче всего в этом убедиться, рассмотрев представление Aut (F/Q) перестановками на множестве Q = {1, 2, 3, 4}, элементами которого нумеруются корни 0(/). Если, например, Ф(0(1)) = 0(2), то 0(1)0(2) = — ] => 0(2)ф(0(2)) = _ 1 => ф(0(2)) = 0(1) И ф (0(3)) = _ ф(0(2)) = = —0(D = 0(4), т. е. Ф « (12) (34) = о. Аналогично получаются автоморфизмы (13) (24) = т и (14) (23) = от.
Остается добавить к сказанному, что циклическая подгруппа <о> оставляет поэлементно неподвижным промежуточное подполе 0 (У^~2) и <о> является группой G (F/Q (У 2)) всех автоморфизмов (группой Галуа) поля F относительно подполя <0(}/Г~2). Аналогично, полями инвариантов для <т> и <от> служат соответственно 0(^3) и О(Кб), а группами Галуа G (F/Q ( К~3)), G (F/Q (К~б)) будут в свою очередь <т> и <от>. Мы проверили на частном примере справедливость биективного соответствия Галуа между подполями нормального поля F и подгруппами его группы автоморфизмов.
2. Изоморфизм полей разложения. В § 3 гл. 6, где определено и построено поле разложения F над Р унитарного многочлена f (Х) = Хп + а1Хп~1 -]--------+ ял£Р[Х],
§ 1]
КОНЕЧНЫЕ РАСШИРЕНИЯ ПОЛЕЙ
425
отмечалось, что в построении имеются элементы произвола. Повторяя сейчас эту конструкцию, мы могли бы лишь сказать, что [F:P]^ln\ (постарайтесь понять, почему). Но на самом деле все поля разложения над Р данного многочлена f изоморфны. Чтобы уточнить это высказывание, рассмотрим несколько более общую ситуацию.
Согласно теореме 3 § 2 гл. 5, любое изоморфное отображение <р поля Р на поле Р продолжается единственным образом до изоморфизма Р [X] на Р [X], так что / (X) = Х“ + ^Х"-х + • • • + “п f (X) = Фх/ =
= X" 4- ф (aj X"-1 + ... + Ф (ап).
Теорема 3. Пусть ф: Р н-» Р—изоморфизм полей; f£P[X]—унитарный многочлен степени п > О, f = 4>xf — его образ при изоморфизме фА; Р, F— поля разложения многочленов f, f над Р и над Р соответственно. Тогда ф продолжается до изоморфизма Ф: F > F k^[F:P] способами, причем k = [F:P]t если все корни многочлена f (X) различны.
Доказательство. Этап I. Вначале рассмотрим случай произвольных расширений Х=эР, К^Р. Пусть Og X— алгебраический элемент с минимальным многочленом g = ge С Р [X]. Утверждается, что изоморфизм ф: Р —> Р продолжается до мономорфизма р: Р (6) —> К в точности тогда, когда g обладает корнем в X, причем число продолжений совпадает с числом различных корней g в К.
Действительно, из существования р следует, что элемент р (0) должен быть корнем g: g(0) = O => g(p(0))^; = р (g (6)) =0. Обратно, если g(co) = O, то Кег ф=э ZDg(X)P[X], гдеф: Р[Х]—+К—гомоморфизм, определенный соответствием и (Х)н->и (со). Как и в случае групп, ф индуцирует гомоморфизм ф: Р [X]/g (X) Р [X] —> X (и (X) 4-g (X) Р [X] и (со); если это не совсем ясно, то нужно обратиться к результатам следующего § 2). Заметим, что ввиду неприводимости g(X) факторкольцо Р [X]/g (X) Р [X]— поле, так что ф — мономорфизм. Точно
426
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
таким же способом определяется изоморфизм полей о: Р [X]/g (X) Р [X] —► Р (0) (и (X) + g(X)P [X] и (0)). Композиция р = ф о а’1 является мономорфным отображением Р (0) в К (р (и (0)) = и (со)). Так как Р (0) порождается над Р элементом 0, то р—единственное продолжение <р, переводящее 0 в ю, Это и означает, что число различных мономорфизмов р с ограничением р |р = <р равно числу различных корней g(X) в X.
Этап II. Поле разложения строилось последовательным присоединением корней неприводимых многочленов. Используем далее индукцию по размерности [F:PJ.
При [F: Р] = 1 многочлен f разлагается на линейные множители уже в Р[Х]: f(X) = (X—Cj)...(X—сп). В таком случае /(Х) = (фх/)(Х) = (Х—<\)... (X—с„). Корни cit ..., сп многочлена / содержатся в Р, а поскольку F порождается ими над Р, то F = P, так что Ф = <рх— единственное продолжение.
При [F:P]> 1 разложим /(X) над Р на унитарные неприводимые множители, среди которых должен быть хотя бы один многочлен степени /п> 1. Обозначим его g(X). Так как
f (X) = g (X) h (X) =» f (X) = (фхЛ (X) = g (X) h (X), то над полями разложения F и F имеют место разложения многочленов
g(X) = (X-0J.. .(X—0J, g(X) = (X—(01).. .(X —©m), т<^п.
Ввиду неприводимости g(X) является минимальным многочленом элемента 0Х над Р и [Р (д1):Р] = т.
Если среди со£, ..., оэ,л имеется I различных, то, согласно этапу 1, найдется I мономорфных отображений Pi, •••, pj расширения L = P(01) в F с р,|р = ф. Конструкция поля разложения такова, что F можно считать полем разложения над L многочлена f С ЦХ], a F можно считать полем разложения над pz(L) многочлена f (X) при любом £=1,2, .. ., Z. По теореме 2 имеем неравенство [F:L] — [F:P]/m<[F:P], так что по предположе
§1]	КОНЕЧНЫЕ РАСШИРЕНИЯ ПОЛЕЙ	427
нию индукции каждый из pz можно продолжить до изоморфизма Ф/,/. F—>F, причем число таких продолжений (число индексов /) не превосходит [F:L] и равно этой верхней границе, если все корни в F многочлена f различны. Так как ®z>y|L==pz, 1^/^[F:L], и р,|р = ф, то Ф/1У—продолжение ср, причем р/#=р^ => Ф/./^Ф^и при i=£s. Стало быть, всего получается k^m[F :L]= =[F:P] продолжений изоморфизма ср. Это неравенство переходит в равенство, если все корни f различны.
Этап III. Пусть, наконец, Ф: F —+F — произвольное продолжение ср. Как и в этапе II, ограничение Ф|£, будучи мономорфным отображением L в F, совпадает с одним из pz, а в таком случае Ф совпадает с одним из Ф/,У. I
Следствие 1. Любые два поля разложения Ff F над Р многочлена f [X] изоморфны.
Действительно, достаточно положить Р = Р в теореме 3 и взять за <р единичное отображение Р на себя. |
Следствие 2. Группа автоморфизмов Aut (F/P) любого поля разложения F над Р многочлена f £Р [X] конечна и имеет порядок :Р]. Если все корни многочлена f (X) различны, то | Aut (F/P) | = [F: Р].
Доказательство непосредственно следует из теоремы 3.
Замечание. Хотя поле разложения F над Q (или над любым другим числовым полем) многочлена f € Q [X] можно считать вложенным в поле С комплексных чисел и тем самым однозначно определенным, следствие 2 показывает, что и в этом случае имело смысл разобрать не очень приятное доказательство теоремы 3.
3. Конечные поля. Помимо Zp= Z/pZ, нам встречались и другие примеры конечных полей (см. § 4 гл. 4). Настало время включить их в общую теорию.
Первое очевидное замечание относится к произвольному конечному расширению /(zdF конечного поля F: если	и [K:F] = nf то \K\ = qn. Действительно,
после выбора базиса векторного пространства К/F последнее отождествляется с пространством Fn строк (аг, ..., ап) длины п. Все координаты az независимо друг от друга принимают q значений из F. Значит,
428
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Второе замечание, связанное с первым, заключается в том, что любое конечное поле F имеет конечную характеристику р (р — простое число) и | F | является степенью р, В самом деле, простое подполе Pc:F в силу конечности F должно быть изоморфно некоторому полю Zp = Z/pZ. Согласно первому замечанию конечное расширение F:jP с | Р | = р имеет мощность \F\=-pm. |
Теорема 4. Для каждого конечного поля F и для каждого целого положительного числа п существует одно и, с точностью до изоморфизма, только одно расширение KzdF степени [K:F] = n.
Доказательство, а) Единственность. Пусть /CzdF — расширение степени и. Как мы знаем \F | = q => =*>д = рт' р — простое, и | К | = qn. Следовательно, мультипликативная группа А? = /С\{0} имеет порядок qn—1, а порядок каждого ее элемента по теореме Лагранжа делит qn—1:	Это значит, что все эле-
менты поля Д (включая t = 0) являются различными корнями многочлена Xq”— X и имеет место разложение
Х4" —Х= Д (X — t).
tEK
Ни над каким собственным подполем поля К с числом элементов < qn такого разложения на линейные множители быть не может, поэтому Д—поле разложения многочлена Xq —X. Обращаясь к следствию 1 теоремы 3, мы приходим к требуемому заключению.
б) Существование. Рассуждения в части а) подсказывают возможный путь построения К. Возьмем за К поле разложения над Р Zp многочлена f(X) = Xq —X. Так как q = pmt то ^-1=0 в К. Поэтому f' (Х)*= = qn-\-Xq -1—1 = —-1 и по известному критерию (теорема 4 § 1 гл. 6) f (X) не имеет кратных корней. Это значит, что подмножество	корней многочлена f (X) имеет
мощность (/Cyl = (у".
Так как KfccK и char/C = p, то, согласно упражнению 8 § 4 гл. 4, (х + уу3 = xps + ypS Для любых х, у€К/ (FciKj) и s = 0, 1, 2, ... В частности,
х, уеД/ (х±ууп = х^п ±у^п = х±у => x±y$Kf.
КОНЕЧНЫЕ РАСШИРЕНИЯ ПОЛЕЙ
429
§ 1]
Кроме того,
1 € (ху)«п = х<1пучп — ху =ф хуек/, 0^xeKf=$>	=	=> x-'ZKf.
Таким образом, —подполе в АГ, содержащее F и все корни многочлена f(X). В соответствии с определением поля разложения должно выполняться равенство = Степень [/<:F] равна и, поскольку = |/С| = |/CJ = = qn- I
Следствие. Для каждого простого числа р и для каждого целого положительного числа п существует одно и, с точностью до изоморфизма, только одно поле с числом элементов рп.
Доказательство заключается в применении теоремы 4 к частному случаю | F | = р. |
Как уже отмечалось в § 4 гл. 4, конечное поле с числом элементов q = pn принято обозначать символом или, в честь Э. Галуа, символом GF (рп). Установим ряд свойств конечных полей.
Теорема 5. Справедливы следующие утверждения.
(i)	Мультипликативная группа F? конечного поля F^ является циклической группой порядка q—1.
(ii)	Группа автоморфизмов Aut (F^) конечного поля F^ с числом элементов q = pn — циклическая порядка п, причем
Aut (Р,) = <Ф|Ф (/) = /', V/€F.>.
(iii)	Если Fprf—подполе поля Fp*, то d\n. Обратно, каждому делителю d числа п отвечает ровно одно подполе С Fp« | Ф* (0 = 0 = Fprf. Автоморфизмы, оставляющие это подполе поэлементно неподвижным, образуют группу	Таким образом, имеется биек-
тивное соответствие между под полями конечного поля FQ и подгруппами его группы автоморфизмов (соответствие Галуа).
(iv)	Если q = pn и F£ = <0>, то 0 — примитивный элемент поля с минимальным многочленом h (X) степени п. F7—поле разложения над Fr многочлена h(X).
(v)	Для любого натурального числа т существует хотя бы один неприводимый многочлен степени т над Fa.
430
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
(ГЛ. 9
Доказательство, (i) Мы докажем более общее утверждение. Пусть F— произвольное поле и Л —конечная подгруппа мультипликативной группы F*. К конечной абелевой группе А применимы результаты § 5 гл. 7. В частности, нам известно, что цикличность А равносильна совпадению порядка | А | с показателем пг группы А — наименьшим натуральным числом, для которого ат=1, VagA. При т < | А | многочлен Хт—1 имел бы в F более т корней, а это невозможно. Значит, группа А—циклическая.
(ii)	Будем смотреть на как на конечное расширение степени п своего простого подполя F^ = 2?. Так как F^—поле разложения многочлена X? —X, все корни которого различны, то согласно следствию 2 теоремы 3, |Aut(Fjl| = п. Из соотношений (х + у)Р = хР + ур, \хуУ = хРур, 1^=1, отмеченных в ходе доказательства теоремы 4, видно, что отображение Ф: t »—» tP является автоморфизмом поля F^ (конечность F# существенна). Если Ф*: 11—> tpS—единичный автоморфизм, то tps —1 = 0 для всех /€Fa, откуда следует неравенство s^n. Но при s = n мы действительно получаем единичный автоморфизм, так что | <Ф> | = п и <Ф> = Aut (F^).
(iii)	Согласно первому замечанию о конечных полях (см. начало пункта), pn — (pd)rt где г—степень расширения Fp/:Z).Fpd. Поэтому n = dr. Обратно, для любого d\n введем подмножество F = С F п | tpd= t}. Так как п = = dr => рп—\ = (pd)r—l=(pd—l)s, то
X"”-' — 1 = x^d- “s— 1 = (A?4-1 — 1) g (X), X₽n-X = (X₽'<—X)g(X).
Так как Fp« — поле разложения многочлена Хрп—X, то ровно pd элементов из FpZJ будут корнями многочлена Xpd—X. Из них как раз и состоит подмножество F, которое можно теперь отождествить с Fprf. Этим рассуждением, дуальным теореме 4, устанавливается также единственность подполя с pd элементами.
Заметим, что по построению
§ 1]
КОНЕЧНЫЕ РАСШИРЕНИЯ ПОЛЕЙ
431
— множество всех элементов, остающихся на месте при действии <<Dd>. Так как группа Aut (Fp»/F^) = <Ф> циклическая, то непосредственно видно, что любой автоморфизм Ф\ не принадлежащий <ФЙ>, действует на Fp* не единичным образом (достаточно применить Фг к образующей группы Fprf). Это и означает, что группа относительных автоморфизмов Aut (Fp«/Fprf) совпадает с <Ф*>. Заключительная фраза в утверждении (iii) имеет тот же смысл, что и в примере п.1.
(iv)	Совершенно очевидно, что Р^ = Р^(9), q — pn. Пусть /i(X) = Xn4-a1X"~x+...—минимальный многочлен примитивного элемента 9. Так как элементы простого подполя Fjp неподвижны при всех автоморфизмах, з а, € Fjp, то, стало быть, корнями h(X) являются 9, 0^, 0^2,	Все они содержатся в нашем поле и
Fp(9, ..., 0^“1) = F/?(0) = Fp« — поле разложения над Fp многочлена h (X).
(v)	Опираясь на теорему 4, построим расширение /<Z)F^ степени т. Согласно (i), К*—циклическая группа. Если К* = <0> и /г(Х)— минимальный многочлен примитивного элемента 0, то К = Р^(9) и deg/z(X) = = [Fa (9) :FJ = |Х:FJ = и?. Минимальный многочлен по определению неприводим (над РД поэтому мы имеем то, что нужно. |
После несложных теоретико-числовых приготовлений мы получим точную формулу для числа неприводимых многочленов степени т над F^-
4. Формула обращения Мёбиуса и ее применения. Теоретико-числовая функция р, определенная правилами
f 1, если и = 1,
р(п) = ^ (—1)\ если/г = Р1... pk. — различные простые, О, если и делится на квадрат > 1,
называется функцией Мёбиуса. Ясно, что р—мультипликативная функция в том смысле, что р не равна тождественно нулю и р (пт) = р (п) р (т) для любых взаимно простых пит. Ясно также, что если п = р™'.. .pfr, то 2 p(d)= 2 Н(^), где nQ = pi.. >pr—свободный от квад-dl л	d I н0
ратов максимальный делитель п. В свою очередь число
432
К ТЕОРИИ ПОЛЕЙ,КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
делителей d = pit.. ,pis числа nQ с фиксированным s равно ($ ) • Таким образом, при п > 1 имеем
г
= Е (;) (—ir=(i—1>"=о
d | п	d | n0	s=0 4	7
(суммирование в левой части ведется по всем делителям 1 целого числа п). Окончательно получаем формулу
( 1, если
2 Н (d) = < п
d\n I 0, если
п = 1, п > 1.
Полезна также ее модификация
если
если
d = m;
d\m, d
(1)
(2)
< т
(суммирование ведется по и, делящим т и делящимся на d). Положив m = dt, n=-dl и заставив I пробегать делители числа /, мы легко перейдем от (2) к (1) и обратно.
Формулу (1) (или (2)) можно было бы взять за определение функции Мёбиуса по индукции. Ее ценность для нас заключена в следующем утверждении. Пусть fug — две произвольные функции из N в М (М = Z, R, Р [X] и т. д.), связанные соотношением
(d).
d | п
(3)
Тогда
=	(у) f(d)-
d[n
(4)
В самом деле, с учетом (2) непосредственное суммирование по и, делящим т, обеих частей (3), умноженных ( т\
на ц ( — j , дает
п\т	n\tn	d\n
d | m	d \ n\ tn
§ 1]	КОНЕЧНЫЕ РАСШИРЕНИЯ ПОЛЕЙ	433
Простая замена обозначений приводит к формуле (4), называемой формулой обращения Мёбиуса. Аналогичным > образом совершается переход от (4) к (3). |
Имеется еще мультипликативный аналог формулы обращения Мёбиуса. Если
f («) = Пя(^), d\n
то
g(n) = IIf(d)k J.	(5)
d | n
Для доказательства нужно провести те же формальные выкладки:
Ш (")"	= ПII g W = П П. в (А -
п\т	п \ tn d\n	d\rn d \n\tn
_Пг№'1"1"	= gW,
d l tn
а затем слегка изменить обозначения.
Приведем три примера на применение формулы обращения Мёбиуса.
Пример 1 (функция Эйлера ф). По определению Ф (и) — число взаимно простых с п чисел ряда 0, 1, ..., п—1, или, что равносильно, ф (n) = | U (ZJ | — порядок группы обратимых элементов кольца Z„ —Z/nZ. Из упражнения 5 § 1 гл. 8 нам известно соотношение
п=2<р(^)-	(6)
d\n
Непосредственно по формуле (4) получаем
d | п	d\n	d\n
Если П = р™' ... ТО
d | п	i	i<j
15 А. И. Кострикин
434
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Таким образом,
— формула, которую мы приводили еще в упражнении 3 § 8 гл. 1 и из которой непосредственно вытекает мультипликативность функции ф.
Пример 2 (круговые многочлены). Поле разложения Г„ над Q многочлена X"—1 называется круговым или циклотомическим. Так как все корни степени п из 1 образуют циклическую группу порядку /г, то круговое поле имеет вид I\ = Q(£), где £ — один из примитивных корней (£$С)- Мы хотели бы найти степень и минимальный многочлен элемента £ над Q.
Обозначим символом Рп множество мощности | Рп | = — Ф (п) примитивных корней степени п из 1, Подгруппы циклической группы порядка п находятся в биективном соответствии с делителями d числа п (теорема 6 § 3 гл. 4), а каждый корень попадает в некоторое множество Pd. Поэтому имеет место разбиение на непересекающиеся классы:
0ДЛ2.......(7)
d | п
(перейдя к мощностям множеств, . мы снова пришли бы к соотношению (6)). Круговым многочленом, отвечающим Г называется многочлен
ФЛ(Х)= II (Х-8)
степени ф(и). В соответствии с разбиением (7) мы приходим к разложению
п- 1
Xй —1 = П(Х —£') = П J П (Х-е)1 = ПФДХ). (8)
i=0	d\n	) d\n
Применяя к (8) мультипликативную формулу обращения Мёбиуса (5), получаем явное выражение для Фл
ц. (
ф„(Х) = П(Х“-1)	(9)
d\n
§ 1J	КОНЕЧНЫЕ РАСШИРЕНИЯ ПОЛЕЙ	435
При небольших значениях п имеем
Ф1(Х) = Х—1, Ф2(Х) = Х+1, Ф8(Х)=Х’ + Х+1, Ф4(Х) = Х2+1,	Ф„(Х) = Х2—Х+1,	Ф8(Х) = Х* + 1,
Ф9 (X) = Xе + X3 + 1, Ф10(Х) = Х4 — Х3 + Х2 — х + 1, Ф12(Х) = Х4-Х2+1.
Заметим, что
On(X)€Z[X] иФя(0)=1.	(10)
Чтобы прийти к (10), можно, минуя (9), действовать по индукции. Для небольших п это проверено, а далее рассуждаем следующим образом. Считая
£(Х)= п ФДХ) d\ п, d ф п
унитарным многочленом с целочисленными коэффициентами и применяя алгоритм деления с остатком (теорема 5 § 2 гл. 5), мы получаем однозначно определенные многочлены <7, r^Z[X] такие, что Хп—I = q (X) g (X) + r (X), deg г (X) < degg-(X). Но X"-1 =Ф„ (X) g(X) в Q[X], и мы видим, что Фп (X) = 7 (X) С Z [X], причем унитарность g(X) влечет унитарность Ф„(Х).
Справедлива теорема о том, что Ф„ (X) — неприводимый над Q многочлен и, стало быть, Г„ = О(£)—расширение степени ф (/г) с минимальным многочленом Фп (X) для Мы этого доказывать не будем, а только напомним, что в конце § 3 гл. 5 была установлена неприводимость ф^(Х) = (Х/>-1)/(Х-1) = Х^-1 + Х/>-2+ ... + 1, гдер-произвольное простое число.
Стоит отметить, что круговые поля, сыгравшие большую роль в истории развития теории алгебраических чисел, до сих пор привлекают внимание исследователей.
Пример 3 {неприводимые многочлены над FJ. Пусть Т4(^)—общее число неприводимых унитарных многочленов степени d над q = pn, и пусть f (X) — один из этих многочленов. Его поле разложения над F^ изоморфно как факторкольцу F7 [X]//(X) F^ [X], так и полю разложения многочлена Xq —X (следствие теоремы 4). Существование общего корня 0 у многочленов Xqd— X и f (X) влечет, в силу неприводимости /(X), делимость Х^—Хна/(Х). Так как Xqd—X—делитель многочлена Xqm—X при
15*
436
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
любом tn = rd и таккак	— X не имеет кратных корней,
то мы приходим к выводу, что в разложение Х^т — X над входят все унитарные неприводимые многочлены fdt 1 W, fd, 2 М, • • • » fd, М
любой степени d\m, причем ровно по одному разу:
Х^-Х = П П fa,Л*) 	(Н)
d | tn ( k = 1	J
Вычисление степеней многочленов, стоящих в обеих частях равенства (11), приводит нас к соотношению
d | tn
из которого прямым применением формулы обращения Мёбиуса (4) получается выражение для (7):
(12) d | tn
Пусть, например, q = 2. Тогда
(2) = 1 (22 - 2) = 1,	(2) = 1 (2’ - 2) = 2,
(2) = 1 (2* -22) = 3, Ч'5 (2) - | (2*-2) = 6, Т в (2) = 1 (2° — 23 — 22 + 2) = 9
(сравнить с упражнением 10 § 1 гл. 6). Формула (12) показывает, что с вероятностью, близкой к 1/т, случайно выбранный унитарный многочлен степени т над Fg окажется неприводимым. Однако нет удовлетворительных критериев неприводимости конкретно взятого многочлена. Что можно сказать, например, о неприводимости трехчлена X,n-\-Xk + 1 над F2? Вопросы такого рода постоянно возникают в алгебраической теории кодирования (задача 3 § 2 гл. 1) и при построении псевдослучайных последовательностей.
§ 1	КОНЕЧНЫЕ РАСШИРЕНИЯ ПОЛЕЙ	437
УПРАЖНЕНИЯ
1.	Показать, что расширение FzdP простой степени не имеет собственных (# Р, F) подполей.
2.	Найти примитивный элемент расширения Q(]/~p, j/* <?),гдер и q — простые числа.
3.	Найти размерность над 0 поля разложения многочленах/’ — 2.
4.	Показать, что над полем Р характеристики р > 0 для многочлена ХР— а имеются лишь две возможности: быть неприводимым или же быть р-й степенью линейного многочлена. (У к а з а н и е. Рассмотреть поле разложения F многочлена ХР — а. Пусть 0£F— один из корней, так что a = QP и ХР — а — (Х — 0)Р. Если теперь ХР — а = и (X) v (X), где и (X) — унитарный многочлен над Р положительной степени т < р, то в силу факториальности F [X] должно выполняться равенство и(Х) = (Х — 0)™. В частности, 0т, №£Р => => 6€Р)
5.	Пусть Zp(Y)— поле рациональных дробей характеристики р. Показать, что ХР — Y — неприводимый над Zp (Y) многочлен, все корни которого совпадают. (Указание. Согласно предыдущему упражне-
/ g(YY\P нию достаточно убедиться, что равенство Хр — Y = 1 X—*j 1 с р, h£ZplY] невозможно.)
6.	Доказать, что при любом d\ nt d < п, имеет место соотношение Хп— 1 = (Xd — 1) Ф„ (X) hd (X), где hd£%\X]. (Указание. Согласно (8), Xd— 1 =	(X). Поэтому
е | (1
X«-l=(Xd-l) П Ф,(Х) = (Х‘*-1)Ф„(Х) П фИ*)-s | /г; s^d	s|n; d\ s^n
Остается сослаться на (10).)
7.	Пусть q — целое положительное число > 1. Согласно (10) Показать, что Фп (q) | (q — 1) => n = 1. (Указание. Так как Ф„ (Х) = JJ (X — е), где 8 пробегает примитивные корни, то при п > 1 все е # 1, и поэтому расстояние на комплексной плоскости от точки q до любого е больше расстояния от q до 1. Стало быть, | Ф„ (q) | = JJ (q— 8) > q— 1 и q — 1 никак не может делиться на Ф„ (<?)•)
8.	Проверить, что круговой многочлен Ф16(Х) = Х8 — Х7 + Хб — —-Х4Ц-Х3—X1, рассматриваемый над полем F2> является произведением двух неприводимых многочленов Х44~Х3+1 и Х4Ц-Х+1. Используя это обстоятельство, доказать неприводимость Ф1б (X) над Q (сравнить с упражнением 11 § 1 гл. 6)
438
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
9.	Исходя из цепочки естественных включений
GF (p)cGF (р21) a GF (р31) с ....
ввести так называемое предельное поле Oj, = GF (р001), полагая а£ a£GF(prtl) при достаточно большом и}. Опираясь на основные свойства конечных полей, доказать, что —алгебраически замкнутое поле. Таким образом получаются, с учетом поля комплексных чисел С, примеры алгебраически замкнутых полей любой характеристики.
10.	Пусть q = pn. Показать, что при р = 2 все элементы поля являются квадратами, а при р > 2 квадраты группы fJ образуют в ней подгруппу fJ индекса 2, причем F<? = Ker (t н—> i^q~
11	(М. Aschbacher). Пусть F?—конечное поле с нечетным числом q = pn элементов. Если q ФЗ или 5, то «на окружности» х2-\-у2~ 1 найдется точка с координатами х, y£fq- Доказать это утверждение при р > 5. (Указание: Перейти к уравнению x2-±-y2 — z2 = 0 с х, yt zgFjp. По теореме Шевалле (см. упражнение 4 § 1 гл. 6) общее число N решений этого уравнения делится на р. Пусть решений с хуг 0 не существует. Подсчитать тогда N, рассматривая отдельно два случая. Если не существует а£ Fjp с а2-\- 1 =0, то решениями будут лишь (0, 0, 0,), (0, п, ±п), (л, 0, ±n), п= 1, 2, ..., р— 1, и поэтому /V = 4p — 3==0(modp) => р = 3. Если л2+1=0 для некоторого a£Fjp, то А/= 6р —5 = 0 (mod р) => р = 5.)
12.	Всякий ли примитивный элемент поля F^ является образующей мультипликативной группы fJ? (Ответ: вообще говоря, нет.)
§ 2. Отдельные результаты о кольцах
Этот параграф можно рассматривать как небольшое, но полезное дополнение к главам 4 и 5.
1.	Новые примеры факториальных колец. В § 3 гл. 5 была доказана факториальность евклидовых колец, к известным примерам которых относятся кольца Z и Р[Х]. Ниже приводится еще один пример евклидова кольца, а также пример факториального кольца, не являющегося евклидовым.
Пример 1 (кольцо целых гауссовых чисел). Имеется в виду числовое кольцо
Z[i] =	n£Z},
§ 2]
ОТДЕЛЬНЫЕ РЕЗУЛЬТАТЫ О КОЛЬЦАХ
439
содержащееся в квадратичном поле Q (Ос С, i2+ 1 = 0, и геометрически отождествляемое с множеством узлов (точек) целочисленной решетки в комплексной плоскости С. Понятно, что Z[i] — целостное кольцо. Мы определим на Z [i]* = Z[i]\{0} отображение б: Z [/]*—> N U {0}, полагая 6(m + m) = |/n + in|2 = /na + n2 (другими словами, б(а) = = N (а) — норма числа а в Q(i); см. п. 5 § 1 гл. 5). Как известно, б (ab) = 6 (а) 6 (Ь)6 (а) для всех а, b$Z[i]\ так что свойство (Е1) из определения евклидова кольца (см. п. 3 § 3 гл. 5) автоматически выполнено. Чтобы убедиться в справедливости (Е2), запишем дробь ab"1 сЬ^Ов виде ab~1 = а + ф с а, р £ Q и возьмем ближайшие к а, р целые числа fe, I такие, что cc = /? + v, p = Z-Ppt,
Тогда
а = b [(Л + v) + i (I + р)] = bq + г,
где q = k-\-ibgZ[i], а г = &(v-|-гр.). Так как г = а—bq, то и rCZfiJ, причем
6 (г) = | г |* = | b р (v* + р*) < 6 (b) (1 +16 (Ь) < 6 (Ь).
Стало быть, Z[i]—евклидово кольцо. |
Кольцо целых гауссовых чисел Z [Z] удобно для демонстрации в миниатюре методов теории алгебраических чисел. Поэтому мы остановимся на свойствах Z[i] чуть подробнее. Сначала сделаем несколько общих замечаний.
1)	Целостное кольцо К, все идеалы которого главные, т. е. имеют вид х/<, называется кольцом главных идеалов. Все евклидовы кольца являются кольцами главных идеалов. Для Z и Р[Х] это было установлено ранее (см. следствие теоремы 5 § 2 гл. 5), а в общем случае доказательство совершенно аналогично: если J — идеал евклидова кольца К, то J = аК, как только а С J и б (а) <1 б (х) для всех 0=£x£J. |
2)	Пусть К—произвольное евклидово кольцо с функцией б (см. п. 3 § 3 гл. 5) и U (К)—группа его обратимых элементов. Тогда
u£U(K) б(и) = б(1) фф б(их) = б(х), Vxg/C. (1)
Действительно, согласно (Е1), б (х) = б (1 -х)^ б (1) для всех х^К*, а если ug(7(/<), то б(1) = б(и-и"х)^б(и),
440
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
так что 6 (и) = 6 (1). Обратно, в соответствии с замечанием 1) б (их) =-- б (%), Ух С К* => их% = х% => х = uxv —> uv= - I => u$U(K). I
В применении к кольцу Z[i] критерий (1) означает, что т + in g U (Z [г]) m2 + ^2 1 • Стало быть, U (Z [/]) = = </> — циклическая группа порядка 4.
3)	Идеал J кольца Д называется максимальным, если J и всякий идеал Т, содержащий J, совпадает с К или J. В евклидовом кольце К свойство элемента р£К быть простым эквивалентно условию максимальности идеала рК-
В самом деле, пусть р — простой элемент и рДс: Т сД, где Т идеал в Д. Согласно 1) Т = аК, и так как р£Т, то p = ab, где один из элементов а, b обратим. Если а£(/(Д), то Т = аК = К- Если Ь£(/(Д), то Т = аК = = аЬК = р%. Обратно, пусть идеал р!( максимален и p=ab са(1/ (Д'). Тогда аД=^=Д и рДс= а/( => рК^аК => а = = pu^abu —> Ъи = \ => b б U (Д) => р —простой элемент. В
Посмотрим теперь, что происходит с простым числом pgZ в кольце Z[iJ. Не исключено, что р остается простым элементом и в Z[i], но если это не так, то пусть г
Р = Пра— его единственное (по теореме 4 § 3 гл. 5) раз-/г=1
ложение на простые множители pk в количестве r> 1. Согласно 2), б (pk) > 1, так что из р2 = б (р) = XI б (pk) и из факториальности Z следуют с необходимостью равенства г = 2, р = р1р21 б (pj б (р2) р. Если pr^ m + in, то р = б (pj = т2 + п2 ^--(т + in) (т— in) => р2 — т — in. Итак, если простое число p£Z допускает нетривиальное разложение в Z[i], то
р = (т-\- in) (т — in) = т2 + п2,	(2)
где m-\-in, т — in — простые элементы в Z[i]. |
В частности, 2 = (1 -|-£)(1 — i) не является простым элементом в Z [ZJ. Заметим, далее, что t2 = 0 или 1 (mod 4) для любого t gZ. Поэтому для нечетного простого числа р, не являющегося простым в Z[i], критерий (2) приводит к выводу:
р = Пг2 + п2 = 0, 1 или 2 (mod 4) => p = 4fe+l.
§ 2]	ОТДЕЛЬНЫЕ РЕЗУЛЬТАТЫ О КОЛЬЦАХ	441
В случае р = 4k +1 положим t = (2k)l. Так как, оче* видно, / = (—I)2* (2/е)! = (—1) (—2) . . . (—2fe)^(p—1)х Х(р — 2). . .(р— 2ft) = ((p+D/2).. .(р—2) (р —l)(modp), ТО
(2ft)! ((р +1 )/2)... (р - 2) (р -1) = (Р -1)! (mod р),
или, с учетом теоремы Вильсона (см. конец § 1 гл. 6), /2+ 1 =0(modp). Если теперь р — простой элемент в Z [г], то из равенства (t-\-i)(t— i) = t2 + 1 = Ip, l^Z, по теореме 1 § 3 гл. 5 следует делимость на р одного из элементов t + i, t — i. Ho t ± i = p (m + in) —> ± 1 -= pn, n g Z, что явно невозможно. Мы доказали следующее утверждение.
Простое число p^Z остается простым в Z[i] тогда и только тогда, когда p^=4k—1.
Всякое простое число р = 4k + 1 представимо в виде р = т2-\-п2, где т, ngZ. |
Отсюда сравнительно несложно извлекается общая теоретико-числовая теорема.
Теорема 1. Число t С Z представимо в виде суммы квадратов двух чисел т, n£Z тогда и только тогда, когда в каноническое разложение i на простые множители каждый простой делитель p = 4k—1 входит с четным показателем.
Действительно, в дополнение к известным нам фактам достаточно показать, что если НОД (т, п) = 1 и р | (т2-{-п2), то p'=4k-\-l. Это довольно ясно: НОД(т, п) = 1, т2 4-п2 инее 0 (mod р) => тп^О (mod р) => тр~1=1 (mod р), п2= — т2 (mod р) => (т?~2п)2 = т2р~^п2 = — т2?~2 =—1 (modp). Таким образом, существует целое число sgZ такое, что s2 =—1 (mod р), s4 = l(modp). Стало быть, мультипликативная группа Z*p порядка р—1 делится на 4 и р = 4k + 1. |
Согласно замечанию 3) простота p = 4k—1 в Z[i] эквивалентна максимальности идеала pZ[i], что в свою очередь выражается свойством факторкольца Z[i]/pZ[i] быть полем из р2 элементов (см. в этой связи упражнение 14 § 4 гл. 4 и теоремы об изоморфизме для колец в п. 2). Это и не удивительно, если учесть, что при p = 4k—1 многочлен Х2+1, рассматриваемый над Zp9 неприводим.
442
К ТЕОРИИ ПОЛЕЙ,КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Пример 2 (полиномиальные расширения факториальных колец). Сейчас будет показано, что кольца многочленов Z [Хх, ..., Хп] и Р [Хх, ..., Хл] (Р — поле) факториальны при любом п. Это важное утверждение непосредственно вытекает из следующей теоремы.
Теорема 2. Если факториально кольцо Д, то факториально и кольцо многочленов Д[Х].
Доказательство. В основе доказательства лежат свойства колец многочленов, примыкающие к лемме Гаусса (см. § 3 гл. 5). Именно, нам понадобятся следующие два свойства.
а)	Примитивные многочлены f, gg Д[Х], ассоциированные в Q (Д) [X] (Q(K) — поле отношений факториального кольца Д), ассоциированы в Д[Х] (легкое упражнение).
б)	Многочлен f [X] положительной степени, неприводимый над Д, неприводим также над Q (X) (доказательство в § 3 гл. 5 для X = Z годится и в общем случае).
Приступая непосредственно к доказательству теоремы, запишем многочлен / С Д [X] положительной степени в виде / = d(/)/0, где d (f)— содержание/, а /0 — примитивный многочлен. Индукцией по степени примитивных многочленов мы получим разложение /0 в произведение f0 = = /х.. .fs неприводимых над К примитивных многочленов /х, .. ., fs. Пусть /0 = g,1.. ,gt— еще одно такое же разложение. Тогда, согласно б), /z и g,- неприводимы над <2(Д), а поскольку кольцо С(Д)[Х] факториально (следствие теоремы 4 § 3 гл. 5), s = t и при надлежащем упорядочении многочлен ft ассоциирован с g{ в Q (Д) [X], а следовательно (по а)), и в Д[Х]. Что касается многочлена / с необратимым в Д содержанием d(/), то, взяв еще разложение d(f) = рг.. .рг на простые множители pi^K, мы придем к разложению /. Единственность такого разложения (в обычном понимании) следует из только что установленной единственности разложения /0 и из фак-ториальности Д, отвечающей за единственность разложения
Имеют место строгие включения: евклидовы} j кольца 1 (факториальные кольца f [главных идеаловf ( кольца
Первое включение нам известно (см. замечание (1)). Существуют примеры (мы их не приводим), показывающие,
}• (3)
§2]
ОТДЕЛЬНЫЕ РЕЗУЛЬТАТЫ О КОЛЬЦАХ
443
что оно строгое. Для доказательства второго включения рассмотрим в кольце главных идеалов К возрастающую последовательность идеалов (d1)c(d2)c:... Непосредственно проверяется, что D= U(dzj — идеал в К- Следовательно, £> = (d), d$D. По определению d € (dm) для некоторого т, откуда (dm) = (dm+i) = ... Стабилизация на конечном шаге возрастающей цепочки идеалов влечет обрыв цепочки необратимых делителей d2, d3, ... с di\di_i и, стало быть, существование разложения в/< на неразложимые элементы. Единственность разложения в К является следствием тех же причин: (а, Ь) = аК + ЬК = =dK = (d) => d= НОД (a, b) = ax + by. Дальнейшие рассуждения повторяют доказательство теоремы 3 (ii) §3 гл. 5.
Идеалы (2, X) в Z[X] и (X, Y) в R[X, И] не являются главными (см. пример в п. 3 § 2 гл. 5). В то же время по теореме 2 кольца Z[X] и R [X, К] факториальны. Тем самым истинность цепочки (3) установлена. |
Кольца главных идеалов интересны с чисто алгебраической точки зрения, поскольку они характеризуются свойствами таких естественных объектов, как ядра гомоморфизмов. С другой стороны, евклидовы кольца более удобны для исследования ввиду наличия в них алгоритма деления с остатком.
2. Теоретико-кольцевые конструкции. Мы уже располагаем довольно значительным арсеналом типов колец и средств, позволяющих строить новые кольца из данного их набора. Примерами служат конструкции кольца матриц M„(/<), поля отношений Q(/C) и кольца многочленов К [Хр ..., Х„], где К—коммутативное кольцо (целостное в случае Полезно обсудить еще, хотя бы вкратце, теоретико-кольцевые аналоги тех общих фактов о гомоморфизмах, которые были установлены для групп в гл. 7. Доказательства, как правило, ничем не отличаются от случая групп, и оставляются читателю в качестве упражнений.
Основную теорему о гомоморфизмах для колец (теорема 2 § 4 гл. 4) мы дополним двумя теоремами об изоморфизме.
Теорема 3. Пусть К — кольцо, L—подкольцо, J — идеал в К- Тогда L + J = {х + у\х £L, y$J} — подкольцо
444
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
в К, содержащее J в качестве идеала, — идеал в L. Отображение
<р: х J ।—> х L П J , х £ L, осуществляет изоморфизм колец:
(L + J)/J ^L/LftJ.
Доказательство. Первые два утверждения совершенно очевидны. Что касается последнего, то нужно рассмотреть ограничение л0 = л | L естественного эпиморфизма л: К—Его образ 1тл0 состоит из смежных классов %4-J, x£L, т. е. Imл0 = (Л +J)/J. Ядро Кегл0 эпиморфизма л0: L—состоит из элементов x£L, для которых % + J = J. Значит, Кег л0 = L f] J. По основной теореме о гомоморфизмах соответствие л0:	А »
I—» л0 (%) = х + J устанавливает изоморфизм L/L П J =
(Z> + J)/J• Остается заметить, что ср = n0“x. |
Мы провели это рассуждение, скопированное с доказательства теоремы 2 § 3 гл. 7, для того, чтобы подчеркнуть полный параллелизм с теорией групп.
Теорема 4. Пусть К — кольцо, J, L—его подкольца, причем J — идеал в К и JcL Тогда L = L/J—подкольцо в К/J и л*: L—>£ является биективным отображением множества й (7(, J) подколец в К, содержащих J, на множество й(/<) всех подколец кольца К. Если	J),
то L — идеал в К тогда и только тогда, когда L—идеал в К, причем
Доказательство — легкое упражнение (см. доказательство теоремы 3 § 3 гл. 7). |
Следствие. Пусть К—коммутативное кольцо с единицей 1. Идеал J максимален в К тогда и только тогда, когда факторкольцо K/J— поле. R
На множестве идеалов кольца К определены следующие операции:
сумма-. J1 + J2 = \xl-lrX2\xheJk}, пересечение: J1f\J2={x\x£Jl, x^.J2\, произведение: JXJ2 =	I xiu € П J2-
ОТДЕЛЬНЫЕ РЕЗУЛЬТАТЫ О КОЛЬЦАХ
445
§ 2]
Можно также говорить о сумме, пересечении, произведении любого конечного числа идеалов, причем справедливо следующее утверждение.
Предложение. Если в кольце К с единицей имеют место равенства
J -|-= k — 1, ..., и,
для идеалов J, Jlt ..., Jn, то справедливы также равенства
J + Л А Л А ••• п = J	J п-
Доказательство. Так как JrJ2..-Jn^ J± П J2 А ... ...П«/П,то достаточно установить равенство J + J2...J =К- При п = 1 оно верно по условию. При п = 2 имеем
1 = p = (x1+^1) (х2 + у2) = х + у1г/2,
где хх, х2, х g J, yt С Jz. Значит, 1 £ J + JJ2 и K=J+J1J2-Далее — очевидная индукция по числу п. |
Пусть 7<\, ..., Кп— конечное семейство колец, Д’== =Д1Х . .. хД„—декартово произведение множеств. Введем на /< структуру кольца, определив операции сложения и умножения покомпонентно:
(*i........+	•••. Уп) =Шг+У» ...,х„ + у„);
(%1, ...,%„)•(//!.у„) = (х^, .... х„у„).
Мы приходим к внешней прямой сумме К = Д\ Ф .. . Ф Кп колец Ki- Каждая из компонент является образом при эпиморфизме nz: К—>К;, jxz: (хх, ..., xn)t—>xh \^i^n. Если, далее, Jz = {(0, . ..,xz, ..., 0) | xz € то J^Kh Ji — идеал в К и К = Л + • •. + Jп-
Пусть теперь К — кольцо с идеалами J19 ..., Jn, причем К = J± + ... + Jп и Jk П ( 2 J Л =0, 1
\ 7	/
Тогда К = Jr Ф •.. Ф Jп—внутренняя прямая сумма своих идеалов Jk. Как и в теории групп, различие между внутренними и внешними прямыми суммами колец—чисто теоретико-множественное и нет смысла отражать его в обозначениях.
3. Теоретико-числовые применения. Универсальное свойство прямых сумм заключается в том, что если S = =/Сх Ф ... Ф Кп и К — произвольное кольцо с заданными гомоморфизмами cpz: К—+К{, то существует единствен-
446
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
ный гомоморфизм ф = (фх, ..., ф„): К —с ядром Кег ф = = ПКегфг, делающий треугольные диаграммы
3
к----й—
я/ с
при 1=1, ...,п коммутативными. Применим это очевидное утверждение к кольцу с 1, с идеалами </п ...
и к прямой сумме
5 = Л//1Ф...ФЛГ//„.
Положив Фр К—У KJJ . =	мы получим гомоморфизм
ф: хн»(х + 4 ..., % + </„)	(4)
кольца К в S с ядром Кег ф = Jt А .. . П Jn-
Теорема 5 (китайская теорема об остатках). Если в указанных выше условиях К — кольцо с единицей и Jz + для	то отображение ф (см. (4))
является эпиморфизмом.
Доказательство. Нам нужно убедиться, что при любых заданных элементах хп ..., хп£ К найдется х£К, для которого xz + Ji = x + Jh т. е. х—x^Jt, Z=l,2, ... ...,п. При п=\ это очевидно, а при п = 2 возьмем элементы at g Jx, а2 € Для которых аг\-а2 = 1, и положим х^х^ + х^сц. Тогда
X X, = (-^1^2 -^2^1)	(^1 ^2) “ (%2 *^1)^1 J 1 >
X Х2 (^1^2 “Ь ^2^1)	(^1 Ч~ ^2) (^1 ^2) ^2 ^2'
Далее рассуждаем индукцией по п. Пусть мы уже нашли элемент у, для которого у—xt^Jh /=1,2, ...,п—1. Так как по условию </z + J„ = K,	—1, то, со-
гласно предложению из п. 2, JT А •.. A Jn-i + Jn = К-Применяя разобранный нами случай п = 2 к идеалам Л А ... А Jп, и к элементам у, хп g К, найдем х € с х—y^J± А ... АЛ-х, х—xn£Jn. Но х—у€ЛЛ... ... A Jn-i => х—у Ji, 1 i^п— 1. С учетом выбора у получаем
х—xz = (х—у) + (У—е А,
1.
ОТДЕЛЬНЫЕ РЕЗУЛЬТАТЫ О КОЛЬЦАХ
447
§ 21
Стало быть, элемент х удовлетворяет всем поставленным требованиям. |
В теореме 5 и в предшествующих ей рассуждениях кольцо /< не предполагалось коммутативным. Пусть, далее, К — целостное кольцо и а19 ..., ап — его п попарно взаимно простых элементов, т. е. aJk + ajK^K при i=/=/ (в факториальном кольце /С это определение согласуется с определением взаимной простоты, получающемся из разложения az на простые множители). Записывая включение х—х^а^К в виде сравнения по модулю главного идеала а^, мы, как обычно, пользуемся обозначением x = xz(modaz).
Следствие 1. Пусть К — целостное кольцо и аг, ... ...,aw—его попарно взаимно простые элементы. Тогда для любых xt, ..К найдется элемент х£К такой, что х = xi (mod az), i = 1, ..., n. |
Следствие 2. Пусть n—натуральное число с каноническим разложением п = р™1.. .p™r; Zn=Z/nZ—кольцо классов вычетов по модулю п и U (Zn)—мультипликативная группа его обратимых элементов. Тогда:
(i) Zn Zprni ф ... Ф Z тг (прямая сумма колец)-,
(ii) U(Zn)~U(Zptni) X .. .XU (Zpmr) (прямое произведение групп).
Доказательство, (i) Заменив в (4) п на г, положив K = Z, Ji — p'^Z и S = Zpmt ф ... ф 1тг, мы придем к гомоморфизму <р: Z—с ядром Кег<р= [yJ — nZ. Эпиморфность <р вытекает из теоремы 5, поскольку НОД(р„ Pj)= 1 при
(ii) Так как в произвольной прямой сумме © ••• ...ф Кг компоненты /С,- аннулируют друг друга: /<;Ду=0, i ф j, то непосредственно из определения обратимых элементов следует, что U (К) = 0 (Ki) X .. .XU (Д).). Остается применить это к разложению (I). |
Замечание. Из утверждения (ii) непосредственно видно, что <р(п) = П<р{рт‘), атак как <р(рт)=р'я~1 (р — 1), 1 = 1
то вновь получается формула для значений функции Эйлера (см. пример 1 п. 4 § 1). Порядок элемента конечной группы является делителем порядка группы,
448
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
поэтому
(п)	== j (mod и)
для любого целого числа а, взаимно простого с п (обобщение малой теоремы Ферма, известное под названием теоремы Эйлера).
Чтобы окончательно понять строение группы U (Zn), нам в силу следствия 2 достаточно разобрать случай п = рт.
Теорема 6. Пусть т — целое положительное число.
(i)	Если р — нечетное простое число, то U (Zpm)— циклическая группа.
(ii)	Группы U (Я2) и U (Z4) — циклические порядков 1 и 2 соответственно, в то время как U (Z2w), т^З,— прямое произведение циклической группы порядка 2гп~2 и циклической группы порядка 2.
Доказательство, (i) По определению взаимно простое с п целое число t имеет порядок г по модулю п, если | </ 4-nZ> | = г, т. е. tr = 1 (mod и), но tk 1 (mod п) для k < г. При г = ф(/г) говорят о примитивном (или первообразном) корне t по модулю п. Обычно t берут из приведенной системы вычетов 0, 1, ...,п—1 по модулю п, но мы никакой системы вычетов не фиксируем.
Согласно теореме 5 § 1, группа Z*P = U(ZP) циклическая, т. е. существует примитивный корень а0 по модулю р.
Dm — 1	огп~*
Так как =<70(mod/?), то и целое число a = aQ будет примитивным корнем по модулю р. С другой стороны, ap~1 = apQm (р“1} = а^рт^ = 1 (mod рт). Значит, смежный класс a = a-\-pmZ порождает в U (ZpTn) циклическую подгруппу порядка р—1.
Далее,
Р / \ / \ (1+^=2\л)р'=i+p2+|(p- 1)рз +L(f )р!. i = o 4 '	i>3 ' '
Так как р > 2, то (1 + р)/" = 1+р2 (mod р3). Предположив по индукции, что (1 +р)р7= 1 + p'+1 (modp'+2), мы
§ 2]
ОТДЕЛЬНЫЕ РЕЗУЛЬТАТЫ О КОЛЬЦАХ
449
находим
(l+p)₽y+1 = [H-(l+sp)p/+^ = £(f)(l + sp)'p</+1>/ =
Z = 0 4 7
= l + (H-sp)p>+2 + 4(p-l)(l + sp)2p2^+1)+1+... откуда (1 +р)₽У+1= 1 +pJ+i (mod ру+3). В частности, (1 + р)^"1 = 1 (mod рт), но (1 + рут~2== 1 + рт~1 == = 1 (modрт), и, стало быть, смежный класс b=\+p+pmZ с представителем Ь=1+р порождает в U (Zpm} циклическую группу порядка р"2-1. Согласно предложению из п. 3 § 2 гл. 4, элементы a, b взаимно простых порядков р—1, рт~г порождают циклическую группу <а&> порядка р'"-1 (р— 1) = Ф (р-) = [ £7 (ZpW)|.
(ii)	С группами U (Z2) и IJ (Z4) все ясно. При т > 2, исходя из тривиального сравнения 5 = 1 + 22 (mod 23), индукцией по / легко проверяется, что
52'== 1 +2'+2(mod2-'+3).
В частности,
52'”-3 == 1 + 2'«-1 =£ 1 (mod 2"1), 52“"2 = 1 (mod 2й),
так что 5 имеет порядок 2'л“2 по модулю 2т и смежный класс 5 + 2wZ порождает в U (Z2m} циклическую подгруппу индекса 2. Заметим, что —1 +2WZ^ <5 + 2^Z>, поскольку 5> = — 1 (mod 2W) => 57 = — 1 (mod 4) —> 1 = е= — l(mod4) — противоречие. Так как |<—1 + 2WZ> | = 2, то
U (Z/2*Z) - <5 + 2mZ> х <— 1 + 2'"Z>
— абелева 2-группа типа (2'л-2, 2) (см. § 5 гл. 7). | Следствие. Группа U (ZJ является циклической (или, что равносильно, примитивный корень по модулю п существует) тогда и только тогда, когда целое число п > 1 имеет вид 2, 4, рт или 2рт, где р — нечетное простое число.
УПРАЖНЕНИЯ
1.	Доказать, что ненулевой элемент р факториального кольца К является простым тогда и только тогда, когда К/рК — целостное кольцо.
450	к ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ	[ГЛ. 9
2.	Доказать, что если целостное кольцо К не является полем, то К [X] не является кольцом главных идеалов.
3.	Показать, что элементы х-\-уУ^—3 с х, у £ Z или же 2fe+l 2/4-1 хх-
х=—-—, у = —, k, I g составляют целостнее кольцо /С.
Проверить, что оно евклидово с функцией б = М (норма в Q ( У—3)). Показать, что подкольцо Z [ V—3] CZ К не является даже факториальным.
4.	Найти все простые элементы кольца целых гауссовых чисел.
5.	Усовершенствовать следствие теоремы 5 в случае факториального кольца /С, для чего, наряду с попарно взаимно простыми элементами alt ..., ап, ввести элементы а; = JJ оу. Найти Ь&К, для которых = 1 (modсц), b/=0(mod «/), 1	Пусть хь ..., хп£К.
Ввести элемент х = и проверить, что xsx/(modafj, (удобство, ощутимое в тех случаях, когда имеют дело с большим числом наборов xlt ..., хп).
6.	Применить предыдущее упражнение к модулям «1 = 5, «2 = 9 и к парам (хх, х2) = (2,5), (3,2), (3,5). Что можно сказать о порядке х по модулю 45?
7.	Пусть р —нечетное простое число. Если сравнение х2 = sa a (mod р) имеет решение, то целое число а называется квадратичным вычетом по модулю р, в противном случае—квадратичным невычетом. Символ Лежандра определяется соотношением
f0, если « = 0(modp),
1, если а ^0 (mod р) — квадратичный вычет, J —1, если а 0 (mod р) — квадратичный невычет.
2	/ \	p-i
Показать, что ( — j = l<=^a4“PZ£Zp и (—-)=« 2 (modp). \ Р )	\Р /
(ab\ ( а \ { b \
— = — ) — и число квадратичных вычетов в приве-Р J \Р) \ Р 1
денной системе 1, 2, ..., р—1 совпадает с числом невычетов. Проверить для небольших нечетных простых чисел р и q выполнение квадратичного закона взаимности
§ 2]
ОТДЕЛЬНЫЕ РЕЗУЛЬТАТЫ В КОЛЬЦАХ
451
доказанного в общем случае (многими способами) Гауссом. Извлечь
из примера 1 в п. 1 соотношение (--)=(—1) 2 .
8.	Доказать (в обозначениях предыдущего упражнения), что /2\
( — )=(—1) 8 , т. е. 2 является квадратом по mod р в точности
тогда, когда ± 1 (mod 8). (Указание. Опираясь на упражнение 9 § 1, рассмотреть примитивный корень а степени 8 из 1 в алгебраическом замыкании поля Fp. Так как сс4=—1, то а2+сс“2=0; кроме того, ссб =—а, а~б = —а"1, откуда аб + ог6 = —(аЦ-а-1). Полагая р = а4-а-1, будем иметь: р2 = а2 + а“24-2 = 2, так что р = ± 1 (mod 8) => рр = аР +	= а + а”1 = Р 1 = Р^“1 =
р-i Р-1	/ О \
= (р2) 2 =2 2 =ф ( — ) = 1. Аналогично Р^ ±5 (mod 8)	р^=
р-1
= a/?+a-^=a6+a“5 = ~(a+a-J) = —Р => ~1=рР-х = 2 2
9	(дополнение к п. 5 § 2 гл. 3). Пусть f (X) = f (..., xfy, ...) — ненулевой многочлен с коэффициентами в Z или в некотором поле от п2 независимых переменных xzy £ X, 1 j^nt рассматриваемый как функция матрицы X = (xzy). Доказать, что если f (XY) = f (X) f (Y) для всех X, Y £Мп(К), то f (X) = (det Х)т, где tn— некоторое неотрицательное целое число. В частности, /(X) = detX, коль скоро т
f (diag (х, 1, ..., 1)) = х. (Указание. Если п = 1 и [ (х) = 2 aixl»
Я/Л т2" 0» ТО т	/ т	\
f (ху) = 2 aix>У' — f (х) f (у) = f(x)[ 2 а1У‘ ) • i = 1	М = 1	/
где х, ^ — независимые переменные. Равенство коэффициентов при ут показывает, что атхт = f (х) ат и, стало быть, /(х)=х'л. Если теперь в общем случае положить g (х) = /(х-£), то g (xy) — g (х) g (у). Отсюда и из справедливости утверждения при п — 1 вытекает, что g(x) = xs. Так как X-Xv = (det Х)-£, то
f (X) f(Xv) = f ((det X) £) =g (det X) = (det X)\
Ho f (X), f (Xv) и det X — многочлены от x,y, Ki, j<n, причем detX неприводим (см. упражнение 7 § 3 гл. 5). По теореме 2 о фак-ториальности кольца многочленов любого числа переменных f (X) = = c(detX)w, с—константа, причем f (XY) = f (X) f (Y) => c2 = c, а так как с 0, то с= 1.)
452
К ТЕОРИИ ПОЛЕЙ, КОЛЕИ И МОДУЛЕЙ
[ГЛ. 9
§ 3.	Модули
Понятие модуля служит носителем фундаментального принципа, выработанного в алгебре полвека назад. Он заключается в том, что предметом изучения любой алгебраической системы должны быть не только внутренние свойства этой системы, но и все ее представления (в самом широком смысле этого слова).
1.	Первоначальные сведения о модулях. Начнем с классического определения. Пусть К—ассоциативное кольцо с единицей и V—аддитивно записываемая абелева группа. Пусть, далее, задано отображение (x,v)^xu из KxV в V, удовлетворяющее условиям:
(Ml)	х (и + у) = хи + xv,
(М2)	(х + у) v = xv + yv,
(М3)	(xy)v = x(yv),
(М4)	= v
для всех х, у£К, и, v£V. Тогда V называется левым К-модулем (или левым модулем над кольцом К). Аналогично определяется правый /(-модуль. В дальнейшем мы говорим просто о /(-модуле, хотя в некоторых ситуациях оба сорта модулей появляются вместе.
Аксиома (М4) (условие унитарности модуля), естественно, является лишней, если кольцо К не обладает единицей. Что более существенно, возможны модификации аксиомы (М3), приспособленные к некоторым неассоциативным кольцам. Пример модуля над неассоциативным кольцом приведен в конце следующего параграфа. Пока мы будем исходить из данного выше определения.
Пусть V—/(-модуль. Подгруппа U а V называется подмодулем в V, если xu£U для всех xg/(, u^U.
Пусть, далее, U и V — произвольные/(-модули. Гомоморфизмом К-модулей (или просто К-гомоморфизмом] аз U в V называется отображение о: U—такое, что
cF(^i + ^2) = cF(^1) + a(w2), о (хн) = ха (и)
для всех и19 и2, u£U, х£К. Легко проверяется, что Кего = {и С U |о(н) — 0} является /(-подмодулем в [/, а образ Imo—/(-подмодулем в V.
МОДУЛИ
453
§ 3]
Со всяким подмодулем U cz V над X ассоциируется фактормодулъ V/U = {у + U | v С V} (факторгруппа аддитивной абелевой группы) с действием X, определенным по правилу
x(v + U) = xv + U.
Основная теорема о гомоморфизмах и две теоремы об изоморфизме, доказанные нами для групп (§ 3 гл. 7), а затем для колец, дословно переносятся, с незначительным изменением доказательств, на модули.
После § 2 гл. 7, где рассматривались аксиомы типа (М3), (М4), и после основательной гл. 8 о представлениях групп (аксиомы (Ml), (М3), (М4)) примеры Д-модулей, которые мы приведем, вряд ли вызовут ощущение новизны. Тем не менее стоит их обсудить и сопоставить друг с другом.
1)	Всякая абелева группа А является Z-модулем. Именно, отображение (п, a) t—> па из 2хЛ в А удовлетворяет всем аксиомам (Ml) — (М4). Точка зрения на абелевы группы как на модули над Z оказывается весьма полезной.
2)	Всякая абелева группа А является модулем над своим кольцом эндоморфизмов End Л. По определению End Л состоит из всех отображений ф: Л—>Л, удовлетворяющих условию ф (а + а') =--= ср (я) + ф (а'). Операции сложения и умножения в End Л вводятся естественным образом:	(ф + ф) (п) = ф (а) + ф (я), (фф) (я) ф (ф (я)),
1 (х) = х, 0 (х) = 0. Отображение (ф, а) >—> ф (а) из End Л х Л в Л наделяет, очевидно, Л структурой Е1^Л-модуля.
3)	Векторное пространство V над полем Р является, несомненно, P-модулем. Если нам дан еще линейный оператор Л\ V—то мы наделим V структурой модуля Vнад кольцом многочленов Р[Х], полагая
f (X) v = f (Л) v = ссои + ос1 Ло + ... + акЛко
для любого ygV и любого многочлена f £Р[Х]. Аксиомы (Ml) — (М4) выполнены, поскольку вместе с Л оператор f (Л) будет также линейным и
(/ + g) W = f (Л) + g (Л), (fg) (Л) = ЦЛ)ё (Л)
(универсальное свойство колец многочленов; см. § 2 гл. 5). Подмодулями в будут служить Л-инвариантные
454
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
подпространства. Различным линейным операторам одного и того же пространства V соответствуют, вообще говоря, различные (неизоморфные) Р[Х]-модули.
4)	Произвольный левый идеал J кольца Д наделен естественной структурой Д-модуля с действием (х, у)н-»ху, х£Д, у€Л индуцированным операцией умножения в Д. В случае J = Д кольцо Д рассматривается как модуль ^Д над собой. Этот взгляд на Д приводит к плодотворным результатам.
5)	Возвращаясь к предыдущему примеру, построим фактормодуль K/J = {у + J | у € Д}. Согласно общему определению (х, у + /)н->ху + J—действие Д на Д/J. Заметим, что канонический эпиморфизм л: Д—являясь гомоморфизмом Д-модулей, удовлетворяет соотношению л (ХУ) = ХУ + J = х (z/+ J) = хл (у). Если же J—двусторонний идеал, то K/J — кольцо и л — гомоморфизм колец: л (ху) = л (х) л (у).
Пересечение Л любого семейства подмодулей cz V i
над Д является подмодулем в V. В частности, пересечение всех подмодулей, содержащих заданное множество TczV, приводит к подмодулю (Т), порожденному множеством Т и состоящему из всевозможных элементов вида x1t1 + ... ...+хА/л, где Х/СД, t^T. Заметим, кстати, что ненулевые элементы /х, ..., tk£V называются линейно зависимыми над К, если x1t1+...+xktk = Qt где не все xz = 0. Подмодуль, порожденный семейством ..., Vm\ подмодулей Vh называется их суммой и обозначается обычным образом:	=	+
Модуль V над Д, порожденный единственным элементом v, называется циклическим. Он имеет вид Е = Ду = — {xv | х б Д), где v С V, и является аналогом циклической группы. В частности, циклический модуль АГД = Д-1 (см. пример 4) — аналог группы (Z, +).
Если V = Kvt + .. . + Kvn — сумма конечного числа циклических модулей, то модуль V называется конечно порожденным или К-модулем конечного типа.
Легко проверяется, что отображение хн-»ху является гомоморфизмом модулей ► Да. Его ядро Ann (и) = =АпПд-(и) = {х g Д |хи=0} — левый идеал в Д, называемый аннулятором (или кручением} элемента v. Таким образом, Kv Д/Апп (и). Элемент v С V с Ann (у) #= 0 называется
МОДУЛИ
455
§ 3]
периодическим. Модуль, все элементы которого периодические, тоже называется периодическим. Если V не содержит ненулевых периодических элементов, то говорят, что V — модуль без кручения.
Аннулятором (или кручением) /(-модуля V называется множество
Ann (V) = \а € /(| aV = 0} = Г1 Ann (у). v е V
Модуль называется точным, если Апп(У) = 0.
К тем же понятиям можно подойти с другой стороны. Пусть V (х)— множество элементов и С У, аннулируемых элементом х£/(. Если /(— целостное кольцо, то У (х)+ + V (у) cz V (ху) и имеет смысл понятие подмодуля кручения Тог(У) = 2 W (кручение — от torsion (англ.)).
В случае равенства Тог (У) = У говорят, что V—модуль кручения. Если же Тог(У) = 0, то мы снова приходим к понятию модуля без кручения.
Характерные примеры периодических модулей: а) всякая конечная абелева группа (периодический модуль конечного типа над Z; кручение — mZ или просто показатель группы т); б) модуль над Р[Х], ассоциированный с линейным оператором Л (см. пример 3; кручение— главный идеал, порожденный минимальным многочленом оператора Л).
Предложение 1. Ann (V) всегда является двусторонним идеалом кольца К. Полагая (х + Ann (У))у = xv, мы наделяем V структурой точного (/(/Ann (У))-модуля.
Доказательство. Положим Л Ann (У). Ясно, что А — аддитивная подгруппа в /(. Далее, (xax')v = = ха (х'0 =; (ха) v' = х (avf) х • 0 = 0 для любых х, х' С /(, а£Л, v g V, откуда и следует, что 7(Л/(^Л, т.е. А — двусторонний идеал в /(. Если теперь х + Л^х' + Л, то х—х' С Л, откуда (х—x')v-=0, или %v = x'v. Стало быть, (х + Л)и = (х'+Л) v, т.е. действие факторкольца К/А на V определено корректно. Нетрудно проверить, что относительно этого действия V является /(/Л-модулем. Наконец,
(х + Л)У=0 =ч> х4-Л (Е Аппк/л (V) => хУ = 0 —> х£Л. Следовательно, лишь нулевой элемент в /(/Л аннулирует У. |
456
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Из предложения 1 вытекает, что факторкольцоД7Апп(У) изоморфно подкольцу кольца End (V) (см. пример 2).
Если V, W—два /<-модуля, то множество НогщДЕ, W) всех /<-линейных гомоморфизмов о: V —> W является абелевой группой относительно операции поточечного сложения гомоморфизмов:
(о + т) (xv) = о (xv) + т (хи) = ха (и) + хт (у) =
= X (о (v) + Т (0) = X ((о 4-т) (и)).
Для модулей V, W над коммутативным кольцом /< множество Нош^(Е, №) само является К-модулем, если под ха, х(ЕК, аСНошдДЕ, W), понимать отображение •~>х(а(у)):
(ха) (уи) = х • а (yv) = х (уо (у)) = (ху) (а (у)) =
= (ух) (о (о)) = у (ха (у)) = у ((ха) (v)).
В случае W = V множество ЕпдЦУ) = НошЦК V) является кольцом; умножением служит естественная композиция А^-гомоморфизмов ср огр: (сроф) (xv) = ср (ф (xv)) = = ср (хф (v))=x<p (ф (v)) = x ((сроф) (v)). Следует иметь в виду, что, рассматривая V как аддитивную абелеву группу, мы пишем Endz (К) и, вообще говоря, End^(K) — собственное подкольцо в End(V). В случае векторного пространства V над полем Д' обычно пишут J?(I/) = EndHV), называя его кольцом (или алгеброй) линейных операторов.
Кольцо End^V) К-эндоморфизмов модуля V называют еще централизатором кольца К на V. Его роль особенно заметна в случае неприводимых (или простых) модулей. Модуль V над кольцом Д называется неприводимым, если: а) V ^О; б) 0, V—единственные подмодули в V и в) КУ ^=0 (это условие автоматически выполняется, если К содержит единицу). Ясно, что К-мод у ль V =^0 неприводим тогда и только тогда, когда V = Kv— циклический модуль при любом и=^0 из V.
Предложение 2 (лемма Шура). Если V, W—два неприводимых К-модуля и о — ненулевой К-гомоморфизм изУ в W, то а— изоморфизм. Далее, End^(V)—кольцо с делением (тело) для любого неприводимого К-модуля V.
Доказательство см. в § 4 гл. 8, где та же лемма Шура (теорема 1) доказана для неприводимых С-прост-ранств. |
МОДУЛИ
457
§ 31
2.	Свободные модули. Мы называем /(-модуль V (внутренней) прямой суммой своих подмодулей Vlt . .., Vn, если V = V + ... 4-и А 2 V} = О для i = 1, ..., п.
/ =# i
Другими словами, V = V± ф ... ФУП (обозначение прямой суммы подмодулей), если любой элемент v£V единственным образом записывается в виде линейной комбинации v = v1-\- . . . + vn, V Внешняя прямая сумма К-моду-лей их, ..., vn определяется очевидным образом (как в случае колец) с действием х (их, .. ., vn) = (xvlt ..., xvn) элемента х£/( на строку (ах, ..., vn),
Пусть, далее, V—/(-модуль и . . ., иД— конечное подмножество в V. Говорят, что ..., vn) порождает V свободно, если V = Kv1 + . . . + Kvn и каждое отображение ср множества {их, . . ., в какой-либо /(-модуль W продолжается до /(-гомоморфизма <р: V—*W, так что <Р (^/) -<р(^), 1
Модуль V над К, свободно порожденный некоторым подмножеством {^х, ..., уД, называется свободным модулем, а {их, ..., vn}— его (свободным) базисом над К-
Предложение 3. Эквивалентны утверждения:
(i)	множество (их, ..., порождает V свободно;
(ii)	множество {t>x, . . ., линейно независимо и <ух, . .. v„> = V',
(iii)	каждый элемент v£V однозначно записывается в виде V 2 XiVi > Xi €
(iv)	V = Kv1 Ф .. . Ф/(уп — прямая сумма и Ann (vz) 0;
(v)	V	. Ф/<К — прямая сумма п экземпляров
(таким образом, свободный К-модуль ранга п относительно базиса {г\, ..., изоморфен модулю Кп строк (%i, . . хп) длины п с компонентами Х;£К).
Доказательство близко к рассуждениям, проведенным в гл. 2 для линейных пространств над полем, но нужно соблюдать некоторую осторожность, связанную либо с некоммутативностью кольца /(, либо с существованием необратимых элементов в К- I
Имеются довольно сложные примеры некоммутативных колец с Кт = Кп при т^п, но коммутативные кольца в этом отношении ведут себя хорошо.
Предложение 4. Ранг конечно порожденного модуля над целостным кольцом К определен однозначно.
458
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Доказательство. Пусть ., vn}, {ult . . . ,ит}-— два базиса свободного модуля V над /<. Тогда
пг	п
Vj --= 2 a, jUi, ut = 5 bkivk.
1=1 J	k=\
Ввиду коммутативности К для матриц А = (а/у) и В = (Ьк1) размеров тхп и пхт соответственно получаются соотношения
АВ = Ет, ВА=^Еп.
Вложив К в поле отношений Q(K), мы получим посредством теоремы 4 § 4 гл. 2 (верной для любого поля, а не только для R), что min(n, т)^т, min (я, т)^п, откуда т = п. Добавим, что случай т < оо, п = оо невозможен, поскольку в выражения для входит лишь конечное число базисных элементов vk, свободно порождающих весь модуль V. |
Замечание. В случае произвольного коммутативного кольца К с единицей будет достигнут тот же эффект, если выбрать в К некоторый максимальный идеал J и перейти к полю K/J. Детали мы опускаем.
Заметим, что в отличие от ситуации в векторных пространствах произвольно взятое порождающее множество свободного /(-модуля не обязано содержать базис модуля. Например, два различных простых числа р, q всегда порождают поскольку up-]-vq=l для некоторых u, Но {р, q\ не является базисом, ибо p-q — q-p — 0, a ftp, ftq— собственные подмодули в Z.
Роль свободных модулей запрограммирована в их определении.
Теорема 1. Каждый К-модулъ конечного типа является гомоморфным образом свободного К-модуля конечного типа, п
Доказательство. Пусть U = 2 Kui—К-модуль, i= 1
порожденный п элементами ut, ..., ип. Возьмем свободный /(-модуль V с базисом	Его существо-
вание обеспечено предложением 3 (v). Отображение <р: uzi—>Uj продолжаемо, в соответствии с определением свободного модуля, до /(-гомоморфизма ср: V—+U. Образ Im ср содержит порождающее множество модуля U и, стало быть, весь модуль U. |
МОДУЛИ
459
§ 3]
Не всегда подмодуль свободного модуля свободен, даже если он является его прямым слагаемым. Вот простейший пример. Пусть К = Ze> U — К (2 4-6Z), V = /( (34-6Z)* Тогда К = U ф V—прямая сумма /(-модулей I/, V, ни один из которых не является свободным: | /С | = 6, в то время как | U | = 3, | V | = 2.
Теорема 2. Пусть V = Ф... Ф Kvn—свободный модуль ранга п над кольцом К главных идеалов. Тогда каждый его подмодуль U — свободный ранга т^.п.
Доказательство. Пусть сначала п = 1, т. е. V К-Любой подмодуль UcV изоморфен идеалу в /(, и, стало быть, Uq£(u) = Ku. Если и = 0, то (7 = 0 (нулевой подмодуль можно считать свободным модулем нулевого ранга). Если же иУ=0, то au^Q для всех 0=И=а£7<, поскольку К — целостное кольцо. Значит, U— свободный (циклический) модуль ранга 1. При n> 1 рассуждаем по индукции. Рассмотрим в V свободный подмодуль V' = Kv2 Ф... ... ®Kvn ранга п— 1. Фактормодуль V = V/V'—свободный, с циклической образующей =t\ + V. Он содержит подмодуль U = (U 4-V')/V'. Если (7 = 0, то (7czV', и тогда утверждение теоремы верно по предположению индукции. Если же (7 =0=0, то рассуждение, проведенное выше для случая п=1, показывает, что U обладает циклической образующей u1 = u1 + V', где u}£U. Если еще U f)V' = 0, то и => u = u + V' => и = arulf а1^К => и — aJu1 € gV' => и = а1и1 => П =	— свободный модуль ран-
га 1.
Пусть, наконец, (7 П V 0. По индукции подмодуль U [}Vr свободного модуля V' ранга п—1 обладает свободным базисом (z/2, .. ., ит}, где 0 < т— 1 ^.п— 1. Почти дословно повторяя проведенное выше рассуждение, убеждаемся в том, что {ult и2, ..., ит\ — свободный /С-базис для (7. Действительно, u£U => и = u+V' £1/ =^> и = а1и1, ai^K=^>u—a1uJ С U nV' => u—a1ui = a2u2 + ... +атит
zz =	4~	+ • • • ~\~атит^	Согласно предло-
жению 3 (ii), нам нужно убедиться в линейной независимости образующих ulf ..., ит. Но ^lxiui = 0 => х1и1 = == — S Х/U/ = 0 в V. Значит, хх = 0, поскольку —базис ____ i>0
в V, а так как {zz2, ..., ит} — свободный базис в t7 О V', то х2и2+...+хтит = 0 =$> ха= ...=хт = 0. |
460
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Следствие. Каждый подмодуль модуля конечного типа над кольцом главных идеалов сам является модулем конечного типа.
Доказательство вытекает из теорем 1, 2 и из второй теоремы об изоморфизме (теоремы о соответствии между подмодулями). |
Не так сложно получить полное описание модулей конечного типа над кольцом X главных идеалов. Однако решающие факторы, обычно стимулирующие такое описание (периодические модули над й и над Р [X]; см. примеры 1 и 3), отпали (см. § 5 гл. 7 и Дополнение), демонстрацию же единого модульного подхода к разного рода задачам можно найти в списке дополнительной литературы.
3.	Целые элементы кольца. Пусть К — целостное кольцо. Элемент t£K называется целым (целым над Z), если t — корень унитарного многочлена Хп -\-а1Хп~х + ... -\-ап С £Z[X]. В том случае, когда К — конечное алгебраическое расширение поля Q или же К — поле, порожденное всеми комплексными алгебраическими числами, говорят о целых алгебраических числах, относя к ним, естественно, все элементы из Z. Упражнение 9 § 4 гл. 6 показывает, что рациональное число t является целым алгебраическим тогда и только тогда, когда t£Z. Если, далее, аоип + -\-а1ип~1 + ... 4-яп = 0, azgZ, то (а{)и)п-\-аьаг	..
.. . +а$ап = 0, а это значит, что любое алгебраическое число, умноженное на подходящий элемент a0£Z, становится целым алгебраическим числом.
Обращаясь к общему случаю, заметим, что /< удобно трактовать как Z-модуль. Любые элементы /2, .. . ,tn £ К порождают в К подмодуль Ktr + Kt2 + • • • + Ktn конечного типа. Если, в частности, t — целый элемент и tn-\-+ aj”’1 + ... +ап -= 0, az-€Z, то подкольцо Z[t]aK является Z-модулем конечного типа, поскольку Z [/] = = Z1 +Z/ + ... +Z/""1. Обратно, пусть Z [/]—Z-модуль конечного типа с образующими ..., vn$K. Тогда соотношения
/V,. = а,а + ai2v2 + ... + ainv„, 1 < i < п, с матрицей А = (aZy) € Мп (Z) приводят к выводу, что линейная однородная система
(/	^ц)	^12^2	* * *	^1П^П	0»
^«1^1	&П2%2	* * ‘ 4” ^пп) %П 0>
МОДУЛИ
461
§ 3] рассматриваемая над полем отношений Q(K), имеет ненулевое решение (хп ...,%„) = (^, ..., vn) (не все = О, поскольку 1 €Z[/]). Значит, определитель системы равен нулю (см. гл. 3) и t — корень унитарного многочлена f (Т) det (ТЕ — Л). Мы доказали, что элемент является целым тогда и только тогда, когда подкольцо Z[/]cz/( является Z-модулем конечного типа.
Теорема 3. Целые элементы кольца Ц образуют в К подкольцо.
Доказательство. Пусть и, v g Ц—целые элементы. Тогда Z[u,v] =	ZulvJ'—Z-^о^яъ конечного типа.
i </?,/< т
Так как Z — кольцо главных идеалов, то следствие теоремы 2 (или непосредственная проверка) показывает, что подмодули Z [и — и], Z[uv] тоже являются Z-модулями конечного типа. Согласно приведенному выше критерию, элементы и — v, uv должны быть целыми. |
Пример. Корень е любой степени из 1 является, очевидно, целым алгебраическим числом. По теореме 3 целочисленные линейные комбинации корней из 1 также будут целыми алгебраическими числами. В частности (см. доказательство предложения § 4 гл. 8), значения Хф(£), характера %Ф любого линейного представления Ф над С конечной группы G являются целыми алгебраическими числами.
УПРАЖНЕНИЯ
Пусть	..., Ап] — кольцо многочленов от п перемен-
ных над полем Р. Последовательность (/х, ..., fr) из г многочленов fi^A называется унимодулярной, если А/2 + •. • -\-А[г = А, т. е.
«i/i k«?/2+-..+«r/r=l	(*)
для некоторых и^А,	Пусть, далее, V — модуль конечного
типа над А. В связи с некоторыми тонкими вопросами из алгебраической геометрии французский математик Ж.-П. Серр (1955 г.) высказал гипотезу ф As As + * =ф V~A^, которой была придана следующая изящная форма: «всякое соотношение (*) можно записать в виде равенства
/1	/2	-../г
«21 «22 • • • «2Г   1
иП иГ2 • • • иГГ
462
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
при подходящих	Это утверждение, несмотря на свою кажу-
щуюся простоту, было доказано лишь в 1976 г. независимо А. А. Суслиным (СССР) и Д. Квилленом (США). Основная идея заключается в изучении действия группы GL (г, А [Хх, ..., Х„-г]) на множестве унимодулярных последовательностей и в рассуждении, использующем индукцию поп. С доказательством можно познакомиться по оригинальной статье (Суслин А. А., Проективные модули над кольцом многочленов свободны, ДАН СССР 229, Кз 5 (1976), 1063—1066)или по докладу на семинаре Н. Бурбаки (Ferrand D., Sem. N. Bourbaki, 28 erne annee, 1975/76, Juin 1976). Изложение вполне элементарное. Какой ценой оно достигнуто, можно судить по более раннему докладу на семинаре Н. Бурбаки (Bass Н., Sem. N. Bourbaki, 26eme annee, 1973/74, Juin 1974). В указанной литературе содержатся постановки нерешенных задач. Весь круг вопросов очень хорош для обсуждения на спецсеминаре.
§ 4. Алгебры над полем
1. Определения и примеры алгебр. До сих пор мы не придавали большого значения тому факту, что почти все известные нам кольца несут одновременно структуру векторного пространства над полем.
Определение. Алгеброй (или линейной алгеброй) над полем Р называется пара, состоящая из кольца (Л, •) и векторного пространства А над Р (базисное множество А у кольца и векторного пространства одно и то же; одинаковы также операция сложения 4- и нулевой элемент 0). При этом
X (ху) = (Хх) у = х (Ку)
для всех К£Р, х,у£А. Алгебра называется ассоциативной, если ассоциативно кольцо (Л, +, •). Размерность над Р векторного пространства Л называется также размерностью алгебры А.
.На алгебры переносятся, с незначительными уточнениями, основные понятия теории колец. Так, подалгеброй алгебры Л считается всякое подкольцо ВсзЛ, являющееся одновременно подпространством векторного пространства Л. Если Т — подмножество в Л, то порожденная им подалгебра Р [71] является пересечением всех подалгебр в Л, содержащих Т. Аналогичным образом определяются идеалы
алгебры над полем
4G3
§ 4]
и факторалгебры по ним. Гомоморфизмами алгебр служат гомоморфизмы колец, являющиеся вместе с тем Р-л инейными отображениями.
Центр Z(A) ассоциативной алгебры А определяется как множество всех элементов а^А, перестановочных с каждым элементом из A: a£Z(A) ах = ха, Ух^А. Очевидно, что (а—а')х = ах—а'х — ха—ха' = х(а—а'), (аа') х =- а (а'х) = а (ха') = (ах) а' = х (аа'), (Ха) х = X (ах) = = X (ха) х (Ха) для всех а, a'£ Z(A), X С Р. Поэтому центр Z(A) — подалгебра в А. Равенство Z(A) = A имеет место тогда и только тогда, когда А — коммутативная алгебра.
Если А — ассоциативная алгебра с единицей 1, тоне-посредственно проверяется, что X-1 £Z(A), причем соответствие Хн-»Х-1, VXgP, определяет мономорфное отображение Р в А. В этом смысле под алгеброй А можно понимать кольцо А вместе с выделенным подполем, содержащимся в центре Z(A).
Приведем некоторые примеры алгебр.
1)	Расширение FzdP конечной степени [р: Р] поля Р является, очевидно, коммутативной ассоциативной алгеброй (с единицей) конечной размерности dimpP = [P:Pj. Этим фактом мы уже пользовались в § 1.
2)	Кольцо многочленов K = P[Xlf ..., с коэффициентами в поле Р несет естественную структуру бесконечномерной коммутативной ассоциативной алгебры над полем Р. Заметим, что
К = ХгФ^Ф...
— прямая сумма конечномерных векторных подпространств Кт однородных многочленов степени т (7<0 = Р), причем Алгебры подобного типа называются градуированными.
3)	Коммутативная алгебра (G) с единицей порожденная над С всеми характерами конечной группы G, имеет размерность г, равную числу классов сопряженных элементов в G (теорема 2 § 7 гл. 8).
4)	Кольцо Мп (Р) квадратных матриц порядка п с коэффициентами в поле Р является алгеброй размерности п2 над Р. Базисные элементы {Ei}-| /, /= 1, 2, . . ., п} алгебры Мп (Р) перемножаются по правилу EikEtj = 8klEfJ. Согласно теореме 3 § 3 гл. 2, центр Z (Мп (Р)) = {Х£} Р.
454
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Назовем ассоциативную алгебру А с единицей центральной простой над полем Р, если Z (Л) Р и в А нет двусторонних идеалов, отличных от 0 и Л.
Предложение 1. Мп(Р)— центральная простая алгебра.
Пусть J — идеал в Мп(Р), отличный от нулевого, и пусть
0^a=
Если aftz=^=0, то Esi = auEsk>a-Elt£J при любых s, t = = 1, ...,и и, стало быть, J = Mn(P).
Аналогичное утверждение справедливо для полной матричной алгебры Mn(D) над произвольным телом D. Исключительно важная теорема Веддербарна (а в более общем контексте—теорема Веддербарна—Артина) гласит, что, обратно, всякая конечномерная ассоциативная простая алгебра над полем Р изоморфна Mn(D), где натуральное число п определено однозначно, а тело D (являющееся алгеброй конечной размерности над Р)— с точностью до изоморфизма.
Матричная алгебра Мп(Р) обладает еще следующим универсальным свойством.
Предложение 2. Всякая п-мерная ассоциативная алгебра А над полем Р изоморфна некоторой подалгебре в Mk (Р), где k < п + 1.
Доказательство. Будем считать Л алгеброй с 1 и вложим ее в Мп (Р). С этой целью каждому элементу а£А поставим в соответствие линейный оператор La: х\-*ах на векторном пространстве Л. Линейность La является следствием билинейности операции умножения в Л. Так как, очевидно, L^a = \La, La+b = La + Lb, Lab = LaLb (ассоциативность!) и = <£, то отображение ср: а—*La является гомоморфизмом. Его инъективность обеспечена существованием единичного элемента: а=^=0=> => La-\=a \--= a, La^=Q.
Пусть теперь Л — алгебра без единицы. Введем в рассмотрение векторное пространство Л = Р Ф Л и определим на нем умножение, полагая (X, а) (к', af) = (W, аа' ф + Ка' + X'а). Легко проверяется, что с этим законом умножения Л является алгеброй над Р с единичным элементом (1, 0).
АЛГЕБРЫ НАД ПОЛЕМ
465
§ 4]
Так как dimp А = dimp А + 1 = n+ 1, то предыдущее рассуждение позволяет вложить А, а вместе с тем и Л, в М„+1(Р).
Нетрудно усмотреть полное сходство в доказательствах предложения 2 и теоремы Кэли для конечных групп. В обоих случаях используется регулярное представление. Более общо, под представлением алгебры А над Р понимается любой гомоморфизм А—>£(К) = = EndF(V), где F:dP — некоторое расширение поля Р. Другими словами, векторное пространство V над F снабжается структурой левого Л-модуля в смысле определений § 3, причем
(Хл;)-и = х-(Хи), ЧК^Р, х£А, v$V.
Выбрав в V какой-нибудь базис, мы придем, как и в случае групп, к матричному представлению А—>Mr(F), где г =- dimF(V).
2. Алгебры с делением (тела). Как показывает сформулированная выше теорема Веддербарна, изучение алгебр с делением — важная составная часть общей структурной теории ассоциативных алгебр. Лемма Шура (предложение 3 § 3) также подтверждает это соображение. Прежде чем приводить какие-либо результаты об алгебрах с делением, остановимся на одном вспомогательном утверждении.
Предложение 3. В ассоциативной алгебре А (с единичным элементом 1) размерности п над полем Р каждый элемент а € А является корнем многочлена fa<tP[X] степени Элемент а^А обратим в точности тогда, когда	Если в А нет делителей
нуля, то А — алгебра с делением. Если поле Р алгебраически замкнуто, то п=\ и А--= Р.
Доказательство. Ввиду конечномерности А элементы 1, а, а2, ... не могут быть все линейно независимыми над Р. Стало быть, найдется унитарный многочлен /в(Х) = Хт + а1Хт~1 + ... + ат¥=0 наименьшей степени т^.п, с коэффициентами azgP, такой, что /а(а) = 0. Если аот^=0, то соотношение fa(a) = O, переписанное в виде [—а"1 (ат~1 + а1а/я”2+ • • • +^-1)]^=^ 1, показывает, что а — обратимый элемент. Обратно, предположим, что а^А не является делителем нуля, но а/л = 0.
16 А. И. Кострикин
466
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Тогда
(ая’-1 + а1ада“2+...+аот_1)а = 0
=> ат~1 + а^"2 + .. . +	= О,
что противоречит минимальности /а(Х). Значит, а,лу=0. В частности, все элементы в Л, не являющиеся делителями нуля, обратимы.
Если поле Р алгебраически замкнуто, то /а(Х) = = (X — cj.. .(X — ст)у Ci € Р, откуда (а — с1)6 = 0, b = (а—с2) ... (а—ст)^=0. Отсутствие делителей нуля в А оставляет единственную возможность: т = 1 и а—с\=0, а = с±^Р. Так как это верно для любого элемента a С Л, то Л = Р. |
Мы видим, что свойства алгебры с делением существенно зависят от основного поля Р. Естественно, что исторически алгебры с делением над полем вещественных чисел R вызывали особый интерес. Существование поля q = R4-/|R давало повод к поискам других «гиперкомплексных систем». Эти поиски увенчались успехом в 1843 г., когда Гамильтон построил свою знаменитую алгебру вещественных кватернионов.
Пример (алгебра кватернионов Н). Формально
H^IR + ZIR-hjIR + fclR, где Z, /, k — величины, перемножающиеся по правилу /2=e/2 = ^2 = _lt Z/=* = -JZ, /* = / = -*/, ki^J=-ik.
Элемент х = a0 + a1Z-|-a2/4-a3^C Н называется кватернионом. Непосредственно проверяется, что Н— ассоциативная алгебра с центром Z(H) = R. Но целесообразнее сначала рассмотреть модель алгебры Н — множество
ф(И)={|_^	| a, b, c£cj> сМ,(С).
Элементарное упражнение на действия с матрицами показывает, что Ф(Н) — кольцо с делением. Аналогичное упражнение разобрано в § 1 гл. 5, когда было введено поле С. Нужно только помнить, что умножение в Ф (Н) некоммутативно. Согласно правилам вычисления обратной матрицы
[ J 2Г=б-я|“ “Ч,
II —b а у || b а || где
6 = det II 2. —| = а2Г4~М (#0 при a;* 0 или b 0).
М)
АЛГЕБРЫ НАД ПОЛЕМ
467
Между прочим, отсюда следует, что мультипликативная группа ф(Н)* = Ф(Н)\{0} содержит подгруппу, изоморфную SU (2) (см, § 1 гл. 7).
Положив
-и ?|. ч; -“! И-? ;ц. «! мы замечаем, что
Я& ——$5^0; q1q2 = q3 =—ЯъЯъ Я2Яз~Я1 —— ЯзЯз>
ЯзЯ1 — Я 2 — — ЯгЯз-
Понятно, что отображение Ф: Н —► Ф (Н), определенное соответствием li—x/о, Zh—>qlt	Лн-><73, является двумерным пред-
ставлением над С алгебры кватернионов Н. Кватерниону х при этом отвечает матрица
ф* = |_£ ^|=оМо + <М1+'М'г+<Ы«,
где a = a0-}-ia1, 6 = a2-Hct3, i—V~—1. Кватернионные единицы Z, /, k порождают в Н* известную нам группу кватернионов Q8 порядка 8, а ограничение Ф|р8 дает ее неприводимое двумерное представление (см. конец § 3 гл. 7).
Для каждого кватерниона х = а0 + aiZ + a2./+a3# определен сопряженный кватернион х* = а0 —axZ —a2j—а3А? (аналог сопряженного комплексного числа).
Операция сопряжения обладает очевидными свойствами:
(х + </)*=х*+у*; х* = х ФФ x£R; х* = —-х <=> ао = О
(х—«чисто мнимый» кватернион). Произведение xx* = N (х) называется нормой кватерн.иона х. При помощи соответствия Ф сразу становится ясным, что (xz/)* = у*х* и N (ху) — N (х) N (у), причем А/ (х) = =; det Ф (х) = oto cti +
Место, занимаемое кватернионами, хорошо выявляется следующей теоремой Фробениуса, Над полем R существуют лишь три конечномерные ассоциативные алгебры с делением'. R, С и Н. Для доказательства (на котором мы не останавливаемся) существенно то, что минимальный многочлен ft(X) любого элемента 0=#/(£R алгебры с делением D над R должен быть квадратичным (см. предложение 3 и теорему 1 § 4 гл. 6).
Сравнительно недавно на основе глубоких топологических соображений было доказано, что над R всякая конечномерная алгебра с делением (не обязательно ассоциативная) имеет размерность 1, 2, 4 или 8. Все возможности реализуются.
16*
468
К ТЕОРИИ ПОЛЕЙ. КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Более 70 лет назад Веддербарном был получен красивый результат о конечных телах, имеющий важное значение для геометрии. Эту теорему, имеющую прямое отношение к содержанию § 1, мы сейчас докажем.
Теорема 1 (Веддербарн). Каждое конечное ассоциативное кольцо с делением коммутативно.
Доказательство. Пусть D — конечное кольцо с делением, Z—его центр. Очевидно, что Z— поле и D — конечномерное векторное пространство над Z:
D = Zer + Ze2 + • • • +
Согласно результатам § 1 Z = ^Q для некоторого q = pm, так что |	= Пусть, далее, x£D\Z. Перестано-
вочные с х элементы образуют множество С (х) = = {y£D\yx = xy}t замкнутое относительно операций сложения и умножения. Другими словами, С (х)— подалгебра с делением в £>, содержащая Z. Если qd—число элементов в С(х), то d = d(x)—делитель n, d<n, поскольку, интерпретируя D как левое векторное пространство
D = C(x)f1+-..+C(x)fr
над С(х), мы имеем qn = | С (х) |г = qdr. Заметим теперь, что Z* — центр мультипликативной группы £)*, а (qn — V)/(qd—1) = (D* : С (х)*) — число элементов, сопряженных с х в D*. Поэтому формула (2') § 2 гл. 7 принимает вид
где d пробегает некоторое множество делителей п, меньших и. Установленные в § 1 свойства кругового многочлена ФЛ(Х) показывают (см. упражнение 6 § 1), что целое числоФл(<?) делит как qn — 1,таки((7'1 — l)/(qd—1) при d\ и,d < п. В таком случае, согласно (*), Ф„ (q) | (q—1), а это влечет (см. упражнение 7 § 1) равенство п = 1 и, стало быть, коммутативность D = Z. |
3. Групповые алгебры и модули над ними. В связи с регулярным представлением конечной группы G в § 1 гл. 8 вводилось векторное пространство g € G>/< над полем /С. Мы превратим.его теперь в/^-алгебру, полагая e^h = egh и распространяя это правило по линейности на
§ 4]
АЛГЕБРЫ НАД ПОЛЕМ
469
произвольные «векторы» 2ageg,	Для упрощения
записи eg обычно заменяют на g и рассматривают множество /<[G] всевозможных формальных сумм 2ag£, ag € /С По определению 2 agg = 2 ₽g£ <=> ag = Pg, v£ € G. Операции над формальными суммами
2м + 2М = Ж+Ш
&	ё	g
М2м)=2*М’	(1)
= 5 аДгй=2у»и»
\ g J \ h J g» h
где уи = 2аА-’“
g
задают на /([G] структуру ассоциативной алгебры. Принято называть К [G] групповой алгеброй конечной группы G над полем /<. Базисными элементами пространства /C[G] служат формальные суммы 1-g, ggG, отождествляемые с элементами ggG;	[G] = | G |. Таким образом,
группа G считается вложенной в алгебру К [G]. Единичный элемент egG является единицей в /C[G]. В том случае, когда К—коммутативное ассоциативное кольцо с единицей, получается групповое кольцо /<[G] группы G над К.
Кроме того, аналогичная конструкция применима к произвольной, не обязательно конечной группе G, если условиться рассматривать лишь суммы 2ag£ с конечным числом отличных от нуля коэффициентов. Удобно также интерпретировать A=^agg как функцию на группе G (со значениями = в 7<), равную почти всюду нулю (т. е. с конечным числом отличных от нуля значений). При этом формулам (1) отвечают операции поточечного сложения
(Л+л2) (§)=^1(§)+л1(5)
и свертка функций
Л3 = Л1*Л2, Л»(и) = 2Л1(г) A^g-^u).
ё
Теория групповых колец—обширный раздел алгебры, имеющий собственную проблематику, но для нас /< [G] — лишь иллюстрация общих понятий, введенных в последних двух главах.
470
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Теорема 2. Существует взаимно однозначное соответствие между Д' [GJ-модулями, являющимися конечномерными векторными пространствами над полем К, и линейными представлениями группы G.
Доказательство. Пусть (Ф, 7) — представление группы G. Продолжим Ф по линейности на элементы из К [G], определяя
ф(2а^)=2агф^)-и положим
(2 ag8'> ° v =* 2 а?ф (s) v, Yu e v.
Операция о вводит на V структуру /С [GJ-модуля в обычном понимании этого слова. Заметим, что
(2 agg) о (kv) = 2 a/D (g) (М = 2 аЛф № v =
= М2 агФ (g) v) = к ((2 <*gg) ° У), т. е. умножения на скаляры в V и в /С [G] согласованы. Пару (Ф, V) естественно называть линейным представлением алгебры /C[G].
Обратно, если V—векторное пространство над Д, являющееся модулем над Д' [G] с действием (2ag£>	*
к-» (2 agg) ° то, полагая
ф (2 аг g)у == (2 аг£) °
мы определим гомоморфизм Ф: /С [G]—► End^V) (т. е. представление алгебры Д[С]), ограничение которого Ф = Ф|0 на G даст нам представление группы G. |
В соответствии с теоремой 1 пространство представления V группы G часто называют модулем представления группы G или коротко—G-модулем, Соответствующие терминологические изменения касаются других понятий теории представлений.
Пусть, далее, G—конечная группа, Д = С—поле комплексных чисел. Согласно результатам гл. 8, каждый неприводимый G-модуль над С (т. е. С [GJ-модуль) с характером %z изоморфен некоторому левому идеалу J { алгебры C[GJ (см. в этой связи пример 4 § 3). Если dime)/= И/, то C[GJ содержит прямую сумму Лх- = = Jj Ф ... Ф Jit П[ nz левых идеалов, С [GJ-изоморфных J, = JZ| г. Выбирая в каждом классе изоморфных левых
АЛГЕБРЫ НАД ПОЛЕМ
471
$4]
идеалов по одному представителю Ji9 мы можем написать разложение
С[О] = Л1Ф ЛаФ ... Ф АГ9	(2)
соответствующее разложению регулярного представления группы G. Заметим, что каждая из компонент определена однозначно.
Если теперь J—минимальный левый идеал алгебры С [G] и t ёС [G], то Л—тоже минимальный левый идеал (возможно, нулевой). Стало быть, отображение <р: J—> Jt9 определенное соответствием ин->vt (v£J)9 является либо нулевым отображением, либо С [GJ-изоморфизмом, поскольку XV ё J для любого X ё С [G] И (р (xv) = (xv) t — = x(yt) = xq (v). По этой причине JczAi ==> JtaAi9 У/ёС[О], и, следовательно, Л/—двусторонний идеал в С [G]. Разложение (2)—прямое, так что
i Ф j => А^ a Ai П А,- = 0.
Мы собираемся получить более точную информацию о разложении (2), опираясь на развитую в гл. 8 теорию характеров. Вначале найдем центр Z(C[G]) групповой алгебры C[GJ. По определению
zeZ(C[G]) о zg ~ gz9 Vg£G.
Если z = 2 4hh9 то heG
2 yg-ut = g (2yA^ = (2yA^ g = 2 Ун-'*, tzG	\ h J \ h J i^G
откуда =	V/£G. Положив t = gh9 получим
Y* = YgAg-i. Это значит, что
Z (C [G]) = <zn z2...zr>c,
где
Zi= 2 g'> i=l, 2..........r	(3)
ge g?
(gl9 g29 ..., gr—представители классов сопряженных элементов группы G). Понятно, что z19 z29 ...,zr—линейно независимые элементы и, стало быть, dim^ Z (C[G]) = г.
Каждому элементу аё^/ поставим в соответствие линейный оператор действующий на минимальном
472
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
левом идеале Ji = Ji,1 по правилу Ц?(о) = ао,
Так как, очевидно, = Ц"+ь = Ц? + Ц",	,
то (р: а—гомоморфизм алгебры Л,-в алгебру эндоморфизмов Endc ЛЦ (С). Предположим, что 0 =#а £ СКегф, т. е. aJi = 0. Все левые идеалы С[С]-изо-морфны, и если ф7: Jt-—► J—изоморфизм, то
aJit/ = aqj (Jf) = афу (eJ^ = фу (a-eJz) - фу (0) = 0.
Значит, aAi = aJi% х+ • • • А-аЗц п. = ®, а в таком случае и 6zC [GJ= 0, поскольку а£А;=>аА, = 0 для всех j=^=i. Однако ае = а=£0. Полученное противоречие показывает, что Кегф = 0. Стало быть, ф—мономорфизм, а так как <р
dim Ai = nt = dim Мп. (С), то А;^Мп. (С). С учетом предложения 2 мы приходим к следующей теореме о строении групповой алгебры С [С].
Теорема 3. Групповая алгебра С [G] конечной группы G над полем комплексных чисел С разлагается в прямую сумму (2) простых двусторонних идеалов, изоморфных полным матричным алгебрам'.
С [G] - Mni (С) Ф Мпз (С) ф ... Ф МПг (С).
В частности, групповая алгебра абелевой группы порядка п над С изоморфна прямой сумме г экземпляров поля С. | Следствие (теорема Бернсайда). Пусть Ф—неприводимое матричное представление степени п над С конечной группы G. Тогда среди матриц Ф^, g^G, имеется п2 линейно независимых, т. е. <Ф^| g g G)q = Мп (С). В Строение центра Z (С [G]) как коммутативной подалгебры в С [G] полностью определяется структурными константами—целыми числами п^ из соотношений
ZiZj = 2 n^zk. k=l
(4)
Имея в виду выражение (3) для zit легко понять, что nfy—число пар (g, h), gZg?, h Zg^, для которых gh — gk. Выберем в Z (С [G]) другой базис
Г
e< = -i§rE хД&)гл = 'П7г£%Л£)£.	(5)
1 1 /?=1
§4]
АЛГЕБРЫ НАД ПОЛЕМ
473
Здесь, как и в § 5 гл. 8,	—характеры непри-
водимых представлений, nlt ...,пг—их степени. Обратный переход совершается по формуле
, V Xi(gk) л
i = 1
Чтобы убедиться в этом, нужно воспользоваться соотношением (4) § 5 гл. 8. Оно же показывает, что
г
= 14|^ gS.n<x<(£)= ra-jZ gSx<(<?)x,-(g) =
£=1	1 ‘geG i	1 'geG
= Щ|е1Со (e)l = e-
Далее, применяя обобщенное соотношение ортогональности из упражнения 1 § 4 гл. 8, мы находим
^e/ = fGF У X/(g)X/(O^ =
g, teG
x/(/»g)U-x=
heG t geG	J
П/П ; bi /
“ TG~j ~n~i S»	x = $ijei-
Таким образом, центральные элементы eh вычисляемые по формуле (5), удовлетворяют соотношениям
£ —	^2	^г»	zg\
e‘i = eh =	' *
и называются по этой причине (и по традиции) центральными ортогональными идемпотентами групповой алгебры С [G]. Соотношение 2 = 6^+ ... -\-ег — условие полноты этой системы. Положив Bz = efC[G], мы немедленно обнаруживаем, что В(—двусторонний идеал в С [G] с единичным элементом ez- и что имеет место разложение в прямую сумму
С[С] = В1ФВ2Ф...ФВГ.	(7)
Непосредственно из (5) следует, что
X/ (е<) = п, |4| У X/(g)X/ (g) = nfiij.
g
474
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Поэтому Bz содержит минимальный левый идеал J с Ah отвечающий характеру %z. Так как Л,- и Bz—двусторонние идеалы, то Л/ez Bz. Сравнивая разложения (2) и (7), мы заключаем, что ЛХ = В1-. Итак, доказан усовершенствованный вариант теоремы 3.
Теорема 4. Элементы eh	вычисляемые по
формуле (5), образуют полную систему центральных ортогональных идемпотентов групповой алгебры С [G] конечной группы G. Простая компонента ezC [G] прямого разложения
С [G] =	[G] Ф е2С [G] Ф... Ф er<C [G],
изоморфная полной матричной алгебре Мп (С), содержит i
все минимальные левые идеалы, отвечающие характеру xz. | Всю теорию представлений групп можно развить, исходя из теоремы Веддербарна—Артина (см. п. 1) и из общей структурной теории групповых алгебр (ее заключительный вывод для конечных групп сформулирован в теореме 3). Мы шли в обратном направлении, опираясь по существу лишь на лемму Шура.
В заключение докажем одно полезное утверждение о степенях представлений.
Теорема 5. Степень п неприводимого представления (Ф, V) над С конечной группы G делит порядок | G |.
Доказательство. Пусть Ф — соответствующее представление групповой алгебры С [G]. По лемме Шура (предложение 3 § 3) линейный оператор O(zz), перестановочный со всеми Ф(&), g^G, и потому принадлежащий Endc [G] (И), должен быть кратен единичному оператору: ф (Zj) = ©z£. Имеем
n<oz = tr (0,-^ = tr Ф (z,) = £ tr Ф (g?) = I gf I Хф (g,), откуда
I g? I Хф (gl) (0, — -------.
1	n
Применяя Ф к соотношениям (4), получим
г
(0/Ы/ = 2
АЛГЕБРЫ НАД ПОЛЕМ
475
§ 4]
Стало быть, Z[coz]—подмодуль Z-модуля Z^, конечного типа и, согласно результатам п. 3 § 3,	—
целое алгебраическое число. По тем же результатам
V=Цг (Хф> = тг Е Хф &	=
г
= i ЕI	I • Хф(^) Хф(§г) = Е “/Хф &z)
1= 1
— целое алгебраическое число. Значит, -^gZ. I
4. Неассоциативные алгебры. Пусть А—любая (т. е. не обязательно ассоциативная) алгебра произвольной размерности над полем Р. Каждым трем элементам х, у, z (Е А поставим в соответствие выражение (х, у, z) = (ху) г—х (yz), называемое их ассоциатором. В зависимости от тождественных соотношений, связывающих ассоциаторы или иные выражения, получаются различные типы (как еще говорят, примитивные классы, многообразия) алгебр. Примерами служат
1)	ассоциативные алгебры*, (х, у, г) = 0;
2)	эластичные алгебры*. (х, у, х) = 0;
3)	альтернативные алгебры*, (х, х, у) = (у, х, х) = 0;
4)	йордановы алгебры*. (х, у, х2) = 0; ху—ух = 0.
По этому аксиоматическому пути можно, очевидно, двигаться неограниченно. Замечательно, однако, что многие классы неассоциативных алгебр возникли естественным путем в областях, далеких от алгебры как науки. В качестве наиболее ярких примеров следует назвать Йордановы алгебры, пришедшие в математику из квантовой механики (от физика Йордана), и алгебры Ли, предназначенные первоначально исключительно для описания (при определенных условиях) локальной структуры топологических групп (Софус Ли — математик XIX века). Об алгебрах Ли мельком упоминалось на страницах книги, поэтому мы отведем им самостоятельное место.
В алгебре Ли L над полем Р произведение элементов х, y£L принято обозначать [ху]. По определению алгебры Ли билинейная операция (х, у)н-»[ху] удовлетворяет двум требованиям:
(i)	[хх] = 0 ([ху] = — [ух]—антикоммутативность)*.
(i i) [[**/] г] + [[f/z] *] + [[zxJ у] = 0 (тождество Якоби).
476
К ТЕОРИИ ПО ЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
Пример 1. Пусть А — ассоциативная алгебра над полем Р. На векторном пространстве А зададим структуру алгебры Ли L (71), полагая [ху] = ху — ух. Ясно, что[хх] = 0. Далее,
[ [xy] * ] = (ху — ух) 2 — 2 (ху — ух) = Ху2 — уХ2 — 2Ху 2уХ, [\У2\Х] = (У2 — 2У)Х—Х (у2 — 2у) = у2Х — 2уХ — Ху2 + Х2у, {[ZX}y]-=(2X — X2) у — у (2Х — Х2) = 2Ху — Х2у — у2Х + уХ2.
В результате простого сложения получаем тождество Якоби.
Пусть, в частности, А = Endp (V) =S (V) — алгебра всех линейных операторов конечномерного векторного пространства V над Р. Любой гомоморфизм ср: L —> L (й (V)) называется представлением алгебры Ли L. Пространство представления V называется также L-модулем (или модулем над алгеброй Ли L). Формально L-модуль задается тремя аксиомами:
(L1)	х (аи + 0у) = ахи + [Зхг,
(L2)	(ах + Ру) v = axv + fiyv;
(L3)	[xy]u = x(yv)—y(xv). <
Пример 2. Дифференцированием произвольной алгебры К (не обязательно ассоциативной) над полем Р называется дифференцирование @) кольца К (см. определение в п. 3§1гл. 6), перестановочное с действием констант из Р:	(Хп) =	(а), Х£Р, а£К.
Пример 1 и упражнение 8 § 1 гл. 6 показывают, что умножение [ <2)1^2] =	—наделяет множество Der (К), являю-
щееся векторным пространством над Р, структурой алгебры Ли. Если, в частности, К = Р[Х]— алгебра многочленов, то Der (К) состоит из дифференцирований @)а, и£К, действующих по правилу: S)u(f) = — u^x = ui'-По определению:	(/) = S)B(S>vf)—S>v
=S>B (vf') — S>v(uf') = U(vf'Y — v(uf'Y=u(v'f’+vf")—v(u’f'+uf")= = (uv'— u'v) f. Следовательно, [@)u<2)v] = @)uv'-u'v, и мы видим, что алгебра Der (/С) изоморфна бесконечномерной алгебре Ли (/(, [ ]) с базисным пространством К и умножением [uv] = uv' — u'v. Положив
= <Xi + 1>Q, мы получим разложение К в прямую сумму
K — ф ф ^(п ф ^(2)Ф- • • ,
обладающее свойством градуированной алгебры Ли-. [Кц) KqJ CZ Ка+р (сравнить с примером 2 п. 1). Алгебра Ли (А, [ ]) действует на векторном пространстве К двумя способами: 1) (п, f)t—>af' (естественное действие); 2) (at f)t—>af'— a'f (действие присоединенными эндоморфизмами). В результате получаются два неизоморфных (К, [ ])-модуля.
Пример 3. Косоэрмитовы матрицы с нулевым следом К2, К3, построенные в упражнении 3 § 1 гл. 7 по группе SU (2), удовлетворяют соотношениям
[К1К2] = Х3, [ К2Кз ] = Ki, IК3К1] = К2,
§4]
АЛГЕБРЫ НАД ПОЛЕМ
477
которые в точности повторяют правила векторного произведения векторов в R3 ([/<$/(/] — KsKt — KfK$ — «коммутаторы» матриц в M2(C); см. пример 1). Поэтому трехмерное вещественное пространство
К2, Аз>[£ наделено структурой алгебры Ли.
Из общей теории представлений компактных групп следует, что между неприводимыми представлениями группы SU (2) и ее алгебры Ли su (2) =	К2, Кз>& имеется
взаимно однозначное соответствие. Интуитивно это можно понять, приняв во внимание непрерывность представления группы и рассмотрев в линейной оболочке операторов Ф (gt) (где gt— зависящий дифференцируемым образом от t элемент группы SU(2);g0 = e) линейный оператор ИтуФ(^), уже содержащийся в алгебре su(2). Чтобы *->о подтвердить полноту списка неприводимых представлений группы SU(2), которые были получены в § 6 гл. 8, нам нужно убедиться в том, что для любого натурального п имеется с точностью до изоморфизма ровно один неприводимый su (2)-модуль размерности п над С. С этой целью удобно перейти с самого начала от вещественной алгебры Ли su (2) к ее «комплексификации», совпадающей с алгеброй Ли
L = s\(2) = su (2)®
всех комплексных 2 х 2-матриц с нулевым следом. Базисные элементы
^—1 — “Ь ~	= j/Cj /С2
алгебры L перемножаются по правилу
=	[еА] = 2er (8)
Забыв на время о происхождении L, можно считать, что L = <e_n е0,	— абстрактная трехмерная алгебра Ли
над С с таблицей умножения (8). Легко проверить, что L—простая алгебра Ли. Стало быть, любой ее неприводимый модуль размерности > 1 будет точным.
Пусть вначале V=#0 — произвольный L-модуль конечной размерности над С, и пусть £_1, £0,	— линейные
операторы на V, отвечающие соответственно элементам е0> ei- В теории представлений алгебр Ли установилась своя терминология, которой мы будем придержи
478	к ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ [ГЛ. 9
ваться. Собственное подпространство Vх = {у g V | £ои = Ау} оператора £0 в V с собственным значением А£С состоит из векторов, о которых принято говорить, что они имеют вес А. Размерность dim Vх называется кратностью веса К.
Лемма 1. Если то E^^V1*2, fiL^gV*-2 (Ei—«повышающий» оператор, а Е_г — «понижающий»).
Доказательство. В соответствии с аксиомой (L3) имеем
Ео (Е^) = [£0£i]v + £i (£о^) = 2£iy + £i (М = (А + 2) Е^, так что по определению Е±о g Рх+2. Аналогично £0 (£_1и) = = (A — 2)E^v.
Из курса линейной алгебры известно, что векторы, отвечающие различным собственным значениям, линейно независимы. Поэтому сумма W = У'У*,с: V—прямая. Из х
леммы 1 следует также, что Ц7 = УРХ является £-подмо-х
дулем в V. Так как W =/= 0, то в случае неприводимого L-модуля V должно выполняться равенство W = V.
Вектор назовем старшим вектором веса А, если vo#=0 и £^о = О, £ovo = Auo.
Лемма 2. Любой конечномерный L-моду ль V обладает старшим вектором.
Доказательство. Возьмем произвольный (#=0) вектор v веса р и построим последовательность векторов v, Е^, Efy, ... с весами р, р + 2, р + 4, ... (см. лемму 1). Так как dimV<oo, то	для некоторого т.
Взяв, т минимальным, мы можем положить vQ = E^v, А = р + 2т.
В качестве примера рассмотрим векторное пространство Vn размерности п + 1 над С с фиксированным базисом г/0, их, ..., vn. Операторы £_г-, £0, Ег определим формулами
E-1vm = (m+1) ии+11
Eovm = (n — 2tn}vm,	(9)
полагая y_i = 0 = urt+i. Прямая проверка показывает, что выполнены соотношения
Ei —	(E1vm) = E(tvm,
Ео (E^vm) — Е-' (Eov,„) = — 2Е_^т,
Ео (E1vm) — Ei (Ebvm) - 2E1v,„,
АЛГЕБРЫ НАД ПОЛЕМ
479
§ 4] находящиеся в соответствии с таблицей умножения (8) и с аксиомами L-модуля. Так как E1v0 = (n+1) v_1==0, EQvQ = nvQf то и0 — старший вектор веса /г, а все пространство Vn записывается в виде прямой суммы
Vn = Vn Ф Vn~2 Ф ... Ф	(10)
одномерных весовых подпространств Vn~2m = <г%> (каждый вес имеет кратность 1). Предположив существование подмодуля U =И=0 в Vn, мы возьмем любой собственный вектор u^U оператора £0. Согласно разложению (10), u = kvm некоторого т. Последовательное применение «повышающего» оператора Ег (см. формулы (9)) даст нам включения	, ..., у0 g {/, а посредством «понижаю-
щего» оператора E_t мы получим из старшего вектора у0 все остальные векторы. Значит, U = Vn и Vn — неприводимый L-модуль.
Заметим, что Vo—тривиальный (одномерный) модуль, a Vt— модуль, соответствующий естественному определению алгебры L: в базисе {а0, vj операторы E_lt Ео, Ег имеют своими матрицами
щ. М’ м-
Следующая теорема решает стоящую перед нами задачу. Теорема 6. Всякий неприводимый L-модуль V размерности п-\- 1 над С изоморфен Vn.
Доказательство. По лемме 2 наш модуль V обладает некоторым старшим вектором v0 веса X. Положим ^-1 = 0 и ив, = Дг£^1и0 = Дг£_1(...(£_1и)...)прит>0. Утверждается, что при любом справедливы формулы
E0vn^(\ — 2m)vm,	(10')
Действительно, при m = 0 формулы (10') сводятся к определению старшего вектора и вектора v19 а дальше действуем индукцией пот: а) формулой E^v^tm-]-!) vm+l определяется вектор vm+1\ б) формула EQvm = (k— 2т) vm следует из леммы 1; в) если уже известно, что Elvm_1^ = (к—m + 2)v^_2, то после сокращения на т обеих
480
К ТЕОРИИ ПОЛЕЙ, КОЛЕЦ И МОДУЛЕЙ
[ГЛ. 9
частей равенства
mE1vm = Ei (E_1vm_l) =
= [£i£ - J vm-t + E-! (E1vm.1) =
= E<>Vm-i + (h—tn + 2)E_1vm_2 =
= {(b-2/n + 2) + (X-m + 2) (m-l)}vm_1 =
= m(K—m+ получается последняя из формул (10').
Если векторы и0, vlf ..vr при каком-то г отличны от нуля, то, имея различные веса, они должны быть линейно независимыми. С другой стороны, в силу неприводимости V подмодуль, порожденный вектором совпадает с V, а так как dim V = п + 1, то V = <v0, v19. .., vn> и vn+i = vn+z = ... =0. В частности,
O = E’ii/zl+f = (X—n)v„ = 0 => К = п
(обратим внимание на любопытную импликацию: dim7< < оо => XgZ, Х^О).
Подставив значение К = п в формулы (10'), мы придем фактически, с учетом выбранных обозначений, к формулам (9), которыми определялся L-модуль Уп. Значит, v=v„.
УПРАЖНЕНИЯ
1.	Сколько решений в алгебре кватернионов Н имеет уравнение x2+i=o?
2.	Алгебра обобщенных кватернионов над Q. Показать, что таблицей умножения
	1	*1	г*	*3
1	1		^2	^3
		Л	%	пе2
%		~ *3	т	— те^
*8	*3	— пе2	те±	— пт
с л,	пт Ф 0, на четырехмерном векторном пространстве
Н (л, m) = <l, elt е2, e3>Q над Q вводится структура ассоциативной
АЛГЕБРЫ НАД ПОЛЕМ
481
§ 4]
алгебры с единицей. Использовать для этой цели представление
Х — *0 4" х1е1 4" Х2е2 4“ ХЗеЗ 1—^Х —
Il*o4-*i У~п %2y/'m4-x3
|| х2 Ут — х3 У тп х0 —хх Уп ||
Определитель det Лх = хо—xfn —x^m + x^nm — N (я) называется нормой элемента х. Проверить, что при выполнении условия x£H(n, т), х Ф 0 => N (х) Ф 0 пространство Н (и, т) является алгеброй с делением (обобщенной алгеброй кватернионов). Используя понятия и результаты упражнения 7 § 2, показать, что при простом р == ± 3 (mod 8) алгебра Н (2, р) будет алгеброй с делением.
3.	Рассмотреть F2„ как векторное пространство V размерности п над F2. Наряду с операцией сложения, наследуемой из F я, ввести на V операцию умножения (х, r/)i—>х°у = Уху. Здесь хн-> У х— автоморфизм на F п, обратный к хн-»х2, так что Ух-\-у= У х + + У у. Показать, что (V, 4~»°)— коммутативная (неассоциативная) алгебра над F2, обладающая свойствами: а) в V нет делителей нуля и нет единицы; б) уравнение а о х = Ь с а ?= О однозначно разрешимо; в) группа автоморфизмов Aut (V) действует на V \ <{0} транзитивно.
4.	В любой алгебре выполняется тождество
t (х, р, z) + (Z, х, y)z = (ix, у, z) — (t, xy, z) + (t, x, yz).
Убедиться в этом прямой проверкой и показать, что если в алгебре Л с единицей 1 над полем Р для всех ассоциаторов имеет место включение (х, у, z)£P-l, то Л —ассоциативная алгебра.
Дополнение
ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА МАТРИЦ
Этот «островок» линейной алгебры слегка освещается здесь лишь для того, чтобы подчеркнуть его сходство с § 5 гл. 7, где дана классификация конечных абелевых групп. Мы не сочли нужным настаивать в § 3 гл. 9 на объединяющей роли в этом вопросе модулей над кольцами главных идеалов, поскольку разным категориям читателей, возможно, будет удобнее иметь прямые доказательства соответствующих фактов о группах и о линейных операторах.
1. Пытаясь разобраться с действием заданного линейного оператора Л\ V—>7, естественно поставить перед собой цель найти базис в V, наилучшим образом согласованный с Л. Другими словами, в классе подобных матриц С-1ДС, отвечающих оператору Л, требуется найти матрицу, имеющую как можно более простой вид. По понятным причинам эта задача существенно связана с основным полем Р, над которым определено векторное пространство V. В дальнейшем считаем, что Р = С — поле комплексных чисел или любое алгебраически замкнутое поле.
Пусть n = dim7 и	Кп — корни характеристи-
ческого многочлена
(/) = Га (0 = det (tE—Я) = t" +	+...+ап =
= IlG-M,
di= —tr A = —(X,x + ... +
= det4 = (-I)^1...V
Комплексные числа являются также собственными значениями линейного оператора Л\ подпространства
уЧ = {v£V 1Ли = Хр}
отличны от нуля и их ненулевые векторы называются собственными векторами оператора Л. Множество Spec (Л)
ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА МАТРИЦ
483
всех попарно различных собственных значений (характеристических корней) оператора Л называется его спектром. Аналогично говорят о спектре Spec (Л) матрицы А.
Отметим следующие факты.
(i)	Собственные векторы, принадлежащие к различным собственным значениям, линейно независимы. Сумма 2	—прямая (вообще говоря, не с°впа-
ЛбЭрес (А)
дает с V).
(ii)	Матрицу линейного оператора Л всегда можно привести (в смысле подобия) к треугольному виду.
Проще всего в этом убедиться рассуждением по индукции. Нужно взять одномерное Л-инвариантное подпространство <^> (Ле1 = 'к1е1), перейти к факторпростран-ству V = V/^e^ = {v =	<^> | v £ V} размерности n — 1 и
к фактороператору Л: Ло= Av, выбрать в V базис е2, ... ..еп, приводящий А к треугольному виду, и вернуться в пространство V:
Х2 *
4= о ’ .	• 
(iii)	(Теорема Гамильтона — Кэли). Линейный оператор Л и соответствующая ему матрица А (в любом базисе) аннулируются своим характеристическим многочленом.
Так как это утверждение не зависит от выбора базиса, то удобно воспользоваться свойством (ii). Рассмотрим цепочку Л-инвариантных подпространств V = = Ve=>Vt=>...=>V„_1=>0, где Vk = <et,e2,	еп_к_ь
е„_А>. Так как (^ — hn_k£)en_keVk+i, то (Л — А.я_^)Уйа cVft+i и, стало быть,
fa M)v=n
4=1
= И— М)... (a-KnS) Voe и—М) • • - И- Ч-itf) с с {Л — М) ... (Л —^п_2^)1/2с: ... С(Л — W)V„-X = O.
Но f^(a)V=Q « /ЛМ) = О.|
484
ДОПОЛНЕНИЕ
(iv)	Минимальный многочлен h^(t)=hA(t) оператора (унитарный многочлен минимальной степени т^п, аннулирующий Л и А) является делителем характеристического многочлена (/), делящимся на все линейные множители t — X, X (Е Spec (Л).
Деление с остатком (t) = q (t)-h^ (/)+r (/), deg г (/)< < degи свойства (Л) = 0 = И^ (Л) показывают, что г(Л) = 0, откуда r(t) = O. Если, далее, X—собственное значение оператора Л, то Ло='ко => 0 = h^ (Л)о = =	(X) V => Ил (X) = о => а - X) I /1Л (0.
Пример. Линейный оператор Л: V—называется нильпотентным, если t/Zm = O; tn — индекс нильпотентности, если Пусть Лт~1и^0. Тогда векторы v, Лщ .Лт~уи линейно независимы. Действительно, всякая нетривиальная линейная зависимость имеет вид
+	+	. +ат-1-А^,л-1у = 0, Q^k^m — 1.
Применение оператора Лт~1~(г к обеим частям этого равенства привело бы нас к соотношению с///л“1у = 0, противоречащему выбору V.
Итак, индекс нильпотентности т оператора Л не превосходит л = dimV. Пусть т = п и	Введем следующие обозначения для базисных векторов: е1=Лгг~1е, е2 — Лп~2е, ...,	=
еп = е. Тогда Л^1 = 0,	= ££-!, k > 1, и матрицей оператора Л
в базисе {еь ..., еп) будет жорданова клетка
	1 0 1	0 ..	,.0 0
	| 0 0	1 ..	..0 0
J п, 0 —	1 0 0	0 ..	..0 0
	0 0	0	.. 0 1
	0 0	0	..0 0
Если, например, V = <1, X, X2, Xn~1>Q — пространство d
многочленов степени < п над Си с/£ = -т-^ —оператор дифференциро-иА
вания, то матрицей этого оператора в базисе е( — -^Х^, будет как раз клетка Jnf 0.
Более общо, назовем (верхней) клеткой Жордана размера тхт (или порядка /и), соответствующей собствен-
ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА МАТРИЦ
485
ному значению %, матрицу
Jт, к —
X 1 о ... О О ОХ i ... о о о о л ... о о
О О 0 ... X 1
О О О ... О X
Заметим, что Jm —KE = Jm 0 — нильпотентная матрица: ^#=0, JS,o = O.
В частности, (/ — Х)от — минимальный многочлен клетки Жордана Jт> х и X — ее единственное собственное значение: Spec(JWbk) = ^b
Если и (/) — произвольный многочлен, то
U т, к )
и (X) и' (Х)/1! и" (Х)/2!
О п(Х) и'(Х)/П
1)!
(%)/(т—2)!
ООО
и(Х)
так что с Jm, х гораздо легче оперировать, чем с произ
вольными матрицами.
Основная теорема. Каждая квадратная матрица А порядка п над алгебраически замкнутым полем Р (в частности, над С) подобна прямой сумме жордано-вых клеток. Именно, существует невырожденная матри-
ца С, для которой
Jtnit Xi
nil, ^2
О
С гАС = jпгх, Xi+ • • • + kg~
О
fnsi
(жорданова нормальная форма J (Л) матрицы Л). С точностью до перестановки клеток жорданова нормальная форма матрицы единственна.
Так как минимальные многочлены подобных матриц совпадают, то из основной теоремы и из замечаний, сделанных по поводу жордановой клетки Jт,к, следует, что
где	= Spec (Л) и mjk—максимальный поря-
док жордановой клетки, отвечающей собственному значению Хд.
486
ДОПОЛНЕНИЕ
Ясно, что необходимым и достаточным условием диа-гонализируемости матрицы А (т. е. подобия ее матрице diag^, Хп}) является отсутствие в J (Л) клеток порядка больше 1. Поэтому получается следующий полезный критерий.
Следствие. Квадратная матрица А над С диагонализируема тогда и только тогда, когда ее минимальный многочлен hA (/) не имеет кратных корней.
Этот критерий эффективен, поскольку для вычисления hA (/) нет необходимости приводить матрицу А к жордановой нормальной форме.
Доказательство основной теоремы разбивается на три части, соответствующие пп. 2, 3, 4.
2. Множество векторов
V (X) = {с/ g V | {Л — Х<£)лу = 0 для некоторого k} называется корневым подпространством, соответствующим собственному значению X € Spec (Л).
В том, что V (X)— подпространство, нас убеждает легкая проверка. Если, например, u£V(k), vgV(X), причем (4— К(§уи = 0, (Л — h(§,)tv = 0 и т = max {s, /}, то
{Л — (аи + рv) = а (Л — 1<§)ти + р (Л — \<§)ти = О,
откуда аи + р^ € V (X) при любых а, р £ С. Так как в V (X) содержится собственный вектор, отвечающий X, то У(Х)у=0. Далее, VxczV (X), но равенства может и не быть, как показывает пример нильпотентного оператора Л индекса нильпотентности п, В этом случае Х = 0—единственное собственное значение, dimV°=l, но V(0) = K
Так как dimV(X)^n и ограничение Л — на V (X) является нильпотентным оператором, то
V(X) = {y€V|(^ —Х^ = 0}.
Теорема 1. Пусть Л\ V—*V—линейный оператор с характеристическим многочленом
^w=na-Mni	пРи i^i).
Тогда V=V (Хх) Ф ... ф V (Хр)—прямая сумма корневых подпространств V (Xz), каждое из которых инвариантно относительно Л и имеет размерность dimV(Xz) = nz. One-
ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА МАТРИЦ
487
ратор Л—Xz<£, нильпотентный на V (к,), действует невырожденным образом на подпространстве
V{ = V (Ц)Ф... ФУ (Х,_х)ФУ (Х/+1)Ф ... ФУ (КД
Наконец, X,-—единственное собственное значение оператора о/|У(Х().
Доказательство. Ни один из простых множителей t—не может быть делителем одновременно всех многочленов
Л (О = П(/-МЛ/.	‘ = 1. 2.....Р,
и поэтому НОД(/1(/), ..., f/,(/))=l. Найдутся, стало быть, многочлены gl(t).....gp (t) € С |/j, для которых
2 h (t)gi (0 = 1.	(1)
f=l
Подпространства
Wi = fi(Л)gi(Л)v={f,(л)gi(Л)v|уev}9 i <t<p, инвариантны относительно
JtWf = fi (Л) gi (Л)	(Л) gi (Л) V = Wi.
Кроме того, lS}>4	(Л) gi И) у = о
(поскольку /Д(<//) = 0; см. (iii)), так что
и7,.а:У(Х,.).	(2)
Соотношение (1), переписанное в виде
i= 1 дает нам разложение
y=S wt
1=1
и тем более (ввиду включения (2)):
р
488
ДОПОЛНЕНИЕ
Предположим, что v(:V(^)nV(’, где, как и в формулировке теоремы, V £ =2 ИМ- Тогда (Л — 'kiS)nv = 0, а так i^i
как v= 2 vj и {Л — v, = 0, то и J Ц (Л —
— о = 0. Но из взаимной простоты многочленов
(/—Х()п, с(t) — П (t — М” следует существование a(t), J =# I
b(i), для которых
Получаем
v = a (Л) {Л— Xz)n v + b (Л) J Ц (Л —	у = 0,
т. е. пространства V (Xz) и Vz не пересекаются. Значит, мы имеем разложение
v=V(Me...®V(^)	(3)
в прямую сумму ^-инвариантных подпространств.
Из включения (2) и из разложения (3) непосредственно вытекает, что 1FZ = V(XZ). Таким образом, для V (Xz) получено эффективное выражение
где ft (/), gi (/)— многочлены из тождества (1). В частности, M-xzpT(xz)^o.
Минимальным многочленом для Л на V (XJ будет некоторый делитель многочлена (7— A,Z)V Отсюда следует, во-первых, что Xz — единственное собственное значение оператора Л[у(к.). Далее, в базисе, являющемся объединением базисов пространств V (Xz), оператор Л имеет матрицу
Ар
где At — матрица порядка п£ = dim V (Xz) с единственным собственным значением Xz и характеристическим много-
ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА МАТРИЦ
489
членом /а. (/) = (/—A./)"',	Так как fA(t) =
р
= П/:а1.(/), то п = п[+ ... +п'р и п; = п/.
Нам осталось доказать невырожденность ограничения (Л— |v.. Но это понятно: в противном случае {Кег (Л — П К,-#= 0 и Ли—А,и = О для некоторого О =£ v С Vi- Однако на V,- характеристическим многочленом для Л является f t (t) = Ц (t—K)ni, и X,- собственным i #= I значением быть не может.
3. Доказанной теоремой 1 задача о выборе простейшей матрицы для линейного оператора Л: V —свелась к тому случаю, когда Л имеет единственное собственное значение X и (Л—^)'л = 0, /и dimV. Положив 93 = = А — мы получим нильпотентный оператор индекса нильпотентности т с нильпотентной матрицей В.
Теорема 2. Жорданова нормальная форма J (В) нильпотентной матрицы В существует (основное поле Р — произвольное).
Доказательство. Нам нужно показать, что векторное пространство V, на котором действует нильпотентный оператор 93 с матрицей В, разлагается в прямую сумму так называемых циклических подпространств P\93\vi = 93vh ..., yz> с 93rnivi = Q. Мы хотим провести индукцию по размерности пространства. Предположим, что утверждение теоремы доказано для всех пар (V', 93'), где dim И' < dimV и 93'— нильпотентный оператор на V'.
Пусть 93т = <3, 93m~1u^Q. Введем циклическое подпространство =	93и, ...,	и факторпрост-
ранство V = V/U, на котором заставим действовать фак-тороператор 93: 93v = 93v. Здесь v = v + U—смежный класс с представителем v. Так как 93то = 93то = 0, то 93—нильпотентный оператор индекса нильпотентности
Другими словами, 93т~хУ ф U, 93'nV^U.
Так как dim V < dim V, то по предположению индукции V = U, ®... Ф , Ui = P [«] щ.
Для V получаем разложение
V = t/1®...©	(4)
490
ДОПОЛНЕНИЕ
где
Ui = <uh SBui9	S3miUi£U9 m^m^m.
Подпространства 47 z не являются ^-инвариантными, поскольку, вообще говоря,
Для удобства при фиксированном i положим w = uh l = mh W = Ui = <wt S3w9 ^z"xoy>. По условию
^lw-=akS3ku + ak+1^k+^u + ... + am-1ffim~1u9 ал#=0
(если все ay = 0, нам нечего делать). Применив к последнему соотношению оператор S"2-1-*, получим^m~1~k+lw= =	Так как $Зт = 09 то это возможно лишь
при l^k^m—1. Положив
v = w—ak$3k~lu— ak+1$3k~l+*u— ... —arn_133m~l~lui мы обнаруживаем, что = $1~*ш + и' =^0, но
Silv = 9dlw—affiku— ... —= 0.
Циклическое пространство <и, $}v9 ..., c$3lv = 0 порождает вместе с U подпространство 47 z Ф U.
Эти рассуждения справедливы при любом i9
—1, поэтому в разложении (4) мы можем каждое подпространство Ui заменить на Vz = <uz, fflvi9 ...,
= 0. Положив еще vs = u9 ms = m9 VS = U9 получим разложение
У = У1Ф...ФУ,,
обладающее всеми нужными свойствами.
4. Приступая к доказательству единственности, укажем заодно практическое правило для приведения произвольной матрицы А порядка п к жордановой нормальной форме.
Для этого нужно уметь находить число N (т9 1) жор-дановых клеток Jm> к порядка т9 отвечающих собственному значению X матрицы А. Сопоставим обычным образом матрице А оператор Л9 действующий на n-мерном векторном пространстве V, и разложим V в прямую сумму
7 = V(X)©V',	(5)
ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА МАТРИЦ
491
где
=	М-W/, ...»
/=1
2 ИИ-
V =#= X
Будем подсчитывать ранг г( = гапк(Д— ХЕ)1 матрицы (Д— кЕу, или, что то же самое, размерность пространства {Л—\S)lV. Эта размерность, конечно, не зависит от выбора базиса в V. Каждое из пространств в разложении (5) инвариантно относительно (Л—М*)г, поэтому dim {Л—к<§У V=2dim (Л—Х<£)* С [Л] Цу+dim (Л—Х<£)(У'.
Считаем для определенности т, <1 т2 ms. Если то (Л—X<£)f С [Л] Vj = 0. При mj~>t имеем
= <(Л —Х<£)% (Л—X^)t+1u/( ...» (Л—
так что dim (Л — Ъ&У С [Л] vt — т}-—t. На V оператор Л—Х<£ невырожден (теорема 1), поэтому dim (Л—Х<£)'У' = = dimV'. Получаем
rt= 2 (т/ — 0 + dimV', ГПу> t
откуда
п—rt+i= 2 ("V—0— 2 (/nz—/—1) = my> i
= 2 И/-0- 2 И/-0+ 2 i = т.> t	ту> i+\	tnt + 1
= 21+2 1 = W + 1, X) + 2V(/+2, %)+...
Wy= t + 1	mj > t + 1
Стало быть, rm_t — rm~(rm—rm+1) = {N(rn, k) + N(m+l, X)+...} — {N(m+1, X) + /V(m + 2, X)+.. .} = (V(m, X), и мы получаем окончательно формулу
^(/n, X) = rm_1 —2rm + rOT+1,	(6)
m^l, r( = rank (Д —X£)‘, r0 — n.
Заметим, что rf—инвариант матрицы А (т. e. число, определяемое классом подобия матрицы Д). Значит,
492
ДОПОЛНЕНИЕ
формулой (6) устанавливается также единственность жордановой формы J (Л).
До сих пор о матрице С, осуществляющей подобие /(Л) = С-МС,
ничего не говорилось. Но так как теперь Л и J (Л) — известные нам матрицы, то C = (czy) можно найти из однородной системы линейных уравнений
CJ (А) — АС = Ъ
порядка и2. Пусть	Сг — ее фундаментальная си-
стема решений. Вообще говоря, не все Cz — невырожденные матрицы, но так как жорданова нормальная форма J (Л) существует, то det	. + trCr) 0 с неопределен-
ными коэффициентами ..., /г, и можно подобрать ..., argC, для которых det + ...+агСг) =Д0.
Тогда С = агСх + ...агСг— искомая матрица. Разумеется, С определяется далеко не единственным образом, даже при нормировке det С = 1.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Абелева группа 14
Автоморфизм 160, 186
Алгебра кватернионов 466
—	Ли 475
—	линейных операторов 456
—	над полем 462
Алгебраически замкнутое поле 272, 438
—	независимые элементы 214
Алгебраический элемент 211, 420
Алгебраическое расширение 422
Алгоритм деления 60, 216, 226
Аннулятор 455
Ассоциативное кольцо 173
Аффинные преобразования вещественной прямой 155
Базис абелевой группы 343
—	арифметического линейного (век-
торного) пространства 68
—	индукции 54
Базисные столбцы 75
Базисный минор 130
Башня расширений 421
Биективное отображение 41
Бинарное отношение 47
Биномиальная формула 56
Вполне приводимое представление 356
Гармонический многочлен 402
Главный идеал 179
Гомоморфизм 161, 178, 463
График функции 49
Группа 139
—	внешних автоморфизмов 330
—	внутренних автоморфизмов 160
—	Галуа 20
—	движений пространства 309
—	диэдра 327
—, заданная образующими и соотношениями 326
—	кватернионов 329
—	преобразований 141
—	характеров абелевой группы 392
Групповая алгебра конечной группы 469
Группы правильных многогранников 372
Действие группы на множестве 302, 305
Декартово произведение 40
Делитель единицы в кольце 184
—	нуля в кольце 184
Дистрибутивные законы кольца 172
Дифференцирование 250, 476
Длина орбиты 304
Дуальное представление 405
Евклидово кольцо 226
Единичная матрица 25
Жорданова клетка 354
— нормальная форма матрицы 354, 485
Закон двойственности для конечных абелевых групп 398
— сокращения в целостном кольце 184
Знакопеременная группа* 153
Знак перестановки 152
Идеал кольца 178
Изоморфизм 158, 179, 353
Инвариант линейной группы 413
Инвариантное подмножество при действии группы 311
—	подпространство 355
Инварианты квадратичной формы 414
—	конечной абелевой группы 342. 344
Инверсия относительно перестановки 155
Индекс подгруппы 166
Интерполяционная формула Лагранжа 247
—	— Ньютона 247
Инъективное отображение 41
Квадратичное поле 205
Квадратная матрица порядка п 25, 84
Кватернионы 466, 467
Китайская теорема об остатках 446
Класс сопряженных элементов 305
—	эквивалентности 48
Классы вычетов по модулю идеала 181
Кольцо 172
—	гауссовых чисел 438
—	главных идеалов 439
—	классов вычетов 177
—	линейных операторов 456
—	многочленов 209, 213
—	с делением 185
—	функций 174
—	характеров 410
—	целых чисел 173
—	целых элементов 561
и- эндоморфизмов абелевой группы 453
494
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Коммутант группы 317, 318
Коммутативная диаграмма 42
Коммутатор элементов 316
Комплексная плоскость 196
Комплексное сопряжение 197
Композиция отображений 42
Конечное алгебраическое расширение
423
Корень многочлена 243
Корневое подпространство 486
Кососимметрическая функция 106, 152, 271
Косоэрмитова матрица 301, 476
Кратность веса 478
—	вхождения неприводимой компоненты 368
Кратно-транзитивная группа 307
Кратный корень 244
Кристаллографическая группа 400
Критерий невырожденности матрицы 87
—	— преобразования 87
—	Рауса — Гурвица 290
—	Эйзенштейна неприводимости многочлена 231
Круговое поле 434
Кручение 455
Лемма Гаусса 230
—	Шура 376, 474
Линейная группа 295
Линейное многообразие 95
—	представление группы 351
—	преобразование 80
Линейно упорядоченное множество 51
Локализация корней многочлена 283
Максимальный идеал кольца 444 — элемент 52
Матрица линейного отображения 80
—	перестановки 169
Матричные единицы 98
Метод Гаусса 32
—	неопределенных коэффициентов 241, 263
—	полной индукции 54
Минимальный многочлен линейного оператора (матрицы) 484
—	— элемента 423
—	элемент 52
Минор матрицы 105
Модуль без кручения 455
—	конечного типа 454
—	над алгеброй Ли 476
—	над кольцом 452
—	представления группы 470
—	сравнения 176
Мономорфизм 162, 178
Морфизм 162
Мультипликативная группа кольца вычетов 448
•	— функция 431
Неприводимое представление 355
Неприводимый многочлен 221, 230
Неразложимое представление 355
Нильлотентный оператор 484
— элемент кольца 193
Нормализатор подгруппы 305
Нормальная (= инвариантная) подгруппа 162
Обобщенный характер группы 410
Обратная матрица 87
Окаймляющий минор 130
Оператор дифференцирования 249 — Лапласа 400
Определитель Вандермонда 118
Орбита 303
Ортогональная группа 295
Ортогональное дополнение 366
Основная теорема алгебры 272, 273 — — арифметики 58 — — о гомоморфизмах колец 183 Отношение 185 — эквивалентности 48
Первообразный корень 202
Перестановка 146
Подобные представления 352
Подпредставление 355
Показатель группы 345
Поле разложения многочлена 276, 427
Полилинейная функция 106
Полиномиальная функция 246
Полная линейная группа 139
Полное матричное кольцо 174
Полупрямое произведение 324
Порядок элемента 145
Поточечная операция 174
Правило знаков Декарта 286
Представление алгебры над полем 465
—	группы 302
Приводимое представление 355
Примитивный корень из единицы 202
—	(= Первообразный) корень по модулю п 448
—	многочлен 230
элемент расширения поля 420
Присоединенная (= взаимная) матрица 125
Проективная специальная группа 337
Производная подгруппа 317, 318
Простая группа 319
Простой модуль 456
Пространство представления 351
Прямая сумма 447, 457, 355
Прямое произведение групп 321, 323
Разложимое представление 355
Размерность алгебры 462
—	пространства 70
Разрешимая группа 318
Расширение поля 186
Регулярное представление 359
Редуцированный многочлен 246, 255
Свертка функций 469
Свободная группа конечного ранга 325, 332
Свободный модуль 457
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
495
Символ Кронекера 85
—	Лежандра 450
Симметрическая группа 146
Симметрический многочлен 257
Соотношение ортогональности 383, 391
Сопряженный класс 305
Спектр матрицы 483
Специальная линейная группа 140, 295
—	ортогональная группа 295
—	• унитарная группа 295
Сравнение 1 76, 448
Стабилизатор точки 303
Стационарная подгруппа точки 303
Структурные константы 410
Сферические функции 404
Сюръективное отображение 41
Факториальное кольцо 221, 438
Фактор кольцо 181
Фактормодуль 153
Факторпредставление 355
Формальный степенной ряд 219
Формула Лейбница 250
—	Муавра 200
—	Ньютона 264
—	обращения Мёбиуса 433
—	Тейлора 291
—	Эйлера 201
Формулы Виета 253
—	Крамера 128
Фундаментальная система решений 94
Функция Мёбиуса 431
—	Эйлера 61, 433
Таблица Кэли 157
—	характеров 390
Тело 185
Тензорное произведение представлений 409
—	— пространств 406
Теорема Безу 243
—	Бернсайда 472
—	Веддербарна 364
—	Вильсона 255
—	• Гамильтона — Кэли 483
—	Машке 365
—	Силова 333
—	Шевалле 255
—	Штейница 272
Тип конечной абелевой группы 344
Тождество Эйлера 256
—	Якоби 475
Транзитивная группа 307
Транспозиция 151
Транспонированная матрица 117
Трансцендентный элемент 211, 420
Унимодуляриая группа 140
Унитарная группа 295
Унитарное представление 363
Унитарный многочлен 217
Факторалгебра 463
Факторгруппа 181
Характер представления 379
Целое алгебраическое число 460
Целостное кольцо 184
Центральная простая алгебра 464
—	функция на группе 381
Центр ассоциативной алгебры 463
—	группы 305
Цикл 148
Число Фибоначчи 33
Эквивалентность действий группы 310
Эквивалентные представления 352
Экспонента (= показатель) группы 345
Элементарная абелева группа 343
Элементарные делители конечной абе-
левой группы 342, 344
Эндоморфизм группы 161
Эпиморфизм 162, 178
Эрмитова матрица 362
Эффективное действие группы 302
Ядро гомоморфизма 161, 178
действия группы 302
—	линейного отображения 92
—	представления 351
Алексей Иванович Кострикин
ВВЕДЕНИЕ В АЛГЕБРУ
М., 1977 г., 496 стр. с илл.
Редакторы В. Н. Латышев, Ф. И. Кизнер Технический редактор В. Н. Кондакова Корректоры О. А. Сигал, Л. С. Сомова
Сдано в набор 4/1V 19 77 г. Подписано к печати 18/VIII 1977 г. Бумага 84Х 108/32. Физ. печ. л.
15,5. Условн. печ. л. 26,04. Уч.-изд.
л. 24,45. Тираж 75 000 экз.
Цена книги 1р. 10 к. Заказ № 1428
Издательство «Наука» Главная редакция физико-математической литературы
117071, Москва, В-71, Ленинский проспект, 15
Ордена Октябрьской Революции и ордена Трудового Красного Знамени Первая Образцовая типография имени А. А. Жданова Союзполиграфпрома при Государственном комитете Совета Министров СССР по делам издательств, . полиграфии и книжной торговли
Москва, М-54, Валовая, 28