Author: Фаддеев Д.К.  

Tags: алгебра  

Year: 1984

Text
                    Д.К.ФАДДЕЕВ
ЛЕКЦИИ
ПО АЛГЕБРЕ
Допущено Министерством высшего
и среднего специального образования СССР
в качестве учебного пособия
для студентов университетов
и педагогических институтов
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1-9 8 4


22.14 Ф15 УДК 512.8 Фаддеев Д. К. Лекции по алгебре: Учебное пособие для вузов.— М.! Наука. Главная редакция физико-математической литературы, 1984.— 416 с. Книга представляет собой изложение курса лекций по алгебре, читавшегося автором в Ленинградском университете на протяжении ряда лет. Этот курс рассчитан на 3 семестра. Большим достоинством книги является то, что абстракт- абстрактные понятия вводятся в ней как результаты обобщения конкретного математи- математического материала. Для студентов университетов и пединститутов. Рецензенты: кафедра высшей алгебры Московского государственного университета; доктор физико-математических наук Л. Я. Куликов Дмитрий Константинович Фаддеев ЛЕКЦИИ ПО АЛГЕБРЕ Редактор Ф. И. Кизнвр Техн. редакторы В. В. Морозова, С. Я. Шкляр Корректоры Т. Г. Егорова, Е. В. Сидоркина ИБ № 12076 Сдано в набор 12.01.84. Подписано к печати 10.11.84. Формат 60X907is. Бумага книжио-журиальная. Усл. печ. л. 26. Усл. кр.-отт. 26,25. Уч.-изд. л. 28.35. Тираж 26 000 экз. Заказ № 26. Цена 1 р. 10 к. Издательство «Наука» Главная редакция физико-математической литературы U7071 Москва В-71, Ленинский проспект, 15 Ленинградская типография Na 2 головное предприятие ордена Трудового красного Знамени Ленинградского объединения «Техническая книга» нм. Евгении Соколовой Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 198052,г. Ленинград, Л-52, Измайловский проспект, 29. © Издательство «Наука». 17П9ПЧПППП 184 Главная редакция ф wu^uauw» io?_ 59_84 физико-математической литературы,
ОГЛАВЛЕНИЕ Предисловие 6 Глава I ЦЕЛЫЕ ЧИСЛА § 1. Теория делимости целых чисел 7 § 2. Теория сравнений 15 § 3. Некоторые общие понятия алгебры 21 Глава II КОМПЛЕКСНЫЕ ЧИСЛА § 1. Обоснование комплексных чисел . 26 §2-. Тригонометрическая форма комплексного числа 31 § 3, Извлечение корня из комплексного числа 39 §^4. Корни из единицы 43 § 5. Показательная и логарифмическая функции комплексной переменной 49 Глава III ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ § 1. Полиномы от одной буквы 53 § 2. Алгебраическое решение уравнений третьей и четвертой степени ... 61 § 3. Полиномы от нескольких букв 69 Глава IV МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ § 1. Матрицы и действия над ними 72 § 2. Теория определителей 82 § 3. Линейная зависимость и линейная независимость строк (столбцов) . . 108 § 4. Системы линейных уравнений общего вида 117 § 5. Дальнейшие свойства определителей 121 § 6. Обращение квадратных матриц 134 § 7. Характеристический полином матрицы 141 Глава V КВАДРАТИЧНЫЕ ФОРМЫ § 1. Преобразование квадратичной формы к каноническому виду линейной подстановкой букв 143 | 2. Закон инерции квадратичных форм .¦ .152 § 3. Ортогональное преобразование квадратичной формы к каноническому . виду 156 $ 4. Эрмитовы формы , , , , 164
4 ОГЛАВЛЕНИЕ Глава VI ПОЛИНОМЫ И ДРОБИ § 1. Теория делимости для полиномов от одной буквы 167 § 2. Производная 175 § 3. Рациональные дроби '. 180 § 4. Интерполяция 191 Глава VII СРАВНЕНИЯ В КОЛЬЦЕ ПОЛИНОМОВ И РАСШИРЕНИЯ ПОЛЕЙ § 1. Сравнения в кольце полиномов над полем 197 § 2. Расширение полей 198 Глава VIII ПОЛИНОМЫ С ЦЕЛЫМИ КОЭФФИЦИЕНТАМИ. ПОЛИНОМЫ НАД ФАКТОРИАЛЬНЫМИ КОЛЬЦАМИ § 1. Полиномы с целыми коэффициентами 203 § 2. Полиномы от одной буквы над факториальным кольцом 208 Глава IX РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА § 1. Существование корней в С 214 § 2. Распределение корней на плоскости комплексной переменной . . .218 § -3. Распределение вещественных корней полинома с вещественными коэф- коэффициентами 223 § 4. Обобщенная теорема Штурма 229 § 5. Приближенное вычисление корней полинома 234 Глава X ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП § 1. Простейшие сведения 242 § 2. Нормальные подгруппы и факторгруппы 247 § 3. Гомоморфизм 249 § 4. Прямое произведение групп 257 § 5. Группы преобразований 259 § 6. Свободная группа 269" § 7. Свободные произведения групп 273 § 8. Конечные абелевы группы 275 § 9. Конечно порожденные абелевы группы 278 Глава XI СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ § 1. Выражение симметрических полиномов через основные 284 § 2. Значения симметрических полиномов от корней полинома 288 § 3. Результант 294 Глава XII ВЕКТОРНЫЕ ПРОСТРАНСТВА § 1. Определения и простейшие свойства 301 § 2. Подпространства 307 § 3. Линейные функции i 312 § 4. Линейные отображения векторных пространств 314
ОГЛАВЛЕНИЕ 5 § 5. Линейные операторы в векторном пространстве 317 § 6. Операторы в векторных пространствах над полем С комплексных чисел 333 § 7. Операторы в векторных пространствах над полем R вещественных чисел 341 Глава XIII ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА § 1. Определения и простейшие свойства ¦. 345 § 2. Подпространства унитарного (или евклидова) пространства .... 352 § 3. Пространства, сопряженные с евклидовым и унитарным пространствами 354 § 4. Операторы в унитарном пространстве 355 | о. Операторы в евклидовом пространстве 362 § 6. Преобразование уравнения гиперповерхности второго порядка к кано- каноническому виду 366 § 7. Линейные отображения унитарного пространства в унитарное . . . 371 § 8. Объем параллелепипеда в евклидовом пространстве 374 Глава XIV ЭЛЕМЕНТЫ АЛГЕБРЫ ТЕНЗОРОВ § 1. Основные понятия • 377 § 2. Действия над тензорами . .¦ . .¦ 380 § 3. Симметричные и антисимметричные тензоры 382 § 4. Тензорные произведения векторных пространств 383 Глава XV АЛГЕБРЫ § 1. Общие сведения ,-,-.¦ 388 ¦§ 2. Алгебра кватернионов 394 § 3. Внешняя алгебра 401 Список литературы .• , , 416
ПРЕДИСЛОВИЕ Настоящая книга представляет собой обработку лекций по ал- алгебре, читавшихся мной на математико-механическом факультете Ленинградского государственного университета на протяжении нескольких десятилетий для математиков всех специальностей. От года к году содержание лекций несколько менялось. Здесь собрано теоретико-множественное объединение материала, читав- читавшегося в разные годы. В основу книги положены лекции, которые я читал в послед- последний раз в 1977—1978 гг. Лекции были старательно записаны Л. Ю. Колотилиной, за что я приношу ей глубокую благодар- благодарность. В ЛГУ линейная алгебра не отделена от общего курса алгебры и читается на третьем семестре. В соответствии с этим последние главы, начиная с главы XII, посвящены линейной алгебре. Эле- ментарно-калькулятивная часть линейной алгебры, состоящая из теории матриц, определителей и квадратинных форм, занимает главы IV и V; этот материал излагается в ЛГУ на первом се- семестре. Язык книги несколько архаичен из-за того, что я не тороплюсь вводить абстрактные понятия во избежание формализма при их восприятии. Я считаю, что их следует вводить по мере того, как удается возбудить в учащихся потребность в обобщении или, по крайней мере, если имеется возможность достаточно иллюстриро- иллюстрировать общие понятия более конкретным материалом. Оформление рукописи было бы для меня невозможным, если бы не энергичная помощь моих товарищей по работе в ЛОМИ, Всем им моя глубокая благодарность! Д. К. Фаддеев
ГЛАВА I ЦЕЛЫЕ ЧИСЛА Изучение свойств целых чисел составляет содержание раздела математики, имеющего название «арифметика» или «теория чи- чисел». Обычно первый термин относится к кругу самых элементар- элементарных вопросов, в основном, к правилам вычислений с целыми чис- числами, а второй — к установлению более глубоких и нетривиаль- нетривиальных свойств целых чисел. Цель этого раздела курса — познако- познакомить читателя с самыми простыми идеями и фактами теории чисел. § 1. Теория делимости целых чисел 1. Определение делимости и простейшие свойства этого отноше- отношения. Множество всех целых чисел принято обозначать Z. Множество Z состоит из натуральных, т. е. целых положительных чисел 1, 2, 3, .... числа 0 и целых отрицательных чисел —1, —2, —3, ... Ясно, что сумма, разность и произведение двух целых чисел суть снова целые числа. Частное же от деления двух целых чисел может и не быть целым числом. Говорят, что целое число а делится на целое число Ь, если существует такое целое число с, что а = be. Другими словами, а делится на Ь, если их частное с снова есть целое число. То же отношение делимости а на Ь может быть выражено дру- другими равнозначными терминами: b делит а; Ь — делитель а; а есть кратное для Ъ. Из определения делимости ясно, что число О делится на любое целое число, в том числе и на 0, но ни одно целое число, отличное от нуля, на нуль не делится. Ясно также, что любое целое число а делится на а, —а, 1 и —1. Эти числа называются несобственными, или тривиальными, делителями числа а. Осталь- Остальные же делители, если они есть, называются собственными, или нетривиальными. Запишем теперь в виде предложений (слово «предложение» зна- значит то же, что слово «теорема», — это высказывание, которое долж- должно быть доказано; мы будем пользоваться словом «теорема» только тогда, когда нужно подчеркнуть важность содержания) некоторые простейшие свойства делимости. Предложение 1. Если два целых числа аи Ь делятся на це- целое число с, то их сумма и разность тоже делятся на с. Доказательство. Имеем а = eg, b = ch, где g и h — целые числа, ибо а и Ь делятся на с. Тогда a ±b = eg ± с/г = c(g ±h). Числа gzth целые. Следовательно, числа а±Ь делятся на с.
8 ЦЕЛЫЕ ЧИСЛА [ГЛ. I Предложение 2. Если целое число а делится на целое число Ь и k — целое число, то ak делится на Ь. Доказательство. Имеем а = btn при целом т, ибо а де- делится на Ь. Тогда ak = bmk. Число mk целое. Следовательно, ak делится на Ь, что и требовалось доказать. Это предложение можно сформулировать и так: если с делится на а и а делится на Ь, то с делится на Ь. Действительно, «с де- делится на а» значит то же самое, что с = ak при целом k. 2. Деление с остатком. Всем хорошо известно, что если деление целых чисел не выполняется «нацело», то возможно деление «с остатком». Придадим этому высказыванию точный смысл в виде следующей теоремы. Теорема 3. Пусть a, b eZ (т. е. а и b являются целыми чис- числами) и b ф 0. Существуют целые числа q {неполное частное) и г (остаток) такие, что а = bq -f- г иО^г^|6|— 1. Эти требова- требования однозначно определяют q и г. Доказательство. Положим сначала, что b > 0. Рассмо- Рассмотрим рациональное (не обязательно целое) число а=-т-. Если оно целое, то положим q = а. Если же а не целое, то найдутся два соседних целых числа, в промежуток между которыми по- попадает а. Меньшее из них обозначим через q. Тогда q < а < q -\- 1. Итак, в обоих случаях мы нашли целое число q такое, что q^-r < <7 + 1- Умножим все три части этого двойного неравен- неравенства на Ь. Так как Ь > 0, знаки неравенства должно сохранить: bq ^ а < bq + b, откуда О^а — bq<Cb. Положим а — hq — r. Это целое число, и, так как г < Ь, а числа г и b оба целые, должно выполняться более сильное неравенство г ^ b — 1. Итак, a — bq-T-rnQ^r^b — 1. Пусть теперь b < 0. Тогда Ь = —|Ь|. Применив предыдущее \Ь й ' найдем целые числа q' и г такие, \П ' у р построение к числам а и \Ь q что а = q'\b\-\- г, О^г^ Ь\—1. Полагая q' = —q, получим a — q(—\b\)-\- r — qb -\- г, 0^r^|ft|—1. Тем самым существо- существование q и г доказано как для положительных, так и для отрица- отрицательных Ь. Остается доказать единственность чисел q и г. Пусть а = = bq\ + ги 0<л <|Ь|—1, и а = bq2 + ri, 0<r2<|b|—1, при- причем, разумеется, числа a, b, q\, qt, r\, r2 — все целые. Тогда bqx -+- + т\ = bq2 + r2, b(qi — q2)=r2 — ru Положим, что q\^q2. Тогда \r2 — n\ = \b\-\qi — q2\^\b\, ибо \qi — q2]^i- С другой сто- стороны, самое большее возможное значение для гч — гх есть |&| — — 1 — 0 ===== |*| — 1, самое меньшее: 0 —(|Ь|—1) = —(|6|—1). Таким образом, — [\Ь\— 1)< г2 — г, =^|Ь|— 1, откуда \г2 — г;| < ^\Ь\—1, что противоречит установленному ранее \г2 — r\\~^\b\. Мы пришли к противоречию, доказывающему неверность сделан-
« jj ТЕОРИЯ ДЕЛИМОСТИ ЦЕЛЫХ ЧИСЕЛ 9 ного предположения q\ ф Цг. Следовательно, Ц\ — Цг, а тогда и /¦j == п. Теорема доказана. Замечание. По ходу доказательства мы использовали то обстоятельство, что для любого вещественного а (у нас а было рациональным) найдется целое q такое, что q ^ a < q -f- 1. Такое число q называется целой частью а и обозначается [а]. Напри- Например, [5] = 5, [л] = 3, [-2, 7] = -3. 3. Наибольший общий делитель. Пусть а и Ь — два целых числа, из которых по крайней мере одно отлично от нуля. Наи- Наибольшим общим, делителем чисел а и b называется наибольшее натуральное число d, являющееся делителем как для а, так и для Ь. Например, наибольший общий делитель чисел —6 и 10 равен 2, наибольший общий делитель чисел —6 и 0 есть 6, наибольший общий делитель чисел —6 и 5 равен 1. Наибольший общий делитель чисел а и b обозначается н.о.д.(а, Ь) или просто (а, Ь); последнее обозначение приме- применяется только в случае, если в том же контексте символ {а, Ь) не используется в каком-либо другом смысле (например, координаты точки на плоскости или скалярное произведение векторов а и Ь и т. д.). Важное свойство наибольшего общего делителя сформулиро- сформулировано в следующей теореме. Теорема 4. Пусть а, Ь — целые числа, одно из которых от- отлично от 0, и пусть d — ux наибольший общий делитель. Тогда A) существуют целые числа и0, vo такие, что d = ащ + bva\ B) если d' — какой-либо общий делитель чисел а и Ь, то d делится на d'. Доказательство. Рассмотрим бесконечное множество М целых чисел, состоящее из чисел аи + bv, где и и v независимо друг от друга пробегают все целые числа: М = {аи -f- + bv\u, v e Z}. Множество М содержит число а, оно получается при « = 1, v = 0; М содержит Ь (при и = 0, и = 1); М содержит 0 (при и = 0, v = 0) и бесконечно много других целых чисел. Установим, что если два числа х и у принадлежат М и у Ф 0, то остаток при делении х на у тоже принадежит М. Действи- Действительно, хеЛ1 и у^М значит, что х — ащ + bv\, у = аи% + bv2 при некоторых целых щ, v{, ы2, v2. Пусть х = yq + r, q, r e Z и 0^ г <^\у\— 1, так что г есть остаток при делении х на у. Тогда ? + b ( + b) ( ) + b( ) ? xyq аи\ + bvi q(au2 + bv2) a(ui q Числа щ — qu2 и v\—qv2 целые, следовательно, г^М. Выберем теперь в множестве М наименьшее положительное число d. Покажем, что а и b делятся на d. Пусть т\ — остаток пРи делении а на d. Так как and принадлежат М, то, в силу только дао сказанного, гх принадлежит М. Но 0 ^ rx < d, a d — наименьшее положительное число, содержащееся в М. Следова-
10 ЦЕЛЫЕ ЧИСЛА [ГЛ. I тельно, г\ не может быть положительным числом, так что гх = 0. Это значит, что а делится на d. Те же соображения приводят к выводу, что Ь делится на d. Таким образом, d есть общий дели- делитель а и Ь. Далее, так как deM, существуют целые и0 и у0 та- такие», что d = auo-\- bv0. Пусть теперь d' — какой-либо общий де- делитель для а и Ь. Из равенства d — auo + bvo заключаем, что d делится на d', ибо оба слагаемых правой части равенства делятся на d'. Поэтому d ^ d!', так что d есть наибольший общий делитель. По ходу рассуждения оказались доказанными оба утверждения теоремы. 4. Алгорифм Евклида. Метод доказательства теоремы 2 очень быстро приводит к цели, но он не дает средства для фактиче- фактического вычисления d. Предлагаемый способ — найти наименьшее натуральное число в бесконечном множестве чисел М — совер- совершенно не эффективен. Однако деление с остатком позволяет быстро «спускаться» внутри М к наименьшему натуральному числу, содержащемуся в М, т. е. к наибольшему общему дели- делителю. Именно, поделим с остатком а на b (считаем, что ЬФО), затем b на первый остаток, затем первый на второй и т. д. Полу- Получим цепочку равенств и неравенств: a = bq\ + ru 0 < п ^\Ь\— 1, b — rxq2-\-r2, 0 < г2 =?Г Г\ — 1 и т. д. Каждый последующий остаток есть натуральное число, строго меньшее предыдущего. Поэтому процесс не может продолжаться без конца. Но закончиться он может только на том, что на ка- каком-то шагу деление выполнится без остатка.' Таким образом, Ь = rxq2 + r2, 0 < г2 < гх — гъ, 0<г3<г2— /*:_я = /*_!?* +г», 0<r*<rfc_,—1; Покажем, что последний отличный от нуля остаток ги равен н.о. д. (а, Ь). Для этого сначала пересмотрим все равенства снизу вверх: Гк-\ делится на rk, гк~г, как сумма двух чисел, делящгьхся на ги, тоже делится на гк и т. д. К третьему сверху равенству мы придем, зная, что г2 и г3 делятся на rk, и заключим отсюда, что г\ делится на г*. Из второго заключим, что Ь делится на г-,, из первого — что а делится на rk. Таким образом, а и b делятся на /•«. Пусть теперь d' — какой-либо общий делитель для а и Ь. Пе- Пересмотрим равенства сверху вниз с точки зрения делимости на d'. Из первого равенства заключаем, что г\ как разность двух чисел, делящихся на d', делится на d'. Из второго — что г2 делится на d' no той же причине, и т. д. Из предпоследнего заключим, что
§ 1] ТЕОРИЯ ДЕЛИМОСТИ ЦЕЛЫХ ЧИСЕЛ И гк делится на d' и, следовательно, rk ^ d'. Итак, Гк оказывается общим делителем, причем наибольшим. Изложенный способ отыскания н.о.д. называется алгорифмом Евклида, он известен уже более 2 000 лет. В процессе доказатель- доказательства мы вновь установили свойство B) н. о. д. Далее, из сказан- сказанного ранее ясно, что все остатки Г\, гг, ..., Гь. принадлежат мно- множеству М, что дает доказательство и свойства A), причем пред- представление остатков в виде аи + bv легко осуществляется шаг за шагом. Таким образом, алгорифм Евклида дает не только способ вычисления н.о.Д. чисел а и Ь, но и его линейное представление в виде аио + bv0. Пример. Пусть а = 959, b = 343. Найти их н.о.д. и найти его линейное представление. Решение: 959 = 343-2 + 273; 343 = 273-1 + 70; 273 = = 70-3 + 63; 70 = 63-1 +7; 63 = 7-9 + 0. Таким образом, d = 7. Далее, 273 = 959 — 343-2; 70 == 343 — 273-1 = 343— (959 — — 343-2) -1 =343-3 — 959; 63 = 273 — 70-3 = 959 — 343-2 — — C43-3 —959)-3=959-4 — 343-11; 7 = 70 — 63 = 343-3 — 959 — — (959-4 —343-11) = 343-14 — 959-5. Таким образом, 7=959-ио + + 343• vo при «о = —5; Vq = 14. 5. Взаимно простые числа. Два целых числа называются взаимно простыми, если их н.о.д. равен 1. Ясно, что если d есть наибольший общий делитель целых чисел а и Ь, то -j и — суть целые взаимно простые числа. Действи- Действительно, то, что эти числа целые, следует из того, что d — общий делитель для а и Ь. Если б —наибольший общий делитель -г и ^-, то а и b делятся на db, откуда следует, что 6=1, иначе d не был бы наибольшим общим делителем для а и Ь. Предложение 5. Для того чтобы целые числа а и b были взаимно простыми, необходимо и достаточно существование це- целых чисел «о. Vq таких, что аио + bvo = 1. Предложение 5 можно сформулировать и в других терминах: для того чтобы неопределенное уравнение аи + bv = 1 имело ре- решение «о, Vo в целых числах, необходимо и достаточно, чтобы а и b были взаимно просты. Доказательство. Пусть а и b взаимно просты. Тогда их н.о.д., равный 1, имеет линейное представление: 1 = аи0 + bv0. Пусть теперь существуют ц0 и v0 такие, что а«о + bv0 = 1. Тогда н.о.д.(а, Ь) делит а«о и bvo, a следовательно, и их сумму, рав- равную 1. Но 1 не имеет натуральных делителей, кроме 1, так что н-°-д.(а, Ь) равен 1. Предложение доказано полностью. Предложение 6. Если целые числа аи а% взаимно просты с целым числом Ь, то их произведение а\п2 тоже взаимно про- просто с Ь.
12 ЦЕЛЫЕ ЧИСЛА [ГЛ. I Доказательство. Существуют целые щ, vit ы2, t>2 такие, что aiui + bvi== I, a2u2 + bv2=l в силу предложения 5. Пере- Перемножая эти равенства, получим после очевидных преобразований -f- b (a1UiV2 + a2u2v i + bv\V2) = 1, откуда, в силу того же предложения, числа а\а2 и b взаимно про- просты, ибо и\и2 и a\U\v% -\- a2u2v\ -f- bv\V2 — целые числа. Предложение 7. Если целые числа а\, а2, ..., ак все вза- взаимно просты с Ь, то произведение а\<х2 ... ак тоже взаимно просто с Ъ. Доказательство. Применим метод математической ин- индукции. При k = 2 предложение верно в силу предложения 6. До- Допустим, что оно верно для произведения k — 1 множителей, и в этом предположении докажем его для k множителей. Запишем a\u2 ... ак как п\(а2 ... ак). Первый множитель а\ взаимно прост с b по условию. Второй а2 ... ак взаимно прост с b в силу индук- индуктивного предположения. Следовательно, мы можем применить предложение 6 и заключить, что п\п2 ... ак взаимно просто с Ь, что и требовалось доказать. Предложение 8. Если целые числа а\, ..., ак и Ь\, ..., Ьп таковы, что каждое число a,, i= 1, ..., k, взаимно просто с каж- каждым числом bj, /= 1, ..., пг, то их произведения а\ ...о* и Ь\ ... bm взаимно просты. Доказательство. Применив m раз предложение 7 к чис- числам аь ..., ak и bj, /= 1, •.., пг, получим, что числа Ьи ..., bm взаимно просты с числом а\ ... ak. Применяя еще раз предложе- предложение 7, получим, что Ь\ ... bm взаимно просто с а\ ... ak, что и требовалось доказать. Предложение 9. Если целые числа а и b взаимно просты, то при натуральных k и пг числа ak и bm тоже взаимно просты. Для доказательства достаточно в предложении 8 положить а\ — ... = ак = а, Ь{ — ... = bm = b. Предложение 10. Если произведение ab двух целых чисел а и b делится на целое число с и первый множитель а взаимно прост с с, то b делится на с. Доказательство. По условию а к с взаимно просты, так что существуют целые и0 и v0 такие, что auQ-\- cvo= 1. Умножив это равенство на Ь, получим abuo-\- cbvo = b. Первое слагаемое левой части делится на с по условию, второе делится на с три- тривиальным образом. Следовательно, и их сумма b делится на с, что и требовалось доказать. Предложение 11. Если целое число а делится на целые взаимно простые числа Ь\ и Ь2, то а делится и на их произведение. Доказательство. Пусть а = Ь\С при целом с. По условию а делится на b2, a bi взаимно просто с Ь2. Следовательно, согласно предложению 8 число с делится на Ь2, т. е. с = b2m при целом т. Поэтому а = {Ьф2)т, что и требовалось доказать.
SH ТЕОРИЯ ДЕЛИМОСТИ ЦЕЛЫХ ЧИСЕЛ 13 Установленные предложения очень просты и кажутся почти тривиальными. Тем не менее из них можно вывести некоторые не совсем тривиальные следствия. Выведем, например, что степень с натуральным показателем дробного рационального положительного числа не может быть це- целым числом. Действительно, пусть а/Ь— дробное рациональное число с це- целым'положительным знаменателем бис целым числителем а. Без нарушения общности можно считать, что числитель и знаменатель взаимно просты, этого можно добиться за счет сокращения на наибольший общий делитель. Пусть это выполнено. Ясно, что Ь > 1, иначе а/Ь было бы целым. Пусть т — натуральное число. Тогда {а/Ь)т — ат/Ьт. В силу предложения 7 ат и Ьт взаимно просты. Поэтому ат не может делиться на Ьт, так что ат/Ьт не является целым числом. Из доказанного следует далее, что если целое положительное число с не является m-й степенью целого числа (при натураль- натуральном т), то оно не является m-й степенью дробного рационального т числа. Поэтому л/с есть либо целое число, либо иррациональное. Так, числа л/% д/3, л/Ъ, л/б, -\/7, -\/8, VlO, ... (пропускаются целые -yfi, л/9, ...) все иррациональны, также иррациональны и числа л/2, ^3, ^4, ^5, ^6, л/~7, л/ъ, <^Гб, ... (пропу- (пропускаются целые -у 8, "$27, ...) и т. д. 6. Простые числа. Целое положительное число, большее единицы, называется простым, если оно не имеет целых положительных де- делителей кроме себя и единицы. Так, числа 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97 простые, а числа 4, 6, 8, 9, 10, 12, 14, ... нет. Непростые числа 4, 6, ... назы- называются также составными. Число 1 не относится ни к простым, ни к составным числам. Предложение 12. Всякое целое число, большее 1, делится по крайней мере на одно простое число. Доказательство. Пусть п > 1 — целое положительное число. Если оно простое, предложение верно, ибо п всегда делится на себя. Если оно составное, то оно делится на число П\ > 1, меньшее чем п. Если п\ простое, предложение доказано: п делится на пи Если нет, то оно делится на меньшее чем П\ число п2 и т. д. Процесс выделения делителей п> щ> п2> ... оборвется че- через конечное число шагов, а оборвахься он может только на том, что мы придем к простому делителю rik. Предложение доказано. - Простых чисел существует бесконечно много. Это непосред- непосредственно вытекает из следующего предложения. Предложение 13. Каково бы ни было конечное множество простых чисел {puPi, ..., р*}, всегда найдется простое число, не яринадЛежащее этому множеству.
Н ЦЕЛЫЕ ЧИСЛА 1ГЛ I Доказательство. Рассмотрим число л = р^р2 ... рк + I. В силу предложения 12 оно делится по крайней мере на одно про- простое число р. Это число р не может совпадать ни с одним из чисел Рь р2, '¦ ¦ ¦, Pk- Действительно, если р = pt, то 1 делится на pt как разность двух чисел, делящихся на р,-, что невозможно. Это рассуждение было известно еще Евклиду. Предложен-ие 14. Если целое число п не делится на про- простое число р, то п и р взаимно просты. Доказательство. Пусть d = (п, р). Так как р делится на d и р простое, для d имеются только две возможности: d = p или d== 1. В первом случае п делится на р, во втором п и р взаимно просты, что и требовалось доказать. Из предложения 14 вытекает следующее утверждение. Предложение 15. Если р\ и р2 — два различных простых числа, то они взаимно просты. Действительно, меньшее из них не делится на большее, и, сле- следовательно, они взаимно просты. Предложение 16. Если произведение двух целых чисел делится на простое число, то по крайней мере один из сомножи- сомножителей делится на это простое число. Действительно, пусть ab делится на р, где a, 6eZ, p — про- простое. Если а делится на р, то предложение справедливо. Если а не делится на р, то а и р взаимно просты, а тогда, согласно предложению 10, Ь делится на р. Это предложение легко обобщается. Предложение 17. Если произведение нескольких целых чи- чисел делится на простое число, то на него делится хотя бы один из сомножителей. Доказательство. Применим метод математической индук- индукции по числу сомножителей. База есть —предложение верно для двух сомножителей. Допустим, что оно верно для произведения k—1 сомножителей. Пусть теперь а\а2 ... ak делится на простое число р. Так как aia2 ... ak = a\{a2 ... ak), заключаем на основании предложения 14, что либо ot делится на р, либо произ- произведение аг ••• ctk делится на р. Во втором случае, в силу индук- индуктивного предположения, один из сомножителей а2, ..., ак де- делится на р, а в первом а\ делится на р. Тем самым предложение доказано. Теперь мы в состоянии доказать основную теорему теории де- делимости целых чисел. Теорема 18. Каждое натуральное число, большее единицы, может быть представлено в виде произведения простых сомножи- сомножителей, и два таких разложения могут отличаться только порядком следования сомножителей. Доказательство. Применим метод индукции. Для числа 2 утверждение теоремы тривиально (так же, как и для всякого про- бтого числа). Допустим, что теорема верна для всех натуральных
j2) ТЕОРИЯ СРАВНЕНИЙ 15 чисел, меньших п, и в этом предположении докажем ее для числа п. В силу предложения 12 число п делится на некоторое простое число р\, так что п =» pirti, причем п\ < п. Если п\ = 1, то п есть «произведение» одного сомножителя рь Если т > 1, то в силу индуктивного предположения щ допускает разложение на простые сомножители: п, = р2 ... pk, и тогда п = р\Рг ¦ ... Рк. Возмож- Возможность разложения доказана. Докажем однозначность разложения с точностью до порядка следования сомножителей. Пусть п = р\р% ... рк = q\q% ... Qi, где все числа р\, рг, ..-, Рк, q\, q-i qi простые. Из этого ра- равенства следует, что произведение q\q% ... qi делится на р\. В силу предложения 15 один из сомножителей q\, q2, ¦¦¦, qi должен де- делиться на р\ и в силу простоты qu q2, ..., qi совпадать с р\. Без нарушения общности, за счет изменения нумерации сомножителей второго разложения, мы можем принять, что q\ = ри так что PiP2 • • ¦ Pk — Pi<72 ..- qi, откуда р2... рк = qi ¦. ¦ qu Ho p2.--Pk~ = nfp\ <C п. Поэтому можно применить индуктивное предположе- предположение, так что / = k, и простые числа <7г, ¦ • •, <7* отличаются от р2, ..., pk только порядком следования. Теорема доказана. Среди сомножителей в разложении п = pip2 ... р* могут быть равные. Их принято объединять в виде степеней. Разложение в форме n = paipa2 ... рат при попарно различных р\, р2, ..., рт называется каноническим разложением натурального числа п. Ка- Каноническое разложение распространяется на все целые числа, кроме 0, в форме где ссо принимает значения 0, 1. Далее, каноническое разложение может быть распространено на дробные рациональные числа, если допустить отрицательные значения для аь ..., ат- Чтобы получить каноническое разложе- разложение для дробного рационального числа, нужно написать разложе- разложения для числителя и знаменателя и выполнить деление одного на другое, употребляя, в случае надобности, отрицательные показа- показатели. Так, -Ц = 2~1325-17, —^- = (— 1) 2-J3~353. Теорема об однозначном разложении целых чисел на простые множители играет исключительно большую роль в теории чисел. § 2. Теория сравнений Пусть т — данное натуральное число. Все целые числа по от- отношению к числу т естественно разбиваются на т классов, если отнести к одному классу числа, дающие один и тот же остаток ПРИ Делении на т. Так, если т = 2, целые числа разбиваются на
16 ЦЕЛЫЕ ЧИСЛА |ГЛ. I классы четных и нечетных чисел. Если т = 3, классы в этом смысле составляют числа вида 3k, 3k + 1, 3k + 2 при целых k и т. д. Числа, относящиеся к одному классу, называются сравнимыми, и изучение свойств классов носит название теории сравнений. Пе- Переходим к точным определениям относящихся сюда понятий. 1. Определение и простейшие свойства. Пусть т — натураль- натуральное число. Два целых числа а и Ь называются сравнимыми по мо- модулю т, если их разность а— b делится на т. Высказывание «а и b сравнимы по модулю т» записывается в виде а=6 (mod m). Предложение 1. а == a(modm); далее,если a = fe(modm), го b = a(modm); если a = 6(modm) и Ь нз c(modm), to a s= c(modm). Действительно, а — а = О делится на любое число; если а — b делится на т, то и й — а делится на т; если а — b и b — с делятся на пг, то а — с = (а — b)-\- (b — с) тоже делится на т. Именно эти свойства сравнений позволяют заключить, что каж- каждое целое число попадает в один и только один класс попарно сравнимых между собой целых чисел. Эти классы называются клас- классами вычетов по модулю m или просто классами по модулю т. Предложение 2. Каждое целое число сравнимо по модулю т с одним и только одним из чисел ряда 0, 1, ..., m — 1. Действительно, пусть а — некоторое целое число. Поделим его на т с остатком: а = mq + г, О^л^т — 1. Ясно, что а = ==r(modm), ибо а — г = mq делится на т. Итак, каждое целое число а сравнимо со своим остатком при делении на т. Остается показать, что среди чисел 0, 1, ..., т—1 нет сравнимых по мо- модулю т. Но это ясно — если взять два различных целых числа этого ряда и вычесть из большего меньшее, мы получим в качестве разности положительное число, меньшее чем т, и, следовательно, эта разность не делится на т. Предложение доказано. В процессе доказательства мы убедились,, что каждый класс по модулю т действительно состоит из чисел, дающих один и тот же остаток при делении на т. Любая совокупность чисел, взятых по одному из каждого класса по модулю т, называется полной системой вычетов по модулю т. Например, числа 0, 1, ..., m—1 образуют полную систему вы- вычетов. Полной же системой вычетов будет 1, 2, ..., т; при нечет- нечетном m = 2k-\-l полной системой вычетов будет —k, ..., —1, О, 1, ..., k, и т. д. Предложение 3. Если а\ = a2(mod m) и b\ = &2(modm), to а, ± Ь\ == а2 ± &2(mod m). Доказательство. Если а\ s=s a2(modm) и bi = 62(niod m), то а\ — а2 и bi — b2 делятся на ш, а следовательно, и aidhfti — — (a2±b2) = (ai — a2)±(bi— b2) тоже делится на m, т. е. -щ ± ±6. з= ач ± b2 (mod m). Предложение 4. Если ai = a2(modm) и b{^ b2{modm), то = a262(niodm).
2] ТЕОРИЯ СРАВНЕНИЙ 17 Доказательство. a\b\ — a2b2 = a\bi — афг + а\Ьг — — a2b2 = Q\{b\ — 62) + {а\ — аг)й2. Если ai = a2 и &i==?2(mod/n:}, то оба слагаемых делятся на пг, а с ними и их сумма а\Ь\ — a2b%. Следовательно, a\b\ = a262(modm), что и требовалось доказать. В частности, если ai = a2(modm) и с — любое целое число, то а\с = a2c(mod m). Предложение 5. ?Ъш са\ з= ca2(modm) и число с взаимно просто с пг, то ai = a2(mod m). Действительно, если ссц =з ca2(modtn), то cai — саг = = c(«i—a2) делится на т, с взаимно просто с m и согласно пред- предложению 8 а\ — а2 делится на пг, что и требовалось доказать. Таким образом, обе части сравнения можно сократить на мно- множитель, взаимно простой с модулем. Без предположения о взаим- взаимной простоте это, вообще говоря, делать нельзя. Так, 2 == 6 (mod 4), но 1 =?3(mod4). 2. Действия над классами. Пусть m = 6. Представим себе, что числа, сравнимые с нулем, мы записываем черными цифрами, сравнимые с единицей — красными, сравнимые с 2 — желтыми, сравнимые с 3 — фиолетовыми, сравнимые с 4 — зелеными и срав- сравнимые с 5 — синими. Тогда предложения 3 и 4 можно переформу- переформулировать так: цвет суммы двух чисел зависит только от цветов слагаемых, но не от того, как выбраны эти слагаемые внутри своих классов. То же относится к разности и к произведению. На- Например, складывая «желтое» число с «синим», мы всегда получим «красное». Умножая «синее» на «фиолетовое», мы всегда получим «фиолетовое», и т. д. Сокращенно это можно записать: ж + с = к; с-ф = ф и т. д. Для шести символов: ч, к, ж, ф, з, с мы можем записать «суммы», «разности» и «произведения», руководствуясь сложением, вычитанием и умножением чисел (все равно каких), взятых из соответствующих классов. То же самое имеет место при любом т. Для того чтобы ука- указать класс, к которому принадлежит сумма, разность или произ- произведение двух чисел, нам достаточно знать классы, к которым эти числа принадлежат, а как они выбраны внутри классов — на ре- результате не сказывается. Это обстоятельство делает естествен- естественными следующие определения. Суммой двух классов по модулю пг называется класс по мо- модулю ш, к которому принадлежит сумма каких-либо чисел из сла- слагаемых классов. Произведением двух классов по модулю пг называется класс по модулю пг, к которому принадлежит произведение каких-либо чисел из перемножаемых классов. В силу предложений 3, 4 эти определения корректны — какие бы числа из двух данных классов мы ни выбрали, их сумма и их произведение будут принадлежать вполне определенным классам, не зависящим от выбора чисел внутри данных классов.
18 ЦЕЛЫЕ ЧИСЛА [ГЛ. I Пример. Приведем «таблицы умножения» для классов по модулю 7 и 8. Таблица 1 ш=7 0 1 2 3 4 б 6 0 0 0 0 0 0 0 0 1 0 1 2 3 4 5 6 2 0 2 4 6 1 3 5 3 0 3 6 2 5 1 4 4 0 4 1 5 2 6 3 5 0 5 3 1 6 4 2 6 0 6 5 4 3 2 т Табл ] /и=8 0 1 2 3 4 5 6 7 <ца 0 и 0 0 0 0 0 0 б 2 1 0 1 2 3 4 5 6 7 2 0 2 4 6 0 2 4 6 3 0 3 6 1 4 7 2 5 4 0 4 0 4 0 4 0 4 5 0 5 2 7 4 1 6 3 6 0 6 4 2 0 6 4 2 7 0 7 в 5 4 3 2 I Символы 0, 1, 2, 3, 4, 5, 6 в табл. 1 обозначают классы по модулю 7, которым принадлежат числа 0, 1, 2, 3, 4, 5, 6. Значение символов в табл. 2 — аналогично. Такими обозначениями мы будем пользоваться и впредь — символ а будет обозначать класс по мо- модулю (который предполагается заданным), содержащий число а. Рассмотрение классов по модулю как объектов, над которыми совершаются действия, часто вызывает у начинающих некоторое затруднение. Иногда оно вызывается тем, что класс это не число, а бесконечное множество чисел, и сама мысль о том, что действие над классами суть действия сразу над бесконечными множествами чисел, кажется противоестественной. Для преодоления этого пси- психологического барьера следует мыслить вместо класса одно из чисел этого класса, но безразлично какое, как бы отказываясь различать их одно от другого, как бы «склеивая» их в один объект. Собственно говоря, это обычный и привычный в обыден- обыденной жизни путь формирования абстрактного понятия. Говоря слово «яблоко», мы отвлекаемся от особенностей конкретных представителей этого класса предметов и подразумеваем некото- некоторое яблоко, все равно какое. Нам привычно, говоря «яблоко», не вызывать в воображении множество всех имеющихся на земле в данный момент яблок. Так же надо относиться к понятию «класс по модулю т». Отметим некоторые очевидные свойства действий над классами по модулю. 1. (а + Б) + с = а + (Б + с) (ассоциативность сложения). Действительно, (а + В) + с есть класс, содержащий (а+ 6)+ с, a a + E + с) есть класс, содержащий a+(fc + c). Но (а-{-Ь) + -f- с = а -\~(Ь + с), откуда и следует требуемое. 2. а-\-Б = 5 + а (коммутативность сложения).
j 21 ТЕОРИЯ СРАВНЕНИИ 19 3. Класс 0 играет роль нуля при сложении: а + б=а при любом а. 4. Класс —а. играет роль класса, противоположного классу а, именно, а + ( — а)_= О" 5. а(Ь + с) = ab + ас; 5'. (b -f- с)а == &а + са (дистрибутивность). 6. аEс) = (аб)с (ассоциативность умножения). 7. аВ — Ба (коммутативность умножения). Свойства 3 и 4 очевидны. Свойства 2, 5, 6, 7 доказываются точно так же, как свойство 1, посредством перехода от классов к любым числам из этих классов, для которых соответствующие свойства действий имеют место. 8. Класс I играет роль единицы при умножении классов, имен- именно, о • 1==а при любом а. 3. Приведенная система вычетов и примитивные классы. Предложение б. Пусть d = н. о. д.(а, пг) и ai = a{moAm). Тогда н.о. д. (а\, m) = d. Доказательство. Имеем ct\ — a-\-mq при некотором ^eZ, так что d есть общий делитель для а\ и пг, и потому d^du где d{ = н. о. д.{аи ш). С другой стороны, а = а.у — mq, откуда следует, что d\ является общим делителем для а я пг, так что d\ ^ d. Отсюда заключаем, что d\ = d. В частности, если одно из чисел класса по модулю m взаимно просто с пг, то w все числа этого класса взаимно просты с т. Классы, состоящие из чисел, взаимно простых с модулем, на- называются примитивными классами. Для любого модуля примитив- ные классы существуют; такими будут, в частности, классы 1 и т—1. Предложение 7. Для того чтобы сравнение ах = 1 (mod m) имело решение, необходимо и достаточно, чтобы а было взаимно просто с ш. Доказательство. Необходимость. Пусть сущест- существует целое число хо такое, что ахо = l(modm). Число 1 взаимно просто с пг, значит (предложение 6), число ах0 взаимно просто с т, откуда а взаимно просто с т, что и требовалось доказать. Достаточность. Пусть а взаимно просто с т. Тогда, со- согласно предложению 5 § 1, существуют целые числа и и v такие, что аи -f- mv = 1. Ясно, что аи = 1 (mod ni), так что и есть решение сравнения ах = l(modm). Предложение 7 можно в терминах классов сформулировать так: для того чтобы класс а имел обратный а~1, т. е. такой, что аи — 1, необходимо и достаточно, чтобы класс а был прими- примитивным. Ясно, что если х0 — решение сравнения ах = l(modm), то все сравнимые с хо числа тоже доставляют решения, так что решение «приводит за собой» весь класс, его содержащий. В этом смысле
20 ЦЕЛЫЕ ЧИСЛА 1ГЛ. I . решений бесконечно много. Однако класс решений существует только один. Действительно, если ахо= 1 (mod m) и ах\ = = l(modm), то ах0 = ахх{тоАт), и в силу взаимной простоты а и пг, Хо = xi(mod пг). В терминах классов: обратный класс а~1 к примитивному классу а существует только один. Число примитивных классов по модулю т обозначается <f(m). Так определенная функция называется функцией Эйлера. Ясно, что фA)= 1. Для т> 1 (р(т) равно, очевидно, числу взаимно простых с т чисел ряда 0, 1, ..., пг—1. Так, фB)= 1, фC) = 2, срD) = 2, фE) = 4, фF) = 2, фG) = 6, ф(8) = 4 и т. д. Если модуль есть простое число р, то все классы, кроме нуле- нулевого, примитивны, так что ф(р) = р— 1. Предложение 8. Сравнение ах = b (mod т), если а взаим- взаимно просто с пг, имеет единственный класс решений. Доказательство. Пусть а' — решение сравнения ах == ^l(modm). Ясно, что а'Ь есть решение сравнения ax^b(mod m), ибо а {а'Ь) = аа'-Ь = 1 -b(mod пг). Если х0 — какое-либо решение сравнения ах = b (mod m), т. е. ai0 = &(modm), то а'ахо = ^ а'Ь (mod пг), откуда хо ^ а'Ь (mod m), ибо a'a ^s I (mod m). В терминах классов предложение 8 означает, что возможно деление на примитивный класс: уравнение ах = Б имеет единствен- единственное решение х = arlb. Если модуль m есть простое число, то все классы, кроме ну- нулевого, примитивны, так что в этом случае возможно деление на любой классу кроме нулевого. Имеет место следующая теорема, носящая имя Эйлера. Теорема Эйлера. Если а и m взаимно просты, то а<есп) == 1 (mod m). Доказательство. Пусть а\, а2, ..., ак — числа, взятые по одному из каждого примитивного класса, так что k — ф(т). Пусть а взаимно просто с т. Тогда числа ааи аа2, ..., aak тоже вза- взаимно просты с т, т. е. принадлежат примитивным классам. Все они попарно несравнимы между собой. Действительно, если аа-,.^ = aa/(mod m), то в силу предложения 5 a,- = a;-(mod m), что воз- возможно только если at и а-, равны. Итак, числа ааи аа2, ..., aak лежат в разных классах и, так как их число равно числу классов, среди них имеется по одному из всех классов («10 человек в 10 комнатах, ни в одной нет двоих, следовательно, все комнаты заняты»). Поэтому числа аа\, аа2, ..., aak сравнимы с а,\, а2, ... ..., аи, расположенными, быть может, в другом порядке. Запи- Запишем это: аа2 == ah, (mod m) аак = aih.
, 3] НЕКОТОРЫЕ ОБЩИЕ ПОНЯТИЯ АЛГЕБРЫ 2t Здесь /ь '2, •¦•. ik — те же числа 1, 2, .... k, но в другом порядке. Перемножив эти сравнения, получим .. ak=aixai2 ... aik (mod m). Но aixai2 ... aih = a]a2 ... ak, так как сомножители различаются только порядком. Итак, Число a\<xi ... ак взаимно просто с т, и на него можно сократить фбе части последнего сравнения. Поэтому ак = l(modm), и оста- остается- вспомнить, что k = ф(т). В терминах классов теорема Эйлера выглядит так: если а — примитивный класс по модулю т, то а^т) = 1. Важным частным случаем теоремы Эйлера является теорема Ферма: если р — простое число и а не делится на р, то ap~l ^ ее= l(modp). Она непосредственно следует из теоремы Эйлера, ибо <р(р)==р — 1. Теорему Ферма часто записывают в равносильной 4>орме ap = a(modp). В этой записи предположение о том, что а не делится на р, становится излишним. Теорема Эйлера дает возможность в явном виде записывать- •класс, обратный к данному примитивному классу. Именно, а~1 = '(>1 § 3. Некоторые общие понятия алгебры 1. Группы. В теории сравнений мы встретились с новым явле- явлением, имеющим большую принципиальную важность. Мы обнару- обнаружили математические объекты, именно, классы по модулю, не являющиеся числами, но над которыми мы имеем возможность- совершать алгебраические действия. Свойства этих действий на- напоминают свойства действий над числами. Подобного рода сн- хтемы объектов возникают в математике в разнообразных ситуа- ситуациях, и это делает естественной и необходимой формализацию Возникающих на этом пути более общих понятий. Полугруппой называется множество, в котором определено действие, сопоставляющее каждой упорядоченной паре элемеЕгтов третий—результат действия. Действие предполагается ассоциа- ассоциативным. Полугруппами являются: множество целых неотрицатель- неотрицательных чисел относительно действия сложения, то же множество от- "ноеительно действия умножения (это совсем другая полугруппа), множество классов по модулю относительно умножения. Во всех этих примерах действие коммутативно. Полугруппа называется группой, если в ней существует ней- нейтральный элемент е такой, что при всех а из группы а*е — = е * а = а (через * обозначен знак действия), и для каждого элемента а существует обратный а-1 такой, что а * а-1 = а-1 * а = е.
22 ЦЕЛЫЕ ЧИСЛА [ГЛ. 1 Примерами групп могут служить: группа всех целых чисел относительно сложения, группа положительных рациональных чи- чисел относительно умножения, группа классов по модулю относи- относительно сложения, группа примитивных классов по модулю отно- относительно умножения. Все эти группы коммутативны. В качестве примера некоммутативной группы рассмотрим множество непре- непрерывных строго возрастающих функций на [0, 1], со значениями <р@) = 0, фA)= 1, т. е. функций, осуществляющих взаимно одно- однозначные отображения промежутка [0, 1] на себя, по отношению к действию суперпозиции, т. е. подстановки функции в функцию, так что (ф*^) (x) = ф(ф(х)). Нейтральным элементом здесь яв- является функция ф(х) = х, осуществляющая отображение каждой точки промежутка на себя. Обратным элементом является об- обратная функция, ассоциативность очевидна. Рассмотрим функ- функции (pi = хг и ф2 = sin-^p. Обе они принадлежат рассматривае- рассматриваемому множеству. Далее, (ф, *ф2)(лс) = fsin-^уЛ , а (ф2*ф,)(л:) = = sin ___. Это разные функции, так чтоданная группа некоммута- некоммутативна. Коммутативные группы называются также абелевыми. Действие в группе обозначается обычно как умножение (муль- (мультипликативная запись), иногда как сложение (аддитивная запись). Аддитивная запись применяется только для абелевых групп. Ней- Нейтральный элемент при мультипликативной записи обозначается 1, при аддитивной записи 0. Соответственно, обратный к а элемент в мультипликативной записи обозначается а~1, в аддитивной — через —а (и называется противоположным элементом). 2. Кольца и поля. Кольцом называется множество математиче- математических объектов, в котором определены два действия — «сложение» и «умножение», сопоставляющие упорядоченным парам элемен- элементов их «сумму» и «произведение», являющиеся элементами того же множества. Предполагается, что действия удовлетворяют следую- следующим требованиям: 1. (а -\- Ь)-\- с = a -\-{b -f- с) (ассоциативность сложения). 2. а + b = b + а (коммутативность сложения). 3. Существует нулевой элемент 0 такой, что а + 0 = а при любом а. 4. Для каждого а существует противоположный —а такой, что а-\-(-а) = 0. 5. (а + Ь)с == ас-\-Ьс\ 5'. c(a + b) = ca + cb (левая и правая дистрибутивность). Первые четыре требования обозначают, что элементы кольца образуют абелеву группу относительно сложения, которая назы- называется аддитивной группой кольца. Выведем простейшие следствия из поставленных требований.
- 3) НЕКОТОРЫЕ ОБЩИЕ ПОНЯТИЯ АЛГЕБРЫ 23 Предложение 1. Если а + х = а + у, то х = у. Действительно, пусть а + х = а + У- Тогда (—а) + (а + х) = (_(—а) + (а + #). Воспользовавшись ассоциативностью, получим ((—а) + а)+ * = ((—а)+а) + #, O-fjc = O + j/, и, следователь- следовательно, * = у. Предложение 2. Яры данных а и b уравнение а-\- х = b имеет единственное решение (—а)-\-Ь. Действительно, если а + х — Ь, то (—а) + (а + х) — (—а)-\-Ь, O + jc = (—a) + b и л = (—а)-\-Ь. Обратно, если х = (—а)+6, то а + х = а + ((-а) + *>) = 0 + Ь = *>. Из предложения 2 следует единственность нуля и противопо- противоположного элемента, ибо 0 есть решение уравнения а + х = а, а —а есть решение уравнения а + х = 0. Предложения 1 и 2 верны для любой абелевой группы, а не только для аддитивной группы кольца. Предложение 3. а-0 = 0-а = 0 при любом а. Действительно, a-0 = a-@-f-0)=a-0-f-a-0, и, в силу пред- предложения 2, а 0 = 0. В общем определении кольца на действие умножения не накла- накладывается никаких ограничений кроме дистрибутивности со сло- сложением. Однако чаще всего возникает необходимость рассматри- рассматривать кольца, в которых умножение удовлетворяет тем или другим дополнительным естественным требованиям. Наиболее употребимыми являются: 6. (ab)c = a{bc) (ассоциативность умножения). При выполнении этого требования элементы кольца образуют по- полугруппу относительно умножения. 7. ab = ba (коммутативность умножения). 8. Существование единичного элемента 1 (т. е. такого, что а-1 = Ьа = адля любого элемента а). 9. Существование обратного элемента а~' для любого элемента а, отличного от 0. В конкретных кольцах эти требования могут выполняться как порознь, так и вместе в различных комбинациях. Кольцо назы- называется ассоциативным, если в нем выполнено условие 6, коммута- коммутативным, если выполнено условие 7, коммутативным и ассоциатив- ассоциативным, если выполнены условия 6 и 7. Если выполнено условие 8, говорят о кольце с единицей, снабжая слово «кольцо» прилага- прилагательным в зависимости от выполнения условий 6 и 7. Если в кольце есть единица, то она единственна. Действи- Действительно, если 1 и 1' — две единицы, то Ы'= 1, так как V — еди- единица, и 1-1'= 1', так как 1 —единица, поэтому 1 = 1'. Кольцо называется областью целостности, если из равенства «6 = 0 следует, что хотя бы один из сомножителей а или b ра- равен 0. Полем называется коммутативное ассоциативное кольцо с еди- единицей, в котором каждый отличный от нуля элемент а имеет
*l\ ЦЕЛЫЕ ЧИСЛА [ГЛ. t обратный а~1. Иными словами, поле есть кольцо, в котором отлич- отличные от нуля элементы образуют коммутативную группу. Эта груп- группа носит наавание мультипликативной группы поля. Любое поле есть область целостности. Действительно, если аЪ = О и а Ф О, то о-1 {ab) = а-'О = 0, и, следовательно, b = 0. Существуют поля, в котор«х некоторое целое кратное 1, т. е. /п-1 = 1 + 1+ ... +1, равно нулю. Наименьшее натуральное m число, обладающее этим свойством, называется характеристик кой поля. Характеристика поля всегда равна простому числу. Действительно, если т-1 = 0 и т = mitn2 при 1 <С Ш\ < т, то {ту 1) (ni2-1) = 0, откуда mi • 1 = 0 или пг2-1—0, так что m — не наименьшее натуральное. Поле вычетов по простому модулю р имеет, очевидно, характеристику р. Если же любое кратное единицы отлично от нуля, то говорят, что характеристика поля равна 0. Приведем теперь примеры. Множество Z всех целых чисел образует кольцо, коммутативное, ассоциативное и с единицей. Оно является областью целостности, но не полем. Полями являются множество Q всех рациональных чисел и множество. R всех ве- вещественных чисел. Классы по модулю тп образуют коммутативное ассоциативное кольцо с единицей. Оно называется кольцом вычетов по модулю пг. Если т —составное число, то это кольцо не будет областью це- целостности. Действительно, _если пг = m\m%, I <! tn\ <! tn, то /л, Ф б, пг2ф0, но m1m2 = m = 0- Если же m = р есть простое число, то кольцо вычетов по нему есть не только область целост- целостности, но даже поле. Действительно, предложение 7 § 2 утверж- утверждает, что все классы по модулю р, кроме нулевого, обратимы. В частности, кольцо вычетов по модулю 2, состоящее всего-на- всего-навсего из двух элементов 0 и 1 (классы четных и нечетных чисел), является полем. Это поле, несмотря на свою крайнюю простоту, оказывается важным для некоторых приложений. Все правила и формулы элементарной алгебры, включая тео- теорию уравнений, полностью сохраняются, если под буквами пони- понимать элементы любого поля, так как в основе этих правил и формул лежат свойства действий и возможность деления, кроме деления на нуль. Пример. Решить уравнение 2х2 + Бх + 4 = б в поле вычетов по модулю 11. Применим обычную формулу решения квадратного уравнения} X == —5±У52-4-2-4 _ — 5± V —7 _ 6 ± V4 __ 6±| 2-2 ~~ 4 4 4 ' т. е. х = 2 или х = 1.
. з] НЕКОТОРЫЕ ОБЩИЕ ПОНЯТИЯ АЛГЕБРЫ 25 В этом примере квадратный корень благополучно извлекся. Могло бы случиться и так, что элемент, находящийся под знаком квадратного корня, не является квадратом какого-либо элемента поля. Это означало бы, что данное квадратное уравнение не имеет корней в исходном поле. 3. Изоморфизм. Часто оказывается, что группы, возникающие в различных областях математики или ее приложений, оказывают- оказываются совершенно одинаковыми по своим свойствам, хотя элементы, из которых они составлены, различны но своей природе. Это явле- явление носит название изоморфизма групп. Дадим точное определение. Взаимно однозначное отображе- отображение группы G] на группу G2 называется изоморфизмом, если обра- образом результата групповой операции над двумя элементами из G\ является результат применения групповой операции в G2 над обра- образами исходных элементов. В символьной записи, если отображение обозначено через ф, нужно (кроме взаимной однозначности), чтобы <p(aia2) = = cp(ai)cp(a2) (мы прибегаем к мультипликативной записи груп- группового действия). Группы называются изоморфными, если для них существует изоморфное отображение. Например, группа клас- классов по модулю 2 относительно сложения изоморфна группе, эле- элементами которой служат числа ±1, а операцией — обычное умно- умножение. Изоморфизм дается сопоставлением классу четных чисел числа 1, а классу нечетных чисел — числа —1. Менее тривиальный пример изоморфизма имеется для группы всех вещественных чисел относительно сложения и группы поло- положительных чисел относительно умножения. Изоморфизм дается сопоставлением любому вещественному числу х значения показа- показательной функции ах. Действительно, оно взаимно однозначно (обратное отображение дается логарифмом) и а ¦ а = aVl+x>. Аналогично изоморфизму групп дается определение изомор- изоморфизма колец. Именно, взаимно однозначное отображение ф коль- кольца А\ на кольцо А2 называется изоморфным, если оно сохраняется при операциях сложения и умножения, т. е. если ф(а1 + а2) — «=<p(ai)-f <p(a2) и Ф(а1а2) = ф(а1)ф(о2). Ясно, что если кольцо А\ есть область целостности или поле, то его изоморфный образ есть область целостности или поле.
ГЛАВА И КОМПЛЕКСНЫЕ ЧИСЛА Как известно, комплексными числами называются выражения вида а + Ыу где а и Ъ — вещественные числа, i — некоторый сим- символ, удовлетворяющий соотношению i2 = —1. Первые попытки введения в математику комплексных чисел были сделаны итальян- итальянскими математиками 16 в. Кардано и Бомбелли в связи с реше- решением уравнений 3-й и 4-й степеней. Однако признание комплекс- комплексных чисел как ценного орудия исследования происходило очень медленно. Недоверие вызывал сам символ i («мнимая единица»), заведомо не существующий среди вещественных чисел. Это недо- недоверие усугублялось тем, что некритическое перенесение некоторых формул обычной алгебры на комплексные числа порождало не- неприятные парадоксы (например, i% = —1, но вместе с тем, исполь- используя формальное выражениеi =V —1 и обычные правила действий с квадратными корнями, получим г2 = д/ —- 1 • д/ — 1 = д/( — IJ = =д/Т=1)- Лишь в 19 в. Гауссу удалось дать достаточно убеди- убедительное обоснование понятия комплексного числа. Построенная в 19 в. на основе комплексных чисел теория функций комплексного переменного обогатила математический анализ новыми результа- результатами, придала значительной части математического анализа чрез- чрезвычайную стройность и простоту, а в дальнейшем оказалась могу- могущественным средством исследования в важных разделах механики и физики. Таким образом, «невозможные», «мнимые» числа яви- явились ценнейшим средством исследования, и тем самым их введе- введение в науку оказалось оправданным не только их непротиворечи- непротиворечивостью, но и практической важностью. § 1. Обоснование комплексных чисел 1. Наводящие соображения. Задание комплексного числа a -f- + Ы вполне определяется заданием двух обыкновенных вещест- вещественных чисел а и Ь, называемых его компонентами. Вводя комплексные числа, необходимо ввести и арифметические действия над ними, по возможности с сохранением обычных пра- правил действий, но с обязательством заменять символ i2 на —1. По- Постараемся охарактеризовать правила этих действий в терминах компонент, без упоминания о «сомнительном» символе I. Так, если по обычным правилам элементарной алгебры «сложить» два комп- комплексных числа a-f-?н и c-\-di, то мы получим комплексное число
j !] ОБОСНОВАНИЕ КОМПЛЕКСНЫХ ЧИСЕЛ 27 (а + c)-\-(b -f- d)i, и при этом компоненты суммы двух комплекс- комплексных чисел будут равны суммам соответствующих компонент сла- слагаемых. Далее, (а + bi) (с + di) = ас + bci + adi + bdi2 = (ac — bd) + r_j_(bc-f- ad)i, т. е. первая компонента произведения двух комплекс- комплексных чисел равна разности произведений первых и вторых компо- компонент, а вторая компонента равна сумме произведений первой ком- компоненты одного из сомножителей на вторую компоненту другого. Наконец, положив Ь — 0 (и считая, что 0t = 0), получим а _j- Oi = а, т. е. комплексное число с нулевой второй компонен- компонентой отождествляется с вещественным числом, именно, с первой компонентой. Разумеется, все эти соображения имеют лишь наводящий ха- характер—мы сформулировали в терминах компонент правила действий над комплексными числами, как будто мы уже каким-то образом убедились в закономерности введения этих странных ма- математических объектов. Но то, что нам это удалось сделать, есте- естественно наводит на мысль дать само определение комплексных чисел и действий над ними в терминах компонент, т. е. веществен- вещественных чисел. 2. Определение комплексных чисел. Комплексными числами называются упорядоченные пары вещественных чисел (компо- (компонент), для которых понятия равенства, суммы, произведения и отождествления некоторых пар с вещественными числами вводятся согласно следующим определениям (аксиомам). I. Пары (а, Ь) и (с, d) считаются равными в том и только в том случае, когда равны их соответствующие компоненты. В символической записи: (а = с (о — а. II. Суммой пар (а, Ь) и (с, d) называется пара (a -f- с, b + d), т. е. III. Произведением nap (а, 6) и (с, d) называется пара (ас — bd, ad -f be), т. е. def (a, b)(c, d) — (ac — bd, ad + be). IV. Пара (а, 0) отождествляется с вещественным числом а, def т. е. (а, 0) = а. Таким образом, в данном определении комплексных чисел, со- составными частями которого являются определения их равенства, вуммы, произведения, нет речи о каком-либо извлечении квадрат-
38 КОМПЛЕКСНЫЕ ЧИСЛА [ГЛ. Щ ного корня из отрицательных чисел. Все определения формулиру- формулируются в терминах вещественных чисел и действий над ними. В первых трех аксиомах речь идет об определении разных по- понятий. Поэтому их сопоставление не может привести к каким-либо противоречиям. Единственное, чего можно опасаться, это наруше- нарушения обычных законов действий, которое априори могло бы произойти. Несколько в другом положении находится аксиома IV. Дело в том, что понятия равенства, суммы и произведения для вещественных чисел имеют определенный смысл, и если бы оказа- оказалось, что эти понятия расходятся с теми, которые возникают в силу аксиом I, II, III при рассмотрении вещественных чисел как пар специального вида, то это привело бы к такой путанице (пришлось бы отличать сумму вещественных чисел как таковых, от их суммы как пар, и т. д.), что следовало бы от аксиомы IV отказаться. Поэтому прежде всего нужно сопоставить аксиому IV с аксио- аксиомами I, II, III. I и IV. Пусть вещественные числа а и b равны, как отождест- отождествленные с ними пары (а, 0) и F, 0). Это будет, согласно аксио- аксиоме I, в том и только в том случае, когда а = Ь, т. е. если они равны в обычном смысле. II и IV. Сумма вещественных чисел а и Ь, рассматриваемых как пары (а, 0) и F, 0), равна, согласно аксиоме II, паре (а -+- Ь, 0), отождествленной с числом а + 6, т. е. с суммой а и Ь в обычном смысле. III и IV. Произведение вещественных чисел а и Ь, рассматри- рассматриваемых как пары (а, 0) и F, 0), равно согласно аксиоме III паре (ab — 0-0, а0 + 06) = (а&, о); отождествленной с числом ас, т. е. с произведением а и Ь в обычном смысле. Таким образом, аксио- аксиома IV хорошо согласована с аксиомами I, II, III и не приводит к путанице, которой можно было бы опасаться. Обратим внимание еще на одну формулу, непосредственно вы- вытекающую из аксиом III, IV, именно, т(а, b) = (ma, mb), если т — какое угодно вещественное число. Действительно, т{а, Ь) — {т, 0) (а, Ь) = (та — 06, mb + 0а) = (та, mb). Допу- Допустим теперь, что т — натуральное число. В силу аксиомы II (а, 6) +(а, 6) = Bа, 26), Bа, 26) + (а, 6) = (За, 36) и т. д., так что (та, mb) есть результат последовательного сложения т сла- слагаемых, равных (а, 6), что хорошо согласуется с привычным пред- представлением о том, что умножение на натуральное число т равно- равносильно сложению т равных слагаемых. Это еще раз свидетель- свидетельствует о хорошем согласовании аксиом. 3. Свойства действий. Теперь нам нужно проверить, что ак- аксиомы II и III согласованы в себе и друг с другом так, что при- привычные'нам свойства действий над числами сохраняются при пе-
¦5 i] ОБОСНОВАНИЕ КОМПЛЕКСНЫХ ЧИСЕЛ 29 реходе к комплексным числам. Именно, мы установим, что комп- комплексные числа образуют поле. При описании свойств действий мы будем придерживаться принятой в § 3 гл. I нумерации аксиом кольца и поля, но при проверке будем несколько отступать от по- последовательности, предписываемой этой нумерацией. 2. (a, b) + (c, d) — (c, d)-\-{a, b) (коммутативность сложения). Действительно, левая часть равна (а-\-с, b-\-d), правая равна (с + а, d-\-b). Они равны в силу коммутативности сложения ве- вещественных чисел. ' 1. ((a, b) + (c, d)) + (e, f) = (a, b) + ((c, d) + (e, f)) (ассоциа- (ассоциативность сложения). Действительно, в силу ассоциативности сло- сложения вещественных чисел правая и левая части равны (a-f-c-j-e, b + d + f). 3. (a, 6)-f-{0. 0) = (a, b), так что пара @, 0) (отождествляе- (отождествляемая с вещественным числом 0) играет роль нуля и при сложе- сложении пар. 4. (а, &)+(—а, —й) = @, 0). Поэтому для каждой пары (a, b) существует противоположная, именно, (—а, —Ь). 7. (а, Ь) (с, d) — (c, d) (a, b) (коммутативность умножения). Действительно, левая часть'равна {ас — bd, ad-{-be), правая рав- ¦яа (са — db, da-{-cb). Они равны. 5. ((а, Ь) + (с, d)) (е, f) = (а, Ь) (е, f) + (с, d) (e, f); 5'. (е, f) ((а, Ь) + (с, d)) = (е, f) (а, Ь) + {е, f) (с, d) (левая и правая дистрибутивность). В силу коммутативности умножения достаточно проверить пер- первую из формул 5. Левая часть равна :(а + с, b + d)(e, f) = ((a + c)e-(b + d)f, (a + c)f + (Ь + d)e) = : = (ae + ce — bf — df, af + cf+be + de). Правая часть равна lae — bf, af + be) + (ce — df, cf + de) = = (ae — bf + ce — df, af + be + cf + de), !г. е. равна левой части. 6. ((a, b)(c, d))(e, f) = (a, b){(c, d){e, f)) (ассоциативность умножения). Действительно, левая часть равна (ас — bd, ad+bc)(e, f) = ((ac — bd)e — (ad+bc)f, (ac — bd)f + + (ad + bc)e) = (ace — bde — adf — bef, acf — bdf + ade + bee). Правая часть равна ia, b)(ce — df, cf + de) = (a(ce — df)—b(cf + de), b(ce — df) + + a(cf + de)) — (ace — adf — bcf — bde, bee — bdf + acf -f- ade), t. e. правая часть равна левой. 8. (a, 6) A,0)=»(о, b). Таким образом, пара A, 0) (отождествляемая с вещественным числом 1) играет роль 1 и при умножении пар..
30 КОМПЛЕКСНЫЕ ЧИСЛА [ГЛ. II Итак, комплексные числа составляют коммутативное ассоциа- ассоциативное кольцо с единицей. Введем теперь понятие сопряженных комплексных чисел. Пары (а, Ь) и (а, —Ь), отличающиеся знаком второй компоненты, на- называются сопряженными. Умножив сопряженные пары (а,Ь)(а,— Ь) = {аа — b{—b), a(—b)+ba) = (a2 + b2,0)=a2 + b*, получим, что их произведение равно неотрицательному числу а2 +62, которое равно нулю только если а = О, b — 0, т. е. если (а, 6) = 0. Если (а, Ь)Ф0, то, умножив сопряженную пару (а, —Ь) на вещественное число 2 . .2 , мы получим обратную к паре (а, Ь\ пару, т. е. такую, которая при умножении на (а, Ь) дает число 1. Таким образом, верно: 9. Для любой пары (а, Ь), отличной от 0, существует обратная (а, Ь)-*, именно, -г^г (а, -Ь) = (-^гр-. —^г^р-) • Итак, мы доказали, что комплексные числа составляют поле. 4. Возвращение к обычной форме записи. Ясно, что (а, Ь) = = (а, 0) + @, Ь) = (а, 0) + (Ь, 0) @, 1) = а + Ы, где буквой i обо- обозначена пара @, 1). Из аксиомы III следует, что /2 = @, 1)@, 1) = @-1, 0 + 0) = (-1, 0) = -1. Таким образом, мы вернулись к обычной записи комплексного числа в виде а + bi, но «мнимая» единица i получила реальное истолкование как одна из пар, действия над которыми определены аксиомами I, II, III, IV, именно, пара @, 1). Если угодно, множи- множитель i при вещественном числе Ь можно истолковать как указание на то, что b является второй компонентой пары (а, Ь). Первая компонента комплексного числа а = а + bi называется вещественной частью этого числа и обозначается Re a, a вторая компонента называется его мнимой частью и обозначается Im a. Подчеркнем, что мнимая часть (так же, как и вещественная часть)' комплексного числа есть число вещественное. В дальнейшем, говоря о комплексных числах, мы должны пом- помнить, что вещественные числа мы рассматриваем как частный слу- случай комплексных (с нулевой второй компонентой), так что фраза «а есть комплексное число» отнюдь не исключает того, что рс мо- может быть и вещественным. 5. Вычитание и деление комплексных чисел. Действия вычита- вычитания и деления определяются как действия^ обратные к действиям сложения и умножения, т. е. вычитание — как действие, восстанав- восстанавливающее одно из слагаемых по данной сумме и второму слагае- слагаемому, а деление — как отыскание одного из сомножителей по дан- данному произведению и второму сомножителю. Их возможность и единственность обосновывается следующими предложениями.
f 2) ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА 31 Предложение 1. Пусть а и р — данные комплексные числа. Тогда существует одно и только одно комплексное число х такое, что а + х = р, именно, х = (—а) + Р- Доказательство. Имеем а + ((—а)+ Р) = а + (—а) + •?¦ р = р, так что jc = (—а)-ЬР удовлетворяет поставленному тре- требованию. Обратно, если а-\-х=$, то (•—a)-f- а + * = (—а) + р, откуда jc = (—a)-f- р, так что'всякое число, отличное от (—а) + р, ре удовлетворяет поставленному требованию. Число (—а)+ р есть, таким образом, разность чисел р и а. Она обозначается обыч- обычным образом: р — а. Предложение 2. Пусть а и р — данные комплексные числа, причем а Ф 0. Тогда существует одно и только одно комплексное щисло х такое, что ах = р, именно, х = а-'р. ' Доказательство. Если х — а~% то ах = aa-'P = р. Если их = р, то a-'ax = a-'p, x = а~% что и требовалось доказать. Число а~!р есть, таким образом, частное от деления р на а. I В Частное обычно записывается в форме дроби —. Ясно, что если |ис = р, то при любом уфО будет уах — уР, откуда х= -^-, та- |им образом, числитель и знаменатель дроби можно умножать на Одно и то же число, отличное от 0. a Удобно фактически вычислять частное —, умножая числитель В ва JB знаменатель на число, сопряженное со знаменателем: -^- = -i-^, ОС ОСОС Так как aa есть вещественное число. Например, 1 + Зг = A + 3Q A - 0 _ 4 + 41 _ 2 . Конечно, этот способ равносилен представлению числа оН в виде —=-а, указанном выше для a = а + Ы. § 2. Тригонометрическая форма комплексного числа 1. Геометрическое изображение. Комплексное число a = a+ *\г Ы естественно изобразить точкой на плоскости, приняв числа а и Ь за координаты точки, изображающей число а. При этом каждому комплексному числу соответствует точка и каждой точке плоскости соответствует некоторое комплексное число. Веществен- Йые числа изображаются точками с равными нулю ординатами, т. е. точками, лежащими на оси абсцисс. На оси ординат распо- располагаются изображения «чисто мнимых» чисел Ы. Началу коорди- Йат соответствует число 0. .. Плоскость, на которой изображаются комплексные числа, на- нарывается плоскостью комплексной переменной. Ее ось абсцисс на- называется вещественной осью, ось ординат — мнимой осью в соот-
32 КОМПЛЕКСНЫЕ ЧИСЛА [ГЛ. II Рис. 1. ветствии с наименованиями чисел, изображения которых лежат на этих осях. Наряду с изображением комплексных чисел точками на пло- плоскости удобно с каждым комплексным числом связывать вектор, исходящий из начала координат в точку, изображающую это число (т. е. радиус-вектор этой точки). Компоненты а и Ъ комп- комплексного числа a -f- Ы являются, очевидно, проекциями (алгебраи- (алгебраическими, с учетом знаков) этого вектора на оси координат. Как известно, проекция суммы векторов (в смысле векторного сложе- _ ния) на любую ось равна сумме проекций "" слагаемых. Поэтому сумма векторов, изо- изображающих комплексные числа аир, есть вектор, изображающий сумму а + р этих чисел, так как компоненты числа a -f- р равны суммам соответствующих компонент слагаемых (рис. 1). 2. Модуль и аргумент комплексного чис- числа. Введем в рассмотрение полярные коор- координаты точки, изображающей комплексное число а, принимая начало координат за полюс и вещественную ось за полярную ось (рис. 2). Как известно, полярными координа- координатами точки являются длина ее радиус-вектора, равная расстоянию от точки до полюса, и величина ее полярного угла, образованного положительным направлением полярной оси и радиус-вектором рассматриваемой точки. Длина радиус-вектора точ- точки, изображающей комплексное число а, называет- называется модулем этого числа и обозначается ]сс|. Ясно, что |а|^0, причем |а| = 0 только, если а = 0. Величина полярного угла точки, изображающей комплексное число а, называется аргументом этого . числа и обозначается arga. Заметим, что arga имеет смысл лишь при афО, аргумент числа 0 смысла не имеет. Положительным направлением отсчета аргумента комплекс- комплексного числа считается направление от положительной полуоси ве- вещественной оси к положительной полуоси мнимой оси, т. е. про- против часовой стрелки при обычном расположении осей. Аргумент комплексного числа определен не однозначно, так как угол между двумя направлениями (даже если выбрано поло- положительное направление отсчета) можно отсчитывать многими спо- способами. Уточним характер многозначности аргумента. Пусть ср0 — наименьшее значение аргумента, отсчитанное в положительном на- направлении. Сделав при отсчете несколько полных оборотов в поло- положительном направлении, мы придем к значению аргумента фо + -\-k-2n, где k — число полных оборотов, т. е. целое неотрицатель- неотрицательное число. Простейший отсчет в отрицательном направлении дает, Рис. 2.
§2] ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА 33 очевидно, значение аргумента —Bя— фо) = Фо— 2я (рис. 3). Если же сделать еще s полных оборотов в отрицательном направлении, мы придем к значению ср0 — (s -f- 1Jзт, s ^ 0. Тем самым все воз- возможные значения аргумента даются формулой: ф = фо + 2&я, где k — любое целое число, положительное, отрицательное или 0. Та- Таким образом, данному комплексному числу, не равному 0, можно соотнести в качестве аргумента бесконечное множество чисел, правда, очень просто связанных между собой, именно, любые два значения аргумента отли- отличаются на целое кратное 2зт. Разумеется, многозначности аргумента мож- можно было бы избежать, наложив на аргумент ка- какие-либо требования, выделяющие одно значе- значение из всех возможных, например, 0 ^ ср <С 2я или —я < ср ^ я. Однако это оказывается не- неудобным, особенно при изучении функций от комплексной переменной. Пусть, например, комп- комплексное число х -f- yi изменяется так, что его изображение описывает в положительном направлении окружность с центром в начале координат, начиная, например, с точки i и воз- возвращаясь в ту же точку (рис. 4). Если бы мы наложили ограни- ограничения на аргумент: 0 ^ ср < 2зт, нам пришлось бы считать, что при подходе к точке 1 аргумент скачком переходит от значений, сколь угодно близких к 2я, к значению 0, и это неестественно. Естественно считать, что аргумент изменяется непрерывно, но когда x-\-yi возвращается в ис- исходную точку, его аргумент получает прираще- приращение, равное 2зт. Впредь, говоря об аргументе комплексного числа, мы будем подразумевать какое-либо его значение, безразлично какое. Если же возникает необходимость выбирать определенное значение, это приходится делать при помощи надлежащего описания (например, «возьмем наименьшее неотрицательное значение аргумента»). 3. Тригонометрическая запись комплексного числа. Модуль г = |а| и аргумент ср = arg а комплексного числа а = а + Ы свя- связаны с его компонентами при помощи формул а = гсозф, b — гэшф. Эти формулы непосредственно следуют из определения функций cos и sin любого угла. Ясно, что г = л/а2 + б2, cos <р = —, sin ср => = —. Эти формулы определяют модуль и аргумент по данным а и Ь. Для определения аргумента можно пользоваться формулой Рис. 4. Ф —" ПРИ - Однако эта формула задает ср лишь с точно-
34 КОМПЛЕКСНЫЕ ЧИСЛА 1ГЛ. IB стью до целого кратного л (т. е. полуоборота), а не до целого кратного 2я. Это заставляет дополнительно выбирать из двух зна- значений ф в противоположных четвертях одно, по знаку cos<p (или sinqp), совпадающему со знаком а (соответственно Ь). Подставляя вместо компонент комплексного числа а = а + Ы их выражения через модуль и аргумент, получаем а = г (cos ф + i sin <p). Такая форма записи комплексного числа называется тригонометри- тригонометрической. Примеры: 1 = 1 (cos 0 + / sin 0), — 1 = 1 (cos л + / sin я), 3 + Ai — 5(cos ф + i sin ф), „ 3 где ф — угол первой четверти, косинус которого равен -g-. 4. Неравенства для модуля суммы и модуля разности двух ком- комплексных чисел. Имеют место следующие неравенства: a) | b) ! c) | d) | Эти неравенства удобны для оценивания модуля суммы и модуля разности комплексных чисел, т. е. для указания границ их изме- изменения, если известны границы для модулей слагаемых. Неравен- Неравенства а) и Ь) применяются для оценивания сверху, неравенства с) и d) дают оценки снизу. Докажем прежде всего неравенство а). Пусть а = Г](со5ф1 + / sin Ф1), Pf= ^(созфг-Мзшфг) (здесь П = | а |, г2 = | Р |). Тогда а + р = r\ cos ф, + r2 cos ф2 + i (r, sin ф, + -{- ггзтфг), откуда = г] соэ2ф, + 2r,r2 cos ф, cos ф2 + r\ cbs ф| + г'\ &$ 2r,r2 sin ф, sin ф, + r\ -f 2Г(Г2 (cos ф; cos ф2 + 51Пф! sin ф2) + r\(cos\2 -f зт2ф2) = = r\ + 2rxr2 cos (ф1 - Фа) + г\.
j 2] - ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА 35 Но cos(cpi — ф2)^ 1. Поэтому \a + $ ( Y откуда в силу положительности |а + р| и г\ + г2 заключаем, что |а + Р|^П + ''2::=|к| + |р|, что и требовалось доказать. Для доказательства неравенства Ь) заметим прежде всего, что |РJ = |—р|. Действительно, компоненты чисел р и —р отличаются только знаками, и суммы квадратов компонент одинаковы. Далее, \а — p| = |a-f-(—P)|^la| + |—PI —lal + lPl> что и требовалось доказать. Для доказательства неравенства с) применим неравенство Ь) к a = (a + P)—Р. Получим: |a|<|a + P|-f-|Pl> откуда |a-f-Pl^s || II >|а| IPI Наконец^ |а — р| = |а + (—Р)|г>|а|— |Р|, чем доказано нера- неравенство d). Все доказанные неравенства имеют ясное геометрическое ис- истолкование (рис. 5). Если точки, изображающие 0, а, р, не лежат на одной прямой, то треугольник с верши- вершинами 0, а, а + р имеет длины сторон |а|, |Р| и |а + Р|. Из известных «неравенств треугольника» — сторона треугольника мень- меньше суммы двух других сторон и больше их разности — получаем неравенства а) и Ь) (даже без включения равенства, что обеспе- обеспечивается сделанным предположением о невы- невырожденности треугольника 0, a, a-j-p). Нера- Неравенства с) и d) становятся очевидными при Взгляде на треугольник с вершинами в точ- • ках 0, а, р. Длины двух его сторон равны |а| ja |p|, длина третьей стороны равна длине радиус-вектора точки щ — р, т. е. равна \а — р|. Применение неравенства треугольника приводит к неравенствам с) и d), снова без знаков равенства, ко- которые могут появиться в случае вырождения треугольника в отре- отрезок. При доказательстве неравенств с) и d) мы отметили одно об- обстоятельство, интересное само по себе: модуль разности двух комплексных чисел равен расстоянию между точками, изображаю- изображающими эти комплексные числа. Неравенства с) и d) иногда полезны в слегка усиленной фор- формулировке с') |a + PI>||a|-|P||, Их справедливость почти очевидна. Действительно, |а + р|^ ^|а| — |р| и |a-fP|;ss|p| — |а|. Правые части отличаются зна- знаком и, выбрав из них положительную, придем к неравенству с'). Неравенство d') следует из с') после замены р на —р. > Неравенство а) очевидным образом обобщается на сумму не- нескольких слагаемых: | ai-f-a2+ ... + а* | ^ | ах \ +1 а21 + ... + | ак \.
36 КОМПЛЕКСНЫЕ ЧИСЛА [ГЛ. 1Г Из неравенства Ь) и обобщенного неравенства а) следует |ai + a2+ ... +a*|^s|ai| — |а2 + ••¦ +ak\^ ^|ai| —|a2|— ... —|а*.|. Это неравенство можно рассматривать как обобщение неравен- неравенства Ь). Оно удобно для оценивания снизу суммы, в которой мо- модуль одного слагаемого больше суммы модулей остальных. . 5. Умножение комплексных чисел в тригонометрической записи. Пусть ai = r^coscp! -{- i sin 91) и a2 = г2(соэф2 + tsin<p2). Тогда a1a2=rir2 (cos (pi cos ф2—sin % sin ф2+? (sin ф[ cos ф2+соэ ф[ sin ф2)) = = nr2 (cos (ф, + ф2) + i sitvfa, + фа)). Таким образом, aja2 легко преобразуется к тригонометрической записи числа, модуль которого равен пг2 и аргумент равен ф1 + ф2. Следовательно, модуль произведения двух комплексных чисел ра- равен произведению модулей сомножителей и аргумент произведения (точнее, одно из значений аргумента) равен сумме аргументов сомножителей. В буквенной записи I сцсх21 = I «i I • I a21, arg (ct^) = arg а, + arg а2. Эти правила распространяются на произведение любого числа со- сомножителей. Именно, | а,а2 ... ak \ = | щ \ • | а2 | ... | ak \, arg(а;а2 ... ak) == arg ax + arg а2 -f- ... + argak. Действительно, эти формулы верны для k == 2. Допустив, что они верны для произведения из k — 1 сомножителей, мы получим | а^г ... ak \ = | at | • 1 а2 ... ak | = | аг | • | а21 ... | ak |, arg (ajct2 ... ak) = = argai-f arg(a2 ... ai) = arga1+arga2+ ... -f- argafe. В обеих цепочках равенств последний переход обеспечивается ин- индуктивным предположением. 6. Возведение комплексного числа в степень с целым показате- показателем и формула Муавра. Положим в формуле ! + /sin ф!)г2(со5ф2 -j- i sin ф2) ... г*.(со5ф^ -f- г sin ф^) = что все сомножители равны, так что г\ = г% = ... =/¦«. = г, ф( = = ф2 =: ... = ф/г = ф. ПОЛУЧИМ (г (cos ф + i sin ф))к — гк (cos kq> + i sin k<f>). При г = 1 получается знаменитая формула Муавра: (cos ф -J- / sin ф)k = cos kq> -J- i sin ^ф.
g 2] ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА КОМПЛЕКСНОГО ЧИСЛА 37 Мы вывели эту формулу в предположении, что k — целое положи- положительное число. Покажем, что она остается верной и при k = 0 и при целом отрицательном k, считая для комплексных чисел, так зке как для вещественных, а° = 1 и а~т = —^. При й = 0 фор- формула превращается в верное равенство: (cos ср + i sin фI" = cos 0 -f- i sin 0 = 1. Положим теперь k = —m, считая т целым положительным. Тогда (cos ф + i sin Ф)& = (cos ф + l sin ф)~т = (с08ф+151пфГ = ^ 1 = cosmq>-fstamq> = ^ ( } . sin ( } _ COS Шф + I Sin Шф С032Шф + 81П2Шф ч ' ^ ' ч ' ^ = cos k(p + г sin ^ф. Таким образом, формула Муавра оказывается верной при всех целых значениях k. 7. Применения формулы Муавра к преобразованиям тригоно- тригонометрических выражений. Формула Муавра оказывается удобным средством для преобразования некоторых выражений, содержащих тригонометрические функции. Рассмотрим несколько примеров. Пример 1. Выразить tg5ф через tgф. Имеем соотношение соэ5ф -f ^'этЗф = (совф -f- i sin фM. При- Применив бином Ньютона, получим cos 5ф + i sin 5ф = cos5 ф + Ы cos4 ф sin ф — 10 cos3 ф sin2 ф — — Юг cos2 ф sin3 ф + 5 cos <p sin4 ф + i sin5 ф (пользуемся тем, что /2 = —1, i3 = —i, i4=l, fi = i). Приравни- Приравнивая компоненты, получим cos 5ф = cos5 ф — 10 cos3 ф sin2 <p + 5 cos ф sin4 ф, sin 5ф = 5 cos4 ф sin ф — 10 cos2 <p sin3 ф + sin5 ф, откуда ¦ _ 5 cos4 ф sin ф — 10 cos2 ф sin3 ф + sin5 ф 5tg ф — 10 tg3 ф + tg5 ф о У cos5 ф — 10 cos3 ф 51П2ф + 5 cos ф sin4 ф 1 — 10 tg2 ф + 5 tg4 ф ' ^Мы поделили числитель и знаменатель на соэ5ф.) Ясно, что подобным образом можно выражать тригонометри- тригонометрические функции кратного аргумента через тригонометрические функции исходного. Пример 2. Выразить зт5ф линейно через тригонометриче- тригонометрические функции кратных аргументов. Положим а = соэф-!" г sin <р, тогда arx = cos ф — /эшф, ak = = cosk(p + i sin йф, a~k = cos fecp — isinky, откуда
38 КОМПЛЕКСНЫЕ ЧИСЛА [ГЛ. II Воспользуемся этими формулами: i а5 — 5а3 + 10а — Юа-1 + 5а~3 — а~ь _ ~~ 32/ ~~ (а5—а-5)—5(а3—а-3)+Ю(а-а-') _ ~~ 32/ ~~ 2/ sin 5ф—10/ sin Зф+20/ sin ф sin 5ф — 5 sin Зф + 10 sin ф ~ 32/ ~ 16 Аналогично, любое выражение вида cos* ф sinm ф можно предста- представить линейно через тригонометрические функции кратных аргу- аргументов. Пример 3. Преобразовать сумму В = этф + sin2q>4- ... ... + sin/гф. Введем в рассмотрение другую сумму А = cos ф -f- cos 2ф + ... ... + cos пф и запишем А + Bi: = (cos ф + i sin ф) + (cos 2ф + 4- isin2ф) + ... + (собпф + isin лф). Мы пришли к сумме геоме- геометрической прогрессии. Для дальнейших преобразований полезно ввести обозначение а = cos -|- + i sin у-. Тогда Вынесем теперь в числителе и знаменателе такие степени а, чтобы в скобках оставались разности степеней с противоположными по- показателями (для возможности этого мы ввели сокращенное обо- обозначение для .cos -2—[- / sin у, а не для cos ф + i sin ф, что, каза- казалось бы, естественнее): . . D. а"+2 (ап - а~") ап+' (ап - а~п) A + Bi= —(„_„_.) = „-Г^Р = ( п + 1 ... га+1 \ ., . пф ( cos —5~ ф + i sin —^— Ф I 2/ sin —Z- откуда В--
ИЗВЛЕЧЕНИЕ КОРНЯ ИЗ КОМПЛЕКСНОГО ЧИСЛА 39 В качестве «бесплатного приложения» мы получили сумму , яф (га+ 1) ф sin —cos - ф sin -|- Аналогичным образом могут быть преобразованы, суммы вида й1 cos&i -f- a2cos &2 -Ь ••• +flncos6n и й\ sin b\ + a2 sin b2 + ... ... -{-anSinbn, если аргументы bu b2, ..., bn тригонометрических функций образуют арифметическую прогрессию, а коэффициенты а\, а2, ..., ап — геометрическую. Разумеется, рассмотренные при- примеры не исчерпывают возможности применений формулы Муавра к преобразованиям тригонометрических выражений. § 3. Извлечение корня из комплексного числа 1. Вывод формулы извлечения корня. Пусть п — натуральное число. Извлечь корень с показателем п из комплексного числа а — это значит найти комплексное число (или числа) р так, что §" = а. Каждое число р такое, что Р" = а, называется корнем п-й степени п из а и обозначается л/а. п Ясно, что если а = 0, то единственным значением л/а явля- является число 0, поэтому сосредоточим внимание на случае а Ф 0. Запишем а в тригонометрической форме а = r(coscp + jsincp) и будем искать р тоже в тригонометрической записи: Равенство Р" = а запишется в виде /?re(cosn0 + /sinnB) = r(coscp+ i sincp). Приравнивая модули и аргументы (с учетом многозначности), получим, что последнее равенство равносильно равенствам: Rn = г, Данное число г положительно (ибо а ф 0) и искомое число R должно быть тоже положительным. Известно, что для любого по- положительного числа существует единственное положительное зна- значение корня п-й степени, называемое арифметическим значением .корня, и это значение принято записывать в виде степени с дроб- дробным показателем. Итак, R = г1/п. Аргумент же 0 находится просто Делением: Ф + 2kn
40 КОМПЛЕКСНЫЕ ЧИСЛА 1ГЛ II Таким образом, корни п-й степени из комплексного числа а существуют, и все они даются формулой i±p) A) при любом fteZ (мы ставим индекс k при р для того, чтобы под- п черкнуть многозначность л]а и зависимость его значений от па- параметра k, могущего принимать все целые значения). 2. Исследование формулы извлечения корня. Теорема 1. Существует ровно п значений корня п-й степени из отличного от нуля комплексного числа а — r(coscp + tsincp). Их дает формула 5 = г'/« (cos ^±^ + / sin 1±^-Л в предположении, что k пробегает какую-либо полную систему вычетов по модулю п, например, k = 0, \v <.., п—-\. Доказательство. Мы уже видели, что значения корня п-й степени из а даТотся формулой A). Покажем, что рй, = р*2 в том и только в том случае, когда k\ = ^(itiodл). Действительно, при целом t (аргументы равных чисел равны или отличаются на целые кратные 2п\. о модулях заботиться не нужно — они одина- одинаковы у всех чисел Рь). Это равенство, в cboiq. очередь, равносильно ¦ ' ~ 2 =t, т. е. k\ з= ?2(modn). Итак, действительно, fift-^Pfa в том и только в том случае, если k\ = &2(modя); и, следова- следовательно, мы получим все различные значения для р^, если k пробе- пробежит значения по одному из каждого класса по модулю я, т. е. некоторую полную систему вычетов. Пример. Найти ^2 + 2/ (один из немногих «хорошо подта- подтасованных» численных примеров). Имеем 2 + 2г = -\/§(cos^° -f- i sin 45°). Согласно формуле ' - (V8) (cos 45°+3fe-360° + / sin = д/2 (cos A5° + k • 120°) + i sin A5° + k • 120°)). Для k достаточно взять значения 0, 1, 2. Получим три значения: р0 = д/2 (cos 15° + / sin 15°), р, = ф, (cos 135° + * sin 135°), р2 = ф. (cos 255° + i sin 255°).
§ 3] ИЗВЛЕЧЕНИЕ КОРНЯ ИЗ КОМПЛЕКСНОГО ЧИСЛА 41 Учитывая, что cos 45° = sin 45° = 1/У2. получим pt = —1 -f- L Для вычисления ро и р2 заметим, что 15° = 45° — 30°, так что cos 15° = cos 45° cos 30° + sin 45° sin 30° = -7=- (— + - V 2 V 2 2 sin 15° = sin 45° cos 30° - cos 45° sin 30° = ~ (-^ - Поэтому Уз + 1 Уз-1 Р0= 9 Г г о ' В заключение отметим, что среди /г значений корня п-й сте- степени из комплексного числа нет оснований, вообще говоря, пред- предпочитать какое-либо одно значение остальным. Понятие «арифме- «арифметического значения» при извлечении корня из комплексного числа не вводится и его невозможно ввести каким-либо естественным способом* Легко проследить, что упоминавшееся выше «противоречие» — 1 = I2 = у — iy—1 = У( — 1) ( — 1) = УГ=1 имеет своим источ- источником путаницу в выборе значений квадратных корней. Дело в том, что в применении к комплексным числам формула Уа Уfi = = У<х|3 верна (при выбранных значениях для л/а и Ур) лишь при одном выборе значения для У<х|3> а при другом выборе она «е верна и даже в случае, если ар оказывается_вещественным по- положительным числом, подходящее значение У<хр не обязано быть арифметическим. В рассмотренном примере игра идет на равен- равенствах: У—1 л/~—[ = — 1 и У — 1У — 1 = 1. Первое из них верно, если в качестве значений для обоих сомножителей взять оди- одинаковые значения У — 1 (т. е. /, i или —i, —i), второе верно, если взять различные значения (т. е. i, —i или —i, i). 3. Извлечение квадратного корня. Извлечение квадратного корня из комплексного числа можно осуществить, не обращаясь к тригонометрической форме. Выведем алгебраическую формулу для выполнения этого действия. Пусть x-\-yi — л/а + Ы, и положим, что Ъ Ф 0, так как только этот случай представляет интерес. Тогда а + bi = (х -\- yiJ ==¦ = х2 — у2 -f- 2xyi, что равносильно системе уравнений х2 — у2 = а, 2ху = Ь, причем нас интересуют только вещественные решения этой систе- системы. Мы уже знаем, что задача имеет решения. Это дает право
42 КОМПЛЕКСНЫЕ ЧИСЛА [ГЛ. II предположить, что под буквами х и у подразумевается решение задачи. Тогда (х2— у2J = а2, Ах2у2 = Ь2. Складывая эти равен- равенства, получим (х2 + у2J — а2 + Ь2, откуда х2 + у2 = У а2 + Ь2, при- причем здесь должно брать арифметическое значение корня, ибо х2+ У2 > 0- Сопоставляя последнее равенство с первым уравне- уравнением системы, получим По замыслу задачи правые части обоих равенств должны быть не- отрицательны, и это действительно имеет место, ибо -\/а2 -f- Ь2 > Из последних равенств находим V-V о2 + b2 + a 2 ' У = Здесь снова берутся арифметические значения для корней, a ai и 02 принимают значения ±1. Ясно, что так вычисленные числа х и у удовлетворяют первому уравнению системы х2 — у2 = а. Но они должны удовлетворять и второму: 2ху = Ъ. Это дает или, после очевидных преобразований, cricr2 V^2 == ^» откуда 0102=1, если Ь > 0, и <7i<t2 = —1, если Ь < 0, так чтс 02 = о! sign 6, где sign Ъ обозначает знак Ь, т. е. -fl. если b > 0. и —1, если Ь < 0. Это дает формулу = ± (VVa2+/+a + * sign 6 VVg2+/~a) • Пример 1. Пример 2. =T*- ± (д/^1 -' V2^) - ± B - 0.
КОРНИ ИЗ ЕДИНИЦЫ 43 § 4. Корни из единицы 1. Формула для корней из единицы. Как и для всякого отлич- отличного от нуля комплексного числа, для числа 1 существует ровно п значений корня п-й степени. Так как 1 == cos 0 -f- i sin 0, то для корней n-й степени из 1 имеет место формула гк = cos —- + i sin при k = 0, 1, ..., п - 1. Рис'6- Конечно, в качестве значений для k может быть взята любай пол- полная система вычетов по модулю п. 2. Геометрическое изображение. Все корни из 1 имеют модуль, равный 1, так что их изображения находятся на окружности ра- радиуса 1 с центром в точке 0. Один из них при k = 0 есть просто число 1 и изобра- изображается точкой пересечения положительной полуоси вещественной оси с единичной ок- окружностью. Корень ei имеет своим аргумен- 2я 1 „ г* том —, т. е. — часть полной окружности. Дальнейшие корни ег, 8з, ..., гп-\ имеют 2 3 га— 1 своими аргументами — » —, • • • . —-— ча- части окружности, так что они все делят еди- единичную окружность на п равных частей (рис. 6). Все корни п-й степени из 1 являются корнями уравнения х"— 1 =0. По этой причине уравнение х"— 1 = 0 носит название уравнения деления круга. - Ъ. Первообразные корни n-й степени из 1. Корень n-й степени из 1 называется^ первообразным или принадлежащим показателю п, если он не является корнем из 1 с меньшим чем п натуральным показателем. Другими словами, е есть первообразный корень п-й степени из 1, если" ъп= i, my при любом натуральном m < п, „ , , ,. 2Я , . . 2я ътф\. Число 6] = cos ——f-jsin— есть, очевидно, первообраз- первообразный корень n-й степени из 1, но при п >¦ 2 существуют и другие первообразные корни. Именно, верна следующая теорема. Теорема 1. Число ek = cos \- i sin есть первообраз- первообразный корень n-й степени из 1 в том и только в том случае, если k и п взаимно просты. Действительно, в? = 1 всегда. Пусть k и п взаимно просты и пусть 8^=1, где m — натуральное число. Тогда ^ = 2tn при целом t и —?- = t, т. е. km делится на п. Но k и п взаимно просты.
44 КОМПЛЕКСНЫЕ ЧИСЛА [ГЛ. II Следовательно, т делится на п и потому не может быть меньше п. Поэтому Ък есть первообразный корень п-й степени из 1. Предположим теперь, что е* есть первообразный корень n-й сте- степени из 1, и пусть й = н.о.д.(&, п), п = йщ, k — dk\. Тогда е& = 2^ ^ — cos 2^12. _|_ i sin ^~ и е? = 1. Отсюда следует, что d = 1, т. е. k и п взаимно просты, иначе п\<.п и е* — не первообразный ко- корень. Из доказанной теоремы следует, что число первообразных кор- корней n-й степени из 1 равно числу меньших п и взаимно простых с п чисел, т. е. оно равно, значению ф(л) функции Эйлера. Напри- Например, при п = 12 имеется четыре первообразных корня: ei, es, 87 И 8ц. Предложение 2. Число ek = cos—— + / sin —— является первообразным корнем из 1 степени П\ = -j-, где d = н. о. д. (k, n). п k Действительно, пусть «i=^f> ^\==~J- Тогда числа щ и k\ взаимно просты и efc = cos -— + < sm -~- есть первообразный корень степени щ из 1 в силу только что доказанной теоремы. Итак, среди корней я-й степени из 1 присутствуют первообраз- первообразные корни из 1, принадлежащие всем показателям «1==-т- яв- являющимся делителями п. Например, среди корней 12-й степени из 1 присутствуют первообразные корни степени 12 (ei, es, 87, ец)> степени б (е2 и ею), степени 4 (е3 и eg), степени 3 (е4 и ее), сте- степени 2 (е6) и степени 1 (е0). 4. Свойства корней из 1. Предложение 3. Произведение двух корней степени п из 1 есть корень степени п из 1. Доказательство. Пусть а и р — корни степени п из 1. Это значит, что а" = 1 и рп=1. Но тогда и (аР)" = а"Р"= 1, т. е. ар — тоже корень n-й степени из 1. Предложение 4. Число, обратное корню степени п из \г есть корень степени п из 1. Доказательство. Если а" = 1, то (а-1)" = 1. Эти два предложения означают, что корни степени п из 1 обра- образуют абелеву группу относительно умножения. Предложение 5. Пусть е — любой первообразный корень степени п из 1. Тогда всякий корень степени п из 1 получается из е возведением в некоторую степень с натуральным показателем. Доказательство. Пусть е — какой-либо первообразный корень степени п из 1. Тогда при любом целом k число е* будет корнем степени п из 1, ибо (е*)"= (ел)*= 1. Рассмотрим числа 1, е, е2, ..., е". Все они суть корни степени п из 1. Среди них нет равных, ибо если е* = ет при Q^k <.ш^п— 1, то еш~* = 1,
§4] КОРНИ ИЗ ЕДИНИЦЫ 45 что невозможно, ибо т — k есть натуральное число, меньшее п, а е — первообразный корень степени п. Итак, числа 1, е, е2, ... ..., е" — попарно различные корни л-й степени из 1, и их число равно п, т. е. равно числу всех корней n-й степени из 1. Поэтому 1, е, е2 гп~1 суть все корни степени л из 1, что и требовалось доказать. Заметим, что сопоставление целому числу k корня е* из 1 со- соотносит одному корню класс чисел по модулю п, и, так как при умножении степеней показатели складываются, сумме классов со- соответствует произведение корней. Тем самым группа корней п-й степени из 1 изоморфна группе классов вычетов по модулю п отно- относительно сложения. п _ Предложение 6. Все значения л/а (<х=^=0) получаются из одного значения посредством умножения на все корни степени п из 1. Доказательство. Пусть Ро=а и рге=а. Тогда (РР^1)ге = = 1, так что рр^' = е есть корень л-й степени из 1 и р = рое. Обратно, если Р = Рое и е есть корень степени п из 1, тоР"= р^еге= Последнее предложение показывает, что корни степени л из 1 при действии извлечения корня /г-й степени из комплексного числа играют такую же роль, как знаки ± при извлечении квадратного корня. Это естественно, так как постановка знаков ± равносильна умножению на ±1, т. е. на корни степени 2 из 1. .—- 5. Алгебраическое вычисление некоторых корней из 1. При не- нескольких малых показателях корни из 1 легко вычисляются. Ясно, что квадратные корни из -1 суть ±1. Корни 4-й степени равны, очевидно, +1, —1, i, —i. Для вычисления корней 3-й степени из 1 рассмотрим уравнение хъ—1=0. Разложение левой части на множители дает (х—1) (х2 + х-\- 1) = 0. Приравнивание к нулю первого множи- 1 л/ч теля дает х = 1. Второй множитель порождает корни — у ± »-у- > являющиеся первообразными кубическими корнями из 1. Срав- Сравнение с формулой efc = cos -—- + / sin -jp показывает, что —2+*-"9"-— cos 120° + isin 120°. Сравнение компонент дает хо- хорошо известные из тригонометрии формулы cos 120° = — cos 60° = — 4-. sin 120° = sin 60° = ^ф-. Разложение на множители многочлена
46 КОМПЛЕКСНЫЕ ЧИСЛА [ГЛ. II показывает, что первообразные корни степени 6 из 1 суть корни ¦jdszi^j- уравнения х2 — х + 1 = О, ибо приравнивание к нулю других множителей дает не первообразные корни. Рассмотрим п = Ъ. Уравнение Xs—1=0 приводит после раз- разложения на множители к уравнению (х — 1) (х4 + х3 + х2 + х + + 1) = 0. Первообразные корни являются корнями уравнения х4 -f- х3 -f- x2 -f- x -f- 1 = 0. Оно равносильно уравнению х2 + х~2 + + х + х-1 + 1 = 0. Положив х + х~х = z и заметив, что х2 + 2 + + х~2 = z2, мы получим следующее уравнение относительно г: z2 + г- 1 = 0, откуда г, = -1 + -^-; г2 = - I - ^L. Корни из 1 находятся из уравнений х2 — z\x + 1 == 0 и х2 — z2x -f- I — 0, от- 2 -и jc= 5 • Подставив вместо и z2 их значения, получим • _ Уб— 1 . Ую + гУб _ Уб-1 . лЛо Х1 — 4 •" 1 4 ' ^2 ~ 4 ' 4 _ л/5 — 1 , . VlO —2 л/5 _ Уб— 1 . л/ю —2л/5 л3 — 4 •" г 4^ ' 4 ~ 4^ 1 4 * 2kn Ikn Сопоставление с формулой xk = cos -=—\- i sin —g— == cos k • 72° + + i sin k • 72° дает сравнительно мало известную формулу cos 72»==^!. Из нее легко выводится формула для длины стороны аю пра- правильного десятиугольника, вписанного в круг радиуса г. Именно, «ю = 2r sin -^ = 2r sin -i = 2r cos (-=¦ - -^ ) = 2r cos Щ- = д/б- 1 = г- Из этой формулы следует способ построения стороны правильного десятиугольника циркулем и линейкой (рис. 7), известный еще в глубокой древности и описанный Евклидом. Разумеется, формулу а10 = г ^—^— легко обосновать без привлечения задачи о корнях из 1. Именно (рис. 8), равнобедрен- равнобедренный треугольник с основанием at0 и боковыми сторонами г имеет угол 36° при вершине и, следовательно, углы 72° при основании. Биссектриса одного из этих углов разбивает треугольник снова на два равнобедренных треугольника, так что \OD\ = \BD\ — |4B| = aio. Из подобия треугольников ОАВ и BDA получаем г~а'° , откуда а210+ га.,„ — г2 = 0 и аы = г -У5 ~ ' ,
$4] КОРНИ ИЗ ЕДИНИЦЫ 47 Во времена Евклида были известны способы построения цир- циркулем и линейкой правильных n-угольников, вписанных в данный круг, для следующих значений п: п = 4, п = 6 (а значит, и п ==3), и = 10 (с ним и о = 5 и о =15, ибо -^ = g- — ^-J — и прием удвоения числа сторон, что приводило к возможности построения при п = 2*, п = 3*2*, п = 5-2* и о = 15-2*. Никаких других слу- случаев возможности аналогичного построения не было известно до конца 18 в. Тем более поразительным было открытие в 1801 г. способа построения правильного 17-угольника восемнадцатилетним немецким математиком К. Ф. Гауссом. Более того, Гаусс показал, что для возможности построения циркулем и линейкой вписанного г/г Л ОНА Рис. 7. Рис. 8. в данный круг правильного n-угольника необходимо и достаточно, чтобы каноническое разложение числа п имело вид 2kpq ... г, где k — любое целое число, а р, q, ..., г — так называемые простые числа Ферма. Простое число р называется числом Ферма, если р— 1 есть степень числа 2. Наименьшими простыми числами Фер- Ферма являются 3 = 2+1, 5 = 22+1, 17 = 24+1, 257 = 28+1, 65537 = 216+1. Легко видеть, что для простоты числа 2"+1 не- необходимо, чтобы показатель п сам был степенью двойки (но не достаточно: 232+1—не простое число). Существует ли беско- бесконечно много простых чисел Ферма, или их лишь конечное число — вопрос, не решенный до настоящего времени. Выведем формулы, из которых следует, что построение вписан- вписанного в круг правильного 17-угольника выполнимо циркулем и ли- линейкой. Разумеется, мы в состоянии это сделать здесь лишь фор- формально, не вскрывая глубоких причин успеха. Прежде всего заметим, что длина стороны Сз4 правильного 34-угольника, вписанного в круг радиуса г, равна 2r sin 2 3 — = 2r sin ^Ь- = 2r cos(y — -^) = 2r cos — . Положим е = cos-yy-+ •+¦ t sin —-. Рассмотрим следующие два числа: а, =е + е2 + е4 + е8 + е9 + е13 + е15 + е16, oj = е3 + е5 + е6 + е7 + е10 + е11 + е12 + е14.
48 КОМПЛЕКСНЫЕ ЧИСЛА [ГЛ. 1Г Заметим, что е + е2 + ... + е16 = ^—- = 4^ = - 1. Поэто- му ai -f- a2 = —1. Далее, числа ai и аг вещественны, ибо е* и е17~* = e~k комп- комплексно сопряжены, и, учитывая расположение на единичном круге слагаемых е*, легко убедиться, что ai > 0, а2 < 0. Вычислим теперь ща2 = е4 + е6 + ег + е8 + е11 + е12 + е13 + е15 + е5 + е7 + + е8 + е9 + е12 + е13 + е14 + е16 + е7 + е9 + е10 + е1' + + е14 + е15 + е16 + е -f е" + е13 + е14 + е15 + е + е2 + + е3 + е5 + е12 + е14 + е15 + е16 + е2 + е3 + е4 + е6 + + е16 + е + е2 + е3 + е6 + ег + е8 + б10 + е + е3 + + е4 + е5 + е8 + е9 + е10 + е12 + е2 + е4 + е5 + е6 + + е9 + е10 + е11 + е'3. Пока мы просто умножили каждое слагаемое из ai на каждое сла- слагаемое из (Яг, заменив все показатели, большие 16, их остатками от деления на 17. Внимательное рассмотрение получившейся сум- суммы показывает, что среди 64 слагаемых присутствуют все числа е, е2, ..., е16, каждое по четыре раза. Поэтому aia2=4(e + в2 + ... ... + е16) =—4. Итак, ai + a2 = —1, aia2 = —4, ai > 0, a2 < 0. Поэтому -1 + УГ7 -1-УГ7 «1= 2 • "г^ 2 • Рассмотрим теперь числа pi = 8 + е4 + е13 + е16 и C2 = е2 + е8 + -j- e9 -f- е15. Из расположения слагаемых на единичной окружности легко получить, что pi > 0, р2 < 0. Далее, 3, + р2 = а,, р,р2 = е3 +8» +elo +e16 + e6 +eI2 +е'3 + 2 15 4 L 5 ll e8 _J_ 814 = _1 ПОЭТОМУ Возьмем еще р3 = е3 + е5 + е12 + е14, р4 = е6 + е7 + е10 + в". Для них аналогично получим, что P3+P4=a2. P3P4 = — 1» Рз > 0» р4 < 0. откуда Теперь положим vi = в4 + в13. 7г = е + е'в- Ясно, что у2 > Vi > > 0. Далее, vi + T2 = Рь T1Y2 == е3 + е5 + е14 + е12 = р3, откуда 4Рз u 4'2я ' • Но Yi =
§ 5] ПОКАЗАТЕЛЬНАЯ И ЛОГАРИФМИЧЕСКАЯ ФУНКЦИИ 49 Итак, сторона правильного 34-угольника, вписанного в круг радиуса г, находится по формуле #34 — г где Pi= -\-J\7 <Х2 = 2"-^ Таким образом, для вычисления а34 нужно кроме арифметических действий сделать несколько извлечений квадратного корня. Все эти действия выполнимы при помощи циркуля и линейки. § 5. Показательная и логарифмическая функции комплексной переменной 1. Определение показательной функции. Показательная функ- функция ах вещественной переменной х (при положительном основа- основании) определяется в несколько приемов. Сперва, для натуральных значений х— как произведение равных сомножителей. Затем опре- определение распространяется на целые отрицательные и ненулевое значения для х по правилам а~п = -^- и а°= 1. Далее рассматри- рассматриваются дробные показатели, при которых значение показательной ч функции определяется при помощи корней: ар = л/ар. Для ирра- иррациональных значений определение связано уже с основным поня- понятием математического анализа — с предельным переходом, из со- соображений непрерывности. Все эти соображения никак не приме- применимы к попыткам распространить показательную функцию на комплексные значения показателя, и что такое, например, 2'+'— совершенно непонятно. Впервые степень с комплексным показателем при натуральном основании е = 2,71828... была введена Эйлером на основе анализа ряда построений интегрального исчисления. Иногда очень похожие алгебраические выражения при интегрировании дают совершенно разные ответы: =грг dx =  1п Т=Т + С> 2 dx = В то же время здесь второй интеграл формально получается из первого при замене х на xi.
50 КОМПЛЕКСНЫЕ ЧИСЛА 1ГЛ. II Отсюда можно сделать заключение, что при надлежащем опре- определении показательной функции с комплексным показателем обратные тригонометрические функции родственны логарифмам и тем самым показательная функция связана с тригонометрическими. У Эйлера хватило смелости и фантазии дать разумное опреде- определение для показательной функции с основанием е, именно, еа+ы _ еа (cos b + ismb). Это определение, и потому данная формула не доказывается, можно лишь искать доводы в пользу разумности и целесообраз- целесообразности такого определения. Математический анализ доставляет очень много доводов этого рода. Мы ограничимся лишь одним. Известно, что при вещественном х имеет место предельное со- соотношение: ех = lim A + —) • В правой части находится много- член, имеющий смысл и при комплексных значениях для х. Пре- Предел последовательности комплексных чисел определяется естест- естественным образом. Последовательность сп = ап -\- bni считается схо- сходящейся, если сходятся последовательности ап и Ьп вещественных и мнимых частей и принимается lim cn = lim an-\-.i lim bn. л-^оо п->°о n->oo Найдем lim A + — -) . Для этого обратимся к тригономе- трической форме 1Н 1 i = г„ (cos ф„ + i sin ф„), причем для аргумента будем выбирать значения из промежутка —я < <р„ ^ я. При таком выборе ясно, что <рл-»-0, ибо 1 -{ 1 i-»-l. Далее, cosqpn = —, sinmn = Теперь (! + т + т 0"=r« (cos щ«+'sin Пф«)- Для предельного перехода нужно убедиться в существовании пре- пределов для гпп и пфге и найти эти пределы. Ясно, что гп-*-1 и [1 ~l( *L -a!±P* Далее, пФ„ = n sin Ф, ¦ -Д- - i ¦ д^ - ».
j 5] ПОКАЗАТЕЛЬНАЯ И ЛОГАРИФМИЧЕСКАЯ ФУНКЦИИ 51 Итак, в выражении (л а , Ъ .\п „ , . „ . { X —! 1 1) —r" cos пф„ -+- irn sin пф \_ И И / " " " вещественная часть стремится к eacos6, мнимая — к easmb, так что lim A + — + — i)" = ea (cos b + / sin b). л-»°о ^ ИИ/ Это несложное рассуждение дает один из доводов в пользу опре- определения Эйлера показательной функции. Установим теперь, что при умножении значений показательной функции показатели складываются. Действительно: = е^.+ог (cos (ft, _j_ ft2) _j_ i sjn (^ _J_ ^ __ eai+o!+(b,+b2)i- 2. Формулы Эйлера. Положим в определении показательной функции а = 0. Получим: cos Ъ + i sin b = ebi. Заменив b на —b, получим cos b — t sin b = e~bi. Складывая и вычитая почленно эти равенства, найдем формулы вЫ I e-bi еЫ _ е-Ы cos 6= -^ , sin b =? g7 • носящие название формул Эйлера. Они устанавливают связь между тригонометрическими функциями и показательной с мни- мнимыми показателями. 3. Натуральный логарифм комплексного числа. Комплексное число, заданное в тригонометрической форме a = r(cos ф + / sin ф), можно записать в форме re*'. Эта форма записи комплексного числа называется показательной. Она сохраняет все хорошие свой- свойства тригонометрической формы, но еще более краткая. Далее, a=reif^=e^nrefi=eln r+fl. Поэтому естественно считать, что lna = = 1пг4-ф<\ так что вещественной частью логарифма комплексного числа оказывается логарифм его модуля, мнимой частью — его аргумент. Это в некоторой степени объясняет «логарифмическое» свойство аргумента — аргумент произведения равен сумме аргу- аргументов сомножителей. Введенная таким образом логарифмическая функция опреде- определена для всех комплексных чисел, за исключением нуля. Необхо- Необходимо только помнить, что логарифмическая функция многозначна, в силу многозначности аргумента. Однозначность можно было бы установить, например, выбирая ветвь логарифма, для которой —л < ф ^ я, но это приводит к ряду неудобств. В частности, свой- свойство логарифма — логарифм произведения равен сумме логариф-
52 КОМПЛЕКСНЫЕ ЧИСЛА [ГЛ. II мов сомножителей — верно лишь с учетом многозначности. Так, например, один из значений In 1 является 0, одним из значений 1п(—1) является ш\ ибо —1 = cosn-f- isinxt = еш. Однако 1п[(—1)«(—1)] = ni + ti' = 2ni. Это одно из значений логариф- логарифма 1 (ибо 1 = cos2fert + is\n2kn), но отличное от 0. 4. Показательная функция с произвольным основанием. Пусть а — комплексное число, отличное от нуля. Тогда а = eln a при любом значении In а. Поэтому естественно считать по определе- определению ар = еР1п а. Это снова многозначная функция от а и р, в силу многозначности In а, который определен с точностью до слагаемого -D+2**) + 2kn \. I — е . Результат кажется несколько парадоксаль- парадоксальным — все значения «очень мнимого» выражения i' вещественны.
ГЛАВА III ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ § 1. Полиномы от одной буквы 1. Определение. В школьной алгебре одночленом от некоторой буквы х называется алгебраическое выражение вида ахт, где а — 'некоторое число, х — буква, т — целое неотрицательное число. Одночлен ах° отождествляется с числом а, так что числа рассматри- рассматриваются как одночлены. Далее, одночлены называются подобными, если показатели при букве х одинаковы. Подобные одночлены складываются по правилу ахт-\- Ъхт = (а + Ь)хт, называемому приведением подобных членов. Многочленом или полиномом на- называется алгебраическая сумма одночленов. В полиноме порядок слагаемых безразличен и подобные одночлены можно соединить, согласно приведению подобных членов. Поэтому любой полином можно записать в канонической форме аохп -\- а\Хп~1 -\- ... + а„, с расположением членов в порядке убывания показателей. Иногда оказывается удобным записывать члены полинома в порядке воз- возрастания показателей. Буква х обычно обозначает произвольное число. Иногда х счи- считается переменной, тогда полином задает функцию от х, назы- называемую целой рациональной функцией. Два полинома называются формально равными, если они, в ка- канонической записи, составлены из одинаковых одночленов. Ясно, что формально равные полиномы равны тождественно, т. е. при- принимают одинаковые значения при каждом значении буквы х. Вер- Верно и обратное утверждение: если два полинома равны тождествен- тождественно, то они равны формально — но это совсем не очевидно и тре- требует доказательства, которое будет дано в п. 7. Наша ближайшая задача состоит в том, чтобы несколько рас- расширить понятие полинома. Пусть А — некоторое коммутативное ассоциативное кольцо с единицей, и пусть х — буква, посторонняя для кольца А. Одночленом от буквы х с коэффициентом из А на- называется выражение ахт, где оеД т — целое неотрицательное число. Считается, что ах° = а, так что элементы кольца А явля- являются одночленами частного вида. Выражение ахт рассматрива- рассматривается формально — как «картинка», изображенная на бумаге. Для одночленов естественным образом определяются действие приве- приведения подобных членов ахт + Ьхт = (а + Ь) хт и действия умно- умножения ахт-Ьхк = а&ят+*. «Картинка», состоящая из нескольких
54 ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ [ГЛ. И! одночленов, соединенных знаком +, называется многочленом или полиномом от л: с коэффициентами из А. Предполагается, что по- порядок следования одночленов безразличен, подобные одночлены можно соединять, а также вставлять и выбрасывать одночлены с нулевыми коэффициентами. Без нарушения общности можно счи- считать полином записанным в канонической форме аох" + а\х"~1 + • • • ... + ап (т. е. в порядке убывания степеней) или в порядке возра- возрастания степеней cQ -f- с^х + ... + спхп. Дадим теперь естественные определения равенства полиномов и основных действий над ними. 1. Два полинома считаются равными, если они составлены в ка- канонической записи из одинаковых одночленов, т. е. аохп + а,*"-1 + ... + ап = boxn + blX"-] + ... + Ъп в том и только в том случае, если а, = 6,-, i = О, 1, ..., п (снова «формальное» равенство). 2. Суммой двух полиномов называется полином, получающийся посредством объединения одночленов, составляющих слагаемые. Разумеется, после объединения следует привести подобные члены. Таким образом, 1+ ... + ап) + (Ьохп + Ьххп~х + ... +6") = 3. Произведением двух полиномов называется полином, со- составленный из произведений всех членов первого сомножителя на все члены второго. Здесь снова возможно приведение подобных членов. Таким об- образом, ап) {bQxm + Ь1Хт~1 + ... + Ьт) = т +(ао6, + alb0)xn+m-1 + ... -f anbm. Коэффициент при xn+m~k равен aQbk-\- aibk-i + ••• + a*60, если условиться считать, что a,- = 0 при i>n и bi = 0 при / > т. Множество полиномов от буквы х с коэффициентами из кольца А составляет; как легко проверить, кольцо по отношению к опре- определённым выше действиям сложения и умножения. Кольцо это коммутативно и ассоциативно. Оно называется кольцом полино- полиномов от буквы х над кольцом А и обозначается А [х]. Роль нуля в этом кольце играет нулевой полином, т. е. нуль кольца А, рас- рассматриваемый как полином, не содержащий одночленов с ненуле- ненулевыми коэффициентами. Роль единицы играет единица кольца А. В данном выше определении одночлена и полинома имеется одно сомнительное место. Именно, было сказано, что х есть буква, посторонняя для кольца А, и не было объяснено, что это значит. Сказать, что х не принадлежит кольцу Л —это сказать слишком
§ 1] ПОЛИНОМЫ ОТ ОДНОЙ БУКВЫ 55 мало, так как при этом не исключаются нежелательные возмож- ности х2 е А или -т-т— е А и т. д. Однако мы в состоянии изба- виться от «сомнительной» буквы х подобно тому, как избавились от символа i в обосновании комплексных чисел. Обратим внима- внимание на те действия над коэффициентами полиномов, которые долж- должны выполняться при действиях над самими полиномами. Опишем эти действия, исходя из расположения полиномов по возрастаю- возрастающим степеням буквы. Именно, вместо полиномов рассмотрим бес- бесконечные последовательности (а0, а\, ..., ак, ...) элементов кольца А, в которых все элементы, начиная с некоторого, равны нулю. Вводим теперь определения равенства и основных действий. 1. (а0, аь ..., ak, ...) — (b0, b\, ..., bk, ...) тогда и только тогда, когда а, = bi, i = 0, 1, ..., к, ... II. (а0, аь ..., ak, ...) + (b0, bu .... bk, ...) = (ao + bQ, ax + + bu ...I ak + bk, ...)• Ясно, что требование об обращении в нуль всех членов, начи- начиная с некоторого, сохраняется при сложении. III. (а0, аи ¦¦-, ak, ...)(b0, bu ..., Ьк, ...) = (aobo, аф{ + + аф0, ..., аФь. + &\bk-\ + ... + аф0, ...). Здесь тоже сохраняется требование об обращении в нуль всех членов, начиная с некоторого места. Легко проверяется коммутативность и ассоциативность сложе- сложения и умножения и дистрибутивность умножения со сложением. Далее, ясно, что (а, 0, ..., 0, .. .) + (&, О, ..., О, ...) = (а + Ь, О, ..., 0, ...) и (а, 0, .... О, ...)(*, О, .... О, ...) = (ab, 0, ... ..., 0, ...), и, более общо, (а, 0, ..., О, ...) (Ьо, Ьи ..., bk, ...) = = (ab0, abu ..., abk, ...). IV. а е Л отождествляется с последовательностью (а, 0, ... ..., О, ...). Легко проверяется, что аксиома IV не находится в противоре- противоречии с первыми тремя. Рассмотрим теперь последовательность @, 1, 0, ..., 0, ...), обозначив ее буквой х. Тогда х2 = @, 0, 1, 0, ..., 0, ...) и т. д. Поэтому (а0, аи а2, ..., ап, 0, ...) = (а0, 0, 0, ...0, ...) + + @, аь 0, ..., 0, 0, ...)+ ... +@, 0, ..., а„, 0, ...) = = ао + а,@, 1, 0, ...)+а2@, 0, 1, 0, ...)+ ... .-.. + а„@, 0, ..., 1, 0 ...) = а0 + а\х + а2х2 + ... + а„хп. Таким образом, нам удалось построить элементы кольца поли- полиномов. 2. Высший член и степень полинома. Пусть f(x)=aox" + + aix"-1 + ... + ап, причем ао'Ф0. Одночлен а0хп называется высшим членом полинома f(x) и показатель п называется сте- степенью f(x) и обозначается degf. Нулевой полином не имеет вые-
56 ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ [ГЛ. III шего члена в смысле данного определения и считается, что он ра- равен 0. Степень нулевого полинома условно считается равной сим- символу —оо. Предположим теперь, что кольцо А есть область целостности, т. е. что произведение двух элементов из А может равняться нулю, только если один из сомножителей равен нулю. Пусть даны два полинома f(x) = ao*"+ а\хп~х + ... -\-ап и g(x) = boXm-\-biXm-1 + ... -\-bm из кольца А[х], причем а0ф0 и Ьо?=О. Тогда произведение f{x)g(x) содержит ненулевой одно- одночлен aoxn-boxm = афахп+т, который будет, очевидно, высшим чле- членом для f{x)g(x), ибо остальные произведения членов f(x) на члены g (х) имеют меньшую чем n + m степень. Отсюда непосредственно следует справедливость следующей важной теоремы: Теорема 1. Если кольцо А есть область целостности, то кольцо полиномов А [х] — тоже область целостности. В частности, кольцо полиномов над полем есть область целост- целостности. Из формы высшего члена произведения двух ненулевых поли- полиномов следует, что степень произведения двух полиномов (над об- областью целостности) равна сумме степеней сомножителей. Это свойство сохраняется и в случае, когда один или оба сомножителя равны 0, если только условиться в правилах: (—оо)-}-(—оо) = =—оо, (—оо)-}-? = —оо при любом k. 3. Степени элемента в ассоциативном кольце. Пусть В — не- некоторое ассоциативное кольцо и a — его элемент. Введем в рас- рассмотрение степени а с натуральными показателями согласно сле- следующим определениям: al = a, а2 = а-а, а3 = а2-а, ..., а* = = ak~l-a. Здесь степени определяются одна за другой и k-я сте- степень определяется после того, как (k— 1)-я уже определена. Опре- Определения такого типа называются индуктивными. Теорема 2. При натуральных k и m имеет место akam = ah+m. Доказательство. Если m = 1, утверждение теоремы верно согласно определению. При пг > 1 обратимся к методу математи- математической индукции, допустив, что утверждение верно при сумме по- показателей, меньшей k-\-tn. Итак, пусть m > 1. Тогда ат = ат~1а и akam = ak(am-1a) = (akam-1)a в силу ассоциативности. Далее, a*am-i _ ak+m-i B СИЛу индуктивного предположения и, наконец, (a*+m-')a = a*+m в силу определения степени, что и требовалось доказать. Из теоремы следует, в частности, что а3 = а2а = аа2, а* = = а3а = а2а2 = аа3, и т. д. Степени элемента а коммутируют при умножении, ибо а*-а = — ak+m = am+* = am-ak. 4. Значение полинома. Пусть В — ассоциативное кольцо, со- содержащее кольцо А в своем центре, т. е. элементы кольца А ком- коммутируют со всеми элементами из В, и пусть единицей кольца В
§ 1] ПОЛИНОМЫ ОТ ОДНОЙ БУКВЫ 5? является единица кольца А. В частности, кольцо В может совпа- совпадать с кольцом А. Пусть се В и пусть дан полином f (x)= a§xn -f- а\хп~х -f- ... ... + вп- Значением полинома f в с (или, с некоторой вольностью- языка, при х = с) называется элемент + ... +а„ кольца В. Легко получаются следующие свойства: если F (х) = U (х) + /2 (х), то F (с) = /, (с) + f2 (с) и если Ф (х) = /, (*) /2 (*), то Ф (с) = /, (с) /2 (с). Действительно, для одночленов это очевидно, а действия над. полиномами определяются через действия над составляющими их. одночленами. Из сказанного следует, что значения полиномов из А[х] в од- одном и том же элементе сеВ коммутируют при умножении, и их множество, обозначаемое через А [с], есть коммутативна под- кольцо ассоциативного, но не обязательно коммутативного- кольца В. 5. Схема Хорнера и теорема Безу. Если для полиномов f(x) и g(x) из А[х] существует такой полином h(x)<^ А\х], что f(x) = *=g(x)h(x), то говорят, что полином f(x) делится на полином g(x). Наша ближайшая задача заключается в выяснении вопроса о делимости f(x)^A[x] на линейный двучлен х — с при се А. Прежде всего установим, что всегда осуществимо так называе- называемое деление с остатком: f(x) = (x — c)h(x)-\-r при г^А. Здесь полином h(x) называется неполным частным, а г — остатком. Теорема 3. Пусть f (x)= а^х"-\- а\хп~х -\- ... +а„еЛ[х] и се Л Найдутся полином п(х)^ А[х] и элемент г^А такие, что f(x) = (x-c)h(x) + r. Доказательство. Естественно искать h(x) в форме box"-1 + Ь\Х"~2 + ... + bn-i. Сравнение коэффициентов показы- показывает равносильность равенства аохп + aijcn~l + ••• + ап = = (х — с) (box"-1 + Ъ\хп-'1 + • • • + Ьп-\) + г це'почке равенств а0 = bo, fl(| = 6] — cb0,
58 ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ [ГЛ. ИГ откуда последовательно определяются коэффициенты п(х) и оста- остаток г: bo — <h> b{ = at + cb0. Теорема доказана. Кроме того, получен очень удобный способ вычисления коэффициентов h(x) и остатка г. Этот способ носит название схемы Хорнера. Заметим сразу, что остаток г равен значению f(c) полинома f(x) при х = с. Действительно, переходя в равенстве f(x) = = (х — c)h{x)-\-r к значениям при х = с, получим f(c) = — (с — c)h(c) + r, откуда r = f(c). Пример. Найти неполное частное и остаток при делении по- полинома х5 на х — 2. Выпишем последовательно коэффициенты полинома хь и, после вертикальной черты, число 2: 1 0 0 0 0 012. Под этой строкой запишем коэффициенты неполного частного и остаток, пользуясь только что выведенными формулами: 10 0 0 0 012 1 2 4 8 16 32 (остаток — подчеркнутое число). Итак, хь — (х — 2) (х4 + 2х3 + Ах2 + 8х+ 16) + 32. Теорема 4 (Безу). Для того чтобы полином f(x)^A[x] де- делился на х — с, необходимо и достаточно, чтобы f(c)= 0. Доказательство. Необходимость. Пусть f(x) де- делится на х — с, т. е. f(x) — (x — c)h(x). Тогда /(с) = 0. Достаточность. Пусть f(c) = O. Тогда в равенстве f(x) = = (x — c)h(x) + r будет г = f(c) = O, т. е. f(х) = (х — c)ti(x). Тео- Теорема доказана полностью. Элемент с кольца А называется корнем полинома f(x), если f(c) = O. Таким образом, теорема Безу может быть сформулиро- сформулирована так: для того чтобы полином f(x)<^A[x] делился на двучлен х — с при сеД необходимо и достаточно, чтобы с было корнем fix). 6. Число корней полинома в коммутативной области целостности. Лемма. В области целостности возможно сокращение в ра- равенстве, т. е. из ab = ас при а Ф; 0 следует b — с.
I i] ПОЛИНОМЫ ОТ ОДНОЙ БУКВЫ 59 Действительно, равенство аЪ = ас равносильно равенству а(Ь — с) = 0. Так как а Ф 0 и мы оперируем в области целост- целостности, должно быть Ъ — с = 0, т. е. b = с. Теорема 5. Пусть f(х) = аохп + а\Хп~1 + • • • + ап — поли- полином из А [х], где А — (коммутативная) область целостности. Тогда число корней f(x) в А не превосходит его степени п. Доказательство. Применим метод математической ин- индукции по степени полинома. База для индукции имеется — поли- полином а0 Ф 0 нулевой степени не имеет корней. Допустим, что n ^ 1 и что теорема доказана для полиномов степени п—1, и в этом предположении докажем ее для полинома f(x) степени п. Если f(x) не имеет корней в А, то утверждение теоремы верно. Пусть корни есть и Ci — один из корней. Тогда f{x) = (x — cl)h(x), где /г(л;)=а0А"г-1 + 61х"-2+ ... ... +Ьа-1*=А[х]. Если с2— какой-либо корень f(x), отличный от си то 0 = —/(сг) = (сг — C\)h(c2), но с2— С\фЬ, следовательно, й(с2) = 0. Таким образом, любой корень f(x), кроме си является корнем полинома h(x) степени п—1. В силу индуктивного предположе- предположения этот полином имеет не более п—1 корней в А и, следова- следовательно, f(x) имеет не более я корней, что и требовалось доказать. Заметим, что предположение о том, что кольцо А есть область целостности, здесь существенно. Так, в кольце вычетов по мо- модулю 8 полином х2— 1 имеет 4 корня: 1, 3, 5, 7. 7. Теорема о тождестве. Пусть, по-прежнему, А — коммутатив- коммутативная область целостности и А[х] — кольцо полиномов над А. Теорема 6 (о тождестве). Если А содержит бесконечно много элементов, то два полинома fi(x) и /2(х), принимающие одинаковые значения при всех с е Л, равны. Доказательство. Допустим, что разность F(x) = fi(x) — — J2(x) отлична от нуля, так что F(x)— аохп + a\xn~l -f- ... -\-ап при аоФ0. Возьмем попарно различные элементы с,, с2, ..., cn+i кольца А. Тогда, в силу условия теоремы, fi(ci) = f2(ci), fi(c2) = = /2(с2), ..., fi(Cn+i) = /2(cn+i), так что полином п-й степени F(x) имеет более чем л корней: с\, с2, ..., сп+и Это невозможно. Сле- Следовательно, F(a') = 0 и f 1 (х) = /2 (х), что и требовалось доказать. Здесь было существенно, что кольцо А имеет бесконечно много Элементов. Так, если A = GFE) есть поле вычетов по модулю 5 и .f1(*) = *8 + x4 + 2*a + jc+l, f2(x) = x* + 2*2 + 2*+1 -поли- -полиномы из А\х], то f,@)=M0)=l, М1) = Ы1)=1, fiB) = = f2B) = 4, M3J = M3)=1, Ы4) = Ы4)=2. Полиномы fx(x) и h(x) принимают одинаковые значения при всех элементах кольца 'А, и тем не менее они различны. Их разность х5 — х есть отличный от нуля полином, все значения которого в А равны 0. 8. Алгебраически замкнутое поле. Поле К называется алгебра- алгебраически замкнутым, если любой полином f{x)<=K[x] выше чем
¦60 ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ П"Л. Ill нулевой степени имеет по крайней мере один корень в поле К. В дальнейшем будет доказана так называемая «основная теорема алгебры», утверждающая, что любой полином с комплексными коэффициентами имеет по крайней мере один комплексный ко- корень. Иными словами, основная теорема алгебры утверждает, что поле JQ комплексных чисел алгебраически замкнуто. По существу, эта теорема принадлежит скорее к математическому анализу, чем к алгебре, так как для ее доказательства нужно привлечение средств анализа. Она будет доказана в гл. IX. Другие знакомые нам поля не замкнуты алгебраически. Так, в поле Q рациональных чисел полином х2— 2 не имеет корней, в поле R действительных чисел не имеет корней полином х2 + 2. Нетрудно установить, что поля GF(p) вычетов по простым моду- модулям тоже не алгебраически замкнуты. Теорема 7. В алгебраически замкнутом поле любой полином аохп + ахх"-* + ... + ап, а0ф0, п^\, имеет разложение на ли- линейные множители вида ао{х — С\) (х — с2) ... (х — сп), и такое разложение единственно. Доказательство. Оба утверждения теоремы будем дока- доказывать методом математической индукции по степени полинома. Начнем с доказательства возможности разложения. Полином первой степени аох-\-а\ при ао^0 в любом поле имеет корень с=— — , я аох4-а\ = ао(х— с). а0 Пусть теперь л>1. В силу алгебраической замкнутости f(x) имеет по крайней мере один корень С\ е& и, следовательно, f(x) = = (х — c,)fi(x),me fi(x) = аохп-1-\-bixn~2+ ••¦ + bn-\ — полином (п—1)-й степени. В силу индуктивного предположения ^1(а') = = ао(х — с2) ... (х — с„), откуда f(х)= ао(х — й) (х — с2) ... ...(Х — Сп) ¦ Теперь докажем единственность разложения, снова по индук- индукции. При п=\ она очевидна: если аох-\- а\ = ао(х — с) = = ао(х — с'), то ао(с'— с) — 0, откуда с'= с, ибо а0ф0. Пусть теперь п > 1 и имеются два разложения: f (x) = aQ(x — — с,)(* -с2) ... {х-сп)=ай{х-х[){х-с'2) ... (х -сп). Положив х = с\, получим f(cl) = 0 = ao(cl-c[)(cl-cZ) ... (ct-c'n). Из равенства нулю произведения заключаем о равенстве нулю одного из сомножителей. Так как ао=^=0, должен обращаться в нуль один из следующих сомножителей и, без нарушения общ- общности, можно считать, что с, — с' = 0, иначе можно изменить ну- нумерацию элементов с[, с'2, ..., с'п. Итак, с[ = с1 и ай{х-с,)(х-с2) ... (х-сп) = а0(х-с^х-с'2) ... (х - с'п).
§ 2i РЕШЕНИЕ УРАВНЕНИЙ ТРЕТЬЕЙ И ЧЕТВЕРТОЙ СТЕПЕНИ 61 Так как кольцо полиномов над полем есть область целостности, можно сократить обе части равенства на х—Сь Получим ао(х - с2) ...(*- с„) = ао(х- 4) ...(х- с'п). В силу индуктивного предположения эти разложения совпадают. Следовательно, совпадают и исходные разложения f(x). Теорема доказана полностью. Среди сомножителей в разложении /(*)= ао(х — ci)(x — c2) ... {х — сп) могут быть равные. Соединив их в виде степеней, получим разло- разложение в виде f (x) =ao(x~ ci)mi ... (jc - ck)mk, * где С\, ..., Ck уже попарно различны. Ясно, что С\, ..., Ck являются корнями полинома f(x) и других корней }{х) в поле К не имеет. Показатели mi ..., nik называ- называются кратностями соответствующих корней. Корни кратности 1 называются простыми корнями, корни крат- кратности 2 — двойными или двукратными, и т. д. Из последней формы разложения полинома на линейные мно- множители следует, что в алгебраически замкнутом поле число корней полинома равно его степени, если условиться считать каждый ко- корень столько раз, какова его кратность. § 2. Алгебраическое решение уравнений третьей и четвертой степени Этот параграф имеет скорее историческое, чем научное значе- значение. Правила решений алгебраических уравнений первой и второй степени были известны еще в античные времена. Для уравнений более .высоких степеней были известны лишь некоторые приемы решения уравнений частных видов. В 16-м веке в Италии несколь- несколькими математиками одновременно был открыт способ алгебраи- алгебраического решения кубических уравнений. Он был опубликован не первооткрывателем метода, но выдающимся разносторонним уче- ученым Кардано, имя которого известно теперь каждому автомоби- автомобилисту и трактористу, так как Кардано изобрел простое и практич- fioe приспособление для передачи вращения с одного вала на дру- другой, не жестко скрепленный с первым. Ученики Кардано обнару- обнаружили, что решение общего уравнения четвертой степени можно свести к решению кубического уравнения и нескольких ква- квадратных. 1. Алгебраическое решение уравнений третьей степени. Общее кубическое уравнение имеет вид + а%х + аз = 0.
62 ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ [ГЛ. III Мы будем считать, что коэффициенты — комплексные числа, и задача состоит в отыскании комплексных корней. Без нарушения общности можно считать, что «о = 1, ибо оот^О и на него можно поделить обе части уравнения. Сделаем замену х = у—¦—. По- Получим [у — хK + а'(# ~~ Т") +а2(#—-т) + аз==:0 и> Ра" скрывая скобки и приведя подобные члены* придем к уравнению - -±)у + ( °з 3~+27 a2 a a 2 Обозначив a2 з~ = Р> аз з—^~ 27" ai == ^' пРиДем к урав- уравнению У3 + РУ + Я = 0. Для дальнейшего исследования нужна следующая элементар- элементарная лемма: существует пара чисел а и р с наперед заданными суммой a + Р = а и произведением ар = Ь. Именно, эти числа являются корнями квадратного уравнения z2 — аг + Ь = 0. Положим теперь у = a -f- р. Уравнение примет вид а3 -f- За2р -f- + Зар2 + р3 + Р(« + Р)+ q = 0 или а3 + Р3 + (Зар-)-р) (а + Р)+ + 9 = 0. Положим Зар + Р = 0. Тогда а3 + Р3 + q = 0. Ясно, что если а3 + Р3 + q = 0 и Зар-)-р = 0, то г/ = а-|-р будет удовлетворять уравнению у3 + рг/ -f- q = 0. Т-аким образом, нам нужно решить систему Зар= -р. Возведем второе уравнение в куб: а3р3 = ?=¦. Мы получили, что для а3 и р3 известны сумма и произведение. Поэтому числа а3 и р3 находятся как корни квадратного уравнения 27 откуда V' , Р° «3— _ ±_ Т "*" 27 ' Р ~ 2 'V 4 ' 27 Для у получается так называемая формула Кардано:
$ 21 РЕШЕНИЕ УРАВНЕНИЙ ТРЕТЬЕЙ И ЧЕТВЕРТОЙ СТЕПЕНИ 63 Для каждого из кубических корней в поле комплексных чисел имеются три значения и для обоих корней имеется девять ком- комбинаций. Однако из них нужно сохранить только те, для которых сф= 1-, т. е. брать $ = —-?[• Обозначим через coi и ш2 пер- первообразные кубические корни из 1, т. е. (ol = —5" + '• 2~' ^^ — ~ у ~~ ' ~2 ' ^Усть ttl и Р1 — одна подходящая пара значений для аир. Остальные значения для а будут aico[ и aioJ, соответ- соответствующие значения для р будут Pi<e2 и Picoi. Поэтому формула Кардано дает три корня уравнения: Пример 1. у" + C — 3?)У + (—2 + 0 = 0. 2г. При извлечении кубических корней нужно помнить, что их произ- произведение должно равняться —- = — 1 + г. Поэтому, взяв для пер- первого корня значение —i, для второго нужно взять —1—и Корни данного уравнения суть: Ух = - I + (-1 - i) = ~ 1 - 2i, Пример 2. г/3 — 9г/ + 28 == 0.
64 ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ [ГЛ. III Нужно помнить, что произведение кубических корней должно рав- равняться — -§- = 3, так что, взяв для первого корня значение —1, О для второго нужно взять —3. Корни данного уравнения суть: У1 1 _ з 4, у2 = — о»! — Зш2 = 2 + i V3, г/3 = — «г — 3oii = 2 — i V3. Данный пример решился очень благополучно, что является скорее исключением, чем правилом, как будет видно из дальней- дальнейшего исследования. 2. Исследование формулы Кардано. Проведем исследование формулы Кардано в предположении, что коэффициенты р и q уравнения г/3 -f- ру + q = 0 являются действительными числами. Из вида формулы О2 , р3 ясно, что знак выражения 4 "¦"" 27 Д°лжен оказывать существен- существенное влияние на характер корней уравнения. Рассмотрим три случая. Случай I. ~4~"т~'2У->0' В этом случае числа —|-+ + д/ —- +¦§}¦ И —\— Д/~4~ ~^~ ~27 °ба Действительные и различны. Если значение ai первого кубического корня взято дей- действительным, то и для второго корня нужно взять тоже действи- действительное значение рь так как их произведение должно быть дей- действительным числом — 4. Таким образом, в этом случае корни О будут Z/2 == CtjCOj -)- Pi012 = — n 1 p I -\o, = — г, 0 ' V3"- = а,со2 Следовательно, i/i — действительный корень, t/2 и г/з — комп- комплексно сопряженные не действительные корни, ибо ом ф pi. „2 ~3 ,7 Случай 2. 4~^27'==^' В этом случае числа —-^ + +- д/-j- + -^ и — -| — Д/-J- + |f Действительные, но равные. Действительному значению cci первого кубического корня должно соответствовать действительное же значение Pi в'торого, и на этот раз ся = pi. Комплексные же значения кубических корней нужно
§ 2] РЕШЕНИЕ УРАВНЕНИЙ ТРЕТЬЕЙ И ЧЕТВЕРТОЙ СТЕПЕНИ 65 подбирать по прежнему правилу, обеспечивающему равенство «Р—f Итак: z/i = cti-]-Pi = 2eii, = — а,, = — а,. В этом случае все три корня действительны, но среди них имеются два равных. а2 р3 Случай 3. -j- + -^=- < 0. Это возможно только при отрица- отрицательном р. Пусть р = —р\, где р\ > 0. В этом случае под знаками кубических корней окажутся сопряженные комплексные числа Для извлечения кубического корня запишем число —г + —¦—т- в тригонометрической форме: r(cos(p -j- /sin<p). Имеем: Отсюда -V4» где k = 0, 1, 2. В этом случае 0^=-^, откуда ф + 2/гя ... cos JiL-g— +'sin cos Л + VEL _ , sIn Таким образом, р оказывается числом, сопряженным с а, в чем можно было убедиться из того соображения, что произведение ар должно равняться действительному числу -^- —|ар.
ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ [ГЛ. Ш Итак, V~p7 ( а 4- 2ftjt ... Ф + 2kn ? ( cos ^^ -l sin JLrEL)-2 V? где ? = 0, 1, 2. Все три корня оказываются действительными и, как нетрудно видеть, попарно различными. Интересно отметить, что в этом, ка- казалось бы, самом лучшем (в смысле действительности корней) случае комплексные числа появляются по существу, и это было одним из стимулов введения комплексных чисел в математику. Рассмотрим еще примеры. Пример 3. у3— 9у + 8 = 0. Здесь имеется бросающийся в глаза корень у= 1. Посмотрим, что дает формула Кардано у -,лУ-4 + л/16 - 27 + V-4 - V16-27 = = -v^—4 + г Vn" + лУ~4 — i УТТ. Ничего похожего на число 1 мы не видим. Однако если знать, л , • /тт ( 1 -» VTT Ч3 , что — 4 + i V1 * = I г У '° чем нетРУДН0 догадаться, за- заранее зная, что исходное уравнение имеет корень 1), то получим 1 — iVH . l + iVH , г ' 2 == ' В случае, когда все три корня вещественны, можно доказать, что при алгебраическом решении уравнения третьей степени из- извлечение кубического корня из комплексного числа неизбежно. Однако и в первом случае, когда нет необходимости в действии извлечения кубического корня из комплексного числа, как пра- правило, «хорошие» корни, если они есть, формула Кардано преподно- преподносит «под маской». Благополучный пример, типа приведенного выше примера 2, является исключением. Рассмотрим еще один пример. Пример 4. jc3 + Зх — 4 = 0. Здесь снова «светится» корень к= 1. Формула Кардано дает: - л/5.
$ 2] РЕШЕНИЕ УРАВНЕНИЙ ТРЕТЬЕЙ И ЧЕТВЕРТОЙ СТЕПЕНИ 67 Правда, и здесь можно «снять маску», если знать, что 2 + V J и 2 —д/5=^ <j-—J . Если принять это во вни- внимание, получим J + 3. Решение уравнений четвертой степени. Вскоре после того, как Кардано опубликовал способ решения кубических уравнений, его ученики и последователи нашли способы сведения общего уравнения четвертой степени к кубическому уравнению. Изложим наиболее простой способ, принадлежащий Л. Феррари. При изложении способа нужно будет воспользоваться следую- следующей элементарной леммой. ' Лемма. Для того чтобы квадратный трехчлен Ах2 + Вх + С был квадратом линейного двучлена, необходимо и достаточно, чтобы его дискриминант В2— \АС равнялся нулю. Доказательство. Необходимость. Пусть Ах2 -+¦ BC = (kx + lJ. Тогда A=k2, B = 2kl, C=l2 и В2 — 4АС=0. Достаточность. Пусть В2 — ААС = 0. Тогда-Л*2 + Вх-f-С» = (Ул* Идея излагаемого способа состоит в том, чтобы представить левую часть уравнения х4 + ах3 -\- Ьх2 + сх + d = 0 в виде раз- разности двух квадратов. Тогда ее можно будет разложить на два множителя второй степени, и решение уравнения приведется к решению двух квадратных уравнений. Для достижения цели ле- левую часть представим в виде: Здесь у — вспомогательная неизвестная, которую нужно подобрать так, чтобы выражение в квадратных скобках оказалось квадратом линейного двучлена. В силу леммы для этого необходимо и доста- достаточно выполнения условия
68 ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ [ГЛ. III Это условие есть уравнение третьей степени относительно у. После раскрытия скобок оно преобразуется к виду г/3 — by2 + {ас — 4d)y — (c2 + a2d — 4bd) = 0. Пусть у\ — один из корней этого уравнения. Тогда при у = условие будет выполнено, так что имеет место при некоторых k и /. Исходное уравнение пр.имет вид или Приравнивая нулю каждый из сомножителей, мы найдем че- четыре корня исходного уравнения. Сделаем еще одно замечание. Пусть х\ и Хг — корни первого сомножителя, х3 и хц — корни второго. Тогда х{х2 = -^- + /, x3xt = = -^—/.Сложив эти равенства, получим, что у\ = х\Х2 + Таким образом, мы получили выражение корня у\ вспомогатель- вспомогательного кубического уравнения через корни исходного уравнения чет- четвертой степени. Пример. Решить уравнение х4 + 2х3— 6х2 — 5лг + 2 = 0. Согласно изложенному выше методу преобразуем левую часть: *4 + 2хъ — 6х2 — 5х + 2 = +х + -|-J - ух2 - х2 — ху — SL — бх2 — Ъх + 2 = Теперь положим (у + 5J — 4 (у + 7) (-^ 2^ = 0. После пре-> образований получим уравнение У3+6у2— 18у — 81 =0. Легко видеть, что одним из корней этого уравнения является число у^ = —3. Подставив его в преобразованную левую часть исход- исходного уравнения, получим: ** + 2*з - 6.v2 - Ъх + 2 = (х2 + х -|J- [4х2 + 2х + |] = - |J - B* + jf = (*' + 3* ~ 1)(х2 - jc - 2).
$ 3] ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ БУКВ Приравнивая сомножители нулю, получим -з + УТэ -з- У13 3 == ' 4 = ~ - Что касается уравнений выше четвертой степени, то здесь были известны некоторые классы уравнений сравнительно частного вида, допускающих алгебраические решения в радикалах, т. е. в виде результатов арифметических действий и действия извлече- извлечения корня. Однако попытки дать решение общих уравнений пятой степени и выше были безуспешны, пока, наконец, в начале 19 в. Руффини и Абель не доказали, что решение такого рода для об- общих уравнений выше четвертой степени невозможно. Наконец, в 1830 г. гениальному французскому математику Э. Галуа удалось найти необходимые и достаточные условия (проверяемые доволь- довольно сложно) для разрешимости в радикалах конкретно заданного уравнения. При этом Галуа создал и использовал новую для своего времени теорию групп подстановок. § 3. Полиномы от нескольких букв 1. Определение и основные действия. Пусть дано коммутатив- коммутативное кольцо А с единицей и несколько посторонних для А букв Х{, ..., хт. Одночленом относительно этих букв называется выра^ жение ах\х ... хп™, где а е A, k\, ..., km — целые неотрицатель- неотрицательные числа. Показатели k\, • ••> km называются степенями одно- одночлена относительно соответствующих букв, a k\-\- ... -f- km назы- называется полной степенью или просто степенью одночлена. Для по- подобных одночленов ах\х ... х4^ и Ьх\х ... х^т определено сложе- сложение ajcf1 ... х^1 + Ьх^ ... хк^ — (а + Ь) хк{' ... хк^ («приведение подобных членов») и определено умножение одночленов: ах*1 хкт • bxtl x'm —abxkl+li хкт+'т ал, ... лщ ихх ... хт —иил{ ... лт Многочленом или полиномом называется формальная сумма одночленов, причем порядок слагаемых безразличен. Максимальная из степеней одночленов, составляющих полином, называется его степенью. Полином, все члены которого имеют оди- одинаковую степень, называется однородным полиномом или формой. Максимальная из степеней относительно какой-нибудь буквы на- называется степенью полинома относительно этой буквы. Два полинома считаются равными, если они составлены из одинаковых одночленов. Для полиномов естественным образом определяются действия сложения и умножения. Именно, сумма двух полиномов составлена из объединения всех одночленов, со- составляющих слагаемые; произведение есть сумма произведений всех членов первого сомножителя на все члены второго. Полиномы
70 ПРОСТЕЙШИЕ СВЕДЕНИЯ ОБ АЛГЕБРЕ ПОЛИНОМОВ [ГЛ. 111 образуют ассоциативное и коммутативное кольцо, обозначаемое А 1*ь ..., Хт]. Ясно, что полином от букв х\, ..., хт можно рассматривать как полином от х\ с коэффициентами, являющимися полиномами от остальных букв. Теорема 1. Кольцо полиномов от нескольких букв над об- областью целостности есть область целостности. Доказательство. Применяем метод математической ин- индукции по числу букв. База индукции имеется — для полиномов от одной буквы теорема была установлена в п. 2 § 1. Положим теперь, что кольцо полиномов от in — \ букв есть область целост- целостности. Тогда и кольцо полиномов от m букв есть область целост- целостности, ибо оно есть кольцо полиномов от одной буквы над коль- кольцом полиномов от m—1 букв, которое есть область целостности по индуктивному предположению. 2. Значения полиномов от нескольких букв. Пусть В — ассоци- ассоциативное коммутативное кольцо (для полиномов от одной перемен- переменной коммутативность В была не обязательна), содержащее А, и с единицей, совпадающей с единицей А. Пусть дан полином F(xx, .... xm)=Zaki ftnxf' ...xfre=A[xlt .... xm] и даны bu ..., bm^B. Значением полинома F(xu ..., xm) в точ- точке (b\ bm) (или при х\ = bu ..., xm = bm) называется Ясно, что если Н{хь ..., xm) = Fl(xu ..., xm) + F2(xu ...,xm) и G(xu ..., xm) = F1(x1, ..., xm)-F2(x{ xm), то H(bu .... bJ^F^bi, .... bm) + F2(bu ..., bm) и 0{bi, •••. bm) = F\{bu ..., bm) ¦ F2(bu ..., bm). 3. Теорема о тождестве. Если А — область целостности, содер- содержащая бесконечно много элементов, то верна следующая теорема о тождестве. Теорема 2. Если два полинома Fx (х\,..., хт) и F2(xu ..., хт) равны тождественно в А (т. е. принимают одинаковые значения при одинаковых наборах значений букв), то они равны фор- формально. Для доказательства достаточно установить справедливость леммы: Лемма. Если полином Н(хи ..., хт)^А[х\, ..., хт] тож- тождественно равен нулю в А (т. е. все его значения равны нулю), то он равен нулю формально. Действительно, достаточно перейти от многочленов fi и ^ к их разности Я = Fi — Fz.
I з] ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ БУКВ 71 Доказательство леммы. Мы докажем равносильное лемме предложение: если полином Н формально отличен от нуля, то найдутся значения х\, ..., х*т для букв х\, .... хт, при которых Н принимает значение, отличное от нуля. Применим метод математической индукции по числу букв т. При т = 1 теорема была доказана. Пусть т> 1, Н (хь ..., хт)Ф ФО. Запишем Н(х\, ..., хт) как полином от х\ с коэффициентами из А[х2, ..., хт]: Можно считать, что ао(х2, ..., хт)ф0. В силу индуктивного предположения для х2, ..., хт найдется набор значенийх*2, ..., х*т такой, что а] = а0 (л:*, ..., хт) ф 0. Тогда И \хр Х2> • • •' Хт) == при aj =т^ 0. В силу теоремы для т = 1 найдется х\ <s Л такое, что что и требовалось доказать. 4. Теорема о несущественности алгебраических неравенств. Теорема 3. Пусть А — область целостности, содержащая бес- ,конечно много элементов, и пусть F\ и F2 — два полинома из А[х\, ..'., хт\, принимающие одинаковые значенияF\ (х\, .. .,л^)= ж:=^2(х'' •••> х"т) всюду, где выполнены неравенства Нх(х\, ... .... х'т) Ф 0, .... Hk(x\, ..., х"т)Ф 0, где Ни .... Hk — некото- некоторые отличные от нуля полиномы из А\хЛ, ..., хт]. Тогда поли- полиномы Fi и F2 равны формально. Доказательство. Рассмотрим полином (Fi — F2)H\...Hk. (Он равен нулю при всех наборах переменных, так как там, где Н1ФО, ..., НьФО, обращается в нуль первый множитель. В силу теоремы о тождестве {Fi — F2)HX ... Hk = 0 (формальное равен- равенство). Но А [х\, ..., хт] есть область целостности и Н\Ф0, ... .... Нкф0. Следовательно, Fi — F2 = Q, т. е. Fy = F2, что и тре- требовалось доказать. Установленная теорема оказывается полезной в довольно часто встречающейся ситуации, когда равенство значений двух полино- полиномов удается установить в предположении о необращении в нуль одного или нескольких полиномов. В силу доказанной теоремы после установления равенства поставленные ограничения автома- автоматически снимаются.
ГЛАВА IV МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ § 1. Матрицы и действия над ними 1. Определение матрицы. Матрицей называется прямоугольная таблица, заполненная некоторыми математическими объектами. По большей части мы будем рассматривать матрицы с элемен- элементами из некоторого поля, хотя многие предложения сохраняют силу, если в качестве элементов матриц рассматривать элементы ассоциативного (не обязательно коммутативного) кольца. Чаще всего элементы матрицы обозначаются одной буквой с двумя индексами, указывающими «адрес» элемента — первый индекс дает номер строки, содержащей элемент, второй — номер столбца. Таким образом, матрица {размеров m Xп) записывается в форме Матрицы, составленные из чисел, естественно возникают при рассмотрении систем линейных уравнений Входные данные для этой задачи — это множество коэффициентов, естественно составляющих матрицу / ац аи ... а1п \ I )' 4 ош ап2 ... апп' ¦ *1 / и сово»унноеть свободных членов, образующих матрицу имеющую лишь один столбец. Искомым является набор зна- значений неизвестных, который, как оказывается, удобно пред-
% If МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ етавлять тоже в виде матрицы I ' I, состоящей из одного столбца. Важную роль играют так называемые диагональные матрицы. Под этим названием подразумеваются квадратные матрицы, имею- имеющие все элементы равными нулю, кроме элементов главной диаго- диагонали, т. е. элементов в позициях A,1), B,2), ..., (п,п). Диагональная матрица D с диагональными элементами di,^2,••• ..., 4п обозначается diag(di, d2, ..., dn). Матрица, составленная из элементов, находящихся на пересе- пересечениях нескольких выбранных строк матрицы А и нескольких выбранных столбцов, называется субматрицей для матрицы А. Если cci < а2 < ... <. ак — номера выбранных строк и Pi < < Р2 < ••• <р/ —номера выбранных столбцов, то соответствую- соответствующая субматрица есть В частности, строки и столбцы матрицы можно рассматривать как ее субматрицы. Матрицы связаны естественным образом с линейной подстанов' кой (линейным преобразованием) переменных. Под этим назва- названием понимается переход от исходной системы переменных Х\, х%,..., хп к другой, новой, уи у2,..., ут, связанных по формулам! + ••• +аХпхп, У2==а21Х1 Ут = «шЛ + 0m2*2 + ••• +1ПА. Линейная подстановка переменных задается посредством ма- матрицы коэффициентов 'аи а,2 ... а1п 1 «22 • • • О-гп - ат1 пт2 • • • йт Среди систем линейных уравнений наибольшее значение имеют системы, в которых число уравнений равно числу неизвестных. Среди линейных подстановок переменных основную роль играют подстановки, в которых число исходных и новых переменных оди- одинаково. В этих ситуациях матрица коэффициентов оказывается квадратной, т. е. имеющей одинаковое число строк и столбцов; это
74 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV число называется порядком квадратной матрицы. Вместо того чтобы говорить «матрица, состоящая из одной строки», и «матри- «матрица, состоящая из одного столбца», говорят короче: строка, столбец. 2. Сложение матриц и умножение матрицы на число. Введем в рассмотрение алгебраические действия над матрицами. Рассма- Рассматриваем матрицы с элементами из некоторого поля Д'. При этом две матрицы считаются равными, если у них совпадают элементы, стоящие на одинаковых местах. Определим произведение элемента с е К на матрицу А = 4 ат\ ... атп ' ^ матриц над некоммутативным ассоциативным кольцом сле- следует различать два произведения с А и Ас). Для матриц одинакового строения, т. е. имеющих одинаковое число строк и столбцов, определяется сложение по правилу: если ... а1п \ ), В= bml ... ТО 1 + *11 ¦•• а\п / Ьи ... ьхп \ = , v bml ... bmn-' ), ml + bmi ... amn + bmn т. е. элементами суммы двух матриц является сумма соответ- соответствующих элементов слагаемых матриц. Отметим некоторые свойства действий. 1. (А -\- В)-\- С = А + (В -\- С)—ассоциативность сложения. 2. А-\- В = В -f- A — коммутативность сложения. 3. Матрица 0, состоящая из нулей, играет роль нуля: A -f- 0 = А при любой А. 4. Для любой матрицы А существует противоположная —А та* кая, что А-\-(—Л) = 0. (В качестве матрицы —А, очевидно, сле- следует взять матрицу (—\)А, элементы которой отличаются от эле- элементов А знаком.) 5. (ci + c2)A = 6. c(Al + A2) = 7. Ci(c2A) 8. 1-Л = А Все перечисленные свойства непосредственно следуют из опре- определений и свойств действий в поле (или в кольце). Система математических объектов, в которой определено дейст- действие сложения и действие умножения на элементы поля К, причем
f ij МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ 75 эти действия обладают свойствами 1—8, называется векторным пространством над полем К. Таким образом, множество матриц одинакового строения с эле- элементами из данного поля К образует векторное пространство по отношению к определенным выше действиям. В частности, строки данной длины и столбцы данной высоты образуют векторные про- пространства. Пусть Аи ..., Ат — несколько матриц одинакового строения. Матрица cxAi + ... + cmAm, при Ci e К, называется линейной ком- комбинацией матриц Аи ..., Am. Нам придется применять этот тер- термин преимущественно к строкам и к столбцам. Рассмотрим в свете этого понятия систему линейных уравнений общего вида + • • • + ЩпХп = Ьи 021*1 + «22*2 + . • • + «2 А = Ь2, введя в рассмотрение столбцы из коэффициентов аи ч • аи Чг\ \ I Я22 ami ' ^ Ящ2 ' N amrl и столбец из свободных членов В = Тогда систему можно записать в виде х\Ах -+- х2А2 4- ... + хпА„ = В, н ее решение превращается в задачу: даны, п столбцов А\, А2, ... ..., Ап и столбец В; требуется представить столбец В в виде линейной комбинации А{, А2, ..., А„. Как мы увидим дальше, та- такая формулировка оказывается полезной. \у 3. Умножение матриц. Введем теперь действие умножения матрицы на матрицу. Предварительно рассмотрим частный случай: Произведением строки А на столбец В той же длины, u а2, ..., ап), В =
76 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV называется число axb\-\- a2b2-\- ... -\-anbn (или элемент кольца, которому принадлежат элементы рассматриваемых матриц). Для прямоугольных матриц А и В произведение определено, если длины строк первого сомножителя А равны длинам столбцов второго сомножителя В, т. е. если число столбцов А равно числу строк В. Именно, произведение АВ матриц А и В составляется из произведений строк А на столбцы В, при их естественном располо- расположении в матрицу. Точнее: произведением АВ матрицы А на ма- матрицу В, где / &11 6l2 ... Ь]п ' D I 621 Ь22 •• атг ... называется матрица С, элемент сц г'-й строки и /-го столбца кото- которой равен произведению j-й строки А на /-й столбец В, т. е. равен сумме произведений элементов i-й строки матрицы А на элементы /-го столбца матрицы В. Таким образом, ¦ = L aiab, al. Рассмотрим примеры: A, 1-3-V-2-4 — 11. 2W1 24 4JI5 3 J /1 2W 1 2\ /Ы ' V5 3JU 4J V5 - )• 1-1+2-5 1-2 + 2-3\ _ / 11 8 .3 4 J \5 3>» V3-1+4-5 3-2 + 4-3,)~Л23 18 2W1 2\_/Ч-1 + 2-3 1-2 + 2-4Ч_/7 10 4 5 3,11,3 4 J V5- 1 + 3- 3 5-2 + 3-4j~U4 22 ) ' Последние два примера поучительны тем, что в них рассматри- рассматриваются произведения одинаковых сомножителей, но в разных по- порядках. Результаты получились различными. Следовательно, свойство коммутативности при умножении даже квадратных ма- матриц не имеет места. Условие, когда произведение матриц определено, а также раз- размеры произведения двух матриц удобно изобразить при помощи схематического рисунка: т к А В к ¦— АВ п Ясно, что если определены произведения АВ и ВА, то число строк А равно числу столбцов В и число строк В — числу столб- столбцов А. Оба произведения АВ и ВА будут квадратными матри- матрицами, но разных размеров, если А и В не квадратные. Если А и В
{ I] МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ 77 квадратные, то АВ не обязано равняться В А, как мы только что видели на примере. Матрицы А и В, для которых АВ = В А, на- 3 4 ) И В = Г 6 6 J коммутируют, ибо АВ = ВА = ( 24 36 ) - Это определение умножения матриц на первый взгляд не ка- кажется естественным. Оно становится совершенно естественным, если связать матрицы с линейными подстановками переменных. Пусть А и В — матрицы указанного выше вида. Рассмотрим линейные подстановки переменных с этими матрицами, заметив, что число старых переменных в первой подстановке равно числу новых во второй, что дает основание обозначить их одинаковыми буквами: г/, =аих, + апх2 + ••• + a{kxk, у2 = а21х, + а22х2 + ... + а2кхк, Ут = ашх\-\-ат2х2+ ... +amkxk и Х\ =bnti +bl2t2 + ••• +blntn, х2 = b2\t\ + b22t2 + ... + b2ntn, xk = bklt1 + bk2t2+ ... +bkntn. Покажем, что если эти две подстановки сделать одну за дру- другой, т. е. выразить переменные у\, ..., ут через t\, ..., tn, то ма- матрица коэффициентов окажется равной АВ. Действительно, пусть У\ =cnti+ ... +clntn, Ут—'ст^1+ ••• + cmJn- Тогда коэффициент сц есть коэффициент при t, в г/;. Выпишем все необходимое для вычисления этого коэффициента: Уг = a-i\X\ + ai2x2 + ... + aikxh, xk= ... +bkjtj+ ... При подстановке х\, х2, ..., хк в yit мы получим l2(... +b2jtj+ ...)+ ' + О*2&2/ + » . • + ЩФкд */ + • • '
78 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ ГГЛ. IV Таким образом, сц — апЬц + щф-ц + ... + alkbki, так что матрица коэффициентов в выражениях уи ..., ут через t\, ¦. ¦, tn действительно равна АВ. Итак, последовательному про- проведению («суперпозиции») двух линейных подстановок соответ- соответствует произведение их матриц. Заметим, что линейную подстановку У\ =«11*1 +^12*2 + ••• +alkxk, у2 =a21xi +а22х2 + ... + a2kxk, Ут — amlxl ~Т~ Q-m2x2 ~T • • • ~Г amkxk можно записать в матричных обозначениях У = АХ, где у2 \ /an a12 ... alk \ ( Хг Y — I ' I Л = I йП fl22 . . • «2ft I j? __ / \а.т\ атг ... amk J ¦Ут ' ч Xk Соответственно, подстановка b22t2 + ... + b2nt 2ntn, Xk = bkltl + bk2t2+ ... +bknta записывается в виде X = ВТ, где В —: матрица коэффициентов, Т — столбец из tj. Поэтому суперпозицию этих подстановок можно записать в виде У = А(ВТ). Вместе с тем матрица суперпозиции равна АВ, и этот факт записывается так: У = (АВ)Т. Таким образом, верно следующее соотношение ассоциативности: (АВ)Т, где Т — столбец. Рассмотрим теперь свойства действия умножения матриц- 1. (сА)В = А(сВ) = сАВ. 2. (Ai + A2)B = AlB + A2B. 3. A(Bl + B2) = ABi + AB2. Эти свойства непосредственно следуют из того, что элементы про- произведения выражаются как через элементы А, так и через эле- элементы В в виде линейных однородных полиномов. 4. (АВ)С = А(ВС) (ассоциативность умножения). Это свойство трактуется таким образом, что если одна из частей равенства имеет смысл, то имеет смысл и другая, и они равны.
I Ц МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ 79 Пусть (АВ) С имеет смысл и пусть т есть число строк матри- матрицы A, k — число ее столбцов. Тогда В имеет k строк, ибо АВ имеет смысл. Пусть матрица В имеет / столбцов. Тогда и АВ имеет / столбцов, так что для осмысленности (АВ) С нужно, чтобы С имела / строк. Итак, для осмысленности (АВ) С необходимо и до- достаточно, чтобы число столбцов матрицы А равнялось числу строк матрицы В, а число столбцов матрицы В равнялось числу строк матрицы С. Аналогично прослеживается, что те же условия необ- необходимы и достаточны для осмысленности А(ВС). Остается дока- доказать равенство (АВ)С = А(ВС). Введем в рассмотрение матрицы F=AB, G=(AB)C, D = BC и Н = А(ВС), обозначая их эле- элементы соответствующими малыми буквами. к Имеем: f^ = Z aial ?ap'> i i к a = l далее, ' *pcp/== 2-t k id df " ""' * ' Z й/а^арср/> I 1 И flia&aPCP/' Мы видим, что g;/ = ha, ибо эти элементы представлены в виде сумм одинаковых слагаемых, только расположенных в различных порядках. Равенство (АВ)С = А(ВС) можно доказать менее вычисли- вычислительно, воспользовавшись следующим простым замечанием. Пусть Р и Q — две матрицы такие, что PQ имеет смысл. Пусть Qh Q2, ... ..., Qk — столбцы матрицы Q. Тогда столбцами матрицы PQ яв- являются PQu PQ2, • • •, PQk, что непосредственно следует из опре- определения. Это обстоятельство можно записать в виде P(Qu Q2) ... Qb) = (PQu PQ2, -.., PQk). Обозначим через С\, Сг, ..., Ci столбцы матрицы С. Тогда \АВ)С = ((АВ)Си (АВ)С2, ..., (AB)Ci). Далее, ВС = (ВСи ВС2, .... ВС,) и A(BC) = (A(BCi), A(BC2), ..., А(ВС,)). Но, как было установлено выше, (АВ)С\ = А(ВС\), (АВ)С2=* ==А(ВС2), ..., (AB)Ct = A(BCi), ибо Сь С2, ..., С, —столбцы. Таким образом, (АВ)С = А(ВС). Особую роль при умножении матриц играют единичные матри- матрицы. Это квадратные матрицы, у которых элементы главной диаго- диагонали равны 1, а все остальные элементы равны 0. Обозначать единичные матрицы будем Бп (если нужно указать порядок) или
80 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV просто Е. Из правила умножения матриц непосредственно следует, что АЕ = Л и ЕА => А, если произведения определены. Ясно, что единичной матрице соответствует единичная подста^ новка переменных: У\ =*i> у2 = х2, У а = Хп, сводящаяся просто к переименованию переменных. На языке под- подстановок переменных свойства единичных матриц становятся со- совершенно очевидными. Отметим еще, что представляют собой субматрицы произведе- произведения двух матриц. Пусть ' Си ... С1ге 1 = лв. Субматрица, образованная строками с номерами аь а2, ..., а.ц и столбцами с номерами Рь р2, ••-, Р/, равна произведению суб- субматрицы матрицы А, составленной из строк аи а2, ..., ак, на суб- субматрицу матрицы В, составленную из столбцов рь р2, ¦ •., рь Это непосредственно следует из того, что Со,р;- есть произведение а,-й строки матрицы А на Р/-Й столбец матрицы В. 4. Транспонирование матриц. Замена строк матрицы на ее столбцы, а столбцов — на строки называется транспонированием. матрицы. Так, если (аи а12 ... п\ в21 «22 • • ¦ «2 «ml am2 • • • amn > то транспонированная с ней матрица («и а2\ ... атХ ахг а22 ... атг а.\п Лгп. ••• а-тп. Ясно, что дважды транспонировать — значит вернуться к исход- исходной матрице: (Лт)т = А. Ясно также, что {А -\- В)Т = Лт + ВТ и Л)т Лт () Несколько сложнее дело обстоит с транспонированием произве- произведения. Именно: Матрица, транспонированная с произведением двух матриц, равна произведению транспонированных, взятых в обратном по- порядке. В буквенной записи — ВТЛТ,
f Ц МАТРИЦЫ И ДЕЙСТВИЯ НАД НИМИ Докажем это. Пусть &12 ... &1л' р I D —- | п\ атг ¦ ¦ ¦ Положим С Си Ci2 ... cim \ /du так что Cji = ai;-, dpa = &ap. Пусть, далее, ' f 11 fl2 ... /in \ /gll S'U /21 ^22 > fmi /m2 • • • f Тогда /// = 2j aia^a/. a = l 2j >g«i g'na fг/- gnm ¦ Итак, gji = /,-/ при всех t = 1, 2, ..., m и j = l, 2, ..., n, а это и значит, что G = Z71, т. е. ВТЛТ ==(ЛВ)Т, что и требовалось доказать. 5. Обзор действий над матрицами. Над матрицами определены четыре действия: сложение, умножение на элементы основного поля (или кольца), умножение матрицы на матрицу и транспонирование. Условие применимости и размеры результата поясняются слег дующими схемами: A+B: + cA: m A3: m т
82 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. JV Эти действия обладают свойствами: ( + ) 2. Л + В = В -f Л. 3. Существует 0: Л + 0 = 0 + Л = Л. 4. Для А существует —A: A -J- (—Л) = 0. 5. (ci -f- с2) Л = ciЛ + с2А. 6. с(Л, +Л2) = Л Л 7. С1(с2А) = ( 8. 1-Л = Л. Это — свойства векторного пространства, так что матрицы фик- фиксированных размеров образуют векторное пространство. 9. (АВ)С = А(ВС). 10. AB + B A И. 12. 13. Существуют единицы, именно, если А — I Iя1» то 7? ЕщА = Лсл = Л. 14. (Лт)т=-Л. 15. (Л + В)т = Ат + В\ 16. (сЛ)т==сЛт. 17. (ЛВ)Т = ВТЛТ. Для квадратных матриц фиксированного порядка п действия сложения и умножения определены всегда, и их результатами яв- являются квадратные матрицы того же порядка. Таким образом, ква- квадратные матрицы фиксированного порядка образуют кольцо. Коль- Кольцо, наделенное структурой векторного пространства, т. е. система объектов, обладающих свойствами 1—12, называется алгеброй над основным полем. Таким образом, квадратные матрицы с элемен- элементами из поля К составляют алгебру над этим полем. Само поле К изоморфно вкладывается в алгебру квадратных матриц при помоги отображения с^—^сЕ, се К- В соответствии с тем, что было изложено в гл. III о значениях полинома, в алгебре квадратных матриц естественным образом определяются степени Ат матрицы с натуральными показателями и значения полиномов, именно, если /(/)= aotn-\- а^"-1 -J- ... ... +ane=K[t], то f(A) = a0A" + a1An-1 + ... +ап-ХА + апЕ. Значения полиномов от одной и той же матрицы коммутируют. § 2. Теория определителей С линейными задачами, использующими теорию матриц, свя- связан аппарат так называемых определителей, очень ценный по ши- широте приложений к теоретическим вопросам.
|«] ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 83 1. Наводящие соображения. Рассмотрим в общем виде систему двух линейных уравнений с двумя неизвестными ахх + Ь\у = си A) U2X + bit/ = С2. Допустим, что система имеет решение и пара х, у составляет ре- решение, так что оба уравнения уже обратились в верные равен- равенства. Умножим обе части первого равенства на Ь2, второго на Ь\ и вычтем. Получим х = C\bi — сф\. Теперь первое равенство умножим на —а%, второе на а\ и сло- сложим. Получим Предположим, что афъ — a2b\ -ф 0. Тогда dibi — ctib,' y C\bj — Cjb\ , , а\Сг — а%С\ 1 а.\Ъг — аъЪ\ ' Таким образом, предположив, что решение существует, мы смогли его найти. Теперь перед нами альтернатива — либо реше- решение существует и тогда оно дается формулами B), либо решение не существует. Для того чтобы отделаться от второй возможности, нужно только установить, что формулы B) действительно дают решение системы, для чего следует подставить х и у из B) в си- систему A). Сделаем это: = Ci, Мы видим, что оба уравнения превратились в верные равенства. Если а.\Ьъ — аф{ = 0, то наши рассуждения не приводят к за- законченному результату, и мы оставим этот случай пока в стороне. В формулах B) знаменатель аф2 — аф\ один и тот же. Чи- Числители же очень похожи по форме записи на знаменатель. Для выражения a\b2 — a2&i существует специальное название определителя матрицы Г"' 6') и специальное обозначение: 2 а\Ьг — аФ\ 2atb2 — a2bi афг — аф\ 2
84 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV С помощью обозначений для определителей формулы B) за- записываются в виде х-= с2 а, а,. ъг ь,. У а, а2 щ а, С\ I С2\ ь, ъ,. Применяя, например, эти формулы к решению системы 2х — Зу = 5, получим 5 7 2 3 —3 4 -3 4 41 17 ' ^ 2 3 2 ! 5 7 —3 4 1 17 Разумеется, понятие определителя было бы не нужным, если бы шла речь только о системах двух уравнений с двумя неизвест- неизвестными. Результат может быть обобщен на линейные системы п уравнений с п неизвестными. Рассмотрим еще случай п — 3. Пусть дана система а2х а3х b2y Ьгу c2z = d2, с32 = йъ. C) Исключим сразу неизвестные у и z. С этой целью умножим первое уравнение на Ь2с3 — Ь3с2, второе на Ь3С\ — Ь\С3, третье на Ь\С2—Ь2с\ и сложим. Получим (a{b2c3 — — Ьф2сх) у + сфхс2 — сф2сх) z = d3b{c2 — d2b3c1—d2blc3 Ясно, что коэффициенты при у и z равны нулю. Коэффициент при х играет здесь такую же роль, как atb2— для систем второго порядка. Он называется определителем ма- трицы / ах Ь\ ci \ I а2 Ь2 с2 I \ аз 6з Сз / и обозначается: а, а3 С\ с» /а, 6, ci \ = det I аг Ь2 Сг I. n аз 6з Сз /
Л 21 ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 85 В этих обозначениях, если определитель не равен нулю, d2 d3 а, 0.2 а3 Ьх Ь2 Ьз Ьх &2 &3 с2 Сз Сх Сг Сз Аналогично, а, а2 а3 а, а2 аз dx d2 d3 Ьх b2 Ьз Сх с2 Сз С\ Сг Сз а, Ьх d\ а2 Ьг di a, bx a.2 b2 a3 b3 Наш вывод имеет смысл при предположении, что решение су- существует. Однако, если подставить найденные выражения для х, у, z в исходную систему, можно убедиться в том, что все три уравнения обратятся в верные равенства. Итак, мы показали, что формулы для решения в общем виде линейных систем уравнений при п = 2 и п = 3 имеют сходную структуру и основную роль в них играют определители второго порядка ах Ьх и третьего порядка их Ьх С\ а.2 ?>2 с2 а3 Ьз с3 аф\С2 ¦ Оба эти выражения представляют собой алгебраические суммы произведений элементов матриц, причем эти произведения состав- составляются по одному элементу из каждой строки и по одному из каж- каждого столбца. Все такие произведения входят в состав определи- определителя. Произведения снабжаются знаками + и — по правилам! п=-
86 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV На этих рисунках соединены линиями элементы матрицы, со- составляющие произведения, входящие в определитель со знаками + и-. Обратимся теперь к обобщению определителя для квадратных матриц любого порядка п, исходя из формы этих выражений для п = 2 и п = 3. Здесь удобно обозначать элементы матрицы одной буквой, при- приписывая ей два индекса — номер строки и номер столбца. Дадим формальное определение определителя для квадратной матрицы порядка п следующим образом: Определителем квадратной матрицы порядка п (или определи- определителем порядка п) называется алгебраическая сумма всевозможных произведений элементов матрицы, взятых по одному из каждой строки, по одному из каждого столбца и снабженных знаками «плюс» и «минус» по некоторому определенному правилу. К вопросу о том, что это за правило, мы обратимся в ближай- ближайшее время, а пока попытаемся записать символически сформули- сформулированное выше определение. В каждом слагаемом определителя мы будем записывать сомножители в порядке следования строк. Номера столбцов будут составлять в совокупности все числа от 1 до п, в различных порядках, причем во всех возможных поряд- порядках, так как определитель, согласно данному определению, со- составлен из всех произведений элементов, взятых по одному из каждой строки и по одному из каждого столбца. В буквенных обозначениях: ц а\2 ... а.\п V1 , — 2 — Здесь индексы oci, а2 а„ пробегают все возможные пере- перестановки чисел 1, 2, ..., п. Все перестановки должны быть раз- разбиты на два класса так, чтобы одному классу соответствовали слагаемые со знаком «плюс», другому — со знаком «минус». 2. Элементарные сведения теории перестановок. Сейчас мы рассмотрим некоторые простейшие свойства совокупности пере- перестановок п элементов. Переставляемыми элементами мы будем считать числа натурального ряда. Предложение 1. Число всех, перестановок п элементов равно п\ = 1-2 ... п. Доказательство. Применим метод индукции. Для п=1 предложение очевидно. Пусть оно верно для п—1. Совокупность перестановок п элементов разобьем на п частей, по положению элемента п на первом, втором, ..., п-м месте. В каждой части будет (п—1)! перестановок, так как их число равно числу распо- расположений элементов 1, 2, ..., п—1 .на я—1 незанятых местах. Следовательно, число перестановок равно п-(п — 1)! = л!, что и требовалось доказать.
.?Я ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 87 Теперь разобьем все л! перестановок п элементов на два клас- класса, по признаку, кажущемуся довольно искусственным, но именно это разбиение будет нужно для разумного правила расстановки знаков в определителе. Пусть («1, а.2, ..., а„)—некоторая перестановка чисел 1, 2, .... .... п. Скажем, что пара элементов (а,-, а;), i < /, образует ин- инверсию, если а, > а/. Число всех пар элементов перестановки,, образующих инверсию, называется числом инверсий в переста- перестановке и обозначается inv(ai, ач, •••> ««)• Так, invC, 5, 1, 4, 2, 6, 8, 7) = 7 (инверсии образуют пары C, 1), C, 2), E, 1), E, 4), E,2), D,2), (8,7)). Перестановки, содержащие четное число инверсий, называются четными, содержащие нечетное число инверсий — нечетными. Подстановкой на множестве {1, 2, ..., п) называется взаимно однозначное отображение множества на себя. Удобно задавать подстановку прямым указанием замен для каждого элемента, по- посредством записи образа под прообразом. Так, запись /1 2 з 4 5\ I 5 з 2 4 J заДает подстановку, которая заменяет элементы 1, 2, 3, 4, 5, соответственно, на 5, 1, 3, 2, 4; порядок расположения ее столбцов безразличен. В такой записи в «числителе» и в «зна- «знаменателе» оказываются перестановки. Удобно в «числителе» запи- записывать элементы в натуральном расположении. Последовательное применение двух подстановок приводит к подстановке, называемой их произведением. Так, ( 1 2 3 4 5 6\ / 1 2 3 4 5 6 \ _ / 1 2 3 4 5 6\ \5 2 1 6 4 З^Чб 12 4 3 5j~V3 1 6 5 4 2) (мы считаем первой действующей ту подстановку, которая запи- записана слева). Почти очевидно, что при умножении подстановок имеет место ассоциативность. Действительно, пусть а, т и q> — под- подстановки на-множестве {1, 2, ..., п}. Сделать (смг)ф— все равно> что сначала сделать а, потом т, затем <р; сделать же о(тф) — все равно, что сначала сделать а, потом тф, т. е. к результату при- применения а применить т и затем ф. Тождественная подстановка, при которой каждому элементу сопоставляется он сам, играет роль единицы в этом умножении. Если запись подстановки а перевернуть, т. е. ее числитель сделать знаменателем, а знаменатель числителем, мы придем к обратной подстановке а~1, произведение которой на о как в одном, так и в обратном порядке, дает единичную подстановку. Умножение подстановок, вообще говоря, некоммутативно, например, /1 2 ЗЛ/1 2 3 \ /1 2 34 /12 3W1 2 3\_ / 1 2 3\ V2 1 ЗМ2 3 \) \Ъ 2 \)' \2 3 1А2 1 . 3,/~Л 1 3 2Jm Число всех возможных подстановок на множестве из п элемен- элементов равно п\, ибо таково число возможных знаменателей при фик- фиксированном числителе.
88 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV Подстановка называется транспозицией, если она п — 2 эле- элемента оставляет на местах, а остальные два элемента перестав^ ляет местами. Вместо того чтобы записывать, например, транспо- транспозицию ( J 5 з 4 2 б) • ПИШУТ кратко B, 5). Предложение 2. Пусть в некоторой перестановке сделана транспозиция. Она равна произведению нечетного числа транспо- транспозиций соседних элементов. Доказательство. Пусть дана перестановка (a, b c,.d, e f, g, jh ¦¦¦, k,l), и транспозиция меняет местами с и h. Обозначим через m число элементов d, е, ..., f, g, лежащих между с и Л. Переставим ме- местами с с d, затем с с е, ..., с с f, с с g. После этого мы придем к перестановке (а, Ь, .... d, е, ..., f, g, с, h, ..., k, I). Мы сделали последовательно пг транспозиций. Теперь переставим с и Л. Придем к (а, Ь, ..., d, е, ..., f, g, h, с, ..., k, I). Теперь «перегоним» h на место, которое занимало с, переста- переставив h по очереди с g, с /,..., с е, с d. Мы придем к перестановке (а, Ь, .... h, d, e, ..., f, g, с, ..., k, /), т. е. как будто мы сделали одну транспозицию (с, И). Всего мы сделали m + 1 + m = 2m + 1 транспозиций соседних элементов. Таким образом, транспозиция (с, К) равна произведению 2пг + 1 транспозиций соседних элементов. Все это рассуждение равно- равносильно одному равенству: {с, п) = (с, d) (с, е).., (с, f) (с, g) (с, A) (g, h) (f, h) ... (e, h) (d, A). Предложение З. При транспозиции соседних элементов число инверсий в перестановке меняется на одну единицу. Доказательство. Нам нужно сравнить число инверсий в перестановках (a, b с, d, e, f, ..., k, I) и (a, b с, е, d, f, ..., k, t). Обозначим через /t и i[ число инверсий в парах, не содержа- содержащих элементов d и е, в обеих перестановках соответственно; через /2 и i'2— число инверсий в парах, содержащих один из элементов d и е; через i3 и i'a— число инверсий в паре d, e и через i и i' — полное число инверсий. Ясно, что t = Ц + k + h, i' = i\ + 4 + »з- Далее, очевидно, что г", = /[. Число /2 тоже равно i'v так как каждый из элементов d и е расположен относительно осталь- остальных элементов одинаковым образом в обеих перестановках. На-
12] ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 89 конец, если /3 === ^> т0 гз= ' > и если г'з= * > то 'а== О- Поэтому i' — i = i[ -f- i'2 + 1з~~ 'i ~~ h~ h ==h~h==^z *»что и требовалось доказать. Следствие 1. Если в перестановке сделать транспозицию со- соседних элементов, то четность перестановки изменится на проти- противоположную. Следствие 2. Любая транспозиция изменяет четность пере- перестановки на противоположную. Действительно, любая транспозиция равносильна нечетному числу транспозиций соседних элементов. Предложение 4. Число четных перестановок п элементов равно числу нечетных перестановок. Доказательство. Пусть число четных перестановок равно а, число нечетных равно Ь. Рассмотрим множество всех четных перестановок. Сделаем в них одну и ту же транспозицию, напри- например, A, 2). Мы получим нечетные перестановки, попарно различ- различные, в количестве а штук. Так как число всех нечетных переста- перестановок равно Ъ, заключаем, что а ^ Ь. Теперь рассмотрим мно- множество всех нечетных перестановок и сделаем в них транспозицию A, 2). Мы получим Ъ четных перестановок и, следовательно, b sg: a. Из установленных неравенств следует, что а = Ь, что и требова- требовалось доказать. Попутно мы получили, что если во всех четных перестановках сделать одну и ту же транспозицию, то мы получили все нечет- нечетные перестановки. Предложение 5. Любая перестановка может быть получена. из любой другой посредством нескольких транспозиций. Доказательство. Применим индукцию. Для п = 2 утверж- утверждение тривиально. Пусть п > 2 и для перестановок п — 1 элемента предложение доказано. Пусть (аи а2, ..., а„) и (р*ь f52, ..., Р«) — две данные перестановки. Если |3i = ai, то (а2,... ,и„) и (р2,..., |3Л) отличаются только порядком и, в силу индукционного предполо- предположения, посредством нескольких транспозиций можно перейти от (ос2 «„) к (р2, • • •, Р«) и, следовательно, от (аь а2, ..., ап) к (рь Рг Рп). Пусть теперь ^\фах. Тогда |3i = a; при некото- некотором 1ф\. Сделав в («i, a2 ап) транспозицию (аь а,), мы придем к новой перестановке, у которой на первом месте нахо- находится a,- =-Pi. В силу доказанного эта перестановка превращается в Рь р2, ..., рп посредством нескольких транспозиций. Следова- Следовательно, от (аь о&2, •••. ап) к (рь р2, ..., ря) можно перейти по- посредством нескольких транспозиции, что и требовалось доказать. В терминах подстановок предложение можно переформулиро- переформулировать так: любая подстановка может быть представлена в виде произведения транспозиций. Переход от одной перестановки к другой посредством транс- транспозиций совершенно не однозначен. Однако в силу предложения 3
flO МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ 1ГЛ. IV четность или нечетность числа транспозиций для такого перехода инвариантна. Именно, для перехода от перестановки к другой пе- перестановке той же четности число транспозиций обязательно чет- четное, ибо каждая транспозиция меняет четность перестановки на противоположную. Аналогично, для перехода от перестановки к другой перестановке противоположной четности требуется нечет- нечетное число транспозиций. 3. Определитель порядка п. Определение. В п. 1 была дана предварительная формулировка для определителя. В ней не хва- хватало правила расстановки знаков слагаемых, но было указано, что это правило должно быть связано с разбиением перестановок на два класса. В п. 2 было описано разбиение перестановок на два класса — четных и нечетных перестановок. Это разбиение и положим в основу правила расстановки знаков в определителе. Таким образом, приходим к следующей полной формулировке. Определителем квадратной матрицы называется алгебраическая •сумма всевозможных произведений элементов этой матрицы, взя- взятых по одному из каждой строки и по одному из каждого столбца. Сомножители в каждом слагаемом записываются в порядке сле- следования строк, тогда номера столбцов образуют перестановки; слагаемые, соответствующие четным перестановкам, берутся со знаком «плюс», соответствующие нечетным — со знаком «минус». Легко проследить, что расстановка знаков в определителях второго и третьего порядков соответствует сформулированному правилу. Настоятельно рекомендую читателю не пожалеть времени и выписать в развернутой форме определитель четвертого порядка. В символической записи определитель можно записать так: aln «21 апХ ап2 ... апп = z <- ч'П*(°1'а1 °/l). !• «2 где (aba2, .--, а„) пробегает все перестановки чисел 1, 2, ..., щ Hiv(a,, a , .... a ) далее, множитель (—1) равен +1, если («i, аг, ... ..., а„)— четная перестановка, и равен —1, если нечетная. Ясно, что понятие определителя имеет смысл для матриц с эле- элементами из любого ассоциативного коммутативного кольца и, в частности, из любого поля. 4. Свойства определителя. 1. Общее правило знаков. Для дальнейшего будет по- полезно узнавать, с каким знаком входит в определитель an aI2 ... а,\п .22. '.". .2" слагаемое аа ^ аа ^ ... аа ^ , где (csi, a2 ап) а„, апг ¦ ¦ ¦ о-пп й фи Эг> •••. Рп) — две перестановки чисел 1, 2, ..., п. Для того
12] ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 91 йтобы узнать это, следует расположить сомножители в порядке следования строк. Заметим, что если поменять местами два со- сомножителя, то происходит транспозиция как в первых, так и во вторых индексах, так что число инверсий в первых индексах и число инверсий во вторых индексах меняются на нечетные числа, и потому их сумма меняется на четное число. Поэтому . ,.inv(a,, a, aK)+inv (C,, Р2, .... C„) (—1) v ' 2 "' не изменяется при перемене мест двух сомножителей, а следовательно, и при любом изменений порядка сомножителей, ибо любое изменение по- порядка равносильно нескольким попарным переменам мест. Отсюда следует, что знак, с которым входит слагаемое aOlp, аа^2 ... аа„р„ в определитель, есть (-lfv(a" ^ -<^+i°v^' р> ^). Действи- тельно, пусть 7ь Уй, ¦ ¦ ¦, Уп — последовательность номеров столб- столбцов после приведения сомножителей в порядок следования строк, так что aaiPaetPj • • • «а„Р„ = «<2Y2 • • • «„v Тогда .lnv(a,,a2 on) + lnv(P, (—1) . V2 vn) = /_ а это и есть множитель ±1, с которым интересующее нас слагае- слагаемое входит в состав определителя. 2. Определитель транспонированной матрицы равен определи- feAio исходной. Другими словами — определитель не меняется при транспонировании матрицы. Действительно, брать произведения элементов по одному из каждой строки и по одному из каждого столбца исходной ма- матрицы — то же самое, что делать это по отношению к транспониро- транспонированной матрице. Далее, номера строк для исходной — это номера столбцов для транспонированной, а номера столбцов исходной суть номера строк транспонированной. Поэтому каждое слагаемое о„.а о ... ап „ входит в состав определителя исходной ма- трицы и определителя транспонированной с одним и тем же мно- жителем (-l)inv(a"a2 e"> +i"V(P" Р' Ч Установленные два свойства указывают, что в определителе строки и столбцы совершенно равноправны. Поэтому все дальней- дальнейшие свойства, устанавливаемые для строк, остаются справедли- справедливыми и для столбцов. Следующие два свойства означают линейность определителя относительно элементов любой его строки. 3. Если элементы какой-либо строки представлены в виде сум- суммы двух слагаемых, то определитель равен сумме двух определи- определителей, в первом из которых элементы отмеченной строки равны первым слагаемым, во втором — вторым.
92 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV Это свойство становится прозрачнее, если от словесной форму- формулировки перейти к формуле: а1п ап\ ... апп Доказательство. аи ... п\п ani ain ¦•¦ c In = Z ( atl) v (-Dinv(ai («1- «2 an) la, • ' • *la, ... ь..„ ... + L (-D (a,. a2, .... an) Ясно, что первая сумма равна inv(ai an la, ' • ' "и ••¦ bl\ ¦¦¦ bin а вторая равна с„ ... с, in и • • • апп Доказанное свойство естественным образом обобщается на слу« чай, когда элементы строки представлены в виде суммы несколь- нескольких слагаемых. 4. Если все элементы какой-либо строки определителя имеют общий множитель, то этот общий множитель можно вынести за знак определителя. аи ... а\п Действительно, А== Yj (—I)'' («I- «2 пп) -« Е hi (о,, о2, .... о„) апп — т ап\ ••• апп <ч •••%•••  е an ¦ m а,, ... а. ann
«2] ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 93 5. Определитель с двумя одинаковыми строками равен нулю. 6. Если в матрице поменять местами две строки, то ее опре- определитель изменит знак на обратный. Эти два свойства тесно связаны и играют особо важную роль в теории определителей. Докажем сначала 5-е свойство, потом 6-е. Пусть дан определитель с двумя одинаковыми строками: и ... ахп ... a kn ап\ = z <- inv (a, ¦ап) «la, • ' • V • • • «W • • • п nan> причем an = ak\, an = ak2 «m = akn. Разобьем сумму на две части, соответствующие четным и не- нечетным перестановкам: (а а \ "'"I ' ' " а'а' ' ' ' пкаЬ ' ' ' ппап ~ V 1' ' П) ... а, ... а , ka k ,. а„ — Z «1 (а1 ап) нечетн. Вспомним, что все нечетные перестановки получаются, если во всех четных перестановках (at, ..., a,-, ..., a*, ..., ап) сделать одну и ту же транспозицию (а;, аи). Поэтому ¦%) • • • aiak ' ' • aka, ' • • а • Kin Но ala = aka и aka =aia . Поэтому для каждого слагаемого i I fi к- первой суммы найдется равное ему слагаемое во второй, так что Д = 0, что и требовалось доказать.s« Обратимся теперь к доказательству 6-го свойства, причем позволим себе обозначить переставляемые строки просто I и II, Нам нужно сравнить определители an I II аи ... а1я II I
94 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV С этой целью рассмотрим вспомогательный определитель, заведомо равный нулю: 0 = аи ••• «ire I + H I+H «ш •¦¦ о.пп аи ¦¦• «ire I I • ••••• Оп\ ¦ ¦ ¦ О.ПП «IB I I + II «m аПп .. ain II I + Il' аПп I II «ш • • • ann ап II I ап\ «it ••• «in II II «ni ••• ann Мы два раза воспользовались свойством 3. Первое и четвертое слагаемые равны нулю. Следовательно, сумма второго и третьего равна нулю, что и требовалось доказать. Рассмотрим другой путь доказательства свойств 5 и 6. Начнем с шестого. Пусть «11 ап akl ... aln ¦¦¦ аы а-пп и А'. an ak\ ain ttkn Возьмем какое-либо слагаемое из второго определителя, запи- записанное в порядке следования его строк: ... a, ... а *ab Оно входит в состав Л'с множителем (—l)mv^a' ««.•••.«* Ho a laj = a la, ... а «a. ... a ка, а так inv(al <**.-. a,-,....an) что в А оно входит с множителем (—1) Ясно, ™>(-I)Inv(ei1 •-•*••••••' а«> = -(-1Г(а' •"•-•* ап\ так что каждое слагаемое из А' входит в А с противоположным знаком, т. е. А' = —А. Теперь для4 доказательства свойства 5 рассмотрим определи- определитель с двумя одинаковыми строками и переменим местами эти строки. С одной стороны, он при этом изменит знак, но вместе с тем он не изменится. Следовательно, А = —А, 2А = 0 и А = 0. Однако это рассуждение применимо, только если в кольце возможно деление на 2, так что из 2А = 0 следует А = 0. В поле
!#,«- ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 95 вычетов по модулю 2 мы не могли бы сделать такого вывода. В этом состоит небольшой недостаток второго доказательства сравнительно с первым. 7. Определитель с двумя пропорциональными строками равен нулю. Действительно, если, согласно свойству 4, вынести за знак определителя коэффициент пропорциональности, то остается опре- определитель с равными строками, который равен нулю. 8. Определитель не меняется, если к какой-либо его строке до- добавить числа, пропорциональные другой строке. Действительно, аи та Чх а п\п kl ¦¦¦«Ы + 'ПЧп ¦•¦ Чп апп а„ ап Ч\. ... а1п ¦¦¦ а1п ¦¦¦ ahn ... апп kl akn a kl -ы a-nn «11 an aki ... aln ¦¦¦ ain ••• akn Свойство 8 особенно важно, так как оно дает ключ к вычисле- вычислению определителей. Рассмотрим небольшой пример. Пусть требуется вычислить определитель 1 1 t 1 1 -1 1 —1 1 1 — 1 —1 1 —1 — 1 1 Прибавим ко второй строке первую, умноженную на —1, затем к третьей прибавим первую, умноженную на —1, и затем к четвер- четвертой прибавим первую, умноженную на —1. Получим равный опре- определитель lill О 0—2—2' 0—2 0—2 0—2 —2 0 Теперь прибавим к четвертой строке третью, умноженную на —1, и к четвертой — вторую, умноженную на —1. Получим равный
МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ tMl.W 1 0 0 0 1 0 —2 0 1 2 0 0 1 —2 —2 4 определитель Теперь оказывается, что из 24 слагаемых определителя отлично от нуля только одно: аца2зйз2«44 = 1 • (—2) • (—2)-4 =16. Пере- Перестановка A, 3, 2, 4) нечетная, следовательно, определитель ра- равен —16. 5. Алгебраические дополнения и миноры. Пусть дан опреде- определитель о„ ... alk ... а, Рассмотрим определитель ап а1п О ... 1 ... О апх ... О ... апп матрица которого получается из матрицы исходного определи- определителя посредством замены элемента а<* на 1 и всех остальных эле- элементов i-й строки и &-го столбца на нули. Так построенный определитель называется алгебраическим дополнением элемента а,*. Для него принято обозначение Л;*. Заметим, что Alk не зависит от элементов 1-й строки и k-xo столбца исходного определителя. 9. Определитель равен сумме произведений элементов какой- либо строки на их алгебраические дополнения. Для доказательства запишем данный определитель в виде ¦¦¦ a in ап\ ••• ank ¦¦¦ апп 'In с , f 0+ ... +0 ... 0+ ... +aik+ ... +0 ... 0 + 0+ ... +atn ап\ ¦¦¦ ank •¦¦ ипп где каждый элемент i-й строки имеет п слагаемых. Теперь вос- воспользуемся свойством линейности. Определитель равен сумме
ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 97 следующих п определителей: a. a, u ••• "u ••• -u ,, ... 0 ... 0 n\ 4k "in alk ... О "nl U '¦¦ alk 0 ... 0 'In "In ап *n\ •¦¦ unk ¦¦• unn. В каждом из них вынесем в качестве множителя ненулевой эле- элемент i-й строки: ап Чп ... О ... О +aik 'и 'ik Чп О ... 1 •*п! ... +ain а а, а, О ... О ... 1 а ank ••• апп Теперь вычтем из первой строки первого определителя i-ю, умно- умноженную на аи, из второй — i-ю, умноженную на агь ..., из п-й вычтем i-ю, умноженную на ап\. Все элементы не изменятся, кроме элементов первого столбца, которые заменятся на нули. Поэтому первый определитель равен О ... а,,, ... а, Ik in ... О ... О nk nn Аналогично, остальные определители равны соответствующим алгебраическим дополнениям, так что действительно 'Ik ¦Чп ап\ ank •¦• апп ... +aikAik+ ... +alnAin. Это свойство носит название разложения определителя по эле- элементам строки. Разумеется, существуют аналогичные разложения lio элементам столбцов.
98 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ 1ГЛ. IV Следующие два свойства являются непосредственными след- следствиями из разложения по элементам строки. аи ... ахп 10. Пусть в определителе "in О.пп выбрана строка с но- мером i и даны п чисел Ь\, ..., Ьп. Сумма произведений этих чисел на алгебраические дополнения элементов г-й строки равна опре- определителю, в матрице которого на месте an ain стоят b\,..., bn: аи ... aln ... bn an\ Действительно, a.\n где А'п, ..., A'in— алгебраические дополнения элементов i-й стро- строки этого определителя. Но алгебраические дополнения не зависят от элементов t'-й строки, так что они совпадают с алгебраическими дополнениями An, ¦ ¦ •, Ain исходного определителя. 11. Сумма произведений элементов какой-либо строки на ал- алгебраические дополнения элементов другой строки равна нулю (свойство ортогональности строк и алгебраических дополнений). Действительно, пусть дан определитель аи ... а,п и1п О-п\ ••¦ апп Тогда, по предыдущему свойству, ••• +aknAtn = «II ak\ ... пщ ••• akn ¦¦¦ akn = 0, ибо получился определитель с двумя одинаковыми строками. Следующее свойство касается вычисления алгебраических до- дополнений.
«2] ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 99 Минором порядка п — 1 для данного определителя называется определитель матрицы, получающейся из матрицы исходного опре- определителя посредством вычеркивания одной строки и одного столб- столбца. Минор, получающийся вычеркиванием строки и столбца, со- содержащих uik, обозначается через Д,ё. 12. Алгебраическое дополнение Aik отличается от соответствую- соответствующего минора Aik лишь на множитель (—1)'+* (т. е. Л,-*. = A,-fe пли Aik = —А/А в зависимости от того, четно или нечетно число i-\-k). При доказательстве рассмотрим два случая. Сначала положим i = k = U 10 ... 0 О аг2 . ¦ . аг О аП2 ... апп |Xinv(al> a2 ап Согласно определению " ~(»,. », »„) причем нужно положить ац = 1, ац = О при k = 2, ..., п и ап = 0 при i' = 2, 3, ...,«. Поэтому в сумме нужно сохранить только слагаемые при ai = 1 и (а2, ..., ап), пробегающей все перестановки чисел 2, 3, ..., п, причем положить ац = 1. По- Получаем лп= Е (_i)InvA>e« ап)а2 ...а . Ясно, что inv(l, яг, .... an) = inv(a2, ..., «я), ибо 1 на первом месте не образует инверсий с другими элементами. Поэтому п=, 2 (- 4inv(a2 ап) ' • ' ппа ~~ a2n a-m ¦•¦ ann Для того чтобы установить последнее равенство, достаточно вос- аользоваться определением определителя для учи- тывая, что вторые индексы на единицу больше номеров столбцов в этом определителе, так что inv(a2, ..., а,п) равно числу инвер- инверсий в номерах столбцов. Итак, Лц = Ац. Теперь пусть ink любые: о Ч.к-\ l, k+l аы а1-1.1 0 a«+l.l ... 0 ... а.+. 1, k-l 1, k-l 0 1 0 ai-l, A4 0 ai + l,k, -l ••• at-u, ... 0 ¦l ••• ai+u, anl a n,k-l
100 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ IV Переместим 1 в левый верхний угол, сохранив порядок остальных строк и столбцов. С этой целью поменяем местами i-ю строку последовательно со всеми предыдущими, а затем то же сделаем с k-м столбцом. Определитель при этом приобретет множитель (—ij'-i+ft-^ так что ,.. о 0 ... О ... а, и i а, .,. ... а,„ Л,4 = (-1)н 10 0 а 11 0 а 7-1, 1 ••' . 1 О а 1, fc-i i-i, ft-i л1+\. fc-l ч, fe-l *1. fe+1 •" a i-Un "л, ft+1 ... а В силу рассмотренного ранее случая i = /г = I заключаем, что 1. А+1 1л a i. ft-i i+l. fe-l t-i, ft+i ••' .-i, n » + l, fe+l •'• ai+U n a «, ft-i a n, ft+l :(-l)i+iA, что и требовалось доказать. 6. Вычисление определителей. Для того чтобы вычислить опре- определитель, пользуясь определением этого выражения, нужно вычис- вычислить л! произведений п сомножителей, каждое из которых равно- равносильно п— 1 попарных умножений чисел. Таким образом, для вы- вычисления определителя этим способом требуется п\(п—1) попар- попарных умножений и много сложений, которых мы не учитываем как значительно менее трудоемкую операцию. Так, при п = 100 число умножений равно 100199 > 10153. Никакая самая мощная вычисли- вычислительная машина не в состоянии справиться с таким числом опе- операций. Теперь посмотрим, как можно воспользоваться свойствами определителя. Разложение по строке (или по столбцу) показы- показывает, что вычисление определителя порядка п в основном сводится к вычислению п определителей порядка п—1. Но если в строке есть нули, то нужно столько определителей порядка п— 1, сколько имеется отличных от нуля элементов в строке (в столбце). Но при помощи добавления к строкам чисел, пропорциональных другим сцрокам, можно получать нули в столбцах. Проследим за этим. Пусть нам нужно вычислить определитель а,, аи ••• <*,„ «21 «22 ••• а2П
4 21 ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 101 Положим для простоты, что аи Ф 0. Вынесем из первой строки за знак определителя: «12 «in а\\ а\\ ап 1 021 апг аПп При этом нам нужно выполнить я— 1 деление (деление и умно- умножение считаются одинаковыми по сложности операциями). Далее, прибавим ко второй строке первую, умноженную на —а21, к третьей — первую, умноженную на —а3ь и т. д. При этом нужно сделать (я—IJ умножений и столько же сложений. Полу- Получится определитель вида ап а\п пи г «22 а„г Для этого перехода нужно я—1+(я—IJ = п(п—1) умноже- умножений и делений и (я— IJ сложений. Но теперь разложение по первому столбцу сводит задачу к вычислению одного определителя (я—1)-го порядка, и процесс нужно продолжить дальше. Всего для перехода к определителю первого порядка, т. е. к одному числу, нужно п(п—1) + ... ... + 2 • 1 = —g— умножений и делений и (я — 1J+ ... +12 = п(п — 1) Bп— 1) = —J g сложении. После этого нужно последнее число (определитель первого по- порядка) умножить на я—1 множителей, которые выносились за знак определителя. Это требует еще я—1 попарных умножений. Всего при п — 100 нужно ^ (- 99 = 333 399 умножений 100-99-199 ооооса и делении и g = 328 350 сложении. Современная ЭВМ, способная производить несколько миллио- иов операций в секунду, легко справится с таким вычислением. При практических вычислениях все может проходить не так •благополучно, как в теоретическом описании. Возможно, что в ле- левом верхнем углу очередной матрицы окажется нуль или число, близкое к нулю. Это обстоятельство заставляет выбирать так на- называемый ведущий элемент — по возможности, наибольший в строке или во всей матрице, на который производится деление строки. Но это значительно усложняет программу при машинном проведении вычислений.
102 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ (ГЛ. IV Мы не будем приводить примеров вычисления численно задан- заданных определителей типа таких, которые могут встретиться в при- приложениях, например, 1,325 2,354 -1,117 2,123 2,427 — 1,621 -2,311 1,427 1,215 3,514 1,511 — 1,211 —0,647 0,812 -1,212 2,531 Ясно, что для вычисления такого определителя нужны хотя бы несложные вычислительные средства. Мы рассмотрим примеры другого рода, не требующие вычисли- вычислительных средств, но нуждающиеся в проявлении известной сообра- сообразительности при применении свойств определителей. Пример 1. Вычислить Оц пц . . . пгг, 0 0 ... ап Квадратная матрица, в которой все элементы ниже главной диагонали равны нулю, называется верхней (или правой) тре- треугольной. (Заметим, что главной диагональю квадратной матрицы называется последовательность элементов, стоящих в позициях A, 1), B,2), ..., (я, я).) Ясно, что определитель треугольной матрицы равен произве- произведению аий22 ... апп элементов ее главной диагонали, ибо это про- произведение есть единственное слагаемое, отличное от нуля. Пример 2. Вычислить 1 1 1 ... 1 1 в2 1 ... 1 1 1 а3 ... 1 1 1 1 Здесь естественно ко всем строкам прибавить первую, умноженную на —1. Тогда получится определитель: 11 11 о о 0 at— 1 О:,- 1 о О «1,-1 Пример 3. Вычислить определитель порядка я 0 1 1 ... 1 1 0 1 ... 1 Д„= 1 1 0 ... 1 1 1 1 ... 0
ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ 103 Если бы вместо 0 в левом верхнем углу находилась 1, мы легко вычислили бы определитель, подобно примеру 2. Прибавим все строки к первой. Получим л— 1 л 1 1 1 ается вычесть К = (я — Пример 4. — 1 0 1 1 л 1 0 1 первую 1) 1 0 0 0 -1 ... п — 1 1 ... 0 1 = («-1 строку из всех ocTaj 1 -1 0 0 Зычислить д п = п 1 .. 0 .. -1 .. 0 .. 1 2 л 1 -1 я 2 3 • 3 2 1 4 1 0 0 -1 = (- ... п ... и — 1 ... /г-2 1 1 1 1 ... 1 1 0 1 ... 1 1 1 0 ... 1 1 1 1 О В строках циклически передвигаются 1,2,3, ..., п. Прибавим «последней строке все предшествующие. Получим: 1 п п— 1 3 1 2 1 л 4 1 3 2 1 5 1 ... ... л ... п ... л — — 2 1 1 2 Теперь получим нули в последней строке, вычитая из каждого столбца предыдущий (из последнего предпоследний, из предпо- предпоследнего предшествующий и т. д.): 1 11 л 1 - п 1 я—1 1 1—л 1-й 1 О О я (я ¦ 1) , пп+\ у,— ' ' ¦1)" 1 —п 1 1 1 — п I 1 1 — п 1 i
104 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ 1ГЛ. «Г Теперь вычтем первую строку из всех последующих: 1 1 ... 1 о п(п+ — и о ... О — п ... О О 0 ... — п О Разложение по последнему столбцу дает О — п 0 ... О —п ... О О ... —я -2 n-2 , 1Ч»-1 1-1 1) При решении последних примеров мы довольно смело состав- составляли линейные комбинации строк. Однако при этом важно сле- следить, чтобы не прибавлять в неизмененном виде строку, изменив- изменившуюся в процессе предыдущих преобразований. Иначе можно, на- например, «доказать», что любой определитель равен нулю. Вот это «доказательство»: дан определитель. Прибавим первую строку ко второй и вторую к первой. Получим определитель с двумя одина- одинаковыми строками, а он равен нулю. Ошибка в этом «доказатель- «доказательстве» состоит именно в том, что вторая строка уже изменилась после прибавления к ней первой строки, и прибавлять ее к первой можно только в этом измененном виде — только тогда можно го- говорить о сохранении величины определителя. 7. Определитель Вандермонда. Определитель вида Д„(дс,, дс2 х „п-1 Х2 1 называется определителем Вандермонда и имеет некоторое теоре- теоретическое значение, так как возникает в различных ситуациях. Подсчитаем определитель Вандермонда для п = 2 и п = 3. Имеем 1 X, При подсчете определителя третьего порядка 1, X2, X3) = x?
ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ Ш5 вычтем из третьего столбца второй, умноженный на л'ь из второго, первый, умноженный на хх. Получим: I О О 1 х — х х2 — 3 V 1» 2» 3/ х3 хх х3 — х$хх Хч "~* Х\ Х2 \Х-2 ~~ J ^3 — Xl Х3 (Х3 — 1 = (^2 - Jfl) (X3 — Х{) х2 Очевидно, что аналогичные рассуждения можно проводить и яри больших п, и это дает основание сформулировать гипотезу: АЛ*1. х2, ..., хп) = =(Х% — Х{) (Х3 — Ху) ... (Хп — Х{) (Х3 — Х2)... (Хп — Х2)... (хп — Хп_{)= = П (xt- xi). Докажем эту гипотезу методом математической индукции. Пусть она доказана для определителя порядка п—1. JS опреде- определителе порядка п вычтем из каждого столбца предшествующий, умноженный на Х\\ 10 0 0 t *., — л, х\ — х2 1 Хо , 4- п-1 п-2 • ¦ л о ~~* ао л п-\ п-2 .. х3 — х3 х — х{ хп — = (дс2 — Л',) (лг3 — *i) • • • (хп — ... хп —хп 1 х3 ... х\- 1 ЛГ„ „«-2 == (х2 — х^(х3 — Xi) ... (хп — х{)Д„_,(х2, х3, .... хп). Мы можем применить предположение индукции: 1. х2, ..., jcJ = I — Xi)(x3-xi)...(xn~ х{) П (^-Jf/)== П Формула доказана. 8. Система п уравнений с п неизвестными с ненулевым опре- определителем матрицы коэффициентов. Дана система п линейных
106 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ |ГЛ. HV уравнений ел неизвестными + + ... + а1пхп = Ь„ ... + а2пхп — Ъ%, с числовыми коэффициентами (результаты остаются в силе для системы уравнений с коэффициентами из любого поля). ц а12 ... am Предполагаем, что D — «И2 ФО. Сначала допустим, что уравнение имеет решение и что х\, Х2,.. > ..., хп составляют решение, так что уравнения уже превратились- в верные равенства. Обозначим через Ау алгебраические дополне- дополнения ац в D. Умножим первое из равенств системы на Ац, второе на А2\, ...„ п=е на Ап\ и сложим. Получим )х,+ + ••• +aniAni)x2+ ... а2пА2\ + ... +ann^rtl)*« = Коэффициент при jci есть определитель D, представленный в- разложении по элементам первого столбца. Коэффициенты же при х2, ..., х„ все равны нулю, так как они суть суммы произведений алгебраических дополнений элементов первого столбца на эле- элементы други-х столбцов. Таким образом, мы пришли к равенству Dx! = Ми + Ь2Ап + ... + ЬпАщ. Таким же образом, умножив исходные равенства на алгебраи- алгебраические дополнения второго столбца, получим Dx2 = biAi2 + Ь2А22 + ... + ЪпАп2 и т. д. Из этих равенств получим *i = j (Ми + Ь2Ап + ... + ЪпАл1), х2 = -gr (biAl2 + Ь2А22 + ... + ЬпАп2), ъ + Ь2А2п+ ... +ЬпАпп). Тем с&мым мы показали, что если решение существует, то оно» единственно и дается формулами, которые мы установили.
^ 21 ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ @7 Теперь нужно доказать, что решение существует, т. е. что фор- формулы для xi, X2, ..., Хп действительно дают решение. Имеем «12*2+ ... + а1пхп= &1(ацЛц + ai2Al2 + ... +alnAln) + Ь2(апА21-{- ai2A22 + ... +alnA2n)+ ... ... -f- Ьп(ацАп1 + a.i2An2-\- ... +а!„Ля Здесь коэффициент при Ь\ равен D в форме разложения по эле- элементам первой строки, коэффициенты же при Ь2, ..., Ьп равны нулю как суммы элементов первой строки на алгебраические до- дополнения других строк. Аналогичным образом, с использованием тех же свойств опре- определителя, проверяется, что найденные х\, х2, ..., х„ удовлетво- удовлетворяют и всем остальным уравнениям. Тем самым мы доказали теорему о существовании и единствен- единственности решения системы п линейных уравнений с п неизвестными с ненулевым определителем матрицы коэффициентов. Эта теорема носит название теоремы Крамера. Формулы для решения можно преобразовать, учитывая, что &i а12 ... а1п ,„ = ь: Ьп ап1 ... апп и аналогично преобразовать остальные числители. Получим где Di есть определитель, матрица которого отличается от матри- матрицы определителя D только i-м столбцом, в который помещены Ьи Ь2, ..., Ьп- Эти формулы носят название формул Крамера. Раньше мы их получили для п = 2 и п = 3. 9. Некоторые следствия из теоремы Крамера. Следствие 1. Если известно, что система п линейных урав- уравнений с п неизвестными не имеет решений, то определитель ма- матрицы из коэффициентов системы равен нулю. Действительно, если бы определитель был отличен от нуля, то система имела бы решение. Следствие 2. Если система п линейных уравнений с п неиз- неизвестными имеет более чем одно решение, то определитель матрицы из ее коэффициентов равен нулю. Действительно, иначе система имела бы единственное решение. Система линейных уравнений называется однородной, если все «е свободные члены равны нулю. Однородная система (независимо от числа уравнений) всегда имеет решение, состоящее из нулевых значений для всех неизвестных. Для однородных систем представ-
108 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ 1ГЛ. IV ляет интерес вопрос о том, является ли нулевое решение единствен- единственным или кроме него существуют другие, нетривиальные, решения» Следствие 3. Для того чтобы система п линейных однород- однородных уравнений с п неизвестными имела нетривиальные решения* необходимо, чтобы определитель матрицы из ее коэффициентов был равен нулю. Действительно, если хотя бы одно нетривиальное решение имеется, то система имеет более чем одно решение, так как нуле- нулевое всегда есть. Следовательно, определитель матрицы из коэф- коэффициентов системы равен нулю. § 3. Линейная зависимость и линейная независимость строк (столбцов) 1. Определение и простейшие свойства. Напоминаем, что линей- линейной комбинацией строк (или вообще матриц) и\, и2, ..., ит назы- называется строка (матрица) С\Щ + с2«2 + ¦ • • + стит, где с,- — числа (элементы основного поля). Ясно, что если все коэффициенты равны нулю, то линейная комбинация равна нулевой строке. Совокупность строк «1, «2, • • •, ит называется линейно зависи- зависимой, если существуют коэффициенты с\, с2, ..., ст, не равные нулю одновременно, такие, что С\щ + с2«2 + ... + стит = 0 (здесь 0 обозначает нулевую строку). Если же такие коэффициен- коэффициенты не существуют, т. е. из равенства C\U\ + с2и2 + ... + стит = 0 следует, что все коэффициенты С\, с2, ..., ст равны нулю, то со- совокупность строк называется линейно независимой. Так, например, строки щ= A, 1, 1), и2= (—1, 2, 1), ы3=A, 4, 3) линейно зависимы, ибо 2и\-\-и2 — «3 = @,0,0). А строки щ = = A,1), «2 = (—1, 2) линейно независимы, ибо из С\щ + c2u^ = Q следует откуда с\ = с2 = 0. Предложение 1. Для того чтобы совокупность строк была линейно зависимой, необходимо и достаточно, чтобы хотя бы одна из строк была линейной комбинацией остальных. Действительно, пусть совокупность строк щ, и2, ..., ит ли- линейно зависима. Это значит, что существуют с\, с2, ..., ст, не рав- равные одновременно нулю, такие, что C\U\ + С2«2 + ... + стит = 0. Пусть Ст^О. Тогда л г Г Г с. '-' Ci I + I с{ -и„ Необходимость доказана. Пусть теперь щ = с^щ + ... + Сл"<-1 + c,+iMi+i + • • • + cmum- Тогда CtUi+ ... +C;_i«,_i+(— l) Ш + Ct+iUl+i + ... + CmUm = 0, т. е. совокупность щ, ..., um линейно зависима.
$ 31 ЛИНЕЙНАЯ ЗАВИСИМОСТЬ СТРОК (СТОЛБЦОВ) 109 Другая формулировка этого предложения: Для того чтобы совокупность строк была линейно независима, необходимо и достаточно, чтобы ни одна из строк не была линейной комбинацией остальных. Отметим еще некоторые очевидные предложения, касающиеся свойств линейной зависимости и независимости. Ясно, что любая совокупность строк, содержащая нулевую строку, линейно зависима. Действительно, нулевая строка есть ли- линейная комбинация остальных строк с нулевыми коэффициентами. Столь же ясно, что всякая совокупность строк, содержащая две равные или две пропорциональные строки, линейно зависима. Да- Далее, если совокупность строк линейно зависима, то всякая боль- большая совокупность будет тоже линейно зависима. Наконец, если совокупность строк линейно независима, то и всякая ее часть линейно независима. Предложение 2. Пусть строки ии ..., ит составляют ли- линейно независимую совокупность, а строки ыь ..., ит, ит+\ — ли- линейно зависимую. Тогда ит+\ есть линейная комбинация и\,...,и,п. Действительно, в равенстве С\Щ-\- ... + cmum-\- cmflum+i = 0 с не равными одновременно нулю коэффициентами коэффициент отличен от 0, так как иначе совокупность U\ um была бы линейно зависимой. Следовательно, um+l = !— и, — u ст+\ Строку ы = (аь ..., ан) будем называть отрезком строки и = = (а\ ak, .... а„). Предложение 3. Если между строками щ, ..., ит имеется линейная зависимость, то такая же зависимость имеет место и для их отрезков пи ..., пт фиксированной длины. Действительно, равенство С\Щ + ... + cmUm — 0 означает, что все компоненты строки С\щ -\- ... + стит равны нулю, а равенство С\п\ + ... + стйт — 0 означает то же самое для компонент, вхо- входящих в отрезки. Отсюда непосредственно следует, что если некоторые отрезки строк «1, ..., ит линейно независимы, то и сами строки и\, ..., ит составляют линейно независимую совокупность. 2. Линейные зависимости столбцов матрицы с линейно зависи- зависимыми строками. Предложение 4. Пусть ии ..., ит — строки матрицы n ... ain А = т\ ¦ • • amn причем строки Uk+\ um являются линейными комбинациями строк ыь ..., uk. Пусть, далее, vu ..., vn — столбцы матрицы А,
ПО МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV a c>i, ..., vn — их отрезки длины k. Тогда из любой зависимости C\v-\- ... + CnVn = 0 следует зависимость C\Vy + ••• + cnvn = 0. Это предложение обращает при сделанных ограничениях пред- предложение о линейной зависимости отрезков линейно зависимых строк (здесь — столбцов). Доказательство. Пусть uk+i = bk+i. i"i+ ••• +bk+i,kuk> О) um = bmlul+ ... +bmkuk. Пусть, далее, c\V\ + ... cnvn = 0. Это означает, что первые k компонент столбца C\V\ + ... + cnvn равны нулю. Рассмотрим (k-\- 1)-ю компоненту. Она равна Но, в силу A), 0n+ ••• -\-bk+li = &fe+1, i«in + ••• +bk+ukakn. Поэтому ... +cnaln)+ ... +bk+ltk(clakl+ ... + cnakn). В скобках находятся первые k компонент столбца c\V\-\- ... -\-cnvn. Все они равны нулю. Следовательно, равна нулю и вычисленная нами (&-М)-я компонента. Аналогично доказывается равенство нулю всех остальных компонент. Предложение доказано. 3. Теорема о линейной зависимости линейных комбинаций. Теорема 5. Пусть и.\, ..., um и v\, ..., Vk — две совокуп- совокупности строк, и все строки второй совокупности суть линейные ком- комбинации строк первой. Тогда, если k > m, совокупность v\, ..., v/, линейно зависима. Доказательство проведем методом математической индукции по числу комбинируемых строк. Для пг = 1 утверждение почти очевидно. Пусть V\ = С\Щ, ..., Vk = chu\. Если С\ = 0, то совокуп- совокупность vi, ¦ •., V* линейно зависима, так как содержит нулевую строку. Если С] Ф 0, то имеется линейная зависимость: Допустим теперь, что утверждение верно для совокупности из m — 1 комбинируемых строк, и в этом предположении докажем его для т.
J 31 ЛИНЕЙНАЯ ЗАВИСИМОСТЬ СТРОК (СТОЛБЦОВ) 11J Пусть V1 = СПЩ + + + Если Си = C21 = ... =Сы = 0, то утверждение верно, так как тогда oi, ..., vk являются линейными комбинациями т — 1 строк «2, • • • i ит- Пусть один из этих коэффициентов отличен от нуля. Без нарушения общности можно считать, что СцфО. Рассмотрим строки: °2 = y2-f7t'1==C22+ ••• +С2тит> Вновь построенные k—1 строк являются линейными комбина- комбинациями т — 1 строк ы2, • • ¦. ит- Так как k > т, то k — 1 > т — 1. В силу индуктивного предположения строки v'v ..., v'k образуют линейно зависимую совокупность. Это значит, что существуют не равные одновременно нулю коэффициенты Ь2, ..., bk такие, что В последнее соотношение подставляем выражение строк v'2, ..., v'k через строки Vi, ..., Vk- Получим (^) (--^ о,) = 0. откуда — v{ + o2v2 + ¦.. + bkvk — U. Теорема доказана. Следствие. Любая совокупность строк длины п, содержа- содержащая более чем п строк, линейно зависима. Действительно, любая строка (аи ..., ап) длины п может быть представлена так: а,A, 0, .... 0)+а8@,1,0, .... 0)+ ... +an@,0, ..., 0,1), т. е. является линейной комбинацией некоторых п вполне опреде ленных строк. В силу только что доказанной теоремы, если числе строк больше п, то их совокупность линейно зависима. 4. Базис и ранг совокупности строк. Пусть дано конечное ил] бесконечное множество строк длины п. В нем существуют линейж независимые подмножества, содержащие не более п строк. Сред! них существуют максимальные, содержащие наибольшее числ< строк.
112 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ (ГЛ. IV Теорема 6. Все строки данного конечного или бесконечного множества строк длины п являются линейными комбинациями строк любого максимального линейно независимого подмножества. Доказательство. Пусть щ, ..., ит — строки, образующие максимальное линейно независимое подмножество, и пусть и — какая-либо строка исходного множества. Тогда совокупность и\, .... ит, и линейно зависима и, как мы видели выше, и есть линейная комбинация и\, •. ¦, ит. Линейно независимая совокупность строк, линейными комби- комбинациями которых являются все строки рассматриваемого мно- множества, называется базисной или фундаментальной совокупностью, короче, базисом данного множества строк. Предложение 7. Число строк, составляющих базис, не за- зависит от его выбора. Действительно, пусть щ, .... ит и Oi, ..., и* — два базиса одного и того же множества строк. Так. как v\, ..., vk — линейно независимая совокупность строк, являющихся линейными комби- комбинациями строк U\, ..., ит, должно быть k ^ т. По тем же сообра- соображениям tn^.k, так что т = k, что и требовалось доказать. Число строк, составляющих базис данной совокупности строк, называется рангом этой совокупности. Разумеется, тот же термин применяется к совокупностям столбцов. Предложение 8. Даны две совокупности строк такие, что вторая из них содержит первую. Если их ранги одинаковы, то все строки второй совокупности являются линейными комбинациями строк первой совокупности. Действительно, выберем базис первой совокупности. Так как ранги равны, выбранные строки образуют базис и для второй со- совокупности, и все ее строки являются линейными комбинациями этого базиса. 5. Линейно эквивалентные совокупности строк. Две совокуп- совокупности строк ии ¦•¦, um и vi, ..., Vk называются линейно эквива- эквивалентными, если каждая строка первой совокупности есть линейная комбинация строк второй совокупности и каждая строка второй совокупности есть линейная комбинация строк первой. Предложение 9. Ранги линейно эквивалентных совокупно- совокупностей строк равны. Доказательство. Пусть г — ранг второй совокупности. Это значит, что все строки второй совокупности являются линейными комбинациями базиса, состоящего из г строк. Но тогда и строки первой совокупности, будучи линейными комбинациями линейных комбинаций этих г строк, сами являются их линейными комбина- комбинациями. Следовательно, ранг первой совокупности не больше г, т. е. ранга второй совокупности. По аналогичной причине ранг второй совокупности не больше ранга первой. Следовательно эти ранги равны.
КЗ! ЛИНЕЙНАЯ ЗАВИСИМОСТЬ СТРОК (СТОЛБЦОВ) ЦЗ 6. Ранг матрицы. С данной прямоугольной матрицей связы- связывается множество ее строк и множество ее столбцов. Каждое из них имеет ранг. Замечательно то, что эти ранги равны. Теорема 10. Ранг множества строк прямоугольной матрицы равен рангу множества ее столбцов. Доказательство. Пусть Пусть ранг множества ее строк равен k. Тогда найдется базис из k строк, т. е. такое линейно независимое множество строк, что все остальные строки являются их линейными комбинациями. Для ^прощения записи будем считать, что это первые k строк, иначе мы изменили бы нумерацию. Введем в рассмотрение матрицу из 'этих строк au Ci2 ... а,„ Ifti dkZ ¦¦¦ Okn )¦ Столбцы матрицы А являются отрезками столбцов матрицы А. Выберем базис столбцов матрицы А. Пусть число столбцов, со- составляющих базис, равно г. Все столбцы матрицы Л являются их линейными комбинациями. Ясно, что г ^ k. Пополним выбранные базисные столбцы до полных столбцов матрицы А. Получившиеся столбцы линейно независимы, и, в силу предложения 4, все столб- столбцы матрицы А являются их линейными комбинациями. Таким образом, мы построили базис множества столбцов матрицы А, состоящий из г столбцов, причем г ^ k. Итак, ранг г множества столбцов матрицы А не превосходит ранга k множества ее строк. Но по тем же соображениям ранг k множества строк не превосхо- превосходит ранга г множества столбцов. Следовательно, эти ранги равны. Их величина называется рангом матрицы. 7. Условие линейной зависимости множества строк квадратной матрицы. Теорема 11. Для линейной зависимости множества строк квадратной матрицы необходимо и достаточно обращение в нуль ее определителя. Доказательство. Необходимость. Допустим, что «let А Ф 0, где
114 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ Равенство cwt + с2и2 + ... -f спип = 0, где щ, и2, ки А, равносильно системе линейных уравнений [ГЛ. IV , ., «я — СТрО- + ап2сп = О, + а2пс2 + аппсп = О, которая имеет единственное нулевое решение, ибо det А1 = = det АФО. Иными словами, если det А Ф О, то строки А линейно независимы, так что для линейной зависимости необходимо, чтобы det А = 0. Достаточность. Доказательство достаточности проведем методом математической индукции по порядку матрицы А. Для т = 1 утверждение теоремы очевидно, ибо равенство det А = 0 означает, что А состоит из нулевого элемента. Пусть для матриц порядка т—1 теорема доказана, и в этом предположении дока- докажем ее для матриц порядка т. Без нарушения общности можно считать йи^О. Обозначим через и\, и2, ..., ип строки матрицы А и введем в рассмотрение строки По свойству определителей а2п а21 а22 ап\ ап2 Далее, det A = О, а]2 О а2 О а'„ а2п , следовательно, = ап а'22 ... г ап2 •¦¦ «22 • • • а'2 ... Чп а'пп 4п а'пп = 0. По индуктивному предположению, строки (а^. • • • > а2п)> • • • > (а«2> • • • •••> а'пп) линейно зависимы, а тогда линейно зависимы и строки v2, ..., vn, с теми же коэффициентами. Итак, существуют не равные одновременно нулю коэффициенты с2, ..., сп такие, что c2v2 + • • • + cnvn = 0, и тогда
$31 ЛИНЕЙНАЯ ЗАВИСИМОСТЬ СТРОК (СТОЛБЦОВ) Ц5 Теорема полностью доказана. Ясно, что то же условие det А Ф 0 является необходимым и до- достаточным для линейной зависимости столбцов матрицы. Отсюда непосредственно следует, что верна следующая теорема. Теорема 12. Для существования нетривиальных решений си- системы п линейных однородных уравнений с п неизвестными не только необходимо, но и достаточно, чтобы определитель матрицы коэффициентов системы был равен нулю. Напомним, что необходимость была установлена выше как следствие из теоремы Крамера. Достаточность следует из того, что отыскание решения системы aniXi+ ... +аппхп = 0 равносильно отысканию коэффициентов хи .... хп линейной за- зависимости столбцов матрицы коэффициентов системы. 8. Ранг матрицы в терминах определителей. Напомним, что если в некоторой матрице выбрать несколько строк и несколько столбцов, то элементы, находящиеся в пересечениях выбранных строк и столбцов, составляют матрицу, называемую субматрицей для исходной. Определители квадратных субматриц носят '-назва- '-название миноров исходной матрицы. Теорема 13. Ранг матрицы равен наибольшему порядку от- отличных от нуля миноров. Доказательство. Пусть ранг матрицы равен k. Тогда в любом миноре порядка ft + 1 и выше (если их можно составить) будут линейно зависимые строки, и все такие миноры равны нулю. Далее, в матрице имеется базисная совокупность из k строк и базисная совокупность из k столбцов. Рассмотрим субматрицу, образованную элементами из этих строк и столбцов. Ее строки ли- линейно независимы, ибо иначе, в силу предложения 4, соответствую- соответствующие полные строки исходной матрицы были бы линейно зависимы. Следовательно, определитель порядка k так выбранной субма- субматрицы отличен от нуля. 9. Определение ранга матрицы при помощи элементарных пре- преобразований. Элементарными преобразованиями совокупности строк называются преобразования трех видов: перестановка строк ме- местами, умножение строки на отличное от нуля число, прибавление к строке строки, пропорциональной другой строке. Очевидно, что при каждом из этих преобразований совокупность строк превра- превращается в линейно эквивалентную. Для первых двух преобразова- преобразований это совершенно ясно, для третьего: если о, = щ -f- аи,, Vk = ы* при k=?=i, то tii — Vi—:avj, Um = Vk при кф[. Поэтому ранг сово- совокупности строк не меняется при элементарных преобразованиях.
116 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ ГГЛ IV Матрица вида 0 0 0 о С12 "• 0 0 0 ... 0 0 ск 0 0 ft+l ft+l ¦k+l ••¦ скп ... 0 ... 0 при с\\ ФО, С22ФО, ..., СккФЪ называется верхней трапециевид- трапециевидной. Легко видеть, что ранг трапециевидной матрицы равен k. Действительно, минор "U -12 отличен от нуля, все же миноры порядка k -f- 1 и выше равны нулю, так как у них имеется хотя бы одна нулевая строка. Предложение 14. Любая матрица за счет элементарных преобразований над строками и, быть может, перестановок столб- столбцов может быть преобразована в трапециевидную. Доказательство. Если матрица не нулевая, она содержит ненулевой элемент, который посредством перестановок строк и столбцов можно перевести в левый верхний угол. Итак, пусть матрица имеет вид 1а,. а,„ ... о.. «22 I [aml am3 причем au Ф 0. Теперь сделаем элементарные преобразования: ко второй строке прибавим первую, умноженную на —a2i/au, к третьей — первую, умноженную на —a3i/au, и т. д. После этих преобразований при- придем к матрице Чп а'т2 Если матрица «22 ••• «2» \ V /* I ат2 ••• «mn / равна нулю, процесс окончен Если нет — то сначала за счет перестановок строк и столбцов добьемся того, чтобы элемент в позиции а'п стал отличен от нуля.
СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ ОБЩЕГО ВИДА 117 Затем добавим к третьей строке вторую, умноженную на — и т. д. Придем к матрице « « 13 12 / / «22 «23 о 4 "In «2n Чп II а Продолжаем процесс до тех пор, пока не исчерпаем все строки или не придем к очередной матрице, равной нулю. В результате получим трапециевидную матрицу. § 4. Системы линейных уравнений общего вида 1. Однородные системы. Теорема 1. Для того чтобы система линейных однородных уравнений a12x2 + ... +alnxn = О, «22*2 + ... + ai№xn = O, ... +amnxa = Q имела нетривиальные решения, необходимо и достаточно, чтобы ранг матрицы коэффициентов был меньше числа неизвестных. Доказательство. Система может быть записана в виде одного равенства х2и2 + ... +х„ип = О, где Mi, U2, ..., «л — столбцы матрицы коэффициентов. Нетриви- Нетривиальные решения системы порождают коэффициенты нетривиаль- нетривиальных линейных зависимостей между столбцами. Для их существо- существования необходимо и достаточно, чтобы ранг был меньше числа столбцов, т. е. числа неизвестных. 2. Строение множества решений системы линейных однородных уравнений. Сейчас нам удобно представить систему в виде где А — матрица коэффициентов, х — столбец из неизвестных. Предложение 2. Если столбцы Z\, z2, ..., z* — решения си- системы Ах = 0, то любая их линейная комбинация c\Z\ -\- c2z2 + ... ... +ckZk тоже есть решение. Действительно, A(ciZi + c2z2 + • • • + CkZk) = ciAzi + c2Az2 -f ... Теорема З. Все решения линейной однородной системы яв- являются линейными комбинациями линейно независимых п — г ре-
118 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV шений, где п — число неизвестных, г — ранг матрицы коэффи- коэффициентов. Доказательство. Запишем снова систему в форме XlUi + X2U2-\- ... -j-XnUn — 0, где «1, up, ..., ип — столбцы матрицы коэффициентов. Среди них имеется базис из г столбцов. Для удобства записи будем считать, что это «1, Ыг, ••-, иг, иначе можно изменить нумерацию неиз- неизвестных и, вместе с ними, столбцов. Запишем, что иг+\, ..., ип суть линейные комбинации «i, иг, ..., иг. Это приводит к равен- равенствам ип = Ьп1щ-\-Ъп2и.2-Аг ... +bnrur, откуда следует, что столбцы zr+i = (br+i,i br+\,r, —I, 0, ... ..., 0)т, .... zn = (bni, ..., bnr, 0, ..., —1)т дают решения си- системы. Они, очевидно, линейно независимы. Пустьл: = (л:р .... х"п x*+v ..., х*\— еще какое-нибудь решение системы. Тогда у = х -f- x*r+lzr+x + ••• + х*пгп тоже является решением системы. В этом решении все компоненты, начиная с (г+ 1)-й, равны 0. Следовательно, и все остальные компоненты равны нулю, ибо столбцы «1, ..., и, линейно независимы. Итак, у = 0, т. е. к = у* у у*? — Xr+\Zr+\ • • • . nZn- Таким образом, zr+\, ••¦. %п — такие линейно независимые ре- решения, что все решения являются их линейными комбинациями. Такая совокупность решений называется базисной или фундамен- фундаментальной. Буквенное выражение, которое при частных значениях для букв дает все решения данной системы уравнений, называется общим решением этой системы. Для системы линейных однород- однородных уравнений общим решением будет линейная комбинация фун- фундаментальной системы с буквенными коэффициентами. 3. Неоднородные линейные системы. С неоднородной линейной системой связываются две матрицы: матрица коэффициентов «ml ••• am
44) СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ ОБЩЕГО ВИДА 119 и расширенная матрица — с присоединенными свободными чле- членами а аы *i а тп Теорема 4 (Кронекера — Капелли). Для того чтобы система линейных уравнений была совместной (т. е. имела хотя бы одно решение), необходимо и достаточно, чтобы ранг матрицы коэффи- коэффициентов был равен рангу расширенной матрицы. Доказательство, Записав систему уравнений в виде *1«1 + . . . + Xntln = Ь, ще Mi, ..., и„—столбцы матрицы коэффициентов и Ь — столбец свободных членов, мы видим, что для совместности системы не- необходимо и достаточно, чтобы столбец Ь был линейной комбина- комбинацией столбцов и\, ..., ип. Для этого равенство рангов, конечно, необходимо, но оно и достаточно, ибо если ранги одинаковы, то базис для «1, ..., ип будет базисом и для щ, ..., и,„ Ь, так что Ь есть линейная комбинация базисных столбцов для mi, ..., ип. 4. Строение множества решений неоднородной системы. Теорема 5. Общее решение неоднородной системы линейных уравнений равно сумме частного решения и общего решения одно- однородной системы с той же матрицей коэффициентов. Доказательство. Пусть х0 — какое-либо частное решение системы Ах = b линейных неоднородных уравнений. Тогда Ахо—Ь> и система Ах — Ь равносильна Ах = Ахо, "или А(х — х0) = 0. По- Поэтому х — х0 должно быть решением однородной системы с той же матрицей А. Общее решение системы Ах — Ь получится, если взять х — х0 равным общему решению однородной системы. Отсюда не- непосредственно следует справедливость теоремы. 5. Метод Гаусса. Рассмотрим метод решения системы линей- линейных уравнений путем сведения его к решению системы с трапецие- трапециевидной (в частности, с треугольной) матрицей коэффициентов — так называемый метод Гаусса. Пусть — система линейных уравнений. Уравнение C)(an*i+ ... +й1л*я)+ ••¦ + cm(ami*i+ ... -\-а,ппхп) — — С\Ь\ + ... + cmbm называется линейной комбинацией уравнений данной системы. Очевидно, что каждое решение исходной системы будет решением и для линейной комбинации.
120 . МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV Две системы линейных уравнений называются линейно эквива- эквивалентными, если каждое уравнение первой системы есть линейная комбинация уравнений второй системы и каждое уравнение второй системы есть линейная комбинация уравнений первой системы. Линейно эквивалентные системы эквивалентны и в обычном смыс- смысле— они одновременно совместны или несовместны и, в случае совместности, имеют одинаковые множества решений. Элементарными преобразованиями системы линейных уравне- уравнений называем умножение уравнения на отличное от нуля число, перестановку уравнений местами и прибавление к одному уравне- уравнению другого, умноженного на некоторое число. Ясно, что элемен- элементарные преобразования переводят систему в линейно эквива- эквивалентную. Теорема 6. Любая система линейных уравнений приводится посредством элементарных преобразований и, быть может, изме- изменения нумерации неизвестных к системе с трапециевидной матри- матрицей. В частности, для системы п уравнений с п неизвестными с не равным нулю определителем матрицы коэффициентов система приводится к системе с треугольной матрицей. Доказательство. Сделаем последовательность элементар- элементарных преобразований так, чтобы матрица коэффициентов привелась к трапециевидной форме. Возможно, что при этом придется изме- изменить нумерацию неизвестных (и соответствующих столбцов ма- матрицы коэффициентов). Если ранг г матрицы коэффициентов меньше числа уравнений пг, то система примет вид: cnxr + cr, r+ixr+l + ... + crnxn = dn 0 =dr+ 0 Равенства, следующие за r-м уравнением, могут быть противоре- противоречивы, если хотя бы одно из чисел dr+\, .... dm отлично от нуля. Если же все они равны нулю, то последние m — г равенств не несут никакой информации и могут быть отброшены. Тогда, если г < п, то неизвестным хг+и ..., хп можно придавать произвольные значения. Неизвестные х\, .... х, найдутся из решения системы с /сп ... с{г\ треугольной матрицей I )• Эту систему удобно ре- Vo ... сп) шать, определив из r-го уравнения хг, затем из (г—1)-го xr-i и т. д. Если сохранить за неизвестными xr+i, .... хп буквенные
J5J ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 121 обозначения, мы можем выразить через них х\, ..., хг и получить .общее решение системы. Если г = п, то система (в случае совмест- совместности) имеет единственное решение. Если г = т = п, т. е. если матрица коэффициентов системы квадратная с не равным нулю определителем, этим способом ре- решение системы сводится к решению системы с треугольной ма- матрицей с,,*, + ... + clnxn = du при Си ф О, ..., Спп Ф 0. Обычно добиваются того, чтобы Сц = ... ... = сГг = 1. Для этого каждый раз, прежде чем добавлять с нужными множителями уравнение к последующим, делят обе ча- части уравнения на коэффициент при исключаемой неизвестной (схема единственного деления метода Гаусса). Преобразование системы к системе с треугольной матрицей называется прямым ходом метода Гаусса. Последовательное вычисление неизвестных в порядке х„, Хп-\, • • •, Х\ называется обратным ходом. Легко под- подсчитать, что число арифметических действий при применении ме- метода Гаусса ненамного больше числа арифметических действий для вычисления одного определителя. Метод Гаусса до настоящего времени остается одним из лучших методов решения систем ли- линейных уравнений. § 5. Дальнейшие свойства определителей 1. Теорема Лапласа. Теорема, о которой будет идти речь в этом пункте, является глубоким обобщением разложения определителя (ап ••• аы \ по элементам строки. Пусть ^=1 I— квадратная 4.1 '•• апп' матрица порядка п. Напомним, что минором порядка k для этой матрицы назы- называется определитель матрицы, составленной из элементов, находя- находящихся на пересечении некоторых выбранных k строк и k столб- столбцов. В общем виде минор порядка k можно записать в форме «.р. ••• \н Здесь аь ••-, а* — номера выбранных строк ai ¦< а2 <С ... < ак, и Рь ..., Р* — номера выбранных столбцов, Pi ¦< Рг <С ¦•• <С Р*. Минором, дополнительным к данному минору порядка k, назы- называется минор порядка n — k, матрица которого получается из исходной посредством вычеркивания строк и столбцов, содержа-
122 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV щих данный минор. Алгебраическим дополнением к данному минору называется дополнительный минор с множителем <_ i)a1 + ...+a^.+3, + ...H3ft. Теорема 1 (теорема Лапласа). Пусть в матрице определи- определителя выбраны k строк. Определитель равен сумме произведений всех миноров порядка k, составленных из этих строк, на их алге- алгебраические дополнения. Например, если для определителя a13 a14 a21 «22 «23 выбрать первые две строки, теорема Лапласа дает °44 «4! «43 a3! «41 «42 Доказательство теоремы Лапласа довольно громоздко. В конце курса, в главе, посвященной внешней алгебре, теорема Лапласа появится как почти очевидное утверждение. Мы ограничимся доказательством важного частного случая, именно, формулой для определителя ступенчатой матрицы. Сту- Ступенчатая матрица устроена так: 22 а2т m + l. m+1.2 a m-l-t. n la«l an2 ••¦ anm an. m+I •" "nn Если к определителю ступенчатой матрицы применить теорему Лапласа, исходя из первых т строк, то лишь один минор будет отличен от нуля, именно, левый верхний, и его алгебраическим дополнением будет минор, составленный из последних п — гп строк и столбцов. Согласно теореме Лапласа \т am+l,m+l •"• a»n-l.n п. m-И
§5] ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 123 Этот частный случай теоремы мы сейчас докажем. При т = 1 утверждение теоремы очевидно. Далее проведем индукцию по по- порядку т минора из левого верхнего угла, допустив, что для левого верхнего углового минора порядка in — 1 теорема верна. Введем следующие обозначения. Через осц, аи, .-., Щт обозначим алге- алгебраические дополнения элементов первой строки определителя •ml , через бц, $ 12, соответствующие миноры. Далее, через Аи, А\%, ..., А\п обозначим алгебраические допол- дополнения элементов первой строки в определителе (let Л и через Ац, Ai2, ..., Ain — соответствующие миноры. Разложим определитель det А по элементам первой строки. По- Получим Присмотримся к тому, что представляет собой минор А)*. Его матрица получается вычеркиванием первой строки и /г-го столбца из матрицы А. Останется снова ступенчатая матрица. Ее левый верхний угловой минор имеет порядок т—1, и его матрица есть результат вычеркивания первой строки и ft-ro столбца из матрицы (а\\ ¦¦¦ elm \ I . Правый нижний угловой минор такой же, как у о ... а / тп\ tntn матрицы А. В силу индуктивного предположения Поэтому П. Я1+1 \к п, т+1 а т+1. т+1 п. т+1 '1т т+1, т+1 "¦ т+1, п а п, т + 1 что и требовалось доказать. Для приложений теории определителей теорема Лапласа, в ос- основном, нужна именно в частном случае определителя ступенча- ступенчатой матрицы.
124 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV Пример. 1 3 5 7 л X и 2 4 6 8 е У V 0 0 1 2 3 е-1 я2 0 0 2 3 1 с Р 0 0 3 4 2 9 0 0 0 0 0 2 3 0 0 0 0 0 5 7 1 Щ • 1 2 3 е-1 л2 2 3 1 с Р 3 4 2 Я 0 0 0 2 3 0 0 0 5 7 1 3 2 4 1 2 3 2 3 1 3 4 2 2 3 5 7 = ( —2).( —3).(—1) 6. Мы дважды применили теорему об определителе ступенчатой матрицы. 2. Умножение матриц, разбитых на клетки. Пусть матрица раз- разбита на части горизонтальными и вертикальными линиями, иду- идущими через всю матрицу. Получившиеся части называются бло- блоками или клетками, а исходная матрица называется блочной или клеточной. Блочную матрицу можно рассматривать как матрицу, элементами которой являются матрицы. Оказывается, что основные действия над клеточными матри- матрицами можно производить по тем же правилам, что и над матри- матрицами из чисел (или из элементов данного поля). Но, разумеется, должны быть выполнены надлежащие требования на разбиения, чтобы все нужные действия имели смысл. Если Л и В — две матрицы одинакового строения и они раз- разбиты на клетки одинаковым образом, то дх. можно складывать по клеткам. Это очевидно. Пусть теперь А есть mX^-матрица, В есть k X n-матрица, С = АВ, k — k\ + ... + ks. Матрица А разбита на клетки Лар, а=1, ..., р, Р = 1, ..., s, так, что ширины гори- горизонтальных полос (в числе р) безразличны, вертикальные же полосы имеют ширины k\, ..., ks; соответственно В разбита на клетки Вп, у = 1 s, 6=1, .... q, ширины горизонтальны^ полос которых равны ku..., ks, ширины вертикальных (в числе q) безразличны. Матрицу С разобьем, на клетки C^v так, что гори- горизонтальные полосы по ширине такие же, как соответствующие Го- Горизонтальные полосы матрицы А, а вертикальные полосы — как соответствующие вертикальные полосы матрицы В. В этих пред- предположениях ЛарВру имеет смысл при любых а, Р, v и Cav = Для доказательства рассмотрим два крайних случая. Сначала допустим, что матрица А разбита только на горизонтальные по- полосы Ль ..., Ар, матрица В —только на вертикальные полосы Вь ••.. Вц и матрица С — соответственно на р полос по горизон- горизонтали и q полос по вертикали. В этом случае субматрица Сау ма- матрицы С есть произведение полосы Аа на полосу Ву.
ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 125 Теперь допустим, что А разбита только на вертикальные по- полосы Аи ..., As щирины ki, ..., ks соответственно и В разбита только на горизонтальные полосы Ви .... Bs ширины k\, ..., kt соответственно. В этой ситуации матрица С на клетки не разби- разбивается. Имеем: Слагаемые в скобках суть элементы в позиции (i, /) матриц AiB\, А2В2, ... Поэтому С = AiBi + А2В2 + ... + ASBS. Справедливость общего утверждения теперь получается непо- непосредственно. Сначала нужно разбить А на горизонтальные полосы и В на вертикальные. Соответствующие клетки матрицы С равны произведениям горизонтальных полос матрицы А на вертикальные полосы матрицы В. Каждое такое произведение вычисляется со- согласно второму частному случаю как сумма произведений клеток матрицы А, на которые разбиты горизонтальные ее полосы, на клетки матрицы В, на которые разбиты ее вертикальные полосы. 3. Умножение матрицы на вспомогательную матрицу как линей- линейное преобразование строк (столбцов). Рассмотрим произведение С = АВ двух матриц А и В. Разобьем матрицу В на клетки, счи- считая клетками столбцы В, матрицу А рассмотрим как состоящую из одной клетки. Соответствующими клетками их произведения С будут столбцы. Получим Л (Вь В2, ..., Вп) = (АВ{, АВ2,..., АВ„). Здесь Bit В2, ..., Вп — столбцы В и, соответственно, АВи АВ2, ... ..., АВп — столбцы С. С таким представлением произведения мы уже встречались. Теперь примем за клетки В ее строки: Вх В2 а за клетки А — ее элементы: ставлении /а„ ... а1к \ : /4 = 1 I.B Ч„1 ••• amkJ этом пред- АВ- anBi +¦•• + «, А «21S1 amlBl+ •¦¦ kB k так что строками матрицы АВ оказываются линейные комбинации строк В.
126 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ Аналогично, расщепление А на строки дает: [ГЛ. IV расщепление же А на столбцы дает (ьп ••• ьы\ (Л„ .... Ak)[ 1 = \bt, ... bt J кп = V>l\A\ + • . . + bkiAk, . . ., fri^! + . . . -f- bknAk). Таким образом, умножение матрицы на некоторую вспомога- вспомогательную матрицу слева равносильно линейному комбинированию строк матрицы, умножение справа — линейному комбинированию столбцов. Рассмотрим матрицу ец, 1Ф1, элементами которой являются 1 на месте (i, /) и нули на остальных местах. Умножение слева неко- некоторой матрицы на ец переставляет у-ю строку матрицы на t-e ме- место, а все остальные строки заменяет нулями. Квадратная матрица Е -f- ceij называется матрицей трансвещии или матрицей элемен- элементарного преобразования. Умножение слева на Е -f- сец равносильно прибавлению к t-й строке /-й строки, умноженной на с, с сохране- сохранением всех остальных строк. Такие преобразования неоднократно применялись нами по различным поводам. Умножение на ец справа переставляет t-й столбец на у'-е место, заменяя нулями остальные столбцы. Умножение справа на Е -f- сец равносильно добавлению к i-му столбцу /-го, умноженного на с. Треугольная матрица называется унитреугольнои, если все эле- элементы ее главной диагонали равны 1. Выясним, как изменяются строки матрицы А при умножении ее слева на правую унитре- угольную матрицу С. Пусть 2 /"> __ — I 0 1 И Л = >0 О Здесь А\, ..., Ат — строки матрицы А. Имеем: СА=\ *,+ ¦¦¦+ с9тА 2т т так что первая строка получена из первой строки А прибавлением Последующих строк, умноженных на с12, ..., С\т, вторая — из
§ Б) ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 127 второй прибавлением последующих строк с соответствующими множителями и т. д., последняя остается без изменения. Если А — квадратная матрица, то при всех описанных преоб- преобразованиях определитель матрицы не изменяется, так что det CA= = det A. Если С — левая унитреугольная матрица 1 0 ... о> . ..„, 1 ... О ТО С А = 1 c<ilAl "*~A<1 .яЛ+стЛ + ¦¦¦+Ап. и здесь описание преобразований удобно начинать с конца: к по- последней строке прибавляются предшествующие, умноженные на ст\, ст2, ..., Ст,т-и к предпоследней — предшествующие, умно- умноженные на соответствующие элементы матрицы С, и т. д.; ко вто- второй строке прибавляется первая, умноженная на Сц, и первая остается без изменения. Поэтому и в этом случае det С А = det A. При правом умножении на унитреугольную матрицу С проис- происходят аналогичные преобразования столбцов, поэтому также det AC= det A. 4. Определитель произведения двух квадратных матриц. Имеет место следующая замечательная теорема: Теорема 2. Определитель произведения двух квадратных матриц равен произведению определителей сомножителей. Теорема эта представляет собой глубокое тождество, непосред- непосредственная проверка которого требует некоторых усилий даже для п = 2. Выполним эту проверку. Пусть А= (" Л, # = (* ^J. ~ . _ / ах + bz, аи + i Тогда АВ = ' * det АВ = (ах + Ьг) {су + dt) — (ay + Ы) (сх + dz) = = ахсу + axdt -f- bzcy + bzdt — аусх — aydz — btcx — bdtz = = adxt + bcyz — adyz — bcxt = (ad — be) (xt — yz) = det A det B. О непосредственной проверке теоремы даже для п = 3 страшно подумать. Тем не менее, у нас "уже имеется достаточно сведений об определителях и матрицах для того, чтобы дать краткое кос- косвенное доказательство теоремы. Доказательство. Пусть А и В — две квадратные матрицы порядка п. Рассмотрим матрицу ( _ ? в) порядка 2п. По
128 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV теореме об определителе ступенчатой матрицы det \ _ р в ) = — det Л det В. Умножим теперь эту матрицу слева на унитре- угольную матрицу ( 0 Е J . При этом определитель не изменится. Таким образом, В последнем определителе поменяем местами первый столбец с (п+1)-ы) второй с (« + 2)-м и т. д. Это равносильно переста- перестановке блоков-столбцов. Определитель приобретет множитель (—1)". Итак, Применив еще раз теорему об определителе ступенчатой матрицы, получим det A det В = (—1) "det AB det (—Я) = det AB, что и требовалось доказать. 5. Примеры применения теоремы об определителе произведе- произведения квадратных матриц к вычислению определителей. Собственно говоря, те приемы вычисления определителей, которые мы рас- рассматривали раньше, можно рассматривать как левые умножения (при комбинировании строк) или правые умножения (при ком- комбинировании столбцов) на вспомогательные матрицы, именно, матрицы трансвекций. Мы должны были внимательно следить за тем, чтобы не прибавить уже измененную строку (или столбец) при линейном комбинировании. Теорема об определителе произ- произведения дает большую свободу для линейного комбинирования строк (или столбцов) за счет умножения на подходящие вспомога- вспомогательные матрицы. Определитель при этом может меняться, но мы в состоянии учесть это изменение, именно, определитель приобре- приобретает множителем определитель вспомогательной матрицы. Оста- Остается следить только за тем, чтобы не умножить на матрицу с ну- нулевым определителем. Пример 1.. Найти det А, если (а Ь с rfv bade] с d a b У d с Ь а) Здесь напрашивается несколько способов линейного комбини- комбинирования строк. Хорошо сложить все строки. Не менее хорошо сложить первые две и вычесть третью и четвертую, сложить пер- первую с третьей и вычесть вторую и четвертую и, наконец, сложить первую с четвертой и вычесть вторую и третью. Все эти преобра-
151 ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 129 зования выполнятся одновременно, если исходную матрицу умно- умножить слева на матрицу • 1 1 1 к 1 1 -1 -1 | 1—1 1—1 Г —1—11/ г с = Действительно а + Ъ + с + d а + Ь — с — d а + 6 — с + d а + Ь + с — d а + Ь + с + а —a — b+c + d а — b + с — d — а-\- b -\- с — d det С А = det С det А = (а + b + с + d) (а + b — с — d) X l- lt —1 —1 b-c+d) det С. Остается убедиться, что detC^O. Мы его вычисляли выше, он равен —16. Но легко также убедиться в справедливости неравен- неравенства det С ф 0, учитывая, что так что (det СJ = 256. Этот пример несколько искусственный, но он есть частный случай более общей ситуации — группового определителя конечной абе- левой группы. Подчеркнем еще раз важность того, что detC=^=0. Если за этим не проследить, можно получить неверный результат. Напри- Например, для той же матрицы А возьмем в качестве вспомогательной 1 1 1 1 1111 llll Л 1 1 Тогда a+b+c+d a+b+c+d a+b+c+d a+b+c+d a+b+c+d a+b+c+d a+b+c+d a+b+c+d a+b+c+d a+b+c+d a+b+c+d a+b+c+d a + b + c + d.
130 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ. IV 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 «Сократив» на det С, получим неверный результат: dydetC. a b с d b a d — с с — d a b d с — b a Но на самом деле det С = 0, и сокращение на det С недопустимо. Пример 2. Найти А = det А, где л = Пример очень похож на предыдущий, но здесь линейное ком- комбинирование строк малополезно. Хорошо возвести Л в квадрат: Д2 = det АТЛ = + &2 + c2 + rf2 0 , 0 0 0 а* + Ьг + с* + d* 0 0 0 0 а* + Ьг + сг + d* 0 О 0 0 a2 + b* + c* + Следовательно, или А = (а2 + Ь2 + с2-{-d2J, или Д = — (аг + + b2 -f- с2 -f- d2J, или при одних значениях а, Ь, с, d одно, при дру- других — другое. Разберемся в этом вопросе. Мы имеем равенство полиномов от а, Ь, с, d: А2 = (а2 + 62 + с2-\- d2L, или (Л — (а2 + Ь2 + с2 + d2J) (Л + (а2 + Ь2 + с2 + d2J) = 0. Но кольцо полиномов есть область целостности. Следовательно, равен нулю один из сомножителей. Равенство нулю второго при- приводит к • А = —(а2 + Ь2 + с2 -{- сРJ, что не имеет места при следующих значениях букв: а = 1, Ь = = с = d = 0. Следовательно, 6. Теорема Бине — Коши. Пусть произведение двух прямо- прямоугольных матриц есть матрица квадратная. Это будет в том и только в том случае, когда не только число столбцов первой ма-
I fa] дальнейшие свойства определителей 131 трицы равно числу строк второй, но и число строк первой равно числу столбцов второй: т А п - В п = АВ т т т В этой ситуации имеет место следующая теорема, называемая теоремой Бине — Коши. Теорема 3. Определитель матрицы АВ равен нулю, если гп> п, и равен сумме произведений веек миноров m-го порядка матрицы А на соответствующие миноры m-го порядка матрицы В, если m ^ л. Соответствие миноров понимается здесь в следующем смысле: номера столбцов матрицы А, составляющие минор, совпадают с номерами строк матрицы В, из которых составляется соответ- соответствующий минор. В формульной записи: det АВ = ? Ау :...<vm Y2. •.YmSY(. Y2. - Ym' где Ayt, y2 у —минор матрицы А, составленный из столбцов с номерами yit у2 Vm, и BYi> Yi,. ..,Y/n — минор матрицы В, со- составленный из строк с номерами уь 42, ¦¦., Уш- Теорему Бине — Коши можно доказать аналогично доказатель- доказательству теоремы об определителе произведения двух квадратных матриц (которая, конечно, есть частный случай теоремы Бине — Коши). Однако при этом пришлось бы воспользоваться теоремой Лапласа в общей формулировке. Приведем доказательство, основанное на другой идее. Запи- Запишем подробно a\\bi\ 21 + - ••+ + •¦. + Теперь применим свойство линейности определителя к первому столбцу. Получим det АВ = а1аЛ,1 amafial\
132 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ (ГЛ. IV где у всех определителей столбцы, начиная со второго, такие же, как у det AB в исходной форме. Применим теперь свойство линей- линейности ко вторым столбцам определителей, составляющих эту сумму. Получим det AB = где индексы а\ и а2 пробегают независимо значения 1, 2, ..., п. Здесь у всех определителей столбцы, начиная с третьего, такие же, как в исходной форме у det AB. : Тем же способом продолжаем разложение определителя det AB на сумму определителей, применяя свойство линейности к третьим, ..., т-м столбцам. Получим в результате laA.l alaA,2 ••• alambamm 11 2 2 ttl ПЪ о,, a,, ..,о„ ••• amambamm где индексы си, аг, ..., ат принимают независимо друг от друга все значения от 1 до п. Здесь всего пт слагаемых. Вынесем из каждого столбца общий множитель. Получим det А В = Jla, ala2 ••• «1, "ma, ma. ... а„ Если т > n, то индексам си, аг, ..., am будет «настолько тесно», что среди их значений будет находиться хотя бы одна пара рав- равных. Но тогда все определители, входящие в слагаемые det AB, будут равны нулю как имеющие равные столбцы. Поэтому det AB = 0 при т> п. Пусть теперь т ^ п. Если среди значений индексов найдется хотя бы одна пара равных, то соответствующее слагаемое равно нулю. Все такие слагаемые можно отбросить и останется сумма, распространенная на попарно различные значения индексов aj, Сб2, .. •, «т. Наборы таких значений могух отличаться как соста- составом значений, так и порядком, если состав один и тот же. Такие наборы носят название размещений. Обозначим через уи у2,..., ут набор значений индексов он, «2, ••-, am, расположенных в порядке возрастания: yi < Y2 < • • • < Ут, так что при одном и том же составе значения индексов он, а%, ..., ат будут образовывать пе- перестановки элементов у\, у%, ..., ут. Проведем сначала суммирование по всевозможным наборам ai, с&2, ..., ост одинакового состава, т. е. по перестановкам эле- элементов 7ь Y2. • • • > Ут, а затем сложим получившиеся суммы по возможным составам.
-S5] ДАЛЬНЕЙШИЕ СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ 133 Получим det АВ = - Е ,, a,. ¦ат) Ча, la. а1а„ "ma, "ma. где во внутренней сумме суммирование ведется по всем наборам (ось <%2, ..., am), составляющим перестановки чисел Yi, Y2. • ••, Y«- В пределах внутренней суммы определители отличаются только порядком столбцов. Приведя столбцы в порядок возрастания зна- значений индексов, получим: flIa, «la2 ... а„ = (-1) (a,, a2 am) так что » (а, X «mY, amY2 ••• amYj -l)lnM«i.et am)X >Vi aW2 ••• aivOT mY| amv2 ''' атУт Во все слагаемые внутренней суммы входит сомножителем один и тот же определитель. Его можно вынести за знак суммьп Y,<-<V lVl «!,„ mY, • • • «ra) После вынесения минора матрицы А за знак внутренней суммы осталось драгоценное наследство в виде множителя (—l)mv(ai am)f наличие которого позволяет заключить, что внутренняя сумма равна определителю Действительно, она есть сумма всевозможных произведений эле- элементов матрицы этого определителя, взятых по одному из каждой строки (ведь (ai, аг, ..., ara) пробегает всевозможные переста- перестановки чисел yi> Y2. • • •. Ут) и по одному из каждого столбца.
134 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ |ГЛ IV" Сомножители записаны в порядке следования столбцов, а inv(ai, a2, ..., am) есть число инверсий в номерах строк. Итак, det АВ = araY, • • • «„ *V,» ... ь, Vml что и требовалось доказать. Приведем один интересный пример. Пусть У,™ ... г> Здесь ai, bi — комплексные числа, a,, bi — сопряженные с ними» Имеем: - ... + пппп O\b\ + a2bi -\~ ... + onbn - ... + anbn blbl+b2b2+ ... + bnbn Вспомним, что произведение комплексного числа на сопряжен- сопряженное равно квадрату его модуля, и заметим, что элементы побочной диагонали АВ комплексно сопряжены. Поэтому По теореме Бине — det АВ = У Коши а. п) bi b/ й1 b'i — afii |2. Сравнивая результаты, получаем тождество Z I afij — flyft, |2» откуда следует известное неравенство Kouiir: ... +аЖ|2^(|а,|2+ ... +|а„|2) (\bx причем равенство возможно, только если aibj — ajbi = 0 для всех i и /, т. е. если строки матрицы А пропорциональны. § 6. Обращение квадратных матриц 1. Условие существования обратной матрицы. Для данной квад- квадратной матрицы А правой обратной называется такая матрица В, что АВ = Е. Соответственно, матрица С называется левой обрат-
¦$ Я ОБРАЩЕНИЕ КВАДРАТНЫХ МАТРИЦ 135 ной для Л, если СА = Е. Матрица называется обратной для Л, «ели она одновременно левая и правая обратная. Теорема 1. Для того чтобы матрица А с элементами из поля имела обратную, необходимо и достаточно, чтобы ее опре- определитель был отличен от нуля. Доказательство. Необходимость. Пусть для ма? трицы А существует правая обратная В, так что АВ = Е. Примем яяя теорему об определителе произведения квадратных матриц, получим: det A det В = det?= 1, откуда следует, что det/J^O. То же условие, очевидно, необходимо и для существования левой обратной. Достаточность. Требование АВ = Е означает, в частности, что произведение t-й строки матрицы А на /-й столбец матрицы В •при 1Ф\ равно нулю. Этому свойству, согласно свойствам опре- определителя, удовлетворяет матрица А, транспонированная к матрице, -составленной из алгебраических дополнений элементов опредет лителя det Л в их естественном расположении. Матрица А носит название матрицы, союзной с матрицей Л. Легко видеть, что ап ап ... а2П || Л1} Агг ... Апг Am ... Апп det Л 0 ... О О det А ... О | = det Л • Е. О 0 ... det A, Действительно, на диагональных позициях оказываются суммы произведений элементов строки на их алгебраические дополнения, * каждая такая сумма есть определитель det Л, представленный в виде разложения по элементам строки. На недиагональных по- позициях оказываются суммы произведений элементов строки на алгебраические дополнения элементов другой строки, а все такие суммы равны нулю. Применяя те же свойства к столбцам определителя det Л, по- получим, что АА = det A-E. Поэтому, если det А ф 0, то матрица . . А • А есть правая и ле- ©ая обратная для матрицы Л, т. е. обратная для Л. Она обозна- обозначается Л-1. Заметим еще, что кроме Л~1 не существует ни правых, ни ле- левых обратных матриц для Л. Действительно, если АВ = Е, то Л {АВ) = А-\ но Л-|(ЛВ) = (Л-|Л)В = В, так что В = А-1. Ана- Аналогично, если СА — Е, то (СА)А~1=А-1, откуда С == А~1,
136 Матрицы и определители ' 1гл. iv Квадратная матрица Л, у которой det А Ф О, называется неосо- неособенной или невырожденной. В противном случае матрица назы- называется вырожденной. Для матриц с элементами из коммутативного ассоциативного- кольца (не обязательно поля) те же рассуждения дают следую- следующее условие обратимости: Для того чтобы матрица А с элементами из коммутативного ассоциативного кольца Л была обратима над тем же кольцом, необходимо и достаточно, чтобы определитель матрицы, был обра- обратимым в кольце Л элементом. Действительно, необходимость следует из равенства det Л det Л-1 = 1, а определитель матрицы с элементами из Л принадлежит Л. Для достаточности нужно заметить, что элементы союзной матрицы Л принадлежат кольцу Л и, если det А обратим в Л, то матрица (det А)-*А будет обратной, и ее элементы принадлежат Л. Например, для целочисленной обратимости матрицы с целыми элементами необходимо и достаточно, чтобы ее определитель был равен ±1. Для обратимости матрицы над кольцом полиномов необходимо и достаточно, чтобы ее определитель был не равной, нулю константой, и т. п. 2. Некоторые свойства обратной матрицы. 1. deM-'^de^)-1. Действительно, АА~1 = Е, следовательно, det4de^~' = *= det ?=1, откуда (detA)-1 = detA-1. 2. Если А н В невырожденны, то их произведение АВ тоже не- невырожденно и (АВ)-1 = В~1А-\ т. е. матрица, обратная к произ- произведению, равна произведению обратных, взятых в обратном по- порядке. Действительно, (В-'Л-1) {АВ) = Б-1 (Л-'Л)Б = й->й = Е, откуда следует, что В~1А~1 =(АВ)~1. 3. (Л-1)-1 = А. Действительно, (Л-1)-1 есть такая единственная матрица, про- произведение которой на Л~' равно Е. Этим свойством обладает А. 4. (Л1)-1 = (Л-')Т. Действительно, переходя в равенстве АА~1 = Е к транспони- транспонированным матрицам, получим (A~l)rAr — Е, откуда и следует* что (Л-1)Т = (ЛТ)-1. 3. Решение линейных систем с невырожденной матрицей в тер- терминах обратной матрицы. Пусть дана система линейных уравнений Ах = Ь, где Л — невырожденная квадратная матрица, х — столбец из не- неизвестных, b — столбец свободных членов.
¦5 6] ОБРАЩЕНИЕ КВАДРАТНЫХ МАТРИЦ 137 Допустим, что система имеет решение и х уже есть решение, так что Ах — Ь — верное равенство. Умножим обе части его на А~1. Получим А~хАх = A~lb, откуда х = А~ХЬ. Теперь докажем, что A~lb действительно есть решение: A (A~lb) — (AA~l)b = Ъ. Мы находились в условиях теоремы Крамера, и приведенные несколько строк представляют собой доказательство теоремы Крамера. Легко проследить, что то доказательство, которое было приведено, в точности совпадает с данным сейчас, но было осу- осуществлено в развернутой записи. Именно, умножение уравнений системы на алгебраические дополнения и сложение представляло «обой не что иное, как умножение слева на союзную матрицу. Вторая часть, проверка, представляла собой подстановку А~1Ь вместо х, но в развернутой записи. Ясно также, что равенство х = A~lb= det^ Ab есть матричная запись формул Крамера. Столь же кратко записывается решение матричного уравнения АХ = В, где А — невырожденная матрица порядка п, X— неиз- неизвестная п X ^-матрица, В — данная пХ ^-матрица. Именно, X =* = А~1В. Запись АХ = В равносильна k системам линейных урав- уравнений с одной и той же матрицей коэффициентов А, с неизвест- неизвестными, составляющими столбцы матрицы X, и со свободными чле- «ами, составляющими столбцы матрицы В. 4. Обращение ступенчатой матрицы. Пусть ( с Dj — невырож* денная ступенчатая матрица с квадратными блоками А и D. Из невырожденности следует, что del А ф 0 и det D ф 0. Пусть v у J — обратная матрица, разбитая на блоки в соответствии о разбиением исходной матрицы. Из равенства (с D)(y vr)=1 "Ко я) следУЮт Уравнения АХ = Е, AY = 0, CX Находим из первого уравнения Х = А~\ из второго У = 0, из четвертого V = ?>-' и, наконец, из третьего U = —D~lCA-1. Итак, А 0 \-'/ А~{ /А 0 \-'_/ \С D) — V-D А (A S\~l (A~{ -A~lBD~l\ Аналогично, @ D) =(Q D_, J • 5. Вычисление определителя матрицы, разбитой на четыре клетки, и обращение такой матрицы. Пусть дана матрица ( r n ) е квадратными клетками А и D, причем предполагается, что
138 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ |ГЛ. IV матрица А невырожденна. Умножим матрицу слева на матрицу (-?¦-» D'Получим А-1 0\(А В\_ -СА~х Е)\С D)- Переходя к определителям, получим deM~'det(? *) = det(Z) — СА~'в) det (^ ?) = det Л det (О-СЛ-'в). Матрица D~CA~lB называется шуровским дополнением к. субматрице А матрицы ( „ „ J . Перейдем теперь в равенстве (*) к обратным матрицам. По- Получим (A ВЛ-V Л"' O\-lfB А-1 В V1 КС D) К-СА~Х е) VO D-CA~lB) ' откуда — 1 е - (А Ву1_(Е А~1В \ ( А~1 0\ Кс о) —\ь d-ca-'b) K-ca-1 е)~ ( _ / ~К + A~lB (D - СЛ"'В)~' СА~Х - А'1 В (D - СА~1В) ~1b)~x -(о-сл-'вГ'сл (d-ca~1b) Заметим еще, что если А, В, С, D — квадратные матрицы оди- одинакового порядка, то формулу для определителя можно преобра- преобразовать к виду det (? J) = det(ЛО-ЛСУГ'В), и если Л и С коммутируют, то det(c 1) = Аналогично, записав det-Л правым множителем, получим det (с
ОБРАЩЕНИЕ КВАДРАТНЫХ МАТРИЦ 139 и, если А и В коммутируют, det( 6. Ортогональные и унитарные матрицы. Вещественная матрица называется ортогональной, если ее обратная совпадает с транспо- транспонированной. В формульной записи: Р ортогональна, если РРТ = Еч Запишем это матричное равенство в развернутой форме. Пусть Тогда pj \ i P*J \ Pll ¦ Pni ( Pu ^Pin Р\г ¦ • Рп •¦¦ Рпг • ¦ Рп • Рп . Ргп • ¦ Pin ¦ Ргп • Рпп • ¦ • Рт ¦ ¦ Рпг • ¦ Рпп и B2 2 Pil"bPl2"^" ••• "^Pin PttPil "•" PitPit т" ••• "f" PlnPin •• На главной диагонали матрицы РРТ находятся суммы квадратов элементов строк матрицы Р. На остальных позициях находятся -суммы произведений соответствующих элементов двух различных строк. Поэтому равенство PPJ = Е, характеризующее ортогональ-. лые матрицы, записывается как Zj</Pft/ . , = l, .... п, Вещественная строка называется нормированной, если сумма квадратов ее элементов равна 1, и две вещественные строки на- называются ортогональными, если сумма произведений соответствую- соответствующих элементов равна нулю. Таким образом, условие РРТ — Е равносильно тому, что строки матрицы Р нормированны и попарно ортогональны. Из равенства РРТ = Е следует РТР = Е, или РТ(РТ)Т = Е. Таким образом, из ортогональности матрицы Р следует ортогональ- ортогональность транспонированной с ней матрицы Рт и обратно. Однако развернутая запись равенства РТР = Е полностью отлична от -записи РРТ = Е, именно, имеет вид нормированности и попарной ортогональности столбцов матрицы Р. Таким образом, мы
140 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ !ГЛ. IV получаем нетривиальное обстоятельство;—из нормированное™ ir попарной ортогональности строк матрицы следует нормирован- ность и попарная ортогональность ее столбцов. Отметим некоторые свойства ортогональных матриц. 1. Ортогональность Р влечет ортогональность Р~1. Действительно, Р~1 = Рт, а ортогональность Рт уже уста- установлена. 2. Произведение ортогональных матриц есть ортогональная ма- матрица. Действительно, PiP2{P^f = Р\РгР1р1 = Р\ЕР] = P^pJ = Е. 3. Единичная матрица ортогональна. Действительно, ЕЕ1 = ЕЕ = Е. Эти свойства означают, что ортогональные матрицы образуют группу. 4. Определитель ортогональной матрицы равен ±1. Действительно, det РРТ = (det РJ = det? = 1, откуда detP = = ±1. Ортогональные матрицы разбиваются на два класса — соб- собственно ортогональные с определителем 1, и несобственно ортого- ортогональные с определителем —1. В дальнейшем мы увидим различие в геометрическом смысле собственно и несобственно ортогональных матриц. Среди матриц с комплексными элементами существенную роль играют так называемые унитарные матрицы. Матрица А*, комп- комплексно сопряженная с транспонированной к А, называется сопря- сопряженной с А, т. е. А* — Лт, где черточка наверху — зна:к комплекс- комплексного сопряжения. Матрица Q называется унитарной, если обрат- обратная к ней совпадает с сопряженной. Записав равенство QQ* = Е в развернутой форме, получим Z^7:=1. 1 = 1, .... Л, / — 1 Строка из комплексных чисел называется нормированной, если сумма квадратов модулей ее элементов равна 1. Две комплексные строки называются ортогональными, если сумма произведении элементов одной строки на числа, сопряженные с соответствую- соответствующими элементами второй строки, равна 0. Таким образом, равенство QQ* = Е обозначает, что строки матрицы Q нормированны и попарно ортогональны. Равносильное равенство Q*Q = Е дает, что столбцы матрицы Q нормированны и попарно ортогональны. • Отметим свойства унитарных матриц, аналогичные свойствам ортогональных матриц.
§ Л ХАРАКТЕРИСТИЧЕСКИЙ ПОЛИНОМ МАТРИЦЫ 141 1. Унитарность Q влечет унитарность Q~K Действительно, Q-1 = Q*, а унитарность Q* следует из равен- равенства Q*Q == Е. 2. Произведение унитарных матриц есть унитарная матрица. Действительно, Q1Q2 (Q1Q2)* = Q1Q2Q2Q* = Q1Q1 *=• Е. 3. Единичная матрица унитарна. Действительно, ЕЕ* = ЕЕ — ?. Эти свойства означают, что унитарные матрицы образуют группу. 4. Модуль определителя унитарной матрицы равен 1. Действительно, det QQ* = det Q det Q* = det Q det Q = | det Q12= § 7. Характеристический полином матрицы 1. Определение характеристического полинома. Сопоставим квадратной матрице с элементами из поля К матрицу tE-—А, эле- элементы которой принадлежат кольцу полиномов K[t]. Матрица tE — А называется характеристической матрицей для А, а ее опре- определитель f(t) = det{tE — А) называется характеристическим поли- полиномом матрицы А. Если С a\i ... а1п ап а12 ... а2п «ш апп . то f(t) = P — bxt"-1 + b2t"r2 + ... ¦+• (—Ц#» с коэффициентами из К. Вычислим bi и Ьп. Заметим, что Ъ\ есть коэффициент гри t"~l в определителе — а21 t — — агп — ап1 — а„2 ..: t — апп Буква t входит, причем в первой степени, только в диагональные элементы матрицы tE — А. Следовательно, каждое слагаемое опре- определителя, содержащее t"-1, имеет в числе сомножителей по край- крайней мере п — 1 диагональных элементов, но тогда и последний сомножитель тоже диагональный. Таким образом, коэффициент прн t"~l равен коэффициенту при tn~l в полиноме (t — an)X Х(< — «гг) ... (t — ann), т. е. равен — (ац + «22+ ... -\-аПп). Таким образом, 6i = an + «22+ ••• -{-апп. Это выражение имеет специальное название — след матрицы А и обозначается Sp А или Тт А (от Spur — нем., Trace — англ.). Для подсчета свободного члена положим t = 0. Получим (—!)"&„ = det(—Л) = (—l)"detA откуда 6« = detA- Остальные коэффициенты тоже можно подсчитать, но это не- несколько сложнее.
142 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ [ГЛ IV 2. Теорема Кэли — Гамильтона. Теорема 1. При подстановке матрицы в ее характеристиче- характеристический полином получается нулевая матрица. (Иными словами, матрица является корнем своего характери- характеристического полинома.) Доказательство. Обозначим через В матрицу, союзную с tE — А. Ее элементы принадлежат кольцу K[t] и являются поли- полиномами от t не выше (п—1)-й степени, ибо они равны, с точ- точностью до знаков, минорам (п—1)-го порядка матрицы tE— А, элементы которой содержат t не выше чем в первой степени. Можно записать В = В^"-1 + В21"^ + ... + Bn-it + Вп, где Ви В2 Вп-и Вп — матрицы над k. По свойству взаимной матрицы имеет место равенство B(tE — А)= uet(tE—А)Е, которое можно записать подробно По определениям равенства матриц и равенства полиномов, мы вправе приравнять коэффициенты при одинаковых степенях на всех позициях, что равносильно приравниванию матричных коэф- коэффициентов при степенях t. Получаем цепочку равенств: ВХ=Е, В2 — В1А = — biE, -ВпА = (-1)пЬпЕ. Умножим справа первое равенство на А", второе на Ап~1, третье на А"-2, ..., (п— 1)-е на А и сложим с последним. Слева все сла- слагаемые взаимно уничтожатся и останется нулевая матрица. Справа получим Aa — biA»-l + biAn-*+ ... +(—l)"-1^-^ + (—\)пЬпЕ. Итак, f(A)= Л" - М"-1 + М"-2 + ••• 1 что и требовалось доказать.
ГЛАВА V КВАДРАТИЧНЫЕ ФОРМЫ § 1. Преобразование квадратичной формы к каноническому виду линейной подстановкой букв 1. Определение и матричная запись квадратичной формы. Квадратичной формой называется однородный многочлен второй степени от нескольких букв. Обозначим эти буквы через х\, х2, ... .... хп. В общем виде квадратичная форма может быть записана так: /(*„ х2, .... хп) = спх\ + спх^+ ... +сХпхухп + Коэффициенты в этой записи образуют треугольную матрицу. Од- Однако эта форма записи неудобна. Если в поле (или кольце), из которого берутся коэффициенты формы, выполнимо деление на 2, то удобнее каждый недиагональный коэффициент разделить на 2 и записать два раза, при произведениях букв в обоих порядках. Запись примет вид / (*1> *2 Хп) = *!!*? + «.2*1*2 + • • • + аыХ,Хп + + «22*2 + • • • + «2«*2*Л + B,Vi + ап2хпх2 + ... + аппх\, причем ац = ац. Такую запись квадратичной формы назовем пра- правильной. Матрица А—\ . . .2. ,".' .2" I называется матрицей квадра- V Чп\ «л2 • • • Чпп / тичной формы. Она симметрична, т. е. А1 = А. Квадратичная форма может быть записана более компактно, если использовать матричные обозначения. Вынося х\ из первой
144 КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. V строки записи, х3 из второй, ..., х„ из последней, получим Х2, .... Хп) = ХХ (ОцДС, + «12*2 + . • + Х.г @121*1 + «22*2 + . . Xi '°П а12 ••• О|Л \[ Х2 (v v у \\ «21 Я22 •¦• «2Л ¦ \X[, x2, ..., дс„;| 0-П2 • • • Япл . Обозначив столбец (хи х2, ..., xn)r через Х, получим 2. Линейное преобразование переменных в квадратичной форме. Пусть в квадратичной форме f(X)= XTAX делается линейное пре- преобразование переменных с невырожденной матрицей: X = BY. Тогда квадратичная форма преобразуется в квадратичную форму от букв (/и (/2, .... Уп (компонент столбца У), именно, в fi(Y) = = rBTABY=Yr(BrAB)Y. Покажем, что форма /,(У) автомати- автоматически полупилась правильно записанной. Для этого достаточно убедиться в том, что матрица ВХАВ симметрична, что легко про- проверяется: (ВГАВУ = ВМТВТТ = В^АВ. 3. Преобразование квадратичной формы к каноническому виду. Теорема 1. Для любой квадратичной формы с веществен- вещественными коэффициентами можно сделать линейное преобразование переменных с невырожденной вещественной матрицей так, чтобы матрица преобразованной формы имела диагональный вид, т. е. чтобы преобразованная форма состояла только из квадратов пе- переменных с некоторыми коэффициентами. Говорят, что квадратичная форма имеет канонический вид, если ее матрица диагональна. Предпошлем доказательству этой теоремы две леммы о вспо- вспомогательных преобразованиях. Лемма 1. Если коэффициент ап при квадрате х\ первой пе- переменной равен нулю, но хотя бы один квадрат входит с ненуле- ненулевым коэффициентом, то можно сделать линейное преобразование с невырожденной матрицей, после которого коэффициент при ква- квадрате первой переменной станет отличным от нуля.
§ I) ЛИНЕЙНОЕ ПРЕОБРАЗОВАНИЕ К КАНОНИЧЕСКОМУ ВИДУ 145 Действительно, пусть akk Ф 0. Сделаем преобразование пере- переменных: Х\ = Цк, Х2 = У2 Xk — tji, ..., Хп = уп, т. е. примем исходные переменные за новые, изменив их нумера- нумерацию. Ясно, что это преобразование дает требуемый эффект^ Лемма 2. Если все коэффициенты при квадратах равны нулю, но хотя бы один коэффициент формы отличен от нуля, то можно сделать невырожденное линейное преобразование переменных так, что после него коэффициент при квадрате одной из новых переменных окажется отличным от нуля. Действительно, пусть ац = 022 = ¦•¦ —апп = 0, но а^^О. Сделаем преобразование ХХ = У , Xi = yi-\-yk, .... Xk=yk, .... Хп = Уп. Это невырожденное преобразование, так как оно, очевидно, обратимо. Подсчитаем коэффициент при у\. Переменная yk вхо- входит только в xi и Xk, поэтому у\ может появиться только из чле- членов aux2t, akkx\ и 2uikXiXk квадратичной формы. Первые два равны нулю. Третий преобразуется в 2aik(yi + У^)ук, так что коэффи- коэффициент при у\ равен 2а1кф§. Сделав еще преобразование первого типа, добьемся того, чтобы коэффициент в позиции A, 1) стал отличен от нуля. Доказательство теоремы. Применим метод математи- математической индукции по числу п переменных. При п = 1 форма равна апх\, так что доказывать нечего. Допустим, что для формы от числа переменных, меньшего чем п, теорема доказана. Пусть /(*„ *„..., хп) = апх\ +aV2x,x2 + ... +cln*1xll + + а2{х2х{ + апх\ + • • • + а2пх2хп + Если все коэффициенты равны нулю, то форма равна нулю, и доказывать нечего. Пусть хотя бы один коэффициент отличен от нуля. Без нарушения общности можно считать, что ацт^О, ибо если ац = 0, то можно сделать вспомогательные преобразования, после которых коэффициент в позиции A,1) станет отличным от нуля. Соединим вместе все слагаемые, содержащие хи и вынесем из них а,, за скобку. Получим -\-a2ix 2ix\
146 КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ V Выделим теперь в первой скобке квадрат линейной формы. По- Получим -gf-*a + ••• +ff*«J + <p(*2 *„). Здесь через ф(лг2, ..., хп) обозначена квадратичная форма от «г, .... хп. Теперь сделаем преобразование: g'n Л) -) Ло т~ • • • ~\ Х„ = Hi, или, что то же самое, Это невырожденное преобразование, после которого форма пре- превратится в any\ + y(yv пл, ..., уп). Форма ц(у2, у3 уп) за- зависит от п—1 переменной. В силу индуктивного предположения существует невырожденное линейное преобразование #2 = 1 ft А у | I U у после которого получится: Добавим к преобразованию еще одну строку: Уп = Ьп222+ ... +bnnzn. Это преобразование, очевидно, невырожденно, и после его при- применения форма
§ 1] ЛИНЕЙНОЕ ПРЕОБРАЗОВАНИЕ К КАНОНИЧЕСКОМУ ВИДУ 147 примет канонический вид: Несколько невырожденных линейных преобразований можно заменить одним невырожденным, ибо композиции преобразований соответствует умножение матриц, а произведение невырожденных матриц невырожденно. Теорема доказана. Заметим, что хотя мы теорему сформулировали для веществен- вещественных квадратичных форм и вещественных преобразований —¦ именно этот случай наиболее интересен для приложений— тео- теорема остается верной для квадратичных форм с коэффициентами из любого поля К, характеристика которого не равна 2, при пре- преобразованиях над тем же полем К. Рассуждение посредством метода математической индукции есть, по существу, краткая запись единообразного процесса, со- состоящего в повторении индуктивного перехода. Поэтому данное доказательство дает и способ преобразования квадратичной формы к каноническому виду. Рассмотрим один пример. / (*,, *v x3, х4) = х\ + х{х2 - Х[х3 + 2*rv4 + + х2х{+ х\ +Заг2аг4 — + 2*4*j + Зх4х2 — 2хАх3 + 4х* = = х\ + 2ххх2 — 2лг,лг3 + 4х,лг4 + х\ + 6а-2ж4 + х\ — 4%v4 + 4лг| = =(дс, + х2 - х3 + 2^4J - (дса - Положим xi + Х2 — ^з + 2*4 = У и Х2 == Уъ т. е. сделаем подстановку ¦Уг + Уз- 2у4. У2, У» У*
148 КВАДРАТИЧНЫЕ ФОРМЫ ГГЛ. V Придем к форме */? + <р(.'/2> У г' У*)> где ф(#2, уг, yi) Здесь нужно вспомогательное преобразование: У\=*и Уч = 22. Уг = z2 + 23) «/4=2,, после которого LZ2 2? Lj-2 2 3 <С3<:4 2 ** Теперь делается замена 22 —- «2 2 2 ' 23 = М3, 24 = Ы4, после которой придем к равенству Ф (У2> Уу У\) = 2ы2 + 4>i («з» ил)' где Ф, (и3. и4) = - | «з - мз«4 ~ Y и* = ~ Т ("з + U*J' Очередная замена: «2 = «2. «3 = Щ ~ V4) «4 = . которая дает ф, (м3, м4) — —я"^- Итак! / = У\ + Ф («У2, У3. У4) = 2? + 2г2 + ^з + 2z?*e , -= и? + 2и| + Ф] (ма> и4) = of + 2»! - j v%
«II линейное преобразование к каноническому виду Результирующая подстановка: 1 — 4- — X X 1 О О 1 О 1 о о —3 о В этом примере перед вторым шагом мы «споткнулись» о вспомогательное преобразование. 4. Ранг квадратичной формы. В терминах матриц теорема о при- приведении квадратичной формы к каноническому виду означает, что для данной симметричной матрицы А существует такая невырож- невырожденная матрица В, что ВТАВ — D, где D — диагональная матрица. Обозначив С = В-1, получим А = CTDC. Из доказательства теоремы ясно, что приведение квадратич- квадратичной формы к каноническому виду может осуществляться беско- бесконечным множеством способов — например, можно сделать произ- произвольную линейную подстановку, а затем приступить к «выделе- «выделению квадратов». Поэтому матрицы В a D определяются неодно- неоднозначно. Однако число ненулевых элементов матрицы D однозначно определено, именно, оно равно рангу матрицы А. Этот ранг назы- называется рангом квадратичной формы. Для доказательства установим сначала справедливость сле- следующих предложений. Предложение 2. Ранг произведения двух матриц (не обя- обязательно квадратных). не превосходит ранга каждого из сомно- сомножителей. . Доказательство. Столбцы матрицы АВ являются линей- ными комбинациями столбцов матрицы А. Поэтому ранг АВ, рав- равный максимальному числу линейно, независимых столбцов, не пре- превосходит ранга А. С другой стороны, строки АВ являются линей- линейными комбинациями строк В, поэтому ранг АВ не превосходит ранга В. Предложение 3. Если один из сомножителей есть квадрат- квадратная невырожденная матрица, то ранг произведения равен рангу другого сомножителя. Действительно, пусть С — АВ к В — невырожденная квадрат- квадратная матрица. Тогда ранг С не превосходит ранга А. Но А = СВ~1, так что ранг А не превосходит ранга С. Следовательно, эти
150 КВАДРАТИЧНЫЕ ФОРМЫ 1ГЛ. V ранги равны. Аналогичное рассуждение применимо к случаю, если левый сомножитель есть квадратная . невырожденная матрица. Из предложения 3 непосредственно следует: если F = ВАС, где В и С — невырожденные квадратные матрицы, то ранги матриц F и А совпадают. Применяя это к матричному равенству D = СГАС, где С — невырожденная квадратная матрица, получим, что ранги D и А совпадают. Но ранг диагональной матрицы D, очевидно, равен числу ее ненулевых элементов. Итак, число ненулевых коэф- коэффициентов после приведения квадратичной формы к канониче- каноническому виду не зависит от способа приведения и равен рангу ма- матрицы квадратичной формы. 5. Преобразование квадратичной формы к каноническому виду посредством унитреугольного преобразования переменных. Вернемся еще раз к доказательству теоремы о приведении квадратичной формы к каноническому виду. Если на каждом шагу индуктивного рассуждения «выделение квадрата» происходит без вспомогатель- вспомогательного преобразования, то на каждом шагу матрица преобразования имеет вид правой унитреугольной матрицы. Так как произведение правых унитреугольных матриц есть, очевидно, правая унитре- угольная матрица, результирующая матрицы преобразования будет тоже правой унитреугольной. Теорема 4. Для того чтобы квадратичная форма с невы-. рожденной матрицей могла быть преобразована к каноническому виду преобразованием переменных с верхней унитреугольной ма- матрицей, необходимо и достаточно, чтобы определители всех левых угловых субматриц ее матрицы были отличны от нуля. Доказательству этой теоремы предпошлем другую теорему, представляющую самостоятельный интерес. Теорема 5. Для того чтобы квадратная невырожденная ма- матрица представлялась в виде произведения левой унитреугольной, диагональной и правой унитреугольной, необходимо и достаточно, чтобы определители всех левых угловых субматриц были отличны от нуля. Такое представление однозначно. Доказательство. Необходимость. Пусть f «11 «12 •• alk ¦¦¦ "in a, °21 •¦¦ a2k ••¦ "in akl ¦¦¦ akk ¦¦¦ akn ank ¦¦¦ (aH U12 •• alk\ <*U ail •¦¦ °2fc ], e*i at* ••• akJ
«I] ЛИНЕЙНОЕ ПРЕОБРАЗОВАНИЕ К КАНОНИЧЕСКОМУ ВИДУ 151 fак что А =¦ Ап. Пусть, далее, 10 ... 0 ... О 62, 1 ... О ... О "k\ ... 1 ... О ... I R = 1 с О 1 а clk... су ^оь • • • ?- In 0 0 ... 1 ... с kn 'hi № '\ С О 1 12 - •' ^0 о ... 1 00 ... 0 ... 1 b d2, ..., dk, .... dn), Dk = diag(d,, d2, .... dk) и A = LDR. Тогда det A = detL detDdet/? = d\d2 ... dn и, так А как det А Ф 0, должно быть dj Легко видеть, что , (=1,2, ..., п. откуда следует, что det Ак = det ?)« = did2 ... dk Ф 0. Достаточность. Применим метод математической индук- индукции по субматрицам Аи А2, ..., Ak, ..., Лп = А. При А= 1 утверждение теоремы тривиально. Пусть оно верно для ЛА_Ь и в этом предположении докажем его для Ак. Разобьем матрицу Ah и искомые LA, /?*, Dh на клетки, выделив блок Аь-и так что «.-(?- о- Здесь ы = (flit, ..., aft_i, ft)T, c=(afti, ..., a*,*_i), jc — неизвест- неизвестная строка в матрице L*, у — неизвестный столбец в матрице /?*, символом 0 обозначены нулевые строки и столбцы. Пусть Ak = LkDkRh. Выполняя умножение по правилу умно- умножения блочных матриц, получим В силу индуктивного предположения L*_i, Dk~\ и /?*_! можно счи- считать известными, обратимыми и определенными однозначно. Тогда
152 КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. V однозначно определяются у, х и dk, именно, y = DZ-\Lk-iu, х = =vRk-iDk-iuclk=akk—xDk_ly.OcTaeTcnубедиться в том,что <1кфО, что нужно для обратимости Dk- Но det Ак = det Dk = det D*_, ¦ d*,. det A. откуда rft=delD/t_| #0- Теорема 5 доказана полностью. Теперь легко доказать теорему 4. Пусть А — невырожденная матрица квадратичной формы, допускающей унитреугольное пре- преобразование к канонической форме. Тогда А = RrDR, где R — пра- правая унитреугольная матрица, Rr— левая унитреугольная. В силу теоремы 5, в части необходимости все определители верхних угло- угловых субматриц отличны от нуля. Обратно, если все такие определители отлнчны от нуля, то A = LDR (в прежних обозначениях). Но А симметрична, так что А = Ат = R'DL1. В силу однозначности разложения должно быть LT = R, т. е. А = RJDR, что обозначает, что квадратичная форма приводится к каноническому виду посредством линейного преоб- преобразования переменных с правой унитреугольной матрицей R. § 2. Закон инерции квадратичных форм 3 этом и следующем параграфах речь будет идти только о квадратичных формах с вещественными коэффициентами и о ли- линейных подстановках переменных с вещественными коэффициен- коэффициентами. 1. Положительно определенные квадратичные формы. Квадра- Квадратичная форма называется положительно определенной, если все ее значения при вещественных значениях переменных, не равных одновременно нулю, положительны. Примером положительно опре- определенной формы от переменных Х[, Хг, ¦¦-, хп может служить форма х\ + х\ + ... + х\. Квадратичная форма называется отрицательно определенной, если все ее значения отрицательны, за исключением нулевого зна- значения при нулевых значениях переменных. Квадратичная форма называется положительно (отрицатель- (отрицательно) полуопределенной, если она не принимает отрицательных (положительных) значений. Так форма х\ — 2ххх2 + х\ = (ж, — дс2J положительно полу- полуопределена. Форма х] + х\ как форма от двух переменных х\ и х2 положительно определена, но как форма от трех переменных х\, дг2, Хг лишь полуопределена. Квадратичные формы, принимающие, как положительные, так и отрицательные значения, называются неопределенными.
$ 2] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ 153 Для п = 1 ненулевая квадратичная форма ах2 либо положи- положительно определена (при а>0), либо отрицательно определена (при а <СО). Неопределенные формы появляются, начиная с п = 2. Теорема 1. Для того чтобы квадратичная форма была по- положительно определенной, необходимо и достаточно, чтобы после приведения ее к каноническому виду все коэффициенты при ква- квадратах новых переменных были положительны. Доказательство. Пусть форма f(xu x2, ..., х„) преобра- преобразуется в каноническую aiy2l + а2у\ ~Ь ••• + апУ2п посредством ли- линейной подстановки с невырожденной матрицей: bl2y2+ ... +bUlyn, Ь22у2 + •¦• + Ь2пуп, хп = bniy} + Ьп2у2 + • • • + Ьппуп. Эта подстановка обратима: yi = cnxi + c12x2+ ... +сыхп, У2 = СПХ\ ~Г С22Х2 "Г • • • I C1nxni #n = CnlXl + Cn2X2+ ... +СппХп. Если а\ > 0, ot2 > 0, ..., ап > 0, то неравенство а{у] -\- а2у\ + -+-••• ~\~апУ2п < 0 невозможно, а равенствоаху\-{-а2у\-\- ... -\-апус^=0 возможно только при t/i = 2/2 = ••• = Уп — 0 и, следовательно, при х1 = х2= ... =л:„ = 0. Если а, ^ 0, то, взяв yj = O при \Ф1 и yi=], мы можем найти соответствующие значения х\, ..., х'п переменных л'ь х2, ... ,.., хп, причем они не будут равны нулю одновременно. Тогда f(x], x\, .... дг;) = аг<0. Теорема доказана как в части достаточности, так и в части не- необходимости условия. Отметим в качестве следствия, что если при некотором преоб- преобразовании формы к каноническому виду все коэффициенты при квадратах новых переменных положительны, то и при всяком дру- другом преобразовании коэффициенты канонической формы будут все положительны. 2. Критерий Сильвестра положительности квадратичной формы. Теорема 2. Для того чтобы квадратичная форма f (*р х2, ..., ха) = апх\ + аих{х2 + ... + а1ахххп + + «21*2*1 + а22»1 + •¦• + +
154 КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. V была положительно определена, необходимо и достаточно выпол- выполнение условий а, и1п До 1 2 л а Доказательство. Необходимость. Пусть Ддгь x2t... ..., А'„) положительно определена. Тогда существует подстановка X = BY с невырожденной матрицей В, преобразующая форму в ? + «2^2 + • • • + аХ ПРИ «1 > 0, а2 > О а„ > 0. Тогда а2 и det ВТАВ = а,а2 ... а„ > О. Но det ВТЛВ = det BT det /I det S = = det Л (det ВJ. Следовательно, det A = А, > 0. Теперь рассмотрим часть формы f{xu хг хп) Jffc) == /(xt xk. 0 0) = с2, Эта форма, рассматриваемая как форма от к\ Xk, положи- положительно определена, ибо ее значения при не равных одновременно нулю jci, .... хк суть значения формы f{xu .... хк, .... х„) при не равных одновременно нулю значениях для Xi, ..., Хц, .... Хп. Поэтому «•¦ !=1, 2, ..., П — Достаточность. Пусть Д« >¦ 0 при k = 1, 2, ..., п. Тогда форма f(xu х% ..., хп) может быть преобразована к канониче- каноническому виду посредством преобразования переменных с верхней унитреугольной матрицей и, как мы видели выше, каноническая форма будет равна Все коэффициенты при квадратах новых переменных положи- положительны, и, следовательно, исходная форма положительно опре- определена. Итак, для выяснения положительной определенности квадра- квадратичной формы имеются два критерия. Естественно поставить во- вопрос о том, который из них лучше. Это зависит от ситуации.
§ 2] ЗАКОН ИНЕРЦИИ КВАДРАТИЧНЫХ ФОРМ 155 Если квадратичная форма задана численно, то для приведения ее к каноническому виду требуется приблизительно" столько же арифметических операций, как при вычислении одного определи- определителя. Так что в этом случае первый критерий проще. Для теоре- теоретических же исследований лучше критерий Сильвестра, так как он дается простыми формулами. 3. Закон инерции квадратичных форм. Теорема 3. Если квадратичная форма преобразована двумя способами к каноническому виду, то число квадратов новых пере- переменных с положительными коэффициентами будет одинаково, так же как число квадратов новых переменных с отрицательными коэффициентами. Иными словами, число положительных и отри- отрицательных коэффициентов не зависит от способа приведения фор- формы к каноническому виду. Доказательство. Пусть дана форма, приведенная к кано- каноническому виду двумя способами: /(*,, х2, ..., хп) = а^-± ... +ару12 ^ Считаем, что все а,- и 0, положительны. Пусть исходные перемен- переменные связаны с новыми посредством следующих невырожденных преобразований: +¦•••+ bnnyn; yn = /„!•«, + ...+ fnnxn; - ... +CinZn, Zi=gnXi+ ...+ginXn, xn = cntzi + ... + cnnzn; zn = ?„,*, + ... + ?„„.*„. Допустим, что число положительных коэффициентов не одина- одинаково. Будем считать, для определенности, что р < s. Положим ух = 0, ..., t/p = 0, zs+i = 0, ..., zn = 0. Все у,- и г,- являются ли- линейными формами от х\, ..., хп. Таким образом, написанная со- совокупность равенств есть система линейных однородных уравне- уравнений относительно хи х?, ..., хп. Число неизвестных равно п, число уравнений равно р + п — s < п. Поэтому система имеет нетриви- нетривиальные решения. Пусть х], .... х*п — одно из них. Соответствую- Соответствующие значения для уи ..., уп обозначим через у], ..., у'п. Заме- Заметим, что у\ — ... — у*р — 0. Соответствующие значения для ги ..., гп обозначим через z\, ..., z*. Эти значения не равны одновременно нулю (иначе равнялись бы нулю х\, ..., ж*), но z*+1 = 0, ..., z] = •=0. Поэтому среди чисел z\, ..., z* имеются отличные от нуля.
156 КВАДРАТИЧНЫЕ. ФОРМЫ [ГЛ. V Из представления f(xlt х2, ..., xn) = aly'f + ... + <у/? — - ар+1^+1 - ... - %+яУ2„+я имеем: f« о -= - v^i - • • • - v a# < о. Из другого представления: Последнее неравенство строгое, ибо среди г\ г* имеются отличные От нуля. Мы пришли к противоречию, так что предпо- предположение о различии числа положительных коэффициентов неверно. Для установления равенства числа отрицательных коэффи- коэффициентов достаточно перейти к форме —f{xi х„) и ее канони- каноническим представлениям - / (*,. • • • • *„) = - «,tf ~ • • • - и применить уже доказанное утверждение о равенстве положитель- положительных коэффициентов. Теорема доказана полностью. Заметим еще, что если Ai = Яц . -. -s „ a2l u22 0, .... Ьп = то можно дать формулу для числа отрицательных коэффициентов в канонической форме. Именно, оно равно числу перемен знаков в ряду чисел 1 = До, Ai, A2 А«. Действительно, коэффициенты в канонической форме, получаю- получающейся при преобразовании с правой унитреугольной матрицей, равны Ai А2 Дз Ад До • л, • Д, • ¦••¦• Д„_! ' так что число отрицательных среди них равно указанному выше числу перемен знаков. § 3. Ортогональное преобразование квадратичной формы к каноническому виду 1. Собственные значения и собственные векторы матрицы. Пусть Л —квадратная матрица с элементами, являющимися комп- комплексными (в частности, вещественными) числами. Ненулевой стол- столбец X называется собственным вектором матрицы А, если имеет место равенство АХ = XX при некотором комплексном (возможно, вещественном) К, называемом собственным значением, матрицы А.
S3] ОРТОГОНАЛЬНОЕ ПРЕОБРАЗОВАНИЕ К КАНОНИЧЕСКОМУ ВИДУ 157 Теорема 1. Для любой квадратной матрицы с комплексными элементами существует по крайней мере один собственный вектор с комплексными компонентами. Доказательство. Пусть in «2 2 '¦¦ л \an\ an2 ¦¦¦ ann\ и пусть АХ = XX. Это значит, что Х = anxl + al2x2 In п 2rt n Ллг, Лдс2 приравнивание компонент дает или an) Xi — а12х2 — . "t" (^ а22/ Х2 • . — alnxn = О, • О2ПХП = О, — anlxi — ап2х2 — (А. — апп) хп = 0. (*) -Q21 п 1 я — Й12 ~a22 — ct ... ... Я °2n — 0 пп Это однородная система линейных уравнений относительно хи А-2, ..., хп, причем нас интересуют ненулевые решения этой си- системы. Для существования таких решений необходимо и доста- достаточно, чтобы определитель матрицы коэффициентов системы был равен нулю: = 0. В матричной записи det(A,? — Л) = 0, т. е. Я, должно быть корнем .характеристического полинома det(*? — A) = tn-\- ... матрицы Л. В силу алгебраической замкнутости поля .Cj комплексных чисел характеристический полином имеет корни, и каждый из них явля- является собственным значением для некоторого собственного вектора, компоненты которого находятся из линейной однородной системы. Заметим еще, что собственные значения, т. е. корни характе- характеристического полинома, часто называют характеристическими чис- числами матрицы.
158 КВАДРАТИЧНЫЕ ФОРМЫ ,'ГЛ. V 2. Собственные значения вещественной симметричной матрицы. Теорема 2. Все собственные значения вещественной симме- симметричной матрицы вещественны. Доказательство. Пусть А — вещественная симметричная матрица и X — некоторый ее собственный вектор с комплексными компонентами, так что АХ = КХ при некотором К. Подсчитаем двумя способами число а = ХТАХ (черточка наверху обозначает, как обычно, комплексное сопряжение). Это действительно число, ибо оно_ есть произведение строки Хт на столбец АХ. Имеем: а — = ХТАХ. Но (а)г = а, так как число а, рассматриваемое как матри- матрица первого порядка, при транспонировании не изменяется. Поэтому а = (X'AXf =~ХТЛГХ'г = X1 АХ = а. Итак, а = а, т. е. а — число вещественное. С другой стороны, а = ХТАХ = XrXX = X(xiXi + ... ... + xnxn) = X(\xi\2 + ... +|*«|2)- Ввиду того, что ХфО, jjfi |2 -f- -¦¦ +к«12>0иА= а есть число ве- I Л1 I Т ¦ • • Т 1 л-п I щес г венное. Теорема доказана. Хочется отметить нетривиальность содержания доказанной тео- теоремы. Мы еще не располагаем критериями вещественности корней полинома с вещественными коэффициентами при п > 2. В даль- дальнейшем мы увидим, что такие критерии не просты. Тем не менее мы получили сейчас широкий класс полиномов, все корни которых вещественны — это характеристические полиномы вещественных симметричных матриц. Даже при п = 2 применение общеизвест- общеизвестного критерия неотрицательности дискриминанта требует некото- некоторых преобразований. Действительно, пусть п = 2,Л = Г? Л; тогда det(?E — A)=t2 — (а + c)t + ас — b2, и дискриминант D ра- равен (а + сJ — А{ас — Ь2) = (а — сJ + 4Ь2^0. Из вещественности собственных значений вещественной сим- симметричной матрицы следует, что компоненты собственных векто- векторов можно брать вещественными. Действительно, они определя- определяются из линейной однородной системы уравнений с вещественными коэффициентами. Ясно, что если X есть собственный вектор ма- матрицы А, то сХ при любом с ф 0 будет собственным вектором, при- принадлежащим тому же собственному значению. Действительно, если АХ = XX, то А(сХ) = ХсХ. Поэтому собственные векторы для ве- вещественной симметричной матрицы всегда можно выбирать норми- нормированными. Действительно, если X —какой-либо собственный век- вектор и х2 + х\ + ... + х\ = г2, то столбец —f X останется собствен- собственным вектором и будет нормирован. 3. Построение ортогональных матриц. Напомним, что матрица называется ортогональной, если ее столбцы нормированы и по« парно ортогональны.
- f 3] ОРТОГОНАЛЬНОЕ ПРЕОБРАЗОВАНИЕ К КАНОНИЧЕСКОМУ ВИДУ 159 Лемма. Пусть Хи Х2, ..., Хк — вещественные нормирован- нормированные попарно ортогональные столбцы длины п, и пусть k < п. Тогда существует нормированный столбец Xk+i, ортогональный столбцам Хи Х2, .... Xk- Доказательство. Пусть Х,=(лги, х21, ..., xni)T, Х2 == ("^ 12> -^221 • • • > *nW » Xk — (хIk' X2k> • • • > xnk) И X/e+l — (Z\, Z2, • . ., Zn) . Запишем требования ортогональности и нормированности в виде уравнений. Придем к системе: xnzi + xnz2 + ... + xnXzn = О, ДГ122, + X22Z2 + . . . + Xn2Zn = О, = 0. Первые k уравнений образуют линейную однородную систему, при- причем число уравнений k меньше числа неизвестных п. Поэтому си- система имеет нетривиальные решения. Пусть z\, г*, ..., г* — одно из них и г2 = г*2 + г*2 + ... + г*2. Тогда числа — г*, — 2*, .... — г * будут удовлетворять всем уравнениям системы, т. е. дадут реше- решение задачи. Заметим, что условие k <Сп здесь существенно. При k = л столбцы составляют ортогональную матрицу, она невырожденна, и система для определения Хк+Х окажется несовместной, так что более чем п попарно ортогональных нормированных столбцов не может существовать. Отметим следующие следствия: Любую матрицу, состоящую из попарно ортогональных нор- нормированных столбцов, можно дополнить до ортогональной ма- матрицы. Действительно, столбцов в такой матрице не может быть больше п. Если их п, то матрица ортогональна. Если же их мень- меньше п, то можно присоединять новые столбцы до тех пор, пока не придем к ортогональной матрице. В частности, любой нормированный столбец может быть при- принят за первый столбец ортогональной матрицы. Пример. Вложить столбец A/3, 2/3, —2/3)т в ортогональ- ортогональную матрицу. Этот столбец нормирован и к нему нужно пристроить еще два нормированных столбца, ортогональных между собой и
160 КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. V ортогональных данному. Присоединяем их по одному: Можно взять zx = 0, 22 = г3 = 1/л/2- Далее, 1 V2 з 2з Т2з — u» Из первых двух уравнений находим г2 = —23, г\ == 4г3. Из усло- условия нормированности 16г| + г|4-; Итак, одна из искомых матриц есть 1 ;= 1, откуда г, = 3-V2 -— 3 2 3 2 0 1 V2 1 Зд/2 _ 1 Зд/2 1 л/2 Зд/2 При выборе второго столбца имелся довольно широкий произ- произвол, третий определен с точностью до множителя ±1. 4. Ортогональное преобразование квадратичной формы к кано- каноническому виду. Теорема 3. Вещественная квадратичная форма может быть приведена к каноническому виду посредством преобразования пе- переменных с ортогональной матрицей. Доказательство. Применим метод математической ин- индукции по числу п переменных. При п = 1 нечего доказывать, так что база индукции тривиальна. Допустим, что теорема уже дока- доказана для форм от л— 1 переменных. Пусть f(xu х2, ..., хп)—ХтАХ, где X = (хи х2, .... хп)т, (ап ••• аы\ Л=1 I— вещественная симметричная матрица. Пусть \а„, ... а__/ Лп\ Xi=(pi\, Р21. •••. Рп\) — нормированный собственный вектор ма- матрицы А, соответствующий собственному значению А,ь Примем Xi за первый столбец ортогональной матрицы: Р — Jn2
$ 3] ОРТОГОНАЛЬНОЕ ПРЕОБРАЗОВАНИЕ К КАНОНИЧЕСКОМУ ВИДУ Покажем, что преобразование с этой матрицей «улучшает» ма- матрицу квадратичной формы. Матрица преобразованной формы есть РТАР. Имеем АР \ a ибо в первом столбце находится столбец АХ\ = K\Xi. Далее, (^12^11 + ^22^21 + • • • + Prf •¦¦+ Pn *1 о ибо столбцы матрицы Р ортогональны и нормированны. Матрица /\ ° • • ° \ РТАР симметрична, поэтому имеет вид! 22 2п I, гдеВ= ^ ' Ьп '' J /*22 ••• Ь2п \ =1 )— Ь„2 ... ьпп) Ьп2 симметричная матрица. Рассмотрим квадра- тичную форму с матрицей В. В силу индуктивного предположения найдется ортогональная матрица Q такая, что QTBQ = diag(X2, ... ..., Хп). Положим Qi = f 0 q J. Ясно, что матрица Qi ортого- ортогональна, ибо ее первый столбец нормирован и ортогонален осталь- остальным столбцам, а остальные столбцы попарно ортогональны и нормированны в силу ортогональности матрицы Q. Ясно, что Ф (о' В ) Q' = diag О" Kv- Хп) и QjPrAPQl = diag (Xp X2>... Теорема доказана, ибо PQi есть ортогональная матрица как произведение двух ортогональных. 5. Коэффициенты канонического вида квадратичной формы и столбцы преобразующей ортогональной матрицы. Пусть А—дан- А—данная квадратная матрица и С — невырожденная матрица. Матрица С~]АС называется подобной матрице А и переход от Л к С-1 АС называется преобразованием подобия посредством С. Отношение подобия симметрично, ибо А= С(С-ХАС)С-Х, и транзитивно, т. е.
162 КВАДРАТИЧНЫЕ ФОРМЫ ГГЛ. V если две матрицы подобны третьей, то они подобны. Действи- Действительно, пусть B1=Cf1/4C, и В2 = С21АС2. Тогда Покажем, что подобные матрицы имеют одинаковые характе- характеристические многочлены. Действительно, = det С-1 (tE — A)C = det C~l dd(tE — A) det С = = det(tE —A) det (С~1 С) = det (tE —А). Вернемся к ортогональному преобразованию квадратичных форм. Равенство Рт АР = diag(lu fa, •••, К) можно переписать в виде Р~ХАР = diag(^i, fa, • ••> Яп), ибо матрица Р ортогональна, так что матрица А подобна диагональной матрице diag(^i, fa, ... ..., %п)¦ Поэтому их характеристические многочлены равны. Ясно, что характеристический многочлен диагональной матрицы diag(A,b fa, ..., Хп) равен (t — %i)(t — fa) ... (t — kn). Итак, {t — ta) {t — fa) ... (t — 'kn)= det (tE — А). Тем самым мы дока- доказали, что каково бы ни было ортогональное преобразование ква- квадратичной формы к каноническому виду, коэффициенты этого ка- канонического вида равны собственным значениям матрицы квадра- квадратичной формы, причем каждое собственное значение повторяется столько раз, какова его кратность как корня характеристического полинома. Равенство РТАР = diag(A,b fa, .-., К) можно записать в виде АР — Рdiag(Xb fa, ..., Хп). Обозначив через Рь Р^, ..., Рп столб- столбцы матрицы Р, получим А(Ри Р2, ..., Рп) = (Ри Р2, .... Рп)d\ag(%i, X2, .... К), откуда (АРи АР2 ЛРЛ) = (Я,,Р,, faP2, .-., ЬпРп) и APi = XiPi, /=1, 2, ..., п. Итак, столбцы преобразующей ортогональной матрицы явля- являются собственными векторами матрицы квадратичной формы. До- Доказанные обстоятельства существенно помогают фактическому вы- вычислению коэффициентов при квадратах и элементов преобразую- преобразующей матрицы. Именно, нужно найти собственные значения и соот- соответствующие им собственные векторы. Но может получиться одна неприятность: столбцы преобразующей матрицы должны быть ортогональны, а собственные векторы априори ортогональными не обязаны быть. Оказывается, что эта неприятность возникает, только если имеются кратные собственные значения. Именно, верна следующая теорема. Теорема 4. Собственные векторы вещественной симметрич- симметричной матрицы, соответствующие различным собственным значениям, ортогональны.
$ 3] ОРТОГОНАЛЬНОЕ ПРЕОБРАЗОВАНИЕ К КАНОНИЧЕСКОМУ ВИДУ 163 Доказательство. Условие ортогональности х\у\-\-х2у2 + • • • .. . + ХпУп = О ДВУХ СТОЛбЦОВ X — (Хи Х2, ..., Хп)Т И Y = (у и 1/2, ... ..., уп)т можно записать в матричном виде двумя равносильными формулами: ХЧ = 0 или ГХ = 0. Пусть А — вещественная симметричная матрица,.Xi и Х2— ее собственные векторы, соответствующие собственным значениям Xi и %2, причем ХхфЪ2. Вычислим двумя способами число a — XjAXv С одной стороны, АХ\ = 'к\Х\, поэтому a = X1XJXV С другой сто- стороны, из АХ2 = 12Х2 следует XJA = К^С], откуда a = k2XjXv Вы- Вычитая, получим (Я, — Х2)Х]Х1 = 0, откуда ZJX1 = 0, ибо Яг^^ь Итак, столбцы Xt и Х2 ортогональны, что и требовалось доказать. 6. Одновременные преобразования двух квадратичных форм к каноническому виду. Даны две квадратичные формы f{x\,X2,... .... Хп)~ХтАХ и h(xu x2, .... Хп)— ХГВХ. Существует ли невы- невырожденное линейное преобразование переменных X — CY, приво- приводящее обе формы к каноническому виду? Оказывается, такое преобразование возможно не всегда. Од- Однако имеется один частный случай, когда такое приведение воз- возможно, важный тем, что он часто встречается на практике. Именно, верна следующая теорема. Теорема 5. Две квадратичные формы, из которых одна по- положительно определенная, можно одновременно привести к кано- каноническому виду посредством невырожденного вещественного ли- линейного преобразования переменных. Доказательство. Пусть f = XхАХ, h — Х1ВХ и форма h положительно определенная. Сделаем преобразование X = CY, "приводящее форму h к каноническому виду: С7ВС = diag(c?i, d2,... ..., dn). Так как форма h положительно определенная, все коэф- коэффициенты di положительны. Сделаем теперь преобразование К = — DZ, где D = diag(df'/2, d2~'!i, ..., rf~'/2). Это преобразование приведет форму h к чистой сумме квадратов г\ + г\ + ... + z\, так что DTCTBCD = Е. Форма f превратится в форму с матрицей D1ClACD. Преобразуем эту форму к каноническому виду ортого- ортогональным преобразованием Z — P-U. Это преобразование не изме- изменит матрицы формы zf + zl+ ... +г2п, ибо РТЕР = РТР — Е в силу ортогональности матрицы Р. Итак, результирующее преобра- преобразование X = CDPU приводит обе формы к каноническому виду, причем положительно определенная приведется к виду чистой суммы квадратов и\ + «|+ ... + и\. Теорема доказана. Остановимся еще на некоторых подробностях. Пусть М = = CDP — матрица результирующего преобразования. Тогда МТАМ = diag(^i, Х2, ..., kn), где Ки Х2, ¦¦¦, Ъп — некоторые ие- щественные числа и МТВМ = Е = diagA, 1, ..., 1). Тогда Xu t-~K2, .f..,t — Xn)
164 КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. V Пусть detB = 60. Тогда (detMJ = 6^1, так что det(^B —Л) = = bo(t — li) (t — X2) ... {t — Kn). Тем самым коэффициенты klt %2, ..., Хп оказываются равными корням полинома det(^B— А), который иногда называют характеристическим полиномом матри- матрицы А относительно матрицы В. Ясно, что этот полином лишь мно- множителем bo отличается от полинома det(/?' — В-1 А), т. е. от ха- характеристического полинома матрицы В~1А. Из равенств МтAM = diag(lu К2, •••, К) и MrBM = diag(l, 1 1) следует (МТВМ)-1МТАМ = М-1 В-1 AM = diag(A,i, X2, .... М. так что матрица В~ХА подобна диагональной матрице diag(Xb Х2,... ..., %п) и все ее собственные значения вещественны. То же отно- относится и к матрице АВ-1 = В(В-1А)В~1, которая подобна матрице В-1 А. Матрица положительно определенной квадратичной формы на- называется положительно определенной матрицей. Покажем, что матрица, обратная к положительно определенной, сама положи- положительно определенная. Действительно, если В положительно опре- определенная, то существует невырожденная матрица С такая, что В = CDC, где D — диагональная матрица из положительных чи- чисел. Тогда В'1 = С-'?»-' (С1)-1 -.CfZJ-'C,, где С1 = (СТ)-', Это значит, что квадратичная форма с матрицей В~1 приводится к ка- канонической форме с матрицей D~\ составленной из положительных чисел. Сказанное выше о матрицах В~1А и АВ-1 мы теперь можем сформулировать так: Матрица, являющаяся произведением двух вещественных сим- симметричных матриц, из которых одна положительно определенная, подобна вещественной диагональной матрице, и все ее собственные значения вещественны. Заметим, что произведение двух симметрич- симметричных матриц, вообще говоря, не симметрично. § 4. Эрмитовы формы 1. Определение эрмитовой формы. Близким аналогом теории вещественных квадратичных форм при переходе к полю комплекс- комплексных чисел является тео*рия так называемых эрмитовых форм. Эрмитовой формой называется многочлен от комплексных пере- п менных х\, х2, .... хп и сопряженных ?ь х2,.. .,хп вида X a^x^j, причем предполагается, что ац = ац. В частности, все диагональ- диагональные коэффициенты вещественны. Напомним, что матрицей С*,
§ 4] ЭРМИТОВЫ ФОРМЫ 165 сопряженной с комплексной матрицей С, называется транспониро- транспонированная матрица, в которой все элементы заменены комплексно сопряженными, так что С* = Ст. Эрмитову форму можно записать в матричных обозначениях в виде Х*АХ, где X = (xi, х% ..., ха)г, причем матрица А ее коэффициентов обладает свойством А* = А самосопряженности или эрмитовости. При линейном.преобразова- линейном.преобразовании переменных X = BY предполагается, естественно, что сопря- сопряженные преобразуются с сопряженными коэффициентами, т. е. Х = Б7, и тогда X* = Y*B*. Эрмитова форма преобразуется по формуле X*AX^Y*B*ABY. Ясно, что матрица В*АВ останется эрмитовой, ибо (В*АВ)* = В*А*В** == В*АВ. Отметим, что значения эрмитовой формы при всех комплекс- комплексных значениях переменных вещественны. Действительно, пусть X — некоторый столбец из комплексных чисел и f = Х*АХ. Тогда J = /* = Х*А*X** = Х*АХ = f, так что f вещественно. Определители эрмитовых матриц тоже вещественны. Действи- Действительно, det A = det A = det A* = det A. Заметим еще, что эрмитова форма с диагональной матрицей имеет вид d\XiXi -\~ йгХгХг + • • • + dnxnxn = d\ \ х\ \2 + d21 х212 + ... ... +dn|^«|2 с вещественными d\, d%, ..., dn. В частности, эрми- эрмитова форма с единичной матрицей есть |a:i|2 + |*2|2+ ... +|л;л|2. 2. Свойства эрмитовых форм. Эрмитовы формы обладают свойствами, аналогичными свойствам вещественных квадратичных форм. Доказательства соответствующих теорем тоже почти до- дословно повторяют аналогичные доказательства для вещественных квадратичных форм. Поэтому мы позволим себе сформулировать эти теоремы, опустив их доказательства. Теорема 1. Эрмитова форма может быть приведена к кано- каноническому виду (с диагональной матрицей) посредством преобра- преобразования переменных с невырожденной комплексной матрицей. Теорема 2. Ранг матрицы эрмитовой формы равен числу не- ненулевых коэффициентов в канонической форме. Эрмитова форма (и ее матрица) называется положительно определенной, если все ее значения положительны, кроме значе- значения при нулевых значениях переменных. Теорема 3. Для того чтобы эрмитова форма была положи- положительно определенной, необходимо и достаточно, чтобы коэффи- коэффициенты ее канонической формы были положительны. Теорема 4. Для того чтобы эрмитова форма с невырожден- невырожденной матрицей приводилась к каноническому виду преобразованием с правой унитреугольной матрицей, необходимо и достаточно, что- чтобы левые верхние диагональные миноры А], Дг An были ОТ'
166 КВАДРАТИЧНЫЕ ФОРМЫ [ГЛ. V личны от нуля. При этом коэффициенты в канонической форме равны Дь Д2/А1, ..., Д„/Д„_1. Теорема 5. Для того чтобы эрмитова форма была положи- положительно определенной, необходимо и достаточно, чтобы верхние диагональные миноры Дь Д2) ..., Д« ее матрицы были все положи- положительны. Теорема 6. Число положительных и число отрицательных коэффициентов в канонической форме не зависит от способа при- приведения к каноническому виду {закон инерции). Теорема 7. Все собственные значения эрмитовой матрицы вещественны. Теорема 8. Эрмитова форма может быть приведена к кано- каноническому виду посредством преобразования переменных с уни- унитарной матрицей. При этом коэффициенты канонической формы равны, собственным значениям матрицы формы, а столбцы преоб- преобразующей матрицы равны соответствующим собственным векторам. Теорема 9. Две эрмитовы формы, из которых одна положи- положительно определенная, можно одновременно привести к канониче- каноническому виду. Теорема 10. Собственные значения матрицы, являющейся произведением двух эрмитовых матриц, одна из которых положи- положительно определенная, все вещественны, и матрица подобна диаго- диагональной матрице, составленной из собственных значений.
ГЛАВА VI ПОЛИНОМЫ И ДРОБИ § 1. Теория делимости для полиномов от Одной буквы 1. Делимость в кольце. Пусть А— коммутативная ассоциатив- ассоциативная область целостности (т. е. кольцо без делителей нуля) с еди- единицей. Говорят, что элемент а е А делится на элемент Ъ se А, если существует такой элемент с ^ А, что а = be. Говорят также, что а — кратное для Ь, Ъ — делитель а, Ъ делит а. Из этого определе- определения ясно, что если а\ и а2 делятся на Ь, то а,\ ± а2 делится на Ь. ¦Далее, если а делится на b и Ъ делится на с, то а делится на с. -Элемент е кольца называется обратимым или единицей, если для него существует обратный е~' еД т. е. такой, что ее~' == 1. Эле- Элементы, отличающиеся обратимым множителем, называются ассо- ассоциированными. Ясно, что любой элемент делится на ассоцииро- ассоциированные элементы и па единицы. Единицы и ассоциированные эле- элементы считаются неинтересными, тривиальными делителями. Не- Необратимые элементы, не имеющие делителей кроме тривиальных, называются неразложимыми. Теория делимости для данного коль- кольца (или класса колец) заключается в выяснении характера разло- разложения любого элемента кольца в произведение неразложимых. Если такое разложение существует и однозначно, с точностью до порядка следования сомножителей и замены сомножителей на ассоциированные, то кольцо называется факториальным. Мы уже имели пример теории делимости для кольца целых чисел. В этом кольце имеются только две единицы ±1, неразложи- неразложимыми элементами являются простые числа и имеет место теорема об однозначности разложения на простые множители, т. е. кольцо ,целых чисел факториально. Другим уже известным примером факториального кольца может служить кольцо полиномов К[х) над алгебраически замкнутым полем К. В этом кольце неразло- неразложимыми элементами являются только полиномы первой степени, которые ассоциированы с линейными двучленами вида х— с. Имеет место однозначное разложение на линейные множители f(x)= ao(x — ci) (x — с2) ... (х — сп). В кольце полиномов К[х] с коэффициентами из произвольного поля К единицами являются все элементы поля К, кроме нуля. Других единиц нет, ибо если /1/2= I, f\,f2^ К[х], то степени /i 'И /2 не могут быть больше нуля, т. е. f\ и fz — константы из К. Ассоциированными являются полиномы, отличающиеся множите-
168 ПОЛИНОМЫ И ДРОБИ (ГЛ. VI лями из К. Полиномы со старшим коэффициентом 1 называются нормализованными. Ясно, что любой полином из К[х] ассоцииро- ассоциирован с нормализованным, и два нормализованных полинома ассо- ассоциированы, только если они совпадают. 2. Деление с остатком. Теорема 1 (о делении с остатком). Для данных полиномов f, g^K[x], g?=0, существуют и единственны полиномы q и г е К[х] такие, что f = gq + г и степень г меньше степени g. Теорема эта очень похожа на соответствующую теорему тео- теории делимости целых чисел. Полином q называется неполным част- частным, г — остатком от деления f на g. Доказательство. Пусть / = аохп-\- аххп~х + ••• + ««, g — boxm + Ъ\хт~х + • • • + bm, причем Ьо ф 0. Применим метод математической индукции по степени полинома f, считая g фик- фиксированным. Пусть п < т. Тогда f — g-0-\- f, так что в качестве q можно взять 0, в качестве г — сам {; оба требования будут вы- выполнены. Этот случай дает базу для индукции. Допустим теперь, что для полиномов степени, меньшей п, теорема доказана и до- докажем ее для полинома f, считая п ^ т. Воспроизведем первый шаг известного процесса деления многочленов, т. е. построим одно- одночлен -^-хп~т и составим разность ^ = f — -т— xn~mg. Полином fi имеет меньшую чем п степень, ибо при вычитании высшие члены исчезнут. В силу индуктивного предположения найдутся полиномы q\ и г такие, что fi = gq\ + г и degr < degg. Тогда f = fr хП~тё + h = т; xn-mg+g<li+r - (-g- xn~m+qi) g + r. Оба требования выполнены, если взять q=^-—xn~m-{-ql. Оста- ется доказать единственность. Пусть f = gq + г и"/ = gqx -\- п, причем степени полиномов г и г\ меньше степени полинома g. Тогда g(q — <7i) = ri — г, но степень полинома гх — г меньше степени g. Это возможно, только если г\ — г == 0 и q — ^i = 0, т. e.'q — qi, !r = r\. \ 3. Наибольший общий делитель двух полиномов. Наибольшим общим делителем двух полиномов fi, f2 из кольца К [х] называется полином наибольшей степени среди полиномов с коэффициентами из поля К или любого его расширения ®, делящих оба полинома h и h- Заметим, что мы не предполагаем заранее, что наибольший об- общий делитель имеет коэффициенты из поля К, и «допускаем к конкурсу» полиномы с коэффициентами из любого, большего чем К, поля й\ Так, для полиномов х2— 1 и л:3— 1 (с коэффициентами из поля Q рациональных чисел) наибольшим общим делителем будет как полином х—1, так и полином е 2{х— 1) или полином
I ц теория делимости для полиномов от одной буквы 169 Теорема 2. Наибольший общий делитель двух полиномов fi, f2^K[x] единствен с точностью до ассоциированности и де- делится на любой общий делитель этих полиномов. Коэффициенты нормализованного наибольшего общего делителя полиномов из К[х] принадежат полю К. Нормализованный наибольший общий делитель d(x) допускает линейное представление в виде d(x) = = fi(x)M\(x)-\~f2{x)M2(x), где М{ и М2—некоторые полиномы из К[х]. Доказательство. Рассмотрим множество полиномов Здесь предполагается, что N\ и N2 независимо пробегают все по- полиномы из К [х]. В этом бесконечном множестве полиномов выбе- выберем отличный от нуля полином d(x) наименьшей степени. Пока- Покажем, что он является наибольшим общим делителем полиномов h и U- Для этого прежде всего установим, что остаток от деления двух полиномов из множества W принадлежит этому множеству. Дей- Действительно, пусть Л] и h2 принадлежат W, так что hi = fiNi + f2N2 и h2 = fiN3 + f2Ni. Тогда остаток г от деления hi на h2, равный hi — qh2, где q— неполное частное, равен fiNi + f2N2— q{fiN3 + + /2Л/4) = /i (Ni — qN3) + f2(N2 — qN<) «= W, ибо" tf, - qN3 €= К [х] и N2 — qNt(=K[x]. Теперь легко доказать, что d есть наибольший общий делитель U и /г- Так как ^е^и (IgF, остаток от деления /i на d тоже принадлежит W, но степень этого остатка меньше степени d. По- Поэтому остаток равен нулю, ибо d — полином наименьшей степени среди отличных от нуля полиномов из W. Таким образом, fi делится на d. Аналогично, /2 делится на d, так что d есть общий делитель fi и f2. Далее, d e W и, следовательно, при некоторых Мi и М2. Пусть б — какой-то общий делитель f 1 и f2 с коэффициентами из К или какого-то большого поля. Тогда, по свойствам делимости, fiMi -\- f2M2 — d делится на б. Поэтому сте- степень d не меньше степени б, так что d есть действительно наиболь- наибольший общий делитель. Наконец, если d\—какой-либо другой наи- наибольший общий делитель, то его степень равна степени d и, так как d делится на di, их частное есть константа, т. е. d и di ассо- ассоциированы. Нормализованный наибольший общий делитель do по- получится из di посредством деления его на старший коэффициент а0. Коэффициенты do= —d принадлежат К, и do = fi(— мЛ + + f2( — М2) имеет линейное представление. Тем самым мы до- казали все свойства наибольшего общего делителя, сформулиро- сформулированные в теореме.
170 ПОЛИНОМЫ И ДРОБИ [ГЛ. VI Кроме двух свойств, аналогичных тем, которые мы видели в теории делимости для кольца Z целых чисел, следует отметить также, что коэффициенты нормализованного наибольшего общего делителя принадлежат тому же полю, что и коэффициенты данных полиномов. Это существенно и не совсем очевидно. Например, полиномы /i = xi — 1 и /2 = х3 + 2х2 + х + 2 с рациональными коэффициентами оба имеют корнем число i, так что нормализован- нормализованный полином х — i есть общий делитель /i и /2) но это не наиболь- наибольший общий делитель, ибо его коэффициенты не принадлежат полю рациональных чисел. Как легко видеть, здесь наибольший общий делитель есть х2 + 1 = (х + i) {х — i). Находить наибольший общий делитель двух полиномов можно тем же способом, что и для двух целых чисел, — алгорифмом Евклида. Именно, выполним цепочку делений с остатком: А = /г<7| + гь deg r, < deg /2, r2, degr2<degr,, r3, deg гг < deg г2 Гк-2 = гк-\Як + гк, deg rk < deg rft_b rk-l — ГкЯк+\- Процесс оборвется, на каком-то шагу деление выполнится без остатка, ибо степень каждого последующего остатка меньше сте- . пени предыдущего. Все остатки, которые мы строим, принадлежат множеству W = {f\Ni -\-f2N2\Ni, N2^ К[х]}, и мы «спускаемся» в смысле степени в этом множестве. Последний отличный от нуля остаток Гк и будет искомым наибольшим общим делителем для f\ и f2. Действительно, пересмотр равенств снизу вверх показывает, что гк является делителем гк-\, ru-i п, /2, /ь а пересмотр сверху вниз — что все остатки п, г2, ..., гк делятся на любой общий де- делитель /i и /2. Очевидно, что из алгорифма Евклида следуют все свойства наибольшего общего делителя, сформулированные в теореме. 4. Свойства взаимно простых полиномов. Два полинома назы- называются взаимно простыми, если их нормализованный наибольший общий делитель равен 1, т. е. эти полиномы не имеют общих дели- делителей, кроме констант. Предложение 3. Для того чтобы полиномы f\ и f2 были взаимно просты, необходимо и достаточно, чтобы существовали полиномы М\ и М2 такие, что fiMi -f- /WW2 = 1. Действительно, если fiMi-\~ f2M2= I, то всякий общий дели- делитель для Mi и М2 делит единицу и является константой. Если fj и /2 взаимно простые, то их нормализованный наибольший общий делитель 1 имеет линейное представление 1 = fiMi -f- /2Af2.
$ 1] ТЕОРИЯ ДЕЛИМОСТИ ДЛЯ ПОЛИНОМОВ ОТ ОДНОЙ БУКВЫ 171 Предложение 4. Если произведение /i/2 делится на f3 и ft взаимно прост с /3, то /г делится на /3. Действительно, поскольку fu /3 взаимно простые, найдутся Л1, и М2 такие, что /iAli + /3.M2= 1. Умножив на f2, получим: [2 = = fih^i + fzfzM2. Первое слагаемое правой насти делится на /з, ибо /i^2 делится на f3, второе делится на /з тривиальным образом, следовательно, их сумма f2 делится на f3. Предложение 5. Если /] и f2 оба взаимно просты с g, то и их произведение fif2 взаимно просто с g. Действительно, существуют Mi, М2, M3, Mi такие, что fiMi + + gM2 = 1 и /2М3 + gMi = 1. Перемножив эти равенства, полу- получим fif2MiM3 + g(M2f2M3-\-fiMiM4 + gM2Mi)= I, так что fif2 и g удовлетворяют признаку взаимной простоты. Предложение 6. Если каждый из полиномов fi, f2, ..., fb взаимно прост с g, то и их произведение /i/г ... fk взаимно про- просто с g. Это предложение доказывается очевидным проведением индук- индукции на основании предложения 5. Предложение 7. Если каждый из полиномов fi, ..., fm взаимно прост с .каждым из полиномов gu g2, ¦•-, gn, то произ- произведение /i ... fm взаимно просто с произведением gi ... gn- Это доказывается многократным применением предложения 6, Предложение 8. Если fug взаимно просты, то fm и g" взаимно просты. Это непосредственно следует из предложения 7, достаточно ПОЛОЖИТЬ f 1 = . . . = fm И gi = . . . = gn. Отметим еще одно свойство взаимно простых полиномов, не имеющее аналога в теории делимости целых чисел. Предложение 9. Если полиномы fug взаимно просты, то они не имеют общих корней ни в каком расширении основного поля. Действительно, пусть /, g принадлежат кольцу К[х] и взаимно просты. Пусть Ж — любое поле, содержащее поле К, и пусть *ое$. Из взаимной простоты следует, что существуют полиномы Mi и М2 е К[х] такие, что fMi + gM2 = 1. Перейдя к значениям при xq, получим f(xo)Mi(xo) +g(xo)M2(x0)= 1, откуда следует, что f(x0) и g(xo) не могут одновременно равняться нулю. &. Неприводимые полиномы. Отличный от константы полином ц>^К[х] называется неприводимым в поле К, если он не имеет нетривиальных делителей в /С[л;]. В противном случае полином называется приводимым в поле К- Очевидно, что неприводимые полиномы в теории делимости по- полиномов должны играть такую же роль, как простые числа в тео- теории делимости целых чисел, т. е. роль неразложимых в кольце К[х] элементов. Отметим, что понятие неприводимого полинома существенно привязано к полю. Так, полином х2 — 2 неприводим в поле Q ра-
172 ПОЛИНОМЫ И ДРОБИ [ГЛ. VI циональных чисел, ибо он не имеет рациональных корней, но он приводим в поле R вещественных чисел: х2 — 2 = (я — д/2)(* + + V2). Предложение 10. Пусть /<=/([*] и ц> неприводим в К. Тогда либо f делится на ф, либо f взаимно прост с ф. Доказательство. Рассмотрим нормализованный наиболь- наибольший общий делитель d полиномов / и ф. Полином ф делится на d и d^K[x]. Поэтому d или ассоциирован с ф, или равен 1. В пер- первом случае / делится на ф, ибо делится на d. Во втором / и <р взаимно просты. ^ Предложение 11. Если tpi и <р2 неприводимы в К[х], то они либо взаимно просты, либо ассоциированы. Действительно, если ф[ и фг не взаимно просты, то ф1 делится на ф2 и фг делится на фь так что ф1 и ф2 ассоциированы. Предложение 12. Пусть f\, f2^K[x] и произведение fi/г делится на неприводимый в К[х] полином ф. Тогда один из сомно- сомножителей делится на ф. Действительно, либо f\ делится на ф, либо /i и ф взаимно про- просты. Во втором случае /2 делится на ф в силу предложения 4. Предложение 13. Пусть fu h> •••> fk^K[x] и произведе- произведение fif2 ... fk делится на неприводимый в К[х] полином ф. Тогда один из сомножителей делится на ф. Доказывается очевидным применением индукции на основании предложения 12. Предложение 14. Если неприводимый над К полином имеет корень х0 в некотором расширении & поля К и этот корень явля- является корнем полинома f^K[x], то f делится на ф. Действительно, f и ф не взаимно просты, ибо имеют общий де- делитель х — Хо^®[х], и, согласно предложению 10, f делится на ф. Отсюда следует, что любой корень полинома ф является кор- корнем /, так что, по словам венгерского математика Пойа, «корни неприводимых полиномов ходят в гости всей семьей». 6. Каноническое разложение. Предложение 15. Каждый полином f^K[x] степени ^ 1 делится по крайней мере на один неприводимый в К[х] полином. Доказательство индукцией по степени. Полиномы первой -сте- -степени неприводимы. Далее, если f неприводим, то он делится на себя. Если приводим, то делится на полином f\^K{x] меньшей степени, который по индуктивному предположению делится на неприводимый в К[х] полином ф. Тогда и f делится на ф. Теорема 16. Любой полином из К[х] степени ~^\ может быть представлен в виде произведения неприводимых над К поли- полиномов, и такое представление единственно с точностью до порядка сомножителей и ассоциированности. Доказательство. Пусть f^K[x]. В силу предложения 14 f делится на неприводимый полином фЬ так что / = ф^. В свою
I 1] ТЕОРИЯ ДЕЛИМОСТИ ДЛЯ ПОЛИНОМОВ ОТ ОДНОЙ БУКВЫ 173 очередь, /i делится на некоторый неприводимый полином ф2, так что /i = фг/г и / = Ф1Ф2/2, и т. д. Процесс выделения неприводи- неприводимых сомножителей закончится в конечное число шагов, ибо сте- степени полиномов f, /1, /2 ... строго убывают. Итак, f = cp^2 ... ф*, где все ф< неприводимы. Остается доказать единственность разло- разложения. Применим индукцию по степени. Базу индукции дают по- полиномы первой степени. Пусть f = ф1ф2 ... ф* и / = г^грг ... 'ф/ — два разложения полинома / на неприводимые. Произведение ¦ф^г • • • tyi делится на фь В силу предложения 13 один из сомно- сомножителей фь г|J, ..., гр/ делится на фь За счет изменения нумера- нумерации можно считать, что гр! делится на фь Так как ipi и ф1 оба не- неприводимы, они ассоциированы, т. е. гр1==с1ф1 при ct e К- Положим f = ф^,. Полином fi е^[л;] имеет меньшую степень чем f и имеет два разложения на неприводимые сомножители: ft = ср2 ... (р*. и fl=(ci^2) ¦¦¦ tyt- В силу индуктивного предположения эти разло- разложения совпадают с точностью до порядка сомножителей и ассо- ассоциированности, а значит, такими же будут разложения / = = ф1ф2 ... ф* и / = ipiit>2 ... tyi- Теорема доказана. Если считать неприводимые полиномы нормализованными, то в разложение следует ввести константный множитель а0, равный коэффициенту в старшем члене полинома /, так что разложение принимает вид / = аоф1фг • • • Ф*. В этой форме разложение един- единственно с точностью до порядка следования сомножителей. Среди сомножителей могут быть равные, и их можно объединить в сте- степени. Разложение принимает вид где фь фг, ..., Фт — попарно различные нормализованные непри- неприводимые в К[х] полиномы. Это разложение называется канониче- каноническим разложением на множители полинома из /([*]. Оно анало- аналогично разложению целых чисел в произведение простых. Предложение 17. Над любым полем существует бесконеч- бесконечно много неприводимых полиномов. Доказательство проведем по той же схеме, что и доказатель- доказательство бесконечности множества простых чисел. Именно, если дана любая конечная совокупность неприводимых полиномов фЬ ф2, ... ..., фА, составим полином F — ф1ф2 ... щ+1. Он делится по крайней мере на один неприводимый полином г|з, который не мо- может равняться ни фь ни фг, ..., ни ф*, ибо иначе 1 делилась бы на г|з. Таким образом, для любого конечного множества неприво- неприводимых полиномов мы можем построить новый неприводимый по- полином, не содержащийся в этом множестве. Предложение 17 тривиально, если поле содержит бесконечно много элементов, ибо над таким полем существует бесконечно много полиномов первой степени х — с, которые все неприводимы, и содержательно лишь для конечных полей, к числу которых при- принадлежат кольца вычетов по простым модулям. Для любого ко-
174 ПОЛИНОМЫ И ДРОБИ [ГЛ. VI нечного поля существует лишь конечное число qn нормализован- нормализованных полиномов хп + а\хп~{ + ... + ап степени п (здесь q обозна- обозначает число элементов поля). Поскольку число неприводимых по- полиномов бесконечно, среди них существуют полиномы сколь угодно высокой степени.При помощи значительно более тонких рассуж- рассуждений можно доказать, что над конечным полем существуют не- неприводимые полиномы любой степени. Вычислим неприводимые полиномы второй и третьей степени над полем из двух элементов (полем вычетов по модулю 2). По- Полиномов первой степени два: х и х-\- 1. Полиномов второй степени четыре: х2, х2-\-1, х2-\-х и х2-\-х-\-1. Из них приводимы х2, (х-\- IJ = х2 + 1 и х(х + 1) = х2 -f х. Неприводимым оказывается один полином х2-\-х-\-\. Полиномов третьей степени восемь. Из них шесть приводимы: х3, х2(х + 1) = X3 + х2, х(х-\~1J = = х3 + х, (х+ IK = хъ + х* + х+ 1, х{х2 + х+ 1)=х3 + х2 + х и (х +1) (х2 + х +1) = хъ + 1. Остальные два полинома х3 -f- х-\-1 и х3 + х2 + 1 неприводимы. Аналогично, отбрасывая приводимые полиномы, которые легко конструируются из неприводимых полиномов меньших степеней, можно строить неприводимые полиномы четвертой, пятой степеней и т. д. Имеются и другие, более тонкие средства. 7. Каноническое разложение над полем R комплексных чисел и над полем С вещественных чисел. Каноническое разложение над полем .С. нам уже известно. Это разложение f(x)= ао(х — х\)щ ... ... (х — Xk)nk на линейные множители, соответствующие корням fix). Предложение 18. Над полем вещественных чисел неприво- неприводимыми полиномами являются только полиномы первой степени и полиномы второй степени, не имеющие вещественных корней. Доказательство. Пусть / = аол:''+ ... + а„ «= R [л;] и п ^ 2. Если полином f имеет вещественный корень, то он имеет делитель первой степени и, следовательно, приводим. Неприводи- Неприводимыми могут быть только полиномы, не имеющие вещественных корней. Пусть / — такой полином. Он имеет по крайней мере один комплексный корень х0 = а + Ы, при Ъ Ф 0. Рассмотрим вспомо- вспомогательный полином Ф (х)—(х—х0) (х~хо)—(х—а—Ы) (x—a-\-bi)=x2—2axJra2-\-b2. Ясно, что ф()()еК[х] и ф неприводим над R, ибо иначе он имел бы делитель первой степени и вещественный корень. Полиномы f и ф не взаимно простые, ибо имеют общий корень в С и, следо- следовательно, f делится на ср. Если степень / равна 2, то f ассоцииро- ассоциирован с ф и неприводим. Если степень f больше 2, то f приводим. В силу доказанного предложения каноническое разложение по- полинома / е R [х] имеет вид: /(*)=Mx-x1)mi ... (x-xk)mk (*2+Pi*+<7i)'' ... (x2-\-prx+qryr,
§ 2] ПРОИЗВОДНАЯ 175 где полиномы х2 + ptx + qi <= R [*] не имеют вещественных корней, т. е. р2 — Aqt < 0. Отметим простое, но важное следствие: если полином с вещест- вещественными коэффициентами имеет комплексный корень а + Ы, ЬфО, то он имеет и сопряженный корень а — Ы той же кратности. Действительно, комплексные корни а + Ы при Ъ ф 0 являются корнями полиномов второй степени, входящих в каноническое раз- разложение, а каждый такой полином вместе с корнем а + bi имеет корень а — Ы. Пример. Найти каноническое разложение в R [х] полинома Х2п+1. Здесь множителей первой степени нет, так как полином не имеет вещественных корней. Все комплексные корни простые, так что множители второй степени входят с показателями 1. Сперва напишем разложение в кольце С [х], для чего найдем корни 2п in xk = -у/ — 1 = У cos (— я) + i sin ( — л) = при k=\, 2, ..., 2п. Корни Xk при k=\, 2, ..., п имеют аргу- аргументы меньше л, так что они находятся в верхней полуплоскости. Корни Xk при k = п-\~ I, ..., 2п расположены в нижней полу- полуплоскости и, в силу следствия из канонического разложения, со- сопряжены с корнями хк при k=\, ..., п (легко проверить непо- непосредственно, ЧТО Xk = Х2п-к) ¦ ПОЭТОМУ п 2п п j^ + i^II(*-**) П (*-**) = ![(*-**)(*-**) = = П (х2 - (xk +xk)x + xkxk) = ft (x2- 2x cos {2k~nl)n + l) . § 2. Производная 1. Определение производной и формулы для ее вычисления. Введем понятие производной от полинома / (л;) е К [х]. Для поли- полиномов над любым полем обычное понятие производной как пре- предела отношения приращений, не работает, ибо понятие предела, например, для конечных полей не имеет смысла. Определим про- производную формально. Именно, производной от полинома f(x)= aoxn-\-aixn~l + ... -\-ап-\х+ап называется полином
176 ПОЛИНОМЫ И ДРОБИ [ГЛ. VI Производная обладает следующими свойствами. 1. (с)' = 0, с —константа. 2. (х — с)'— 1. 4. (f) f Эти свойства непосредственно следуют из определения. Это свойство докажем в три приема. a) f, = ахт, /2 = bxk, так что ftf2 = abxm+k. Тогда (/,/,,)' = (т + k) abxm+k-x = tnabxm+k-1 + b) ^ = a0Jcm + ai-«m-I+ ... +аЯ| f2 = &xft. Здесь fif2 = =aoxm-bxk + aixm-1-bxk+ ... +am-6xfe. В силу свойств 3, 4 и случая а) ахт (bxk)' Объединяя нечетные и четные слагаемые, получим + Ut', с) U = аохт + а,хт~' + ... + ат, /2 = Ьохк + + Тогда /if2 = f\boxk + f\b\xk~l + ... + f\bk и, в силу свойств 3, 4 и случая Ь), • • • + ьк)' - Доказывается индукцией по А, на основании свойства 5. 7. (f*)' = fef*-'f. Следует из свойства 6, достаточно положить /i = f2 == ... "8. ((je — c)fe)' = fe(A; — с)*-1. Производная от производной называется второй производной, производная от второй производной называется третьей производ- производной и т. д. Легко убедиться в том, что k-я производная от гп-й про- производной равна (k-\-m)-n производной исходного полинома. 2. Разложение полинома по степеням линейного двучлена. Пусть / = aoxn-j- aix"-1 + ... -\~ an^k[x] и х — с — данный ли- линейный двучлен. Предложение 19. Полином f может быть разложен по сте- степеням х — с.
§ 2] ПРОИЗВОДНАЯ 177 Доказательство. Проведем индукцию по степени с три- тривиальной базой полиномов нулевой степени. Разделим f на х— с с остатком. Получим f(a) = (x-c)fi(x) + bn где Ъп — остаток, f\(x) — полином степени п ного предположения 1. В силу индуктив- индуктив+Ьп-и откуда ... +bn-l(x-c) Приведенное доказательство дает и процесс для вычисления коэффициентов. Свободный член Ьп разложения дается как оста- остаток от деления f на х — с. Рассуждение по индукции заменяет единообразный процесс, так что Ьп-\ есть остаток при делении не- неполного частного /i нал; — с, и вычисление последующих коэффи- коэффициентов требует вычисления неполного частного /г при делении fi на х — с. Далее, Ьп-ч находится как остаток при делении f2 на х — с и т. д. Итак, нужно делить на х — с полином f и последую- последующие неполные частные. Остатки дадут коэффициенты разложения, начиная со свободного члена. Деление целесообразно выполнять, пользуясь схемой Хорнера, рассмотренной на стр. 58. Пример. Разложим полином хъ по степеням х — 2. Согласно схеме Хорнера запишем: 1 0 1 2 1 4 1 6 1 8 1 10 0 4 12 24 40 0 8 32 80 0 16 80 0 32 Остатки подчеркнуты. Таким образом, — 2J + +80 (л: 2)+32. -В случае поля нулевой характеристики можно дать удобную для теоретических рассуждений формулу для коэффициентов раз- разложения. Выведем эту формулу. Пусть f = do + dl(x — c) + d2(x — cJ+ ... +dn(x — c)n (нам Удобно записать по возрастающим степеням х — с).
178 полиномы и дроби 1гл. vi Возьмем производные до «-го порядка включительно (дальней- (дальнейшие все равны нулю): f = d1 + 2d2(x-c)+... +ndn(x-c)n-1, /" = 2 d2 + 3 • 2d3(x - с) + ... + n{n - 1) dn (x - cf~\ р-») = (я_1)(я_2) ... 2dn_, + n(n-l) ... 2dn{x-c), p = n(n-l)...2dn. Положим во всех этих равенствах х = с. Получим p-«)(c) = (n-l)(n-2)...2dB_lf }W(c) = n(n-\)...2dn, откуда d-.f(c) d -?Ж d -?М. d f("-"(Q) rf fn{c) и разложение принимает вид Эта формула называется формулой Тейлора. Для приближенного вычисления корней полинома бывает нуж- нужно вычислять f{c) и f'{c) при значении с, близком к корню. Ясно, что выполнить это проще всего при помощи схемы Хорнера, вы- вычислив по этой схеме два коэффициента разложения / по степеням х — с. Пример. Для полинома х3 — х— 1 вычислить /A,2) и /'A,2). Применяем схему Хорнера: 10 — 1 — 1 11,2 1 1,2 0,44 — 0,472 1 2,4 3^32 Итак, f A, 2) = —0,472 и /' A, 2) = 3,32. 3. Разделение множителей различной кратности. Предложение 20. Простой корень полинома не является корнем его производной. Пусть с — простой корень полинома /, так что / = (х — c)fi и fi не делится на х — с, т. е. fi(c)=^=O. Тогда f' = fi-{- (x — с)/' и Предложение 21. Корень с полинома из К[х] кратности k является корнем производной кратности k — 1, если только k не
Ц<Ц ПРОИЗВОДНАЯ 179 делится на характеристику основного поля К (в частности, если эта характеристика равна 0). Действительно, пусть f = (х — c)kfv причем Д(с) Ф 0. Тогда /' = *(*- с)*-1/, + (х- с)% = (х- с)*-1 [kf, + (х - с) /[] = *=(х — c)k~xF{x). Полином F(x) не делится на х—с, ибо F(c) = = kfi(c)^ 0 (k не делится на характеристику!). Эти предложения можно несколько обобщить. Напомним, что полиномы /е/С[л;] разлагаются в произведе- произведение неприводимых над К множителей / = «0Ф?'Ф22 • • • Фт' Ф* ^ Ф/- Предположим, что характеристика поля k равна нулю. Предложение 22. Однократный неприводимый множитель полинома не входит в разложение его производной. Действительно, пусть f = aoq>F, cp неприводим и F не делится на ф. Тогда f = a^'F + aotyF'. Полином <р' ненулевой, его степень меньше степени ф, поэтому ф' взаимно прост с ф (в поле ненуле- ненулевой характеристики могло случиться, что ф' = 0). Полином F тоже взаимно прост с ф, ибо F не делится на ф и ф неприводим. Первое слагаемое a^'F взаимно просто с ф, второе аоц>Р' делится на ф. Следовательно, f взаимно прост с ф. Предложение 23. Неприводимый над К полином ф, входя- входящий в разложение полинома f e К [х] с показателем k, входит в разложение f с показателем k — 1. Действительно, пусть f = q>kFi при Fi, взаимно простом с ф. Тогда f = йф*-1ф//71 + ф^ = фй-1(Аф'^1 + ф/:'О- Первое слагае- слагаемое в скобках ktp'Fi взаимно просто с ф, второе делится на ф. Следовательно, полином ky'Fx + q>F'{ взаимно прост с ф и f не делится на (pk. Эти предложения позволяют, оставаясь в кольце /<С[х], отделить друг от друга произведения неприводимых сомножителей, входя- входящих в f e ^[л;] с различными показателями. Действительно, пусть / = а ф^ф^г ... ,ф^т и пусть й\ — наиболь- наибольший общий делитель f и f. Неприводимыми множителями для d[ могут быть только фь фг Фт, ибо f делится на d\, и они вхо- входят в dx с показателями k\ — 1, k2— 1, ..., km— 1, так что f=difu где d{ =ф(г1-1ф*г~1 ... ф^щ-1 и fi = аОф1фг ... ц>ш- В d\ не будут входить однократные неприводимые множители f. Найдем далее наибольший общий делитель d2 полиномов dx и d\. Он будет со- состоять из неприводимых множителей, входящих в f с большим чем 2 показателем. Их показатели в d% на 2 меньше, чем в f. Полином 12 =-j- будет состоять из неприводимых множителей, входящих в / с показателями 2 и выше. Далее, пусть с/3 есть наибольший об-
180 ПОЛИНОМЫ И ДРОБИ [ГЛ. VI щий делитель d2 и d'v \$ = -j-- Полином f3 составлен из неприво- неприводимых множителей, входящих в / с показателем 3 и выше, и т. д. Частное от деления /i на }2 будет составлено из неприводимых множителей, входящих в / ровно в первой степени, частное от деления /г на /з состоит из неприводимых множителей, входящих в / равно во второй степени и т. д. Пример. } = х5 + 2х4 — 2х3—4х2 + х + 2. f = 5х4 + 8х? — — 6х2 — 8л; + 1. Применив алгорифм Евклида, получим, что н. о. д.(Д /'^ равен dl = x2— 1. Далее, d[ = 2x, d2=U d'2 = 0, d3=l. Поэтому fг = = f/d = xs + 2x2 — x — 2, f2 = dl/d2==x2—l, f3 = di/da=l. По- Поделив /i на f2, получим x + 2, частное от деления f2 на f3 есть х2—1. Итак, / = (л; + 2) (л;2 — IJ = (л: + 2) (х — 1J(х+ IJ. § 3. Рациональные дроби 1. Определение рациональных дробей и действий над ними. Дробной рациональной функцией или, короче, рациональной дробью называется частное от деления двух полиномов. Если по- полиномы рассматривать как функции, в определении дробной ра- рациональной функции нет никаких затруднений. Однако возникают некоторые неприятности при привычном всем действии сокраще- сокращения дробей. Так, строго говоря, мы должны считать функции \ х 1 —ц—г и ' 2_, как различные, ибо различны их естественные об- области определения. Однако вторая превращается в первую при сокращении на х— 1. Мы рассматривали полиномы не как функции с заранее данной областью определения, а как формальные выражения, над кото- которыми можно совершать действия и преобразования по определен- определенным правилам. Эту же точку зрения нам надлежит принять при рассмотрении рациональных дробей. Определение. Рациональной функцией над полем К назо- назовем «картинку» вида —, где f и g^K[x], причем ^(д;)^0. Введем теперь понятие равенства дробей. Две дроби -^- и -^- считаются равными, если полином fig2—¦ -~hg\ равен 0. Здесь, в отличие от прежних определений равенства для вновь вводимых объектов (комплексных чисел, полиномов и матриц), равенство определяется при помощи некоторого соглашения, а не по тождественности записи. В математике принято называть экви- эквивалентностью или равенством такое отношение между сравнивае- сравниваемыми объектами, которое удовлетворяет следующим требованиям. 1. Рефлексивность: а = а, т. е. объект а равен самому себе.
$31 РАЦИОНАЛЬНЫЕ ДРОБИ 181 2. Симметричность: из а = Ь следует b — а. 3. Транзитивность: из а = с и b = с следует, что а = Ь, т. е. два объекта, равные третьему, равны между собой. Проверим эти требования для равенства рациональных дробей. Рефлексивность: t- = -j. ибо fg — gf = 0. S ft» Симметричность: если—L- = —г-, то -г" = ~-> ибо f2gi — f\g2— ?» 1 & 2 & 2 si Транзитивность. Если -И- = -?2- и .iL^-ii., т0 Jl_ = _[н_ . Г gl g3 §2 §3 gl g2 Действительно, пусть -?-- = -7- и —— = -^-. Рассмотрим по- ^i ?Гч j?9 ?^ч лином gs(f\g2 — f2gi). Он равен gsf1g2 — §2/3^1 + ?2/3^1 — §3/2^1 = «ft(/ig3-f3gi)+gi(/sga-/2g8) = 0,H6o ^ = ^- и -^ = -^-- Из равенства g3{fig2 — f2gi) = Q заключаем, что fig2 — hgi = 0, т. е. что J— = -^~, ибо кольцо К[х] есть область целостности. Из данного определения равенства следует, что при любом по- , . А - f fh линоме пфО имеет место равенство — = —у, т. е. в числитель и знаменатель можно вставлять один и тот же множитель или со- сокращать на общий множитель. Далее, само определение равенства можно сформулировать так: две дроби равны, если от одной из них можно перейти к другой посредством вставки и сокращения. = Действительно, если ~т~= #¦• т' е' /iS'2 = /2§'i. то /l __ flg2 __ figl _ U g\ gig2 glg2 g2 о 0 Og 0 x Заметим еще, что — == -у— = —, т. е. все дроби с нулевым числителем равны между собой и равны ~. Обратимся теперь к определениям действий над дробями. Опре- Определим сложение дробей: Это определение совершенно естественно: посредством надлежа- надлежащих вставок выравниваются знаменатели и затем числители скла- складываются. Однако несмотря на естественность данного определе- определения, нужно проверить его корректность — не изменится ли резуль- результат при замене слагаемых на равные. /l . | . fg _ flgl + fig\ /З I U _ figi + figl S\ g2 g\gi gs g4 g3g
182 полиномы и дроби [гл. vi Сравним результаты, исходя из определения равенства дробей. Имеем gag* {fig* + ftgi) — gig2 {fag* + figs) = = gtg* (figs — fagi) + gigs (fig* — ftgt) = 0. Результаты сложения оказались равны, так что определение кор- корректно. Из определения ясно, что сложение коммутативно и ассоциа- ассоциативно. Элемент у' играет роль нуля. Действительно, — + у = = g t g = ~r • Для -j противоположным является —-, ибо g "*" g e2 g2 i ' Итак, рациональные дроби образуют абелеву группу по отно- отношению к сложению. Теперь определим умножение столь же естественным образом: U % _fa_ def /if2 gi gi g\g2 ' Проверим корректность определения. Пусть ~9~==~j~ и -iS- = -ii-, т. е. fig3 — fs^i = 0 и /2g4 — /4^2 = 0. Сравним, согласно определению равенства, дроби ¦ и г > г г г glg2 Имеем — faf&g» = fifsgag* — fafigig* + faftgig* ~ = hSi (figs — fagi) + hg\ (fig* — hg2) = 0. Умножение, очевидно, коммутативно и ассоциативно и связано со сложением дистрибутивностью. Проверим последнее: ( f\ ¦ fa ^ fa _ fxgi + f?g\ fa _ fjagi + /a/agl . \ gi """ g2 ) ga gigi ' ga gigiga ' Ji h_ 1 _/j fs _ fifa 1 /afa __ fifsga ¦ hfagi _hfagt +hfagi gl ' g3 ~Г ff2 ^3 gigs ^ g2g3 gl^gs glg2ff3 g\g2g3 1 ft f Элемент у является единицей. Действительно, -—г= • Далее, всякий отличный от нуля элемент имеет обратный. Действи- Действительно, -?¦ ф -г означает, что f Ф 0, т. е. 4 имеет смысл и с» * L.L L «г f ~ 1 * Итак, множество построенных формальных дробей образует поле. Оно называется полем рациональных функций от буквы х и обозначается К(х) (простые скобки!). Кольцо К[х\ естественно вкладывается в поле К(х).
§\3] РАЦИОНАЛЬНЫЕ ДРОБИ 183 Именно, положим у =- /. гДе f ^ К[х]. Нужно убедиться в кор- корректности этого отождествления, для чего нужно доказать, что оно не вступает в противоречие с определением равенства и опреде- определениями действий сложения и умножения. Это легко проверяется: 1 = 1 равносильно равенству /i-l— f2-l=0, т.. e. fi={2> -у- + -у-= и -у---у-=-^р, т. е. при сложении и умноже- умножении дробей вида — получаются результаты, соответствующие ре- результатам тех же действий над полиномами. 2. Поле частных. Присмотримся внимательнее к рассужде- рассуждениям п. 1. Мы видим, что в этих рассуждениях мы почти не пользо- пользовались тем, что употреблявшиеся буквы обозначали полиномы. Нам было нужно, чтобы эти буквы были элементами коммута- коммутативного ассоциативного кольца с единицей, являющегося областью йелостности. Этим мы пользовались при проверке транзитивности равенства дробей и при определениях их сложения и умножения, так как в определении дроби запрещено появление элемента 0 в знаменателе и нужно, чтобы знаменатель суммы и произведения был отличен от нуля. '¦¦¦ Мы можем теперь повторить построения п. 1 на более высоком уровне абстракции. Пусть А — произвольная коммутативная ассоциативная область целостности. Рассмотрим множество пар — , g ф 0, элементов А. Введем для них определения равенства и действий сложения и умножения: 2 Ji_,fi.*g g\ gl glg2 3 ft . Ь <t! hf2 g\ ' g2 Слово в слово так же, как в п. 1, проверяется корректность Этих определений. По отношению к сложению символы -^ обра- образуют абелеву группу с нулем —• (который не зависит от g, согласно Определению равенства). По отношению к умножению все ненуле- ненулевые пары (т. е. отличные от —J образуют абелеву группу с еди- единицей — (не зависящей от g) и с обратным для — элементом 4-. Умножение со сложением связано дистрибутивностью. Таким об- образом, мы построили поле, которое называется полем частных для Области целостности А.
184 ПОЛИНОМЫ И ДРОБИ [ГЛ. VI Кольцо А могло не содержать единицу, в поле частных она появляется. Наконец, кольцо А вкладывается в свое поле частных посред- посредством отождествления — = / (при любом g Ф о). Ясно, что поле частных для кольца целых чисел есть поле Q рациональных чисел. Подобно полиномам от одной буквы, множе- множество ПОЛИНОМОВ К\%\, ..., Xk] ОТ НеСКОЛЬКИХ букв Xi, X2, ..., Xk является областью целостности и вкладывается в поле частных F (х., х9 .... хЛ К(хи хч, ..., Хп), состоящее из дробей г; Щ-. u\xv ха xk) 3. Правильные рациональные дроби. Вернемся к изучению рациональных дробей от одной буквы. Рациональная дробь может быть записана в форме -j многими способами. Однако всегда можно перейти к несократимой записи — со взаимно, простыми числителем и знаменателем. Для этого достаточно найти наиболь- наибольший общий делитель числителя и знаменателя и сократить на него. Далее, старший коэффициент знаменателя можно вынести и присоединить к числителю, после чего знаменатель можно считать нормализованным. Несократимая запись дроби с нормализован- нормализованным знаменателем называется нормализованной записью дроби. или нормализованной дробью. Две нормализованные дроби равны, только если равны их числители и знаменатели, т. е. совпадают по записи. Действительно, если v" = -i равенство двух нормали- нормализованных дробей, то fig2 = f2gi- Полином g\ взаимно прост с fi в силу несократимости -^-, и, следовательно, #2 делится на gu Аналогично, gi делится на g2, т. е. они ассоциированы. Так как их старшие коэффициенты равны 1, они совпадают; следовательно, совпадают /i и f2. Рациональная дробь называется правильной, если степень ее числителя меньше степени знаменателя. Если дробь правильная в некоторой записи, то она остается правильной в несократимой записи, так как при сокращении степени числителя и знаменателя уменьшаются на одно и то же число, а значит, и во всякой другой записи, ибо любая запись получается из несократимой посредством умножения числителя и знаменателя на один и тот же полином. Предложение 1. Любая рациональная дробь есть сумма полинома и правильной дроби. Действительно, пусть данная дробь. Поделим / на g с остатком: f = gq+J, degr<degg. Тогда у = ^Г^ ^ 1Г + 7Г ==
fj 3J РАЦИОНАЛЬНЫЕ ДРОБИ 185 ==q -j—. Здесь q— полином (он может равняться 0, если degf < degg), a j— правильная дробь. Предложение 2. Сумма, разность и произведение правиль- правильных дробей есть правильная дробь. (Здесь имеется существенное отличие от арифметики рацио- 1.2 7 \ нальных чисел, где, например, -^ + -^ = -g-. J Доказательство. Пусть дроби — и -—¦ правильные. Они & 1 ь2 останутся правильными и при записи -^- и Щ~-, а — ±—= J Г glg2 gift gl g2 __ _а?г—b?i Степени обоих слагаемых в числителе меньше сте- glg2 пени знаменателя, следовательно, степень числителя меньше сте- степени знаменателя. Для произведения -^-•~==="^" имеем deg Uh = deg U + deg f2 < deg gi + deg g2 == deg gjg2. Таким образом, правильные дроби образуют кольцо. Оно не содержит 1. 4. Разложение рациональной дроби на простейшие. Предложение 3. Если знаменатель правильной рациональ- рациональной дроби —^К{х) есть произведение двух взаимно простых по- полиномов, g = g\g2, то дробь представляется в виде суммы двух правильных дробей со знаменателями, равными сомножителям gx и g2 знаменателя исходной дроби, т. е. —— = —— + —, причем обе дроби в правой части правильные. Такое представление един- единственно. Доказательство. Так как gi и g2 взаимно просты, най- найдутся полиномы Mi и М2 такие, что g\M\ -\- g2M2 = 1. Тогда JL- = _L_ (giM gigl glg2 VS1 ITS2 12> g2 ^ gl В этом разложении слагаемые правой части, вообще говоря, не являются правильными дробями. Поделим полином fM2 на gi с остатком: fM2 = giq + fi, degfi<deggb так что '^1==<7 + "^7- Присоединим q к первому слагаемому. Получим—^— = -—!- + 9 + i fi f Afi + qgi i f\ о fM\ + QKz h + -Ц-= ' '^^2 -f--^-. Здесь первое слагаемое -—^ЧК2 =-Н- g\ J?2 gl gf2 g2 автоматически оказывается правильной дробью как разность пра- правильных дробей —-— и —. Итак, —— = —'- 4- --- и оба слагае- слагаемых в правой части равенства — правильные дроби.
186 ПОЛИНОМЫ И ДРОБИ [ГЛ. VI Остается доказать единственность. Пусть f :;_ ft , h г:_ /з ¦ /4 gig? gl "*" gi g\ ^ gi' причем все дроби правильные. Тогда ——— = '4~'2 и g2(/i — /3) — = giifi~ fz)- Левая часть делится на gi и полином g2 взаимно прост с gi. Поэтому /i — f3 делится на gi, что возможно только при /i — h = 0, ибо степень /i—/3 меньше степени gb Итак, А == /з и, следовательно, /2 = ft- Предложение доказано пол- полностью. Теперь обобщим это предложение. Предложение 4. Если знаменатель g правильной рацио- рациональной дроби ~<= К(х) есть произведение gig2 ... g* нескольких попарно взаимно простых полиномов, то дробь представляется в виде суммы -j- ~\—- + ... -\—— правильных дробей и такое представление единственно. Доказательство проведем индукцией по числу сомножителей. База индукции есть при k = 2. Далее, g = gi (g2 ... gu) и поли- * f f F номы g! и g2 ... gk взаимно просты. Поэтому — = —H — ¦ Ко второму слагаемому применяется индуктивное предположение. f f F Разложение — = — + — — единственно по предложению F t f 3, и разложение = — + ... -|—— единственно по индук- S2 ¦ ¦ ¦ Sit S2 Sk тивному предположению. Следовательно, разложение — = —'- + -\—- + • • • Л—~~ единственно. Полином из К[х] имеет каноническое разложение на неприво- неприводимые множители g = ауф^'фг ... ш"/*. 3 соответствии с этим правильная рациональная дробь раскладывается на сум-му пра- правильных дробей со знаменателями ф', q>T2, •••, щк- Эти дроби носят название примарных. Действительно, пусть дробь (в нормализованной записи) есть —-—-^- —, где фь фг, ..., Ц>к — попарно различные нормали- "'1^2 k ^ k зованные неприводимые полиномы. Тогда они попарно взаимно просты и их степени ф"\ ..., ф)"* тоже попарно взаимно просты. Применение предложения 4 дает требуемое разложение; m. m, mb m, Ф1 Ф2 -"«Pft Vl Ф2
ft,} РАЦИОНАЛЬНЫЕ ДРОБИ 1S7 Оно единственно в силу предыдущих предложений. Примарная дробь называется простейшей, если ее числитель есть полином, степень которого меньше степени, неприводимого по- полинома, входящего в знаменатель. Предложение 5. Любая правильная примарная дробь пред- представляется в виде суммы простейших дробей. Доказательство. Пусть —йг — данная примарная правиль- правильная дробь. Поделим /на ф с остатком: / — q>q\ + f\, deg/i <C degtp. Тогда -^" = -^гЧ—Tlhr- Такое представление единственно, ибо если -фг==-фг + -^Ьг при deg/i<deg(p, то / =fj + <7i(p, т. е. fi"есть остаток деления / на ф и q\ — неполное частное. Выделив остаток от деления qt на ф, qi = /г + Ф^г, degf2 < degф, получим Продолжая процесс, придем к правиль- правильной дроби Clm~l , которая является простейшей. Итак, Единственность разложения очевидна, в силу единственности на каждом шагу процесса. Теорема 6. Правильная рациональная дробь из поля К(х) может быть представлена в виде суммы простейших дробей, и та- такое представление единственно. Действительно, всякая правильная дробь из К(х) единствен- единственным образом представляется в виде суммы правильных примарных дробей и каждая правильная примарная дробь представляется в виде суммы простейших. Если знаменатель исходной дроби имеет каноническое разложение ф,"'ф™2 •.. Ф™*> то знаменателями про- простейших дробей будутф^1, ф!, ..., Фр ф!Г2> Фг, •••> <Р2> ••• : 5. Разложение рациональной дроби на простейшие над полем С комплексных чисел. Поле С всех комплексных чисел алгебраиче- алгебраически замкнуто, и любой нормализованный полином разлагается нал р в произведение линейных множителей g = {х — Xif1 ... (х- xkfk. В этом случае простейшими дробями будут — • г-»"е ^е?Г, так что разложение правильной дроби на простейшие
188 ПОЛИНОМЫ И ДРОБИ [ГЛ. VI имеет вид l___ An ^lm, A2l А2п,2 а^, а kmk Это разложение играет значительную роль в математическом анализе. Простейшие дроби легко дифференцировать и интегри- интегрировать. 6. Разложение рациональной дроби на простейшие над полем R вещественных чисел. Над полем R имеется два типа неприводимых полиномов — полиномы первой степени х — Xi и полиномы второй степени х2 4- PjX -\- q/ при p2t — Aq-, < 0. Соответственно, имеется два типа простейших дробей: А - Вх + С , . . - —- и — — при р2 — 4<7у < 0. Разложение над R тоже полезно для целей математического анализа. Пример. (л._ 1J(л.2 + t) • гч „¦ Ai А, Вх + С Эта дробь разлагается на слагаемые-. гт^-, —~- и — ' . Записав это разложение и умножив на знаменатель (х—1J (я24-1), получим равенство Нужно определить коэффициенты Аи А2, В и С. Самый естествен- естественный путь для их определения — так называемый метод неопреде- неопределенных коэффициентов, т. е. сравнение коэффициентов при 1, х, х2 и xz. Это даст систему четырех уравнений с четырьмя неизвест- неизвестными, имеющую, как мы уже знаем, единственное решение. Вот эта система: , Ai — A2 + C=l, Л2 + В - 2С = 0, из которой находим Ai — 1/2, А2 = —1/2, В = 1/2, С = 0, так что 1 1 1 х (х - 1)а (х2 + 1) ~~ 2 (х - IJ 2 (* - 1) +  (*г + 1) ¦ Коэффициенты можно было бы определить несколько проще, полагая в равенстве полиномов А,{х- 1} (^2 + 1) + (вдс + С) (*-!)»
$3] РАЦИОНАЛЬНЫЕ ДРОБИ 189 х=1, что дает 1—2А\ — О, Ах=-^, и x = i, что дает 1 = = (В;+С)(—21), откуда В = 1/2 и С = 0. Оставшийся коэффи- коэффициент А2 определяется, например, из сравнения свободных членов. 7. Разложение на простейшие правильной рациональной дроби, знаменатель которой разложен на попарно простые линейные множители. Пусть дана правильная дробь ,х_х , ix_x\ (х — х У xi ф Xj. Ее разложение имеет вид Их) Л, , Л2 . Ап (х — Xi) (х — х2) ... (* — хп) х — *1 "т" л: — х2 ' ' ' ~~* х — хп ' Для определения коэффициентов умножим равенство на зна- знаменатель: f(x) = Ai(x — х2). • • (x — xn) + A2(x — Xi) (х — хг)... (х — Хп) + ... ... + Ап(х — хх) ... (х — xn_i). Положим теперь по очереди х = xit х = х2, .. ¦, л: = хп. По- Получим: — x3) ... (x, — х„), / (Л-г) — ^2 (^2 — Xi) iX2 X3f • • • {X2 — •*¦«)> / V^n/ — лп\хп x\)\xn X2> •¦• \xn xn-\l- Множители при коэффициентах в правых частях все отличны от нуля и легко выражаются при помощи производной полинома F(x) = (x — Xi) (х — х2) ... (х — хп). Действительно, F'(x) = (x — х2) ... (х —х„) + (х —xi)(x —х3) ... (х — х„)+ ... Полагая по очереди x — xi, x — x2 х = хп, получим: F' {Xi) = (*, - х2) (Xi -хъ) ... (дс, - хп), F' {х2) = (х2 - xi) (х2 - х3) ... (х2 - х„), f (х„) = (хп - х,) (х„ - х2) ... (х„ - х„_,). Принимая во внимание эти равенства, получим f(Xj) . f(X2) __ /U«) и для разложения на простейшие получаем формулу f (д:) Zj F'(x ) (х - .г ) ' •Эта формула носит название формулы Лагранжа.
190 полиномы и дроби 1гл. vi Рассмотрим несколько примеров ее применения. Пример 1.(Х + 2)(Х+1)Х(Х_1){Х_2Г Здесь F(x) = (x + 2)(x+l)x(x-l)(x-2), F' (-2) = (-2+1) (-2) (-2-1) (-2 -2) = 24, F'(-l) = (-l+2)(-l)(-l-l)(-l-2) = -6, F'@) = @ + 2)@ + 1) @ - 1)@ - 2) = 4, F'({) = -?>, F'B) = 24 и х3 + 5х + 7 2)(х+\)х(х-\)(х-2) 11 * ,7 13 ¦ 25 *" 4х Ых- П "г"' 24(* + 2) 6(x+l) l Ax b(x— 1) ~ 24 (jc — 2) ' Пример 2. Разложить над полем R дробь —^ . X -р 1 Сперва напишем разложение над „С:. Напомним, что корни по- полинома F(x) = x2n + 1 лежат на единичной окружности и попарно ы ™* Bfe— \)л ... Bk— 1)я сопряжены. Именно, с корнями xk = cos т- J- г sin——~—г—, k = \, 2, ..., п, сопряжены корни Xk = x2n+v-k- Корни по- парио различны, так что формула Лагранжа применима. Имеем F'(x) = 2пх2п-\ откуда F' (хк) = 2nxf -1 == Znx^xf = — 2/wj'. По формуле Лагранжа v2« 4-1 2п Z-i х — х. 2п Lj х — xh ч Объединив теперь комплексно сопряженные слагаемые, получим г - ** = 1 —X COS ¦ x2n+l 2nft=i B* - 1): 2га 2га Lj хг- (xk + xk)x+\ га Z-, „ Bfe-l)w ' Й = 1 \ * «/ feel* — ^л COS ~' ' ¦ -|- 1 Пример 3. Разложить дробь — на простейшие над по- X ~~ X лем GF(p) вычетов по модулю р. В силу теоремы Ферма все элементы поля 0, 1, ..., р—1_суть корни полинома F(x) = xp — х, так что х? — х = х(х— 1) ... "... {х — р — 1). Имеем F'(x) = рхр~1 — 1 = —1. Следовательно, р-1 1 i хр — х ?¦* х — k
|4] ИНТЕРПОЛЯЦИЯ 191 § 4. Интерполяция 1. Постановка задачи. Слово «интерполяция» хорошо знакомо. Под этим термином понимается разумный способ вычисления функции, заданной таблицей, в точках, не вошедших в таблицу. Б этой ситуации обычно применяется линейная интерполяция, со- состоящая в том, что функция на промежутке между соседними таб- табличными значениями приближенно заменяется линейной функцией, так что в- целом функция заменяется на кусочно линейную. Сход- Сходная задача возникает при обработке результатов эксперимента. Пусть экспериментально определяются значения некоторой функ- функции в ряде точек. Требуется построить экспериментальную фор- формулу, позволяющую вычислять значения функции в точках, для которых эксперимент не проводился. В общем виде задачу об интерполяции можно сформулировать так. Дана таблица, в которой значениям независимой переменной сопоставлены значения функции. Требуется найти функцию с та- такой таблицей значений. Разумеется, п такой постановке задача совершенно неопределенная, и для внесения большей определен- определенности должен быть указан класс допустимых функций (например, класс кусочно линейных функций для линейной интерполяции). Сейчас мы рассмотрим задачу о построении полинома наимень- наименьшей степени, принимающего данную таблицу значений. Пусть х *' Хг ''' *" — данная таблица значений. Разумеется, У I У\ Уг • ¦ • Уп числа х\, х2, ..., хп должны быть попарно различны, ибо одина- одинаковым значениям х мы должны приписать одинаковые значения для у и нет оснований повторять одно и то же условие два или большее число раз. У нас имеется п условий. Полином, имеющий п коэффициентов, есть полином степени п—1. Поэтому естествен- естественно искать решение задачи в виде полинома степени и —1: Поставленные условия означают выполнение равенств: Мы получили систему п линейных уравнений с п неизвестными во, ах, ..., an-i- Определитель из коэффициентов этой системы есть уже знакомый определитель Вандермонда
192 ПОЛИНОМЫ И ДРОБИ [ГЛ. VI Он отличен от нуля, ибо все х? попарно различны. Следовательно, задача имеет единственное решение. Оно дает интерполяционный полином, степень которого не превосходит п — 1 (она может ока- оказаться меньше п—1, если один или несколько старших коэффи- коэффициентов окажутся равными нулю). Интерполяционный полином степени п — 1 или меньше является интерполяционным полиномом наименьшей степени, ибо среди полиномов степени меньше п он существует только один и все другие интерполяционные полиномы имеют степень п и выше. 2. Интерполяционная формула Лагранжа. Для интерполяцион- интерполяционного полинома степени не большей п—1 существует несложная формула. Ее можно получить из решения системы линейных урав- уравнений предыдущего пункта, но мы ее выведем чрезвычайно крат- кратким, но искусственным путем, используя формулу Лагранжа для разложения дроби на простейшие. Пусть х, *' Хг ¦¦¦ Хп _ данная таблица значений, xt Ф х,- и У I 2/t У 2 • ¦ ¦ У и f(x) — интерполяционный полином наименьшей степени. Обозна- Обозначим F(x) = (x— х\)(х — Х2) ... (х — х„) и рассмотрим рациональ- f (х) ную дробь р, . . Она правильная, ибо степень числителя меньше п, и мы можем применить формулу Лагранжа для разложения дроби на простейшие. Получим fix) A f(xk) F(x) fa F'{H){*-4)' В правой части равенства все известно, ибо f(Xk) = yk- Умножив на F(x), получим искомую формулу: f(xk) F(x)_ ¦ х. k=i F' (xk) х~лк Эта формула очень удобна для теоретических исследований, но не удобна для практического вычисления интерполяционного по- полинома. Например, для функции, заданной таблицей х\ 1 2 3 4 JI2345 интерполяционным полиномом является, очевидно, х-\- 1. По фор- формуле же Лагранжа, исходя из F(x) = (x—I) (х—2) (х—3) (х—4), мы придем к тому же результату лишь после некоторых
§ 4] ИНТЕРПОЛЯЦИЯ 193 преобразований: / (*) = ТГв (* - 2) (* - 3) (* - 4) + ¦§¦ (* - 1) (* -- .3) (х - 4) + J _!)(*_ 2)(х-4)+ ¦-(*-1)(*-2)(*-3)- ^ 24) + j{x3 — 8х2 + 19* — 12) — Обратим внимание еще на одно обстоятельство. Если окажется, что нужно расширить таблицу данных, то построение интерполя- интерполяционного полинома по формуле Лагранжа заставляет выполнить пересчет с самого начала — изменится полином F и значения его производных. Выведем теперь из формулы Лагранжа некоторые интерес- интересные и нетривиальные тождества. Пусть, как прежде, F(*) = = (х — xi) {x — х2) ...(х — Хп) при хсфХ). Положим f(x)'=xs, где s ^ п — 1. Получим: V^ Хи Г (Х) Zj F' (хь) х — х. к-\ v *' " Сравним коэффициенты при хп~х в обеих частях равенства. Ясно, что —-^— есть полином степени п — 1 со старшим коэффи- циентом 1. Следовательно, при s^O, I,..., n — 2, 3.' Способ интерполяции Ньютона. Способ основан на последо- последовательном решении интерполяционных задач: X | Х} Х\Х\ Х2 Х\ХХ Х2 ... Хп У\У1 ' У I У1 У2 ' " '' У\У\ У2 ..-Уп ' Интерполяционные полиномы для этих задач обозначим через fu /2, • • •. fn- Решением первой задачи является, очевидно, кон- константа /i = y\. Сравним решения двух соседних задач /*_i и /*. Разность fk — fk-i полиномов fk и fh-i обращается в 0 при х = хи х — х2, ..., х — Xk-i и, следовательно, делится на (х — xi) (x — х2) ... (x — Xk-i). Степень fn — fk-\ не превосходит k — 1. Поэтому частное есть константа, т. е.
194 полиномы и дроби [гл vi Положим в этом равенстве х = Xk. Получим откуда я _ _Ук-1к-А*к) Следовательно, решение последней интерполяционной задачи есть /== U = А\. + А2(х — xi) + А3{х — xi) {x — х2) + ... ... + Аа (х — xi) (х — х2) ... (х — хп-\), где коэффициенты Ак вычисляются последовательно по выведен- выведенным выше формулам. Для коэффициентов можно дать довольно громоздкие выраже- выражения непосредственно через данные задачи, в форме так называе- называемых разделенных разностей. Мы не будем на этом останавли- останавливаться. При фактическом вычислении интерполяционного полинома целесообразно записать его в форме Ai + А2{х — хх) + А3(х — xi) (х — х2) + ... с неопределенными коэффициентами и затем находить их, после- последовательно полагая х = хи х = х2, .... х = хп. Например, для рассмотренной выше таблицы х\ 1 2 3 4 у |2 3 4 5 запишем Получим при x=*l: 2 = Ai; при х =2: 3 = 2 +А2, Л2=1; при х = 3: 4 = 2+1-2 + 2А3, А3 «= 0; при х = 4: 5 = 2+1-3 + 6Л4. Л -= 0. Итак, f (х) =• 2 + (х — 1) = х + 1. 4. Приближенная интерполяция. Задача о приближенном ин- интерполировании особенно существенна при обработке эксперимен- экспериментальных данных. Их, как правило, нельзя считать абсолютно точ- точными, и строить точный интерполяционный полином не имеет Смысла. Часто оказывается целесообразным выбирать полином ёозможно более низкой степени так, чтобы он удовлетворял по- поставленным требованиям приближенно, но наилучшим образом в том или ином смысле. Степень полинома обычно подсказывается условиями задачи, требующей интерполяции.
§ 4] ИНТЕРПОЛЯЦИЯ 195 Итак, пусть дана таблица данных X | Х\ Х2 ... Хп У\У> Уг---Уп и требуется найти полином f(x) степени т < п—1, приближенно принимающий данные значения. Числа уи — f{Xk) носят название невязок, они в совокупности должны быть малы. Основные кри- критерии этой «совокупной малости» следующие. I. Требуется подобрать f(x) так, чтобы наибольшая по модулю невязка была возможно меньше. II. Требуется подобрать f(x) так, чтобы сумма модулей невя- невязок была возможно меньше. III. Требуется подобрать f(x) так, чтобы сумма квадратов не- невязок была возможно меньше. Решение задачи по первым двум критериям непросто и приво- приводится к довольно сложным экстремальным задачам. Гораздо про- проще решение задачи по третьему критерию. Оказывается также, что этот критерий наиболее приемлем с точки зрения теории вероят- вероятностей. Рассмотрим задачу подробнее. Речь идет об отыскании коэффициентов а0, аи ..., ат поли- полинома f(x) = ao + а,\Х + ... + атхт, обеспечивающих минимум вы- выражения п E(i/A-«о-«л- ••• -WeJ- Это выражение есть полином второй степени относительно неиз- неизвестных а0, аи ..., "ат. Абсолютный минимум (как функции т + 1 переменных) будет также минимумом этого выражения, рассма- рассматриваемого как функция одного из коэффициентов при фиксиро- фиксированных остальных. Поэтому все частные производные по ао, аи ... ..., ат в точке минимума равны нулю. Приравнивая их нулю, получим систему линейных уравнений. Оказывается, что эта си- система имеет единственное решение, и оно действительно дает ми- минимум. Рассмотрим, например, таблицу х\ 1 2 3 4 у\ 1,5 1,2 0,8 0,5 Мы видим, что у — почти линейная функция от х в пределах табличных значений, так что ищем решения в виде полинома пер- первой степени f(x) = ax + b. Сумма квадратов невязок равна: ф = (а + Ь — 1,5J + Bа + Ь — 1,2J + (За + Ь — 0,8J + + Dа + Ь -0,5)»,
196 ПОЛИНОМЫ И ДРОБИ (ГЛ. VI Вычисляем производные по а и по 6: 5~ ~з— = (а + 6 — L,5) + 2 Bа + 6 — 1,2) + 3 (За + 6 — 0,8) + + 4 Dа + 6 - 0,5) = 30а + 106 — 8,3; + Dа + 6 — 0,5) = 10а + 46 - 4,0, Решаем систему уравнений: 30а + 106—8,3 = 0, 10а+ 46 —4,0 = 0. Получаем: а = —0,34, 6 = 1,85, так что решением задачи является /(*) =-0,34*+1,85. Сравним значения этого полинома с данными задачи: дс ] 1 2 3 4 у\ 1,51 1,17 0,83 0,49 Максимальный модуль невязки равен 0,03. Если значения для у измерялись с точностью до 0,05, то построенный полином дает вполне удовлетворительную точность.
ГЛАВА VII СРАВНЕНИЯ В КОЛЬЦЕ ПОЛИНОМОВ И РАСШИРЕНИЯ ПОЛЕЙ § 1. Сравнения в кольце полиномов над полем 1. Кольцо вычетов по полиному. Рассматривается кольцо по- полиномов К[х] над полем К. Пусть / — данный полином. Два поли- полинома gi и g-2^K[x] называются сравнимыми по модулю f, если их разность gi— gi делится на f. Сравнение обозначается так: g! == g2(modf). Справедливы следующие предложения: Предложение 1. Если gt = g3(mod/) и g2 = gi(mod/), то gi ± g2 = gz.± g4(mod f). Предложение 2. Если g\ =s g3(modf) и g2 = g\ (mod /), то (df) gf Доказательство ничем не отличается от доказательств анало- аналогичных предложений теории сравнений в кольце целых чисел (предложения 3 и 4 § 2 гл. I). Попарно сравнимые полиномы объединяются в классы. Для классов естественным образом определяются действия сложения и умножения: именно, суммой и произведением классов называется класс, содержащий сумму и произведения каких-либо полиномов из этих классов. Корректность этих определений обеспечивается предложениями 1 и 2. По отношению к этим действиям классы образуют кольцо, коммутативное и ассоциативное. Нулем в этом кольце является класс полиномов, сравнимых с нулем, т. е. деля- делящихся на /. Единицей является класс, содержащий «полином» 1, т. е. множество полиномов, которые становятся делящимися на / после вычитания 1. Все полиномы одного класса по модулю / имеют один и тот же н. о. д. с f. Действительно, если gi = g2 + qf, то всякий общий делитель g2 и / делит gi и всякий общий делитель gi н f делит g2. Класс называется примитивным, если входящие в него полиномы взаимно просты с модулем. Класс называется обратимым, если для него существует обратный, т. е. такой, произведение которого й данным равно единичному. Предложение 3. Обратимыми являются примитивные клас~ сы и только они. Доказательство. Пусть g принадлежит примитивному классу, так что (g, /)= 1. Тогда найдутся полиномы М, N из кольца К[х] такие, что gM + fN= 1. Ясно, что gM s= l(modf), так что М принадлежит классу, обратному к классу, содержа- содержащему g.
198 СРАВНЕНИЯ В КОЛЬЦЕ ПОЛИНОМОВ, РАСШИРЕНИЯ ПОЛЕЙ [ГЛ. VII Пусть теперь класс, содержащий g, обратим. Это значит, что для полинома g найдется такой полином М, что gM s= l(mod/). Обозначив через N частное от деления 1 — gM на /, получим gM -f- fN = 1, а это и означает, что g и f взаимно просты. Из доказанного предложения немедленно следует Предложение 4. Кольцо вычетов по модулю неприводи- неприводимого полинома есть поле. Действительно, в этом случае все классы, кроме нулевого, об- обратимы. Если же полином / приводим, то кольцо вычетов по модулю ] не только не поле, но даже не область целостности. Действи- Действительно, пусть f = fi/2, где /i, f2^K[x] отличны от констант. Тогда содержащие fi и f2 классы отличны от нулевого, но их про- произведение есть нулевой класс. 2. Значения рациональных дробей. Пусть К(х) — поле рацио- рациональных дробей от буквы х над полем К, fit — какое-либо расши- расширение поля К. Пусть а е Ж. Если для дроби — элемент а явля- S ется корнем для знаменателя и не является корнем числителя, говорят, что — имеет полюс в точке а. Если g{a)=?0, то имеет смысл значение ±^г дроби. Если числитель и знаменатель умно- умножить на один и тот же полином, не обращающийся в нуль при а, то значение дроби, очевидно, не меняется. Следовательно, оно не меняется и при сокращении. Если дробь несократима, т. е. если ее числитель и знаменатель взаимно просты, то они не могут обра- обращаться в нуль одновременно, так что если а не является полюсом дроби, то имеется ее значение в а, которое принимается за зна- чение дроби независимо от ее записи. Так, дробь 2_ 4 имеет значение при х = 2, хотя знаменатель и обращается в 0 в этой 1 * Л х—2 1 точке, именно, это значение равно -^, ибо х2 _ = . 2 . § 2. Расширение полей 1. Простое расширение поля. Пусть дано поле К, содержащее его поле $, и ае,$?. Рациональные дроби поля К(х), не имеющие а полюсом, имеют значения в а, принадлежащие полю Ж. Множе- Множество значений ". всех дробей — <= К (х) образует, очевидно, поле. Действительно, если а не является полюсом для -~ и для -^- то а не будет полюсом для их суммы, разности и произве- дения, так что если значения -— и —— в а имеют смысл, то имеет
§ 2] РАСШИРЕНИЕ ПОЛЕЙ 199 смысл значение в а для их суммы, разности и произведения. Да- Далее, если -^~ Ф 0, то /(а)=И=0, так что дробь 4- не имеет а полюсом и имеет значение в а. Ясно, что f >? = ( , ,Л . Так построенное поле обозначается через К (а) и называется простым расширением поля К посредством присоединения а. Элемент а е $ называется трансцендентным относительно поля /С, если он не является корнем какого-либо ненулевого поли- полинома с коэффициентами из К. Если же а является корнем неко- некоторого полинома из /([*], то а называется алгебраическим отно- относительно К. Алгебраический элемент а является корнем однознач- однозначно определенного неприводимого полинома (р^К[х]. Действи- Действительно, если /(а) = 0 при некотором f^K[x] и / = ф1ф2 ... срт — разложение f на неприводимые над К множители (допускаются равные множители), то q>i(a)cp2(a) ... фт(а)=0, и, так как все ф1(а), ..., фт(а) принадлежат полю $, должен равняться нулю один из сомножителей ф;. Если два нормализованных неприводи- неприводимых полинома имеют корнем а, то они не взаимно просты и, сле- следовательно, совпадают. Числа, трансцендентные и алгебраические над полем Q рацио- рациональных чисел, носят названия, соответственно, трансцендентных и алгебраических чисел. Так, числа i, л/2, л/Ъ алгебраические, в то время, как числа е, я, 2 трансцендентные, что доказано в работах выдающихся ученых 19-го и 20-го веков. Простые расширения, получающиеся посредством присоединения трансцендентного элемента, называются простыми трансцендент- трансцендентными расширениями, расширения же посредством алгебраического элемента называются простыми алгебраическими расширениями. Рассмотрим подробнее строение простых трансцендентных и алге- алгебраических расширений. Если а е $ трансцендентен относительно К, то а не может быть полюсом ни одной из дробей поля К{х), ибо не может быть корнем полинома, находящегося в знаменателе. Поэтому каждая дробь — имеет значение \ . Разные дроби имеют разные зна- значения. Действительно, если ' =' , то f\(a)g2(<z)—¦ '—/2 («)§¦( (a) = 0, откуда следует, что полином f[g2 — ^1 равен нулю в силу трансцендентности а, так что дроби -^- и — равны. Итак, между дробями поля К{х) и их значениями в а имеется взаимно однозначное соответствие, которое, очевидно, сохраняется при действиях сложения и умножения. Таким образом, поле К(х) и поле К (а) изоморфны. Тем самым мы установили, что все про- простые трансцендентные расширения изоморфны между собой, ибо
200 СРАВНЕНИЯ В КОЛЬЦЕ ПОЛИНОМОВ, РАСШИРЕНИЯ ПОЛЕЙ [ГЛ. VII они все изоморфны полю дробей К(х). Разумеется, само поле К(х) тоже является простым трансцендентным расширением поля К, ибо х не является корнем полинома с коэффициентами из К (в ка- качестве объемлющего поля j?, содержащего поле К и х, можно взять само К(х)). Пусть теперь а е $ алгебраично над К и ср е К [х] — неприво- неприводимый над К полином, корнем которого является а. Пусть, далее, jG/((x)— несократимая дробь, для которой а не является по- полюсом, т. е. g (а) =7^=0. Это значит, что полином g взаимно прост с неприводимым над К полиномом ф. Поэтому существуют полиномы М, N^K[x] такие, что gM + фЛ' = 1. Переходя к значениям при а, получимg(а)М(а) = 1, так что—т-у = М(а) и -Ц^г = /(«)М (а). Таким образом, значение дроби — оказывается равным значению полинома fM. Далее, полиномы из К[х] имеют одинаковые значе- значения в а в том и только в том случае, когда они сравнимы по мо- модулю ф. Действительно, если /i =/2 (mod ф), то /i — f2 = ф<7 и fi(a) — f2(a) — (p(a)q(a)= 0. Обратно, если /i(a) = /2(a), то по- полином /i — f2^K[x] имеет общий корень с неприводимым над К полиномом ф и, следовательно, делится на него, т. е. fi = f2 Ax100*9). Итак, мы получили взаимно однозначное соответствие между клас- классами по модулю ф и значениями полиномов F ^ К[х] в точке а. Ясно, что это соответствие сохраняется при сложении и при умно- умножении. Таким образом, алгебраическое расширение К (а) оказы- оказывается изоморфным полю вычетов кольца К[х] по модулю непри- неприводимого полинома ф, корнем которого является а. Таким образом, это поле вычетов оказывается абстрактной изо- изоморфной моделью, не зависящей ни от того поля $, из которого взято а, ни от выбора корня полинома ф. Так, например, полином Xs — 3, неприводимый над полем рациональных чисел (если бы был приводим, то имел бы рациональный линейный множитель и рацио- рациональный корень), имеет в поле С комплексных чисел три корня а, = лУз, а2 = л^3р и а3 = ^3р2, где р = e24il3, но все три поля Q (л/ъ ), Q (^3 р) и Q (л^З р2) изоморфны полю вычетов кольца Q [х] по модулю полинома х3 — 3 и, следовательно, изоморфны между собой, хотя множества чисел, их составляющих, различны. Так, поле Q (л^з) состоит только из вещественных чисел, а элемен- элементами поля Q (\/з р). кроме элементов Q, являются комплексные числа с отличной от нуля мнимой частью. Заметим еще, что поле С комплексных чисел получается из поля R вещественных чисел присоединением корня неприводимого над R полинома х2+1. Поэтому оно изоморфно полю вычетов кольца R[x] по модулю полинома я2+1. Это дает один из спо- способов обоснования понятия комплексного числа. (Комплексными числами называются классы вычетов кольца R [л] по полиному
§ 2J РАСШИРЕНИЕ ПОЛЕЙ 201 х2 + 1. Обозначив класс, содержащий х, через i, получим, что все комплексные числа имеют вид а-\-Ы при a, JeR. Так как х2 е= —1 (modx2 + 1), то i2 = —1 и т. д.). Вычисление, посредством которого значение дроби — на алге- б браическом элементе преобразуется в значение полинома, назы- называется исключением иррациональности в знаменателе. Пример. Исключить иррациональность в знаменателе выра- выражения 2 "_~^ , 1 , где а — корень полинома х3 — х—1. Мы знаем, что результат может быть единственным образом представлен в виде Аа2 -f- Ва -f- С. Записав равенство а» ¦ а ¦ t ^ = Ла2+Ва+С, получим, что а + 1 = (Аа2 + Ва + С) (а2 + а + + 1)= Ла4 + (Л + Я)а3 + (Л+В+С)а2 + (В + С)а + С. Далее, а3 = а + 1 и а4 = а2 + «¦ Поэтому а + 1 = Л (а2 + а) + (Л + В) (а + 1) + (Л + В + С)а2 + + (В+С)а+С. В силу однозначности записи в виде полинома от а не выше вто- второй степени, получаем 2Л + В + С = 0, Получилась система трех линейных уравнений с тремя неиз- неизвестными, и мы знаем заранее, что она имеет единственное ре- решение. Мы легко его найдем: Л = —1, В= 1, С= 1. Итак, «+ t „2 I „ ! 1 —5~~i 1—Г" — ^ +8+ 1. а2 + а + 1 ' ' 2. Конструирование простых расширений. Результаты п. 1 показывают, что с точностью до изоморфизма можно конструиро- конструировать простые расширения поля К, не обращаясь к рассмотрению поля ®, из которого берутся присоединяемые элементы. Так, про- простое трансцендентное расширение есть поле рациональных дро- дробей К(х) от некоторой буквы. Простое трансцендентное расшире- расширение поля К(х) есть поле рациональных дробей от буквы у с коэф- коэффициентами из К(х). Каждую такую дробь посредством умноже- умножения на произведения всех знаменателей коэффициентов при у F(x, у) можно привести к виду Qv ' ' частного двух полиномов от х и у, так что двукратное трансцендентное расширение приводит к полю частных кольца полиномов от двух букв, и т. д. Алгебраические же расширения можно конструировать как поля вычетов кольца полиномов по неприводимым полиномам. Рассмотрим еще один пример. Мы выяснили раньше, что над полем из двух элементов имеется один неприводимый полином ** + х + 1 второй степени.
202 СРАВНЕНИЯ В КОЛЬЦЕ ПОЛИНОМОВ. РАСШИРЕНИЯ ПОЛЕП [ГЛ. VII Поле вычетов по нему состоит из четырех элементов 0, 1, р, р+1, где через р обозначен класс, содержащий х. Сложение в этом поле совершается естественным образом, только характери- характеристика поля равна 2, так что сложение каждого элемента с собой дает 0. Умножение же характеризуется тем, что р2 -f- р + 1 = 0, т. е. р2 = р -f- 1. Как уже говорилось выше, над полем вычетов GF(p) по про- простому модулю р существуют неприводимые полиномы любой сте- степени. Поле вычетов по модулю неприводимого полинома степени п имеет рп элементов, ибо каждый элемент такого поля можно однозначно записать в виде полинома степени п—1 или ниже, и для коэффициентов таких полиномов имеется ровно рп возмож- возможностей. Оказывается, что все такие поля изоморфны, так что раз- различные неприводимые полиномы степени п приводят к изоморф- изоморфным полям вычетов. Так построенные поля из рп элементов носят название полей Галуа и обозначаются GF(p"). Доказывается, что никаких других полей из конечного числа элементов не существует.
ГЛАВА VIII ПОЛИНОМЫ С ЦЕЛЫМИ КОЭФФИЦИЕНТАМИ. ПОЛИНОМЫ НАД ФАКТОРИАЛЬНЫМИ КОЛЬЦАМИ § 1. Полиномы с целыми коэффициентами Полиномы с рациональными коэффициентами и полиномы с целыми коэффициентами тесно связаны между собой, ибо каждый полином с рациональными коэффициентами может быть превра- превращен в полином с целыми коэффициентами посредством умножения на общий знаменатель коэффициентов. Изучение кольца Z [х] по- полиномов с целыми коэффициентами интересно также потому, что Z [л] есть простейший пример кольца полиномов над факториаль- ным кольцом. 1. Рациональные корни полиномов с целыми коэффициентами. Теорема 1. Если несократимая дробь — является корнем полинома пйХп + а\хп~1 + ... +а«, ап=?0, с целыми коэффи- коэффициентами, то ее числитель является делителем свободного члена, а знаменатель q — делителем старшего коэффициента. ) + #1 ( ) + • • • . ..+а„_, ~ + ап = 0. Тогда aQpn + aip"-lq+ ... -f an^pqn~l +i 4-а„<7" = 0 и anqn = p(—a0pn-i — aipn-2q—...—an-iq"-1). Та- Таким образом, число anqn делится на р в кольце целых чисел. По условию q и р взаимно просты, следовательно, ап делится на р. Аналогично, из равенства заключаем, что по делится на q. Доказанная теорема дает возможность найти рациональные корни полинома с целыми (следовательно, и с рациональными) коэффициентами в конечном числе действий. Именно, нужно найти все делители свободного члена и все делители старшего коэффи- коэффициента, составить из них несократимые дроби и испытать посред- посредством подстановки в полином. Если во всех случаях испытание даст отрицательный результат, то это значит, что полином не имеет рациональных корней. Сделанное в теореме предположение о неравенстве нулю свободного члена не ограничивает общности: если свободный член и, быть может, еще несколько младших коэффициентов обращаются в 0, то можно вынести из полинома надлежащую степень х так, чтобы после вынесения остался поли-
204 ПОЛИНОМЫ С ЦЕЛЫМИ КОЭФФИЦИЕНТАМИ [ГЛ. УПГ ном с отличным от нуля свободным членом. Этот полином будет иметь те же ненулевые корни, что и исходный. Отметим следующее следствие. Если ао= 1, то все рациональ- рациональные корни полинома являются целыми числами, именно, дели- делителями свободного члена. Пример. Зх2—10x-f-3. Кандидатами в корни, согласно тео- теореме, являются числа 1, —1, 3, —3, 1/3, —1/3. Подстановка в по- полином дает, что корнями являются 3 и 1/3. 2. Редукция полиномов с целыми коэффициентами по число- числовому модулю. Пусть т — целое положительное число. Два по- полинома fi(x) и f2(x) называются сравнимыми по модулю т, если все коэффициенты их разности делятся на т. Полиномы разби- разбиваются на классы сравнимых по модулю т. Все коэффициенты полиномов из одного класса определены с точностью до целых кратных т, т. е. класс естественно отождествляется с полиномом, коэффициенты которого принадлежат кольцу вычетов Z/mZ. Со- Совершенно ясно, что если fi = f2(modm) и f3 = Mmodm), то /i ± /з = /г ± /4 (mod hi) и f 1/3 = /2/4 (mod m). Поэтому для клас- классов по модулю т естественным образом определяются сложение и умножение, и эти действия совпадают с действиями сложения и умножения полиномов с коэффициентами из кольца вычетов Г~П , Г-п ?1т?. Особый интерес представляет редукция по простому модулю, так как в результате редукции получаются полиномы над полем GF(p), и их множество образует область целостности. Полином из Z [х] называется примитивным, если наибольший общий делитель его коэффициентов равен 1. Так, полином 3xs—10х + 6 примитивен, а 2х3—10x4-6 не примитивен. Предложение 2 (лемма Гаусса). Произведение двух при* митивных полиномов есть примитивный полином. Доказательство. Пусть fi и f2^Z[x]— примитивные по- полиномы. Допустим, что их произведение f\f2 не примитивно. Обо- Обозначим через р какой-либо простой делитель наибольшего общего делителя коэффициентов fif2. Тогда fj2 z=f\f2 = 0 (черточка обо- обозначает результат редукции). Так как кольцо полиномов над по- полем GF(p) есть область целостности, один из сомножителей дол- должен равняться нулю, а это значит, что все коэффициенты ft или f2 делятся на р, что противоречит предположению о примитив- примитивности. 3. Теорема Гаусса и факториальность кольца Z [х]. Предложение 3. Пусть f == аохп + а\хп~х + ¦ • • + ап — при- примитивный полином, Ъ — рациональное число такое, что bf имеет целые коэффициенты. Тогда Ъ — целое число. Доказательство. Пусть Ь —-г— несократимая дробь. По са. условию, все числа bat = -~ целые, 1 = 0, .... п.
§ 1] ПОЛИНОМЫ С ЦЕЛЫМИ КОЭФФИЦИЕНТАМИ 206 Числа cud взаимно просты, следовательно, все а,- делятся на d, что возможно только при d = 1, в силу примитивности f. Теорема 4 (теорема Гаусса). Если полином с целыми коэф- коэффициентами раскладывается на два множителя над полем рацио- рациональных чисел, то он может быть разложен на множители с це- целыми коэффициентами, именно, представлен в виде произведения целого числа на произведение примитивных полиномов. Отсюда следует, что если полином с целыми коэффициентами приводим над полем рациональных чисел, то он приводим и над кольцом целых чисел. Доказательство. Пусть feZ[jc] и / = fi/2, где /i и f2 — полиномы с рациональными, быть может дробными, коэффициен- коэффициентами. Обозначим через N[ и N2 общие знаменатели коэффициен- коэффициентов полиномов /] и f2. Тогда /i = -rr-fi, f2==~rrf2< гДе /i и h имеют уже целые коэффициенты. Пусть Мх и М2 — наибольшие общие делители коэффициентов полиномов f\ и f2 соответственно. Тогда f 1 = MJ] и f2 = M2f2, где fi и f2 — уже примитивные полиномы. Тогда f ;i М\Мг f f Г — Ыа—щщ-Tih' По лемме Гаусса fif2 есть примитивный полином и, согласно предложению о, рациональное число о = в действительности целое. Итак, f=bflf2, где Ь — целое число, fj и f2 — примитив- примитивные полиномы. Теорема доказана. Очевидно, что результат остается верным, если / есть произ- произведение нескольких полиномов с рациональными коэффициентами, именно, после вынесения общих знаменателей коэффициентов и наибольших общих делителей коэффициентов получившихся поли- полиномов мы получим, что / есть произведение целого числа на про- произведение примитивных полиномов, отличающихся от полиномов исходного разложения лишь числовыми множителями. Очевидно, что примитивные полиномы могут быть ассоциированы, только если они совпадают или отличаются множителем —1. Теорема 5. Любой полином с целыми коэффициентами мо- может быть представлен в виде произведения простых чисел и не- неприводимых над Q примитивных полиномов. Такое разложение единственно с точностью до порядка следования сомножителей и присоединения к сомножителям множителя —1. Действительно, от разложения / = ф]ф2 ... ф* полинома / е е Z [х] на неприводимые множители над Q мы можем, в силу теоремы Гаусса, перейти к разложению f = &if>ii{>2 ... tyk, где b — целое число, а примитивные полиномы i)>b if>2, ¦ • ¦, "Ф* отличаются от полиномов фь фг, ..., фй лишь числовыми множителями. Тем самым сомножители if>i, if>2, ... > tyk определены однозначно, с точ-
206 ПОЛИНОМЫ С ЦЕЛЫМИ КОЭФФИЦИЕНТАМИ {ГЛ. VIIB ностью до порядка следования сомножителей (который совпадает с порядком следования <рь фг, ..., <р*) и множителей ±1. В свою очередь, целое число Ь, которое равно, в силу леммы Гаусса, наи- наибольшему общему делителю коэффициентов полинома f, одно- однозначно разлагается на простые множители. Ясно, что простые числа и примитивные неприводимые поли- полиномы являются неразложимыми элементами кольца Z[x]. Тем са- самым доказана Теорема 6. Кольцо Z [х] полиномов с целыми коэффициен- коэффициентами факториально. 4. Задача о приводимости полинома над полем рациональных чисел. Поставленную задачу достаточно исследовать для полино- полиномов с целыми коэффициентами, ибо любой полином из Q [х] ассо- ассоциирован с полиномом из 2[х]. Теорема Гаусса позволяет дать способ разложения полинома с целыми коэффициентами на два множителя или убедиться в его неприводимости над Q. Способ этот теоретически прост, но практически довольно громоздок. Опи- Опишем его. Пусть дан полином f = асхп + а{хп-1 + ••• + ап, a,-eZ, До- Допустим, что он приводим над Q. Тогда существует, согласно тео- теореме Гаусса, его разложение на два множителя с целыми коэффи- коэффициентами: /==/1/2, /ь /г^2[д;]. Сумма степеней fi и /2 равна п, значит, степень одного из них, положим, ft, не превосходит k = = [я/2]. Мы знаем, что полином, степень которого не превосходит k, вполне определяется, если для него известно k -f- 1 значение, согласно решению задачи об интерполяции. Возьмем k + 1 целых значений для х: Хо, Х\, . . . , Xk, X; =?= Xj, Xi €=.?¦. Если произойдет такое счастливое обстоятельство, что одно из выбранных чисел окажется корнем полинома f, то задача решена, / приводим, и мы можем написать его разложение на два сомно- сомножителя. Положим теперь, что f(xi)=?O при i = 0, 1, ..., k. Из равенств fl(Xl)f2{Xi)=f{Xi) заключаем, что числа fi(xi) нам «почти» известны. Действительно, fi{xi) и fi{xi) — целые числа, так что fi(xt) является одним из де- делителей известного нам числа f(xt). Для fi(xt) имеется конечное число возможностей. Обозначим через tt число делителей числа f(xi). Составим таблицы y\dQd{...dk расставляя в нижние строки наборы из всевозможных делителей чисел f(x0), f{x\), ..., f(xk). Число таких таблиц конечно и равно toti ... tk, ибо i-e место в нижней строке можно заполнить tt спо- способами. Построим для каждой таблицы интерполяционный поли-
$ I] ПОЛИНОМЫ С ЦЕЛЫМИ КОЭФФИЦИЕНТАМИ 207 ном. Если / приводим, то его множитель f\ найдется среди по- построенных полиномов. Поэтому, построив интерполяционные поли- полиномы, нужно выбросить те, у которых имеется хотя бы один дроб- дробный коэффициент (ибо искомый fi имеет целые коэффициенты), а полиномы с целыми коэффициентами испытать посредством де- деления на них полинома /. Если испытание в каком-то случае даст положительный результат, то полином f приводим, и мы нашли его разложение на два множителя. Если же испытание во всех случа- случаях даст отрицательный результат, то полином / неприводим. Тем самым поставленная задача решена в конечном числе действий. 5. Редукционный признак неприводимости полинома. Теорема 7. Пусть р — простое число, f = аох" + ... + апs eZ[4 а0 Ф 0(modp) и редукция J полинома f no модулю р не- приводима. Тогда f неприводим над Q. Доказательство. Если f приводим над Q, то по теореме Гаусса имеет разложение на множители с целыми коэффициен- коэффициентами f = fif2, ГДе fi = Ь0Хт + . . . + bmji ft = C0Xk + ... + Ck, ПрИ m^j и k ^ 1. Из a0 = boco и ао^=О заключаем, что Б0ф0 и со^=б. Таким образом, J = f1f2, fl = B_oxm+ ... +5m и ]2 = = cqxh + ... + ik. Оба полинома fi и f2 отличны от констант. Мы пришли к противоречию с условием, которое и доказывает теорему. Пример. Легко установить, что полином х4 + х3 + х2 + х + 1 неприводим по модулю 2. Отсюда следует, что любой полином четвертой степени с нечетными коэффициентами неприводим над Q. 6. Признак неприводимости Эйзенштейна. Теорема 8. Пусть р — простое число, f = аохп-{- а\Хп-г -f-... ... |a»eZ [x], aQ^Q(modp), а; = 0(тос1р) при i—l, ..., п и ап Ф 0 (mod p2), Тогда f неприводим над Q. Доказательство. Пусть / приводим над Q и пусть / = = fi/2, где fl = boxm+ ... +bm, /2 = cox*+ ... +cft, m^l, k ^ 1, — разложение f на множители с целыми коэффициентами, которое существует в силу теоремы Гаусса. Переходим к редукции по модулю р. Ясно, что f = аохп и J — = hh- Одночлен х неприводим над GF(p) и, в силу однозначности канонического разложения над полем, заключаем, что fi = Вохт и f2 = coxk. Поэтому все коэффициенты, кроме старших, полиномов f\ и /г делятся на р. В частности, Ьт = 0(тойр) и ck =s 0(modp). Следовательно, ап = bmck делится на р2, что противоречит усло- условию теоремы. Это противоречие доказывает теорему. Пример 1. хп + 2Ьххп-х + ... +26„_,х + 46п + 2 при Ьи Ь2, ..., J,gZ неприводим над Q в силу применимости признака Эйзенштейна для р = 2. Пример 2. f = ^~-= jcp-i_j_xp-2_(_ ._ _(_ if p_ простое число. Здесь признак Эйзенштейна непосредственно не применим.
208 ПОЛИНОМЫ G ЦЕЛЫМИ КОЭФФИЦИЕНТАМИ П"Л. VHI Рассмотрим полином g(y)!naf(y + 1). Ясно, что полиномы fug приводимы или неприводимы над Q одновременно. Имеем: Простое р входит в числитель всех коэффициентов, начиная со второго, и не входит в знаменатель k\. Поэтому все коэффициен- коэффициенты, начиная со второго, делятся на р, а свободный член р не де- делится на р2. По признаку Эйзенштейна полином g, а вместе с ним и полином /, неприводим над Q. § 2. Полиномы от одной буквы над факториальным кольцом 1. Наибольший общий делитель элементов факториального кольца. Пусть А — факториальное кольцо. Наибольшим общим делителем двух (или нескольких) элементов А называется общий делитель, делящийся на любой общий делитель тех же элементов. Докажем, что для любых элементов факториального кольца наи- наибольший общий делитель существует. Доказательство проведем для двух элементов (обобщение на любое конечное множество элементов тривиально). Пусть а = е^^р™2 ... p™h и 6 = e2p"ip?2... ... pnkk — разложение а и Ь на неразложимые множители (здесь «1 и ег — единицы, р\, ..., р* неразложимы, допускаются нулевые показатели). Тогда любой общий делитель элементов а и Ъ содер- содержит каждое р,- с показателем, не превосходящим как /п,-, так и щ. Поэтому d = рГ"(m" "'Vfn(nv ) • • • Pf"(т*' "ft) будет наиболь- наибольшим общим делителем. Заметим, что линейного представления наибольшего общего делителя в факториальном кольце может и не быть. Так, в кольце Z [х] элементы 2 и х неразложимы, их наибольший общий дели- делитель равен 1, но равенство I — 2f-\-xg при /, jeZ[jc], невоз- невозможно, ибо полиномы в правой части равенства имеют четный свободный член. 2. Сравнения в факториальном кольце. Пусть А — факториаль- факториальное кольцо и m — некоторый его элемент. Элементы а, Ъ е А на- называются сравнимыми по модулю пг, что обозначается а = зэ 6 (mod m), если их разность а — Ъ делится на m в кольце Л. Ясно, что все элементы А разбиваются на классы попарно сравни- сравнимых. Далее, очевидные предложения: если а\ = fe[(modm) и а^ =з =з b2(modm), то ах ± а2 = 6, ± &2(mod m) и а^аг = b^Onodm) позволяют превратить множество классов в кольцо, при естествен- естественном определении действий сложения и умножения. Это кольцо на- называется кольцом вычетов по модулю m и обозначается A/tnA,
§ 2] ПОЛИНОМЫ НАД ФАКТОРИАЛЬНЫМ КОЛЬЦОМ 2СЗ Предложение 1. Кольцо вычетов А/рА факториального кольца по неразложимому элементу р есть область целостности. Доказательство. Пусть а, Ь<=А и а, Б — содержащие их классы по модулю р. Допустим, что аВ=О. Это означает, что аЬ Делится на р. Разложим а и Ъ на неразложимые множители. Не- Неразложимый элемент р должен входить в объединение неразло- неразложимых множителей, входящих в а и Ь, в силу однозначности раз- разложения. Следовательно, р входит в а или в Ь, т. е. а = О или 6 = 0. Заметим, что для колец А=*Х и А = К[х] кольцо вычетов было не только областью целостности, но даже полем. Вообще же это не так. Например, для кольца А = Z [х] элементы 2 и х2 + 1 неразложимы. А/2 А есть кольцо полиномов над полем GFB) вы- вычетов по модулю 2, А/(х2-\-1)А изоморфно кольцу комплексных чисел с целыми компонентами. В обоих случаях это не поля, 3. Лемма Гаусса. Полином из кольца полиномов А[х] с коэф- коэффициентами из факториального кольца А называется примитив- примитивным, если наибольший общий делитель его коэффициентов равен 1. Если теД то полиномы из А[х] разбиваются на классы сравнимых по модулю пг, если отнести в один класс те, разность которых имеет коэффициенты, делящиеся на т. Ясно, что для классов единственным образом определяются сложение и умноже- умножение, по отношению к которым классы образуют кольцо, изоморф- изоморфное кольцу полиномов над кольцом А/тА. Предложение 2 (лемма Гаусса). Произведение двух прими- примитивных полиномов из А[х] есть примитивный полином. Доказательство. Допустим, что произведение fif2 двух примитивных полиномов не примитивно. Пусть р — неразложимый элемент, входящий во все коэффициенты fif2. Переходя в кольцо классов вычетов по р в кольце А[х], получим fi/8 —0. Но это кольцо есть кольцо полиномов над областью целостности А/рА, и потому само является областью целостности. Поэтому либо f, = 0, либо U = 0, что противоречит примитивности fi и /г. Ясно, что лемма остается справедливой для произведения лю- любого числа примитивных полиномов. 4. Факториальность кольца полиномов над факториальным кольцом. Пусть А — факториальное кольцо и К — его поле частных. Предложение 3. Если f^A[x] — примитивный полином и с е К такое, что cf e А[х], то се А. Доказательство. Пусть с = -j. Без нарушения общности можно считать, что н. о. д. (b, d) равен 1, ибо если он отличен от 1, то у можно сократить. Пусть f=aoxn-\- ... -f- ап. При любом I atb '—-j-^ А. В силу факториальности А каждый неразложимый мно- множитель d входит в ai, ибо d и b общих неразложимых множителей
210 ПОЛИНОМЫ С ЦЕЛЫМИ КОЭФФИЦИЕНТАМИ 1ГЛ. VIII не имеют. Следовательно, d — обратимый элемент кольца А, иначе f не был бы примитивен, так что с е А. Предложение 4 (теорема Гаусса). Если полином f^A[x] приводим над полем К, то он может быть разложен и над коль- кольцом А. Пусть / = fif2, где fi е К [х] и f2 е К [х]. Запишем fi и /2 в виде t\g\ и c2g2, где с\, с2 е К, a g, и g2 — примитивные полиномы в А[х]. Это всегда можно сделать. Далее, / = Cic2g:g2- В силу леммы Гаусса и предложения 3, схс2 е А. Тем самым теорема доказана. Обратимся теперь к разложению полинома на неразложимые множители. Пусть /еЛ[х] и над полем К разложение f на не- неприводимые множители есть f = ф,ф2 ... ук (равные или ассо- ассоциированные множители допускаются). Каждый ф< представлен в виде Cityt, где с; е К, tyi^A[x] примитивен. Тогда /=c\t>1\f2 ••• ... ф^ где с = Ci ... Ck и, в силу леммы Гаусса и предложения 3, с е j4. Сомножители определены однозначно, с точностью до мно- множителей, являющихся единицами кольца Л. Они неразложимы, ибо неприводимы над К и примитивны, так что не делятся ни на полиномы из А[х], ни на константы из А. Далее, с можно разложить на неразложимые в-Л множители. По- Получим f = Это разложение на неразложимые множители однозначно. Тем самым мы доказали факториальность кольца полиномов от одной буквы над факториальным кольцом. Отсюда немедленно, применением индукции, заключаем, что кольцо полиномов от любого конечного множества букв над фак- факториальным кольцом факториально. В частности, факториальны кольца Z [хи ..., хп] и K[zu ..., zn] при любом поле К. 5. Кольца главных идеалов. Подмножество М коммутативного ассоциативного кольца А называется идеалом этого кольца, если оно образует группу относительно сложения и допускает умноже- умножение на любой элемент из А. Иными словами, если Ь\, Ь2 е Af и а е А, то &i ± Ь2 е М и аЬ\ е М. (Заметим, что понятие идеала естественно распространяется на любые кольца, только в случае некоммутативности, идеалы разби- разбиваются на три сорта — правые, левые и двусторонние, в зависи- зависимости от того, какие умножения на элементы из А допускаются.) Ясно, что если теД то множество пгА всех кратных та эле- элемента т образует идеал. Такой идеал носит название главного идеала, порожденного элементом т. Кольцо называется кольцом главных идеалов, если все его идеалы главные. Предложение 5 (теорема об обрыве цепочки делителей). Пусть а\, а2, ¦¦¦, о-п, ... — бесконечная последовательность эле- элементов кольца А главных идеалов такая, что ai делится на ai+i,
§2] ПОЛИНОМЫ НАД ФАКТОРИАЛЬНЫМ КОЛЬЦОМ 211 {— 1, 2, ... Тогда, начиная с некоторого места, члены последова- последовательности ассоциированы. Доказательство. Рассмотрим главные идеалы а\А, а2А,... ..., апА, ... Так как а\ делится на а2, то а\ е а2А, и, следователь- следовательно, аЙ?а2А По тем же соображениям aiA^a,+lA при всех i. Рассмотрим объединение В всех идеалов aiA. Если bt и Ъ2— два элемента из В, то они входят в идеалы at А и а/А при некоторых i и j и, если / ^ /, оба входят в идеал а/А Следовательно, b\±b2 и Ъ\а при любом а е А входят в а-,А, а следовательно, и в В. Таким образом, множество В есть идеал. Кольцо А есть кольцо главных идеалов и, следовательно, В = ЬА при некотором 6eS. Элемент 6 принадлежит одному из идеалов а,Л, /=1, 2, .... пусть, для определенности, идеалу атА. Тогда b e апА при всех п^ т. Поэтому Ъ делится на все ат, т ^ п. С другой стороны, все а,- принадлежат В = ЬА и, следовательно, все а,-, /= 1, 2, ..., делятся на Ъ. Итак, 6 делится на ат при m Z^n и ат делится на Ъ. Поэтому ат при т^п ассоциированы с Ъ и потому ассо- ассоциированы друг с другом. Теорема доказана. Из теоремы следует, что если имеется последовательность эле- элементов аи п2, .... в которой каждый член последовательности делится на следующий и не ассоциирован с ним, то такая после- последовательность конечна. 6. Существование разложения на неразложимые множители в кольце главных идеалов. Предложение 6. Любой элемент, не являющийся единицей в кольце главных идеалов, делится по крайней мере на один не- неразложимый элемент. Доказательство. Пусть А — кольцо главных идеалов и а е А. Если а неразложим, то нечего доказывать. Пусть а = аф, причем а\ и Ь не являются единицами кольца. Тогда а делится на а\ и а не ассоциирован с аь Если ai неразложим, то теорема для а доказана. Если а\ разложим, то найдется а2 такой, что а{ делится на а% и а\ не ассоциирован с а2- Если а2 неразложим, теорема для а доказана, ибо а делится на а2. Если а2 разложим, повторяем рассуждение и т. д. Последовательность а, аь а%, ... оборвется на каком-то шагу, что и значит, что мы придем к нераз- неразложимому элементу а*, на который делятся все предшествующие, включая а. Предложение доказано. 7. Наибольший общий делитель элементов кольца главных идеалов. Предложение 7. Для любых двух элементов аи а2 кольца А главных идеалов (и для любого конечного множества а\, а2, ... ..., ak) существует общий делитель d, допускающий линейное представление d — п\п\-\-а2и2 (d = а{их -\- а2и2-f ... -f- akuk) и, следовательно, делящийся на любой общий делитель а\ и а2 ,(аи а2, .... ак).
212 ПОЛИНОМЫ С ЦЕЛЫМИ КОЭФФИЦИЕНТАМИ [ГЛ. VIII Такой общий делитель называется наибольшим общим дели- делителем. Доказательство. Рассмотрим множество элементов М = = а\А + а2А = {a\V\ + a2v2\v\, v2^A). Ясно, что М есть идеал, содержащий а^ и а2 (и ими порожденный, т. е. наименьший идеал, содержащий а\ и а2). Следовательно, М — dA, где d— один из элементов М. Все элементы идеала М делятся на d, в частности, а\ и а2 делятся на d. Но d, как и все элементы множества М, имеет линейное представление d= ахи\-\- а2и2 при некоторых щ, ы2е А Ясно, что d делится на любой общий делитель а} и а2, ибо правая часть на него делится. Предложение доказано. (Для до- доказательства предложения для аь а2, ..., at нужно рассмотреть идеал М = а{А -\- а2А -f ... -\-акА.) Из линейного представления наибольшего общего делителя следует критерий взаимной простоты элементов — для того чтобы а\, а2е.А были взаимно просты, необходимо и достаточно суще- существование таки-х и\, й!еД что a\U\ -f- a2u2 = 1. Из этого критерия выводятся свойства взаимно простых элементов, в частности, если «1^2 делится на b, a at и Ъ взаимно, просты, то а2 делится на Ъ. Из этих свойств следуют свойства неразложимых элементов, ана- аналогичные свойствам простых чисел и неприводимых полиномов, в частности,.предложение о том, что если произведение а\а2 ... ат делится на неразложимый элемент р, то на него делится один из сомножителей. Наконец, справедлива Теорема 8. Разложение элемента кольца главных идеалов на неразложимые множители единственно с точностью до порядка следования сомножителей и ассоциированности. Тем самым, любое кольцо главных идеалов является факто- риальным кольцом. Заметим, что кольцо вычетов А/рА кольца главных идеалов по неразложимому элементу р является полем. Действительно, если а принадлежит ненулевому классу по модулю р, т. е. не де- делится на р, то а и р взаимно просты и найдутся такие и, v e А, что au-\-pv= 1, т. е. аи = l(modjo), так что класс, содержащий и, есть обратный для класса, содержащего а. Оглянувшись назад, мы увидим, что теория делимости в кольце Z целых чисел и в кольце К[х] полиномов над полем фактически основывалась на том, что эти кольца являются кольцами главных идеалов. Именно, рассматривались идеалы а\А -f- a2A, относитель- относительно которых устанавливалось, что они главные. Средством для этого была «теорема о делении с остатком», за- заключавшаяся в том, что для элементов а и b ФО существуют эле- элементы q и г такие, что а = bq -f- г, причем г в некотором смысле меньше чем Ь. Уточняет это обстоятельство следующее опреде- определение: Кольцо А называется евклидовым, если для любых элементов а и ЬфО существуют q и г такие, что a = bq-\-r и ф(г)
J 2] ПОЛИНОМЫ НАД ФАКТОРИАЛЬНЫМ КОЛЬЦОМ 213 где ф — функция на А с неотрицательными целыми значениями (иногда еще дополненными символом —оо). В кольце целых чисел роль ф играла абсолютная величина числа, в кольце полиномов — степень полинома. Всякое евклидово кольцо есть кольцо главных идеалов. Дей- Действительно, пусть М — идеал евклидова кольца. Обозначим через d отличный от нуля элемент идеала, в котором функция ф имеет наименьшее значение. Тогда все элементы идеала М делятся на d, т. е. М = dA, ибо иначе для остатка г = а — dq e M от деления какого-либо элемента а на d имели бы ф(г)< (p(d).
ГЛАВА IX РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА § 1. Существование корней в С 1. Элементы теории пределов для комплексных чисел. В на- настоящей главе полиномы рассматриваются только над полями .CJ и R как функции от комплексной или вещественной переменной, так что эта глава является скорее главой математического ана- анализа, а не алгебры, хотя теорема о существовании корня у лю- любого отличного от константы полинома с комплексными коэффи- коэффициентами (т. е. установление алгебраической замкнутости поля .С) носит название основной теоремы алгебры. Выше, в § 5 гл. II, было дано определение предела последова- последовательности комплексных чисел гп = хп-\-yni как такого числа с — = а + Ы, что а = lim xn, b— lim yn. Предельное соотношение lim zn — c равносильно соотношению \zn — с|-»-0, ибо |xn-a|, \уя-Ь\). Последовательность гп такая, что |zn|sg:/? при некотором R, называется ограниченной. Для вещественных переменных известна теорема Больцано — Вейерштрасса: из любой ограниченной последовательности можно извлечь сходящуюся подпоследовательность. То же самое верно и для последовательностей, составленных из комплексных чисел. Действительно, пусть zn — х.п-\- yni— ограниченная последова- последовательность, т. е. \zn\<.R. Тогда \xn\<.R, так что хп есть ограни- ограниченная последовательность вещественных чисел. Из нее можно выбрать сходящуюся подпоследовательность х„к ->¦ а. Рассмотрим соответствующую подпоследовательность мнимых частей у„к. Она ограничена, и из нее можно извлечь сходящуюся подпоследова- подпоследовательность у„, -*-Ь. кт Соответствующая подпоследовательность комплексных чисел имеет сходящиеся последовательности вещественных и мнимых частей и, следовательно, сходится, и ее предел равен а + Ы. 2. Доказательство основной теоремы. Прежде чем приступить к формальному доказательству, наметим его идею. Пусть f(z) — полином, рассматриваемый как функция от комплексной перемен-
8 1] СУЩЕСТВОВАНИЕ КОРНЕЙ В С 215 ной г. Представим себе «график» функции w = \f(z)\, считая, что значения z изображаются на горизонтальной плоскости, перпенди- перпендикулярной к плоскости чертежа, а значения |f(i)| откладываются вверх в направлении оси w. Мы установим, что f(z) и |/(z)| яв- являются непрерывными функциями от z на всей плоскости комп- комплексной переменной. Функция F(z) от комплексной переменной z называется непрерывной в точке го, если достаточно близким к zQ значениям z соответствуют сколь угодно близкие к F(z0) значения F(z). В более точных терминах — для любого е > 0 найдется та- такое б > 0, что \F(z) — F(z0) | < е, как только \z—Zo|<6. Непрерывность |/(z)| дает основания представлять себе гра- график w = \f(z)\ в виде непрерывной поверхности, накрывающей плоскость w = 0, и местами доходящей до этой плоскости. Соб- Собственно говоря, нам и нужно доказать, что существует такое зна- значение zq, в котором f(zo) = O, и, тем самым, |f(zo)| = O, т. е. что поверхность w = \f(z)\ доходит до плоскости w = 0 в точке zq. Мы докажем, что если дана точка на поверхности w = \f(z)\, ко- горая расположена выше плоскости w = О, то в ее окрестности найдется точка поверхности, расположенная ниже данной точки. Тогда останется только доказать, что на поверхности w = \f(z)\ существует самая низкая точка, скажем, при z = z0. Она не может находиться выше плоскости w = О, ибо тогда она не была бы са- самой низкой. Следовательно, \f(zo) | = 0 и, следовательно, }(го)==0, г. е. z0 есть корень полинома f(z). Теперь приступим к доказательству основной теоремы, разбив это доказательство на цепочку лемм. Лемма 1. Дан полином f(z)=aozn-\- ... + an-\z с нулевым свободным членом. Тогда для любого е >• О найдется такое б > О, что |f (г) | -=С е, как только |z|<6. Доказательство. Пусть |г|<1. Тогда | / (z) | = | + ' +\ \\\i + 2 + а,г+ ... +an_]z\ \z\\a0z + alz+ ... +а„_,|< < I z | (| а01 +1 а, | + ... + | а„_11). Положим | ц, | + | ах | + • • • — Ч-|ал_,| = АГ. Если |z|<min(l,-J-), "то |f (г)|<|г|М < <-^-М = 8, что и требовалось доказать. Лемма 2. Полином есть непрерывная функция во всех точках плоскости комплексной переменной. Доказательство. Пусть дан полином f(z) и точка г0. Рас- Расположим полином по степеням z — zq\ f(z)=co + cl{z — zo)+ ... +cn(z — z0)n. Тогда Со = f(z0), так что f(z) — f(Z0)=CiB — 20)+ ... +Cn{z — Z0)n. Правая часть есть полином от z — z0 с нулевым свободным членом.
216 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА [ГЛ. IX По лемме 1 для любого е > 0 найдется такое б > 0, что \f(z) — — f(z0) I < s, как только \z— zo|<6, что и требовалось до- доказать. Лемма 3. Модуль полинома есть непрерывная функция. Доказательство. Из неравенства \f{z) — /(z0) | ^ | |f(г) | — — |fBo)|| следует, что для данного е > 0 то 6, которое «обслу- «обслуживает» f(z), подходит и для |/(z)|. Действительно, при |z-zo|<6 имеем | |/(г) \-\f(z0) | |< \f(z) — f (z0) | < е. Лемма 4 (о возрастании модуля полинома). Если f(z) — по- полином, отличный от константы, то для любого М ~> 0 существует такое R > 0, что \f(z) | > М, как только \z\ > R. Это означает, что любая горизонтальная плоскость w = М отре- отрезает от поверхности w = \f(z)\ конечный кусок, накрывающий часть круга |2;|^i?. Доказательство. Пусть f (z) = aazn-\- а&п~х -\- ... -\-ап = { полином от z~l с нулевым свободным членом. В силу леммы 1 для в= 1/2 найдется такое б > 0, что при \г~1 | < б будет |фB~1) j < 1/2. Модуль aozn может быть сделан сколь угодно п большим, именно, при \z\> -\/2М/\ао\ будет |ао.гл|>2Л1 Возь- п мем /? = max(V2Af/|ao|, 1/б). Тогда при |z|>/? будет |г-!|<б и |z|>V2AJ7UTl, так что | f(z) | > |ааг"|A -|Ф (г"«) |) > >2M(l -i-)=M. Лемма 5. Точная нижняя грань значений \f(z)\ достигается, т. е. существует такое го, что \f(zo) \ ^ |/(г) | при всех z. Доказательство. Обозначим точную нижнюю грань \f{z)\ через т. Возьмем последовательность m -\--г, & = 1, 2, ..., стре- стремящуюся к m сверху. Каждое из этих чисел не является нижней гранью значений |/(z)|, ибо m — точная нижняя грань. Поэтому1 найдутся zk такие, что | f(zk) |<m+-^-, k= I, 2, ... Восполь- Воспользуемся теперь леммой о возрастании модуля. Для М = т-\-\ найдем такое R, что при Ы>/? будет | /(г) | > М ^т + -г. От- сюда следует, что |za|^ R при всех k. Последовательность zk ока- оказалась ограниченной, и из нее можно извлечь сходящуюся подпоследовательность zk . Пусть ее предел равен z0. Тогда lim If (гА )| —\f(zo)\ в силу непрерывности |/(z)j. Кроме того, m<|/Bfe')|<m + -|-. Поэтому lim |/(zk \I = т. Итак |/{z0) | = жв= т, что и требовалось доказать.
$ 1] СУЩЕСТВОВАНИЕ КОРНЕЙ В С 217 Лемма 6(лемма Даламбера). Пусть f(z) — полином, отлич- отличный от константы, и пусть f(zi)=?Q. Тогда найдется такая точка z2, ЧТО |/B2)|<|/B,)|. Геометрический смысл этой леммы: если на поверхности w = = |/(z)| дана точка, находящаяся выше плоскости w = 0, то на ней найдется другая точка, расположенная ниже первой. Доказательство. Расположим полином f(z) по степеням /(z) = co + ci(z — z,) + ... +с„(г —2i)n. Тогда Со = ]{г{)Ф 0. Идея доказательства состоит в том, чтобы за счет первого отличного от нуля слагаемого «откусить кусочек» от с0> а влияние дальнейших слагаемых сделать незначительным. Пусть Ck{z — Z\)k — первое отличное от нуля слагаемое после с0, так что С\— ... = Ck-\ = 0 (если k > 1). Такое слагаемое имеет- имеется, так как /(z) не константа. Тогда = co(l + is.(z -z,)ft + A (z - z,)ftФ(z - z,)). Здесь ф (z — 2,) = -iii- (z — zx)+ ... H—- (z — Zi)" * есть полином от z — Z\ с нулевым свободным членом. По лемме 1 для 8=1/2 найдется такое 6, что |<p(z — z{) | < 1/2, как только |z — zi|<6. Положим —— = R(cosЭ + i sin6) и z — z, = r (соэф + i smq). Co Тогда —^-B — z^* = /?rfe(cosF + &Ф) + i sin @-{- &ф))- Выберем г c0 так, что Rrk < 1. Для этого нужно взять г < -y/^IR. Далее, поло- положим 6-j-^ = n, т. е. возьмем ф = (л — Q)/k. При таком выборе ft будет — (z — zj% = — i?r*. Теперь положим z2 = гх+г (cos ф+/ sin ф) k при r<minF, VW) и ф = (я —6)/А. Тогда /(г2) = с0A - Rrk— — Rr\{z2 — Zi)) и I /(z2) I -k0 | •! 1 - Rrk - Rrkq>(z2 - г,) | < Лемма доказана.
218 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА [ГЛ. IX Заметим, что с тем же успехом мы могли взять 8 + ^ф==л + -f- 2tn при ? = 0 k—1, так что при k>\ (т. е. в случае, когда z\ — корень кратности k—1 полинома f'(z)) имеется k на- направлений спуска по поверхности до —|/(г)|. Они разделяются k направлениями подъема при Q-\-kq> = 2sn, s = 0, ..., k—1. Дей- Q ствительно, в этих направлениях —- (г — z{)'{ = Rrk и I / (г) | ^> 1 r*|q>B-z,)|)> \f(zo)\ (l +1 Rrk ) >\f{zo)\. Так что если Z\ есть корень производной кратности k — 1, то поверхность w = \f(z)\ в окрестности точки г\ «гофри- «гофрирована» так, что на ней имеется k «долин» спуска, разделенных к «хребтами» подъема. Теорема. Полином с комплексными коэффициентами, отлич- отличный от постоянной, имеет по меньшей мере один комплексный ко- корень (т. е. поле JCJ комплексных чисел алгебраически замкнуто). Доказательство. Пусть f(z) — данный полином, отличный от константы. Пусть, далее, m = inf|f(z) | и Z\ — точка, в которой |Д21)| = т; она существует по лемме 5. Тогда fBi) = 0, ибо иначе, согласно лемме 6, нашлась бы такая точка z2, что \f(z2) | < <lf(zi) l = inf \f(z) |, что невозможно. § 2. Распределение корней на плоскости комплексной переменной 1. Аргумент комплексного числа, изображение которого дви- двигается по непрерывной линии. В этом параграфе мы несколько от- отступим от того уровня математической строгости, который принят в учебной математической литературе, и позволим себе чуть боль- больше «верить своим глазам», прибегая к наглядным геометрическим представлениям. Пусть комплексная переменная z меняется так, что ее изобра- изображение непрерывно двигается по некоторой непрерывной линии, не проходящей через начало координат. Это значит, что z = z{t) есть непрерывная функция от вещественного параметра /, меняю- меняющегося в замкнутом промежутке а ^ t ^ Ъ, причем г(/)#0 при всех значениях t. Тогда радиус-вектор точки z{t) будет непрерывно поворачи- поворачиваться вокруг начала координат, изме- изменяясь по длине, но ни разу не сжимаясь в точку, и угол, который он образует с ве- вещественной осью, т. е. argz{t), можно считать тоже изменяющимся непрерывно (рис. 9). Таким образом, выбрав каким- Рис. 9. либо способом значение аргумента числа г(а) в начале пути, можно выбрать зна- значения аргумента z{t) при всех t так, чтобы в целом функция avgz{t) оказалась непрерывной функцией параметра t. (Читатель,
§2] РАСПРЕДЕЛЕНИЕ КОРНЕЙ НА КОМПЛЕКСНОЙ ПЛОСКОСТИ 219 несколько искушенный в началах математического анализа, в со- состоянии дать более строгое доказательство этого утверждения, на- например по такой схеме. Пусть r=infJ2(/)|. Тогда г > 0, ибо не- непрерывная функция |z(/)| на замкнутом промежутке [а, Ь\ до- достигает своей нижней грани. В силу равномерной непрерывности непрерывной на [а, Ь] функции, можно разбить промежуток [а, Ь] на конечное число интервалов так, что в пределах каждого из них колебание компонент x(t) и y(t) функции г (t) не превосходит -~г. Тогда z(() на каждом таком интервале изменяется не более чем в двух смежных координатных квадрантах, и здесь справед- справедливость утверждения очевидна. Остается согласовать выбор аргу- аргумента на границах интервалов.) Предположение о том, что z(t) не обращается в нуль, су- существенно. Так, например, пусть z{t) = t при —I^/sgll. При / < О аргумент z(t) будет равен нечетному кратному л, а при ?>0 — четному кратному. Выбор значений аргумента здесь нельзя так согласовать, чтобы сохранить непрерывность при t ¦==¦ 0. Пусть теперь имеется несколько непрерывных комплексных функций zi(t) Zk(t) от вещественной переменной t, a ^ t ^.b, каждая из которых не обращается в нуль ни в какой точке дан- данного промежутка. Тогда их произведение z(t) = zi(t) ... Zu(t)— тоже непрерывная функция, не обращающаяся в нуль на этом про- промежутке. Выберем значения аргументов z\(t), ..., zk(t) и z(t) при t— а так, чтобы аргумент z(a) был равен сумме аргументов Z\{a), ..., Zk(a) (а не отличался от нее на четное кратное я). Тогда, при непрерывном, изменении аргументов, равенство argz{t) = siTgzi(t)+ ... 4-argzft(<) сохранится при всех t, a s?l ^^^6. Действительно, разность argz(t) — (argzi(/)-j- ... ... -f-argZft(/)) может принимать лишь значения 0 и четные крат- кратные я, причем равна 0 при t = а. Но, будучи непрерывной функцией, она не может изме- изменяться скачками и потому остается равной нулю при всех t. Пусть теперь линия, по которой двигает- двигается z, замкнута. Это значит, по-прежнему, что z = z(t)—непрерывная функция от вещест- вещественной переменной t, а ^ I ^ Ь, и z{b) — z(a). В этом случае, при непрерывном изменении аргумента, мы можем получить при t = Ь значение аргумента, отличное от значения при t= а. Разность значений аргумента может равняться только целому кратному й-2я числа 2я. Коэффициент k имеет ясный гео- геометрический смысл. Он равен числу полных оборотов вокруг начала координат радиус-вектора точки z{t) при обходе этой точкой ли-* Рис. 10.
220 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА [ГЛ. IX нии в направлении возрастания параметра t, с учетом знака в со- соответствии с направлением обхода. Так, для приращения аргумента z(t) на рис. 10 при указанном направлении обхода k = 2, при противоположном k = —2. 2. Принцип аргумента. Пусть функция z=z(t) непрерывна при а ^ t ^ b, z{a) = z(b) и, за исключением этого случая, г(г{)Ф фг(г%) -при ti=?t2. В этой ситуации z описывает простой замкну- замкнутый контур, т. е. непрерывную замкнутую линию без самопересе- самопересечений. Имеет место замечательная топологическая теорема Жор- дана о том, что простой замкнутый контур разбивает плоскость на две связные части — внутри и вне контура (фигура на плоскости называ- называется связной, если любые две ее точ- точки можно соединить непрерывной ли- линией, целиком лежащей на ней). Тео- Теорема Жордана тривиальна для ок- окружности— точки ее внешней части рис ц характеризуются тем, что расстояние от них до центра больше радиуса, точки внутренней — тем, что это расстояние меньше радиуса. Тео- Теорема «на глаз» очевидна, если контур несложен, но наглядность теряется для более сложных контуров (см. рис. 11), особенно, если от контура ничего не требовать, кроме непрерыв- непрерывности. Лемма. Пусть г проходит простой замкнутый контур в поло- положительном направлении. Тогда приращение аргумента z — z\ рав- равно 2я или 0 в зависимости от того, где находится z\ — внутри или вне контура. Доказательство. Ограничимся геометрически наглядным случаем выпуклого контура, например окружности. Пусть zx на- навнутри контура (рис. 12). Число z—z% изображается вектором, исходящим из точки Z\ в точку г. Ясно, что когда z обойдет контур один раз в положительном направлении, вектор z — Z\ обернется вокруг своего начала один раз, тоже в положительном направлении, и приращение аргумента z — Z\ равно 2я. Пусть теперь z{ находится снаружи контура (рис. 13). Тог- Тогда колебание аргумента z — z\ не превосходит л, так что приращение аргумента может быть равно только нулю. Лемма остается верной для произвольного простого замкну- замкнутого контура, но ее доказательство в общем случае довольно ходится Рис. 12. Рис. 13.
§ 2] РАСПРЕДЕЛЕНИЕ КОРНЕЙ НА КОМПЛЕКСНОЙ ПЛОСКОСТИ 221 сложно. Для дальнейшего нам нужен только случай выпуклого контура, в частности окружности. Теорема (принцип аргумента). Дан простой замкнутый кон- контур и полином f(z), не имеющий корней на контуре. Тогда число корней полинома внутри контура (с учетом кратностей) равно -g^- Д arg /(z), где Aavgf(z) есть приращение аргумента f(z), вы- вычисленное в предположении, что г проходит данный контур один раз в положительном направлении. Доказательство. Над полем .С, каждый полином может быть разложен на линейные множители, соответствующие корням. Пусть f(z)=aQ(z — Z\) ... (z — zn) — такое разложение. При об- обходе переменной z контура области все сомножители правой части и их произведение f(z) меняются непрерывно. Можно считать, что argfB)= argao + argB —2i)+•••+ argB —2Я), и, следователь- следовательно, Aargf(z) = Д argB — Zi)+ ... +Aarg{z — zn). Здесь прира- приращения отсчитываются при однократном обходе z по контуру об- области. Слагаемые в правой части равны 2я или 0, в зависимости от того, лежит ли соответствующий корень 2,- внутри или вне контура. Поэтому Д argfB) = пг-2я, где пг — число корней, рас- расположенных внутри контура, что и доказывает теорему. Теорема позволяет фактически найти число корней в данной области, ограниченной простым замкнутым контуром. На контуре нужно взять достаточно густую сетку точек, в каждой точке вы- вычислить значение полинома, нанести их на чертеж и проследить за приращением аргумента. Правда, заранее неизвестно, насколько густую сетку точек нужно взять. 3. Теорема Руше. Имеются случаи, когда принцип аргумента позволяет найти число корней полинома в области почти без вы- вычислений. Рассмотрим пример. Требуется узнать, сколько корней имеет полином 25 + 5г2 — 3 внутри единичного круга |z|j^l. На кон- контуре z = еи, 0 ^ / ^ 2я, второе слагаемое 5z2 = 5e2it преобладает по модулю над остальными, ибо |522| = 5, а |г5 — 3|^1+3 = 4. Ясно, что пока z обходит один раз единичную окружность в поло- положительном направлении, 5г2 обойдет окружность радиуса 5 два раза, a f(z), будучи «привязан» к 5г2 вектором, изображающим г5 — 3, длина которого не превосходит 4, вынужден тоже обойти вокруг начала два раза. Поэтому полином г5 + 5г2 — 3 имеет внутри единичного круга два корня. Пусть теперь требуется узнать число корней этого полинома в круге радиуса 2. Преобладающим слагаемым на контуре z => «= 2е'*, О ^ t ^ я, оказывается г5 = 32е5", модуль которого равен 32. Сумма остальных слагаемых 5z2 — 3 по модулю не превосходит 5-22 + 3 = 23. Слагаемое г5 обходит начало координат 5 раз, и f(z), отходя от z5 не более чем на 23 единицы, тоже обходит на- начало 5 раз. Число корней полинома в круге радиуса 2 равно б.
222 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА {ГЛ. IX Итак, мы узнали, что 25 + 5г2 — 3 имеет 2 корня в единичном круге и 3 корня в кольце между окружностями |z|= 1 и |z| = 2. Приведем теперь теорему, частными случаями которой явля- являются только что приведенные рассмотрения. Теорема (Руше). Пусть полином f(z) = fi(z)-\~ h(z) пред- представляется в виде суммы двух полиномов, и на контуре области выполнено неравенство |/г(г) | < \f\{z) |. Тогда число корней по~ линомов f(z) и fi(z) внутри области одинаково. Доказательство. Прежде всего убедимся в том, что к по- полиномам fi(z) и f(z) можно применить принцип аргумента. Из неравенств \h(z)\>\fa(z)\ и |/(z) |S»|/,(z) | —|/2(z) |> 0, спра- справедливых для всех г на контуре, следует что fi(z) и f(z) не обра- обращаются в 0 на контуре. Далее, f (г) = /t (г) 1 -\~ /, \ ¦ так что Д arg f(z) = ^ arg /, (г) + Д arg A + / ?1 ) • пока 2 ПРОХ°ДИТ кон* /2B) /2B) тур области. Далее, из "ТТТ ^ * следует, что 1 -f- Ч2 : ' имеет значения, лежащие внутри круга с центром в точке 1 и с единич- единичным радиусом, так что все они находятся в правой полуплоскости. Вектор, исходящий из 0 в точку 1 -f- I2. . , не может повернуться вокруг начала, так что Aargf 1 +-г7гг) ==^- Следовательно, Согласно принципу аргумента, число корней полиномов /((г) и f(z) внутри области одинаково, что и требовалось доказать. 4. Непрерывность корней полинома. Пусть дан полином fo{z). Покажем, что его корни меняются непрерывно при изменении коэффициентов. Именно, при достаточно малом изменении коэф- коэффициентов корни меняются сколь угодно мало, но только кратные корни могут распадаться, превращаясь в совокупность корней в количестве (с учетом кратностей), равном кратности исходного корня. Действительно, пусть z0 — корень кратности k для полинома fo(z) и пусть f(z) = fo(z) + g(z) — полином, полученный из fo(z) малым изменением его коэффициентов. Окружим корень z0 сколь угодно малой ^окружностью, причем настолько малой, чтобы в ограниченном ею круге не было корней полинома fo(z), кроме zq. Пусть т = inf /0B) | при 2, меняющемся на окружности. Так как функция |/(г) непрерывна и не обращается на окружности в нуль, т > 0. Возьмем коэффициенты полинома g(z) столь малы- малыми, что на окружности \g(z) | <С т. Тогда на этой окружности вы- выполнено условие теоремы Руше, и полином f(z) имеет столько же корней внутри круга (с учетом кратностей), сколько их имеет fo(z), т. е. k. В частности, простой корень при малом изменении коэффи- коэффициентов немного перемещается, оставаясь простым. Если коэффи-
f 3| РАСПРЕДЕЛЕНИЕ ВЕЩЕСТВЕННЫХ КОРНЕЙ ПОЛИНОМА 223 циенты зависят от вещественного параметра t, являясь не только непрерывными, но и дифференцируемыми функциями, то простые корни имеют производные по t, именно, —— — —-, • —- dt fo(Zj) dt 2zj В точках, где эта производная отлична от нуля, корень переме- перемещается по гладкой кривой. Картина усложняется, когда корни «сталкиваются», превращаясь при некото- некотором значении t в кратный корень. Рассмот- Рассмотрим простой пример. Пусть f(z)=z2—2z+ + t при 0 ^ t ^ 2. При t = О корни равны О и 2. Далее, z\, 2 = 1 ± л/\ — t. При из- изменении t от 0 до 1 корни сближаются и, при /=1, сливаются при значении ( 14) П й ж 1-1 р р г=1 (рис. 14). При дальнейшем увели- Рис. 14. чении t корни становятся комплексными и расходятся вдоль прямой Re 2 = 1. У нас нет никаких оснований считать, который из корней пошел вверх: тот, который пришел слева, или тот, который пришел справа. Корни после столкнове- столкновения как бы теряют индивидуальность. § 3. Распределение вещественных корней полинома с вещественными коэффициентами 1. Ограничение вещественных корней полинома с веществен- вещественными коэффициентами. Лемма о возрастании модуля (§ 1) дает Средство для ограничения всех корней по модулю сверху. Именно, 1сли для М = 0 найти такое R, что |/(г)|>М = 0, как только г|>/?, то, очевидно, за пределами круга радиуса R полином (г) не имеет корней, и поэтому все его корни не превосходят R По модулю. Для вещественных корней полиномов с вещественными коэф- коэффициентами можно указать другие оценки, которые иногда оказы- оказываются лучше. Приведем одну из них. Теорема (оценка Маклорена). Пусть f(x)—aoxn-\-a\Xn-l-{-... ... +an6R(jc], причем а0 > 0. Если f(x) не имеет отрицатель- отрицательных коэффициентов, то отсутствуют положительные корни, так что верхней оценкой для вещественных корней оказывается число 0. Пусть отрицательные коэффициенты имеются, m — номер первого по порядку отрицательного коэффициента и А — максимум моду- модулей отрицательных коэффициентов. Тогда вещественные корни m f(x) не превосходят 1 + д/ Доказательство. Пусть все коэффициенты неотрицатель- неотрицательны и х > 0. Тогда f(x)> 0, так что f(x) не имеет положительных корней. Пусть теперь отрицательные коэффициенты есть и х ^
224 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА (ГЛ. IX ^. Имеем:/(*)=go,v"+ <*!*"-' + ¦•• + ат-1Хп ...+ с п. Подчеркнутые слагаемые, если они есть, неотрицательны при х > 0, и потому ¦f- amxn-m + ... +а„. При k ^ m будет a* ^ —Л, следовательно, (n — Л (jc"- -f ... +1) = xn-m+l j ~ лг — i /""m+1 {aoxm-' (jc - l)-i4) . Л . х{аохт-х(х-\)-А) ^ ха-т+1(а0(х-1)я-А) > __ ^ —-j jc— 1 Итак, при х~^\ + Л/— будет /(.к:)>0, так что все вещест- m венные корни не превосходят 1 -f- д/—, что и требовалось до- доказать. При помощи оценки корней сверху легко получить и оценку снизу. Для этого достаточно рассмотреть полином Корни этого полинома равны корням полинома / с обратным зна- знаком, так что из оценки корней его сверху, —xi ¦< М, получим оценку снизу для корней исходного полинома: xi > —М. Пример. Найти оценки сверху и снизу для корней полинома f(x) = х5 + Зх3 — 4х2 — 2х + 4. Сверху: xt < 1 + л/4 < 3. Снизу: составим g(х) = х5 + Зх3 + Ах2 — 2х — 4, имеем — *, < < 1 + V4 < 3. Итак, — 3 < xi < 3. Оценка Маклорена довольно грубая. Имеется много других приемов оценивания вещественных корней полиномов с вещест- вещественными коэффициентами. Мы не будем на этом останавливаться. 2. Теорема Штурма. Здесь будет решена следующая задача. Дан полином с вещественными коэффициентами и дан промежу- промежуток на вещественной оси. Требуется узнать, сколько корней имеет полином на этом промежутке. Способ решения этой задачи осно-
§ 3] РАСПРЕДЕЛЕНИЕ ВЕЩЕСТВЕННЫХ КОРНЕЙ ПОЛИНОМА 225 ван на принципе счетчика. К переменной х, двигающейся от ле- левого конца промежутка, будет «приделан счетчик», стрелка кото- которого поворачивается на одно деление, как только х проходит через корень полинома. Тогда число корней полинома на интервале равно разности показаний счетчика в начале и в конце интервала. Роль показаний счетчика будет играть число перемен знаков среди значений некоторой конечной последовательности (последователь- (последовательности Штурма) вспомогательных полиномов. Под числом перемен знаков в некоторой последовательности вещественных чисел по- понимается число пар соседних элементов последовательности, имею- имеющих противоположные знаки, причем нулевые члены исключа- исключаются из последовательности. Последовательность /0, /ь ..., /* Штурма полиномов, построен- построенных для данного полинома / = /0, удовлетворяет следующим тре- требованиям при значениях х из данного интервала (а, Ь): 1. Последний полином fk не обращается в нуль. 2. Два соседних полинома не обращаются в нуль одновре- одновременно. 3. Если некоторый полином fi, I ^ i ^ k—1, обращается в нуль в некоторой точке Хо, то соседние полиномы f,_i и f,+] имеют в хо значения противоположных знаков. 4. Произведение /o/i меняет знак с минуса на плюс, когда х, возрастая, проходит через корень полинома /о- Теорема Штурма. Число корней полинома f(x) в проме- промежутке [а, Ь] равно числу перемен знаков в значениях полиномов ряда Штурма при х = а минус число перемен знаков при х = Ь, Предполагается, что концы промежутка не являются корнями f(x)< Тем самым ряд Штурма играет роль «счетчика» корней. Доказательство проводится по принципу счетчика. Рассмотрим промежуток [а, Ь]. На нем имеются корни начального полинома fo = J и корни других полиномов ряда Штурма. Мы докажем, что число перемен знаков в значениях полиномов ряда Штурма изме- изменяется, только когда х проходит через корень начального поли- полинома, и тогда это число уменьшается на 1. Ясно, что полином, в силу непрерывности, может изменить знак, только когда х прохо- проходит через корень полинома. Поэтому нам нужно проследить, что происходит со знаками и с числом перемен знаков при переходе через корень начального полинома и через корни других полино- полиномов Штурма. Пусть хо является корнем некоторого полинома f,(x) ряда Штурма и не является корнем начального полинома. Может случиться, что кроме полинома fi(x) некоторые другие полиномы тоже обращаются в нуль при х0. Допустим, для определенности, что таким полиномом является f,-(x). Пусть все остальные поли- полиномы ряда Штурма не обращаются в 0 в точке Хо. Выберем про- промежуток (х0 — б, х0 + б) настолько малым, что в нем не содер- содержится ни одного корня полиномов ряда Штурма, кроме хс, и про-
226 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА [ГЛ. IX следим за изменением числа перемен знаков, когда х проходит этот промежуток. С этой целью рассмотрим следующую таблицу: Хо — 6 < X < Х0 х = Ха х0 < х < Хо + б /о п ... /J-1 а а а и а —а 0 <т —а —а —а —а ... fl-i 01 01 01 // 0 //+1 —01 —or. 0i Полиномы fo, ..., fi-u fi+i fj-u fj+u ..., fk в нуль не обра- обращаются, и их знаки не изменяются на всем промежутке (х0 — б, лго + б), следовательно, и число перемен знаков среди пар, не включающих /,- и f,-, не изменяется. Пусть /,-i(xo) имеет знак о (+ или —). Этот знак сохраняется на всем промежутке (х0 — б, хо + б). По третьему свойству полиномов Штурма полином [г-н имеет знак —а. Какие бы знаки ни имел полином /, слева и справа от хо, число перемен знаков в отрезке Д-ь /,, f«4-i ряда Штурма остается равным 1 и не изменяется. Такая же картина имеет место на отрезке f/_i, f/, /7+1. Таким образом, когда х проходит по про- промежутку, не содержащему корней начального полинома f0 = f, но, быть может, содержащему корни других полиномов ряда, число перемен знаков среди значений полиномов ряда Штурма не изме- изменяется. Пусть теперь лг0 — корень начального полинома /0- Возможно, что кроме него при х0 обращаются в нуль какие-либо другие по- полиномы. Положим, что fj(jCo) = O. Рассмотрим снова таблицу распределения знаков: х0 — б < х < ха X =^ Xq Хо < X < Хо + б -01 0 01 h 01 01 01 //-I 0 0 а ft 0 //+1 -0 —0 —а ... fk Ha участке f/_i, ft, fi+\ ряда Штурма картина распределения зна- знаков будет такая же, как в предыдущем случае, так что, хотя знак полинома ft может измениться, число перемен знаков на этом участке не изменится. Полином /i в точке хо не обращается в О, согласно второму свойству ряда Штурма. Пусть а\ — знак fi(x0). Этот знак полином f\ сохраняет на всем промежутке (х0 — б, хо + б). Согласно четвертому свойству ряда Штурма знак /о(х) до хо противоположен знаку fi{x), а после хо знаки /о(л-) и fi(x)
f 3] ' РАСПРЕДЕЛЕНИЕ ВЕЩЕСТВЕННЫХ КОРНЕЙ ПОЛИНОМА 227 одинаковы. Таким образом, на участке /о, /i ряда Штурма, а сле- следовательно, и во всем ряду Штурма число перемен знаков умень- уменьшается на единицу (счетчик повернулся на одно деление). Сопоставляя все сказанное, делаем вывод, что при изменении х от а до & число перемен знаков среди значений полиномов ряда Штурма уменьшается на столько единиц, сколько корней поли- полинома /о(х) лежит между а и Ъ, что и доказывает теорему Штурма. Из рассмотрения второй таблицы мы видим, что число пере- перемен знаков при корне х0 начального полинома такое же, как на- направо от корня, и на единицу меньше, чем налево от корня. При- Принимая это во внимание, мы можем в теореме Штурма снять пред- предположение, что /о не имеет корней на концах промежутка. Если начало а является корнем, то при отходе от него вправо число перемен знаков не изменится, а если конец Ъ является корнем, то при подходе к нему слева в последний момент число перемен зна- знаков уменьшится на одну единицу. Таким образом, разность числа перемен знаков значений полиномов ряда Штурма в начале и в конце промежутка равна числу корней полинома \ на этом про- промежутке, исключая левый конец (если он является корнем) и включая правый (если он является корнем). 3. Построение ряда Штурма. Заметим прежде всего, что если полином имеет на (а, Ь) корень .v0 четной кратности, то для него построение ряда Штурма невозможно. Действительно, нужно, что- чтобы /i(xo)t^=O, так что знак полинома fi(x) должен сохраняться в окрестности х0. Так как л-о— корень четной кратности для fo(x), полином fo(x) тоже не меняет знака в окрестности Хо, так что fo(x)fi(x) не может изменить знак, как это должно быть согласно последнему требованию. Однако удовлетворить этому требованию можно всегда. Именно, верно следующее Предложение. Произведение полинома f(i)sR[i] на его производную меняет знак с минуса на плюс, когда х, возрастая, проходит через корень f(x). Доказательство. Пусть х0 — корень полинома f(x) крат- кратности k, так что f{x) = (x — xo)kg{x) и g(xo)?=O. Тогда f (x) =*k(x- xo) k-lg (х) + (х- х0) V (х) = = (х- хо) *~] (kg (х) + (х- хо) g' (х) )\ так что ?(x)f'(x) = (x — xQ)*k-1[k(g(x))* + (x-xo)g(x)g'(x)] = = (x — xoJk-1F(x). Имеем F(xo)I=k[g(xo)]2 > 0 и, следовательно, F(x) остается положительным в окрестности xq. Но (х — хоJ*~' меняет знак с минуса на плюс, когда х проходит через лг0. Следовательно, то же самое будет и для произведения (х — xoJk-lF(x) = f(x)f'(x). Далее будем считать, что полином f не имеет кратных корней и, следовательно, взаимно прост со своей производной. За полином fi(x) ряда Штурма примем производную полинома ?(лг) == /о(л:); Затем применим к полиномам fo(x) и fi(x) алгорифм
228 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА ГГЛ. IX Евклида, меняя на каждом шагу знак остатка на обратный. По- Полученные последовательные остатки примем за полиномы /2, /з, • • • ...,/*. В силу взаимной простоты /0 и /i последний полином fk?=O есть константа. Таким образом, эти полиномы связаны соотношениями / 1 — I2§2 — /3> fk-2 = fk-lgk-1 Ik' Проверим, что построенные полиномы удовлетворяют всем тре- требованиям ряда Штурма. Последний полином не обращается в нуль, так как он есть отличная от нуля константа. Из соотношения fi-i(x) —fi(x)q(x) — fi+i(x) следует, что если /._i (лг0) = /,¦ (л:0) = О, то и Д-+1 (х0) = 0, но тогда и /н-2(*о) = О и т. д., наконец- fk(xo) = О, что невозможно. Итак, два соседних полинома ряда одновременно в 0 не обращаются. Далее, если f,(Aro) = O, то fi-i(x0) =—fc+i(x0), так что они имеют противоположные знаки. Итак, три первых тре- требования ряда Штурма выполнены. Заметим, что они были бы выполнены, если в качестве f\(x) взять любой полином, взаимно простой с f(x) = fo(x). Наконец, четвертое требование выполнено при fi(x) — f(х) в силу доказанного предложения. Заметим еще, что свойства ряда Штурма сохраняются, если полиномы умножить на любые положительные константы. Это за- замечание полезно при решении примеров. Пример \.f(x) = x3 — 7х — 7. Возьмем f\(x) = f'(x) = Зх2—-7. При делении 3/(х) на ft(x) в остатке получим —14х — 21, так что в качестве /г можно взять 2л:+3. При делении 4fi(x)=12.v2 — 28 на f2 получим в остатке —1, так что /з = 1. Таблица распределения знаков — оо — 2 -1 0 + ОО /о Л _ + — + _ _ — — + + — + + + и + + + + + показывает, что имеется один положительный корень и два отри- отрицательных в интервале (—2, —1). Для уточнения расположения корней вычислим /(—3/2) = 1/8 > 0, так что мы можем заклю- заключить, уже не обращаясь к ряду Штурма, что корни лежат по од- одному в интервалах (—2; —3/2) и (—3/2, —1). Для уточнения положения положительного корня заметим, что fC)=—1 < О, = 29>0, следовательно, корень лежит в интервале C, 4).
§ 4] ОБОБЩЕННАЯ ТЕОРЕМА ШТУРМА 229 рим ер 2. fW = l+—+f + ... +Trt". Здесь мы несколько отступим от описанного выше приема по- построения ряда Штурма. Полином f(x) не имеет положительных корней, так что все его вещественные корни, если они есть, лежат в интервале (—М, —б), где М достаточно большое и б достаточно малое положительные числа. Именно для этого интервала мы бу- будем строить полиномы Штурма. Имеем f (х) = 1 +— + ~гГ + • • • ••• + ( *_ п; • так что / М = Г {X) — у ^j-J • ПОЛОЖИМ /о = /, хп /] = /¦' и f2 == j- • Очевидно, что все требования для ряда Штурма на интервале (—М, —б) выполнены. Таблица распреде- распределения знаков /О II 12 —М (—1)" (—I)""' (—1)" + + (-1)" показывает одну перемену знаков при —М и одну или нуль пере- перемен при —б, в соответствии с четностью или нечетностью п. Сле- Следовательно, полином f имеет один вещественный (отрицательный) корень при нечетном п и не имеет вещественных корней при чет- четном п. § 4. Обобщенная теорема Штурма 1. Индекс полинома с вещественными коэффициентами относи- относительно другого полинома. Пусть / и g — два взаимно простых по- полинома с вещественными коэффициентами. Скажем, что веществен- вещественный корень хо полинома f есть корень первого типа относительно g, если произведение f(x)g(x) меняет знак с минуса на плюс, когда х, возрастая, проходит через х0, и, соответственно, х0 есть ко- корень второго типа, если f(x)g(x) меняет знак с плюса на минус. Ясно, что корни первого и второго типа являются корнями нечет- нечетной кратности ибо, в силу взаимной простоты / и g, если f(xo) — O, то g(xQ) Ф 0, и знак f(x)g(x) меняется, только если меняется знак f(x), что имеет место, только если х0 есть корень нечетной крат- кратности. Индексом на промежутке [а, Ь] полинома /, такого, что f(a)=? фО, 1(Ь)Ф0, относительно полинома g называется разность числа корней f первого и второго типа относительно g (кратные корни считаются по одному разу, корни четной кратности оставляются без внимания). 2. Обобщение теоремы Штурма. Пусть для взаимно простых полиномов / и g с вещественными коэффициентами построен ряд
230 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА [ГЛ. IX полиномов fo = f, fi ¦= g, /2, ¦ • •. fk, удовлетворяющий первым трем требованиям ряда Штурма на некотором промежутке [а, Ь]. В частности, такой ряд можно построить при помощи алгорифма Евклида с изменением знаков остатков на обратный: fo- /г [ f lfifl — /2. : f-igi — /з. fk-2 — fk-\gk-\ fk> fk = const. Тек построенный ряд полиномов будем по-прежнему называть рядом Штурма. Теорема. Допустим, что f(x) не обращается в нуль на кон- концах промежутка [а, Ь]. Разность числа перемен знаков в значе- значениях полиномов ряда Штурма в начале и в конце промежутка равна индексу полинома f относительно полинома g. Доказательство. Ясно, что так же, как при доказатель- доказательстве теоремы п. 2 § 3, возможное изменение знаков промежуточ- промежуточных полиномов ряда не влечет за собой изменение числа перемен знаков. Оно может произойти только за сч,ет пары полиномов f0, fu Здесь могут представиться четыре случая: X < Хо X = Xq X > Хо h —а 0 а h а а а fo а 0 —а h а а а /о 0 0 а а а а /о —а 0 —а а а а В первом случае хо есть корень первого типа, а число перемен знаков уменьшается на единицу. Во втором х0 есть корень второго типа, и число перемен знаков увеличивается на единицу. В третьем и четвертом случаях х0 есть корень четной кратности, а число перемен знаков не изменяется. Следовательно, пока х переходит от а к Ь, число перемен знаков уменьшается на столько единиц, сколько имеется в промежутке корней первого типа, и увеличи- увеличивается на столько единиц, сколько есть корней второго типа. Та- Таким образом, разность числа перемен знаков в начале и в конце промежутка равна индексу / относительно g. 3. Полиномы с разделяющимися корнями. Пусть имеется по- последовательность полиномов ра, ри ¦ ¦ ¦, рп, степени которых рав- равны, соответственно 0, 1, ..., п, старшие коэффициенты положи- положительны, и имеются трехчленные соотношения: pk(x) при О, o.2, 3 п. Соотношения эти показывают, что полиномы п, Рп-и ...1 Ро составляют ряд Штурма, полученный исходя из
§ 4] ОБОБЩЕННАЯ ТЕОРЕМА ШТУРМА 231 fo = pn и /|=р„_1 посредством алгорифма Евклида, причем алго- алгорифм Евклида протекает «без вырождения», т. е. степень каждого последующего остатка на единицу меньше степени предыдущего. Распределение знаков, очевидно, дается следующей таблицей: Рп Рп-\ ¦¦¦ Pi Ро — оо + ОО (-If-1 так что число перемен знаков при —оо равно п и при -f-oo равно 0. Это значит, что все корни полинома р„ вещественны и все первого типа по отношению к рп-и Последнее значит, что произведение рпрп-\ меняет знак с минуса на плюс каждый раз, когда х, возра- возрастая, проходит через корень полинома рп. Следовательно, между соседними корнями рп произведение рпрп~\ должно изменить знак с плюса на минус, что возможно только при переходе через корень рп~\. Таким образом, между соседними корнями полинома рп имеется корень полинома рп-\. Так как число корней полинома р„_1 равно п—1 и число интервалов между соседними корнями полинома рп тоже равно п— 1, в каждом таком интервале лежит только один корень полинома рп-\. Про такое расположение кор- корней двух полиномов говорят, что корни разделяются. Из сказанного ясно также, что корни всех полиномов ри р2, ... вещественны и корни соседних полиномов разделяются. Интересно заметить, что установленная связь между свойствами ряда Штурма для пары полиномов и тем, что их корни вещест- вещественны и разделяются, обратима. Именно, если имеются два поли- полинома f0 и /[ степеней п и п — 1 соответственно, с положительными старшими коэффициентами и с вещественными разделяющимися корнями, то алгорифм Евклида для построения ряда Штурма проходит без вырождения, так что все неполные частные имеют первую степень и старшие коэффициенты всех полиномов ряда Штурма положительны. Действительно, пусть х\, хг, ..., хп — корни полинома /о, а gi, .... g,,_i— корни полинома /ь причем Xi < |i < Х2 < ... < Хп-1 < |„_1 < Хп. Для полинома fof\ степени In—1 числа х\, gi, хг, ..., gn-i, хп бу- будут корнями, причем простыми, ибо их число равно степени поли- полинома. Поэтому fof\ меняет знак каждый раз, когда х проходит через эти корни. При достаточно больших по модулю отрицатель- отрицательных значениях х полином fofi принимает отрицательные значения. Поэтому первая перемена знака, когда х проходит через х\, будет с минуса на плюс. Следующая, при переходе через gi, будет с плюса на минус и т. д. Таким образом, при переходе через все корни х\, ..., хп полинома /о полином fo/i меняет знак с минуса на плюс, так что все корни /о имеют первый тип по отношению к f\. Следовательно, разность числа перемен знаков в значениях ряда
232 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА [ГЛ. IX Штурма, построенного исходя из /о и /[ при помощи алгорифма Евклида, при —оо и +°° равна п, что возможно только в случае, если алгорифм проходит без вырождения и старшие коэффициенты всех полиномов ряда Штурма положительны. 4. Число корней полинома в полуплоскости. В теории диффе- дифференциальных уравнений и в ее приложениях важную роль играет распределение корней полинома в левой и правой полуплоскостях плоскости комплексной переменной z. Технически удобнее иссле- исследовать этот вопрос для верхней и нижней полуплоскости; первая задача сводится ко второй посредством замены z — iu. Пусть f B)== aozn + (ai + bii)zn-1 + ... + an + bni— полином с вещественными а,- и Ь/, ао > 0. Положим g(x) = aoxn + a1xn-l+ ... +ап и h(x) = bix"-1 + ... + bn. Будем считать, что f{z) не имеет вещественных корней. Это равно- равносильно тому, что g(x) и h(x) не имеют общих вещественных кор- корней, так что если они не взаимно просты, то их наибольший общий делитель не имеет вещественных корней и, следовательно, не ме- меняет знак при изменении х по всей вещественной оси. Пусть х двигается по всей вещественной оси от —оо к -f оо, Тогда f (x) == g (х)-{- ih(x) будет описывать некоторую непрерыв- непрерывную линию на плоскости, не проходящую через начало координат. При х->+оо и x-i—00 tgarg/(x) = —пт->-0, так что аргумент f(x) при x-v-f-oo и х-*~—оо стремится к целому кратному я, и приращение аргумента f (x) при прохождении х по всех веществен- вещественной оси равно целому кратному п. Это значит, что линия, по ко- которой перемещается f(x), совер- шает целое число полуоборотов вокруг начала координат. Разложим f(x) на линейные множители над 1С: f(x) = a0(x-z1)(x-za) ... Рис- 15- ... (х-гп). Все zi лежат или выше, или ниже вещественной оси. Ясно, что Aarg(x — zi) = Q — (—я) = я, если zi выше вещественной оси, и Aarg(x — г,)==0 — п = —я, если zi ниже вещественной оси (см. рис. 15). Следовательно, Л argf(x) = n{ti\ — п2), где пх — число корней f(z) в верхней полуплоскости, я2 — в нижней (с учетом кратностей). Число полуоборотов —Aargf(x) можно подсчитать при по- помощи следующих геометрически наглядных соображений. Кривая, по которой перемещается f(x), при каждом полуобороте должна Пересекать ось ординат. Это будет происходить каждый раз, когда
§ 4] ОБОБЩЕННАЯ ТЕОРЕМА ШТУРМА 233 л проходит через корень нечетной кратности полинома g(x). Ли- Линия, изображающая f(x), может пересекать ось ординат в поло- положительном направлении, переходя из первой четверти во вторую или из третьей в четвертую, или в отрицательном направлении (из второй четверти в первую или из четвертой в третью; рис. 16). Интуитивно ясно, что число полуоборотов вокруг начала равно разности числа положительных пересечений линии f(x) с осью ординат и числа отрицательных пересечений (в предположении, что число полуоборотов в отрицательном на- направлении считается отрицательным числом). Более подробно это можно пояснить сле- следующим образом. С вектором из начала коор- координат в f(x) свяжем вектор единичной длины того же направления, его конец будет пере- перемещаться по единичной окружности. Прира- Приращение аргумента }(х), разумеется, равно приращению аргумента соответствующего единичного вектора. Ясно, что если единич- единичный вектор проходит некоторую дугу окруж- окружности и затем возвращается обратно, то та- Ри'с кое перемещение можно исключить без изменения суммарного приращения аргу- аргумента. Пометим последовательные пересечения точкой f(x) оси ординат последовательностью знаков + и —, в соответствии с на- направлением этого пересечения. Пусть в получившейся записи ока- окажутся рядом + и —. Это значит, что f(x) перешел из первой четверти во вторую (или из третьей в четвертую) и возвратился из второй четверти в первую (соответственно, из четвертой в третью), ибо попасть в противоположную четверть, не пересекая оси орди- ординат, f(x) не может. Соответствующий единичный вектор тоже идет вспять, и часть пути, содержащую обе точки пересечения, можно исключить. Аналогично можно исключить последовательность — -{-. После таких преобразований мы придем к движению, в ко- котором все пересечения имеют один и тот же знак, и их число (с уче- учетом знаков) равно разности числа положительных и числа отри- отрицательных пересечений. Но если все пересечения имеют одинако- одинаковое направление, то их число, очевидно, равно числу полуоборотов в том же направлении. Если имеет место при х = х0 положительное пересечение линии f (х) с осью ординат, то либо h(xo) > 0 и g(x) меняет знак с плюса на минус, либо /г(хо)<О и g(x) меняет знак с минуса на плюс. В обоих случаях g{x)h(x) меняет знак с минуса на плюс, т. е. х0 является корнем g(x) второго типа. Соответственно, если при х = х0 имеет место отрицательное пересечение, то х0 является кор- корнем g(x) первого типа относительно h(x). Сопоставляя все сказанное, получим, что разность п\— п% числа корней f{x) в верхней и нижней полуплоскостях равно .взятому со
234 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА (ГЛ IX знаком минус индексу полинома g{x) относительно h(x) на всей прямой (—оо, +оо). Определить индекс можно при помощи ряда Штурма, состав- составленного посредством алгорифма Евклида. Если окажется, что g и h ие взаимно просты, то за последний полином ряда следует взять наибольший общий делитель g и Л, который не имеет ве- вещественных корней и, следовательно, не меняет знака при —оо <1 + Пример 1. g {х) == аохп + a-iX"-1 + ... |d,eR[i), a0 > О, и g(x) не имеет кратных корней. Рассмотрим полином f(z) = — Siz) ~Ь &&'(z) > гДе ^ — вещественный параметр, и выясним рас- расположение его корней. Пусть g имеет s вещественных корней и t пар сопряженных комплексных, так что s + 2t = п. Пусть Я > 0. Ясно, что индекс g(x) относительно %g'' {х) такой же, как относительно g'(x). Все вещественные корни g(x) являются корнями первого типа относи- относительно g'(x), так что индекс g относительно g' равен s. Следова- Следовательно, п\ — П2 =—s, где п\ и пч — число корней полинома \{г) в верхней и нижней плоскости. Вместе с п,\ + пг = п = s -f 2t это дает n\ = t и n,2 = s-\-t. При X < 0 получим щ = s-{-i и л2 = ^ При непрерывном изменении Я корни f{z) меняются непрерыв- непрерывно, и их пути не пересекают вещественную ось при А, ф 0, поэтому они только при переходе К через 0 могут переходить из верхней полуплоскости в нижнюю и обратно. При этом t корней g(z) (т. е. корни f(z) при Я = 0), лежащих в верхней полуплоскости, при изменении К будут оставаться в верхней полуплоскости, t корней, лежащих в нижней полуплоскости, останутся в нижней. Что ка- касается s вещественных корней g{z), то при Я>0 они опустятся вниз, а при % < 0 поднимутся вверх. Пример 2. Узнать, сколько корней в левой полуплоскости имеет полином f (г) = г3 + 2г2 + 4г + 2. Сделав замену z = ш и умножив на —/, придем к полиному ф (и) = и3 — 2ги2 — Аи + 2г = и3 — Аи -f t (—2«2 + 2), который имеет в верхней полуплоскости столько же корней, сколько f(z) имеет в левой полуплоскости. Применяя алгорифм Евклида к и3 — Аи и —2«2 + 2, построим для них ряд Штурма: и3 — Аи, —и2 + I, и, —1. Получаем, что индекс и3 — Аи относительно —2и2-f-2 на про- промежутке (—оо, -f оо) равен —3. Значит, все три корня полинома <р(«) лежат в верхней полуплоскости и, следовательно, все корни f(z) находятся в левой полуплоскости. § 5. Приближенное вычисление корней полинома 1. Метод десятичных испытаний. Допустим, что мы нашли ин- интервал (с, c+l), ceZ, в котором находится один простой корень полинома f(x)<= R [л:]. Значения полинома на концах интервала имеют разные знаки. Разделим интервал на 10 равных частей и
5 5] ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ КОРНЕЙ ПОЛИНОМА 235 выберем ту часть, в которой находится корень. Эта часть харак- характеризуется тем, что f(x) на ее концах имеет разные знаки. Этот интервал снова разделим на 10 частей и выберем ту часть, в кото- которой находится корень. После этого шага процесса мы получим корень с точностью до 10~2, но можно продолжить процесс дальше для достижения большей точности. При фактических вычислениях можно увеличивать на каждом шагу интервал в 10 раз. В этом варианте процесс выглядит так. Пусть корень х\ полинома f(x)= аоХп-\- ... + ап находится в ин- интервале (с, с + 1)- Разложим f(x) по степеням х — с: f(x) = = Ь0(х — с)п-\-Ь\(х — с)"-1 -f ... + bn, что делается по схеме Хорнера, и перейдем к полиному /i(f/)= 10"/(x) после замены х — с = у/10. Этот полином имеет корень в интервале @, 10); за- заключаем его между сх и с\ + 1 и повторяем процесс. После двух шагов получаем: хх = с + —¦ + -^ и с2 < ж < с2 + 1, так что ко- корень известен с точностью до 10~2. Пример. Легко видеть, что полином f(x) — x3 — х—1 имеет только один вещественный корень, и он заключен в интервале A, 2). Вычислить корень этого полинома с точностью до 10~2. Разложим f(x) по степеням х—1. Получим по схеме Хорнера f(x) = (x—lK+s(x—lJ+2(x—l) — \. Заменим x=l+-^ и умножим на 103. Получим fi (у) = у3 + 30//2 + 200у — 1000. По- Посредством проб получим, что 3 < r/i < 4. Разлагаем f\ (у) по сте- степеням у — 3. Получим /i (у) = (у — 3K + 39 (у — 3J + 407 (у — 3) — — 103. После замены t/ = 3+ -^- и умножения на 103 получим /2(z) = z3 + 39Oz2 + 407002—103 000, откуда найдем для корня: 2 < Z\ <; 3. Итак, мы получили 1,32 <С х <С 1,33. Описанный метод удобен для вычисления с невысокой точ- точностью корней полинома небольшой степени с небольшими коэф- коэффициентами. Его недостаток — быстрый рост коэффициентов от шага к шагу. 2. Метод непрерывных дробей. Пусть для полинома f(x) снова известно, что он имеет один простой корень х\ в интервале (с, с+ 1). Разложим f(x) по степеням х — с: f(x)=bo(x — с)" + ... ... + Ьп. Мы знаем, что Х\ — с лежит в интервале @, 1). Сделаем инверсию этого интервала посредством замены х — с=*1/у и умножим на уп. Получим ynf(x) = bnyn-\- ... +b0. На этом этапе коэффициенты не изменяются, но только записываются в обрат- обратном порядке. Корень у\ построенного полинома лежит в интервале A, +оо). Заключим его между двумя соседними целыми чис- числами, С\ < у\ < ci + 1, и повторим процесс. Пусть у, =Cx -f —, ?2<z1<e2+l, 21 = с2 + т- и с3 <.ti <? С3 + I. Тогда для корня
236 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА 1ГЛ. IX хх будет «+ТГ причем известно, что Сз<^1<Сз+1. Заменяя t\ на Сз и сз+1 и учитывая характер изменения х при этих заменах (заменяя t\ 1 1 на с3, мы увеличиваем у-, уменьшаем р и увеличиваем х\\ С + заменяя t\ на с3+ 1, мы уменьшаем х\), получим границы для х\\ ^2 1 i 7" ^2 "Г" ~~" Ca + 1 Сз Выражения, которые здесь участвуют, носят название непре- непрерывных дробей. Пример. Применим метод непрерывных дробей к уточнению значения корня полинома х3 — х— 1, 1 < х\ <С 2. Разложим полином по степеням х — 1. Получим (х—1K + + 3(л:—1J + 2(л-—1)—1. Теперь делаем замену х—1 = \/у и умножаем на —у3. Получим у3 — 2у2 — Ъу—1. Корень этого поли- полинома заключен в интервале C, 4). Разложение по степеням (у—3) дает {у — 3K + 7(у — 3J+ \2(у — 3)—1. Замена у — 3=1/г и умножение на —г3 дает г3 — 12г2 — 7 г— 1. Корень этого полинома, очевидно, больше 12 и, как легко видеть, меньше 13. Разложение по степеням г—12 дает (z— 12K + 24(г— 12J + 137(г— 12) — — 85, после замены г—\2=\/t и умножения на —tb получим 35/3—137/ — 24^—1 и для корня tx этого полинома 1 ¦< t\ < 2. Итак: 1 Отсюда получаем границы для х\\ 1+Ц , 25 . ^ . 13 т. е. 177<x1<11q Границы эти довольно тесные. Действительно, 40 77 3080 "
§ 5] ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ КОРНЕЙ ПОЛИНОМА 237 13 Таким образом, 1 -щ = 1,325 есть приближение к корню с из- избытком и отличается от корня меньше чем на 0,00033. Можно до- доказать, что разность таким образом построенных приближений всегда равна 1, деленной на произведение знаменателей. Приведем еще один_ пример, чтобы показать одно интересное явление. Вычислим -у7 2 как корень полинома х2— 2, лежащий в интервале A, 2). Разложим полином по степеням х—1 и сделаем замену х—1 = \/у. После умножения на —у2 получим полином у2 — 2г/—1. Этот полином имеет корень в интервале B, 3). Раз- Разложение па степеням у — 2 и замена у — 2=1/2 дают, после умножения на —г2, г2 — 2г— 1. Мы получили для у и z полиномы с одинаковыми коэффициентами и нас интересуют корни из одного и того же интервала B, 3). Следовательно, процесс будет далее повторяться без изменения, так что 2 + - Периодичность при разложении в непрерывную дробь имеет место для всех квадратичных иррациональностей, т. е. для чисел вида а -' при целых a, b, d, причем й > 0 и d не является квадра- квадратом целого числа. Это явление было обнаружено и доказано еще Эйлером. Читателю, у которого еще сохранилось любопытство, рекомен- рекомендуем найти несколько приближений к ^6. Здесь, конечно, перио- периодичности не будет, но на 6-м шагу произойдет неожиданное со- событие. 3. Способ Ньютона. Этот способ основан на «основном прин- принципе дифференциального исчисления», который, в нестрогих тер- терминах, заключается в том, что график всякой «приличной» функ- функции на малом промежутке изменения независимой переменной мало отличается от прямой, именно, касательной в одной из точек. Пусть с — корень дважды дифференцируемой функции и х0 — до- достаточно хорошее приближение к корню. Тогда имеет место при- приближенное равенство f(x) = f{xo)+f'(xo)(x-xo) для всех х, достаточно близких к хо. Полагая х = с, получим
238 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА 1ГЛ. IX откуда для с получаем приближенное значение Вообще говоря, х\ должно быть лучшим приближением к с, чем исходное приближение х0. По приближению Х\ мы можем найти приближение x<i по фор- муле х2 = х1—р-.—г- и т. д. если последовательность х\, х%, ... сходится, то она сходится к корню полинома /. Действительно, пусть Xfe-vct при &-voo. Переходя к пределу в равенстве Хк = ¦=-vfe-i -->,„ ч ¦ получим а = а — -р-ттг, откуда f(a) = 0. ' \xk-v i ( ' Для того чтобы выяснить, насколько близко к с должно под- подходить исходное приближение х0, произведем оценку, учитывая погрешность исходного приближенного равенства, для чего рас- рассмотрим формулу Тейлора с остаточным членом в интегральной форме: X f W = / (*о) + {х - *о) /' (*о) + \ f" @ (х - S) dl, X, или, после подстановки в интеграле ? = х — t(x — xQ), 1 / (X) = / (*0) + (X - JC0) Г (Х0) + (Х- X0f \ Г (X-t(X- Х0)) ! dt. о Положив х = с, получим Поделим это равенство на f'(xo) и перенесем первые два члена В левую часть. Получим В левой части выражение х0 — L\°\ равно приближению хь Итак, ности Пусть *о выбирается в окрестности точки с, и в этой окрест - ти модуль /'.(*). ограничен снизу числом т и модуль f"(x)
$ 5] ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ КОРНЕЙ ПОЛИНОМА 239 ограничен сверху числом М. Тогда N1 Умножив на -=—, получим \x c\^q<l то \х с|<<72 Поэтому, если -^\xo — c\^.q<l, то -^-\хх — c\^q2. Для дальнейших приолижений -^ | .v2 — с | <1 <г, ..., 2^*а~ с J ^^ . Таким образом, в этом предположении имеет место быстрая сходимость приближение в корню с. Такого рода сходимость, когда погрешность приближения равна по порядку квадрату по- погрешности предыдущего приближения, носит название квадратич- квадратичной сходимости. Для полиномов все проведенные выше рассуждения имеют силу не только для вычисления вещественных корней полиномов с вещественным!: коэффициентами, но и для комплексных корней полиномов с комплексными коэффициентами. Для вещественных функций имеются ситуации, когда нет необ- необходимости выбирать начальное приближение очень близко к кор- корню. Пусть на интервале (а, Ь) первая и вторая производные функции f не меняют знак, а значе- значения f на концах интервала имеют противоположные знаки. В этих пред- предположениях функция / имеет на ин- интервале единственный корень с. Допустим, для определенности, что Y и /" положительны на интервале (а,Ь). Это значит, что f возрастает и выпуклость ее графика направлена вниз (рис. 17). Возьмем начальное приближение х0 справа от корня (например, хо=Ь). Рис. 17. Геометрически очевидно, что следую- следующее приближение х\ будет ближе к с чем х0 и останется справа от с. Подтвердим это вычислением: В силу возрастания f заключаем, что /(*о)> 0, но и /'(jco)> 0 по условию, следовательно, х\ < хо. Далее, а / Х1 хо
.240 РАСПРЕДЕЛЕНИЕ КОРНЕЙ ПОЛИНОМА [ГЛ. IX : — Хо) ^ х0, а /" положительна на всем интервале ибо с гс; с — (а, Ь). Вычисляя далее последовательные приближения х2, х3, ..., мы получим убывающую последовательность, ограниченную снизу а х0- *,^v I Рис. 18. Рис. 19. а х0 V Рис. 20. jl знак уг\ ел ев числом с. Она сходится и, как мы видели выше, сходится к корню /, который на промежутке (а, Ь) только один, именно, с. Легко видеть, что если /' и f" отрицательны на промежутке (а, Ь), то начинать приближения тоже следует справа от корня (рис. 18). Если же f и /" сохраняют на (а, Ь) противоположные знаки, то приближения следует начинать слева (рис. 19, 20). _Пример 1. Найти приближения к V2, т. е. к положительному корню по- полинома f = х2 — 2. Здесь У = 2х, f" = 2, так что /' и /" / положительны на @, +°°)- В качестве / начального приближения можно взять I любое число, большее д/1?. В качестве лч можно взять 2,8, а М = 2. Поэтому xk - д/2 < (**_, - V2O2,8. В качестве Хо возьмем 3/2. Погрешность х0 не превосходит 0,1. Следующее приближение Х\ равно 17/12. Его погрешность не превосходит 0,01/2,8 « 0,003. Следующее приближение х2 равно 577/408. Его погрешность не превосходит 0,0032/2,8 да 0,000003. Разложение в десятичную дробь дает 577/408= 1,414215... вместо л/2~= 1,414213 ... Пример 2. Уточнить значение корня полинома f = х3 — х—1, зная, что 1,3 < х < 1,4 Здесь Г = Зх2 — 1 > 5, Г = 6х < 8,4, М/2т « 0,84 < 1. На- Начиная с приближения лго=1,4 с погрешностью меньше 0,1, мы придем к приближению xlt погрешность которого меньше 0,01,'еле-
§ 5) ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ КОРНЕЙ ПОЛИНОМА 241 дующее приближение х2 будет иметь погрешность меньше 0,0001, следующее х% даст 8 верных десятичных знаков после запятой. Посмотрим, как уточняется приближение х0 = 1,325 = 53/40, по- погрешность которого меньше 1/3000. Для него х\ = 180877/136540 (в обыкновенных дробях). Оно приближает корень с точностью до 1/9000000, т. е. с точностью до одной единицы седьмого знака после запятой. В десятичных дробях х\ = 1,3247180... Метод Ньютона может применяться и к системам уравнений. Пример. Решить приближенно систему *2-г/-1=0, у1 — х — 2 = 0. Построив графики, найдем приближенно координаты их точки пересечения при положительных х и у. Получим начальное при- приближение Хо = 1,7, г/о = 2. При этом приближении невязка в пер- первом уравнении равна —0,11, во втором 0,3. Положим л: =1,7 +А, у — 2 + k. После подстановки получим 3,4/z + A2 — k -0,11=0, Числа А и k малы. Отбросив их квадраты, получим линейную си- систему 3,4А — fe-0,11=0, — А + 4k + 0,3 = 0, откуда найдем приближенные значения для А и k, которые дадут следующее приближение (,vb у\) к (х, у). Именно, А = 0,015, k = = —0,059, так что х\ ¦¦= 1,715, у\ = 1,941. Невязки этого прибли- приближения равны 0,000225 и 0,52481, значительно меньше невязок для
ГЛАВА X ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП § 1. Простейшие сведения 1. Об ассоциативности. Пусть М — множество, в котором опре- определена бинарная операция, сопоставляющая каждой упорядочен- упорядоченной паре а, Ь элементов из М третий элемент — их «произведение» ab. Из упорядоченной тройки abc элементов из М можно построить два произведения (аЬ)с и а{Ьс), из четверки а, Ь, с, d — уже пять: ((ab)c)d, (a{bc))d, (ab) (cd), -a(b(cd)) и a((bc)d), из пятерки элементов — уже 14 и т. д. (Можно доказать, что число осмыслен- осмысленных расстановок скобок в упорядоченной совокупности из /г эле- элементов равно Bп — 2)!/(«!(«—1)!)-) Ассоциативность действия означает, что оба произведения (ab)c и а(Ьс) тройки элементов а, Ь, с равны. Предложение 1. Если действие в М ассоциативно, т. е. М есть полугруппа, то произведение упорядоченной совокупности а\, аг,. • ¦ •, пп элементов не зависит от способа расстановки ско- скобок, т. е. от порядка выполнения бинарных операций. Доказательство. Назовем произведение (...((а\а2)а$)а^..), в котором сомножители присоединяются последовательно по од- одному слева направо, левонормированным. Докажем по индукции, что произведение с любой расстановкой скобок равно левонорми- рованному. Для п = 3 это верно в силу ассоциативности. Пусть я > 3 и уже установлена справедливость предложения для произ- произведений из m элементов при т^п—1. Рассмотрим произведение п элементов О1О2 ••• о.п с какой-то расстановкой скобок (мы ее не пытаемся записать). Так как действие бинарно, это произведе- произведение равно произведению двух произведений а\п2... ак и аи+\ . ¦. ап, с какими-то расстановками скобок. В силу индуктивного предпо- предположения оба эти сомножителя равны левонормированным произ- произведениям. Если k — п— J, то рассматриваемое произведение равно (а\п2 ... ап-\)ап и получается из левонормированного произведе- произведения п\п2 ... ап-\ присоединением "справа еще одного сомножителя а,-., так что оно само левонормированно. Если же k<Zn—1, то (аха2 ... ак)(ак+1 ... an) = (aia2 ... ак)((ак+1 ...-ап-\)ап) и, в силу ассоциативности, равно ((aia2 ... ak){ak+\ ... ап-\))ап. В силу индуктивного предположения (aia2 ... а*) (я*+! ... сип-\) равно левонормированному произведению а\п2 .,,-ап-\, и после
§ 1] ПРОСТЕЙШИЕ СВЕДЕНИЯ 243 присоединения ап получается снова левонормированное произве- произведение. Предложение доказано. Доказанное предложение дает возможность при записи «длин- «длинных» произведений в полугруппе не расставлять скобок, указываю- указывающих порядок выполнения бинарной операции. В частности, произведение п равных сомножителей не зависит от способа расстановки скобок, так что имеет определенный смысл выражение а" (или па при аддитивной записи) и а • ак = ат+к. 2. Аксиомы группы. В первой главе мы определили группу как полугруппу (т. е. множество с бинарным ассоциативным дейст- действием), в которой существует нейтральный элемент е — такой, что ае = еа — а при любом а, и для любого а существует обратный элемент а~' —такой, что а~1а = аа~1 — е. Убедимся в том, что эти аксиомы группы можно несколько ослабить. Предложение 2. Если в полугруппе существует левый нейтральный элемент е, т. е. такой, что еа = а при любом а, и для любого элемента а существует левый обратный а', т. е. такой, что а'а = е, то полугруппа является группой. Именно эти требования были приняты в классической аксиома- аксиоматике теории групп. Доказательство. Докажем, что левый нейтральный эле- элемент е является и правым нейтральным, т. е. ае = а при любом а. С этой целью рассмотрим произведение а"а'аа'а, где а' — левый обратный для а, а" — левый обратный для а', и подсчитаем его двумя способами. Во-первых, а"а'аа'а = ({а"а')а) (а'а) = (еа)е— = ае. Во-вторых, а"а'аа'а = а"((а'а)а')а = а' (еа')а = а"а'а — — (а"а')а = еа = а. Итак, ае = а при любом а. Теперь докажем, что левый обратный а' элемента а является и правым обратным для а, т. е. аа' = е. С этой целью рассмотрим элемент а" а'а а'. Во-первых, а"а'аа' = ((а"а')а)а' = (еа)а' = =>аа'. Во-вторых, а"а'аа' = а"((а'а)а') = а"{еа') = а"а' = е. Итак, аа' = е, т. е. а' есть правый обратный для а. В дальнейшем в мультипликативной записи вместо а' будем писать а-1. Предложение 3. Если в полугруппе имеется левый ней- нейтральный элемент е и правый нейтральный элемент е', то они сов- совпадают. Действительно, ее' = е', так как е — левый нейтральный эле- элемент и ее' = е, так как е' — правый нейтральный элемент. Отсюда следует, что в условиях предложения 3 полугруппа со- содержит только один левый нейтральный элемент, ибо любой левый нейтральный элемент равен выбранному правому нейтральному элементу е' и, по аналогичной причине, в этих условиях полугруппа Содержит единственный правый нейтральный элемент. В част- частности, в группе существует только один нейтральный элемент. При
544 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП 1ГЛ. X использовании мультипликативной записи нейтральный элемент группы будем называть единицей группы и обозначать 1. Предложение 4. В группе уравнение ах = Ъ при данных а и Ъ имеет единственное решение х = a~lb. Уравнение уа = b имеет единственное решение у = Ьа~К Действительно, положим *= a~lb; тогда ах = a(a~xb) = b. Обратно, если ах = 6, то arlax = a~lb и х=а~1Ь. Этим дока- доказано существование и единственность решения уравнения ах ~ Ь. Уравнение уа = Ь рассматривается аналогично. Из предложения 4 непосредственно следует единственность обратного элемента для любого элемента группы. Группа (полугруппа) называется конечной, если она состоит из конечного числа элементов. Число элементов конечной группы (полугруппы) называется ее порядком. Приведем несколько примеров групп сверх тех примеров, ко- которые приводились в § 3 гл. 1. Невырожденные квадратные ма- матрицы с вещественными элементами, очевидно, образуют группу относительно умножения. Эта группа неабелева и бесконечная. Невырожденные матрицы с элементами из конечного поля тоже образуют неабелеву группу, но эта группа конечна. Выяснение ее порядка является не очень простой задачей. Множество всех под- подстановок п элементов образует конечную неабелеву (при п > 2) группу порядка «1. Эта группа называется симметрической группой. 3. Умножение подмножеств группы. Пусть G — группа, А и В— два подмножества ее элементов. Произведением АВ этих подмно- подмножеств называется множество произведений ab, где а <= А, 4ей. Ясно, что имеет место свойство ассоциативности (АВ)С = А(ВС), ибо оба эти произведения составлены из элементов abc = {ab)c — = a {be), a e A, b ^ В, с е С. Если одно из подмножеств состоит из одного элемента, например В = {Ь}, то произведение АВ обознача- обозначается Ab, т. е. в этом контексте нет необходимости отличать элемент от составленного из него одноэлементного множества. Введем еще одно обозначение. Через Л-1 обозначим множество всех элементов, обратных к элементам множества А. Заметим, что А-'- отнюдь не является обратным к Л в смысле умножения подмно- подмножеств группы. 4. Подгруппы. Подмножество Н элементов группы G называ- называется подгруппой, если оно само образует группу относительно действия в G. Из этого определения следует, что если a, b e H, то ab ей. Ясно, далее, что единица Н является единицей G, ибо если еа — а, е,а^ Н, то е = aa~l = IgC. Таким образом, единица группы G принадлежит любой ее подгруппе. Ясно также, в силу единственности обратного элемента в группе, что обратный эле- элемент для любого элемента подгруппы будет для него обратным и во всей группе.
$ 1] ПРОСТЕЙШИЕ СВЕДЕНИЯ 245 Предложение 5. Если подмножество Н элементов группы G содержит вместе с двумя элементами а, Ь их произведение ab и вместе с каждым элементом а его обратный а~1, то Н есть под- подгруппа G. Действительно, надо лишь показать, что Н обладает единицей. Но единица G равна аа~1 при а е Н и, следовательно, принадле- принадлежит Н согласно условиям предложения. 5. Классы смежности. Множество На, где Н— подгруппа груп- группы G и а — некоторый элемент из G, называется левым классом смежности группы G по подгруппе Н. Между элементами под- подгруппы Н и элементами левого класса смежности На имеется есте- естественное взаимно однозначное соответствие z>—>za — u, и*—>. 1—»ыа~1 = г. Если подгруппа Н конечна, то число элементов в каждом левом классе смежности равно порядку Н. Предложение 6. Два левых класса смежности группы G по подгруппе Н либо совпадают, либо не имеют общих элементов. Доказательство. Нужно установить, что если два левых класса смежности имеют общий элемент, то они совпадают. Пусть х^На и х^НЬ. Рассмотрим класс смежности Нх. Так как ig е На, то х = za при некотором геЯ и Нх = Hza с: На. Но а = z~lx, так что На = Hz~lx cz Нх. Следовательно, На = Нх. Аналогично, НЬ = Нх, так что На = НЬ, что и требовалось до- доказать. Попутно выяснилось полезное свойство: На = Нх при любом х е На, т. е. в качестве элемента, порождающего как правый мно- множитель класс смежности, можно взять любой элемент из этого класса. Теорема 7. Группа является дизъюнктным объединением ле- левых классов смежности по подгруппе. (Дизъюнктное объединение — это объединение множеств, по- попарно не имеющих общих элементов.) Справедливость теоремы непосредственно следует из предло- предложения 6, ибо любой элемент группы а принадлежит некоторому классу смежности, именно, На, а различные классы не имеют об- общих элементов. Указанное в теореме разбиение группы называется разложе- разложением группы по подгруппе. Если число левых классов смежности в разложении G по Н конечно, то это число называется индексом подгруппы Н в группе G и обозначается (G:H). Разумеется, если группа G конечна, то индекс любой ее подгруппы конечен. Предложение 8. Пусть G :э Н zd К, причем Н и К — под- подгруппы в G. Если Н в G имеет конечный индекс и К в Н имеет конечный индекс, то К в G имеет конечный индекс и (G:K) = (G;H)(H:K).
246 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП {ГЛ. X Доказательство. Пусть G = U Яа,-, i=l, 2,...,h, и Н = U Kbj, /= 1, ..., k, — разложения G по Я и Н по К. Тогда G = (J Kbjui. Нужно показать, что классы смежности КЬ\<ц по- попарно не имеют общих элементов. Если Kbhah и Kb^а; содержат общий элемент, то Hai и Яаг2 содержат общий элемент, ибо Kb. и i<C6.2 содержатся в Я. Следовательно, ii = t2. Но тогда Kbjt = Kbj.,, что возможно только при /i = /2. Итак, G есть дизъ- дизъюнктное объединение классов смежности KbjCii. Их число равно hk = (G:H){H:K), t. e. (G : К) = (G : Я) (Я : /С). Если подгруппа состоит только из одного единичного элемента, то классами смежности являются одноэлементные множества из элементов группы, так что индекс (G : 1) равен порядку группы G. Полагая К={1} в предложении 8, получим (G:l) = = (G : Я) (Я : 1). Это означает, что порядок конечной группы G делится на порядок ее подгруппы Я и частное от их деления равно (G :Н), т. е. индексу Н в G. (Эту важную теорему легко доказать непосредственно, без ссылки на предложение 8, прямо из разло- разложения группы по подгруппе и того, что число элементов в любом классе смежности одинаково и равно порядку подгруппы.) Наряду с левыми классами смежности можно рассматривать правые классы смежности аН, и для них тоже справедлива тео- теорема о разложении группы по подгруппе. Между левыми и пра- правыми классами смежности имеется естественное взаимно одно- однозначное соответствие. Именно, отображение а>—*-а~1 есть взаимно однозначное отображение группы на себя и это отображение пе- переводит левые классы смежности в правые. Действительно, левый класс На состоит из элементов га при геЯ и обратные элементы а~хг~х заполняют правый класс смежности а~хН. Поэтому если для группы Я имеется конечное число левых классов смежности, то столько же будет и правых, так что определение индекса под- подгруппы при помощи левых или правых классов смежности дает одно и то же. 6. Циклические группы. Группа, составленная положительными и отрицательными степенями одного элемента а, называется ци- циклической группой. Говорят, это элемент а порождает такую группу. Ясно, что элемент а~1 тоже можно считать порождающим. Элементы ..., а~п, .,., а~1, 1, а а", ... могут быть все по- попарно различны. В этом случае группа называется бесконечной (или свободной) циклической. Примером свободной циклической группы может служить группа целых чисел относительно сложе- сложения. Любая свободная циклическая группа ей изоморфна, изо- изоморфизм задается соответствием nt—^a", ибо при умножении сте- степеней элемента а показатели складываются. Но возможно, что среди элементов циклической группы име- имеются равные. Если ак = ат при k > т, то ak~m =lt так что в этом ¦случае некоторая степень с натуральным показателем порождаю-
$ 2J НОРМАЛЬНЫЕ ПОДГРУППЫ И ФАКТОРГРУППЫ 247 щего элемента равна 1. Наименьший натуральный показатель, обладающий этим свойством, называется порядком элемента а. Если порядок равен числу п, то среди элементов 1, с, ..., сп~' нет равных, ибо если бы нашлись равные, то разность показателей дала бы натуральный показатель, меньший чем п, обращающий степень а в единицу. Всякий же элемент ат равен одному из 1, а, ..., а"-1, именно, аг, где г — остаток от деления т на п. Та- Таким образом, порядок группы, порожденной элементом порядка пу тоже равен п. 7. Циклические подгруппы группы. Пусть G— данная группа. Любой ее элемент порождает некоторую циклическую подгруппу. Если G— конечная группа, то и все ее циклические подгруппы конечны. Порядок группы G делится на порядок ее любой под- подгруппы, в частности, на порядок любой циклической подгруппы. Этот порядок равен порядку порождающего элемента. Таким об- образом, верна следующая важная теорема. Теорема 9. Порядок конечной группы делится на порядок любого ее элемента. Пусть G — конечная группа порядка m и а — некоторый ее эле- элемент порядка k. Тогда tn — Ы при целом / и ат = (а*)' = 1. Сле- Следовательно, верно следующее предложение. Предложение 10. Любой элемент конечной группы при возведении в степень порядка группы дает единицу. Это предложение не потребовало для своего доказательства особенно глубоких соображений. Однако из него непосредственно следует такой, казалось бы, нетривиальный факт, как теорема Эйлера. Действительно, примитивные классы вычетов по модулю m образуют группу относительно умножения и порядок этой груп- группы равен значению <р(пг) функции Эйлера. Следовательно, для^ любого примитивного класса а имеет место равенство аф (т> = 1 или, на языке сравнений, а«><т) з= l(modm). Заметим, что при до- доказательстве теоремы Эйлера в гл. I мы использовали коммута- коммутативность умножения, в то время как в предложении 10 коммута- коммутативность группы не предполагается. § 2. Нормальные подгруппы и факторгруппы 1. Определение. Элемент Ь группы G называется сопряженным с элементом а* если существует cs G. такой, что 6= с~1ас. Подгруппа Я группы G называется нормальной (или инвари- инвариантной, или нормальным делителем группы G), если она вместе с.каждым элементом содержит все сопряженные. Ё абелевой группе лТббЗя подгруппа нормальна, так как в та- такой группе при любых а и с будет с~хас = а. В группе квадратных невырожденных матриц над некоторым полем множество матриц с определителем 1 образует нормальную подгруппу. Действительно, если det Л = I, то det у?—1 = 1, и если:
248 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. X detS = 1, то det АВ = 1. Далее, при любой невырожденной С бу- будет det(C~lAC) = det А = 1. Группа ортогональных матриц — под- подгруппа в группе всех вещественных невырожденных матриц, но эта подгруппа не является нормальной, ибо, например, ( „ _, ) / 2 1 Ч /1 0W2 1\ ( 3 24 ортогональна, но ^ j ( J I Q —1 I I } j I = ( _4 _з ) не ортого- ортогональна. Из определения нормальной подгруппы ясно, что нормальная подгруппа Н группы G является нормальной подгруппой для лю- любой подгруппы К, содержащей Н. Действительно, если а е Н и включение с-1 ас е Н выполняется при всех с е G, то оно подавно будет выполняться при всех се/(. 2. Классы смежности по нормальной подгруппе и факторгруппа. Предложение 1. Пусть Н— нормальная подгруппа группы G и с — какой-либо элемент G. Тогда с~хНс = Н. Действительно, по определению нормальной подгруппы, с~хНс с Н. Пусть теперь а — любой элемент Н. Тогда сас~1 = — (с~1)-1 ас~1 е Н и а = c~l(cac~l)c s c~lHc. Поэтому Нас~хНс и, следовательно, с~хНс = Н. Предложение 2. Если Н — нормальная подгруппа группы G и c<=G, то Нс=* сН. Непосредственно следует из с~хНс = Н. Достаточно умножить слева на с. Предложение 3. Классы смежности по нормальной под- подгруппе образуют группу относительно умножения подмножеств группы. Единицей этой группы является сама нормальная под- подгруппа. Доказательство. Пусть G — группа и Я — ее нормальная подгруппа. Рассмотрим произведение двух классов смежности На и НЪ, причем воспользуемся ассоциативностью умножения подмно- подмножеств и предложением 2. Имеем: На-НЬ = Н(аН)Ь = Н(На)Ь = = (HH)ab = Hab. Таким образом, произведение двух классов смежности оказалось классом смежности. Ассоциативность этого умножения нам уже известна. Далее, Н(На) = (НН)а = На и (На)Н = Н(аН) — Н(На) = На, так что Н есть единица при этом умножении. Наконец, (На~х) (На)= На~ха = Н и (На) (Harl)=* = Наа~х = Н, так что На~х есть обратный элемент для На. Пред- Предложение доказано. Группа, образованная классами...смежности..группы G по нор- нормальной подгруппе Н, называется факторгруппой G по Н и обо- обозначается G/H. Мы уже встречались с факторгруппами. Так, классы целых чисел по модулю m по отношению к действию сложения состав- составляли факторгруппу всех целых чисел по подгруппе чисел, крат- кратных модулю т. Аналогичная ситуация имела место в других слу- случаях, когда мы рассматривали сравнения и классы сравнений.
5 3] гомоморфизм 249 Само определение факторгруппы тоже можно сформулировать в терминах сравнений. Именно, назовем два элемента а\ и а2 группы G сравнимыми по нормальной подгруппе Н, если а{а21^ Н или, что то же самое, а\ е На2, т. е. а.\ и а2 принадлежат к одному классу смежности по Я. Тогда, если а\ = а2 (Н) и Ь\ == Ъ% (Н), то аф\^ афъ (Н), ибо a\=Z\a2, b\ — zibi при z\, z2<^H и albl = z^a2z2b2 = zl (^a^2a~')a2b2 = г3а2&2 при 23 = 2, (a^a^1) e #, т. e. aj&i = О2&2- Поэтому, если определить произведение классов как класс, содержащий произведение каких-либо представителей из этих классов, определение будет корректным. Оно, разумеется, совпадает с определением произведения классов смежности как элементов факторгруппы. § 3. Гомоморфизм 1. Определение. Пусть G — группа и S — другая группа (или полугруппа). Пусть каждому элементу а из G сопоставлен неко- некоторый элемент из 5, т. е. дано отображение G в S. Отображение <р называется гомоморфным или гомоморфизмом G в S, если про- произведению элементов из G соответствует произведение их образов, т. е. ф(а1аг) = ф(а!)ф(а2), где ф(а) — образ ueG при отображе- отображении ф. При этом, вообще говоря, не предполагается, что образы элементов G заполняют все S, и не предполагается, что различ- различным элементам из G соответствуют обязательно различные эле- элементы из S, т. е. при гомоморфном отображении элементам из G разрешается «склеиваться». Предложение 1. Гомоморфным образом q>(G) группы G является группа. Образом единицы группы G является единица образа и взаимно обратным элементам G соответствуют взаимно обратные образы. Доказательство. Равенство ц>(аЬ) = ц>(а)ц>(Ь) означает, что произведение двух элементов из ф(С) принадлежит q>(G). Ассоциативность следует из ассоциативности в G и S. Равенство ф(а) = фAй)= фA)ф(а) показывает, что фA) есть левая еди- единица для ф(б). Наконец, ф(а-')ф(а) = ср(а-1а) = фA) показы- показывает, что ф(аН) есть левый обратный элемент для ф(а) в (p(G). Этого уже достаточно (предложение 2 из § 1) для заключения, что ф(<3) есть группа. Чтобы избежать ссылки на довольно слож- сложно доказываемое предложение 2, достаточно было бы рассмотреть еще равенства ф(а)=ф(а1) =ф(й)фA) и ф(а)ф(а-1)==ф(аа-1) = A) Заметим, что если S есть только полугруппа, а не группа, то фA) не обязана быть единицей для всей 5. Однако фA) является единицей для q>(G) или для любой группы, содержащейся в S и содержащей ф(б).
¦250 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. X Введем еще два полезных термина. Гомоморфизм группы G, образом которого является все множество S, называется гомомор- гомоморфизмом G на S («на» вместо «в») или эпиморфизмом. Гомомор- Гомоморфизм G в S, при котором различным элементам из G сопостав- сопоставляются различные элементы в S, называется мономорфизмом или вложением G в S. Ясно, что при мономорфизме имеется взаимно однозначное соответствие между элементами G и их образами, сохраняющееся при умножении, так что при мономорфизме ф группа G и ее образ q>(G) изоморфны. Гомоморфизм G в S, являющийся одновременно эпиморфизмом и мономорфизмом, есть, очевидно, изоморфизм G и S. 2. Первая теорема о гомоморфизме. Пусть ц> — гомоморфное отображение группы G на группу 5. Множество всех элементов из G, имеющих один и тот же образ xeS, называется полным прообразом элемента х и обозначается ф~" (х) (следует помнить, что qr4 (х) является, вообще говоря, множеством элементов G, а не одним элементом). Полный прообраз'единицы группы S назы- называется ядром гомоморфизма. Предложение 2. Ядро гомоморфизма ф группы G на груп- группу S является нормальной подгруппой группы G. Доказательство. Введем обозначение Н для ядра. Если а<=#, то а-'ей, ибо ф(а-') = (ф(а))-1 = 1. Если аеЯ и Ь^Н, то ab^H, ибо ц>(аЬ) = ц>(а)ц>(Ь) = 1 • 1 = 1. Наконец, если аеЯи c^G, то с~1ас^Н, ибо ф(с-1ас)=ф(с)-'ф(а)ф(с) = ф()ф() Предложение 3. В условиях предложения 2 полные прооб- прообразы элементов из S являются классами смежности по ядру гомо- гомоморфизма. Доказательство. Если а и b принадлежат одному классу смежности по Н, то Ь — га при геЯ, и тогда ф(Ь)= ф(г)ф(а) = = 1-ф(а) = ф(а). Обратно, если ф(а) = фF), то ф(а6~')=1, так что ab е Н, а е НЬ и, конечно, b e НЬ. Теорема 4 (первая теорема о гомоморфизме). Гомоморфный образ группы изоморфен ее факторгруппе по ядру гомоморфизма. (Формулировка этой теоремы является пугалом для неосведомлен- неосведомленных, так как состоит практически из одних терминов.) Доказательство. Между образами при гомоморфизме и элементами факторгруппы имеется взаимно однозначное соответ- соответствие, в силу предложения 3. Оно сохраняется при умножении, ибо Ф((На) (НЬ)) = Ф(На)ц(НЬ). Естественно встает вопрос —любая ли нормальная подгруппа может быть принята за ядро гомоморфизма. Ответ положитель- положительный. Отображение группы G на факторгруппу G/H по нормаль- нормальной подгруппе Н, заключающееся в том, что каждому элементу группы G сопоставляется содержащий его класс смежности, есть
§ 3] ГОМОМОРФИЗМ 25 f гомоморфизм, и его ядро совпадает с Я. Это непосредственно сле- следует из определения умножения классов смежности как элементов факторгруппы. Этот гомоморфизм G на G/H называется есте- естественным гомоморфизмом. Первая теорема о гомоморфизме утверждает, что любой гомоморфизм в основном (формальнее — с точностью до изоморфизма) не отличается от естественного гомоморфизма группы на ее факторгруппу по ядру гомоморфизма. Рассмотрим примеры. Пример 1. Пусть дана циклическая группа G порядка п — = mk. Пусть Н — ее подгруппа, порожденная элементом ак, где а — элемент, порождающий G. Ясно, что порядок ак равен пг, и порожденная им группа состоит из элементов 1, ак, а2к,..., а(т~Х)к. Представителями смежных классов G по Н могут служить 1, а, ... ..., ак~х. Умножение смежных классов сводится к сложению по- показателей по модулю k, ибо ак порождает Н. Таким образом, здесь факторгруппа изоморфна циклической группе порядка k. Пример 2. Пусть G — группа по умножению невырожденных квадратных матриц над полем Р, S — полугруппа элементов ноля Р относительно умножения и ср — сопоставление каждой матрице из G ее определителя. Это отображение есть гомоморфизм, так как определитель произведения матриц равен произведению опре- определителей. Здесь образ состоит из всех элементов поля Р, кроме нуля, ибо любой элемент а из Р есть определитель матрицы, отли- отличающейся от единичной тем, что одна из единиц на диагонали за- заменена на а. Ядром отображения является группа матриц с опре- определителем 1, так что эта группа есть нормальная подгруппа группы всех невырожденных матриц (в этом мы убедились раньше пря- прямым подсчетом). Классы смежности по ядру составляют матрицы, имеющие один и тот же определитель. 3. Гомоморфные образы подгрупп. Предложение 5. Пусть Н и К— подгруппы группы G, при- причем Н — нормальная подгруппа. Тогда НК является подгруппой G и НК = КН. Доказательство. Пусть ab^HK, причем иеЯ, b e К- Тогда (аб)-1 = 6-1а-1=(&-1о-16)&-!, причем Ь-'а-'б е= Н, ибо Н — нормальная подгруппа, и b~x e К. Следовательно, (ab)~l e ^НК. Далее, пусть а\Ь\ и a2b2 принадлежат НК, причем й[ и а2 принадлежат Н, Ь\ и Ь2 принадлежат К. Тогда {аф.) ¦ {ajjj) = = (ai&ia2&r )b\b2, где aibxaibT' е= Н в силу нормальности Н и bibi^.K, так что {a{b{) (а262)е НК. Предложение доказано. Заметим, что произведение двух подгрупп, из которых ни одна не является нормальной, вообще говоря, не обязано быть подгруп- подгруппой. Так, если Н состоит из диагональных невырожденных матриц Vo ь2)' а ^ состоит из трех матриц: [_{ _j J, ее квадрата j 0J и ее куба ^Q jj, то НК состоит из матриц вида
252 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП {ГЛ. X (_б2 _&J. { Ьг о J и U bj- Объединение этих трех б2 _&J { Ьг множеств матриц не образует группы, ибо при Ь\ ф Ъ2 матрица )~\blb2~ b22 не входит в это множество. Теорема 6 (вторая теорема о гомоморфизме). Пусть Н и К— подгруппы группы G, причем Н — нормальная подгруппа. Тогда НК/Н изоморфна К/К П Н. Доказательство. Рассмотрим какой-либо гомоморфизм ф группы G на группу 5 с ядром Н, например, естественный гомо- гомоморфизм G на G/H. Образы элементов подгруппы К составят, оче- очевидно, некоторую подгруппу Р группы S, являющуюся гомоморф- гомоморфным образом К при отображении ср', совпадающем с ср на К. Ядром отображения ср' является, очевидно, пересечение К[\Н группы К с ядром Н гомоморфизма ср. Поэтому Р изоморфна К/К(]Н. С другой стороны, если z^P является образом элемента с е К, то полный прообраз ср~'(г) есть смежный класс Не, и объ- объединение всех этих прообразов есть подгруппа НК группы G. По- Поэтому образ НК при гомоморфизме ср снова совпадает с Р и, так как ядро Н гомоморфизма ср содержится в группе НК, группа Р изоморфна НК/Н. Отсюда уже следует, что факторгруппы К!К П Н и НК/Н изоморфны, что и требовалось доказать. 4. Подгруппы факторгруппы. Пусть Н — нормальная подгруппа группы G и К — какая-либо промежуточная подгруппа, т. е. G =э К =э Н, Тогда Н есть нормальная подгруппа для К и фактор- факторгруппа К/Н имеет смысл. Ясно, что К/Н есть подгруппа группы G/H. Если же задана некоторая подгруппа L факторгруппы G/H, то, «рассыпав на элементы G» классы смежности, из которых со- составлена L (точнее — построив объединение элементов, состав- составляющих классы смежности, из которых состоит L), мы получим множество К элементов группы G, которое, очевидно, будет под- подгруппой группы G и К/Н — L. Таким образом, между подгруп- подгруппами факторгруппы G/H и промежуточными между G и // под- подгруппами имеется естественное взаимно однозначное соответ- соответствие. 5. Третья теорема о гомоморфизме. Теорема 7. Пусть имеются два гомоморфизма epi и ц>2 груп- группы G на группы S\ и S2, причем ядро ср2 содержит ядро цц. Тогда существует гомоморфизм <р3 группы Si на группу S2 такой, что ф3ф, = ф2 (г. е. фз(ф1(я)) = фг(я) при любом а е G). Переформулируем эту теорему в понятиях и терминах, имею- имеющих широкое применение в некоторых разделах современной
§ 31 гомоморфизм 253 алгебры. Изобразим эпиморфизмы q>i и <р2 стрелками: У Получится рисунок, называющийся диаграммой с отображе- отображениями. В теореме утверждается, что если ядро ф1 содержится в ядре фг, то существует эпиморфизм фз группы Si на S2 такой, что Фзф] = ф2. В терминах диаграмм это означает, что исходную диаграмму можно замкнуть эпиморфизмом фз, т. е. перейти к диа- диаграмме, причем так, что получившаяся диаграмма будет коммутативной, т. е. при «движении» из G в S2 по стрелке фг и по составному пути, состоящему из стрелок ф1 и фз, будет получаться одинаковый результат. Употребление коммутативных диаграмм очень облегчает рас- рассуждения в ситуациях, где одновременно рассматривается много отображений (в частности, гомоморфизмов). В нашей достаточно простой ситуации в использовании языка диаграмм необходи- необходимости нет. Доказательство теоремы. Возьмем любой элемент zeSi и любой его прообраз а^ G. Все прообразы элемента г отличаются множителями из ядра ф1 и, так как ядро ф! содер- содержится в ядре ф2, их образы в S2 будут совпадать с фг(а). Таким образом, мы построили отображение Si в S2. Обозначим его через фз, т. е. положим фз(г) = ф2(а). Ввиду того, что любой элемент веб является прообразом некоторого г = Ф1 (a)eSu мы видим, что ф2(с) = фз(ф1(а)), так что фзф1 = фг- Произведению ZiZ2 эле- элементов из Si соответствует произведение а\а2 их прообразов с точ- точностью до множителей из ядра фь содержащегося в ядре ф2, так что ФзB122) = ф2(а1а2) = ф2(а1)ф2(а2) = фз(г1)-фзB2), т. е. ф3 есть гомоморфизм Si в S2. Наконец, любой элемент у из S2 есть образ фг(а) некоторого элемента из G, и а, в свою очередь, есть прооб- прообраз некоторого 2SS). Поэтому любой элемент yeS2 есть фз(г) при z e Si, так что фз есть гомоморфизм Si на S2, т. е. эпиморфизм. Теорема доказана. (Рассуждения, составившие доказательство теоремы, удобно проследить на диаграмме.) Пусть теперь ф1 и ф2 — естественные гомоморфизмы группы G на факторгруппы д/Н\ и G/#2, причем Я2 zd H\. Тогда фз из тео-
264 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. X ремы 6 есть гомоморфизм G/Hi на G/H2. Ясно, что его ядром яв- является Н2/Нх. Поэтому верна следующая теорема. Теорема 8. Пусть E=эЯ2гэЯь где Нх и Н2 —нормальные подгруппы в группе G. Тогда H2/Hi есть нормальная подгруппа группы G/H\ и (G/H\)/(H2/Hi) изоморфна G/H2. Разумеется, теорему 8 нетрудно доказать и непосредственно, исходя из рассмотрения классов смежности, из которых состав- составлены упомянутые в условии факторгруппы. Теорему 7 можно рассматривать также как следующее свой- свойство «универсальности» факторгруппы. Пусть Я — нормальная под- подгруппа группы G. Тогда любой образ G при гомоморфизме, при котором элементы группы Я отображаются в единицу, является гомоморфным образом группы G/H. Для того чтобы в этом убе- убедиться, достаточно положить, что ф1 есть естественный гомомор- гомоморфизм G на G/H и фг — какой-то гомоморфизм, при котором эле- элементы Я отображаются в единицу. Тогда ядро ф2 содержит Я, т. е. ядро фь и по теореме 7 образ фг есть гомоморфный образ фактор- факторгруппы G/H. 6. Наименьшая подгруппа, содержащая данное множество эле- элементов. Предложение 9. Пусть дана группа G и некоторое множе- множество S ее элементов. Тогда существует наименьшая подгруппа группы G, содержащая множество S (т. е. содержащаяся во вся- всякой другой подгруппе, содержащей S). Мы дадим два доказательства этого предложения. 1-е доказательство. Из свойств, характеризующих под- подгруппу (предложение 5 из § 1), ясно, что пересечение любого мно- множества подгрупп группы G есть подгруппа группы G. Рассмотрим множество всех подгрупп, содержащих S. Оно непусто, так как ему принадлежит сама группа G. Пересечение всех подгрупп этого множества является подгруппой. Она содержит S и содержится в любой подгруппе, содержащей S. 2-е доказательство. Рассмотрим множество T = S\JS~K Множество Т содержит S и вместе с каждым своим элементом Содержит его обратный. Пусть Я есть множество всех (конечных, разумеется) произведений а\а2 ... ak элементов множества Т. Ясно, что произведение двух элементов из Я снова принадлежит Я и элемент, обратный к элементу а\а2 ... as из Я, тоже принад- принадлежит Я, ибо(а,ао ... аЛ~ = ar1 ... а~1а~1 а множество Т вме- сте с каждым элементом содержит обратный. Таким образом, Я есть подгруппа группы G. Далее, Я содержит 5, ибо среди его элементов имеются все «одноэлементные произведения» а е Т, в частности, элементы из S. Нанонец, любая подгруппа, содержащая S, содержит и множество обратных элементов S~l, тем самым и множество Т и все произведения, составленные из элементов Т, т. е. всю подгруппу Я.
S 3] гомоморфизм 255 Возможно, что наименьшая подгруппа, содержащая множество S, есть вся группа G. В этом случае говорят, что множество S порождает группу G и элементы множества S называются порож- порождающими G или образующими. Так, циклическая группа порож- порождается одним элементом. Нетрудно видеть, что для симметриче- симметрической группы Sn всех подстановок п элементов можно взять две образующих — транспозицию а = A, 2) и круговую подстановку т = Г„ 3 л 1) всех элементов. Действительно, т-'ат = B, 3), х~1B, 3)т —C, 4) и т. д. Таким образом, в группе, порожденной подстановками а и т, содержатся все транспозиции соседних эле- элементов, следовательно, и все транспозиции и все подстановки. Группа, которая порождается конечным множеством образующих, называется конечно порожденной. Класс конечно порожденных групп довольно обширен, и в него входят, очевидно, все конечные группы. 7. Наименьшая нормальная подгруппа, содержащая данное множество элементов. Предложение 10. Пусть дана группа О и некоторое мно- oid ;тво S ее элементов. Тогда существует наименьшая нормальная подгруппа группы G, содержащая множество S. Доказательство. Рассмотрим множество 71 = S(JS~I и множество U, состоящее из всех элементов Т и всех с ними сопря- сопряженных в G. Множество U содержит вместе с каждым элементом обратный и все с ним сопряженные, ибо (с~хас)-х = с~ха~хс и c^i(cjaeI)e2 = (c1c2)~ a(e,c2). Пусть Я есть множество всех про- произведений а|а2 ... а* элементов множества V. Тогда Я есть под- подгруппа группы G и, более того, нормальная подгруппа, ибо при любом себ будет (гх(аха2... ak)c = {c~xa\c) (c~xa2c) ... (c-lakc). Конечно, Я содержит S. Далее, каждая нормальная подгруппа, содержащая S, должна содержать все обратные элементы к эле- элементам S, все сопряженные в G с элементами из S и с обратными к ним элементами и все их произведения, т. е. всю группу Я. Та- Таким образом, Я есть наименьшая из нормальных подгрупп груп- группы G, содержащих множество S. Предложение 10 можно было доказать аналогично первому доказательству предложения 9. Для этого надо воспользоваться очевидным фактом, что пересечение любого множества нормаль- нормальных подгрупп есть нормальная подгруппа, затем рассмотреть мно- множество всех нормальных подгрупп, содержащих S, и взять их пе- пересечение. Это и будет, очевидно, наименьшая из нормальных под- подгрупп, содержащих S. Построенная нормальная подгруппа Я обладает тем свойством, что гомоморфизм группы G с ядром Я отображает все элементы из S в единицу. Более того, гомоморфизм с ядром Н обладает следующим свойством универсальности: любой гомоморфный образ
256 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП 1ГЛ. X группы G, в котором образами всех элементов из S является 1, есть гомоморфный образ группы G/H (т. е. образа группы G при гомоморфизме с ядром Н). Действительно, ядро Н{ гомоморфизма, при котором все эле- элементы из S отображаются в 1, содержит S, S~l и, следовательно, Т, U и все произведения элементов из U, т. е. всю нормальную подгруппу Н. Следовательно, образ G при гомоморфизме с ядром #i есть гомоморфный образ группы G/H, в силу замечания об универсальности факторгруппы, которое было сделано в связи с теоремами 7 и 8. 8. Коммутант группы. Выражение aba~lb~l, где а и Ь — эле- элементы группы G, носит название коммутатора элементов а и Ь. Пусть аЬа-}Ь~1 = г. Тогда ab = zba, так что коммутатор z играет роль как бы поправочного множителя при перестановке элемен- элементов а и Ъ. Поэтому для того чтобы а и Ъ были перестановочны, необходимо и достаточно, чтобы их коммутатор был равен 1. Подмножество группы G, состоящее из всевозможных коммута- коммутаторов и их конечных произведений, носит название коммутанта группы G. Так как элемент, обратный к коммутатору: (afea-'fe-1)-1 = bab~la~l сам является коммутатором, коммутант есть подгруппа группы G, порожденная множеством коммутато- коммутаторов. Далее, элемент c~x(aba~lb~l)c, сопряженный с коммутато- коммутатором, есть тоже коммутатор. Действительно, с~] (aba~xb~l)c = = (c~lac) (c~lbc) (c-lac)-l(c~lbc)-1. Поэтому коммутант есть нор- нормальная группа группы G. Его принято обозначать [G, G]. Факторгруппа группы G по коммутанту абелева. Действитель- Действительно, все коммутаторы элементов группы G находятся в ядре есте- естественного гомоморфизма группы G на факторгруппу по комму- коммутанту и, следовательно, образы любых двух элементов группы G имеют единичный коммутатор, т. е. коммутируют. При любом гомоморфизме ср группы G в абелеву группу образ является гомоморфным образом факторгруппы по коммутанту. Действительно, коммутаторы всех элементов G при гомоморфизме Ф отображаются в 1, т. е. принадлежат ядру гомоморфизма, ко- которое, тем самым, содержит коммутант. В силу свойства универ- универсальности факторгруппы отсюда следует, что образ группы G при гомоморфизме ф есть гомоморфный образ факторгруппы по коммутанту. 9. Центр группы. Центром группы G называется множество ее элементов, каждый из которых коммутирует со всеми элементами группы G. Пусть а принадлежит центру и с — произвольный элемент группы G. Тогда ас = са. Умножив это равенство слева и справа на а-1, получим са~х = а~гс, так что а~] тоже принадлежит цен- центру. Далее, если а и b принадлежат центру, то при произвольном с е G abc = acb = cab, т. е. ab тоже принадлежит центру. Та-
5 4) ПРЯМОЕ ПРОИЗВЕДЕНИЕ ГРУПП 257 ким образом, центр есть подгруппа группы G. Из равенства с~1ас — а при любом c^G следует, что центр является нормаль- нормальной подгруппой группы G. § 4. Прямое произведение групп 1. Внешнее прямое произведение. Пусть имеются две группы G\ и G2. Рассмотрим их декартово произведение, т. е. множество пар {(*ь хг) | X|Gd, х2е^2}, Введем для них «покомпонентное» def умножение: (хь х2) (г/i, у2) = [х\у\, х2у2). Свойство ассоциатив- ассоциативности, очевидно, имеет место, так как оно имеет место в компо- компонентах. Элемент A, 1) является единицей относительно введен- введенного умножения. Для (хи х2) обратным будет, очевидно,(jcj, x~l). Таким образом, декартово произведение групп превращено в группу, которая называется внешним прямым произведением групп G\ и G2 и обозначается G\ X G2. Выясним некоторые свойства внешнего прямого произведения. 1. Множество элементов вида (х, 1) есть нормальная подгруп- подгруппа группы G\ X G2, изоморфная группе G\. То, что элементы вида (хи 1) образуют подгруппу, очевидно. Столь же очевиден ее изоморфизм с группой G] в силу соответ- соответствия (х\, 1)-<->a:i. Подгруппу, образованную элементами вида (jci, 1), обозначим 0\. Из цепочки равенств {Ух. У2У'(Х1 следует, что О\ — нормальная подгруппа в G\ X 62- 2. Множество элементов вида A, х2) есть нормальная подгруп- подгруппа группы G[ X G2, изоморфная G2. Это свойство ничем, кроме обозначений, не отличается от пре- предыдущего. Подгруппа, образованная элементами вида A, х2), обо- обозначается 02. 3. Элементы из подгрупп G\ и бг, соответственно, коммути- коммутируют при умножении. Действительно, (хи 1) A, х2) = (хи х2) и A,х2) (хи 1) = (хих2). 4. 0\ П 02 = 1- Очевидно. 5. O,O2= G,XG2. . Действительно, любой элемент (х\, х2) из Gi X G2 равен (хи 1)A, *2). 2. Разложение группы в прямое произведение. По большей части прямые произведения возникают при изучении конкретных клас- классов групп. Предложение 1. Пусть в группе G имеются две нормаль- нормальные подгруппы #i и Н2 такие, что Нх[\Н2— 1. Тогда элементы из Н\ коммутируют с элементами из Н2.
258 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ X Доказательство. Пусть х\ е Н i и х2 е Я2. Рассмотрим их коммутатор z ==xlx2x^lx2~l. При расстановке скобок z — ~ х{(х2х~хх~1} становится ясно, что г^Ни ибо первый множи- множитель принадлежит Н\ по условию, а второй принадлежит Яь ибо хр'еЯ. и Я1 — нормальная подгруппа. Расстановка скобок 2 = (xix2x-l)x2 из аналогичных рассуждений дает гЕЙ2. Но Н1 и Я2 имеют единственный общий элемент — единицу. Следова- Следовательно, XxX2X^XX~l = I HXiX2 = X2Xi. Теорема 2. Пусть в группе G имеются две нормальные под- подгруппы Нх и Н2 такие, что Hi f| Я2 = 1 « #i#2 == G. Тогда G изо- изоморфна прямому произведению Нх и Н2. Доказательство. Рассмотрим внешнее прямое произведе- произведение Я] X #2 и сопоставим каждой паре (xb x2) e Я[ X ^г элемент *ijt2 группы G. Это отображение гомоморфно. Действительно, про- произведению пар (хи х2)(уи у2) = (х\у\, х2у2) сопоставляется элемент х\у\Х2у2 ^ G. Но в силу предложения 1, у\х2 = х2у\, так что Х\ухх2у2 = Х\Х2у\у2 = {х\х2) (у\у2), т. е. образ произведения пар равен произведению образов. Это отображение является отобра- отображением на всю группу G, ибо G = Н{Н2. Оно взаимно однозначно, ибо если xix2 = У\У2 при хь i/i е Я] и хг, г/2 s Я2, то г/f 1д:1 = у2х21- Левая часть приадлежит Hi, правая Я2, следовательно у {~1х1= =у2^г! = 1, ибо H]f\H2= 1, и xi = t/i, X2 = i/2. Таким образом, отображение (xh x2)-*~xix2 оказывается действительно изомор- изоморфизмом групп Н\У(Н2н G. В этой ситуации говорят, что G разлагается в прямое произве- произведение нормальных подгрупп Hi и Я2, и произведение HtH2 в этом случае называют внутренним прямым произведением нормальных подгрупп Я| и Я2. Понятие прямого произведения естественно обобщается на произвольное конечное множество групп. Именно, (внешним) пря- прямым произведением групп G\, G2, ..., Gk называется множество строк (х\, х2 xh) при xi^Gi с покомпонентным умножением: (*,, хъ ..., xk)(уи у2, ..., yk) = (xiyu х2у2, ..., xkyk). Легко видеть, что это множество есть группа с единицей A, 1, ..., 1). Прямое произведение обозначается GiXG2X ••• ... X Gk. Имеют место следующие свойства. 1. Множество элементов вида A, 1, .... xit 1, ..., 1) обра- образует нормальную подгруппу группы G\ X G2 X • • • X Gk, изо- изоморфную группе Gi. Обозначим ее Oi. . 2. Произведение GXG2 ... Gk равно GiXG2X •• X G*. 3. Элементы групп Gt и G 7 при 1ф\ коммутируют. 4. Пересечение каждой группы Qi с произведением всех осталь- остальных Gj, j ^ i, СОСТОИТ ТОЛЬКО ИЗ 1.
(, 5] ГРУППЫ ПРЕОБРАЗОВАНИЙ 2531 Внутреннее прямое произведение определяется аналогично ра- разобранному выше случаю k = 2. Именно: Теорема 3. Пусть группа G имеет нормальные подгруппы Н1г Н2, ..., Нк такие, что Н\Н2 ... Я& = G и при любом i пересече- пересечение подгруппы Hi с произведением Нх ... //,_i//,+i ... Hk состоит только из 1. Тогда G изоморфна прямому произведению Я] X ... х я,. Доказательство. В силу предложения 1 элементы из раз- разных подгрупп Я, и Hj коммутируют. Сопоставим элементу (хи х2, .... Хь)^НгХН2Х ¦¦¦ XHk элемент ххх2 ... xk. Это отображение гомоморфно: ххх2 ... xky\y2 ¦¦-¦ у и = ххухх2у2... Хиуиг ибо элементы х,- и у1у при 1ф), коммутируют. Оно эпиморфно, ибо #,//2 • • • Hk = G. Оно мономорфно, ибо из равенства х\ .... ... Xi-xXiXi+i ... Xk = y\ ... yi-iysyi+i ... ук следует, в силу ком- коммутирования элементов из разных Я/, что х^т1 —ухх~х ... ... {/{_i*7"-i^i+r^f+i •••#***'• Левая часть принадлежит Н^ правая — произведению всех Я,- при / ф i. Поэтому обе части рав- равны 1 и Xi = yi, и это верно для всех ?=1,2, ..., k. Итак рассмат- рассматриваемое отображение есть изоморфизм. 3. Прямое прозведение факторгрупп. Пусть Яь Я2, ..., Hk — подгруппы групп Gi, G2, ..., G&. Внешнее прямое произведение Н1ХН2Х ¦ ¦ • X Я& есть, очевидно, подгруппа группы Gi X G2X • • • .... X Gfc. Если Hi являются нормальными подгруппами групп d, jo Н[Х Н2\ ... X Hk есть нормальная подгруппа группы G^XGiX ... XG*. Предложение 4. Факторгруппа группы GiXG2X ••• X Gk по Н,ХН2Х ... XHk равна (G,/HX)X(G2/H2)X ... X{Gk/Hk). Доказательство. Смежные классы группы GiXG2X ¦•- ... X Gfc по Н\ХН2Х ••• X Hk образованы последовательностя- последовательностями (z\u\, z2a2 ZkCtk), где zi пробегает Я,-, а а,- — фиксирован- фиксированные элементы из G,. Эти множества естественно рассматривать как последовательности классов смежности {Нха\, Н2а2,..., Hkak). Покомпонентное умножение элементов этих множеств сводится к покомпонентному умножению классов смежности, т. е. элементов факторгрупп Gi/Hi. Тем самым предложение доказано. § 5. Группы преобразований 1. Определения. Пусть задано некоторое множество М и груп- группа G, «действующая» на элементы этого множества; Точнее, это значит, что определено действие (мы будем обозначать его как умножение), сопоставляющее элементу из М и элементу из G но- новый элемент из М. При этом требуется выполнение следующих аксиом: 1. щ-\ = m при любом пг&М; 1 обозначает единицу груп- группы G. 2. m(ziZ2) = (mzi)z2 при любых m^M, z\ и z2 из G.
¦260 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. X Здесь элементы записываются как операторы, действующие на элементы из М справа. Принята также левая запись, при которой действие Z&.G на теМ записывается в форме zm. При левой записи аксиомы записываются в виде: 1. \-т = т. 2. (zyz2)m = zl{z2m). Правая и левая записи совершенно равносильны, но в действии произведения элементов группы на шеМ имеется разница. При правой записи первым действующим является левый сомножитель, а затем действует правый. При левой записи наоборот первым действующим является правый сомножитель. В этом параграфе мы будем пользоваться правой записью. Иногда будем применять левую, и фактически это уже было сделано в другой ситуации при рассмотрении гомоморфизмов. Множество М, на котором определено действие группы G, но- носит название G-оператор но го множества, или, короче, G-множе- ства. Его элементы будем называть точками. Пусть m — некоторый элемент из М. Множество tnG, т. е. мно- множество всех mz при геО, называется орбитой, порожденной точ- точкой т. Точка rh\, лежащая на орбите, порожденной точкой т, порождает ту же орбиту. Действительно, пусть тх = mz\. Тогда m\G =*{mz\)G = m(ziG)== mG. Таким образом, орбиты могут либо совпадать, либо не иметь общих элементов. Тем самым G-множество разбивается на орбиты. Каждая орбита, в свою оче- очередь, является G-операторным множеством, состоящим из одной орбиты, именно, себя самой. Если G-множество М состоит из одной орбиты, то говорят, что G действует на М транзитивно, а само множество М называют однородным пространством по отно- отношению к группе G. Рассмотрим некоторые примеры. Пример 1. М — множество точек на плоскости, Q — группа векторов относительно сложения. Действие вектора на точку опре- определяется как перенос точки на этот вектор. Ясно, что здесь одна орбита, так что множество точек на пло- плоскости является однородным пространством по отношению к пере- переносам на векторы, т. е. параллельным переносам. Пример 2. М — множество точек на плоскости, G — группа всех движений плоскости. Это тоже однородное пространство. Пример 3. М — множество точек на плоскости, G — группа вращений вокруг фиксированной точки 0. Здесь орбитами будут окружности с центром в 0 и сама точ- точка 0. 2. Классы сопряженных элементов. В качестве множества М возьмем саму группу Q и действие элемента геб на элемент йеб определим как сопряжение z~laz. Здесь записывать такое действие в виде правого умножения неудобно, получится путаница
§ 5] ГРУППЫ ПРЕОБРАЗОВАНИЙ 261 с обычным умножением в группе, поэтому оператор сопряжения поднимем в показатель, т. е. будем записывать z~laz = az. Вы- Выполнение аксиом легко проверяется: а1 = 1~ а\ ==а, z2 = (аг>J\ Орбиты в этой ситуации называются классами сопряженных элементов. Среди них имеются состоящие из одного элемента. Таков класс, порожденный единицей, ибо г~Чг = 1 при всех z. Такими же будут классы, составленные из каждого элемента центра, ибо если а принадлежит центру, то az = z~laz = z~lza = = а при любом геС. 3. Строение однородных пространств. Рассмотрим еще один очень важный пример внутри самой теории групп. Пусть G — группа и Н— некоторая ее подгруппа. Рассмотрим множество левых классов смежности На, определив на этом мно- множестве действие группы G как правое умножение на ее элементы, т. е. положив (Ha)z = Наг для гей. Это действие действитель- действительно переводит левые классы смежности в левые классы смежности, и выполнение аксиом G-операторного множества тривиально. Все классы смежности составляют одну орбиту, ибо На2 — = (Яй!1)а[^{а2, т. е. множество левых классов смежности образует однородное пространство по отношению к правым умножениям на элементы группы G. Важность этого примера состоит в том, что пространство клас- классов смежности является изоморфной моделью для любого одно- однородного G-пространства. Уточним сказанное. Скажем, что Gi-операторное множество М{ и О2-операторное множество М^ изоморфны, если группы G\ и G2 изоморфны и имеется взаимно однозначное соответствие между элементами My и М^, сохраняющееся при применении соответствующих друг другу элементов групп G\ и Ог- Теорема 1. Любое однородное G-пространство М изоморфно пространству классов смежности по некоторой подгруппе. Доказательство. Пусть то —некоторая точка простран- пространства М. Рассмотрим множество Н всех элементов группы G таких, которые не изменяют т0, т. е. таких геС, что tnoz = m0. Оче- Очевидно, что такие элементы образуют подгруппу группы G, ибо если tnoz = mo, то mozz~l — moz-{, т. е. moz-1 = mo, и если muz\ = = m0 и moZ-i = m0, то mo(ziz2) = (mQzi)z2 = m0z2 = m0. Подгруппа H называется стабилизатором точки mo. Возьмем теперь любую другую точку mi. Так как М однородно, т. е. состоит из одной ор- орбиты, найдется элемент ieG такой, что m^x-=m,\. Выясним, ка- какие еще элементы преобразуют т0 в ni\. Пусть tnoy = mi. Тогда
262 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. X тоху-1 = т\угх = т0, так что ху~[ ей и хе Ну. Таким обра- образом, элементы из G, одинаково преобразующие точку т0, принад- принадлежат одному левому классу смежности по стабилизатору. Обрат- Обратно, если элементы хну принадлежат одному левому классу'смеж- классу'смежности по стабилизатору, то тох = тоу. Таким образом, между точками однородного пространства М и левыми классами смеж- смежности по стабилизатору имеется взаимно однозначное соответ- соответствие. Оно сохраняется при умножении справа на элементы G. Действительно, если т\ = тох, то точке т.\ соответствует класс Нх. Пусть т2 = гп\у = тоху. Этой точке соответствует класс Нху — (Нх)у. Теорема 1 доказана. Сделаем одно замечание. Мы установили, что однородное про- пространство изоморфно пространству левых классов смежности по стабилизатору некоторой точки т0, выбранной произвольно. Но у разных точек стабилизаторы различны. Почему же выбор точек т0 произволен? Для того чтобы в этом разобраться, выясним, как свя- связаны стабилизаторы различных точек. Пусть, как и раньше, стаби- стабилизатор точки т0 обозначен Я. Для любой другой точки тх имеем Ш\ = тох при некотором х е G. Равенство m\Z = ni\ равносильно равенствам гщхг = тох., moxzx~x = то, что имеет место в том и только в том случае, если xzx~l e Я, т. е. гег-'йх. Таким обра- образом, стабилизатор точки т\ есть х~1Нх. Изоморфное отображение группы G на себя называется авто- автоморфизмом группы. Отображение а^-^х~1ах при фиксированном ,1ёй есть, очевидно, отображение G на себя, причем изоморфное, ибо х~]а\й2Х = (x-'aiJf) (x~1a2x), т. е. оно является автоморфизмом. Такой автоморфизм называется внутренним. При этом автомор- автоморфизме подгруппа Я группы G переходит в сопряженную подгруппу х~1Нх. Левый класс смежности На переходит во множество х~хНах = х~1Нхх~1ах, которое является левым классом смежности по подгруппе х~]Нх, порожденным элементом х~1ах. Ясно, что пре- преобразование классов смежности по подгруппе Я, вызванное умно- умножением справа на z^G, будет таким же, как преобразование классов смежности по подгруппе х~хНх, вызванное умножением справа на элемент xrxzx. Поэтому пространство классов смежности по" подгруппе Я изоморфно пространству классов смежности по сопряженной подгруппе х~]Нх. Наличие такого изоморфизма может служить объяснением того, что при доказательстве теоремы 1 можно было взять точку т0 и ее стабилизатор произвольно. 4. К теории подстановок. Как уже говорилось, подстановками называются взаимно однозначные отображения на себя конечных множеств. Будем считать, что {1, 2, ..., п} — множество, на кото- котором действуют подстановки. Пусть a — некоторая подстановка и 1, о, ..., пт~х — циклическая группа, порожденная подстановкой о. Множество переставляемых элементов разбивается на орбиты, и подстановка вполне определяется тем, как она действует на каждой
§ 51 ГРУППЫ ПРЕОБРАЗОВАНИЙ 263 орбите. Пусть ао — один из переставляемых элементов. Обозначим через ai тот, который получается из a<j применением подстановки о, через аг тот, который получается из ао применением а2 (т, е. применением я к fli), и т. д. При продолжении этого процесса в конце, концов вернемся к элементу ао. Таким образом, элементы орбиты, содержащей ао, естественно располагаются в порядке (ао, а\, ..., a/j-i), в котором подстановка о переставляет элемен- элементы по кругу. Таким же образом элементы располагаются на всех орбитах. Подстановка разбивается на циклы: о — (а0, аи .... ak-\) (b0, bu • ••, bm-i) ... (со, C\, ••-, cp-\). Если каждый цикл (ао, аи ..., a^-i) рассматривать как под- подстановку, циклически переставляющую элементы ао, аи ..., ак-\ и оставляющую все остальные элементы на своих местах, то мы можем рассматривать равенство а = {аа, а\, .... а*_[)-(й0. Ь\, •••, Ьт-\) ... (со, си ..., cp_i) как разложение подстановки в произведение циклов, попарно не содержащих общих элементов. Легко видеть, что цикл (а0. аи •¦•» ak-i) допускает такое раз- разложение в произведение транспозиций: (ао. а aft_1) = (a0, ai) (а0, а2) ... (ао, a*-i). откуда следует, что цикл нечетной длины является четной подста- подстановкой, цикл четной длины — нечетной. Поэтому четность или не- нечетность подстановки совпадает с четностью или нечетностью ко- количества циклов четной длины. Предложение 2. Пусть а — подстановка, разложенная на циклы, их — некоторая другая подстановка. Тогда, чтобы получить подстановку т"'от, нужно сделать подстановку i в каждом цикле подстановки а. Доказательство. Пусть а = (а0, аи ..., ак_х)(Ь0, Ьи ..., 6т_,) ... (с0, си •••, ep-i), b\ ••• bm-i ••• co ci Тогда (% ai ••• aft-i *о b\ ••• bm-i ••• co ci •¦• cp-i\ \a0 сц ... ak_l b0 by ... bm_x ... c0 c{ ... cp_x ) c'o c' ... c'p_t\ C0 c\ ••• Cp-\)' b0 b\ ••• bm-\ Проследим за действием подстановки x~lat на элементы а'о, а, #?_, и т. д. Подстановка т-1 переводит а' в ао, а пере- переводит ао в at, т переводит at в а[. Следовательно, х~1от перево- переводит а'й в a'v
264 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП |ГЛ X Таким же образом прослеживается судьба элемента а[. Он сперва переходит в а\, затем а\ в ач и аг в а'2, так что а\ перехо- переходит в а'2. Наконец, a'k_x переходит в ak-\, a*_i в а\ и а{ в а\, так что цикл (а'о, а\, ..., a^-i) замыкается. То же самое происходит и с остальными циклами, так что т-]сгт = (а;> а[,..., <_,)(*>;, Ъ\ *'„.,) ... (cj, cj, .... <>_,). Отсюда следует Теорема 3. Для того чтобы две подстановки были сопря- сопряжены в симметрической группе, необходимо и достаточно, чтобы они имели разложения на циклы одинаковых порядков. Необходимость непосредственно следует из предложения 2. Достаточность — из того, что в симметрической группе существуют подстановки, переводящие любое расположение элементов в лю- любое другое. В силу этой теоремы число классов сопряженных элементов в симметрической группе Sn равно числу разбиения числа п на сла- слагаемые, порядок которых безразличен. Так, число 5 допускает раз- разбиения 5 = 5, 5 = 4 + 1, 5 = 3 + 2, 5 = 3+1 + 1, 5 = 2 + 2+1, 5 = 2+1 + 1 + 1 и 5=1 + 1 + 1 + 1 + 1. Поэтому в группе 55 имеется 7 классов сопряженных элементов. 5. Примеры из геометрии. Пусть М — множество точек на плоскости и G — группа всех движений плоскости. Стабилизатором точки является группа вращений вокруг этой точки. Между точ- точками плоскости и левыми классами смежности группы всех движе- движений по группе вращений вокруг точки имеется изоморфное соответ- соответствие. Элементарная геометрия изучает свойства геометрических фи- фигур, остающиеся неизменными при движениях. Одно из основных понятий геометрии — расстояние между двумя точками — можно рассматривать как инвариантную величину, связывающую пару классов смежности полной группы движений плоскости по под- подгруппе вращений. Можно сказать, что пара групп G zd H определяет некоторую геометрию, в которой точками являются левые классы смежности G по Н, а движениями — правые умножения классов смежности на элементы из G. Взгляд на геометрию с точки зрения теории групп был развит немецким математиком Ф. Клейном в конце 19-го века. Геометрия Лобачевского укладывается в эту схему следующим образом. Рассматривается группа дробно линейных преобразова- oz 4- В п t> ний z и-*¦ —+4- комплексных чисел, где а, р, V. о — вещественные коэффициенты, удовлетворяющие зависимости осб — р-у = 1. Верх- Верхняя полуплоскость оказывается однородным пространством для
§ 5] ГРУППЫ ПРЕОБРАЗОВАНИИ 265 этой группы. Действительно, если z = х + yi при у > О, то _ yz + 6 (\x + бJ + vV <zz + В |/ так что мнимая часть числа , д , равная + 6,2 + г . , поло- положительна. Легко проследить, что для любой пары г,'г' комплекс- комплексных чисел с положительными мнимыми частями найдутся вещест- вещественные а, р, v. в, аб — Pv = l. такие, что -г' = "* ^ . Действи- тельно, положив г' = jc' + y't, z = jc+'«//, получим равенство, рав- равносильное требуемому: (*' + y'i) (V (* + yi) + 6) = а (х + ус) + р. Можно даже положить 6 = 0. Отделив вещественную часть от мнимой, получим два линейных однородных уравнения, связы- связывающих а, Р и у, из которых найдем а _ у *»' + х'у р.— ~ уу'{х2 + у2) Y у ' р г/ откуда Положив y = Л/у (^+ »2) . получим требуемое. Верхняя полуплоскость, в которой движения определены как указанные дробно-линейные преобразования, является моделью плоскости Лобачевского, эта модель связана с именем Пуанкаре. Стабилизатором точки i является группа, образованная преобра- преобразованиями z и—» _' . при условии а2 + Р2 = 1- Следователь- Следовательно, точки плоскости Лобачевского находятся в изоморфном (по отношению к группе движений) соответствии с левыми классами ^ ¦• s r o.z + р смежности группы дробно-линейных преобразовании z = —-ц— с вещественными а, р, у, б и аб — fty = 1 по подгруппе, составлен- <. аг + р о . „о . ной из преобразовании _ „ при сг -\- р^^ 1. 6. Централизатор элемента и нормализатор подгруппы. В п. 2 мы рассматривали группу G как G-операторное множество, пола- полагая, аг = z~laz для a^G и геб, т. е. рассматривая действие элементов G как соответствующие им внутренние автоморфизмы. В этой ситуации орбитами являются классы сопряженных элемен- элементов, и каждый класс является однородным пространством. Пусть С— некоторый класс сопряженных элементов ивбС. Стабилиза- Стабилизатором элемента а является множество всех геО, обладающих свойством z~laz = а, т. е. az = za. Таким образом, стабилизато- стабилизатором элемента а является множество всех элементов группы, ком- коммутирующих с а. Это множество образует подгруппу группы G,
266 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП ГГЛ X называемую централизатором элемента а. В силу п. 3 элементы класса сопряженных с а элементов находятся во взаимно одно- однозначном соответствии с левыми классами смежности группы G по централизатору элемента а. В частности, если класс сопряжен- сопряженных элементов конечен, то число составляющих его элементов равно индексу централизатора любого элемента из этого класса. Термин «централизатор» элемента а связан с тем, что центра- централизатор а является наибольшей подгруппой, содержащей а в своем центре. Элементы группы G можно рассматривать как действующие на множестве всех подгрупп группы G в виде соответствующих внутренних автоморфизмов: Н-*-г~^Нг. В этой ситуации орбитами будут классы сопряженных подгрупп. Стабилизатором для под- подгруппы Я является множество всех таких геС, что z~lHz = H. Этот стабилизатор носит название нормализатора группы Я, ибо он является максимальной подгруппой, для которой Я является нормальной подгруппой. Отсюда следует, что между сопряжен- сопряженными с группой Я подгруппами и левыми классами смежности группы G по нормализатору Я имеется взаимно однозначное соот- соответствие, осуществляющее изоморфизм между однородными про- пространствами, состоящими из сопряженных с Я подгрупп, и клас- классами смежности по нормализатору. 7. Центр р-группы. Конечная группа называется р-группой, если ее порядок есть степень простого числа р. Ясно, что все подгруппы р-группы являются р-группами и индекс любой подгруппы в р-группе равен некоторой степени р. Разобьем р-группу G порядка р" на классы сопряженных эле- элементов. Среди классов будут одноэлементные, образованные эле- элементами центра, причем их число не меньше 1, ибо единица группы образует одноэлементный класс. Пусть число элементов центра равно t. Все элементы, не принадлежащие центру, порождают классы сопряженных, содержащие больше одного элемента. Пусть эти классы Сь Сг, ..., Ck. Число элементов в каждом таком классе есть индекс централизатора любого элемента класса и, следовательно, является степенью р'п с большим нуля показате- показателем т. Пусть число элементов в классе С, равно рт', пи > 0. Подсчет числа элементов группы G как суммы чисел элементов во всех классах сопряженных дает p« = / + pm. + pm2+ ... +pmK Из этого равенства заключаем, что / делится на р, и, так как t~^\, будет / ^ р. Таким образом, мы доказали, что любая ко- конечная р-группа имеет нетривиальный центр. Конечно, порядок t центра равен степени р. 8. Преобразования. Взаимно однозначное отображение мно- множества М на себя называется его преобразованием. Тождествен-
§ 5] ГРУППЫ ПРЕОБРАЗОВАНИЙ 267 ное или единичное преобразование заключается в том, что каждый элемент отображается на себя. Последовательное осуществление двух преобразований равносильно третьему преобразованию, на- называемому их произведением. Умножение преобразований (в ука- указанном смысле), очевидно, ассоциативно. Для каждого преобра- преобразования существует обратное, в силу взаимной однозначности пре- преобразований. Для конечных множеств преобразования называются подстановками, и мы уже встречались с группой всех подстановок конечного множества — так называемой симметрической группой. Для бесконечных множеств группы всех преобразований совер- совершенно необозримы, и рассматриваемые в математике группы пре- преобразований выделяются посредством тех или иных достаточно сильных ограничений, связанных с особенностями строения рас- рассматриваемых множеств. Гомоморфное отображение группы G в группу преобразований некоторого множества называется представлением группы G по- посредством преобразований. Множество М, преобразованиями ко- которого представляется группа G, становится G-множеством, если каждому элементу G сопоставить в качестве действия на элементы М соответствующее ему в силу гомоморфизма преобразование. В свою очередь, каждое G-множество М задает представление группы G преобразованиями. Множество преобразований G-множества М, вызванных дейст- действиями элементов G на М, не обязано быть группой, изоморфной G. Оно, вообще говоря, является лишь гомоморфным образом группы G. Ядром гомоморфизма является множество всех элемен- элементов G, вызывающих тождественное преобразование М, т. е. пере- пересечение стабилизаторов всех точек. Следовательно, пересечение стабилизаторов всех точек есть нормальная подгруппа группы G, и группа преобразований, вызванных элементами G на G-множе- стве М, изоморфна факторгруппе G по пересечению стабилизато- стабилизаторов всех точек множества М. Если пересечение стабилизаторов состоит только из 1, то представление группы G преобразованиями G-множества М будет точным, т. е. группа G будет изоморфна группе вызванных ее элементами преобразований множества М. Если G-множество М есть однородное пространство, то стаби- стабилизаторами его точек являются все подгруппы, сопряженные со стабилизатором Н одной из точек. В этом случае группа преобра- преобразований М, вызванных элементами группы G, изоморфна фактор- факторгруппе G по пересечению группы Я со всеми сопряженными. 9. Автоморфизмы группы. Мы уже упоминали, что автоморфиз- автоморфизмами группы называются изоморфные отображения группы G на себя. Среди автоморфизмов мы выделили внутренние автомор- автоморфизмы, вызываемые преобразованиями сопряжения посредством элементов группы. Предложение 4. Внутренние автоморфизмы образуют нор- нормальную подгруппу группы всех автоморфизмов.
268 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП (ГЛ X Доказательство. Будем обозначать автоморфизмы как правые операторы в показателе, внутренний автоморфизм, вызван- вызванный сопряжением посредством элемента г, обозначим аг. Нужно доказать, что при любом автоморфизме а автоморфизм атхага есть тоже внутренний автоморфизм. Применим автоморфизм ат1ага к произвольному элементу а группы. Получим: В силу того, что а — автоморфизм, это выражение равно (za)~l (a") za = (za)~l aza, так что а-]ага есть внутренний авто- автоморфизм посредством элемента za. Факторгруппа группы всех автоморфизмов группы по подгруппе внутренних автоморфизмов называется группой внешних автомор- автоморфизмов. Предложение 5. Группа внутренних автоморфизмов группы G изоморфна факторгруппе группы G по ее центру. Доказательство. Мы уже рассматривали группу G как G-множество по отношению к действию сопряжения аг = z~xaz. Это действие индуцирует в G группу преобразований. Стабилиза- Стабилизатором элемента аеб является централизатор а, пересечение всех централизаторов есть центр G, ибо если элемент принадлежит централизаторам всех элементов, то он должен быть перестаново- перестановочен со всеми элементами G, т. е. должен принадлежать центру и, конечно, каждый элемент центра принадлежит централизаторам всех элементов. В силу п. 8 группа внутренних автоморфизмов действительно изоморфна факторгруппе по центру. Любая абелева группа не имеет нетривиальных внутренних автоморфизмов, ибо в абелевой группе z~laz = а при любых а и z. Внешние же автоморфизмы есть даже у циклических групп. Бесконечная циклическая группа, порожденная элементом а, имеет лишь один нетождественный автоморфизм ak*—>a~k. Дейст- Действительно, образующим бесконечной циклической группы будет либо а, либо с. Ясно, однако, что любой автоморфизм должен переводить образующий в образующий. Автоморфизм а*—>а есть тождественный автоморфизм, автоморфизм а*—>а~] преобразует а* в а-*. Для конечной же циклической группы порядка п существует ф(«) автоморфизмов, именно, автоморфизм может преобразовать образующий а в любой другой образующий, а таковыми являются ат при (т, п)=\, причем т нужно рассматривать по модулю п. Группа, центр которой состоит только из 1, и все автоморфизмы внутренние, называется совершенной. Можно доказать, что сим- симметрические группы Sn подстановок совершенны при п = 3, п = 4, п = Ь и п> 6. Для группы же S6 факторгруппа группы всех авто- автоморфизмов по группе внутренних автоморфизмов имеет индекс 2. Доказательства этих предложений не очень просты.
§ 6] СВОБОДНАЯ ГРУППА 269 § 6. Свободная группа 1. Свободная полугруппа. Пусть задано конечное множества элементов а\, а2, ..., а„, называемых буквами. Это множество на- называется алфавитом. Последовательности а. а. ... а. букв алфа- *1 2 m вита называются словами. Присоединение к данному.слову справа второго слова называется умножением слов. Ясно, что это дейст- действие ассоциативно, так что по отношению к нему слова составляют полугруппу. Естественно ввести в рассмотрение пустое слово. Оно играет роль единицы в полугруппе слов. Так построенная полу- полугруппа называется свободной полугруппой, порожденной данным алфавитом. 2. Свободная группа. Свободная полугруппа, конечно, не явля- является группой, так как произведение непустых слов непусто, так что у непустого слова не может существовать обратного. Для построения на этом пути группы применим следующую конструкцию. К алфавиту 5 = {ci, а2, ..., ап) присоединим вто- второй алфавит S= {й\, а2, ..., ап}- Строим слова в объединении этих алфавитов Т = S U S и вводим для слов в алфавите Т отно- отношение эквивалентности следующим образом. Вставкой в слово в алфавите Т мы назовем присоединение между двумя буквами (или в начале слова, или в его конце) слова aidi или diut. Сокращением слова назовем исключение из слова его части вида а,й; или diai. Два слова назовем эквивалентными, если от одного из них можно перейти ко второму посредством конечного числа вставок и со- сокращений. Ясно, что если два слова эквивалентны третьему, то они эквивалентны между собой, так что все слова разбиваются на непересекающиеся классы эквивалентных слов. Столь же ясно, что если слово А\ эквивалентно слову В\ и слово А2 эквивалентно слову В2, то слово А\А2 эквивалентно слову 6162- Это позволяет ввести естественным образом умножение классов слов, считая про- произведением классов тот класс, который содержит произведение каких-либо слов из этих классов. Класс, содержащий пустое слово, является единицей при этом, умножении. Ассоциативность умно- умножения, очевидно, следует из ассоциативности умножения слов в свободной полугруппе. Классы, содержащие а,- и а,, взаимно об- ратны, ибо слова а&ь и a~ia,i превращаются в пустое слово после сокращения. Наконец для класса, содержащего любое слово, су- существует обратный: если класс содержит слово Ь\, Ъ2, ..., Ьц при bi^T, то обратным будет класс, содержащий слово Вк ... B2Bt (здесь под щ понимается а,). Итак, множество классов эквивалентных слов образует группу. Она называется конечно порожденной свободной группой. Классы, содержащие буквы алфавита S, являются ее образующими. Когда речь идет об обширных классах объектов, всегда прият- приятнее иметь дело с какими-либо стандартными представителями из
•270 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. X этих классов. Здесь роль таких представителей играют несократи- несократимые слова. Слово в алфавите Т называется несократимым, если в нем не стоят рядом буквы а,- и а,-. Теорема \. В любом классе эквивалентных слов существует одно и только одно несократимое слово. Доказательство. То, что для любого слова найдется не- несократимое, ему эквивалентное, очевидно: в исходном слове нужно шаг за шагом, в каком-либо порядке, сокращать соседние «двой- «двойники» а«, а,-. При каждом сокращении длина слова, т. е. число со- составляющих слово букв, уменьшается на две единицы, так что процесс сокращения должен закончиться на несократимом слове после конечного числа сокращений. Остается доказать, что различные несократимые слова не мо- могут быть эквивалентны. Мы докажем это от противного. Пусть даны несократимые слова А и В, и допустим, что они эквивалент- эквивалентны, т. е. что существует конечная последовательность слов Л = Ло> Ль Л2, ..., Лт_1, Ат = В таких, что каждое последующее слово получается из предыдущего вставкой или сокращением. Так как А и В несократимы, переход к Ао к At может быть только встав- вставкой, переход от Ат-\ к Ат — В — только сокращением. Полной высотой перехода от Л к В назовем сумму длин всех промежуточ- промежуточных слов. Пусть At — слово наибольшей длины среди слов Ао,Ль ... ..., Лт-1, Ат. Оно,не крайнее, ибо длина Ах больше длины Ло и длина Лт-i больше длины Ат. Поэтому у слова Л,- имеется как сосед слева Ai-\, так и сосед справа Л(+1. Переход от Ai~\ к Л,- должен быть вставкой, переход от Ai к Л,-+1 — сокращением. Здесь может представиться несколько случаев: 1. При переходе от Л,_1 к Л,- вставили bb и при переходе от Л, к Ai+i вставленную пару сократили. В этом случае Аг-< = Л,+1, так что мы можем исключить из перехода слово Л, и «склеить» Д_1 и Ai+u 2. При переходе от Л,_1 к Л, вставили bb, и справа от этой вставки находился элемент Ь, а при переходе от Л,- к Л<+1 в тройке соседних букв bbb сократили ЪЬ. В этом случае опять A_i ~ = Д-+1. То же самое будет, если вставить bb направо от & и в тройке bbb сократить Bb. 3. При переходе от Л,_1 к Л, вставляется ЪЪ и при переходе от At к Ai+i сокращается ее, и эта пара не имеет общих элементов со вставленной bb. Тогда переход от Л,_| к Ai+\ можно сделать по-другому. Буквы с и с не были вставлены при переходе от А-„-\ к Ai, и следовательно, ее уже присутствовало в Ai-i. Можно было сначала сократить се, получив слово Л'., а затем вставить ЬБ. Длина промежуточного слова А\ на 4 меньше длины слова Л,-, так что полная высота перехода от Л к В уменьшилась на 4. Во всех случаях полная высота перехода может быть умень- уменьшена. Это невозможно, ибо среди переходов от Л к В должен
§ 61 СВОБОДНАЯ ГРУППА 271 существовать переход с наименьшей полной высотой. Следова- Следовательно, эквивалентные несократимые слова равны, что и требова- требовалось доказать. 3. Конечно порожденные группы как гомоморфные образы сво- свободной группы. Теорема 2. Любая конечно порожденная группа с п обра- образующими есть гомоморфный образ свободной группы с п обра- образующими. Доказательство. Пусть ии и2, ..., и„ — система образую- образующих группы G. Рассмотрим свободную группу сначала как полу- полугруппу слов в алфавите аь а%, ..., а„, й\, аъ ..., а„. Каждому слову ... at .. .uj ¦.. сопоставим элемент ... и( ... «г1... группы G. Ясно, что произведению слов соответствует произведение эле- элементов группы G. Покажем, что эквивалентным словам соответ- соответствуют одинаковые элементы. Действительно, вставке am в слово соответствует появление сомножителя и.иг1, равного единице, и сокращению пары am соответствует исключение из произведения utu-1 = 1. Тем самым, построенное отображение есть гомоморфизм свободной группы на группу G. Если некоторое слово ... а,- ... а/ ... из свободной группы вхо- входит в ядро, то соответствующий элемент ... ut ... и~' ... группы G равен 1, т. е. элементам ядра гомоморфизма свободной группы в G соответствуют соотношения между образующими группы G.. 4. Задание группы образующими и соотношениями. Теорема 3. Пусть дан алфавит аи ..., ап, аи ..., ап и слова в этом алфавите Щ = иП---иЩ> W2 = U21 • • • ft2, ••" Wm = Vm\ ' ' • V mkm. Здесь vn обозначают буквы алфавита. Тогда существует группа Gen образующими щ, ич ип, в которой выполнены соотно^ шения г\ ~XU- • 'X\kx = ' Z1 ~ Х21 • ' • X2k2 =ж ' > • ' •' Zm = Xm\ * " " Хткт = 1 г еде хц =»з Us, если vij = as, и xtj=^ujx, если х>ц = at. Среди групп, для образующих которых выполнены указанные соотношения, су- существует группа G, в которой все соотношения между образую- образующими являются следствиями данных соотношений, и эта группа обладает свойством универсальности — любая группа, в которой выполнены предписанные соотношения, является гомоморфным образом группы G. Прежде чем доказывать теорему, необходимо выяснить, что по- понимается под следствиями из данных соотношений. Мы считаем, что если г( = хп ... xik= 1 есть соотношение, то соотношение z^'==x^ ... ж~,' = 1 является его следствием. Если
272 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. X 2j = 1 и Zj = 1 — два соотношения, то соотношение ZtZj = 1 яв- является их следствием, и, наконец, если Zi — 1 есть соотношение, то при любом j/eG соотношение y~lziy = 1 тоже считается след- следствием. Доказательство. Рассмотрим свободную группу с обра- образующими аи ...» Яп и в ней наименьшую нормальную подгруппу, содержащую Доь Шг, ..., wm. Напомним, что эта подгруппа со- состоит из элементов доь w2, .... wm, обратных к ним элементов, со- сопряженных с ними и произведений всех таких элементов. Гомо- Гомоморфный образ G свободной группы с так построенным ядром будет иметь предписанные соотношения. Другие соотношения бу- будут определяться всеми элементами ядра гомоморфизма, и в силу устройства этого ядра, будут следствиями предписанных соотно- соотношений в описанном выше смысле. Если в группе, кроме предписанных соотношений и их следст- следствий, выполняются еще какие-либо соотношения, то ядро гомомор- гомоморфизма будет содержать указанную нормальную подгруппу, и, в силу свойства универсальности факторгруппы, группа будет гомо- гомоморфным образом группы G. Доказанная теорема дает возможность задавать группы при помощи задания образующих и соотношений между ними. Эти соотношения называются определяющими соотношениями. Груп- Группы, имеющие конечное число образующих и конечное число опре- определяющих соотношений, называются конечно определенными. Именно такие группы часто возникают в приложениях теории групп к геометрии и топологии. Иногда определяющие соотноше- соотношения таковы, что элементам группы удается дать некоторую кано- каноническую запись, и умножение элементов в канонической записи не представляет труда. Рассмотрим примеры этого рода. Пример 1. Группа задана двумя образующими а и Ь, свя- связанными соотношениями а2 = 1 (т. е. а = а~1), Ь3 = 1 и aba = b2. Очевидным следствием из этих соотношений является ab2a = Ь. Последние два соотношения можно записать в форме ba = ab2 и Ь2а = ab. Эти соотношения позволяют переносить образующий а через b или Ь2 справа налево, заменяя b на Ь2 и Ь2 на Ь. Это позво- позволяет записать любой элемент группы в форме akbm при k = 0, 1 и m = О, 1,2. Рассматривая элементы этого вида формально, с пра- правилами умножения, вытекающими из правила переноса а справа налево и условий а2=1 и Ь3—1, нетрудно проверить, что сим- символы akbm действительно образуют группу. Она конечна,' ее поря- порядок равен 6. Легко видеть, что она изоморфна симметрической группе подстановок трех элементов. Изоморфизм дается соответ- соответствием аь-*A, 2), &ь-»A, 2, 3). Пример 2. Группа задана двумя образующими с и а и соот- соотношениями а2 = 1 и аса = с~К Здесь образующий с свободен, т. е. порождает бесконечную циклическую группу. Очевидным след- следствием из этих соотношений является аста = с~т при любом це-
§ 7] СВОБОДНЫЕ ПРОИЗВЕДЕНИЯ ГРУПП 273 лом т, т. е. преобразование сопряжения посредством а вызывает в подгруппе, порожденной образующим с, единственный нетриви- нетривиальный автоморфизм. Из соотношения аста = с~т следует пра- правило переноса образующего а справа налево, именно, ста = ас-. Это правило позволяет записать любой элемент группы в виде аьст ПрИ ? __ о> 1 и любом целом т. Легко проследить, что сим- символы акст при умножении с правилами, обусловленными соотно- соотношениями а2 = 1 и ста = ас~т, действительно образуют группу. Эта группа нам еще встретится в следующем параграфе. Однако при задании группы образующими и определяющими соотношениями имеет место одна принципиальная неприятность. Если даны два элемента группы, записанные через образующие, как узнать, равны они или нет? Вопрос легко решается, если со- соотношения таковы, что существует каноническая форма записи. Однако такой характер соотношений является скорее исключе- исключением, чем правилом. Проблема распознавания равенства элемен- элементов группы, заданной образующими и определяющими соотноше- соотношениями, называется проблемой тождества в теории групп. Для свободной группы она решается благодаря канонической записи элементов в виде несократимых слов. Проблема получила поло- положительное решение для групп с одним соотношением. Однако в 1952 г. П. С. Новиков доказал, что не существует алгорифма, по- позволяющего решать проблему тождества в общей постановке. Бо- Более того, им построена такая система определяющих соотношений между образующими, что не существует алгорифма для решения проблемы тождества в группе, заданной этими образующими и соотношениями. При этом доказательство потребовало точного определения того, что такое алгорифм, и привлечения средств со- современной математической логики. Разумеется, несуществование общего алгорифма для любых элементов не значит, что задача не может быть решена индиви- индивидуальным приемом для заданной пары элементов. Из того, что алгорифмически неразрешима массовая проблема, не следует не- неразрешимость индивидуальных проблем. По своей принципиальной значимости результат П. С. Нови- Новикова находится в одном ряду с классическими «отрицательными» результатами в математике, такими, как недоказуемость посту- постулата Евклида о параллельных (следующая, например, из непро- непротиворечивости геометрии Лобачевского) и неразрешимость в ра- радикалах общих алгебраических уравнений пятой степени и выше. § 7. Свободные произведения групп 1. Определение. Пусть даны группы G\, G2 , Gn. Составим слово из произвольных элементов групп G\, G2, ..., Gn в любом порядке. Для таких слов введем действие удлинения, заключаю- заключающееся во вставке в любое место единицы любой группы и в за-
274 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. X мене какого-либо элемента в слове равным ему произведением двух элементов той же группы. Вставку единицы можно рассма- рассматривать как частный случай замены элемента произведением, если отождествить единицы всех групп. Тогда вставка единицы равно- равносильна замене левого соседнего элемента а на а Л или правого соседнего b на \-Ь. Обратные операции — выбрасывание единицы и замена рядом стоящих элементов одной и той же группы их про- произведением — назовем сокращением. Два слова будем считать эквивалентными, если возможен переход от одного к другому по- посредством конечного числа удлинений и сокращений. Все слова разбиваются на классы эквивалентных. Ясно, что эквивалентность сомножителей влечет эквивалентность их произведений. Это по- позволяет определить умножение классов эквивалентных слов. Умно- Умножение ассоциативно, роль единицы играет пустое слово (или слово, составленное из единицы, которая отождествлена с единицами всех групп). Для каждого класса существует обратный, так что классы эквивалентных слов образуют группу. Эта группа назы- называется свободным произведением групп G\, G2, ..., Gn- Слово называется несократимым, если в его составе нет еди- единиц и нет соседних элементов из одной группы. Теорема. В каждом классе эквивалентных слов имеется одно и только одно несократимое слово. Доказательство. Для построения из данного слова несо- несократимого достаточно выкинуть единицы и умножить рядом стоя- стоящие элементы из одной группы. Остается доказать, что неравные несократимые слова не экви- эквивалентны. Это мы докажем подобно доказательству аналогичного утверждения для свободной группы. Пусть А и В — различные несократимые слова, и пусть Л = Ло, Ль ..., Ат-\, Ат = В — по- последовательность слов, в которых последующее получается из пре- предыдущего посредством удлинения или сокращения. Переход от Ло к А\ может быть только удлинением, переход от Ат-\ к А,„ = В может быть только сокращением. Сумму длин слов А\, ..., Am_i назовем полной высотой перехода. Пусть Л,- — слово наибольшей длины. Оно не может быть крайним, так что у него есть два сосед- соседних А,--\ и А{+1. Переход от Л,_1 к Л,- должен быть удлинением, от Л* к А-+1 — сокращением. Могут представиться следующие случаи. 1. При переходе от Л,_] к Л,- элемент Ъ заменили на произве- произведение b\b2 элементов той же группы, а при переходе от Л, к Ai+i заменили Ьф2 на Ь. Ясно, что в этом случае Л,_1 = Л,+], Л, можно исключить из перехода, а Л(_! и Л,+] — «склеить». Полная высота перехода уменьшится. 2. При переходе от Л,_] к Л,- элемент b заменили на произве- произведение fri&2, а при переходе от Л,- к Ai+i соединили Ь\ с предшест- предшествующим элементом а из той же группы. Это значит, что в слове Ai-i была последовательность букв аи и в слове Лг+1 вместо нее
§ 8] КОНЕЧНЫЕ АБЕЛЕВЫ ГРУППЫ 275 появилась последовательность букв сй2. где с = аЪ\. Переход от At-\ к Л,+1 можно было сделать иначе — сперва сократить, соеди- соединив а и Ь, а потом удлинить, вставив вместо произведения ab рав- равное ему произведение cb2. Промежуточное слово А\ будет короче At на 2, так что полная высота уменьшится. Аналогично рассматривается случай, когда после замены b на Ъ\Ь2 элемент Ь2 соединяется со следующим элементом, который должен принадлежать той же группе. 3. При переходе от At-\ к Л,- заменили элемент Ь на произве- произведение Ьф2, а при переходе от Л,- к Л,-+1 заменили С\С2 на их произ- произведение с в другом месте, не затрагивая элементов Ь\ и Ьг. В этом случае для перехода от Лг_1 к Л;+1 можно было сперва заменить С\С2 на с, а потом заменить Ъ на Ьф2. Промежуточное слово A't короче слова Л* на 2. Полная высота перехода тоже уменьшилась. Итак, при переходе от несократимого слова Л к несократимому слову В всегда можно уменьшить полную высоту перехода. Мы получили противоречие, ибо безграничное уменьшение полной вы- высоты невозможно. Таким образом, несократимые слова не могут быть эквивалентны и могут служить каноническими представите- представителями классов, т. е. удобной записью элементов свободного произ- произведения групп. 2. Пример. Рассмотрим свободное произведение двух цикличе- циклических групп второго порядка с образующими а и Ъ. Несократимые слова состоят из чередующихся букв а и Ъ. По- Положим аЪ ±= с. Тогда с~х = ba, cm — abab ... аЬф\, так что с порождает свободную циклическую группу. Элементы а и с яв- являются образующими, ибо b = ас. Далее, са = aba = ac~K Таким образом, свободное произведение двух циклических групп второго порядка изоморфно группе примера 2 предыдущего пункта. Эта группа имеет простую геометрическую интерпретацию. Возьмем на плоскости две параллельные прямые х = 0 и х = с. Обозначим через а отражение относительно первой прямой и че- через Ъ — отражение относительно второй прямой. Ясно, что а2 = = 62=1. Отражение а переводит точку с абсциссой х в точку с абсциссой —х, отражение b преобразует х в с — х. Следователь- Следовательно, преобразование ab переводит х в с — (—х)==с-\-х, т. е. ab есть сдвиг на с. Группа сдвигов на кратные с есть свободная ци- циклическая группа. Поэтому все произведения чередующихся букв а и b различны, т. е. группа, порожденная отражениями от двух параллельных прямых, есть свободное произведение двух цикли- циклических групп второго порядка. § 8. Конечные абелевы группы 1. Разложение конечной абелевой группы в прямую сумму при- марных абелевых групп. В этом и следующем параграфах мы из- изложим теорию конечно порожденных абелевых групп, причем бу-
276 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП [ГЛ. X дем пользоваться аддитивной записью и соответствующей терми- терминологией. Действие в группе будем называть сложением и обозна- обозначать знаком +. нейтральный элемент назовем нулем группы и обозначим 0, вместо обратного элемента будем говорить о проти- противоположном, вместо степеней — о кратных, вместо термина прямое произведение будем говорить прямая сумма и для обозначения прямой суммы будем использовать знак Ф. Пусть G — конечная абелева группа и а — ее элемент. Нату- Натуральное число т такое, что та = 0, назовем аннулятором эле- элемента а. Среди аннуляторов найдется минимальный, именно, по- порядок элемента а. Предложение 1. Все аннуляторы элемента а е G делятся на его порядок. Действительно, пусть m — порядок элемента а и т\— какой- либо другой аннулятор. Тогда Ш\ = mq + г, 0 ^ г ^ m — 1, и га — = т\а — qma = 0, и, следовательно, г = О, в силу минималь- минимальности аннулятора т. Аннулятором группы называется натуральное число, при умно- умножении на которое аннулируются все элементы группы. Порядок группы принадлежит к числу ее аннуляторов. Среди аннуляторов группы существует минимальный и все аннуляторы на него де- делятся. Предложение 2. Пусть m — аннулятор группы G и m — = m\tn2, причем т\ и т2 взаимно просты. Тогда G разлагается в прямую сумму двух подгрупп, одна из которых аннулируется чис- числом Ш\, другая — числом т2. Доказательство. Пусть G\ — множество всех элементов группы G, которые аннулируются числом mj, и G2— то же для гщ. Ясно, что G\ и G2— подгруппы G. Ввиду взаимной простоты пг\ и пг2 найдутся целые числа и\ и и2 такие, что m,\U\ + m%u% = 1. Пусть а е G. Тогда а — m.\U\a -\- пг2и2а. Первое слагаемое ni\U\a принад- принадлежит G2, ибо т2Ш\ща — 0. Соответственно второе принадлежит G\. Таким образом, G = G\ ~f- G2. Чтобы убедиться в том, что сумма прямая, остается установить, что G\ П G2 = 0. Пусть а е е G] П G2. Из равенства а = m\U\a + т2и2а заключаем, что а — 0, ибо равны нулю оба слагаемых правой части. Заметим, что из самого построения групп G\ и G2 следует, что они определены однозначно. Предложение 3. Пусть аннулятор m группы G разлагается в произведение m = m\m2 ¦ ¦ ¦ ttik попарно взаимно простых со- сомножителей. Тогда G разлагается в прямую сумму подгрупп с ан- нуляторами ш\, пг2, ..., т*. Непосредственно следует из предложения 2. Конечная абелева группа называется примарной, если ее анну- аннулятор есть степень простого числа. Теорема 4. Конечная абелева группа разлагается в прямую сумму примарных подгрупп.
§ 8) КОНЕЧНЫЕ АБЕЛЕВЫ ГРУППЫ 277 Следует из предложения 3, в применении к каноническому раз- разложению аннулятора: 2. Подгруппы циклической группы. Предложение 5. Все подгруппы конечной циклической группы порядка т цикличны, и их образующими являются элемен- элементы вида ad, где а — образующий данной группы, d — делитель числа т. Доказательство. Пусть G— циклическая группа порядка т с образующим а и Я— ее подгруппа. Пусть d — наименьшее на- натуральное число, при котором da e Я. Тогда т делится на d, ибо если т = dq -\- г, 0 ^ г ^ d— 1, то га = та — qda — —qda e Я, и, в силу минимальности d, г = 0. Если ka e Я, то k делится на d, ибо если k = dq\ + r\, 0 ^ Г\ ^ d—1, то r\a = ka — q\da e Я и г\ = 0. Таким образом, da—образующий группы Я. Порядок Я равен m/d. При любом d, делящем т, элемент da порождает под- подгруппу Я порядка m/d. В частности, если т = ра, то все подгруппы группы G обра- образуют цепочку G :=> G, =э G2 => ... =э Ga-i =э 0, где Gt — подгруппа, порожденная р'а. 3. Разложение примарной абелевой группы впрямую сумму при- марных циклических групп. Предложение 6. Пусть Я — подгруппа абелевой группы G и из классов смежности G по Н можно извлечь по одному предста- представителю так, что они образуют группу F (очевидно, изоморфную факторгруппе G/H). Тогда G = Я Ф F. Доказательство. Я -\- F= G, ибо в Я -f- F присутствуют все элементы веех классов смежности. Я П F = 0, ибо при есте- естественном гомоморфизме G на G/H все элементы Я f\F отобража- отображаются в нулевой класс факторгруппы, и элемент группы F, принад- принадлежащий нулевому классу, может быть только 0. Следовательно, по теореме 2 § 3, G = Я ф F. Теорема 7. Примарная конечная группа G может быть раз- разложена в прямую сумму примарных циклических групп. Доказательство проведем посредством индукции по порядку группы. Базу для индукции составляют группы простого порядка, ибо они цикличны. Пусть ра' — минимальный аннулятор группы G. Тогда найдется элемент a\^G, порядок которого равен ра'. Пусть Нх — цикличе- циклическая подгруппа, порожденная элементом а.\. Если Н\ совпадает с G, то вопрос исчерпан, G сама циклична. Пусть Я] не совпадает с G. Рассмотрим факторгруппу G/H\. Она примарна, ее минималь- минимальный аннулятор равен р$ при E ^ а\, и ее порядок меньше порядка G. Согласно индуктивному предположению она является прямой суммой циклических групп Я2, .... Hk с образующими а2, ..., а*. Постараемся выбрать из классов смежности такие представители
¦278 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП (ГЛ. X а2, ..., «а, чтобы их порядки совпадали с порядками йг, ..., а*. Тогда они порождают подгруппу F, изоморфную G/H, т. е. пред- ставимую в виде прямой суммы циклических групп Я2, ..., Нк, изоморфных Я2, ..., Hk. В силу предложения 6 группа G равна я, е f = hv ф я2 е ... е я*. Таким образом, для завершения доказательства теоремы нам. нужно позаботиться о выборе представителей из классов а2, ...,ак. Пусть ра* — порядок а2. Ясно, что а2 ^ Р ^ «ь Выберем из клас- класса а2 какой-либо элемент а'. Тогда pa'a'2^.Hv так что paia2 = tal при некотором целом (.Далее, ра1~а2раш'2 = 0, так что pai~a2tal = 0. Это значит, что pai~ait делится на pai и t делится на раг, t = pa4l. Положим а2 = а'г — txa^az. Тогда ращ = ра*а'2 — р^^! = to, — to,= = 0. Выбранный представитель а2 класса а2 удовлетворяет по- поставленному требованию. Аналогично выбираются представители из классов аз, ..., ak. Теорема доказана. Из доказанной теоремы следует, что порядок примарной абе- левой группы равен степени того же простого числа, которое вхо- входит в аннулятор. Так как порядок прямой суммы групп равен про- произведению порядков слагаемых, мы видим, что порядок конечной абелевой группы есть произведение степеней простых чисел, вхо- входящих в аннулятор, так что примарные сомножители канониче- канонического разложения порядка группы совпадают с порядками примар- ных прямых слагаемых. 4. Инвариантность порядков циклических прямых слагаемых прпмарной абелевой группы. Разложение примарной абелевой группы G в прямую сумму циклических подгрупп не однозначно, но тем не менее число прямых слагаемых и их порядки не зависят от способа разложения. Чтобы доказать это, обозначим через t{ число прямых слагаемых максимального порядка ра, через t2—- число прямых слагаемых порядка ра~1, ..., через ta — число пря- прямых слагаемых порядка р. Тогда pG есть прямая сумма t\ цикли- циклических групп порядка ра~1, /2 циклических групп порядка ра~2, ... .... ta-i циклических групп порядка р. Поэтому G/pG есть прямая сумма групп порядка р в количестве t\ -\- ti -\- ... -\- ta и ее поря- порядок равен р'|+'2+"'+'а- Таким же образом pG/p2G есть прямая сумма t\ -f- tz "г • • • + 'a-i групп порядка р и ее порядок равен ptl+t!+ ¦••+<„_! и т_ д_ Таким образом, суммы <i + ^+ ••• + ta, ti-{-t2-{- ... 4-г'а-ь •••. ti + t2,ti имеют инвариантный смысл как показатели при р в порядках факторгрупп p'-lG/p'G. Следовав тельно, числа t\, t2, ..., ta тоже инвариантны. § 9. Конечно порожденные абелевы группы 1. Подгруппы конечно порожденных абелевых групп. Пусть G — аддитивно записанная абелева группа с конечным числом обра- образующих иь «2, ..-, Ип- Тогда все ее элементы представляются в
§ 91 КОНЕЧНО ПОРОЖДЕННЫЕ АБЕЛЕВЫ ГРУППЫ 279 виде niiUi-\-т2и2-\- ... + matin с целыми nil, пг2, ..., тп, причем такая запись может быть не- неоднозначной из-за наличия соотношений между образующими. Теорема 1. Подгруппа конечно порожденной абе левой группы конечно порождена, и ее образующие можно вы- выбрать так, чтобы их число было не больше числа образующих группы. Доказательство. Пусть G— абелева группа с образую- образующими «1, и2, • • •, «я и Я — ее подгруппа. Доказательство проведем методом математической индукции по числу образующих. Для групп с одним образующим ии т. е. для циклических групп, тео- теорема верна, ибо всякая подгруппа конечной или бесконечной ци- циклической группы сама циклична и порождается элементом кщ с наименьшим натуральным k. Допустим, что теорема верна для подгрупп группы, порожденной меньше чем п образующими, и в этом предположении докажем ее для подгрупп группы с п обра- образующими. Рассмотрим элемент vi = m.\U\ -f- m2u2 -\- ... -+- тпип ей с наименьшим натуральным коэффициентом nil. Покажем, что для любого v = hui -f l2u2 + • • • + inUn e Я коэффициент U делится на ти С этой целью выполним деление с остатком: h = miq-\-r, О s^ r ss: ni\ — 1, и положим v' = v — qvx — rux -f m?a2-f-... +т^ыпе е Н, откуда заключаем, в силу минимальности ть что г = О, так что у' = v — qvx = пг'2и2 + .. • + т'пип- Обозначим через С подгруппу G, порожденную ы2, • • •. и п. Тогда v' е Н' = Я f] G'. Группа Я' является подгруппой группы G', имеющей п—1 обра- образующий. В силу индуктивного предположения, Я' конечно порож- порождена и образующие можно выбрать так, что их число не больше п—1. Пусть v2, ..., vn — эти образующие (некоторые из них могут быть равны 0). Тогда v' = k2v2 + ... + knvn при целых ki и v = qvi -f- v' = qvi + k2v2 +...-+- knvn. Поэтому оь v2, ..., vn — образующие группы Я и их число равно п или меньше, если среди них есть нули. Теорема доказана. 2. Целочисленные унимодулярные матрицы. Предложение 2. Для того чтобы, матрица А с целыми эле- элементами имела обратную Л-1 тоже с целыми элементами, необхо- необходимо и достаточно, чтобы det A «== ±1. Доказательство. Пусть А и Л-1 имеют целые элементы. Из равенства ЛЛ-1 = Е следует, что det Л-det Л-1 = 1, но оба эти определителя — целые числа. Поэтому deM = ±l. Это условие и достаточно, ибо союзная с Л матрица, элементами которой являются алгебраические дополнения к элементам матрицы Л, имеет целые элементы, а матрица А~х получается из союзной делением на det Л = ±1, так что элементы Л~' — тоже целые числа.
280 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП (ГЛ. X Матрицы с целыми элементами и с определителем ±1, т. е. целочисленно обратимые, носят название целочисленных унимоду- лярных матриц. 3. Унимодулярная замена образующих конечно порожденной абелевой группы. Предложение 3. Пусть щ, и2 и„— образующие абе- абелевой группы G и М — (пщ)—целочисленная унимодулярная ма- матрица. Тогда элементы vu v2, ..., vn, где v{=mnux-\-m{2u2 + ... +mlnun, v2 = тпщ + т22щ + ... + т2пип, vn = тп{щ + тп2и2 + ... + тппи„, тоже составляют систему образующих группы G. Доказательство. Пусть М~[ = (/г,-/). Положим Wx —knvl + kl2v2 + ••• +klnvn, w2 = k2{vx + k22v2 + ... + k2nvn 2nvn, wn = knlvl + kn2v2+ ... +knnvn. Тогда элементы w\, w2, ..., wn выражаются через щ, и2, ..., un с матрицей коэффициентов М~1М = Е, так что w\ = u\, w2 — u2, ... ..., wn — tin. Таким образом, образующие ии и2, ¦¦-, ип выража- выражаются через v\, v2, ..., vn с целыми коэффициентами, следова- следовательно, и любой элемент группы G выражается через vu v2,...,vn с целыми коэффициентами, т. е. vu v2, ..., vn составляют систему образующих группы G. 4. Свободная конечно порожденная абелева группа. Абелева группа, имеющая образующие, не связанные соотношениями, назы- называется свободной абелевой группой, а ее образующие, не связан- связанные соотношениями, называются свободными образующими. Пусть «1, «2,"..., и г — свободные образующие свободной абелевой груп- группы F. Тогда любой элемент z^F представляется через обра- образующие z = ni\U\ + пг2и2 -+-...-+- iHrUr однозначно, ибо иначе между образующими было бы нетривиаль- нетривиальное соотношение. Поэтому G есть прямая суммы бесконечных ци- циклических групп: G = MiZ Ф u2Z Ф ... Ф urZ. Свободные образующие в свободной абелевой группе могут <5ыть выбраны разными способами, однако их число г не зависит от выбора образующих. Действительно, G/2G=;Z/2Z®Z/2Z® ... ... Ф 7/27, {г прямых слагаемых, изоморфных циклическим груп- группам второго порядка), и потому 2Г равно порядку группы G/2G,
§ 9] КОНЕЧНО ПОРОЖДЕННЫЕ АБЕЛЕВЫ ГРУППЫ 281 так что 2Г, а вместе с ним и г, получает инвариантное истолкова- истолкование, не зависящее от выбора системы свободных образующих. 5. Вспомогательные предложения. Предложение 4. Пусть (а}, а2, ••., аи) — строка, состав- составленная из целых чисел, и d — наибольший общий делитель чисел а\, а2, ..., ak. Существует такая целочисленная унимодулярная матрица, что (аи а2, .... ak)M = (d, 0, ..., 0). Доказательство. Применим индукцию по длине строки k. Базу для индукции дает случай k = 2. Пусть d — наибольший об- общий делитель чисел а\ и а2. Он допускает линейное представле- представление d = а\и + <*2V. Возьмем матрицу М = ( 2 J , где Ъх = п\ , а.; .. ,, „ , , , uet\ + х>а0 =-т-, Ь2 = -ц- Матрица М унимодулярна, ибо иЬ\ + vb2— ^ = = 1. Далее, (аь а2)М = (ахи + a2v, —а\Ь2-\- a2b\) = (d, 0). Допустим теперь, что предложение доказано для строк длины k—1. Тогда найдется целочисленная унимодулярная матрица М\ порядка k — 1 такая, что (а2, .... a*)Mi=(d2, 0, ..., 0), где d2 — наибольший общий делитель чисел а2, ¦¦¦, а*. Пусть те- теперь М2 — ( 0 м J . Тогда (аи а2, ..., ak)M2=--(au d2, 0, ..., 0). Далее, наибольший общий делитель чисел ах и d2 равен d. Найдем целочисленную унимодулярную матрицу М3 второго порядка та- такую, что (d, d2)Mz = (d, 0). Положим М4 = f 3 J . МА — тоже целочисленная унимодулярная и (аь d2, 0, ..., 0)М4 = = (d, 0, ..., 0). Таким образом, матрица М = М2МА, очевидно,, целочисленная унимодулярная, дает требуемое: (аь 02, ..., ak)M = (d, 0, .... 0). Предложение 5. Если числа а\, а2, ..., ак в совокупности взаимно простые, то существует целочисленная унимодулярная матрица с первой строкой (аи а2у ..., ак). Доказательство. В предположении взаимной простоты чи- чисел а\, а2, ..., ah будет d=\, так что существует целочисленная унимодулярная матрица М такая, что (аи а2, ..., ak)M — = A, 0, ..., 0). Тогда A, 0, ..., 0)М-'=(аь а2, ..., ак). Матри- Матрица М~х целочисленная унимодулярная, а последнее равенство по- показывает, что ее первая строка есть (а\, а2, ..., а*). 6. Конечно порожденные абелевы группы без кручения. Абе- лева группа называется группой без кручения, если она не имеет элементов конечного порядка.
282 ЭЛЕМЕНТЫ ТЕОРИИ ГРУПП {ГЛ. X Теорема 6. Конечно порожденная абелева группа G без кру- кручения свободна, т. е. имеет свободную систему образующих. Доказательство. Пусть и\, и2, .... ик — некоторая систе- система образующих группы G Если она свободна, то вопрос исчерпан. Если же не свободна, найдется соотношение a\U\-\- а2и2-\- ... + ukUk = 0. Без нарушения общности коэффициенты можно считать взаимно простыми в совокупности, ибо если они не взаимно просты и их наибольший общий делитель d > 1, то Я[ = da\, а2 — da'2, ..., ak = da'k и d(a'xu{-\-a2u2-\- ... + a'kuk) = 0, откуда a\u{-\- a2u2 + ... +a'kuk = 0, ибо G — группа без кручения. Числа же а[, а\, ..., a'k взаимно просты. Возьмем целочисленную унимодулярную матрицу М с первой строкой аи а2, ..., а* и сделаем замену образующих посредством подстановки с этой матрицей: vl=a1ui+a2u2+ ... +akuk, v2 = mnux + m22u2 + ... + m2kuk, - ... +mkkuk. Первый образующий v\ равен 0, и его можно исключить из си- системы образующих. Таким образом, число образующих уменьши- уменьшилось на 1. Если полученные образующие свободны — процесс окон- окончен. Если не свободны, то тем же приемом можно еще уменьшить на 1 число образующих. Через конечное число шагов мы должны прийти к системе свободных образующих. Теорема доказана. 7. Конечно порожденные абелевы группы в общем случае. Мно- Множество элементов конечного порядка конечно порожденной груп- группы G образует, очевидно, подгруппу. Эта подгруппа, в свою оче- очередь, конечно порождена и, так как ее образующие имеют конеч- конечные порядки, она конечна. Подгруппа элементов конечного поряд- порядка группы G называется ее подгруппой кручения. Теорема 7. Факторгруппа конечно порожденной абелевой группы G по подгруппе кручения есть группа без кручения и, .сле- .следовательно, свободная. Доказательство. Пусть а — некоторый элемент фактор- факторгруппы G/H, где Н — подгруппа кручения. Допустим, что та = 0 при целом тФО. Тогда, если а^а, то та е Н. Все элементы подгруппы И имеют конечные порядки, следовательно, при неко- некотором целям т\ф§ будет т^па = 0. Но это значит, что а е Я
§ 9] КОНЕЧНО ПОРОЖДЕННЫЕ АБЕЛЕВЫ ГРУППЫ 265 и о = 0. Таким образом, G/H не имеет элементов конечного по- порядка кроме нуля и является группой без кручения. Ранг группы G/H как свободной абелевой группы называется также рангом группы G. Теорема 8. Конечно порожденная абелева группа G разла- разлагается в прямую сумму группы кручения Н и свободной абелевой группы с числом свободных образующих, равным рангу G/H. Доказательство. Пусть щ, а2, ..., а, — свободные обра- образующие группы G/H. Возьмем произвольно элементы aieai, а2^а2, ..., аг^аг. Элементы аи а2, .... аг порождают свобод- свободную подгруппу F группы G, ибо каждое соотношение т\п\ + + т2а2 + ... + тгаг = 0 влечет за собой соотношения т\й\ + + т%а2 + • • • + ttirdr = 0. Элементы группы F содержатся по од- одному во всех классах смежности, составляющих G/H. Согласно предложению б из § 8, группа G равна прямой сумме Н и F. Разумеется, разложение G = Н -\- F не однозначно, хотя под- подгруппа Я в G однозначно определена. Неоднозначность обуслов- обусловлена тем, что элементы ci, a2, ..., а., выбираются внутри клас- классов смежности «I, а2, ..., аг произвольным образом. Из всего сказанного следует, что конечно порожденная абелева группа G разлагается в прямую сумму циклических групп, при- марных конечных и бесконечных. Число бесконечных прямых сла- слагаемых равно, рангу группы G, порядки примарных конечных ци- циклических прямых слагаемых определены группой G (точнее, ее подгруппой кручения) однозначно. Эти порядки носят название коэффициентов кручения группы G. Задание ранга и коэффициен- коэффициентов кручения определяет группу G с точностью до изоморфизма. Для любых наперед заданных значений ранга и коэффициентов кручения существует соответствующая абелева конечно порожден- порожденная группа.
ГЛАВА XI СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ § 1. Выражение симметрических пэлииов через основные 1. Лексикографическое расположение одночленов в полиноме. Пусть F(x\, х2, ..., Хп)—полином с коэффициентами из некото- некоторой области целостности. Расположим его по убывающим степе- степеням буквы х\. Одночлены, содержащие х\ в одинаковой степени, расположим по убывающим степеням буквы х%, одночлены, содер- содержащие х\ и х2"в одинаковых степенях, расположим по убывающим степеням буквы х3 и т. д. Одночлены расположатся в так назы- называемом лексикографическом порядке, напоминающем расположе- расположение слов в словарях. Будем говорить, что предшествующий в лек- лексикографическом порядке одночлен выше последующих. Из опре- определения ясно, что одночлен Ах*'х%2 ¦ • • *"" выше одночлена В^х\г •.. *ЦВ з том и только в том случае, когда первая ртлич- ная от нуля среди разностей oci — |3Ь а2 —Рг, ..., а« — §п поло- положительна. Одночлен, который находится на первом месте при лексикогра- лексикографическом упорядочении, носит название высшего члена полинома. Ясно, что если F(xvx% хп) = ай(х2,хъ,...,хп)xf + а{(х2,х3,... ... , хп)х*~{-\- ... , то высшим членом полинома F является произведение х* на высший член полинома ао(х2, х3, ..., хп). Предложение 1. Высший член произведения двух полино- полиномов равен произведению высших членов сомножителей. Для п = 1 это верно. Остается применить тривиальным обра- образом математическую индукцию, учитывая замечание, предшествую- предшествующее формулировке предложения. Предложение 1 естественно распространяется на произведение любого числа полиномов. 2. Симметрические полиномы. Полином F(x\, х2, .. ¦, хп) назы- называется симметрическим,^сли он не изменяется при всех переста- перестановках входящих в него букв. Примерами симметрических поли- полиномов могут служить так называемые степенные суммы — сум- суммы одинаковых степеней букв. Особо важное место занимают так называемые основные или элементарные симметрические
§ 1] ВЫРАЖЕНИЕ ЧЕРЕЗ ОСНОВНЫЕ 285 полиномы: fl==Xl + x2+ ... + хп> f \ .. ~\-Хп_\Хп, • • • + Хп~2Хп-\Хп, fn-i = Х\Х% . . . Хп-1 + . . . + Х2Х3 ... Хп, fn = Х\Х2 ¦ • ¦ Хп- Полином называется моногенным, если все составляющие его одночлены получаются один из другого посредством перестановки букв. Очевидно, что каждый моногенный полином является сим- симметрическим. Из определения симметрического полинома ясно, что если он содержит какой-либо одночлен, то он содержит все одно- одночлены, получающиеся из него перестановками букв, и их сумма составляет моногенный полином. Поэтому любой симметрический полином есть сумма моногенных. Объединяя вместе моногенные полиномы одинаковой степени, получим, что любой симметриче- симметрический полином есть сумма однородных симметрических полиномов. 3. Основная теорема теории симметрических полиномов. Лемма. Показатели в высшем члене симметрического поли- полинома образуют невозрастающую последовательность. Доказательство. Пусть F{x\, X2, ...,хп)—симметриче- ...,хп)—симметрический полином и Лл:™1^™2 ... хапп — его высший член. Нужно дока- доказать, что а\ ГЗг «2 ^ • ^ «л- Допустим противное, что при неко- некотором i имеет место а< < a,+i- Переставив в одночлене Ах ... ... ж"'*"!!1 ... хапп местами Xi и xi+\, мы получим одночлен Ах*1.. .л^'+'л;"^. . .хапп, который тоже содержится в F, в силу сим- симметричности. Но построенный одночлен выше исходного, так как показатели при Х\, ..., Xj_i у них одинаковые, а показатель аг+[ при xi во втором одночлене больше показателя at при Xt в исход- исходном. Мы пришли к противоречию с тем, что исходный одночлен был высшим. Это противоречие и дает доказательство леммы. Теорема 2 (основная теорема теории). Любой симметриче- симметрический полином может быть представлен в виде полинома от основ- основных симметрических полиномов. Коэффициенты в таком представ- представлении являются целочисленными линейными комбинациями коэф- коэффициентов исходного полинома. Доказательство. Достаточно ограничиться рассмотрением однородных симметрических полиномов. Пусть F(xu хг, ..., хп) — однородный симметрический полином и Длг^'л; ... лг™« — его высший член. Допустим сначала, что коэффициенты F — целые числа. Подберем одночлен от основных симметрических полино- полиномов fu /2, ..., fn так, чтобы высший член этого одночлена как по- полинома от х\, Хг, ..., хп,совпал с Ах\хх\г ... хапп. Ясно, что вые'
286 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ {ГЛ XI шие члены полиномов fu /2,. •., fn равны, соответственно хи Х\хг,... . . . , Х\Х% . . . Хп. Подходящим одночленом является Л/2/ • ¦ • /"^Т1™"^™"- В силу леммы все показатели неотрицательны, так что этот одно- одночлен является полиномом от хи Xi, .... хп- Его высший член равен Число А, согласно предположению, целое, коэффициенты всех основных симметрических полиномов целые, следовательно, все ко- коэффициенты полинома Л/"/"™3 ... /""Т1"™^" целые. Полином F (y y г \ — F(r х х ^ Afai~a2fa2-a2 fan-i~an faa ri{X\> X2> ••'>Xn) —Г VA1' X2' •'•*Xn) ЛП '2 •••lit-l hi есть снова симметрический полином с целыми коэффициентами, но его высший член Вхух./ ... хпп будет ниже высшего члена поли- полинома F, ибо при вычитании высшие члены уменьшаемого и вычи- вычитаемого взаимно уничтожились. Процесс повторяется. Из поли- полинома Fi(xi, x% ..., хп) вычитается полином Bf^~^f^~^3 ... ft*. В результате получается симметрический полином Ft(x\, х2,..., хп), снова с целыми коэффициентами и со старшим членом еще ниже Процесс не может продолжаться без конца, ибо одночленов фикси- фиксированной степени (и тем более таких, которые могут быть высшими членами симметрических полиномов), каждый из которых ниже предыдущего, может быть лишь конечное число. Процесс может оборваться только на том, что при очередном вычитании полу- получится 0. Итак, Fix х х\ — ylf^" fan-\-anfan 4- Г \Xlt Х2, . . ., Хп) — Л/, f2 ¦••/„_! /„ -Г I BfPl ""Р2/Р2-Рз ftn-1 -PnfPrt _1_ T^"/l /2 *•" /rt-1 In 7Г ••• Все коэффициенты А, В, ... будут целыми числами. Теперь снимем предположение о том, что коэффициенты исход- исходного полинома были целыми числами. Представим полином в виде суммы моногенных и в каждом моногенном слагаемом вынесем за скобки коэффициент, общий для всех его членов. В скобках оста- останется полином с коэффицеинтами 1, и его представление через основные полиномы будет иметь целые коэффициенты, а, следо- следовательно, коэффициенты в представлении данного моногенного слагаемого будут целыми кратными коэффициента его одночле- одночленов. Из различных моногенных слагаемых могут возникнуть по- подобные члены в их представлениях через основные, и, после при- приведения, получится полином от /ь /ъ • • ¦, /л с коэффициентами,
§ 1] ВЫРАЖЕНИЕ ЧЕРЕЗ ОСНОВНЫЕ 287 являющимися целочисленными линейными комбинациями коэф- коэффициентов исходного полинома. Теорема доказана полностью. Эти же идеи позволяют доказать единственность представле- представления симметрического полинома в виде полинома от основных сим- симметрических полиномов. Предложение 3. Отличный от нуля полином от основных симметрических полиномов отличен от нуля и как полином от Хи Х2, . .., Хп. Доказательство. Пусть Ф(/,, f2, ..., fn) = Aff>fe ...#• + + Bf\lfl22 ... fnn + ..., причем среди слагаемых нет отличающихся только коэффициентом. Высший член одночлена Afflf22 ... fnn как полинома от х\, х%, . ¦., хп равен Аналогично определяются высшие члены других одночленов. Различные одночлены имеют различные высшие члены, и самый высший из них получается лишь из одного одночлена и не имеет подобных среди членов других слагаемых. Поэтому Ф(/ь /г> • • •, /«), не равный нулю как полином от f\, f2, ..., In, не может стать рав- равным нулю как полином от Х\, х%, ..., хп. Отсюда непосредственно следует единственность представления симметрического полинома в виде полинома от основных, ибо если бы были два различных представления, разность представлений была бы отличным от нуля полиномом от основных симметриче- симметрических полиномов, равным нулю как полином от Х\, лг2> ..., хп, что невозможно. 4. Примеры. Рассмотрим несколько примеров. 1. F(xx, x2, ..., хп) = х\ + х\+ ... +х2п. Первым членом представления через основные симметрические является f]. Ясно, что F — f\ = ~ 2fv так что F = f2l—2fr 2- F{xvx, xn) = xl + 4+ •••.+ 4- Первым членом представления является f3r Во избежание гро- громоздких вычислений применим следующий прием. Прежде всего выясним, какие показатели могут быть у высших членов симме- симметрического однородного полинома третьей степени. Задача эта сводится к разбиению числа 3 на невозрастающие слагаемые. Та- Таких разбиений три: 3 = 3; 3 = 2+1; 3 = 1 + 1 + 1- Поэтому представление однородного симметрического полинома третьей степени имеет вид Af\-\- BfJ2 + Cf3. Нужно найти коэффициенты. Очевидно, что А= 1, ибо таков коэффициент при х\. Таким оэ> разом,
288 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ 1ГЛ XI Это равенство должно быть тождественным, т. е. сохраняться при всех значениях букв Х\, хг, ..., хп. Положим Х\ = Хг = 1, хз = ... ... =Хп = 0. Левая часть равна 2, правая равна 23 + 2В, откуда В — —3. Положим теперь х{ = х2 = х3= 1, х$= ... =х„ = 0. В левой части будет 3, в правой З3 — 3-3-3+ С, откуда С = 3. Итак: 3. F = (x1-x2J(x1 Этот пример нам понадобится в § 3. Ясно, что F — симметрический полином и его высший .член ра- равен х\х\. Нам следует установить показатели высших членов, ко- которые встретятся при представлении F в виде полинома от основ- основных. Эти показатели должны составлять разбиения числа 6 на три или меньше невозрастающих слагаемых, причем эти разбие- разбиения должны быть лексикографически не выше разбиения 6=4+2. Такими разбиениями являются 4 + 2, 4+1 + 1, 3 + 3, 3 + 2+1, 2 + 2 + 2. Поэтому представление F через основные имеет вид F = ПЦ + Af% + Bf\ + CfJJ3 + Df*. Зададим такими значениями для хи *2, *з, чтобы в правой части были нули, но аннулировались бы не все слагаемые. Напри- Например, рассмотрим следующую таблицу значений: x, 1 1 2 1 -1 1 2 1 Хъ 0 2 — 1 1 и 0 0 3 3 'г — 1 —3 0 3 h 0 —2 —4 1 F 4 0 0 0 Подставляя значения из этой таблицы, получим: откуда В = Итак, F О == — 27В + 4D, 0==- 108Л+ 16D, 0 = 81 + 27 А + 27В + 9С + D, 4, ?> = — 27, А = — 4, С =18. f?/| - Af\U ~ Щ + 18Ш, ~ 27П- § 2. Значения симметрических полиномов от корней полинома 1. Выражения значений симметрических полиномов от корней полинома через его коэффициенты. Пусть полином f(x) == аохп + x"'1 + ... + а„^ К[х] имеет корни с\, с2, ..., с„ в некото-
S 21 ЗНАЧЕНИЯ ОТ КОРНЕЙ ПОЛИНОМА 289 ром расширении поля К. Тогда f(x) = ao(x — Ci){x — c2) ... (х — сп). Раскрыв скобки и сравнив коэффициенты при степенях буквы х, получим: а, = — ао(с, + с2+ ... +сп), а2 — а0 {с{с2 + с^з + ••• +cn-icn)> а„_1=(— lJ^'flo^iCa ... с„_1+ ... +с2с3 ... ся). Мы видим, что значения основных симметрических полиномов от с., с2, ..., сп просто выражаются через коэффициенты: ft (си с2, ..., с„) = —-|-, /2(с,, сг, .... сп) = ~, -1 ап~\ С / ft \ / 1 \" а0 Пусть теперь F (а:р х2, ..., д:„) = Лх^2 ... дс"" + ... — сим- симметрический полином с высшим членом Ах*1х22 •.. хапп. Тогда F(x X X \ = Afai~a*fui~a3 fan Л. Rf^l~hfh~^3 f's Г г \xi> Л2> ' * "> xti) — л'1 '2 • • ' /в Т^ D'l '2 • • • /о ^ • • • Следовательно, В первое слагаемое множитель —1 войдет с показателем ai — + + а3 —а4+ ••• =а1+«2 + аз+ ••• +an(mod2). Но оы -f- + а2+ ... + а„ = m — степень одночлена Лл;™1^2 ... хапп. Если полином F однородный степени т, то во все слагаемые войдет множитель (—1)т. В знаменатель первого слагаемого правой ча- части войдет a"i"a2+a2-a3+•••+««=:а«1, соответственно в знаменатель второго слагаемого войдет а§\ причем Pi <; а,\ и т. д. Поэтому
290 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ ГГЛ XI для однородного симметрического полинома степени т будет (-irajff(clt cg с„) = т. е. a^F(clt са, ..., сп) является полиномом от коэффициентов полинома f(x). Пример. Доказать, что корни полинома не могут быть все вещественными при любых вещественных коэф- коэффициентах аз, ..., ап. Действительно, сумма квадратов корней равна a* —2a2 = —2. Если бы все корни были вещественные, сумма их квадратов была бы положительным числом. 2. Степенные суммы. Пусть f(x) = (х— Х\) (х — х2)...{х — — Хп) = хп — fix"-1 + f2xn~2-f ••• +(—l)"fn- Вспомним, что f'(x) = (x — х2)(х — дг3) — (х- хп) + {х — Xt)(x — х3) ... f (х) Вычислим , воспользовавшись схемой Хорнера. В ре- х — xt зультате последовательно получим коэффициенты частного: Таким образом, коэффициент при хп~1-к равен Выполнив сложение по i, получим в качестве коэффициента при хп-\-к выражение где Si, S2, ••¦ обоз«ачают суммы соответствующих степеней х\, х2, ..-, хп. Приравнивая это выражение к коэффициенту при л"-1-* в f(х), получим: откуда = 0, =1, ..., n— 1,
§ 2] ЗНАЧЕНИЯ ОТ КОРНЕЙ ПОЛИНОМА 291 Эти формулы Ньютона позволяют последовательно выражать сте- степенные суммы sk через основные симметрические полиномы для k от 1 до л — 1. Для k ^ n аналогичные формулы выводятся еще проще. Умно- Умножив равенство х1} — f,A?~'+ ... + (— l)nfn = Q на х\~а, получим Просуммировав по i, получим: Sk — fiSk-i+ ... +{—l)nfnSk-n = 3. Дискриминант полинома. Дискриминант полинома, говоря неформально, есть полином от его коэффициентов, обращение в нуль которого является необходимым и достаточным условием су- существования кратного корня. В качестве полинома от корней, обращающегося в нуль при наличии кратного корня, естественно взять произведение всевозможных разностей корней или, что то же самое, определитель Вандермонда от корней. Но этот полином не симметрический, он меняет знак при нечетных подстановках кор- корней. Его квадрат (хх— x2J(xi— х3J ... {хп-\ — хпJ будет уже симметрическим полиномом. Буква Х\ входит в высший член этого полинома с показателем 2п— 2. Поэтому а2"^— ж2J ... ...(xn-i — хпJ является полиномом от коэффициентов полинома f(x)= aoxn-\-aixn~l-\- ... + ап, если вместо букв хи х2, ..., хп подставить корни полинома. Этот полином и называется дискри- дискриминантом D(f) полинома f(x). Подсчитаем дискриминант для п = 2 и п = 3. При и = 2 бу- 4 дет o(I^ g(Jf2) f4 гак что мы получили хорошо известный дискриминант квадрат- квадратного трехчлена. При л = 3 имеем D (/) = a*(*i - x2f(xl - x3f(x2 - x3f. Этот симметрический полином мы выразили через основные в качестве последнего примера в п. 4 § 1. Было получено: (*, - О2(*. - *зJ(*2 - *3J = ПП ~ *Шз ~ Щ + 18Щ3 - 27ff. Подставив вместо хи х2, х% корни полинома f(x)= aoX3-\-atx2-{- + а2х + аз, получим # ^4 - х,У (х, - х3? (х2 - х3J=# - а ао а0 а0 откуда D (f) = а\а\ - Аа\аг - 4afr0 + i8aoa,a2a3 Для полинома f(x) = х3 + рх-\- q будет
292 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ (ГЛ. XI так что дискриминант в этом случае лишь множителем —108 от- отличается от выражения, находящегося под знаком квадратного корня в формуле Кардано. Дискриминанты полиномов более высокой степени имеют, при явном выражении через коэффициенты, очень сложный вид. Од- Однако существуют представления дискриминанта в виде опреде- определителя. Одно, самое простое в теоретическом плане, представле- представление получается так: i „2я-2 1 Х2 гп-1 Х2 х х2 ¦*o 1 Xl х2 1 Хп X, „п-1 1 *l 2 X2 a-1 1 Воспользовавшись тем, что произведение определителей равно определителю произведения их матриц, получим: П S\ S2 ... Sn-\ S, S2 S3 ... Sn S'2 S3 54 » . « Sfi-^l Sn-l Sit Sfj-l-i . . . S2n— 2 где si — сумма степеней корней. Существуют более удобные для вычислений представления ди- дискриминанта в виде определителя, но мы не будем на этом оста- останавливаться. 4. Алгебраическое решение уравнений третьей и четвертой сте- степени в свете теории симметрических полиномов. Пусть F(xy, X2, ... ..м хп) — некоторый полином от х\, х2, ..., хп. Под действием некоторых подстановок букв х\, х2, ..., хп он может не изме- изменяться. Ясно, что множество подстановок, не меняющих данный полином, образует группу. Эта группа Н является подгруппой всей симметрической группы Sn, и ее индекс k равен числу различных полиномов F — F\, Ft, ¦ ¦ ¦, Fk, которые можно получить из поли- полинома F посредством подстановок Х\, х%, ..., хп- Под действием этих подстановок полиномы F\, F%, ..., Fk перемещаются так же, как левые классы смежности группы Sn по подгруппе Н при умно- умножении на элементы из Sn справа. Поэтому любой симметрический полином от F\, F2, ..., Fk есть вместе с тем симметрический по- полином от Х\, Х2, ..., хп, так что если вместо Х\, х2, ..., хп подста- подставить корни данного полинома f(x) = xn -f a\xn~l + ... +ап, то соответствующие значения полиномов Fu F2, ..., Fk будут кор-
<§ 2] ЗНАЧЕНИЯ ОТ КОРНЕЙ ПОЛИНОМА 293 яями полинома степени k с коэффициентами, выражающимися ;в виде полиномов от коэффициентов аь а2, ..., ап полинома /. Рассмотрим в качестве примера применения этих идей вопрос об алгебраическом решении алгебраических уравнений f(x) = 0 при я = 3и/1 = 4в поле комплексных чисел. Пусть п = 3. Рассмотрим полином 0i = Х\ -f- х2р + х3р2, где ¦р = е2л'/3 — первообразный корень степени 3 из единицы. При кру- круговых подстановках х\, х2, х3 полином 0i приобретает множители ,р и р2 и, следовательно, 9J при этом не меняется. Круговые под- подстановки образуют подгруппу индекса 2 в симметрической группе S3, и представителями классов смежности можно считать 1 и транспозицию (х2, х3). Она переводит 0i в 02 = х\ + х2р2 + х3р и, соответственно, 6| в 0|. Поэтому 0, + &1 и 9;9| являются симметри- симметрическими полиномами от Х\, х% х3. Именно, 9? + 03 = 2х\ + 2х\ + 2х\ — 3 (х\х2 + ...) + 12х{х2х3 = = 2Р{ —9f{f2-\-27f3. Симметрическим оказывается не только 8^9|, «о и 6Д = xf + 4 + 4 — хххг - хххг — х^сг = f2 — 3f3. Таким образом, 9^ и 9| определяются как корни квадратного уравнения с известными коэффициентами. Затем 0] и 02 находятся посредством извлечения кубического корня, причем значения кор- корней нужно согласовать так, чтобы произведение 0i02 равнялось Л ~ 3/3. Далее, Х\, х2, Хг находятся посредством решения линей- мой системы Xl + Х2 + Х3 = ft, которая дает хх =у (f, -f 9! + 92), х2 = у (/=, + 9,р2 + 02р), Легко видеть, что это решение ничем не отличается от решения до формуле Кардано. Пусть теперь п = 4. В качестве Fi возьмем jciX2 -f ^3X4. Поли- «ом Fi не меняется при восьми подстановках, составляющих под- труппу индекса 3 в симметрической группе Si. Другие подстановки переводят Ft в F2 = Х\Хъ + х2х4 и F3 — Х\Хц -\- х2х3. Симметриче- Симметрические полиномы от Fu F2, F3 будут симметрическими и от х\, х2, .х3, хц. Именно, основные симметрические полиномы будут: Fi + F2 + F3 = fa, FiF2 + FXF3 + F2F3 = f,/a - 4f4, Считая, что xi, x2, x3, А —корни полинома xi + аххъ + а2л;2 -4-a3x+a4, мы можем составить кубическое уравнение для F
294 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ (ГЛ. Xt- F2, F3. Найдя один из корней F\ = ххх2 + *з*4, мы в состоянии найти Х\, х2, Хз, лч, решая цепочку квадратных уравнений. Полу- Получается способ, совпадающий со способом Феррари. Известный под названием метода Эйлера способ получим, если- возьмем Fx = [хх -{- х2 — хъ — х4J == f\ — 4f2 + 4 (ххх2 + лг3х4). Поли- Полином F\ не меняется при той же группе из восьми подстановок, что- и Х\х2 + ХгХц. Подстановки из классов смежности группы S$ по> этой подгруппе переводят F: в F2 = {xi — х2-\-х3— х4J в F3 = = (*i— х2 — Х3 + Х4J. Выражения основных симметрических по- полиномов от Fi, F2, F3 дают: FXF2 + FXF3 + f/3 - 3ft - 16/ff2 + 16/1 причем симметрическим оказывается и {х{ + х% - х3 - х,) (х, - х2 + х3 ~ хА) (^1-x2- Таким образом, значения полиномов F\, F2, F3 от корней поли- полинома х4+ а\к3 + а2х2 ~\- а3х-\- а* оказываются корнями кубиче- кубического уравнения с известными коэффициентами. Найдя Fh F2, Fs,. нужно извлечь из них квадратные корни, распорядившись зна- знаками корней так, чтобы их произведение равнялось fj — 4/,/2 + 8/з_ Корни хи х2, Хъ, Х4 найдем из системы линейных уравнений. По- Получим *i = -jifi + V^ + л/К + л/Ю, *2 = j (/l + V^ - Л/К - Л/К), + л/К). Тонкий анализ близких идей привел Руффини и Абеля к до- доказательству неразрешимости в радикалах общих уравнений пятой? и выше степени. Мы не будем касаться этого трудного вопроса. § 3. Результант 1. Определение результанта при помощи симметрических по- полиномов. Для двух полиномов l(x) s= аохп -{- п\Хп~х + .. . + ап и g(x) = boxm -(- b\Xm~l + ... + bm, a0 ф 0, bo Ф 0, можно построить полином от их коэффициентов так, что обращение его в нуль про- происходит в том и только в том случае, когда / и g не взаимно про- просты, т. е. если они имеют общий корень в надлежащем расширенна основного поля.
•» 31 РЕЗУЛЬТАНТ 295 Пусть Х\, х2, ..., хп — корни полинома f. Симметрический по- полином g(xi)g(x2) ... g{xn) от Х\, Х2, .... хп обращается в нуль в том и только в том случае, когда один из корней полинома f является корнем полинома g. В высший член этого полинома Х\ входит с показателем т, поэтому a™g{x^)g(x^) ... g(xn) является чюлиномом от коэффициентов f и, очевидно, полиномом от коэф- коэффициентов g. Этот полином называется результантом полиномов / и g и обозначается R(f, g). Определение результанта кажется не симметричным по отно- отношению к полиномам / и g. В действительности это определение «почти симметрично», именно, R(g, f) = (—l)mnR(f, g). Для дока- доказательства этой формулы введем в рассмотрение корни у\, у2у ... ..., ут полинома g, так что g(x)= bo(x — y\) (х — у2) ... (х — ут)-. Тогдаgixjgixz).. ^(хп)=ЬЩ(х{-У!) и R(f,g)=aSlbnuJ[(xl-yi) = Далее, а, Ц(у, -xt) = f {у,), так что R(f,g) = (- \)mnbnQ Ц f (y,)= Отметим еще некоторые свойства результанта. Прежде всего ¦ясно, что результант является однородным полиномом степени п •от коэффициентов полинома g и, в силу соотношения R(g,f) = = (—\)mnR(f, g), однородным полиномом степени т от коэффи- диентов полинома /. Далее, назовем весом одночлена а"°а™' ... й"п6д°6,' ... Ь^1 число oci -f- 2а2 + ... + пап -f Pi + 2рг + • • • + т$п- Ясно, что веса коэффициентов а\ ап равны степеням соответствующих -основных симметрических полиномов от х\, Хц, ..., хп и веса tou --•. Ьт равны степеням соответствующих основных симметри- симметрических полиномов от г/ь г/г, • • •, г/m, веса же ао и Ьо считаются равными нулю. Поэтому вес одночлена ао°а°' • • • a1ln^a°rfl • • • ^m равен полной степени этого одночлена, рассматриваемого как по- полином от х\, Хъ,...,хп, У\, У2, ¦¦¦,ут. Но результантa™blП{xt — г/;) «сть однородный полином степени тп относительно х\, х% хп, У и У2, ¦¦¦, Ут- Поэтому веса всех одночленов, составляющих ре- результант, одинаковы и равны тп. В качестве примера приведем результант полиномов f =» а0л:2 + ~\-aix-\-a2 и g = box2 + b\X-\- b2. Вычисления здесь не представ- представляют труда, и мы выпишем результат этих вычислений: Я (/, g) = а\Ь\ — auaxbxb% + а^ф\ — 2a0a2bQb2 + а\ЬаЬ2 — ala2b0bl -f ар*. 2. Другой способ построения результанта. Для взаимной прос тоты полиномов / п + 1 + ... + а„ и g = boxm-l
296 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ [ГЛ. X» необходимо и достаточно, чтобы не существовало отличных от нуля полиномов р и q, степени которых меньше тип соответ- соответственно, и таких, что pf + qg — 0- Действительно, если fag взаимно просты, то из равенства pf + qg = 0 следует, что р де- делится на g и q делится на f, а это при сделанных ограничениях на степени возможно только при р = 0 и q = 0. Если же f и g не взаимно просты и йф const — их общий делитель, то можно взять Попытаемся найти полиномы р и q способом неопределенных коэффициентов, т. е. найдем уравнения, которым должны удовле- удовлетворять коэффициенты полиномов р и q. Пусть Р = С0Хт-1 + СхХт-2 + • . . + Ст-1, Будем считать, для определенности, что т ^ п. Приравнивая к нулю коэффициенты при степенях х в полиноме pf -j- qg, полу- получим систему т + п линейных однородных уравнений относительно Со, ..., Cm-i, do, ..., dn-i: аосо -f b0d0 = 0, ajCo + айсх -f bxdo + Mi = 0, Матрица М из коэффициентов этой системы, как легко видеть, равна аа oi о0 Ь\ Ьо в) по Ьг Ь\ Ьо Лщ-1 вт_2 вт-з ... в0 вт em_i вт_2 ... Oi Ьт-1 Ьт—2 Ьт-з •¦• Ьо Ьт Ьт-1 Ьт-2 • • • *1 Ьт Ьт-1 ••• Ь2 вп в«—1 Яя—2 ап в«-1 вп-т+1 ап-т+2 ап Ьт Ьт-i 6т все равны Элементы выше по и ?>о и элементы ниже й„ и ниже нулю. Для существования отличных от нуля полиномов р и q, т. е. для того чтобы полиномы fug были не взаимно просты, необхо- необходимо и достаточно, чтобы detA? —0. Таким образом, det-M играет такую же роль, как результант R(f, g). Теорема 1. detM = R(f, g).
РЕЗУЛЬТАНТ 297 Сперва предположим, что'хг попарно различны. Умножим ма- матрицу м слева на матрицу: т+п-1 х\ т+п-1 Н т+п-1 х xl ... xl 1 vn~l , Л2 • • • Xn i ... дс„ Определитель этой матрицы равен (-1)" „ге-1 ..«-1 При выполнении умножения L на М примем во внимание, что *(*,) Получим: a0 а,, T-l '«ы 6. Ът-\ В нижних клетках выше а0 и выше Ьо находятся нули. Поэтому det LM = ( (*«) „«-1 ж, .п-2 ,.«-2 Поделив обе части равенства на det L Ф 0, получим detМ = a«g(ж,)g(x2) ...g(xn) = /?(/, я). Равенство det M = ,/? (f, g) установлено в предположении, что хх, Хг, ..., хп попарно различны, а это равносильно тому, что дискриминант D(f) полинома f отличен от нуля. Итак, detAf и R(f, g) оба являются полиномами от коэффи- коэффициентов / и g и они принимают одинаковые значения при условии, что полином D(f) отличен от нуля. По предложению о несущест- несущественности алгебраических неравенств (стр. 71) detM и R(f,g)) равны тождественно.
298 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ ГГЛ. Xt 3. Линейное представление результанта. Пусть полиномы / и g взаимно просты, так что их результант отличен от нуля. Тогда существуют такие полиномы р и q, что pf-\-qg = 1. Если потре- потребовать, чтобы степени q и р были меньше, соответственно, степеней f и g, то такие q и р определены однозначно. Положив, как в пре- предыдущем пункте, р = сохт-1 + ... + Cm-i и q = doxn-1 -f ... ... + dn-\, мы получим для определения коэффициентов систему линейных уравнений с матрицей М и со столбцом в правой части,, состоящим из нулей, кроме последней компоненты, равной 1. По» формулам Крамера коэффициенты Со, ..., ст-\ являются част- частными от деления первых т алгебраических дополнений последней строки определителя матрицы М на det Af = /? (f, g), а коэффи- коэффициенты d0, ..., dn-\ суть частные от деления на detAf алгебраи- алгебраических дополнений с номерами от т + 1 до п элементов послед- последней строки. Положив (det M)p = P, (det M)q — Q, получим, что коэффициенты Р и Q будут полиномами от коэффициентов f и g, и имеет место равенство Pf + Qg = R(f, §)¦ Ясно, что полином Р равен определителю матрицы, получаю- получающейся из матрицы М заменой первых т элементов последней: строки на хт~\ хт~2, ..., 1, а остальных —на нули. Соответствен- Соответственно, полином Q равен определителю матрицы, получающейся из М заменой первых т элементов последней строки на нули, а после- последующих— на хп~1, хп~2, ..., 1. 4. Применение результанта к исключению неизвестного из си- системы двух алгебраических уравнений с двумя неизвестными. Пусть дана система уравнений f(x,y) = o, где f и g—полиномы степеней пит соответственно. Будем пред- предполагать, что коэффициенты полиномов принадлежат алгебраи- алгебраически замкнутому полю и решения разыскиваются в этом поле. (Заметим, что алгебраически замкнутое поле даже в случае нену- ненулевой характеристики содержит бесконечно много элементов^ Действительно, к любой конечной системе элементов ось «2, ¦ ¦ ¦, ««¦ можно присоединить новый элемент, например, корень полинома [(х — а{) (х — а2) ... (х — ап)+1.) Пусть Сохп + Cixn~ly -f- ... -f- cny" — однородная часть степени п полинома f(x, у). Возможно, что Со = 0. Сделаем «перекос оси абсцисс» посредством замены неизвестной у на у' = у — ах (но- (новая ось абсцисс у' = 0 имеет в исходных координатах х, у урав- уравнение у — a.v = 0). Коэффициент при х" станет равным со-Ь + С\а + ... + спап, и а можно выбрать так, что ao=c0+Cia+ ... ... +с„апФ0 (это требование налагает конечное число запретов.
¦* 31 РЕЗУЛЬТАНТ 299 *а выбор а). Одновременно можно добиться того, что коэффициент яри хт в g(x, у) станет отличным от нуля. В дальнейшем мы еще наложим некоторые запреты на выбор «коэффициента перекоса» а. Ясно, что решение системы fix, у) = О, и решение системы после замены у на у' + ах тривиально сво- сводятся одно к другому, так что можно с самого начала считать, что коэффициенты uq и Ьо при хп в полиноме f(x, у) и при хт в поли- полиноме g{x, у) отличны от нуля. Итак, пусть f(x, y) = aoxn+ ai(y)xn-] + ... + а „(у) и g(x, y) = = Ьохт + Ь1(у)хт-1+ ... +Ьт{у), яо?=0, ЬофО. Так как сте- степень f(x, у) равна п, степени полиномов at (у) не превосходят /. Соответственно, степени Ь/(у) не превосходят /. Составим резуль- результант Rx(f, g), рассматривая f и g как полиномы от х с коэффи- коэффициентами, зависящими от у. Этот результант является полиномом F(y) от у, степень которого не превосходит тп, что следует из того, что вес каждого члена результанта равен тп. Допустим сначала, что результант не равен нулю тождественно. Тогда он имеет конечное число корней, не более чем тп. Подставив любой корень результанта в полиномы f(x, у) и g(x, у), мы получим по- полиномы от одного неизвестного х, результант которых равен нулю. Значит, они имеют общие корни, каждый из которых, вместе со значением для у, дает решение системы. Легко видеть, что все решения находятся на этом пути. Действительно, если х\, у\ — ре- решение системы, то зависящие только от х полиномы f(x, y{) и g(x, i/i) имеют общий корень х\, и, следовательно, их результант равен нулю, т. е. у\ является корнем результанта F(y) = Rx(f, g). Таким образом, система f(x, y) = 0, g\x, y)=0 имеет конечное число решений (xt,yi). Для оценки их числа наложим дополни- дополнительные ограничения на коэффициент перекоса ос. Именно, потре- потребуем, чтобы в новых неизвестных все решения имели различные •ординаты. Это приводит снова к конечному числу запретов для ос, именно, запрещены равенства yi — axt = y\— ах/. При таком выборе а для каждого у' найдется только одно значение для х. Так как число корней результанта не превосходит тп, то и число решений системы не превосходит тп. Если же результант Rx(f, g) равен нулю тождественно, то для любого у найдется соответствующее значение для х, так что си- система будет иметь бесконечно много решений. Причиной этого является наличие в этом случае нетривиаль- нетривиального общего делителя <р(х, у) у полиномов f(x, у) и g(x, у), и лю- =бое решение уравнения <р(х, у) = 0 дает и решение системы. 5. Связь дискриминанта полинома с результантом полинома и «го производной. Наличие кратного корня у полинома f(x) =
300 СИММЕТРИЧЕСКИЕ ПОЛИНОМЫ (ГЛ. X? = аохп + а\хп~х + ... + а„ равносильно наличию общего корня f(x) и его производной. Поэтому обращение в нуль /?(/, f) равно- равносильно обращению в нуль дискриминанта. Следовательно, R(f, f')> и D(f) должны быть тесно связаны. Найдем эту связь. Пусть f(x) — ao(x — Xi) (х — x2) ... (х — хп). Тогда f(x1)=aQ(xi — x2) ... (xi — xn), ff(xn) = ай{хп — Х\) (х„ — х2) ... {хп — Хп-х). Следовательно, R(f, Г) = <-1Г(^1)Г(х2)... Г(*я) = аГ'(*!-**) ••• ... (Xi—Xn) (X2 — Xi) ... (Х2 — Хп) ... (Хп — Х\) ...(Xn — Xn-i)^ Каждая разность xi — Xj входит в полученное произведение два раза с противоположными знаками. Поэтому rt(fi-l) Я(В-1) Тем самым предполагаемая связь установлена.
ГЛАВА XII ВЕКТОРНЫЕ ПРОСТРАНСТВА § 1. Определения и простейшие свойства 1. Определение и примеры. Напомним (стр. 75), что вектор- векторным пространством S над полем К называется аддитивно записан- записанная абелева группа, для элементов которой определено действие умножения на элементы поля К, удовлетворяющее требованиям: с {щ + и2) = сщ + си2, с, (с2и) = {с{с2) и, 1 * И ¦ ¦ И, где с, Си с2, 1—элементы поля Л', и, и\, и2 — элементы векторного пространства. Элементы векторного пространства будем называть векторами, элементы поля К для краткости будем называть чис- числами (хотя они могут иметь другую природу). Примерами векторных пространств над полем R веществен- вещественных чисел могут служить множества векторов на плоскости или в пространстве. Другие (уже над любым полем К) примеры — матрицы фиксированного строения, в частности, строки и столбцы с элементами из поля /С, полиномы от одной (или нескольких) букв с коэффициентами из поля К, полиномы ограниченной сте- степени с коэффициентами из поля Л'. Исследование векторных пространств составляет содержание линейной алгебры. В приложениях линейной алгебры к другим математическим дисциплинам рассматриваются преимущественно векторные про- пространства над полями „С, и R. В теории информации полезными оказываются векторные пространства над конечными полями, осо- особенно над полем GFB) из двух элементов. Отметим еще свойства нуля векторного пространства. 1. 0-и = 0. Действительно, 0-и + 0-и =@ + 0)и = 0-и. Доба- Добавив к обеим частям этого равенства элемент, противоположный к 0-и, получим 0-и = 0. 2. с-0 — 0. Действительно, с-0 + с-0 = с@ + 0) = с-0, откуда 3. Если си — 0, то либо с = 0, либо и = 0. Действительно, если сФО, то существует с~1 и с~1си = с~10 = 0, т. е. и = 0.
302 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII 2. Линейные комбинации, линейная зависимость и линейная не- независимость. Линейной комбинацией векторов щ, щ, ..., ит из 5 называется вектор С\щ + с2«2 + ... + стит при с(- е К. Ясно, что линейной комбинацией линейных комбинаций векторов и\, ..., ит является снова линейная комбинация этих векторов. Совокупность векторов щ, ..., ит называется линейно неза- независимой, если равенство С\Щ-\- ... + стит = 0 возможно только при с\= ... =ст — 0. Если же существуют не равные одновре- одновременно нулю С], ..., ст такие, что c\ti\-\- ... -\-стит = 0, то сово- совокупность векторов «1, ..., ит называется линейно зависимой. Определения эти совпадают с определениями, данными на стр. 108 в применении к строкам. Предложение 1. Совокупность векторов щ, ..., ит линей- линейно зависима в том и только в том случае, когда один из векторов является линейной комбинацией остальных. Предложение 2. Если совокупность векторов щ, ..., ит линейно независима, а совокупность и\,..., um, um+\ линейно за- зависима, то вектор Um+i есть линейная комбинация векторов Ul, . .., Um- Предложение 3. Если векторы v\, ..., v* являются линей- линейными комбинациями векторов щ, ..., ит и k> т, то совокупность V\, ..., Vk линейно зависима. Доказательства этих предложений ничем не отличаются от до- доказательств аналогичных предложений для строк (стр. 108—110). Совокупность векторов называется порождающей, если все век- векторы пространства являются их линейными комбинациями. Если для пространства S существует конечная порождающая система, то пространство называется конечномерным, в противном случае — бесконечномерным. В конечномерном пространстве не могут су- существовать сколь угодно большие (по числу векторов) лине"йно независимые совокупности векторов, ибо, согласно предложению 3, любая совокупность векторов, превосходящая по числу векторов порождающую совокупность, линейно зависима. Пространство матриц фиксированных размеров и, в частности, пространство строк фиксированной длины конечномерны, в ка- качестве порождающей системы можно взять матрицы с единицей на одной позиции и с нулями на остальных. Пространство всех полиномов от х уже бесконечномерно, ибо совокупность полиномов 1, х, х2, ..., хп линейно независима при любом п. В дальнейшем будем рассматривать конечномерные простран- пространства. Предложение 4. Любая минимальная (по числу векторов) порооюдающая совокупность векторов линейно независима. Действительно, пусть щ, .... ип — минимальная порождающая совокупность векторов. Если она линейно зависима, то один из векторов, скажем ип, есть линейная комбинация остальных «i, ...
$ 1] ОПРЕДЕЛЕНИЯ И ПРОСТЕЙШИЕ СВОЙСТВА 303 ..., ип-\ и всякая линейная комбинация щ, ..., ип-\, ы« есть ли- линейная комбинация меньшей совокупности векторов и\, ..., ип-\, которая тем самым оказывается порождающей. Предложение 5. Любая максимальная {по числу векторов) линейно независимая совокупность векторов является порож- порождающей. Действительно, пусть и\, ..., ип — максимальная линейно неза- независимая совокупность и и — любой вектор пространства. Тогда совокупность «ь ..., ип, и не будет линейно независимой, и, в силу предложения 2, вектор и есть линейная комбинация щ, ...., ип. Предложение 6. Любая линейно независимая порождаю- порождающая совокупность является минимальной среди порождающих и максимальной среди линейно независимых. Действительно, пусть «ь ..., и„ — линейно независимая по- порождающая совокупность векторов. Если уь ..., Vk — какая-то другая порождающая совокупность, то и\, ..., ип являются ли- линейными комбинациями v\, ..., vk, и отсюда заключаем, что п ^ k, ибо если было бы п > k, то, в силу предложения 3, и\, ¦¦¦ ..., и„ была бы линейно зависимой совокупностью. Пусть теперь W\, ..., wm — какая-либо линейно независимая совокупность. Век- Векторы a>i, ..., wm являются линейными комбинациями векторов и\, ..., ип и, следовательно, пг ^ п, ибо при m > n, в силу того же предложения 3, Wi, ..., wn составляли бы линейно зависимую со- совокупность. Таким образом, в предложениях 4, 5, 6 устанавливается тож- тождественность трех понятий — минимальная порождающая совокуп- совокупность векторов, максимальная линейно независимая совокупность векторов и линейно независимая порождающая совокупность. Совокупность векторов, удовлетворяющая этим условиям, на- называется базисом пространства, а число векторов, составляющих базис, называется размерностью пространства. Размерность про- пространства S обозначается dim S. Таким образом, размерность рав- равна максимальному числу линейно независимых векторов (мы часто в дальнейшем будем говорить слова «линейно независимые» и «ли- «линейно зависимые векторы» вместо того, чтобы сказать «векторы, составляющие линейно зависимую совокупность» и — соответствен- соответственно—для линейно независимой совокупности) и минимальному числу порождающих векторов. Предложение 7. Пусть щ, ..., ит — линейно независимая совокупность векторов, причем их число меньше размерности про- пространства. Тогда к ним можно присоединить вектор ит+\ так, что совокупность «ь ..., Um, um+\ останется линейно независимой. Доказательство. Рассмотрим множество линейных ком- комбинаций C\U\ -+¦ . ¦ • + cmum. Оно не исчерпывает всего простран- пространства, ибо «ь ..., ит не составляют порождающую совокупность векторов. Возьмем вектор, не являющийся линейной комбинацией U\, ..., um- Тогда «ь ..., Um, «m+i — линейно независимая сово-
304 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII купность, так как иначе ит+\ был бы линейной комбинацией век- векторов «1, ..., ит, в силу предложения 2. Из предложения 7 следует, что любую линейно независимую совокупность векторов можно дополнить до базиса. Это же предложение и его доказательство указывают на ха- характер произвола в выборе базиса. Действительно, если взять произвольной ненулевой вектор, то его можно достраивать до ба- базиса, взяв второй вектор как угодно, только не линейную комбина- комбинацию первого, третий как угодно, только не линейную комбинацию первых двух, и т. д. К базису можно «спуститься», исходя из произвольной порож- порождающей совокупности. Предложение 8. Любая порождающая совокупность век- векторов содержит базис. Действительно, пусть и\, и2, ..., ит — порождающая совокуп- совокупность векторов. Если она линейно зависима, то один из ее векто- векторов есть линейная комбинация остальных, и его можно исключить из порождающей совокупности. Если оставшиеся векторы линейно зависимы, то можно исключить еще один вектор, и т. д., до тех пор пока не останется линейно независимая порождающая сово- совокупность, т. е. базис. 3. Координаты вектора. Пусть ей •••> <?п—базис л-мерного пространства S над полем /Сих — произвольный вектор этого пространства. Тогда х есть линейная комбинация в\ еп: х = х\е\ + х2е2 + ... + хпеп при *,- е К. Такое представление единственно. Действительно, если х = *;<?,+ дф?2+ ... +х'пеп, то и, в силу линейной независимость базиса, х\ — х{=х'2 — х.2 Коэффициенты х\,хг,'..., хп называются координатами век- вектора х. Координаты вектора будем представлять себе в виде столбца. Два векторных пространства над одним и тем же полем назы- называются изоморфными, если между их элементами имеется взаимно однозначное соответствие (изоморфизм), сохраняющее линейные комбинации. Из определения ясно, что образ при изоморфизме ли- линейно зависимой совокупности векторов будет линейно зависимой совокупностью, образ линейно независимой совокупности будет линейно независимой совокупностью, образ порождающей сово- совокупности будет порождающей совокупностью, и, следовательно,
§ I) ОПРЕДЕЛЕНИЯ И ПРОСТЕЙШИЕ СВОЙСТВА 305 образом базиса будет базис. Таким образом, изоморфные конечно- конечномерные пространства имеют одинаковую размерность. Сопоставление каждому вектору л-мерного пространства 5 столбца из его координат по отношению к некоторому базису осуществляет изоморфизм пространства S и пространства столб- столбцов с элементами из /(. Действительно, это сопоставление взаим- взаимно однозначно и сохраняет линейные комбинации. Именно, если вектор х имеет координатный столбец (хи х2, ..., хп)т и у —стол- —столбец (i/i,j/2, ..., УпУ, то х = *!<?! + х2е2 + • • • + х„е„, У = У\в\ + +у2е2+...+у„е„ и clx + c2y={cixi+c2yi)el+(clx2+c2y2)e2+... ... + (ciXn-\- с2уп)е„, т. е. столбец из координат вектора cix + c2y есть линейная комбинация с коэффициентами Су и с2 столбцов из координат векторов х и у. 4. Замена базиса и преобразование координат. Пусть в прост- пространстве S наряду с исходным базисом е\, ..., еп рассматривается другой базис е[, е'2, ..., е'п. Векторы, составляющие этот базис, выражаются через векторы исходного базиса линейно, с коэффи- коэффициентами из основного поля: е[=спе1 +с2[е2+ ... +сп1еп, е2 = С12б1 I С22^2 Т" • • • "Г Сп2еп' /J\ +Сппв ппвп (я сознательно применил необычную индексацию: здесь в матрице коэффициентов второй индекс обозначает номер строки и пер- первый — номер столбца). Матрица сгг ... Спг Спп ' называется матрицей замены базиса ех, е2, ..., еп на е(, е'2,...,е'. В свою рчередь, векторы исходного базиса выражаются через векторы нового: e,=61,e;+V2+ ••• +Ъа/п, е2 = Ь12е[ + Ь2/2 + ... + Ьп/п, Подставив в эти формулы вместо е\, е2, ..., е'п их выражения через ей е2, • • ¦, е„, получим: ех = dnex + d2le2 +...-(- dnlen, e2=di2el + d22e2 -f ... -f dn2en, d2ne2 + ... -\-dnnen,
306 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII где матрица (d\i ... dnl ч , Ь\\ ... Ьм \/с" •¦• сш \ din ••• dnn ) \Ь\п ... bnn J\cin ... cnnj В силу линейной независимости системы базисных векторов за- заключаем, что d\\ = d22 = ... =dnn:=\ и dij = O при [ф]. / du ... dn] ч Следовательно, ( } — единичная матрица, а матрицы \dln ... dnnj (Сц ... Сп\ ч sb\i ... Ьп\ ч I и ( ] взаимно обратные, и потому каждая С\п ... с„„/ Vim ... Ъпп ) из них невырожденна. Выясним теперь, как изменяются координаты векторов при замене базиса. С этой целью обратимся к координатной записи векторов. Формулы A) в координатах означают, что в базисе в\, в2, ..., еп вектор е\ имеет координатный столбец (сц, c2i, ... ..., спг)т, вектор е'2— столбец (ci2, c22, ..., сп2)т, ..., вектор е'п — столбец (С\п, с2п, •••, с„„)т. Пусть вектор х имеет координат- координатный столбец (хи х2, ..., Хп)т в базисе еи е2, ..., е„ и столбец {х\, х'2, ..., х'п)т — в базисе е\, е'2, ..., е'п. Тогда х = х\е\ -\- х2е'2 + ... ... + х'пе'п. Сравнивая координаты по отношению к базису е\, е2, ..., еп в левой и правой части последнего равенства, по- получим Х\ == СПХ\ ~Г С12^2 "Т~ * ' ' "Г С\пХп' х2 = с21х{ + спх2 -\- ... -\- с2пхп, Хп = СпА + СпА+ ¦•• +СппХп- (Сц ••• fin \ J называется матрицей преобразования координат. Она транспонирована с матрицей замены базиса. Ее элементы являются коэффициентами в линейных выражениях исходных координат через новые. Обратная матрица дает выраже- выражения новых координат через старые. Матрица, обратная к транспонированной для некоторой ма- матрицы, называется контраградиентной с ней. Таким образом, ма- матрица, дающая выражение новых координат через исходные, контраградиентна с матрицей замены базиса или, что то же самое, координаты вектора изменяются контравариантно с векторами ба- базиса. Легко видеть, что матрица, контраградиентная с произведением матриц, равна произведению контраградиентных в том же по-
$ 21 ПОДПРОСТРАНСТВА 307 рядке. Действительно, Таким образом, переход к контраградиентным есть автоморфизм в группе всех невырожденных матриц. § 2. Подпространства 1. Определение и размерность. Подпространством Р /г-мерного пространства S называется множество векторов, образующих век- векторное пространство по отношению к действиям, которые опреде- определены в S. Иными словами, подпространство есть множество век- векторов, содержащее вместе с любым конечным множеством векто- векторов все их линейные комбинации. Подпространство /г-мерного про- пространства конечномерно и его размерность не превосходит п. Действительно, любая линейно независимая совокупность векто- векторов из Р будет линейно независимой и по отношению к S, так что максимальное число линейно независимых векторов из Р не пре- превосходит и, т. е. dim P ^ dim 5. Если dimP=dimS = n, то Р = S. Действительно, в этой си- ситуации базис Р есть линейно независимая совокупность векторов, содержащая п элементов, т. е. она максимальна, базис Р есть вместе с тем базис S, и следовательно, подпространство Р совпа- совпадает с S. В любом пространстве S существуют два тривиальных подпро- подпространства— само 5 и подпространство, состоящее только из нуле- нулевого вектора. При п > 1 имеются и нетривиальные подпростран- подпространства. Строить их можно так. Взять любую конечную совокупность векторов «ь ..., ит и ввести в рассмотрение множество всех их ли- иейных комбинаций схи\ -f- ... + cmum. Это множество, очевидно, есть подпространство. Его размерность равна т, если щ, ..., ит линейно независимы, и меньше т, если они линейно зависимы. По- Поэтому в /г-мерном пространстве существуют нетривиальные под- подпространства всех возможных размерностей, от 1 до п — 1. В силу предложения 7 предыдущего параграфа базис любого подпространства может быть дополнен до базиса всего про- пространства. 2. Сумма и пересечение подпространств. Пусть Р и Q — два под- подпространства пространства 5. Их суммой P-j-Q называется мно- множество векторов х-f- У при х^Р и y^Q. Ясно, что любая линей- линейная комбинация векторов из Р -(- Q принадлежит Р + Q, так что Р + Q есть подпространство пространства S (быть может, совпа- совпадающее со всем S). Далее, пересечение Pf\Q подпространств Р и Q, т. е. множество векторов, принадлежащих одновременно Р и Q, есть, очевидно, подпространство (быть может, состоящее только из нулевого вектора).
308 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII Ясно, что подпространства Р и Q содержатся в P + Qh P + Q содержится в любом подпространстве, содержащем Р и Q. Иными словами, Р -\- Q есть наименьшее подпространство, содержащее Р и Q. Пересечение PflQ содержится в Р и Q, и любое подпростран- подпространство, содержащееся в Р и Q, содержится и в Р Л Q- Это значит, что Р П Q есть наибольшее среди подпространств, содержащихся в Р и Q. Теорема 1. dim(P + Q) + dim(Pf| Q) = dimP -f dim Q. Доказательство. Обозначим P-f-Q = /?HPnQ = r. Раз- Размерности подпространств будем обозначать соответствующими ма- малыми буквами. Выберем прежде всего базис Т. Пусть это <?ь е2, ..., et. Имеем Т cz Р и Т cz Q. Поэтому базис Т можно дополнить до базиса Р и до базиса Q. Пусть ей в2, ..., et, et+\, ..., ер — базис Р и пусть «1» •••. ^> e't+i, •••. е^ —базис Q. Покажем, что векторы е\, ..., ^f, et+\, ..., <гр, ^+1, ..., e'q со- составляют базис R = Р-\-Q. Любой вектор z^R равен х-{-у при ^еР, i/eQ. Следовательно, г = *i<?i + • • • + *«?* + xt+1et+i + ... + + + + yi+ie't+\ + ¦•¦ + У„е'ц> так ер, e't+v ..., e'q порождают R. Докажем их линейную независимость. Пусть с.е, + ... + ctet + ct+let+1 + ... + срер + c't+/t+1 + ...+ c'/q = О, откуда Вектор и принадлежит Р, ибо он есть линейная комбинация век- векторов базиса Р, но вместе с тем «eQ, ибо он есть линейная ком- комбинация части базисных векторов Q. Следовательно, «ePflQ и является линейной комбинацией векторов базиса этого подпро- подпространства: и = а\в\ -\- ... + atet. Приравнивая это представление и к его представлению через базис Q, получим: - c'qe'q или, что то же самое, ал + ... + atet + c't+le't+l + ... + c'/q = 0. Но векторы ev ..., et, e't+x, ..., e'q линейно независимы, ибо они составляют базис Q. Следовательно, c't+l = ... = c'q = 0, а: = .., ... = at = 0 и 4- • • • 4- ^р = 0.
$ 2) ПОДПРОСТРАНСТВА 309 В силу линейной независимости базиса подпространства Р по- получаем d = ... = ct = ct+\ = ... == ср == 0. Итак, все коэффициенты линейной комбинации векторов в\, ... ..., et, et+i, ..., ер, e't+v ..., е^ оказались равными нулю. Следо- Следовательно, эти векторы линейно независимы. Так как они порож- ¦ дают Р -(- Q, они составляют базис Р -\- Q. Их число, т. е. dim(P-f Q), равно p-\-q — t = dim Р -f dim Q — dim (P Л Q). Тем самым теорема доказана. Доказанная теорема служит основой интуиции в вопросе о рас- расположении подпространств в многомерных пространствах. Так, в четырехмерном пространстве S два двумерных подпространства Р и Q (т. е. две плоскости, проходящие через начало координат) могут иметь три возможности взаимного расположения. Возможно,, что их сумма дает все S. Тогда dim(PnQ) = 0, т. е. плоскости пересекаются в одной точке. Возможно, что dim(P+Q) = 3, т. е. обе плоскости лежат в трехмерном пространстве и не совпадают. В этом случае dim(PnQ)=l, т. е. плоскости пересекаются по прямой. Наконец, если dim(P -j- Q) = 2, то P + Q совпадает с Р, с Q и с их пересечением, т. е. это тот случай, когда плоскости Р и Q совпадают. 3. Прямая сумма подпространств. Сумма двух подпространств Р и Q называется прямой суммой, если представление любого век- вектора из P + Q в виде суммы вектора из Р и вектора из Q одно- однозначно, или, что то же самое, из равенства u+v — Q при неР, weQ следует « = 0, о = 0. Прямая сумма обозначается P@Q. Говорят, что если S = Р ® Q, то 5 разлагается в прямую сумму своих подпространств Р и Q. Предложение 2. Для того чтобы сумма Р + Q была пря- прямой, необходимо и достаточно, чтобы Р (] Q = 0. Действительно, если сумма прямая и ге PflQ, то 0==г + (—z) при геР и -zgQ и, следовательно, г = 0. Обратно, если Pf]Q = O и г — ui-\-Vi — U2 + V2 при «I, «г^-Р и vi, r2eQ, та «1 — «2 = vг — v\. В левой части — вектор из Р, в правой — вектор из Q, следовательно, это — нулевой вектор и щ = «2, f i = t>2- Сум- Сумма Р+ Q прямая. Предложение 3. Для того чтобы сумма Р -\- Q была пря- прямой, необходимо и достаточно, чтобы объединение базисов Р и Q составляло базис Р -\- Q. Ясно, что объединение базисов Р и Q порождает Р + Q. Далее, выражая через базисы Р и Q векторы кеЯ и v e Q в равенстве и -f- v = 0, мы получим равную нулю линейную комбинацию век- векторов объединения базисов Р и Q, и она может быть только три-
310 ВЕКТОРНЫЕ ПРОСТРАНСТВА ГГЛ. ХН виальной в том и только в том случае, когда объединение базисов. Р и Q образует линейно независимую совокупность векторов. Понятие суммы подпространств естественно распространяется на любое конечное число слагаемых подпространств. Именно, сум- суммой Р\-\- ?2-\- ¦¦¦ 4-Рк называется множество сумм и, -f ы2¦+-... ... + Ид. при Ui e Pi. Ясно, что, сумма подпространств есть под- подпространство. Оно порождается объединением базисов слагаемых подпространств. Сумма подпространств называется прямой сум- суммой, если представление ее векторов в виде u\-\-ui-\- ... + Uk, Ui e Pit однозначно или, что то же самое, из равенства «i+иг -+-••• ... +«fe = 0 при н,- е А- следует, что и, = 0, t = l, .... k. Заметим, что можно определить сумму бесконечного множе- множества подпространств Р„ i e /, как множество конечных сумм век- векторов из пространств Pi. Понятие прямой суммы естественно раст пространяется на случай бесконечного множества подпространств, но оно имеет смысл только для бесконечномерных подпространств. Предложение 4. Для того чтобы сумма Pi -f- Р2 + ... + Рк была прямой, необходимо и достаточно, чтобы пересечение каж- каждого из подпространств Pi с суммой остальных состояло только из нулевого вектора. Действительно, если сумма прямая и вектор г принадлежит Pt и сумме остальных слагаемых подпространств, то г — и\ — ... ... — м;_1 — Ut+\ — ... — и* — 0 и 2 = 0. Обратно, если при всех i пересечение Pt с суммой остальных подпространств есть нуле- нулевой вектор, то из равенства щ + ... + Ш-i -Н «« + «f+i + ... ... + Uk = 0 следует щ\ — — иЛ — ... — ш-х — m,+i — ... — uk; от- откуда ui = 0. Предложение 5. Для того чтобы сумма Pi -f-P2 + ... ... -f- Pk была прямой, необходимо и достаточно, чтобы объеди- объединение базисов Р\, Р^, .... Pk составляло базис суммы. Доказательство аналогично доказательству предложения 3. П редл о.жен ие 6. Для того чтобы сумма Р{ -f- P2 + ... ... -f- Pk была прямой, необходимо и достаточно, чтобы Pi(] Рг = = 0, {Р\ + Рг) П Рл — 0. " т- д., т. е. пересечение каждого подпро- подпространства Pi с суммой предшествующих состояло только из нуле- нулевого вектора. Необходимость следует из предложения 4. Доказательство до- достаточности проведем индукцией по числу слагаемых подпро- подпространств. Из (Pi+ ... +Pk-i)[]Pk = 0 следует, что если «!-f ... ... + Uk-i + uk = 0, то uk = 0 и «1 + ... + ик-\ = 0. В силу ин- индуктивного предположения щ = ... =Мд._1=0. Базу для индук- индукции дает случай k = 2 (предложение 2). 4. Относительная линейная независимость и относительный базис. Пусть S — векторное пространство и Р — его подпростран- подпространство. Скажем, что векторы мь uk линейно независимы относи- относительно Р, если из включения CiUi + ... -f-CkUkeP -следует, что. d ==...== ck = 0.
«2] ПОДПРОСТРАНСТВА 31! Предложение 7. Для того чтобы совокупность ии ..., Uk векторов была линейно независима относительно подпространства Р, необходимо и достаточно, чтобы совокупность ui, ..., «*, *i, ..., ет, где в\, .... ет — базис Р, была линейно независимой. Действительно, если щ, • • •, «* Линейно независимы относи- относительно Р, то из c\U\ + ... + ckuk + bte\+ ... -f bmem = 0 сле- следует, что ci«i + ... +аде^, поэтому Cj = ... =с4 = 0 и так- также Ь[ = ... = Ьт =0, в силу линейной независимости еь ..., ет. Обратно* если щ, ..., «д., ei, ..., ?m линейно независимы, то из схщ + ... + CkUk е Р следует схи\ + ... + ckuk = bxei + ... ... + bmem, откуда с\ — ... = ch = 0. Векторы Mi, ..., и* образуют базис S относительно Р, если они линейно независимы относительно Р и любой вектор х е 5 пред- представляется в виде их линейной комбинации, с точностью до векто- векторов из Р. Точнее — если х = CiUj -f- ... +с*м*-}-у, при у ^Р. Предложение 8. Для того чтобы векторы и\, ..., «* состав- составляли базис S относительно Р, необходимо и достаточно, чтобы векторы и\, ..., Uk, ей ..., em, где е\, .... ет — базис Р, состав- составляли базис S. Действительно, линейная независимость Mi, ..., «*, в\, ..., ет необходима и достаточна для линейной независимости Н], ..., м* относительно Р. Для того чтобы щ, ..., «* порождали 5 с точ- точностью до векторов из Р, необходимо и достаточно, чтобы «i, ... ,.., Uk, eu ..., ет порождали S. Из предложений 7 и 8 следует, что любая совокупность векто- векторов, дополняющая базис Р до базиса S, есть базис S относитель- относительно Р. Любая линейно независимая относительно Р совокупность векторов может быть дополнена до базиса S относительно Р. Число векторов, составляющих базис S относительно Р, равно раз- разности размерностей S и Р. 5. Факторпространство. Пусть S — векторное пространство и Р — его подпространство. Скажем, что векторы x,y^S сравнимы по подпространству Р (и запишем х s у(Р)), если х — у^Р. Ясно, что S «расслаивается» на классы сравнимых по Р векторов. Далее, если х = у(Р) и u = z(P), то С\х-\- с2и = с^у -f c2z (P). Это обстоятельство делает корректным определение операции взя- взятия линейных комбинаций на классах сравнений по Р. Ясно, что классы образуют векторное пространство по отношению к этой операции. Оно называется факторпространством и обозначается S/P. Если отвлечься от операции умножения элементов фактор- пространства на элемент основного поля, S/P есть факторгруппа аддитивной группы (т. е. группы относительно сложения) про- пространства S по аддитивной группе подпространства Р. Предложение 9. Классы по Р, содержащие базис S отно- относительно Р, образуют базис S/P. Обратно, элементы, взятые по одному из классов базиса S/P, составляют базис S относительно Р.
312 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII Действительно, включение С\щ + ... + cfe"* e P равносильно сравнению с\их-\- ... -j- сд-й* = О (Р) и равенству Ciu-f- ••• ... -f- ?«(«& — 0 (черточка обозначает переход к классам сравнений по Р), так что линейная независимость их, ..., Uk относительно Р равносильна линейной независимости элементов пх, .... «д. фак- торпространства. Равенство х — C\U\ -+¦••• + ckuk + у при i/eP равносильно сравнению х = C\U\ -f- ... + ckUk (Р) и равенству х = = с\п\ + ... + Ckuk в факторпространстве. Отсюда следует, в частности, что размерность факторпростран- ства S/P равна разности размерностей S и Р. § 3. Линейные функции 1. Сопряженное пространство. Линейными функциями на век- векторном пространстве 5 называются функции, онределенные на векторах этого пространства со значениями в основном поле К, удовлетворяющие условию линейности: 1(схх + c%y) — c\l{x) -f- -f c2l(y). Пусть в S выбран базис е\, е%, .... еп. В силу линейности значение функции / на любом векторе определяется значениями на базисе; действительно, если (хи ..., хп)т — столбец из коорди- координат вектора х, так что х = ххех + ... + хпеп, то 1(х) — xxl(ei) -f-... ... -\-xnl{en). Ясно, что любая функция, выражаемая через коор- координаты по формуле 1(х)= ахх\-{- ... -j-anxn, будет линейной функцией. Таким образом, между линейными функциями на 5 и строками {а.\, ..., ап) в формуле /(х)= а,\Х\ + ••• + апхп имеет- имеется взаимно однозначное соответствие. Значение функции 1(х) на векторе х равно произведению строки из коэффициентов линейной функции на столбец из координат вектора х. Для линейных функций естественным образом определяются действия сложения и умножения на элементы основного поля, именно, по определению, (U + h)x= U{x)+ 12(х) и (cl)x = cl(x). По отношению к этим действиям линейные функции образуют век- векторное пространство, называемое сопряженным с пространством 5 и обозначаемое S*. Оно, очевидно, изоморфно пространству •строк коэффициентов линейных функций и, следовательно, я-мер- но, так же как S. Однако естественного изоморфизма между 5 и S*, который бы не зависел от выбора базиса, не существует. Элементы хе5 естественно порождают линейные функции на пространстве S*, если считать *(/) — 1(х). Поэтому S изоморфно погружается в (S*)*. Образ при этом погружении совпадает с пространством (S*)*, ибо размерности пространств S и (S*)* рав- равны. Это позволяет рассматривать пространство S как сопряжен- сопряженное с пространством S*. Линейные функции на пространстве S называют также ковек- торами. В этой терминологии значение линейной функции на век- векторе называется скалярным произведением ковектора на вектор .или вектора на ковектор.
§ 3] ЛИНЕЙНЫЕ ФУНКЦИИ 313 2. Дуальный базис. Пусть в пространстве S выбран базис, Покажем, что в S* существует базис, в котором координатами ко- вектора оказываются коэффициенты в выражении значения ли- линейной функции через координаты вектора. Обозначим через fi функцию, сопоставляющую каждому век- вектору из S его i-ю координату в выбранном базисе ей е2, .-., еп. Ясно, что ft — линейная функция и /,(е,)=1, f,(e/) = O при 1ф\. Тогда l(x) =a,jci-f а2х2-{- ... + апхп = cnfi(x) + a2f2 (x)+ ... ... +anfn(x) = (aifl + a2f2+ ... +anfn)(x). Таким образом, коэффициенты й\,а2, ..., ап оказываются ко- координатами ковектора / в базисе /i, /2, ..., fn. Этот базис назы- называется дуальным с базисом е\, е2, ..., еп пространства S. Если рассматривать S как пространство, сопряженное с S*, то, очевид- очевидно, базисом, дуальным с базисом \\, f2, ..., fn, является исходный базис еи е2, ..., еп. 3. Преобразование координат в S* при преобразовании коор- координат в S. Пусть в S выбран новый базис е\, в2, ..., еп> связан- связанный с исходным соотношениями сп2еп, Тогда координаты в исходном базисе выражаются через коорди- координаты в новом базисе по формулам: ~ CUXl 2 ~Г ' • • т Хп = СпА + Сп2Х2+ ••• +СппХп- Линейная функция 1(х)= а\Х\ + а2х2-\- ... + апхп с координа- координатами аи а2, ..., ап в базисе, дуальном с исходным, выразится че- через новые координаты вектора х по формуле: ... +с2пх'п) +сп2ап)х'2 сяпаа) х'п,
314 ВЕКТОРНЫЕ ПРОСТРАНСТВА (ГЛ. XII так что координаты 1(х) в базисе, дуальном с базисом е[, e'v ... ..., е'п, равны: а[ = cuai + с21а2 + ... +сп1ап, Тем самым формула преобразования совпадает с формулой пере- перехода от исходного базиса к новому. Как говорят, координаты ковектора изменяются ковариантно с изменением базиса простран- пространства S, в отличие от координат вектора, которые, как мы видели выше, изменяются контравариантно. § 4. Линейные отображения векторных пространств 1. Ядро и образ при линейном отображении. Линейным отобра- отображением или линейным оператором векторного пространства S в векторное пространство Т называется функция зФ, определенная на 5 со значениями в Т, удовлетворяющая требованию линей- линейности зФ (с\Х + Сгу) = CiMx -f- Линейные отображения будем записывать рукописными пропис- прописными буквами перед обозначением вектора, опуская скобки. Пусть dim 5=ли dim Т = m и в пространствах S ч Т выбра- выбраны базисы ей ..., еп и fu ..., fm. Пусть, далее, зФ — линейное отображение из S в Т. Ясно, что значения S& вполне определяются значениями на базисе е\, ..., еп, ибо, в силу линейности, ?ф {%\е\ -f- ... + хпеп) = XiS^-ei -f- .. • + xns4-en- Обозначим через (ац, ••¦, am\Y, ..., (ащ, ..., amn)T столбцы из координат век- векторов s4-eit ..., Меп в базисе flt .... fm и буквой А — матрицу, со- составленную из этих столбцов: (ан ац ... aift \ a2i a2Z ... ain I «mi ami ... amm / Тогда координаты Q/i, ..., ym)T вектора у = зФх выражаются по формулам yi^auXi -f + + у2 = ym==amixl + am2x2+ ... +amnxn через координаты вектора х или, в матричных обозначениях, Y = АХ,
f 4) ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ ВЕКТОРНЫХ ПРОСТРАНСТВ 315 где через У- и Y обозначены столбцы из координат векторов х и у. Матрица А называется матрицей отображения зФ. Ядром ker зФ отображения зФ называется множество всех век- векторов из S, отображаемых в 0 пространства Т. Образом im^ или зФБ отображения зФ называется множество векторов зФх при х е S. Ясно, что ядро и образ зФ являются под- подпространствами, соответственно, пространств S и Т. Векторы из S, сравнимые по кетзФ, т. е. отличающиеся слагае- слагаемым из ker зФ, имеют, очевидно, одинаковые образы в Т. Обратно, если зФх = зФг, то зФ(х— 2) = 0, т. е. х и z сравнимы по кетзФ. Следовательно, между векторами образа зФБ оператора зФ и эле- элементами факторпространства S/кетзФ имеется взаимно однознач- однозначное соответствие. Это соответствие, очевидно, сохраняет линейные комбинации, так что пространство зФБ изоморфно факторпростран- ству S/кетзФ. Следовательно, (ИтзФБ = dim S —.dim ker зФ. 2. Изменение матрицы оператора при преобразовании коорди- координат в пространствах S и Т. Пусть в пространствах S п Т базисы е е„ и /ь ..., fm заменены на базисы е\, ...,е'п и f\, ..., f'm. Соответствующие этим заменам матрицы преобразования коорди- координат обозначим через С и В, столбцы из координат векторов х и у = s4-x в исходных базисах обозначим через X и У, в преобразо- преобразованных— соответственно, X' и У. Матрицу оператора j# обозна- обозначим А. Тогда У = AX, X = CX', Y = BY', так чтоУ'==В-'У. Сле- Следовательно, У = B~lY = В АХ = В~ХАСХ'. Поэтому матрицей оператора si- по отношению к новым базисам является матрица А' = В-1АС. 3. Каноническая форма матрицы линейного отображения. Прежде всего заметим, что размерность образа S&S равна макси- максимальному числу линейно независимых векторов в порождающей это пространство совокупности векторов s^e\, ..., s4-en, т. е. равна максимальному числу линейно независимых столбцов матрицы А оператора s4-. Таким образом, dim ,s$S = л где г — ранг матри- матрицы А. В силу соотношения между размерностями ядра и образа, от- отсюда следует, что dim ker si- = п — г. Пусть е\, ..., ег — какой-либо базис S относительно ker«s#. Тогда векторы s4-eu ..., Мег образуют базис ^5. Действительно, эта совокупность векторов порождает s?S, ибо любой вектор из S есть линейная комбинация е\, ..., е, с точностью до слагаемого из ker«5#, и поэтому любой вектор из «s^S есть линейная комби- комбинация sf-eu ¦ ¦ ¦. s&e,. Вместе с тем векторы $$-еи ..,, Мег линейно независимы, ибо из С\$1>е\ + ... + сгМег = 0 следует s&(c\e\ + • • • ¦.. + crer) = 0, откуда С\ех + • • ¦ + cre, <= ker зФ и С\ = ... — с, = "sO в силу определения относительного базиса. Пусть ег+\, ...
316 ВЕКТОРНЫЕ ПРОСТРАНСТВА (ГЛ. XII ..., еп — какой-либо базис кег.я?. Тогда ей .... er, vr+u ¦¦¦, вп можно принять за базис пространства S. В пространстве Т линейно независимую совокупность s?ei, ..., ?Фег дополним каким-либо образом до базиса Т. Обозначим gi = $t-eu ¦ ¦ ¦, gr — ^ег и через gr+\, •••. gm — какие-либо векторы, дополняющие gu ••-, gr до базиса Т. В выбранных базисах матрица оператора А есть: V "т—г, г 0т_Г) п—г ) Здесь Ет — единичная rX^-матрица, 0r,n-r, 0m_r, r и 0m_r, „_г — ну- нулевые матрицы указанных размеров. Полученному результату можно придать следующую форму на языке теории матриц. Ввиду того, что любую тХ «-матрицу А можно принять за матрицу линейного оператора из л-мерного про- пространства 5 в m-мерное пространство Т, для любой m X «-матрицы можно найти такие невырожденные m X m-матрицу В и п X «-ма- «-матрицу С, что *-*:-(f I). где г — ранг матрицы А. Это равенство можно переписать и так: Со. где Сй = С-\ Пусть B = (Bi, В2), где Bi — матрица, состоящая из первых г столбцов матрицы В, матрица В2 составлена из остальных m — г столбцов В. Соответственно, пусть Со = f c' J, где Ct составлена из первых г строк матрицы Со, а С2 составлена из остальных п — г строк. По правилу умножения матриц, разбитых на клетки, по- получим Итак, мы получили, что любая тХ «-матрица ранга г может быть представлена в виде произведения m X /"-матрицы В{ на гХ «-матрицу С\. Обе эти матрицы имеют ранг г, ибо у матрицы В\ столбцы линейно независимы, а у матрицы С\ — строки. 4. Линейные действия над операторами. Пусть si- и Ш — линей- линейные операторы, действующие из «-мерного пространства 5 в m-мерное пространство Т. Определим линейную комбинацию опе- операторов формулой (cis4- -f- c2$i)x = C\s4-x -f- c2&x. Ясно, что по отношению к этому действию операторы образуют векторное пространство. Выбор базисов в S и Т задает изомор- изоморфизм пространства операторов и пространства тХ «-матриц. По- Поэтому размерность пространства операторов равна т.п.
§ 5] ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕКТОРНОМ ПРОСТРАНСТВЕ 317 5. Умножение линейных отображений. Пусть даны три прост- пространства Su S2, S3 и даны линейные отображения: $, отображаю- отображающее Si в S2, и s4-, отображающее S2 в S3. «Сквозное» отображение Si в S3, т. е. отображение, действующее на векторы из Si по фор- формуле s4-($Mx), называется произведением $$¦$ отображений $Ф и Ы. Обращаю внимание на то, что первым действующим на к оказы- оказывается правый множитель, и затем на результат действует левый множитель. Такой порядок обусловлен левой записью: оператор расположен слева от объекта, к которому он применяется. Пусть в Si, S2, S3 выбраны базисы. Пусть по отношению к этим базисам операторы М- и & имеют матрицы А и В, и пусть X — столбец из координат вектора х е Si. Тогда столбцом из коорди- координат вектора З&х будет ВХ и столбцом из координат вектора s4-kx будет АВХ. Таким образом, произведению операторов соответ- соответствует, по отношению к выбранным базисам, произведение матриц. Ясно, что для умножения операторов и взятия их линейных комбинаций верны соотношения билинейности: 6. Обращение невырожденных линейных отображений. Линей- Линейное отображение пространства S в пространство Т называется не- невырожденным, если образом «я? является все пространство Т и ядро s& состоит только из нуля, так что из равенства stx — 0 сле- следует х = 0. Невырожденное отображение взаимно однозначно, так что существует обратное отображение зФ~1. Из линейности s4- сле- следует, линейность s4-~x. Действительно, s4-~l (c\x -\- С2у) есть такой вектор г е S, что $t-z = С\х + с2у. Пусть и==^~'х и v — st~lyt т. е. $Фи = х, s4-v = у. Тогда s4-z = с^и + c2siv = s4- (cxu + c2v) и, следовательно, г — с\и — c2v = 0, ибо ядро s& состоит только из нуля. Итак, s4-~x (cYx -f c2y) = С\и -f c2v = CiS&~lx + с2зф-ху. Линей- Линейность s4--x доказана. Из определения зФ~ ясно, что s4-~ ?Ф является единичным оператором на S и s&$t-~x есть единичный оператор на Т. § 5. Линейные операторы в векторном пространстве 1. Матрица линейного оператора. В настоящем и следующих параграфах будут рассматриваться линейные операторы, дейст- действующие из векторного пространства S в себя. Пусть е\, ..., еп — базис S. Тогда оператору s4- соответствует матрица, составленная из столбцов координат векторов s&eu $$-е2, ..., $t-en относительно базиса е\, е2, ..., еп, так что эта матрица квадратная. В отличие от ситуации, когда мы рассматривали линейные операторы дейст- действующие из пространства S в пространство Т, и мы имели возмож- возможность выбирать базисы в каждом из этих пространств, здесь сво-
318 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII бода в выборе базиса меньше, мы можем выбирать базис лишь в самом пространстве S. Матрицы преобразования координат В и С, независимо выбиравшиеся в ситуации § 4, здесь совпадают, так что формула для изменения матрицы при преобразовании ко- координат принимает вид А' = С~1АС. Здесь А — матрица оператора st, отнесенная к исходному базису, С — матрица преобразования координат и А' — матрица оператора М- в преобразованном базисе. Таким образом, при преобразовании координат матрица ли- линейного оператора претерпевает преобразование подобия. Выше мы видели, что характеристический полином de\(tE — А) матрицы А не изменяется при преобразовании подобия. Следова- Следовательно, характеристический полином матрицы оператора зависит лишь от самого оператора и не зависит от выбора базиса про- пространства. Поэтому будем его называть характеристическим по- полиномом оператора. 2. Действия над операторами. Векторное пространство над полем К, для элементов которого определено действие умножения, сопоставляющее упорядоченной паре векторов третий вектор, на- называемый их произведением, называется алгеброй над К, если вы- выполнены соотношения билинейности произведения: (с,*! + с2х2) у = CyXiy -f с2х2у, /i + с2у2) = cixyi + с2ху2. Таким образом, в алгебре соединяются структуры векторного пространства и кольца, согласованные свойствами билинейности. Алгебра называется ассоциативной, если действие умножения ассоциативно. Примером ассоциативной алгебры служит алгебра квадратных матриц с элементами из поля К. Операторы, действующие из S в S, образуют, очевидно, ал- алгебру, ибо они образуют векторное пространство и для них опре- определено действие умножения, удовлетворяющее соотношениям би- билинейности. Алгебра операторов ассоциативна. Роль единицы в ней играет единичный оператор Ш', сопоставляющий каждому век- вектору самого себя. Оператор называется невырожденным, если его ядро состоит только из нуля или, что то же самое (в силу зависимости между размерностями ядра и образа), если S отображается на все 5. Для невырожденного оператора существует обратный. Алгебра операторов из S в S изоморфна алгебре квадратных п X «-матриц, где п = dim S. Изоморфизм задается сопоставле- сопоставлением каждому оператору «я? его матрицы относительно некото- некоторого фиксированного базиса. Единичному оператору при этом со- соответствует единичная матрица, невырожденным операторам — невырожденные матрицы и взаимно обратным операторам — вза- взаимно обратные матрицы. Для дальнейшего нам будут нужны значения полиномов от оператора. Именно, если f{t)=aotn+ ... + an-it+ an(= K[t], то
§ 5] ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕКТОРНОМ ПРОСТРАНСТВЕ 319 положим f(M) = аь&п-\- ••• + <in-\$l + ап&. Ясно, что матрицей (по отношению к некоторому базису) оператора f(st) является f(A), где А — матрица оператора si. 3. Инвариантные подпространства. Подпространство Р прост- пространства S, в котором действует оператор зФ, называется инва- инвариантным относительно этого оператора, если для любого х е Р вектор six тоже принадлежит Р. Таким образом, оператор М- ото- отображает Р в Р, и, ограничив область определения оператора si- подпространством Р, мы получим оператор из Р в Р. Для крат- краткости, вместо того чтобы говорить об ограничении оператора $Ф на Р, скажем короче —оператор зФ на Р. Далее, если х = у\Р), т. е. х — у^Р, то М(х — у)^Р, так что s?x = s4-y (Р). Таким образом, оператор М сохраняет сравни- сравнимость по инвариантному подпространству, и тем самым действие оператора М- естественно переносится на факторпространство. В ре- результате на факторпространстве возникает оператор, индуциро- индуцированный оператором М. Пусть е\, ..., ек — базис инвариантного подпространства Р, и пусть в\, ..., в/с, вк+и ••¦, бп — базис S, включающий базис Р. Тогда для векторов s?ei, ..., зФен координаты, начиная с (&-)-1)-й, равны нулю, так что в выбранном базисе оператору М соответ- соответствует матрица и ••• a\k at, *+i *•• а\п akl акк ак.к+\ Art 2к+1.п О ... О а n.k+l Матрица ^4г === I тора si- на Р. Далее, I есть, очевидно, матрица опера- (Р). а„, +аппеп так что правый нижний квадрат Л2 матрицы А есть матрица опе- оператора, индуцированного оператором «я? на фактопространстве S/P. Предложение 1. Характеристический полином оператора J&, действующего в пространстве S, делится на характеристиче- характеристический полином оператора J& на инвариантном подпространстве Р. Частным от их деления является характеристический полином опе- оператора, индуцированного оператором М- на факторпространстве Ш/Р,
I Al 0 0 0 . A2 . 0 .. .. 0 .. 0 ¦ A 320 ВЕКТОРНЫЕ ПРОСТРАНСТВА (ГЛ XII Доказательство. tE.-A. В *0 tEn_^A По теореме об определителе ступенчатой матрицы 6et(tEn — А)= det(tEk — A^uetitEn-k — А2), что и доказывает предложение. Матрица оператора еще больше упрощается, если S разла- разлагается в прямую сумму двух или нескольких инвариантных под- подпространств. В этой ситуации за базис S можно взять объедине- объединение базисов прямых слагаемых, и оператор $& будет преобразо- преобразовывать базис каждого из подпространств Р,- посредством матрицы ограничения оператора s4- на Pi, так что в целом матрица ока- окажется блочно-диагональной: А — Здесь Аи А2, ..-, Ат — матрицы оператора $& на инвариант- инвариантных прямых слагаемых Р\, Р2, ..., Рт, а нулями обозначены ну- нулевые матрицы надлежащих размеров. Из сказанного следует, что для упрощения матрицы оператора нужно стремиться, насколько это возможно, разложить простран- пространство 5 в прямую сумму инвариантных подпространств. Предложение 2. Ядро и образ любого полинома от опера- оператора si (в частности, самого оператора) являются инвариантными подпространствами. Доказательство. Пусть вектор х принадлежит ядру опе- оператора f(j&). Это значит, что f(s?)x=0. Но тогда «я?/(.5#)х=0 и, в силу перестановочности значений полиномов, f(j&)Mx — 0, так что st-х принадлежит ядру оператора /(.$$). Это значит, что ядро f(«s#) инвариантно. Пусть теперь х принадлежит образу f(s&), т. е. x = f(M)y. Тогда $&x — J&f{s4)y = f(s?){s4'y), так что Мх тоже принадле- принадлежит образу f(^), что и означает, что образ /(«я?) есть инвариант- инвариантное подпространство. 4. Циклическое подпространство и минимальный аннулятор вектора. Пусть в пространстве S действует оператор зФ. Для не- некоторого вектора х из S построим наименьшее инвариантное под- подпространство, содержащее вектор х. С этой целью введем в рас- рассмотрение совокупность х, Мх, ..., s&^x, продолжая ее до тех пор, пока в первый раз не возникнет линейная зависимость, так что х, зФх, ..., Мк~1х — линейно независимая совокупность векто- векторов, а х, s4-x, .... s&k~lx, зФкх — уже линейно зависимая. Тогда
$ 5] ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕКТОРНОМ ПРОСТРАНСТВЕ 321 вектор s4'hx есть линейная комбинация предшествующих: $t-kx = — axs4-k~lx — ... — ak_xs4x — akx. (Мы сознательно взяли коэффициенты линейной комбинации со знаком минус.) Пространство Р, натянутое на векторы х,$?х, ..., s4-k~xx, ин- инвариантно. Действительно, если у е? Р, то у = схх + с^х + • • • и л^г/ = cxs4-x + c2«s$2x + •• lx-{- ... + ak-iStx+ akx) + ... + ck-\S4-k-lx e P, ибо все слагаемые принадлежат Р. Далее, если Q — какое-либо инвариантное подпространство, со- содержащее вектор х, то оно содержит и векторы si-x, s4?x,. . .,s4-k~lx, и, следовательно, Q =э Р. Таким образом, Р есть минимальное ин- инвариантное подпространство, содержащее вектор х; оно назы- называется циклическим подпространством, порожденным вектором х. Равенство x — akx можно записать в виде /@ Полиномы F(t), обладающие свойством F(s4-)x = 0, назы- называются аннуляторами вектора х. Покажем, что f(t) является анну- лятором наименьшей степени среди ненулевых аннуляторов. Дей- Действительно, если botk~l + b\tk-\- ... -\-bk-2t-\-bk-X есть аннуля- тор для вектора х, то Ьаб&^х + b{s4-k~2x + ... + bk-2s^x-{-bk-iX= == 0, что возможно только при bo = b\ — ... = bk-2 = bk-\ = О, в силу линейной независимости х, s4-x, ..., s^k~lx. Поэтому поли- полином f(t) называется минимальным аннулятором вектора х. Предложение 3. Любой аннулятор вектора х делится на минимальный аннулятор. Действительно, пусть F(t) — некоторый аннулятор вектора х и f(t)—минимальный аннулятор х. Поделим F(t) на /(/) с остат- остатком: F(t) — q(t)f(t)-\-r(t), причем степень r(t) меньше степени f(t). Тогда откуда r(s?)x = 0, ибо F(s?)x = 0 и f(s?)x — O. Следовательно, г(/)^0, ибо f(t) — аннулятор наименьшей степени. 5. Матрица оператора на циклическом подпространстве и ее характеристический полином. Пусть в векторном пространстве S действует оператор si-. Обозначим через Р циклическое подпро- подпространство, порожденное вектором хе 5, и пусть /@=^ + + a\tk~x + ... + ak+lt-\- ak — минимальный аннулятор вектора х. За базис Р можно принять векторы х, $&х, sftx, ..., s4-k~xx. Под действием оператора s4- они превращаются, соответственно, в
322 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII s€x,s4-2x, ..., s4-k~xx, s4-kx, причем s4-kx = — akx — ak_xs€x— ... ... —a^s€ ~lx. Следовательно, матрица оператора s& в этом бази- базисе равна "О 0 ... О — ak 1 0 ... О -а. О 1 О —а й-2 О О 1 -а, Матрица этого вида носит название сопровождающей для поли- полинома f(t). Предложение 4. Характеристический полином оператора s€ на циклическом подпространстве, порожденном вектором х, равен минимальному аннулятору вектора х. Иными словами, нужно доказать, что характеристический поли- полином матрицы, сопровождающей для полинома f(t), равен этому полиному. Это — нетрудная задача на вычисление определителей. Характеристический полином матрицы, сопровождающей для полинома /(/), равен t -1 0 0 ... / ... — 1 ... 0 0 0 ak ak-l ak-2 -1 t + 0l Для вычисления этого определителя прибавим к его первой строке вторую, умноженную на t, третью, умноженную на t2, ..., послед- последнюю, умноженную на th~x. Получим: f(t) О о о — 1 t О - 1 4-2 О О -1 О — 1 0 о — 1 =(-l)fe+1(-lf-1 f{t)=f(t). Предложение доказано. Сопоставим это предложение с предложением I, получим, что характеристический полином оператора si (на всем пространстве) делится на минимальный аннулятор любого вектора и, следова- следовательно, характеристический полином от оператора аннулирует все векторы пространства, т. е. является нулевым оператором. Тем самым мы снова доказали в терминах операторов теорему Гамиль- Гамильтона— Кэли, доказанную ранее в терминах матриц. 6. Минимальный полином оператора. Минимальным полиномом оператора «s$, действующего в пространстве S, называется поли- полиномом наименьшей степени, аннулирующий все векторы простран-
$ 51 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕКТОРНОМ ПРОСТРАНСТВЕ 323 ства S, т. е. такой полином g(t) наименьшей степени, что g = 0. Обычным приемом деления с остатком легко убедиться в том, что если F(s4-) — Q, то F(t) делится на минимальный поли- полином. Поэтому минимальный полином является делителем характе- характеристического. Минимальный полином есть наименьшее общее кратное мини- минимальных аннуляторов векторов базиса. Действительно, минималь- минимальный полином является кратным для всех таких аннуляторов и любое кратное аннуляторов векторов базиса аннулирует базисные векторы, а с ними и все векторы пространства. Более общо, если пространство 5 есть сумма (не обязательно прямая сумма) инвариантных подпространств Р\ Ре, то ми- минимальный полином оператора rf на 5 равен наименьшему об- общему кратному минимальных полиномов оператора si на подпро- подпространствах Pi, ..., Pk. Действительно, минимальный полином s4- на 5 делится на минимальный полином si на Р„ т. е. является кратным для всех минимальных полиномов подпространств Р\, ... ..., Pk- Вместе с тем любое кратное этих полиномов, в частности, наименьшее общее кратное аннулирует все подпространства Pi Pk и их сумму 5. 7. Разложение пространства с оператором в прямую сумму примарных подпространств. Пространство, в котором действует оператор, называется примарным, если минимальный полином оператора является степенью неприводимого полинома над основ- основным полем. Цель настоящего пункта — доказать, что пространство можно разложить в прямую сумму инвариантных примарных под- подпространств. С этой целью докажем несколько вспомогательных предложений. В их формулировках будет всюду предполагаться, что векторы принадлежат пространству, в котором действует опе- оператор s4-. Предложение 5. Если вектор аннулируется двумя взаимно простыми полиномами, то он равен нулю. Действительно, минимальный аннулятор такого вектора делит пару взаимно простых полиномов и, следовательно, равен 1, так что 1 аннулирует вектор, и сам вектор равен нулю. Предложение 6. Если вектор г аннулируется полиномом g(t)= §i(t)§2(t)> разлагающимся в произведение двух взаимно простых полиномов gi{t) и gz(t), то вектор можно представить в виде суммы двух векторов, один из которых аннулируется полино- полиномом gi(t), другой — полиномом g2(t). Доказательство. В силу взаимной простоты gi и g2 най- найдутся такие полиномы и и v, что ug2-\- vg<. = l. Тогда u(st)g3(&) + v{s4-)gi{si) =8, и z = Sz = u(si)g2{s4-)z + + v(st-)g\(s4-)z = Z\ + z2. Вектор z{ = u(s4-)g2(si')z аннули- аннулируется полиномом gi(t), ибо g\(s4-)z\= g\(si')u{s4')g2{s4-)z = = u{s4-)gl{s4-)g2{si')z = Q. Аналогично, вектор г2 = v\s4-)gi{s4-)z аннулируется полиномом @
324 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII Предложение 7. Если вектор z аннулируется полиномом g{) 8\(t) ••¦ gk(t) при попарно взаимно простых сомножите- сомножителях gi, ..., gk, то г представляется в виде суммы k векторов, аннулирующихся, соответственно, полиномами gu ..., gk. Доказывается тривиальным применением метода математиче- математической индукции, на основании предложения 6. Предложение 8. Пусть минимальный полином оператора $$¦ {на всем пространстве) разлагается в произведение g(t) — = &i@ '•• §t(t) попарно взаимно простых полиномов. Тогда пространство однозначно разлагается в прямую сумму инвариант- инвариантных подпространств Pi, ..., Ра. на которых оператор s& имеет ми- минимальные полиномы g\, .. -, gk. Доказательство. Обозначим через Р,- множество всех век- векторов, аннулируемых полиномом g;, иными словами, P,=kergi(s&). Тогда Pi + ... + Pk = S, ибо любой вектор из S аннулируется полиномом g(t) и, в силу предложения 7, представляется в виде суммы векторов из Рь ..., Рк. Сумма Р\ -f- ... + Рк прямая, ибо если вектор г принадлежит Р, и сумме Р\ + ... + Pt-i + Лч-i + • • • ... + Pk остальных слагаемых подпространств, то z аннулируется парой взаимно простых полиномов gi{t) и g\{t) ... gi-\{t)gi+\{t) ... ... gk(t) и, следовательно, равен 0. Минимальный полином опера- оператора s? на Pi есть gi(t) или его делитель, но собственным делите- делителем не может быть, ибо g = gi ... gk есть наименьшее общее кратное минимальных полиномов оператора М- на Р,. Однозначность разложения следует из того, что Рг есть мно- множество всех векторов, аннулируемых полиномом gi. Предложение доказано полностью. Из предложения 8 сразу вытекает справедливость следующей теоремы: Теорема 9. Пространство, в котором действует оператор, разлагается в прямую сумму примарных подпространств. Достаточно применить предложение 8 к каноническому разло- разложению g- = cpmi ... cpmfe минимального полинома g на неприводи- неприводимые множители. Подпространство, состоящее из всех векторов, аннулируемых полиномом ф^«, назовем полным примарным подпространством, соответствующим примарному делителю ср; полинома g. 8. Разложение примарного пространства в прямую сумму цик- циклических примарных подпространств. Теорема 10. Примарное пространство может быть представ- представлено в виде прямой суммы циклических примарных подпро- подпространств. Доказательство. Применим метод математической индук- индукции по размерности пространства. За базу для индукции можно принять примарные циклические пространства. Сделаем индуктив- индуктивное предположение о том, что для примарных пространств, раз-
§ 51 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕКТОРНОМ ПРОСТРАНСТВЕ 325 мерность которых меньше размерности рассматриваемого про- пространства 5, теорема верна. Пусть минимальный полином равен фт. Тогда все элементы пространства аннулируются делителями этого полинома, т. е. сте- степенями ф с показателями, не превосходящими т. При этом най- найдется элемент, аннулируемый полиномом фт и не аннулируемый полиномом фт~', иначе все векторы аннулировались бы полино- полиномом ф™-1, что противоречит минимальности полинома фт. Пусть U\ — такой вектор и Р| — циклическое подпространство, порожден- порожденное вектором «ь Если Pi = 5, то теорема для пространства S доказана. Пусть Р\ФБ. Рассмотрим факторпространство S/Pi. Его векторы, очевидно, аннулируются полиномом фт, так что /P примарно и имеет размерность, меньшую чем 5. Поэтому к можно применить индуктивное предположение. Пусть S/PX = P2® ... ®Pk (черточки сверху букв обозначают, как обычно, что рассматри- рассматриваются объекты, составляющие факторпростр_анство), п2, ..., пк — векторы из S/P\, порождающие Р2, ..., Р*, и фт2, ..., ф* — аннуляторы векторов п2, ..., ы*. Ясно, что mi ^ т при всех /. По- Покажем, что в классах п2, ¦ • •, «•* можно найти элементы и2, ..., «*, минимальными аннуляторами которых будут те же ц>тг, ..., фт*. Действительно, пусть и'г — какой-либо вектор из щ. Тогда f^UjSP,, так что ц)тги'2 = Р (sf) щ, где F — некоторый полином. Но фт аннулирует все векторы в S, так что <рти'2 = фт-т2фт*«2 = = <pm-m*(sP) F {sf)ux =0. Следовательно, полином tpm-'n?F делится на фт, и поэтому F делится на у-. Пусть F — ymFx, так что <pm'(^)w'2 = Vm'(^)fi(^)«i, откуда фтг(^)«2 = 0 при м2 = ы'2 — — Fy{s4)uy Ясно, что ы2 = г4> Так что и2^п2. Заметим, что полиномы аннулируют векторы и2 и п2 одновременно, так как их минимальные аннуляторы совпадают. Аналогичным образом выбираются Мз, ..., ик. Пусть Р2, ..., Рк — циклические подпро- подпространства, порожденные векторами ы2, ..., ы*. Так как F(j/)w2e '^F{s4-)u2 и если F\(s4-)u2 = F2{s4-)u2, то F\{s4-)ii2 = F2(s4-)u2 и обратно (здесь F, F\, F2 — любые полиномы), векторы простран- пространства Р2 входят по одному во все классы, составляющие Р2, и ну- нулевой класс представляет нулевой вектор. Аналогичным образом обстоит дело с пространствами Р3, ..., Рк. Сумма пространств Р\-\-Р2-\- ... + Ph равна пространству 5, ¦ибо любой вектор из S сравним по Р, с вектором из Р2 + ... + Рк- Сумма эта прямая, ибо если г, + z2 + ... + г* == 0 при Zt e Pi, то 22 + ... + г* = 0, откуда г2, .... гк равны нулю, ибо S/Pi ^сть прямая сумма Р% ..., Р*. Но тогда z2 = ... = Zk = 0 и, на- йонец, z\ = 0. Теорема доказана. 9. Модули над кольцом главных идеалов. Читатель, вероятно, обратил внимание на сходство формулировок теорем 9 и 10 и их
326 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII аоказательств с теоремами теории конечных абелевых групп — теоремой о разложении конечной абелевой группы в прямую сумму примарных и теоремой о разложении примарной абелевой группы в прямую сумму примарных циклических подгрупп. Обе эти теории можно рассматривать как частные случаи более общей теории конечно порожденных Л-периодических модулей над коль- кольцом главных идеалов Л. Дадим некоторые относящиеся сюда определения. Пусть Л — ассоциативное коммутативное кольцо с единицей. Модулем М над кольцом Л называется абелева группа, для элементов которой определено умножение на элементы Л, удовлетворяющее есте- естественным требованиям: (а, + а2) х = щх + а2х, Здесь а, щ, «геЛи х\, Х2, хеМ. Модуль называется конечно порожденным, если существует ко- конечное множество х\, ..., Xk^-M такое, что все элементы из М представляются в виде aiXi + • • • + «Л при аи ..., a* e Л. Модуль называется Л-периодическим, если для каждого хеМ существует такое аеЛ, что ах = 0. Каждый элемент а, обла- обладающий этим свойством, называется аннулятором элемента х. Мно- Множество аннуляторов образует идеал кольца Л и, если Л есть кольцо главных идеалов, идеал аннуляторов оказывается главным и порождающий его элемент играет роль минимального аннуля- тора — всякий другой аннулятор на него делится. Далее, сущест- существует аннулятор всего модуля, например произведение аннулято- аннуляторов элементов хи ..., хк, порождающих М. Аннуляторы всего М снова образуют главный идеал, так что найдется минимальный в смысле делимости..аннулятор, играющий роль минимального по- полинома. Модуль называется примарным, если он аннулируется степенью простого элемента кольца Л. Ввиду того, что в кольце главных идеалов существует линейное представление наибольшего общего делителя, доказываются аналоги предложений 6, 7, 8 и теорема 9. Модуль называется циклическим, если он порождается одним элементом. Аналог теоремы 10 о разложении примарного модуля в прямую сумму примарных циклических доказывается так же, как сама теорема 10, может только представить некоторое за- затруднение выбор объектов, по которым проводится индукция. Конечные абелевы группы представляют собой конечно порож- порожденные периодические модули для кольца Z целых чисел. Про- Пространство с оператором s4- можно рассматривать, как конечно по- порожденный периодический модуль над кольцом полиномов K[t]t
$ 5] ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕКТОРНОМ ПРОСТРАНСТВЕ 327 с «умножением» вектора на F(t) по правилу {F(t))x = F{s?-)x. Как кольцо Z, так и кольцо K[t] являются кольцами главных идеалов. 10. Некоторые следствия. Предложение 11. Характеристический полином оператора на примарном пространстве равен степени соответствующего не- неприводимого полинома с показателем, равным сумме' показателей в минимальных полиномах для циклических слагаемых. Действительно, характеристический полином на прямой сумме инвариантных подпространств равен произведению характеристи- характеристических полиномов на этих подпространствах. Примарное простран- пространство разлагается в прямую сумму циклических подпространств, и на каждом циклическом подпространстве характеристический по- полином равен минимальному. Минимальный полином оператора на каждом примарном циклическом слагаемом есть степень неприво- неприводимого полинома, именно того, степенью которого является мини- минимальный полином примерного пространства. Предложение 12. Пусть S — пространство с оператором. s& и фт1ф™2 ... фт* — каноническое разложение характеристического полинома зФ. Тогда примарные сомножители фтц ф"*2, ..., фт* I ? ft равны характеристическим полиномам оператора s& на полных примарных прямых слагаемых. Действительно, характеристический полином оператора 5 на всем пространстве равен произведению характеристических поли- полиномов на полных примарных прямых слагаемых. Эти полиномы равны степеням неприводимых полиномов, различных для различ- различных прямых слагаемых. Следовательно, произведение этих харак- характеристических полиномов есть каноническое разложение характе- характеристического полинома на всем пространстве. Предложение 13. Инвариантные подпространства примар- ного циклического пространства S с характеристическим полино- полиномом фт суть q>S, q>2S, ..., фт~'5, составляющие убывающую це- цепочку SS 2S э ... r> qm-lS г> фт5 = 0. Доказательство. Пусть и — вектор, порождающий S. Тогда все векторы из 5 имеют вид F(s4-)u, где F(t)—полиномы из K[t]. Пусть Р — инвариантное подпространство пространства S я v = F\{s4-)u — такой вектор из Р, для которого полином F\(t) делится на возможно меньшую степень полинома ф. Пусть эта степень равна фШ|, так что Fx (t) = фт1/72@. причем F2(t) не де- делится на ф. Полином F2@ взаимно прост с фт, так что существуют такие полиномы p(t) и q(t), что F2P + ymq = 1. Тогда p(s&)v =» = р {si)Fx (si) и = р (si) qm^si-)F2{s4)u = q>m<(s4)(% — q(s4)ym(s4))u=>* .= фШ1 ($?) и, ибо фт (s&) и = 0. t; Следовательно, q>m'(s&)ii принадлежит пространству Р и по- порождает его, ибо полиномы F(t) для элементов из Р делятся на
328 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII Фт'. Таким образом, P — cpmi(A)S при некотором т\. Включения 5 id ф5 гэ q>2S id ... гэ ym-lS :э <pmS = 0 тривиальны в силу инва- инвариантности всех фш'(ЛM. Предложение 14. Примарное циклическое пространство неразложимо в сумму правильных инвариантных подпространств. Действительно, если Pi и Ро — два инвариантных подпростран- подпространства, то одно из них содержится в другом, пусть Р2 cz Pi и Р2 + Р, = Р, Ф S. Таким образом, разложение пространства в прямую сумму примарных циклических подпространств окончательное, получен- полученные прямые слагаемые уже не разлагаются в прямую сумму инва- инвариантных подпространств. 11. Каноническая форма матрицы оператора. Как мы видели выше, для упрощения матрицы оператора целесообразно разло- разложить пространство в прямую сумму инвариантных подпространств и взять в качестве базиса объединение базисов прямых слагае- слагаемых. Тогда матрица примет блочно-диагональный вид с блоками,, равными матрицам ограничений оператора на прямые слагаемые. В качестве прямых слагаемых следует взять примарные цикли- циклические подпространства. Если в примарном циклическом простран- пространстве с минимальным полиномом фт, где ф — неприводимый поли- полином степени k, взять в качестве базиса и, si-u, J&2u, ..., s^mk~lur где и — порождающий пространство вектор, мы получим в ка- качестве матрицы оператора матрицу, сопровождающую полином" Фт. Если это сделать в каждом примарном циклическом, слагае- слагаемом, матрица оператора станет блочно-диагональной, состоящей из полиномов, сопровождающих минимальные полиномы примар- примарных циклических слагаемых. Эту форму матрицы оператора на- назовем грубой канонической формой. Более полно отражает строение примарного циклического про- пространства форма матрицы в базисе: е\ = и, е2 — Если ?@=/ft + ai/*~'+ ... -fa*, то a2ek-i — .. • — akeu — ... — akek+\, — —a\emk — a2emh-\ и s4-ei = ?;+i при i, не делящемся на k. В этом базисе матрица оператора si состоит из диагональных блоков, каждый из которых равен сопровождающей полином ф< матрице, «связанных» единичками, примыкающими снизу и слева
¦§ 5] ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕКТОРНОМ ПРОСТРАНСТВЕ 329 к соседним блокам. (Эти единички возникают из первых слагае- слагаемых в выражениях зФвк, si-eik, ..., s€eim-X)k через базис.) Если осуществить такой выбор базиса во всех примарных ци- циклических пространствах, мы получим форму матрицы, которую назовем общей канонической формой. Она лучше грубой формы тем, что в ней участвуют сопровождающие матрицы для самих неприводимых полиномов, а не для их степеней. Общая каноническая форма принимает особо простой вид в случае, если характеристический полином разлагается на линей- линейные множители, так что минимальные полиномы примарных ци- циклических слагаемых имеют вид (t — к)т. В этом случае сопровождающая матрица для полинома t — X есть матрица первого порядка I, и каноническая матрица на при- марном циклическом пространстве имеет вид Я 0 0 ... О О 1 Я О ... О О О 1 Я ... О О О 0 0 ... 1 Я Такая матрица называется каноническим блоком Жордана. Матри- Матрица оператора на всем пространстве примет вид блочно-диагональ- ной матрицы/ составленной из блоков Жордана. Такая матрица называется канонической матрицей Жордана. Диагональные элементы канонических блоков являются кор- корнями характеристического полинома, и каждый корень может вхо- входить в несколько блоков. Ясно, что кратность корня характери- характеристического полинома равна сумме порядков блоков Жордана с этим корнем на диагонали. В частности, если характеристический полином не имеет крат- кратных корней, то порядки всех блоков Жордана равны 1 и канони- каноническая матрица оператора принимает особо простой вид diag(^i, Х2, ..., Хп), где Хи Х2, ..., Хп — корни характеристиче- характеристического полинома. Вместо общей канонической формы матрицы оператора на при- марном циклическом пространстве иногда оказывается удобной так называемая блочно-жорданова форма. В этой форме по диа- диагонали расположены блоки из сопровождающей матрицы непри- неприводимого полинома, но блоки «связаны» не единичками, как в об- общей форме, а единичными матрицами, например, матрица имеет вид: А Можно доказать, что если неприводимый полином ф сепарабе- лен, т. е. не имеет кратных корней ни в каком расширении основ- основного поля, то матрица оператора на примарном циклическом про-
1 0 0 0 1 1 0 0 1 0 У 0 0 1 0 0 1 0 0 0 1 0 У 0 0 0 У 0 330 ВЕКТОРНЫЕ ПРОСТРАНСТВА (ГЛ. XII странстве с минимальным полиномом фт может быть приведена к блочно-жордановой форме. Мы не будем это доказывать в столь общей ситуации. Но сепарабельность ф здесь существенна. Чтобы это продемонстрировать, рассмотрим пример. Пусть /(o = GFB) и /( = /Со(г/). Полином cp(t) = t2— y^K[t], очевидно, неприводим в поле К, так как если бы он был приводим, то раскладывался бы и в кольце полиномов Ко[у, t], что не имеет места. Он не сепара- белен, ибо его производная равна нулю. Его сопровождающая ( 0 и \ г, матрица есть I , 0 I. В циклическом пространстве с мини- минимальным полиномом ф2 общая каноническая форма есть 0 у 0 0 а блочно-жорданова Нетрудно проверить, что над полем К не существует преобра- преобразования подобия, переводящего Л в В. С этой целью следует рас- рассмотреть систему шестнадцати линейных однородных уравнений с шестнадцатью неизвестными, именно, элементами матрицы С, такой что АС = СВ. Из рассмотрения этой системы нетрудно получить (учитывая, что характеристика поля К равна 2), что первые две строки матрицы С состоят из нулей, так что невырожденной матрицы, удовлетво- удовлетворяющей уравнению АС = СВ, не существует. Конечно, неприводимые несепарабельные полиномы могут су- существовать только над полями с ненулевой характеристикой. Для полей характеристики 0, в частности для числовых полей, непри- неприводимых несепарабельных полиномов не существует. 12. Оператор проектирования. Пусть S = Р © Q- Тогда любой вектор zeS однозначно представляется в виде z = х + у при хе Р и у е Q. Вектор х называется проекцией вектора г на Р параллельно Q, вектор у, соответственно, — проекцией вектора z на Q параллельно Р. Если z = cxz\ + c2z2, z — x-j-y, z\— x, + yu z2 = x2 + y2, то z = (ciXi -f c2x2) + (ci«/i -\-c2y2), так что x = = C\X\ + c2x2. Переход от вектора z к вектору х называется опе- оператором проектирования или проектором. Если z = C\Z\ + c2z2, то х = CiXi + с2х2. Поэтому оператор проектирования линеен. Далее, если х е Р, то его разложение на векторы из Р и Q есть х = х + 0. Следовательно, оператор проектирования действует на векторы из Р как единичный оператор, а на векторы из Q — как нулевой.
S 51 ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ВЕКТОРНОМ ПРОСТРАНСТВЕ 331 Пусть si — оператор проектирования S на Р параллельно Q. Тогда при любом г е 5 вектор si-z принадлежит Р, так что s?(s4-z) = s?z. Таким.образом, оператор s€2— s4- аннулирует все векторы из S, и тем самым si-2— si = 0, т. е. sP-— s&. Оператор si, для которого s^2 = s4-, называется идемпотент- ным. Таким образом, оператор проектирования идемпотентен. Справедливо и обратное, любой идемпотентный оператор, от- отличный от 0 и <В, есть оператор проектирования. Действительно, пусть s€2 = s&. Обозначим s€S = P и {8 — s?)S = Q. Для лю- любого jeS верно равенство г = slz + {<$ — s4-)z — x-\-y при хеР, уеQ. Следовательно, 5 = Р + Q. Остается доказать, что эта сумма прямая. Пусть yePf)Q- Тогда v = s€z\ и у== = (&—s€)z% при некоторых z\, Z2^S. Из первого представления следует, что si-v = s4-2zi = s4-z\ = и, из второго, что .s/u = = (^ — si-2)zi — 0- Таким образом, и = 0 и 5 = P©Q. Следова- Следовательно, из равенства z = х + У при х = s?z бР и у = (<!Г — л^)г е eQ следует, что x — $4-z есть проекция вектора г на Р парал- параллельно Q. В базисе, составленном из базисов Р и Q, оператор проекти- проектирования имеет диагональную матрицу, ибо все векторы из Р яв- являются собственными векторами для собственного значения 1, а все векторы из Q — собственные векторы для собственного значе- значения 0. Поэтому матрица имеет вид ( Ек 0 N V 0 0 )' где k = dim P. 13. Полуобратные линейные отображения. Пусть s4-—любое отображение пространства 5 в пространство Т. Положим ker^ = = Р и обозначим через So какое-либо подпространство, допол- дополняющее Р до S, т. е. такое, что Р + 50 = S. Положим То = s?S, и пусть Q — какое-либо подпространство, дополняющее То до Т, т. е. То + Q = Т. Тогда s4> отображает 50 на То, ибо векторы из Р отображаются на нулевой вектор. Ядро этого отображения состоит только из нулевого вектора, ибо So и Р пересекаются только по 0. Поэтому ограничение s&o оператора 5Ф на So имеет обратный оператор s4-^x, определенный на подпространстве То пространства Т. Пусть ^(-1) есть продолжение «s/,71 на все пространство Т, отображающее векторы из Q в нулевой вектор пространства S. Ясно, что j/(-'> есть линейный оператор, действующий из Т в S. Он называется полуобратным для s€. Разумеется, .s#<-!> зависит от выбора подпространств So и Q. Для ^(-1) подпространство Q является ядром и So — образом. Подпространство То составляет прямую сумму, равную Т, с ядром Q оператора J^(~n, и подпространство Р дополняет образ So опе- оператора ?Ф(-1) до пространства S. Таким образом, поменяв ролями
332 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XI! 5 и Т, So и То, Р и Q, мы можем построить (j/(-")<-1). Ясно, что (^(D)(i) ^ () Оператор st^-^st- отображает 5 в 5. Если z = x+f/eS при хе50, уеР, то s4-z — s4-x = s4-oxбТои зФ-~Х)з4-г = M-^sb^x = х. Таким образом, s4-^~l)s4- отображает любой вектор г из S на его составляющую х в разложении г = х + y,~x&S0, у е Р. Оператор «s/''.?/ проектирует векторы из 5 на подпространство So парал- параллельно подпространству Р. Соответственно, оператор s4-s4-(~l), отображающий Г в Г, проек- проектирует векторы из Г на подпространство То параллельно Q. Полуобратный оператор ^~1) обладает свойством s&s4-(-X)s4- = = s?. Действительно, если г = х + у, х е So, у е Р, то s4^~X)Mz = = х и s&s?-ls?z = <s/x = j/2, ибо х и г отличаются слагаемым из ядра <s/. Это верно для любого ге5, следовательно,stf-sfi^—^. Соответственно, s4-{ - 1Ыя?{ ~ " = $Ф{~ ". Предложение 15. ?сш оператор si- из S в Т и оператор 9$ из Т в S связаны соотношениями s&Ms4- = s& и &S4-& = SB, то SB = = s#.(-u no отношению к некоторым прямым разложениям про- пространств S и Т. Доказательство. Из si-^s^ = М- следует, что {ШзФ&бФ = = $?Ф, т. е. ЗИзФ есть идемпотентный оператор из S в S. Следова- Следовательно, он является оператором проектирования. Обозначим через So подпространство, на которое S$s4- проектирует S, и через Р— подпространство, параллельно которому происходит проектирова- проектирование. Проверим, что Р = ker s&. Действительно, если х е Р, то <%$Фх = 0 и sbffisi'X = s?x = 0, так что Р s ker .5$. Обратное вклю- включение тривиально. Из того же соотношения s?S8s& = si- заключаем, что s&SSs&SB — s&&, т. е. sl-Ш — идемпотентный операториз Г в Г, т. е. оператор проектирования. Введем обозначения Го и Q для образа и ядра Ы-9%. Операторы s4- и && осуществляют взаимно обратные отображения подпространств So и Го, ибо $s& действует на So как единичный оператор, s?<% действует таким же образом на Го. Остается доказать, что Q аннулируется оператором Ш. Здесь используется соотношение 38s?& = Ш. Действительно, при i/eQ будет SSy = @(s?&)y = 0, ибо s4-®y = 0. Для операторов, действующих из S в S, тоже можно опреде- определить полуобратные операторы, исходя из двух, вообще говоря, различных разложений S в прямую сумму подпространств,,— одно разложение S = Р + So, другое S = s&S 4- Q- Имеется ситуация, когда эти разложения можно взять одина- одинаковыми. Именно, если подпространства S&S и Р = кег^ пересе- пересекаются только по нулевому вектору. Это значит, что если slz Ф 0, то si> {.s4-z) = s4?z Ф 0. Тогда и s?3z, и s4-Az, и т. д. — все отличны от нулевого вектора. Таким образом, поставленному ограничению можно дать такую формулировку: из s4<kz = 0 при k ^ 2 должно следовать, что si-z = 0. Взяв в этом случае разложение S =
$ 6] ОПЕРАТОРЫ В ВЕКТОРНЫХ ПРОСТРАНСТВАХ НАД С 333 — s?S(BP, т. е. положив 50 = st-S и Q = P, придем к полуобрат- полуобратному оператору s4-(-X), для которого ?ФзФ{~Х) и M(-l)s? равны, именно, равны оператору проектирования на s&S параллельно Р. § 6. Операторы в векторных пространствах над полем С комплексных чисел Над полем комплексных чисел любой полином разлагается на линейные множители. Поэтому, в силу последних пунктов преды- предыдущего параграфа, для любого оператора найдется базис, в кото- котором матрица оператора имеет каноническую жорданову форму и, в частности, если характеристический полином оператора не имеет кратных корней, каноническая форма диагональна. В настоящем параграфе повторим эти результаты, войдя в не- некоторые подробности, представляющие самостоятельный интерес. 1. Собственные векторы оператора. Ненулевой вектор х назы- называется собственным вектором для оператора si, если имеет место равенство s4-x = Xx при некотором Хе.С Это число носит назва- название собственного значения оператора. Предложение 1. Собственными значениями оператора яв- являются корни характеристического полинома и только они. Пусть в пространстве выбран базис, А= ан ••• аы \ I— ап\ ¦¦¦ апп* матрица оператора s? в этом базисе и {х\, Х2, ..., хп)т — столбец из координат вектора х. В координатной ферме уравнение s4-x = Кх запишется в виде системы уравнений ... -f alnxn = Ъсь - a22x2 -\~ .,. —p a2n%n — Xx2i anlX\ \ an2X2 "T" • • • "T annXn == ЛЛП или, что то же самое, (Я — аи) л;, — а12х2 — ... — а,„хге = О, <h.\x\ + (^ а2й) *2 — • • • — ^гп^л — О — anlxi — ал2^2— ¦¦• +(Л- — ап«)^п = 0. Для того чтобы эта система имела ненулевые решения относи- относительно х\, х2, ..., х„, необходимо и достаточно равенство пулю ее определителя: ¦К-а. 22 Х-а пп = 0,
334 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII а это и значит, что X есть корень характеристического полинома det(^? — А) оператора s?. Предложение 2. Линейная комбинация собственных векто- векторов, принадлежащих одному и тому же собственному значению, есть собственный вектор, принадлежащий тому же собственному значению, или нулевой вектор. Действительно, если эФх = Хх и $?у — Ху, то s4-(c\x + с2у) = = сх$Фх-\- c2s?y = X(ciX+ c2y), так что если СгХ-\-с2уф0, то С\Х -J- с2у — собственный вектор. Таким образом, все собственные векторы, принадлежащие соб- собственному значению X, вместе с нулевым вектором образуют под- подпространство— подпространство собственных векторов. Предложение 3. Собственные векторы, принадлежащие попарно различным собственным значениям, линейно независимы. Проведем индукцию по числу векторов. Для одного вектора предложение верно, ибо собственный вектор ненулевой. Пусть предложение верно для совокупности собственных векторов, число которых меньше k, и пусть и\, и2, ..., «* — совокупность собствен- собственных векторов, принадлежащих попарно различным собственным значениям A,i, Х2, ..., Xk. Допустим, что -f C2U2 + ... + CkUk = 0. Применив к обеим частям этого равенства оператор, получим Умножим первую зависимость на %k и вычтем из второй. Получим откуда, в силу индуктивного предположения, С\ {%\ — Xk) = с2 (Х2 — Xk) = •.. —Ck-i (Хь-i — Хк) = 0. По условию все разности Х\ — Xk, ...» Xk~\ — %h отличны от нуля. Следовательно, С\ = с2 = ... = Си-\ = 0 и CkUh = 0. Вектор ии ненулевой. Значит, и с* = 0. Предложение 4. Если характеристический полином опера- оператора s& не имеет кратных корней, то существует базис простран- пространства, в котором матрица оператора диагональна. Действительно, в этом случае, в силу предложения 3, сущест- существует базис и\, и2, ..., ип из собственных векторов, и в этом ба- базисе матрица оператора Ы- диагональна, в силу равенств s4-Ui = = X\U\, S4-U2 = X2U2, . . ., S4-Un = XnUn. Предложение 5. Для того чтобы существовал базис, диа- гонализирующий матрицу оператора si-, необходимо и достаточно, чтобы размерности подпространств собственных векторов были равны кратностям соответствующих собственных значений как корней характеристического полинома.
$ 6) ОПЕРАТОРЫ В ВЕКТОРНЫХ ПРОСТРАНСТВАХ НАД С .335 Доказательство. Пусть размерность подпространства собственных векторов, принадлежащих собственному значению К, равна k. Ясно, что это подпространство инвариантно, матрица опе- оператора на нем равна %Ек и характеристический полином оператора si- на этом подпространстве равен (t — Я)*. Ввиду того, что харак- характеристический полином оператора М на всем пространстве де- делится на характеристический полином si- на любом инвариантном подпространстве, k не превосходит кратности Я, как корня харак- характеристического полинома. Ясно, что базис, в котором оператор <s/ имеет диагональную форму, состоит из собственных векторов и на диагонали нахо- находятся соответствующие собственные значения. Кратность корня характеристического полинома диагональной матрицы равна крат- кратности вхождения этого корня на диагонали. Поэтому число базис- базисных собственных векторов, отвечающих собственному значению Я,, равно кратности к как корня характеристического полинома. Сле- Следовательно размерность пространства собственных векторов, со- соответствующих к, не меньше кратности X как корня характеристи- характеристического полинома, но и не больше, как было установлено выше. Предложение 6. Любое собственное значение оператора является корнем его минимального полинома. Д о к а з а т е лъство. Пусть и — собственный вектор операто- оператора &Ф, принадлежащий собственному значению к. Тогда минималь- минимальным аннулятором вектора и является линейный двучлен t — к. Минимальный полином оператора аннулирует все векторы, так что делится на все минимальные аннуляторы, в частности, на t—X. Следовательно, к есть корень минимального полинома, что и тре- бовалесь доказать. Из предложения 6 следует, что характеристический полином оператора и его минимальный полином разлагаются на одинако- одинаковые линейные множители, различны могут быть лишь их крат- кратности. 2. Корневые векторы. Вектор и называется корневым для опе- оператора s?, если при некотором X выполняется равенство (.s/ — XS)'""« = 0, т. е. если вектор и аннулируется полиномом (t — k)m. Наименьший показатель m называется высотой корне- корневого вектора. Собственный вектор — это корневой вектор высоты 1. Число к, участвующее в определении корневого вектора, является собственным значением. Действительно, для корневого вектора и высоты m будет v = (s&— Ш)т~1иФ0, но (.s/ — kS)v==Q, т. е. v есть собственный вектор, принадлежащий собственному значе- значению Я,. Высота корневого вектора, соответствующего собственному значению Я,, не превосходит кратности Я, как корня минимального полинома оператора. Эта верхняя грань достигается, т. е. сущест- существует корневой вектор, высота которого равна кратности соответ- соответствующего собственного значения как корня минимального поли-
336 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII нома. Действительно, пусть минимальный полином оператора si> равен (t — X)mF(t), где Р(Х)Ф0. Полином {t — X)m-{F{t) анну- аннулирует не все векторы, так что найдется вектор v, не аннулируе- аннулируемый этим полиномом. Тогда вектор и = F{s?)v не аннулируется полиномом (t — Х)т~\ но аннулируется полиномом (t — Х)т, т. е. является корневым вектором высоты т. Предложение 7. Линейная комбинация корневых векторов, соответствующих одному и тому же собственному значению X, является корневым вектором, соответствующим тому же собствен- ному значению. Доказательство. Пусть и\ и иг — два корневых вектора, соответствующих собственному значению X, и пусть ni\ и т% — их высоты, т.\ ^ т.2. Тогда полином (/ — X)mi аннулирует оба век- вектора, а также любую их линейную комбинацию. Таким образом, корневые векторы, соответствующие данному собственному значению, образуют подпространство, называемое корневым подпространством. Предложение 8. Корневые векторы, соответствующие по- попарно различным собственным значениям, линейно независимы. Доказательство. Пусть и\, ..., uk—корневые векторы для оператора «s/, соответствующие собственным значениям Х\, ... ..., Xh, Xi ф Xj, и пусть mi, •¦¦, ttik — их высоты. Допустим, что + . . . + CiUi + • • . + CkUk = 0. Рассмотрим полином U @ = {t- я,Г ... (/ - а,,I"'-1... (/ - xk)mK Применим оператор ft(s&) к обеим частям линейной зависимости. Этот оператор аннулирует все корневые векторы, кроме ui, ибо полином fi(t) делится на аннуляторы этих векторов. Но он не аннулирует ш, ибо fi(t) не делится на минимальный аннулятор этого вектора. Получим Cifi(s&)Ui = 0, откуда с,-= 0, ибо /,-(«я^)«,-^= Ф 0. Это верно для всех t = 1, ..., k. Теорема 9. Векторное пространство S над С, в котором действует оператор si, разлагается в прямую сумму корневых под- подпространств. ' Доказательство. То, что сумма корневых подпространств есть прямая сумма, следует из линейной независимости векторов из различных корневых подпространств. То, что эта сумма запол- заполняет все пространство S, следует из предложения 8 предыдущего параграфа, ибо полиномы (/ — Xi)m\ ..., (t — Xk)mk< произведением которых является минимальный полином, попарно взаимно про- просты. Теорема доказана. Теорема 9 есть, конечно, частный случай теоремы 9 предыду- предыдущего параграфа.
§ 6) ОПЕРАТОРЫ В ВЕКТОРНЫХ ПРОСТРАНСТВАХ НАД С 337 3. Нильпотентный оператор. Оператор $1 называется нильпо- тентным, если некоторая его степень есть нулевой оператор. Наи- Наименьший показатель степени, обладающей этим свойством, назы- называется показателем нильпотентности. Таким образом, если m есть показатель нильпотентности оператора 3&, то $т = О, но 38т-1 ф 0. Ясно, что минимальный полином для нильпотентного оператора показателя т есть tm. Нильпотентный оператор имеет единствен- единственное собственное значение 0. Все векторы пространства являются корневыми. Высоты их не превосходят показателя нильпотент- нильпотентности, и существуют векторы, высота которых равна показателю нильпотентности. Для дальнейшего удобно считать, что нулевой вектор имеет высоту, равную нулю. Введем в рассмотрение цепочку вложенных друг в друга инва- инвариантных подпространств: {0} = Qo = Q, = ... = Q, <= ... c=Qm==s, где подпространство Q,, /= 1, ..., т, состоит из векторов, высоты которых не превосходят /. По построению, Q,- = ker &'¦ Предложение 10. Пусть j ^ 2. Если векторы иь ..., vk при- принадлежат Q, и линейно независимы относительно Q/_b то векторы f%v\, ..., fSvk принадлежат Q/_i и линейно независимы относи- относительно Q/-2- Доказательство. Если vi e Q/, то Mhi = 0, так что ^'-1(^v'i) = Q, т. е. 3fvi<=Qj-i. Допустим, что 9Svu •••. $vk свя- связаны зависимостью Это значит, что ^''-2(ci^ui-f ... + ck&vk) — 0, так что S&'-1 (cm + ... + CkVk) = 0, т. е. Следовательно, с\ = ... = Си = 0, в силу линейной независимо- независимости векторов vu ..., Vk относительно Q,_i. Это и требовалось до- доказать. Построим теперь базис S следующим образом. Пусть и1Ь ... ..., v\kl — базис Qm относительно Qm_i. Тогда, в силу предложе- предложения 10, векторы Jfoii, ..., 3Sv\k, принадлежат Qm-y и линейрю не- независимы относительно Qm-2. Дополним эту совокупность векто- векторов до базиса Qm-i относительно Qm_2. Пусть v2\, ..., V2k,—до- V2k,—дополняющая совокупность векторов. Тогда 3!2vn,.. .,<%2vlkl, $Jv2\, ... • ••, SlViht принадлежат Qm-2 и линейно независимы относи- относительно Qm-ъ- Дополним их совокупность до базиса Qm_2 относи- относительно Qm-з- Продолжив этот процесс до построения базиса Qb получим следующую совокупность векторов:
338 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII Qm Qm-1 Qm-2 1 "• "I», Я'г„ ... &vlki °21 ¦•• D2ft2 ¦ *21 ••• Ч ят-2. "u, ит-3„ ят-3, ит-I. 1*1 ят-2. ит-2. *, (Слева мы выписали названия подпространств, для которых каж- каждая строка векторов образует базис относительно подпространства с меньшим на 1 индексом.) Выписанная совокупность векторов составляет базис простран- пространства Qm = S. Действительно, векторы в нижней строке образуют базис Qi- Векторы второй строки снизу образуют базис Q2 относи- относительно Q\, так что они вместе с векторами нижней строки состав- составляют базис Q-2- После присоединения векторов третьей снизу строки получится базис фз и т. д. Разобьем теперь построенный базис на «башни», рассматри- рассматривая вместе векторы иц, &vn, ..., 3Sm~1vn и т. д., расположенные в приведенной схеме на одной вертикали. Общий вид «башни»: v, 9tv, ..., $k-lv при некотором k, причем &kv = 0. Подпростран- Подпространство, натянутое на векторы башни, является циклическим, порож- порожденным вектором, находящимся наверху башни. Все пространство 5 = Qm есть прямая сумма этих циклических подпространств. Тем самым мы вновь доказали теорему 10 из предыдущего параграфа для нилыютентного оператора. Построенный базис называется каноническим для пространства с нилытотентным оператором. Хотя в его выборе имеется некото- некоторый произвол, число башен каждой высоты вполне определяется размерностями подпространств Q\, Q2, ..., Qm- На циклическом пространстве с базисом v, SSv, ..., $k-xv (при __ о) матрица оператора 9В имеет вид 0 1 0 0 0 ... 0 ... 1 ... 0 ... 1 0 0 0 0 Такая матрица называется нильпотентным жордановым блоком. Во всем пространстве матрица нильпотентного оператора по отно- отношению к каноническому базису квазидиагональна с жордановыми .блоками вдоль диагонали. Число блоков равно числу нижних эта- этажей башен, т. е. числу линейно независимых собственных векто-
ОПЕРАТОРЫ В ВЕКТОРНЫХ ПРОСТРАНСТВАХ НАД О 339 ров. Заметим, что результаты этого пункта сохраняют силу для векторных пространств над любым полем, а не только над полем С. комплексных чисел. 4. Каноническая форма Жордана матрицы оператора. Прост- Пространство S, в котором действует оператор si, однозначно разла- разлагается в прямую сумму корневых подпространств. Взяв в про- пространстве базис, составленный посредством объединения базисов корневых подпространств, мы придем к квазидиагоналыгой ма- матрице для оператора si, диагональные блоки которой суть матрицы оператора si на корневых подпространствах. Рассмотрим корневое подпространство, соответствующее соб- собственному значению к. Оператор (si — kS)m, где т — кратность Я как корня минимального полинома, аннулирует все векторы рассматриваемого подпространства, т. е. оператор $) — si — к<§ нильпотентен на этом подпространстве. В каноническом базисе для оператора $} этот оператор имеет квазидиагональную матрицу с нильпотентными жордановыми блоками вдоль диагонали. В том же базисе оператор si = $} -\-к& будет иметь матрицу, отличающуюся от матрицы оператора ^? тем, что к нулям на главной диагонали прибавится X, ибо еди- единичному оператору & соответствует единичная матрица. Таким образом, матрица оператора на рассматриваемом корневом под- подпространстве есть квазидиагональная матрица, составленная из жордановых блоков / X 0 ... 0 0 I 1 X ... 0 0 \ о о ... 1 я, с числом к на главной диагонали. Число блоков с данным X равно числу линейно независимых собственных векторов для собствен- собственного значения к, ибо каждый собственный вектор оператора $ есть собственный вектор для оператора si, соответствующий соб- собственному значению к. Если во всех корневых подпространствах выбрать канонические Фазисы, то в их объединении оператор будет иметь квазидиаго-
340 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII нальную форму, диагональными блоками которой являются кано- канонические блоки Жордана, отвечающие всем собственным значе- значениям, т. е. каноническую форму Жордана общего вида. Тем самым мы вновь пришли к результату, полученному в конце предыдущего- параграфа из более общих соображений. На языке матриц теорема о канонической форме означает, что для квадратной матрицы А с элементами из поля jQ существует невырожденная матрица С такая, что С~1АС есть каноническая матрица Жордана. Заметим еще, что характеристические полиномы \t — %)k жор- дановых блоков называются элементарными делителями матрицы tE — А. Этот термин связан с другим подходом к рассматривае- рассматриваемому вопросу, основанным на теории матриц над кольцом полино- полиномов .СД/]. Именно, если построить наибольшие общие делители миноров порядка / матрицы tE — А, мы получим некоторые поли- полиномы g){t). Почти очевидно, что gj делится на gj-i. Их частные ft = gj/gf-i называются инвариантными делителями матрицы tE — А. Примарные множители (t — X,)* инвариантных делителей как раз и являются элементарными делителями матрицы tE — А. Мы не будем на этом останавливаться. 5. Пример. Рассмотрим з заключение параграфа один неболь- небольшой пример. Пусть А — квадратная матрица ранга 1. Ее строки пропорциональны, так что ее можно представить в виде произведе- произведения столбца B = (bub2, •-., bn)T на строку .С~(си d, ..., сп) Оба сомножителя ненулевые. Для определенности положим, что Ь]Ф0 и с =т^0. Матрицу А будем рассматривать как оператор левого умножения в пространстве столбцов. Пусть X = (хь х2, ... ..., хп)т. Тогда АХ = ВСХ = (с}х1 + с2х2 + ... +спхп)В. Поэтому X = В является собственным вектором оператора $?, принадлежащим собственному значению с\Ь\ + сф2 + • • • + с"Ьп- Далее, любой вектор с компонентами, удовлетворяющими требо- требованию CiXi + с2Х2 + ... + спХп = 0, является собственным векто- вектором при собственном значении, равном 0. Таких линейно независи- независимых векторов существует п—1- Пусть это будут Х\ X4_i. Если X = cibi + C2&2+ ..- + СьЬкфО, то векторы В, Хи ..., Хп-г составляют базис из собственных векторов, и в этом базисе ма- матрица оператора левого умножения на А принимает вид / Л 0 ... 0 I о о ... о о о ... о Если же С\Ь\ + с2&2 + ... + cnbn = 0, то вектор В попадает в пространство, натянутое на Хи ..-, Xn-i. В этом случае А2 = = ВСВС = 0, ибо СВ = 0, т. е. А нильпотентна показателя 2. В этом случае в канонический базис, кроме собственных векторов, нужно включить один корневой. В качестве корневого можно взять
S 7] ОПЕРАТОРЫ В ВЕКТОРНЫХ ПРОСТРАНСТВАХ НАД R 341' любой такой вектор X, что АХ ф 0, что будет, если с\Х\ -f- с2х2 + •.. ... -\-СпХпф§. Можно взять, в частности, Х = A, 0, ..., 0)т. Тогда АХ = С\В. Вектор схВ нужно дополнить до базиса про- пространства собственных векторов. Для того чтобы обеспечить ли- линейную независимость этих векторов с вектором С\В = (сфи ... ..., сфпI, достаточно взять дополняющие векторы Х2, ..., Хп-Х с нулевой первой компонентой и с остальными, удовлетворяющими соотношению с2х2 + ... + спхп = 0. Таких найдется п — 2 линейно независимых и не больше, ибо среди чисел с2, ..., сп имеется хотя бы одно отличное от нуля, иначе равенство C\b\ + c2b2 + ¦¦¦ ... + спЬп = 0 было бы невозможно. В выбранном базисе X, с\В, Х2, ..., -Хд-1 матрица оператора умножения на А прини- принимает вид 0 0 ... 0- 1 0 ... 0 о о ... о .0 0 ... 0 Итак, в терминах матриц, существует такая невырожденная матрица Р, что (Л 0 ... 0\ ° °.'"'.° L если А, = 6,с, + ... +Ьпспф0, О О ... 0У или 0 о ... о- 1 0 ... 0 Р"-'ЛР=| о о ... 0 |, если Ь1с1+ ... +Ьпсп=О. • • * • • .0 0 ... 0 § 7. Операторы в векторных пространствах над полем R вещественных чисел Поле вещественных чисел не алгебраически замкнуто, т. е. не каждый полином с вещественными коэффициентами имеет только вещественные корни. В частности, характеристический полином матрицы может иметь корни с ненулевой мнимой частью, и таким корням не соответствует собственный вектор в исходном простран- пространстве. Поэтому преобразование матрицы оператора к канонической форме Жордана не всегда возможно. Цель настоящего парагра- параграфа — вывести достаточно наглядную каноническую форму в этом случае. 1. Комплексификация вещественного пространства. Пусть S — векторное пространство над полем R. Погрузим его в векторное пространство 5 над полем С. следующим образом. Введем в рас- рассмотрение формальные суммы х + iy при xeS, у & S. Условимся
342 ВЕКТОРНЫЕ ПРОСТРАНСТВА [ГЛ. XII считать, что х + iy = х? + iy' в том и только в том случае, если х = ? и у —у'. Определим сложение по формуле (х + и/) + + (x' + iy') = x + x' + i(y-\-y') и умножение на комплексные числа по формуле (a -f- Ы) (х + iy) = ax~by + i(bx + ay). Легко проверить, что множество S ъсех'х + yi, xeS, y^S, удовлетво- удовлетворяет по отношению к введенным действием всем аксиомам век- векторного пространства над полем .Cj. Пространство S называется комплексификацией пространства S- Базис в\, , еп пространства S оказывается базисом и для S по отношению к полю .О. Действи- Действительно, пусть x = b\ei-\- ... +bnen, у~с\в\-\- ... + с„еп, при ¦bh CisR, тогда х + iy — (b{ + cxi)ex + ... + (bn + cni)en. Поэто- Поэтому комплексификация 5 «-мерного вещественного пространства 5 оказывается тоже «-мерной по отношению к полю .С:. Векторы из S, отождествляемые с векторами из S с нулевой второй компонентой, будем называть вещественными. Векторы z = х + iy и z = х — iy, х, y^S, будем называть комплексно со- пряженными. Легко проверить, что az = az при aeCi и z + z' — = 5 +Г. Предложение 1. Если векторы v\, ..., cseS линейно не- независимы над С:, то сопряженные векторы v\, ..., и* тоже линей- линейно независимы. Действительно, если c\V\ + ... +cfeyft = 0, то ?\V\ + ... ... + CkVk = 0, откуда 5\ ==...= Ck== 0 и, следовательно, С\ = ... . * 2. Продолжение операторов, действующих в вещественном пространстве, на комплексификацию. Пусть si- — оператор, дейст- действующий в вещественном векторном пространстве S. Продолжим его на комплексификацию 5 по формуле зФ (х -f- iy) = s&x + is&y. Покажем, что продолженный оператор останется линейным и над полем .С:- То, что он переводит сумму в сумму, очевидно, нужно только убедиться в том, что комплексный множитель можно вы- вынести за знак оператора. Это легко проверяется. Действительно, s& (ax — by) + isi (bx + ay) = as4-x — bsty -\- i(bs&x + as?y) Заметим еще, что вектор, сопряженный с s&z, при ге5 равен Предложение 2. Пусть z принадлежит комплексификации S вещественного пространства S с оператором s4-. Пусть q>(t) = t" + -f-aif*-1-f- ... + аи—полином с комплексными коэффициентами, являющийся аннулятором для вектора г. Тогда полином ф@ = = tk + a.\tk-1 -f- ... -f- ak с сопряженными коэффициентами есть аннулятор для вектора г. Действительно, переход к сопряженным в равенстве s4-*z-{- + axs4-k~xz+ ¦•• +а*г = 0 дает tk+ ^4 + 0 что и доказывает предложение.
$ 7] ОПЕРАТОРЫ В ВЕКТОРНЫХ ПРОСТРАНСТВАХ НАД R 34$ Из доказанного предложения следует, что если г — корневой вектор, соответствующий комплексному собственному значению Я,. то г — корневой вектор, соответствующий сопряженному собствен- собственному значению Я. Более того, учитывая сохранение линейной не- независимости при переходе к сопряженным векторам, мы можем за- заключить, что векторы, сопряженные с каноническим базисом в корневом подпространстве, соответствующем Я, составляют кано- канонический базис в корневом подпространстве, соответствующем Я, и каждой «башне» векторов канонического базиса для Я соответ- соответствует башня из сопряженных векторов для Я. 3. Каноническая форма оператора в вещественном простран- пространстве. Разобьем пространство S в прямую сумму корневых под- подпространств для оператора s& и затем корневые подпростран- подпространства— в прямые суммы циклических, натянутых на «башни» ка- канонического базиса. Ясно, что для каждого из вещественных соб- собственных значений канонический базис может быть взят в самом пространстве S, и этим базисам соответствуют вещественные блоки Жордана. Пусть теперь Я = а + Ы — комплексное собственное значение при ЬфО, Я — сопряженное собственное значение, Р — подпро- подпространство, натянутое на башню канонического базиса корневого' подпространства для к, Р— подпространство из сопряженных век- векторов, входящее прямым слагаемым в корневое подпространств©' для Я. Сумма подпространств Р + Р есть прямая сумма, ибо кор- корневые подпространства для различных собственных значений Я и Я пересекаются только по нулевому вектору. Пусть z\ — х\ + iyi,- г2 = Х2 + /г/2, •••, zk = Xk + п/й — базис подпространства Р. Тогда г\, ..., г* вместе с гь ..., г* составляют базис подпространства Р@Р. Базис (относительно поля С) составят также веществен- вещественные векторы хи Уи • • •, xk, yk, ибо векторы г\, z2, ..., г*, г\, zb... ..., Zk выражаются через них линейно и, обратно, Х\,у\, ..., хц,у* выражаются линейно через Z\,Z\, ..., Zk,Zk. Вещественное подпро- подпространство, натянутое на векторы хиуих2,у2, ..., xk, yu, есть пере- пересечение S и РФ Р. Выясним, как действует оператор si- на эту совокупность векторов. Вспомним, что г2 = (st- — №?)г\, г3 => = (j* — %&)г2 Zk = (M — ЯёГ)г*_, и (st — %Я)zk = 0. Пере- Перепишем эти соотношения в форме: Si-zx = Яг] + z2, si-zi = Яг2 + z3, ... ..., stzk-i = ЯгА_1 + zk, s?zk = Xzk.. Подставив Я = а -\- Ы и г/ = х; -f- iyt, получим: + is4-yx = axi — byx + i Fx, + ayx) + x2 + iy2, + Шу2 = ax2 — by7 + / {bx2 + ay2) + x3 + iy3, + i{bxk_x + ayk^) + xk + iyk, -f- is4>yk = axk — byk -f- i (bxk -f-
344 ВЕКТОРНЫЕ ПРОСТРАНСТВА ГГЛ. XII Отделив вещественные и мнимые части в этих равенствах, по- получим: = ах{ — Ьу\ + х2, = Ъхх + аух + у2, -.i = axk_x — byk_x + xk, = axk- byk, ¦ = bxk-\r ayk. Таким образом, в рассматриваемом базисе оператору $Ф соответ- соответствует матрица а Ь - b a 1 О О 1 о о о о о о 0 о а Ь — Ь а 1 О О 1 О О О О О О О О о о о о о о о о о о о о 10 а Ь О 1 ~Ь а Обозначив диагональные блоки ( _ 6 j через Я и единичную матрицу второго порядка через Е, получим блочно-жорданову форму К 0 .... о- Е к 0 Е 0 0 ... Е Мы рассмотрели одну пару сопряженных башен. Так же можно рассуждать для всех остальных, так что часть канонической ма- матрицы, соответствующей комплексно-сопряженным парам соб- собственных значений, есть квазидиагональная матрица, составлен- составленная из блочно-жордановых матриц указанного вида. Веществен- Вещественным же собственным значениям соответствуют обычные жорда- новы блоки.
ГЛАВА XIII ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА § 1. Определения и простейшие свойства 1. Скалярное произведение. В обычной геометрии на плоскости и в пространстве существеннейшую роль играют метрические по- понятия, связанные с измерением. К. ним относятся длина отрезка и угол между прямыми. В векторной терминологии это длина век- вектора и угол между векторами. Длина вектора не является линей- линейной функцией от вектора и угол между векторами не является линейной функцией от одного из векторов при фиксированном втором. Несмотря на это, из длин двух векторов и угла между ними при помощи действий, далеких от линейности, можно по- построить так называемое скалярное произведение векторов, являю- являющееся билинейной функцией от векторов, т. е. линейной по каж- каждому из векторов при фиксированном втором. Именно, скалярным произведением двух векторов называется произведение их длин и косинуса угла между ними. Билинейность почти очевидна на основании определения. Действительно, скалярное произведение векторов х я у равно длине вектора х, умноженной на величину ортогональной проекции вектора у на направление вектора х, а проекция линейной комбинации векторов на любое направление равна такой же линейной комбинации проекций. Таким образом, скалярное произведение оказывается линейной функцией от у при фиксированном х и, в силу симметрии, линейной функцией от х при фиксированном у. Тем самым скалярное произведение векто- векторов с точки зрения алгебры проще длины вектора и угла между векторами. В свою очередь, эти величины просто выражаются через скалярное произведение. Именно, квадрат длины вектора ра- равен скалярному произведению вектора на себя. Косинус угла между векторами равен частному от деления скалярного произве- произведения на произведение длин. Все сказанное дает основания при введении метрических поня- понятий в теорию многомерных вещественных пространств отталки- отталкиваться от понятия скалярного произведения. Дадим определения. Скалярным произведением (х, у) векторов вещественного век- векторного пространства называется функция от векторов х, у с ве- вещественными значениями, удовлетворяющая требованиям: 1) линейности по первому аргументу (cix + с2у, z) = сх(х, г) + с2(у, г);
346 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. XIII 2) симметрии (*. У) = (у, х); 3) положительной определенности (х, х) > О при х Ф 0. Из линейности по первому аргументу и симметрии следует и линейность по второму аргументу: (х, сху + c2z) = с, (х, у) + с2 (*, г). Далее, длиной \х\ вектора х называется ^/(х, х). В следую- следующем пункте будет доказано неравенство (х, уJ :?С \х\2- |(/|я, кото- которое делает осмысленным определение угла ср, образованного век- векторами х и у, посредством формулы \x\-\y\ Вещественное конечномерное пространство со скалярным про- произведением называется евклидовым пространством. Бесконечно- Бесконечномерное пространство со скалярным произведением называется предгильбертовым. (Оно называется гильбертовым, если обладает свойством полноты как метрическое пространство, т. е. если лю- любая последовательность вложенных замкнутых сфер с безгранично убывающими радиусами имеет общую точку. В функциональном анализе устанавливается, что предгильбертово пространство всегда может быть пополнено до гильбертова.) В комплексном пространстве тоже вводится скалярное произве- произведение как функция (х, у) от двух векторов х и у с комплексными значениями и удовлетворяющая следующим требованиям: 1) линейности по первому аргументу (ctx + c2y, г) = сх (х, г) + с2 (у, г); 2) симметрии с переходом к сопряженному (у, х) = (х, у); 3) положительной определенности (х, х) > 0 при хФО. Заметим, что из первых двух требований следует инволюцион- инволюционная (т. е. с переходом к сопряженным в коэффициентах) линей- линейность по второму аргументу: [х, с\у + c2z) = c\ (х, у) + с2(х, г)
§ 1] ОПРЕДЕЛЕНИЯ И ПРОСТЕЙШИЕ СВОЙСТВА 347 (распространенные в последние годы прилагательные «полулиней- «полулинейная» в смысле «линейная с инволюцией» и тем более «полуторали- нейная» в смысле «билинейная с инволюционной линейностью по второму аргументу» мне представляются малоудачными). Из условия симметрии уже следует, что (х, х) есть веществен- вещественное число, ибо (х, х) — (х, х), условие положительной определен- определенности добавляет к вещественности числа (а:, х) еще и положи- положительность. Так же, как в вещественном случае, (х, х) принимается за квадрат длины вектора х. Понятие угла между векторами в комп- комплексном пространстве не вводится. Конечномерное комплексное пространство со скалярным про- произведением, удовлетворяющим поставленным требованиям, назы- называется унитарным пространством. Бесконечномерные пространства имеют название комплексных предгильбертовых и, в случае пол- полноты,— комплексных гильбертовых пространств. 2. Неравенство Коши. Известное под этим названием (в более конкретной обстановке) неравенство | (х, у)\2^(х, х) (у, у) до- доказывается для вещественных и для комплексных пространств одним и тем же приемом. Проведем доказательство для комплекс- комплексного пространства. Если * = 0, неравенство тривиально. Пусть хфО. Введем в рассмотрение вектор г = у—у' ¦ х. Тогда (г, х) = (г/, х) ц-jf ' (¦*» *) = 0 и, следовательно, {z, г) = = (*. У) ~ IRj" <*• *> = (*> У) - <». У) ~ 1в'%'х*'У) = j % в (*,*)(* у)-!<*, У) Р. но (г,г)&0 и (х,х) > 0.Следова- тельно, (х,х)(у, у)-\(х, у)\2>0. Неравенство доказано. 3. Примеры. Простейшими примерами евклидова и унитарного пространства являются арифметические пространства, т. е. про- пространства столбцов x = (xi, x% ..., хпУ с вещественными элемен- элементами в евклидовом случае и с комплексными в унитарном, при скалярном произведении (х, у) = х\ух + х2у2 + ... + хпуп и, соот- соответственно, Х\У\ + Х2У2 + . . . + ХпУ п. Неравенство Коши для арифметического унитарного простран- пространства имеет вид Оно было установлено еще в гл. IV в качестве примера на приме- применение теоремы Бине — Коши.
348 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. XIII Примером предгильбертова пространства может служить про- пространство бесконечных последовательностей комплексных чисел, имеющих лишь конечное число ненулевых компонент. Скалярное произведение х — {х\, Х2, ...) и у = (уи у2, ,..) определяется как (х, (/)== xiyi + Х2У2 + ••• Эта сумма имеет лишь конечное число отличных от нуля слагаемых. Для того чтобы пополнить это про- пространство до гильбертова, нужно присоединить бесконечные по- последовательности х == (xi, X2, ...) со сходящимися рядами из ква- квадратов модулей. Если х и у — две такие последовательности, то применив неравенство Коши к отрезкам ряда х^у\-\- х2у2-\- • •¦. легко получим, что этот ряд абсолютно сходится. Его сумму и нужно принять за скалярное произведение. Так построенное про- пространство обозначается /г. Еще один важный пример предгильбертова пространства дают комплекснозначные непрерывные на данном промежутке [а, Ь]\ ь функции со скалярным произведением (f, g) = \ f(t)g (t) dt. При- a менение неравенства Коши в этой ситуации дает интегральное не- неравенство ь ь <\\f{t)?dt.\\g{t)?dt. а а Для пополнения этого пространства до гильбертова нужно при- присоединить функции с суммируемым (т. е. интегрируемым в смысле Лебега) квадратом модуля. 4. Евклидово и унитарное пространства в общем случае. Пусть 5 — евклидово пространство и е\, е%, ..., еп — некоторый его ба- базис. Пусть х = х\в\ + х2е2-\- ... + хпеп и у = yie\ + #262 + ... ... + упеп- Тогда, в силу билинейности скалярного произведения, -(л:, у) = X Si!xilJi> гДе 8ч =(^1, е/). В силу симметрии скалярного произведения gij — gji, так что матрица (gi,) (называемая матри- матрицей Грама для базиса еи ..., еп) симметрична. Далее, (х, х) = ¦= S giixixi и> в силУ требования (х, х) > 0 при х Ф 0, (ga) — положительно определенная матрица (т. е. является матрицей по- положительно определенной квадратичной формы). В матричной форме скалярное произведение записывается в виде XTGY, где X и У — столбцы из координат векторов х и у и G — (gn). При пре- преобразовании координат с матрицей С скалярное произведение в новых координатах X', У запишется в виде X'rCrGCY', так что матрица Грама преобразуется по формуле преобразования квадра- квадратичной формы: C'~CTGC. В глазе V (см. стр. 153 и 163) было установлено, что положительно определенная квадратичная форма может быть приведена к сумме квадратов новых переменных, т. е,
•§ 1] ОПРЕДЕЛЕНИЯ И ПРОСТЕЙШИЕ СВОЙСТВА 349 к квадратичной форме с единичной матрицей коэффициентов. Сле- Следовательно, в евклидовом пространстве существует такой базис, в котором матрица Грама есть единичная матрица. Это значит, что (?«, ei) = 1 и (et, ei) — О при i Ф /. Такой базис называется орто- нормальным. Пусть теперь 5 — унитарное пространство и в\, ..., еп— его базис. Тогда (х, у) = ? gijxiyi=XTGY, где X и Y — столбцы из координат х и у, G =(#«/), где gij = (ei, е{), хи ..., хп и уи ¦ . ..., уп— координаты векторов х и у в выбранном базисе. В этой ситуации матрица Грама G = (gi/) эрмитово симметрична, ибо (ej, ei) = (ei, ej). Скалярное произведение имеет вид (х,х) = ~Ш giixixj> T- е- представляется в виде эрмитовой формы от Xi, ..., хп с матрицей G. Эта форма является положительно опре- определенной. При преобразовании координат с матрицей С матрица Грама преобразуется в CrGC = Ci*GCi, где С\ — С, т. е. изме- изменяется по формуле преобразования матрицы эрмитовой формы. Положительно определенная эрмитова форма может быть преобра- преобразована к сумме квадратов модулей новых переменных i e. к эр- эрмитовой форме с единичной матрицей. Следовательно и в этом случае существует ортонормальный базис со свойствами (е/, е,) = «= 1 и (ei, ej) = 0 при i ф /. В п. 6 это обстоятельство будет установлено без ссылки на алгебраическую теорию квадратичных и эрмитовых форм, но при помощи соображений довольно прозрачных при пользовании гео- геометрической терминологией По существу же эти соображения почти равносильны преобразованию положительно определенных форм к каноническому виду. 5. Ортогонализация совокупности векторов. Векторы и к v унитарного (или евклидова) пространства называются ортогональ- ортогональными, если (и, v) = 0. Из (и, v) = 0 следует, что (и, ц) = 0, так как (у, и) = (и, v). Из ортогональности и и v следует ортогональ- ортогональность с{и и с2у при любых С\ и с2. Нулевой вектор ортогонален любому другому. Верно и обратное утверждение: Предложение 1. Если вектор v ортогонален, всёп векторам унитарного (евклидова) пространства, то он равен нулю. Действительно, если вектор ортогонален всем векторам про- пространства, то он ортогонален самому себе, т. е (v, ь) = 0 и ь = 0. Предложение 2. Попарно ортогональные ненулевые век- векторы линейно независимы. Действительно, пусть v\, v2, ..., Vk — попарно ортогональные ненулевые векторы, так что (vit vj) = O при 1ф\ и (vi, vi) > 0. Пусть CiVi + ... + ciVi -+¦•••+ ckvk = 0. Тогда (ciVi + ... -f с(о(-+ -f- ... + ckvk,Vi) = 0, откуда d(v;, v{) = 0 и, наконец, с, == 0. Теорема 3 (об ортогонализации). Пусть v\, v2, ..., Vk — линейно независимая совокупность векторов в унитарном (или евклидовом) пространстве. Исходя из нее, можно построить от-
350 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА (ГЛ. XIII личные от нуля попарно ортогональные векторыv\, vt, ..., v'k так, что г. е. каждый вектор v\ получается из v-t посредством прибавления линейной комбинации предыдущих векторов vi, ..., vi-i. Доказательство. Применим индукцию по k. База индук- индукции при k = 1 тривиальна. Пусть теорема доказана для совокуп- совокупности из k — 1 вектора, и в этом предположении докажем для k. Будем искать v'k в виде суммы Vk. и линейной комбинации уже ортогональных векторов v'v v'2, ..., v'k_{. Приравняем нулю (у^, v'^) при i < k. Получим: 9 откуда иг определяется однозначно: bi — —7-7—тс- Выразим 0». »t) теперь v'k через vk, vh ..., vk-\. Получим при некоторых cki,ck2, ..., cft,#_i- Остается показать, что и^ ^= 0. Но если бы t^ = 0, то векторы v\, V2,..., Vk-u Vk были бы ли- линейно зависимы. Теорема доказана. Процесс ортогонализации можно провести несколько иначе. Сначала построить векторы и2, из, .. •, Uk, добавив к v% 03, ..., Vk подходящие кратные v\ так, чтобы и%, и3, ..-, ы* стали бы орто- ортогональны v\. Затем построить векторы и'ъ..., u'k за счет добав- добавления к ыз, .... «* подходящего кратного вектора и2 с тем, чтобы и, ..., u'k стали ортогональны к «2- При этом ортогональность v\ сохранится. Процесс продолжается до конца. В итоге векторы
§ 1] ОПРЕДЕЛЕНИЯ И ПРОСТЕЙШИЕ СВОЙСТВА 351 vv и2, и'3, ... —это те же векторы v\, v'2, ..., v'h, что и в первом процессе. Заметим, что так осуществленный процесс ортогонализа- ортогонализации точно воспроизводит процесс преобразования положительно определенной эрмитовой (или квадратичной) формы к канониче- каноническому виду. Дадим еще одну интерпретацию процесса ортогонализации. По- Последовательность F вложенных подпространств 0 = Ро a Pi cr . . ... с: Рк-\ с: Pk называется флагом, если размерность каждого подпространства на единицу больше размерности предыдущего, так что dim Р,- = L Базисом флага называется базис пространства Pk, включающий базисы всех подпространств, составляющих флаг, так что если уь и2, .... vk — базис флага, то v\ — базис Р\, v\ и v2 — базис Р% и т. д. Пусть v\, V2, ... , Vk — базис флага F, и пусть V3 = причем си ф 0, сгг ф 0, ..., Ckk Ф 0. Тогда v[ — ненулевой вектор в PY, v'2 принадлежит Р2 и не яв- является линейной комбинацией v\ и т. д., v\ принадлежит Pi и не является линейной комбинацией и', ..., v'i_] при всех i. Сле- Следовательно, v[, v2, ..., v\ линейно независимы и образуют базис Pi, так что Op v2, ..., v'k есть базис флага F. Ясно, что любой базис флага F связан с базисом v\, 02, ¦ ., f* формулами указан- указанного вида. Вернемся к теореме об ортогонализации. Примем исходную систему векторов иь vi, ..., vk за базис некоторого флага F. Тогда векторы v[, v2, ..., v'k после проведения ортогонализации составят базис того же флага, но составленный из попарно орто- ортогональных векторов. Поэтому теорема об ортогонализации может быть сформулирована следующим образом: Для любого флага существует ортогональный базис, т. е. ба- базис, состоящий из попарно ортогональных векторов. 6. Ортонормальный базис. Вектор в унитарном (или евклидо- евклидовом) пространстве называется нормированным, если его длина равна 1. Любой отличный от нуля вектор можно умножить на не- некоторое число так, что в результате получится нормированный вектор. Действительно, пусть х ф 0. Тогда (ах, ах) — ай(х, х) — = |а|2(х, х). Достаточно взять а таким, что [а\= —.¦ = -—г¦
352 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. XIII Так подобранное число а называется нормирующим множителем для вектора х. В унитарном пространстве нормирующий множи- множитель определен с точностью до множителя с модулем, равным 1. В евклидовом пространстве нормирующий множитель определен с точностью до знака. Ясно, что если векторы ортогональны, то и после их нормиро- нормирования получатся ортогональные векторы. Пусть теперь v\, V2, •••, vn— какой-либо базис унитарного (или евклидова) пространства. Применив к нему процесс ортого- нализации, придем к ортогональному базису. После нормирова- нормирования всех базисных векторов придем к базису, составленному из попарно ортогональных и нормированных векторов еи е2, ..., е„. Такой базис носит название ортонормального. Для ортонормаль- ного базиса выполняются соотношения {ei, e,)=l и (ei, e,) = 0 при i Ф }, так что м'атрица Грама для ортонормального базиса есть единичная матрица. Скалярное произведение векторов в координатах в ортонор- мальном базисе имеет, очевидно, вид (х, у) = хш + ХгУг + ••• ... + хпуп, т. е. точно такой же, как в арифметическом простран- пространстве столбцов. Тем самым установлен изоморфизм, с сохранением скалярных произведений, унитарного (или евклидова) пространства с ариф- арифметическим пространством столбцов. 7. Преобразование координат при замене ортонормального ба- базиса. Напомним, что матрица преобразования координат, с кото- которой координаты векторов в базисе е\, е%, ..., еп выражаются через координаты в базисе е[, е'2, ..., е'п, имеет своими столбцами коор- координаты векторов е[, е'2, ..., е'п относительно базиса еь е2, ..., еп- Допустим, чтоер е2, ..., еп и е[, e'v ..., е'п—ортонормальные базисы унитарного (или евклидова) пространства. Векторы е[, е'2, ..., е'п нормированы, следовательно, суммы квадратов мо- модулей элементов столбцов матрицы равны 1. Далее, {е\, е^) = 0 при 1ф}, так что суммы произведений элементов /-го столбца на числа, сопряженные с элементами /-го столбца, равны 0. Следо- Следовательно, матрица преобразования координат при замене ортонор- мальных базисов унитарна (ортогональна для евклидова про- пространства). Ясно, что любая унитарная (ортогональная) матрица является матрицей преобразования координат при замене ортонормального базиса на некоторый тоже ортонормальный базис. § 2. Подпространства унитарного (или евклидова) пространства 1. Ортонормальный базис подпространства и его дополнение до ортонормального базиса пространства. Любое подпространство унитарного (или евклидова) пространства само является унитар-
§ 2] ПОДПРОСТРАНСТВА УНИТАРНОГО ПРОСТРАНСТВА 353- ным (евклидовым) по отношению к тому же скалярному умно- умножению. Пусть Р есть- А-мерное подпространство «-мерного унитарного (евклидова) пространства S. Пусть в\ ек — ортонормальный базис Р. Дополним его до базиса S, присоединив векторы vk+u ¦ •. ..., vn- Применим к базису еи ..., вк, Vk+u ••-, vn процесс орто- гонализации. Первые векторы е\, ..., вк при этом не изменятся, так как они попарно ортогональны. Получим ортогональный базис ev ..., ek, v'k+v ..., v'n. Чтобы получить ортонормальный базис S, остается только нормировать векторы v'k+l v'n. 2. Ортогональное дополнение. Пусть S есть л-мерное унитарное (или евклидово) пространство и Р — его ^-мерное подпростран- подпространство, 1 ^ & ^ п — 1. Ортогональным дополнением Рх к подпро- подпространству Р называется множество всех векторов из S, ортого- ортогональных всем векторам из Р. Ясно, что если векторы ортогональны всем векторам из Р, то любая их линейная комбинация обладает тем же свойством. Поэтому PL есть подпространство S. Пусть е\, ..., вк — ортонормальный базис Р и ей ,.., е&, вк+\, .... еп — включающий его ортонормальный базис 5. Натянем на векторы вк+ь -.-, еп подпространство Q. Любой вектор из Q, будучи линейной комбинацией векторов ек+и ..., е„, ортогонален векторам ег ёк и, следовательно, любой их линейной комби- комбинации, т. е. любому вектору из Р. Следовательно, Q г= Р1. Пусть теперь вектор х = *iei + • • • + xkek + Хк+\вк+\ + ... + хпеп е Рх. Тогда (х, ei) — xi = 0 при i=l, ..., k, так что х = хк+^к+\ + ••• ... + x"e" e Q- Итак, любой вектор из Q принадлежит Рх и лю- любой вектор из Р1- принадлежит Q. Подпространства Q и Рх сов- совпадают. Таким образом, ортогональное дополнение Р1 к подпростран- подпространству Р есть подпространство, натянутое на векторы, дополняющие ортонормальный базис Р до ортонормального базиса S. Теперь легко установить следующие свойства ортогональных дополнений. 1. dim Рх = dim 5 — dim P. Непосредственно следует из построения базиса Рх. 2. (Р^-)^ = Р. Действительно, в качестве векторов, дополняющих ортонор- ортонормальный базис вк+и •¦•> ?„ подпространства Рх до ортонормаль- ортонормального базиса S, можно взять в\, .... вк, и натянутое на эти векторы, подпространство (Рх)х совпадает с Р. 3. Если Pic:P2, то Pt=>Pk- Ясно из определения ортогонального дополнения. 4. (Р1+Р2)Х = Р11ПР2-. Действительно, любой вектор из (Pi + Pz)L ортогонален всем векторам из Р] и всем векторам из Рг, т. е. принадлежит Pi /\P%
864 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. XIII Обратно, любой вектор из Pt Л Pt ортогонален всем векторам из Pi и всем векторам из Рг и любым их суммам, т. е. принадлежит Перейдя в свойстве 4 к ортогональным дополнениям, получим Pi + Р2 = (Рх Л Pi')'1- Заменив в этом равенстве Pt и Pt. на Pi и Р2, получим: 5. (PinP2)x-=P/- + Pt- Таким образом, переход к ортогональным дополнениям обра- обращает отношение включения подпространств и переставляет опера- операции сложения и пересечения подпространств. ' 6. S = Р Ф Р±. Действительно, базис S есть объединение базисов Р и Р-Ч В этой ситуации говорят, что пространства S есть ортогональная сумма подпространств Р и Рх. Более общо, скажем, что S есть ортогональная сумма своих подпространств Р\, ..., Р*, если 5 = Pt + ••• + Ра, причем век- векторы, взятые из различных подпространств, ортогональны. Орто- Ортогональная сумма всегда прямая, ибо из равенства v\ + .. -f- vк = = 0 при у,еРг следует равенство нулю всех слагаемых vi, ибо наличие ненулевых слагаемых в левой части противоречило-бы линейной независимости ненулевых попарно ортогональных век- векторов. § 3. Пространства, сопряженные с евклидовым и унитарным пространствами 1. Пространство, сопряженное с евклидовым пространством. Пусть S — евклидово пространство. Любому вектору у е S можно поставить в соответствие линейную функцию ly e 5* со значениями 1у(х) = (х, у). Если уф z, то 1уф1г, ибо равенство (х, (/)=» = (х, z) при всех xgS значит, что (х, у — z) = 0 при всех х, что возможно только при у = z. Пусть Х\, .... х„ — координаты вектора х в ортонормальном базисе. Любая линейная функция от к представляется в виде yiXi + ... + упхп при некоторых у\, ..,, уп, т. е. в виде (я, у), где у — вектор с координатами у и ..., у„. Та- Таким образом, между векторами из 5 и ковекторами из 5* имеется естественное взаимно однозначное соответствие у •*-*¦ 1У. Далее, из линейности скалярного произведения по второму аргументу (х, ciyi-\-c2y2) = Ci(x, yi)-\-c2(x, y2) следует, что линейной комби- комбинации векторов соответствует такая же линейная комбинация ковекторов. Таким образом, соответствие у •*-*¦ 1У задает изо- изоморфизм пространства S и сопряженного с ним пространства S*. 2. Пространство, сопряженное с унитарным пространством. Так же, как в евклидовом пространстве, устанавливается взаимно однозначное соответствие между векторами и ковекторами по пра-
5 4] ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ 355 вилу у -«->- ly, где ly — линейная функция со значениями — (х,у). Линейность функции 1У следует из линейности скалярного произведения относительно первого аргумента. Однако линейной комбинации векторов соответствует линей- линейная комбинация ковекторов с сопряженными коэффициентами, в силу свойства (х, С\у\ + c2(/2) = ci(x, y\)-\- c2(x, i/2). Таким обра- образом, между унитарным пространством и его сопряженным имеется инволюционный изоморфизм, с заменой коэффициентов на сопря- сопряженные при линейном комбинировании. § 4. Операторы в унитарном пространстве 1. Инвариантный флаг для оператора в комплексном простран- пространстве. Пусть S — векторное пространство над полем С; и s4- — ли- линейный оператор в S. Предложение 1. Для оператора si, действующего в комп- комплексном пространстве S, существует флаг, составленный из инва- инвариантных подпространств. Для доказательства достаточно установить, что для каждого Агмерного инвариантного подпространства Р* найдется объемлю- объемлющее его (&+ 1)-мерное инвариантное подпространство Pk+i. Пусть S = S/Pk и si — оператор, индуцированный оператором si на 5. Пусть К — собственное значение оператора si и йе5 — соответ- соответствующий собственный вектор. Пусть и — произвольный вектор из класса п. Тогда siu = %и (Р*), т. е. siu = %u + z при z e Pk. Век- Вектор и не принадлежит Р*, ибо пфО. Пусть Pk+\ — подпростран- подпространство, натянутое на базис Pk и на вектор и. Оно (k -f- 1)-мерно, ибо и <ф. Pk. Оно инвариантно. Действительно, х е Pk+\ значит, что х = си + у при у е Pk. Тогда six == csiu + siy = сХи + cz + s$y& e Pft+i, ибо и, z и s&y принадлежат Р*+ь Тем самым предложе- предложение 1 доказано. ' В любом базисе флага, составленного из инвариантных под- подпространств, оператор имеет верхнюю треугольную матрицу. Действительно, пусть щ, ы2, ..., ип — базис флага, состоящего из инвариантных подпространств Pi, P2 Р„. Тогда siu\ e Рь т- е. siu\ = X\U\. Далее, j^m2 ^ Р2, т. е. siu2 = a^Mi + ^гм2, sf-иъ = = a\zU\ + a23U2 + ^з«з и т. д. Матрица из координатных столбцов векторов siuu siu2, ..., siun есть am I 0 %2 ^2Э ... л = ' .0 0 0 ... Я„ Диагональные элементы матрицы А суть собственные значе- значения оператора si, ибо характеристический полином матрицы А равен (/ — h)(t — fa) ... (t — Xn\.
856 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. XIII Пусть теперь S — унитарное пространство. В силу теоремы об ортогонализации для любого флага существует ортонормальный базис. Следовательно, верна следующая теорема Шура: Теорема 2. Для любого оператора в унитарном простран- пространстве существует ортонормальный базис, в котором оператор имеет верхнюю треугольную матрицу. Любую квадратную комплексную матрицу можно принять за матрицу линейного оператора по отношению к некоторому орто- нормальному базису. Переход от исходного ортонормолыюго ба- базиса к ортонормальному базису инвариантного флага влечет пр :- образование координат с унитарной матрицей. Поэтому теорема Шура имеет следующий эквивалент на языке матриц: Для любой квадратной комплексной матрицы А существует такая унитарная матрица С, что С~1АС есть верхняя треугольная матрица. Рассмотрим один интересный частный случай. Пусть матрица сама унитарна. Тогда верхняя треугольная матрица С~1АС тоже унитарна и, следовательно, ее строки и столбцы нормированны, т. е. суммы квадратов модулей элементов всех ее строк и столбцов равны 1. Но легко видеть, что верхняя треугольная матрица 1 «12 ai3 • ¦ • а, О Л2 а2з ... а2п .0 0 0 ... А„ с нормированными строками и столбцами диагональна и ее диа- диагональные элементы по модулю равны 1. Действительно, рассма- рассматривая сумму квадратов модулей элементов первого столбца, по- получим |Xi|2=l. Для первой строки теперь получим |A,i|2 + + |а12|2+ ... +|а,„|2=1, откуда |а12|2+ ... +|aln|2 = 0 и ai2 = ... =ain = 0. Теперь обратимся ко второму столбцу и за- затем второй строке. Получим |А,2|2=1 и а2з = ••• =a2n = 0 и т. д. Таким образом, для унитарных матриц верна следующая теорема: Теорема 3. Для любой унитарной матрицы А найдется та- такая унитарная матрица С, что С~1АС диагональна. Все собствен- собственные значения унитарной матрицы равны по модулю 1. Эту теорему мы получим далее в качестве частного случая бо- более общей теоремы. 2. Сопряженный оператор. Сопряженным оператором для дан- данного оператора .s#, действующего в унитарном пространстве S, называется такой оператор S4-*, что при любых векторах х и у имеет место равенство (s?x, y) = (x, s&*y). Докажем существование сопряженного оператора. С этой целью перейдем к координатной записи. Пусть (xi,x2, ..., хп)т — столбец из координат вектора х в некотором ортонормальном ба- базисе, (yi, г/2, ¦¦•, Уп)т — координаты вектора у и А = (ац) — ма- матрица оператора S&.
i 4] ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ 357 Тогда {Жх, у) = - ... + а2пхп)у2 + Т~ • • • \ &ппХп) Уп === а22у2 + ... + ап2уп) + + хп {alny{ + а2пу2 + ... + аппдп). Вторые сомножители в этой сумме комплексно сопряжены с чис- числами ... +anlyn, + ... +аппуп, которые являются координатами вектора s4-*y, где оператор s4-* имеет матрицу которая транспонирована и комплексно сопряжена (т. е. просто сопряжена, как мы условились на стр. 140) с матрицей оператора зФ. Итак, нам удалось построить оператор si-* такой, что (ах, у) = (х, st*y). Теперь нужно показать единственность сопряженного опера- оператора и, тем самым, независимость от выбора ортонормального базиса в пространстве S.. Пусть (si-x, у)'=(х, М*у) и \s4-x, у) = =(х, &у). Тогда при любых х и у будет (х, st*y) = (x, 38у), т. е. $х,,-з?*у — &у) = 0. Так как это выполнено при всех х, заключаем, что МЧЦ — &У = 0 при всех у, а это и значит, что si-* = 38. Итак, для любого оператора зФ существует единственный со- сопряженный оператор, и его матрица в любом ортонормальном ба- базисе сопряжена с матрицей оператора si-. Отметим некоторые очевидные свойства действия сопряжения операторов. 1. (s>P)* = st. 2. (& + &)* = si* + Я*. 3. (csf)* = cs4-*. 4. {§)
358 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. ХИ1 Свойство 1 очевидно из рассмотрения матриц для si- и $&¦*. Это же легко проверяется и бескоординатно: х) = (х, sly). Свойства 2 и 3 непосредственно получаются из определения со- сопряженного оператора. Свойство 4 проверяется, например, так: (tS& ) {@ a*) ( $*4*) у) { y) y) Для дальнейшего важно еще одно, менее очевидное свойство сопряженного оператора. Предложение 4. Ортогональное дополнение Рх к инва- инвариантному для оператора s4- подпространству Р инвариантно для оператора si-*. Доказательство. Пусть у е Рх. Это значит, что у орто- ортогонален всем векторам из Р, в частности, всем векторам si-x при хеР. Это значит, что {$4-х, у) = 0 и (х, s4-*y)=Q. Это равенство верно для всех j;gP, следовательно, s4-*y e P1. 3. Нормальные операторы. Оператор, действующий в унитар- унитарном пространстве, называется нормальным, если он перестановочен со своим сопряженным. К классу нормальных операторов отно- относятся самосопряженные операторы, совпадающие со своими со- сопряженными, и унитарные операторы, для каждого из которых сопряженный равен обратному. В ортонормальном базисе самосопряженный оператор имеет эрмитову матрицу, а унитарный — унитарную. Предложение 5. Если S4- — нормальный оператор, <§ — единичный и а —любое комплексное число, то оператор 33 = = s4- — аё тоже нормальный. Доказательство. Проверим равенство ЗИЖ = &*38. Имеем Поэтому 38@* = @*@, ибо Предложение 6. Собственный вектор нормального опера- оператора есть собственный вектор и сопряженного оператора, соответ- соответствующий сопряженному собственному значению. Доказательство. Пусть и — собственный вектор нормаль- нормального оператора s?, принадлежащий собственному значению К. Тогда s?u = iu, что можно записать как &и = 0, где & = &!¦ — KS". Из равенства 9&и = 0 следует, что {Яи, &и) = 0. Но C1и, Ми) = = (и,М*Ми) = (и,38@*и) = (@*и,$*и). Следовательно, &*и = 0, откуда (s?* — Я<^)« = 0 и s?*u = Xu, что и требовалось доказать. Теорема 7. Для нормального оператора существует ортонор- мальный базис, в котором матрицы оператора и его сопряженного диагональны и их соответствующие диагональные элементы сопря- сопряжены. ¦ Доказательство. Пусть и\ — нормированный собственный вектор для нормального оператора si и Р\ — одномерное поДпро-
§ 4] ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ 359 странство, натянутое на вектор и\. Так как и\ является собствен- собственным вектором и для si*, подпространство Pi инвариантно и для s4>*'. Следовательно, ортогональное дополнение Р\~ к Pi инвари- инвариантно как для si, так и для si*. Ограничения операторов ^и/ на Pf- останутся взаимно сопряженными, ибо раз равенство {six, у)=:(х, si*y) верно для всех векторов х, у пространства, оно будет верно и для векторов из Pix. Для оператора si на Р\~ най- найдется нормированный собственный вектор и2. Он ортогонален век- вектору и\. Вектор ы2 будет собственным и для si-*. Поэтому подпро- подпространство Р2, натянутое на векторы щ и и2, инвариантно как для si, так и для si*. Его ортогональное дополнение P-t тоже инва- инвариантно для si- и si-*, которые на Рг останутся взаимно" сопря- сопряженными. В Pi находится нормированный собственный вектор «з. который ортогонален и\ и м2, он будет собственным вектором и для оператора si*. Продолжая этот процесс шаг за шагом, по- построим ортонормальную совокупность собственных векторов для si, которая в конце концов даст базис пространства. В этом ба- базисе матрицы операторов si- и si* диагональны. Соответствующие диагональные элементы будут сопряжены как собственные значе- значения операторов s4- и si*, соответствующие одному и тому же соб- собственному вектору. Теорема доказана. По ходу доказательства теоремы мы конструировали ортонор- мальный базис из собственных векторов. Но некоторые собствен- собственные векторы ортогональны автоматически. Предложение 8. Собственные векторы нормального опера- тдра, принадлежащие различным собственным, значениям, ортого- ортогональны. Действительно, пусть и и v — собственные векторы нормаль- нормального оператора si-, соответствующие собственным значениям К и li, % Ф \i. Тогда и и v будут собственными векторами и для сопря- сопряженного оператора si*, соответствующие собственным значениям X и \i. Подсчитаем двумя способами число {s4-u, v). С одной сто- стороны, (siu, v) = (Xu, v) = X(u, v). С другой стороны, (j^u, u) = = (и, si*v) = (u, [iv) = \i(u, v). Сравнив, получим (% — и) («, v) = = 0, откуда (и, v) = 0, что и требовалось доказать. Доказанное предложение дает возможность указать другую конструкцию для построения ортонормального базиса из собствен- собственных векторов. В силу диагонализуемости матрицы нормального оператора любой вектор пространства равен сумме собственных векторов, и, следовательно, пространство равно сумме подпространств соб- собственных векторов, принадлежащих попарно различным собствен- собственным значениям. В силу предложения 8 эта сумма ортогональная. Поэтому для построения ортонормального базиса всего простран- пространства достаточно объединить ортонормальные базисы всех подпро- подпространств собственных векторов.
860 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. Х1П Нормальность оператора не только достаточна для диагонали- зируемости матрицы в некотором ортонормальном базисе, но и необходима. Действительно, если матрица оператора si равна diag(Xi, %2, ..., Ял), то в том же базисе матрица сопряженного базиса сопряжена с матрицей si, т. е. равна diag(Xi, ^2. ..-, Я«)> а любые диагональные матрицы коммутируют. 4. Самосопряженные операторы. Предложение 9. Для того чтобы нормальный оператор был самосопряженным, необходимо и достаточно, чтобы все его собственные значения были вещест- вещественными. Действительно, матрица самосопряженного оператора в любом ортонормальном базисе совпадает с сопряженной, в частности, диагональная матрица, получающаяся в базисе из собственных векторов. Но диагональная матрица совпадает с сопряженной, со- составленной из комплексно сопряженных чисел, в том и только в том случае, когда она вещественна. Элементы, находящиеся на диагонали, равны собственным значениям. Предложение о возможности унитарного преобразования ма- матрицы самосопряженного оператора к вещественной форме, в тер- терминах матриц означает, что для любой эрмитовой матрицы А су- существует унитарная матрица С такая, что С~гАС = С*АС есть вещественная диагональная матрица. Это равносильно тому, что эрмитова форма с матрицей А может быть приведена к канони- каноническому виду посредством преобразования переменных с унитар- унитарной матрицей. Это было сформулировано в конце гл. V. Если оператор si самосопряженный, то (six, x) вещественно при всех значениях вектора х. Действительно, (six, x) = (x, si*x)*=* «= (х, Six) = (Six, X) . Если все значения (six, x) при ненулевых векторах х положи- положительны, то самосопряженный оператор si называется положи- положительно определенным. Если и\, ..., ип — ортонормальный базис из собственных векторов оператора si при собственных значениях %и ..., к„ и хи х% ..., хп —гкоординаты вектора х в этом базисе, тб (Six, X) = (Si(x\U\-\- ... +XnUn), n, X\U\-\- ... -\-XnUn) = Из этого равенства следует, что для положительной определен- определенности оператора необходимо и достаточно, чтобы все его собствен- собственные значения были положительны. Предложение 10. Из положительно определенного само- самосопряженного оператора можно «извлечь квадратный корень», яв- являющийся самосопряженным положительно определенным опера- тдром. Это значит, что для положительно определенного самосо-
¦§ 4] ОПЕРАТОРЫ В УНИТАРНОМ ПРОСТРАНСТВЕ 361 пряженного оператора st> существует положительно определенный оператор 9& такой, что &2 = зФ. Доказательство. Пусть ki, K2, ..., kn— собственные зна- значения самосопряженного положительно определенного оператора «s# и п\, «2, ..., ип— ортонормальный базис из соответствующих собственных векторов. Все числа ki, K2, ..., kn положительны, и из них можно извлечь положительные квадратные корни. Пусть ЗВ — оператор, имеющий собственные векторы мь ы2> ••• ..., ип и собственные значения V^i> V^2> •••> V%r- Этот опера- оператор самосопряжен, ибо его матрица в ортонормальном базисе «1, «2, • • •, "л диагональна и вещественна. Он положительно опре- определенный, ибо его собственные значения положительны. Квадрат его матрицы в базисе щ, и2, ..., ип равен матрице оператора st> в том же базисе. Следовательно, $2 = зФ. Теорема 11. Любой невырожденный оператор равен произ- произведению унитарного на положительно определенный. Доказательство. Пусть $Ф — невырожденный оператор. Тогда оператор зФ*зФ самосопряженный и положительно опреде- определенный. Действительно, '{яРзФ)' = зФ* (st*)* = sfs4-. Далее, при х ф О имеем (s&*s&x, x) = (s&x, s&x)>0, ибо stf-хфО при хфО. Пусть &В — квадратный корень из оператора 3^*31-. Тогда s4-*s4- = &2. Умножив это равенство справа и слева на !%-\ получим -1 = 8. Но 38~хзФ* = {зФЗ&~1)*. Таким образом, оператор s&3l~l и его со- сопряженный взаимно обратны, т. е. оператор 11 = ?Ф9&-^ унитар- унитарный. Следовательно, что и требовалось доказать. Это разложение носит название полярного разложения опе- оператора. Существует и другое полярное разложение, в котором положи- положительно определенный множитель находится слева, а унитарный справа. Действительно, применив полярное разложение к сопря- сопряженному оператору si-*, получим и переход к сопряженным дает Оператор %1~х унитарен вместе с Ш. 5. Оператор ортогонального проектирования. Пусть S — Р ®] Ф Q, где Q = Р1. В этом случае проектирование называется орто- ортогональным, и соответствующий оператор называется оператором ортогонального проектирования. Оператор ортогонального проек- проектирования самосопряжен, ибо он имеет вещественную диагональ-
362 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА ГГЛ. XIII ную матрицу в ортонормальном базисе, получающемся посред- посредством объединения ортонормальных базисов Р и Q. Предложение 12. Любой самосопряженный идемпотентный оператор есть оператор ортогонального проектирования. Действительно, любой идемпотентный оператор s4-, как мы ви- видели на стр. 331, является оператором проектирования S на P — S4-S параллельно Q = (<0>—$4-)S. Нужно доказать только, что Р и Q ортогональны. Пусть х = s4-u еР и у = v — s?v e Q. Тогда (х, y) = (s&u, v — s4-v). В силу самосопряженности s& имеем (s&u, v — ^и) = (ы, s4-v — $4-2v) = {u, 0)=0, что и требовалось доказать. 6. Унитарные операторы. Предложение 13. Для того чтобы нормальный оператор был унитарен, необходимо и достаточно, чтобы его собственные значения были равны 1 по модулю. Действительно, диагональная матрица нормального оператора в ортонормальном базисе из собственных векторов унитарна в том и только в том случае, если все ее диагональные элементы, т. е. собственные значения, равны 1 по модулю. Предложение о возможности унитарного преобразования по- подобия матрицы унитарного оператора к диагональной форме мы получили ранее более формальными средствами при помощи тео- теоремы Шура. § 5. Операторы в евклидовом пространстве 1. Комплексификация евклидова пространства. Пусть 5 — ев- евклидово пространство и 5 — его комплексификация. Введем ска- скалярное произведение в 5 по формуле: (x + yi, u + vi) = (x, u) + {y, v)+i{{y, и) — (х, v)). Нужно проверить корректность этого определения. Аддитив- Аддитивность по первому аргументу при фиксированном втором очевидна. Для проверки линейности по первому аргументу достаточно убе- убедиться в возможности вынесения комплексного множителя из пер- первого аргумента. Соответствующее вычисление не представляет труда, но довольно громоздко. Именно: ((а + Ы) {х + yi), и + vi) = (ад: — by -f (bx + ay) i, и + vi) = = (ax — by, u) + {bx + ay ,v)-\-i ({bx + ay, u) — {ax — by, v)) = = a{x, u) — b{y, u) + b{x, v) + a{y, v) + b{x, u)i + + а {у, u)i — a {x, v)i + b (y, v) i = = (a + to) ((*, и) + {у, v) + i {{у, и) - {x, »))) = = (a + to) {x + yi, и + vi). Симметрия с инволюцией очевидна — при перестановке местами ж + yi и и + vi вещественная часть скалярного произведения не меняется, а мнимая меняет знак на обратный.
§ 5] ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 363 Наконец, (x + yi,x + yi) = (x,x)-{-(y,y)+i((y,x) — (x,y)) — — (х, х)-\-{у, у) > 0, если х -\- у1фО. Таким образом, комплекси- фикация S евклидова пространства S становится унитарным про- пространством. Заметим еще, что скалярное произведение пары векторов х Н- yi, u-\-vi и скалярное произведение пары комплексно сопря- сопряженных с ними векторов х — yi, и — vi комплексно сопряженные. Это непосредственно следует из определения скалярного произве- произведения в S. 2. Операторы в евклидовом пространстве и их продолжение на комплексификацию. В евклидовом пространстве для оператора s& определяется сопряженный оператор si* той же формулой (six, у) = (х, sl*y) при любых хну, что и в унитарном простран- пространстве. Доказательство существования и единственности сопряжен- сопряженного оператора ничем не отличается от аналогичных доказа- доказательств для унитарного пространства. Матрица оператора si* в ортонормальном базисе просто транспонирована с матрицей опе- оператора si. При продолжении взаимно сопряженных операторов si и si* с S на S они останутся сопряженными. Действительно, (si {х + iy), и + iv) = (six + isly, и + iv) — — {six, и) + (sly, v) — (six, v) i + (sly, u) i = = (x, spu) + (y, sTv) - (x, sl*v) i + (y, sfu) i = = ((x + yi), (yJ-*u + sP'vi) ) = (x + yl, sl*(u + vi))'. 3. Нормальные операторы в евклидовом пространстве. Нормаль- Нормальный оператор si в евклидовом пространстве 5 остается нормаль- нормальным и при его продолжении на комплексификацию 5 пространства S. Поэтому в 5 существует ортонормальный базис из собственных векторов, диагонализующий матрицу оператора А. Для вещественных собственных значений можно взять вещест- вещественные собственные векторы, т. е. лежащие в S. Действительно, координаты собственных векторов относительно базиса 5 опреде- определяются из линейных однородных уравнений с вещественными коэффициентами в случае вещественности собственного зна- значения. Комплексные собственные значения появляются парами сопря- сопряженных с одинаковой кратностью. Выбрав ортонормальный базис из собственных векторов, принадлежащих некоторому собствен- собственному значению К = а + Ы при b ф 0, базис из собственных векто- векторов для собственного значения % = а — Ы можно взять из век- векторов, сопряженных с векторами базиса собственных значений для к. Такой базис будет ортонормальным. Теперь натянем на каждую пару и + vi и и — vi сопряженных векторов двумерное комплексное подпространство. Все эти подпространства инва- инвариантны, ортогональны друг другу и вещественным собственным
364 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. XIII векторам, соответствующим вещественным собственным значе- значениям. Комплексное пространство, натянутое на векторы и + vi и и — vi, очевидно, совпадает с комплексным подпространством, на- натянутым на вещественные векторы и и у, и, следовательно, явля- является комплексификацией вещественного подпространства, натяну- натянутого на и и v. Далее, из ортогональности собственных векторов к + vi и и — vi, принадлежащих различным собственным значениям Я, = = а + Ы и X = а — Ы, следует: О = («-|- vi, и — vi) = {u, и) — {v, v) = («, и) — (v, v)+2i(u, v)t ибо в евклидовом пространстве S скалярное произведение симме- симметрично. Из этого равенства следует, что (и, v) = 0, т. е. векторы и и у ортогональны, а также (и, u) = (v, v). Вспомним теперь, что век- вектор м + ш" нормированный, т. е., ввиду ортогональности и и v, (и, и)-\-(у, р)=1. Поэтому (и, u) = (v, я)=1/2, так что векторы и и v не нормированны, но становятся нормированными после умножения на -у/2. Итак, для нормального оператора, действующего в евклидо- евклидовом пространстве S, существует ортонормальный базис, составлен- составленный из собственных векторов, принадлежащих вещественным соб- собственным значениям, и умноженных на -\/2 вещественных и мни- мнимых частей Собственных векторов, принадлежащих комплексным собственным значениям. Одномерные подпространства, натянутые на вещественные собственные векторы, и двумерные, натянутые на компоненты комплексных собственных векторов, инвариантны, так что матрица оператора в построенном базисе квазидиагональна и составлена из диагональных блоков первого и второго порядка. Блоки первого порядка —это вещественные собственные значе- значения. Найдем блоки второго порядка. Пусть и -f vi — собственный вектор, принадлежащий собственному значению а + Ы. Тогда 34- (н + vi) = (а + bi) (и -f- vi), откуда slu — au — bv, st-v = bu + civ. Ровно те^се соотношения сохранятся после умножения векторов и и v на д/2> Таким образом, блоки второго порядка имеют вид а Ь — Ь а
5 5] ОПЕРАТОРЫ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 365 Заметим еще, что эти блоки появляются из подпространства, натянутого на сопряженные собственные векторы, принадлежащие сопряженным собственным значениям а ± Ы, так что наряду с блоком ( _а. J, записанным при помощи собственного значе- значения а + Ы, не нужно включать блок Г , J , соответствующий собственному значению а — Ы. 4. Самосопряженные операторы в евклидовом пространстве. Нормальный оператор в евклидовом пространстве самосопряжен в том и только в том случае, если все его собственные значения вещественны. Действительно, самосопряженный оператор в евкли- евклидовом пространстве остается самосопряженным и в комплекснфи- кации. Поэтому существует ортонормальныи базис в самом евкли- евклидовом пространстве, в котором его матрица диагональна. В тер- терминах матриц это значит, что для любой вещественной симметрич- симметричной матрицы А существует ортогональная матрица С такая, что С-1 АС => С1 АС диагональна. Это обстоятельство было выяснено еще в гл. V в связи с ортогональным преобразованием квадратич- квадратичной формы к каноническому виду. Тесная связь между теорией самосопряженных операторов в евклидовом пространстве с тео- теорией квадратичных форм ясно видна из того, что скалярное произ- произведение (stx, x) выражается через координаты вектора х в орто- нормальном базисе в виде квадратичной формы с матрицей, рав- равной матрице оператора зФ в том же базисе, и при ортогональном преобразовании координат матрица оператора и матрица квадра- квадратичной формы преобразуются одинаково: ибо для ортогональной матрицы С~х = Ст. Для самосопряженных операторов в евклидовом пространстве имеют место те же свойства, которые отмечались для самосопря- самосопряженных операторов в унитарном пространстве, и их доказатель- доказательства ничем не отличаются от доказательств в случае унитарного пространства. Поэтому ограничимся их перечислением. Самосопряженный оператор положительно определен в том ч только в том случае, когда его собственные значения положи- положительны. Из самосопряженного положительно определенного оператора можно извлечь положительно определенный квадратный корень. Любой невырожденный оператор можно представить в виде произведения положительно определенного самосопряженного опе- оператора на ортогональный, как в одном, так? и в другом порядке. Оператор ортогонального проектирования есть самосопряжен- самосопряженный идемпотентный оператор и обратно, самосопряженный идем- потентный оператор есть оператор ортогонального проектирования.
366 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. XIII 5. Ортогональные операторы. Ортогональный оператор имеет ортогональную матрицу в любом ортонормальном базисе. Так как ортогональный оператор нормален, существует ортонормальный базис, в котором матрица оператора блочно-диагональна и со- состоит из вещественных чисел А,/ на диагонали и блоков вида (_/> ) • Из ортогональности такой матрицы следует, что fa = = ±1, и в каждом блоке второго порядка а2 + Ь2 = 1. (Это можно увидеть также из того, что ортогональный оператор становится унитарным при продолжении на комплексификацию, и, следова- следовательно, все его собственные значения равны 1 по модулю.) Можно положить a = cosq>, b = sin ф. Оператор на плоскости с матрицей (_g°n? со"Ф) есть опеРатоР вращения плоскости на угол —ф. Ортогональный оператор называется собственно ортогональ- ортогональным, если определитель его матрицы равен 1; если же определи- определитель равен —1, то оператор называется несобственно ортогональ- ортогональным. Порядок базисных векторов можно выбрать так, чтобы по диагонали следовали сначала 1, потом —1 и за ними блоки вто- второго порядка. В случае, если оператор собственно ортогонален, число диагональных элементов, равных —1, четно. Матрицу вто- второго порядка Г л _1 ) удобно рассматривать как блок второго ( cos n sin n \ „ порядка I _ . I, геометрически означающий поворот пло- плоскости на я. Таким образом, действие собственно ортогонального оператора геометрически означает следующее. Пространство разбивается в ортогональную сумму подпространств, одно из которых натянуто на собственные векторы, принадлежащие собственному значению 1, — это подпространство неподвижных векторов, и нескольких двумерных подпространств, каждое из которых вращается на не- некоторый угол (вообще говоря, разные плоскости на разные углы). В случае несобственно ортогонального оператора имеется еще один базисный вектор, переходящий в противоположный под действием оператора. § 6. Преобразование уравнения гиперповерхности второго порядка к каноническому виду 1. Пространство точек. Пусть дано векторное пространство S. Пространством точек для 5 называется однородное пространство М для аддитивной группы пространства 5 с нулевыми стабилиза- стабилизаторами для всех точек М (заметим, что, в силу коммутативнбсти группы, стабилизаторы всех точек совпадают).
5 6] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 367 Подробнее, М есть множество объектов, называемых точками, для которых определено действие сдвига на вектор, переводящее точку в точку. Записывая эту операцию знаком +, мы придем к следующим свойствам этой операции: 1. (m + x) + y = т + (х + у), где т ёМ, х, t/eS. 2. т + 0 = т, где 0 — нулевой вектор. 3. Для любых точек mi и т% из М найдется такой вектор х, что mi + х = т2. 4. Если т + х = т, то х — 0. Первые два требования означают, что М есть множество, на котором определено действие «сдвига» на векторы из S, т. е. М есть 5+-множество (здесь S+ обозначает аддитивную группу пространства 5). Третье условие означает однородность М как 5+-множества. Наконец, четвертое, — что стабилизаторы всех то- точек состоят только из 0. Зафиксировав некоторую точку то в М, мы можем сопоставить каждой точке т из М вектор, переводящий то в т. Этот вектор назовем координатным вектором для т при выбранном начале координат /и0. Соответствие между точками и их координатными векторами взаимно однозначно. Началу координат соответствует нулевой вектор. Если изменить начало координат, перенеся его на вектор хо в точку т'о, то координатные векторы х и х' любой точки т е М относительно начал то и то связаны очевидным соотношением х = х0 + х'. Выбор начала координат в пространстве точек и выбор базиса в векторном пространстве 5 дает возможность сопоставить каж- каждой точке ее координаты, именно, координаты координатного век- вектора точки относительно выбранного базиса. Если S — евклидово пространство, то соответствующее про- пространство точек называется евклидовым. Координаты точек отно- относительно некоторого начала и ортонормального базиса в 5 носят название прямоугольных координат. Преобразование координат при фиксированном начале, но с переходом от одного ортонор- ортонормального базиса S к другому, называется преобразованием пово- поворота осей. В дальнейших пунктах этого параграфа пространство точек будет предполагаться евклидовым. 2. Алгебраические гиперповерхности. Множество всех точек в пространстве, координаты xi, ..., хп которых связаны соотно- соотношением F(xu ..., хп) = 0, где F — полином с вещественными коэф- коэффициентами, называется алгебраической гиперповерхностью. Сте- Степень полинома F называется степенью или порядком гиперпо- гиперповерхности. Гиперповерхности первой степени называются гиперплоско- гиперплоскостями. В векторной форме уравнение любой гиперплоскости можно
368 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА (ГЛ. XIII записать в виде (ft, х) = р, где b — некоторый ненулевой вектор, х — координатный вектор точки. Без нарушения общности можно считать вектор Ь нормированным. Тогда уравнение (ft, х) — p на- называется нормальным уравнением гиперплоскости. Если уравнение гиперповерхности в и-мерном пространстве имеет вид F(x\, ..., хй) = 0 при k < п, то координаты xk+i, ...,xn остаются произвольными. В этом случае говорят, что гиперповерх- гиперповерхность является цилиндрической гиперповерхностью с (я — k)-мер- k)-мерными образующими, построенной на гиперповерхности с тем же уравнением, в /г-мерном подпространстве, натянутом на первые k базисных векторов, исходящих из начала координат. 3. Гиперповерхности второго порядка. В векторной форме урав- уравнение гиперповерхности второго порядка можно записать в виде где зФ — самосопряженный оператор, ft— вектор и с — число. Действительно, в виде (s&x, x) записывается квадратичная форма, составленная из членов второй степени полинома, 2 (ft, x) является записью суммы членов первой степени, наконец, с — свободный член. Выясним, как изменяется уравнение при переносе начала коор- координат. Пусть х — координатный вектор при исходном начале коор- координат, у— координатный вектор при новом начале и *о — коорди- координатный вектор нового начала относительно исходного. Тогда, под- подставив х = хо-\-у в уравнение поверхности, получим, как легко видеть, преобразованное уравнение в виде (&У, У) + 2 (&хо + Ь, у) + с + 2 (Ь, хо) + {stx0, х0) = 0. Если уравнение s4-xu -f ft = 0 разрешимо, то за счет переноса начала можно в уравнении уничтожить первые степени координат. Если же уравнение s&xo -f- b = 0 не имеет решений, то этого до- достигнуть нельзя. Таким образом, нужно рассмотреть два случая, в зависимости от разрешимости или неразрешимости уравнения зФхй + Ь = 0. 4. Первый случай гиперповерхности второго порядка. Пусть уравнение s4-xu + ft = 0 разрешимо. Тогда, сдвинув начало коор- координат на вектор Хо, придем к уравнению где с' = с + 2 (&, хо) + [зФхй, х0). Теперь сделаем поворот осей, приняв за базис пространства векторов ортонормальный базис из собственных векторов опера- оператора $4>. Пусть этот базис образован векторами и\, ..., им, ы*+ь ... ..., ы„, причем «1 Uk принадлежат ненулевым собственным значениям Я,ь ..., %к, а ик+и • • •» "я принадлежат нулевому соб- собственному значению. Обозначив через у[, .... y'k, y'k+], ..., уп координаты вектора у в этом базисе, получим уравнение гиперпо-
S б] ГИПЕРПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА 369 верхности в виде hy?+ ••• + Хку'к2 + с' = 0. Если k < п, то гиперповерхность будет цилиндрической с (п —/г) -мерными образующими, построенной на гиперповерхности с уравнением Klyfl2 -f- ... -f %куг^ + с' = О в 6-мерном подпростран- подпространстве. Если с' = 0, то поверхность коническая, именно, если точка т с координатным вектором у лежит на поверхности, то и прямая, проходящая через начало координат и точку т, т. е. множество то- точек с координатными векторами ty, —oo<^t<i-{-oo, целиком лежит на гиперповерхности. Если при этом Я,ь ..., X/, одного знака, то конус вырождается в одну точку — начало координат. Конусы клас- классифицируются по максимальному числу коэффициентов' одного знака. Если же с' ф 0, то, разделив обе части уравнения на —с', при- придем к уравнению 2 » Если все коэффициенты аи ..., ak отрицательны, то на гиперпо- гиперповерхности нет точек. Если все коэффициенты положительны, то для координат точек на гиперповерхности имеют место неравенства r/'fe|<; 1/д/аА. так что гиперповерхность ограничена. В этом случае гиперповерхность в 6-мерном пространстве носит название эллип- эллипсоида или, в случае а\ = ... = ак, сферы радиуса l/Vai- Если же среди коэффициентов аь ..., ак имеются как положи- положительные, так и отрицательные, то гиперповерхности (в й-мерном пространстве) носят название гиперболоидов. Гиперболоиды клас- классифицируются по числу отрицательных коэффицеинтов аи ..., а*. Конусы, эллипсоиды, гиперболоиды и построенные на них ци- цилиндрические гиперповерхности носят название центральных, так как начало координат после преобразования к каноническому виду оказывается центром симметрии. Действительно, точки с коорди- координатными векторами у и —у одновременно принадлежат или не при- принадлежат гиперповерхности. 5. Второй случай гиперповерхности второго порядка. Пусть теперь уравнение s&xo -\- b = 0 не разрешимо.'Это возможно, только если размерность образа оператора s4- меньше п, т. е. оператор имеет нетривиальное ядро и среди его собственных значений име- имеется число 0. Напомним, что для самосопряженного оператора образ и ядро ортогонально дополнительны. Образ есть подпространство, натя- натянутое на собственные векторы оператора, принадлежащие нену- ненулевым собственным значениям, а ядро состоит из собственных век- векторов, принадлежащих собственному значению 0. Разобьем вектор b на два слагаемых, b = b\-\- b2, из которых первое принадлежит образу оператора ?Ф, второе — его ортого-
370 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. ХИТ нальному дополнению, т. е. ядру. В рассматриваемом случае Ъ2 ф Ф0. Тогда уравнение s4-a-\-b\ = 0 разрешимо, и все его решения получаются из частного решения Х\ добавлением произвольного вектора из ядра оператора si-. Если х2 = х\ + z при z из ядра, то (stx2, х2) = (s&xu xi + z) = (s&xu xi) + (st>xu z) = {stxu Xi) + -\-(xu<s>tz) = (slX],xi). Таким образом, для любого решения х? уравнения з&х -\-b\ = Q число {з&х2, х2) остается неизменным. Будем искать вектор сдвига начала в виде Хо = Х\ + tb2, при вещественном t. Так как Ь2 принадлежит ядру бФ, будут иметь место равенства s&xQ + Ъ\ = 0 и (stxo, xo) = (stxu xi). После та- такого сдвига начала уравнение примет вид Ьи у) + 2(Ь2, у) + с + 2F,, хо) + Слагаемое 2(^хо + Ь\, у) в левой части исчезает. Далее, (Ь\, хо) = = (Ьи Xi + tb2) = (bu Xi),. ибо Ь\ и b2 ортогональны; (Ь2,хо) = = (b2, xi)-\-t(b2, b2); (stxo, Xo) — (s4-xi, x\). Таким образом, урав- уравнение принимает вид 2, y) + 2t(b2, Если взять BЙ2, 2 (*„ b2) то уравнение примет вид (&у,у)+2(Ь2,у) = 0. Пусть b2 = —pv, где у — нормированный вектор. При этом уравнение примет вид {si-y, y)=2p{v, у). Теперь сделаем поворот осей, приняв за новый базис нормирован- нормированные собственные векторы и\ Uk, принадлежащие ненулевым собственным значениям Х\, ..., Kk оператора ^, и нормирован- нормированные собственные векторы и*+ь ••-. м«. принадлежащие нулевому собственному значению, включив в их число вектор v. Пусть V — Uk+l- Уравнение в новых координатах у{, ..., уа примет вид Гиперповерхности с такими уравнениями (в (k-\- 1) -мерном пространстве) носят название параболоидов, причем эллиптиче- эллиптических, если все %\, ..., Хь одного знака, и гиперболических, если среди Я,ь ..., hk имеются числа противоположных знаков. Гипер- Гиперболические параболоиды классифицируются по максимальному числу собственных значений Xi, ..., Xk одного знака.
$ 7] ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ УНИТАРНОГО ПРОСТРАНСТВА 371 § 7. Линейные отображения унитарного пространства в унитарное 1. Сопряженные отображения. Пусть S и Т — два унитарных пространства и si— линейное отображение S в Т. Сопряженным с si отображением зФ* называется отображение Т в S, обладаю- обладающее свойством (six, у) = (х, sl*y) при любых х е S и 1/еГ. Вы- Выберем в пространствах S и Т ортонормальные базисы. Пусть А — матрица оператора si по отношению к этим базисам. Запи- Записав скалярные произведения (six, у) через координаты векторов х и у и сделав такие же преобразования, как в аналогичной си- ситуации для оператора из S в S, легко получим, что поставленному требованию удовлетворяет оператор, матрица которого сопряжена {т. е. транспонирована к комплексно сопряженной) с матрицей А. Единственность сопряженного оператора и, тем самым, независи- независимость от выбора базисов доказывается так же, как для операто- операторов из S в S. Именно, если (six, у) = (х, sl*y) и (six, у) — (х, Шу) при любых j(eS, у^Т, то (х, (si* —-38)у) = 0 при всех xeS, следовательно, (si*— &)у — 0 при всех i/eF, а это и означает, что J? = si*. Для операции сопряжения верны свойства: 1. (sl*)* = sl. 2. (sl\ -\- s4"i)*= sl\ -\-sl\. 3. (csl)*=csl*. 4. Если si отображает Si в S2 и $ отображает S2 в S3, то для ММ>, отображающего Si в S3, верно (&s&)* = ?ф*38*. Доказательства ничем не отличаются от доказательств анало- аналогичных свойств в ситуации операторов из S в S. Предложение 1. Образ оператора s4- есть ортогональное дополнение к ядру оператора si-*. Действительно, если у е ker si*, то при любом х = s^z e $4-S будет (х, y) — {s4-z, у) = (z, s&*y) = 0. Обратно, если у ортогонален всем векторам si-z из S&S, то {s4-z, y) — (z, s4-*y) = <d при всех z^S, следовательно, s4-*y = 0. Предложение доказано. В силу симметрии si и s4-* по отношению операции сопряже- сопряжения, из предложения 1 следует Предложение 2. Образ оператора si* есть ортогональное дополнение к ядру оператора si. 2. Каноническая форма матрицы линейного отображения унитарного пространства в унитарное. Пусть si — линейное ото- отображение унитарного пространства S в унитарное пространство Т и s4-* — сопряженное отображение. Рассмотрим оператор si*si, отображающий S в S. Он самосопряжен, ибо {sPsl)* = sl*sl** = = sl*sl. Далее, ker sl*s? = ker.s?. Действительно, если sl*slx = 0 при jteS, то (si*six, x) = (six, six) = 0, откуда slx = 0. Таким образом, ker si*si s ker si. Обратное включение тривиально. Пусть Р ¦= ker si, So = Px = sl*T, T0 = slS и Q = To= ker sl\ Так как S = So Ф P, то To = slS = slS0 + slP = slS0- Таким об- образом, si отображает So на все То. Аналогично, si* отображает
372 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА 1ГЛ. ХПГ То на все So. Очевидно, что ядро s4- на 50 состоит только из нуле- нулевого вектора, и то же имеет место для оператора М-* на Го. Оператор s4-*s4- на So не только самосопряжен, но и положи- положительно определен. Действительно, при xeS0 и хфО имеет место (j&*s??x, x) = ($f-x, stx)>0, ибо при л;#0и &хфО. Положим dimS = rt, dim T = m и dimS0 = dim Го = k. B S» найдем ортонормированный базис щ, ..., ы& из собственных век- векторов оператора s4-*si-. Тогда sPs^ui — hui, причем Яг > 0. Поло- Положим %i = \x]. Векторы s&Ui попарно ортогональны. Действительно, {t ^) ( j) ( /) ( у) Положим vi = \xrxs4'Ui. Векторы vi не только ортогональны, но- и нормированны, ибо(иг, v.) = цу2[s4-ut, s&u.') = \ir2(s&*s&ui, и() = = (ир ыг)=1. Таким образом, векторы vu •••> Vk образуют базис Го. Ясно, что s4-ui = [nvi. Пусть Uk+u ..., tin — ортонормальный базис Р, Vk+u ..., vm — ортонормальный базис Q. Тогда совокупности векторов и\, ..., uk, ик+и .... и„ и уь ••-, Vk, Vk+u •••. Vm образуют ортонормальные базисы пространств 5 и Г. По отношению к этим базисам опера- оператор зФ имеет следующую матрицу: Hi 0 0 0 ... ц2 ... 0 ... °m-ft. 0 0 •** ft °ft,n~ °m-ft, i n-k Числа [i\, ..., iik носят название главных или сингулярных зна- значений оператора ?&. На языке матриц полученный результат можно сформулиро- сформулировать следующим образом. Для любой комплексной m X п-матрицы А существуют унитар- унитарные магрицы В и С такие, что В*АС есть матрица вида М, при- причем k равно рангу матрицы. Действительно, любая комплексная тХ «-матрица может рас- рассматриваться как матрица линейного отображения n-мерного уни- унитарного пространства 5 в m-мерное унитарное пространство Г по отношению к некоторым ортонормальным базисам. Матрицы С и В преобразования координат от исходных базисов к базисам Hi ип и vu ..., vm унитарны. В силу формулы преобразова- преобразования матрицы линейного отображения при преобразованиях коор- координат, в новом базисе матрица вида М выражается посредством формулы В-1 АС = В* АС. Число k = dim Го = dim ,s#S равно рангу матрицы А. 3. Обобщенный обратный оператор. Пусть st> — оператор, отображающий л-мерное унитарное пространство S в /я-мерное
S 7] ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ УНИТАРНОГО ПРОСТРАНСТВА 373 унитарное пространство Т. Пусть So, Р, То и Q — те же простран- пространства, что и в п. 2. Полуобратный оператор, построенный исходя из разложений S = So © Р и Т = T0(BQ, называется обобщенным обратным и обозначается через st+. В этой ситуации операторы s4>+s4> и s4>s>4>+ будут операторами ортогонального проектирования, т. е. будут самосопряжены. Легко видеть, что если оператор 38, действующий из 7" в S, удовлетворяет условиям зФ&Ж = М-, &&3S = &, ЗИзФ и S4-& само- самосопряжены, то 3& = S4-+. Действительно, первые два условия пока- показывают, что 9& есть полуобратный оператор для некоторых разло- разложений S = So © ker s4-, T = s&S © Q, оператор 3§s& проектирует S на So параллельно ker зФ, а оператор S&& проектирует Т на To = s4-S. Из самосопряженности операторов S&& и 3ls& следует, что оба проектирования ортогональны, т. е. 5o = (ker«s^)J- и Q =* = (^5) -1. Поэтому 3S = S&+. Если ортонормальные базисы в S и Т выбраны так, что тХ«* матрица оператора М- равна 0 ... О О ц2 ... О О 0 ... Н m—k,k m—k.n—к то, очевидно, st+ будет иметь лХ-матрицу такого же видa^ только вместо ць цг, •-., V-k будут {xf1, ц^\ ..., ц^1. Понятие обобщенного обратного оператора естественно пере- переносится на матрицы, так как каждую матрицу можно рассматри- рассматривать как матрицу оператора по отношению к ортонормальным. базисам. Для вычисления матрицы А+, обобщенной обратной для /иХ«- матрицы А ранга k, можно, например, поступить так. Представить А в виде произведения ВС /иХ*-матрицы В ранга k на kY^n- матрицу С ранга k. Тогда матрицы В*В и СС* самосопряжены и невырожденны. Легко проверить, что Л+ = С*(СС*)-*(В*В)-1В*. Для этого нужно убедиться в выполнении равенств АА±А = А, А+АА+ = Л+ и в самосопряженности А+А и АА+, что не представ- представляет труда. 4. Роль обобщенного обратного оператора в теории систем линейных уравнений. Сначала введем одно важное понятие. Пусть- в унитарном пространстве S даны подпространство Р и вектор г. Расстоянием от вектора z до подпространства Р называется ми- минимум длин векторов г — и при и^Р. Пусть z = x-\-p при *<=Р, у^Р1. Тогда \z — и\2 = {х — и + у, х — и + у) = (х—и, х — и) + (у, у), ибо векторы х — и и у ортогональны. Ясно, что минимум реализуется при и = х и равен {у, у) = | у |2- Таким обра- образом, расстояние от z до Р равно длине ортогональной проекции
374 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. ХШ вектора г на Р2- и реализуется на векторе х, являющемся ортого- ортогональной проекцией z на Р. Обратимся теперь к системе линейных уравнений. Систему т линейных уравнений с п неизвестными в векторно-операторной форме можно рассматривать как задачу определения вектора х из уравнения s&x — f, где зФ — оператор из n-мерного простран- пространства 5 в m-мерное пространство Т, a f — данный вектор в Т. Для систем с комплексными коэффициентами (в частности, с вещест- вещественными) пространства S и Т можно рассматривать как унитар- унитарные пространства с данными ортонормальными базисами. Вектора х, удовлетворяющего уравнению s&x = f, может не существовать. Для любого вектора хе5 вектор f — АеТ называется векто- вектором невязки. Обобщенным решением или решением в смысле наи- наименьших квадратов называется вектор х0, при котором вектор не- невязки имеет минимальную длину. Векторы х, отличающиеся на слагаемые из ядра з&, дают один и тот же вектор невязки. Среди них имеется кратчайший. Он называется нормальным обобщен- обобщенным решением. Покажем, что вектор s&+f дает нормальное обобщенное реше- решение уравнения s&x = f. Действительно, $4-s4-+f есть ортогональная проекция вектора f на Го = s&S. Поэтому на этом векторе невязка имеет минимальную длину. Далее, s?+f gS0 = (ker s&I. Поэтому длина любого вектора 3&+f-}-y при t/eker^, квадрат которой равен \s&+f |2 -f-|f/|2, имеет минимум при «/ = 0. 5. Линейное отображение евклидова пространства в евклидово. Теория линейных отображений евклидова пространства в евкли- евклидово ничем не отличается от теории отображений унитарных про- пространств с заменой унитарных преобразований координат на орто- ортогональные. Имеет место такая же каноническая форма, существует обобщенный обратный оператор, играющий такую же роль, как в комплексном случае, для систем линейных уравнений с веществен- вещественными коэффициентами. § 8. Объем параллелепипеда в евклидовом пространстве 1. Квадрат объема в общем случае. Параллелепипедом, на- натянутым на m линейно независимых векторов v\, V2, ..., vm в n-мерном евклидовом пространстве, называется множество векто- векторов ^ui +/2У2 + ... -\-tmVm при ti, независимо изменяющимися на отрезке [0,1]. Назовем (т — 1)-мерный параллелепипед, натянутый на векторы уь у2, •••, vm-\, основанием параллелепи- параллелепипеда, а расстояние от вектора vm до подпространства, натяну- натянутого на t>i, #2, .-., Vm-u — высотой параллелепипеда. «Объемом» одномерного параллелепипеда {tv\} называется длина вектора v\. Для больших размерностей объем определяется индуктивно, как объем основания, умноженный на высоту.
5 8] ОБЪЕМ ПАРАЛЛЕЛЕПИПЕДА 375 Теорема 1. Квадрат объема параллелепипеда равен опреде- (»,, Pi) ... (Р,, fm_l) (P|, Vm) лителю Грама G = СОвОКуП- т, »l) ... (Рот, Pm-i) (Рот. носгы векторов vu ..., um-i, om. Доказательство проведем индукцией по числу m векторов. Для m = 1 это верно, ибо | v\ |2 = (v\, vi). Допустим, что это верно для совокупности из m — 1 векторов. Пусть у — ортогональная проекция вектора vm на ортогональ- ортогональное дополнение к подпространству Р, натянутому на vu ..., vm-\. Эта проекция осуществляется параллельно подпространству Р, так что y—vm-\-a\vx-\- ... + am-ivm-i при некоторых аи .... ат-ь и у ортогонален к векторам vu ..., vm-\- Прибавим к последнему столбцу определителя G предшествую- предшествующие, умноженные на а\, ..., am-i- В силу линейности скалярного произведения по второму аргументу, мы получим в последнем столбце числа (vi, у), ..., (vm-u у), (vm, у), из которых первые m — 1 равны нулю. Последний элемент (vm, у) последнего столбца равен (y — aiVi— ... — am-\Vm-\, у) = (у, у) = \у\2. Длина вектора у равна высоте параллелепипеда, согласно опре- определению расстояния от вектора до подпространства. Таким обра- (pi, Pi) ... (pi, om_i) зом, G = \y\ . Последний определитель, согласно индуктивному предположению, есть квадрат объема осно- основания. Следовательно, G равен квадрату объема рассматриваемого параллелепипеда, что и требовалось доказать. 2. Объем л-мерного параллелепипеда в л-мерном евклидовом пространстве. Пусть V\, v2, ..., vn — линейно независимая сово- совокупность векторов в л-мерном пространстве, и пусть матрица имеет своими столбцами координаты векторов v\, t»2, ..., vn отно- относительно некоторого ортонормального базиса е,, е2, ..., еп. Тогда^ элемент gn матрицы G = АТА равен ацац + a2ia2i -f-... + ащпгц — = (Vi, v,), т. е. матрица G = А1 А есть матрица Грама для совокуп- совокупности векторов vu о2, ..., vn. Имеем det G = det ATA = (det AJ. Таким образом, квадрат объема параллелепипеда равен ква-- драту определителя матрицы А и, следовательно, объем паралле- параллелепипеда равен абсолютной величине det A. Вскроем геометрический смысл знака определителя матрицы Л. Скажем, что совокупность векторов vi, v2, ..., vn ориентирована так же, как базис в\,е2, ..., еп, если det Л ^> 0, и ориентирована: противоположным образом, если det А < 0.
376 ЕВКЛИДОВО И УНИТАРНОЕ ПРОСТРАНСТВА [ГЛ. Xltl Скажем, что базис vi, v%, ..., vn получается непрерывной де- деформацией из базиса е\, е2, ..., еп, если существует матрица A(t), элементы которой непрерывно зависят от параметра t, ме- меняющегося на отрезке [0,1], такая, что Л@) = ? и ЛA) = Л, где А — матрица из координат векторов vi, v2, ¦•., vn, причем det А(ЦФ0 при всех значениях t. Покажем, что если базис v\, v2, ..., vn имеет одинаковую -ориентацию с базисом еи е2, ..., еп, то существует непрерывная деформация, переводящая е\, е2, ..., еп в v\, v2, • • •» vn. С этой целью представим невырожденную матрицу А в виде произведе- произведения ВН положительно определенной матрицы В на ортогональную матрицу Я. Далее, матрицу В представим в виде C~xlDC\, где D — диагональная матрица из положительных собственных значений Х1Д2, ..., Кп матрицы В. Пусть D(t) — диагональная матрица, со- составленная из элементов e"nA*> k=l, 2, ..., п. Тогда D@) = = ?, D(l) — D и элементы D(t) меняются непрерывно. При этом detD@ = (detD)(^0. Положим B(t) = C71D(t)Cu Матрица Я собственно ортогональна, ибо det А > 0 и det В > 0. Поэтому Я допускает представление Я =Сг FC2, где С2 — орто- ортогональная матрица, a F — блочно-диагональная, составленная из 1 и блоков второго порядка вида f _ c?s ^ sin * J (включая «блоки» с ф=я). Пусть F(t)—блочно-диагональная матрица, в которой каждый блок второго порядка Г _ ^ф ^" * J заменен на блок / cos to sin tq>\ „. i^/j\ ± V— sin to cos toj " ^атРии'а F(t) непрерывно зависит от / и при всех значениях / собственно ортогональна- Очевидно, что F@) = E и F(\) = F. Положим Н(t)=C2lF(t)C2. Ясно, что НA) непрерывно зависит от t, собственно ортогональна при всех значениях t, Я@) = ?ЯA) Я () Наконец, положим A{t) = B(t)H(t). Матрица A(t) непрерыв- непрерывна при 0=^^1, det A (t) = det В (t)?*0, А@) = Е и ЛA) = Л. Искомая деформация получена. Если же ориентация уь ^2, .. •, vn противоположна ориентации •еи е2, ..., еп, то непрерывной деформации базиса ей е2, ..., еп в v\, v2 vn не существует. Действительно, если матрица A(t) непрерывна при Q^t^l, А@) = Е и ЛA) = Л, причем detЛ < <; 0, то det A(t), будучи непрерывной функцией от t, должен пе- перейти от положительного значения det.4@)= 1 к отрицательному det Л A) = det Л < 0, что возможно, только если при некотором значении t0, 0 </0 < 1, det A (to) =0, т. е. векторы vi{t0), v2(to), ... ..., Vn(to) с матрицей из координат, равной A(t0), линейно зави- зависимы и не составляют базиса.
ГЛАВА XIV ЭЛЕМЕНТЫ АЛГЕБРЫ ТЕНЗОРОВ § 1. Основные понятия 1. Определение тензора. Тензоры представляют собой много- многокомпонентные системы, элементы которых занумерованы двумя системами индексов — несколькими верхними и несколькими ниж- нижними, каждый из которых пробегает значения от 1 до п. Число нижних индексов называется валентностью ковариантности, число- верхних— валентностью Яонтравариантности, их сумма — полной валентностью. Тензоры, у которых отсутствуют верхние индексы, называются чисто ковариантными, у которых отсутствуют нижние — чисто контравариантными. Если присутствуют те и другие, тензор назы- называется смешанным. Так, компоненты трижды ковариантного и дважды контравариантного тензора имеют вид аП. Тензоры счи- считаются связанными с «-мерным векторным пространством, в ко- котором выбран базис, таким образом, что компоненты тензора при фиксированных индексах, кроме одного верхнего, образуют коор- координаты вектора в выбранном базисе, компоненты же при фиксиро- фиксированных индексах, кроме одного нижнего, образуют координаты ковектора в дуальном базисе. При замене базиса компоненты тен- тензора изменяются в соответствии с приведенным истолкованием индексов, нумерующих компоненты тензора. В соответствии с данным определением набор координат век- вектора следует рассматривать как контравариантныи тензор валент- валентности 1 и нумеровать их следует верхними индексами. В матрице преобразования координат элементы каждого столб- столбца являются координатами векторов, именно, векторов нового- базиса относительно исходного. Поэтому строки матрицы преоб- преобразования координат следует нумеровать верхними индексами. Элементы же каждой строки можно рассматривать как координаты ковекторов, т. е. линейных функций, посредством которых исход- исходные координаты векторов выражаются через новые, и нумеровать их нижними индексами. При таких обозначениях матрица преоб- преобразования координат имеет вид (с^). Выражения исходных коор- координат через новые имеют вид
378 ЭЛЕМЕНТЫ АЛГЕБРЫ ТЕНЗОРОВ [ГЛ. XIV а выражения новых координат через исходные имеют вид *''= = ? YJj.**. где (у{) — матрица, обратная к (cj). To, что эти две матрицы взаимно обратны, можно записать в форме ? ylkc\ = Н- Здесь 6? — символ Кронекера, т. е. Sj, = O при k Ф / и б? = Ь {60—единичная матрица. Ввиду того, что обратная матрица является не только левой обратной, но и правой, верно, что При транспонировании матрицы нужно поменять ролями верх- верхние и нижние индексы. Напомним, что матрица преобразования координат транспонирована с матрицей замены базиса, так что формулы замены базиса имеют вид (суммирование по верхнему индексу матрицы (с/), а не по ниж- нижнему). Напомним еще, что при преобразовании координат коэффи- коэффициенты линейной функции hxl + ... -f- 1пХп, т. е. координаты 1\ /„ соответствующего ковектора, преобразуются по фор- формулам т. е. совершенно по тем же формулам, что формулы замены ба- базиса. Это и дает основание считать набор координат ковектора ковариантным тензором. В соответствии с данным выше определением тензора и форму- формулами преобразования координат вектора и ковектора мы прихо- приходим к следующему правилу преобразования компонент тензора при преобразовании координат: а' = У аах cxcv-clvpvq а Цк — Zj "AM.VC«6/CfeY(yYT' Здесь суммирование производится по индексам к, ц, v, а, т, ме- меняющимся от 1 до п. Это правило изменения компонент при преобразовании коорди- координат может рассматриваться и как определение тензора. 2. Сокращенные тензорные обозначения. В формулах пре- преобразования компонент тензора при преобразовании координат, в частности, наборов координат вектора и ковектора, происходит суммирование при изменении некоторых индексов в одних и тех же пределах — от 1 до п, причем во всех рассмотренных в п. 1 ситуа- ситуациях индекс, по которому осуществляется суммирование, входит два раза — как нижний и как верхний. Эти обстоятельства делают
$ 1] ОСНОВНЫЕ ПОНЯТИЯ 379- излишним указание пределов для индекса суммирования и, более того, само употребление знака 2 становится не необходимым, если условиться считать, что как только в выражении встречается оди- одинаковое обозначение для некоторых нижнего и верхнего индекса, то по этому индексу осуществляется суммирование. Так, формула преобразования компонент тензора записывается без знака ?) в виде a'i^ = a^v^CyC^YaY?- Действительно, здесь каждый из ин- индексов К, ц, v, а, т встречается как верхний и как нижний и, сле- следовательно, по всем этим индексам производится суммирование. Соответственно, формулы преобразования координат для ко- координат вектора и ковектора записываются в виде х" = \'кхк, 1{ =¦ — с\1г Значение ковектора (линейной функции) с координатами U на векторе с координатами х' записывается в виде Uxl. Элемен- Элементы /| произведения матриц А = (а/) и В — (&/) запишутся в виде Эти сокращенные обозначения оказываются удобными иногда и за пределами алгебры. 3. Примеры тензоров. Примеры контравариантного и кова- ковариантного тензоров валентности 1 мы уже видели — это наборы координат вектора в некотором базисе и, соответственно, ковек- ковектора в дуальном базисе. В качестве следующего примера рассмотрим матрицу коэффи- коэффициентов линейного оператора. Она может рассматриваться как тензор, один раз контравариантный и один раз ковариантный. Действительно, строки матрицы следует занумеровать верхними индексами, столбцы — нижними. Равенство у = Ах запишется в виде у1 — а'хК Матричная форма записи матрицы оператора при преобразовании координат А-+ С~ХАС совпадает с тензорной записью а',' = а^у^с™. Суммирование по т соответствует умноже- умножению справа на матрицу преобразования координат, суммирование по k соответствует умножению слева на обратную матрицу. В частности, символ Кронекера, связанный с единичным опера- оператором, является тензором, однократно ковариантным и контрава- риантным. Матрица коэффициентов квадратичной формы, рассма- рассматриваемой как функция от координат вектора, есть дважды ковариантный тензор. Действительно, сама квадратичная форма есть ацх1х!. При преобразовании координат х1 заменяются на ckx' , значение формы превратится в a{jc'kc'mx'kx'm, т. е. ее коэффи- коэффициенты превращаются в o.ijcikcim = a'km, преобразуясь по правилу преобразования дважды ковариантного тензора. Суммирование по / равносильно умножению матрицы формы справа на матрицу преобразования, суммирование no i можно рассматривать как умножение слева на матрицу, транспонированную с матрицей
380 ЭЛЕМЕНТЫ АЛГЕБРЫ ТЕНЗОРОВ [ГЛ. XIV преобразования координат, в полном совпадении с формулой пре- преобразования А-+СТАС. Тензор коэффициентов квадратичной фор- формы обладает свойством симметрии ац = о/г, которое, разумеется, сохраняется при преобразовании координат. Полилинейной функцией от нескольких векторов называется функция, линейная относительно каждого вектора. Рассмотрим полилинейную функцию от трех векторов одного и того же п-мер- ного пространства и двух ковекторов. В координатной записи она имеет вид аР^кх'xixkypyq. Здесь xr — координаты векторов, ys — координаты ковекторов в дуальном базисе. Набор коэффициентов а??к является тензором, трижды ковариантным и дважды контравариантным. В следующей главе мы познакомимся с некоторым один раз контравариантным и два раза ковариантным тензором, естественно возникающим в пределах самой алгебры. Тензоры более высоких валентностей играют существенную роль в геометрии римановых пространств и в теоретической физике. § 2. Действия над тензорами 1. Сложение и умножение на число. Суммой двух тензоров одинакового типа называется тензор, компоненты которого равны суммам соответствующих компонент слагаемых: (а +&. То, что сумма тензоров действительно является тензором, ясно из формулы преобразования компонент при замене базиса. Произведением числа а на тензор называется тензор, получен- полученный из исходного умножением всех компонент на а: Из этих определений ясно, что тензоры одинакового типа со- составляют векторное пространство, размерность которого равна степени п с показателем, равным полной валентности. 2. Умножение тензоров. Произведением тензоров aPJk и Ь\^ называется система чисел d^ap = а%6ар в предположении, что все индексы независимо принимают допустимые значения. Легко видеть, что произведение тензоров есть тензор. Действительно, при замене базиса e'm = c^ev компоненты преобразуются по формуле d,rSy. _ рч i I „krs.% op x _ dpqk II т. е. по формуле изменения компонент тензора пятикратно кова- риантного и трехкратно контравариантного. При умножении тен- тензоров их валентности складываются.
f 2] ДЕЙСТВИЯ НАД ТЕНЗОРАМИ 381 Аналогично определяется произведение любого числа тензоров. Тензор называется разложимым, если его можно представить в виде произведения тензоров валентности 1. Предложение 1. Любой тензор можно представить в виде линейной комбинации разложимых тензоров. Доказательство. Зафиксируем базис пространства ei,... ..., еп и рассмотрим векторы ei и ковекторы /', составляющие дуальный базис. Их координаты равны нулю, кроме одной, рав- равной единице. Тензор, равный произведению тензоров из коорди- координат этих векторов и ковекторов, имеет единственную компоненту, равную 1, и остальные нули, причем 1 можно получить в любом месте тензора. Следовательно, любой тензор является их линейной комбинацией. Наименьшее число разложимых тензоров, линейной комбина- комбинацией которых является данный тензор, называется его рангом. Легко видеть, что тензор полной валентности 2 имеет ранг, рав- равный рангу соответствующей матрицы. Вопрос об определении ранга полной валентности 3 и выше еще не получил алгорифми- ческого решения в общем виде, и возможно, что даже вопрос о су- существовании алгорифма не является бесспорным. 3. Свертка. Пусть имеется тензор afjk, имеющий как верхние, так и нижние индексы. Приравнивая один верхний индекс к од- одному нижнему, мы должны, по соглашению об обозначениях, про- просуммировать по этому индексу, и в результате получится система элементов, в верхних и нижних номерах которых останется на одну единицу меньше, так что можно положить Ьрг. = a^k. Эта операция называется сверткой тензора. Предложение 2. Свертка произведения тензора на сим- символ Кронекера, как по верхнему, так и по нижнему индексу этого символа, не меняет тензор по существу и сводится только к пе- переименованию индекса. Действительно, сумма affkd* имеет лишь одно слагаемое, от- отличное от нуля, именно то, для которого значение символа Кроне- Кронекера равно 1, т. е. при q — s. Поэтому a?fk6sll = a?*k. Аналогично, npq Aft __ apq Предложение З. Результатом свертки тензора является тензор. Доказательство. Пусть дан тензор а?Д. Обозначим affk через 6?;. Пусть е'а = с?ер — замена базиса. Тогда компоненты тензора a\^k преобразуются по формуле Переход к 6^ требует положить v = т и просуммировать по v. Это дает ^^а^^ЗД' Но сумма c*v* равна б*. и сумма
382 ЭЛЕМЕНТЫ АЛГЕБРЫ ТЕНЗОРОВ 1ГЛ. XIV а[Дб* по q и k равна сумме affk'=bp{j. Итак, Это значит, что Ьр} действительно есть тензор. § 3. Симметричные и антисимметричные тензоры 1. Применение подстановки к индексам ковариантного тензора. Пусть а,1/2... [т— ковариантный тензор валентности т и о —не- —некоторая подстановка чисел 1, 2, ..., т. Применив эту подстановку к номерам индексов, мы получим систему чисел, занумерованную т индексами ]\, /2, ..., }т, где j\ = iia, ..., jm = imo- Из формул преобразования компонент тензора, которые имеют одинаковый вид для всех индексов, заключаем, что мы снова получим /п-кова- риантный тензор. Операцию применения подстановки к номерам индексов можно рассматривать как обобщение операции транспо- транспонирования матрицы. 2. Симметричные тензоры. Тензор называется симметричным, если он не меняется в результате всех подстановок номеров индек- индексов, т. е. если его компоненты не изменяются при всех переста- перестановках индексов. Примером симметричного ковариантного тензора валентности m при индексах, меняющихся от 1 до п, может служить набор коэффициентов формы степени m от п переменных, если сомножи- сомножители в каждом одночлене рассмотреть во всех возможных поряд- порядках и коэффициент разделить поровну по всем записям одночлена. Запись такой формы принимает вид (верхние индексы мы ставим в скобки, чтобы не перепутать с по- показателями степени, которые здесь естественно возникают при равных значениях индексов) с симметричным тензором коэффи- коэффициентов. Иногда применяется операция симметризации тензора. Эта опе- операция заключается в том, что производятся все ml подстановок номеров индексов, результаты складываются и делятся на mL В результате операции симметризации получается симметричный тензор. Нетрудно проследить, что тензор коэффициентов произведения двух форм равен результату симметризации произведения тензо- тензоров коэффициентов перемножаемых форм. Симметризацию тензора иногда применяют по части индексов и применяют ее не только к ковариантным, но и к смешанным тензорам, в последнем случае по всем (или части) нижним ин- индексам и отдельно по всем (или части) верхним индексам.
§ 4] ТЕНЗОРНЫЕ ПРОИЗВЕДЕНИЯ ВЕКТОРНЫХ ПРОСТРАНСТВ 383 3. Антисимметричные тензоры. Ковариантный тензор a,li2... (щ называется антисимметричным, если две его компоненты, получаю- получающиеся одна из другой переменой местами двух индексов, отли- отличаются только знаком. Ясно, что тогда любая компонента с хотя бы одной парой одинаковых значений индексов равна нулю. Да- Далее, если система индексов получается из другой цосредством четной подстановки, то компоненты равны, если же системы ин- индексов связаны нечетной подстановкой, то они отличаются знаком. Полилинейная форма F(x{,..., хЛ — а. х^хЧ — xlm с 'Г2 ••• 'm 2 Ш антисимметричным тензором коэффициентов антисимметрична, т. е. F(xu ..., xi, ..., х/, .... xm) = —F{xu .... xj, ..., х„ ... ..., xm). Если валентность m меньше числа п возможных значе- значений для индексов, то в индексации каждой компоненты встретятся одинаковые значения, так что все компоненты тензора равны нулю. Интересен случай, когда m = п. В этом случае ненулевые ком- компоненты будут иметь индексы (iu i2, ..., in), среди которых нет равных, т. е. они представляют собой перестановки чисел 1. 2, ... ...,п. Если положить а.1,2,..., п = а, то остальные компоненты рЁВНЫ а. (_ i)lnv('i-'2 ln). Соответствующая полилинейная форма будет равна а X (- l)inv С. ь '») х№ ¦ • • ¦# = a det xi xl Подобно симметризации рассматривается антисимметризация, При которой все тензоры, получающиеся при подстановках индек- индексов, складываются со знаками + или — в зависимости от чет- четности или нечетности подстановки индексов. § 4. Тензорные произведения векторных пространств I. Определение тензорного произведения. Пусть 5 и Т два векторных пространства над полем К. Рассмотрим пары векторов {х, у) при х е S, у е Г и их формальные суммы (х\,У\) + {х2,у2)+ ... +{xk,yk). ' Введем следующие эквивалентности: 1) (ах, у) ~ {х, ау) при a <= К; 2) (хи у) + (х2, у) ~ (xi + х2, у); 3) (х, у\) + {х, у2)~(х, у\ + у2). Две формальные суммы пар будем считать эквивалентными, если от одной к другой можно перейти посредством конечного
384 ЭЛЕМЕНТЫ АЛГЕБРЫ ТЕНЗОРОВ [ГЛ. XIV числа эквивалентностей 1), 2), 3). Класс эквивалентности, содер- содержащий сумму пар (xi,yi) + (x2, у2) + • •• +(хк, у к), будем обозна- обозначать X! ® г/, + х2 ® г/г + ... + xk ® ук. На множестве формальных сумм пар введем структуру вектор- векторного пространства, положив При бесконечном поле К это пространство, очевидно, беско- бесконечномерно. Ясно, что если две суммы пар эквивалентны, то они останутся эквивалентными после умножения на а. Если первая сумма пар эквивалентна второй и третья эквивалентна четвертой, то сумма первой и третьей эквивалентна сумме второй и четвер- четвертой. Поэтому структура векторного пространства может быть пе- перенесена на множество классов эквивалентных сумм пар. Полу- Получившееся векторное пространство называется тензорным произве- произведением пространств S и Т и обозначается S ® Т. 2. Базис и размерность тензорного произведения. Пусть еи ... ..., еп — базис пространства 5 и g\, ..., gm — базис пространства Т. Тогда, в силу эквивалентности 2) и определения произведения пары на элемент поля К, любая сумма пар эквивалентна сумме С\(е]у yi) + c2(e2, у2)+ ¦¦¦ + сп(еп, уп) при некоторых с\, ..., сп& е К и у\, ..., Уп^Т. Далее, в силу эквивалентностей 3) и 1), такая сумма эквивалентна сумме си 0?i, gi) + с!2 (еи g2) + ... + сш (еи gm) + + c2i (e2, gi) + с22 {е2, g2) + • • • + c2m (e2, gm) + + cBi (en, gx) + сп2 (еп, g2) + ... + cnm (en, gm). Таким образом, векторы е,- ® gj, i = 1, ..., п, / = 1, ..., m, по- порождают пространство S ®Т. Докажем, что они линейно независимы. Пусть fi, ..., fn и и Ль ..., hm — базисы сопряженных пространств S* и V, дуаль- дуальные к выбранным базисам пространств 5 и Т. Рассмотрим пары (ft, hj) и определим их действие как линейных функций на про- пространстве сумм пар по формуле (ft, hj)(Ci(xu yt)+ ... -\-ck(xk, yk)) — = c\fiX\-hiy\-\- ... +ckf{Xk-h Линейность этой функции на пространстве сумм пар очевидна.
S 4] ТЕНЗОРНЫЕ ПРОИЗВЕДЕНИЯ ВЕКТОРНЫХ ПРОСТРАНСТВ 385 Покажем, что эта функция принимает одинаковые значения на эквивалентных суммах пар. Это достаточно проверить для экви- валентностей 1), 2), 3). Получаем 1) (U, hj) (ах, у) = U (ах) h,y = afi (x) hi (у), (к ^) (х, ay) = U (x) к,- (ay) = afi (x) ht (y); 2) (ft, hj) [ (xi, y) + (x2, У) ] = fixi ¦ hjy + fix2 ¦ h,y, (ft, hj) (xx + x2, y) = ft (xi + x2) • hjy — ftxi ¦ h,y + ftx2 ¦ hjy. Проверка для эквивалентности 3) аналогична. Таким образом, функция (ft, hj) определена на классах эквивалентных пар как линейная функция. Допустим теперь, что имеется зависимость Применим к этому равенству функцию (/;, А/). Ясно, что ее зна- значения на всех произведениях базисных векторов, кроме et ® gj, равны нулю, а значение на е< ® gj равно 1. Поэтому с,/= 0 при всех i и /. Таким образом, элементы е* ® g,- составляют базис про- пространства S ® Т, причем размерность этого пространства рав- равна пгп. 3. Тензорное произведение нескольких пространств. Тензорное произведение нескольких пространств Si, S2, ¦ ¦ ¦, S* вводится ана- аналогично тензорному произведению двух пространств. Рассматри- Рассматриваются наборы компонент (лсь х2, ..., хк) при XjeS; и их фор- формальные суммы. Вводятся действия сложения (формально) и умножения на элементы основного поля, посредством присоеди- присоединения множителя к первой компоненте. Множество таких формаль- формальных сумм становится векторным пространством (бесконечномер- (бесконечномерным при бесконечном основном поле). Вводятся эквивалентности 1) (ахих2, ..., xk) ~ (хиах2, ..., хк) ~ ... ~ {хих2, .-., axk); Щ*1 *i + x\ xk) ~ (*i Х[,...,хк) + (-г,, ...,х" хк). Две формальные суммы рассматриваемых наборов считаются эквивалентными, если от одной из них можно перейти к другой посредством конечного числа эквивалентностей вида 1), 2). Струк- Структура векторного пространства формальных сумм наборов компо- компонент переносится на множество классов эквивалентности. Полу- Получившееся пространство называется тензорным произведением Si®S2® ••• ®Sft пространств Sb S2, ..., Sft. Класс, содержащий набор (хь х2, ..., хк), обозначается *i®je2® ... ®xk. Тензор- Тензорные произведения базисов пространств Si, S2, ..., Sk составляют базис Si <8> S2 ® ... ® Sk. Это доказывается аналогично подробно разобранному выше случаю k = 2. Поэтому размерность тензор- тензорного произведения пространств равна произведению размерностей этих пространств. 4. Инвариантное определение тензора. Сейчас мы дадим опре- определение тензора, отличное от данного в § 1, но, разумеется, тесно
886 ЭЛЕМЕНТЫ АЛГЕБРЫ ТЕНЗОРОВ [ГЛ. XIV с ним связанное. Пусть дано векторное пространство S и сопря- сопряженное с ним пространство S*. Элементы тензорного произведения т экземпляров S и k экземпляров 5* называются т раз контра- вариантными и k раз ковариантными тензорами. Если выбран ба- базис 0i, ег е„ пространства 5 и дуальный с ним базис f1, ..., fn пространства 5*, то тензоры представляются в виде li ... lk U ' ' ' !m Из формул преобразования координат следует, что набор коэффи- коэффициентов а[1'"[т составляет k раз ковариантный и т раз контра- вариантный тензор в смысле определения, данного в § 1. Данное здесь определение тензора хорошо своей инвариант- инвариантностью, в его формулировке никак не участвует выбор базиса про- пространства. Однако в приложениях тензоров чаще оказывается бо- более удобным определение через компоненты и формулы преоб- преобразования. 5. Действия над тензорами в свете инвариантного определения. Действия сложения и умножения на скаляры -совпадают с одно- одноименными действиями в пространстве тензоров данного типа. Действие умножения тензоров равносильно их тензорному умно- умножению как векторов в своих пространствах. Это с очевидностью следует из представления тензоров через базис: '' ®... ® f '*) ® b"i---gte ®...®e <g> fpi ®.. .&> f*W Pl ••• Ps Q\ Qf ' ' ,/ tl ... lk pt ... ps /, ' " * /m Операция свертки заключается в том, что в каждом слагаемом суммы тензорных произведений i i f. X, ® . . . ® X, ® • • • ® X, ®«1®...®#'®...®У* i\ 's 'т. выбираются одинаково для всех слагаемых один ковектор у1* и один вектор X) , они выбрасываются, но при этом появляется в качестве множителя значение ковектора ylt на векторе xlg. Инва- Инвариантность этой операции легко проследить. Если ее выполнить в записи тензора через базис: 111' ft pi, pi, 'l — ff- lk h " ' U " ' 'm мы получим, что значение f'< на ejs отлично от нуля и равно 1 только при js = it, и при фиксированных остальных индексах нужно сложить получившиеся свободные члены, что и сводится к е 'т
§ 4] ТЕНЗОРНЫЕ ПРОИЗВЕДЕНИЯ ВЕКТОРНЫХ ПРОСТРАНСТВ 387 суммированию по it компонент с'1 "."(')" \т> т. е. описанная опера- операция свертки в инвариантной форме совпадает со сверткой при задании тензора компонентами. 6. «Прямоугольные» тензоры. Компоненты тензора полной ва- валентности т естественно сопоставляются точкам с целыми коор- координатами от 1 до п (п — размерность пространства) в /п-мерном пространстве. Они образуют как бы /и-мерно кубическую таблицу, подобно тому, как при полной валентности 2 компоненты распола- располагаются в виде квадратной матрицы. Аналогами прямоугольных матриц могут служить компоненты тензоров, связанных с несколь- несколькими пространствами. Пусть даны пространства Si, S2, ..., S, над одним и тем же полем /(.Рассмотрим тензорное произведение нескольких экземпля- экземпляров S, и S*, нескольких экземпляров S2 и Sj и т. д. Векторы получившегося пространства будут иметь вид nhh ¦¦• h, q\qi ¦¦¦If-- gv Здесь индексы iu ..., ik, /1, .... ji принимают значения от 1 до ni = dimSb индексы q\, ..., qt и ри ..., ps принимают значения от 1 до п2 = dimS2 и т. д.;ех, ..., ещ — базис S,, /, ... fn_ — дуаль- дуальный базис S*, gu ..., gni и hv ..., hn2 — базисы S2 и S и т. д. Компоненты при преобразованиях координат в пространствах Si, S2, ... изменяются по правилам преобразования компонент тен- тензора, только первая группа индексов связана с Sb вторая группа с 3>2 и т. д. Сложение, умножение на скаляры и умножение тензо- тензоров выполняются по тем же правилам, что и для обычных тензо- тензоров. Свертка допустима только по нижнему и верхнему индексам из одной группы.
ГЛАВА XV АЛГЕБРЫ § 1. Общие сведения 1. Определение и простейшие свойства алгебр. В различных разделах математики возникает потребность рассматривать век- векторные пространства (над данным полем К), в которых кроме действий сложения и умножения на скаляры определено еще дейст- действие умножения, сопоставляющее каждой упорядоченной паре век- векторов третий вектор того же пространства — их «произведение». В этой ситуации всегда естественно предполагать, что результат умножения ху линеен по каждому из множителей при фиксиро- фиксированном втором, т. е. с2х2) у = cixiy + с2х2у, х{сху{ + с2у2) = cixyi + c2xy2. Пространство с умножением, удовлетворяющим такому требова- требованию билинейности, называется алгеброй над полем К- Иначе можно сказать, что алгебра есть одновременно кольцо и линейное (векторное) пространство с естественным согласованием кольцевого умножения и векторных действий. Именно, сложение в кольце и сложение в векторном пространстве совпадают, а свой- свойства дистрибутивности для умножения «усиливаются» до линей- линейности по каждому множителю, для чего достаточно потребовать, чтобы (сх)у = х(су) = сху при любых с ^ К н х, у т алгебры. Читатель уже неоднократно встречался с алгебр'ами. Напомним некоторые знакомые примеры алгебр. 1. Поле С. комплексных чисел над полем R вещественных чи- чисел образует, очевидно, алгебру размерности 2. 2. Кольцо квадратных матриц порядка п с элементами из поля К образует алгебру над этим полем размерности п2. 3. Кольцо многочленов K[t] образует алгебру бесконечной раз- размерности над полем К- 4. Пусть {— фиксированный многочлен степени п из K[t]. Классы сравнений по модулю f образуют алгебру размерности п. Все эти алгебры ассоциативны. Все они, кроме алгебры квад- квадратных матриц, коммутативны. Примером неассоциативной алгеб- алгебры может служить пространство векторов в трехмерном евклидо- евклидовом пространстве с умножением в смысле векторного умножения. Мы будем рассматривать только конечномерные алгебры. С каждым элементом х алгебры А связаны два оператора, действующие в линейном пространстве алгебры. Это оператор пра-
J 1] ОБЩИЕ СВЕДЕНИЯ 389 вого умножения Жх. у*-+ух, сопоставляющий каждому элементу уеЛ его произведение на х справа, и оператор левого умножения 3?х: у>—>ху. Оператор Мх линеен в силу линейности умножения в алгебре относительно левого множителя. Далее, отображение x^—^Slx пространства алгебры А в пространство 5 линейных опе- операторов тоже линейно в силу линейности умножения в алгебре относительно правого множителя. Аналогично, линеен оператор S\ и линейно отображение ху->&х. Операторы правого и левого умножения связаны очевидным соотношением: 3?x{y) — 0Ly{x). Задание некоторого линейного отображения лп—^ор* данного векторного пространства А в пространство S линейных операто- операторов, действующих в А, можно рассматривать как задание алгебры, для которой операторы ор* суть операторы правого умножения. Действительно, если для элементов х, у е А положить ух = фл-(у), то линейность этого умножения относительно первого множителя обусловливается линейностью операторов ф*, а линейность отно- относительно второго множителя — линейностью отображения х>—><$х- Аналогично алгебра может быть задана и посредством задания операторов левого умножения. Две алгебры А к В называются изоморфными, если существует взаимно однозначное линейное отображение А на В, преобразую- преобразующее произведение прообразов в произведение образов. Например, алгебра С комплексных чисел (как алгебра над полем R) изоморфна алгебре вещественных матриц вида Г а, ]. Действительно, отображение <р: ф (а + Ы) — ( ? J линейно, взаимно однозначно и ас — bd — ad — be \ /a — b\ ( с — d ad + be ac — bd ) \ b a ) V. d с Взаимно однозначное соответствие (о с ь \ -с 0 a I — 6 — а О / между тройками вещественных чисел и антисимметричными ма- матрицами третьего порядка есть изоморфизм алгебр, если тройки умножать по правилу векторного умножения векторов, заданных в декартовой системе координат, а «произведением» матриц L и М считать L °М = LM — ML- 2. Структурные константы алгебры. Для того чтобы описать правило умножения в данной конечномерной алгебре, достаточно задать «таблицу умножения» для какого-либо ее базиса, т. е. за- записать произведение каждой пары элементов выбранного базиса в виде линейной комбинации его элементов: е.е. = а*еь; а^.^К I J IJ к I j (мы пользуемся тензорными обозначениями). Константы а^ назы-
890 АЛГЕБРЫ {ГЛ. XV ваются структурными константами алгебры. Покажем, что они со- составляют дважды ковариантный и один раз контравариантный тензор. Пусть fp = с'ре{ — новый базис алгебры. Тогда ek = yrjr Далее, fpf4'=cpciqeie1 = cpcqa^ek = afjcpciqyrjr, так что новые струк- структурные константы а^с1рсчугк получены из исходных по правилу преобразования дважды ковариантного и один раз контравариант- ного тензора. По этой причине набор структурных констант назы- называют также"структурным тензором. Если алгебры А и В изоморфны, то в соответствующих (в силу изоморфизма) базисах структурные константы совпадают. Ясно и обратное, если у двух алгебр структурные константы совпадают, то сопоставление базисных элементов осуществляет изоморфизм алгебр. Поэтому для изоморфизма двух алгебр необходимо и до- достаточно, чтобы в них существовали базисы, определяющие одина- одинаковые структурные тензоры. Следовательно, для того чтобы алгеб- алгебры, заданные структурными тензорами в некоторых базисах, были изоморфны, необходимо и достаточно, чтобы эти структурные тен- 80ры были связаны соотношением а'' = a\,clcqyrk при некоторых с1. 3. Некоторые классы алгебр. Как уже было сказано выше, алгебры с ассоциативным умножением называются ассоциатив- ассоциативными алгебрами. Ассоциативность будет иметь место, если выпол- выполнены п3 равенств: (е«е/) е* = е* (е/е*), где еи ..., еп— какой-либо базис алгебры. Запишем это условие в терминах структурных кон- констант. Имеем: е1е1 = а?/?р, (eft) ek = а^ерек = af^e^ Далее, ед= — arjker, e{ (e;eft) = arjkeier = arjkaqlreq. Таким образом, условие ассо- ассоциативности имеет BHfl,a%jap7k = arjka'jr. Положив aplja^k'=arlkaqir = bqijk, получим, что bfjk есть тензор структурных констант для тройных произведений eiejek==bqjkeq ассоциативной алгебры. В терминах операторов умножения условие ассоциативности формулируется проще и естественнее. Именно, ассоциативность эквивалентна каждому из трех следующих свойств операторов умножения (записанных как левые операторы, т. е. первым дейст- действующим считается тот, который записан справа): Алгебра называется коммутативной, если ху = ух при любых х и у из алгебры. Алгебра называется антикоммутативной, если квадрат любого ее элемента равен нулю. В этом случае для лю- любых х и у из алгебры выполнено соотношение ху =— ух, ибо 0 = (х + у) (х + у) = х2 + ух + ху + у2 = ух + ху. Алгебра называется алгеброй Ли, если она антикоммутативна и для любых трех ее элементов выполнено соотношение Якоби:
§ 1] ОБЩИЕ СВЕДЕНИЯ 391 Среди алгебр, встречающихся в приложениях, алгебры Ли играют особую роль. В частности, они тесно связаны с группами Ли. Любая ассоциативная алгебра может быть «превращена» в алгебру Ли посредством введения нового «умножения» о по нра- вилу х°у = ху — ух. Ясно, что хох =» 0 при любом х. Соотношение же Якоби легко проверяется: х° (y°z) + y° (z°x)+z° (x°y) = x(yz — zy) — (yz — zy)x + + y{zx — xz)—-(zx — xz) у + z(xy — yx)—(xy — yx)z=* 0. Алгебра (не обязательно ассоциативная) называется алгеброй с делением, если уравнение ху = z разрешимо относительно х при данных у Ф 0 и z. Другими словами, алгебры с делением характе- характеризуются тем, что все операторы правого умножения, кроме ну- нулевого, невырожденны. В алгебрах с делением уравнение ху = z при у Ф 0 разрешимо относительно х однозначно, ибо невырожден- невырожденный оператор имеет нулевое ядро. В частности, из равенства ху=0 следует, что при у ф 0 х = 0 и что х Ф 0 возможно только при у = 0. Но это значит, что любой оператор левого умножения, кроме умножения на 0, имеет нулевое ядро и, следовательно, не- невырожден. Поэтому и каждое уравнение ху = г при х ф 0 разре- разрешимо относительно у. Легко видеть, что над полем С не существует алгебр с деле- делением, кроме самого '.С Действительно, если размерность п ал- алгебры с делением больше 1, то в ней существует два линейно не- независимых элемента х п у. Рассмотрим соответствующие им опе- операторы правого умножения Й, н Йв и их матрицы Rx и Ry в не- некотором базисе. В силу невырожденности операторов правого умножения detRxф0 и det Ry Ф 0. Рассмотрим элемент x-\-ty при t^C Оператор правого умножения на него есть Rx-\-tRy. Его определитель det(Rx+tRy) = detRx+ ... -\-tndetRy есть по- полином степени п от t, следовательно, обращается в 0 при некотором значении t. Это невозможно в алгебре с делением, ибо х + ty Ф 0, и, следовательно, оператор 3tx + Шу должен быть невырожден. Что касается алгебр размерности 1, то, как легко видеть, их су- существует только две, с точностью до изоморфизма, — алгебра с ну- нулевым умножением (т. е. алгебра, в которой произведение любых двух элементов равно 0) и С. Над полем вещественных чисел ал- алгебры с делением существуют — в частности, поле С. С важной алгеброй размерности 4 мы познакомимся в следующем параграфе. 4. Идеалы алгебры. Правым идеалом алгебры А называется подпространство / такое, что при любых у е /, х е А будет ух (= J. Другими словами, правый идеал алгебры есть подпространство, ин- инвариантное для всех операторов правого умножения. Аналогично определяется левый идеал алгебры. Подпространство, являющееся правым идеалом и левым идеалом одновременно, называется дву- двусторонним идеалом. Ясно, что в коммутативной или в антикомму- антикоммутативной алгебре все идеалы двусторонние.
392 АЛГЕБРЫ [ГЛ. XV Двусторонние идеалы играют в теории алгебр такую же роль, как нормальные подгруппы в теории групп: именно они, и только они, являются ядрами гомоморфизмов алгебр. Гомоморфизмом, или гомоморфным отображением алгебры А в алгебру В называется ли- линейное отображение q>: A-*В, сохраняющее умножение, т. е. та- такое, что ф (ху) = ф (х) ф (у). Легко видеть, что ядро / любого гомоморфизма ф алгебры А есть двусторонний идеал. Действительно, если y^J, то ц>(у)=0, но тогда ф(л-г/) = ф(л:)ф(г/) = О и ф (ух) = <р (у) ф (х) = 0 при любом лее Л. Значит, xy^J и yx^J, т. е. / есть двусторонний идеал. Для того чтобы показать, что любой двусторонний идеал есть ядро некоторого гомоморфизма, нужно осуществить построение факторалгебры A/J, т. е. ввести естественным образом действие умножения в факторпространстве A/J. Вспомним, что факторпро- странство A/J состоит из классов сравнений по модулю /. Линей- Линейной комбинацией классов считается класс, содержащий такую же линейную комбинацию представителей, и этот класс не зависит от выбора представителей в силу очевидного свойства сравнений по подпространству. Введем столь же естественным способом действие умножения классов. Именно, произведением двух классов назовем класс, содержащий произведение любой пары представителей от умножаемых классов. Корректность этого определения, т. е. незави- независимость класса от выбора представителей, обеспечивается следую- следующей леммой. Лемма. Если J — двусторонний идеал алгебры А и если Х\ s= ¦= yx (mod /) и^е у2 (mod /), то ххх2 = У\у2 (mod /). Доказательство. ХхХ2 — ухуч = Хх(х2 — #2) + (*i — </i)#2e/, ибо Х2 — y2^J, х\ — ух ^ / и / есть двусторонний идеал. Лемма доказана. Итак, в факторпространстве A/J мы ввели умножение. Его ли- линейность относительно каждого из сомножителей следует из би- билинейности умножения в алгебре А. Ясно, что A/J есть гомоморф- гомоморфный образ алгебры А при «естественном» отображении, соотнося- соотносящем каждому элементу х^А содержащий его класс. То что это отображение гомоморфно, следует из определения действий в A/J. Справедлива также следующая теорема. Теорема 1. Гомоморфный образ алгебры изоморфен фактор- алгебре по ядру гомоморфизма. Доказательство почти очевидно — легко проследить, что прооб- прообразами будут классы по ядру, т. е. элементы факторалгебры, и их умножение соответствует умножению образов. Алгебра, не имеющая двусторонних идеалов, кроме себя и нуля, называется простой алгеброй. Легко видеть, что алгебры с делением могут быть охарактери- охарактеризованы как алгебры, не имеющие правых (левых) идеалов, кроме себя и нуля, и отличные от алгебры размерности 1 с нулевым умножением.
S 1] ОБЩИЕ СВЕДЕНИЯ 393 5. Присоединение единицы. Единицей алгебры А называется элемент 1, удовлетворяющий требованиям 1-х = х-1 — х при лю- любом шА Единица в алгебре может существовать, может и не существовать. Если существует, то только одна: если Г и 1" — две единицы, то У\" = 1", так как Г —единица, и \'\" = Г, ибо I"— тоже единица, т. е. Г = \". Однако всегда можно погрузить алгебру А в алгебру Л на единицу большей размерности так, что в алгебре Л единица есть. Действительно, положим Л = Ке Ф А и введем в А умножение по правилу: (схе + *i) (с2е + х2) = схсге + схх2 + с2х{ + ххх2 при любых Сь с2е К, Xi, XjeA Ясно, что введенное умножение билинейно, так что Л — алгебра. Далее, е(се + х) = се + х и (се + х) е = се + х, так что е есть единица алгебры Л. Действия над элементами из А внутри Л не отличаются от действий над ними внутри А- Переход от алгебры А к алгебре Л называется внешним при- присоединением единицы. Если в исходной алгебре А единица была, то в расширенной алгебре она перестает быть единицей. Ясно, что алгебра А является двусторонним идеалом для Л и факторалгебра А/А изоморфна полю К. Легко проверяется, что если алгебра А ассоциативна, то и Л ассоциативна; если А коммутативна, то и Л коммутативна. Но, например, антикоммутативность (и лиевость) алгебры не сохра- сохраняется при внешнем присоединении единицы, так что эта операция для антикоммутативных (и лиевых) алгебр не целесообразна. 6. Вложение ассоциативной алгебры в алгебру матриц. Теорема 2. Ассоциативная алгебра с единицей размерности п над полем К изоморфна некоторой подалгебре алгебры квадрат- квадратных матриц порядка п. Если единицы нет, то возможно погруже- погружение в том же смысле в алгебру матриц порядка п или п + 1. Доказательство. Пусть 3?к — оператор левого умножения на элемент х в ассоциативной алгебре А размерности п. Из ассо- ассоциативности х (yz) = (xy) z следует, что умножить слева на ху все равно, что сперва умножить на у, потом на х. Это значит, что 3*ху = З'хЗ'у (при левой записи операторов), т. е. что отображе- отображение xs-^-3'x есть не только линейное отображение пространства алгебры А в пространство операторов, но и гомоморфизм алгебры А в алгебру операторов. Ядро этого гомоморфизма состоит из тех элементов х е А, которые аннулируют все элементы алгебры при умножении слева, т. е. таких, что хг = 0 при всех геА Если та- таких элементов нет в алгебре А, кроме нуля, то отображение jc—>2"« есть изоморфное отображение алгебры на подалгебру ал- алгебры линейных операторов, состоящую из операторов левого умножения. В свою очередь, алгебра всех линейных операторов, действующих в пространстве алгебры А, изоморфна алгебре ква- квадратных матриц порядка п. Ясно, что если алгебра содержит 1, то х-\ = х, и ядро отображения лл—>3?х состоит только из нуля. По- Поэтому для алгебр с единицей теорема доказана.
394 АЛГЕБРЫ 1ГЛ XV Если же ядро нетривиально, то перейдем к алгебре А посред- посредством внешнего присоединения единицы. Обозначим через 3?х опе- оператор умножения нахеЛв алгебре Л. Ясно, что снова 3?х&у = = 3?Ху при любых х, }бА Но на этот раз ядро гомоморфизма х*-*-5?х состоит только из нуля, ибо из лг-1 = 0 следует х = 0. Таким образом, отображение х>—*3?х есть изоморфизм алгебры А в алгебру операторов, действующих в пространстве алгебры Л, которая, в свою очередь, изоморфна алгебре матриц порядка п-\- 1. § 2. Алгебра кватернионов 1. Определение. Алгеброй кватернионов называется алгебра размерности 4 над основным полем, обладающая единицей 1 и имеющая базис 1, i, j, k со следующей таблицей умножения: j2 a jh Jzm #2 _„. — j} ij я=я —ji ш= ^ jk __ —щ „ ^ fa—* —ik—a I Основное поле может быть взято произвольно. Наиболее инте- интересной для приложений является алгебра кватернионов над полем R вещественных чисел, которая и будет исследоваться в дальнейшем. Прежде всего установим ассоциативность алгебры кватернио- кватернионов. Для этого следует проверить 27 равенств (три возможности для каждого из трех множителей в равенствах (ab)c = а(Ьс), про- проверяемых для базисных элементов i, j, k). Мы избежим этого, установив изоморфизм алгебры кватернионов над R и некоторой алгебры матриц специального вида над .С Именно, единице 1 сопоставим единичную матрицу Е = ( Q l J второго порядка, эле- элементу i алгебры кватернионов — матрицу / = Г 1 _ . J (здесь элемент матрицы tsjCj — обычная мнимая единица, так что нами сознательно допущена путаница в обозначениях — буква i обозна- обозначает в одном контексте два разных объекта), элементу / сопоста- вим матрицу / = ^ _ j 0 J и элементу k — матрицу д = (^ { Q \. Равенства I2 = Р -= К2 = —Е, // = —// =/С, JK = —KJ = I, K.I = —IK = / легко проверяются. Они означают, что простран- пространство матриц, натянутое на матрицы Е, I, J, К, образует алгебру, изоморфную алгебре кватернионов. На основании ассоциативности умножения матриц мы заклю- заключаем об ассоциативности алгебры кватернионов. Заметим, что если за основное поле принято поле [С, комплекс- комплексных чисел, то алгебра кватернионов (над .С) окажется изоморф- изоморфной алгебре Мг(С) всех квадратных матриц второго порядка над С; ибо матрицы Б, I, J, К линейно независимы над [С] и их ли- линейные комбинации заполняют всю алгебру М2(С). 1. Связь алгебры кватернионов с векторами в трехмерном евк- евклидовом пространстве. Пусть а = а + Ы + cj + dk— кватернион. Число а называется скалярной частью кватерниона. Кватернион
§2] АЛГЕБРА КВАТЕРНИОНОВ ggg Ы + с/ + dk называется векторной частью кватерниона а. Кватер- Кватернионы с нулевой скалярной частью будем называть векторами, они, естественно, изображаются как векторы трехмерного евкли- евклидова пространства. Пусть их = bii + с\\ + d\k hu2- b2i + c2j + d2k — два вектора. Вычислим их произведение (в алгебре кватернионов) b\id2k + c\\b2i + Cijc2j + C\\d2k -f- dxkb2i + dikc2j 4- dxkd2k = — bxb2-~ cxc2— dxd2+ (cxd2— did) i-f- + (dib2 — bxd2)j + (bxc2 — cib2)k = —(uu «2)+ [иь и2\ (здесь [мь и2] — векторное произведение векторов «i и иг). Таким образом, скалярной частью кватерниона ти2 оказыва- оказывается скалярное произведение векторов ии и2, взятое с обратным знаком. Векторная же часть кватерниона и\и2 равна векторному произведению векторов щ, щ. Тем самым операция умножения векторов как элементов алгебры кватернионов как бы объединяет оба умножения векторов — скалярное и векторное. Далее, легко видеть, что u2ui = —(u2, «О +[«2, ui] = — (ui, u2) — [uu u2]. Отсюда («1, Щ) = — ~2 ("l + «2"l). [«1. ] = у ("l — «2- Из последней формулы немедленно следует известное в векторной алгебре соотношение Якоби [[ии и2], и3] + [[и2, и3], «i] + + [[«з, «1], и2] = 0. Достаточно принять во внимание связь между ассоциативными алгебрами и алгебрами Ли (см. п. 3 § 1). 3. Алгебра кватернионов как алгебра с делением. Пусть дан кватернион а = a -j- bl + с] + dk = a -j- и. Кватернион а = а — — Ы — с] — dk = a — и, отличающийся от а знаком векторной час- части, называется сопряженным с кватернионом а. Ясно, что а =¦ а. Умножим кватернион а на сопряженный а. Получим аи = = (а + и)(а — и) = а2+аи — аи — и2= ай + (и, и) — [и, «] = а2+ + («, и) = а2 -f- b2 + с2 + d2- Поэтому, если а^О, то аа. > 0. За- Заметим еще, что аа = аа. Число Vой = Vfl2 + b2 + с2 + d2 называется модулем кватер- кватерниона а и обозначается через |а|. Теперь легко установить, что каждый отличный от нуля кватернион а имеет обратный. Действи- Действительно, (^-f а) а = а ("^g) = 1- так что обратным кватернионом для а является -^- • а. Таким образом, алгебра кватернионов над полем R есть алгебра с делением. Заметим, что здесь существенно было использовано то обстоя- обстоятельство, что за основное поле принято поле R: заключение о не-
396 АЛГЕБРЫ 1ГЛ. XV равенстве нулю a2-J- Ь2 -J- с2 -\-d2 при аф$ было бы неверно, на- например, для поля С или поля вычетов по простому модулю. 4. Тождество Эйлера. Теорема 3. Модуль произведения двух кватернионов равен произведению модулей сомножителей. Доказательство. Сначала докажем, что кватернион, со- сопряженный с произведением двух кватернионов, равен произведе- произведению сопряженных кватернионов, взятых в обратном порядке. Действительно, пусть а = а + м, р = Ь + и, где a, t> eR, a и v— векторы. Тогда ар = ab -J- av -j- bu + uv = ab — (и, v) + av + bu + •+ [u, v). Далее, J3a = ab — av — bu + vu ==_ab — (v, u) — av — bu + [-{- [v, u] —ab — (u,v)—av — bu — [u,v]=a$. Теперь имеем |ap|2= = ap-af = aPPa =a|p|2a =|P|2|a|2, откуда |ap| = |a| |p|, что и требовалось доказать. Распишем теперь тождество fap|2 = |a|2|p|2 через компонен- компоненты кватернионов, положив а = ах— b\i — с\\ — dxk, р = а% -f- + bzi+ c2j + d2k, так что ap = axa2 + bxb\-\- CiC2 + d\dz + (ai62 — — bia2 — cxd2 + dxc2)i + (aic2 + bxd2 — cxa2 — dxb2)j + (axd2 — — bxc2-\- cxb2—dxa2)k. Получим известное тождество Эйлера: = {а{а2 + bfi2 + с{с2 + d{d2J + (axb2 — bfi2 — cxd2 + dxc2f + + («1C2 + 6Id2 - Clfl2 - dAf + («1^2 - 61C2 + CA - ^ЛJ, позволяющее выразить произведение двух сумм четырех квадра- квадратов в виде суммы четырех квадратов билинейных выражений. Ана- Аналогичные тождества имеют место для сумм двух квадратов (это тождество связано с умножением комплексных чисел) и для сумм восьми квадратов. Это последнее тождество связано с умножением в так называемой алгебре Кэли — некоторой уже не ассоциатив- ассоциативной алгебре с делением размерности 8. Оказывается, что анало- аналогичных тождеств для сумм п квадратов, кроме перечисленных при п = 2, 4, 8 (и тривиального тождества при п — 1), не существует. 5. Вращения трехмерного евклидова пространства. Пусть и, v, w — тройка попарно ортогональных векторов единичной длины, ориентированная так же, как тройка i, j, k. Тогда, согласно пра- правилу умножения векторов в алгебре кватернионов, получим и2 = =zv2 = w2 = —1. Далее, uv = — (и, v)-\-[u, v] — [u,-v] = w. Здесь мы воспользовались тем, что векторное произведение взаимно ортогональных единичных векторов равно единичному вектору, ортогональному к ним обоим и направленному в соответствии с ориентацией базисных векторов i, j, k. Аналогично, vu = —w, vw = — wv — и, wu = — uw — v. Таким образом, правило умно- умножения векторов и, v, w ничем не отличается, кроме обозначений, от правила умножения векторов i, j, k. Иными словами, отображе- отображение 11—^-1, it—>u, /i—>v, kt-^-w задает изоморфизм алгебры ква«
S 2] АЛГЕБРА КВАТЕРНИОНОВ 397 тернионов на себя, "в. е. автоморфизм этой алгебры. Линейное пре- преобразование пространства векторов, отображающее тройку i, j, k на тройку и, v, w, есть, очевидно, собственно ортогональное преоб- преобразование, ибо эти две тройки образуют ортонормальные одина- одинаково ориентированные базисы пространства векторов. Ясно, что лю- любое собственно ортогональное преобразование пространства векто- векторов определяет некоторый автоморфизм алгебры кватернионов. Все автоморфизмы получаются указанным способом. Действи- Действительно, пусть ы, v, w — образы i, j, k при некотором автоморфизме. Тогда и2 = v2 = w2 = —1, uv = —vu = w, vw = —wv = и и wu = = —uw = v. Из равенства и2 = —1 заключаем, что кватернион и есть вектор единичной длины. Действительно, пусть и = а -\- и\% где а — скалярная часть и. Тогда —1 = и2 — а2 + 2ащ—|ui|2, от- откуда 2аи\ = 0. Если допустить, что и\ = 0, то —1 = а2, что невоз- невозможно. Поэтому Mi ф 0 и, следовательно, а = 0, |m| = |mi|=1. По той же причине кватернионы v и w — тоже векторы единичной длины. Далее, из того, что скалярная часть кватерниона uv = w равна нулю, мы заключаем, что векторы и и и ортогональны. По той же причине ортогональны векторы v, w и w, и, так что и, v, w составляют тройку попарно ортогональных единичных векторов. Ориентация этой тройки совпадает с ориентацией тройки i, /, k, ибо в противном случае было бы uv = —w, а не uv = w. Пусть теперь а — некоторый кватернион единичного модуля. Ясно, что отображение д:*—>а-'т есть автоморфизм алгебры ква- кватернионов и, следовательно, он осуществляет некоторое собствен- собственное вращение пространства векторов. Рассмотрим его подробнее. Пусть а = а + Uo, где а — скалярная часть а. Тогда а2 + | мо|2 = 1» так что можно положить а = cos ф, | мо| = sin ф, 0 ^ ф ^ я. Тогда a = coscp-j- «sin<р, где и — вектор единичной длины (если а=±1, то «о = 0, и в качестве и можно взять любой единичный вектор). Пусть теперь v — какой-либо вектор единичной длины, ортогональ- ортогональный вектору и, и пусть w = uv. Выясним, как действует автомор- автоморфизм л:н-> or-'m на векторы и, v, w. Ясно, что а и и коммутируют, так что а-1ыа = и. Далее, а~' = а = cos ф — и sin ф, а-1Уа = (cos ф — и sin <p) v (cos ф + и sin ф) = = (v cos ф — w sin ф) (cos ф + и sin ф) = = v cos 2ф — w sin ф cos ф+ vu sin ф cos ф — wu sin2 ф = = v (cos2 ф — sin2 ф) — 2w sin ф cos ф = v cos 2ф — гю sin 2ф$ а-'даа = (w cos ф + v sin ф) (cos ф + и sin ф) = v sin 2ф + w cos 2ф. Итак, автоморфизм xs—^а-'ха не меняет вектор и и поворачи- поворачивает на угол —2ф плоскость, натянутую на векторы v и w (счи- (считаем положительным направление вращения от v к w), т. е. вра- вращает пространство векторов вокруг оси, проходящей через вектор
398 АЛГЕБРЫ (ГЛ. XV и, на угол — 2ф. Известно, что всякое собственное вращение трех- трехмерного пространства есть поворот вокруг некоторой оси на неко- некоторый угол, так что любое собственное вращение может рассмат- рассматриваться как трансформация х*—*¦ а-1 ха посредством кватерниона е единичным модулем. Заметим, что преобразование х>~>аг1ха при |a|=jM не дает ничего нового, ибо, если положить a = ja|ao, то |ао|=1 и а~1ха = ао~1л;ао при любом кватернионе х. В любой ассоциативной алгебре с единицей обратимый эле- элемент а порождает автоморфизм алгебры х\—xx-'xa. Такие авто- автоморфизмы называются внутренними автоморфизмами алгебры. Полученный ранее результат показывает, что все автоморфизмы алгебры кватернионов внутренние. Кватернионы единичного модуля образуют, очевидно, группу относительно умножения. Сопоставление каждому такому кватер- кватерниону вращения ху—>агхха. трехмерного пространства векторов есть, очевидно, гомоморфное отображение, ибо (aP)~1Jcap = = Р (а-'дга) р, т. е. произведению кватернионов отвечает произ- произведение вращений. Ядро этого гомоморфизма состоит только из элементов ±1. Действительно, a = a -f- bi-\- c/-f- dk принадлежит ядру, если a~'xa = х при любом векторе х, т. е. если ха = ах. По- Положив х = i, получим с = d = 0, а положив х = /, получим Ъ = = d —0. Итак, а = с = ±1, ибо |a| = |a|= 1. Тем самым мы получили, что группа SOC) собственных вра- вращений трехмерного пространства изоморфна факторгруппе группы кватерниэнов единичного модуля по подгруппе {±1}. Представление трехмерных вращений при помощи кватернио- кватернионов очень удобно тем, что кватернион, связанный с вращением, определяет непосредственно его геометрические характеристики — ось вращения и угол поворота. При обычном задании вращения при помощи ортогональной матрицы для определения оси враще- вращения и угла нужно произвести некоторые, хотя и несложные, вы- вычисления. Закон умножения кватернионов тоже проще (по форме записи) закона умножения матриц третьего порядка. Заметим еще, что группа кватернионов с единичным модулем изоморфна группе SUB) унитарных матриц второго порядка с определителем, равным единице. Действительно, кватерниону а = = а + Ы + с/ + dk соответствует, в силу описанного в п. 1 изо- л ( а + Ы с + di \ морфизма, матрица А = f _cldi a_ bi )> сопряженному ква- кватерниону a =» a — Ы — cj — dk — матрица Г " ~ J ~~ °a ~ ^. J = А'. Из равенства aa = 1 следует АА* = Е, т. е. матрица унитарна. Далее, det А = а2 + Ь2 + с2 + d2 = 1. Обратно, если матрица А = = ( ° б) УнитаРна и det Л = 1, то равенство А~1 — А* дает
S 2] АЛГЕБРА КВАТЕРНИОНОВ 399 Таким образом, отображение си—>Л осуществляет изоморфизм группы кватернионов единичного модуля и группы SUB). 6. Вращения четырехмерного пространства. Рассмотрим четы- четырехмерное пространство кватернионов как евклидово, с естествен- естественной метрикой: если х = ах + М + c\j + d\k, у == а2 + b2i + с2/ + + d2k, то (*, у) = а\а2 + Май- схс2 + йМ2 = Re(x#) = Re(x#). Пусть р — кватернион, |Р| = 1. Покажем, что как оператор ле- soro умножения на Р, так и оператор правого умножения являются ортогональными операторами. Действительно, и (хр, irp) = Более того, оба эти оператора собственно ортогональны. Для доказательства положим р = cosq>+wsinqp и возьмем в качестве базиса векторы 1, и, v, w, где v — какой-либо единичный вектор, ортогональный вектору и, и w = uv. Тогда р . 1 = cos ф -j- ы sin ф, р . « == — sin ф + « cos ф, Р • v = у cos ф + да sin ф, Р ¦ и> = — v sin ф + ш cos ф. Таким образом, в рассматриваемом базисе оператор левого умножения на р имеет матрицу, составленную из двух одинако- одинаковых блоков определителя +1. Аналогично 1 . р х= cos ф + u sin ф, и ¦ р = — sin ф + и cos ф, v • р = v cos ф — до sin ф, до • р = и sin ф -j- до cos ф, так что матрица оператора правого умножения на р тоже имеет определитель, равный +1. Заметим, что в базисе 1, и, w, v оператор правого умножения имеет матрицу, состоящую из двух одинаковых блоков. Базис 1, и, v, w получается из исходного 1, i, /, k посредством собственно ортогонального преобразования координат, а базис 1, и, до, v по- получается из исходного посредством несобственно ортогонального преобразования координат. Рассмотрим теперь оператор двустороннего умножения: х*—*- ь->7~'^Р. где у и р — кватернионы единичного модуля. Этот опера- оператор есть произведение собственно ортогонального оператора ле- левого умножения на у~1 и собственно ортогонального оператора правого умножения на р, поэтому он тоже собственно ортогонален. Покажем, что любой собственно ортогональный оператор в про- пространстве кватернионов представляется в виде оператора двусто-
400 АЛГЕБРЫ [ГЛ. XV роннего умножения. Действительно, пусть <р — такой оператор и пусть фA) = сс. Тогда |а|=1 и if>(х) = ф(х)а~1 оставляет 1 на месте, и, следовательно, преобразует в себя ортогональное к 1 трех- трехмерное пространство векторов, индуцируя в нем собственно орто- ортогональный оператор. Следовательно, ty(x) = y-1xy при некотором кватернионе у единичного модуля и <р(х) = у~1х$ при p=Ya. Рассмотрим (внешнее) прямое произведение G двух экземпля- экземпляров группы кватернионов единичного модуля и каждому элементу i = (f,P)eG этой группы сопоставим оператор ху-^-у~1х§. Тогда произведению элементов из G соответствует произведение опера- операторов. Действительно, пусть A,i =(vi, Pi), к2 = G2, Рг)• Элементу XiX2 = (viV2. Р1Р2) соответствует оператор лгн-Ц-угуг)*?^3 = 'Y2CYrljlcPt)P2' применение которого равносильно последова- последовательному применению операторов, соответствующих элементам К\ и Кг- Таким образом, мы задали гомоморфное отображение группы G на группу вращений четырехмерного пространства. Ядро этого гомоморфизма состоит из таких пар (у, р), для которых у~1х$ = х при всех х. Положив х—1, получим, что у = р. Из р-'-ф = х при всех х следует, как мы видели в предыдущем пункте, что р = ± 1- Итак, ядро состоит из элементов A,1) и (—1,—1). Таким образом, мы доказали следующую теорему. Теорема 4. Группа SOD) собственно ортогональных преоб- преобразований четырехмерного пространства изоморфна факторгруппе прямого произведения двух групп кватернионов единичного модуля по подгруппе, состоящей из A, 1) и (— 1,—1). Заметим еще, что группа SO D) содержит циклическую под- подгруппу второго порядка, образованную операторами ±<8, где Ж — тождественный оператор. Факторгруппа PSOD) группы SOD) по этой подгруппе изоморфна, как легко видеть, прямому произве- произведению двух групп SOC). Такое разложение группы SO D) ставит ее в исключительное положение среди групп SO (я). Именно, все группы SO (я) при нечетном п ^ 3 простые и факторгруппы PSO(«) групп SO (я) по подгруппе {±<2?} при четном п ^ 6 тоже простые. Установленное разложение группы SO D) показывает, что в ней имеются два замечательных нормальных делителя, соответ- соответствующих операторам правого и левого умножения в алгебре* кватернионов. Интересно охарактеризовать эти группы в терминах самой группы SOD). Это нетрудно сделать. Выше мы видели, что каждый оператор правого умножения и каждый оператор левого умножения имеет в некотором ортонормадьном базисе матрицу, состоящую из двух одинаковых блоков второго порядка. Оказы- Оказывается, что этим свойством вполне характеризуются элементы SO D), допускающие реализацию в виде оператора правого или левого умножения. Действительно, пусть оператор М Ф ±& обла- обладает этим свойством. Тогда J#2— 2 cos ф М -\- 1 =0, ибо этому
J3] ВНЕШНЯЯ АЛГЕБРА 401 уравнению удовлетворяют оба блока. Отсюда следует, что каков бы ни был вектор х, векторы х и $Фх линейно независимы, порож- порождают инвариантное двумерное подпространство и ортогональное дополнение к нему тоже инвариантно. Пусть si- действует в про- пространстве алгебры кватернионов и пусть p = «s?(l). Кватернион р будет иметь единичный модуль и будет отличен от ±1, ибо 1 и р линейно независимы. Положим ($ = cos ф -f- м sin ф. Пусть v — какой-либо вектор, ортогональный векторам и и w = uv. Тогда либо в базисе 1, и, v, w, либо в базисе 1, и, w, v матрица опера- оператора $Ф будет состоять из двух равных блоков. В первом случае si- есть оператор левого умножения на р, во втором — правого. Итак, мы получили следующее. 1. Элементы SOD), имеющие в некотором ортонормальном базисе матрицу, состоящую из двух равных блоков второго по- порядка, разбиваются на два класса в зависимости от ориентации этого базиса. Эти два класса имеют общими элементами лишь ±&>. 2. Элементы каждого класса образуют группу по умножению. 3. Элементы из разных классов коммутируют. Прямое доказательство этих утверждений без обращения к алгебре кватернионов непросто. § 3. Внешняя алгебра 1. Определение внешней алгебры. Под названием внешней ал- алгебры известна ассоциативная алгебра, введение которой, в част- частности, полезно при построении теории интегрирования в много- многомерных пространствах. Внешняя алгебра (над данным полем К) строится, если задано некоторое векторное пространство над тем же полем. Элементами внешней алгебры являются формальные «внешние» произведения векторов, причем попарное умножение векторов считается антикоммутативным. Никаких соотношений, кроме тех, которые следуют из дистрибутивности, ассоциативности и антикоммутативности, при умножении векторов не предполага- предполагается. Строже определение внешней алгебры можно дать различ- различными способами. Мы дадим следующее формальное определение. Пусть N= {1,2, ..., п) — множество чисел, составляющее от- резок натурального ряда N- Символами Г, Г!; Т'г, ... будем обозна- обозначать подмножества множества N, включая само N и пустое мно- множество 0. Каждому Т cz N сопоставим базисный элемент ет внеш- внешней алгебры. Тем самым размерность конструируемой алгебры равна числу подмножеств множества N, Т. е. 2". Действие умноже- умножения во внешней алгебре обозначается знаком Л. Для базисных элементов оно задается следующим образом: 1. Если Г,ПГ2^0, то еГ1Л<?гг = 0. 2. Если Г,ПГ2=0, то ег, Дег, = (- l)inv<r" Гг)ег, иг2. Здесь inv(ri,r2) обозначает число инверсий, которое образуют числа, составляющие Гь с числами, составляющими Гг.
402 АЛГЕБРЫ (ГЛ XV 2. Ассоциативность. Докажем ассоциативность умножения во внешней алгебре. Пусть Гь Гг и Г3 — три подмножества множества N. Нам нужно доказать, что (ег, Л ег2) Л ег, = ег, Л («г2 Л еГз). Допустим сначала, что хотя бы одно из множеств Ti (] Г2, Г1ПГ3, Г2ПГз непусто. В этом случае обе части равенства равны нулю. Действительно, левая часть равна нулю, ибо непусто либо Г] П Г2, либо (riUr2)nr3. Аналогично, правая часть равна нулю, ибо непусто либо Г2ПГ3, либо Г1П(Г2 1)Гз). Теперь допустим, что Ti П Г2 = Ti П Г3 = Г2 П Г3 == 0. Имеем (ег, Л еГг) д ег, = (- l)inv <r" Гг)ег, и г2 Л «г, = _= (_ 1).п»(г,. ry+inv (г, и г, гз)еп ц пи Г|. ег, Л (ег, Л еГз) = ( - l)In* <г°- r3)eri д вГ{ ц Га ^ = ( _ l)lnv(r» ra)+inv (Г,. Г2 U Г )ег_ и ^ ц п> Но ту(Г1иГ2,Гз) = ту(Г1,Гз) + ту(Г2,Г3) и inv(r,, Г2иГ3) = = inv(ri,r2)+inv(ri, Г3). Поэтому (ег, ЛеГг) ЛеГз = ег, Л («п Л «г,). 3. Градуировка. Степенью базисного элемента ет внешней ал- алгебры называется число элементов, составляющих Г. Элемент Zj аг^г называется однородным, если все базисные элементы, вхо- г дящие с ненулевыми коэффициентами, имеют одинаковую степень. Эта степень называется степенью однородного элемента. Нулевой элемент алгебры причисляется к однородным элементам любой степени. Ясно, что однородные элементы фиксированной степени k образуют линейное подпространство в пространстве внешней ал- алгебры, и его размерность равна числу ^-элементных подмножеств множества N, т. е- числу сочетаний С*. Ясно также, что произве- произведение двух однородных элементов есть однородный элемент, сте- степень которого равна.сумме степеней сомножителей, если эта сумма не превышает п. Если же сумма степеней двух однородных эле- элементов больше п, то их произведение равно нулю, ибо в этом слу- случае подмножества, индексирующие любую пару базисных элемен- элементов, входящих в сомножители, имеют непустое пересечение. Разложение внешней алгебры в прямую сумму подпространств однородных элементов называется ее градуировкой. Вообще, алгебра конечной или бесконечной размерности назы- называется градуированной, если она может быть разложена в прямую сумму подпространств Uk, & = 0, 1, 2, ..., причем если xeUk, у е Ui, то ху е Uk+i. Разумеется, если градуированная алгебра имеет конечную размерность, то пространства Uk при достаточно больших k состоят только из 0. Примером градуированной ал- алгебры может служить алгебра многочленов от одной или несколь- нескольких переменных. Эта алгебра имеет бесконечную размерность. Элементы внешней алгебры нулевой степени являются крат- кратными элемента е0, который, очевидно, есть единица внешней алгебры. Поэтому элементы нулевой степени естественно отожде-
§3] ВНЕШНЯЯ АЛГЕБРА 403 ствить с элементами основного поля и называть скалярами. Элементы первой степени образуют п-мерное пространство, на- натянутое на базисные векторы е\, е2, ..., еп (мы обозначаем одно- одноэлементные множества {1}, ..., {п} просто 1, .... п, что здесь не приведет к недоразумению). Элементы первой степени будем называть векторами и образованное ими пространство считать пространством, над которым построена внешняя алгебра. Однородные элементы степени 2 называются бивекторами, сте- степени 3 — тривекторами и т. д.; общий термин — поливекторы.- Как уже было сказано, пространство r-векторов имеет размер- размерность Сгп. В частности, пространство л-векторов одномерно, его элементы имеют вид сец при сеУ(; пространство (п—^-векто- (п—^-векторов я-мерно, и вообще, пространства r-векторов и (п — г)-векторов имеют одинаковую размерность. Из определения произведения ясно, что er = etl Л ei2A ¦¦¦ Aeir, если Г= {м, <2> • •-, Ц и h < h < ... < ir. Поэтому общий вид r-вектора есть Если (/i,/2. •••, /V)—какая-либо перестановка чисел i\,h, .... ir, то еп А е/2 Л ... Л е,г = ( - l)inv <'•• f* "- '^е1{ Л е,2 Л . • • Л е1г. Выписав индексы i\, t2. • • •» ir во всех возможных порядках и ПОЛОЖИВ 6/l/2*"//-=-i-(— l)tnv(/l»'«>"-/r)<;'i'2-"'ri ПОЛУЧИМ ЗЭПИСЬ r-вектора в тензорной форме: б'1'2 "' 1гвИ Ael2 /\ ... Л е1г. Совокуп- Совокупность коэффициентов bll>2'" lr составляет антисимметричный кон- травариантный тензор. 4. Свойства внешнего умножения векторов. Предложение 1. Пусть f — вектор. Тогда f Л/ = 0. Действительно, если / = а\в\ + а2е2-{- ¦ ¦ ¦ + апеп, то fAf = п п п = Z Z ал} (et А е,) = Z о? (в, Л в() + Z а^; (в, Ле( + еу Л в,) = = 0, ибо е,Ле( = 0, е,- Ле,- = е{1 /} и е/Ле, = — е{. /} при t < /. Предложение 2. Яг/сгб f \ и f2 — два вектора. Тогда h Л Л U = —U Л /,. Действительно, 0 = (f, + /2) Л (/, + /2) = f 1 Л f, + /1 Л /2 + f» Л Л/1 + /2Л/2 = /1Л/2 + /2Л/,. Предложение 3. ?слм во внешнем произведении fi Л ... ... Л /* имеется хотя бы одна пара равных сомножителей, то оно равно нулю. Действительно, попарно переставляя соседние множители, добьемся того, чтобы равные оказались рядом. Предложение 4. Пусть /ь /2 fk — векторы и (а,, а2 ..., ak) — перестановка чисел 1, 2, .... k. Тогда fal A fa2 Л ¦ • ¦ ... Л/«-(-lI"*"""* •"•"*>/! ЛЬ Л... Л/*.
404 АЛГЕБРЫ {ГЛ. XV Доказательство. От расположения fa{, fU2, ..., /eft мож- во перейти к расположению f\, f2, ..., fk посредством транспози- транспозиций соседних элементов- При каждой такой транспозиции меняется знак внешнего произведения. Четность или нечетность числа нуж- нужных транспозиций совпадает с четностью или нечетностью числа инверсий inv(ai, а2, ..., а*), что и доказывает предложение. Пусть теперь даны векторы f\,f2, •••, fm, m^n, и пусть Г== = {Yi> Y2. •••. Y*}— подмножество множества {1, 2, ..., т}. Бу- Будем считать, что Yi "< Y2 "< • • • < Y*- Внешнее произведение fvi Л f\2 A • ¦ ¦ Л fyk назовем стандартным (по отношению к вы- выбранной нумерации векторов fhf2, ..., fm) и обозначим через Fr- Ясно, что если индексы ai, а2, ..., aft составляют множество Г, так ЧТО ЛИШЬ ПОРЯДКОМ ОТЛИЧаЮТСЯ ОТ У\, Y2, ¦ • • , Y*> T0 fai Л f02 Л • • • ... д fak = ( — l)lnv(aba2. ¦••>aft)/='r. Это следует из предложения 4, Предложение 5. Fr,AFr, = O, если 1\ П Г2Ф 0, uFrtAFr2 = = (—iynv(r,.r,)friUri> если Г1ПГ2=0. Доказательство. Пусть Г, = {yi, •••, Yj. Yi < Y2 < • • • ... < \й, и Г2 = {Yfc+i, • • •, Y/}. Yft+i < • • • <Ъ- Тогда Fr, Л Fr, =' = fvi Л fY2 Л ... Л Uh Л fvk+i Л ... Л Ur Если Ti П Г2 Ф0, то среди множителей в последнем произведении найдутся равные, и произведение равно 0. Если же Г1 f| 1Л2 = 0, то Fr, Л Fr, = ( - l)'nv (V" Y2> -• Ч' Ч+" -• v'}^г,и г,=(-D'nv (Г" T^Fг,иГ2» ибо inv(Yi, Y2 Yfc. Yft+i. •••» Y/) = inv(rb Г2). 5. Автоморфизмы внешней алгебры. Пусть векторы fit ...,/„ линейно независимы и число их равно размерности пространства векторов, так что они образуют базис. Докажем, что элементы Fr, когда Г пробегает все подмножества множества N={1,..., п), составляют базис внешней алгебры. Число элементов Fr равно, очевидно, размерности внешней алгебры, так что нам достаточно показать, что элементы fr порождают внешнюю алгебру как век- векторное пространство. Но это почти очевидно—исходные базисные элементы е\, ..., еп являются линейными комбинациями fit ..., /„, и, следовательно, при любом Г cz N, ег = еУ1 /\ еУ2 А ¦ • • А еУк есть линейная комбинация внешних произведений векторов fit ..., fn, взятых по К- Все такие произведения либо равны нулю, либо с точностью до знаков являются стандартными произведениями. Та- Таким образом, стандартные произведения Fr порождают в виде линейной комбинации все базисные элементы ет внешней алгебры, а значит, и все элементы внешней алгебры являются их линейными комбинациями, что и требовалось доказать. Заметим, что из приведенного рассуждения следует линейная независимость всех 2" стандартных призведений Fr и, в частности, неравенство нулю каждого из них.
§ 3] ВНЕШНЯЯ АЛГЕБРА 405 Итак, наряду с исходной системой базисных элементов {ег|Гс:Л?} внешней алгебры можно взять в качестве базиса лю- любую систему {/\-|ГсгЛГ}, где Fг — стандартные произведения, по- построенные, исходя из какого-либо базиса /ь ..., /„ пространства векторов. В силу предложения 5 таблицы умножения для {Fr |ГсЛ?} и {ec\TczN} одинаковы, т. е. переход от базиса {ег} к базису {Fr} есть автоморфизм внешней алгебры. Сами элементы ет и /;г получаются из нумерованных базисов еи..,,еп и fi,..., fn пространства векторов одинаковым способом — посредством со- составления стандартных произведений для каждого Г с: Л'. 6. Условие линейной независимости векторов в терминах внеш- внешней алгебры. Теорема 6. Для того чтобы система векторов f\, f2, ..., /* была линейно независимой, необходимо и достаточно, чтобы Uf f Доказательство. Пусть система fu /2, ..., /*• линейно не- независима. Тогда ее можно дополнить до базиса /ь /2, ••-, fk, fft+ь . • •, fn- В силу сказанного в п. 5 стандартные произведения fvi Л /Y2 Л • ¦ ¦ Л fvft. Vi < • ¦ • < 7*. все отличны от нуля, в част- частности, f, Лh А ... AJk?=0. Если же система f\, f2, • • •, fk линейно зависима, то один из ее векторов f] есть линейная комбинация остальных: /ь ..., f/_b /я-i, ..., fk и произведение /i Л ... Afk = fiA ... Af,--iA A(ci/,+ ... + c/_if,_, + ci+ifi+i + ••• +Ckfk)AfJ+iA ... Afk есть линейная комбинация внешних произведений, в каждом из которых имеется пара равных сомножителей. Все они равны нулю. Тем самым теорема доказана. 7. Внешнее произведение п векторов. Пусть f\, ..., fn — си- система из п векторов в пространстве с базисом е\, ..., еп: ... + alnen, f2 = a2Xey + a22e2 + ... + a2nen, fn = anXex + an2e2 + ... + annen. Матрицу коэффициентов (ац) обозначим через А. Рассмотрим fiAf2A ... Afn- Из предыдущего ясно, что это произведение есть однородный элемент степени я, и, следователь- следовательно, лишь множителем а отличается от вы = в\ Л е2 Л ... Л еп. Из свойств внешних произведений мы можем без вычислений сказать о некоторых свойствах этого множителя. Из дистрибутивности внешнего умножения следует, что этот множитель есть линейная функция от каждого из сомножителей, т. е. линейная функция от элементов каждой строки матрицы А. Далее, этот множитель ме- меняет знак при перестановке двух сомножителей, т. е. при переста- перестановке двух строк матрицы. Наконец, если матрица А единичная, т. е. //= е/, /= 1, 2, ..., /г, то множитель а равен 1. Мы знаем,
406 АЛГЕБРЫ СГЛ XV что этими свойствами обладает определитель матрицы А, и, бо- более того, можно показать, что определитель характеризуется этими свойствами- Таким образом, должна быть верна формула: fiAf2A ... Afn = det4e,Ae2A ...T/\en. A) Убедимся в этом прямым вычислением. Имеем п /, Л /2 Л • • • Л fn = Е а1а1а2а2 ... аШпеах А еа2 А ... Л ев„. а,,...,а„=1 Здесь индексы ai, а2, ..., а„ независимо пробегают значения 1, 2, ..., я. Значительная часть слагаемых в правой части равна нулю. Именно, это будет, если среди значений индексов аь а2, ... ..., а„ встретится хотя бы пара равных. Если же значения ai, «2, ..., OLn попарно различны, то они образуют перестановку чи- чисел 1,2, ..., л, и тогда еЛ1 Ле«2Л • • • Л еап = ( - l)inv ("'•в* -> а«> е, Л е2 Л ... Л в„. Итак, /i Л /2 Л • • • Л fn = { ,ai ... a в1Лв,Л • • - Аеп = = det А б] Л е2 А ... Л е„, согласно определению определителя (под знаком суммы (а(, аг,... ..., ап) пробегает все перестановки чисел 1,2, ..., п). Заметим, что если базисные векторы ей б2, ..., еп заменить на любую систему векторов gu g2, ..., gn (быть может, зависимую), то в силу п. 4 все вычисления сохраняются, так что если ... +alngn, gh g2, ..., gn — любая система векторов, то fi Л ... Л fn =' = det A gi Л ... Agn, где А = (аи). Выведем теперь в качестве следствий из формулы A) некото- некоторые свойства определителей, ранее полученные другими сред- средствами. Следствие 1. Для того чтобы векторы /ь ..., fn были ли- линейно независимы, необходимо и достаточно, чтобы det А Ф 0. Для этого заключения достаточно сопоставить формулу A) с теоремой 6. Следствие 2 (теорема об определителе произведения двух квадратных матриц). Пусть U = &ugi + • • • + blngn, g: = спех + ... + сХпеп, h = &2i?i + • • • + b2ngn, g2 = c21e, + • • • + c2nen, fn == bnigi + • • • + bnngn gn = cnie[ + ...
ВНЕШНЯЯ АЛГЕБРА 407 причем ей е2, , еп — линейно независимая система. Тогда fi = ane1+ ... +а1пеп, h ¦= (h\*\ + • • • + а2пеп, f» -= а„1в, + • • ¦ +аппеп, причем Л = ВС, А = (а,7), В = (Ь,7), С == (с,7). Применив формулу A), получим, с одной стороны, = det В det С ех Л е2 Л ... Аея. С другой стороны, /i Л f2 Л ... Л /„ = det Л б! Л ег Л ... Лел. Сравнив коэффициенты при е\/\е%/\ ... Ле„, получим det^4 = = det В det С. Следствие 3 (формула для определителя ступенчатой ма- матрицы). Пусть \ап •••a iA 0 ... о 1, А ... а„ Положим Л == /ft = акхех + ... + аккек, /ft+i = aft+i,iei + • • • + ak+i.kek + ak+i. fn = ап\е\ + • • • + апкек + а„, Тогда, с одной стороны, fiAf2A ... Af* Л/a+i Л = det Л ei Л е2 Л ... Л е„. С другой стороны, ЛЛ/,Л ... A/n = (fiA ... Лf*)Л(/*+,&* ••• ЛМ = . Afn = В последнем внешнем произведении мы можем опустить в выра- выражениях fk+u ¦., fn слагаемые, содержащие еи ..., ек, ибо они аннулируются множителем е\ Л е2 Л ... Ле/i. Поэтому Ле2Л ... откуда det Л = det A\ det Л2. ... Ле„) = = det Л1 det Л2 ei Л е2 Л ... Л <?«f
408 АЛГЕБРЫ 1ГЛ. XV 8. Внешнее произведение k линейных комбинаций т векторов при k < т. Пусть f+ ... +almgn, fk = akigi + • • • + akmgm. Пусть М = {1,2, ..., m} и Г = {71,y2, ..., Yft} с: М, причем Yi < 72 < • • ¦ < V*- Обозначим через Агминор матрицы А =*= (а*/), составленный из столбцов с номерами уьуг, • ••> V*. т. е. Через О г обозначим стандартное внешнее произведение gti A gy2 А . ¦. A gyk. Предложение 7. Справедлива формула f i Л f2 Л •.. A f fe= S где сумма распространена на все k-элементные под- г множества множества М. Доказательство. /i Л f2 Л • • • Л fk = Z alaia2a2... aAaftgai Л ffa2 Л • • • Л gaft- ab...,aft Здесь ai, ..., ос* пробегают независимо значения 1, 2, ..., tn. Если среди ai, ..., ак имеются равные, то соответствующие сла- слагаемые равны нулю и их можно опустить. Остается Z а1а[а2а2 ... akakgai A ga2 А ••• A gak. о, Ф а; Оставшиеся теперь комбинации значений индексов составляют все ^-элементные подмножества Г множества М, причем каждое подмножество встречается k\ раз, ибо наборы (аь ..., ак) при данном составе элементов встретятся во всех возможных поряд- порядках. Пусть 7ь 72, ¦••, 7* — элементы подмножества Г, располо- расположенные в порядке возрастания: 71 < 72 < • ¦ ¦ < V*- Тогда наборы (ai, ai, ..., oLh), поставляющие одно и то же подмножество Г, представляют собой перестановки чисел yit 72, ••-, 7*- Объединяя слагаемые, соответствующие одному и тому же подмножеству Г, и складывая получившиеся суммы для всех Г, получим f 1 Л h А ¦ • • Л fk = Z Z «lai • • • akakSo.i А •.. Л gak, г (аи--;Ч) где (аь ..., ак) пробегает все перестановки чисел -уь 7г, .... V*- Но gaiAga2 Л ... A^aft=(~ l)'nv(a- -•e*VvI Лй2Л...Л^ = -=(_ l)inv(ai.---.aft)Gr. Поэтому получаем fi л/аЛ ... Л/*=»
ВНЕШНЯЯ АЛГЕБРА 409 If 2 (-l)to(«-"-4lai...ajGr Г \(аи .... ak) J ( .«ft) так как = ЛГ согла- .., fk = сно определению определителя. Заметим еще, что если fi = augi+ ... + almg, , f *= ukigl + . • • , + ukmgm И k > /П, TO fi Л ... Л f* = 0, Ибо В ЭТОЙ ситуации векторы /ь ..., fk образуют линейно зависимую систему. В том же легко убедиться и формальной проверкой — в выраже- выражении fi Л ... Afk через внешние произведения gu ..-, gm мы в каждом слагаемом будем встречаться с равными множителями. Из доказанной формулы легко выводятся еще некоторые свой- свойства определителей. Следствие 4 (теорема Бине — Коши об определителе про- произведения двух прямоугольных матриц). Пусть ап ... alk \ fbn ... 6 N /сп ... elh \ , В- , С= , еде А=ВС, Y2 < • • • причем k < m. Пусть Г = {vb ••-. Vn}, где Vfe- Положим ВГ 1V1 "Ml Yftl "Vftft Тогда det Л == X -ВгСг, г<Эе сумма распространена на все k-элемент- г ные подмножества множества М =={1,2, ¦.., ш}. Доказательство. Пусть h = bng\ + • • • + blmgm, g{ = с„е, + ... + clkek, fk = bkigi + • • • + bkngm, gm = cmXex + ... + cmkek, причем е\, ..., e* линейно независимы. Тогда ... +alkek, Поэтому, с одной стороны, f, Л . с другой стороны, h Л h Л ... Л fh akkek. Л /* = det A ex A ... Аек, ^ ВГ gyi Л gy2 А ... Л gyh'
410 АЛГЕБРЫ ГГЛ XV Ясно, что так что дает откуда ?V) Л gy2 Л ... A gyk=Crel Ae2A ... Л ек, /, Л h А ¦. ¦ A f к = Z ВГСГ ех Л в2 А ... Л в». г Сравнение коэффициентов при eiAe2A ... Л* det /I = Z #гСг, что и требовалось. г Заметим, что если k~> т, то det ВС = 0, ибо произведение /i Л /2 Л ... Л fk обратится в 0 как внешнее произведение линей- линейных комбинаций меньшего, чем k, числа векторов. Следствие 5 (теорема Лапласа). Пусть квадратная матрица 'In k+l, 1 а k+l, п "я! -Г разделена на две клетки, первая из которых имеет k строк, пусть Г есть k-элементное подмножество множества N = {I, 2, ..., п} и Г' = ЛГ\Г — его дополнение. Пусть Air — минор k-го порядка натрицы А[, составленный из столбцов, номера которых состав- составляют Г, и A2v—минор (п — k)-zo порядка матрицы А3, номера столбцов которого составляют Г'. Тогда de^= Z А1ГА2г'(-1)Ь+"+Ч 2 - Доказательство. Пусть Тогда Но /, Л / .*. jA ffc+i ==ak L = an Л... Ле„ = (/, ...A/ft=Z^ :,*, + • • л/2л lir^r,/ft- • + alaeaf ¦ + аыеп> - ... + ak+u nen, • + annea. ... л W л (/*+, и Л ... Л /„ = Л ... Z л2Д* д Л fn)- где Г
f 31 ВНЕШНЯЯ АЛГЕБРА 411 пробегает все Л-элементные подмножества, а Л — все (п — k) -эле- -элементные подмножества множества М Ясно, что ег Л ед = 0, если ГПА непусто, а пусто оно, только если Д =* Г'. Следовательно, detAeN = fi Л ... Л /П = Е Е^гЛгдег Л ед — г д — Е Л, гЛгг-ег Л ег - Е А гЛ2Г- ( - l)lnv(r- r'V г г Пусть Г = {vi, .. •, Y*} и Yi < Y2 < • • • < У к. Все элементы, меньшие, чем yi> находятся в Г', поэтому yi составляет yi — 1 ин- инверсий с элементами из Г', далее, все элементы, меньшие, чем Y2. кроме Yi> находятся в Г', так что Y2 составляет Y2 — 2 инверсий с элементами из Г' и т. д. Таким образом, inv(r, r') = Yi + • • • ...+YA-l-...-fc = Yi+---+Yft-1/2fc(fc+l). Итак, det Л = (—1) Л1ГЛ2Г', что и требовалось доказать. г Переставляя строки, легко доказать теорему Лапласа в общем случае, когда в матрице А выбраны любые k строчек. Мы предо- предоставляем это читателю. Следствие 6 (критерий линейной независимости в терми- терминах ранга матрицы). Для того чтобы векторы f\ = anei + ... ... + а.\пеп, ..., fa — ctk\ei + • - ¦ + йкпвп были линейно незави- независимы, необходимо и достаточно, чтобы хотя бы один минор k-го порядка матрицы А = (ац) был отличен от нуля. Действительно, для линейной независимости необходимо и до- достаточно, чтобы /i Л ... /\fk?*O. Но f i Л • • • Л/*—Е^г^г, и для /i Л ... Л fk =fr 0 необходимо и достаточно, чтобы хотя бы один из миноров Ат был отличен от нуля. 9. Внешняя алгебра над пространством Евклида. Пусть в про- пространстве векторов имеется структура евклидова пространства, т. е. основное поле есть поле R вещественных чисел и в простран- пространстве определено скалярное произведение. Пусть базис е\, ..., е„, исходя из которого строится внешняя алгебра, ортонормален. Про- Продолжим евклидову структуру на все пространство внешней алгебры, считая базис {ег} ортонормальным, так что скалярное произведение элементов х= Е хт^г и у= Е Угвг равно Yj хтУг- г г г При таком соглашении однородные элементы разных степеней будут ортогональны, так что градуировка определяет разложение пространства внешней алгебры в прямую ортогональную сумму подпространств однородных элементов. Предложение 8. Пусть /ь ..., fk и gi gk — dee cu. стены векторов. Тогда скалярное произведение k-векторов /i Л ... ... Л fk и gt Л ... Л gk равно (fk,8k)
412 АЛГЕБРЫ 1ГЛ. XV В частности, квадрат длины k-вектора f i Л ... Л fk равен опреде- " (fI.Л) ••• {h,fk) лителю Грама , т. е. совпадает с квадратом объема параллелепипеда, натянутого на векторы fi, ..., Доказательство. Пусть h = bhet + ... + blnen, g, == cue, + ... + clnen, fk = Ьк\в\ + • • • + bknen, gk = ckXex + ... + cknen. Обозначим через В г, С г миноры, «вырезаемые» множеством Г из матриц В = (bii), С = (dj). Как мы уже знаем, F = fi Л ••• Л /а = Zj #г?г, G = gi Л ••• Л gk — 2j Cr^r- г г Поэтому (F, G) = X ВгСГ = det ВСТ в силу теоремы Бине —Коши (С7 — транспонированная матрица). Согласно правилу умножения матриц ВСТ = 1 ) = 4 что и требовалось доказать. М. (. Чтобы получить частный случай, включенный в формулировку предложения, достаточно положить gi = fi, .... gk — fk- Заметим, что скалярное произведение (F, G) ^-векторов за- зависит лишь от скалярных произведений (fi,gi), т. е. от взаимного расположения этих двух систем векторов друг относительно друга, но не от выбора системы координат. В частности, отсюда следует, что если fi, ..., fn — ортонормальный базис исходного простран- пространства и {Fг)—стандартные произведения базисных элементов, то для двух fe-элементных подмножеств Г] и Гг ч f О, (г г„ г г,) == (ег„ ег,) = < I. 1, если 1 г = 12, ибо скалярные произведения векторов, составляющих Fr, и Fp,, равны соответствующим скалярным произведениям векторов, со- составляющих ег, и йг2- Таким образом, ортогональное преобразование координат в пространстве векторов вызывает ортогональные преобразования во всех пространствах ft-векторов, а следовательно, и во всем про- пространстве внешней алгебры, ибо оно разлагается в прямую орто- ортогональную сумму пространств поливекторов. 10. Внешнее произведение векторов как направленный объем. Пусть задана упорядоченная система линейно независимых векто-
t 3J ВНЕШНЯЯ АЛГЕБРА 413 ров fi, ..., /и в «-мерном евклидовом пространстве R". Напомним, что объем параллелепипеда, натянутого на эту систему, равен ква- квадратному корню из определителя Грама: V2(fi, ..., fk) = = det ((ft, fi)). Если /i, ..., fk и gu ..., gk — два базиса некоторого k ^-мерного подпространства Р в R" и g; = ^ cltfi, ? = 1,2, ..., k, то V(gl gk) = \fet(ci,)\V{fu ..., /*).'"Если det(c,7)>0, си- системы g[, ..., git и /i fk одинаково ориентированы, если же det(c,;)<0, то их ориентации противоположны- Напомним, что если /ь ..., /^ и gi, ..., gk одинаково ориентированы, то суще- существует непрерывный путь, соединяющий две эти системы, т. е. существует система векторов hi(t), ..., hk(t), непрерывно завися- зависящая от вещественного параметра t, О ^ t ^ 1, и такая, что /г,@) = = f,-, hi(l) = gi и при любом t из промежутка 0 < / < 1 система векторов h\(t), ..., hk{t) остается базисом подпространства Р- Если же /ь ..., fk и gi gk имеют противоположную ориента- ориентацию, то такого пути не существует. Теперь докажем теорему, вскрывающую геометрическое значе- значение внешнего умножения векторов. Теорема 9. Пусть fu ..., fk — линейно независимая система векторов в п-мерном евклидовом пространстве R", и пусть gi, ... • • •» gk — другая система векторов. Для того чтобы имело место равенство f 1 Л U Л • •. Л fk = gx Л gi Л ... f\gk, C) необходимо и достаточно, чтобы системы fu ..., f* и gu ..., g/, порождали одно и то же подпространство в Rn, были бы в нем одинаково ориентированы и объемы V(f\ fk) и V(gu ..., gk) были бы равны. Доказательство. Докажем сначала необходимость. Пусть равенство C) выполнено. Тогда при любом i, I s^ i ^ k, будет f\ Л f2 Л ... Л /ft Л gi = 0 и, следовательно, система fu ..., fA, gi линейно зависима, откуда в силу независимости flt ..., fk еле-' k дует, что gi = YjCijfh i=\, 2, ...,k. Тогда g{ Л ... = det(c,/)/iA ... Лfk, так что det(c;/) = + 1. Следовательно, си- системы fu ..., fk и gu ..., gk порождают одно и то же подпро- подпространство и одинаково в нем ориентированы. Так как V(gi, ... •. -,gk) = \ det(c,v) | V(f\, ..., fk), объемы равны. Докажем теперь достаточность. Пусть /ь ..., fk и gu .... gk порождают одно и то же подпространство, имеют одинаковые k ориентации и V(f\, ..., fk)=V{gu ¦¦¦, gk). Тогда gi = T,c{jfl, причем det(c,7)>0 и |det(c,7) |= 1, т. e. det(c;/)=l. Ясно, что A A dt{)fA A/ = f,A ... Л/*.
414 АЛГЕБРЫ |ГЛ. XV Доказанная теорема позволяет трактовать ft Л /2 Л ... Л /* как «направленный объем» параллелепипеда, натянутого на /ь ... ..., fk. Действительно, это внешнее произведение определяет как величину объема, так и его «направление», т. е. подпространство, в котором этот объем сосредоточен, и ориентацию в этом подпро- подпространстве. В этом смысле внешнее произведение системы векторов обобщает векторное произведение пары векторов в трехмерном пространстве. Напомним, что векторное произведение равно по ве- величине площади параллелограмма, натянутого на пару векторов, а его направление характеризует плоскость, порожденную парой векторов и ориентацию пары на этой плоскости. 11. Подпространства однородных элементов дополнительных степеней. Пусть Sk и Sn-k — подпространства однородных элемен- элементов степеней k и п — k в пространстве внешней алгебры. Размер- Размерности этих подпространств совпадают. Если «eSj и ое Sn-k, то и Аи принадлежит одномерному подпространству Sn элементов степени п. Пусть еи ..., еп — какой-либо базис в S\. Тогда и/\v ¦== а(и, u)eiAe2A ... Ле„. Ясно, что коэффициент а(и, v) есть при фиксированном v линейная функция от и. Очевидно* что порожденное тем самым отображение Sn-k в пространство S*k, сопряженное с 5*, линейно и его ядро состоит только из 0. Из совпадения размерностей Snk и S'k следует, что это отображение есть изоморфизм. Так определенный изоморфизм пространств Sn_k и S*k зависит от выбора базиса е\, ..., еп, но зависит «сла- «слабо»— он определен с точностью до множителя det (с»/), где (с,,-) — матрица перехода от исходного базиса к другому. В частности, если det(c,/) = +1, то изоморфизм Sn_k и S\ сохраняется при п замене базиса еи ¦ ¦ ¦, еп на бпзис fi, ..., fn при ft — X cuei- i = i Если за исходный базис в пространстве 5* взяты элементы ег =^ —<?Vl Л ... AeVft>Yi < • • • < Ук>то сопряженным базисом в Sn-k бу- будет система элементов (— l)'nv(r, г/)ег,) где т;' _ ЛГ\Г,что непосред- непосредственно следует из закона умножения во внешней алгебре. Допустим, что исходное пространство S\ евклидово и базис #1, е2, ..., еп ортонормальный. Тогда пространства Sk и 5я_А,тоже имеют структуру евклидова пространства при ортонормальных ба- базисах {ег} и {<?г'}. Напомним, что для евклидова пространства S имеется естественный изоморфизм между 5 и сопряженным про- пространством S*, именно, образом элемента у е S при этом изомор- изоморфизме является функционал /# {х) = (х, у). Наличие этого изомор- изоморфизма позволяет отождествить S и 5*. Эти соображения делают естественным введение следующего понятия. Будем считать, что элемент «eSj квазиравен элементу уе5/,-« и писать и «у, если U и v индуцируют в Sk одинаковые функционалы, т. е. при любом weSt имеет место равенство w Л v = (до, и)е\ Л ... Л еп. Ясно,
§ 3] ВНЕШНЯЯ АЛГЕБРА 415 что квазиравные k- и (п — k) -векторы и и v имеют одинаковые координаты в базисах {ег} и {(— l)Inv<r. г'>еГ'} при Г" = ЛГ\Г. Отношение квазиравенства «почти симметрично», именно, если и « v, то v « (—1 )*("-*>«. Отношение квазиравенства зависит от выбора базиса, но, очевидно, не изменяется при собственно орто- ортогональном преобразовании координат. При несобственно ортого- ортогональном преобразовании квазиравные поливекторы превращаются в квазипротивоположные, т. е. если до преобразования было и « v, то после преобразования станет и « —v (конечно, при определе- определении квазиравенства по отношению к новым базисным векторам). Это следует из того, что если f\, ..., fn получается из ei, .... еп несобственно ортогональным преобразованием, то Д Л ... Л fn = =» —б! Л ... Л еп. -Выясним теперь, какой элемент из Sn-k квазиравен внешнему произведению g\ Л ... Л ^ е Sj линейно независимых векторов gx, ..., gk- С этой целью выберем в подпространстве Р, натянутом на gi, ..., gk, ортонормальный базис fi, ..., fk, причем так, чтобы ориентации системы векторов gi, ..., gk и fi fk были одина- одинаковы. Тогда gi A ... Agb — Vfi A ... Afk, где V — объем парал- lelepjpeda, natynutogo na git ..., gk. Дополним fit ..., fk до орто- нормального базиса fi, ..., fk, fk+i, ¦¦-, fn пространства Si, име- имеющего одинаковую ориентацию с исходным базисом еи ..., еп. Тогда, в силу сказанного выше, giA ... Agutt Vfk+iA ... Afn. Векторы fk+u ..., fn составляют базис ортогонального дополне- дополнения PL к подпространству Р. Если в этом пространстве взять лю- любую систему векторов hk+u ¦. ¦, hn, имеющих одинаковую ориента- ориентацию с fk+i, ¦ ¦ ¦, fп и с объемом параллелепипеда V, то gi A ... ... Л gk » hk+i A ... Ahn. Итак, если векторы hk+\, ..., hn орто- ортогональны векторам glt ..., gk, объемы параллелепипедов, натяну- натянутых на gi, ..., gk и hk+i, ..., hn, одинаковы и ориентация систе- системы векторов gi, ..., gk, hk+u ¦¦¦, hn совпадает с ориентацией исходного базиса еи ...,"<?„, то giA ... Agk^hk+\ A ... Ahn. Рассмотрим случай я = 3и& = 2. В этом случае g\ A g2 « Лз, где Лз —г ортогональный к gi и g2 вектор, длина которого равна площади параллелограмма, натянутого на gu g2, и ориентация glt g2, h3 совпадает с ориентацией исходного базиса. Таким образом, вектор hit квазиравный бивектору g\Ag2 (при л = 3), есть не что иное, как векторное произведение [g\, g2] ¦ Заметим, что квазиравенство g\ Л ... Agkwhk+\ A ... Ahn равносильно равенству компонент этих поливекторов по отноше- отношению к базисам {ег} и {(— l)Invtf\r')er,j. при т' = Ы\Г. Это ра- равенство может быть сформулировано как равенство миноров &-го порядка, составленных из первых k столбцов матрицы координат векторов g\, ..., gk, hk+i, ..., hn, их алгебраическим дополнениям. Формальная проверка таких соотношений не совсем тривиальна.
СПИСОК ЛИТЕРАТУРЫ Архангельский А. В. Конечномерные векторные пространства. — М.« Изд-во МГУ, 1982. Боревич 3. И. Определители и матрицы. — М.: Наука, 1970. Ван дер В а р д е н Б. Л. Алгебра. — М.: Наука, 1979. Гельфанд И. М. Лекции по линейной алгебре. — Mi Наука, 1971. Кострикин А. И. Введение в алгебру. — М.: Наука, 1977. Кострикин А. И. и Мании Ю. И. Линейная алгебра и геометрия. —> М.: Изд-во МГУ, 1980. Курош А. Г. Курс высшей алгебры.— М.: Наука, 1975. Л е н г С. Алгебра. — М.: Мир, 1968. Мальцев А. И. Оосновы линейной алгебры. — М.: Наука, 1975. Фаддеев Д. К. иСоминский И. С, Сборник задач по высшей ал» гебре. — М.: Наука, 1977.