Author: Кострикин А.И.  

Tags: алгебра   математика  

ISBN: 5-9221-0017-3

Year: 2000

Text
                    А. И. КОСТРИКИН
основы
АЛГЕБРЫ
7f — —г»Л


А.И. Кострикин ВВЕДЕНИЕ В АЛГЕБРУ Часть I ОСНОВЫ АЛГЕБРЫ Рекомендовано Министерством общего и специального образования Российской Федерации в качестве учебника для студентов университетов, обучающихся по специальностям "Математика" и "Прикладная математика" МОСКВА ФИЗИКО-МАТЕМАТИЧЕСКАЯ ЛИТЕРАТУРА 2000
УДК 512 @75.8) ББК 22.143 К71 Кострикин А.И. Введение в алгебру. Часть I. Основы ал- алгебры: Учебник для вузов. — М.: Физико-математическая литература, 2000. — 272 с. — ISBN 5-9221-0017-3. Рассмотрены системы линейных уравнений, элементарная теория матриц, теория определителей, простейшие свойства групп, колец и по- полей, комплексные числа и корни многочленов. Помещено большое число упражнений различной степени трудности. Специальный раздел посвящен обсуждению некоторых нерешённых задач о многочленах. Для студентов младших курсов университетов и вузов с повышенными требованиями по математике. Ил. 28. ТП-2000-1-73 ISBN 5-9221-0017-3 (Т. I) ISBN 5-9221-0016-5 рикин,2000
ОГЛАВЛЕНИЕ ПРЕДИСЛОВИЕ 7 СОВЕТЫ ЧИТАТЕЛЮ 10 ГЛАВА 1 ИСТОКИ АЛГЕБРЫ § 1. Алгебра вкратце 12 § 2. Некоторые модельные задачи 15 1. Задача о разрешимости уравнений в радикалах A5). 2. За- Задача о состояниях многоатомной молекулы A7). 3. Задача о кодировании сообщения A8). 4. Задача о нагретой пластин- пластинке A8). § 3. Системы линейных уравнений. Первые шаги 19 1. Терминология B0). 2. Эквивалентность линейных сис- систем B1). 3. Приведение к ступенчатому виду B3). 4. Исследова- Исследование системы линейных уравнений B4). 5. Отдельные замечания и примеры B6). § 4. Определители небольших порядков 29 Упражнения C3). § 5. Множества и отображения 33 1. Множества C3). 2. Отображения C5). Упражнения D0). § 6. Отношения эквивалентности. Факторизация отображений . . 41 1. Бинарные отношения D1). 2. Отношение эквивалентнос- эквивалентности D1). 3. Факторизация отображений D2). 4. Упорядоченные множества D4). Упражнения D5). § 7. Принцип математической индукции 46 Упражнения E0). § 8. Перестановки 50 1. Стандартная запись перестановки E0). 2. Цикловая струк- структура перестановки E2). 3. Знак перестановки E6). 4. Действие Sn на функциях E8). Упражнения F0). § 9. Арифметика целых чисел 61 1. Основная теорема арифметики F1). 2. НОД и НОК в Z F3). 3. Алгоритм деления в Z F3). Упражнения F4).
Оглавление ГЛАВА 2 МАТРИЦЫ § 1. Векторные пространства строк и столбцов 66 1. Мотивировка F5). 2. Основные определения F6). 3. Линей- Линейные комбинации. Линейная оболочка F7). 4. Линейная зависи- зависимость F8). 5. Базис. Размерность F9). Упражнения G2). § 2. Ранг матрицы 72 1. Возвращение к уравнениям G2). 2. Ранг матрицы G4). 3. Критерий совместности G6). Упражнения G7). § 3. Линейные отображения. Действия с матрицами 78 1. Матрицы и отображения G8). 2. Произведение матриц (81). 3. Транспонирование матриц (83). 4. Ранг произведения матриц (84). 5. Квадратные матрицы (86). 6. Классы эквива- эквивалентных матриц (91). 7. Вычисление обратной матрицы (93). 8. Пространство решений (96). Упражнения (98). ГЛАВА 3 ОПРЕДЕЛИТЕЛИ § 1. Определители: построение и основные свойства 102 1. Геометрическая мотивировка A02). 2. Комбинаторно- аналитический подход A04). 3. Основные свойства определи- определителей A05). Упражнения A12). § 2. Дальнейшие свойства определителей 113 1. Разложение определителя по элементам столбца или стро- строки A13). 2. Определители специальных матриц A16). Упраж- Упражнения A19). § 3. Применения определителей 121 1. Критерий невырожденности матрицы A21). 2. Формулы Крамера A23). 3. Метод окаймляющих миноров A25). Упраж- Упражнения A28). § 4. К построению теории определителей 130 1. Первое аксиоматическое построение A30). 2. Второе ак- аксиоматическое построение A31). 3. Построение методом пол- полной индукции A31). 4. Характеризация мультипликативными свойствами A31). Упражнения A33). ГЛАВА 4 ГРУППЫ. КОЛЬЦА. ПОЛЯ § 1. Множества с алгебраическими операциями 134 1. Бинарные операции A34). 2. Полугруппы и моноиды A35). 3. Обобщённая ассоциативность; степени A36). 4. Обратимые элементы A38). Упражнения A39).
Оглавление § 2. Группы 139 1. Определение и примеры A39). 2. Циклические группы A42). 3. Изоморфизмы A43). 4. Гомоморфизмы A47). 5. Словарик. Примеры A48). Упражнения A49). § 3. Кольца и поля 151 1. Определение и общие свойства колец A51). 2. Сравнения. Кольцо классов вычетов A55). 3. Гомоморфизмы колец A56). 4. Типы колец. Поле A57). 5. Характеристика поля A61). 6. За- Замечание о линейных системах A63). Упражнения A65). ГЛАВА 5 КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ § 1. Поле комплексных чисел 167 1. Вспомогательная конструкция A67). 2. Плоскость комплекс- комплексных чисел A68). 3. Геометрическое истолкование действий с комплексными числами A69). 4. Возведение в степень и извле- извлечение корня A73). 5. Теорема единственности A75). 6. Элемен- Элементарная геометрия комплексных чисел A76). Упражнения A79). § 2. Кольцо многочленов 180 1. Многочлены от одной переменной A81). 2. Многочлены от многих переменных A85). 3. Алгоритм деления с остат- остатком A87). Упражнения A88). § 3. Разложение в кольце многочленов 190 1. Элементарные свойства делимости A90). 2. НОД и НОК в кольцах A92). 3. Факториальность евклидовых колец A94). 4. Неприводимые многочлены A97). Упражнения B00). § 4. Поле отношений 201 1. Построение поля отношений целостного кольца B01). 2. По- Поле рациональных дробей B03). 3. Простейшие дроби B04). Упражнения B07). ГЛАВА 6 КОРНИ МНОГОЧЛЕНОВ § 1. Общие свойства корней 208 1. Корни и линейные множители B08). 2. Полиномиаль- Полиномиальные функции B10). 3. Дифференцирования кольца многочле- многочленов B12). 4. Кратные множители B14). 5. Формулы Вие- та B16). Упражнения B18). § 2. Симметрические многочлены 220 1. Кольцо симметрических многочленов B20). 2. Основная тео- теорема о симметрических многочленах B21). 3. Метод неопре- неопределённых коэффициентов B24). 4. Дискриминант многочле- многочлена B26). 5. Результант B28). Упражнения B31).
Оглавление § 3. Алгебраическая замкнутость поля С 232 1. Формулировка основной теоремы B32). 2. Доказательство основной теоремы B34). 3. Ещё одно доказательство основной теоремы B37). § 4. Многочлены с вещественными коэффициентами 241 1. Разложение на неприводимые множители в R[X] B41). 2. Простейшие дроби над С и R B42). 3. Проблема локализации корней многочлена B44). 4. Вещественные многочлены с ве- вещественными корнями B49). 5. Устойчивые многочлены B51). 6. Зависимость корней многочлена от коэффициентов B52). 7. Вычисление корней многочлена B54). 8. Рациональные корни целочисленных многочленов B55). Упражнения B57). ПРИЛОЖЕНИЕ НЕРЕШЁННЫЕ ЗАДАЧИ О МНОГОЧЛЕНАХ 1. Проблема якобиана 259 2. Задача о дискриминанте 261 3. Задача о двух порождающих кольца многочленов 261 4. Задачи о критических точках и критических значениях . . . 262 5. Задача о глобальной сходимости метода Ньютона 263 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 266
Алгебра щедра — зачастую она даёт больше, чем у неё спрашивают. Даламбер ПРЕДИСЛОВИЕ Необходимость в едином изложении курсов алгебры, линейной алгебры и геометрии ощущалась давно. Во всяком случае, учебник "Введение в алгебру" (М., Наука, 1977) 22-летней давности с само- самого начала рассматривался лишь как первый шаг к интегрированно- интегрированному подходу. Алгебра — живая ветвь математики, обладающая зна- значительной притягательной силой и основывающаяся на небольшом числе ясных, интуитивных начал. Смысл алгебраического понятия может иметь теоретико-числовую или геометрическую природу, а зачастую его корни лежат в вычислительных аспектах математи- математики и в решении уравнений. Возникающие из такого исторического понимания принципы и требования, предъявляемые к современно- современному университетскому учебнику по алгебре, стали общепринятыми. Вся трудность падает на реализацию более или менее известных идей. Естественная эволюция стандартных программ — то в сторо- сторону объединения курсов линейной алгебры и многомерной аналитиче- аналитической геометрии, то в сторону их разделения и вкрапления элементов теории чисел в курс алгебры — нашла отражение на страницах пред- предлагаемого "Введения в алгебру", написанного на базе упомянутого одноимённого учебника, но сильно расширенного и разбитого для удобства читателя на три части. Само собой разумеется, что объ- объединение этих частей заведомо содержит устойчивое ядро указан- указанных курсов — тот минимум, которому должен удовлетворять вся- всякий учебник. С другой стороны, распределение материала по частям соответствует реально сложившемуся за последние десятилетия по- порядку чтения курсов студентам механико-математического факуль- факультета МГУ: первый семестр — "Основы алгебры"; второй семестр — "Линейная алгебра и геометрия"; третий семестр — "Основные структуры алгебры" (алгебра на уровне элементарных, но доволь- довольно содержательных сведений об алгебраических системах, ставших принадлежностью каждого математика наших дней). В дальнейшем для удобства ссылок на эти книги будут использоваться соответ- соответственно сокращения [ВА I], [ВА II], [ВА III]. На этот порядок, равно как и на принцип подачи материала, наложили свой отпечаток не только здравый смысл, но и мудрый совет Горация: "Надо сегодня сказать лишь то, что уместно сегодня. Прочее всё отложить и ска- сказать в подходящее время". Другими словами, мы придерживаемся концентрического стиля изложения, не боясь возвращаться к одной
8 Предисловие и той же теме, к одному и тому же примеру много раз. Так, поня- понятия группы, кольца, поля, изоморфизма возникают в [ВА I] и обсуж- обсуждаются на уровне примеров, накапливаемых затем в [ВА II]; более основательное изучение этих понятий проводится лишь в [ВА III]. Абстрактные векторные пространства и линейные операторы на них исследуются в [В АII], хотя их конкретные аналоги, сопровождающие теорию систем линейных уравнений, появляются на первых страни- страницах настоящей книги. Разумеется, только читатель вправе судить, приближает ли такой подход то понимание предмета, о котором пи- писал великий математик А. Пуанкаре в своем замечательном сочи- сочинении "Наука и метод" (гл. 2. Математические определения и пре- преподавание). Реально читаемым курсом (три часа лекций в неделю в первом семестре, четыре — во втором и два — в третьем), по опыту самого автора, заведомо невозможно охватить весь материал учебника, да к этому и не следует стремиться. По своему замыслу он рассчитан на свободное творчество лектора (разумеется, в из- известных рамках). Хотелось бы рассматривать его также как своего рода справочник и как источник для дополнительного чтения сту- студентами. Многообразие современной алгебры невозможно уложить в прокрустово ложе какого-либо "Введения в алгебру", однако импуль- импульсом к творческой работе мысли учебник послужить должен. Этому способствуют многочисленные упражнения, рассчитанные в какой- то мере на развитие основной темы. Кроме того, в каждой части имеется раздел, где перечислены, с необходимыми пояснениями, не- некоторые нерешённые или трудно решаемые задачи, непосредственно примыкающие (во всяком случае, по своей постановке) к программ- программному материалу и лежащие почти что на поверхности. Вряд ли эти задачи станут предметом повального увлечения, но будет прекрасно, если в ком-то они зажгут огонёк поиска математической истины. * * * Несколько слов о [ВА I]. Эту книгу можно считать алгеброй в миниатюре. Фундаментальные понятия группы, кольца, поля, новые для большинства студентов, вводятся по возможности неформально и в минимальных дозах, хотя общее количество производных поня- понятий получается довольно большим. Их не нужно запоминать: они станут привычными после самостоятельной работы над задачами и упражнениями. Для удобства выделяется несколько наиболее употре- употребительных алгебраических систем таких, как группы (Z, +), 5П, Лп, GLn, SLn, кольцо многочленов, поля Q, Е, С и Zp, на фоне которых демонстрируется язык алгебры. По традиции и по соображениям преемственности между школой и вузом вначале излагается техника матриц и определителей, используемая для отыскания и исследова- исследования решений систем линейных уравнений. На этом пути естествен- естественным образом возникают и основные алгебраические структуры. Их
Предисловие более обстоятельному изучению посвящена книга [ВА III], а пока в нашу задачу входит лишь накопление "живых" примеров. Следует обратить особое внимание на книгу И.Р. Шафаревича [4] из дополнительного списка литературы, в которой развивается све- свежий и в высшей мере нетрадиционный взгляд на алгебру, а также на математику в целом. Я благодарен всем читателям старого учебника "Введение в ал- алгебру", его переводчикам на английский, болгарский, испанский, польский, французский, китайский языки и рецензентам, сообщив- сообщившим свои замечания, а также членам кафедры высшей алгебры МГУ, где учебник продолжает подвергаться ежегодному испытанию. Я рад выразить глубокую благодарность А.Я. Кострикиной, а также Н.К. Ильиной и В.В. Острику за неоценимую помощь при оформлении рукописи. А.И. Кострикин ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 1. Сборник задач по алгебре/ Под редакцией А.И. Кострикина. — М. Факториал, 1995. 2. Курош А.Г. Курс высшей алгебры. — 10-е изд. — М.: Наука, 1971. 3. Фаддеев Д.К. Лекции по алгебре. — М.: Наука, 1984. 4. Шафаревич И.Р. Основные понятия алгебры. — М.: ВИНИТИ, 1986. ГРЕЧЕСКИЙ АЛФАВИТ Аа альфа Нт, эта Nv ню Тт тау вр бета вв тэта кси Tv ипсилон г7 гамма Jl йота Оо омикрон фф фи AS дельта К к каппа #7Г пи хх хи Ее эпсилон лх ламбда Рр ро пси ZC дзета М/л мю Еа сигма Г)ш омега
ЧИТАТЕЛЮ Согласно общему плану, изложенному в предисловии, схема зави- зависимости глав в книге линейна. Фактически студенту-первокурснику полезно читать всё подряд, обращая особое внимание на многочи- многочисленные примеры и на упражнения, значительная часть которых обычно предлагается во время экзамена. Искушённому читателю (скажем, преподавателю или студенту второго курса) будет нетрудно начинать чтение практически с лю- любого места, естественно — при наличии готовности обращаться время от времени к определениям в предыдущих параграфах и гла- главах. Не все новые понятия вводятся в абзацах, начинающихся словом "определение". Подробное оглавление и предметный указатель помо- помогут найти нужное место в книге. Каждая глава разбита на несколько параграфов, а каждый па- параграф — на несколько пунктов с собственными названиями. Внут- Внутри праграфа теоремы, предложения, леммы, следствия имеют свою собственную нумерацию: теорема 1, теорема 2, ...; лемма 1, лем- лемма 2, ... С этой примитивной, но весьма наглядной и экономной ну- нумерацией при ссылках на утверждения из другого параграфа прихо- приходится писать "теорема г §j" или даже "теорема г § j гл. А;", однако это не вызывает неудобств. Конец доказательства отмечается знаком П. Для сокращения используются простейшие логические символы. Знак импликации =Ф- в записи А =$- В имеет простую смысло- смысловую нагрузку, что иА влечёт В" или "из А следует В", в то вре- время как "А <=> В" означает эквивалентность высказываний Л и В, т.е. (... тогда и только тогда, когда ...). Квантор всеобщности V служит заменой выражения "для любого". Остальные обозначения понятны из контекста. Выше приведен целиком греческий алфавит с указанием произно- произношения букв. Наблюдаемая здесь путаница досадна, поскольку буквы греческого алфавита весьма употребительны в математике.
Глава 1 ИСТОКИ АЛГЕБРЫ С чего начинается алгебра? С некоторым приближением можно сказать, что истоки алгебры кроются в искусстве складывать, умно- умножать и возводить в степень целые числа. Формальная, но далеко не очевидная и не однозначная замена чисел буквами позволяет дейст- действовать по аналогичным правилам в пределах гораздо более общих алгебраических систем. Стало быть, попытка ответить исчерпываю- исчерпывающим образом на поставленный вопрос увела бы нас не только в глубь веков, в тайны зарождения математической мысли. Более трудная часть ответа была бы связана с описанием основных структур ал- алгебры наших дней: групп, колец, полей, модулей и т. п. Но этому как раз и посвящена значительная часть книги, так что цель главы 1 кажется пока недостижимой. К счастью, под абстрактной оболочкой большинства аксиома- аксиоматических теорий алгебры скрываются вполне конкретные задачи теоретического или практического характера, решение которых слу- служило в свое время счастливым, а иногда и неизбежным поводом к далеко идущим обобщениям. В свою очередь развитая теория давала импульс и средства к решению новых задач. Сложное взаимодействие теоретических и прикладных аспектов теории, присущее всей мате- математике, в алгебре проступает весьма отчётливо и делает в какой-то мере оправданным принятый нами концентрический стиль изложе- изложения. После кратких общих замечаний, связанных с историей предме- предмета, мы сформулируем несколько задач, предваряющих содержание последующих глав. Одна из этих задач послужит отправной точкой для изучения систем линейных уравнений, теории матриц и теории определителей. Мы изложим метод Гаусса и получим первые сведе- сведения о решениях линейных систем. Уже на этом этапе полезно ввести стандартные обозначения и терминологию, для чего мы дадим сжатый обзор теории множеств и отображений. Будут введены важные понятия отношения эквивалентности и факторизации отображений. Далее в связи с разъяснением принци- принципа математической индукции устанавливаются элементарные комби- комбинаторные соотношения. Особое место отводится перестановкам, на которых базируется теория определителей. Наконец, приводимые в последнем параграфе простейшие ариф- арифметические свойства системы целых чисел не только используются в дальнейшем, но и являются прототипом для построения аналогичной арифметики в более сложных алгебраических системах.
12 Гл. 1. Истоки алгебры Материал этой главы не выходит далеко за пределы школьной программы. От читателя требуется лишь готовность встать на несколько более общую точку зрения. Чтение можно начинать с § 3. § 1. Алгебра вкратце В наши дни не без основания говорят об "алгебраизации" мате- математики, т.е. о проникновении идей и методов алгебры как в теоре- теоретические, так и в прикладные разделы математики. Такое положе- положение вещей, ставшее совершенно отчётливым к середине XX столетия, наблюдалось отнюдь не всегда. Как всякая область человеческой деятельности математика подвержена влиянию моды. Мода на ал- алгебраические методы вызвана существом дела, хотя увлечение ею иногда переходит разумные границы. А так как алгебраическая обо- оболочка, затмевающая содержание, не меньшая беда, чем элементарное забвение алгебры, то не случайно достоинством той или иной книги уже считается (вполне резонно) умение её автора избежать перегру- перегруженности алгебраическим формализмом. Если отвлечься от крайностей, то алгебра издревле составляла существенную часть математики. То же самое следовало бы сказать и о геометрии, но мы скроемся за крылатой фразой Софи Жермен (XIX век): "Алгебра — не что иное, как записанная в символах гео- геометрия, а геометрия — это просто алгебра, воплощённая в фигурах". С тех пор положение изменилось, но, кажется, "признано, что "при- "природа" математических объектов есть, в сущности, дело второстепен- второстепенное и что довольно неважно, например, представили ли мы результат в виде теоремы "чистой" геометрии или при помощи аналитической геометрии в виде алгебраической теоремы" (Н. Бурбаки). В соответствии с принципом "важны не математические объек- объекты, а отношения между ними" алгебра определяется (несколько тав- тавтологически и совершенно непонятно для непосвящённого) как наука об алгебраических операциях, выполняемых над элементами различ- различных множеств. Сами алгебраические операции выросли из элемен- элементарной арифметики. В свою очередь на основе алгебраических со- соображений получаются наиболее естественные доказательства мно- многих фактов из "высшей арифметики" — теории чисел. Но значение алгебраических структур, т.е. множеств с алгебра- алгебраическими операциями, далеко выходит за рамки теоретико-числовых применений. Многие математические объекты (топологические пространства, функции нескольких комплексных переменных и др.) изучаются путём построения надлежащих алгебраических структур, если и не адекватных изучаемым объектам, то во всяком случае отражающих их существенные стороны. Нечто подобное относится и к объектам реального мира.
§ 1. Алгебра вкратце 13 Определённое мнение на этот счет было высказано более 45 лет назад одним из творцов квантовой механики П. Дираком: "Современ- "Современная физика требует всё более абстрактной математики и развития ее основ. Так, неевклидова геометрия и некоммутативная алгебра, считавшиеся одно время просто плодом воображения или увлечения логическими рассуждениями, теперь признаны весьма необходимы- необходимыми для описания общей картины физического мира". Алгебраические средства весьма полезны при исследовании эле- элементарных частиц в квантовой механике, свойств твёрдого тела и кристаллов (в этой связи особенно важна теория представлений групп), при анализе модельных задач экономики, при конструиро- конструировании современных ЭВМ и т.д. и т.п. В свою очередь алгебра питается живительными соками других дисциплин, в том числе математических. Так, гомологические ме- методы алгебры выросли из недр топологии и алгебраической теории чисел. Не удивительно поэтому, что облик алгебры и точка зрения на алгебру менялись в разные эпохи. Мы не имеем возможности про- проследить подробно за этими изменениями не только из-за недостатка места, но главным образом потому, что описание истории предмета должно быть конкретным, — требование, которому можно удовле- удовлетворить лишь при основательном знакомстве с самим предметом. Ограничимся схематическим перечислением имён и периодов. Древние цивилизации Вавилона и Египта. Греческая цивилиза- цивилизация "Арифметика" Диофанта (III в. н.э.). Восточная цивилизация средних веков. Сочинение уроженца Хивы Мухаммеда ибн Муса ал-хорезми (ок. 825г.) "Хисаб ал-джабр ва-л- мукабала". Эпоха Возрождения. С. Ферро A465-1526) Н. Тарталья A500-1557) И. Кардано A501-1576) Л. Феррари A522-1565) Ф. Виет A540-1603) Р. Бомбелли A530-1572) XVII-XVIII вв. Р. Декарт A596-1650) П. Ферма A601-1665) И. Ньютон A643-1727) Арифметические действия на множест- множествах целых и рациональных положитель- положительных чисел. Алгебраические формулы в геометрических и астрономических расчётах. Формулировка задач на по- построение (об удвоении куба и трисекции угла), занимавших алгебраические умы в гораздо более позднее время. Алгебраические уравнения первой и второй степени. Возникновение самого термина "алгебра". Решение общих алгебраических уравне- уравнений третьей и четвертой степени. Создание современной алгебраической символики. Возникновение аналитической геомет- геометрии — прочного мостика между геомет- геометрией и алгеброй. Оживление деятельно- деятельности в теории чисел.
14 Гл. 1. Истоки алгебры Г. Лейбниц A646-1716) Л. Эйлер A707-1783) Ж. Даламбер A717-1783) Ж.-Л. Лагранж A736-1813) Г. Крамер A704-1752) П. Лаплас A749-1827) Вандермонд A735-1796) XIX в. - начало XX в. К. Ф. Гаусс A777-1855) П. Дирихле A805-1859) Э. Куммер A810-1893) Л.Кронекер A823-1891) Р. Дедекинд A831-1916) Е. И. Золотарёв A847-1878) Г. Ф. Вороной A868-1908) А. А. Марков A856-1922) П. Л. Чебышев A821-1894) Ш. Эрмит A822-1901) Н. И. Лобачевский A792-1856) А. Гурвиц A859-1919) А. Руффини A765-1822) Н. X. Абель A802-1829) К. Якоби A804-1851) Э. Галуа A811-1832) Б. Риман A826-1866) 0. Коши A789-1857) К. Жордан A838-1922) Л. Сйлов A832-1918) Г. Грассман A809-1877) Д. Сильвестр A814-1897) А. Кэли A821-1895) У. Гамильтон A805-1865) Дж. Буль A815-1864) С. ЛиA842-1899) Г. Фробениус A849-1918) Ж. Серре A819-1885) М. Нётер A844-1922) Д. А. Граве A863-1939) А. Пуанкаре A854-1912) Ф. Клейн A849-1925) У. Бернсайд A852-1927) Ф. Э. Молин A861-1941) И. Шур A875-1941) Г. Вейль A885-1955) Ф. Энриквес A871-1946) Дж. фон Нейман A903-1957) Д. Гильберт A862-1943) Э. Картан A869-1951) К. Гензель A861-1941) Э. Штейниц A871-1928) Э. Нётер A882-1935) Развитие алгебры многочленов. Ин- Интенсивные поиски общих формул для ре- решений алгебраических уравнений. Пер- Первые подходы к доказательству суще- существования корня уравнения с числовыми коэффициентами. Начала теории опре- определителей. Доказательство основной теоремы о су- существовании корней уравнений с чис- числовыми коэффициентами. Интенсивное развитие теории алгебраических чисел. Поиски методов приближенного реше- решения алгебраических уравнений. Условия на коэффициенты, обеспечивающие за- заданное расположение корней. Решение проблемы о неразрешимости общих уравнений степени п^5в ради- радикалах. Развитие теории алгебраических функций. Создание теории Галуа. Нача- Начала теории конечных групп, преимущест- преимущественно на базе групп перестановок. Интенсивное развитие методов линей- линейной алгебры. Возникновение, после открытия ква- кватернионов, теории гиперкомплексных систем (такие системы теперь называ- называются алгебрами). В частности, в связи с развитием теории непрерывных групп (групп Ли) были заложены основы тео- теории алгебр Ли. Важными главами ма- математики стали алгебраическая геомет- геометрия и теория инвариантов. В XIX в. ма- математика ещё не достигла тонкой диф- дифференциации, и многие крупные уче- ученые творчески работали в различных её областях. Первая половина XX в. была отмече- отмечена коренной перестройкой всего здания математики. Алгебра, отказавшаяся от привилегии быть наукой об алгебраи- алгебраических уравнениях, решительно встала на аксиоматический и гораздо более
§ 2. Некоторые модельные задачи 15 Э. Артин A898-1962) Н. Бурбаки "Элементы математи- математики". абстрактный путь развития. Вошёл в обиход язык теории колец, модулей, категорий, гомологии. Многие разрозненные теории оказались уложены в общую схему универсальной ал- алгебры. На стыке алгебры и математической логики родилась теория моделей. Старые теории обновились, расширив область своих применений. Примером здесь могут служить современная алгебраическая геометрия, алгебраическая топология, алгебраическая К-теория, теория алгебраических групп. Несколь- Несколько ярких взлётов испытала теория конечных групп. Вся алгебра находится сейчас в состоянии динамического разви- развития. Крупные заслуги в этом принадлежат математикам России. Вы- Высокий уровень алгебраических исследований в нашей стране многим обязан таким учёным, как Н.Г. Чеботарёв A894-1947), О.Ю. Шмидт A891-1956), А.И. Мальцев A909-1967), А.Г. Курош A908-1971), П.С. Новиков A901-1975), Д.К. Фаддеев A907-1989). § 2. Некоторые модельные задачи Формулируемые ниже четыре задачи стоят на разных уровнях. Первые три, сами по себе тоже неравноценные, предназначены ис- исключительно для мотивировки исследования полей разных типов, ли- линейных пространств, групп и их представлений, т. е. тех алгебраи- алгебраических теорий, о которых речь будет ниже. "Решениям" этих задач посвящено много специальных монографий. Четвёртую задачу, пред- предваряющую изучение линейных систем, полезно попробовать тут же решить, не заглядывая в следующий параграф, где приводится нуж- нужное рассуждение. 1. Задача о разрешимости уравнений в радикалах. Из элементарной алгебры известна формула -Ь± 2а A) для решений xi,X2 квадратного уравнения ах2 + Ьх + с = 0. Уравнение третьей степени хг + ах2 + Ьх 4- с = 0 подстановкой х н» х - а/3 приводится к виду х3 + рх + g = 0. Корни £i, ^2,хз этого уравнения следующим образом выражаются через его коэффициенты. Если положить е = B)
16 Гл. 1. Истоки алгебры (кубические корни выбираются так, что uv = -Зр), то можно пока- показать, что { + ) {e2 + ) { + e2 xi = {u + v), х2 = -{e2u + ev), хг = -{ей + e2v). C) Формулы B) и C), называемые формулами Кардапо A545 г.) и ассоциирующиеся также с именами других итальянских математи- математиков эпохи Возрождения (С. Ферро, Н. Тарталья), равно как и фор- формула A), справедливы при любых буквенных коэффициентах а, Ь, с, р, д, которым можно придать, например, произвольные рацио- рациональные значения. Аналогичные формулы были найдены для кор- корней уравнения четвёртой степени, и на протяжении почти трёхсот лет предпринимались безуспешные попытки "решить в радикалах" общее уравнение пятой степени. Лишь в 1813 г. А. Руффини (в пер- первом приближении) и в 1827 г. Н. Абель (независимо и совершенно строго) доказали теорему о том, что общее уравнение при га > 4 не разрешимо в радикалах. Фундаментальное открытие в этой области было сделано двадца- двадцатилетним Эваристом Галуа в 1831 г. (оно стало известным лишь в 1846 г.), когда он дал универсальный критерий для разрешимости в радикалах любого (например, с рациональными коэффициентами), а не только общего уравнения степени п. Каждому многочлену (урав- (уравнению) степени га он сопоставил поле разложения и конечное семей- семейство (мощности не более га!) автоморфизмов этого поля, называемое теперь группой Галуа поля (или исходного многочлена). Хотя мы и лишены возможности останавливаться более подроб- подробно на теории Галуа, в [ВА III] будет выделен чисто внутренними свойствами специальный класс так называемых разрешимых групп. Оказывается, уравнение степени га с рациональными коэффициента- коэффициентами разрешимо в радикалах в точности тогда, когда разрешима со- соответствующая ему группа Галуа. Пусть, например, дано уравнение пятой степени х5 - ах - 1 = О, где а — некоторое целое число. Ему отвечает группа Галуа Ga, за- зависящая каким-то сложным образом от a; Go — циклическая группа порядка 4 (а все циклические группы разрешимы по определению) и уравнение хъ - 1 = О разрешимо в радикалах. Напротив, Gi имеет то же строение, что и симметрическая группа 5s порядка 120, а последняя, как показано в [ВА III], неразрешима. Следовательно, неразрешимо в радикалах и уравнение х5 - х - 1 = 0.
§ 2. Некоторые модельные задачи 17 Отметим в заключение, что для практических нужд возможность выразить корень алгебраического уравнения в явном виде через ра- радикалы существенного значения не имеет; более актуальны разные приближённые методы вычисления корней. Но это обстоятельство не умаляет красоты достижения Галуа, оказавшего сильнейшее идей- идейное воздействие на последующее развитие математики. Начать с то- того, что именно Галуа заложил основы теории групп. Установленное Э. Галуа взаимно однозначное соответствие между подполями поля разложения и подгруппами его группы Галуа в XX веке обогатилось новыми абстрактными конструкциями и стало незаменимым сред- средством исследования математических объектов. 2. Задача о состояниях многоатомной молекулы. Каждую молекулу можно рассматривать как систему частиц — атомных ядер (окружённых электронами). Если в начальный момент времени кон- конфигурация системы близка к равновесной, то при определённых усло- условиях частицы, входящие в систему, всегда будут оставаться вблизи положений равновесия и не будут приобретать больших ско- скоростей. Движения такого типа называются колебаниями относи- относительно равновесной конфигурации, а система — устойчивой. Известно, что любое малое колебание молекулы вблизи положе- положения устойчивого равновесия является суперпозицией так называе- называемых нормальных колебаний. Во многих случаях удаётся определить потенциальную энергию молекулы и её нормальные частоты, при- принимая во внимание внутреннюю симметрию молекулы. Симметрия молекулярной структуры описывается точечной группой молекулы. Различные реализации этой конечной группы (её неприводимые пред- представления) и связанные с этими реализациями функции на группе (характеры представлений) определяют параметры колебаний моле- молекулы. Например, молекуле воды Н2О (рис. 1) отвечает четверная груп- группа Клейна (прямое произведение двух циклических групп второго порядка), а молекуле фосфора Р4 (рис. 2), имеющей вид правильного Рис. 1 Рис. 2 тетраэдра, в вершинах которого расположены атомы фосфора, — симметрическая группа 54 порядка 24. Неприводимые представления этих групп будут изучены в [В А III].
18 Гл. 1. Истоки алгебры В настоящее время развитие структурной теории молекул труд- трудно себе представить без помощи теории групп. Гораздо более ран- ранние применения теории групп относятся к кристаллографии. Ещё в 1891 г. великий русский кристаллограф Е.С. Фёдоров, а затем немец- немецкий ученый А. Шёнфлис нашли 230 пространственных кристаллогра- кристаллографических групп, описывающих все имеющиеся в природе симметрии кристаллов. С тех пор теория групп постоянно используется для ис- исследования влияния симметрии на физические свойства кристалла. 3. Задача о кодировании сообщения. В конструировании автоматических систем связи, наземных или космических, обычно в качестве элементарного сообщения берётся упорядоченная последо- последовательность — строка (или слово) а = (ai,a2,...,an) длины п, где п{ = 0 или а» = 1. Так как обычные операции сложения и умножения по модулю 2 хорошо приспособлены для выполнения на электронной машине, а сами символы 0, 1 удобны для передачи в виде электрических сигналов A и 0 отличаются фазой разделённых по времени сигналов или их наличием и отсутствием), то неудиви- неудивительно, что поле GFB) (см. § 3 гл. 4) — необходимый атрибут спе- специалиста по переработке информации. Иногда удобно использовать в качестве а,{ элементы других конечных полей. С целью исключения влияния помех (атмосферных разрядов, кос- космических шумов и т. д.), способных превратить 0 в 1 и обратно, приходится брать а достаточно длинным и использовать специаль- специальную систему кодирования — выбор такого подмножества (кода) Sq передаваемых строк (кодовых слов) из всего их множества 5, чтобы было возможно восстановить а по полученному искажённому слову а' при условии, что произошло не слишком много ошибок. Так воз- возникают коды, исправляющие ошибки. Алгебраическая теория кодирования, сильно развившаяся за по- последние годы и предложившая много остроумных методов кодиро- кодирования, имеет дело в основном со специальными линейными кодами, когда выбор Sq связан с построением специальных прямоугольных матриц и решением систем линейных уравнений, коэффициенты ко- которых принадлежат заданному конечному полю. Простой пример та- такого кода будет приведён в гл. 4. 4. Задача о нагретой пластинке. Плоская прямоугольная пластинка с тремя отверстиями (рис. 3) используется в качестве кла- клапана одного фантастического устройства для получения низких тем- температур. На клапан нанесена квадратная сетка (решётка). Её вершины, лежащие на четырёх контурах, называются граничными, а все ос- остальные вершины — внутренними. Непосредственное измерение
§ 3. Системы линейных уравнений. Первые шаги 19 показывает, что при любом нагревании или охлаждении температу- температура в каждой внутренней верпшне является средней арифметической величиной от температур ближайших четырёх вершин — неважно, граничных или внутренних. Ожидается, что детали устройства, 50 Рис. 3 соприкасаясь с различными участками контуров, сообщат соответст- соответствующим граничным точкам указанную на рис. 3 температуру. Возможно ли это, а если возможно, то однозначно ли при этом расп- распределение температуры во внутренних точках? § 3. Системы линейных уравнений. Первые шаги Линейные уравнения ах = Ь и системы вида ах + by = e, сх + dy = / A) с вещественными (действительными) коэффициентами a, b,c,d,e,/ "решаются" в средней школе. Наша цель — научиться оперировать с системой линейных алгебраических уравнений (или, коротко, с ли- линейной системой) самого общего вида = 62, B) -f • •. xn = b Здесь тип — произвольные целые положительные числа. Будучи, казалось бы, чисто количественным, усложнение, полу- получающееся при переходе от A) к B), имеет на самом деле принципи- принципиальное значение. Системы вида B) встречаются буквально во всех разделах математики, и так называемые линейные методы, конеч- конечным продуктом которых часто являются решения линейных систем, составляют её наиболее развитую часть. Достаточно упомянуть, что теория систем вида B) послужила в конце XIX века прототипом для создания теории интегральных уравнений, играющей исключительно
20 Гл. 1. Истоки алгебры важную роль в механике и физике. Решение большого числа практи- практических задач на ЭВМ также сводится к системам B). 1. Терминология. Следует обратить внимание на весьма эко- экономное и удобное обозначение коэффициентов системы B): коэффи- коэффициент ац (читается а-и-жи; например, а\ч есть а-один-два, но ни- никак не а-двенадцать) стоит в г-м уравнении при j-й неизвестной Xj. Число Ь{ называется свободным членом г-ro уравнения. Система B) называется однородной, если Ь{ = 0 для г = 1,2,..., га. При любых Ь{ линейную систему + ^12^2 + . . . + = 0, = 0» /«Оч + am2 + . . • + amnXn = 0 называют однородной системой, ассоциированной с системой B) или ещё — приведённой системой для системы B). Коэффициенты при неизвестных составляют прямоугольную таблицу an C) называемую матрицей размера тхп (тх п-матрицей или квадрат- квадратной матрицей порядка п при т = п) и сокращённо обозначаемую символом (aij) или просто буквой А. Естественно говорить об г-й строке (а«1, од» • • •, а»п) матрицы C) и о j-м столбце amj который в дальнейшем, ради экономии места, будет изображаться строкой, заключённой в квадратные скобки: [ay,аъ$,...,amj]. В слу- случае квадратной матрицы говорят ещё о главной диагонали, состоя- состоящей из элементов ац,022» • • • >аПп- Матрица (а^), у которой все эле- элементы вне главной диагонали равны нулю, обозначается иногда и называется диагональной матрицей, а при ац = an = .. • = ann = a обозначается diagn(a) (скалярная матрица). Для матрицы diagn(Z), называемой единичной матрицей, обычно используется обозначение Еп или Е, когда размер матрицы фиксирован.
§ 3. Системы линейных уравнений. Первые шаги 21 Наряду с матрицей C) рассматривают и расширенную матрицу (aij\bi) системы B), получаемую из C) добавлением столбца [Ь\, Ь2, • • • > Ьт] свободных членов; для ясности он отделён от осталь- остальных столбцов вертикальной чертой. Если каждое из уравнений системы B) обращается в тождество после замены неизвестных Х{ числами ж?, то упорядоченный набор из п чисел ж?, х2,..., я£ называется решением системы B), ах- — его г-й компонентой. Говорят также, что набор ж?, ж!],... ,я° удов- удовлетворяет всем уравнениям системы B). Система, не имеющая ни одного решения, называется несовместной. Если же у системы есть решения, то она называется совместной и притом определённой, коль скоро решение единственно. Решений может быть и более одного, тогда система называется неопределённой. Совместна ли данная си- система линейных уравнений, а если совместна, то каковы все её реше- решения — вот ближайшие вопросы, на которые нужно получить ответ. Посмотрим ещё раз на задачу п. 4 § 2. Пронумеруем все внутренние точки пластинки произвольным образом от 1 до 416 (именно столько их на рис. 3), добавим к ним 204 номера гра- граничных точек и в соответствии с заданным правилом вы- вычисления температуры U во внутренней точке с номером г составим 416 соотношений типа / Q к b e d 9 с h е 4 ' Рис.4 Пусть, скажем, а, 6, с ^ 416, d > 416. Тогда это соотношение можно перепи- переписать в виде линейного уравнения -ta -tb-lc+ 4te = td с правой частью tj = -273,-100,-50,0,50,100,300 (возможны и другие вари- варианты). Взятые вместе эти уравнения составят квадратную линейную систему вида B) с п = т = 416. Коэффициенты при неизвестных U равны 0 (их боль- большинство), -1 или 4. Является ли эта система совместной и определённой? Мы получили иную, математически точную формулировку задачи качест- качественного характера. Вопрос о существовании и единственности весьма типичен для многих разделов математики, связанных с изучением физических явлений. 2. Эквивалентность линейных систем. Пусть нам дана ещё одна линейная система того же размера a'nxi + а'12х2 + ... + а[пхп = Ь[, а'21хх + а'22х2 + ... + ОъпХп = Ь;2, <4l*l + а'т2 + • • • + а'тпхп = Vm. Будем говорить, что система B;) получена из B) при помощи элементарного преобразования типа (I), если в системе B) все урав- уравнения, кроме г-ro и fc-ro, остались прежними, а г-е и k-e уравнения поменялись местами. Бели же в B;) все уравнения, кроме г-ro, те же,
22 Гл. 1. Истоки алгебры что и в B), а г-е уравнение имеет вид (an + caki)xi + ... + (ain + cakn)xn = b{ + cbk, (*) где с — какое-то число (т.е. а1^ = а^+са**', fcj = Ь*+сЬ*), то полагаем, что к системе B) применено элементарное преобразование типа (II). Линейные системы B) и B') называются эквивалентными, если обе они либо несовместны, либо совместны и обладают одними и те- теми же решениями. Условившись обозначать эквивалентность систем (а) и (Ь) так: (а) ~ (Ь), мы замечаем, что (а) ~ (а), из (а) ~ (Ь) следует (Ь) ~ (а), а из (а) ~ F) и (b) ~ (с) следует (а) ~ (с). Достаточный признак эквивалентности систем содержится в сле- следующем утверждении. Теорема 1. Две линейные системы эквивалентны, если одна получается из другой путём применения конечной последователь- последовательности элементарных преобразований. Доказательство. Достаточно установить эквивалентность системы B) и системы B;), полученной из B) путём применения од- одного элементарного преобразования. Заметим, что система B) получается из B') также в результа- результате применения одного элементарного преобразования, поскольку эти преобразования обратимы. Другими словами, в случае (I), переста- переставив ещё раз местами уравнения с номерами г и fc, мы вернёмся к первоначальной системе; аналогично в случае типа (II), прибавив к г-му уравнению в B') fc-e, умноженное на (—с), мы получим г-е урав- уравнение системы B). Докажем теперь, что любое решение (xj,..., ж®) системы B) явля- является также решением системы B;). Если было произведено элемен- элементарное преобразование типа (I), то сами уравнения вообще не из- изменились (изменился только порядок их записи). Поэтому числа ж?, Х2> • • • > хпу удовлетворявшие им ранее, будут удовлетворять им и по- после преобразования. В случае элементарного преобразования типа (И) уравнения, кроме г-го, не изменились, и поэтому решение (rrj, ^2» • • • > XV) им по-прежнему удовлетворяет. Что касается г-го уравне- уравнения, то оно приобрело вид (*). Так как наше решение удовлетворяет г-му и fc-му уравнениям системы B), то ацх<1 + ... + ainx°n = Ь{, cikiXi + ... + aknXn = bk. Умножив обе части последнего тождества на с и прибавив его к пер- первому, мы получим, группируя члены, тождество вида (*) с Х{ = ж?. В силу отмеченной выше обратимости элементарных преобразо- преобразований проведённое рассуждение показывает также, что, обратно, лю- любое решение системы B;) будет решением системы B).
§ 3. Системы линейных уравнений. Первые шаги 23 Осталось заметить, что несовместность одной системы влечёт несовместность другой (рассуждение от противного). D 3. Приведение к ступенчатому виду. Путём последователь- последовательного применения элементарных преобразований можно перейти от заданной системы уравнений к системе более простого вида. Во-первых, заметим, что среди коэффициентов ац имеется хотя бы один, отличный от нуля. В противном случае не имело бы смыс- смысла упоминать о неизвестной х\. Если ац = 0, то поменяем местами (преобразование типа (I)) первое уравнение с таким j-м, что clji ^ 0. Теперь коэффициент в первом уравнении при первой неизвестной от- отличен от нуля. Обозначим его через а'п. Вычтем из г-го уравнения (г = 2,3,..., ш) новой системы первое уравнение, обе части которого умножены на такой коэффициент с*, чтобы после вычитания коэф- коэффициент при х\ обратился в 0 (ш — 1 элементарных преобразований типа (II)). Очевидно, что для этого нужно положить с* = ац/а'п. В результате мы получим систему, в которой х\ входит только в первое уравнение. При этом может оказаться, что вторая неизвест- неизвестная также не входит во все уравнения с номером г > 1. Пусть Xk — неизвестная с наименьшим номером, которая входит в какое-нибудь уравнение, не считая первого. Мы получим систему a'2kxk+ ... +a!2nxn = amkXb + • • • + amnxn = Не обращая теперь внимания на первое уравнение, применим ко всем оставшимся те же рассуждения, что и ранее. После ряда эле- элементарных преобразований исходная система примет вид =Ь'3', Разумеется, здесь a"j = a^b" = b'i, ибо первое уравнение не затра- затрагивалось. Будем применять этот процесс до тех пор, пока возможно. Ясно, что мы будем вынуждены остановиться, когда станут равными нулю не только коэффициенты при очередной неизвестной (скажем,
24 Гл. 1. Истоки алгебры 5-й), но и коэффициенты при всех следующих неизвестных вплоть до n-й. При этом система B) примет вид •-. D) arsxs + ... + arnxn = br, 0=br+i, 0=bm. Здесь an^ast... ars ф 0, 1 < к < I < ... < 5. Может оказаться, что г = m, и поэтому уравнений вида 0 = Ь{ в системе D) не будет. Про систему уравнений вида D) говорят, что она имеет ступенчатый вид. Этот термин не является общепринятым; здесь можно было бы говорить о трапецевидном или о квазитреугольном виде и т.п., что не так уж существенно. Теорема 2. Всякая система линейных уравнений эквивалентна системе, имеющей ступенчатый вид. Доказательство непосредственно вытекает из предшествующих рассуждений. Элементарные преобразования иногда удобно производить не над системой, а над её расширенной матрицей (a^ | b{). Точно так же, как и теорема 2, доказывается Теорема 2'. Всякую матрицу можно при помощи элементар- элементарных преобразований привести к ступенчатому виду. 4. Исследование системы линейных уравнений. Ввиду теорем 1 и 2 вопросы совместности и определённости достаточно исследовать для систем ступенчатого вида D). Начнём с вопроса о совместности. Очевидно, что если система D) содержит уравнение вида 0 = bt с bt ф 0, то эта система несовместна, так как равенство 0 = bt нельзя удовлетворить никакими значениями для неизвестных. Докажем, что если таких уравнений в системе D) нет, то эта система совместна. Итак, пусть bt = 0 при t > г. Назовём неизвестные х\, ж*, ж/, ... ...,xs, с которых начинаются первое, второе, ..., r-е уравнения, главными, а остальные неизвестные, если таковые имеются, — сво- свободными. Главных неизвестных по определению всего г. Придадим свободным неизвестным произвольные значения и под- подставим их в уравнения системы D). Тогда для х8 получится одно (г-е)
§ 3. Системы линейных уравнений. Первые шаги 25 уравнение вида ах8 = Ь с а = аГ8 ф О, которое имеет единственное решение. Подставляя найденное значение х8 = х^ в первые г — 1 урав- уравнений и поднимаясь так снизу вверх по системе D), мы убедимся в том, что значения для главных неизвестных определяются однознач- однозначно при любых заданных значениях для свободных неизвестных. Нами доказана Теорема 3. Для совместности системы линейных уравнений необходимо и достаточно, чтобы после приведения к ступенчато- ступенчатому виду в ней не оказалось уравнений вида 0 = bt с bt ф 0. Если это условие выполнено, то свободным неизвестным можно придать произвольные значения; главные неизвестные (при заданных значе- значениях для свободных) однозначно определяются из системы. Выясним теперь, когда система будет определённой, в предполо- предположении, что введённое нами условие совместности выполнено. Если в системе D) имеются свободные неизвестные, то система заведомо неопределённа: мы можем придать свободным неизвестным любые значения, выражая через них (по теореме 3) главные неизвестные. Если же свободных неизвестных нет, и все неизвестные, стало быть, главные, то по теореме 3 они определяются из системы однозначно, так что система является определённой. Остается заметить, что отсутствие свободных неизвестных рав- равносильно условию г = п. Мы доказали следующее утверждение. Теорема 4. Совместная линейная система B) является опре- определённой тогда и только тогда, когда в полученной из неё ступен- ступенчатой системе D) выполняется равенство г = п. При т = п линейную систему, приведённую к ступенчатому виду, можно записать ещё так (треугольный вид): E) если не заботиться о том, чтобы выполнялось условие йц ф 0 для всех г. Действительно, запись E) означает, что в системе fc-e уравнение не содержит неизвестных Х{ с г < А:, а это условие заведомо выполнено для систем ступенчатого вида. Заметим на будущее, что матрица (а^) с элементами a,ij = 0 при i > j называется верхней треугольной. Аналогично определяется нижняя треугольная матрица. Из теорем 3 и 4 вытекает Следствие 1. Линейная система B) в случае т = п является совместной и определённой тогда и только тогда, когда после
26 Гл. 1. Истоки алгебры приведения к ступенчатому виду получится система E) с апа22...апп ф 0. Обратим внимание на тот факт, что это условие не зависит от правых частей системы. Поэтому при т = п система B) тогда и только тогда совместна и определённа, когда это верно для ассоци- ассоциированной с ней однородной системы B°). Но однородная система всегда совместна: она имеет, например, нулевое решение Условие ацЙ22 • • • о>пп Ф 0 означает, что однородная система обладает только нулевым решением. Мы приходим к иной форме следствия 1, не связанной с её ступенчатым видом. Следствие 1'. Линейная система B) в случае т = п являет- является совместной и определённой тогда и только тогда, когда ассо- ассоциированная с ней однородная система B°) имеет только нулевое решение. Специального внимания заслуживает случай п > т. Следствие 2. Совместная система B) при п > т является неопределённой. В частности, однородная система при п > т всег- всегда имеет ненулевое решение. Доказательство. Действительно, в любом случае г ^ ш, поскольку в системе D) не больше уравнений, чем в системе B) (урав- (уравнения с тождественно равными нулю левыми и правыми частями от- отброшены). Поэтому неравенство п > т влечёт п > г, что по теоре- теореме 4 означает неопределённость системы B). Остаётся заметить, что неопределённость однородной системы равносильна существованию у неё ненулевого решения. □ Часть полученных нами результатов отражена в следующей таблице. Число решений Тип линейной системы общая 0,1,оо однородная 1,00 п> т неоднородная 0, оо n > m неоднородная оо 5. Отдельные замечания и примеры. Изложенный нами метод решения систем линейных уравнений называется методом Гаусса или методом последовательного исключения неизвестных. Весьма удобный при небольших п, он годится и для осуществления на ЭВМ, хотя по разным причинам более практичными зачастую оказываются другие способы решения, например итерационные. Это относится в особенности к тому случаю, когда коэффициенты даны, а решения ищутся с определённой степенью точности. В теоретиче- теоретических исследованиях, однако, первостепенное значение приобретают формулировка условий совместности или определённости линейной
§ 3. Системы линейных уравнений. Первые шаги 27 системы, а также нахождение общих формул для решений в терми- терминах коэффициентов и свободных членов без приведения системы к ступенчатому виду. В какой-то мере одному из этих требований от- отвечает следствие 1'. Пример 1. Вновь обратимся к задаче о нагретой пластинке из § 2. Как мы видели в п. 1, интересующий нас вопрос выражается в свойствах вполне конкрет- конкретной линейной системы (для определённости назовём ее НП) с довольно большим числом неизвестных £». Следуя критерию, сформулированному в следствии 1/, рассмотрим однородную линейную систему (ОНП), ассоциированную с НП. Дру- Другими словами, температура всех граничных точек пластинки принимается теперь равной нулю. Пусть е — номер внутренней точки с максимальным значе- значением \te\. Тогда из условия tg + tb + *С + td ie = 4 вытекает |ie| = \ta\ = \tb\ = \tc\ = \td\- Сдвигаясь на один шаг решётки в любом из четырёх направлений, мы будем проходить через точки с тем же значением \t{\ — |te|, пока не достигнем граничной точки с нулевой температурой. Значит, \te\ = 0, а поэтому и U = 0 для всех г. Итак, система ОНП имеет лишь нулевое решение, и, стало быть, НП — совместная и определённая линейная система. Задача о нагретой пластинке в первоначальной её постановке тем самым решена. Пример 2. Дана линейная система XI =1, Х2 = 1, -X! -Х2 + ХЗ =0, -Хп-2 -Хп_1 + Хп =0. Очевидно, что это — совместная определённая система, уже приведённая к сту- ступенчатому (треугольному) виду. Только, решая ее, нужно двигаться не снизу вверх, а сверху вниз. Решением является по определению последовательность первых п чисел Фибоначчи /ь/г,-•-,/п. Эти числа связаны с одним ботани- ботаническим явлением, так называемым филлотаксисом (расположением листьев на растениях). Однако при п = 1000 или даже при произвольном п хотелось бы указать общее выражение (аналитическую формулу) для n-го числа Фибоначчи. Вы можете возразить, сказав, что у вас хватит терпения указать и /юоо? следуя индуктивному определению этих чисел. Но это не будет математическим реше- решением вопроса. В гл. 2 и гл. 3 мы укажем два выражения для /п, хотя, конечно, эту конкретную задачу можно решить и более прямыми средствами. Замечание 1. Иногда бывает удобнее находить решения ли- линейной системы, не приводя её к ступенчатому виду. Это особенно относится к тому случаю, когда матрица системы содержит много нулей. Небольшая практика здесь предпочтительнее длинных объяс- объяснений. Замечание 2. Какое количество Гп арифметических операций необходимо выполнить для решения системы п линейных уравнений с п неизвестными методом Гаусса? Это не праздный вопрос, поскольку ставшему обыденным в наши дни использованию ЭВМ при больших п должны предшествовать априорные оценки машинного времени, требуемого для решения задачи.
28 Гл. 1. Истоки алгебры Так как умножение двух чисел более трудоёмко, чем сложение, то рекомендуется подсчитывать только количество умножений и, разу- разумеется, делений, называемых далее просто операциями. Без ограни- ограничения общности можно предполагать, что решение линейной систе- системы единственно, т.е. все неизвестные — главные. Правые части урав- уравнений пока игнорируем. Тогда для исключения неизвестной х\ из уравнения с номером г > 1 нужно заготовить число U = ац/ац (одно деление) и вычислить ещё п — 1 произведений /*ау, j = 2,3,..., п, т.е. всего требуется п операций. Процедурой вычитания из г-го уравне- уравнения первого, умноженного на Z», мы условились пренебречь. Так как i = 2,3,..., п, то для исключения х\ понадобилось п(п — 1) операций. На втором шаге, когда мы имеем дело с системой порядка п - 1, понадобится (п — 1)(п — 2) операций, на третьем — соответственно (п — 2)(п — 3) и т.д. Общее число операций для приведения левых частей системы к треугольному виду E) равно сумме Г(п) = п(п - 1) + (п - 1)(п - 2) + ... + 1A - 1). Нетрудно убедиться (докажите сами или загляните в § 7), что Г(п) = п3 - п Процесс нахождения компонент z^^n-i' •••>£? решения (движе- (движение снизу вверх по системе E)) требует всего п= операций. При больших п это не внесёт существенного вклада в общую сумму операций. Итак, вполне удовлетворительной оценкой числа операций является (гауссова) величина Гп = п3/3. В 1969 г. Штрассеном разработан метод (подробности см. в [ВА II]), требующий только операций, — значительный выигрыш при очень больших п, полу- полученный, правда, за счёт увеличения числа операций сложения. Но константа С в Шп чрезвычайно велика, а программа реализации логически сложна, поэтому речь идёт скорее о выигрыше в тео- теоретическом плане. Оба упомянутых нами метода являются типичными математи- математическими алгоритмами, приспособленными для решения массовых за- задач. Позднее мы встретимся с другими примерами алгоритмов. Их роль в наш век сплошной компьютеризации весьма велика. При этом важны не только сами алгоритмы, но и оценки их сложности.
§ 4- Определители небольших порядков 29 § 4. Определители небольших порядков Излагая метод Гаусса, мы не слишком заботились о значениях коэффициентов при главных неизвестных. Важно было лишь то, что эти коэффициенты отличны от нуля. Проведём теперь более акку- аккуратно процесс исключения неизвестных хотя бы в случае квадрат- квадратных линейных систем небольших размеров. Это даст нам пищу для размышлений и исходный материал для построения общей теории определителей в гл. 3. Как и в § 3, рассмотрим систему двух уравнений с двумя неиз- неизвестными аХ + аХ = Ь\, ,-, f>2 и постараемся найти общие формулы для компонент ния. Назовём определителем матрицы — 021012 и обозначим его з^2 её реше- выражение ai 1022— U21 О22 Тем самым квадратной матрице сопоставляется число О21 О22 B) Если мы попытаемся исключить Х2 из системы A), умножив первое уравнение на агг и прибавив к нему второе, умноженное на —ai2, то получим Правую часть также можно рассматривать как определитель матри- цы . Предположим, что &2 а22 0. Тогда мы имеем an О22 x2 = C) Имея формулы для решения системы двух линейных уравнений с двумя неизвестными, мы можем решать и некоторые другие систе- системы (решать системы — значит находить их решения). Рассмотрим,
30 Гл. 1. Истоки алгебры например, систему двух однородных уравнении с тремя неизвестны- неизвестными + ai2S2 + О13Ж3 = 0, = 0. D) Нас интересует ненулевое решение этой системы, так что хотя бы одно из Х{ не равно нулю. Пусть, например, хз Ф 0. Разделив обе части на -хз и положив у\ = — х\/хз, уг = —яг/^з, запишем систему D) в том же виде On2/i + 0122/2 = Oi3, O21J/1 +О222/2 = 023» что и A). При предположении an B21 012 О22 Ф 0 формулы C) дают i 2/1 = - — = хз 013 ai2 О23 CL22 a2i 022 2/2 = = an 012 «21 «23 an a2i Неудивительно, что мы нашли из системы D) не сами Ж1,Ж2,Жз, а только их отношения: из однородности системы легко следует, что если (xi, ^2, Ж3) — решение и с — любое число, то (cxj, сх®,сх%) тоже будет решением. Поэтому мы можем положить 023 012 022 x = - ж = E) O2i 023 ' 3 O2l O22 и сказать, что любое решение получается из указанного умножением всех Х{ на некоторое число с. Чтобы придать ответу несколько более симметричный вид, заметим, что всегда \ a b \ \ b a \ I с d I " I d с Г как это непосредственно видно из формулы B). Поэтому E) можно записать в виде О12 О13 a22 023 Х2 = - ац 013 CL21 агз x3 = F) Эти формулы выведены в предположении, что фО. Не- Неон О12 О21 О22 трудно проверить, что доказанное утверждение верно, если хоть один из входящих в выражения F) определителей отличен от нуля. Если же все три определителя равны нулю, то, конечно, формулы F) дают решение (а именно нулевое), но мы не можем утверждать, что
§ 4- Определители небольших порядков 31 все решения получаются из него умножением на число (рассмотрите систему, состоящую из двух совпадающих уравнений х\ +Х2+х$ = 0). Перейдём теперь к случаю системы трёх уравнений с тремя не- неизвестными = 0, - азз^з = 0. Мы хотим исключить из этой системы Х2 и хз, чтобы получить зна- значение для х\. С этой целью умножим первое уравнение на ci, второе на С2, третье на сз и сложим их. Подберём С1,С2,сз так, чтобы в по- получившемся уравнении члены с Х2 и жз обратились в нуль. Прирав- Приравнивая нулю соответствующие коэффициенты, мы получим для с\, С2 и сз систему уравнений 4" ^22^2 4" ^32^3 = 0, 4- а2зС2 4- азз^з = 0, относящуюся к тому же типу, что и D). Поэтому можно взять а\2 а$2 I ^23 с\ = , С2 = - После очевидных изменений мы получаем для х\ выражение О22 О23 032 032 4-a3i 032 Q>i2 G) Коэффициент при х\ называется определителем матрицы и обозначается аи аз1 аи О>21 аи т аз2 а12 а22 а$2 агз азз ai3 ^23 ^33 Таким образом, за определитель третьего порядка мы берём выра-
32 Гл. 1. Истоки алгебры жение О>23 = Оц О>22 а23 0>12 = сщаггозз + ^12^23^31 + 013021^32 — ai2 013 О22 ^23 — 012021033 — (8) задаваемое при помощи определителей второго порядка. Легко заме- заметить, что правая часть в равенстве G) получается из коэффициента при х\ заменой ац на bi, 021 на Ьг и аз1 на Ьз- Поэтому равенство G) можно записать в виде a>2i Q>i2 ai3 О22 ^23 a32 ^33 Zi = h b2 h О22 Предположим, что коэффициент при х\ отличен от нуля. Тогда, проведя аналогичные вычисления для Х2 и ственно Zi,Z2,Z3 В ВИДе мы выразим соответ- соответbi b2 ^23 an a2i ^22 ^32 ^23 an a2i <*31 ац 021 031 h b2 Ьз аи О22 аз2 on О23 азз огз G23 азз ац О31 ^22 b2 Ьз ац О22 Q>32 огз G23 Очевидно, что те же самые рассуждения применимы к системе из четырёх, пяти и т.д. уравнений с тем же числом неизвестных. Для этого нам надо сначала вывести формулы, аналогичные F), для решений однородной системы трёх уравнений с четырьмя неизвест- неизвестными; потом в системе четырёх уравнений с четырьмя неизвестными исключить z2,Z3,Z4, умножая уравнения на сх,С2,сз,С4 и складывая их. Мы найдём значения с* (г = 1,2,3,4) из системы трёх однородных уравнений. Коэффициент, получающийся при х\ и строящийся из определи- определителей третьего порядка по образцу (8), мы назовём определителем четвёртого порядка. Проводя те же рассуждения с Z2, Z3, Z4, мы найдём для z* форму- формулы, аналогичные (9). Так можно продолжать неограниченно. Уверен- Уверенность в том, что мы когда-нибудь достигнем цели, нам даёт общий принцип, широко используемый в математике, а именно принцип ма- математической индукции (см. § 7).
§ 5. Множества и отображения 33 УПРАЖНЕНИЯ 1. Формулу (8) легче запомнить, если воспользоваться следующим нагляд- наглядным правилом знаков для выписывания произведений, входящих в разложение определителя третьего порядка: Найти аналогичное правило для определителя четвёртого порядка. 2. Показать, что все шесть членов в разложении определителя третьего по- порядка не могут быть одновременно положительными. 3. Проверить, что an ai2 «22 азг ai3 «23 азз an «12 «13 «21 «22 О23 аз1 «32 азз 0 —a -6 a 0 ~—с b с 0 = 0. § 5. Множества и отображения В предыдущих двух параграфах мы встретились с множествами элементов разной природы, равно как и с отображениями множеств. Множество решений данной системы линейных уравнений или пра- правило, ставящее в соответствие каждой матрице второго порядка её определитель, — это лишь частные проявления того круга формаль- формальных понятий, знакомство с которым (хотя бы на интуитивном уров- уровне) полезно для дальнейшего. 1. Множества. Под множеством, понимают любую совокуп- совокупность объектов, называемых элементами множества. Множества с конечным числом различных элементов могут быть описаны путём явного перечисления всех их элементов; обычно эти элементы заключаются в фигурные скобки. Например, {1,2,4,8} — множество степеней двойки, заключённых между 1 и 10. Как пра- правило, множество обозначается прописной буквой какого-либо алфа- алфавита, а его элементы — строчными буквами того же или другого алфавита. Для некоторых особо важных множеств приняты стандартные обозначения, которых стоит придерживаться. Так, буквами N, Z, Q, R обозначают соответственно множество положительных целых чи- чисел (натуральные числа), множество всех целых чисел, множество рациональных чисел и множество вещественных чисел. При заданном множестве S включение а € 5 указывает на то, что а — элемент множества 5; в противном случае пишут а $ 5.
34 Гл. 1. Истоки алгебры Говорят, что 5 — подмножество множества Г и записывают это 5 С Г E содержится в Г), когда имеет место импликация Уж х е S =» х е Г. (По поводу обозначений см. раздел "Советы читателю".) Два множества S и Г совпадают (или равны), если у них одни и те же элементы. Символически это записывается так: 5 = Г «=> S С Г, Г С 5 — "тогда и только тогда, когда" или "влечёт в обе стороны"). Пустое множество 0, совсем не содержащее элементов, по опре- определению входит в число подмножеств любого множества. Если 5 С Г, но 5 Ф 0 и 5 Ф Г, то 5 — собственное подмножество в Г. Для выде- выделения подмножества S С Т часто используют какое-либо свойство, присущее только элементам из 5. Например, {п е Ъ | п = 2ш для некоторого m € Z} — множество всех чётных целых чисел, а N = {п е Ъ | п > 0} — множество натуральных чисел. Под пересечением двух множеств S иТ понимают множество а под их объединением — множество Пересечение S П Г может быть пустым множеством. Тогда говорят, что S иТ — непересекающиеся множества. Операции пересечения и объединения удовлетворяют тождествам типа проверку которых мы оставляем читателю в качестве упражнения. Рис. 5 поможет провести несложное рассуждение. Рис.5 Разностью S\T множеств S и Г называется совокупность тех элементов из 5, которые не содержатся в Т. При этом, вообще говоря, не предполагается, что Г С 5. Вместо S\T пишут также 5 - Г.
§ 5. Множества и отображения 35 Если Т — подмножество в 5, то запись S \ Т обозначает ещё дополнение к Т в 5. Положив R = 5 \ Г, будем иметь RHT = 0, R U Г = 5. Обратим внимание на соответствие между операциями пересечения, объединения, дополнения и логическими связками "и", "или", "нет". Пусть далее X и У — произвольные множества. Пару (ж, у) эле- элементов х € Х,у €Y, взятых в данном порядке, будем называть упо- упорядоченной парой) считая при этом, что («i,yi) = (я2,уг) Т0ГДа и только тогда, когда х\ = Ж2,У1 = У2- Декартовым произведением двух множеств X и Y называется множество всех упорядоченных пар (я, у): XxY = {(x,y)\xeX,yeY}. Пусть, например, R — множество всех вещественных чисел. Тогда декартов квадрат R2 = R x R есть просто множество всех декартовых координат точек на плоскости относительно заданных координатных осей. Аналогичным образом можно было бы ввести декартово произведение Х\ х Хъ х Х% трёх множеств (= {Х\ хХ2)х х Хз = Х\ х (Х2 х Хз)), четырёх и т.д. При Х\ = Х2 = ... = Xk пишут сокращённо Хк = ХхХх...хХ и говорят о fc-й декартовой степени множества X. Элементами Хк являются последовательности (или строки) (х\, хг,..., Хк) длины А;. Чтобы почувствовать различие между множествами X х Y и X U U У, возьмём за X и Y множества конечной мощности (cardinality (англ.)): |Х| = Card* = п, |У| = Cardy = m. Тогда \Х х Y| = пт, \Х U Y\ = n + m - \Х П У|. Если это не ясно, то нужно перечитать заново все определения. 2. Отображения. Понятие отображения или функции играет центральную роль в математике. При заданных множествах X и Y отображение / с областью определения X и областью значений Y сопоставляет каждому элементу х € X элемент f(x) € У, обозначае- обозначаемый также fx ниш /ж. В случае Y = X говорят ещё о преобразовании f множества X в себя. Символически отображение записывается в виде f: X —>УилиХ-Ау. Образом при отображении / называется множество всех элемен- элементов вида f(x): Ьп/ = {/(х)|х €*} = /(*) С У (Im — от image (англ.)).
36 Гл. 1. Истоки алгебры Множество Г1(») = {^ех|/(х) = у} называется прообразом элемента у б У. Более общо: для Уо С У положим *(%) = {* € Х\ /(*) С Уо} = U ГЧУ). Если у б У \ Ьп /, то, очевидно, / г(у) = 0. Отображение /: X -> У называется сюръектгтвньис (surjective (фр).) или отображениедс на, когда 1т/ = У; оно называется инъ- ективным (injective (фр).)> когда из х ф х1 следует f(x) ф /(ж'). Наконец, /: X -> У — биективное (bijective (фр.)) или взагллсно од- однозначное отображение, когда оно одновременно сюръективно и инъ- инъективно. Равенство / = д двух отображений означает по определению, что их соответствующие области совпадают: X -А У, X -£* У, причём Vx € X /(ж) = </(ж). Сопоставление "аргументу" ж, т.е. элементу ж € -X", значения /(ж) € У принято обозначать при помощи ограниченной стрелки: ж н- /(ж). Пусть, например, /п — число Фибоначчи (см. § 3) с номером п. Соответ- Соответствие пи /п определяет отображение N -> N, не являющееся ни сюрьективным, что очевидно, ни инъективным, поскольку f\ = /2 = 1. Бели R+ — множество положительных вещественных чисел, то отображения определённые одним и тем же правилом х -> х2, все различны: / ни сюрьективно, ни инъективно, g сюрьективно, но не инъективно, а отображение h биективно. Таким образом, задание области определения и области значения — существен- существенная часть определения отображения (функции). Единичным (или тождественным) отображением ех : X -* X называется отображение, переводящее каждый элемент х € -X" в се- себя. Если X — подмножество в У; X С У, то иногда бывает полезным специальное отображение — вложение I: X -* У, которое каждо- каждому элементу х Е X сопоставляет тот же самый элемент, но уже во множестве У. Отображение /: X -* У называется сужением (или ограничением) отображения # : X' -* У, когда X С Х\ У С У и Уж € X f(x) = 0B;). В свою очередь g называется продолжением отображения /. Например, вложение /: X ->• У есть ограничение единичного отображения еу : У -* У. Нам представится также случай говорить о функциях многих переменных. Полезно уяснить себе, что введённое выше понятие де- декартовой степени Хп множества X даёт возможность говорить о
§ 5. Множества и отображения 37 функции /(хь ... ,жп) многих переменных a?» G X, г = 1,... ,п, как об обычном отображении /: Хп -> Y. Произведением (суперпозицией или композицией) двух отображе- отображений g: U -+V и f: V -+W называется отображение fog: U->W, определённое условием То же самое наглядно изображается треугольной диаграммой и Про эту диаграмму говорят, что она коммутирует (или комму- коммутативна), т.е. результат перехода от U к W не зависит от того, сделаем ли мы это прямо при помощи fog или воспользуемся про- промежуточным этапом V. Заметим, что композиция определена не для любых отображений / и д. Надо, чтобы в предшествующих обозна- обозначениях у них было общим множество V. Но композиция двух пре- преобразований множества X в себя всегда имеет смысл. В дальнейшем вместо fog мы будем писать просто fg. Ясно, что fex = /, eyf = / для любого отображения / : X -> Y. Проверка этого свойства оче- очевидна. Важное свойство композиции (произведения) отображений выражает следующая Теорема 1. Композиция отображений подчиняется закону ассоциативности. Это значит, что если h:U->V, g\V-+W, f:W->T — три отображения, то f(gh) = (fg)h. Доказательство. Наглядно все необходимые рассуждения со- содержатся в следующей диаграмме: *^^ а
38 Гл. 1. Истоки алгебры где а = gh, /3 = fg- В соответствии с формальным определением равенства отображений нужно просто сравнить значения отображе- отображений f{gh): U -* Т и (fg)h: [/->Тв произвольной "точке" и € U. Но согласно определению композиции отображений имеем (f(gh))u = f((ghu)) = f(g(hu)) = (fg)(hu) = ((fg)h)u. □ Композиция отображений X -* X, вообще говоря, некоммута- некоммутативна, т.е. fg Ф gf. В этом легко убедиться на примере, когда X = = {а, Ь} — множество из двух элементов, /(а) = b, f(b) = а, р(а) = а, <j(b) = а. Другой пример: / и д — постоянные отображения из X в X, т.е. значения f(x) и у(ж) не зависят от х. Тогда / Ф д => fg Ф gf. Некоторые функции имеют обратные. Предположим, что /: X -* -+Y и д: Y —> X — какие-то отображения, так что композиции fg и gf определены. Если fg = еу, то / называется левым обратным к #, а д — правым обратным к /. Когда произведения в любом порядке являются единичными отображениями: fg = еу, gf = ех, A) £ называется двусторонним обратным (или просто обрашньш) ото- отображением для / или к / (а / — обратным отображением к д) и обозначается /~*. Итак, /(u) = v <=> f^) = и. Предположив существование ещё одного отображения д1: Y -* ->• X, для которого мы, опираясь на равенства A), A;) и на теорему 1, получим д' = ехд' = @/)$' = $(/ff') = geY = ^. Таким образом, двустороннее обратное отображение к /, коль скоро оно существует, определено однозначно. Это и служит оправданием для обозначения /~*. Теорема 2. Отображение f: X -> Y тогда и только тогда имеет обратное, когда оно взаимно однозначно (биективно). Доказательство теоремы опирается на следующую лемму, представляющую самостоятельный интерес. Лемма. Если f:X->Y, g:Y-+X — любые отображения, для которых gf = ex, то f инъективно, а g сюръективно. Доказательство. В самом деле, пусть х,х' € X и f(x) = = f{x!). Тогда х = ех(х) = (gf)x = </(/*) = (gf)xf = ex(*;) = *'.
§ 5. Множества и отображения 39 Стало быть, / инъективно. Если, далее, х — любой элемент из X, то х = ех(х) = (gf)x = g(fx), а это доказывает сюръективность д. D Возвращаясь к теореме 2, предположим вначале, что / обладает обратным д = /~*. Тогда из равенств A) и из леммы вытекает как сюръективность, так и инъективность /. Другими словами, / биек- биективно. Обратно: предположив / биективным, мы для любого у £ Y найдём единственный элемент х € X, для которого f(x) = у. Положив д(у) = х, мы определим отображение д: Y -* X, обладаю- обладающее свойствами A). Значит, f = д. О Следствие. Из биективности отображения /: X -* У выте- вытекает биективностъ /-1, причём U-l)~l=f- B) Пусть, далее, f: X -+Y, h: Y -> Z — #г*екттшвные отображения. Тогда биективна и их композиция Л/, причём l = rlh-1. C) Доказательство. По теореме 2 биективность / влечёт су- существование /-1, что в силу той же теоремы эквивалентно биек- биективности /-1. Симметричность условий A), переписанных в виде Z/ = еу, Z/ = е^, даёт равенство B). Далее, по условию и по теореме 2 существуют отображения /-1: У->Х, Л: Z->y и их композиция Из равенств (Л/) (/-1/!-1) = ((Л/)/)/» = Щ/Г1))^1 = ИЛ = ег, (rlh-l){hf)f-l{b-l(hf)) = r4(h~lhh)f) = Г1/ = ex вытекает, что /~1Л" — обратное отображение к /. D Отображение "следования" а : N -* N, определённое правилом сг(п) = п +1, инъективно, но не сюръективно, поскольку первый эле- элемент (единица) не принадлежит Im ст. Интересно, что для конечных множеств подобная ситуация невозможна. Теорема 3. Если X — конечное множество и преобразование /: X -* X инъективно, то оно биективно. Доказательство. Нужно лишь показать, что / сюръективно, т.е. для любого элемента х £ X найдётся х1 с f(x') = x. Положим Л *Ч * = 0,1,2,... В силу конечности X в этой последовательности элементов должны быть повторения. Пусть, скажем, fm(x) = /п(х), т > п. Если п > 0,
40 Гл. 1. Истоки алгебры то из f{fm~lx) = f(fn~lx) и из инъективности / следует равенство /т"(х) = /п(х). Повторив достаточное число раз сокращение /, мы придём к равенству А в таком случае f{x') = х, где х1 = fm~n~l(x). О Как легко понять, сюръективное преобразование конечного мно- множества в себя также биективно. Несколько слов о мощности. Считается, что два множества X и Y имеют одинаковую мощность тогда и только тогда, когда су- существует биективное отображение / : X -* Y. Множества той же мощности, что и N (или Z), называются счётными. УПРАЖНЕНИЯ 1. Пусть U = {+, -, ++, Н—, —h, —, + + +, •..} — множество всех конеч- конечных последовательностей плюсов и минусов, а / : П -+ П — преобразование, переводящее элемент и = ш\^2 ...wn6fiBw' = w\Cj\uJU2 • • -UnUn, где ш^ = -, если шь = +, и Шк = +| если о;* = -. Показать, что в f(fw) любой отрезок длины > 4 содержит ++ или —. 2. Имеет ли отображение / : N -► N, заданное правилом п >-* п2, правое обратное? Указать для / два левых обратных отображения. 3. Пусть /: X -> У — отображение и 5,Т — подмножества в X. Показать, что /E и Г) = /E) U /(Г), /E П Т) С /E) П /(Т). Привести пример, показывающий, что последнее включение нельзя, вообще го- говоря, заменить равенством. 4. Множество всех подмножеств множества S обозначается 9(S) = {T\TC S). Если, например, 5 = {si,S2>- • -,sn} — конечное множество из п элементов, то y{S) состоит из пустого множества 0, п одноэлементных множеств {si}, {«2}, • • • • • • {sn}, n(n —1)/2 двухэлементных множеств {si, Sj;}, 1 $ г < j ^ n, и т.д. вплоть до Т = 5. Какова мощность множества УE)? 5. Пусть / : X -► Y — отображение и 6 = /(а) для некоторого а 6 X. Прообраз Г1(Ь) = Г1(/(в)) = {х |/(*) =/(в)} иногда называют ещё слоем над элементом b £lmf. Показать, что всё множество X является объединением непересекающихся слоев (т.е. разбие- разбиением множества X). Предупреждение. Обозначение /~F) не следует ассо- ассоциировать с обратным отображением, которого может и не быть. в. Показать, что конечная декартова степень счётного мно- жества является счётным множеством. Рис. 6 7. Симметрическая разность двух множеств S и Т обозначается SAT: SAT ={S\T)U(T\S) (рис. 6). Показать, что S \ Т = E U T) \ (S П Т). 5 7 GO
§ 6. Отношения эквивалентности. Факторизация отображений 41 § 6. Отношения эквивалентности. Факторизация отображений Эквивалентность систем линейных уравнений, введённая нами в § 3, наводит на мысль посмотреть на это понятие в общем плане, тем более что эквивалентностями разных типов мы пользуемся нео- неосознанно как в логических рассуждениях, так и в обыденной жизни. 1. Бинарные отношения. Для любых двух множеств X и У всякое подмножество и> С X xY называется бинарным отношением между X и У (или просто на X, если У = X). Для упорядоченной па- пары (ж, у) Е ш используют обозначение хиу и говорят, что ж находится в отношении и к у. Это удобно, посколь- поскольку, например, упорядочение < на множестве вещественных чисел К является бинарным отношением на R, состоящим из всех точек плоскости R2, которые лежат выше прямой х — у = 0 (рис. 7); громоздкое включение (я, 2/) Е о;(а; <) заменяется обычным нера- неравенством х < у. Рис. 7 Каждой функции / : X -¥ Y сопоставляется её график — под- подмножество являющееся отношением между X и У. Изучение на R2 графиков функций 1-^R входит в курс математического анализа. Понятно, что не каждое отношение и может служить графиком какого-либо отображения X -tY. Необходимое и достаточное условие заключа- заключается в том, чтобы каждому х Е X отвечал ровно один элемент у с хиу. Фактически задание X, У и графика Г(/) восстанавливает /. 2. Отношение эквивалентности. Бинарное отношение ~ на X называется отношением эквивалентности, если для всех ж, ж', х" Е X выполнены условия: i) х ~ х {рефлексивность)] ii) х ~ х' =Ф> х1 ~ х (симметричность)] ш) х ~ ж', х' ~ х" =Ф> х ~ х" (транзитивность). Запись а к* Ь выражает отрицание эквивалентности элементов а,ЬеХ. Подмножество х = {х1 Е Х\ х1 - х} С X всех элементов, эквивалентных данному ж, называется классом эк- эквивалентности, содержащим ж. Так как ж ~ ж (см. i)), то действи- действительно ж Е ж. Любой элемент ж' € ж называется представителем класса ж.
42 Гл. 1. Истоки алгебры Справедливо следующее утверждение. Множество классов эквивалентности по отношению ~ являет- является разбиением множества X в том смысле, что X является объ- объединением непересекающихся подмножеств (это разбиение можно обозначить тг^(Х)). В самом деле, так как х Е я, то X = \Jx€x %• Если теперь х' П х" ф / 0 и х Е х' П х", то х_у х^_и х ~ х", откуда в силу транзитивнос- транзитивности ш) имеем х1 ~ х" их' = х". Значит, различные классы не пересе- пересекаются. □ Пусть П = R2 — вещественная плоскость с прямоугольной системой коорди- координат. Взяв за свойство ~ принадлежность точек Р, Р' 6 П одной горизонтальной прямой, мы получим, очевидно, отношение эквивалентности с классами — гори- горизонтальными прямыми (рис. 8). П+ У' о 1р р' / ° / / / Рис. 8 Рис.9 Гиперболы Тр (рис. 9) вида ху = р > 0 определяют отношение эквивалент- эквивалентности в области П+ 6 П точек Р(х,у) с координатами х > 0, у > 0. Эти гео- геометрические примеры наглядно показывают, что верно следующее обратное утверждение. Если имеется какое-то разбиение ir(X) множества X на непере- непересекающиеся подмножества Сх, то Сх будут классами эквивалент- эквивалентности по некоторому отношению эквивалентности ~. В самом деле, по условию каждый элемент х Е X содержится точно в одном подмножестве Са- Достаточно считать х ~ х' в том и только том случае, когда х и х' лежат в одном и том же подмно- подмножестве Са- Очевидно, это отношение ~ рефлексивно, симметрично и транзитивно, т.е. является отношением эквивалентности. Далее, х € Са => х = Са по определению ~. Стало быть, тг(Х) = тг^(Х). □ 3. Факторизация отображений. Ввиду установленного вы- выше взаимно однозначного соответствия между отношениями экви- эквивалентности и разбиениями множества X принято разбиение, отвечающее отношению эквивалентности ~, обозначать X/ ~ и называть фактормножеством X относительно ~ (или по отноше- отношению ~). Сюръективное отображение р: х*->р(х) =5 A) называется естественным отображением (или канонической проек-
§ 6. Отношения эквивалентности. Факторизация отображений 43 цией) X на фактормножество X/ ~. Пусть X, Y — два множества и /: X -¥Y — отображение. Би- Бинарное отношение Uf\ Уж, х1 еХ xufx1 Ф=> f(x) = /(ж'), очевидно, рефлексивно (f(x) = /(ж)), симметрично (f(x') = f(x) =Ф> ==> /0*0 = /(*')) и транзитивно (/(ж) = /(ж') & /(ж') = /(ж") =» =^ /(ж) = /(ж")). Таким образом, а;/ — отношение эквивалентности на X. Соответствующие классы эквивалентности ж являются слоями (прообразами) в смысле упр. 5 § 5. Другими словами, х = {х'\ /(*') = /(*)}. Отображение f:X-¥Y индуцирует отображение /: Х/и/ -> У, определённое правилом /) или, что то же самое, /р(х) = /(х), B) где р — естественное отображение A). Так как то соотношение B), задающее /, не зависит от выбора представителя ж класса ж. В таких случаях говорят, что определение / является правильным или корректным. Коммутативная диаграмма наглядно описывает факторизацию (разложение) f = fp (з) отображения / в произведение сюръективного отображения р и инъ- ективного отображения /. Инъективность / вытекает из того, что f{xi) = f(x2) *=* f(xi) = /(ж2) Ф=Ф xi = ж2. Очевидно, сюръективность / равносильна сюръективности /. Заме- Заметим, что если /': X/uf -> Y — ещё одно отображение, для которого выполнено соотношение C): /' • р = /, то из /'(*) = /V) = (f'p)x = f(x) = /(ж) (см. B)} следует на самом деле равенство /' = /. Стало быть, отобра- отображение /, делающее указанную выше треугольную диаграмму комму- коммутативной, единственно.
44 Гл. 1. Истоки алгебры 4. Упорядоченные множества. Упорядочением множества X (или порядком на X) называется бинарное отношение ^ на X, обла- обладающее свойствами рефлексивности (ж ^ ж), антисимметричности (если х^уиу^ х, то х = у) и транзитивности (если х ^ у и у ^ г, то х ^ z). При х ^у их фу пишут х < у. Вместо х ^ у используется также запись у ^ ж. Пара элементов ж, ж' € X может и не находиться в отношении ^. Если, однако, ж ^ ж' или ж' ^ ж для каждой пары эле- элементов из X, то X называется линейно упорядоченным множеством или цепью. В общем же случае говорят о частичном порядке на X. Множество X = T(S) подмножеств множества 5 (см. упр. 4 § 5) с обычным отношением включения ЖсТ между подмножествами, а также множество N натуральных чисел с отношением d | n (п делится на d) являются примерами частично упорядоченных множеств. Пусть X — произвольное частично упорядоченное множество, ж и у — его элементы. Говорят, что у накрывает ж, если ж < у и не существует z с условием ж < z < у. В случае CardX < оо х < у (т.е. ж и у сравнимы) тогда и только тогда, когда найдётся цепоч- цепочка элементов ж = Ж1,Ж2,... ,жп_1,жп = у, в которой Xi+\ накрывает Х{. Понятие накрытия удобно при изображении конечного частично упорядоченного множества X плоской диаграммой. Элементы мно- множества X изображаются точками. Если у накрывает ж, то у поме- помещается выше жиж соединяется с у прямолинейным отрезком. Срав- Сравнимость у и х изображается понижающейся ломаной, соединяющей у с ж, причём таких ломаных может быть несколько. Несравнимые ж и у не соединяются. На двух из приводимых диаграмм (рис. 10) изо- изображены "отрезок" натурального ряда чисел и множество УЦп, Ь, с}) (N — естественное линейно упорядоченное множество, а упорядоче- упорядочение на y(S) было введено выше). {а, 6, с} 61 0 Рис. 10 Наибольшим элементом частично упорядоченного множества X называется элемент п Е X такой, что ж ^ п для всех ж Е X, а максимальным — элемент т € X , для которого из т ^ ж Е X следу- следует ж = т. Наибольший элемент всегда максимален, но не обратно.
§ 6. Отношения эквивалентности. Факторизация отображений 45 Максимальных элементов может быть много, но наибольший эле- элемент, если он существует, определён однозначно. Те же замечания относятся к наименьшему и минимальному элементам. На рис. 10 две диаграммы слева имеют наибольшие и наименьшие элементы, диа- диаграмма справа — три максимальных элемента (один наименьший) но нет наибольшего элемента. Теория частично упорядоченных алгебраических систем (булевы алгебры, решётки) насыщена содержательными результатами и за- занимает важное место в алгебре, но мы не имеем возможности её касаться. Этот параграф преследует скромную цель — познакомить читателя с ещё одним естественным бинарным отношением и дать представление о диаграммах, которые помогут в будущем понять взаимное расположение подгрупп в группах или, скажем, расположе- расположение подполей в полях. УПРАЖНЕНИЯ 1. Показать, что фактормножество R2/ ~, получающееся из рис. 8, и любая прямая /, пересекающая ось Ох, находятся в биективном соответствии. 2. Положить Р(х,у) ~ Р(х',у') для точек вещественной координатной плос- плоскости R2 в точности тогда, когда х' -х € Z и у' -у € Z. Доказать, что ~ является отношением эквивалентности и что фактормножество R2/ ~ геометрически изо- изображается точками на торе (поверхности бублика; рис. 11). @,1) ,1)/V ,0I J о" Рис. 11 3. Показать, что множества из двух, трех и четырёх элементов имеют соот- соответственно 2, 5 и 15 различных фактормножеств. 4. Пусть ~ — отношение эквивалентности на множестве X и /: X —> У — отображение, для которого Показать, что это условие совместимости f с ~ (более слабое, чем рассмот- рассмотренное в п. 2) позволяет правильно определить индуцированное отображение /: х н-). f(x) из X/ ~ в У, приводящее к факторизации / = / • р, но / уже не обязательно должно быть инъективным. В чём заключается условие инъектив- ности /? 5. Изобразить диаграммами частично упорядоченные множества: 1K»({о,6,с|«0); 2) множество всех делителей целого числа 24 (отношения порядка указаны в тексте).
46 Гл. 1. Истоки алгебры § 7. Принцип математической индукции Считается, что нам известно множество N = {1,2,3,...} всех на- натуральных (или целых положительных) чисел. На самом деле отправ- отправной точкой для изучения N служит аксиоматика Пеано (Дж. Пеано, 1858-1932). Из аксиом Пеано (мы их не приводим) вытекают свой- свойства сложения, умножения и линейного упорядочения (см. п. 4 § 6) натуральных чисел, точнее, системы NU {0}. В частности, доказы- доказывается интуитивно ясное утверждение: в каждом непустом множе- множестве 5 С N имеется наименьший элемент, т.е. натуральное число s € 5, меньшее всех остальных чисел в 5. С учётом этого утвержде- утверждения из аксиом Пеано извлекается следующий Принцип индукции. Предположим, что для каждого п £ N мы имеем некоторое утверждение М(п). Предположим также, что мы располагаем правилом, позволяющим установить истинность МA) для данного I при условии, что М(к) верно для всех к < I (в частности, подразумевается, что мы можем проверить истин- истинность МA)). Тогда М(п) верно для всех п € N. В самом деле, допустим, что подмножество 5 = {s | s € N, M(s) неверно} С N непусто. Согласно сказанному выше 5 содержит наименьший эле- элемент so- Тогда утверждение М(so) ложно, а М(s) истинно для каж- каждого s < so- Это, однако, противоречит нашему предполагаемому умению доказывать истинность М(so). Здесь не место для всестороннего обсуждения принципа матема- математической индукции. Мы ограничимся замечанием, что он отражает, так сказать, суть натурального ряда, а познание последнего не сво- сводится к чему-либо существенно более простому. Стоит ещё обратить внимание на одно обстоятельство. Именно, непременным моментом "доказательства методом полной индукции" является установление базиса индукции, т.е. проверка того, что свойство или утверждение выполнено для небольших п. Без такой проверки можно приходить к произвольным умозаключениям типа "все студенты одинакового роста". Вот и рассуждение. Пустое множество студентов и множе- множество из одного студента обладают этим свойством. Делаем предпо- предположение индукции, что им обладает любое множество из ^ п студен- студентов. Во множестве из п +1 студентов первые п и последние п студен- студентов одинакового роста по предположению индукции. Эти множества пересекаются по подмножеству из п — 1 студентов тоже одинакового роста. Значит, все п+1 студентов одинакового роста. На самом деле первое содержательное утверждение относилось бы ко множеству из любых двух студентов, а здесь-то оно как раз и неверно. Насколь- Насколько же длинным должно быть основание индукции? Обычно это ясно
§ 7. Принцип математической индукции 47 из доказательства. В нашем элементарном примере важным являет- является условие непустоты пересечения двух множеств, т.е. выполнение неравенства п — 1 ^ 1, откуда п ^ 2. В более сложных ситуациях, в особенности когда приходится опре- определять или строить объект по индукции при помощи рекуррентных соотношений, необходимо проявлять особую заботу о базисе индук- индукции. Например, делимость на 5 числа Фибоначчи f^m (см. пример 2 § 3) при любом целом т ^ 1 вытекает из равенства Д = 5 и из со- соотношения /5(m+i) = 5Дт+1 + ЗДт, которое ещё нужно получить. С другой стороны, нельзя впадать в иную крайность: убедившись в ис- истинности М(к) для всех к из достаточно длинного отрезка 1 ^ к ^ / натурального ряда, делать необоснованный вывод (это будет так на- называемая неполная индукция) об истинности М(п) для всех п £ N. Вот — два обескураживающих примера. Пример 1. П. Ферми, полагал, что все числа вида Fn = 22" + 1, п = 0,1,... (числа Ферма), простые. Первые пять чисел Ферма простые, но для Fj Эйлер нашёл разложение F5 = 4294967297 = 641 • 6700417. Настойчивые усилия полу- получить при помощи новейших ЭВМ хотя бы одно новое простое число Ферма пока не увенчались успехом. Одним из последних "достижений" в этом направлении является проверка того, что F1945 делится на 5 • 21947 + 1. Пример 2. Исследование при п = 1,2,..., 40 чисел вида n2 — n -f 41 (много- (многочлен, предложенный Эйлером) способно склонить к мысли о простоте этих чисел при любом п (о простых числах см. § 9). Однако 412 - 41 + 41 = 412. Примеров такого рода можно приводить сколь угодно много. В рассуждениях по индукции иногда самое важное — придать надлежащую форму доказываемому утверждению. Предположим, что нужно найти сумму pfc(n) = 1* + 2* + 3* + ... + (п - 1)* + п*, к = 1,2,3. Задача значительно облегчится, когда вам скажут, что предполагае- предполагаемый ответ содержится в выражениях Степенные суммы р*(п) самого общего вида будут ещё обсуж- обсуждаться в связи с корнями многочленов (см. гл. 6), а сейчас заметим, что встретившаяся нам в п. 5 § 3 сумма Г(п) имеет вид Г(п) = п(п - 1) + ... + *(* - 1) + ... + 1 • A - 1) = (в дальнейшем знак суммирования Jj будет систематически исполь- использоваться). Опираясь на приведённые выше выражения для P2(w) и Pi(n), получаем, что Г(п) = (п3 — п)/3. Разумеется, к тому же ре-
48 Гл. 1. Истоки алгебры зультату нетрудно прийти, рассуждая по индукции непосредственно вГ(п). Если до вида pi(n) додуматься нетрудно, то вид рг(п) и рз(п) уже не так тривиален, а соотношение вообще нужно было бы искать по какому-то определённому плану. В данном случае такой план указать можно, но не в этом дело. Для обоснования всех указанных выше соотношений нужно провести пря- прямыми вычислениями шаг индукции отпкп + 1. Оставим это чита- читателю в качестве полезного упражнения. Кстати, в этом упражнении пригодится так называемая биноми- биномиальная формула (а + Ъ)п = ап + Q ап~1Ь + ... + Q an~kbk + ... + Ьп. A) Здесь под а и Ь подразумеваются произвольные числа, а биномиаль- биномиальный коэффициент (^)при одночлене ап~кЪк имеет вид /п\ п! п(п - 1).. ■ (п - fc + 1) (. \к) fc!(n-fc)! fc(fc-l)...21 ' К) где п! = п(п — 1)... 2 • 1 (эн-факториал). Это — быстро растущая величина, например, 6! = 720, 10! = 3628800, а 100! > 10150. Полезно дополнить выражение B) соглашениями 0! = 1и(^)=0 при к < 0. Отметим ещё, что (свойство симметричности биномиальных коэффициентов). Формулу A), очевидно, верную при п = 1,2, мы докажем индук- индукцией по п. Считая её справедливой для всех показателей ^ п, умно- умножим обе части соотношения A) на а + Ь. Получим ... + abn Приведение подобных членов показывает, что коэффициентом при
§ 7. Принцип математической индукции 49 одночлене an+1~kbk будет п + (fc - l)!(n - k + 1)! + fc!(n - fc)! (fc-l)!(n-fc)! [n-fc + 1 fc n! n + 1 _ (n + " (Jb-l)!(n-Jb)! fe(n-Hl) " *!(n + l-fc)! т.е. как раз биномиальный коэффициент вида B) с верхним индек- индексом, увеличенным на единицу. Тем самым справедливость формулы A) доказана для всех п € N. Бели записать присвоив каждому множителю справа номер от 1 до п, и посмотреть на те подмножества номеров 1 < ii < »2 <••.<** ^ п, которые отвечают при умножении одночлену an~kbk, то мы придём к выводу, что (]£) есть не что иное, как число всех подмножеств мощности А: множества из п элементов. Несколько "старомодный" термин — число * ■ о о сочетаний из п по fc — выражает по существу то же самое. В частности, мощность множества У({$ь..., sn}) (см. упр. 4 § 5) равна ( п Но, полагая а = Ь = 1 в формуле A), получим Таким образом, Caxd?({sbs2,...,sn}) = 2n. Биномиальные коэффициенты — почти непременный атрибут элементарных комбинаторных рассуждений. Вот — наглядный гео- геометрический пример.
50 Гл. 1. Истоки алгебры Пример (Amer. Math. Monthly. — 1977. — V. 84, X* 6). Известна задача об определении числа Rn областей, образуемых в круге E) хордами, которые соединяют п фиксиро- фиксированных точек на окружности, при предположении, что никакие три хорды не пересекаются внутри кру- круга (рис. 12). Результат при п = 1,2,3,4,5 наводит на мысль, что Rn = 2n-1; но на самом деле правильной будет формула Rn = 1 -f (§) + D)• Попробуйте это доказать. Доказательство теоремы или построение объек- объекта иногда удобно проводить, опираясь на более слож- сложные формы индукции. Например, принцип двойной Рис. 12 индукции заключается в следующем. Пусть любым натуральным числам тип отвечает некоторое утверждение У(т,п), причём: i) У(т, 1) и УA,п) истинны для всех тип; и) если У (к — 1,1 ) и У(/с, / — 1) истинны, то У(к,1) также истинно. Это эквивалентно: И') если У(к\1') истинно при всех к' $*,«'< I, к1 +1' < к + 1, то У(М) также истинно). Тогда утверждение У(т,п) истинно для всех натуральных тип. УПРАЖНЕНИЯ 1. Положим s(n) = sin ip + sin 2ip -f ... 4- sin n<p, c(n) = cos ip -f cos 2(p -f ... + cos rup. Индукцией по п доказать формулы sin(n<?/2)sin((n + iyp/2) sin(n<?/2)cos((n + = iT^ ' c(n)= m 2. Имеют место формулы: пBп - 1) fc=0 Убедиться в их справедливости хотя бы при n ^ 5. § 8. Перестановки 1. Стандартная запись перестановки. Разовьём немного те- тему, начатую в § 5, применительно к биективным преобразованиям конечных множеств. На этой базе естественным образом возникают важные алгебраические понятия. Пусть П — конечное множество из п элементов. Поскольку при- природа его элементов для нас несущественна, удобно считать, что П = = {1,2,... ,п}. Элементы множества 5n = S(u) всех взаимно одно- однозначных преобразований П -> П, обычно обозначаемые строчными
§ 8. Перестановки 51 буквами греческого алфавита, называются перестановками. Лишь за единичным преобразованием е = е^ сохранилась буква латинско- латинского алфавита. В развёрнутой и наглядной форме произвольную перестановку тг: г н> тт(г), г = 1,2,..., п, изображают в виде /1 2 ... п\ \ii г2 ... г„/' полностью указывал все образы: 1 2 ... п тт: ; X X, Ч *2 ••• *п где г* = ж(к), к = 1,..., п — переставленные символы 1,2,..., п. Перестановки а, т 6 Sn перемножаются в соответствии с общим правилом композиции отображений: (ат) = а(т(г)). Например, для перестановок _/1234\ _/1234\ V2341/' T~\iZ2l) имеем 12 3 4 /12344 /1234\ ] I I J /1 2344 ^=B34lJU32lj= I I I Je(l432> 14 3 2 В то же время __ /1 2 3 4\ /1 234\ _ /1234\ Т<7" V4 3 2i;V2 3 4i; " V3 2 1 4/' так что ат ф та. Согласно результатам § 5 умножение перестановок подчиняется следующим правилам. i) Умножение ассоциативно, т.е. (ap)j = a(/3j) для всех а, /3, j 6 €5». ii) Sn обладает единичным элементом е : тге = тг = етг для всех тг 6 5П. ш) Для каждой перестановки тг 6 5П существует обратная пере- перестановка тг: тгтг = тг^тг = е. Эти три свойства, дополненные общими принципами, на кото- которых мы не хотим сейчас останавливаться (см. гл. 4), дают основание говорить о группе 5П. Точнее, множество 5П, рассматриваемое вместе с естественной операцией умножения его элементов (компози- (композицией перестановок), называется симметрической группой степени п
52 Гл. 1. Истоки алгебры (иначе, симметрической группой на п символах или на п точках). Для нас пока это всего лишь удобное терминологическое соглашение, смещающее акценты с множества Sn как такового на мультиплика- мультипликативные свойства перестановок, т.е. на то, что может быть выявлено при композиции элементов из 5П. Симметрическая группа 5П лежа- лежала у истоков общей теории групп и теории Галуа более 170 лет тому назад, и можно только поражаться связанному с ней обилию мате- математических идей. Замечание. Иногда элементы группы 5П называют подста- подстановками, используя термин перестановка в качестве синонима рас- расположения чисел 1,2,..., п в каком-то фиксированном порядке. Так как между такими упрядочениями чисел и элементами группы Sn имеется взаимно однозначное соответствие, а слово "перестановка" ассоциируется в сознании скорее с действием, чем с застывшим упо- упорядочением, то подстановки у нас из употребления исключены. Впро- Впрочем, ниже мы будем говорить, например, о подстановке числа в мно- многочлен, но это служит лишь дополнительным аргументом в пользу указанного терминологического соглашения. Если нужны ещё какие-то доводы, то их можно найти по мень- меньшей мере: а) в научной литературе; б) в учебнике П.С. Александрова "Лекции по аналитической геометрии" (Наука, 1968, с. 767). Найдём порядок |5П| группы 5П. Символ 1 можно подходящей перестановкой а перевести в любой другой символ аA), для чего существует в точности п различных возможностей. Но, зафикси- зафиксировав сгA), мы имеем право брать в качестве аB) лишь один из оставшихся п — 1 символов (всего различных пар аA),стB) имеет- ся (п - 1) + (п - 1) + ... + (п - 1) = п(п - 1)), в качестве аC) — соответственно п — 2 символов и т.д. Всего возможностей выбора аA), <тB),..., &{п), а стало быть, и всех различных перестановок бу- будет п(п — 1)... 2 • 1 = п!. Таким образом, 2. Цикловая структура перестановки. Разложим теперь пе- перестановки из Sn в произведения более простых перестановок. Идею разложения поясним схематически (рис. 13) на примере указанных выше перестановок а, г 6 54- Рис. 13 Перестановка <т, кратко записываемая в виде а = A 2 3 4), или,
§ 8. Перестановки 53 что то же самое, в виде а = B 3 4 1) = C 4 12) = D 12 3), называется циклом длины 4, а перестановка т = A4)B 3) — произведением двух независимых (непересекающихся) циклов A 4) и B 3) длины 2. Заметим, что а2 = A 3)B 4), а4 = (а2J = е, г2 = е. Пусть теперь тг — произвольная перестановка из 5П. Её степень тг* определяется по индукции (см. доказательство теоремы 3 § 5): {т^тг5"), если s > О, е, если s = О, тг((тг')(""*')), если s < 0. При таком определении, очевидно, (последовательное приписывание тг или тг* при s и t одинакового знака и замена тгтг", тг^тг на е при s и t разных знаков). Так как \п\ < оо, то на самом деле для каждой перестановки тг 6 5П найдётся однозначно определённое натуральное число q = q(n) такое, что все различные степени содержатся во множестве (тг) = {е,тг,... ,тг9"} и тг9 = е. Это число q называется ещё порядком перестановки тг. Так, рассмотренные выше перестановки а и г имеют соответственно порядки 4 и 2. Две точки i,j 6 п назовём к-эквивалентными, если j = тг*(г) для некоторого s 6 Z. Так как г = тг°(г), 3 = «*(i) => i = '-У), 3 = »'W, * = **(?) => то, очевидно, мы имеем дело с рефлексивным, симметричным и тран- транзитивным отношением на ft (см. п. 2 § 6). В соответствии с общим свойством отношений эквивалентности получаем разбиение п = пг U ... U пр A) множества ft на попарно непересекающиеся классы fix,..., Пр, кото- которые принято называть ещё тг- орбитами. Название это вполне обос- обосновано. Каждая точка г 6 £1 принадлежит в точности одной орбите, и если г 6 fi*, то ft* состоит из образов точки г при действии сте- степеней элемента тг: г,тг(г),тг2(г),... ,тН*'~1(г). Здесь Ik = |П/ь| — длина к-орбиты ft*. Очевидно, что d(), тт**(г) = г,
54 Гл. 1. Истоки алгебры причём %k — наименьшее число, обладающее этим свойством. Поло- Положив мы придём как раз к перестановке, называемой циклом длины Ik- Вопрос вкуса и удобства — писать A2 3 ... I) или A,2,3,...,/). Цикл я-* оставляет на месте все точки из множества п \ £)*, а 7r(j) = 7Tk(j) для любой точки j £ Г)*. Это свойство даёт нам осно- основание называть тг5, TTt, s ф t, независимыми или непересекающимися циклами. Так как тг/д»(г) = г для i G fijk, то тт^1 = е. Итак, с разбиением A) ассоциируется разложение перестановки тг в произведение где все циклы перестановочны: тг = тгхтгг ... тгр = тг^ ttj2 ... тг/р. Можно считать, например, что l\ ^ h ^ •.. ^ lm > im+i = ... = Zp = 1. Если цикл тг* = (г) имеет длину 1, то он действует как единич- единичная перестановка. Естественно такие циклы в произведении B) опус- опускать: тг = ТГ1ТГ2 ... тгт, Ik > 1, 1 ^ к ^ т. C) Например, перестановку '12345678\ а мы залишем в виде тг = A 2 3 4 5)F 7)(8) = A234 5)F 7). D) Некоторую неловкость вызывает то обстоятельство, что A 2 3 4 5) F 7) можно интепретировать как перестановку из Sn при любом п ^ 7, однако при фиксированном п никакой неоднозначности нет. Более точно, пусть наряду с разложением C) мы имеем ещё одно разложение тг = aia2-..ar в произведение независимых циклов, и пусть г — символ, не остающийся на месте при действии тг. Тогда тгв(г) ф г, at(i) ф г для одного (и только одного) из циклов tti, ..., /rm и одного из ai,.. .,ar. Имеем тгДг) = тг(г) = at (г). Если мы уже знаем, что ^s @ = п @ = at (О» E) то, применяя к этим равенствам перестановку тг и используя пере- перестановочность тг с тг* и с а*, получаем тгтг5 = тг (i) "==- тга^ (i), откуда тг^тг(г) = Trfc+1(i) = а£тг(г) и, наконец,
§ 8. Перестановки 55 Значит, равенства E) справедливы при любом А: = 0,1,2,... Но цикл однозначно определяется действием его степеней на любой символ, который не остаётся на месте. Следовательно, тг5 = at. Далее приме- применяется индукция по т или г. Итак, нами доказана Теорема 1. Каждая перестановка тг ф е в Sn является произ- произведением независимых циклов длины ^ 2. Это разложение в произ- произведение определено однозначно с точностью до порядка следования циклов. Обратим внимание на циклы длины 2. Определение. Цикл длины 2 называется транспозицией. Любая транспозиция имеет вид г = (ij) и оставляет на месте все символы, отличные от г, j. Из теоремы 1 вытекает Следствие. Каждая перестановка тг 6 Sn является произве- произведением транспозиций. Доказательство. В самом деле, в силу теоремы 1 достаточно записать в виде произведения транспозиций каждый из циклов. Но это можно сделать, например, так: A2 ... I - 1 I) = A 0A / - 1)... A 3)A 2). D Формулировки теоремы 1 и её следствия нуждаются в пояснении. Как следует из определения цикла а = (i\ г*2 гз ... i/_i */)> и потому ничто не изменится, если мы запишем а = (гг гз ... ц i\), т.е. произведём циклический сдвиг номеров, входящих в а. Таким образом, утверждение единственности в теореме 1 носит по существу абсолютный характер. С другой стороны, в следствии ни о какой единственности записи перестановки через транспозиции не может быть и речи. Скажем, • • • П-1 U) = (»i tj)(n *i-i) • • • (»i h){h *2), a = (t2 г3 ... ti-i ii ti) = (гг ti)(»2 »0(*2 t«-i) • • • (*2 »з). Эти две записи одной и той же перестановки о содержат по одина- одинаковому числу / - 1 совершенно разных транспозиций (лишь (г'г i\) = = (г*1 гг))- Более того, транспозиции, вообще говоря, не перестановоч- перестановочны, а их число не является инвариантом перестановки. Например, в 54 имеем A2 3) = A 3)A 2) = B 3)A 3) = A 3)B 4)A 2)A 4).
56 Гл. 1. Истоки алгебры 3. Знак перестановки. Справедлива следующая важная Теорема 2. Пусть тг — перестановка из 5П, 7Г = Т1Т2...Т* F) — произвольное разложение тг в произведение транспозиций. Тогда число е, = (-1)*, G) называемое знаком тг {иначе: сигнатурой или чётностью), пол- полностью определяется перестановкой тг и не зависит от способа разложения F), т.е. чётность целого числа к для данной переста- перестановки тг всегда одна и та же. Кроме того, еар = еаер (8) для всех а,/3 Е 5П. Доказательство. 1) Предположим, что наряду с F) мы имеем также разложение 7Г = Т^...т£„ F') причём четности к и к' различны. Это значит, что целое число к + к' нечётно. Так как (r'aJ = е, то, последовательно умножая справа обе части равенства т\Тъ .. . т* = т{т2 .. .т'к,, вытекающего из F) и F*), на г*/,... , 7*2, т{, получим TiT2 ... TfcTv ... 72Tj = е. Мы свели нашу задачу к следующей. Пусть е = ai<72 ... <rm_i<7m, m > 0, (9) — запись единичной перестановки в виде произведения m > 0 транс- транспозиций. Нужно показать, что обязательно тп — чётное число. С этой целью будет установлено, что от записи (9) мы можем пе- перейти к записи е в виде произведения ш—2 транспозиций. Продолжив этот спуск, мы пришли бы при нечётном тп к одной транспозиции г. Но, очевидно, ефт. Итак, нам нужно обосновать спуск в (9) от тп к m — 2 множителям. 2) Пусть s, I ^ s ^ п, — любое фиксированное натуральное число, входящее в одну из транспозиций 02,... ,ат. Для определён- определённости считаем, что е = <тх... <jp-iapap+i... am, где (тр = (st), а (Тр+ь. • • ,^ш не содержат s. Для ap_i имеются четыре возможности: а) 0p_i = (s£); тогда отрезок ap_iap = (s£)(s£) из записи е уда- удаляется, и мы приходим к тп — 2 транспозициям; б) огр-1 = (в г), г #s,*; здесь 0р-1СГр = (в г) (в*) = (**)(»•*)» и мы сдвинули вхождение s на одну позицию влево, не изменив ш;
§ 8. Перестановки 57 в) <jp_i = (tr), г ф s,t; здесь ap_iap = (tr)(et) = (er)(tr), и снова, как в случае б), произошёл сдвиг s влево без изменения ш; г) огр-1 = (gr), {g,r} П {s,*} = 0; здесь ^p-i^p = {qr){st) = (8t)(qr). В случае а) наша цель достигнута. В случаях б)-г) повторяем процесс, сдвигая вхождение s на одну позицию влево. В конечном счёте мы придем либо к случаю а), либо к экстремальному случаю, когда е = (т[а2 ... а'т, причём а[ = (st1) и s не имеет вхождений в 02,..., <г'т. Значит, a'k(s) = s при А; > 1 и s = e(s) = ai(s) = t1 ф s. По- Полученное противоречие доказывает утверждение об инвариантнос- инвариантности Epi. 3) Если а = п ... т*, уЗ = rfc+i... t*+j, то а/3 = n ... rfcrfc+i... т*+/ И£а = (-1)*, ^ = (-1)', ^ = (~1)Л+Т= (-^(-lI = 6а^. D Определение Перестановка тг 6 Sn назьгоается чётной, если бя- = 1, и нечётной, если е* = —1. Из определения вытекает, что все транспозиции — нечётные пе- перестановки, а ее = 1. Следствие. Пусть перестановка тг 6 5П разложена в произве- произведение независимых циклов длин 1\, ?2,..., 1т- Тогда Действительно, по теореме 2 имеем ^7Г = ^7Г1...7Гт = £ТГ1 • • • ^7Гт • Кроме того, е1Гк = (—I)'*", поскольку тг^ записьгоается в виде про- произведения Ik — 1 транспозиций (см. доказательство следствия теоре- теоремы 1). Окончательно ()-Имеем?г=A52 откуда /i = 5, h = 4, /3 = 2 и е* = (-lL*3*1 = 1. Запишем 5П в виде объединения Sn = AnUAn, где Ап = {тг 6 Sn | е^ = 1} — множество всех чётных перестановок, Ап = Sn\ Ап — множе- множество нечётных перестановок. Пусть г = (ij) — любая транспозиция. Отображение Sn в себя, определённое правилом LT : тг »->• гтг, биек- биективно. (Оно инъективно: га = тC ==> а = /?; далее применить теоре- теорему 3 из § 5. Можно просто заметить, что L^ — единичное отображе- отображение и L~l = LT.) Для наглядности изобразим Ьт в виде перестановки
58 Гл. 1. Истоки алгебры / 7П 7Г2 степени N = п! на множестве Sn = {tti = е, тгг, тгз,... з ... 7TN \ Г7Г1 Г7Г2 ТТГз . . . Т7Г;у у Аналогично, / 7П 7Г2 ТГз ••• *N \ \ TTiT 7Г2Г ТГзТ ... 7TNT J — перестановка на 5П. Отображения A0) и A0') будут использо- использоваться нами впоследствии, причём даже в более общем контексте. А сейчас заметим, что еТп = ет£п = — £*» поэтому LT{An) = An, Lr(>ln) = Лп. Значит, число чётных перестановок в 5П совпадает с числом нечётных перестановок, откуда И„1 = \\sn\ = j. (и) 4. Действие Sn на функциях. К важному понятию знака пере- перестановки а 6 Sn можно подойти несколько иначе, подсчитывая число так называемых а-инверсий (см. упр. 5 в конце параграфа). Но вме- вместо этого мы дадим сейчас альтернативное доказательство теоре- теоремы 2, которое опирается на понятие кососимметрическои функции, важное само по себе и полезное для дальнейшего. Определение. Пусть тг G Sn и / — функция от любых п аргу- аргументов. Полагаем (тг о /)(хь... ,хп) = /(х*!,.. .,хкп). A2) Говорят, что функция д = тг о / получается действием тг на f. Лемма 1. Пусть а,/? — любые перестановки из 5П. Тогда Доказательство. В соответствии с определяющим соотноше- соотношением A2) имеем или, полагая у* = яа* и замечая, что y@i = . . ,Zn). □ Определение. Функция f от п аргументов называется косо- симметрической^ если
§ 8. Перестановки 59 т.е. при перестановке местами любых двух соседних аргументов зна- значение / меняет знак на противоположный. Лемма 2. При перестановке местами любых двух аргументов кососимметрическая функция меняет знак на противоположный. Доказательство. Пусть переставлены г-й и j-й аргументы, причём г < j. Проводим индукцию по числу I = j — г — 1 аргументов между переставляемой парой. При I = 0 утверждение леммы совпада- совпадает с определением кососимметрической функции. Пусть лемма верна при всех j — г — 1 < I. Тогда = f{---,Xi+i,Xj,...,Xj-.i,Xii...) = = -/(. ..,Xi,Xi+i,...,Xi_i,Xi,...). □ Надо ещё быть уверенным в том, что не все кососимметрические функции тождественно равны нулю. Простейшим является следую- следующий пример. Пример. Пусть Лп = An(xi,x2,... ,хп) = Yl (xi~xj)- Символ П ПРИ записи произведения играет ту же роль, что и £ ПРИ записи суммы. Выделив любые два рядом стоящих аргумента Zfc,£fc+i> бУДем иметь An = (zjb+i - xk)[(xk+i - xfc_i)... (х*+1 - xi)(xfc - xfc_i)... (xfc - xi)] • A • B, где n a=k+2 При перестановке местами х& и x^+i множители [(Xfc+i ~ Xfc_i) . . . (Xjfe+i ~ Xi) • (Xfc - Xfc_i) . . . (Xfc - Xl)], А и By очевидно, не меняют своих значений, в то время как (xfc - xfc+i) = -(xfc+i - xfc). Это и значит, что An(...,xfc,Xfc+i,...) = -An(...,Xfc+i,Xfc,...), I ^ Js ^ n- По лемме 2 имеем также An(...,Xi,...,Xj,...) = -An(...,xJ-,...xi,...). Кроме того, An(xi,..., хп) Ф 0 при попарно различных ац,..., хп.
60 Гл. 1. Истоки алгебры Второе доказательство теоремы 2. Возьмём произволь- произвольную кососимметрическую функцию / от п аргументов х\,... ,хп. По лемме 1 действие тг = Т\Т2 .. .т* на / сводится к последовательному применению транспозиций т>, т*_1,..., т\, т.е. к fc-кратному умноже- умножению / на —1: Так как левая часть этого соотношения зависит от тг, но не от какого-либо его разложения, то и отображение е : тг н> еп, задан- заданное равенством G), должно полностью определяться перестановкой тг при условии, конечно, что / не тождественно равная нулю функ- функция. В качестве такой функции можно взять, например, только что рассмотренную функцию / = Дп. Применение к такой функции / перестановки а/3 по правилу, из- изложенному в лемме 1, дает e<*0f = (а/3) о/ = ао(/3о/) = ао (epf) = ер(а о /) = откуда получается соотношение (8). □ Замечание. К действию 5П на функциях мы будем обращать- обращаться неоднократно, а в [ВА III] увидим, что это лишь частное про- проявление гораздо более общей закономерности. Пока наше маленькое достижение заключается в том, что словесное выражение "поменяем в f(x\,..., хп) местами я» и я/' сведено к символьной записи г о / с транспозицией г = (ij). УПРАЖНЕНИЯ 1. В курсе математического анализа доказывается формула Стирлинга п!~ ч/2тгпппе~п, где е = 2,718281... — основание натурального логарифма, 7г = 3,141592...; символ ~ здесь означает, что отношение V2nnnne~n/n\ стремится к 1 при п —► оо. При помощи формулы Стирлинга, дающей приближение с недостатком, про- проверить, что 100! > (9,33.. .I0157. Сколько в 5юо циклов длины 100? 2. Найти порядок перестановки D) и перестановки /123456784 *\3682 1 457/ ' 3. Перестановка тг вида C) с m независимыми циклами оставляет символов (или точек) на месте. Число ^(тг) = п — (т + т') называется декремен- декрементом перестановки тг. Проверить, что е* = (—l)d^.
§ 9. Арифметика целых чисел 61 4. Найти знак перестановки / 1 2 3 ... п-1 п \ *~ \ п п-1 п-2 ... 2 1 ) ' 5. Пусть П = {1,2,...,п}, П х П — декартов квадрат. Будем называть па- РУ (*K) 6 fixfi инверсией относительно перестановки а Е Sn (или, короче: о -инверсией), если i < j, но <т(г) > cr(j). Положим sgna= 11 —т—• Так как (o^j) — &(i))/(j — г) — отличное от нуля рациональное число, являю- являющееся отрицательным в точности тогда, когда (ij) будет а-инверсией, и так как а: ft —» П — биективное отображение, то sgna = (—l)fc, где к — общее число а-инверсий. Если т = (ij) — транспозиция, то sgnT = — 1. Как легко видеть, ( _( так что а-инверсия (г, j) перестает быть инверсией относительно перестановки га, где т = (a(j) а(г)) — транспозиция. Показать, что найдутся к транспозиций п,... ,тъ, для которых — единичная перестановка. Стало быть, а = ri... т^_1Т^ и sgn a = (—l)fc=e^ — два равноправных обозначения одного и того же инварианта перестановки; sgn (от signum (лат.)) — знак. Мы получили еще один удобный способ определения знака перестановки. Скажем, относительно перестановки D) множество инвер- инверсий состоит из пяти пар A, 5), B, 5), C, 5), D, 5), F, 7), так что sgn?r = —1. Практически дело сводится к подсчёту в нижней строке перестановки тг коли- количества чисел j, больших г, но стоящих перед », для г = 1,2,...,п—1. § 9. Арифметика целых чисел Задачей этого параграфа является краткое описание тех простей- простейших свойств делимости целых чисел, на которые удобно по разным поводам ссылаться в дальнейшем. Дополнительные факты будут при- приведены в гл. 5, где теория делимости переносится на более общие алгебраические системы. 1. Основная теорема арифметики. Целое число s называется делителем (или множителем) целого числа п, если п = st для неко- некоторого t G Z. В свою очередь п называется кратным s. Делимость п на 5 обозначается символом s\n> а отрицание делимости — симво- символом 5 /fn. Делимость — транзитивное отношение на Z. Если, далее,
62 Гл. 1. Истоки алгебры т\п и n|m, то п = ±ш, и целые числа n, m называются ваннылси. Целое число р, делители которого исчерпьгоаются числами ±р, ±1 (не собственные делители), называется простым. Обычно в качестве простых берутся положительные простые числа > 1. Фундаментальную роль простых чисел вскрывает Основная теорема арифметики. Каждое положитель- положительное целое число пф\ может быть записано в виде произве- произведения простых чисел: п = PiP2---P«- Эта запись единственна с точностью до порядка множителей. Собрав вместе одинаковые простые множители и изменив обо- обозначения, получим запись Для любого рационального числа а = п/т 6 Q имеет место анало- аналогичное разложение, но с показателями £», как положительными, так и отрицательными. Заметим, что множество Р = {2,3,5,7,11,13,...} всех простых чисел бесконечно (теорема Евклида). Действительно, если бы существовало лишь конечное число простых чисел, скажем, Pi > Р2, • • •, Pt, то по основной теореме число с = pip2 ... Pt +1 делилось бы по крайней мере на одно из р«. Без ограничения общности считаем с = p\d. Тогда pi(c/ - Р2 ...pt) = 1, а это невозможно, поскольку делителями единицы в Z являются лишь ±1. D Доказательство основной теоремы откладывается до гл. 5. На первый взгляд, её вообще не надо доказывать, настолько она ка- кажется очевидной. Между тем, хотя речь идёт о мультипликативных свойствах (свойствах делимости) целых чисел, основную теорему не- невозможно доказать, не используя одновременно операций умножения и сложения в Z. В качестве иллюстрации этого утверждения рассмотрим в N под- подмножество Оно замкнуто относительно умножения: Dfci + l)DJfc2 + 1) = 4fc3 + 1. Индукцией none S нетрудно установить существование разложения (первая часть основной теоремы) п = q\... qt, где ф — далее нераз- неразложимые элементы из 5. Мы назовём их квазипростыми числами. Выпишем несколько таких чисел: 5,9,13,17,21,49. Вторая часть основной теоремы для системы S неверна, посколь- поскольку, например, число 441 £ 5 имеет два существенно разных разложе- разложения в произведение квазипростых чисел: 441 = 9 • 49 = 212.
§ 9. Арифметика целых чисел 63 2. НОД и НОК в Z. Любые два целых числа пит можно записать в виде произведения степеней одних и тех же простых чисел п = ±р?р? ...р?, т = ±pf',# ■■■$, если условиться допускать нулевые показатели (как всегда, считая р? = 1). Введём в рассмотрение два целых числа т)=р^2...р**, где7г = min(ai,/?i), й = max (a», ft), t = 1,2,...,*. Так как d\n => d = ±р"х.. .p£fc> 0 ^ a'f ^ c*i, to из A) вытекают следующие утверждения. i) НОД(п,т)|п, НОД(п,т)|т, и если d|n, d|m, то с?|НОД(п,т). ii) n|HOK(n,m), т|НОК(п,т), и если п\и, т\щ то HOK(n,m)|u. Свойства i) и ii) оправдывают сокращённые обозначения НОД и НОК наибольшего общего делителя и наименьшего общего кратного целых чисел п,т. При п > 0, т > 0 выполнено соотношение НОД(п, т) • НОК(п, т) = птп. B) Целые числа n, m называются взаимно простыми, если НОД(п,ш) = 1. В этом случае соотношение B) принимает вид HOK(n,m) = nm. 3. Алгоритм деления в Z. Яри заданныха,Ь € Z, 6 > 0, всегда найдутся q,r 6 Z такие, что a = bg + r, O^r<b (если считать лишь Ь ф 0, то будет выполнено неравенство В самом деле, множество 5 = {a-6s| s€Z,a-bs^0}, очевидно, непусто (например, a - b(-a2) > 0). Стало быть, 5 со- содержит наименьший элемент; обозначим его г = a — bq. По усло- условию г ^ 0. Предположив г ^ Ь, мы получили бы элемент г — Ь = = a — b(g + 1) £ 5, меньший, чем г. Это противоречие устраняется лишь при г < b. D Проведённое несложное рассуждение даёт также предписание, т.е. алгоритм (или алгорифм), для нахождения частного Ъ и остат- остатка г в конечное число шагов. Алгоритм деления в Z используется для иного определения НОД, а следовательно, и НОК, если принять во в нимание соотношение B). Именно, при заданных целых числах п,т, одновременно не рав- равных нулю, положим J = {nu + mv | и, v G Z}. C)
64 Гл. 1. Истоки алгебры Выберем в J наименьший положительный элемент d — пщ + Используя алгоритм деления, запишем п = dq + г, 0 ^ г < d. Ввиду выбора d включение г = п — dq = n — (тшо + rnvo)q = n(l — uoq) + m(—год) € «7 влечёт равенство г = 0. Стало быть, d\n. Аналогично доказывается, что d\m. Пусть теперь d! — любой делитель чисел пит. Тогда d'|n, d'\m =Ф> d'lnuo, d'|mvo ==> d;|(nuo + ravo) ==> d'|d. Итак, d обладает всеми свойствами наибольшего общего делителя, и поэтому d = НОД(п,т). Мы приходим к следующему утверждению. Наибольший общий делитель двух целых чисел п, т, не равных одновременно нулю, всегда записывается в виде НОД(п, т) = тш + mv, и, v € Z. D) В частности, целые числа n, m взагс^но просты тогда и только тогда, когда пи + mv = 1 D') при некоторых u, v € Z. Было проверено, что взаимная простота n, m влечёт соотношение D;). Обратно: если n, m таковы, что имеет место D'), то d|n, d|m =Ф- d|nu, d|mv =Ф> d|(nu -f mv) => d|l => d = ±1. □ Доказательство соотношений D) и D;) довольно эффективно. Нужно взять любой положительный элемент из множества J (см. C)), а затем уменьшать его при помощи алгоритма деления до тех пор, пока не получится наименьший элемент, который и будет наиболь- наибольшим общим делителем. УПРАЖНЕНИЯ 1. Каждое нечётное простое число имеет вид 4fc + 1 или 4Дс — 1. Используя мультипликативность множества 5 из п. 1, доказать бесконечность множества простых чисел вида 4fc — 1. 2. Доказать, что существует бесконечно много простых чисел вида 4fc + 1, опираясь на следующее нетривиальное утверждение. Если п, т £ Z, НОД(п,ш) = 1, и еслир — простое число, делящее п2 +т2, то р — 4k + 1. 3. Если натуральное число п делится в точности на г различных простых чисел Pi,• • • ,рг, то количество чисел, меньших п и взаимно простых с п, равно Функция ф: N —» N называется функцией Эйлера. Проверить справедливость формулы для значений <р(п) при п <С 25 и при п = рт. 4. Используя биномиальную формулу, индукцией по п доказать, что если р — простое число, то пр — п делится на р при любом п £ Z.
Глава 2 МАТРИЦЫ Прямоугольные матрицы, введённые в § 3 гл. 1, встречаются настолько часто, что с течением времени возник самостоятельный раздел математики — теория матриц. Её становление относят к се- середине прошлого века, но полноту и изящество она приобрела позд- позднее, вместе с развитием линейной алгебры. До сих пор теория матриц остаётся важным инструментом исследования, хорошо приспособлен- приспособленным и к запросам практики, и к абстрактным конструкциям совре- современной математики. Здесь будут изложены простейшие результаты теории матриц. Матрицы являются естественными спутниками линейных отоб- отображений векторных пространств. В курсе линейной алгебры и гео- геометрии [ВА И] этому утверждению будет придан точный смысл. В настоящей главе понятия пространства, вектора, линейной зависи- зависимости, ранга системы и т.п. развиваются в чисто алгебраическом аспекте и ровно настолько, насколько они необходимы для наших непосредственных целей. § 1. Векторные пространства строк и столбцов 1. Мотивировка. В связи с системами линейных уравнений нам приходилось рассматривать строки длины п, в которые вклады- вкладывался разный смысл. Это были строки (а^а^,- . • ,а*п)> 1 ^ i ^ m, матрицы А = (aij) размера m х п и решения (х?,^... ,х£) линей- линейной системы с матрицей А. Приведение в § 3 гл. 1 системы или матрицы к ступенчатому виду включало, помимо элементарного преобразования типа (I), два важных акта: умножение строки на число и сложение двух строк. Те же действия можно производить и с решениями однородной линейной системы. Действительно, если (xi,х'2,...,х'п) и (ж'/,х£,...,О — два решения системы = О, г = 1,2,...,т, а а,/? — два любых вещественных числа, то строка (ах[ + /Эх'/, ах'2 + 0x'i, . тоже будет решением нашей системы: ац(ах[ + 0х'{) + at-2(a4 + /Зх%) + ... + i + а{2х'2 +... -h ainx'n)+ = Р{ацх" + anx'l + ... + а{пх^) = 0.
66 Гл. 2. Матрицы С другой стороны, любая строка, что бы она ни выражала, яв- является элементом "унивеРсального" множества Rn, т.е. n-й декар- декартовой степени множества Ж вещественных чисел. Поэтому жела- желательно изучить общий объект, свойства которого автоматически переносились бы на матрицы и на решения однородных систем. 2. Основные определения. Пусть п — какое-то фиксирован- фиксированное натуральное число. Векторным пространством строк длины п над R называется множество Rn (его элементами являются векторы- строки или просто векторы), рассматриваемое вместе с операция- операциями сложения векторов и умножения их на скаляры — вещественные числа. Скаляры обозначаются строчными буквами латинского или греческого алфавита, а векторы — заглавными латинскими буква- буквами, как матрицы. По существу на вектор X = (х\, а?2, • • • > Яп) можно смотреть как на 1 х n-матрицу. Пусть У = (yi, y2j • • • > Уп) — ещё один вектор, А — скаляр. По определению Х + У = (xi +yi,z2+ !/2,...,Zn+yn), XX = (Хх\, лХ2) • • • > Ажп). Нулевой вектор @,0,..., 0) обозначается в дальнейшем обычным сим- символом нуля 0. Далее, R1 принято отождествлять с R. Формальные правила действий с вещественными числами, без- безусловно, известные читателю, переносятся на Rn. Их перечисление, хотя и скучное, даёт точное представление о том, что следует пони- понимать под абстрактным векторным пространством, которое изуча- изучается в более позднем курсе линейной алгебры и геометрии: ВПх: Х + У = У + Хдля любых векторов X, У G Rn (закон коммутативности); ВП* (Х+Y)+Z = Х + (У+£) для любых трех векторов X, У, Z е е W1 (закон ассоциативности); ВПз: существует специальный (нулевой) вектор 0 такой, что X + + 0 = X для всех X € Rn; ВП4: каждому X G Rn отвечает противоположный (или обрат- обратный) вектор -X такой, что X + (-Х) = 0; IX = X для всех X € Rn; (ар)Х = аЦЗХ) для всех а,/? € R, X G Rn; ВП* а(Х + У) = аХ + аУ. Единственность векторов 0 и —X, о которых говорится в ВПз и ВЩ, равно как и другие простые следствия из указанных правил (или аксиом, если имеется в виду абстрактное векторное пространст- пространство), мы не будем выводить, считая их достаточно прозрачными. Происхождение термина "векторное (или ещё линейное) прост- пространство" разъясняется в курсе аналитической геометрии (читаемом также в первом семестре), где устанавливается взаимно однозначное
§ 1. Векторные пространства строк и столбцов 67 соответствие между точками (векторами) пространства — декарто- декартовой плоскости — и их координатами (х,у). Сложению векторов по правилу параллелограмма и умножению их на число соответствуют как раз действия с векторами-строками в R2. Наряду с векторным пространством строк длины п рассматри- рассматривается также векторное пространство столбцов высоты п х2 как мы их условились обозначать в § 3 гл. 1. Понятно, что разли- различие между пространствами строк и столбцов чисто условное, но мы вскоре убедимся, что полезно иметь оба варианта пространства. Из контекста обычно ясно, о каких векторах, столбцах или строках идёт речь, поэтому никаких специальных обозначений не вводится. 3. Линейные комбинации. Линейная оболочка. Пусть Х\, Х2, • • •» Xk — векторы пространства Rn и c*i, а2,..., ак — скаляры. Вектор X = ol\X\ + а2Х2 + • • • + &кХк называется линейной комби- комбинацией векторов Х{ с коэффициентами а». Например, B,3,5,5) - 3A,1,1,1) + 2A,0, -1, -1) = A,0,0,0). Пусть, далее, Y = Р\Х\ + #2-Хг + ... + 0кХк — линейная ком- комбинация тех же векторов Х{ с коэффициентами /3», а а,/3 G R. Тогда аХ + /ЗУ = = a(axXi + а2Х2 + ... + акХк) + 0(/3iXi + &X2 + ... + РкХк) = = (ааг + 0fa)Xi + (аа2 + P/h)X2 + ... + (cm* + /3(Зк)Хк — снова линейная комбинация векторов X» с коэффициентами aoti + p/3{. Мы видим, что множество V всех линейных комбинаций данной системы векторов Хх)Х2у...,Хк обладает свойством X,YeV=>aX + t3Y eV A) для всех а,/? £ R. В частности, нулевой вектор всегда содержит- содержится в V. Обычно V обозначают символом (X\,X2i...,Xk) и называют линейной оболочкой (или просто оболочкой) системы векторов Xi, Х2,...,Xk. Говорят ещё, что оболочка (-Xi,Х2,... ,Хк) натянута на Х\, Х2,... Хк пит порождена векторами Х\,Х2>..., Хк. Можно определить линейную оболочку любого подмножества 5 С С Rn, понимая под E) совокупность всех линейных комбинаций конечных систем векторов из 5. Ясно, что если V — линейная оболочка в Rn, то (V) = V: любая линейная комбинация векторов
68 Гл. 2. Матрицы из V принадлежит V. В частности, 5 С V => E) С V, т.е. линей- линейную оболочку E) можно определить как пересечение всех оболочек, содержащих данное множество 5 векторов из W1: (S) = П V. B) SCV На первый взгляд не очевидно, что стоящее в правой части B) пересечение OV какого-то множества оболочек будет линейной обо- оболочкой. Но если Х,У 6 HV, то X,Y 6 V для каждой оболочки У, входящей в множество. Значит, аХ + /3Y £ V для всех а, /? £ R, а это и даёт нужное включение аХ + 0Y € ПУ. Напротив, объединение U U V оболочек U и У, вообще говоря, не является оболочкой, как показывает хотя бы пример U = {(А, 0) | А € R}, У = {@, А) | А € R} в!2. Рассмотрим два общих примера* Пример 1. Пусть Vm = {@,... ,0, Am+i,..., An) | Xi € R} С Rn, 0 < m < п. Непосредственно проверяется, что Um> Vm — линейные оболочки, причём (Um,Vm) = Rn и Um П Vm = {0}. Пример 2. В пространстве Rn рассмотрим так называемые единичные векторы-строки ЯA) = A,0,...,0), ЯB) = @,1,...,0), ..., S(n) = @,0,...,l). C) Каждый вектор X = {х\, жг, • • •, хп) однозначно записывается в виде X = -I- хг£B) + • • • + sn£(n)- Поэтому Единичные векторы-столбцы будем обозначать символами ^1> = [1,0 0], ЯB> = [0,1,...,0], ..., Я<п> = [0,0,...,1]. C') 4. Линейная зависимость. Система векторов Х\,..., Xk про- пространства W1 называется линейно зависимой, если найдутся к чисел <*i,..., а*, одновременно не равных нулю и таких, что агХх + а2Х2 + ... + акХк = 0 D) (справа стоит нулевой вектор). Будем говорить также, что линейная зависимость D) нетривиальна. Если же a\X\ + а2Х2 + ... + ctkXk = = 0 => c*i = а2 = ... ak = 0, то векторы Х\, X2i..., Хк назьгоаются линейно независимыми. Пример 2 в п. 3 показьгоает, что единичные векторы Ещ, £7B),... ..., £?(п) линейно независимы. Один вектор X ф 0, очевидно, всегда линейно независим, поскольку (XX = 0, X ф 0) ==> А = 0. Далее, свойство системы Xi,..., Xk быть линейно независимой никак не
§ 1. Векторные пространства строк и столбцов 69 связано с порядком векторов, так как слагаемые щХ{ в равенстве D) могут быть переставлены произвольным образом. Теорема 1. Имеют место следующие утверждения: i) система векторов {Х\,...,Хк} с линейно зависимой под- подсистемой сама линейно зависима; ii) любая часть линейно независимой системы векторов {Х\,... ..., Xk) линейно независима; iii) среди линейно зависимых векторов Х\,... ,Xk хотя бы один является линейной комбинацией остальных; iv) если один из векторов Х\,... ,Хк выражается через осталь- остальные, то векторы Х\,..., Xk линейно зависимы; v) если векторы Х\,..., Xk линейно независимы, а Х\,..., Xk, X линейно зависимы, то X — линейная комбинация векторов Х\,... • • • )Xk; vi) если векторы Х\,... ,Xk линейно независимы и вектор Xk+\ нельзя через них выразить, то система Х\,... ,Хк,Хк+г линейно независима. Доказательство, i) Пусть, например, первые s векторов Xi,..., Xs, s < к, линейно зависимы, т.е. агХх +... + а8Х8 = 0, где не все а* равны нулю. Положив тогда as+i = ... = а* = 0, получим нетривиальную линейную зависимость ... + asX8 + a^+xXe+i + ... + акХк = 0. Утверждение ii) непосредственно следует из i) (рассуждение от противного). iii) Пусть, например, ак Ф 0 в соотношении D). Тогда iv) Пусть, например, Xk = PiX\ + ... + 0k-iXk-i. Положив а\ = = /?i, ..., ajk-i = /3*-1, otk = —I» придём к соотношению D) с коэф- коэффициентом OLk Ф 0. v) Нетривиальное соотношение с /3 ф 0 даёт в силу iii) то, что нужно. Если, однако, C = 0, то /?! = ... = /Зк = 0, поскольку Х\,... ,Хк по условию линейно незави- независимы. Утверждение vi) непосредственно следует из v). □ 5. Базис. Размерность. Дадим теперь важное Определение. Пусть V — ненулевая линейная оболочка в Rn. Система векторов X\,...,Xr G V называется базисом для V (или
70 Гл. 2. Матрицы в V), если она линейно независима и её линейная оболочка совпада- совпадает с V: (Xl9...tXr) = V. Из определений базиса и линейной оболочки системы векторов следует, что каждый вектор X £ V записывается единственным обра- образом в виде X = ot\Xi + ... + arXr. Коэффициенты од,..., ar € R на- называются координатами вектора X относительно базиса Х\,..., Хг. Как мы уже видели, линейно независимые единичные векторы C) порождают Rn. Стало быть, {#A),#B)> • • • > Е(п)} — базис прост- пространства Rn. Но этот так называемый стандартный базис — далеко не единственный базис в Rn. Например, векторы ЕA) = £A)> Е'B) = ЕA) + ЯB), ^C) = ЕA) + ЕB) + #C)> • • • > Е(п) = ЕA) + £B) + • • • + Е(п) тоже составляют базис пространства Жп (проверьте это аккурат- аккуратно). С другой стороны, пока не ясно, каждая ли линейная оболочка в Rn обладает базисом, а если да, то будет ли количество базисных векторов постоянным. Ответы на оба вопроса оказываются положи- положительными. Наши рассуждения будут основаны на следующей лемме. Лемма. Пусть V — линейная оболочка в Rn с базисом Х\,..., Хг и Y\, Y2, ... , Y8 — линейно независимая система векторов из V. Тогда s ^ г. Доказательство. Как и все векторы из У, Y\,..., Y8 являются линейными комбинациями базисных векторов. Пусть Y\ = Y2 = Y8 = auXi + a28X2 + ... + ar8Xry где u{j — какие-то скаляры (являясь координатами векторов У}, они однозначно определены, но это пока несущественно для нас). Рассуждаем от противного. Предположим, что s > г. Составим линейную комбинацию векторов Yj, с коэффициентами ху. и рассмотрим систему из г линейных уравнений с s неизвестными + а12х2 + .. • + ai8x8 = 0, ... + ar8x8 = 0. Так как по предположению s > г, то применимо следствие 2 § 3 гл. 1, согласно которому наша система обладает ненулевым решением
§ 1. Векторные пространства строк и столбцов 71 (х?,... , xj). Мы приходим к нетривиальной линейной зависимости наличие которой, однако, противоречит условию леммы. Значит, 5 ^ Г. П Теорема 2. Каждая ненулевая линейная оболочка V С W1 обла- обладает конечным базисом. Все базисы оболочки V состоят из одина- одинакового числа г ^ п векторов (это число называется размерностью оболочки V и обозначается dimR V или просто dim У). Доказательство. В соответствии с условием V содержит хо- хотя бы один ненулевой вектор Х\ (строку или столбец). Пусть мы нашли в V линейно независимую систему векторов Хх,... , Х*. Ес- Если линейная оболочка (Х\,...,Xk) не совпадает с У, то выберем в V вектор Xk+\ & (Xi>... ,Xk). Другими словами, X*+i не является линейной комбинацией векторов Xi,..., Xk* По теореме 1, vi) систе- система Х\у... ,Xfc, Xk+i линейно независима. Мы могли бы продолжать неограниченно процесс расширения линейно независимой системы, но все её векторы Х{ лежат в Жп = (-E(i), -ЕB)? • • • ?-Е(п))> а по толь- только что доказанной лемме всякая линейно независимая система в W1 содержит не более п векторов. Стало быть, при некотором нату- натуральном г ^ п линейно независимая система Х\,..., Xk, -. •, ХТ € V станет максимальной, т.е. мы получим линейно зависимую систему Х\,..., Хт, X, каков бы ни был вектор X ф 0 из V. По теореме 1, v) будем иметь включение X е {Хи..., Хг). Значит, V = {Х\}... ,ХГ), и векторы Х\,..., Хг составляют базис для V. Предположим теперь, что Yi,...,F* — ещё один базис для V. По лемме мы имеем неравенство s ^ г. Поменяв местами системы Х\,..., Хг и Fi,..., Fe, мы получим по той же лемме неравенство г ^ s. Стало быть, s = г, и теорема доказана. D Заметим, хотя в этом и нет большой необходимости, что все наши рассуждения в равной мере относились как к пространству строк, так и к пространству столбцов. Итак, с каждой линейной оболочкой V в Жп ассоциируется целое положительное число г ^ п, которое мы назвали её размерностью: г = dimV. В частности, dimRn = п. Этот важный числовой пара- параметр пространства можно характеризовать разными другими спосо- способами. Один из вариантов определения размерности основан на поня- понятии ранга системы векторов. Именно, если {J£i, X<i%... } — какая-то, возможно, бесконечная, система векторов в пространстве Rn, то, как мы знаем, размерность линейной оболочки (Xi,...) не превосходит п. Её называют рангом системы {Xi, X2, -..}: X2,...} = dim (XUX2,... >• В случае V = {0} принято считать dim V = 0.
72 Гл. 2. Матрицы УПРАЖНЕНИЯ 1. Линейная оболочка (UUV) называется суммой подпространств U и V: U + V = (U U V) = {tx + v | u G С/, v G V}. Если С/ П V = 0, то говорят, что сумма U + V прллсод, и пишут С/ 0 V. Пусть V = Vi 0 V2 и X = Xi + Л2 = Х[ + Л*2 — два выражения вектора X 6 V в виде линейной комбинации векторов Х\,Х[ Е Vi и Х2, Х^ Е Уг. Тогда имеем Xi-X[ = Х'2-Х2е V\ П V2i а так как Vi П V2 = 0, то Xi = Х(, Х2 = Х2. Доказать обратное: если запись X = Х\ + Х2, Х{ Е Vi, г = 1,2, единственна для каждого вектора X Е V, то сумма V = Vi + V2 прямая. Более общо: сумма V подпространств V\,..., Уд. С Rn называется npjucoti сулемой V = Vi 0 ... 0 V^, если каждый вектор X 6 V имеет однозначное выражение вида X = Х\ +... 2. Пусть V, Vi и V2 — линейные оболочки в Rn, причём V С Vi -\-V2- Всегда ли верно, что V = V C\Vi + V C\V2? Что можно сказать про это соотношение в частном случае Vi С V? 3. Пусть V — линейная оболочка в Rn. Если V = U 0 W — разложение в прямую сумму, то оболочка W называется дополнением к С/, a U — дополне- дополнением к W в V. Однозначно ли определено дополнение к U в V? Сравнить W с теоретико-множественным понятием дополнения V/U (см. § 5 гл. 1). 4. Показать, что векторы Х\ = A,2,3), Х2 = C,2,1) линейно независимы; рассмотреть линейную оболочку У(Х\>Х2)\ показать, что вектор X = (—5,2,9) содержится в V, и найти его координаты в базисе Х\,Х2; найти в R3 хотя бы одно дополнение к V. 5. Показать, что система векторов Xi,...,Xn из Rn тогда и только тогда порождает Rn, когда она линейно независима. 6. Показать, что всякую линейно независимую систему векторов Х\,..., Х^ из линейной оболочки V С Rn можно вложить в некоторую базисную систему для V. 7. Пусть U и V — линейные оболочки в Rn. Доказать, что если U П V = О, то dim (U + V)= dim U + dim V. 8. Найти ранг системы векторов @,1,1), A,0,1), A,1,0). § 2. Ранг матрицы 1. Возвращение к уравнениям. В векторном пространстве m столбцов высоты т рассмотрим п векторов [ttij, O2j, . . . , Omj]y j = 1, 2, . . . , П, и их линейную оболочку V = {А^\А^2\..., А^). Пусть дан ещё один вектор В = [fci,fc2>--->bm]« Спрашивается, принадлежит ли В линейной оболочке V С Ет, а если принадлежит, то каким образом его координаты bi,..., Ьт (относительно стандартного базиса C;) из § 1) выражаются через координаты векторов А^? В случае dim У = = п вторая часть вопроса относится к значениям координат вектора В в базисе А^,..., А^. Мы берём линейную комбинацию векторов
§ 2. Ранг матрицы 73 с произвольными коэффициентами Xj и составляем уравнение х\ А^ + ... + хпА^ = В. Наглядный вид этого уравнения Ьг ап О>21 ami + Х2 an О22 ат2 есть лишь иная запись системы из m линейных уравнении с п неиз- неизвестными B) -f ... + amnxn = Именно такую систему мы и встретили впервые в § 3 гл. 1. Там же были введены простая и расширенная матрицы ац a2i ain O2n amn (А\В) = an bm C) линейной системы B). Первое впечатление таково, что мы вернулись к исходным позициям, потеряв время и ничего не выиграв. На самом же деле мы располагаем теперь рядом важных понятий. Осталось приобрести навыки в обращении с ними. В этом месте удобно ещё раз остановиться на обозначениях. Для сокращения записи мы часто будем сумму s\ + S2 + ... + sn обозна- обозначать 2Г=1 si- ^Ри этом si> • • • > sn — величины произвольной природы (числа, векторы-строки и т.д.), для которых выполнены все законы сложения чисел или векторов. Правила t=l i=l i=l t=l i=l достаточно понятны, чтобы их нужно было разъяснять. Будут рассматриваться также двойные суммы п m п тп тп п Е Е ау = Е (Е а«) = Е (Е a'i) = Е а*>> jl il jl il il j\ ij
74 Гл. 2. Матрицы в которых порядок суммирования (по первому и второму индексу) можно выбирать по своему желанию. Это легко понять, если рас- расположить величины dij в прямоугольную матрицу размера m x п: в нашей воле начинать суммирование элементов матрицы по строкам или по столбцам. Другие возможные типы суммирования будут разъясняться в нуж- нужном месте. 2. Ранг матрицы. Назовём пространством столбцов прямо- прямоугольной матрицы А размера т х п (см. C)) введённую выше ли- линейную оболочку V = (АA\АB\ ..., А(п)). Будем теперь V обозна- обозначать VB(A) или просто VB (в — вертикальный). Размерность гв(А) = = dim VB назовём рангом по столбцам матрицы А. Аналогично вво- вводится ранг по строкам матрицы А: гГ(А) = dimVr, где Vr = (Ащ, iiB),...,A(m)) — пространство строк матрицы А, т.е. линейная оболочка в Еп, натянутая на векторы-строки Ащ = (а,ц,а»2, •. •, a>in), i = 1,2,..., m (г — горизонтальный). Другими словами, Гв(Л) = rank гг(А) = rank{A(i), ЛB),..., А(т)} — ранги систем векторов-столбцов и векторов-строк соответствен- соответственно. По теореме 2 § 1 величины гв(А) и гг(А) определены правильно. Следуя терминологии, введённой в § 3 гл. 1, будем говорить, что матрица А1 получена из А элементарным преобразованием типа (I), если А', ч = А(фА/£ч = А(8) для какой-то пары индексов s ф t и А'щ = Л(^ для i ф s,t. Если же А',* = А^ для всех i ф s и Л/вч = А(8) + АЛ(ф s ф t, Л € К, то говорим, что к А применено элементарное преобразование типа (II). Здесь имеются в виду эле- элементарные преобразования над строками матрицы А. Заметим, что элементарные преобразования обоих типов обра- обратимы, т.е. матрица А1, получающаяся из А при помощи одного эле- элементарного преобразования, переходит снова в А путём применения одного элементарного преобразования, причём того же типа. Лемма. Если матрица А' получена из прямоугольной матрицы А путём применения конечной последовательности элементарных преобразований над строками, то имеют место равенства: i) rr(A') = гг(А); ii) rB(A') = rB(A). Доказательство. Достаточно рассмотреть тот случай, когда А! получена из А путём применения одного элементарного преобра- преобразования (э.п.). i) Так как
§ 2, Ранг матрицы 75 то э.п. типа (I) не меняет гГ(А). Далее, A{s) = A(s) + XA(t) => A(s) = A{s) и, следовательно, ..,j4(#) + AA(t),... , A(t),..., A(m)) = так что гг(А) не меняется и при э.п. типа (II). ii) Пусть А' , 1 ^ j ^ п, — столбцы матрицы А'. Докажем, что п п jA'{j) = 0. D) С этой целью рассмотрим две линейные однородные системы JIOC и ЛОС с матрицами А и А1 соответственно, записанные в виде A) (столбцы свободных членов нулевые): ЛОС : 'О) = 0. Матрицы Л и Л' у нас таковы, что ЛОС получается из ЛОС при помощи э.п. типа (I) или (II). По теореме 1 § 3 гл. 1 системы ЛОС и ЛОС эквивалентны, т.е. всякое решение (Ai, A2,..., Ап) одной системы будет решением другой, а это и есть импликация D). Таким образом, всякой, в том числе и максимальной, независи- независимой системе столбцов одной матрицы будет отвечать независимая система столбцов с теми же номерами другой матрицы, чем и уста- устанавливается равенство rB(A') = rB(A). D Основным результатом этого параграфа является следующее ут- утверждение. Теорема 1. Для любой прямоугольной т х п-матрицы А спра- справедливо равенство гв(А) = гГ(А) (это число называется рангом матрицы А и обозначается rank A). Доказательство. По теореме 2 § 3 гл. 1 конечным числом эле- элементарных преобразований, совершаемых над строками А», матрицу А можно привести к ступенчатому виду А = аи 0 0 0 0 Q>ik 0 0 аи 0.21 O-ZI о о Si. 0>2п а™ 0 E) 0
76 Гл. 2. Матрицы . йГ8 ф 0. Согласно лемме гв(А) = RB(A), rr(A)=rr(A), так что нам достаточно доказать равенство гв(А) = гг(А). Столбцы матриц А и А с номерами 1,&,2,...,5, отвечающими главным неизвестным Я1,я*.,я/,... ,х8 линейной системы B), будем называть базисными столбцами. Эта терминология вполне оправда- оправдана. Предположив наличие соотношения ... + А.Л« = О, связывающего векторы-столбцы = [ale,a2s,...,ars,0,... ,0] матрицы E), получим A*are = 0, ..., А/аз/= О, А*а2* = 0, Aian = О, а так как апагдозд ... are ^ 0, то Ai = А*_= А/ = ... = Х8 = 0. Значит, rank{AA),Alk\A(l\... ,А^} = г и_гв(А) ^ г. Но пространство Ув, порождённое столбцами матрицы Л, отождествляется с простран- пространством столбцов матрицы, которая получается из А удалением по- последних т — г нулевых строк. Поэтому rB(A) = dim VB ^ dim Rr = г. Сопоставление двух неравенств показывает, что гв(А) = г (неравен- (неравенство rB(A) ^ r вытекает также из того очевидного соображения, что все столбцы матрицы А являются линейными комбинациями базис- базисных; проделайте это самостоятельно в качестве упражнения). С другой стороны, все ненулевые строки матрицы А линейно не- независимы: любое гипотетическое соотношение + А2 ЛB) + . • • + Аг А{г) =0, А» € К, как и в случае со столбцами, даёт последовательно Aiau = 0, А2а2* = 0, ..., Arare = О, откуда Ai = A2 = ... = Ar = 0. Стало быть, гг(А) = г = rB(A). D 3. Критерий совместности, Ступенчатый вид матрицы Л, дающий ответ на ряд вопросов относительно линейных систем (см. § 3 гл. 1), содержит элементы произвола, связанные, например, с вы- выбором базисных столбцов, или, что эквивалентно, с выбором главных неизвестных системы B). В то же время из теоремы 1 и из её дока- доказательства извлекается Следствие. Число главных неизвестных линейной системы B) не зависит от способа приведения её к ступенчатому виду и равно rank А, где А — матрица системы.
§ 2. Ранг матрицы 77 Действительно, мы видели, что число главных неизвестных равно числу ненулевых строк матрицы А (см. E)), совпадающему, с ран- рангом матрицы А, Ранг определялся нами совершенно инвариантным образом. (Этими словами выражается тот факт, что ранг матрицы служит её внутренней характеристикой, не зависящей от каких-либо привходящих обстоятельств.) □ В следующей главе мы получим эффективное средство для вычис- вычисления ранга матрицы А, устраняющее необходимость приведения А к ступенчатому виду. Это, несомненно, повысит ценность утверж- утверждений, основанных на понятии ранга. В качестве простого, но по- полезного примера сформулируем критерий разрешимости линейной системы, речь о котором шла ещё в гл. 1. Теорема 2 (Кронекер—Капелли). Система линейных уравне- уравнений B) совместна тогда и только тогда, когда ранг её матрицы, совпадает с рангом расширенной матрицы (см. C)). Доказательство. Совместность линейной системы B), запи- записанной в виде A), можно трактовать (с этого начинался настоящий параграф) как вопрос о представлении вектора-столбца В свободных членов в виде линейной комбинации векторов-столбцов А^ матрицы А. Если такое представление возможно (т.е. система B) совместна), тоВе (АA),...,Л(п))игапк{ЛA),...,Л(п)} = гапк{ЛA),...,А(п),В}, откуда гапкЛ = гв(А) = гв((А\В)) = гапк(Л|В) (см. формулировку теоремы 1). Обратно: если ранги матриц А и (А\В) совпадают и {А^1\... ...,А^} — какая-то максимальная линейно независимая система столбцов матрицы А, то расширенная система {А^1\..., А^Г\В} будет линейно зависимой, а это по теореме 1, v) § 1 означает, что В — линейная комбинация базисных (и тем более всех) столбцов А^. Стало быть, система B) совместна. D УПРАЖНЕНИЯ 1. Доказать теорему 1, не приводя m х n-матрицу А = (a»j) к ступенчатому виду. Указание. Пусть dim Vr(A) = r, dim VB(A) = s. Выбрать г базисных строк; без ограничения общности можно считать, что ими являются первые г строк АA), АB),..., А(г). Рассмотреть укороченную г х n-матрицу А = [А^), АB),... ..., А(г)], составленную из первых г строк матрицы А. Выбрать в A t базисных столбцов, t = dimVn(A). Пусть ими будут А^1\..., А^\ Так как VB(A) С Rr, то t ^ г. Для каждого столбца А^, А; > t, нужно найти скаляры Ai,..., А* Е R такие, что А<*) = AiAW + ... + AtA<*), т.е. aik = £p=i Аро»р, 1 ^ i ^ m. При i ^ r это, наверное, так, ибо имеется соотношение А^ = Ai А^1) + • • • + XtA^ для укоро- укороченных столбцов. При i> г использовать выражение А^ = /iiA^) + .. . + /irA(r) для г-й строки через первые г строк. Из него следует, что aik = £{=i M^ik = = E[=i H EP=i V*/p = EP=i AP E[=i Mie/p = Ep=iVip- Установленная ли-
78 Гл. 2. Матрицы нейная зависимость столбцов показывает, что s $ t, а так как t ^ г, то s Рассмотреть, далее, так называемую транспонированную матрицу an a2i ... ат] размера пхт. Имеют место равенства гг(*А) = гв(Л), гъ(ьА) = гг(Л), поэтому по доказанному г ^ в. Стало быть, г = в. 2. Как и в случае строк, перестановку столбцов с номерами s и t матри- матрицы А называют элементарным преобразованием (э.п.) типа (I), а прибавление к 5-му столбцу t-ro столбца, умноженного на скаляр Л, — э.п. типа (II). Указать ступенчатый вид матрицы А по столбцам. Элементарными преобра- преобразованиями столбцов привести матрицу А (см. E)) к виду А = diag (оц, О22,..., огг, 0,...,0), где on = ftn» огг = Яг*» 2зз = &si> • • • * &rr = йг*; Щ= 3. Показать, что при оо Ф 0 квадратная матрица 0. 0 0 0 0 0 0 О2 0 0 0 0 1 0 оп-2 0 1 о„_1 имеет ранг п. 4. Условие равенства рангов двух матриц A- Л Рп Л 02 71 72 an 7n выразить геометрическим свойством множества п прямых на плоскости. § 3. Линейные отображения. Действия с матрицами 1. Матрицы и отображения. Пусть 1пи1т — векторные пространства столбцов высоты пит соответственно. Пусть, далее, А = (a,ij) — матрица размера т х п. Определим отображение <рд : Еп -> Rm, полагая для любого X = [xi,яг, • • •, хп] € Еп tpA{X) = + ... + хпА(п\ A) где А^,..., Л^п) — столбцы матрицы А (сравнить с A) § 2). Так как они имеют высоту ш, то в правой части A) стоит вектор-столбец Y = [yi, J/2» • • •, Ут] € Кт- Более подробно A) переписывается в виде
§ S. Линейные отображения. Действия с матрицами 79 Если X = X' + X" = [х[ + ж?, х'2 + х'2', ..., х'п + <], то ' + х") = t=l 1=1 1=1 Аналогично, Е ^ = А ЕХ'Л(<) = Х<Рл{Х)у А € Обратно, предположим, что ч>: Rn -> Rm — отображение множеств в смысле § 5 гл. 1, обладающее следующими двумя свойствами: i) <p(X' -f X") = <р(Х') + <р(Х") для всех Х\Х" € Rn; ii) ^p(XX) = A^(X) для всех X G Rn, А € Е. Как мы знаем (см. п. 3 § 1), Rn = B5A),...,25(п)) — линейная оболочка стандартных базисных столбцов, так что Согласно свойствам i), ii) имеем B) Соотношение B) показывает, что отображение (р полностью опреде- определяется своими значениями на базисных векторах-столбцах. Положив 2h...,amj] = A^ € Rm, C) мы обнаруживаем, что задание <р равносильно заданию прямоуголь- прямоугольной матрицы А = (aij) размера mxnco столбцами А^1\... ,А(п\ а соотношения A) и B) фактически совпадают. Стало быть, можно ПОЛОЖИТЬ <£ = фА- Определение. Отображение (р = фа • Kn -> Rm, обладающее свойствами i), ii), называется лг^нейньмс отображением из Rn в Rm. Часто, в особенности при п = т, говорят о линейной! преобразова- преобразовании. Матрица А называется матрицей линейного отображения <ра- Пусть фАуфл1 — два линейных отображения Rn -¥ Rm с матри- матрицами А = (otj) и А' = (а^.). Тогда равенство <рл = <Ра* равносильно совпадению значений Ц)а(Х) = ФА'(Х) РД& всех X 6 Кп. В частно- частности, A'(j) = tpA'{EW = va{E(j) = А^\ 1 ^ j < п, откуда a^- = a^- и Л# = А.
80 Гл. 2. Матрицы Резюмируем наши результаты. Теорема 1. Между линейными отображениями Rn в Rm и матрицами размера т х п существует взаимно однозначное соот- соответствие. Следует подчеркнуть, что бессмысленно говорить о линейных отображениях S -¥ Т произвольных множеств 5 и Т. Условия i), ii) предполагают, что S иТ — линейные оболочки в8пи Ет соот- соответственно. Обратим внимание на специальный случай m = 1, когда линейное отображение tp: Жп -¥ К, обычно называемое линейной функцией от п переменных, задается п скалярами oi, а2,..., ап: <р(Х) = ^>(xi,x2,...,xn) = aixi + a2x2 + ... + anxn. D) Замечание. Наша терминология отличается от той, которая принята в средней школе, где (в случае одной переменной х) линейной называют функцию х н* ах + Ь. Линейные функции D), равно как и произвольные линейные отоб- отображения Rn -¥ Em при фиксированных пит можно складывать и умножать на скаляры. В самом деле, пусть <ра,<Рв' Кп —> Rm — два линейных отображения. Отображение Rn->Rm, a,0eK, определяется своими значениями: В правой части стоит обычная линейная комбинация векторов-столб- векторов-столбцов. Так как ' + X") = а<рА{Х' + X") + foniX1 + X") = = а{<рА(Х') + Ы*")} + {<хрл(Х") <р(\Х) = а<рА(\Х) + №в{\Х) = а\<рА(Х) = \{трА(Х) + 0<р (здесь мы неявно пользовались правилами ВЩ-ВЩ из § 1), то tp — линейное отображение. По теореме 1 можно говорить о его матрице С: tp = ipc- Чтобы найти С, выпишем, следуя C), столбец с номе- номером у. [су, сад, • • •, = <ярА{Е = [аау + jSby, aa2j + jS^i, • • •, aamj + 0bmj].
§ 3. Линейные отображения. Действия с матрицами 81 Матрицу С = (c{j с элементами Cij = aa,ij + fibij естественно назвать линейной комбинацией матриц А и В с коэффициентами а и /3: Оц аап aoln Итак, 4- +Р<РВ = . E) F) Особенно часто нами будет использоваться тот факт, что ли- линейные комбинации линейных функций снова являются линейными функциями. В заключение этого пункта отметим, что если правила ВЩ- ВЩ из § 1 для векторных пространств переписать, заменив всюду векторы-строки X, У, Z на матрицы размера т х п, то в соответствии с определяющим соотношением E) получатся правила BMi-BMg, ко- которые дают основание говорить о векторном пространстве матриц размера тхп. Если угодно, его можно считать компактной записью векторного пространства Rmn строк длины тп (строки разбиты на отрезки длины п, расположенные друг под другом). 2. Произведение матриц. Соотношения E) и F) выражают согласованность действий сложения и умножения на скаляры в мно- множествах матриц размера т х п и отображений En -> Em. В случае произвольных множеств имеется ещё важное понятие произведения (композиции) отображений (см. п. 2 § 5 гл. 1). Разумно ожидать, что композиция двух линейных отображений должна выражаться неким согласованным образом в терминах матриц. Посмотрим, как это де- делается. Пусть <рв : Rn ->• R*, Ч>а ' Rs -> Rm — линейные отображения, фс = Ч>А ° 4>в — их композиция: топ Ч>С тот Вообще говоря, нам следовало бы предварительно проверить, что <рА о ipв — линейное отображение, но это довольно ясно: ' + х") = ЫЫ*' + х")) = ЫЫх1) + <рв(х")) =
82 Гл. 2. Матрицы ii) <p(\X) = tpA(<pB(\X)) = М^в(X)) = А^ поэтому по теореме 1 с <р ассоциируется вполне определённая матри- матрица С. Действие отображений на столбцы в цепочке [хи...,жя] £5> [уи •.. ,У«] запишем в явном виде по формуле A;): S 8 П П / 8 \ = ]£ а{кУк = X) °»* Z) b«*i = 5Z ( Z) ^^i ) *i- Jb=l ik=l j=l j=l \*=1 / С другой стороны, Сравнивая полученные выражения и памятуя о том, что Sj, (j = = 1,2,... ,n) — произвольные вещественные числа, мы приходим к соотношениям a G) Будем говорить, что матрица С = (с^) получается в результате умножения матрицы А на матрицу В. Принято писать С = АВ. Таким образом, произведением прямоугольной матрицы (а,*) раз- размера т х s и прямоугольной матрицы F^) размера 5 х п называется прямоугольная матрица (cij) размера mxnc элементами с^, задаю- задающимися соотношением G). Нами доказана Теорема 2. Произведение ц>аЧ>в двух линейных отображений с матрицами А и В является линейным отображением с матрицей С = АВ. Другими словами, Ч>аЧ>в = Ч>ав- (8) Соотношение (8) — естественное дополнение к соотношению F). Мы можем забыть о линейных отображениях и находить произве- произведение АВ двух произвольных матриц А, В, имея в виду, однако, что символ АВ имеет смысл только в том случае, когда число столб- столбцов в матрице А совпадает с числом строк в матрице В. Именно при этом условии работает правило G) умножения г-й строки Ащ на j-й столбец В^\ согласно которому (9)
§ 3. Линейные отображения. Действия с матрицами 83 Число строк матрицы АВ равно числу строк матрицы А, а число столбцов — числу столбцов матрицы В. В частности, произ- произведение квадратных матриц одинаковых порядков всегда определе- определено, но даже в этом случае, вообще говоря, АВ ф В А, как показывает хотя бы следующий пример: II 1 О IIII О О II II О О || , || 0 1 И || 0 0 || || 1 0 || || о о || || 1 о ||" || о о || ^ || о о ||" || 1 о || || о о ||' Умножение матриц, конечно, можно было бы вводить многими другими способами (умножать, например, строки на строки), но ни один из этих способов не сравним по важности с рассмотренным выше. Это и понятно, поскольку мы пришли к нему при изучении естественной композиции (суперпозиции) отображений, а само по- понятие отображения относится к числу наиболее фундаментальных в математике. Следствие. Умножение матриц ассоциативно: А{ВС) = (АВ)С. Действительно, произведение матриц соответствует произведе- произведению линейных отображений (теорема 2 и соотношение (8)), а по тео- теореме 1 § 5 гл. 1 произведение любых отображений ассоциативно. К тому же результату можно прийти вычислительным путём, исполь- используя непосредственно соотношение G). □ Обратим ещё внимание на так называемые законы дистрибутив- дистрибутивности: (А + В)С = АС + ВС, D{A + В) = DA + DB, A0) где A,B,C,D — произвольные матрицы размеров соответственно m х 5, га х 5, s х n, n х га. Действительно, полагая А = (а^), В = (bij)> С = (cij), мы полу- получим для любых i,j равенство (используя дистрибутивность в Е) jfe=l k=l k=l левая часть которого даёт элемент ду матрицы (А+В)С, а правая — элементы Л^ и Л^ матриц АС и соответственно ВС. Второй закон дистрибутивности A0) проверяется совершенно аналогично. 3. Транспонирование матриц. Будем говорить, что матрицы Оц п\2 • • • CL\n all °21 О21 О22 • • • 0>2n t л _ °12 ^22 °m2 Q>mn размеров m x n и п х m соответственно получаются друг из дру- друга транспонированием — заменой строк на столбцы, а столбцов на
84 Гл. 2. Матрицы строки (внимательный читатель заметит, что понятие транспониро- транспонирования уже встречалось в упр. 1 § 2). Непосредственно видно,что Транспонирование произведения матриц подчиняется более инте- интересной закономерности. Если Ьц bi2 ... bin 62i &22 • • • &2n Оц О21 ai2 . О22 • am2 . .. au •• a2' .. ams в = TO a>'ki = Вычисление коэффициентов матриц Си Ci2 С21 С22 = гВ • гА = . . . dim ... dn по формуле G): показывает, что dji = Cij при всех 1 ^ г ^ m, 1 ^ ,; ^ п. Значит, 1С = J9, или, в исходных обозначениях, *(АВ)= гВгА. Более общо: если определено произведение матриц Ai, A2,..., Аг, то В силу теоремы 1 § 2 выполнено также свойство rank*A = rank A. 4. Ранг произведения матриц. Пусть Аи В — произвольные матрицы размеров т х s и s x п. Что можно сказать о величине rankAB? Теорема 3. Справедливо неравенство rankAB ^ min{rankA, rankjB}.
§ 3. Линейные отображения. Действия с матрицами 85 Доказательство. Для строк Сщ и столбцов С^ матрицы С = АВ мы в соответствии с G) имеем выражения C{i)=A{i)B, С^=АВЫ. A1) Интерпретируя теперь ранг матрицы А как ri = rank A = dim(AA), АB),..., А(т)), считаем без ограничения общности базисными строки Ащ,..., А(Г1), поскольку необходимая перестановка строк в А будет сопровождать- сопровождаться точно такой же перестановкой строк матрицы С, а это преобра- преобразование (э.п. типа (I)) не меняет ни rank А, ни rank С. Итак, откуда (используя дистрибутивность A0)) получаем П Г! С{к) = А{к)В = ( и, стало быть, Таким образом, rank С = dim^!),... ,С(т)) ^ rx = rank А. Аналогично, интерпретируя ранг матрицы В как г2 = rank В = dim(B^l\B^\... ,В<П>) и считая без ограничения общности базисными столбцы ..., В(Г2\ будем иметь Г2 < A; ^ n, откуда rankC = dim(CA),... ,C(n)) ^ r2 = rankS. П Заметим, что в случае каких-то специальных матриц Л, В дока- доказанное неравенство может становиться строгим. Так будет, скажем, при А ф 0, В Ф 0, АВ = 0 (см. пример в п. 2). В общем случае теоре- теорема 3 просто утверждает, что при умножении матриц ранг не может увеличиться.
86 Гл. 2. Матрицы 5. Квадратные матрицы. Множество всех квадратных мат- матриц (a,ij) порядка п с вещественными коэффициентами а^-, обычно обозначается Mn(R) (или Мп). Как уже отмечалось в конце п. 1, мож- можно говорить о векторном пространстве Мп(Ж). Согласно п. 2 произве- произведение любых двух матриц из Мп(Ж) снова принадлежит Мп(Ш). При этом выполнены свойства ассоциативности и дистрибутивности. Определение. Говорят, что квадратные матрицы фиксирован- фиксированного порядка п образуют матричное (ассоциативное) кольцо; а с учётом легко проверяемых правил ХАВ = (ХА)В = А(ХВ) умноже- умножения на скаляры А€ К множество Мп(Ш) называют также алгеброй матриц над R. К этим наименованиям предстоит ещё привыкнуть (см. гл. 4 по поводу систематизации терминологических новшеств), а сейчас мы обратим внимание на единичную матрицу Е = Ekj), где . _ Г 1, °kj " \ О, если k = j, если к ф j, — символ Кронекера. Очевидно, что rank 2? = п. Правило умножения матриц G), в котором следует заменить bkj на 6kj, показывает, что справедливы соотношения Более общо: A2) где ЕА = А = АЕ, diagn(A)A = XA = diagJA) = XE = А 0 0 А £ Мп(Ш). Adiagn(A), 0 . А . 0 . . 0 . 0 . А — известная нам скалярная матрица (см. § 3 гл. 1). Таким образом, умножение матрицы А на скаляр А равносильно умножению А на скалярную матрицу. В равенстве A2) отражён легко проверяемый факт перестановоч- перестановочности diagn(A) с любой матрицей А. Весьма важным для приложений является следующее его обращение. Теорема 4. Матрица из Мпу перестановочная со всеми матри- матрицами в Мп, должна быть скалярной. Доказательство. Введём матрицу Eij, в которой на пересе- пересечении г-й строки и j-ro столбца стоит 1, а все остальные элементы нулевые. Если Z = (zij) — матрица, о которой идет речь в теореме, то она перестановочна, в частности, со всеми Eij:
§ 3. Линейные отображения. Действия с матрицами 87 Перемножая матрицы в левой и правой частях этого равенства, мы получим матрицы О О Zjl Zj2 О О О с единственным ненулевым j-м столбцом и соответственно с един- единственной ненулевой г-й строкой. Их сравнение немедленно приводит к соотношениям Zk% = 0 при к ф г и гц = Zjj. Меняя г и j, получаем требуемое. D Для данной матрицы A G МП(Е) можно попробовать найти та- такую матрицу A' G МП(Е), чтобы выполнялись соотношения А А1 = = Е = А1 А. Сразу же заметим, что АА' = Е = А!1 А => А11 = А1. A3) Действительно, А" = А"Е = A"(yL4') = (A"A)A; = EA' = А1. Таким образом, матрица А1, коль скоро она существует, единственна. Её называют матрицей, обратной к А, и обозначают А~г: АА'1 =Е = А'1 А. A4) При выполнении A4) говорят ещё, что матрица А обратима. Определение. Матрица A G Mn(R) называется невырожден- невырожденной, если система её строк (а тем самым и столбцов) линейно незави- независима, т.е. rank Л = п. Если rank Л < п, то А называется вырожден- вырожденной. Теорема 5. Матрица A G МП(Е) обратима тогда и только тогда, когда она невырожденна. Доказательство. 1) Если АВ = Е (или ВА = Е), то по тео- теореме 3 имеем п = rankB = rank АВ ^ min {rank A, rankB} ^ n, откуда rank А = п. 2) Если rank A = п, то и, стало быть, A5) 1=1 причём коэффициенты о'^, составляющие матрицу А' = (о^) G МП(Е), определены однозначно. Согласно п. 1 § 2 (см. там уравнения A) и B)) соотношения A5) переписываются в виде =AAf{j\ 1О'<п,
88 Гл. 2. Матрицы откуда Е = {Е&\..., Я(п)) = (АА'A\..., АА'(п)) = АА1. Здесь мы интерпретировали матрицы Е и АА1 как объединения от- отвечающих им столбцов. Заметим теперь (см. п. 3), что вместе с А невырожденной явля- является и транспонированная матрица ЬА. Поэтому в силу доказанного найдётся матрица В такая, что ЬА • В = Е. Снова обращаясь к п. 3 и полагая А" = *В, находим Е=1Е= \гАВ) = гВьСА) = А" А. Итак, АА' = Е = А" А. Остаётся заметить (см. A3)), что А" = А', а поэтому в соответствии с A4) А' = А, т.е. матрица А обратима. □ Следствие 1. Если В и С — невырожденные квадратные матрицы порядков тип соответственно, а А — произвольная т х п-матрица, то rank В АС = rank А. Доказательство. В силу теорем 3 и 5 имеем rank ВАС ^ rank В Л = rank В А {С С'1) = = rank (BAC)C~l ^ rank ВАС, откуда rank ВАС = rank В А. Аналогично устанавливается равенство rank В А = rank A. □ Следствие 2. Если А,В € Мп(Ш) и АВ = Е или В А = JS, то В = А-К Доказательство. Как показано в части 1) доказательства теоремы 5, АВ = Е =^ rank A = п, т.е. А невырожденна и, сле- следовательно, обратима. □ Следствие 3. Если А,В,...,C,J9 — невырожденные п х п- матрицы, то произведение АВ... CD также невырожденно и (АВ... CD)-1 = D~lC~l... B~lA~l. Доказательство. Невырожденность матрицы G = АВ... CD видна из следствия 1, а равенство G~l = D~lC~l... B~lА прове- проверяется непосредственно: G(D~lC~l... В" А) = АВ... C(DD~l)C-1... В А = 1)...В-1А-1 = ... = Я. □
§ 3. Линейные отображения. Действия с матрицами 89 Удобный способ вычисления обратной матрицы, обычно исполь- используемый на практике, будет приведён в п. 7. Одновременно получится ещё одно доказательство теоремы 5. Явную формулу для А~х мы укажем в гл. 3. Сейчас лишь заме- заметим, что фактическое вычисление А для матрицы А с числовыми коэффициентами или вычисление произведения двух матриц обычно требует выполнения большого числа операций. На практике встре- встречаются матрицы порядка п = 100 и более. Если А и В — две такие матрицы, то для вычисления С = АВ нужно найти п2 элементов Cij по формуле G) (или (9)), что в каждом случае требует 2п - 1 умножений и сложений чисел. Всего нужно произвести Bп — 1)п2 операций, т.е. около двух миллионов операций при п = 100. Для со- современных ЭВМ это — сравнительно лёгкая задача, но реальные трудности возникнут, если потребуется найти степень Ат матри- матрицы Л с показателем т ^ 1000. Здесь по определению Ат = ААт~1\ фактически Ат = АкАт~к, 0 ^ к ^ т, — лёгкое следствие ассоциа- ассоциативности (см. следствие теоремы 2), как это будет показано в гл. 4 в более общем контексте. Для вычисления Ат используют разные дополнительные приёмы, либо основанные на специфике матрицы А, либо заимствованные из курса линейной алгебры. В качестве ил- иллюстрации рассмотрим три примера. Пример 1. Если = diag(ai,...,an) = ai ... О О ... otn то, очевидно, Пример 2. Пусть Тогда индукция по т показывает, что О .. о£ а с 0 Ь Г Ат = ат с- 0 О-6 где am-ftn а-Ь В частности, при о = Ь имеем а с 0 Ь -2 + b m~l ат тат~1с О ат
90 Гл. 2. Матрицы Пример 3. Индукцией по т нетрудно убедиться в том, что т-я степень матрицы А = II ° Ml имеет вид лт = || /т-1 /т II Aб) || /т /т+1 ||' V ' где целые числа /о = 0, /i = 1, /2 = 1, /3 = 2, ... определяются рекуррентным соотношением /m+l = /m + /т-1- Это не что иное, как числа Фибоначчи (см. пример 2 в конце § 3 гл. 1). Введём матрицу £ = с определителем 1 (см. § 4 гл. 1), где "А~ 2 ' Л'- 2 Небольшое вычисление показывает, что \/5Ai -- 0 А2 •В. Но если три произвольные п х n-матрицы Л, В, С, из коих В невырожденная, связаны соотношением А = В~1СВ, то Лт = В"ХСВ • В-ХСВ • B-1CB .... ВСВ = В-1СтВ (внутренние множители ВВ~1, заменённые на 2?, сократились). В нашем случае с учётом примера 1 и соотношения A6) имеем /m-l /m (I __ ^m _ R-l /m /m+l Н"Л "" Ai 0 0 А2 О А2 В = Am 0 0 Am A, 1 " 5 5 (звёздочками отмечены не интересующие нас члены).
§ 3. Линейные отображения. Действия с 91 Сравнивая коэффициенты матриц в левой и правой частях этого равенства, получаем для числа Фибоначчи с номером т значение /w = Мы видим, что fn скольку AJ1* при больших m (геометрическая прогрессия), по- 6. Классы эквивалентных матриц. Как и при доказательстве теоремы 4, обозначим через E,t матрицу размера т х т, в которой на пересечении s-й строки и t-ro столбца стоит 1, а все остальные элементы нулевые (такие матрицы называются иногда матричны- матричными единицами). Рассмотрим в Мт(Е) так называемые элементарные матрицы следующих типов: = Е — Еа) — + Ей = *; (I) Fttt = E + XE,t = 1 ...Л ... (П) ..,l,A,l,...,l}, А ф 0. (III) Пусть А — произвольная т х n-матрица. Тогда непосредственно проверяется, что матрица А1 = FA получается из Л посредством элементарного преобразования (э.п.) над строками типа (I) или (II) в зависимости от того, будет F = F8t или F = F8t(\). В случае F = Fa(X) будем говорить об э.п. типа (III) (умножение 5-й строки Л(в) на А). Аналогично, матрица А" = AF получается из А посредством э.п. столбцов. Мы уже знаем из п. 2 § 2 и из упр. 2 из § 2, что э.п. типов (I) и (II), совершаемыми над строками и столбцами, А приводится к матрице с диагональной невырожденной подматрицей
92 Гл. 2. Матрицы в левом верхнем углу размера гхг, где г = rank Л (при г = 0 матрица А нулевая). Так как О аг О = F1(a1)F2(a2)...Fr(ar) О О ■ о то привлечение э.п. типа (III) даёт возможность получить из А мат- матрицу вида Ег О О О A7) (здесь Ег — единичная матрица в МГ(Е); нули обозначают матрицы размеров гх(п-г), (т-г)хги(т-г)х(п-г)). Таким образом, PkPk.1...P1AQiQ2...Qi = \\ EQr о A8) где Pi, (соответственно Qj) — элементарные матрицы порядка т (соответственно п). Не раз отмечалось, что элементарные операции обратимы. Это согласуется с существованием обратных матриц (F.,t)-1 = F.,t, F.,t (A) = Fttt(-X), В соответствии со следствием 3 теоремы 5 матрицы Р = PkPk~i • • • Р\ и Q = Q1Q2 • • • Qi тоже обратимы: р-1 = рг1 ... р*--1! JT1. Q-1 = QT1 ■ ■ ■ Q?QIl- Заметим, что P~l>Qjl — элементарные матрицы. Две матрицы Л, В размера тхп назовём эквивалентными и за- запишем А ~ В, если найдутся невырожденные матрицы порядков т и п соответственно такие, что В = PAQ. Как легко понять, ~ является отношением эквивалентности:
§ 3. Линейные отображения. Действия с матрицами 93 ii) А ~ В =*■ В ~ А, поскольку В = PAQ =^> А = P^ iii) В = P'AQ', С = P"BQ" => С = PAQ, где Р = Р"/*, Q = = Q'Q"- Согласно общим принципам (см. § 6 гл. 1) множество всех га х п-матриц разбивается по отношению ~ на непересекающиеся классы эквивалентных матриц. Так как ранги эквивалентных матриц равны (см. следствие 1 теоремы 5), то рассуждение, приведшее нас к равенству A8), показывает, что в качестве представителей классов можно брать матрицы A7). Мы получаем следующее утверждение. Теорема 6. Множество матриц размера тхп разбивается на р = min(m,n) + 1 классов эквивалентности. Все матрицы ранга г попадают в один класс с представителем A7). Следствие. Всякая невырожденная п х п-матрица записыва- записывается в виде произведения элементарных матриц. Действительно, все невырожденные матрицы порядка п попада- попадают в один класс с представителем — единичной матрицей, поскольку их ранги равны п. Соотношение A8) переписанное в виде А = рг1 ... P^P^QT1 ■ ■ • Q?Q?, A9) даёт нужное утверждение. □ Не утверждается, что запись А в виде произведения элементар- элементарных матриц единственна, но сам факт существования такой записи весьма полезен. В частности, его можно использовать для отыскания обратной матрицы. В самом деле, из A9) мы находим А'1 = QiQ2... QiPkPk-i • • • Pi = QR 7. Вычисление обратной матрицы. Бели в рассуждениях предыдущего пункта ограничиться преобразованиями над строками и рассмотреть с самого начала расширенную матрицу (А\Е) размера п х 2п, то в случае невырожденной матрицы А £ Мп(Ж) возникнет цепочка {А\Е) А(р1а|р1е) А... ... А (Р, ... Р2Р1 А\Рк ... Р2РХЕ) = (Е\А'). Она оборвётся на А;-м шаге, когда в левой половине расширенной матрицы место А заполнит единичная матрица Е. В правой поло- половине при этом получится однозначный ответ: А1 = А~1. В случае вырожденной матрицы А процесс оборвётся, возможно, раньше — приведением А к ступенчатому виду и вычислением ранга г = rank A.
94 Гл. 2. Матрицы В матричной реализации, с которой начинался п. 6, при п = 3 имеем 1 0 0 -3 1 0 0 0 1 0 0 1 1 0 1 0 ^3,2 D) = 1 0 0 1 0 0 0 1 4 0 0 1 Реально элементарные п х n-матрицы Pi слева не приписываются. На них следует смотреть как на предписания и выполнять соответст- соответствующие им э.п. над строками. Напомним ещё раз о значении символов: Р{ = F8%t — переставить местами строки с номерами s и t; Pi = F§,tW — прибавить к 5-й строке t-ю строку, умноженную на Л; Pi = F8(\) — умножить 5-ю строку на Л. Пример 4. Пусть 0 2 0 1 1 -1 2 1 -1 Имеем (А\Е) = 0 2 0 1 1 -1 2 1 -1 1 0 0 0 10 0 0 1 .i (-2) 1 1 -1 0 1 0 0-11 1 0 -1 0 10 0 -1 1 1 0 -1 0 1 0 0 0 1 1 1 -1 0 2 0 О -1 1 1 1 -1 0 2 0 2 1 -1 0 1 О 1 О О О -2 1 О 1 О 1/2 О О О -2 1 0 1 О 1 О О О 0 1 -1/2 1/2 0 -1/2 1/2 1/2 1 0 -2 1 0 -2 0 0 1 1 0 0 1 0 0 ) 0 0 1 О -1 1 1/2 О О 1/2 -2 1
§ 3. Линейные отображения. Действия с матрицами 95 1-1 _ Таким образом, О -1 1 1/2 О О 1/2 -2 1 Для экономии места целесообразно выполнять сразу серию однотипных пре- преобразований. Пример 5. Пусть Имеем (А\Е) = А=\ -1111 1-111 11-11 111-1 -1111 1-111 11-11 111-1 10 0 0 0 10 0 0 0 10 0 0 0 1 Fi,2(i) 2 2 1 -1 1 1 - 1 1 1 1 1 1 -1 1 1 1 -1 111-1 1 0 0 0 1 1 0 0 1 0 1 0 1 0 0 1 2 1 1 -1 1/2 1/2 1/2 1/2 0 10 0 0 0 10 0 0 0 1 1111 0-200 0 0-20 0 0 0-2 1111 0 10 0 0 0 10 0 0 0 1 1/2 1/2 1/2 1/2 -1/2 1/2 -1/2 -1/2 -1/2 -1/2 1/2 -1/2 -1/2 -1/2 -1/2 1/2 1/2 1/2 1/2 1/2 1/4 -1/4 1/4 1/4 1/4 1/4 -1/4 1/4 1/4 1/4 1/4 -1/4 F4(-l/2) F2(-l/2) 10 0 0 0 10 0 0 0 10 0 0 0 1 -1/4 1/4 1/4 1/4 1/4 -1/4 1/4 1/4 1/4 1/4 -1/4 1/4 1/4 1/4 1/4 -1/4 Таким образом, А'1 = A/4)Л. Впрочем, в данном случае вычислений можно было бы избежать. Замечал, что произведение вырожденной матрицы и произвольной матрицы всегда вы- вырожденно (теорема 3), в то время как 4 0 0 0 0 4 0 0 0 0 4 0 0 0 0 4
96 Гл. 2. Матрицы мы делаем заключение о невырожденности А и, следовательно, о существовании А~1. Но коль скоро это так, то А = А2А'1 = 4Е • Л = 4Д =» А~1 = -А. 4 Замечание. При выполнении серии преобразований над стро- строками следует избегать типичной ошибки — прибавления в неизмен- неизменном виде строки, изменившейся в ходе предыдущих преобразований. Например, предписание *2,l(l) А —+ А' 1*1.2A) двусмысленно: не ясно, в каком порядке действовать — сначала FiJ(l), потом ^2дA); сначала F2ii(l), потом -Р\JA) или одновремен- одновременно? Каждый раз будут получаться различные выражения для строк А',гу А'Bу В примере 5 мы объединяли лишь однотипные преобра- преобразования, а если ставить своей целью вычисление на ЭВМ по указан- указанному методу, то естественно всю последовательность элементарных преобразований линейно упорядочить. Рассмотренный нами метод вычисления ранга, а также обратной матрицы называется Р-приведением или, более общо, (P,Q)-npuee- дением матриц к нормальному виду A7). 8. Пространство решений. Из вводных замечаний в начале § 2 и § 3 следует, что система линейных уравнений с матрицей А размера т х п и столбцом свободных членов В £ Rm может быть записана коротко в виде АХ = В B0) (X = [xi,...,xn] — столбец высоты п). Представив, что т = п и квадратная матрица А невырожденна (см. п. 5), мы получим, и при- притом единственное, решение системы B0), умножая обе части матрич- матричного соотношения слева на А": X = ЕХ = (А~1А)Х = А~Х{АХ) = = А В. Эта удобная символическая запись решений определённой системы не избавляет нас от вычислений, поскольку матрица А заранее не дана. Но не откажем себе в удовольствии заметить, что матричный аппарат доставляет по меньшей мере эстетическое наслаждение. Воспользуемся им теперь для обозрения всех решений линейной однородной системы (JIOC): АХ = 0. B1) По существу мы уже знаем, что если Х^1\Х^ — решения нашей ЛОС, то и любая их линейная комбинация тоже будет решением: А{ахХ^ + о2Х'2') = ai AX^ + a2 AYB) = 0. Поэтому можно говорить о пространстве решений ЛОС — линейной оболочке VA = (X £Rn
§ 3. Линейные отображения. Действия с матрицами 97 Пусть s = dim Уд, г = rank А. По определению s ^ n, r ^ ^ min(rn, п). Какая связь существует между s и г? Теорема 7. Имеет место равенство г + s = п. Доказательство. Выберем базис Л^1),. . ,,Х(*) линейной обо- оболочки Va и дополним его до базиса ХA\...,Х(8\Х(*+1\.. . ,Х(П) всего пространства Еп. Это всегда можно сделать, как показывает доказательство теоремы 2 § 1 (и упр. 6 из § 1). Для любого вектора X = £?el aiXW € Еп имеем так что в соответствии с § 2 линейная оболочка VB(A) = {AW,..., A<n>> = (хг А^ + ... + хпА^ \ х{ £ Еп) = называемая пространством столбцов матрицы А, совпадает с ли- линейной оболочкой (АХ(8+1\..., АХ^). В частности, г = dim VB(A) ^ п — s. Но векторы АХ^8+1\... линейно независимы, поскольку из о= следует Eib^t+i Л^4 G V*> а это в СИЛУ выбоРа ^(в+1),... ,^(п) возможно только при 08+i = ... = /Зп = 0. Значит, г = п — 5. П Замечание. Если использовать язык линейных отображений (см. п. 1 § 3), то, очевидно, VA = KenpA, VB(A) = ЪгирА — ядро и образ отображения ц>а '• Rn ~> Km, отвечающего А. Для нас, однако, этот подход служит лишь мотивировкой для введения матричных понятий. Чтобы найти базис пространства Va, выберем в Л г базисных столбцов одним из способов — приведением А к ступенчатому виду или так, как это указано в гл. 3. Перестановкой столбцов или, что равносильно, перенумерацией неизвестных можно добиться, чтобы базисными были г первых столбцов А(х\... ,А(Г\ При этом в новой системе неизвестных х'1уХ2,...,х'п главными неизвестными станут х[,..., х'Т. Любая система из г 4-1 столбцов А^,..., А^, А^к^, к > > 0, будет линейно зависимой, и на основании теоремы 1, v) из § 1 можно выписать систему соотношений + ... + х^А^ + Л(г+*> = 0, к = 1,2,..., п - г.
98 Гл. 2. Матрицы Векторы-столбцы XW = х<2> = 2 , B) B) ..., о], B2) B) Хг , в количестве п — r штук, очевидно, линейно независимы (из-за специ- специального вида своих последних п — r компонент) и, будучи решениями ЛОС B1), составляют по теореме 7 базис пространства Уд всех её решений. Понятно, что решение Х^ получается, если новым (штри- (штрихованным) свободным неизвестным придать значения s'r+i =0, ..., xr+k = 1, • • •, x'n = 0. Любой базис пространства решений однородной системы АХ = 0 ранга г называется фундаментальной системой решений. Систему B2) называют ещё нормальной фундаментальной системой. Согласно следствию теоремы 1 § 2 её ранг s = dim Уд = п — т равен числу свободных неизвестных линейной системы. УПРАЖНЕНИЯ 1. Даны отображения: а) [xi,x2,...,xn]»-+ [zn,. б) [xi,X2,...,*n]»-^[xil В) [Х1,Х2,...,ХП]»-+ [Х1, Какие из них являются линейными? 2. Доказать, что lac 0 1 6 0 0 1 II 1 т(т — 1) , , 1 та —*-у Lab + me = 01 тЬ II 0 0 1 Найти 3. для 1 а 0 1 0 0 с 6 1 Проверить, что 1 обратную матрицу. 0 -1 1 -1 = £?. 4. В приложениях большую роль играют марковские (или стохастические) матрицы Линейные отображения ч>р, ассоциированные с марковскими матрицами, обычно применяют к специальным так называемым вероятностным векторам-столбцам
§ 3. Линейные отображения. Действия с матрицами 99 Согласованность этих определений, диктуемых естественнонаучными зада- задачами, видна из следующих утверждений, которые нужно доказать хотя бы при п = 2. а) Матрица Р € Mn(R) является марковской в точности тогда, когда вместе с любым вероятностным вектором X вектор РХ также является вероятностным (здесь PX = tpp(X)). б) Бели Р — положительная марковская матрица (Vi, j pij > 0), то любому вероятностному вектору X отвечает положительный вероятностный вектор РХ (все компоненты строго больше нуля). в) Бели Р и Q — марковские матрицы, то марковской будет также матри- матрица PQ. Это означает, в частности, что любая степень Рк марковской матрицы является марковской. 5. Найти 'Я • Я, если Я = 1111 1-1 1-1 1 1-1-1 1-1-1 1 в. Ассоциировав с циклом длины п в 5П (см.! (строк единичной матрицы Еп) гл. 1) матрицу перестановки 0 О 1 О О 1 О О О О О 1 О О О О 0 О 1 О проверить, что Рп = Е. 7. Показать, что rank (А + В) ^ rank A + rank В для любых двух т х n-матриц А и В. 8. Показать, что для любой т х s-матрицы А и любой s x n-матрицы В имеет место неравенство rankj4 + rank£-a ^ rankAB. 9. Показать, что если ABC = 0 для квадратных матриц А, В, С порядка п, то rank Л + rank Б + rank С ^ 2п. 10. Найти ранг матрицы Х2У1 Х2У2 Х2Уп ХпУ1 Указание. Показать, что А = [хь.. .,xn](j/i,...,j/n). 11. Показать, что если А = (a«j) — невырожденная симметрическая матрица = ajt), то и Л — симметрическая матрица. 12. Найти А п F, если 5 4 3 2 1 4 8 6 4 2 3 6 9 6 3 2 4 6 8 4 12 3 4 5 2 3 2 1 3 6 4 2 4 8 6 3 2 4 3 2
100 Гл. 2. Матрицы 13. Проверить, что ■=i: sb.--**o В частности, ad - be = 1: а d —с 1 d-6c -b II а d II -с -Ъ а Существует ли А" при ad — be = 0? 14. Доказать, что для любой матрицы выполнено соотношение a b с d А2 = (а + d)A - (ad - bc)E B3) (другими словами, А является "корнем" квадратного уравнения х2 - (а + d)x + + (ad - 6с) = 0). 15. При ad-ЬсфО использовать соотношение B3) для нахождения обратной матрицы А. 16. Доказать, что если | , = 0, то , = 0. 17. Обосновать следующее рассуждение. Пусть m x s-матрица Х разбита горизонтальными и вертикальными прямыми на блоки (или клетки), так что Х\\ Х\2 Х2Х -^22 Хц Xi2 где Хц,..., Xik — матрицы с одинаковым числом mi строк (mi +... + rn» = m), а Xij,...,Xij — матрицы с одинаковым числом Sj столбцов (ei + ...а* = а). Бели теперь Yn Y12 ... Ylr Y21 Y22 Ykl Yk2 ... Ykr — s x n-матрица с блоками Уу размеров Si x rij (ni -f . •. + nr = n), то имеет смысл говорить о произведении Z = XY, причём матрицу Z = (zy) тоже можно считать блочной с блоками Zy, вычисляемыми формально по формуле G): По условию размеры матриц XiUiYuj таковы, что произведение X{uYuj имеет смысл. Приём разбиения матриц на блоки удобен даже в таком простейшем слу- случае, как «Е А || || А 0 || _ || 0 АВ 0 Я у И -Я В || " || -Е В где А, В, Е,0 € Mn(R) (Е — единичная, а 0 — нулевая матрица). 18. Показать, что умножение матрицы X =
§ 3. Линейные отображения. Действия с матрицами 101 на Т = (tij) € Мп {Щ слева равносильно линейному комбинированию строк Х(!)..., ^(п)> а справа — линейному комбинированию столбцов ^\^h В частности, обратить внимание на то, что если т = 1 ti2 ti3 О 1 t23 0 0 0 — верхняя унитреугольная матрица, то *(!> + ТХ = ..+ — матрица, полученная из X посредством цепочки элементарных преобразова- преобразований типа (II) над строками.
Глава 3 ОПРЕДЕЛИТЕЛИ Формулы C) и (9) из § 4 гл. 1 для решений квадратных линей- линейных систем порядков п = 2,3 наводят на мысль о существовании подобных формул при любом п. В конечном счёте речь идёт о правильной интерпретации в каж- каждой из упомянутых формул числителя и знаменателя. Мы будем смо- смотреть на них как на значения некоторой "универсальной" функции det : Mn(R) -> R из множества квадратных матриц порядка п в R. Эффективное построение функции det (определителя) даст ответ также на многие другие вопросы о матрицах, поднятые в гл. 2. На самом деле роль теории определителей в математике гораздо ши- шире затронутой нами темы, и каждое из применений этой теории подсказывает собственный путь её построения. Один из наиболее естественных подходов — геометрический, основанный на аналогии "определители матриц — объёмы многомерных фигур" и на внешних n-формах. Так как для этого нужно чуточку больше техники, то мы остановимся на аналитическом пути, апеллируя к геометрической интуиции лишь в самом начале. § 1. Определители: построение и основные свойства 1. Геометрическая мотивировка. Ничто сейчас не мешает ввести общее понятие определителя, но попытаемся на время забыть о нашей задаче, обратившись к вычислению объёмов простейших геометрических фигур — параллелепипедов. Квадратной матрице А = (aij) порядка п поставим в соответствие параллелепипед рёбра которого задаются столбцами матрицы А^, А^,..., А^, т.е. векторами (или точками) А^ = [aij,a2j,.. . ,anj] € Rn. Под ЩА) нужно понимать подмножество в Rn, состоящее из всех точек вида (мы незаметно перешли к отождествлению векторов-столбцов с их концевыми точками в пространстве с прямоугольной системой ко- координат). При п = 1 параллелепипед называется отрезком, а при п = 2 — параллелограммом. Объём v(U(A)) n-мерного параллелепипеда определяется по ин- индукции как произведение объёма v(U(A^1\.. .,A(n~V)) (п - 1)-мер- ного основания в Rn~1 и длины Л перпендикуляра А^Р, опущенно- опущенного на гиперплоскость этого основания из точки А^п\ Под объёмом
§ 1. Определители: построение и основные свойства 103 отрезка (п = 1) понимается, конечно, его длина, а под объёмом па- параллелограмма (п = 2) — его площадь. В общую теорию измерений объёмов мы сейчас не входим. Прямые вычисления показывают, что с точностью до знака n = 2: v 3: v an 021 an 021 031 Oi2 022 012 022 032 ai3 а2з азз A) (определители матриц порядков 2 и 3 вводятся соответственно фор- формулами B) и (8) из § 4 гл. 1). Соблазнительно было бы сохранить формулы типа A) без огово- оговорок, т.е. при любом расположении точек Л^^А^,..., но это воз- возможно только в том случае, если пользоваться понятием ориенти- ориентированного объёма параллелепипеда с допустимыми отрицательными значениями. В частности, для отрезка ориентированной длиной будет а < 0. Для параллелограмма ЩА^\А^) площадь берётся со знаком плюс, если упорядоченная пара векторов (А^г\А^) задает ту же ориентацию плоскости R2, что и базисная пара векторов (ei,e2); в противном случае — со зна- знаком минус. При таком понимании естественно обратить формулу A) и считать при любом п определителем det А матрицы А ориентиро- ориентированный объём параллелепипеда, обозначаемый тем же символом: Базисный вектор е^, отвечает стандартному столбцу Е^ = [О,... ...,!,...,0], так что — образ единичного вектора при линейном отображении ц>а ' X н» н» АХ (см. § 3 гл. 2). Образом единичного куба ЩЕ) при отображе- отображении (рл будет как раз параллелепипед П(Л), а поскольку v(U(E)) = 1, определитель det <pa = det А равен коэффициенту изменения ориен- ориентированного объёма. На самом деле при применении <рл ориентиро- ориентированный объём любой фигуры, а не только единичного куба, меняется в det Л раз (см. [ВА Щ). Обратим внимание на легко проверяемые свойства ориентирован- ориентированной площади параллелограмма: (<lU<2>) () 2) v(n(AW +AA<2UB))) = v
104 Гл. 3. Определители 3) v(U(E)) = 1. О свойствах 1) и 3) говорилось выше, а свойство 2) проиллюстри- проиллюстрировано (при п = 2) на рис. 14 и основано на идее равносостав- равносоставленности. При п > 3 свойства 1)-3) объёмов параллелепипедов уже менее наглядны, но совер- совершенно очевидно, что при любом подходе к теории определителей отмеченные три свойства долж- Рис. 14 ны выполняться. Кроме того, должны быть получены и другие свойства определителей так, чтобы вычисление det А для любой фиксированной квадратной матрицы А, а следовательно, и вычисление объёма и(П(Л)), было алгоритмически реализуемым и легко осуществимым актом. 2. Комбинаторно-аналитический подход. Близкие обозна- чения аи а\2 О21 О22 Onl , det A = аи ai2 О21 О22 ОП1 > B) которые для нас не новы и которыми мы будем постоянно пользо- пользоваться в дальнейшем, существенно различны. Бели А — квадратная таблица, заполненная своими коэффициентами (обычно числами), то определитель порядка п как та же таблица, но ограниченная верти- вертикальными чёрточками, — это число (или выражение), приписывае- приписываемое матрице А и определённое формулой полного развёртывания det А = C) Другими словами, определителем det А матрицы А = (ojj) называет- называется алгебраическая сумма всевозможных произведений коэффициен- коэффициентов aij, юятых по одному из каждой строки и из каждого столбца. В каждом произведении сомножители записываются в порядке следова- следования строк, а номера столбцов определяются образами <т1, <т2,..., ста номеров строк при перестановке а € 5П. Всего под знаком суммы в C) стоит п! слагаемых; слагаемые, отвечающие чётным переста- перестановкам, входят со знаком плюс, а отвечающие нечётным перестанов- перестановкам, — со знаком минус. Тех и других, согласно соотношению A1) из § 8 гл. 1, — одинаковое число п!/2. Как показывает несложная проверка, формула C) при п = 2 и п = 3 приводит к известным нам выражениям. Пусть п = 4, и пусть а = A 2)C 4). Тогда еа = 1, а о^^ог^гоз.^зо^о^ = 012021034043-
§ 1. Определители: построение и основные свойства 105 Это значит, что в определитель четвёртого порядка слагаемое 012021034043 входит со знаком плюс. В качестве полезного упражне- упражнения, рассчитанного на прочное владение материалом § 8 гл. 1, стоит выписать все 24 члена этого определителя и внимательно проследить за расстановкой знаков. Кстати, уже при п = 5 подобное задание с выписыванием 120 членов выглядело бы бессмысленным. Между тем, следуя наводящим соображениям из п. 1, мы хотели бы извлечь из ис- исходной формулы C) все нужные нам свойства определителей любого порядка. 3. Основные свойства определителей. Этих свойств немно- немного, но для формулировки и, главное, для их понимания нужно усло- условиться о терминологии и обозначениях. В дальнейшем, как и в гл. 2, символами А*) = (а*ьа»2,...,а*п)> г = 1,2, ...,п, будут обозначаться соответственно г-я строка и jf-й столбец матрицы А = {aij). Сама матрица А представляется либо как объединение своих строк: (столбец строк), либо как объединение своих столбцов: (строка столбцов). Условимся впредь строки и столбцы пхп-матрицы А называть также строками и столбцами определителя |а^-| поряд- порядка п. Согласно определению | | = det (от англ. determinant) — функ- функция, сопоставляющая квадратной матрице А некоторое число \А\ = = det А. Наша задача — изучить поведение этой функции при из- изменении строк или столбцов матрицы Л, рассматриваемых как эле- элементы (векторы) линейного пространства W1. Бели угодно, для нас det А — сокращённое обозначение (в духе п. 2 § 5 гл. 1) функции det[i4(!),... ,i4(n)] или det(A^\... УА^) п переменных, коими явля- являются векторы из Rn. Произвольную функцию V : [Ащ,..., А(п)] к-> V(AW,..., А(п)) мы будем называть полилинейной, если она линейна по каждому ар- аргументу -A(i)» т-в. .., aA'{i) + PA'fo,..., А{п)) = = aV(A{1),.. .,A'{i),.. .,A{n)) (ср. с п. 1 § 3 гл. 2). Та же функция V называется кососимметри-
106 Гл. 3. Определители ческой (см. п. 4 § 8 гл. 1), если 4(<),..., A(n)), 1 ^ i ^ n - 1. D) Замечание 1. Из определения линейных функций (см. D) § 3 гл. 2) можно заключить, что функция V полилинейна ровно тогда, когда при фиксированных A(i),...9A(i-.i),A(i+i)9...,A(n) и при A(i) = X = (х\,..., хп) мы имеем 2>(ЛA),..., Л(п)) = aixi + а2х2 + ... + ansn, где а\,..., ап — скаляры, не зависящие от xi,..., хп. Замечание 2. Кососимметричность полилинейной функции V эквивалентна выполнению соотношений 2>(A(i),...,-A(i-i),Л",-Y, А(<+2)»• • •»-А(п)) = 0, 1 ^г ^п-1. D;) В самом деле, положив А^ = -A(»+i) = X в D), мы придём к D;). Обратно, при X = j4(») + -A^+i) из D;) вытекает в силу полилинейно- полилинейности V соотношение = P(..., A(i) + A(<+i), A{i) + A(i+1) ,...) = 0. Первые два члена равны нулю (положить в D;) соответственно X = А(») и X = -A(i+i)), поэтому равна нулю сумма двух последних членов, что является лишь иной записью соотношения D). Те же определения и замечания относятся к функции V(A^l\... ..., А^) векторов-столбцов. Более того, условие B) кососимметрич- кососимметричности применимо к любой функции V: Мп -> R, где Мп — декар- декартова степень некоторого множества М. Напомним ещё, что согласно лемме 2 гл. 1 при перестановке местами любых двух аргументов кососимметрическая функция меняет знак на противоположный. Обратим внимание на то обстоятельство, что в формулу C) стро- строки и столбцы матрицы А входят, на первый взгляд, "неравноправ- "неравноправным" образом. Но если в А поменять местами строки и столбцы, то получится транспонированная матрица гА (см. п. 3 § 3 гл. 2). Стало быть, речь идёт о сравнении двух величин: det А и det lA. Ответ даёт Теорема 1. Определители любой квадратной матрицы А и транспонированной с ней матрицы ЬА совпадают: Доказательство. Положив А = (а^), 1А = (а^), где а^- = ajj, и заметив, что к = ^(тг^) для любой перестановки тг Е Sn и для
§ 1. Определители: построение и основные свойства 107 любого номера к Е {1,2,...,п}, мы видим, что упорядочение мно- множителей произведения а'1п1.. .а'п пп в соответствии с перестановкой тг даёт а1,7Г1 ' ' ' аП,7ГП = °1Г-11,1ГAГ-11) * * * ая—1Л,«г(я—1л) = Если учесть ещё, что еп = en-i (enen-i = enn-i = ее = 1), а {тг"1 тг Е G Sn} = {тг|тг Е Sn} = Sn (поскольку тг ь-> тг — биективное отобра- отображение из Sn в Sn), то по формуле C) имеем det *А — ^^ £ а1 о! — ^^ £ а! а! — ^ал^л ...an.™ = detA D Замечание 3. Утверждение теоремы 1 интерпретируется так: если для определителей выполнено какое-то свойство относитель- относительно строк (столбцов), то оно имеет место и относительно столбцов (строк). Теорема 2. Функция det: А и- det А на множестве Мп(R) обла- обладает следующими свойствами. Dl. detA — кососимметрическал функция строк матрицы А (т.е. при перестановке местами любых двух строк определитель меняет знак на противоположный). D2. det А — полилинейная функция строк матрицы А (т.е. опре- определитель матрицы А является линейной функцией элементов любой её строки D3. Доказательство. D1. Пусть А' — матрица, получающаяся из А перестановкой строк А(8), A(t), т.е. A1^ = A(t), А'^ = A(s), A'^ = = А(г) при гф s,t. Тогда, записав любую перестановку тг Е Sn в виде тг = от с транспозицией г = (s,t) (см. в п. 3 § 8 гл. 1 выражение A0'), определяющее перестановку i?r), будем иметь detA'= 22e«<«i'-<™ = -Е . • • * ^«,<tts * * * ^ttaTt ' • * ®"п,(ттп -Е «■«1,.
108Гл. 3. Определители = -det A- D2. Пусть А = (dij), и пусть А(к) = Х'А'^ + А"А"Л), где штрихи указывают на вспомогательные матрицы По условию Основываясь на замечании 1, свойство линейности det А относитель- относительно элементов А:-й строки А(к) можно установить следующим образом. По определению ,--->-А(*)>---,4(п)] = detA = где Pa, a G Sn, — коэффициенты, не зависящие от элементов строки А(ку Собирая подобные члены, отвечающие тем а Е Sn, для которых afe = j} и полагая aj = ]С(т*=; ^» получим нужное свойство линейно- линейности det [...,i4(fc),...] det [....^ц^, 2 a (Afa + АЧ;) = = 2 a,- (Afaw + АЧ;) Короче: det A = A' det A1 + A" det A". D3. Очевидно, det£ = = 1. П Из теоремы 2 вытекает несколько простых утверждений, кото- которые мы сформулируем в виде свойств определителей, но доказывать их будем в более общей ситуации — для любой функции V: Мп(Ж) -> -> R, обладающей свойствами D1-D2.
§ 1. Определители: построение и основные свойства 109 D4. Пусть А € Mn(R),A E К. Тогда Действительно, в силу свойства D2, применённого последователь- последовательно к строкам с номерами 1,2,..., имеем V(\A) = = Ю[А{1),ЛЛB),...,ЛА(П)] = ... = \nV[AA), ЛB),..., А{п)] = D5. Определитель с нулевой строкой равен нулю. Пусть, например, А(к) = @,0,..., 0). Тогда и 2А^ = @,0,..., 0). Следовательно, по D2 V(A) = ,..., A{k),..., откуда 2>(А) = 0. □ D6. Если в квадратной матрице А две строки совпадают, то её определитель равен нулю. Берём опять произвольную функцию V со свойствами D1-D2. Поменяв местами две совпадающие строки А(8),Ащ в А, мы полу- получим ту же матрицу А. С другой стороны, согласно свойству D1 для V значение V(A) примет противоположный знак. Таким образом, V{A) = -V(A), откуда 2V(A) = 0 и V(A) = 0. D D7. Определитель не меняется, если над его строками совер- совершать элементарные преобразования типа (II}. Достаточно рассмотреть случай применения одного элементарно- элементарного преобразования. Пусть после прибавления к з-й строке матрицы А её £-й строки, умноженной на Л, получилась матрица А'. Тогда в соответствии со свойствами D1 и D6 для V имеем ,..., A{t),...] = ,..., А[9) .., A{9),..., A{th...] = V(A). D Замечание 4. Проведённые доказательства показывают, что любая функция V: Мп(Ж) -> R со свойствами D1-D2 обладает также свойствами D4-D7 (заменить символ det на V). Предложение 1. Пусть О Й22 • • • 0-2п О 0 ... апп E)
по Гл. S. Определители — верхняя треугольная матрица порядка n, E — единичная мат- матрица и V: Мп(Ж) -> R — любая функция, обладающая свойствами D1-D2. Тогда Доказательство. Согласно замечанию 4 мы можем опираться на свойства D2, D7. На основании D2 вынесем Апп за знак V: = annV \ О О о 1 Применим теперь к А элементарное преобразование типа (II): выч- вычтем из г-й строки стоящей под знаком V матрицы последнюю строку, умноженную предварительно на а%п- При этом элементы последнего столбца обратятся в нуль (кроме апп = 1)» а все другие элементы ма- матрицы останутся без изменения. Применим то же самое рассуждение к предпоследней строке вновь полученной матрицы и т.д. Каждый раз очередной элемент ац выносится за знак V ъ рассуждение воз- возобновляется. Проделав его п раз, мы убеждаемся в том, что /1-0 V(A) = ann...an-'D[ V 0 ... 1 а это и есть искомая формула. D Следствие. Если А — матрица вида E), то det А = Оцо22 ... CLnn- F) Доказательство непосредственно вытекает из предложения 1, если заметить, что det Е = 1 (свойство D3). D Полезно привести ещё один вывод формулы F), опирающийся на более общее утверждение, которым мы воспользуемся позднее. Предварительно дадим следующее Определение. Определитель матрицы, получающейся из А = = (aij) вычёркиванием г-й строки и j-ro столбца, обозначается Mij и называется минором матрицы А, соответствующим элементу a%j. Величина Ау = (—1)*+*М# называется алгебраическим дополнением элемента а^. Предложение 2. Если СЧп 0 ап2
§ L Определители: построение и основные свойства 111 то det А = Доказательство. Так как det A = det*A (теорема 1) и так как аи.— единственный отличный от нуля элемент первого столбца ^1\ то а*!,! = 0 при тг1 / 1 и = 22 det А = Совокупность всех перестановок тг € 5П, оставляющих на месте сим- символ 1, отождествляется с множеством Sn-i перестановок, действую- действующих на множестве {2,3,... ,п}. Таким образом, det А = ац • - а<™,п = = Оц а2п апп В применении к_верхней_треугольной матрице А предложение 2 даёт равенство det А = ОцМц, где """ а22 о — определитель того же вида, но на единицу меньшего порядка. Оче- Очевидное рассуждение по индукции приводит к формуле F). Доказанные свойства дают возможность сравнительно просто вы- вычислить определитель порядка п. Один из методов заключается в следующем. Матрицу А = (a,ij) следует привести элементарными преобразованиями к треугольному виду (см. § 3 гл. 1). Пусть мы получим матрицу А вида E). Предположим, что в процессе приве- приведения было совершено q элементарных преобразований типа (I) и какое-то количество преобразований типа (II). Так как последние не меняют определителя (свойство D7), а каждое преобразование типа (I) умножает его на -1, то det A = (-l)*det А. По формуле F) мы имеем det A = ацп22 • •О'пп- В таком случае det А = (-1)* аца22 . • .апп. G) Это и есть одна из формул для вычисления det A. Теперь, опираясь на формулу G), мы установим важный факт, касающийся роли свойств D1-D3 определителя. Именно, имеет место
112 Гл. 3. Определители Теорема 3. Пусть V: Мп(Ж) -¥ Е — функция, обладающая сле- следующими свойствами: i) при перестановке местами любых двух соседних строк мат- матрицы A £ МП(Е) значение V(A) меняет знак на противоположный; ii) V(A) является линейной функцией элементов каждой строки матрицы А {другими словами, V(A) — кососимметрическая поли- полилинейная функция строк матрицы). Тогда Доказательство. Как мы знаем, свойство i) эквивалентно то- тому, что V{ А) меняет знак на противоположный при перестановке лю- любых двух строк, т.е. при любом элементарном преобразовании типа (I). Далее, согласно замечанию 4 V(A) обладает также свойствами D4-D7. В частности, V(A) не меняется, если строки матрицы А под- подвергнуть элементарному преобразованию типа (II). Приведём матрицу А при помощи элементарных преобразований к треугольному виду E), где, конечно, некоторые из Ац могут рав- равняться нулю. С учётом вышесказанного мы имеем формулы (см. G)) det А = (-1)* det А = (-1)9апа22... а„п, V(A) = (-1)П>(Я), где q — число элементарных преобразовании типа (I), совершенных при переходе от А к А. Нужное нам соотношение V(A) = V(E) det A вытекает теперь непосредственно из предложения 1. П Итак, свойствами D1-D3 функция det характеризуется однознач- однозначно. По этой причине мы отнесли их к основным свойствам определи- определителей. Можно было с самого начала назвать определителем функцию Z>, обладающую свойствами D1-D3, но в таком случае нужно устано- установить её существование. У нас существование обеспечивается самой конструкцией функции det — формулой C). Имея в виду дальнейшие применения теоремы 3, мы не включили в её формулировку нормировочное условие V(E) = 1. УПРАЖНЕНИЯ 1. Кососимметрическую функцию A: R3 —>■ R трех переменных А(ж,у,г) = (у - x)(z - x)(z - у) записать в виде определителя третьего порядка. 2. Пусть А = (oij), А1 = (о^) — две п х n-матрицы, Д, Д; — их определи- определители. Сравнить АиА'в случаях: а)а},.=2*-'ву; б) о^. =an+i-i,j; в) а\- =
§ 2. Дальнейшие свойства определителей 113 3. Показать, что 1 1 1 1 2 1 1 1 3 1 1 1 1 1 1 1 1 1 п 1 1 1 1 п + 1 = п\. § 2. Дальнейшие свойства определителей 1. Разложение определителя по элементам столбца или строки. Существует регулярный способ вычисления определите- определителей, основанный на редукции к определителям меньшего порядка. При этом используются понятия минора M»j и алгебраического до- дополнения Aij (см. определение в § 1). Теорема 1. Пусть А = (а^) Е Мп{Щ. Справедливы следующие формулы: det A = 1=1 1=1 {разложение определителя по элементам j-го столбца)] det А = A) B) {разложение определителя по элементам i-й строки). Иначе говоря, определитель матрицы А равен сумме произведе- произведений всех элементов некоторого столбца {некоторой строки) на их алгебраические дополнения. Доказательство. 1) Опираясь на основные свойства D1 и D2 определителей (сначала относительно столбцов, а затем относитель- относительно строк), выпишем цепочку равенств: det A = аи CL2J ап? О>21 axj О О ап din 0>п1 0>пп
114 Гл. 3. Определители ац • • • 0 ... ain 0,21 • • • 0 • • • 0>2п ani •Т. anj ... ann an ... ai,j_i О ani ••• anj_i О О ац ... aij_ ... а„ лч О ani ... an>j_i 1) v^ an • • • Onn din am ani Последнее равенство основано на предложении 2 § 1, применённом к матрице А'= а'п 0 a& 22 «in 0 a'. с а'Х1 = a»j, а'12 = a»i, ..., a'ln = а^, М{х = М^. Остаётся вспомнить, что по определению Aij = (--l)t+-7Mij. Формула A) доказана. 2) Положим lA = (a^), а^ч = а^. Заметим ещё, что минором, соот- соответствующим элементу е^ч в det*A, будет М^ = М^. Как было пока- показано в 1), det A = deteA = E"=i(-ji ij
§ 2. Дальнейшие свойства определителей 115 т.е. мы пришли к формуле B). Можно было рассуждать проще, со- сославшись сразу на замечание 3 из § 1. П Следующие дв& примера служат иллюстрацией полученных нами свойств определителей. Пример 1. Определитель 1 XI 1 X2 = A(xi,z2,...,xn), Xj X2 . . . Xn связываемый с именем Вандермонда, вычисляется по формуле или, в более подробной записи, An = (Ж2 - . . . (Хп - ~Х2)... {Хп - Х2) . . • (Хп - Xn-l (в связи с этой формулой полезно вернуться к упр. 1 из § 1). В частности, при попарно различных элементах х\,..., хп определитель Вандермонда отличен от нуля. Этим его свойством часто пользуются. По теореме 1 § 1 имеем также Д» = XI „п-1 Для доказательства формулы C) применим индукцию по п. Считая, что Am,m < п, вычисляется по формуле C) и опираясь на свойство D7, вычтем из каждой г-й строки определителя Ап (г — 1)-ю строку, умноженную на х\\ АЛ = 1 Хп — Х\ — Х2Х\ Хо - ж: ,п-2„ Напрашивается мысль разложить теперь Ап по первому столбцу, а в получив- получившемся определителе порядка п — 1 вынести из j-ro столбца (j = 1,2,..., п — 1) за знак определителя общий множитель ij+i — х\ (свойство D1 для столбцов). Мы придём к выражению п = (Хп - 1 Х2 • Д(Ж2,ХЗ,...,ЖП), совпадающему с C), поскольку по предположению индукции А(Ж2,...,ЖП)= П (Xj-Xi).
116 Гл. 3. Определители Пример 2. Матрица А = (а^) вида А = 0 -Ol2 —Oj3 CL\2 0 -U23 013 0 0>2n называется кососимметрической (о её определителе тоже говорят, что он ко- сосимметрический). Другими словами, ЬА = -Л. С учётом теоремы 1 из § 1 имеем det A = det *A = det(-A) = (-l)n det Л, откуда [1 + (-l)n"]detA = 0. При нечётном п получаем det Л = 0, т.е. опреде- определитель любой кососимметрической матрицы нечётного порядка равен нулю. 2. Определители специальных матриц. Чем больше нулей среди элементов матрицы А и "чем лучше" они расположены, тем легче вычислять определитель det А. Это интуитивное представле- представление находит в некоторых случаях точное количественное вьфажение. Например, мы знаем (см. F) из § 1), что определитель треуголь- треугольной матрицы (верхней или нижней) равен произведению элементов, стоящих на главной диагонали. Другой важный частный случай со- содержит Теорема 2. Для определителя D порядка п + т, у которого на пересечении первых п столбцов и последних т строк, стоят нули, имеет место формула an ain 0 . 0 . .. ann .. 0 .. 0 ann+i ... a bu ... bml ... hm "mm am • • • Gin •• Q>nn иц ••• 01m ^ml • • • "mm {определитель в левой части этого равенства называется квази- квазитреугольным или определителем с углом нулей). Доказательство. Зафиксируем сначала п(п + т) элементов aij и рассмотрим определитель D как функцию элементов Ьм, кото- которые образуют квадратную матрицу В порядка т. На полученную функцию можно смотреть как на функцию матрицы В: D = V(B). Ясно, что полилинейность и кососимметричность определителя D относительно последних т строк эквивалентна тем же свойствам Т>(В) относительно строк матрицы В. Значит, правомерно приме- применить к Т>(В) теорему 3 § 1, согласно которой V(B) = V(E) det В. По
§ 2. Дальнейшие свойства определителей 117 определению функции V имеем аи ... а\ о о о о о 1 Разложим Т>(Е) по последней строке (см. формулу B)), затем по предпоследней и т.д. Повторив эту операцию m раз, мы убедимся в том, что V(E) = det А, где *nl • • • О'пп Окончательно получаем D = V(B) = det A • det В. D В новых обозначениях формула из теоремы 2 принимает более компактный вид det А С О В = detA-det£. D) Здесь Аи В — квадратные матрицы, а нулевая матрица 0 и мат- матрица С прямоугольные. Опираясь на теорему 1 из § 1 и теорему 2 или на рассуждения, использованные в ходе доказательства теоремы 2, мы без труда устанавливаем, что det А О С В = detA-detB. D Иногда пытаются написать в точности такое же выражение для определителя det шии контрпример дящеи матрицу с в 0 1 А 0 1 0 я путём С В А 0 , хотя сразу же напрашивается простеи- = — 1. Всё дело в знаке. Правильный ре- результат получается путём перестановки строк или столбцов, приво- к виду или А С О В Более простые рассуждения основаны на той же теореме 3 из § 1, которую мы неоднократно использовали. Действительно, det С А В О = det С А Е О •det В.
118 Гл. 3. Определители Далее по формуле B), применённой m раз, находим det С А Ет О 1 ... О О О ... 1 0 ... О = (_l)("+2)+(n+4)+...+(n+2m)detj4 _ (_] Окончательно приходим к выводу, что если А, В — квадратные мат- матрицы порядков пит соответственно, то det В 0 | = (-l)nTndetA-detB. E) Формулы D) и E) охватываются общей теоремой Лапласа о раз- разложении определителей. Эта теорема, однако, употребляется срав- сравнительно редко, и мы на ней не останавливаемся, отсылая любозна- любознательного читателя к упражнениям в конце следующего параграфа. Исключительно важное в теоретическом плане утверждение об определителях матриц содержит Теорема 3. Пусть А и В — квадратные матрицы порядка п. Тогда det AB = det A • det В. Доказательство. Согласно формулам G) и (9) § 3 гл. 2, вы- выражающим коэффициенты сц матрицы (c{j) = AB = (fltj)(bij) через коэффициенты матриц А и В, г-я строка (АВ)^) записывается в виде k=i Фиксируем матрицу В и для любой матрицы А положим = det AB. Докажем, что функция V = ©в удовлетворяет условиям i), ii) теоремы 3 из § 1. В самом деле, поменяем А^8) и Ащ местами. Так как 5-я и t-я строки матрицы АВ имеют вид
§ 2. Дальнейшие свойства определителей 119 то при этом они тоже поменяются местами и, значит, то теореме 1 Далее, как известно, det AB — линейная функция элементов i-й стро- строки (AB){i): det AB = XiA{i)B^ + X2A{i)B^ + ... + \nA{i)B<nK Поэтому n n n n n j=l k=l k=l j=l k=l где Hk = S^=i ^jbkj — скаляр, не зависящий от элементов г-й строки Л(») матрицы А. Мы видим, что V линейно зависит от элементов г-й строки матрицы А. Таким образом, выполнены оба условия теоремы 3 § 1, согласно которой V(A) = V(E) • det А. Но по определению V(E) = det ЕВ = = det В. Отсюда вытекает искомая формула. П Непосредственная проверка теоремы 3, сравнительно легко вы- выполнимая при п = 2, уже при п = 3 сопряжена со значительными трудностями. Однако и в общем случае можно указать обходной ма- маневр, основанный непосредственно на свойствах D1-D2, а также на привлечении теорем 1 и 2 (см. упр. 3). УПРАЖНЕНИЯ 1. Целые числа 1798, 2139, 3255, 4867 делятся на 31. Без всяких вычислений показать, что определитель четвёртого порядка 17 9 8 2 13 9 3 2 5 5 4 8 6 7 также делится на 31. 2. Показать, что любой кососимметрический определитель |а^| четвертого порядка с aij € Z является квадратом целого числа. Замечание. Это верно для кососимметрического определителя произволь- произвольного порядка. 3. Доказать соотношение det AB = det A • det В (теорема 3) путём приведе- приведения элементарными преобразованиями типа (II) над строками вспомогательной II Е В II II Е В II матрицы С =\\ А п размера 2п х 2п к виду С = n A n . II ""■** II II A*j И Указание. Воспользоваться равенством det С = det С и соотношениями D), E).
120 Гл. 3. Определители То же доказательство провести, основываясь на упр. 17, 18 из § 3 гл. 2 и на Е А замечании, что 0 Е — верхняя унитреугольная матрица. 4 (Захаров В.И. — ТУла, 1984). В задачах по моделированию случайных ста- стационарных процессов возникают определители вида где xi,...,zm — любые переменные; fci,...,fcm — натуральные числа, /ci-f- ■ + • • • + кт = n; M£(x) — к х n-матрица вида 1 Ж X2 ... Хп~1 о 1 (J), ... Г-1)*"-8 0 0 1 ... ("J1)*»-3 оо Доказать, что Указание. При fci = ... = кт = 1, т.е. при т = п, получается определитель Вандермонда. 5. Показать, что W /5 + 1 Vt + •"• Vt + n-i / 5 + 1 \ V Указание. Вынести последовательно 5 + к — 1 из к-й строки при А: = = 1,2,..., п, а затем 1/(£ + / — 1) из 1-го столбца при I = 1,2,..., п. Действо- Действовать так до тех пор, пока в первом столбце не будут стоять только 1. 6. Пусть Cn(Ai,...,An) = -1 0 0 0 1 А2 0 0 0 0 1 0 0 0 0 0 ... Ап-2 -1 0 0 0 1 Ап-1 -1 0 0 0 1 Ап
§ 3. Применения определителей 121 Показать, что det Сп = An det Cn-i +det Сп-2- При Ai = Л2 = ... = Лп = 1 найти численное значение det Сп • Указание. Вспомнить пример 3 из п. 3 § 3 гл. 2 и обратить внимание на тот факт, что detCn(l,...,l) = (-l)n detCn(-l,.. .,-1). 7. Показать, что определитель п х п-матрицы 2 -1 0 0 0 -1 2 -1 0 0 0 -1 2 0 0 0 ... 0 ... -1 ... 0 ... 0 ... 0 0 0 -1 0 0 0 0 2 -1 0 0 0 -1 2 равен п +1. 8. Пусть АУВ — любые квадратные матрицы порядка п. Показать, что detl В = det(A + В) • det(A - В). 9. Пусть X — матрица размера п х к, a Y — размера кхп. Доказать, что det(£n + XY) = det(£fc + YX). Указание. Использовать соотношение Ек + YX О X Еп Ек Y О Еп Y Еп Ек О X En+XY § 3. Применения определителей 1. Критерий невырожденности матрицы. По теореме 5 из § 3 гл. 2 условие невырожденности матрицы А € Мп(Ш) (т.е. равен- равенство rank Л = п) эквивалентно её обратимости. Применяя теорему 3 из § 2 к соотношению АА~г = А А = Е, мы получаем, что Стало быть, определитель невырожденной матрицы отличен от нуля и 1 1 Наряду с матрицей А рассмотрим её присоединённую (или взаим- взаимную) матрицу Ап Чтобы получить ;4V, надо поставить на место каждого элемента а^ матрицы А его алгебраическое дополнение А^ (i,j = 1,... ,п), а за- затем перейти к транспонированной матрице.
122 Гл. 8. Определители Теорема 1. Матрица А € Afn(R) невырожденна (обратима) тогда и только тогда, когда detA ф 0. Если detA ф 0, то A-1 = (detA)-1Av, или, в более подробной записи, Ап ап апг -1 detA detA detA А-пп detA Доказательству теоремы предпошлём лемму. Лемма. Пусть А € Мп(Ш). Имеют место соотношения ... + ainAjn = бу det A, A) j + a2iA2j + ... + aniAnj = <Jti det A, B) где 6{j — символ Кронекера (при i Ф j говорят о разложении опре- определителя detA no чужой строке или соответственно по чужому столбцу). Доказательство. При i = j утверждение леммы совпадает с теоремой 1 из § 2. Поэтому остаётся рассмотреть случай i Ф j, когда 6{j = 0. С этой целью введём матрицу ац ai2 ... air, ain ani аП2 ... anf получающуюся из А = [..., Ащ,..., A(j),... ] заменой j-и строки на г-ю (г-я строка остается на месте). Как и у всякой другой квадрат- квадратной матрицы с двумя одинаковыми строками, det А' = 0. С другой стороны, алгебраическое дополнение А^к (к = 1,...,п) образуется путем зачёркивания j-й строки Ау\ = А(») и Л-го столбца опреде- определителя, так что Aj-fc = Ajk- Формальное разложение определителя матрицы А1 = (a'8t) по j-й строке даст нам соотношение 0 = detA' = совпадающее с соотношением A) в формулировке леммы. Второе со- соотношение получается из аналогичных соображений, относящихся к столбцам. D
§ 3. Применения определителей 123 Обращаясь к доказательству теоремы, мы просто замечаем, что левая часть соотношения A) есть не что иное, как элемент Cij мат- матрицы С = AAV: Cm аи am апп n Мп Согласно соотношению A) (c<j) = (8^ detA) = (detA)E. Таким обра- образом, ААУ = (det А)Е, откуда при det А ф О получаем (det А)^^) = A(det А)^ = Е. Левая часть соотношения B) является выражением элемента с'ч матрицы С1 = Av А Так как правые части в A) и B) совпадают, то в случае det АфО мы приходим к соотношениям A(det А) означающим, что А" = (det j4)~Mv. D Следствие. Определитель равен нулю тогда и только тогда> когда его строки [и столбцы) линейно зависимы. Доказательство. Линейная зависимость строк (или столб- столбцов) матрицы А € Mn(R) эквивалентна неравенству rank Л < п, т.е. вырожденности матрицы Л, что по теореме 1 равносильно условию det А = 0. D Замечание. Импликация гапкЛ < п =» detA = 0 является, конечно, непосредственным следствием основных свойств определи- определителей (см. D2, D6 в § 2). Теорема 1 имеет скорее теоретическое значение. С вычисли- вычислительной точки зрения, в особенности при больших размерах мат- матриц, для отыскания матрицы А удобнее пользоваться методом (Р, (З)-приведения, описанным в п. 7 гл. 2. 2. Формулы Крамера. Выведем теперь формулы для решения системы из п линейных уравнении с п неизвестными, ради которых, в частности, и была первоначально развита теория определителей. Теорема 2 (Крамер). Если линейная система имеет отличный от нуля определитель (т.е. det(a^) Ф 0), то её
124 Гл. 3. Определители единственное решение задаётся формулами Оц ... ащ ... аи ... ощ ... bl • ьп .. 01* • On* • • °ln • Onn •• 0>пп (числитель D* получается заменой к-го столбца в D = стол£г{0.м свободных членов). Доказательство. По теореме 1 матрица А = (а^) обратима. Поэтому, записав нашу систему в виде АХ = 5, мы, как и в п. 8 § 3 гл. 2, будем иметь det A Ап A2i Ai2 A22 Ani A2n ... откуда Именно такое выражение в числителе мы получим, разложив опре- определитель Dk по fc-му столбцу (см. B)). Выполнение всех преобразований в обратном порядке показыва- показывает, что набор (jDi / det Ay..., Dn/ det А) действительно является ре- решением нашей системы. D Заметим, что формулы C), (9) из § 4 гл. 1 совпадают как раз с формулами Крамера при п = 2ип = 3 соответственно. Удобные при небольших п формулы Крамера несут в общем чисто теоретическую функцию. Например, их применение к линейной системе из приме- примера 2 в п. 5 § 3 гл. 1 даёт (с учётом равенства det Л = 1) для чисел Фибоначчи выражение /« = 1 0 -1 0 0 0 1 -1 0 0 0 ... 0 ... 1 ... 0 ... 0 ... 0 0 0 -1 -1 0 0 0 1 -1 1 1 0 0 0
§ 3. Применения определителей 125 Понятно, что оно весьма далеко от того явного выражения для /п, которое мы нашли в п. 5 § 3 гл. 2. Надо сказать ещё, что необходимое для применения формул Кра- Крамера условие det А ф 0 неустойчиво в следующем смысле. Для реаль- реальных квадратных линейных систем с приближённо вычисленными ко- коэффициентами увеличение точности вычислений может радикально изменить картину. Если, например, -1 10 0 ... 0 0 0 -1 10 ... 0 0 0 е 0 0 о о -1 10 0 -1 то det Ае = 1 - е • 109 (разложить определитель по элементам первого столбца). При е = 10""9 имеем det Ae = 0. В то же время, вычисляя ко- коэффициенты матрицы всего лишь с точностью до одной миллионной, мы могли "не заметить е" (т.е. посчитать е = 0, a det Aq = 1). Таким образом, условия применимости формул Крамера чувствительны к малому "шевелению" коэффициентов системы. 3. Метод окаймляющих миноров. В § 3 гл. 2 содержится всё необходимое для описания совокупности решений прямоуголь- прямоугольной системы линейных уравнений. Важнейшая роль в этом описании принадлежит понятию ранга матрицы. Нам осталось лишь переве- перевести его на язык теории определителей, чтобы получить в своё распо- распоряжение ещё один метод вычисления ранга и удобное средство для выражения факта линейной независимости системы векторов линей- линейного пространства Ет. Итак, пусть агг — произвольная прямоугольная матрица размера тхпс коэффици- коэффициентами aij € К. Определение. Элементы, стоящие на пересечении каких-то выделенных к строк и к столбцов т х n-матрицы А (к ^ min(m,n)), составляют квадратную матрицу, определитель которой называется минором к-го порядка для А. Иногда говорят о миноре если l ••• Зк и jif-,jk — номера выделенных строк и столбцов.
126 Гл. 3. Определители При к = п — 1 мы приходим к ранее введённому понятию минора М^ для п х n-матрицы А. ^Минор М называется окаймляющим для М, если М получается из М вычёркиванием одной крайней строки (первой или последней) и одного крайнего столбца. Теорема (метод окаймляющих миноров). При вычислении ран- ранга матрицы А следует переходить от миноров меньших порядков к минорам больших порядков. Если для А уже найден минор М ф О по- порядка г, то требуют вычисления лишь миноры порядка г + 1, окайм- окаймляющие минор М. Если все они равны нулю, то rank А = г. Доказательство. Рассуждение основано на простом замеча- замечании, что если все миноры k-ro порядка матрицы А равны нулю, то равны нулю и все миноры более высоких порядков. Для этого соглас- согласно теореме 1 § 2 достаточно рассмотреть разложение любого минора порядка fc-f 1 по элементам какого-нибудь столбца (например, перво- первого или последнего, если ограничиться рассмотрением только мино- миноров, полученных посредством окаймления), затем перейти к минорам порядка к + 2 и т.д. Действуя теперь по схеме, указанной в формулировке теоремы, мы дойдём до какого-то минора М ф О порядка г. Без ограниче- ограничения общности считаем, что М отвечает матрице, стоящей в левом верхнем углу нашей матрицы: air м arr arj a™ aiT ац ain ami • • • amr ... Этого всегда можно достичь перестановкой строк и столбцов, не меняющей, как нам известно, ранга матрицы А. Выделим теперь в А строку Ащ и столбец А^ с совершенно про- произвольными номерами i,j (возможно, г ^ г или j ^ r). Составим при помощи элементов из Ащ и А^ минор М порядка г + 1, окаймляю- окаймляющий М: ац ... air М = ац arr arj air o>a Если М ф 0, переходим к минорам, окаймляющим Л/. Критический момент наступит, когда все окаймляющие М миноры будут равны нулю.
§ 3. Применения определителей 127 Итак, пусть М = 0 при любом выборе i,j. Разлагая М по элемен- элементам последней строки, придём к соотношению а>а М\ + а^Мг + ... + (XirMr + aijM = О с коэффициентами M, = (-l)r+'+1 ar>,+i ... arr ar;- не зависящими от t. Так как М ф О, то a»j = Aian + Л? од + .. - + Ara»r для i = 1,2,..., т с одними и теми же коэффициентами А, = —М8/М, 1 ^ 5 ^ г. Стало быть, т.е. любой столбец А^ является линейной комбинацией первых г столбцов. Это значит, что rank Л ^ г. Но из М ф 0 вытекает ли- линейная независимость столбцов в М и тем более — соответствую- соответствующих более длинных столбцов в А. Мы приходим к заключению, что rank А = г. D Следствие. Ранг всякой лсатршдо совпадает с наивысшим по- порядком её отличных от нуля миноров. Для следствия можно указать короткое независимое доказатель- доказательство. Именно, пусть ранг матрицы А равен г. Согласно теореме 1 § 2 гл. 2 это значит, что г — максимальное число линейно незави- независимых строк и максимальное число линейно независимых столбцов матрицы Л. Обращаясь к теореме 6 § 3 гл. 2, мы замечаем, что 4-яИ Er ° \\г I ° ° II где В и С — невырожденные матрицы порядков тип соответ- соответственно, записываемые в виде произведения элементарных матриц. «Е П II пг п имеется отличный от нуля минор М = |J5r| = 1 порядка г, но нет ненулевых миноров порядка > г, и так как это свойство сохраняется при элементарных преобразова- преобразованиях строк и столбцов, то мы приходим к нужному утверждению. D Метод окаймляющих миноров достаточно практичен, особенно тогда, когда мы хотим знать не только ранг, но и те столбцы или строки матрицы А, которые составляют максимальную линейно не- независимую систему. При элементарных преобразованиях эта инфор- информация, конечно, утрачивается.
128 Гл. 8. Определители УПРАЖНЕНИЯ 1. Показать, что выполнены следующие соотношения: (AB)V = BVAV; (*A)V =* (Лу); (ЛЛ)У = A"-1^; (Av)v = (detA)n~2A. 2. Выразить rank Лv через rank Л. 3. Доказать, что квадратная система линейных однородных уравнений тог- тогда и только тогда обладает нетривиальными решениями, когда определитель системы равен нулю. 4. Опираясь на результаты п. 8 § 3 гл. 2 и на теорему 2, показать, что фундаментальная система решений однородной системы xn =0, Лп-1,1^1 + ... + an-i,n£n = 0 ранга г = п — 1 будет состоять из одного вектора-столбца где Di — определитель матрицы, получающейся из А = (a» j) вычёркиванием её г-го столбца. Любое решение системы имеет вид X = АХ°. 5. Пусть А = (aij) € Mn(R) и (n- 1)|ау| < \ац\ для всех г ^ 3- Доказать, что det А ф 0. Указание. Предположив противное, воспользоваться критерием, сформу- сформулированным в упр. 3. Именно, если [xj,... ,ж£] — нетривиальное решение линей- линейной системы АХ = 0 и z£ — его компонента, имеющая максимальный модуль, то из fc-ro уравнения следует оценка дающая нужное противоречие. в. Доказать следующее утверждение (теорема Бине—Кохии). Пусть А = = (ау), В = (bki) — матрицы размеров п х т и т х п соответственно, и пусть С = АВ. Тогда Ojji 6jj2 ••• ajin a>2l aJ22 ••• aj2n detC = ^—/ Суммирование в правой части проходит по всем ( J возможным комбинациям по п элементов {ji> J2» • • •»jn} из 1,2,..., m. В частности, det С = det A-det В при m = п и det С = 0 при п> т. Указание. Так как су = C)
§ 3. Применения определителей 129 то многократное применение свойства D2 определителей (теорема 2 § 1) даёт detC= а2к2 апкп bklibk22..-bknTli где суммирование проводится по всем попарно различным fci,..., кп. При т <п таких индексов нет и, следовательно, det С = 0. Если же т ^ п, то к\,..., кп — выборка элементов {ji,..., jn}t взятых в каком-то порядке из 1,2,..., т. Следует собрать все члены, соответствующие фиксированной комбинации {ji,.--,jn}, и при помощи формулы C) § 1 получить нужное выражение: апкп bj in а3пп (Й ::: £)• И ( ) 7. Используя предыдущее упражнение, показать, что если А — тпхп-матрица над R, т ^ п, то det*AA = ^M2, м где М пробегает по всем f j минорам порядка п матрицы А. 8. Данному минору м( порядка к для п х n-матрицы А = (а^*) (см. определение в п. 3) отвечает дополни- дополнительный минор М f V " ' *.* 1 порядка п - fc, матрица которого получается из Л вычёркиванием строк с номерами i\,...,%к и столбцов с номерами ji,... ,jk. Выражение =(-""м>1?(?. ::: *)■ ... + ik) + (л + ... 4- Л), называется алгебра^ческгш дополнением к М \ } ''' k ). При А: = п — 1 мы \П •-- JhJ возвращаемся к обычному определению. Используя последовательно разложение определителя по элементам строк с номерами ti,...,{&» показать, что справед- справедлива следующая Теорема (Лаплас). Пусть в матрице А = (a*j) € Mn(R) выбраны к строк с номерами i\,..., г*. Тогда Е М \п ... i
130 Гл. 3. Определители При произвольном п теорема Лапласа известна нам в двух частных случаях: 1) /Ь = 1; 2) j4 — матрица с углом нулей размера (п — к) х к. В случае неудачи полезно убедиться в правильности теоремы Лапласа хотя бы при п = 4, ii = 1, i2=2: det A = - all U21 азз а4з ац ai4 &21 ^24 - О44 a22 a - an U21 азз 14 24 + агз • ai2 ct\ 0.22 0,2 eui а4з О42 3 3 + аз4 z\ агз а a44 14 24 a42 9. Пусть A € Mn(R),«B € Mm(R) — невырожденные матрицы, С — произ- произвольная nxm-матрица. Используя приём блочного умножения матриц (см. упр. 17 из § 3 гл. 2), показать, что А С -1 о в || -|| о в-1 ||• 10. Показать, что если Л, В, С, D € Mn(R), det Л -ф 0, то det Л В £ „ = det (ЛЯ - ЛСЛ"^) = (det Л) • det(D - < Кроме того, проверить, что det А В II f det(AD - СВ), если АС = СЛ, С D | \ det(DA - СВ), если ЛВ = ВЛ. § 4. К построению теории определителей Теоремы 2 и 3 из § 1 дают по существу аксиоматическое опи- описание функции det, хотя начинали мы с чисто конструктивного её задания. Укажем ещё несколько подходов к теории определителей, каждый раз ограничиваясь наброском канвы рассуждений. (Полное их проведение является хорошим упражнением.) 1. Первое аксиоматическое построение. Будем считать определителем любую функцию V: Mn(R) ->■ R, обладающую следую- следующими тремя свойствами: 1.1) V(A) — кососимметрическая функция строк матрицы А; 1.2) V(A) — полилинейная функция строк матрицы А; 1.3) V(E) = 1. Мы видели, что свойствами 1.1)—1.3) функция V однозначно ха- характеризуется и совпадает с функцией det, определённой формулой полного развёртывания C) § 1. Единственное, о чём нужно позабо- позаботиться, это дать независимое доказательство факту V( гА) = Сама формула C) § 1, если угодно, также нуждается в выводе.
§ 4- К построению теории определителей 131 2. Второе аксиоматическое построение. Определителем считаем любую функцию V: Mn(R) -¥ R, обладающую тремя свойст- свойствами: 2.1) Х>(..., АА(»),:..) = №(..., Ащ,...)» т-е- если °дну из строк А(») матрицы А умножить на А, то значение V(A) также умножается на А; 2.2) £>(...,Ali),...,AU),...)=V(...,A({i+AU),...,AUh...)] 2.3) X>(J5) = 1. Последовательно проверяется, что: а) значение V(A) не меняется при элементарных преобразованиях типа (II) над строками матрицы А; б) V(A) — полилинейная функция строк матрицы А] в) Т>(А) = 0 при равенстве двух строк матрицы А и, следователь- следовательно, V(A) — кососимметрическая функция строк. Мы вернулись, очевидно, к первому аксиоматическому прострое- нию. Нормировочное свойство V(E) = 1 в обоих случаях необходимо. 3. Построение методом полной индукции. Возьмём в ка- качестве определителя матрицы (аи) порядка 1 число ац. Определи- Определители матриц порядков 2 и 3 вводятся соответственно формулами B) и (8) из § 4 гл. 1. Пусть определители матриц порядков 1,2,..., п — 1 уже введены. Назовём определителем матрицы А = (a,ij) порядка п величину V(A) = апМи - 021М21 + ... + (-lr^amMni, где Mij — "минор" матрицы А, соответствующий элементу a»j и являющийся определителем V(A) матрицы А порядка п — 1, которая получается из А вычёркиванием строки с номером г и столбца с номе- номером j. Таким образом, в качестве исходного свойства берётся разло- разложение определителя по элементам первого столбца (частный случай теоремы 1 § 2). Используя индукцию по п, нужно установить свойства 1.1)—1.3) функции V применительно к матрицам порядка п, памятуя, что для Mij эти свойства выполнены. Реализация этой программы, закреп- закрепляющей навыки в грамотном применении метода индукции, не очень сложна. С деталями можно познакомиться по учебнику "Введение в алгебру" A977 г.). 4. Характеризация мультипликативными свойствами. Пусть мы имеем функцию V: Мп(Ж) ->• R, обладающую следующими свойствами: i) V(AB) = V(A)V(B) для любых матриц А,В е Mn(R); ii) V(F81) = -1 для каждой элементарной матрицы FSit (см. п. 6 § 3 гл. 2);
132 Гл. 3. Определители iii) T>(A) = А для верхних треугольных матриц вида * А € А = о ••. В частности, V(Fi(X)) = A. Утверждается, что V = det. В самом деле, воспользовавшись свойствами i) и ii) в применении к матрице мы получим причём это верно при любом А Е R, а не только при А ф 0, когда по определению матрица F$(X) элементарна. Отсюда для l имеем =Fr+1@)...Fn@) _ Г 0, если г Кп, ., если г = п. Согласно ш) V(F8it{\)) = 1 для элементарной матрицы F8tt(X) с $ < t. Так как F8ytF8it(X)F8it = Ft|f (A), то и V(Fty8(X)) = 1, а поэтому V(F8it(X)) = 1 при любых индексах s ^ t. Итак, D(F.,t) = -1 = detF,,t) P(F.,f(A)) = 1 = detF.,«(A), Поскольку любая матрица А 6 Mn(R) записывается в виде Ег О где Р и Q — произведения элементарных матриц (см. рассуждения перед теоремой 6 § 3 гл. 2), свойство i) позволяет заключить, что V(A)=detA.
§ 4- К построению теории определителей 133 УПРАЖНЕНИЯ 1 (J. Browkin, Poland). Пусть /: R —v R — произвольная функция с условием /@) = 0. Доказать, что существует, и притом только одна, функция V: Afn(R) —► R, обладающая следующими свойствами: i) если А содержит столбец нулей, то V(A) = 0; ii) если А! получается из А элементарным преобразованием типа (II) над столбцами, то V(A') = V(A)\ iii) если А = diag(A, 1,1,..., 1) — диагональная матрица, то V(A) = /(Л). При /(Л) = Л получаем V = det, но произвол в выборе / полезен в других приложениях. 2. Читателю предлагается выдвинуть и обосновать собственные варианты аксиоматического описания функции det.
Глава 4 группы, кольца, поля В предыдущих главах накопилось довольно много конкретного материала, который необходимо осмыслить с более общих позиций. С этой целью мы введём и изучим (пока на элементарном уровне), фундаментальные для всей алгебры понятия группы, кольца и поля. § 1. Множества с алгебраическими операциями 1. Бинарные операции. Пусть X — произвольное множество. Бинарной алгебраической операцией (или законом композиции) на X называется произвольное (но фиксированное) отображение г: X х х X ->• X декартова квадрата X2 = X х X в X. Таким образом, любой упорядоченной паре (о, Ь) элементов а, Ь € X ставится в соот- соответствие однозначно определённый элемент т(а, Ь) того же множе- множества X. Иногда вместо т(а. Ь) пишут атЬ, а ещё чаще бинарную опе- операцию на X обозначают каким-нибудь специальным символом: *, о, • или +. Последуем и мы по тому же пути, называя а • b (или просто об, без всякого значка между а и Ь) произведением, а а + Ь — сум- суммой элементов а,Ь £ X. Понятно, что эти названия в большинстве случаев условны. На X может быть задано, вообще говоря, много разных операций. Желая выделить одну из них, используют скобки: (X, *), и говорят, что операция * определяет на X алгебраическую структуру или что (X,*) — алгебраическая структура {алгебраическая система). Так, например, на множестве Z целых чисел, помимо естественных опера- операций +, • (сложения и умножения), легко указать получающиеся при помощи + (или —) и • "производные" операции: пот = п + т — nm, n*m = —п — ти т.д. Мы приходим к различным алгебраическим структурам (Z,+), (Z,.), (Z,o), (Z,*). Наряду с бинарными алгебраическими операциями не лишены ин- интереса гораздо более общие n-арные операции (унарные при п = 1, тернарные при п = 3 и т.д.), равно как и их комбинации. Связанные с ними алгебраические структуры составляют специальную теорию универсальных алгебр. Впрочем, мы упоминаем об этом только для того, чтобы липший раз подчеркнуть принципиальную важность для математики, казалось бы, частных разделов теории универсальных алгебр — алгебраических структур с бинарными операциями. В направлении конструирования разных бинарных операций на множестве X также, очевидно, открывается неограниченный прос- простор для фантазии. Но задача изучения произвольных алгебраических структур слишком обща, чтобы представлять реальную ценность. По
§ 1. Множества с алгебраическими операциями 135 этой причине её рассматривают при различных естественных огра- ограничениях. 2. Полугруппы и моноиды. Бинарная операция * на множест- множестве X называется ассоциативной, если (а * Ь) * с = о * (Ь * с) для всех а,ЬусЕ X; она называется коммутативной, если а * b = Ь * а. Те же названия присваиваются и соответствующей алгебраической структуре (X,*). Требования ассоциативности и коммутативности независимы. В самом деле, операция * на Z, заданная правилом П * 771 = —П — 771, очевидно, коммутативна, но A * 2) * 3 = (-1 - 2) * 3 = -(-1 - 2) - 3 = 0 ф 4 = 1 * B * 3), так что условие ассоциативности не выполняется. Далее, на множе- множестве Мп(Щ всех квадратных матриц порядка п > 1 определена опе- операция умножения — ассоциативная, но некоммутативная (см. п. 2 § 3 гл. 2). Элемент е € X называется единичным (или нейтральным) отно- относительно рассматриваемой бинарной операции *, если е*я = х*е = я для всех х € X. Если е' — ещё один единичный элемент, то, как сле- следует из определения, е' = е' * е = е. Стало быть, в алгебраической структуре (X,*) может существовать не более одного единичного элемента. Множество X с заданной на нём бинарной ассоциативной опера- операцией называется полугруппой. Полугруппу с единичным (нейтраль- (нейтральным) элементом принято называть ещё моноидом (или полугруппой с единицей). Как и для всякого множества, мощность моноида М = (Л/, *) обозначается символом CardM или \М\. В случае конечности числа содержащихся в нём элементов говорят о конечном моноиде М по- порядка \М\. Приведём несколько примеров полугрупп и моноидов. Пример 1. Пусть ft — произвольное множество и М(п) — множество всех его преобразований (отображений п в себя). Из свойств множеств и отобра- отображений, отмеченных в § 5 гл. 1, следует, что M(ft) — моноид. Имеется в виду, конечно, тройка (М(П),о,еп) где о — естественная композиция отображений, а en — тождественное отображение. Выделим тот частный случай, когда П — конечное множество из |ft| = п элементов, обозначаемых просто натуральными числами 1,2,...,п. Каждое пре- преобразование / : ft —> ft определяется указанием упорядоченной последователь- последовательности /A),/B),... ,/(п), где в качестве образа /(г) может стоять любой эле- элемент из ft. Не исключаются совпадения /(г) = f(j) при г ф j. Выбирая все- всевозможные последовательности, мы получим ровно пп преобразований. Значит,
136 Гл. 4- Группы. Кольца. Поля |М(Г2)| = CardM(£2) = пп. Пусть, скажем, п = 2. Элементы е, /,<j,/i моноида М({1,2}) и их попарные произведения полностью задаются следующими двумя таблицами: 6 / 9 h 1 1 2 1 2 2 2 1 1 2 е / 9 h е е f 9 h f f e 9 h 9 9 h 9 h h h 9 9 h Непосредственно видно, что М({1,2}) — некоммутативный моноид. Пример 2. Пусть снова П — произвольное множество и V(Sl) — множество всех его подмножеств (см. упр. 4 из § 5 гл. 1). Так как (АПВ)ПС = АП(ВПС) и (Ли В) UС = Ли (ВUС), то на V(Ct) определены две естественные ассоциативные бинарные операции. Очевидно, что 0иЛ = ЛиЛПГ2 = Л. Мы имеем два коммутативных моноида: (P(£2),U,0) и (Р(£2),П,£2). Как известно, |Р(П)| = 2П, если |Г2| = п. Пример 3. (MnQR),+,0) — коммутативный моноид с нейтральным элемен- элементом — нулевой матрицей, a (Mn(R),-,£) — некоммутативный моноид с ней- нейтральным элементом — единичной матрицей Е. Это непосредственно вытекает из свойств сложения и умножения матриц, с которыми мы познакомились в гл. 2. Пример 4. Пусть пЪ = {пт\т € Z} — множество целых чисел, делящихся на п. Ясно, что (nZ,+,0) — коммутативный моноид, a (nZ, •) — коммутативная полугруппа без единицы (п > 1). Пример 5. Множество Рп(Щ стохастических матриц порядка п (см. упр. 4 из § 3 гл. 2) является моноидом с обычной операцией умножения матриц. Подмножество 5' полугруппы S с операцией * называется подпо- подполугруппой, если х * у € 5' для всех ж, у € 5'. В этом случае говорят ещё, что подмножество S1 С S замкнуто относительно операции *. Если (М, *) — моноид, а подмножество М' С М не только замкнуто относительно операции *, но и содержит единичный элемент, то М' называется подмоноидом в М. Например, (nZ, •) — подполугруппа в (Z,), a (nZ,+,0) — подмоноид в (Z,+,0). Всякий подмоноид моно- моноида М(п) называется моноидом преобразований (множества п). 3. Обобщённая ассоциативность; степени. Пусть (X, •) — произвольная алгебраическая структура с бинарной операцией •, ко- которую мы ради простоты будем опускать, записывая ху вместо х • у. Пусть, далее, xi,...,xn — упорядоченная последовательность эле- элементов из X. Не меняя порядка, мы можем многими разными спо- способами составлять произведения длины п. Пусть 1П — число таких способов: 12 = 1: хгх2; k = 2: (xix2)xz, xi(x2xz)] U = 5: ((xix2)x3)x4i (xi{x2xz))x4, Xi((x2x3)x4), Хх(х2(х3х4)), (хгх2)(х3х4)] Очевидно, что, перебирая всевозможные произведения х\...Хк, £*+1... хп длин кип- A:, 1^/s^n — 1, а затем соединяя их нашей бинарной операцией в данном порядке, мы исчерпаем все 1П возмож-
§ 1. Множества с алгебраическими операциями 137 ностей. Замечательно, что в моноидах (и полугруппах) расстановка скобок оказывается излишней. Теорема 1. Если бинарная операция на X ассоциативна, то результат её последовательного применения к п элементам мно- множества X не зависит от расстановки скобок. Доказательство. При п = 1,2 доказывать нечего. При п = 3 утверждение теоремы совпадает с законом ассоциативности. Далее рассуждаем индукцией по п. Предположим, что п > 3 и что для числа элементов < п справедливость утверждения установлена. Нам нужно лишь показать, что (ХХ. . . Xk){xk+1. . .Жп) = (Si. . .S|)(S|+i. . . Хп) A) при любых &,/, 1 ^ fc, / ^ п-1. Мы выписали только внешние пары скобок, поскольку по предположению индукции расстановка внутренних скобок несущественна. В частности, х\Х2.. .я* = = (... ((яхЖгЭяз) • • -xk-i)xk — произведение, называемое левонорми- рованным. Различаем два случая: а) * = п - 1; тогда (хх... хп-г)хп = (. •. (xix2)... sn-i)sn — ле- вонормированное произведение; б) Л < п — 1; ввиду ассоциативности имеем = (Xi...Xk){(Xk+i...Xn-l)Xn) = т.е. снова левонормированное произведение. К тому же виду приво- приводится и правая часть доказываемого равенства A). D Ранее был введён знак суммирования £а;«. Очевидно, его мож- можно использовать и в любом аддитивном коммутативном моноиде. В мультипликативном моноиде аналогом служит знак кратного произ- произведения: 2 3 п ( г=1 г=1 г=1 ^ г=1 В силу теоремы 1 при записи (или при вычислении) произведения элементов х\х2 •.. хп моноида скобки излишни. Единственная забота должна проявляться о порядке множителей, да и то лишь в случае, когда они не все перестановочны между собой. В частности, при х\ = Х2 = ... = хп = х произведение хх... х обозначают, как и при действиях с числами, символом хп, называя его n-й степенью элемента я. Следствием теоремы 1 являются соотношения В моноиде (М, •, е) для любого х € М полагают ещё х° = е.
138 Гл. 4- Группы. Кольца. Полл Степеням хп £ (М, -,е) в моноиде (М, + ,0) соответствуют крат- кратные пх = х+х+...+х элемента х. Правила B) становятся правилами для кратных: тх + пх = (m -f n)s, п(шж) = (пт)х. B') Отметим ещё один полезный факт. Если ху = ух в моноиде М, то = хпуп, п = 0,1,2,... C) В частности, это всегда так в коммутативном моноиде. Соотношение C) доказывается индукцией по п: (ху)п = (ху)п~1(ху) = (s^V'1 Более общо: при X{Xj = а^я», t, j = 1,... ,m, опираясь на соотноше- соотношение C) и используя индукцию по ш, получаем (*!...*„,)» = *?...*». D) Аналогично, если х Н- у = у + х и ж» + Xj = Xj -f х» при i, j = 1,..., m, то nx + ny, n = 0,1,2,..., C') ... + xm) = nxi + ... + nxmy n = 0,1,2,... D;) Обычно моноид (М,-,е) называют мультипликативным, а (М, Н-,0) — аддитивным. Аддитивная запись используется преиму- преимущественно в коммутативных моноидах. 4. Обратимые элементы. Элемент а моноида (М, -,е) называ- называется обратимым, если найдётся элемент b е М, для которого аЬ = = е = Ьа (понятно, что элемент Ь тоже будет обратимым). Если ещё и ab' = е = Ь'а, то &' = еб' = (Ьа)Ь' = Ь(аЬ') = be = Ь. Это даёт нам осно- основание говорить просто об обратном элементе а" к (обратимому) элементу а Е М: а а = е = аа. Разумеется, (а")" = а. Понятие обратимого элемента монои- моноида служит, очевидно, естественным обобщением понятия обратимой матрицы в мультипликативном моноиде (МП(Е), •, Е). Так как (xy)(y~lx~i) = xQ/y-1)^""*1 = яея""*1 = е и, анадогич- н0» (у~1х~т1)(ху) = е, то (xj/)""^ = j/^. Стало быть, множество всех обратимых элементов моноида (М, -,е) замкнуто относитель- относительно операции и составляет подмоноид в М.
§2. Группы 139 УПРАЖНЕНИЯ 1. В п. 2 в качестве примера на Z вводилась операция *: п*т = -п — т, коммутативная, но неассоциативная. В алгебраической структуре (Z,*) выпол- выполняются соотношения (п*гп)*т = п, т*(т*п) = п. Пусть теперь нам дана про- произвольная алгебраическая структура (X, *), в которой (х*у)*у = ж, j/*(|/*x) = х для любых х,у € X. Доказать, что .т*у = j/*x, т.е. операция ♦ коммутативна. Ни- Никаких указаний к решению не даётся, поскольку это одно из самых бесполезных упражнений в книге. Но все-таки! 2. Показать, что множество | ]Г ay =0, » = 1,2,.. ., =i с обычной операцией умножения матриц является полугруппой. Является ли (Af° (R),.) моноидом? 3. В мультипликативном моноиде М выбирается произвольный элемент t и вводится новая операция *: х * у = xty. Показать, что (М, *) — полугруппа и что обратимость элемента t в М — необходимое и достаточное условие, при вы- выполнении которого (М,*) — моноид с нейтральным (единичным) элементом t. 4. Показать, что множество Z с операцией or пот = п + т + пт = A4-n) x х A + т) — 1, является коммутативным моноидом. Что служит в (Z, о) нейтраль- нейтральным элементом? Найти в (Z,o) все обратимые элементы. § 2. Группы 1. Определение и примеры. Рассмотрим множество GLn(E) всех п х n-матриц с вещественными коэффициентами и с отличным от нуля определителем. Согласно теореме 3 из § 2 гл. 3 det А ф 0, detB ф 0 =Ф detAB ф 0. Мы видим, что А, В е GLn(R) =» АВ е € GLn(E). Далее, (АВ)С = А(ВС) и существует выделенная матрица Е такая, что АЕ = ЕА = А для всех А € GLn(E). Кроме того, у ка- каждой матрицы А € GLn(E) имеется "антипод" — обратная матрица А, для которой АА~Х = А~1А = JS. Множество GLn(E), рассматриваемое вместе с законом компози- композиции (бинарной операцией) (А, В) и> АВ и называемое полной линей- линейной группой степени п над Е, можно было бы коротко определить, следуя терминологии § 1, как подмоноид всех обратимых элемен- элементов моноида (МП(Е), •,£?). Но этот подмоноид настолько важен, что он заслуживает специального названия и даёт веский повод ввести общее Определение. Моноид С?, все элементы которого обратимы, называется группой. Другими словами, предполагаются выполнен- выполненными следующие аксиомы. GO) На множестве G определена бинарная операция (я, у) н» ху. G1) Операция ассоциативна: (xy)z = x(yz) для всех ж, у, z € G. G2) G обладает нейтральным (единичным) элементом е: хе = = еж = х для всех х € G.
140 Гл. 4- Группы. Кольца. Полл -1 G3) Для каждого элемента х € G существует обратный х хх = х~1х = е. Мы видели в § 8 гл. 1, что указанным аксиомам удовлетворяет ал- алгебраическая система 5П, названная нами симметрической группой перестановок степени п. Фактически этим важнейшим примером мы предварили общее определение группы. Удивительно, что одна из старейших и богатейших по результа- результатам область алгебры, играющая фундаментальную роль в геометрии и в приложениях математики к вопросам естествознания, основыва- основывается на столь простых аксиомах. Небольшой анализ показывает, что их можно ещё упростить, но эта задача для нас не принципиальна. Группа с коммутативной операцией называется, естественно, коммутативной, а ещё чаще — абелевой (в честь норвежского мате- математика Абеля). Сам термин "группа" принадлежит французскому математику Галуа — подлинному создателю теории групп. Идеи теории групп "носились в воздухе" (как это часто бывает с осново- основополагающими математическими идеями) задолго до Галуа, и неко- некоторые из её теорем в наивной форме были доказаны еще Лагран- жем. Гениальные работы Галуа оказались непонятыми, и возрожде- возрождение интереса к ним началось только после книги К. Жордана "Курс теории перестановок и алгебраических уравнений" A870 г.). Лишь к концу XIX века в теории групп "совершенно отказываются от фан- фантазии. Взамен этого тщательно препарируется логический скелет" (Ф. Клейн, "Лекции о развитии математики в XIX столетии"). Для обозначения числа элементов в группе G (точнее, мощности группы) используются равноправные символы CardG, |G| и (G : е). Почти всё сказанное в § 1 о моноидах переносится на группы. Сле- Следует лишь производить надлежащую замену слов. В частности, под- подмножество Н С G называется подгруппой в G, если е € Я; h\, /12 Е е Я => hih2 € Я и h е Я =» /Г е Я. Подгруппа Я С G собст- собственная, если Я ф {е} и Я ф G. Приведём ещё несколько примеров групп. Пример 1. В уже известной нам полной линейной группе GLn(K) рассмот- рассмотрим подмножество SLn(R) матриц с определителем 1: SLn(R) = {А € GLn(R) | det A = 1}. Очевидно, что Е € SLn(K)- Согласно общим результатам гл. 3 об определителях det А = 1, det В = 1 => det AB = 1 Поэтому SLn(R) — подгруппа в GL(R); она носит название специальной линейной группы степени п над R. Её называют ещё и унимодулярной группой, хотя к последней часто причисляют матрицы с определителем ±1.
§2. Группы Ш Надо сказать, что группа GLn(R), будучи вместилищем многих интересных групп, является для математиков разных поко- р. ,_. лений как бы нескончаемым источником новых r/1^ ' идей и нерешённых задач. v^N^ Пример 2. Используя рациональные чи- Q- (О)г/ 5> SI (П\ ела вместо вещественных, мы придём к полной «vv;cf ъ> п\ ) линейной группе GLn(Q) степени п над Q и к её >v/' подгруппе SLn(Q). В свою очередь SLn(Q) со- |SLn(Q) держит интересную подгруппу SLn(Z) целочи- целочисленных матриц с определителем 1. Теорема 1 § 3 гл. 3, предлагающая явную формулу для ко- SLn(Z) эффициентов обратной матрицы, показывает, что SLn(Z) действительно является группой. Группы SLn(Q) и SLn(Z) занимают почётное место в теории чисел. Частично упорядоченное множество (см. п. 4 § 6 гл. 1) рассмотренных подгрупп группы GLn(R) изображается помещённой здесь диаграммой (рис. 15). Пример 3. Положив в примерах 1 и 2 п = 1, мы придём, во-первых, к мультипликативным группам R"=R\{0} = GLi(R), <Г =Q\{0} = GLi(Q) вещественных и рациональных чисел. Эти группы, очевидно, бесконечны. Так как в (Z,-,l) обратимыми элементами являются только 1 и —1, то GLi(Z) = = {±1}. Далее, SLi(R) = SLi(Q) = SLi(Z) = 1. Но уже при п = 2 группа SL2(Z) бесконечна: ей принадлежат, например, все матрицы 1 m II || 1 0 || II m m - 1 О X И' ||т l||. ||l I Отметим ещё бесконечные аддитивные группы: (R.+.0), (Q.+.0), (Z.+.0). Пример 4. Пусть п — произвольное множество, a S(U) — множество всех биективных (взаимно однозначных) преобразований / : п -> п. Обратившись к результатам § 5 гл. 1 об отображениях множеств (теоремы 1, 2 и следствие теоремы 2), мы немедленно делаем заключение, что S(u) — группа с естествен- естественной бинарной операцией, являющейся композицией преобразований. Разумеется, S(u) — подмоноид всех обратимых элементов моноида М(п) из примера 1 § 1, но это обстоятельство мы не склонны подчёркивать. Сама по себе группа 5(П) и в особенности различные её подгруппы, называемые группами преобразова- преобразований, — стартовая площадка, с которой начинаются всевозможные применения теории групп. Достаточно упомянуть о знаменитой "Эрлангенской программе" Ф. Клейна A872 г.), положившей понятие группы преобразований в основу клас- классификации различных типов геометрий (более подробно см. по этому поводу [ВА И]). Взяв за П линейное пространство Rn, мы придём к "большой" и малообозри- малообозримой группе 5(Rn). Но в 5(Rn) содержится подгруппа обратимых (биективных) линейных преобразований <рл ' Еп —> Еп, находящихся во взаимно однозначном соответствии с невырожденными матрицами А порядка п (см. § 3 гл. 2). Таким образом, получается вложение GLn(R) в 5(ЕП). Смысл этого вложения станет яснее, когда будет введено важное понятие изоморфизма групп.
142 Гл. 4- Группы. Кольца. Поля 2. Циклические группы. Пусть G — мультипликативная груп- группа (т.е. с операцией умножения), а — её фиксированный элемент. Если любой элемент д G G записывается в виде д = ап для не- некоторого п € Z, то говорят, что G = (а) — циклическая группа с образующим а (или циклическая группа, порождённая элементом а). Аналогично циклическая группа определяется в аддитивном случае: (а) = {па\ п е Z}. Это, конечно, не означает, что все элементы ап или па попарно различны. Условимся обозначать (а")* = а""* и убе- убедимся в справедливости следующего утверждения. Теорема 1. Каковы бы ни были т,п € Z, атап = am+n, (am)n = amn (соответственно та + па = (ш + п)а, п(та) = (пт)а). Доказательство. При неотрицательных т,п см. соотно- соотношения B), B') из п. 3 § 1. Если m < О, п < О, то т' = -т > О, I*411' = a~(m4n/) = am+n. -a"JCe-:-q) = n' = При —n >0 и aman = m* am = —m (a > > o, -1) n> i 1)n = 0 имеем 1 = C«-i. Если m' ^ n, to an~m/ = (aI71'-11 = om+n. Аналогично рассматривается случай m > 0, n < 0. Равенство (am)n = amn вытекает из предыдущего и достаточно очевидно из определения степеней. D Простейшим примером циклической группы служит аддитивная группа целых чисел (Z,+,0), порождённая обычной единицей 1 или —1. Легко проверить, далее, что матрица L. - порождает в SL2(Z) бесконечную циклическую подгруппу. Множество {1,-1} является по умножению циклической группой порядка 2. Пример циклической группы порядка п получается, если рассмотреть все вращения на плоскости вокруг некоторой точки О, совмещающие с собой пра- правильный n-угольник Рп с центром в точке О. Очевидно, что эти вращения обра- образуют группу: под их произведением следует понимать последовательное выполне- выполнение преобразований. Наша группа Сп содержит вращения (ро,<р1,.. .,<Pn-i против часовой стрелки на углы 0,2тг/п,..., (п — 1Jтг/п. При этом (рв = <р{, а из геометрических соображений ясно, что (pjl = v*?""* и 4>i = <Po (единич- (единичное преобразование). Итак, \Сп\ = п и Сп = (<Р\)- Заметим, что циклическая группа Сп является собственной подгруппой группы Dn всех преобразований симметрии n-угольника Рп (т.е. совмещений Рп с собой). Пусть снова G — произвольная группа, а — некоторый её эле- элемент. Имеются две возможности. 1) Все степени элемента а различны, т.е. тфп =$> ат ф ап. В этом случае говорят, что элемент a EG имеет бесконечный порядок.
§2. Группы 143 2) Имеются совпадения ат = ап при т ф п Бели, например, т > п, то ат~п = е, т.е. существуют положительные степени эле- элемента а е G, равные единичному элементу. Пусть q — наименьший положительный показатель, для которого aq = e. Тогда говорят, что а — элемент конечного порядка q. В конечной группе G (CardG < oo) все элементы, разумеется, будут конечного порядка. Предостере ж*е н и е. Слово "порядок" в математике многознач- многозначно. Мы говорили раньше о квадратных матрицах порядка п (матри- (матрицах размера n x п), но невырожденная матрица А, рассматриваемая как элемент группы GLn(R), имеет также порядок (возможно, бес- бесконечный) в только что указанном смысле. Каждый раз будет ясно из контекста, о чём идёт речь. На фоне приведённого выше примера циклической группы поряд- порядка п следующее утверждение почти очевидно. Теорема 2. Порядок любого элемента а € G (G — абстракт- ноя группа) равен Card (а). Если а — элемент конечного порядка q, то (а) = {е, а,..., а9}, а* = е <=> А; = lq, leZ. Доказательство. В случае элемента бесконечного порядка доказывать нечего. Если а — элемент порядка д, то по определе- определению все элементы е,а, а2,..., а9" различны. Любая другая степень ак совпадает с одним из этих элементов, т.е. (а) = {е,а,...^а4}. В самом деле, воспользовавшись алгоритмом деления в Z (п. 3 § 9 гл. 1), запишем показатель к в виде после чего, оперируя со степенями по правилам, изложенным в тео- теореме 1, получим а* = (aq)lar = еаг = аг. В частности, ак = е => г = 0 ==> к = lq. □ 3. Изоморфизмы. Как уже отмечалось ранее, три вращения ^(ь^ь^г против часовой стрелки на углы 0°, 120°,240° соответственно переводят пра- правильный треугольник Рз в себя. Но имеют- ;/ , , ся ещё три осевых преобразования симме- симметрии (отражения) ^ь^2>^з с указанными на рис. 16 осями симметрии 1-1', 2-2', 3-3'. \* з7 *2 Всем шести преобразованиям симметрии соот- Рис. 16 ветствуют перестановки на множестве вершин треугольника. Мы
144 Гл. 4- Группы. Кольца. Поля получаем <ро ~ е, <рх ~ A 2 3), pa ~ A 3 2), Фг ~ B 3), ф2 ~ A 3), ^з - A 2). Так как других перестановок степени 3 нет, то можно утверждать, что группа Dz всех преобразований симметрии правильного тре- треугольника обнаруживает большое сходство с симметрической груп- группой S3. В том же смысле близки друг к другу циклические группы Сп (см. пример в п. 2) и (A 2 ... п)) С Sn. Эти факты, а также общие размышления о группах не могут не приводить к весьма естествен- естественному вопросу о наиболее существенных свойствах групп. На первый взгляд, полная информация содержится в таблице умножения группы G, называемой таблицей Кэли: 91 92 9п 9i 9291 9n9i 92 9i 92 9292 9п92 ... дп ... ■ • • 9г9п • • • • • • 929п • •. ... 9п9п ... Действительно, многие закономерности группы можно уловить из рассмотрения её таблицы Кэли или, что то же самое, матри- матрицы М = (rriij) (размера п х п, если n = (G : е)) с элементами rriij = QiQj e G. Мы замечаем, например, что среди элементов каж- каждой строки и каждого столбца матрицы М любой элемент группы G встречается ровно один раз (см. ниже доказательство теоремы 4). Группа G абелева тогда и только тогда, когда матрица М сим- симметрическая, т.е. rriij = rriji. Этот список свойств можно было бы продолжить, но всё-таки сравнивать две таблицы для групп G,G' одинакового порядка довольно затруднительно, потому что вид мат- матрицы М зависит от нумерации (расположения) элементов группы, а уж в случае бесконечных групп ситуация ещё более усложняется. Самый правильный и самый радикальный подход к различению (или, напротив, к отождествлению) групп GmG1 предлагает понятие изоморфизма. Определение. Две группы GhG'c операциями * и о называ- называются изоморфными, если существует отображение /: G -»• G' такое, что: i) f(a * b) = f(a) o f(b) для всех а, Ь 6 G; ii) / биективно. Факт изоморфизма групп часто обозначается символически G^G1. Отметим простейшие свойства изоморфизма.
§2. Группы 145 1) Единица переходит в единицу. Действительно, если е — едини- единица группы G, то е * а = а * е = а, и, значит, /(е) о /(а) = /(а) о /(е) = = /(а), откуда следует, что /(е) = е' — единица группы G'. В этом рассуждении использованы, хотя и частично, оба свойства /. Для i) это очевидно, а свойство ii) обеспечивает сюръективность /, так что элементами f(g) исчерпывается вся группа G'. 2) /(а") = /(а). В самом деле, согласно 1) /(а) о /(а") = = /(а * а") = /(е) = е' — единица в G', откуда /(а) = /(а) о е' = /(а) о (/(а) о /(а)) = = (/(а) о /(а)) о /(а) = е' о /(О = Да). 3) Обратное отображение /-1 : G1 -+ G [существующее в си- силу свойства ii)) тоже является изоморфизмом. В силу следствия теоремы 2 § 5 гл. 1 надо убедиться лишь в справедливости свой- свойства i) для /-1. Пусть а',6' G G'. Тогда ввиду биективности / имеем а' = /(а),6' = /(Ь) для каких-то ab^G. Поскольку / — изомор- изоморфизм, а' о Ь' = /(а) о /F) = /(а * Ь). Отсюда имеем а * Ь = f"l{q! о 6'), а так как в свою очередь а = /~1(а'),Ь = f(b'I то /~1(а' о Ь') = = /-1(о')*Г1(Ь')- Замечание. Несложная проверка показывает, что установлен- установленное нами соответствие ~ между группами Из и 5з является на самом деле изоморфизмом. В качестве изоморфного отображения / мультипликативной группы (IR+>*) положительных вещественных чисел на аддитивную группу (R,+) всех вещественных чисел может служить / := In. Известное свойство логарифма In ab = In a + In b как раз моделиру- моделирует свойство i) в определении изоморфизма. Обратным к / служит отображение хие1. Докажем теперь две общие теоремы, иллюстрирующие роль изо- изоморфизма в теории групп. Теорема 3. Все циклические группы одного и того же порядка (в том числе и бесконечного) изоморфны. Доказательство. В самом деле, если (д) — бесконечная ци- циклическая группа, то все степени дп образующего д различны, и мы получим изоморфизм /: (д) ->• (Z, +), полагая дп Н> f(9n) = п- Биек- тивность / очевидна, а свойство f(gmgn) = f(gn) + f{gm) вытекает из теоремы 1. Пусть теперь G = {е, д,..., д^1} и G' = {е',дГ,..., (я')^1} — две циклические группы порядка q (операции в G и G' не различаем). Определим биективное отображение Полагал п + т = lq + r, O^r^g-1, для любых п, га = 0,1,..., q — 1
146 Гл. 4- Группы. Кольца. Полл и рассуждая как при доказательстве теоремы 2, будем иметь f(gn+m) = f(gr) = (д'У = (дТ+т = (д'Пя'Г = /Ю/ОП- □ Теорема 4 (Кэли). Любая конечная группа порядка п изо- изоморфна некоторой подгруппе симметрической группы Sn- Доказательство. Пусть G — наша группа, n = \G\. Можно считать, что 5П — группа всех биективных отображений множества G на себя, так как природа элементов, переставляемых элементами из 5П, несущественна. Для любого элемента а 6 G рассмотрим отображение La: G ->• G, определённое формулой La(9) = ag (очевидно, мы повторяем определение из п. 3 § 8 гл. 1). Бели е = = Рь 92, •.., 9п — все элементы группы G, то а, ар2,..., Щп будут теми же элементами, но расположенными в каком-то другом порядке (вспомним таблицу Кэли). Это и понятно, поскольку Значит, La — биективное отображение (перестановка), обратным к которому будет L = Le-i. Единичным отображением является, естественно, Le. Используя вновь ассоциативность умножения в G, получаем ^оь(р) = (аЬ)^ = а(Ь^) = La(Lbg), т.е. £аЬ = LaLb. Итак, множество Le, LP2,..., L9n образует подгруппу, скажем, Я, в группе S(G) всех биективных отображений множества G на себя, т.е. в 5П. Мы имеем включение Н С 5П и имеем соответствие L : а и La 6 Я, обладающее по сказанному выше всеми свойствами изоморфизма. D Теорема Кэли, несмотря на свою простоту, имеет важное зна- значение в теории групп. Она выделяет некий универсальный объект (семейство {Sn\ п = 1,2,...} симметрических групп) — вместили- вместилище всех вообще конечных групп, рассматриваемых с точностью до изоморфизма. Фраза "с точностью до изоморфизма" отражает сущ- сущность не только теории групп, стремящейся объединить в один класс все изоморфные группы, но и математики в целом, которая без таких обобщений была бы лишена смысла. Положив G' = G в определении изоморфизма, мы получим изо- изоморфное отображение ц>: G -+ G группы G на себя. Оно называ- называется автоморфизмом группы G. Например, единичное отображение e>G ' 9 *~+ 9 (далее обозначаемое просто через 1) — автоморфизм, но, как правило, G обладает и нетривиальными автоморфизмами. Свойство 3) изоморфных отображений показывает, что отображе- отображение, обратное к автоморфизму, тоже будет автоморфизмом. Если, далее, (p,i/> — автоморфизмы группы G, то (^ о ф)(аЬ) = (p(^(ab)) =
§2. Группы 147 = <p{ip(a)ip(b)) = (^р о ip)(a) • (ip о xl>){b) для любых a,b € G. Стало быть, множество Aut(G) всех автоморфизмов группы G образует группу — подгруппу группы S(G) всех биективных отображений G-+G. 4. Гомоморфизмы. В группе автоморфизмов Aut(G) группы G содержится одна особая подгруппа. Она обозначается символом Inn(G) и назьгоается группой внутренних автоморфизмов. Её эле- элементами являются отображения Небольшое упражнение показывает, что 1а действительно удов- удовлетворяет всем свойствам, требуемым от автоморфизмов, причём J = Ja-i, Ie = 1 — единичный автоморфизм, Iao Ib =z Iab (так как (/« о Ib)(g) = Ia(h(9)) = Ubgb-1) = abgb-'a'1 = abg(ab)-1 = Iab(g)). Последнее соотношение показывает, что отображение группы G на группу Inn(G) ее внутренних автоморфизмов, опре- определённое формулой f(a) = Ia,a G G, обладает свойством i) изоморф- изоморфного отображения: /(а) о f(b) = f(ab). Однако свойство ii) при этом не обязано выполняться. Если, например, G — абелева группа, то ада'1 = д для всех a, p 6 G, тал что Ja = Je, и вся группа Inn(G) со- состоит из одного единичного элемента /е. Это обстоятельство делает естественным следующее общее Определение. Отображение/: G ->• G' группы (G,*) в (G',o) называется гомоморфизмом, если Va,b€G /(a*b) = /(a)o/(b) (другими словами, выполняется только свойство i) из определения изоморфизма). Ядром гомоморфизма / назьгоается множество Кег/ = {g G G | /(#) = е; — единица группы G'}. Гомоморфное отображение группы в себя назьгоается ещё её зн- доморфизмом. В этом определении от / не требуется не только биективности, но и сюръективности (т.е. быть отображением "на"), что, впрочем, не очень существенно, поскольку всегда можно ограничиться рас- рассмотрением образа Ьп/ С G', являющегося, очевидно, подгруппой в G'. Главное отличие гомоморфизма / от изоморфизма заключает- заключается в наличии нетривиального ядра Кег /, являющегося, так сказать, мерой неинъективности /. Если же Кег/ = {е}, то /: G -> Ьп/ — изоморфизм.
148 Гл. 4- Группы. Кольца. Полл Заметим, что /(а) = е',№ = е' =* f(a*Ь) = /(о) о /(&) = е'ое' = е', Поэтому ядро Кег/ — подгруппа в G. 5. Словарик. Примеры. Стоит отметить, что термины сюръ- ективное отображение (отображение "на"), инъективное (отобра- (отображение вложения), биективное (взаимно однозначное отображение), применимые к отображениям любых множеств (без операций), в слу- случае групп (и в случае других алгебраических структур) заменяются соответственно терминами эпиморфизм (гомоморфизм "на"), моно- мономорфизм (гомоморфизм с единичным ядром), изоморфизм (взаимно однозначный гомоморфизм — эпиморфизм и мономорфизм одновре- одновременно). Имеется тенденция к замене гомоморфизма термином мор- физм. Этот словарик полезно иметь в виду при чтении математи- математической литературы, но на первых порах желающие могут обойтись двумя терминами: изоморфизм и гомоморфизм с добавлениями "в" и "на". В дополнение к рассмотренным выше приведём ещё несколько примеров морфизмов групп. Пример 5. Аддитивная группа целых чисел Ъ гомоморфно отображается на конечную циклическую группу (д) порядка д, если положить /: пирп (см. теорему 2 § 2). В этом случае, очевидно, Кег/ = {lq\ I 6 Z}. В самом деле, ясно, что {lq} С Кег/. Обратное включение следует из теоремы 1. Пример 6. Отображение / : R —> Т = SOB) аддитивной группы веществен- вещественных чисел на группу Т вращении плоскости с неподвижной точкой 0, задаваемое формулой /(А) = Ф\ (Ф\ — вращение против часовой стрелки на угол 2тгЛ), го- гомоморфно, так как Фд о Фм = Фд+М- Вращение на угол, целочисленно кратный 27Г, совпадает с единичным вращением (на нулевой угол), поэтому Кег/ = Z. Говорят также, что / — гомоморфизм Ж на окружность S1 единичного радиуса, поскольку имеется взаимно однозначное соответствие между Ф\ и точкой на S1 с полярными координатами A,2тгА), 0 ^ А < 1. Пример 7. Полная линейная группа GLm(M) вещественных матриц А (т.е. матриц с коэффициентами в R с не равным нулю определителем det А гомоморф- гомоморфно отображается на мультипликативную группу R* отличных от нуля веществен- вещественных чисел, если положить / := det. Условие гомоморфизма f(AB) = f(A)f(B) — лишь иная формулировка теоремы 3 § 2 гл. 3. По определению SLm(R) = Кег/. Пример 8. Рассмотрим циклическую группу Сг = (—1) = {1,-1} поряд- порядка 2. Если угодно, её можно задать абстрактно таблицей Кэли: С2 : -1 1 -1 1 -1 -1 1 Отображение Sn —> СЪ при помощи известной нам функции е = sgn : тг *-ь еж (знак перестановки тг) является гомоморфизмом симметрической группы Sn на Съ. Ядро Кеге = Ап порядка п!/2 (см. п. 3 § 8 гл. 1) называется знакопеременной группой.
§2. Группы 149 Пример 9. Бесконечная группа может быть изоморфна своей истинной (собственной) подгруппе. В самом деле, аддитивная группа (Z, +) содержит соб- собственную подгруппу пЪ = {пк | Дс € Z}, где п > 1 — фисированное натуральное число. Легко проверяется, что отображение дп - Z —> nZ, определённое соотноше- соотношением дп(к) = пк, является изоморфизмом. Попутно заметим, что Z и пЪ — бес- бесконечные циклические группы, в которых образующими служит соответственно 1 или -1 ип или —п; поэтому дп и отображение к »-> —пк исчерпывают все изоморфизмы Z -* nZ. Пример 10. Группа Aut(G) и даже отдельный неединичный элемент (р € € Aut(G) могут служить источником важных сведений о группе G. Вот яркий пример такого рода. Пусть G — конечная группа, на которой действует авто- автоморфизм <р порядка 2 (<р2 = 1) без неподвижных точек: афе=> <р(а) ф а. Предположим, что (p(a)a~~l = <p(b)b~l для каких-то а,Ь 6 G. Тогда после умножения этого равенства слева на (p(b)~l и справа на.а получим <р(Ь)~1ф(а) = = б а, т.е. <p(b~la) = б" а, откуда Ь~а = еи6 = а. Итак, <р(а)а~1 пробегает вместе с а все элементы группы G, или, что равносильно, любой элемент д 6 G записывается в виде д = <р(а)а~1. Но в таком случае <р(д) = </?(<р(а))(/?(а) = = (р2(а)(р(а~1) = аф(а)~1 = ((р(а)а~1)~1 = д~*. Итак, ц> совпадает с отображени- отображением д »-► д-1. Зная это, получаем аЬ = ^(а)^") = <p(a~lb~l) = (о~1Ь~1)~1 = = 6а, т.е. группа G оказывается абелевой. Кроме того, (G : е) — нечётное число, ибо G состоит из е и непересекающихся пар элементов ^г,*? = <р(д%)- Пример 11. Насколько можно изменить операцию на группе, не меняя в смысле изоморфизма самой группы, показывает следующий пример (см. также упр. 3 из § 1). Пусть G — произвольная группа, t — её какой-то фиксированный элемент. Введём на множестве G новую операцию (9>h) »-f g*h = gth. Непосредственно проверяется, что (gi * рг) * дг = 01 * @2 * 0з)> т.е. операция * ассоциативна. Кроме того, д* t" = t *д = д и д* (t~lg~lt~1 = (t~lg~lt~l) * * р = t", а это значит, что (G, ♦) — группа с единичным элементом е* = t. Элементом, обратным к д в (G, *), служит 0.Г1 = t""*?*". Отображение / : д >-> gt~l устанавливает изоморфизм групп (G, •) и (G, *), т.е. /(<?Л) = f(g)*f(h). Все указанные примеры служат, между прочим, иллюстрацией к одному общему правилу: изучение морфизмов группы G даёт значи- значительную информацию о самой группе G. УПРАЖНЕНИЯ 1. Доказать, что пересечение f]^j #»; любого семейства {#»|г € /} подгрупп группы G является подгруппой. 2. Говорят, что группа G порождается подмножеством 5 своих элементов, и пишут G = E), если пересечение всех подгрупп Я, содержащих 5, совпадает с G (другими словами, в G нет хотя бы одной собственной подгруппы, содер- содержащей 5), Показать, что в случае G = (S) каждый элемент д 6 G имеет вид 0 = ti*2 .. .tn,n = 1,2,..., где либо U € 5, либо tT £ S, l ^ t ^ п. 3. Показать, что перестановочные элементы a, b произвольной группы G, имеющие взаимно простые порядки s,£, порождают в G циклическую подгруппу порядка st: (а,Ь) = (аб).
150 Гл. 4- Группы. Кольца. Полл Указание. Включение (аЬ) С (а,Ь) = {а*Ы |0^t^5~l, 0 ^ j ^ « - 1} очевидно. Вместе с тем, согласно п. 3 § 9 гл. 1, из НОД(М) = 1 следует, что tk + sl = 1 для некоторых к,1 € Z. Поэтому с учётом теоремы 1 а = а1^** = а**5 = atkbtk = (ab)tfc € (аб). Аналогично, 6 € (ab), и, стало быть, (а, 6) 6 (ab). 4. Показать, что если М = E) — моноид, порождённый множеством 5, и каждый элемент s e S обратим в М, то М — группа. 5. Группа — это моноид G, в котором уравнения вида ах = 6, уа = 6 одно- однозначно разрешимы при любых а, Ь 6 G. Доказать это утверждение. 6. Показать, что множество A\(R) так называемых аффинных преобразова- преобразований <ра,ь: х |-* ах + Ь (а, 6 € R; а ^ 0) вещественной прямой R образует группу с законом умножения (pa,b<Pc,d = <Pac,a<*+&- В группе Ai(R) содержится подгруп- подгруппа GLi(R), оставляющая точку х = 0 на месте, и подгруппа "чистых сдвигов" х *-ь х + Ь- 7. Группа SL2(Z) содержит элементы Л = I , Б = по- порядков 4 и 3 соответственно. Показать, что (АВ) — бесконечная циклическая подгруппа в SL2(Z). Таким образом, произведение двух элементов конечного по- порядка в группе G не обязано быть элементом конечного порядка. А как обстоит дело в абелевой группе? 8. Доказать, что группа G чётного порядка \G\ = 2п обязательно содержит элемент д ф е порядка 2. Указание. Рассмотреть разбиение G на пары д,д~1. 9. Доказать, что Sn = (A 2), A3),..., A п)). 10. Доказать, что Sn = (A 2), A 2 3 ... п)). 11. Доказать, что знакопеременная группа Ап, п ^ 3, порождается циклами длины 3, причём на самом деле An =(A2 3), A2 4), ..., A2п)>. 12. Доказать, что к-я степень 7г* цикла 7г = A2...п)€5п является произведением d - НОД(п,/с) независимых циклов, каждый из которых имеет длину q = n/d. 13. Показать, что порядок перестановки тг £ Sn ( порядок циклической под- подгруппы (тг)) равен наименьшему общему кратному длин независимых циклов, входящих в разложение тт. 14. Пусть Л, В € Мп(Щ и (АВ)т = Е для некоторого целого числа т. Верно ли, что (ВА)т = Е? 15. Доказать, что непустое подмножество Н конечной (мультипликативной) группы G является подгруппой, если Я замкнуто относительно умножения. Зна- Значит, в данном случае требования существования в Я единичного элемента е и обратного h~l для каждого Л € Я излишни. 16. Какую систему образующих можно предложить для мультипликативной группы (Q+,-) положительных рациональных чисел? Указание. Использовать основную теорему арифметики из § 9 гл. 1. Существует ли в (Q+, •) конечная система образующих? 17. Доказать, что с точностью до изоморфизма существует лишь конечное число р(п) групп данного порядка п. Указание. Оценить сверху число различных таблиц Кэли порядка п. Фор- Формальные рассуждения с использованием теоремы 4 ограничивают р(п) числом (^) различных подмножеств в5п изп элементов. На самом деле р(п) значи- значительно меньше, но хорошей оценки, приближающейся к точной, пока не найдено.
§ 3. Кольца и поля 151 18. Используя упр. 10, показать, что каждая конечная группа может быть вложена (т.е. для неё существует мономорфизм) в конечную группу с двумя обра- образующими. 19. Попробуйте убедиться, что на диаграмме (рис. 17) изображены все под- подгруппы знакопеременной группы А*. Символом V4 обозначена так называемая A23)сГA24)с(Aз4) A4)B3) Рис. 17 четверная группа (или группа Клейна) V* = {е,A2)C4),A3)B4),A4)B3)}, а возле других вершин диаграммы поставлены образующие циклических подгрупп. 20. Показать, что все группы порядка 4 абелевы и с точностью до изомор- изоморфизма исчерпываются группами перестановок U = (A234)), V4, или же группами матриц: П м i1-t -:м; - ц МП ;м-! si-1-t -:м О -1 Выписать в явном виде изоморфизмы U -* L\> V* -*• L2. У к азан ие. Если х2 = е для любого элемента х 6 G, то абаЬ = е § 3. Кольца и поля 1. Определение и общие свойства колец. Алгебраические структуры (Z,+), (Z,-) выступали у нас в качестве самых первых примеров моноидов, причём на (Z, +) мы смотрели позднее как на аддитивную абелеву (фактически циклическую) группу. В повсе- повседневной жизни, однако, эти структуры чаще всего объединяются и получается то, что в математике называется кольцом. Важная компонента элементарной арифметики заключена в дистрибутивном (или распределительном) законе (а + Ь)с = ас + Ьс, кажущемся три- тривиальным только в силу приобретённой привычки. Попытавшись, например, объединить алгебраические структуры (Z,+), (Z,o), где nom = n + ra + nm, мы уже не заметим столь хорошей согласован- согласованности между двумя бинарными операциями. Прежде чем переходить к дальнейшим примерам, дадим точное определение кольца.
152 Гл. 4- Группы. Кольца. Поля Определение. Пусть К — непустое множество, на котором заданы две (бинарные алгебраические) операции + (сложение) и • (умножение), удовлетворяющие следующим условиям: К1) (Ку +) — абелева группа; К2) (К, •) — полугруппа; КЗ) операции сложения и умножения связаны дистрибутивны- дистрибутивными законами (другими словами, умножение дистрибутивно по сло- сложению) (а + Ь)с = ас + be, с(а + Ь) = са + сЬ для всех о, 6, с € К. Тогда (К, +, •) называется кольцом. Структура {К, Л-) называется аддитивной группой кольца, а (К, •) — его мультипликативной полугруппой. Если (К, •) — моноид, то говорят, что (К, -I-,-) — кольцо с единицей. Единичный элемент кольца принято обозначать обычной едини- единицей 1. Существование 1 часто вносится в определение кольца, но мы этого делать не будем. В приложениях и в общей теории колец (а такая теория, и при- притом чрезвычайно развитая, существует) рассматриваются алгебраи- алгебраические структуры, в которых аксиома К2) либо совсем устраняется, либо заменяется другой — в зависимости от конкретной задачи. В таких случаях говорят о неассоциативных кольцах. Пока у нас бу- будут только обычные (ассоциативные) кольца. Это значит, что мы можем опираться на теорему 1 из § 1 и не заботиться о расстановке скобок в произведении а\ач .. .а* любого числа к элементов кольца. Подмножество L кольца К называется подкольцом, если х,у € L =Ф- х - у € L, xy e L, т.е. если L — подгруппа аддитивной группы и подполугруппа муль- мультипликативной полугруппы кольца. Ясно, что пересечение любого семейства подколец в К являет- является подкольцом (рассуждения те же, что и в упр. 1 из § 2) и, стало быть, имеет смысл говорить о подкольце (Г) С К> порождённом под- подмножеством Т С К. По определению (Г) — пересечение всех тех подколец в К, которые содержат Г. Если с самого начала Г было подкольцом, то (Г) = Г. Кольцо называется коммутативным, если ху = ух для всех х, у € G К (в отличие от групп, коммутативное кольцо не принято назы- называть абелевым). Понятие кольца в том виде, как оно введено нами, является весь- весьма широким. Более того, класс коммутативных колец, кажущийся на первый взгляд довольно специальным, был предметом усиленного изучения в течение многих десятилетий, и в настоящее время тео- теория коммутативных колец переплетается с алгебраической геомет-
§ 3. Кольца и поля 153 риеи — красивой математической дисциплиной, пограничной между алгеброй, геометрией и топологией. Пример 1. (Z, +, •) — кольцо целых чисел с обычными операциями сложения и умножения. Множество тЪ целых чисел, делящихся на т, будет в Z подколь- цом (без единицы при т > 1). Аналогично, кольцами с единицей являются Q и R, причём естественные включения ZCQCR определяют цепочки подколец кольца Е. Пример 2. Свойства операций сложения и умножения в Mn(R), введённые и подробно изученные нами в гл. 2, позволяют утверждать, что МП(Н) — кольцо с единицей 1 = Е. Оно называется полным матричным кольцом над R, а также кольцом квадратных матриц порядка п (или размера п х п) над Е. Это один из самых важных примеров колец. Так как при п > 1 матрицы, как правило, неперестановочны, то Мп(Ш) — некоммутативное кольцо. Оно содержит в каче- качестве подколец кольца Mn(Q) и Mn(Z) квадратных матриц того же порядка над Q и над Z соответственно. Вообще, Мп(Щ насыщено всевозможными подколь- цами. Время от времени некоторые из них будут возникать у нас естественным образом. Заметим ещё, что можно рассматривать кольцо квадратных матриц Мп(К) над произвольным коммутативным кольцом К, поскольку при сложении и умножении двух матриц А, £ 6 Мп(К) будет снова получаться матрица с ко- коэффициентами из К, а законы дистрибутивности в Мп(К) являются следствиями аналогичных законов в К. Всё это прямо вытекает из формальных правил дей- действий с матрицами, подытоженных в пп. 2 и 5 из § 3 гл. 2. Пример 3. Наряду с кольцом матриц в различных разделах математики широко используется также кольцо функций. Именно, пусть X — произволь- произвольное множество, К — произвольное кольцо. Пусть, далее, Кх = {X -* К} — множество всех функций (или, что то же самое, отображений) f : X -> К, рас- рассматриваемое вместе с двумя бинарными операциями — поточечной суммой / + g и поточечным произведением fg, определёнными следующим образом: (/ + <?)(*) = /(*)е <?(*), @ и 0 — операции сложения и умножения в К). Это, очевидно, не та композиция (суперпозиция) функций, которая привела нас в случае линейных отображений к кольцу Мп. Скорее мы становимся здесь на точку зрения, принятую в матема- математическом анализе, когда, например, при X = М, К = R произведением функций tg и sin будет tg • sin: х »-> tg x • sin я, а не tg о sin: хи tg(sin x). Легко проверяется, что Кх удовлетворяет всем аксиомам кольца. Так, ввиду дистрибутивности операций в К имеем [/(*) Ф 9(х)] 0 h(x) = /(*) 0 h(x) ф g(x) 0 h(x) для любых трёх функций /,£, h 6 Кх и любого хбХ,а это по определению поточечных операций даёт (/ + g)h = fh + gh. Справедливость второго дистри- дистрибутивного закона устанавливается англогично. Бели 0,1 — нулевой и единичный элементы в К, то Ох : х »-> 0, 1х • х ■-> 1 — постоянные функции, играющие роль нуля и единицы в Кх. В случае комму- коммутативности К кольцо функций Кх также коммутативно. Кольцо Кх содержит разнообразные подкольца, определяемые специальны- специальными свойствами функций. Пусть, например, X — [0,1] — замкнутый интервал в R и К = R. Тогда кольцо Ы°>1] всех вещественных функций, определённых на [0,1], содержит в качестве подколец кольцо Rorp всех ограниченных функций,
154 Гл. 4- Группы. Кольца. Поля кольцо О&непр всех непрерывных функций, кольцо №■ '1 всех непрерывно диффе- дифференцируемых функций и т.д., поскольку все отмеченные свойства сохраняются при сложении (вычитании) и умножении функций. Каждому числу а 6 R отвечает постоянная функция ах : я »-» а, и отображе- отображение вложения а »-» ах позволяет рассматривать R как подкольцо в Rx. Словом, почти каждому естественному классу функций соответствует свое подкольцо в Rx. Пример 4. На любой аддитивной абелевой группе (A,-f) соотношением ху = 0 для всех х,у 6 А устанавливается структура кольца с нулевым умно- умножением. Многие свойства колец являются переформулировками соответст- соответствующих свойств групп и вообще множеств с одной ассоциативной операцией. Например, атап = am+n, (am)n = amn для всех неотри- неотрицательных целых m,n и всех а 6 К (ср. с соотношением B) § 1). Другие свойства, более специфические для колец и вытекающие пря- прямо из аксиом кольца, моделируют по существу свойства Z. Отметим некоторые из них. Во-первых, для всех а 6 К a-0 = 0-a = 0. A) Действительно, а + 0 = а =Ф а(а + 0) = аа => а2 + а • 0 = а2 =Ф =>a2 + a-0 = a2+0 =*► а• 0 = 0 (аналогично, 0 • а = 0). Теперь, предположив на момент, что 0 = 1, мы получим а = аЛ = = о-0 = 0 для всех а € К, т.е. К состоит только из нуля. Стало быть, в нетривиальном кольце К всегда 0^1. Далее, (-а)-Ъ = а(-Ь) = -(аЬ), B) поскольку, например, из A) и аксиомы дистрибутивности следует 0 = а - 0 = а(Ъ - Ъ) = ab + a(-ft) =Ф а(-Ъ) = -(ab). C) Так как -(-а) = а, то из B) получаем равенства (—а)(—6) = аЬ (налример, (-1)(-1) = 1), -а = (-1) • а. Аксиома дистрибутивности имеет своим следствием общий закон дистрибутивности п т (oi + ... + an)(bi + ... + bm) = £ ]Га^'' D) i=i i=i в чём нетрудно убедиться рассуждением по индукции сначала (при т = 1) по п, а затем по т. Используя теперь A), B) и C), получим n(ab) = {па)Ь = а(пЬ) для всех п 6 Z и а, Ь € AT. Наконец, отметим биномиальную формулу (бином Ньютона) = Е(")а<Ь"-<) E) i=0
§ 3. Кольца и поля 155 справедливую для всех а>Ь € К, но только в коммутативном кольце К. При доказательстве E) нужно, опираясь на D), действовать так же, как и в § 7 гл. 1, где рассмотрен частный случай К = Z. 2. Сравнения. Кольцо классов вычетов. Пусть т — фик- фиксированное натуральное число, т > 1. Множество mZ, очевидно, замкнуто не только относительно операции сложения, но и относи- относительно операции умножения, и удовлетворяет всем трём аксиомам кольца. Теперь, используя подкольцо тЪ С Z, построим ненулевое коль- кольцо, состоящее из конечного числа элементов. С этой целью введём Определение. Два целых числа п,п1 называются сравнимыми по модулю т, если при делении на т они дают одинаковые остатки. При этом пишут п = п'(т) или п = n'(modm), а число т называют модулем сравнения. Получается разбиение Z на классы чисел, сравнимых между со- собой по модулю т и называемых классами вычетов по модулю т. Каждый класс вычетов имеет вид {r}m = г + тЪ = {г + mk \ к € Z}, так что Z = {0}m U {1}т U ... U {т - 1}т. F) По определению п = п'(т) <Ф=> п — п1 делится на т. Удобство записи п = п'(т) для отношения делимости m|(n —п') состоит в том, что с такими сравнениями можно оперировать совершенно так же, как с обычными равенствами. А именно, если к = fcA(m) и I = Z'(m), то к±1 = к1 ± V(m) и Ы = к'1'(т). В частности, А; = fc'(m) =Ф fcs = = fc's(m) для любого s € Z. Таким образом, каждым двум классам {fc}m и {1}т независимо от выбора в них представителей к, I можно сопоставить классы, являю- являющиеся их суммой или произведением, т.е. на множестве Zm = Z/mZ классов вычетов по модулю т однозначным образом индуцируются операции 0 и 0: \л/т 0 и/т = iA ■" *)т> /7^ Так как определения этих операций сводятся к соответствующим операциям над числами из классов вычетов, т.е. над элементами из Z, то {Zm,0,©} будет также коммутативным кольцом с единицей {1}т = 1 + mZ. Оно называется кольцом классов вычетов по моду- модулю т. При небольшом навыке (и фиксированном модуле) индекс т опускают и пишут к вместо {к}т, так что
156 Гл. 4- Группы. Кольца. Поля Высший этап освоения с Zm, кажущийся на первый взгляд кощун- кощунственным, но представляющий явные технические преимущества, за- заключается в том, что отказываются от чёрточек и кружочков и опе- оперируют с каким-нибудь фиксированным множеством представителей по модулю т, чаще всего — с множеством {0,1,2,..., т — 1} (оно на- называется приведённой системой вычетов по модулю т). Скажем, в соответствии с этим соглашением —к = т — к, 2(т—1) = —2 = т—2. Итак, конечные кольца существуют. Приведём три простейших примера, указывая отдельно таблицы сложения и умножения: + 0 1 0 0 1 1 1 0 + 0 1 2 0 0 1 2 1 1 2 0 2 2 0 1 + 0 1 2 3 0 0 1 2 3 1 1 2 3 0 2 2 3 0 1 3 3 0 1 2 • 0 1 • 0 1 2 • 0 1 2 3 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 1 2 1 0 1 2 3 2 0 2 1 2 0 2 0 2 3 0 3 2 1 Кольцо вычетов Zm издавна привлекало внимание теоретикочис- ловиков, а в алгебре служило отправным пунктом для разного рода обобщений. 3. Гомоморфизмы колец. Отображение / : п«-> {п}т обладает в силу G) следующими свойствами: /(* +1) = /(*) е ДО, /(«) = /(*) © ДО- Это даёт нам основание говорить о гомоморфизме колец Z и Zm в соответствии с общим определением. Определение. Пусть (К, +,•) и (Х',0,0) —кольца. Отобра- Отображение / : К ->• К1 называется гомоморфизмом, если оно сохраняет все операции, т.е. если При этом, конечно, /@) = 0' и /(па) = п/(а), n € Z. Ядром гомоморфизма / называется множество Ясно, что Кег / — подкольцо в К.
§ 3. Кольца и поля 157 Как и в случае групп (см. словарик в п. 5 § 2), гомоморфизм /: К ->К* называется: мономорфизмом, если Кег/ = 0; эпиморфизмом, если образ совпадает с К', т.е. 1ш/ = /(*) = {а' €К'\а' = /(а)} = К'; изоморфизмом, если отображение / мономорфно и эпиморфно. Факт изоморфизма колец кратко записывают в виде К ^ К*. Рассмотренное выше отображение /: п н> {п}т является, оче- очевидно, эпиморфизмом Z -> Zm с ядром Кег / = mZ. Если рассматривать только кольца с единицей, то в определение гомоморфизма /: К ->• К' целесообразно внести условие /A) = г. При эпиморфизме это условие, конечно, автоматически выполняется. Изоморфные кольца тождественны по своим алгебраическим свойствам, и подлинно математический интерес представляют толь- только те свойства колец, которые сохраняются при изоморфных отобра- отображениях. Именно это обстоятельство имелось в виду, когда кольцо Zm мыслилось то как множество классов вычетов по модулю т, то как множество произвольным образом выбранных представителей этих классов. 4. Типы колец. Поле. В хорошо известных нам числовых коль- кольцах Z, Q и R из аЬ = 0 следует, что либо а = 0, либо Ь = 0. Но кольцо квадратных матриц Мп над любым из указанных колец этим свойством уже не обладает. Используя матрицы Ец (см. до- доказательство теоремы 4 из § 3 гл. 2), мы приходим к равенствам EijEki = 0 при j ф к, хотя, конечно, Eij ф 0 и Ем Ф 0. Заметим, что EikEkj = Е^ ф 0. Можно было бы приписать столь необычный для элементарной арифметики феномен некоммутативности кольца Мп, но это не так. Как мы видели в п. 2, в коммутативном кольце Z4 выполнено равенство 2 0 2 = 0, вопреки общеизвестной истине "дважды два — четыре". Вот — ещё два примера. Пример 5. Числовые пары (а,6) (где q,6€ Z, Q, R) со сложением и умно- умножением, определёнными формулами (ai,6i) + @2,62) = (ai +a2,bi образуют, очевидно, коммутативное кольцо с единицей A,1), в котором мы снова встречаемся с тем же явлением: A,0) • @,1) = @,0) = 0. Пример 6. В кольце RR вещественных функций (см. пример 3 в п. 1) функ- функции / : х *-+ \х\ + х и д : х ь* |х| — х таковы, что f(x) = 0 для х^Ои д(х) = 0 для х ^ 0, а поэтому их поточечным произведением fg будет нулевая функция, хотя / ф 0 и д ф 0.
158 Гл. 4- Группы. Кольца. Поля Определение. Если ab = О при а^Оиб^Ов кольце К, то а называется левым, а 6 — правым делителем нуля (в коммутатив- коммутативном кольце К говорят просто о делителях нуля). Сам нуль в кольце К ф 0 — тривиальный делитель нуля. Если других делителей нуля нет (кроме 0), то К называется кольцом без делителей нуля. Ком- Коммутативное кольцо с единицей 1 ф 0 и без делителей нуля называют целостным кольцом (кольцом целостности или областью целост- целостности). Теорема 1. Нетривиальное коммутативное кольцо К с едини- единицей является целостным тогда и только тогда, когда в нём выпол- выполнен закон сокращения ab = ас, афО =Ф Ь = с для всех а, 6, с € К. В самом деле, если в К имеет место закон сокращения, то из аЬ = 0 = а • 0 следует, что либо а = 0, либо а ф 0, но b = 0. Обратно: если К — область целостности, то ab = ac, афО => а(Ь - с) = 0 =>=* b-c = Q=>b = c. D В кольце К с единицей естественно рассматривать множество обратимых элементов. Элемент а называется обратимым (или дели- делителем единицы), если существует элемент а, для которого аа = = 1 = а а. Точнее, следовало бы говорить об элементах, обрати- обратимых справа или слева (ab = 1 или Ьа = 1), но в коммутативных кольцах, а также в кольцах без делителей нуля эти понятия совпада- совпадают. Действительно, из ab = 1 следует aba = а, откуда а(Ьа — 1) = 0. Так как а ф 0, то Ьа - 1 = 0, т.е. Ьа = 1. Нам известно, например, что в кольце Мп обратимые элемен- элементы — это в точности матрицы с отличным от нуля определите- определителем. Обратимый элемент а не может быть делителем нуля: ab = 0 => a~l{ab) = 0 =► (a'la)b = 0=>1-Ь = 0=ФЬ = 0 (аналогично, Ьа = 0 => b = 0). Неудивительно поэтому, что имеет место Теорема 2. Все обратимые элементы кольца К с единицей составляют группу U(K) no умножению. В самом деле, так как множество U(K) содержит единицу, а € е U(K) => а € U(K) и ассоциативность по умножению в К вы- выполнена, то нам нужно только убедиться в замкнутости множества U(К), т.е. проверить, что произведение ab любых двух элементов а и Ь из U(К) будет снова принадлежать U(K). Но это очевидно, поскольку (ab)'1 = b^a'1 (ab • b~la~l = a(bb~l)a~l = a -1 • a = aa'1 = 1), и, значит, ab обратим. □
§ 3. Кольца и поля 159 Нетрудно видеть, что U(Z) = {±1} — циклическая группа по- порядка 2. Мы получим весьма интересный класс колец — так называемые кольца с делением, или тела, заменив в определении кольца аксиому К2) на существенно более сильное условие К2') относительно операции умножения множество К = К \ {0} является группой. Кольцо с делением, стало быть, всегда без делителей нуля, и каж- каждый ненулевой элемент в нём обратим. Операции сложения и умноже- умножения становятся почти полностью симметричными в коммутативном кольце с делением, которое называется полем. Итак, дадим ещё раз Определение. Поле Р — это коммутативное кольцо с еди- единицей 1 ф 0, в котором каждый элемент а ф 0 обратим. Группа Р* = U(P) называется мультипликативной группой поля. Поле представляет собой гибрид двух абелевых групп — адди- аддитивной и мультипликативной, связанных законом дистрибутивности (теперь уже одним ввиду коммутативности). Произведение аЬ~г записывается обычно в виде дроби (или от- отношения, частного) тг, которую для экономии места на бумаге запи- записывают ещё с помощью косой черты: а/b. Следовательно, дробь а/Ь, имеющая смысл только при b фО, является единственным решением уравнения Ьх = а. Действия с дробями подчиняются нескольким правилам: а с а с __ad + bc , -^ = А, Ь^о, (8) о с _ ас b"d~bd' Ы а' а,ЬфО. Это — обычные, "школьные" правила, но их надо не запоминать, а выводить из аксиом поля, что, впрочем, не представляет никаких трудностей. Вот рассуждения, достаточные для получения второго из правил (8). Пусть х = а/b и у = c/d — решения уравнений bx = a и dy = с. Из этих уравнений следует dbx = da, bdy = be => bd(x + y) = da + bc ==>• t = x + у = —~— ba — единственное решение уравнения bdt = da + be.
160 Гл. 4- Группы. Кольца. Поля Подполем F поля Р называется подкольцо в Р, само являю- являющееся полем. Например, поле рациональных чисел Q — подполе поля вещественных чисел R. В случае F С Р говорят также, что поле Р является расшире- расширением своего подполя F. Из определения подполя следует, что нуль и единица поля Р будут содержаться также в F и служить для F нулём и единицей. Если взять в Р пересечение Fi всех подполей, со- содержащих F и некоторый элемент а € Р, не принадлежащий F, то F\ будет минимальным полем, содержащим множество {F,a} (рас- (рассуждение такое же, как для групп в упр. 1 из § 2). Говорят, что расширение F\ поля F получено присоединением к F элемента а, и отражают этот факт записью F\ = F(a). Аналогично можно говорить о подполе F\ = .F(ai,. ..,an) поля Р, полученном присоединением к F п элементов а\,..., ап поля Р. Небольшая проверка показывает, что Q(\/2) совпадает с множеством чисел a + Ьу/2> где а, Ь 6 Q, поскольку (\/2J = 2 и = _V2 а + bV2 а2 - 262 а2 - 262 при а -Ь Ьу/2 ф 0. То же самое относится к Q(\/3), Q(\/5) и т.д. Поля Р и Р1 называются изоморфными, если они изоморфны как кольца. По определению /@) = 0' и /A) = 1' для любого изоморф- изоморфного отображения /. Не имеет смысла говорить о гомоморфизмах полей, так как Кег/ ф 0 =» f(a) = 0, а ф 0 =» =► /A) = /(aa-1) = f(a)f(a^) = 0 • /(сТ1) = 0 =► =► Vb /(Ь) = /A • Ъ) = /A)/(Ь) = 0 • f(b) = 0 =>Кег/ = Р. Напротив, автоморфизмы, т.е. изоморфные отображения поля Р на себя, связаны с самыми глубокими свойствами полей и являются мощным инструментом для изучения этих свойств в рамках так на- называемой теории Галуа. Понятие расширения полей вполне созвучно известному стремле- стремлению человечества увеличивать запас используемых чисел. Довольно медленный процесс, который условно изображается диаграммой {один} ~> {один да один есть два} •** N ~> {N, 0} ~» ~> Z ~» Q - и который продолжался вплоть до наших дней, привёл к чрезвычайно разветвлённой сети полей, весьма далеких от привычных числовых. Не все этапы этого процесса были чисто алгебраическими. Скажем, переход от рациональных чисел к вещественным (или действитель- действительным), основывающийся на понятии непрерывности и полноты (су-
§ 3, Кольца и поля 161 ществование пределов у последовательностей Коши), и поныне раз- разбирается в курсах математического анализа. В то же время совер- совершенно аналогичная конструкция полей р-адических чисел, которой мы здесь не касаемся, и выросший на её основе современный р-ади- ческий анализ — достойные детища трёх областей — теории чисел, алгебры и анализа. 5. Характеристика поля. В п. 2 было построено конечное кольцо классов вычетов Zm с элементами О, 1, 2, ..., W=l и операциями fc + / = fc + /, к I = kl сложения и умножения (мы отказываемся от значков 0 и 0). Если т = st, з > 1, t > 1, то s • i = m = 0, т.е. з и i — делители нуля в Zm. Пусть теперь т = р — простое число. Утверждается, что Ър — поле (из р элементов). Для р = 2,3 это непосредственно видно из таблиц умножения, выписанных в п. 2. В общем случае достаточно установить существование для каждого з € ZJ обратного элемента s1 (целые числа з и з* не должны, очевидно, делиться на р). Рассмотрим элементы 8,2s, ..., (p-l)a. (9) Они все отличны от нуля, так как з ф 0 (modp) =Ф кз ^ 0 (modp) при к = 1,2,... ,р — 1. (Здесь используется простота р.) По той же причине элементы (9) все различны: из кз = Is, к < /, следовало бы (к — 1)з = 0, что неверно. Итак, последовательность элементов (9) совпадает с последовательностью переставленных каким-то образом элементов 1, 2, ...,р=1. В частности^айдется з'Д ^ з* ^ р— 1, для которого з'з = 1. Но это значит, что з'з = 1, т.е. s; — обратный к з элемент. Нами доказана Теорема 3. Кольцо классов вычетов Zm является полем тогда и только тогда, когда т = р — простое число. Следствие (малая теорема Ферма). Для любого целого числа ш, не делящегося на простое число р, имеет место сравнение тр-1 = l(modp). Доказательство. Как мы видели, {m,2m, ...,(р- (заменить в (9) s на т и принять во внимание равенства km = = km,k = 1,...,р— 1). Поэтому, перемножая по отдельности все
162 Гл. 4- Группы. Кольца. Полл элементы в левой и правой части, получим Поскольку Zp — кольцо без делителей нуля, по теореме 1 множитель Ш=1 * Ф 0 можно сократить: т* = 1. На языке сравнений имеем то, что нужно. □ Справедлива более общая теорема Эйлера, но необходимость в ней возникнет лишь в [В А III]. Поля Z2, Z3, Z5,..., столь не похожие на известные нам поля Q, Q(\/2), R, заняли в алгебраической иерархии полей место, вполне сопоставимое по своему значению с местом, давно отведённым для Q. Дело здесь вот в чём. Пусть Р — поле. Как мы уже отмечали, пе- пересечение Г\+Р{ любого семейства подполей {Pi\i € /} будет под- полем в Р. Определение. Поле, не обладающее никаким собственным под- полем, называется простым. Теорема 4. В каждом поле Р содержится одно и только одно простое поле Ро. Это простое поле изоморфно либо Q, либо Zp для некоторого простого р. Доказательство. Допустив существование двух различных простых подполей Р',Р" С Р, мы неизбежно придём к выводу, что их пересечение Р' П Р" (очевидно, непустое, поскольку 0 и 1 содер- содержатся как в Р', так и в Р") будет полем, отличным от Р' и Р". Это, однако, невозможно ввиду их простоты. Стало быть, простое подполе Ро С Р единственно. В Ро наряду с единичным элементом 1 содержатся все его крат- кратные п-1 = 1 + ... + 1. Из общих свойств операций сложения и умно- умножения элементов в кольцах (см. конец п. 1) следует, что з • 1 +1 • 1 = (s -hi) • 1, (s • l)(t • 1) = (at) • 1; s, t e Z. Поэтому отображение / кольца Z в Р, определённое правилом f(n) = = n • 1, является гомоморфизмом, ядро которого имеет вид Кег/ = = mZ. Бели m = 0, то / — мономорфизм, и дроби (з • l)/(t • 1), имею- имеющие смысл в Р (поскольку Р — поле), образуют поле Ро, изоморф- изоморфное Q. Оно и будет простым подполем в Р. Если же m > 0, то, очевидно, отображение /*, определённое по правилу будет изоморфным вложением Zm -» Р. По теореме 3 это возможно только тогда, когда m = р — простое число. Стало быть, /*(ZP) — простое подполе в P. D Определение. Говорят, что поле Р имеет характеристику нуль, если его простое подполе Ро изоморфно Q; Р — поле простой
§ 3. Кольца и поля 163 (или конечной) характеристики р, если Ро — Zp. Соответственно пишут charP = 0 или chafP = р > 0. Вместо Zp обозначением "абстрактного" поля из р элементов слу- служит обычно ¥р или GF(p) (Galois Field — поле Галуа). Следует иметь в виду, что существует конечное поле GF(g) с q = pn элементами, где р — простое, an — любое целое положительное число. К этому инте- интересному вопросу мы вернёмся в [ВА III], а сейчас ограничимся лишь примером поля из четырёх элементов {0,1,а,/3}: GFD) : Чем являются а и /3, нас пока не интересует. Рекомендуется прове- проверить выполнение закона дистрибутивности. Иногда нулевую характеристику называют бесконечной в соот- соответствии с её интерпретацией как порядка элемента 1 в аддитивной группе поля Р. Аналогично, конечная характеристика р — общий порядок любого ненулевого элемента в аддитивной группе: + 0 1 а 0 0 0 1 а 0 1 1 0 0 а а а /9 0 1 0 0 а 1 0 • 0 1 а 0 0 0 0 0 0 1 0 1 а 0 а 0 а 0 1 0 0 0 1 а 6. Замечание о линейных системах. Настала пора окинуть мысленным взором изложенную в предыдущих главах теорию систем линейных уравнений и выросшую из неё теорию определителей. Ко- Коэффициентами в линейных уравнениях и элементами матриц у нас были числа (рациональные или вещественные), но специфика этих чисел никак не использовалась. Нет никаких препятствий к тому, чтобы взять теперь вместо чисел элементы фиксированного поля Р. При этом и результаты должны формулироваться в терминах поля Р: компоненты решения линейной системы и значения функции det будут лежать в Р. Метод Гаусса решений систем линейных уравне- уравнений, теория определителей, правило Крамера остаются справедливы- справедливыми (без существенных изменений) для произвольного поля Р. Пример 7. Пусть нам дана однородная система линейных уравнений АХ = = 0 с квадратной матрицей 1 -10 12 12 2 13 -9 13 3 14 14 -8 4 15 15 15 и столбцом неизвестных X = [х1,хз,хз,Х4]. Прямые вычисления показывают, что det Л = 23 • II3. Следовательно, при <Ц;,х* € Р, где Р — любое поле ха- характеристики нуль или характеристики р ф 2,11 (в этом случае целые числа 1,2,3,4, —10,..., 15 заменяются на соответствующие классы вычетов), система является определённой и имеет только тривиальное решение X = 0.
164 Гл. 4- Группы. Кольца. Полл Если charP = 2 (скажем, Р = Z2), то из сравнения 12 3 4 -10 13 14 15 12 -9 14 15 12 13 -8 15 10 10 0 10 1 0 10 1 0 10 1 (mod 2) мы заключаем, что ранг системы равен 2 и система допускает два независимых решения Х\ = [1,0,1,0], Хг = [0,1,0,1]. Во избежание недоразумений следова- следовало бы писать Х\ = [1,0,1,0], Хг = [0,1,0,1], но мы считаем себя достаточно подготовленными к восприятию упрощённой записи. Бели charP = 11, то из сравнения 12 3 4 -10 13 14 15 12 -9 14 15 12 13 -8 15 12 3 4 12 3 4 12 3 4 12 3 4 (mod 11) вытекает, что система имеет три независимых решения Xi= [9,1,0,0], Х2 = [8,0,1,0], Х3 = [7,0,0,1]. Как мы видим, ответ о числе решений существенно зависит от рассматриваемого поля Р, но анализ системы ничем не отличается от обычного. Стало быть, одно из преимуществ перехода от Ни Q к произвольному полю заключается в устранении дублирования сходных рассуждений. Но имеются к тому и более веские причины. Говоря о полной линейной группе, мы до сих пор считали её груп- группой всех невырожденных матриц с коэффициентами из Q или R. Со- Совокупность квадратных матриц порядка п с коэффициентами в про- произвольном поле Р составляет кольцо матриц Мп(Р), а подмножест- подмножество всех невырожденных матриц А € Мп(Р) (матриц с detA ф 0) приводит к понятию полной линейной группы GLn(P) над полем Р. Варьируя поле Р, например, полагая Р = Fp, можно естественным путем получить ряд важных групп (см. [ВА III]). Поля типа R, Q, Q(\/2) и прочие называются обычно числовыми полями. Поле Fp — пример нечислового поля: было бы неправильным называть его элементы числами лишь на том основании, что они часто отождествляются с элементами множества {0,1,... ,р — 1}. В § 2 гл. 1 ставилась задача (под номером 3) по использованию ко- конечных полей в теории кодирования. Мы приведём сейчас маленький пример на эту тему. Пример 8. Для передачи лозунга МИРУ МИР в принципе достаточно повторения четырёх элементарных сообщений М = @,0), И = A,0), Р = @,1), У = A,1), интерпретируемых как векторы-строки двумерного линейного пространства Щ над полем Рг — Z2 = {0,1} из двух элементов. Но во время передачи в канале связи возникают помехи (замены символа 0 на 1 или 1 на 0), в результате ко- которых на приёмный конец канала может прийти, например, сообщение РИМУ РИМ. Согласно фундаментальной теореме Шеннона за счёт увеличения длины
§ 3. Кольца и поля 165 элементарных сообщений (т.е. за счёт скорости передачи) влияние помех устра- устранимо. Пусть, скажем, из условий передачи известно, что в каждом элементарном сообщении длины 5 происходит не более одного искажения. Возьмём тогда в линейном пространстве S = F| подмножество So = {М = @,0,1,1,0), И = A,0,0,1,1), Р = @,1,1,0,1), У = A,1,0,0,0)} так называемых кодовых векторов. Из таблицы Кодовые векторы Векторы, получаемые из кодовых векторов в ре- результате искажения 00110 00010 00100 00111 01110 10110 10011 00011 10001 10010 10111 11011 01101 00101 01001 01100 01111 11101 11000 01000 10000 11100 11001 11010 видно, что множества искажённых векторов из разных столбцов не пересека- пересекаются, и, стало быть, возможно правильное декодирование, т.е. восстановление истинного сообщения. Мы получили код So, исправляющий одну ошибку. Переходя к пространствам FJ достаточно большой размерности п, можно сконструировать аналогичный код, способный безошибочно передать весь русский алфавит, т.е. любой текст. Чтобы декодирование не свелось к длительному и очень медленному перебору, So приходится выбирать специальным образом. Для этого существует множество приёмов, в том числе и чисто алгебраических, основанных на использовании ко- конечных полей Fq. УПРАЖНЕНИЯ 1. Развивая идею примера 2 из § 1, показать, что множество V(Q) с опера- операциями Л + £ = (ЛиВ)\(АП£), АВ = АПВ, Л, В € ft, является кольцом с единицей, все элементы аддитивной группы которого имеют порядок 2. 2. Установить коммутативность произвольного кольца, в котором каждый элемент х удовлетворяет уравнению х2 = я. Верно ли это при условии я3 = я? 3. Изоморфны ли поля Q(n/2),Q(\/5)? 4. Показать, что эпиморфный образ коммутативного кольца является ком- коммутативным кольцом. 5. Показать, что любое конечное целостное кольцо К является полем. 6. Пусть р — простое число и К — коммутативное кольцо с единицей такое, что рх = 0 для всех х € К. Показать, что тогда Указание. Использовать индукцию по m и то обстоятельство, что бино- биномиальный коэффициент (i) > 0 < k < р, делится на р. 7. Доказать, что кольцо К, состоящее из пяти элементов, либо изоморфно Z5, либо является кольцом с нулевым умножением. 8. Элемент х ф 0 кольца К называется нилъпотентным, если хп = 0 для некоторого п 6 N. Показать, что: 1) нильпотентность элемента х влечёт обратимость элемента 1 — х в любом кольце с единицей;
166 Гл. 4- Группы. Кольца. Поля 2) кольцо Zm = Z/mZ содержит нильпотентные элементы в точности тогда, когда т делится на квадрат натурального числа > 1. 9. Доказать, что в кольце К с единицей и бесконечной мощности |АГ| не может быть конечного числа п ^ 1 необратимых элементов ф 0. Указание. Использовать рассуждение от противного. Пусть N = {ai,... ... ,an} — множество всех ф 0 необратимых элементов кольца К. Отображение рх : а» •-> ха» является биекцией N -> N для любого х G К \ (N U {0}). Ядро Кегр отображения р: х •-> рх бесконечно. 10. Пусть К — произвольное ассоциативное кольцо с единицей 1 и а, 6 — его элементы. Показать, что A - аЬ)с = 1 = сA - аЬ) => A - ba)d = 1 = d{\ - 6a), где d = 1 -f- bca, т.е. обратимость 1 — ab в А!" влечёт обратимость 1 — Ьа. Чему равен элемент 1 + adb? 11. Показать, что матрицы _? , где & € Z3, образуют поле из девяти элементов и что мультипликативная группа этого поля циклическая порядка 8. 12. Способен ли код So (из примера 2 в конце параграфа) исправить две ошибки?
Глава 5 КОМПЛЕКСНЫЕ ЧИСЛА И МНОГОЧЛЕНЫ В этой главе будут рассмотрены вполне конкретные алгебраи- алгебраические системы, частично известные из школьной математики, но заслуживающие того, чтобы остановиться на них несколько подроб- подробнее. Точка зрения, выработанная в предыдущей главе, позволит нам бросить свежий взгляд на традиционное "поле деятельности" ал- алгебры прошлых веков. В то же время на примере многочленов станут более понятными и осязаемыми такие проблемы, как расширение ко- колец и однозначность разложения на простые множители в целостных кольцах (областях целостности). § 1. Поле комплексных чисел История математики отмечена длительной борьбой сторонников и противников "мнимых" чисел, источником которых служит ал- алгебраическое уравнение х2 + 1 = 0. A) Можно занять упрощенную позицию и ограничиться формальной за- записью решений уравнения A) в виде ±л/^1. Но такое немудрено было сделать и в более далёкие времена; оставалось лишь придать смысл указанной записи. Мы будем решать эту задачу на разных уровнях. Вначале приведём некоторые эвристические соображения. 1. Вспомогательная конструкция. Нам хочется расширить поле вещественных чисел R так, чтобы в новом поле уравнение A) обладало решением. Моделью такого расширения может служить множество Р всех квадратных матриц B) Утверждается, что Р — поле (ср. с упр. 11 из § 3 гл. 4). В самом деле, в Р содержатся нуль 0 и единица Е кольца Далее, из соотношений -Ь а Ь _Ь а ас -bd ad + be —(ad-f 6c) ас — bd
168 Гл. 5. Комплексные числа и многочлены вытекает замкнутость Р относительно операций сложения и умно- умножения. Ассоциативность этих операций является следствием их ас- ассоциативности в М2(М). То же самое относится к законам дистри- дистрибутивности и коммутативности сложения. Таким образом, Р — подкольцо в M2(R). Коммутативность умножения в Р вытекает из третьей формулы C), и остаётся доказать лишь существование в Р матрицы, обратной к любой матрице B) с определителем а2 + Ь2 ф 0. Прямо по формуле для коэффициентов обратной матрицы (см. тео- теорему 1 из § 3 гл. 3) или путём решения линейной системы ах - by = 1, Ьх + ау = 0, возникающей из условия находим, что где а Ь -Ъ а - i с -d 1 0 d с 0 1 D) с = -Ь Используя правило E) из § 3 гл. 2 умножения матриц на числа, мы любой элемент поля Р запишем в виде а -Ь bJ, E) Поле Р содержит подполе {аЕ \ а € R} ^ R, а соотношение J2 + Е = 0 показывает, что элемент J € Р "с точностью до изоморфизма" явля- является решением уравнения A). Ни о какой мистике вокруг "мнимой величины J" здесь не может быть и речи. Не поле Р, однако, называется полем комплексных чисел, а некий изоморфный ему объект, элементы которого изображаются точка- точками плоскости. Желание иметь геометрическую реализацию поля Р не случайно, если вспомнить, что и поле R для нас не отделимо от "ве- "вещественной прямой" с фиксированной на ней точкой, изображающей 0, и фиксированным масштабом, определяемым положением числа 1. 2. Плоскость комплексных чисел» Итак, мы хотим постро- построить поле С, элементы которого были бы точками плоскости R2, а сложение и умножение точек, подчиняясь всем правилам операций в поле, решали бы нашу задачу. Выберем на декартовой плоскости
§ 1. Поле комплексных чисел 169 прямоугольную систему координат с осью абсцисс х и осью ординат у. Будем писать (а, Ь) для точки с абсциссой а и ординатой Ь. Для точек (а, Ь) и (с, d) определим сумму и произведение по правилам (a,b) + (c,d) = (a + c,b + d), (a, Ь) (с, d) = {ас -bd,ad + be) ( } (использование тех же знаков +,*, что и в поле R, не должно при- приводить к путанице). Прямая, но довольно утомительная проверка убедила бы нас в том, что так определённые операции наделяют мно- множество пар (точек плоскости) строением поля с нужными свойства- свойствами. В этой проверке, к счастью, нет необходимости. Сопоставление (-■4U.' точкам плоскости С элементов построенного ранее поля Р и беглый взгляд на формулы C) и F) убеждают нас в том, что мы имеем дело с изоморфизмом и что, следовательно, множество С является полем. Оно и называется обычно полем комплексных чисел. Имея в виду гео- геометрическую реализацию этого поля, С называют ещё плоскостью комплексных чисел (а чаще, хотя и несколько двусмысленно, — комп- комплексной плоскостью). Выбранная нами ось абсцисс, т.е. множество точек (а,0), ничем не отличается по своим свойствам от вещественной прямой, и мы полагаем (а,0) = а. Нуль @,0) и единица A,0) поля становятся при этом обычными вещественными числами. Для точки @,1) на оси ординат вводится, со времён Эйлера и Гаусса, обозначение г "мни- "мнимой единицы", являющейся корнем уравнения A): г2 =• @,1)@,1) = = (—1,0) = —1. Произвольное комплексное число z = {х,у) = (х,0) + + @,1)(у,0) запишется теперь в традиционном виде z = x + iy, x,y€R, G) весьма близком к виду E) элементов поля Р. Заметим, что Q С R С С С. Поэтому С — поле нулевой характеристики (см. п. 5 § 3 гл. 4). 3. Геометрическое истолкование действий с комплекс- комплексными числами. Ось абсцисс плоскости С обычно называется вещественной (или действительной) осью, ось ординат — мнимой осью, а числа гу, лежащие на ней, — чисто мнимыми числа- числами, хотя слово "мнимое" и утратило свой первоначальный смысл. Соответственно в записи G) х = Re z — вещественная часть, а у = Im z — мнимая часть комплексного числа г.Рассмотрим отображение, которое сопоставляет каждому комплексному числу z = х + гу комплексно
170 Гл. 5. Комплексные числа и многочлены сопряжённое с ним число z = х — iy (операция комплексного сопря- сопряжения). Геометрически оно сводится к отражению плоскости С от- относительно вещественной оси (рис. 18). Весьма примечательно, что справедлива Теорема 1. Отображение z н> z является автоморфизмом порядка 2 поля С, оставляющим на месте все вещественные чис- числа. Сумма и произведение комплексно сопряжённых чисел являются вещественными числами. Доказательство. Утверждение х = х, х € М, очевидно из определения комплексно сопряжённого числа. В частности, 0 = 0 и 1 = 1. Столь же очевидно утверждение о порядке: (z) = z. Нам остаётся проверить соотношения 4*2 =ZX +Z2, *i22= 2i Z2, (8) но они прямо следуют из формул F), которые нужно только перепи- переписать в виде (х\ 4 гуг) 4 (х2 4- гу2) = (a?i 4- х2) 4 i(»i 4 у2), (х\ 4 *i/i) • (х2 4 iy2) = (xix2 - 2/12/2) 4 tfrilfe 4 x2yi). Частным случаем формул (9) является утверждение о сумме и произведении числа z = х 4 iy и комплексно сопряжённого с ним числа г: г 4 ~z = 2х, г! = х2 4 J/2. □ Замечание. Автоморфизм z н> z выделяется среди многих других автоморфизмов поля С тем, что он — единственный непре- непрерывный автоморфизм (переводящий близкие точки плоскости С в близкие). Мы не уточняем и не доказываем это утверждение. Модулем комплексного числа z = х4гу называется неотрицатель- неотрицательное вещественное число \z\ = y/zl? = \/х2 4 у2. Положение точки z на плоскости, как известно, вполне определяется заданием её поляр- полярных координат: расстояния г = \z\ от начала координат до z и угла if между положительным направлением оси абсцисс и направлением из начала координат на z (см. рис. 18). Угол (р называется аргумен- аргументом числа z и обозначается arg z = (р. По определению arg z может принимать любые положительные и отрицательные значения, но при заданном г углы, отличающиеся на целое кратное 2тг, соответству- соответствуют одному и тому же числу. Аргумент не определён для числа 0 с модулем |0| = 0. Отношения "больше" или "меньше" бессмысленны в применении к комплексным числам, т.е. их нельзя соединять знаком неравен- неравенства: в отличие от вещественных чисел, аргумент которых прини- принимает лишь два главных значения — 0 (положительные числа) и тг (отрицательные числа), — комплексные числа не упорядочены.
§ 1. Поле комплексных чисел 171 Более точно, на С не существует отношения > со свойствами: i) если z € С, то z > О, z = 0 или —z > 0; ii) из и > 0, v > 0 следует, что u + v>Qhuv>0. Действительно, в противном случае из z ф 0 следовало бы (как и в М) z2 > 0. В частности, I2 > 0, г2 > 0 и согласно ii) 0 = г2 +1 > 0 — противоречие. Полярные координаты ги</? определяют х и у по известным фор- формулам A0) Это — так называемая тригонометрическая форма числа z. Операция сложения комплексных чисел z, z1 просто выражается z + z' в декартовых координатах, а %у именно по правилу параллело- параллелограмма, или, что равносильно, •' по правилу сложения направлен- у"' ных отрезков (векторов), вы- выходящих из начала координат и соответствующих числам z,z* (рис. 19). Из рис. 19, сравнивая стороны треугольника с верши- вершинами в точках 0,2 и z + z1 (и отождествляя модули комплекс- Рис. 19 ных чисел с соответствующими геометрическими длинами), полу- получаем важное неравенство |* + *'|^|*| + |*'|. A1) Заметим, что неравенство A1), которое можно было бы записать в более общей форме \z\-\z'\<\z±z'\<\z\ + \z'\, совершенно аналогично соответствующему неравенству для веще- вещественных чисел. Операция умножения комплексных чисел удобно выражается в полярных координатах. Теорема 2. Модуль произведения комплексных чисел z,zf равен произведению модулей, а аргумент — сумме аргументов множите- множителей: \zz'\ = \z\ • \z'\, axgzz* = axgz + argz'. A2) Аналогично, = M argl-
172 Гл. 5. Комплексные числа и многочлены Доказательство. Действительно, пусть тригонометрической формой A0) для zvlz1 будет z = r(cosip + isimp), z' = rf (cos ip' + г sin ip1). Непосредственным умножением или же по формуле (9) получаем zz1 = rr' [(cos ip cos ip1 — sin ip sin <^>') + г (cos ip sin <p' + sin ip cos <p')], а это соотношение при помощи известных формул приводит к три- тригонометрической форме числа zz1: zz' = \z\ • \z'\ • [cos(ip ■ Если, далее, z" = = zV. Поэтому, используя доказанные формулы A2) для произведения z'z", мы получим из них формулы для дроби г/г'. О В частности, z'1 = |z|[cos( Рис. 20 Чтобы получить z г на комплекс- комплексной плоскости (рис. 20), надо, сле- следовательно, применить к z инверсию относительно окружности единичного радиуса с центром в 0 (это даст точ- точку z'), а затем — отражение относительно вещественной оси (или автоморфизм z1 н> I'). Фактически утверждения о модуле произведения и модуле сум- суммы легко вытекают без обращения к геометрической интуиции из теоремы 1. В самом деле, во-первых, откуда \zz'\ = мы получаем |1 + z\2 = A + откуда |1 + z\ j — ZZ ZZ — ZZ ZZ — ZZZ Z — \Z\ \Z I , |-|г'|. Далее, заметив, что \z\ = л/х2 Ч- у2 ^ Vx2 = |ж|, )A + г) = 1 + (г + г) + гг = = 1 + 2х + Н2 ^ 1 + 2|*| 4- И2 = A + \z\)\ 1 + \z\. Если теперь 2 ^ 0 и z' ф 0, то Из полученных результатов мы можем извлечь некий общий прин- принцип: обычная форма G) комплексных чисел приспособлена к выраже- выражению их аддитивных свойств, а тригонометрическая форма A0) — к
§ 1. Поле комплексных чисел 173 выражению мультипликативных свойств. Нарушение этого принци- принципа приводит к чрезвычайно сложным формулам, затуманивающим суть дела. 4. Возведение в степень и извлечение корня. Из формулы A2) для умножения комплексных чисел, заданных в тригонометри- тригонометрической форме, вытекает формула Муавра [г (cos (p + i sin (p)]n = rn(cosn<p + isinn<^), A3) справедливая для всех п Е Z (в иной записи \zn\ = |z|n, arg2n = = n • argz). Частный случай формулы A3) при г = 1, биномиальная формула A) из § 7 гл. 1 и соотношения дают возможность получить выражения для синусов и косинусов кратного угла: = £(-1)* ( n ) cos"* <р ■ sin2* <л sinny, = £(-1)* ( " j) cos^^ Справедливости ради стоит заметить, что частным случаем фор- формул A4) при п = 2 мы воспользовались ранее — в ходе доказатель- доказательства теоремы 2. Замечание. Пусть eQ = limn->oo (I + a/n)n. В анализе, путём разложения функции комплексной переменной в степенные ряды, до- доказывается формула Эйлера ei<p = cos (p + г sin <p, A5) из которой вытекают все полученные нами результаты. Стоит толь- только заметить, что Тригонометрическая форма комплексного числа z сводится к записи Далее, мы хотели бы научиться извлекать корни произвольной степени из комплексных чисел, и основной вопрос, который здесь возникает: всегда ли это можно делать? Оказывается, что всегда, и формула Муавра даёт по существу полное решение этого вопроса. Пусть нам дано комплексное число z = r (cos ip + sin^), а мы хотим найти число z1 = /(cos^' + isiny/) такое, что (z')n = z. Выражая (z')n по формуле Муавра, а затем сравнивая в обеих частях равенства (z')n = z модули и аргументы, мы находим (г')п = г и тир' = (р + 2ттк
174 Гл. 5. Комплексные числа и многочлены (слагаемое 2ттк Итак, плата за неполную определённость аргумента). г — п (под у/г подразумевается арифметическое значение корня п-й степе- степени из положительного вещественного числа). Корень y/z, стало быть, существует, но определён неоднозначно. При А; = 0,1,..., п — 1 для z' будет получено п различных значений, причём ими исчерпываются все корни, поскольку из А; = ng + г, О^г^п — 1, следует 2тгг Ч> = п Нами доказана Теорема 3. Извлечение корня п-й степени из комплексного числа z = |2|(cos<p-Hsin<p) всегда возможно. Все п значений корня п-й степени из z расположены в вершинах правильного п-угольника, вписанного в окружность с центром в нуле и радиуса y/\z\ : cos п h г sin п ) A6) Следствие. Корни п-й степени из 1 выражаются формулой у/\ = ek = cos h t sin , A7) 71 71 A; = 0,1,..., n — 1. Они расположены в вершинах правильного п-угольника, вписанного в окружность с центром в нуле и радиу- радиуса 1. Из A6) и A7) непосредственно видно, что вещественных корней y/z будет нуль, один или два, а корней е = cos72° + sin72° vl — один или два (на рис. 21 пока- показаны корни из 1 степени 5). Корень п-й степени из 1 называ- называется примитивным (или первообраз- х нъмс), если он не является корнем из 1 никакой меньшей степени. Таковы- Таковыми будут, например, 2тг . . 2тг е = S\ = cos Ы sin—, en-i- Рис. 21 П П Любой другой корень е* является степенью примитивного что опять-таки видно из формулы Муавра. Более того, £*£/ = £*+/, если А; +1 брать по модулю п. В частности, е^1 = еп-*, £о = 1. Уже
§ 1. Поле комплексных чисел 175 искушённые в теории групп, мы замечаем, таким образом, что корни п-й степени из 1 составляют циклическую группу (е) порядка п. Тем самым получена ещё одна реализация циклической группы порядка п. Для каждого d\n в (е) имеется ровно одна подгруппа (en/d) порядка d. Корень ет будет примитивным тогда и только тогда, когда (ет) «= (е), т.е. Card(em) = п, а зто возможно только при т, взаимно простым с п. Например, при п = 12 примитивны- примитивными корнями будут е,^5,^7,^11. В случае простого п = р все корни из единицы, отличные от 1, примитивные. С алгебраической точки зрения, без учёта геометрического изображения, все примитивные корни данной степени п равноправны. Возвращаясь к вопросу об извлечении корня степени п из произ- произвольного комплексного числа z ф О, заметим, что если z' — какой- нибудь фиксированный корень (скажем, z1 = y/\z\(cos£+ isin^)), то все другие корни имеют видz'e*, fc = 0, l,...,n — 1. ^то утверж- утверждение находится в соответствии с формулой A6). 5. Теорема единственности. Преимущество поля С перед Ж мы сможем оценить полностью лишь впоследствии, но уже один тот факт, что С содержит все корни из 1, оправдывает повышенный ин- интерес к комплексным числам. Заметим, что по построению С — дву- двумерное векторное пространство над Е (в смысле определения из п. 2 § 1 гл. 2) с базисными элементами 1,г: С = A,г)ц. Возникает естественный вопрос, насколько широко семейство по- полей, обладающих аналогичными свойствами. Оказывается, справед- справедлива следующая теорема единственности поля комплексных чисел. Теорема 4. Каждое ассоциативное коммутативное кольцо К с единицей 1 без делителей нуля, являющееся двумерным векторным пространством над Е, изоморфно полю С. Доказательство. Без ограничения общности отождествим 1 • Е с Е и считаем Е вложенным в К. Так как dimRif = 2, то су- существует е 6 К \ Е такой, что 1 и е составляют базис пространства К над Е. Очевидно, е2 = а • 1 + 2/3 • е с а, /3 6 Е. Для элемента / = е - /3 £ М имеем /2 = 7, где j = а-\- 02 е TSL. Очевидно, 7 < О, поскольку иначе у/у € Е, и мы имели бы / = ±^/7- Таким обра- образом, существует S € Е, для которого S2 = —7- Теперь j2 = -1 для j = J/, и легко проверяется (как при построении С), что ка- каждый ненулевой элемент из К обратим, т.е. К — поле. Отображение ip: С -> AT, определённое соответствием х + iy ь» х + jy, является искомым изоморфизмом полей. D Где в этом доказательстве мы использовали условие, что К — кольцо без делителей нуля? Во-первых, могло бы случиться так, что е2 = 0, и тогда а = /3 = О =Ф- 7 = 0. Далее, фактически утвержда- утверждается, что 7^0 =>' / = ±y/l- Это действительно так, поскольку
176 Гл. 5. Комплексные числа и многочлены В поле С, кроме Q и R, содержится много других подполей. Осо- Особенно интересны расширения поля Q, получающиеся присоединением какого-либо элемента из С, не содержащегося в Q. Пример 1 (квадратичное поле). Пусть d — отличное от нуля целое число, возможно, отрицательное, такое, что \fd £ Q. Поле Q{y/d) С С называется ве- вещественным квадратичным при d > О и мнимым квадратичным при d < 0. О поле О(\/2) упоминалось в § 3 гл. 4. Рассуждение, дословно повторяющее ход доказательства теоремы 4, если заменить там j на y/dy а соотношение j2 = -1 — на (VdJ = d, показывает, что В частности, /5 /5 = (oi + а2) (ai + 6i\/d)@2 + b2y/d) = (aio2 + 6M) + (^ 6)/rf Далее, при a + by/d ф 0 (т.е. при a и 6, одновременно не равных нулю). Пользуясь A8), легко проверить, что отображение / : a + Ьу/d i-+ a - 6\/d является автоморфизмом поля Q(v/d) (аналог комплексного сопряжения). Нормой числа a = a + by/d называется число tf(a) = о2 - db2 = о/(о). Очевидно, что N(a) = 0 •$=>- a = 0. Далее, так как / — автоморфизм, то N(aP) = apfW) = afif(a)f(P) = a/(o) • /?/(/?) = JV(o) • N@). В частности, iV(a) • N(a~l) = N(aa~l) = N(l) = 1. Поэтому норма обладает существенными свойствами (квадрата) модуля в поле С. 6. Элементарная геометрия комплексных чисел. Вещест- Вещественное векторное пространство С = A, г)ц является евклидовым: оно снабжено положительно определённым скалярным произведением (zi\z2) = Reziz2 = xxx2 + 2/i2/2, гдег* =xk+iyk, * = 1,2. Справедливо неравенство Коши—Бунлковского—Шварца поскольку K^il^)! = |ReziJ2| < \z^\ = |*i||z2| = \zi\\z2\. Два вектора (комплексных числа) z\,z2 называются ортогональ- ортогональными или перпендикулярными друг другу, если (z\\z2) = 0. Из соотношения A2) непосредственно вытекает, что два векто- вектора z,cz € С* ортогональны в точности тогда, когда с — чисто мнимое число.
§ 1. Поле комплексных чисел 177 Прямая, проходящая через точки и, v € С, задаётся параметри- параметрически to = и + (v — u)t, t E R. Поэтому ортогональность двух прямых w = u+(v—u)£, ги' = u'( — u')£ выражается соотношением (v — u|t/ — u') = 0. Ясно также, что три точки 21,22,2з € С, Z\ ф 22, лежат на одной прямой в точности тогда, когда ^—^ € М, A9) 22 ~ 2i Т.е. 2з22 ~ 2з^1 - 2122 € R. Вот маленькое рассуждение на тему ортогональности. Если рас- расположить произвольный треугольник так, чтобы его две вершины а,/3 оказались на вещественной оси, а третья вершина г^ — на мнимой, то легко проверяется, что три высоты треугольника пересекаются в об- общей точке i6, где S = —а/3/7- Например, <* 61 /Г (-а + г<*| - р + *7) = 0 (рис. 22). Рис. 22 Важную роль во многих геометрических вопросах играет поня- понятие двойного отношения [z\,Z2,23,24] четырёх точек2i, 22,23,24 G С с 2i ф 24, 22 Ф 2з (детали см. в [ВА II]). По определению 21-22 *3 -*2 ~ : — = 2l ~ 24 2з ~ 24 - 22) - «4) . . ^ ^ — комплексное число, зависящее от порядка в последовательности 2i, 22,2з,24. При циклической перестановке имеем [*2,23, ^4, Zi] = [2Ь 22, 23, 24]. Заметим, что в соответствии с B0) двойное отношение не меня- меняется при сдвигах Та : z *-> z + а. Представим себе, что три точки 2i, 22,2з не лежат на одной прямой. Это свойство тоже инвариантно относительно сдвигов. Поэтому центр окружности, в которую впи- вписан треугольник с заданными вершинами 21,22,23, можно считать (при вычислении [21,22,23,24]) расположенным в начале координат. Но тогда |2i| = |2г| = |2з|, и легко убедиться в том, что B1 - 22)B3 - 24)Bi - Z4)(Z3 ~ Z2) ~ - г(|23|2 - |24|2) • ImB322 - 2321 - 2122) € R (рекомендуем читателю проделать это в качестве упражнения). Со- Согласно A9) ДОЛЖНО ВЫПОЛНЯТЬСЯ уСЛОВИе ЬпBз22 — 2з21 — Z\Z2) ф 0,
178 Гл. 5. Комплексные числа и многочлены а в таком случае произведение (z\ - 22Н23 ~ ^4)(^i ~ 24X23 - ^) бу- будет вещественно, или, что эквивалентно (см. B0)), [21,22» 23,24] € R тогда и только тогда, когда |^з|2 — 1^412 = 0, т.е. \z$\ = 1*41- Значит, Zk, 1 ^ к ^ 4, — числа, равные по модулю и, стало быть, лежащие на одной окружности. То же рассуждение действует и тогда, когда на одной прямой не лежат какие-то другие три точки из четырёх. Достаточно заме- заметить, что вещественность [z\,Z2, 23,24] сохраняется при циклической перестановке. Мы доказали следующее утверждение. Теорема 5. Четыре точки 21,22,23,24 € С с z\ ф z±, 22 Ф z$, не лежащие на одной прямой, лежат на одной окружности в точ- точности тогда, когда их двойное отношение вещественно. Это лишь одна из многих конфигураций, свойства которых вы- выражаются на языке двойных отношений. В заключение мы построим геометрическими средствами новые числовые поля, занимающие видное место в истории математики. Пример (конструктивные числовые поля). На декартовой плоскости R2 считаем заданными точки @,0) и A,0). Все последующие конструкции осуще- осуществляются только при помощи циркуля и линейки. Построив точки Р и Q, мы, естественно, можем считать построенным и соединяющий их отрезок PQ. Бели построены точка Р и отрезок г, то строится также окружность радиуса г с цен- центром в точке Р. Попарные пересечения уже построенных прямых (отрезков) и окружностей конструктивны в том же смысле. Комплексное число а + гЬ называется конструктивным, если при помощи конечной последовательности указанных выше (допустимых) конструкций мы можем построить, отправляясь от @,0) и A,0), точ- точку Р = (а, Ь). Нетрудно видеть, что конструктивность а + %Ь эквива- эквивалентна конструктивности \а\ и |Ь|. Множество точек плоскости, ко- которые строятся при помощи циркуля и линейки, а следовательно, и множество всех конструктивных комплексных чисел обозначим CS. Теорема 6. Множество CS является подполем поля С. Доказательство. Непосредственно из определения конструк- конструктивности чисел следует замкнутость CS относительно операции сло- сложения (точка z + z1 строится как пересечение двух окружностей (ра- (радиуса \z\ с центром вг'и радиуса \z'\ с центром в z) и перехода от z = х + iy € CS к -z = -х - iy. а, 0 о 1 1 + а в 1 8 = а/0 а б Рис. 23 Откладывая на осях координат отрезки конструктивных длин
§ 1. Поле комплексных чисел 179 1,а,/3 и рассматривая подобные треугольники, изображённые на рис. 23, о, б (штрихами показаны новые конструктивные отрезки), мы убеждаемся в конструктивности произведения 7 = <*0 и частного S = а/р. Так как построение zz' = {х + %у){х' + гу') = (ет' - j/j/') + i{xy' + z'y), 1 = а? , у г " х2 + у2 \2+у2 сводится в конечном счёте к построению величин типа 7 и <$, то конструктивность произведения zz' и частного 1/г также установле- установлена. Вместе с тем доказана замкнутость множества CS относительно всех операций в поле С. □ Замечание. 1) CS инвариантно относительно автоморфизма сопряжения zhz. 2) На рис. 23,в показано, что извлечение квадратного корня у/а из конструктивного вещественного числа а > 0 конструктивно. На самом деле это высказывание относится к любому конструктивному числу z. Всякое подполе F С CS принято называть конструктивным чис- числовым полем. Понятно, что Q С CS и что любое конструктивное поле является полем нулевой характеристики. Согласно замечанию 2) всякое квадратичное поле (см. пример в п. 5) конструктивно. УПРАЖНЕНИЯ 1. Найти все комплексные числа 2, по модулю равные 1, при которых z2 + + A + i)z принимает чисто мнимые значения. Изобразить соответствующее гео- геометрическое место точек на плоскости С. 2. Что можно сказать о поле Щ6), которое получено из R присоединением комплексного числа 6, удовлетворяющего равенству бА = -1? 3. Пусть Л, В е Мп№)- Опираясь на теорему 1, доказать, что det(A + iB) = = det(A - iB) (черта означает сопряжение). 4. Пусть Д,В€ Мп(Щ, ЧЛ ? Применяя к вещественной матрице С элементарные преобразования первого и второго типа над полем комплексных чисел С, показать, что detC=|det(A 5 (Г. Полна и Г. Сегё). Используя упр. 3 и 4, дать объяснение следующему "странному" факту. Однородная квадратная линейная система =0, М n =0 с комплексными коэффициентами dki = а&/ + ibki и неизвестными Z{ = Х{ + iyi имеет нетривиальное решение Bi,...,2n) в точности тогда, когда det(dfcj) =
180 Гл. 5. Комплексные числа и многочлены = а + ib = 0 (см. общие замечания по этому поводу в п. 6 § 3 гл. 4). Это условие приводит к двум уравнениям а = 0, 6 = 0, связывающим 2п2 вещественных вели- величин аы, bkl. С другой стороны, систему (*) можно представить в виде системы 2п линейных однородных уравнений с 2п вещественными неизвестными х», у». Теперь условие нетривиальности решения запишется в виде равенства нулю од- одного вещественного определителя размера 2n x 2п, что даст лишь одно уравнение между аы, &ы • Как согласовать между собой эти два результата? в. Имея в виду, что автоморфизмы квадратичного поля Q(y/d) должны ос- оставлять на месте рациональные числа, найти автоморфизмы этого поля. Ответ. Единичное отображение и а + by/d »-> а - by/d. 7. Чему равна сумма всех корней степени п > 1 из 1? Что можно сказать о сумме примитивных корней степени 12 и степени 15 из 1? 8. Показать, что С = B + г)/B - г) не является корнем из 1, хотя |£| = 1. Указание. <п = 1 =» B - г)п = B + г)п = B - г + 2г)п = B - г)п + ... ... +Bi)n =» B-i)(a+bt) = Bi)n =» 5(a2+62) = 22n => 5|22n — противоречие. 9. Множество S1 = {e*vjy> 6 R} (окружность единичного радиуса) образу- образует относительно умножения в С подгруппу группы (С*,*). Всякое R-линейное отображение / : С -> С называется ортогональным, если (f(z)\f(z')) = (z\z'), т.е. если оно сохраняет длины векторов (расстояния между точками). Доказать, что отображение /: С -► С в точности тогда ортогонально, когда f(z) = cz или f(z) = cz, где с eSl. 10. Показать, что ХО Х\ Х2 Хп—1 Хп-1 Хо Xi ... Хп-2 Хп-2 Хп-1 XQ ... Хп-3 п-1 Jb=O 'I X2 Х$ Хо где С — примитивный корень степени п из 1. § 2. Кольцо многочленов Наряду с линейными системами, рассмотренными нами в гл. 2 и гл. 3, многочлены составляют старый и хорошо изученный раздел традиционной алгебры. На языке многочленов формулируются или решаются самые различные задачи математики. Тому есть множе- множество причин, и одна из них заключается в свойстве универсальности кольца многочленов, на чём мы коротко остановимся в п. 1. Пусть К — коммутативное (и, как обычно, ассоциативное) коль- кольцо с единицей 1, А — некоторое его подкольцо, содержащее 1. Если t Е К, то наименьшее подкольцо в К, содержащее Ant, будет, оче- очевидно, состоять из элементов вида a(t) = ао + a\t + d2t2 + ... + antn, (*) где а8 € A, n € Z, n ^ 0. Мы обозначим его A[t] и назовем кольцом, полученным из А присоединением элемента t, а выражение (*) — многочленом от t с коэффициентами в А. Что понимать под сум- суммой и произведением многочленов, видно из простейших примеров
§ 2. Кольцо многочленов 181 (скажем, при п = 2): a(t) + b{t) = (oo + М + a2t2) -f (b0 + M -f b2t2) = = (ao + bo) + (ai + bi)t + (a2 + k)*2, a(t) • b(t) = aobo + (aobi + axbo)t + + (aob2 + aibi + a2b0)*2 + (aib2 + a2bi)t3 + a2b2t4. Очевидно, что приведение подобных членов основано на попарной перестановочности всех элементов a^b^tk. Теперь настало время вспомнить, что t — наугад взятый эле- элемент кольца К, и поэтому внешне различные выражения (*) могут на самом деле совпадать. Бели, скажем, А = Q, t = у/2, то t2 = 2 и £3 = 2* — соотношения, которые никоим образом не вытекают из формальных правил. Чтобы прийти к привычному понятию мно- многочлена, необходимо освободиться от всех таких побочных соотно- соотношений, для чего под t следует понимать произвольный символ, не обязательно содержащийся в К. On призван играть чисто вспомо- вспомогательную роль. Гораздо большее значение имеют правила, по ко- которым составляются коэффициенты выражений a(t) + b(t), a(t)b(t). Имея в виду эти предварительные замечания, перейдём к точному определению алгебраического объекта, называемого многочленом, и собрания таких объектов — кольца многочленов. 1. Многочлены от одной переменной. Пусть А — произ- произвольное коммутативное кольцо с единицей. Построим новое кольцо В, элементами которого являются бесконечные упорядоченные по- последовательности / = (/о,Л,/2,...), fie А, A) такие, что все /», кроме конечного их числа, равны нулю. Определим на множестве В операции сложения и умножения, полагая / + 9 = (/о,/ь/2,...) + (9o,9i,92, •. •) = (/о + 0о, Л + 9иh + 92, •. •), где Ясно, что в результате сложения и умножения получаются снова последовательности вида A) с конечным числом отличных от нуля членов, т.е. элементы из В. Проверка всех аксиом кольца (см. § 3 гл. 4), кроме, разве, аксиомы ассоциативности, очевидна. В самом деле, поскольку сложение двух элементов из В сводится к сложению конечного числа элементов из кольца Л, (В,+) является коммута- коммутативной группой с нулевым элементом @,0,0,...) и элементом —/ =
182 Гл. 5. Комплексные числа и многочлены = (-/о, -Л, -/2, • • •), обратным к произвольному / = (/о, Л, /2,...). Далее, коммутативность умножения следует непосредственно из симметричности выражения элементов hk через /» и Qj. Это же выражение показывает, что в В выполнен закон дистрибутивности (/ + р)Л = /Л ■+■ <?Л. Что касается ассоциативности операции умноже- умножения, то пусть — три произвольных элемента множества В. Тогда /# = d = (do, di, d2,...), где d/ = Ei+j=//i0i» ' = 0,1,2,..., a (fg)h = d/i = e = = (eo,ebe2,...), гДе e, = Ен-*=*<йЛ* = £/+*=« (Ei+i=/ fi9j) hk = = Si+j+A:=s fi9jhk- Вычисление f(gh) даёт тот же результат. Итак, В — коммутативное ассоциативное кольцо с единицей A,0,0,...). Последовательности (а, 0,0,...) складываются и умножаются так же, как элементы кольца А. Это позволяет отождествить такие по- последовательности с соответствующими элементами из А, т.е. поло- положить а = (а, 0,0,...) для всех а € А. Тем самым А становится под- кольцом кольца В. Обозначим, далее, @,1,0,0,...) через X и назовем X перемен- переменной (или неизвестной) над А. Используя введённую на В операцию умножения, находим, что Х = @,1,0,0,...), Х2 = @,0,1,0,...), B) Х* = @,0,... ,0,1,0,...) Кроме того, ввиду B) и ввиду включения А С В имеем Итак, если /п — последний отличный от нуля член последователь- последовательности / = (/о, Д,..., /п, 0,0,...), то в новых обозначениях Такое представление элемента / однозначно, поскольку /0,..., /п в правой части C) — это члены последовательности (/о, • • •, /п, 0,...), которая равна нулю тогда и только тогда, когда /0 = ... = /п = 0. Определение. Введённое выше кольцо В обозначается через А[Х] и называется кольцом многочленов над А от одной переменной X, а его элементы — многочленами (или полиномами).
§ 2. Кольцо многочленов 183 Конечно, присвоение фиксированной букве X названия перемен- переменной или неизвестной не очень удачное терминологическое изобрете- изобретение, но оно привилось, поскольку не приводит к недоразумениям. Мы намеренно ввели заглавную букву X, чтобы отличить наш специально выделенный многочлен / = X от теоретико-функцио- теоретико-функциональной переменной я, пробегающей какое-то множество значений (чисто временное соглашение, придерживаться которого в будущем не обязательно). Более привычной является запись многочлена / в виде 1 т.е. по убывающим степеням X. В дальнейшем мы будем писать так, как это представится удобным. Элементы /» (и а») называются коэффициентами многочлена /. Многочлен / нулевой, когда все его коэффициенты равны нулю. Ко- Коэффициент /о при X в нулевой степени называется ещё постоянным членом. Если fn ф 0, то /п называют старшим коэффициентом, а п — степенью многочлена и пишут п = deg/. Нулевому многочлену приписывается степень —оо (—оо 4- (—оо) = —оо, —оо 4- п = —оо, —оо < п для каждого п € N). Многочлены степени 1,2,3,... называ- называются соответственно линейными, квадратичными (или квадратны- квадратными), кубичными и т.д. Роль единицы кольца А[Х] играет единичный элемент 1 кольца А, рассматриваемый как многочлен нулевой степени. Непосредственно из определения операций сложения и умножения в А[Х] следует, что для любых двух многочленов / = /о + fiX + ... + fnXn, g = go+9iX + ... + 9mXm D) степеней пит соответственно имеют место неравенства deg(/ + g) ^ max(deg /, deg g), deg(fg) ^ deg / + deg g. E) Второе из неравенств E) на самом деле заменяется равенством всякий раз, когда произведение fngm старших коэффициентов мно- многочленов D) отлично от нуля, поскольку fg = fogo + (fogi + hgo)x + ... + (fngm)Xn+m. F) Но это значит, что верна Теорема 1. Если А — целостное кольцо, то и кольцо А[Х] является целостным. Место кольца многочленов среди коммутативных колец отчасти поясняет следующая Теорема 2. Пусть коммутативное кольцо К содержит А в качестве подкольца. Для каждого элемента t e К существует
184 Гл. 5. Комплексные числа и многочлены единственный гомоморфизм колец П*: А[Х] -4 К такой, что = а, Ut(X) = t. G) Доказательство. Предположим сначала, что такой гомомор- гомоморфизм Щ существует. Так как Ut(fi) = /t для каждого коэффициен- коэффициента многочлена /, записанного в стандартном виде C), и Ut(Xk) = = (TLt(X))k = tk (свойство гомоморфизма и условие G)), то ... + fntn, (8) т.е. П*(/) определён однозначно и выражается формулой (8). Обрат- Обратно: задав отображение П* формулой (8), мы, очевидно, удовлетворим условию G) и получим гомоморфизм колец. Это ясно для отображе- отображения аддитивных групп колец, а что касается умножения, то приме- применение П* к произведению F), а затем использование (общего) закона дистрибутивности даёт = fo9o + (/oft + fi9o)X + ... + (/n0m)*n+m = Результат применения отображения П*, определённого формулой (8), к многочлену / = f(X) называется подстановкой t в / вместо X или (с некоторой натяжкой) просто значением / при X = £, так что П*(/) = /(£). Знать П*(/) — значит уметь вычислить значение / при X = t. Гомоморфизмы Пж, х € А, служат связующим звеном между функциональной и алгебраической точками зрения на мно- многочлен. По определению линейный многочлен X - с = (—с, 1,0,...) никогда не равен нулю, но ассоциированная с ним функция жиж-с принимает нулевое значение при х = с. Другой пример: отличный от нуля многочлен X2 4- X с коэффициентами из поля Рг (где 14-1 = 0) представляет нулевую функцию / : F2 -> F2, поскольку О2 + 0 = 0 и I2 + 1 = 0. Элемент t Е К называется алгебраическим над А, если П*(/) = 0 для некоторого / € А[Х]. Если же Ut : А[Х] -> if — изоморфное вложение (мономорфизм), то t — трансцендентный над А элемент. В случае А = Q и К = С говорят просто об алгебраичесяш; и транс- трансцендентных числах. Например, числа е и тт, определяемые в анализе, являются трансцендентными, а числа \/2, \/3, л/2 4- \/3 — алгебраи- алгебраическими. Гомоморфизм lit, собственно говоря, служит выражением уни- универсального свойства кольца многочленов А[Х]. Более полным обра- образом универсальность кольца многочленов видна из следующего ут- утверждения, обобщающего теорему 2.
§ 2. Кольцо многочленов 185 Теорема 3. Пусть А и К — произвольные коммутативные кольца, t — элемент из К и </?: А -> К — гомоморфизм. Тогда существует, и притом единственное, продолжение if до гомоморфизма ч>%\ А[Х] ->• К кольца многочленов А[Х] в К, перево- переводящего переменную X в t. Доказательство является незначительным видоизменением дока- доказательства теоремы 2 и оставляется читателю в качестве упражне- упражнения. D 2. Многочлены от многих переменных. Бели в ситуации А С К, рассматривавшейся в начале параграфа, взять произвольные п элементов t\,..., tn € К и рассмотреть в К пересечение всех под- колец, содержащих A,t\,..., tn, то мы получим кольцо A[t\,..., tn]. Формальная запись его элементов подсказывает, как и в случае п = = 1, необходимость введения в обиход кольца многочленов от п пе- переменных. Делается это очень просто. Вспомним, что конструкция кольца В = А[Х] включала произвольное коммутативное кольцо А с единицей. Мы можем теперь заменить в нашей конструкции кольцо Л на В и построить кольцо С = B[Y], где У — новая независи- независимая переменная, играющая по отношению к В ту же роль, что и X по отношению к А. Элементы из С однозначно записываются в ви- виде 32bjY*, bj e В, причём В отождествляется с подкольцом в С, а именно с множеством элементов bY° = Ь • 1. Так как в свою оче- очередь bj = 53 aijX% — однозначная запись элементов bj € В, то любой элемент из С имеет вид причём подразумевается (по смыслу конструкции), что а^ переста- перестановочны с X и У, а переменная X перестановочна с У. Кольцо С называется кольцом многочленов над А от двух независимых пере- переменных (от двух неизвестных) X и У. Повторив достаточное число раз эту конструкцию, мы получим кольцо А[Х\,..., Хп] многочленов (полиномов) над А от п независи- независимых переменных (или неизвестных) Х\,..., Хп. Набор (ii,.. о, in) € N* из п целых неотрицательных чисел i\,... ..., in (N = N U {0}) условимся сокращённо обозначать символом (г). Тогда любой элемент / € А[Х\,...,Хп] запишется в виде а@Х«, a{i)eA, (9) (О где X® = Х{*... Хпп — одночлен (или моном), так что / — линей- линейная комбинация одночленов с коэффициентами из А. В соответствии с определением многочленов все коэффициенты а^ в (9), за исключе-
186 Гл. 5. Комплексные числа и многочлены нием конечного их числа, равны нулю. Единственность записи (9) непосредственно вытекает из следующего утверждения. Многочлен f равен нулю тогда и только тогда, когда равны нулю все его коэффициенты Oii...in- При п = 1 это уже отмечалось в ходе построения кольца А[Х], а при п > 1 проще всего использовать индукцию по п. Именно, мы можем записать где — многочлены от меньшего числа переменных. Утверждение для п = = 1 и предположение индукции показывают, что / = O«=^Vzn bin =0<=>V(ib...,*n) а^...;п_^п =0. Теперь естественно считать два многочлена /, g € А[Х\,..., Хп] равными, если совпадают их коэффициенты при одинаковых одно- одночленах (согласно вышесказанному (i\,..., in) ф (j\,..., jn) =Ф> Под степенью многочлена f относительно Xk понимается наи- наибольшее целое число, обозначаемое cleg* /, которое встречается в ка- качестве показателя при Xk в а^ХW с а^ ф 0. Например, многочлен 1 4- X 4- XY3 ■+■ X2Y2 имеет степень 2 относительно X и степень 3 относительно Y. Целое число i\ 4-.. .-f in называется (полной) степенью одночлена Степенью deg / (или полной степенью) многочлена f будет мак- максимальная из полных степеней его одночленов. Полагаем degO = — оо. О старшем по степени члене многочлена / не имеет смысла говорить, поскольку таких членов (одночленов) может быть несколько. На кольцо А[Х\,..., Хп] переносятся многие результаты, полу- полученные нами в п. 1 для А[Х]. Например, опираясь на теорему 1 и используя индукцию по п, мы сразу же убеждаемся в том, что спра- справедлива Теорема 1/. Если А — целостное кольцо, то и кольцо А[Х\,... ..., Хп] является целостным. В частности, кольцо многочленов от п переменных над любым полем Р целостно. Полезным уточнением теоремы 1' служит Теорема 4. Пусть fug — произвольные многочлены от п переменных над целостным кольцом А. Тогда = deg/-f deg p.
§ 2. Кольцо многочленов 187 Доказательство. Назовём однородным многочленом или фор- формой степени т многочлен h(Xi,..., Хп), все члены которого имеют одну и ту же полную степень т. Формы степеней 1, 2, 3 называ- называются соответственно линейной, квадратичной и кубичной формами. Объединяя вместе все входящие в / (или, как ещё говорят, встре- встречающиеся, имеющие ненулевые коэффициенты) одночлены одной и той же степени, мы однозначно представим многочлен / = в виде суммы нескольких форм /т различных степеней Если теперь 9 = 0о + 01 + • • • + 9и I то, очевидно, h = /о0о + (/o0i + /i0o) + • • • + fk9i (это похоже на соотношение F), но fi,Qj имеют там другой смысл), откуда deg fg ^ k+l. По теореме 1' из Д ф 0, gi ф 0 следует Д# ф О, т.е. deg(fg) = deg(/*#) = fc + / = deg / + deg#. D 3. Алгоритм деления с остатком. В п. 3 § 9 гл. 1 для целых чисел был введён алгоритм деления с остатком. Оказывается, что совершенно аналогичный алгоритм имеет место и в кольце А[Х] над целостным кольцом А (для А = R это известно фактически из курса элементарной алгебры: вспомните деление уголком). Теорема 5. Пусть А — целостное кольцо ид — многочлен в А[Х] со старшим коэффициентом, обратимым в А. Тогда каждо- каждому многочлену f E А[Х] сопоставляется одна и только одна пара многочленов q,r E А[Х], для которых J = 49 +г, deg r < deg g. A0) Доказательство. Пусть где аобо Ф 0 и Ьо|1. Применим индукцию по п. Если п = 0 и т = deg# > deg/ = 0, то положим q = 0, г = /, а если п = m = 0, то г = 0 и q = aofyj. Допустим, что теорема доказана для всех мно- многочленов степени < п (п > 0). Без ограничения общности считаем т ^ п, поскольку в противном случае возьмём д = 0 и г = /. Раз это так, то _ 1 где deg/ < п. По индукции мы можем найти q и г, для которых / = qg + г, причём deg г < т. Положив
188 Гл. 5. Комплексные числа и многочлены мы придём к паре многочленов с нужными свойствами. Обращаясь к свойству единственности частного q и остатка г, предположим, что qg + г = / = ^Н- г'. Тогда (qf — q)g = r — r'. По теореме 1 имеем deg(r - г') = deg(g' — q) + + deg<7, что в наших условиях возможно только при г' = г и q1 = g (напомним, что degO = —оо и что —оо + m = —оо). Наконец, приведённые рассуждения показывают, что коэффици- коэффициенты частного q и остатка г принадлежат тому же целостному кольцу Л, т.е. f,g е А[Х] => q,r е А[Х]. О Замечание. Многочлены со старшим коэффициентом 1 часто называют нормализованными (ещё нормированными, унитарными). Указанный выше процесс деления многочлена / на <?, называемый евклидовым, несколько упрощается, если g — нормализованный мно- многочлен. Говорят, что / делится на д, если остаток г равен нулю (см. A0)): / = qg. УПРАЖНЕНИЯ 1. Многочлены f(X) = Х*+ЗХ4+Х3+4Х2-гХ-1, д(Х) = Х2+Х+1 можно считать принадлежащими кольцу Z[X] или, скажем, кольцу Z&[X] в зависимости от того, как интерпретировать их коэффициенты. Применяя алгоритм деления с остатком, йоказать, что в первом случае f(X) не делится на д(Х), а во втором — делится. Возможна ли реализация противоположного варианта? 2. Доказать при помощи теоремы 3, что если F — поле, то группа всех автоморфизмов кольца Fpf], тождественных на F, изоморфна группе преобра- преобразований X »-+ аХ + Ь, где о, Ь € F и о ф 0. 3. Показать, что многочлен / € F[Xi Хп] является формой степени m (см. доказательство теоремы 4) тогда и только тогда, когда /(tAi,...,tXn) = = tmf(Xi>...,Хп)> где * — новая переменная. 4. Показать, что число различных одночленов от п независимых переменных полной степени т равно (т "^ ) - Указание. Использовать принцип двойной индукции по п и т, опираясь на соотношение l\ /(m-l) + n-l\ = /m + n-l\ ) \ m-1 У V rn )' 5. Возвращаясь к определениям п. 1, рассмотрим совокупность А[[Х]] так называемых формальных степенных рлдов f(X) = J2i^oai^i 0T переменной (неизвестной) X или, если угодно, последовательностей @0,01,02,...) с любым, возможно, бесконечным, числом коэффициентов а» ф 0, принадлежащих комму- коммутативному кольцу А. Действия с формальными степенными рядами из А[[Х]] проводятся по тем же правилам, что и действия с многочленами: (Е **0 • (Еь*4) = Е<***> с* = Е
§ 2. Кольцо многочленов 189 Показать, что множество Л[[Х]], рассматриваемое вместе с этими опера- операциями, является ассоциативным и коммутативным кольцом с единицей 1 = A,0, О,...)- Так как в степенной ряд / = £ а*Хх входят сколь угодно высокие степени Xх переменной X, то вместо степени cleg/, не имеющей теперь смысла, естественно рассматривать порлдок ш(/) — целое число, равное наименьшему индексу п, для которого ап Ф 0 (полагают ещё ш@) = +оо). Показать, что: Если А — целостное кольцо, то w(fg) = <*;(/) +u)(g). В частности, вместе с А целостным является и кольцо А[[Л"]]. Показать также, что А[Х] — подкольцо в А[[Л"]]. 6. Многочлены и степенные ряды часто используются в качестве производл- щих функций различных числовых величин. Смысл оперирования с ними поясним на двух простых примерах. а) Установить соотношение исходя из биномиальной формулы ^2(п)Хх = A + Х)п в Z[X] и очевидного разложения A + Х)тA + Х)п = A + Х)т+п. б) Найти число 1п всевозможных расстановок скобок в произведении длины п элементов множества с одной бинарной операцией. С этой целью удобно ввести производящую функцию — формальный степенной ряд '(*) = ]£ *пХп = X + X2 + 2Х3 + ..., начальные коэффициенты которого были вычислены ещё в п. 3 § 1 гл. 4. Из очевидного рекуррентного соотношения п-1 и = 5Z Wn-k A:=l вытекает, что /(XJ = 1(Х) - X. Решая это квадратное уравнение, находим 2 (знак перед радикалом определяется условием 1п > 0). Но если степенной ряд f(X) таков, что /г = 1 + АХ, г € N, то -.♦£ In (Hi ^ fc=i Lt=o vr yJ K- (разложение в ряд Тейлора, которое можно принять пока на веру). В нашем слу- случае г = 2,А = —4,и простая подстановка даёт окончательное выражение _ 1_ /2п-2\ ~n Vn-1/ (заметим, что /п = Cn-i — классическое число Каталана). Предлагается провести все промежуточные выкладки.
190 Гл. 5. Комплексные числа и многочлены § 3. Разложение в кольце многочленов 1. Элементарные свойства делимости. В разных местах, на- начиная с гл. 1, мы затрагивали вопросы делимости в кольце Z целых чисел, но так называемая основная теорема арифметики у нас оста- оставалась пока недоказанной. Теперь настала пора не только заполнить этот пробел, но и распространить соответствующие утверждения на более широкий класс колец. В первую очередь нас интересует кольцо многочленов Р[Х] над полем Р. Начнём с произвольного целостного кольца К. Обратимые эле- элементы в К были названы нами делителями единицы. Часто их имену- именуют ещё регулярными элементами. Совершенно очевидно, что много- многочлен / е А[Х] обратим (регулярен) в точности тогда, когда deg / = 0 и / = /о — обратимый элемент кольца А, поскольку fg = 1 => => deg/ + degg = deg 1 = 0. Говорят, что элемент Ь Е К делится на а € if (или Ь кратен а), если существует такой элемент с Е К, что Ь = ас (это обозна- обозначается а\Ь). Если а\Ь и Ь|а, то а и Ь называются ассоциированными элементами. Тогда Ь = иа, где tc|l. В силу сделанного выше замеча- замечания ассоциированность многочленов /, g € А[Х] означает, что они отличаются лишь обратимым множителем из А. Элемент р 6 К называется простым (или неразложимым), если р необратим и его нельзя представить в виде р = аЬ, где а, Ь — необра- необратимые элементы. В поле Р каждый ненулевой элемент обратим и в Р нет простых элементов. Простой элемент кольца А[Х] называется чаще неприводимым многочленом. Отметим следующие основные свойства отношения делимости в целостном кольце К. 1) Если а\Ь, Ь|с, то а\с. Действительно, мы имеем Ь = ab', c = bcf, где Ь',с; € К. Поэтому с = (aV)c1 = a(b'J). 2) Если с\а и с|Ь, то с\(а ± Ь). В самом деле, по условию а = со!, b = сЬ' для некоторых а',Ь; Е К, и ввиду дистрибутивности а ± Ь = = c(a'±V). 3) Если а|Ь, то а\Ьс. Ясно, что Ъ = аЬ1 => be = (ab')c = а(Ъ'с). Комбинируя 2) и 3), получаем 4) Если каждый из элементов bi, Ьг,..., Ьт € К делится на а € € К, то на а будет делиться также элемент biCi+1ъс2 +.. •+Ьтст, где Ci,C2,...,Cm — произвольные элементы. Определение. Говорят, что целостное кольцо К — кольцо с однозначным разложением на простые множители (или К — фак- ториальное кольцо), если любой элемент а ф 0 из К можно предста- представить в виде .Pr, A) где и — обратимый элемент, а РьРг, • • • ,Рг — простые элементы (не
§ 3. Разложение в кольце многочленов 191 обязательно попарно различные), причём из существования другого такого разложения о = vqiq2 ... q8 следует, что г = s и при надлежа- надлежащей нумерации элементов р* и qj будет qi =tiipi,...,q[r = urpr, где t&i,...,ur — обратимые элементы. Допуская в равенстве A) значение г = 0, мы принимаем соглаше- соглашение, что обратимые элементы в К тоже имеют разложение на прос- простые множители. Ясно, что если р — простой, г, и — обратимый эле- элемент, то ассоциированный с р элемент up тоже простой. В кольце Z с обратимыми элементами 1 и — 1 отношение порядка (а < Ь) даёт возможность выделить положительное простое число р из двух воз- возможных простых элементов ±р. В кольце Р[Х] удобно рассматривать нормализованные (см. замечание в конце § 2) неприводимые много- многочлены. Справедлива следующая общая Теорема 1. Пусть К — произвольное целостное кольцо с раз- разложением на простые множители. Однозначность разложения в К (факториальность К) имеет место тогда и только тогда, когда любой простой элемент р 6 К, делящий произведение ab G К, делит по крайней мере один из множителей а, 6. Доказательство. Пусть К факториально, и пусть об = рс. Если — разложения о, Ь, с на простые множители, то из равенства П а« х х П bj = р П ск следует, что элемент р ассоциирован с одним из о» или bj, т.е. р делит о или Ь. Обратно: установим однозначность разложения в AT, где р\аЬ => =Ф- р\а или р\Ь. Рассуждая по индукции, допустим, что разложение всех элементов из К с числом ^ п простых множителей единственно (конечно, с точностью до порядка множителей и их ассоциирован- ассоциированности). Докажем теперь это для любого элемента о ф 0, который может быть разложен на п 4-1 простых множителей. Именно, пусть п+1 т+1 B) — два разложения элемента acm^n. Условие теоремы, применённое кр = Pn+i) даёт нам, что pn+i должен делить один из элементов ri,... ,rm+i. Без ограничения общности (ибо это вопрос нумерации) считаем, что pn+i |rm+i. Но rm+i — простой элемент, поэтому rm+i = = 1фп+1, где и — обратимый элемент. Опираясь на закон сокраще- сокращения в К (теорема 1 из § 3 гл. 4), получаем из B) равенство ПГ=1 Р* =
192 Гл. 5. Комплексные числа и многочлены = и П^=1 rj- В левой его части стоит произведение п простых множи- множителей. По предположению индукции т = п, и оба разложения отли- отличаются лишь порядком простых элементов, снабжённых, возможно, какими-то обратимыми множителями. D В произвольном целостном кольце К элемент о ф О вообще не обязан допускать разложение типа A). Что более интересно, имеются целостные кольца, в которых разложение на простые множители хотя и возможно, но не является однозначным, т.е. условие теоремы 1, кажущееся тривиальным, не всегда выполняется. Пример 1. Рассмотрим мнимое квадратичное поле Q(\/—5) (см. пример в п. 5 из § 1), а в нём целостное кольцо К = {а -\- б-s/—5| а, 6 6 Z}. Норма N(a + by/^E) = а2 + ЪЬ2 каждого отличного от нуля элемента а 6 К — целое положительное число. Если а обратим в К> то (N(a))^x = ^(а) € Z, откуда N(a) = 1. Это возможно лишь при 6 = 0, а = ±1. Таким образом, в К, как и в Z, обратимыми элементами являются только ±1. Бели а = еоааг • —Q-r Ф О, е = ±1, то N(a) = N(a\). ..N(ar). Так как 1 < N(oti) € N, то при заданном а число множителей г не может неограниченно расти. Стало быть, разложение на простые множители в К возможно. Вместе с тем число 9 (да и не только оно) допускает два существенно раз- различных разложения на простые множители: 9 = 3 • 3 = B + vc:5)B - ч/1^). Неассоциированность элементов 3 и 2 ± у/^Ъ очевидна. Далее, NC) = NB ± ± v/^5) = 9. Поэтому из разложения а = оц(Х2 для а = 3 или 2 ± у/^Ъ с необра- необратимыми ai,c*2 следовало бы 9 = N(a) = N(oti)N(ot2), т.е. N(oti) = 3, t = 1,2, что невозможно, поскольку уравнение х2 4- by2 = 3 с х, у € Z неразрешимо. Этим доказана простота элементов 3 и 2 ± у/~-Ъ. Рассмотренный пример содержит в зародыше большой круг вопросов, частично остающихся пока нерешёнными, о квадратичных полях Q{y/d). Их изу- изучение входит в круг вопросов алгебраической теории чисел. Прежде чем устанавливать при помощи теоремы 1 факториаль- ность тех или иных колец, мы введём важные вспомогательные по- понятия, представляющие независимый интерес. 2. НОД и НОК в кольцах. Пусть К — целостное кольцо. Под наибольшим общим делителем двух элементов о, b E К мы будем понимать элемент d E К, обозначаемый НОД(а, 6) и обладающий двумя свойствами: i) d|a, d\b; ii) c|o, c\b => c\d. Ясно, что вместе с d свойствами i), ii) обладает любой ассоции- ассоциированный с ним элемент. Обратно: если end — два наибольших делителя элементов а и Ь, то будем иметь c\d> d|c, так что end ассо- ассоциированы. Обозначение НОД(о, Ь) относится к любому из них, т.е. в этой записи ассоциированные элементы не различаются. С учётом такого соглашения к определяющим свойствам i), ii) наибольшего общего делителя добавятся следующие: ш) НОД(о, Ь) = о «=> а|Ь;
§ 3. Разложение в кольце многочленов 193 1у)НОД(о,0)=о; )() vi) НОД(Н0Д(о, 6), с) = НОД(а, НОД(Ь, с)). Проверка их не вызывает никаких трудностей и оставляется чи- читателю. Свойство vi) позволяет также распространить понятие НОД на произвольное конечное число элементов. По аналогии с НОД(о, Ь) вводится дуальное понятие наименьше- наименьшего общего кратного т = НОК(о,Ь) элементов о,Ь € К, также опре- определённого с точностью до ассоциированности двумя свойствами: i') a|m, b\m\ ii') a|c, b\c => m|c. В частности, полагая с = ab, получаем m\ab. Теорема 2. Пусть для элементов о,Ь целостного кольца К существуют НОД (о, Ь) и НОК(о,Ь). Тогда: а) НОК(а, Ь) = О <=* а = 0 или Ъ = 0. б) о, Ь ф 0, т = НОК(о, Ь), об = dm => d = НОД(а, Ь). Доказательство. Утверждение а) вытекает непосредствен- непосредственно из определения НОК(а, 6). Для доказательства 6) нам нужно убе- убедиться, что элемент d, определённый равенством об = dm, обладает свойствами i), ii). В самом деле, i') => m = o'a, m = b'b. Зна- Значит, ob = dm = da'o, откуда после сокращения на о, допустимо- допустимого в любом целостном кольце, имеем b = da;, т.е. d\b. Аналогично, ab = dm = db'b => a = db\ т.е. d|o. Мы пришли к i). Далее, пусть о = /о", Ь = /Ь". Положим с = /о^Ь". Тогда с = = об" = Ьа" — общее кратное о и Ь. Согласно свойству ii') с = dm для некоторого с' G К, откуда /с'т = /с = /2о//Ь// = об = dm, т.е. d = /с' и /|d. Мы пришли к ii). D Определение. Элементы о, Ь целостного кольца, в котором су- существует НОД, называются взаимно простыми, если НОД(о,Ь) = 1. Из свойств i), ii), i;), ii') или из теоремы 2 нельзя извлечь ни способа вычисления, ни доказательства существования НОД(а, Ь) и НОК(а, Ь). Теоремой 2, б) устанавливается лишь соотношение между ними. Предположим теперь на время, что К — факториальное кольцо. Обозначим через V множество простых элементов в К такое, что всякий простой элемент из К ассоциирован с одним и только одним элементом из V. Рассматривая разложения двух элементов о, b G AT, удобно считать, что в них входят одинаковые элементы из V, но некоторые, возможно, с нулевыми показателями, т.е. u|l, «|1; /О 0, h>0; PieV; l^i^r. При помощи теоремы 1 получается легко запоминающийся
194 Гл. 5. Комплексные числа и многочлены Признак делимости. Пусть а,6 — элементы факториаль- ного кольца К, записанные в виде C). Справедливы утверждения: 1) а\Ь тогда и только тогда, когда fcj < I<, t = 1,2,..., г; 2) НОД(о,Ь) = р[1 .. .р8/, где e< = min{**,/*}, i = 1,2,... ,r; 3) НОК(о,Ь) = pi1.. .pjr, где *» = max {*<,/<}, г = 1,2,... ,r. Таким образом, в качестве S» нужно брать наименьший из двух показателей А;»,/», а в качестве U — наибольший. В частности, эле- элементы a>b Е К взаимно просты в точности тогда, когда простые множители, входящие в разложение одного элемента, не входят в раз- разложение другого. Недостаток этого признака делимости заключается, конечно, в том, что на практике бывает весьма трудно получить разложение вида C). Даже в случае К = Z (этим не предвосхищается факто- риальность Z) приходится довольствоваться незначительными вариа- вариациями метода прямого перебора простых чисел, меньших данного числа п. Тем более приятно, что в факториальных кольцах, о кото- которых пойдёт речь ниже, имеется эффективный способ вычисления НОД(а,6)иНОК(а,Ь). 3. Факториальность евклидовых колец. Алгоритм деления с остатком в Z и Р[Х] (см. п. 3 § 9 гл. 1 и п. 3 § 2) делает естественным рассмотрение целостного кольца if, в котором каждому элементу а ф Q поставлено в соответствие неотрицательное целое число 5(а), т.е. определено отображение 8 : так, что при этом выполняются условия: Е1) 8{аЬ) ^ 5(о) для всех о, Ъ ф 0 из К; Е2) каковы бы ни были о, Ь G if, b ф 0, найдутся q,r E К (q — "частное", г — "остаток"), для которых а = qb + г; 6(г) < 5(Ь) или г = 0. D) Целостное кольцо К с этими свойствами называется евклидо- евклидовым кольцом. Полагая 6(а) = \а\ для о G Z и 6(а) = dega для а = а(Х) € Р[Х], мы приходим к выводу, что Z и Р[Х] — евклидовы кольца. В евклидовых кольцах существует способ нахождения НОД(а, Ь), называемый алгоритмом последовательного деления или алгорит- алгоритмом Евклида и заключающийся в следующем. Пусть даны ненулевые элементы a, b евклидова кольца К. Применяя достаточно большое (но конечное) число раз предписание Е2), мы получим систему равенств
§ 3. Разложение в кольце многочленов 195 типа D) с последним нулевым остатком: b = q2ri + r2, 8(r2) E) Гк-2 = 9*ГЛ-1 + Г*, 5(Гк) < 5(r*-i), r*-i = g*+ir*, Пь+1 =0. Это действительно так, поскольку строго убывающая цепочка неотрицательных целых чисел 5(Ь) > 5(г\) > 5(г2) > ... должна оборваться, а обрыв может произойти только за счёт обращения в нуль одного из остатков. Утверждается, что последний отличный от нуля остаток г* явля- является как раз наибольшим общим делителем элементов о и Ь в смы- смысле определения, данного в п. 2. В самом деле, по условию г*|г*_1. Двигаясь в системе E) снизу вверх и используя свойство 4) отноше- отношения делимости, сформулированное в п. 1, получим цепочку г*|г*_1, Гк\гк-2, •.., гк\г2, гк\гг и, наконец, г*|Ь, гк\а. Стало быть, гк— общий делитель элементов о и Ь. Обратно: пусть с — любой другой делитель тех же элементов; тогда c\ri, и, двигаясь теперь в системе E) сверху вниз, мы получим цепочку отношений делимости с|г2, с|гз, ..., с|г*. Последнее из них окончательно убеждает нас в том, что НОД(о, Ь) существует, причём имеет место равенство г* = НОД(а,Ь). F) Обратим, далее, внимание на то обстоятельство, что каждый остаток г*, в системе E) выражается в виде линейной комбинации с коэффициентами в К двух предыдущих остатков г»_1 и г*_2- При этом ri выражается через о и Ь: г\ = о — gib, а г2, выражаясь через Ь и п, тем самым является опять линейной комбинацией о и Ь. После- Последовательная подстановка в г» выражений Г{-\ и г»_2 через о и Ь даст нам при i = к выражение г к = аи + bv G) с какими-то элементами u, v € К. Сопоставляя F) и G) и принимая во внимание теорему 2, б), по- получаем следующее утверждение. Теорема 3. В евклидовом кольце К любые два элемента о,b имеют наибольший общий делитель и наименьшее общее кратное. При помощи алгоритма Евклида можно найти такие u,v e К, что будет выполнено соотношение НОД(о,Ь) = au + bv.
196 Гл. 5. Комплексные числа и многочлены В частности, элементы о, b G К взаимно просты тогда и толь- только тогда, когда существуют элементы и, v E АГ, для которых аи 4- bv = 1. Следствие. Пусть а,6,с — элементы евклидова кольца К. i) Ясли НОД(а,Ь) = 1 и НОД(о,с) = 1, то НОД(а,Ьс) = 1. ii) Если а\Ьс и НОД(а, Ь) = 1, то а\с. iii) Если Ь|о, с\а и НОД(Ь,с) = 1, то Ьс\а. Доказательство.!) Согласно теореме 3 имеем равенства ащ + + Ьо\ = 1, au2 + CV2 = 1. Перемножая соответственно их левые и пра- правые части, находим a(au\U2 + Ъи2Щ +CU1V2) + bc{v\V2) = 1, что и даёт нужное утверждение. ii) Имеем аи Л- bv = 1, откуда ac-u-f Fc)v = с. Но be = aw, поэтому с = o(cw 4- t/w), т.е. о|с. iii) Согласно свойству ii') HOK Ь\а, с\а =» НОК(Ь,с)|а =» Ьс|а, поскольку Ьс = НОД(Ь,с)НОК(Ь,с) и НОД(Ь,с) = 1 по условию. □ Читатель легко распространит утверждение теоремы 3 на случай произвольного конечного числа элементов евклидова кольца. Непосредственным шагом к установлению факториальности евклидова кольца служит Лемма. Всякое евклидово кольцо К является кольцом с разло- разложением (т.е. любой элемент а ф 0 из К записывается в виде A)). Доказательство. Пусть элемент о € К обладает собствен- собственным делителем Ь: о = Ьс, где Ь и с — необратимые элементы (другими словами, а и 6 не ассоциированы). Докажем, что 6(Ь) < 5(а). В самом деле, согласно Е1) непосредственно имеем 6(Ь) ^ 5(Ьс) = = 6(а). Предположив выполнение равенства 6(b) = 5(a), мы восполь- воспользуемся условием Е2) и найдем q,r с b = qa 4- г, где 5(г) < 8(а) или же г = 0. Случай г = 0 отпадает ввиду неассоциированности о и Ь. По той же причине 1 — qc ф 0. Стало быть, снова по Е2) (поменять местами а и 6) имеем 6(а) = 6(Ь) ^ 6(ЬA - qc)) = 6(Ъ - qa) = *(r) < 5(a) — противоречие. Итак, 6(Ь) < д(а). ЕЗсли теперь о = О1О2... оп, где все о» необратимы, то am+iam+2 • • • an — собственный делитель amam+i... оп, и по дока- доказанному *(о) = 8{аха2 ... an) > E(a2 ... an) > ... > <J(an) > *A). Эта строго убывающая цепочка неотрицательных целых чисел име- имеет длину п $С 6(а). Значит, для элемента а £ К имеется разложение максимальной длины, которое и будет разложением на простые мно- множители. D
§ S. Разложение в кольце многочленов 197 Теорема 4. Всякое евклидово кольцо К фактпориально (т.е. обладает свойством однозначности разложения на простые мно- множители). Доказательство. С учётом леммы и критерия факториаль- ности, содержащегося в теореме 1, нам остаётся показать, что если р — простой элемент кольца К, делящий произведение be каких-то элементов Ь, с G AT, то р делит либо Ь, либо с. Действительно, при 6 = 0 или с = 0 доказывать нечего. Если же be ф 0 и d = НОД(Ь,р), то d, будучи делителем простого элемента р, либо равен 1 (точнее, является делителем 1), либо ассоциирован с р. В первом случае b и р оказываются взаимно простыми, и утверждение ii) следствия теоремы 3 позволяет заключить, что р|с. Во втором случае d = up, u\l и, значит, р|Ь. □ Следствие. Кольца Ъ и Р[Х] факториальны (Р — произволь- произвольное поле). Доказательство. Как отмечалось непосредственно после определения евклидовости, на каждом из колец Z,P[X] задана есте- естественная функция S с нужными свойствами Б1), Б2), так что оста- остаётся сослаться на теорему 4. D Очень рекомендуется провести отдельно для Z и для Р[Х] до- доказательства факториальности, чтобы устранить всякую видимость какого-либо наукообразия в этом вопросе. Факториальность кольца многочленов Р[Х\,..., Хп], п > 1, уже не являющегося евклидовым, устанавливается в [В А III]. Там же при- приводятся дополнительные примеры евклидовых колец. 4. Неприводимые многочлены. Специализируя данное ра- ранее определение простого элемента, ещё раз подчеркнем, что много- многочлен / ненулевой степени из кольца Р[Х] называется неприводимым в Р[Х] (или неприводимым над полем Р), если он не делится ни на ка- какой многочлен g G Р[Х], у которого 0 < degg < deg/. В частности, всякий многочлен первой степени неприводим. Совершенно очевид- очевидно, что неприводимость многочлена степени > 1 или разложение его на неприводимые множители — понятия, тесно связанные с основ- основным полем Р, как это показывает уже известный нам по построению комплексных чисел многочлен X2 + 1 = (X + i)(X — г). Многочлен ХА 4- 4 приводим над Q, хотя об этом и нелегко догадаться: X4 + 4 = (X2 - 2Х + 2) (X2 + 2Х + 2). Оба множителя справа неприводимые не только над Q, но и над R, будучи приводимыми, однако, над С. Как простых чисел в Z (см. § 9 гл. 1), так и нормализованных неприводимых многочленов над произвольным полем Р бесконечно много.
198 Гл. 5. Комплексные числа и многочлены В случае бесконечного поля Р это ясно: достаточно рассмотреть неприводимые многочлены вида X — с, с € Р. Если же поле Р конечно, то годится рассуждение Евклида. Имен- Именно, пусть уже найдены п неприводимых многочленов р\,... ,рп. Мно- Многочлен / = pip2 ... рп +1 имеет хотя бы один нормализованный прос- простой делитель, поскольку deg / ^ п. Обозначим его через pn+i- Он отличен от pi,... ,рп, поскольку из pn+i = р8 для какого-то s ^ и следовало бы p8\(f -pi.. .pn), т.е. р,|1. □ Так как многочленов заданной степени над конечным полем ко- конечное число, то можно сделать следующее полезное заключение. Над любым конечным полем существуют неприводимые много- многочлены сколь угодно высокой степени. Это утверждение качественного характера будет уточнено в [ВА III]. Неприводимые многочлены над полем Q играют особую роль в теории полей алгебраических чисел. Так как умножением на подхо- подходящее натуральное число от многочлена из Q[X] всегда можно пе- перейти к многочлену из Z[X], то естественно уточнить сначала связь между свойствами приводимости над Q и над Z. Имея в виду дру- другие приложения, мы докажем одно общее утверждение о многочленах над факториальным кольцом К. Назовём содержанием многочлена / = ao + aiX + ...+ anXn G € К[Х] наибольший общий делитель d = d(f) всех его коэффициен- коэффициентов. До сих пор мы говорили о НОД(о, Ь) двух элементов, но свойства i)-vi) НОД позволяют без труда распространить это понятие на лю- любое конечное число элементов целостного кольца. Если d(f) — обратимый элемент в К, то многочлен / называют примитивным. Лемма Гаусса. Пусть К — факториальное кольцо и f,g G G К[Х]. Тогда d(fg)*d(f).d(g). В частности, произведение двух примитивных многочленов сно- снова будет примитивным многочленом (здесь и ниже & означает ра- равенство с точностью до ассоциированности). Доказательство. Начнём с последнего утверждения. Пусть / = ею + oiX + ... + апХп, g = Ьо + hX + ... + ЬтХт — примитивные многочлены из АГ[Х], произведение fg которых не является примитивным. Существует, стало быть, простой элемент р € К, делящий d(fg). Выберем наименьшие индексы s,£, для кото- которых р /ae, p J[bt. Такие индексы найдутся ввиду примитивности / и д. Коэффициентом при Х8~*~1 в fg будет
§ 3. Разложение в кольце многочленов 199 Так как ав_» и Ь^~« при г > 0 делятся на р по условию и р|сЛ+г по предположению, то мы имеем соотношение pu = a8bt+ pv, из которого следует, что p\a8bt. Ввиду факториальности К имеем р\а8 или p\bt — противоречие, доказывающее наше утверждение. Переходя к общему случаю, запишем произвольные многочлены в виде где /о, 0о — примитивные многочлены. Так как fg = d(f)d(g) и по доказанному d(fogo) » 1, то, стало быть, d(fg) « d(f)d(g). О Следствие. Многочлен f G Z[X], неприводимый над Z, продол- продолжает оставаться неприводимым и над Q (deg/ > 0). Доказательство. Согласно следствию теоремы 4 Z — фак- ториальное кольцо, поэтому к Ъ[Х] применима лемма Гаусса. Пред- Предположим, что / = gh, где / Е Z[X], a g, h 6 Q[X]. Умножая обе части этого равенства на наименьшее общее кратное знаменателей всех коэффициентов у д и ft, мы перепишем его в виде а/ = bgoho, где о,Ь е Ъ и 0o>fto — примитивные многочлены над Z. По лемме Гаусса о • d(/) = Ь (в данном случае без ограничения общности ассо- ассоциированность заменяется на равенство), так что получается разло- разложение / = d(f)goho над Z. Остаётся вспомнить о неприводимости / в Z[X]. D Критерий неприводимости (Эйзенштейн). Пусть f(X) = Хп 4- си** + ... + ап^Х + ап — корлсолизовоккый лсиогочлек над Z, все коэффициенты ад,... ,ап которого делятся на некоторое простое число р, wo an не делился на р2. Тогда f{X) неприводим над Q. В самом деле, предположив противное и воспользовавшись следствием леммы Гаусса, мы запишем / в виде произведения двух многочленов над Z: f(X) = (X8 + ЬгХ8-1 + ... + Ь8){ХЬ + ci-Y'-1 + ... + с*), st> 0. Это разложение сохранится и в кольце ZP[X], элементы которого по- получаются из целочисленных многочленов взятием их коэффициентов по модулю р. По условию п{ = 0, где а* — класс вычетов по модулю р, соответствующий целому числу о». Но кольцо ЪР[Х\ факториально (следствие теоремы 4). Сравнивая два разложения: мы неизбежно приходим к заключению, что Ь{ = 0 = с^, т.е. все коэффициенты b»,Cj делятся на р. В таком случае ап = Ьвс* делится на р2 — противоречие, устанавливающее справедливость критерия Эйзенштейна. □
200 Гл. 5. Комплексные числа и многочлены Примечание. Критерий действует и в том случае, когда стар- старший коэффициент ао отличен от 1, но не делится на р. Пример 2. Многочлен J(X) = Л'* + Х»~2 + ... + X + 1 неприводим над Q при любом простом р. Достаточно заметить, что вопрос о неприводимости f{X) эквивалентен вопросу о неприводимости многочлена все коэффициенты которого, кроме старшего, делятся нар в первой степени (свойство биномиальных коэффициентов, отмеченное в упр. 6 из § 3 гл. 4) и к которому, следовательно, применим критерий Эйзенштейна. УПРАЖНЕНИЯ 1. Показать, что nZ + mZ = Z • НОД(п, m), nZ П mZ = Z • HOK(n, m). 2. Пусть f,g — нормализованные многочлены из Z[X]. Показать, что в выражении НОД(/,<?) = /и + gv с u,v € Z[X] можно считать deg'a < deg#, degv <deg/. 3. Являются ли кольца Ъ[у/—3] и Zg[X] факториальными? 4. Разложить на неприводимые множители в Z[X] многочлены Хп — 1 при 5 ^ n ^ 12. 5. Доказать, что неприводимые множители однородного многочлена f(XyY) = a0Xn + aiXn~lY + ... + an-xXY^1 + anYn € однородны и f(Xy Y) неприводим тогда и только тогда, когда неприводим мно- многочлен /(X, 1) = a0Xn + aiX»-1 + ... + an-iX + an € (&Х]. в. Пусть Р — поле и f(X) = £^оа*Х* — формальный степенной ряд из Р[[Х]] (см. упр. 5 из § 2). Условие ао Ф 0, или, что эквивалентно, ш(/) = 0 необхо- необходимо и достаточно для существования степенного ряда д{Х) € Р[[Х]], обратного к /: fg = 1. Например, A — X) = ]£«^о-^** С точностью до ассоциированно- ассоциированности X — единственный простой элемент в Р[[Я]]. Кольцо Р[[Х]] факториально. Обосновать эти утверждения. 7. Показать, что det(x^) = £*€£« ^t^(i),i • • -^(п),п — неприводимый од- однородный степени п многочлен от п2 независимых переменных Xij. Указание. Рассуждая от противного, предположить, что det(xij) = £i(... ,Xij,...) х д2(... ,x»j,...). Так как det(zjj) — линейный однородный многочлен от переменных, стоящих в одном фиксированном столбце, то один из множителей pi, до является линейным однородным многочленом от х^, 1 ^ t ^ п, при фиксированном j, в то время как другой совсем не зависит от x%j, 1 $С г ^ п. Аналогичные рассуждения сохраняют- сохраняются при замене столбцов на строки. Пусть, скажем, хц входит в pi. Тогда до не содержит х\jу 1 ^ j ^ п, откуда следует что до не содержит x<j, I ^ t, j ^ п, т.е. до — константа.
§ 4- Поле отношений 201 § 4. Поле отношений 1. Построение поля отношении целостного кольца. В пре- предыдущих двух параграфах было установлено много свойств, общих для Z и Р[Х]. Наша ближайшая цель — вложить Р[Х] в поле, причём сделать это нужно самым экономным способом, образцом для ко- которого может служить вложение Z в Q. Фактически нисколько не сложнее решать точно такую же задачу для произвольного целост- целостного кольца А. Рассмотрим множество Ах А* (А* = А \ {0}) всех пар (а, Ь) эле- элементов а,Ъ е А с b ф 0. Это множество разобьём на классы, по- полагая пары (а, Ь) и (с, d) принадлежащими одному и тому же клас- классу, как только ad = Ьс\ в записи: (а, Ь) ~ (с, d). Ясно, что всегда (а,Ь) ~ {а,Ь). Далее, (а,Ь) ~ (c,d) <=$> (c,d) ~ (а,Ь) и, наконец, (а,Ъ) ~ (c,d), (с,d) ~ (е,/) =Ф- {а,Ь) ~ (е,/). Действительно, име- имеют место равенства ad = be, с/ = de, откуда adf = bcf = bdey т.е. d(af - be) = 0. Ho d ф 0, и в силу целостности кольца А получаем а/ = Ье, что и означает (а, Ь) ~ (е, /). Итак, отношение ~ рефлек- рефлексивно, симметрично и транзитивно, т.е. (см. § 6 гл. 1) оно является отношением эквивалентности на множестве А х А* и, следовательно, определяет разбиение А х А* на непересекающиеся классы. Пусть Q(A) — множество всех классов эквивалентности, или, что то же самое, Q{A) есть фактормножество АхА*/ ~ множества Ах А* по отношению эквивалентности ~. Будем обозначать символом [а, Ь] класс, в котором лежит упорядоченная пара (а, Ь). По определению [a,b] = [c,d]«=*ad = bc. A) Бели на множестве Ах А* задать операции сложения и умножения формулами (а, Ъ) + (с, d) = (ad + Ьс, М), (а, Ъ)(су d) = {ас, bd) (а это возможно, поскольку ъ А яз Ъ ф 0,d ф 0 следует bd ф 0), то эти бинарные операции можно перенести на Q(A), В самом деле, нам нужно показать, что fa' Ъ') ~ (а Ь) =* I М) + М) ~ (°''Ь') + (C)d)' (о ,Ъ ) ~ (а, 6) =» ^ {ab). (cd) ^ {a,bl). (cd) То же самое выражается соотношениями ас • b'd = о'с • bd, истинность которых прямо вытекает из условия а'Ь = ab'. Аналогич- Аналогичный результат получим, заменяя (c,d) на {с1 yd'), где cd' = c'd. Мы приходим к заключению, что на Q{A) операциями сложения и умно-
202 Гл. 5. Комплексные числа и многочлены жения, не зависящими от выбора представителей в классах эквива- эквивалентности, будут [а, Ъ] + [с, d] = [ad + be, bd\, [а, Ь][с, d\ = [ас, bd\. B) Здесь следовало бы писать [а, Ъ] 0 [с, d] и [о, Ъ] 0 [с, d], но без ущерба для ясности 0 и 0 заменены обычными знаками суммы и произведения. Убедимся теперь в том, что <Э(А), рассматриваемое вместе с опе- операциями B), есть поле. Действительно, например, из соотношений [а, 6] + ([с, d) + [е, /]) = [а, Ь] + [с/ + de, df) = [adf + bcf + bde, bdf), ([о, Ь] + [с, d]) + [e, /] = [ad + be, bd] + [e, f) = [adf + bcf + bde, bdf) вытекает закон ассоциативности для операции сложения. Ассоциа- Ассоциативность умножения очевидна. Далее, соотношения ([а, 6] + [с, d]) 7 [е, /] = [ode + bee, bdf), [a, b)[e, f) + [c,d)[e, f) = [adef + beef, bfdf) = [{ode + bce)f, (bdf)f) и условия A) равенства классов эквивалентности показывают, что выполняется закон дистрибутивности. Столь же просто проверяется коммутативность операций сложе- сложения и умножения. Нулём для сложения является класс [0,1] ([0,1] + + [а,Ь] = [a,b]), a единицей для умножения — класс [1,1]. Далее, -[а,Ь] = [-a,b], поскольку [а,Ь] 4- [-а,Ь] = [0,Ь2] = [0,1]. Всё это вместе взятое означает, что Q(А) — коммутативное кольцо с еди- единицей. Если [а,Ъ] ф [0,1], то а ф 0 в А, стало быть, [Ъ,а] € Q{A) и [а, Ь][Ь,а] = [1,1], так что мультипликативным обратным к [а, Ь] ф Ф [0,1] служит [Ь,а]. Тем самым показано, что Q{A) — поле. Сопоставление а н* [о, 1] определяет инъективное отображение /: А -> Q(A), которое на самом деле является морфизмом ((моно- ((мономорфизмом) колец (/(а + Ъ) = /(а) + /(Ь), f(ab) = f(a)f(b); афЪ =» => /(а) ф f{b)). Для любого элемента х = [a, b] € Q{A) имеем [Ь,1]* = [а,1], так что х есть "отношение" f(a)/f(b) элементов из f(A). По этой причине Q (А) называется полем отношений кольца А. Удобно отождествить каждый элемент а € А с его образом /(а) = = [а, 1] G Q{A)y т.е. заменить А на f{A). Можно поступить несколь- несколько иначе: заменить каждый из элементов [а, 1] G Q{A) на a G А, оставив без изменения все другие элементы поля Q(A), и произвести надлежащие замены в формулах B). Именно, следует положить а + [Ьу с] = [ас + Ь, с], а[Ь, с] = [аЬ, с]. В результате целостное кольцо А окажется с самого начала подколь- цом поля, изоморфного Q{A) и изображаемого обычно тем же симво- символом Q(A). После такого отождествления разумно называть элементы
§ 4- Поле отношений 203 [а, Ь] дробями и писать короче и в привычной форме Введённые выше правила действий с классами [а, Ь] повторяют, как нетрудно догадаться, правила действий с дробями в поле (см. (8) в п. 4 § 3 гл. 4). Нами доказана Теорема 1. Для каждого целостного кольца А существует поле отношений (или поле частных, поле дробей) Q{A), элементы которого имеют вид а/Ь, а £ А, 0 ф Ь € А. Действия с дробями подчиняются правилам A), B), где следует положить [а, Ь] = а/Ь. Конструкция полей отношений довольно часто используется в ма- математике. Её естественность оправдывается хотя бы тем, что поле Q есть не что иное, как поле отношений Q(Z) кольца Z. Легко видеть (проверьте это), что Q(A) ^ А, если А — поле. Замечание. Можно доказать, что если целостное кольцо А есть подкольцо поля Р и каждый элемент х £ Р записывается в виде отношения а/Ь элементов а € А, 0 ф Ь € А, то Р £ Q(A). Например, 2. Поле рациональных дробей. Пусть Р — поле, Р[Х] — кольцо многочленов над Р. Поле отношений Q(P[X]) кольца Р[Х] обозначается символом Р{Х) (смена квадратных скобок на круглые) и называется полем рациональных дробей от переменной X с коэф- коэффициентами в Р. Следует заметить, что поле рациональных дробей Р(Х) всегда содержит бесконечное число элементов, а его характеристика совпа- совпадает с характеристикой поля Р. Поле ¥Р(Х) доставляет пример бес- бесконечного поля характеристики р > 0. Каждая рациональная дробь поля Р{Х) записывается (притом многими способами) в виде f/g (или ^, если не стремиться к эко- экономии бумаги), где f,g — многочлены из кольца Р[Х], g ф 0. По определению f/g = fi/gi <=> fg\ = fig- Естественно назвать / числителем, a,g — знаменателем дроби f/g. Дробь не меняется, если её числитель и знаменатель умножаются на один и тот же ненулевой многочлен или сокращаются на любой общий множитель, В частно- частности, целое число (положительное или отрицательное) deg/ — degg не зависит от представления ненулевой рациональной дроби в виде отношения (частного) f/g двух многочленов. Это число называется степенью дроби. Рациональная дробь от переменной X называется несократимой, если её числитель взаимно прост со знаменателем. С точностью до множителя из Р, общего для числителя и знаменателя, любая рациональная дробь f/g однозначно определяется некоторой несократимой дробью. В самом деле, деление / и g на НОД(/, д) при- приводит к несократимой дроби, а равенство f/g = fi/gi двух несокра-
204 Гаг5. Комплексные числа и многочлены тимых дробей, выраженное в виде fg\ = fig, даёт / = c/i, с € Р, д = сд\ (использовать следствие теоремы 4 из § 3). Если deg(f/g) = deg/ — degg < 0, то (несократимая) дробь f/g называется правильной (нулевой многочлен причисляется к правиль- правильным дробям, поскольку мы условились считать deg 0 = -оо). Теорема 2. Каждая рациональная дробь из Р(Х) однозначно представима в виде суммы многочлена и правильной дроби. Доказательство. Алгоритм деления с остатком, применённый к числителю и знаменателю дроби f/g, дает равенство / = qg + г, где deg г < deg g. Теперь f/g = q + r/g есть искомая запись, срав- сравнение которой с любой другой записью того же типа f/g = q + f/"g {ЯуГ>11 € Р[-^]> deg r < deg"g) приводит к соотношению г г rg-rg q- q = z = z—• 9 9 99 Таккакд-д€Р[Х], а ~ degg < 0, то это возможно лишь в случае q — q = 0 и r/g = г /p. D Замечание. Множество -Ро(-Х^) всех правильных дробей, рас- рассматриваемое вместе с операциями сложения и умножения в Р(Х), является кольцом без единицы 1. Действительно, пусть f\/g\,fi/gi G Ро{Х). Так как deg/i/2 = deg/i + deg/2 то Далее, поскольку степени каждого из слагаемых /i#2 и /2рг строго меньше степени знаменателя <?i£2. Как мы условились перед формулировкой теоремы 2, 0 G Ро{Х). В то же время 1 $ Ро(Х). D До сих пор мы всё время подчёркивали, насколько похожи кольца Z и Р[Х]. При переходе к их полям отношений появляется существен- существенное различие: правильные дроби в Q не образуют кольцо. Например, 2 3 _ 19 3 + 5 " 15' За Простейшие дроби. Правильная рациональная дробь f/g € € Р{Х) называется простейшей, если g = рп, п ^ 1, где р = р{Х) — неприводимый многочлен, причём deg/ < deg p.
§ 4- Поле отношений 205 Основной теоремой о рациональных дробях является Теорема 3. Каждая правильная рациональная дробь может быть разложена, и притом единственным образом, в сумму прос- простейших дробей. Доказательство. Пусть f/g € Р{Х) — данная нам правиль- правильная рациональная дробь, в которой без ограничения общности мно- многочлен g можно считать нормализованным (если А ф 0 — старший коэффициент многочлена д> то следует перейти от f/g к равной ей дроби А//^""^)- Дальнейшие рассуждения распадаются на ряд этапов. Этап 1. Предположим, что д = д\д2 — произведение двух вза- взаимно простых нормализованных многочленов. Тогда -£- = £ + £, О) 0102 01 92 причём обе дроби в правой части правильные, а сама запись в виде суммы единственна. В самом деле, из взаимной простоты 01,02 следует (теорема 3 ИЗ § 3), ЧТО 1 = 1*101 + 1*202 ДЛЯ НеКОТОрЫХ 1*1,1X2 € Р[Х]. УМНОЖИВ обе части этого соотношения на /, получим / = /t*i0i 4- /1*202- Еыж теперь fu2 = qgi + /1, deg/i < degpi (деление fu2 на д\ с остатком), то / = /i02 + /201» где /г = fu\ + qg2- Разделив обе части этого соотношения на 0102, т.е. рассмотрев дроби со знаменателем 0102, мы придём к искомому разложению C), поскольку по построению /i/0i € Po{X) (множество правильных дробей) и в соответствии с замечанием в конце п. 2 /2/02 = f /9"~ /i/0i € Po{X)- Пусть теперь наряду с C) имеется ещё разложение f/g = /1/01 + + /2/02 в сумму правильных дробей. Тогда из равенства Л/01 + + /2/02 = fi/gi + ft/92 будем иметь Из делимости (/1-/1H2 на д\ и из взаимной простоты 01,02 следует, что разность Д - f[ должна делиться на д\. Но deg(/i -f{)< deg g> и, стало быть, /i — /1 = 0. Единственность разложения C) установлена. Этап 2. Пусть в правильной рациональной дроби f/g для (нор- (нормализованного) знаменателя д имеется каноническое разложение 9 = рТрТ--Р^ D) в произведение степеней попарно различных нормализованных не- неприводимых над Р многочленов р\(Х),р2{Х),... ,рт(Х). Тогда су- существует однозначно определёное разложение
206 Гл. 5. Комплексные числа и многочлены в сумму правильных дробей fi/p?' (эти дроби называются ещё при- марными). Наше утверждение легко получается индукцией по т, базу для которой даёт этап 1: I - А + /о .A g'Pi1 р?..-р2г p? \p? pt Так как /i и /о определены однозначно, то по предположению индук- индукции это верно и относительно /г,..., /ш- Этап 3. Всякая правильная йримарная дробь а/рп представля- представляется, и притом единственным образом, в виде суммы простейших дробей. Действительно, так как по условию dega < ndegp, то евклидов алгоритм деления с остатком приведёт нас к системе равенств a = Ч\Рп~1 + г\, deg гг < (п - 1) degp, г\ = ЧъРп~2 + r2, deg r2<{n- 2) degp, rn-2 = Яп-iP + rn-i, degrn_i < degp, где deg (ft < degp для всех однозначно определённых частных (ft,... ..., qn. Мы видим, что а = q\pn~l + Я2Рп~2 + ... + qn-iP + Яп, откуда — = Ь -«г + ... + -—т + —-. рП р р2 Pn-1 pn Так как deg ft < degp, то дроби ft/p* являются простейшими. По построению они однозначно определены (аналог разложения целого числа в 2-адическую или в десятичную дробь). Этап 4. Рассуждения этапов 1-3, соединённые вместе, дают всё, что нужно. Из доказательства теоремы 3 видно, что если f/g — правильная рациональная дробь, то знаменателями соответствующих простей- простейших дробей при заданном каноническом разложении D) для д будут Pi^Pi1,...^!] ... ; pJJrSPjJr-1»---»?™. Тема простейших дробей, не очень актуальная для алгебры (хотя и дающая новые примеры колец), находит важные приложения в анализе. Это обусловлено специальным видом неприводимых мно- многочленов над полями С и R, о чём более подробно будет говориться в гл. 6.
§ 4- Поле отношений 207 УПРАЖНЕНИЯ 1. Построить поле отношений R((X)) кольца Щ[Х]] формальных степенных рядов от X с коэффициентами в поле R. Опираясь на упр. 6 из § 3, показать, что каждый элемент поля R((X)) имеет вид так называемого мероморфного степен- степенного ряда ip{X) = a_mX-m + a- ... + a-iX + oo + aiX + a2X2 + ... , a< 6 R, в котором допускается конечное число отрицательных показателей. Другими сло- словами, ip(X) = X"~m/(X), где f(X) — обычный степенной ряд из R[[X]]. 2. Пусть бесконечная последовательность вещественных чисел ao,ai,a2,... периодична, начиная с некоторого члена. Показать, что степенной ряд f(X) = = ao -Ь а\Х + агХ2 + ... записывается в виде рациональной дроби из R(X). 3. Показать, что множество простейших дробей вида //pn, n ^ 1 (и их ли- линейных комбинаций), является подкольцом кольца Ро(Х) (см. замечание в конце п. 2). 4. Показать, что в соответствии с упр. 3 простейшие дроби над Р = Z3 a2X образуют кольцо К с бесконечно убывающей цепью K = K1DK2D...DKND... подколец Kfq> натянутых на дроби (аХ ■+■ Ь)/(Х2 + 1)п, п^ N.
Глава 6 КОРНИ МНОГОЧЛЕНОВ Займёмся тем, ради чего в прошлом изучали алгебру, — корнями многочленов. Эта область перестала быть доминирующей в алгебре, но её важность никем не оспаривается. Дело в том, что многие за- задачи математики в конечном счёте сводятся к вычислению отдель- отдельных корней конкретных многочленов или к качественному описанию их совокупности. Нам удастся затронуть лишь простейшие свойства корней, но их во всяком случае будет достаточно, чтобы в полной мере оценить особое место, занимаемое полем С комплексных чисел. § 1. Общие свойства корней 1. Корни и линейные множители. Пусть коммутативное кольцо А с единицей содержится в целостном кольце К. Определение. Элемент с € К называется корнем (или нулём) многочлена f € А[Х], если /(с) = 0. Говорят также, что с — корень уравнения f(x) = 0. Необходимость рассмотрения колец, содержащих А собственным образом, станет понятной, если вспомнить, что многочлен f(X) = = X2 +1 над R не имеет нулей в R, но /(г) = 0, г € С = Щг]. Сначала мы рассмотрим, однако, случай К = А. Теорема 1 (теорема Безу). Элемент с £ А является корнем многочлена f € А[Х] тогда и только тогда, когда X — с делит f в кольце А[Х]. Доказательство. Эта теорема — часть более общего утверж- утверждения, которое мы могли бы доказать давно. А именно, алгоритм деления с остатком (теорема 5 из § 2 гл. 5) гласит, что f(X) = = (X - c)q(X) + r(X), где degr(X) < deg(X - с) = 1. Значит, r(X) — константа. Подстановка с вместо X (т.е. применение отоб- отображения Пс из теоремы 2 § 2 гл. 5) даёт /(с) = г, так что всегда /(X) = (X-c)g(JT) + /(c). A) В частности, /(с) = 0 «=* f{X) = {X - c)q{X). П Деление многочлена f{X) с коэффициентами в целостном кольце А на линейный многочлен X — с удобно осуществлять по так назы- называемой схеме Горнера, более простой, чем общий алгоритм деления с остатком. Именно, пусть f{X) = aoXn + ахХп-1 + ... + ап, сц € А. Согласно формуле A) q{X) = ЪоХ"-1 + ЪгХп-2 + ... + Ъп-и bj G А.
§ 1. Общие свойства корней 209 Подставляя теперь в A) эти вьфажения для f(X) и q(X) и сравнивая коэффициенты при одинаковых степенях X (начиная со старших), мы после небольшого преобразования получим ak ... 1 bn-i = &n-2C 4- aw-i 1 /(с) = bn-ic + пп\, B) так что заодно вычисляется значение / при X = с. Рекуррентные формулы B), в которых и заключается схема Горнера, удобны при счёте. Ввиду теоремы 1 естественно ввести следующее более общее Определение. Элемент с € А называется k-кратным корнем (или k-кратным нулем) многочлена / € А[Х], если / делится на (X — с)*, но не делится на (X — с)Л+1. Корень кратности 1 назы- называется простым корнем (соответственно при fc = 2 и fc = 3 говорят о двойном и тройном корне). Итак, с € А — корень кратности fc многочлена / £ А[Х] тогда и только тогда, когда f(X) = (X - c)kg{X), где НОД(Х - с, д(Х)) = 1. Последнее условие в силу формулы 1 выражается также неравенст- неравенством д(с) Ф 0. Далее, ввиду теоремы 1 § 2 гл. 5 замечаем, что deg/ = fc + degp, откуда fc ^ deg /. Имеет место важная Теорема 2. Пусть А — целостное кольцо, f ф 0 — многочлен из А[Х] и ci,... ,Сг — его корни в А кратностей соответственно fci,.. .,fcr. Тогда g(X)eA[X], В частности, число корней многочлена f G А[Х], рассматривае- рассматриваемых вместе с их кратностями, не превосходит степени многочлена C) Доказательство. Достаточно перейти к полю отношений Q{A) (если кольцо А не было полем с самого начала) и воспользо- воспользоваться однозначностью разложения на простые множители (в дан- данном случае на X - с\,..., X - Сг) в кольце Q(A)[X] (результаты § 3 и § 4 гл. 5). Однако необходимости в столь мощном оружии сейчас нет. Будем рассуждать прямо. Так как deg/ = (fci + ... 4- fcr) + degg, то неравенство C) — следствие делимости / на (X - ci)kl... (X - Cr)kr, которую мы уста- установим индукцией по г. При г = 1 доказывать нечего. Пусть мы уже знаем, что
210 Г л, 6. Корни многочленов Так как у нас сг — С\ ф 0,..., cv — cv-i ф 0 и А — целостное кольцо, то элемент cv не является корнем многочлена (X—c\)kl... {X—cr^i)*r. Но Сг — fcr-кратный корень многочлена /, т.е. f(X) = (X — Cr)kr x х гх(Х). Поэтому Л(сГ) = 0. Соответственно Л(Х) = (X — Cr)8v(X), s ^ kr. Имеем (X - Сг)ЫХ) = /(*) = (Х- с:)*1 ... (Л" - с-!)*-1 (X - CrYv(X). Используя закон сокращения в целостном кольце А[Х], приходим к заключению, что s = fcr. D Без предположения о целостности кольца А теорема 2 перестаёт быть верной, как показывает пример многочлена f(X) = X3 над кольцом Zg : /@) = /B) = /D) = /F) = 0. Разложение / на простые множители в Zs{X) также неоднозначно: / = X3 = Х(Х — 4J = = (-Y - 2){Х2 + 2Х + 4) = {X - 6)(Х2 - 2Х + 4). Из теоремы 2 вытекает Следствие. Два лсногочлена f,g 6 Л[Х] степени ^ п, примгх- мающие одинаковые значения при подстановке п +1 различкыа: эле- элементов из целостного кольца А, равны: f = р. Доказательство. Положим h = / - у, так что degh ^ п. По условию h(c\) = ... = to(cn+i) = 0 для попарно различных элемен- элементов Ci,...,cn+i € А, т.е. многочлен h степени ^ п имеет не менее п + 1 корней. Полученное противоречие с неравенством C) можно устранить, лишь признав, что h = 0. D 2. Полиномиальные функции. Следствие теоремы 2 позволя- позволяет решить затрагиваемый ранее (см. п. 1 § 2 гл. 5) вопрос о соотно- соотношении теоретико-функциональной и алгебраической точек зрения на многочлены. Каждому многочлену / € А[Х] ставится в соответствие функция /: А -» А, аи /(а). Множество всех таких функций составляет кольцо Apoi полино- полиномиальных (или целых рациональных) функций, являющееся подколь- цом кольца функций АА = {А -> А} с поточечным сложением и умножением (см. пример 3 в п. 1 § 3 гл. 4 и теорему 2 § 2 гл. 5). Со- Совершенно аналогичным образом вводятся полиномиальные функции от нескольких независимых переменных. Как уже отмечалось ранее, отличный от нуля многочлен X2 + Х 6 Рг[Х] определяет нулевую функцию. Вообще, если f(X) = (Хр - Х)д(Х) — много- многочлен над конечным полем из р элементов, то / — нулевая функция, поскольку хр — х = х(хр — 1) = 0 для всех х 6 Fp. Лишь в случае deg / ^ р — 1 многочлен / € Fppf] определяется своей функцией /. Произвольный многочлен / € Fpf-ЭД можно заменить однозначно определённым редуцированным многочленом /* сте- степени ^ р — 1, взяв в качестве /* остаток от деления / на Хр — X. Тогда, очевидно, / = /*• В случае бесконечных полей или целостных колец ситуация значительно проще.
§ 1. Общие свойства корней 211 Теорема 3. Если А — целостное кольцо с бесконечным числом элементов, то отображение кольца многочленов А[Х] на кольцо по- полиномиальных функций Apoi, определяемое соответствием f •->• /, является изоморфизмом. Собственно говоря, это есть переформулировка следствия тео- теоремы 2, поскольку речь идёт лишь о том, что многочлену / ф О сопоставляется ненулевая функция /, т.е. f(a) Ф О хотя бы для одно- одного а € А. На самом же деле / имеет не более чем п нулей в А, если deg / = п. □ На основании теоремы 3 кольцо многочленов над бесконечным полем Р отождествляют с кольцом полиномиальных функций (обо- (обозначаемых /(ж)), и остаётся только решить вопрос о том, как по / (а фактически по нескольким значениям многочлена /) восстановить в явном виде сам многочлен. Точная постановка задачи "интерполяции" заключается в сле- следующем. Пусть Ьо, Ьь..., Ьп — произвольные элементы, а со, с\,... ... ,Сп — попарно различные элементы поля Р. Требуется найти мно- многочлен / Е Р[Х] степени ^ п такой, что /(с») = Ь», г = 0,1,... ,п. Со- Согласно следствию теоремы 2 решение задачи, если оно существует, единственно. Но один многочлен / с заданными свойствами всегда существует, как показывает интерполяционная формула Лагранжа Впрочем, существование и единственность решения сразу усматри- усматриваются из линейной системы для коэффициентов ао,..., ап искомого многочлена /. Определитель этой системы, являющийся определителем Вандермонда, отличен от нуля, и п{ находятся по правилу Крамера. Удобство формулы D) заключается в её простоте и лёгкости запоминания. Некоторые преи- преимущества иногда имеет интерполяционная формула Ньютона ci)...(X-cn-i), E) где коэффициенты гхо, щ,..., ип определяются путём последователь- последовательной подстановки значений X = co,X = ci,...,X = cn. Интерполяци- Интерполяционные формулы D), E) находят практическое применение при вы- вычислении и графическом изображении функции </>: R -> R, заданной таблично или полученной из опыта. Зная из каких-нибудь косвенных соображений, что функция <р ведёт себя на интервале / вещественной прямой R "достаточно хорошо", стараются приближённо изобразить
212 Гл. 6. Корни многочленов изобразить (р на / такой "гладкой" функцией, как полиномиальная (рис. 24). При этом используют в качестве так называемых узлов ин- интерполяции часть точек со, с\,..., Сп внутри интервала /, в которых (и только в них) известны значения ф{с%) = Ь{. у* I i i i Рис. 24 Тонким вопросам выбора узлов интерполяции и разработки об- общих методов приближения функций посвящены целые разделы ма- математики. Стоит отметить, что применение интерполяционных про- процессов сыграло большую роль в развитии теории трансцендентных чисел (определение алгебраических и трансцендентных чисел см. в § 2 гл. 5), так что здесь смыкаются интересы теории функций, тео- теории чисел и алгебры. Отметим в заключение, что каждой рациональной несократимой дроби fig е Р(Х) (см. § 4 гл. 5) и каждому расширению F D Р с бесконечным числом элементов сопоставляется рациональная функ- функция f/g : F(f/g) -> F с областью определения ^(//р), получающей- получающейся из F удалением конечного числа элементов — нулей многочлена д в F. Можно доказать, что при указанных условиях отображение f/g н-> fig взаимно однозначно. Нам это утверждение не потребу- потребуется. Интуитивно оно ясно. Несмотря на это соответствие, нужно делать чёткое различие между рациональными функциями и рацио- рациональными дробями. Рациональная функция х ь> 1/х не определена в точке х = 0, в то время как вопрос об определимости рациональной дроби 1/Х вообще не возникает. 3. Дифференцирования кольца многочленов. Функциональ- Функциональная точка зрения на многочлены делает естественным следующее определение. Пусть f(X) = + ап — многочлен степени п над полем Р. Его производной называется многочлен f'(X) = naoXn~l + (n - F)
§ 1. Общие свойства корней 213 Если Р = R — поле вещественных чисел, а / — связанная с / по- полиномиальная функция, то определение F) производной совпадает с обычным её определением как предела Дж-Ю Дх В случае же произвольного поля Р говорить о каких-либо свойствах непрерывности полиномиальной функции бессмысленно (что такое сходящаяся последовательность в Zp?) и нужно исходить из формаль- формального определения F). Имеют место хорошо известные из анализа соотношения (а/+ /?</)' = a/'+ /V, <*,/?€ Р, G) = f'9 + f9'. (8) Соотношение G) прямо вытекает из F) и из определения суммы мно- многочленов. Используя G) и определение произведения многочленов, проверку (8) можно свести к тому случаю, когда / = Хк, д = X1: (Хк+1)' = (к + l)Xk+l~l = (кХк~г)Х1 + ХкAХ1-г) = = (Хк)'Х1+Хк(Х1у. Обобщением (8) служит легко доказываемая индукцией по к формула к В частности, {fh)' = kfk-lf. (9) Соотношения G), (8), переписанные в терминах отображения -ггт :/»->/' (говорят также, что -&г — оператор дифференциро- дифференцирования), наводят на мысль ввести в рассмотрение для произвольного кольца К отображение V : К —► Л", обладающее свойствами (Г) Такого рода отображения кольца К в себя, называемые дифференци- дифференцированиями, весьма полезны для изучения Л", а их множество Dei(K) оказывается интереснейшим объектом, вводящим в обширную об- область математики (группы и алгебры Ли). Обобщением (8') служит формула Лейбница Vm(uv) = ]£ (^) VkuDm-kv, (8")
214 Гл. 6. Корни многочленов получаемая индукцией по т ^ 1 (применение V к (8/;), использование (8') и соотношение (fc™ х) + (^) = (mf Х) дадут (8") при т +1). В случае К = Р[Х] из соотношений G'), (8'), дополненных пра- правилом V(Xf) = XV f, A € Р, непосредственно вытекает Vf(X) = f'(X)VX. Стало быть, любое дифференцирование кольца многочленов Р[Х] определяется заданием единственного многочлена VX. При VX = 1 мы получаем обычный оператор дифференцирования -At . 4. Кратные множители. Результат m-кратного применения отображения -&т к f(X) обычно обозначается символом f^m\X). Очевидно, что f(X) = аоХп + агХп-1 + .. . + an =» /^(Х) = n!a0, /(n+1)(X) = 0. Если Р — поле нулевой характеристики, то deg/' = deg/-l. Однако для полей конечной характеристики р это уже не так, по- поскольку {ХкрУ = fcpX**-1 = 0. Всё же некоторую пользу из рассмотрения производной молено извлечь и в общем случае. Разделив произвольный многочлен / е Р[Х] на (X - сJ, с G F, F D Р, а затем записав (линейный) остаток в виде (X — c)s + г, где s,r € F, мы придём к соотношениям / = (X - с)Н + (X - ф + г, /' = (X - с)[2* + (X - с)*'] + а. Подставив в них значение X = с, получим г = /(с), s = /'(с), т.е. /(X) = (X - сJ*(Х) + (X - с)/'(с) + /(с). Мы пришли к следующему утверждению. Теорема 4. Пусть Р — произвольное поле и F — любое его расширение. Многочлен f 6 Р[Х] имеет кратный корень с£ F тог- тогда и только тогда, когда /(с) = /;(с) = 0. Пример 1. В любом поле характеристики р многочлен Хп — 1 имеет лишь простые корни, если п не делится нар. Действительно, корни производной пХп~1 не могут быть корнями Хп — 1. Далее предполагается, что Р — поле нулевой характеристики, и без ограничения общности под Р можно понимать одно из полей Q, К или С. Нормализованный неприводимый многочлен р%{Х) в разло- разложении kkk, хер, (ю)
§ 1. Общие свойства корней 215 многочлена f(X) Е Р[Х] (по аналогии с определением кратного кор- корня) называется ki-кратным множителем для /. Ранее уже говори- говорилось о том, что получить разложение A0) на практике довольно слож- сложно. Опишем вкратце метод, основанный на понятии производной и дающий возможность узнать, содержит ли /(-X") над данным полем Р (или над его расширением) кратные множители. Теорема 5. Пусть р(Х) есть k-кратный неприводимый мно- множитель многочлена f Е Р[Х] (k ^ I, degp(X) ^ 1). Тогда р(Х) будет (к — 1) -кратным множителем производной f'(X). В частности, при k = I f не делится на р{Х). Доказательство. По условию имеем f(X) = p(X)kg(X), где НОД(р(Х),(/(Х)) = 1, т.е. д(Х) не делится на р(Х). Применяя пра- правила (8) и (9), находим f'(X) = p{X)k-1[kp'(X)g(X) +р{Х)д'(Х)}. Достаточно показать, что многочлен, стоящий в квадратных скобках, не делится на р{Х). Если бы это было не так, то на р{Х) делился бы многочлен kpf(X)g(X), что, однако, невозможно (см. след- следствия теорем 3 и 4 § 3 гл. 5), поскольку д(Х) не делится на р(Х), а degkp'(X)<degp(X). D Понятно, что в ходе доказательства существенно использованы и неприводимость р(Х), и условие charP = 0. Следствие 1. Для многочлена f(X) с коэффициентами в поле Р характеристики нуль следующие два условия эквивалентны: i) / имеет в некотором расширении F D Р поля Р корень с кратности к; и) /«)(с) = 0, 0 $ з ^ к - 1, но /(«(с) ф 0. Для доказательства нужно к раз применить теорему 5, имея в виду линейный множитель р{Х) = X — с и с самого начала заме- заменяя, в случае необходимости, Р на его расширение F, содержащее корень с. □ Следствие 2. Если многочлен f G Р[Х] степени ^ 1 имеет разложение A0), то разложением для наибольшего общего делителя f и его производной /' будет яод(!,П = р1(Х)к1-1р2(х)к*-1...рг(х)к*-1 (и) (НОД всегда можно считать нормализованным многочленом). Действительно, по теореме 5 каждый из простых делителейр%(Х) многочлена f(X) с каноническим разложением A0) входит в разло- разложение fl(X) с показателем fc» — 1, т.е. f'(X) = Pl(X)k^lp2(X)k^1.. .рЛХ)*'-1 • u(X), где НОД(и,Рг) = 1, 1 ^ г ^ г (предполагается, что Pi(X)° = 1). Поэтому по известному нам признаку делимости (см. п. 2 § 3 гл. 5) мы заключаем, что НОД(/,/') вычисляется по формуле A1). □
216 Гл. 6. Корни многочленов Используя выражение A1) для НОД(/, /'), мы получаем средство освободиться от кратных множителей, входящих в разложение f(X). Именно, многочлен 9(Х) = содержит те же простые делители, что и /(X), но с единичной крат- кратностью. Важно отметить, что многочлен д(Х) можно найти, не зная фактически разложений для / и /', а лишь используя алгоритм Евклида. Пример 2. Многочлен/(X) = Х5-ЗХ4+2Х3+2Х2-ЗХ + 1 него производ- производная f'(X) = 5Х4 - 12Х3 + 6Х2 + 4Х - 3 имеют в качестве НОД нормализованный многочлен X3 - ЪХ2 + ZX - 1 = (X - IK. "Свободный от квадратов" многочлен д(Х) = f(X)/(X - IK = X2 - 1 = (X - 1)(Х + 1) имеет два корня: ±1. Таким образом, f(X) = (X — 1L(Х + 1) обладает корнем +1 кратности 4 и простым корнем — 1. 5. Формулы Виета. В связи с теорией систем линейных урав- уравнений мы уже имели случай упомянуть о благотворном влиянии на её развитие хорошей системы обозначений, приведшей, в частности, к определителям. Это заслуга математиков XVIII в. и начала XIX в. Но гораздо раньше, когда алгебра ещё отождествлялась с "анализом уравнений", решающее усовершенствование алгебраических обозна- обозначений у Ф. Виета и у Р. Декарта коснулось теории многочленов и алгебраических уравнений. От частных типов уравнений с число- числовыми коэффициентами, скрывавшими общие закономерности, был совершён смелый переход к уравнениям с буквенными коэффициен- коэффициентами. Новый способ записи нередко порождает новые результаты. У Декарта это завершилось революционным применением алгебры к геометрии. Мы остановимся на более скромном достижении его предшественника Виета. Предположим, что нормализованный многочлен / Е Р[Х] сте- степени п имеет в поле Р или в некотором его расширении п корней ci,C2,... ,Сп, среди которых, возможно, есть и одинаковые. Тогда в соответствии с теоремой 2 справедливо разложение Запишем f(X) в обычном виде по степеням X: f{X) = Хп + агХп-1 + ... + акХп~к + ... + ап, для чего перемножим все двучлены X — с* и приведём подобные чле- члены. Тогда для коэффициентов сц,..., ап получатся выражения через
§ 1. Общие свойства корней 217 корни Ci,...,Cn: ап = (-l)ncic2...Cn. Формулы A2) называются формулами Виета. Бели бы многочлен / не был нормализованным, т.е. имел стар- старший коэффициент ао ф 1, то формулы, аналогичные A2), давали бы выражения для отношений а»/ао. Формулы Виета, устанавливающие явную связь между корнями и коэффициентами произвольного многочлена, замечательны тем, что их правые части не меняются при любых перестановках корней ci,..., Сп. Это даёт нам повод ввести понятие симметрической функ- функции подобно тому, как в связи с определителями оказалось удобным рассматривать общие кососимметрические функции. Согласно опре- определению, приведённому в п. 4 § 8 гл. 1, элемент тг симметрической группы Sn действует на функцию /(xi,... ,хп) от п аргументов по правилу GГ О /)(ЯЬ . . . ,Sn) = /(^(i),. . . ,Xn(n)). Функция / называется симметрической, если тг о / = / для всех тг Е Sn- Примером симметрических функций служат так называемые элементарные симметрические функции s*: *tiSt2 •••*«*. A3) Они позволяют переписать формулы A2) в виде afc = (-l)Vci,...,c*), fc = l,2,...,n) A2') так что с точностью до знака коэффициент а* многочлена / есть значение функции s* на множестве корней многочлена /. Обратим внимание на тот факт, что по определению a* G Р, хотя корни ci,...,Cn> вообще говоря, лежат в некотором расширении F D Р. Вопрос о существовании F мы сейчас не затрагиваем. Но иногда разложение многочлена на линейные множители является прямым следствием свойств поля Р. Пример 3. Рассмотрим многочлен Хр~1 — 1 над конечным полем Fp (см. п. 6 § 4 гл. 4). Мы знаем, что хр~г = 1 для всех х € FJ, т.е. все ненулевые элементы — корни многочлена Хр~1 - 1. Стало быть, имеет место разложение X*-1 - 1 = (X - 1)(Х - 2)... (X - (р - 1)). A4)
218 Гл. 6. Корни многочленов Предполагается, что мы уже настолько освоились с полем Fp, что без труда раз- различаем двойственную природу чисел 1,2,... ,р - 1 как обычных элементов из Z и как элементов поля Fp 9i Z/pZ (представителей классов вычетов {i}P). Из A2;) и A4) при р > 2 получаем sfcA,2,... ,р - 1) = О (modp), А: = 1,2,... ,р - 2, Последнее соотношение, переписанное в виде (p-l)! + l = 0(modp) A5) и как таковое известное по названием теоремы Вильсона, выражает фактически необходимый и достаточный признах простоты целого числа р. Действительно, выполнение A5) для простых р мы только что доказали. С другой стороны, Р = Р1Р2 => (р- 1)! = Pit => (р- 1)! + 1 £ O(modpi) => (р- 1)! +1 £ O(modp). УПРАЖНЕНИЯ 1. Будет ли кольцо полиномиальных функций над полем из р элементов це- целостным? 2. Пусть Р — бесконечное поле и / — ненулевой многочлен из Р[Х\,..., Хп]- Опираясь на теорему 3 и используя индукцию по п, доказать существование ai,..., ап € Р, для которых f(a\,..., ап) Ф 0. Это даёт изоморфизм Р[Х\,..., Хп] с кольцом полиномиальных функций от п переменных над Р. 3. Ненулевой многочлен / 6 Zp[Xi,.. . ,ХП] степени < р по каждой пере- переменной обладает сформулированным в упр. 2 свойством: /(ai,...,an) ф 0 для некоторых ai,...,an £ Zp. Показать, что любой многочлен / € Zp[Xi,.. .,Л"П] можно записать в виде где /* — редуцированный многочлен (deg^\ /* ^ р — 1, i = 1,2,... ,п) степени deg /* ^ deg /. Сделать обоснованное заключение, что отображение />->/ = /* является эпиморфизмом кольца ZP[X\,...,Хп) на кольцо полиномиальных функ- функций от п переменных над Zp с ядром L = S?=i(-^f "~ ^'i)Zp[Xi,... ,ХП]. 4. Теорема (Шевалле). Пусть /(Xi,...,Xn) — однородный многочлен (форма) над Ър степени г < п. Тогда уравнение /(xi,...,xn) = 0 имеет хо- хотя бы одно нетривиальное решение. Указание. Так как / — форма, то, очевидно, /@, ...,0) = 0. Рассуждая от противного, предположить, что (а\,..., ап) Ф @,..., 0) => f(a\,..., ап) Ф 0. При помощи упр. 3 и малой теоремы Ферма вывести отсюда, что редуциро- редуцированным многочленом для g(Xi,..., Хп) = 1 - f(X\ ,...,Хп)р~1 будет g* (Xi,... 11 = (p-l)deg/ = (p - 1)г < (p - l)n = degg*. Полученное противоречие доказывает теорему. Несколько изменив рассуждение (вычислив сумму 2в1 ,...,«„€ двумя способами), доказать, что общее число решений всегда делится на р. 5. Пусть /(xi,... ,хп) — целочисленная квадратичная форма. Теорема Ше- Шевалле (см. упр. 4), сформулированная на языке теории сравнений, утверждает, что при п ^ 3 сравнение ..,xn) = 0(modp)
§ 1. Общие свойства корней 219 имеет ненулевое решение. Проверить, что все решения сравнения х2 — 2у2 = = 0(mod 5) тривиальны и, следовательно, условие г <п существенно. в. Показать, что НОД(/',/) = 1, если charP = 0, / — неприводимый над полем Р многочлен и /' — его производная. 7. Доказать, что /' = 0 => / = const для многочлена /(X) над полем нулевой характеристики и /' = 0 => /(X) = д(Хр) для многочлена f(X) над полем характеристики р > 0 (д — некоторый другой многочлен). 8. Из п. 3 мы знаем, что каждое дифференцирование кольца многочленов Р[Х] имеет вид Ти: f*->uf\ ueP[X]. Установить справедливость утверждений: i) множество констант (то, что переходит при дифференцированиях в нуль) — подкольцо в Р[Х]\ и) произведение Ть,ТЬу вообще говоря, не является дифференцированием, но если char Р = р > 0, то степень (Ти)р — дифференцирование; iii) коммутатор [Tti,Tv] = TUTV -TVTU всегда является дифференцированием вида 7\у, где w = uv' - u'v. 9. В случае кольца многочленов Р[Х\,..., Хп] от п переменных естественно ввести оператор частного дифференцирования по k-и переменной i) Показать, что множеством констант для пу служит кольцо многочленов Р[Х\,..., Xfc,..., Хп] от п — 1 переменной (char P = 0). и) Пусть f(Xi,. ..,Xn) — форма (однородный многочлен) степени т. Убе- Убедиться в справедливости тождества Эйлера Обратно: если charP = 0, то тождеству Эйлера удовлетворяют только формы степени т = 1,2,3,... 10. Показать, что отсутствие линейных множителей у многочлена равносильно выполнению условия an(l+ ][><) *°- При п ^ 3 неприводимые многочлены над Z2 исчерпываются следующими: X, Х + 1, Х2 + Х + 1, Х8 + Х + 1, АГ8+Х2 + 1. Выписать все неприводимые многочлены над Z2 при п = 4ип = 5 (их будет соответственно 3 и 6). 11. Исходя из сравнения Хъ - X - 1 = (X3 + X2 + 1)(Х2 + X + l)(mod 2), установить неприводимость многочлена X5 — X — 1 над Q. Указание. Применить следствие леммы Гаусса (§ 3 гл. б) и предыдущее упражнение, а также сослаться на факториальность кольца Z2[X]. Аналогично, доказать неприводимость многочлена X5 — X — 1 над Q, перейдя к сравнению по модулю 3 (это гораздо проще).
220 Гл. 6. Корни многочленов § 2. Симметрические многочлены 1. Кольцо симметрических многочленов. Следуя определе- определению симметрических функции1), которое было дано в конце преды- предыдущего параграфа, мы введём аналогичное понятие в кольце А[Х\,... ..., Хп] многочленов над целостным кольцом А. Теорема 3 из § 1, рас- распространённая на многочлены и функции многих переменных, как будто делает такое перенесение излишним. Но следует учесть, что в этой теореме целостное кольцо А коэффициентов бесконечно, а нам хочется иметь универсальную конструкцию. Итак, полагаем Gro/)(Xi,...,Xn) = /(Xff(i),...,Xff(n)). Многочлен / называется симметрическим, если тг о / = / для всех тг е Sn. Как и для функций, вводятся элементарные симметрические многочлены s*: k = 1,2,...,n. Строго говоря, следовало бы рассмотреть многочлен = Yn - sil™-1 + s2Fn-2 + ... + (-l)nsn B) над A[Xi,...,Xn] от новой переменной У и заметить, что s* — симметрический многочлен, поскольку левая часть тождества B) не меняется при любых перестановках линейных множителей У - Х\,... ,У — Хп. Обратим внимание на то обстоятельство, что после подстановки нуля вместо Хп в обе части тождества B) мы получим (Y - Хх)... (У - Х„_х)У = Г* - ЫоГ"-1 + ... + (-1)п-1("»-1)оГ, где (sfc)o — результат подстановки Хп = 0 в s*. Сокращая обе части на Y (на основании теоремы 1 из § 3 гл. 4, применённой к А[Х\,..., Xn, Y]), приходим к тождеству (Y-Xl)(Y-X2)...(Y-Xn-i) = 1 2 + ... + (-ly-WOo. C) Х)В [ВАII] группа Sn по-прежнему называется симметрической, но многочлены и функции — симметричными или кососимметричными в зависимости от того, остаются они при действии Sn на месте или приобретают множитель —1. Такая терминология лучше отвечает сути дела, но традиции гораздо сильнее, поэтому мы оставляем читателю свободу выбора.
§ 2. Симметрические многочлены 221 Сравнивая B) и C), мы приходим к выводу, что (si)o,..., (sn-i)o — элементарные симметрические многочлены от п — 1 переменных Xi,...,Xn_i. Так как, далее, 5г: / н* 7го/ — автоморфизм кольца А[Х\,..., Хп], то любые линейные комбинации симметрических многочленов и их произведения будут снова симметрическими многочленами. Это зна- значит, что множество всех симметрических многочленов образует кольцо, являющееся подкольцом кольца A[Xi,..., Хп]. Наша ближай- ближайшая цель — разобраться, как устроено это подкольцо. 2. Основная теорема о симметрических многочленах. Ока- Оказывается, что наиболее общим способом получения симметрических многочленов является следующий. Нужно взять произвольный мно- многочлен g 6 A\Y\,..., Yn] и подставить вместо Y\,..., Yn соответствен- соответственно si,...,sn. Получившийся в результате многочлен будет, конечно, симметрическим. Заметим еще, что одночлен У^*1... Y£n, входящий в д, переходит при подстановке Y* = Sk(Xi,...,Xn) в однородный многочлен от -Xi,..., Хп степени i\ + 2t2 + ... + mn, поскольку degs* = к. Сумму i\ -f 2t2 + ... + nin называют обычно весом одночлена У/1...YJ}n. Весом многочлена у(Уь..., Yn) естественно считать максимум весов одночленов, входящих в д. Основное утверждение о симметрических многочленах выражает Теорема 1. Пусть f € A[Xi,...,Xn] — симметрический мно- многочлен полной степени т над целостным кольцом А. Тогда существует^ и притом единственный, многочлен g E A[Y\,..., Yn] веса m, для которого Коэффициенты многочлена g являются целочисленными линей- линейными комбинациями коэффициентов исходного многочлена /. Доказательство. В своё время (см. гл. 5 § 2) мы отмечали, что любой многочлен / = f{X\7..., Хп) можно записать в виде сум- суммы однородных форм /т различных степеней: / = /о + /i + ... + /*• Очевидно, что эта запись единственна. Если теперь / — симметри- симметрический многочлен, то симметрическими будут и формы /т, посколь- ку7го/ = £тго/т,а действие ?г: /т н» тг о /т на степень т формы fm не влияет. Таким образом, без ограничения общности симметри- симметрический многочлен / можно считать однородным. Дальнейшие рассу- рассуждения разобьём на несколько частей. 1. Условимся располагать одночлены в / лексикографически (по принципу построения словаря), т.е. таким образом, что одночлен и = аХ[1Х£... Х£ предшествует одночлену v = ЪХ{1Х£... Xfr (или больше одночлена v: и > v) в точности тогда, когда последователь- последовательность ti - л, *2 ~ J2, •.. Лп - in имеет вид 0,... ,0,*,..., где t > 0.
222 Гл. 6. Корни многочленов Справа от t могут стоять и отрицательные разности ii—ji. Одночлен, входящий в / и занимаюпщй первое место при лексикографическом упорядочении, называется высшим членом многочлена /. Обозначим его ВЧ(/). Лемма 1. Высшим членом произведения h = Л1Л2 ... hr являет- является произведение высших членов сомножителей fti, /12,..., hr. Действительно, при п = 1 утверждение верно, а если h = h(x1,x2,.. .,хп) = 0о№, • • • ,хп)х;+91(х2>..., Jwr1+• • •, то ВЧ(Л) = X* • ВЧ(^о)- Взяв теперь разложение по степеням Х\ каждого сомножителя /ц и обратив внимание на то, как получается коэффициент 9о(Х2,. •. ,Хп), мы при помощи естественной матема- математической индукции по п придём к нужному выражению B4(/i) = = Ш=1вч(л4). п 2. Одночлен и = аХ^ Х%*... ХДП условимся называть монотон- монотонным, если z'i ^ %2 ^ ... ^ in- Лемма 2. Высший член симметрического многочлена всегда мо- монотонен. В самом деле, пусть ВЧ(/) = и = аХ^Х£. ..Х£. Допустим, что Ч < h+i при некотором к ^ п — 1. Переставив в и = аХ[г.. .X£fc x х X%kh+i... Х£ местами переменные Хх£ и X*+i, мы получим од- одночлен и1 = aXJ1...X^+1X^1...X^n, из-за симметричности / то- тоже входящий в /. Но, очевидно, и1 > и, поскольку показатели при Хх,...,Xk-i в и, и1 одинаковые, а показатель при X* в и' больше показателя при Xk в и. Полученное противоречие доказывает лем- лемму. D 3. Существование многочлена g{Yi,. ,.,Yn). Предполо- Предположим снова, что и = аХ\хХ£ .. .Х£ = ВЧ(/). В силу леммы 2 ik ^ U+ъ 1 ^ & ^ п — 1. Поэтому мы можем ввести в рассмотре- рассмотрение симметрический многочлен отвечающий одночлену aYi*1""*2!^*2"""*3 ...1^п веса (i\ - г'2) -I- 2(гг - - t3) + ... (п - 1)(гп-1 - гп) -I- mn = ii + г2 + ... + гп = deg/. Так как высшими членами элементарных симметрических многочленов si,S2,...,sn являются, очевидно, Х\,Х\Хг,..., Х\Хъ ...Хп, то по лемме 1 высшим членом в as^^Sj2""*3.. .sjj1 будет Ь{ХхХъ)Ь-Ь... (ХгХ2 ...Хп^У^'^{ХХХ2 . ..Хп)*- = т.е. в точности и = ВЧ(/). Стало быть, он сокращается, в /(Х) не входит и ВЧ(/) > B4(/(i)). Отметим ещё, что коэффициенты мно-
§ 2. Симметрические многочлены 223 гочлена /(i) имеют вид с — qa, где с, а — коэффициенты многочлена /, Я е Z. Пусть v = ЬХ^Хр.-.Х** = ВЧ(/(и), Ь € А. Снова по лемме 2 имеем ji ^ j2 ^ • • • ^ jn и, по изложенным выше соображениям, для симметрического многочлена ,...,Хп) -tei'-^sf^3...s£ получаем ВЧ(/(х)) > ВЧ(/B)). Кроме того, коэффициенты много- многочлена /B) имеют вид а - gift, где q\ 6 Z, a ci,ft — коэффициенты многочлена /(i). Продолжая этот процесс, мы придём к последовательности одно- однородных симметрических многочленов f{k) = / - азГ<\ -.sJT - Ь41Ч2--.*% - ... степени deg/(*) = deg/, для которых ВЧ(/) > ВЧ(/A)) > ВЧ(/B)) > > ВЧ(/(/ь)) > ..., D) причём коэффициенты у /(*) будут Z-линейными комбинациями ко- коэффициентов многочлена /. Так как одночленов фиксированной сте- степени (и тем более монотонных) конечное число, то цепочка нера- неравенств D) должна оборваться (/(*) = 0 при некотором fc); мы полу- получим требуемое выражение f(Xi,..., Хр) = g(si,..., sn), где g(Yi,... ... ,УП) = аУ?-{2У?-{\ .. Y^ + bY(l42Yi24\ .. Y*> + ... 4. Единственность. В случае существования двух различных представлений / = ffi(si,... ,sn) = </2(si> • • • >sn) мы имели бы отлич- отличный от нуля многочлен g(Yu..., Yn) = 9\{YU..., Yn) - ^2(^ь • • •, V'n) веса deg/, для которого p(si,...,sn) = 0. Если aY*lY£2...Y*n — одночлен, входящий в #, то, как мы видели, B4(asfJ ... s*n) = Ясно поэтому, что различным одночленам, входящим в #, отвечают различные высшие члены. Среди них один будет самым высшим, и, стало быть, B4(y(si,... ,sn)) ф 0 вопреки предположению. О На другом языке утверждение о единственности означает, что si,... ,sn алгебраически независимы над А, а кольца A[si,... ,sn] и А[Х\,..., Хп] изоморфны (хотя, разумеется, A[s\ (Х\,..., Хп),... ..., sn(Х\,..., Хп)] — собственное подмножество в А[Х\,..., Хп]). Между прочим, при А = Z коэффициентами многочленов / и g бу- будут целые числа. Из теоремы 1 вытекает ещё полезное Следствие. Пусть f(X) = Хп + aiXn~1 + ... + an-iX + an — нормализованный многочлен степени п от одной переменной X над полем Р, имеющий п корней ci,...,cn в некотором большем поле F D Р. Пусть, далее, ^(A"i,...,Xn) — произвольный симметри- симметрический многочлен из Р[Х\,...,Хп]-
224 Гл. 6. Корни многочленов Тогда его значение /i(ci,... ,сп), получающееся при подстановке с» вместо X», i = 1,... ,п, будет принадлежать полю Р. Доказательство. В самом деле, по основной теореме о симме- симметрических многочленах найдётся многочлен g(Y\,..., Yn) € P[Y\,... ..., Yn] такой, что h(Xi,..., Хп) = g (si (X\,..., Xn),..., sn (Xi,..., -X"n)). Поэтому /i(ci,... ,Cn) = 0(si(cb... ,Cn),... ,sn(cb... ,Cn)), атак как в соответствии с формулами Виета A2) из § 1 Sfc(ci,..., Сп) = (—1)*а* 6 € Р, то и e(-oi,..., (-1)пап) € P. D 3. Метод неопределённых коэффициентов. Существует несколько различных доказательств основной теоремы о симмет- симметрических многочленах, а соответственно и методов выражения заданного многочлена / через элементарные симметрические мно- многочлены. Чтобы описать один из таких наиболее употребительных методов, введём новый тип симметрических многочленов. Для опре- определённости будем брать в качестве А кольцо Z или поле R. Пусть v = X? Х£ ... Х£ — какой-то одночлен. Обозначим через S(v) сум- сумму всех различных одночленов, получающихся из v перестановкой независимых переменных. Например, — Л-й элементарный симметрический многочлен. Далее, pk(X1,...,Xn) = S(X*) = X!+X* + ... + X*, к 2 0, E) есть так называемая к-л степенная сумма. Понятно, что всегда S(v) — однородный симметрический многочлен (называемый ещё моногенным) той же полной степени, что и г>. Так как S(v) = S(aov) для всех а € 5П, то естественно рассматривать лишь многочлены 5(г>), отвечающие монотонным одночленам v. По смыслу ясно так- также, что любой симметрический многочлен / над А является линейной комбинацией с коэффициентами из А многочленов типа S(v): Обычно такая запись получается моментально ("на глазок"). Таким образом, задача сводится к выражению S(v) через элементарные симметрические многочлены. С каждым монотонным одночленом v = Х[ХХ£...Х% ассоции- ассоциируется симметрический многочлен <;v = <;v№,...,^n) = sri2s*2-i3...sjr, F) высшим членом которого как раз и является v. В соответствии со схемой доказательства теоремы 1 вырисовывается следующий метод выражения S(v) через элементарные симметрические многочлены.
§ 2. Симметрические многочлены 225 Пусть degv = m. Берутся все "монотонные" разбиения т = ji + j2 + • • . + jn, jl^J2^.'Z Зп > 0, целого числа т такие, что w = X[l X£... Xnn < v. Рассматривает- Рассматривается множество Mv всех таких одночленов w. Для каждого w € Mv составляется одночлен gw (см. F)). Мы уже знаем, что S = gv+ ]Г n*9w, G) где nw — какие-то целые числа. Неопределённые коэффициенты nw (отсюда и название метод неопределённых коэффициентов) нахо- находятся путем последовательных подстановок в G) вместо Хг,..., Хп каких-нибудь целых чисел, обычно нулей и единиц. Значения gu,9w и S(v) при этом известны, и для nw получается заведомо совместная система линейных уравнений. Пример 1. v = X13JS(v)=p3(Xi,...,A'n), n^3, pv = 8f, gw 8182 83 Уравнение G) в данном случае имеет вид Если Xi = X2 = 1, Х{ = 0 при t > 2, то рз = 2, si = 2, 82 = 1, 83 = 0. Если же Х\ = Х2 = Х3 = 1, Xi = 0 при t > 3, то рз = 3, si = 3, s2 = 3, s3 = 1. Из получившейся системы находим а = -3, 6 = 3, т.е. рз = в\ — 3siS2 + З83. Для выражения степенных сумм pk(X\y...,Хп) в виде многочле- многочленов от 81,82)..., sn имеются рекуррентные формулы, называемые формулами Ньютона: Р* - Рл-Л + Рл-2 + . • • + (-1)*~хР18*-1 + (-1)**в* = 0 (8) при 1 ^ к ^ п; Pfc-Pft-iei+Pft^ + ^. + t-ir^Pft-n+ien-i + t-irPft-nen = 0 (9) при к > п. Чтобы их доказать, воспользуемся очевидными соотношениями Xtn - в!*? + ... + (-l^Sn-iXi + (-l)nsn = 0, получающимися при подстановке Y = Xi в C). Умножая каждое из этих соотношений на Х*"п (к ^ п): ^ ? f1 *-n = 0,
226 Гл. 6. Корни многочленов и производя затем суммирование по г от 1 до п, мы получим не только формулу (9), но и формулу (8) при к = п (р0 = Х% + ... + Х° = = п). Рассмотрим, далее, симметрический однородный многочлен Л,п степени к ^ п (или —оо, если Д,п = 0): Л,„(Хь • ■ •, *») = Р* - Pft-iei + ... + (-l^-W-i + (-1)**вь Используя индукцию по г = п — Л, докажем, что ДэП тождествен- тождественно равен нулю. Для г = 0 этот факт был только что установлен. Полагая Хп = 0 и замечая, что получающиеся при этом симметри- симметрические многочлены (sj)o, (Pi)o совпадают с многочленами S» и р», определёнными для п — 1 переменных Х\>..., Хп-\ (см. C) и E)), мы приходим к равенству = (Р*)о - (p*-i)o(si)o + ... + (-l)*(pi)o(e*-i)o + (-l)*fc(e*H = = fk,n-i{Xi,...,Xn-i) = 0, ибо n — 1 — к = г — 1<г, и применимо предположение индукции. Соотношение Л(П№,."Дп-ь0) = 0 показывает, что много- член fk,n делится на Хп: Д|П = Хп Д. Используя симметричность Д,п, приходим к выводу, что этот многочлен содержит в качестве множи- множителей Xi,Х2,...,-Хп, а значит, и их произведение sn = Х1Х2 ...Хп. Другими словами, Л,.№, ...,хп) = зп(Х!,... ,хп) ■ h(xly..., хп). (ю) Разложение A0) возможно, однако, лишь при h = 0, поскольку degsn = n, a deg/jb>n = А; < п. Итак, ДэП = 0, и доказательство формулы (8) завершено. D 4. Дискриминант многочлена. Рассмотрим в кольце P[Xi,... ..., Хп] многочлен который, очевидно, можно представить в виде определителя Вандер- монда 1 1 ... 1 Х\ Х2 ... Хп хп-1 A1) Так как определитель является кососимметрической функцией своих столбцов, то 7г о Дп = ежАп — знак перестановки 7г € Sn. Но в та- таком случае Д£ — симметрический многочлен, и по основной теореме
§ 2. Симметрические многочлены 227 его можно выразить в виде многочлена от элементарных симметри- симметрических функций Многочлен Dis от si (Хг,..., Хп), ..., sn (Xi,..., Хп) называется дискриминантом семейства Хь..., Хп. Его коэффициенты, очевид- очевидно, лежат в Z.. При подстановке ж» € F вместо X», г = 1,2,...,п (F — какое-то расширение поля Р), можно говорить о дискрими- дискриминанте семейства любых п элементов поля F. Если не все х\,..., хп € 6 F различны, то дискриминант этого семейства обращается в нуль, поскольку хотя бы один из множителей Х{ — Xj будет равен нулю. Способностью Dis выделять этот случай и объясняется сам термин дискриминант. Удобный способ получения дискриминанта основан на интерпре- интерпретации Дп как произведения определителя A1) на транспонирован- транспонированный определитель: Дп = Дп*Ап (вспомним, что det*A = detA для любой квадратной матрицы А). Действуя по правилу умножения матриц, мы сразу же находим Dis(sb...,sn) = n Pi P2 Pi P2 Рз P2 • Рз . P4 • • • Pn-1 Pn • • Pn+1 Pn-1 Pn Pn+1 P2n-2 A2) где pk — известные нам степенные суммы E). Вычислив р* по ре- рекуррентным формулам (8) и (9), мы придём к явному выражению для Dis(si,... ,sn). В частности, pi = si, рг = sf — 2s2} так что Dis(sbs2) = si s? - 2s2 Пусть нам дан теперь нормализованный многочлен f(X) = Хп + сцХ*1 + ... + ап^Х + ап € Р[Х]> A3) имеющий в Р или в некотором его расширении F n корней ci,..., Сп. Как мы знаем из формул Виета, а* = (—l)*sjb(ci,.. .уСп)- Определение. Дискриминант семейства корней с\,..., сп мно- многочлена /, или, что равносильно, значение дискриминанта Dis(si,... ...,sn), получающееся при подстановке (—1)*а* вместо s*, называ- называется дискриминантом многочлена f и обозначается D(f). Он назы- называется также дискриминантом алгебраического уравнения f{x) = xn + агхп-г + ... + ап-хх + ап = 0. A4) Ясно, что D(f) G Р (вспомним в этой связи следствие теоремы 1).
228 Гл. 6. Корни многочленов Как видно из определения дискриминанта, справедливо также Предложение. D(f) = 0 тогда и только тогда, когда урав- уравнение A4) имеет кратные корни (хотя бы один корень кратности С учётом следствия 2 теоремы 5 из § 1 мы имеем теперь два спо- способа, не требующих выхода за пределы основного поля Р, решить, обладает или нет многочлен / 6 Р[Х] кратными корнями. Но значе- значение дискриминанта заключается не только в этом. Скажем, форму- формула A3), применённая к квадратному трёхчлену f(X) = X2 + аХ + + b с вещественными коэффициентами а,Ъ, даёт D(f) = а2 - 4Ь — выражение, известное из элементарной алгебры. В частности, от знака D(f) зависит вещественность или комплексная сопряжённость корней уравнения х2 + ах + b = 0. Пример 2. Вычислим дискриминант так называемого неполного кубичес- кубического уравнения f(x) = Xs + ах + Ь = 0. A5) В данном случае 84 = 0, и вычисление р& по рекуррентным формулам даёт Pl = si = 0, р2 = sf - 2s2 = -2а, рз = ef - 3sis2 + 3s3 = -36, р4 = = sj - 4s^S2 + 4siS3 + 2s^ = 2а2. Следовательно, по формуле A2) имеем 3 0 -2a 0 -2a -36 -2a -36 2a2 = -4a3-2762. A6) Выражение D(f) приобретает более сложный вид (по сравнению с A6)) в случае полного кубического уравнения а?3 + aix2 + ага? + аз = 0, однако от его рас- рассмотрения можно избавиться, как показывает следующее общее рассуждение. Перейдём от аргумента х к у = x+ai/n. Подставляя х = у—а\/п в уравнение A4) и используя биномиальную формулу, находим 2 + ... = 0, A7) т.е. в новом уравнении коэффициент при уп~г равен нулю. Зная корень уо урав- уравнения A7), мы легко найдём также и корень xq = yo-ai/n исходного уравнения A4). Поэтому без ограничения общности можно считать ai = 0. Бели пытаться найти обитую формулу для решения уравнения A5) (в чём преуспели средневековые математики Сципион дель Ферро, Кардано и др.), то неизбежно в игру будет вводиться дискриминант A6) (см. формулы B) из § 2 гл. 1). 5. Результант. Основное свойство D(f)) сформулированное в предложении из предыдущего пункта, интерпретируется также как признак наличия общих корней (или общих множителей) у многочле- многочлена/и его производной /'. В основе этого признака лежит в конечном счёте алгоритм Евклида. Это даёт основание полагать, что имеется аналогичный критерий, позволяющий непосредственно по коэффи- коэффициентам любых двух многочленов f,g £ P[X] решить вопрос о том, обладают они общим множителем или не обладают.
§ 2. Симметрические многочлены 229 Итак, пусть f(X) = а0Хп + QlXn-1 + ... + ап^Х + ап, д(Х) = ЬОХП + biX^1 + ... + Ьт-гХ + Ьт — два многочлена с коэффициентами в поле Р. Здесь п > 0, m > О, но не исключается возможность того, что ао = О или Ьо = 0. Определение. Результантом Res(/,#) многочленов fug называется однородный многочлен (однородная полиномиальная функция) от их коэффициентов (степени га относительно ао,... ,ап и степени п относительно Ьо,..., Ьт) вида т строк п строк В этом определении результанта содержится некое утверждение о его степенях как многочлена. Но оно непосредственно вытекает из свойств определителей: если заменить в первых т строках а» на ta^ то Res(£/,#) = £mRes(/,<7), после чего остаётся сослаться на упраж- упражнение 3 из § 2 гл. 5. Выведем теперь основные свойства результанта. Rl. Res(/,(?) = 0 тогда и только тогда, когда ао = 0 = Ьо или otce fug имеют общий множитель в Р[Х] степени > 0. Убедимся сначала в том, что условие "ао = 0 = Ьо или же / и g имеют общий множитель в Р[Х] степени > 0" выполняется тогда и только тогда, когда найдутся многочлены /i,</i, одновременно не равные нулю, для которых /0i + fi9 = 0, deg Л < пг, deg gi < m. A8) Действительно, пусть h = НОД(/,#), deg Л > 0. Тогда / = ЛД, g = — Лдх, и, следовательно, fgi + gfi = 0. Кроме того, deg/i < п, deg 0i < m, так что A8) имеет место. При ао = 0 = Ьо мы можем положить Д = /, pi = -g. Обратно: предположив при выполнении A8), что НОД(/,(/) = 1, мы ввиду факториальности Р[Х] (см. § 3 гл. 5) придём к импликации /0i = -0/i =* /1/ь 0|0ь Стало быть, deg/ < n, deg# < m, откуда а0 = 0 = Ьо. Мы докажем теперь эквивалентность условий A8) и Res(/, g) = 0.
230Гл. 6. Корни многочленов Положив 9l = и вычислив по формальным правилам коэффициенты многочлена /<7i+/i0 степени ^ п+т—1, мы запишем условие A8) в виде квадрат- квадратной однородной системы линейных уравнений с п + т неизвестными + ... + boco ... =0, aido+aodi+ ... +6iCo + boci ... =0, + aidi + a^di ... -f Ьгсо + biCi + ЬоФ =0, Определитель матрицы системы A9) (точнее, определитель транспо- транспонированной матрицы) совпадает как раз с Res(/, g). Стало быть, сис- система A9) имеет ненулевое решение в точности тогда, когда Res(/,(/) = 0, а всякое ненулевое решение приводит к паре много- многочленов /i,<7i, удовлетворяющих условию A8). D R2. Пусть многочлены fug полностью расщепляются на ли- линейные множители в Р[Х] : Тогда Res(/, g) = а Доказательство. Ясно, что указанные здесь формулы, ес- если они верны, должны носить универсальный характер, не завися- зависящий от частных типов многочленов /,р. Эта несложная "филосо- "философия", в природу которой мы не хотим здесь вдаваться, позволяет нам ограничиться рассмотрением "общего случая", когда, скажем, все p(ai),..., g(an) и все /(Л),..., f{Pm) попарно различны. Далее, так как Res((/,/) = (-l)mnRes(/,(/) (см. определение), то достаточно убедиться в справедливости соотношения Res(f,g) = = aj1 П 9(ai)- С этой целью введём новую переменную Y и над полем рациональных дробей P(Y) рассмотрим многочлены f(X),g(X) - Y. Из определения результанта, где следует заменить Ьт на Ьт — У, получается, что Res(/>9 - Y) = (-1)П<СУП + ... + Res(/,e) — многочлен степени п относительно Y со старшим коэффициентом (~l)naol и с постоянным членом Res(/, g). Многочлены f(X) и g(X) - — 9iai) с общим корнем а» делятся на X — а». Ввиду свойства R1 имеем Res(/,£ - 9(&{)) = 0.
§ 2. Симметрические многочлены 231 По теореме Безу многочлен Res(/,p — У) должен делиться на g(oii) - У, 1 < t < п. Так как все д(щ) у нас различны, то Res(/,£ - У) = <nr=i@(ai) ~ У)- При У = 0 получаем нужное выражение. D Данное в п. 4 определение дискриминанта перенесём на случай ненормализованных многочленов, полагая п 2 R3. Имеет место формула D(f) = (-ly^-wv'Retf. /')• B0) Действительно, согласно R2 Но что является простым следствием подстановки X = а< в общее вы- выражение получаемое дифференцированием произведения f(X) = оо Щ=1 - а^). Таким образом, = ao(-l)n(n-1)/2agn-2 Д(а< - a,J = ao(~l)n(n-1)/2D(/). О Формула B0) даёт явное вьфажение для дискриминанта. УПРАЖНЕНИЯ 1. Пусть р — простое число. При помощи формул Ньютона (9), A0) показать, > .m __ f -l(modp), если тделится на р-1, ~" ^ 0 (modp), если m не делится на р - 1.
232 Гл. 6. Корни многочленов 2. Используя систему рекуррентных формул Ньютона и формулы Крамера, получить следующие явные выражения р* через зк и зк через р*: si 1 0 0 ... О Pfc = 282 383 si 82 1 Si (* - Sfc-2 Sfc-1 Sfc-3 Sfc-2 Pi 1 О P2 Pi 1 РЗ Р2 PI Sfc-4 Sfc-3 0 0 1 1 si 0 0 0 Pfc-l Pfc-2 Pfc-3 Pfc-4 ••• 1 Pfc Pfc-1 Pfc-2 Pfc-3 ••• Pi 3. Пусть ci,C2,сз — комплексные корни многочлена X3 — X + 1. Что можно сказать о расширении Q{c^9 + с^9 + с99)? 4. Многочлен f(X\,..., Хп) над полем Р характеристики ф 2 называется ко- сосимметрическхш (или знакопеременным), если Утг € 5П (тг о /)(Xi,... ,ХП) = = e-Kf(X\y.. .уХп) (как всегда, е* — знак перестановки). Примером кососим- метрического многочлена может служить An = Ylj<i(X% "" Xj)- Показать, что любой кососимметрический многочлен / € Р[Х\,... ,ХП] имеет вид / = Дп • д, где д — симметрический многочлен. Указание. Рассмотреть / как многочлен относительно Хп с коэффициен- коэффициентами в P[Xit... ,Xn-i]. Обратить внимание на то, что в силу кососимметрич- кососимметричности / = 0 при Хп = Xn_i и, стало быть, / делится на Хп — Хп~\. 5. Используя свойство R2 и факт существования поля разложения многочлена (см. следующий параграф), показать, что Res(/9, h) = Res(/, h) ■ Resfo, h). 6. Из упр. 5 и из R3 вывести формулу 7. Чему равен результант Res(/(X),X - a)? 8. Показать, что D(Xn+a) = (-l)n(n-1)/2nnan-1. 9. Пусть f(X) = Xn'1 + Хп~2 + ... + 1. Используя соотношение Хп - 1 = = (X-l)f(X) и предыдущие упражнения, показать, что D(f) = (-l)(n-1)(T*-2)/2x хп1 п-2 § 3. Алгебраическая замкнутость поля С 1. Формулировка основной теоремы. Пусть Р — поле и / — произвольный многочлен над Р. Как уже отмечалось в п. 2 § 1, поведение полиномиальной функции /: Р -» Р, ассоциированной с /, существенно зависит от поля Р. В частности, Im/ = Р, коль скоро deg / > 0, и к Р применимо следующее Определение. Поле Р называется алгебраически замкнутым, если каждый многочлен из кольца Р[Х] разлагается на линейные множители.
§ 3. Алгебраическая замкнутость поля С 233 То же самое можно выразить другими словами: поле Р алгеб- алгебраически замкнуто, если неприводимыми над Р являются лишь мно- многочлены степени 1 (линейные многочлены). Если любой многочлен f € Р[Х] обладает в Р по крайней ме- мере одним корнем, то поле Р алгебраически замкнуто. Действитель- Действительно, тогда f(X) = (X - a)h(X), a e Р, h € Р[Х], но по условию для многочлена h в Р тоже существует хотя бы один корень, т.е. h(X) = (X - b)r(X), Ь е Р, г е Р[Х]. Продолжая этот процесс, мы придём в конце концов к полному разложению / на линейные множи- множители. Так как / — произвольный многочлен, то поле Р удовлетворяет определению алгебраической замкнутости. Хотя и справедливо утверждение о том, что для всякого поля Р существует расширение Р D Р, являющееся алгебраически замкну- замкнутым полем (теорема Штейница), на первых порах всё же трудно воспринять не только конструкцию алгебраически замкнутого рас- расширения, но и саму идею такого расширения. Тем более приятно, что мы фактически располагаем ярким и очень важным примером алгебраически замкнутого поля, как об этом гласит так называемая основная теорема алгебры. Именно, справедлива Теорема 1. Поле комплексных чисел С алгебраически замк- замкнуто. Сформулируем ещё раз это фундаментальное утверждение, те- теперь уже в терминах корней. Произвольный многочлен f(X) степени n ^ 1 с комплексными (или вещественными) коэффициентами имеет ровно п комплексных корней, считаемых со своими кратностями. Громкий титул "основной" теорема 1 приобрела ещё в те време- времена, когда решение алгебраических уравнений было одним из главных занятий алгебраистов. В наши дни теорема 1 относится к числу ря- рядовых, хотя и важных утверждений. Впервые строгое доказательство основной теоремы было пред- предложено Гауссом в 1779 г. С тех пор появилось много вариантов до- доказательства, различающихся между собой, так сказать, степенью алгебраичности. Необходимость опираться на свойства непрерыв- непрерывности полей ЕиС (иначе, на их топологию) проявляется в той или иной форме; есть даже совсем не алгебраическое и очень короткое доказательство, основывающееся на довольно глубоком понятии ана- аналитической функции комплексной переменной. Сейчас будет приве- приведено доказательство, основанное на элементарных сведениях из ма- математического анализа и восходящее к идеям Даламбера, Эйлера, Гаусса, Коши, Аргана. Именно последнему (Argand R., 1814 г.) при- принадлежит наиболее прозрачное изложение, которому с тех пор сле- следуют почти все учебники по алгебре.
234 Гл. 6. Корни многочленов 2. Доказательство основной теоремы. Его неалгебраич- ность начинается с двух вспомогательных утверждений, которые можно найти в любом курсе анализа. 1) Каждый комплексный многочлен f(z) = aozn + axzn~l + ... + an-xz + an, n ^ 1, A) лвллетсл непрерывной функцией в любой точке плоскости С (функ- (функция / : С -» С непрерывна в точке zo Е С, если lim*-^ f(z) = f(zo)] другими словами, для любой окрестности V(f(zo)) найдётся окрест- окрестность U(zo) такая, что при любом z E U(zo) будет f(z) € V(f(zo)). 2) Каждая непрерывная функция f : К ->Жна компакте К С R2 достигает своего минимума в К (компакт — замкнутое ограничен- ограниченное множество). Заметим, что следовало бы говорить о непрерывности полино- полиномиальной функции /: С ->• С, но мы следуем упрощённому языку, принятому в анализе. Компактом у нас будет круг \z\ ^ r некоторого достаточно большого радиуса г, определённого ниже. Тривиальный случай многочлена / со свободным членом ап = 0 исключается из рассмотрения, поскольку тогда / имеет корень zo = 0. Чтобы пояснить геометрически идею доказательства, вообразим себе поверхность, в R3, отвечающую уравнению w = |/(я)|: значе- значения z изображаются на горизонтальной плоскости R2, а значения \f(z)\ откладываются вверх, в направлении оси w, перпендикулярной к R2. Из непрерывности f(z) следует непрерывность функции \f{z)\ на всей плоскости С. Нужно убедиться в том, что хотя бы одной точ- точкой наша поверхность "опирается" на горизонтальную плоскость R2 (ги = 0). Последующие рассуждения разобьём на несколько шагов. Лемма 1. Существует положительное число г £ R такое, что |/B)| > |/@)| длл всех z б С с \z\ > г. Действительно, для z ф 0 имеем \j{z)\ = |г|п|ао + 9{z~l)\> где g(u) = d\U + CL2U2 + ... + апип Е С[и]. Из непрерывности д в точке 0 следует существование такого вещественного 6 > 0, что \д(и)\ ^ ^ |ао|/2 при \и\ < 6. Таким образом, |/B)| £ |,|"(|ио| - М*)!) > \\ao\\z\n при \z\ > 6~х. Следовательно, осталось выбрать любое вещественное число г > 6~х, для которого было бы выполнено неравенство \ао\гп > > 2\ап\. D Следствие (лемма Коши о минимуме). Длл каждого многочле- многочлена / е C[z] существует z0 € С такое, что |/(zo)| = i^Uec 1/0*01- В самом деле, ввиду утверждения 2) непрерывная функция \f(z)\ принимает в круге Dr = {z € С| \z\ ^ г} минимальное значение, т.е. существует zq Е Dr такое, что |/(^о)| = infz€Dr \f(z)\. Но так
§ 3. Алгебраическая замкнутость поля С 235 как \f(zo)\ ^ |/@)|, а по лемме 1 имеет место неравенство |/@)| ^ ^ inf*€c\z>r |/B)|, то |/(*о)| = inf,€C |/(*)|. О Лемма 2. Пусть к — любое целое число ^ 1, и пусть h Е C[z] — многочлен с h@) ф 0. Тогда для каждого а € С* найдётся такое b Е С, что \a + bkh(b)\<\a\. Доказательство леммы исходит из факта непрерывности многочлена h: существует 6 > 0 такое, что при \z\ < S имеет мес- место неравенство \h(z) - /i@)| < |/i@)|/2. Это позволяет нам получить оценку для а + zkh(z) = а + h@)zk + zk(h(z) - Л@)): \а + zkh(z)\ < |а + h@)zk\ + i|fc@)| • \z\k (•) из круга |z| < J. Выберем теперь комплексное число b E С, для которого h(O)b* = -ta, 0 < t < 1 (ниже на вещественное число t будут наложены дополнительные огра- ограничения). В качестве Ь достаточно взять, следуя теореме 3 из § 1 гл. 5, любой корень степени к из —taZi(O) Ф 0. Получаем |а+Л@)Ь*| = A— — t)\a\ и |/i@)| • \Ь\к/2 = ^|а|/2, что в соединении с (*) приведет к нуж- нужному неравенству, коль скоро |Ь| < 6. Мы обеспечим выполнение это- этого условия, наложив на t = ~/i@)a~16fc ограничение t < \h@)a~x\Sk. Итак, подставив в (*) значение z = 6, |Ь| < 6, получаем окончательно \а + ЪкЦЪ)\ £ A - t)\a\ + \ t\a\ = (l " 5 *) Следствие (лемма Даламбера—Аргана). Пусть f(z) —много- —многочлен положительной степени над С. Тогда каждой точке с Е С такой, что /(с) ф 0, отвечает точ- точка с' Е С, для которой Для доказательства многочлен f(z + с), подобно f(z) не являю- являющийся константой, разложим по степеням z: S{x + с) = /(с) + Ь»** + bk+1zk+1 + ... + bnzn, bk ф 0. Другими словами, f(z + c) = f(c) + zkh(z), где h(z) = Ь* + 6*+1z + ... + 6пгп"*, Л@) ^ 0.
236 Гл. 6. Корни многочленов Подставив в формулировку леммы 2 значение а = /(с) ф О, мы мо- можем утверждать существование такого 6 Е С, что при d = Ь+с будет выполнено требуемое неравенство 1/(с'I = |/(Ь + с)| = |/(с) + Ь»Л(ЬI < /(с). □ Геометрический смысл: если на поверхности w = /B) взята точка, расположенная строго выше плоскости w = 0, то обя- обязательно найдётся другая точка на поверхности с более низким рас- расположением. Окончание доказательства основной теоремы (тео- (теоремы 1). Согласно следствию леммы 1 существует такая точка zo € е С, что \f(zo)\ ^ \f(z)\ Для всех z е С. Если f(z0) ф 0, то, как утверждает следствие леммы 2, найдётся такая точка z'o e С, что 1/DI < 1/(*о)| — противоречие. □ Воздерживаясь пока от каких-либо комментариев по поводу про- проведённого доказательства, заметим, что явным аналогом леммы 1 служит, очевидно, Лемма 3 (лемма о модуле старшего члена). Пусть f(z) — мно- многочлен вида A) с произвольными комплексными коэффициентами ao,ai,...,an, п ^ 1. Положим А = max(|ai|,..., |an|), r = -Лт -hi. |ao| Тогда при \z\ > г будет выполнено неравенство \aozn\ > \axzn~l + ... + an_iz + ап\. Доказательство. Если взять \z\ > г, то получим |ao| > i 1 _ ^, откуда согласно правилам действий с модулями комплексных чисел (см. § 1 гл. 5) будем иметь + ... + |an-i*| + |an| ^ laiz"-1 + ... + an^z + an\. □ Следствие 1. Пусть многочлен A) степени п ^ 1 тшеет ве- щественные коэффициенты. Тогда для всех х € R, достаточно больших по абсолютной ве- величине, знак (вещественного числа) f(x) совпадает со знаком стар- старшего члена аохп. Следствие 2. Многочлен нечётной степени с вещественными коэффициентами имеет хотя бы один вещественный корень. Доказательство. Ввиду нечётности п старший член аохп полиномиального отображения / : R -¥ R будет принимать при положительных и отрицательных х Е R разные знаки. Взяв эти
§ 3. Алгебраическая замкнутость поля С 237 значения х достаточно большими по абсолютной величине, мы сог- согласно следствию 1 можем утверждать, что и /(ж) будет иметь раз- разные знаки. Если, например, оо > 0, то /(—г) < 0, а /(г) > 0, где г — вещественное число, взятое из леммы 3. По теореме Больцано- Коши о промежуточном значении функция /, непрерывная на от- отрезке [—г, г] и принимающая на его концах значения разных знаков, должна обращаться в нуль в некоторой точке рассматриваемого от- отрезка: Зс Е [—г,г], /(с) = 0 (на самом деле /(ж) принимает любое промежуточное значение между /(—г) и /(г)). То же рассуждение годится и для оо < 0. D 3. Ещё одно доказательство основной теоремы. От геоме- геометрически наглядного доказательства теоремы 1, приведённого в п. 2, остаётся чувство неудовлетворённости не только у читателя — пок- поклонника алгебры; это чувство было присуще и математикам прошлого века. Недаром Гаусс неоднократно возвращался к основ- основной теореме и дал для неё целых четыре доказательства. Естественно попытаться свести к минимуму атрибутику математического анали- анализа и максимально алгебраизировать все рассуждения. Такое "алгеб- "алгебраическое" доказательство, восходящее к Эйлеру, Лагранжу, Гауссу и Лапласу, приобрело со временем каноническую форму, согласую- согласующуюся с общей теорией Галуа. Ни в коей мере не касаясь последней, мы хотели бы только дать почувствовать аромат известной нам тех- техники. Всё доказательство распадается на две части. 1) Для всякого многочлена / € P[z] степени п ^ 1 существует хотя бы одно поле разложения — такое минимальное расширение F поля Р, в котором содержатся все корни многочлена /. Можно записать F = Р(иь..., un) и f(z) = oq{z - щ)(г - tx2)... {z - un). Для удобства считаем далее / нормализованным (оо = 1). Су- Существование и единственность, с точностью до изоморфизма, поля разложения F D Р для каждого многочлена / € P[z] — это след- следствие общеалгебраической конструкции, на которой мы остановим- остановимся в [ВА III]. Эта конструкция, напоминающая построение кольца классов вычетов Zm в п. 2 § 3 гл. 4, никак не связана со специфи- спецификой основного поля Р. Утверждение о единственности нам вообще не понадобится. В качестве примера отметим, что полем разложе- разложения многочлена z2 +1 над R является поле С. 2) Если часть 1) мы фактически приняли на веру, чтобы не отягощать изложение, то часть 2), являющуюся замечательной ил- иллюстрацией уже усвоенных нами общих принципов (принципа мате- математической индукции и принципа перехода к симметрическим функ- функциям), мы приведём со всеми деталями. В соответствии с замечанием, сделанным непосредственно после определения алгебраически замкнутого поля, необходимо установить существование хотя бы одного комплексного корня у многочлена
238 Гл. 6. Корни многочленов A). Предположим сначала, что все его коэффициенты вещественные, причём без ограничения общности будем считать оо = 1, ап ф 0. Пусть где по — нечётное целое число. Если m = 0, то по лемме 2 много- многочлен / имеет корень, даже вещественный. Применяя индукцию по т, будем считать теорему доказанной для всех многочленов с ве- вещественными коэффициентами, степень которых имеет вид 2т'п'о ст'^ш-1 (на нечётный множитель п'о никаких ограничений не накладывается). Заметим, что по следствию 2 леммы 3 основание ин- индукции, отвечающее значению га = 0, у нас имеется (единственный фрагмент неалгебраической природы). Рассмотрим поле разложения F многочлена (z2 + l)/(z), су- существующее в силу 1) и содержащее С в качестве подполя. Пусть ui, 1*2,..., ип — корни многочлена / в F. Рассмотрим в F элементы l^Kj^n, B) где а — какое-то фиксированное вещественное число. Следовало бы писать Vij (а), но мы этого делать не будем, чтобы не усложнять обо- обозначения. Число п' элементов вида B) равно /п\ _ п(п - 1) Ы где По — нечётное целое число. Многочлен из кольца F[z] имеет степень п', а его корнями по определению явля- являются все элементы B). В соответствии с формулами Виета A2) из § 1 коэффициентами Ь\,..., Ьп» многочлена fa(z) будут с точностью до знака элементарные симметрические функции s* от Vij. Подставив в 8л(^12,^1з? • • • >un-i,n) выражения элементов v^ через txi,... ,un, мы получим функцию >... ,txn) = sjk(.. .,ищ + а(щ которая тоже является симметрической. В самом деле, для любой перестановки тг Е 5П EП — симметрическая группа степени п) имеем тг о Vij = un{i)unU) + a{un{i) + un{j)) = Vn(i)MJ) (или г;,гу)>1Г(<), если тт(г) > тг(,;)), так что тг индуцирует переста- перестановку тг на множестве элементов вида B). В силу симметричности
§ 3. Алгебраическая замкнутость поля С 239 ..,vn-i,n) не меняется при перестановке аргументов, поэтому GГ О /lfc)(ui,. . . , tin) = 8*(ТГ О Vi2, 7Г О t713> . . . , 7Г О Vn_i,n) = (.. ,un). Заметим, что hk(u\,...,un) есть значение при Х% = и», г = 1,...,п, симметрического многочлена hk(X\,..., Хп) с вещественными коэф- коэффициентами, зависящими только от а € R. По основной теореме о симметрических многочленах (теорема 1 из § 2) найдётся многочлен gk(Yi>-.. ,Уп) с вещественными коэф- коэффициентами такой, что Л* (Xi,..., Xn) = gk (si (Xi,..., Xn), ... ..., sn(Xi,..., Xn)). Стало быть, ,...,tin) = Sfc(ei(ui,... ,un),... ,sn(txb... ,txn)) = (напомним, что а» — коэффициенты рассматриваемого унитарного многочлена / G R[z)). Итак, коэффициенты 6* многочлена fa(z) оказались веществен- вещественными при любом о € R. Так как deg/a = n' = 2т~1п'о (см. C)), то по предположению индукции /а имеет хотя бы один комплексный корень, который, конечно, должен совпадать с одним из t;^. Меняя находящийся в нашем распоряжении параметр a 6 R, мы будем по- получать другие многочлены fa(z) с вещественными коэффициентами. Каждому из них соответствует пара индексов г < j (зависящая от а) такая, что элемент Vij = ищ + а(щ -h Uj) € F содержится в под- подполе С поля F. Так как различных пар индексов i < j всего (^), & вещественных чисел aGK бесконечно много, то найдутся два раз- различных вещественных числа а, а' с одной и той же отвечающей им парой индексов, скажем, г = 1, j = 2 (это вопрос нумерации корней ub...,un), для которых -ha(ui +112) = с, + a'(ui +1*2) = с', а ф a', будут комплексными числами. Из этой системы уравнений следует, что и с —с1 с — d принадлежат полю С. Коль скоро это так, элементы txi,U2 будут кор- корнями квадратного многочлена (г - u\)(z - U2) = z2 - (ui +112J
240 Гл. 6. Корни многочленов с комплексными коэффициентами. По известным формулам так что iti,i*2 тоже оказываются комплексными числами. Таким образом, для рассматриваемого многочлена f(z) с вещественными коэффициентами найдены даже два комплексных корня. Пусть теперь f(z) — многочлен вида A) с произвольными комплексными коэффициентами (можно считать оо = 1, но это не- неважно). Заменяя все а* комплексно сопряжёнными числами, мы по- получим многочлен f(z) = aozn + aiz"-1 + ... 4- an^z + an. Введём многочлен Ф) = /(*)/(*) = eoz2n + exz2- + ... + e2n степени 2п с коэффициентами Так как операция сопряжения z »-> z является автоморфизмом поряд- порядка 2 поля С (теорема 1 из § 1 гл. 5), то ё* = X^i+i=fc й^а^ = е^, а это означает, что е* Е R. По доказанному многочлен e(z) с веществен- вещественными коэффициентами имеет хотя бы один комплексный корень с: Отсюда вытекает, что либо /(с) = 0, и теорема доказана, либо /(с) = 0, т.е. йосп + а\сп~1 4-... 4- an_ic -I- an = 0. Применяя к обе- обеим частям этого равенства автоморфизм комплексного сопряжения, получим аос* 4- ai?1 4-... 4- an-ic 4- ап = 0, т.е. /(с) = 0. □ Алгебраической замкнутостью поля С (а также фактом су- существования поля разложения многочлена) удобно пользоваться при решении различных задач. Пример. Пусть So (/) — множество всех различных корней многочлена / € € С[Х], а Si(f) — множество всех его "единиц": € S\(f) <=> f(d) = 1. Пусть теперь fyg — какие-то многочлены из С[Х]. Требуется показать, что So(f) = SoW, Si (Я = A to) =» /W = pW- Так как, очевидно, So(f)nSi(f) = 0, то согласно результатам § 1 достаточ- достаточно показать, что |5о(/) U 5i(/)| ^ n + 1, где n = deg /. По теореме 1 где
§ 4- Многочлены с вещественными коэффициентами 241 В соответствии с теоремой 5 § 1 имеем f(xy = (f(x) -1)' = f[(x - «у*-1. Д(х - d,)*i-*. л(Х), так что (п -«/) -f (n - /х) = Е(«< - 1) + ]С(^- - 1) ^ deg f(X)' = n - 1. Стало быть, Время от времени появляются новые доказательства основной теоремы алгебры как иллюстрации передовых идей математики. Обратим внимание на топологические доказательства, использую- использующие понятия гомотопии, степени отображения, порядка кривой, кри- критической точки и пр. С ними можно познакомиться по элементарным вводным курсам: 1. Стинрод #., Чинн У. Первые понятия топологии. — М.: Мир, 1967. 2. Милнор Дж., Уоллес А. Дифференциальная топология. — М.: Мир, 1972. 3. Торп Дж. Начальные главы дифференциальной геометрии. — М.: Мир, 1982. § 4. Многочлены с вещественными коэффициентами 1. Разложение на неприводимые множители в ЩХ]. Из теоремы 1 § 3 следует, что каждый многочлен / степени п в С[Х] может быть записан, и притом единственным образом (с точностью до перестановки множителей), в виде /(X) = а(Х - С1)(Х - с2)... (X - с), где а ф 0, Ci,...,Cn — комплексные числа. Пусть теперь f(X) = = Хп + aiXn-1 + ... + ап~\Х + ап — нормализованный многочлен с вещественными коэффициентами а\,..., оп и с — какой-то его комп- комплексный корень: с = u + iv, v ф 0. Применяя к соотношению /(с) = 0 автоморфизм комплексного сопряжения, как мы это делали во вто- втором доказательстве теоремы 1 из § 3, получим, что и /(с) = 0, по- поскольку а» = а». Стало быть, f(X) делится на многочлен второй степени д{Х) = (X - с){Х - с) = X2 - (с + с)Х + ее = X2 - 2иХ + (и2 + v2) с отрицательным дискриминантом D(g) = Аи2 - 4(w2 + v2) = -4v2 < < 0. Условие D(g) < 0 необходимо и достаточно для неприводимости над R квадратного многочлена д € ЩХ]. Если, далее, к — кратность корня с многочлена f(X) и / ^ к — кратность корня с, то f(X) делится на J-ю степень многочлена у(Х): = g(X)lq(X).
242 Гл. 6. Корни многочленов Частное q(X) двух многочленов из ЩХ] будет тоже многочленом из ЩХ], причём при к > I элемент с € С будет его корнем кратности к — I, в то время как с корнем не является. Мы видели, однако, что это не так. Значит, к = I (предположение I ^ к рассматривается аналогично), т.е. комплексные корни всякого многочлена из ЩХ] по- попарно сопряжены. Мы приходим к заключению, что для элементов факториального кольца ЩХ] справедливо следующее утверждение. Теорема 1. Любой нормализованный многочлен / € ЩХ] сте- степени п разлагается единственным образом (с точностью до поряд- порядка множителей) в произведение т ^ п линейных многочленов X—Ci, соответствующих его вещественным корням сь.. .,Ст, и (n-m)/2 квадратных многочленов, неприводимых над R и соответствующих парам комплексно сопряжённых корней. Замечания. 1) Неприводимый многочлен из ЩХ] либо линеен, либо квадратичен, с отрицательным дискриминантом. 2) В обозначениях теоремы 1 имеет место соотношение £>(/) = (~l)(n""m)/2|D(/)|, т.е. знак дискриминанта определяется числом пар комплексно со- сопряжённых корней. Это соотношение получается либо непосредствен- непосредственно из определения дискриминанта, либо при помощи формулы, содер- содержащейся в упр. б из § 2. Пример 1. д(Х) = Х2п + 1. Так как д(Х) вещественных корней не имеет, а комплексные корни с* = сое *—2п + tsin*—2?Г» 1 $ * ^ 2п (опре- (определённые по формуле A6) из § 1 гл. 5), все простые, то вещественные неприво- неприводимые множители входят в д(Х) с показателями 1. Очевидно, б* = c2n+i-fc при так что A) 2. Простейшие дроби над С и R. Теперь, когда мы знаем общий вид неприводимых многочленов над СиИ, естественно вер- вернуться к теме простейших дробей (п. 3 § 4 гл. 5), поскольку именно эти случаи важны в теории интегрирования. Мы знаем, что нор- нормализованные неприводимые многочлены имеют вид X — с над С и X2 + аХ + Ь или X - с над R. Поэтому простейшими дробями над С будут у/(Х — с)т, 7 € С, а в случае R к ним добавятся дроби вида (аХ+/?)/(Х2+аХ+Ь)т. Практически удобным методом разложения правильной дроби f/g в сумму простейших над С и R при известном каноническом разложении знаменателя д(Х) является метод неопре- неопределённых коэффициентов. Проиллюстрируем его парой примеров.
§ 4- Многочлены с вещественными коэффициентами 243 Пример 2. Бели д(Х) = (X + 1J(Х2 + 1) — каноническое разложение над R, то для дроби 1/д(Х) имеем (X + 1J(Х2 + 1) (Х+1J с не определёнными пока коэффициентами а, /3,7,6 € R. Умножив обе части этого равенства на д(Х)} получим 1 = а(Х2 + 1) + 0{Х + 1)(Х2 + 1) + GХ + <*)(* + IJ. (*) Сравнивая теперь коэффициенты при 1,Х,Х2,Х3, придём к неоднородной ли- линейной системе из четырёх уравнений с четырьмя неизвестными Q + 0+ <*=1, р+ 7+ 26=0, О + 0 + 27+ 5=0, 0 + 7 =0» которая, конечно же, совместна и определённа, как это следует из теоремы 3 из § 4 гл. 5. Решая её, приходим к заключению, что 1 11 X (X + 1J(Х2 + 1) 2(Х + IJ + 2(Х + 1) 2(Х2 + 1) * Можно поступить более разумно, подставляя непосредственно в (*) вместо X конкретные числовые значения -l,t (корни неприводимых множителей). Это сразу даст а = 1/2, (ry + SJi = 1, или у = -1/2, 6 = 0. При X = 0 получится соотношение для р. Пример 3. Пусть deg/(X) < п,д(Х) = (X-ci)(X-C2).. .(Х-Cn) с попарно различными элементами с\, сг,..., Сп из С или R. Тогда (X-ci)(X-c2)...(X-Cn) откуда При X = сЛ, 1 ^ А; ^ п, имеем /(Cfc) = ак{ск - Cl) . . . (Cfc - Cfc-!)(Cfc - Cfc+i) . . . (Cfc - Cn), атак как Получающаяся в результате формула Лагранжа имеет прямое отношение к интерполяционной формуле Лагранжа D) из § 1. Действительно, если умножить обе части в B) на д(Х) и положить /(с*) = 6^, то получится формула D) из § 1.
244 Гл. 6. Корни многочленов В применении к дроби 1/д(Х) с д(Х) = X2 -f 1 рассуждения из примера 1 и формула B) показывают, что X2» 1 2n 2 л ск X - — разложение на простейшие дроби над С, поскольку д'(Х) = 2nX2n~1, g'(ck) = = 2ncj^1c|n = -2nc^1. Объединение слагаемых с комплексно сопряжёнными ко- коэффициентами даст нам разложение на простейшие дроби над R: 3. Проблема локализации корней многочлена. Будем смот- смотреть на многочлен / G R[X] как на вещественнозначную функцию х н» /(х) вещественного аргумента х, изображая последнюю графи- графиком на плоскости с прямоугольной системой координат хОу. Вещест- Вещественным корням многочлена f(X) (или нулям функции f(x)) отвеча- отвечают абсциссы точек пересечения графика с осью х (рис. 25). Следует Рис. 25 ожидать, что корни алгебраического уравнения /(ж) = 0 будут на- находиться между экстремальными точками (или в экстремальных точках), являющимися в свою очередь корнями алгебраического уравнения f'(x) = 0 более низкой степени. Первый важный вопрос, с которым обычно сталкиваются на прак- практике, — это вопрос о границах вещественных корней, т.е. об интер- интервале а < х < Ьу внутри которого должны содержаться все веществен- вещественные корни заданного многочлена /. Собственно говоря, из леммы 3 § 3 мы уже знаем, что при |х| > А/|ао| 4-1 (по — старший коэффи- коэффициент, А = max {|oi|,..., \ап\}) функция f(x) не обращается в нуль, даже если бы мы вышли на комплексную плоскость. Более точные границы корней указаны в упр. 1-4. Общая проблема локализации {отделения) корней многочлена за- заключается в том, чтобы для каждого из вещественных корней ука- указать интервал, внутри которого находится только один этот корень, а для каждого интервала указать число находящихся на нём вещест- вещественных корней.
§ 4- Многочлены с вещественными коэффициентами 245 Впервые удовлетворительное, хотя и несколько громоздкое ре- решение этой задачи было достигнуто Штурмом в 1829 г. Прежде чем переходить к формулировке соответствующей теоремы и её доказа- доказательству, введём необходимые определения. Определение 1. Пусть 5 = {ci,C2,... ,Ст] — конечная пос- последовательность отличных от нуля вещественных чисел, и пусть V(S) — число индексов г, 1 < t < m — 1, для которых с*с»+1 < 0. То- Тогда V(S) называется числом перемен знаков в последовательности 5. Если S содержит нули, то под V(S) следует понимать число пере- перемен знаков в укороченной последовательности £", получающейся из S вычёркиванием нулей. Например, У ({1,0,2,0, -3,4,0,0, -2}) = 3. В дальнейшем без огра- ограничения общности будем предполагать, что интересующий нас мно- многочлен f(x) с вещественными коэффициентами не имеет кратных корней, чего, как мы знаем (см. конец п. 4 § 1), всегда можно до- добиться. Определение 2. Конечная упорядоченная последовательность отличных от нуля многочленов с вещественными коэффициентами /о(*) = /(*), Л(*), ...,/.(*) C) называется системой Штурма (или рядом Штурма) для многочлена f(x) на отрезке [а, ft] (а ^ х ^ ft), если выполнены следующие условия: i) последний многочлен Д(х) не имеет корней на [a, ft]; И)/о(а)/оF)*0; iii) если Д(с) = 0 для с <Е [a, ft] и 1 < k < s - 1, то /jb-i(c)/*+i(c) < <0; iv) если /(с) = 0 для с £ [a,b], то произведение fo(x)f\(x) меняет знак с минуса на плюс, когда х, возрастая, проходит через точку с. Другими словами, существует такое S > 0, что /о (я)Л (я) < 0 для х €]с- 6,с[ и /o(z)/i(x) > 0 для х Е]с,с + <5[. Заметим, что соседние многочлены системы C) не имеют на [a, ft] общих корней: если /*-i(c) = fk(c) = 0, к ^ 1, то /*-i(c)/*+i(c) = 0, что противоречит условию iii). Положим для краткости Ус = W) = П{/о(с),/1(с),...,Л(с)}), с£[а,Ь]. Теорема 2 (Штурм). Число корней вещественного многочлена f(x) степени п ^ 1 на интервале ]a,ft[ равно разности Va - И, где величины Va, Vb отвечают какой-то фиксированной системе Штур- ма C). Доказательство. Совокупность всех различных веществен- вещественных корней на [a, ft] многочленов системы Штурма C) разбивает от- отрезок [a, ft] на подынтервалы ]uj , aJ+i [ca = ao<ai<...<am = ft, в которых ни один из многочленов /»,0 ^ г ^ 8, не имеет корней. Мы собираемся сравнить значения Vc для различных точек с €]a[
246 Гл. 6. Корни многочленов Для начала пусть с Е]ао, ai[, так что /о, •••,/« не имеют корней в ]ао,с[. По теореме Больцано—Коши о промежуточном значении должно выполняться условие f%(ao)fi(c) ^ 0 для 0 ^ i ^ s. В случае /»(с) ф 0 для всех г имеем fi(ao)fi(c) > О, откуда Vao =VC.B случае же Д (ao) = 0 для некоторого fc обязательно к ф 0, s из-за свойств i), ii) системы Штурма. По свойству ш) имеем Д_1(ао)Д+1(ао) < 0. В то же время fk-\{x) и fk+i{x) не имеют корней в ]оо,с[, так что по теореме Больцано—Коши fk-i(ao)fk-i(c) > 0 и A+i(ao)/*+i(c) > 0. Значит, что fk-i(c)fk+i(c) < 0. Мы приходим к выводу, что при вычислении Vao и Vc подпоследовательности A-i(ao),O,/fc+i(ao) и /*-i(c),/*(c), A+i(c), независимо от значения Д(с), вносят одина- одинаковый вклад (по одной перемене знака). Это верно для всех к с /(ао) = 0, поэтому Vao = Vc. Аналогичное рассуждение годится для точки из другого крайнего интервала: с €]am_i,am[=^ Ус = УЛт. Пусть теперь с €]aj-i,a^[, d G]aj,oJ+i[ — точки из двух сосед- соседних интервалов, 1 < j < т — 1 (рис. 26). Действуют те же соображе- соображения. Именно, соединение уже проведённых рассуждений показывает, что Vc = Ус/, если только f(a>j) ф 0: Vc = Vaj = CLj — l C OLj Рис. 26 В случае fo(aj) = f(o>j) = 0 впервые появляется различие. По условию iv) имеем /o(c)/i(c) < 0 и fo(c')fi(c') > 0, т.е. у подпосле- подпоследовательности /o(c),/i(c) будет одно изменение знака, а у /о(с/), /i(c') — ни одного. В то же время наши предыдущие рассуждения показывают, что при к > 1 у подпоследовательностей A_i(c), Д(с), /*+i(c) и Д-1(с/), Л(с'), /fc+i(c') число перемен знаков одинаково. Все это означает, что если /(oj) = 0, то Vc - Ус/ = 1. Фиксируем точки с* Е ]а^—i>ajb[9 1 ^ к ^ т, и записываем тож- тождество v. - v» = (V. - vei) + X;(Vc - vCk+t) + (vCm - vb). к=1 Мы знаем, что выражения в крайних скобках равны нулю, в то время как _/0, если /Ы^О, 1, Г< Других корней на отрезке [а, Ъ] у многочлена f(x) нет (по построению все корни многочленов системы Штурма сосредоточены в точках ao,ai,a2,. ..,am). Суммируя, получаем окончательно, что разность Va - Vt равна числу корней многочлена f(x) на интервале ]о,Ь[. D
§ 4- Многочлены с вещественными коэффициентами 247 Чтобы применять доказанную теорему, надо научиться строить системы Штурма для каждого конкретного вещественного много- многочлена /(х). Чаще всего используется стандартная система Штур- Штурма, получающаяся небольшим видоизменением известного нам из гл. 5 алгоритма Евклида. Именно, в последовательности E) из § 3 гл. 5, начинающейся с /о(я) = /(ж), Д(х) = f'(x) (производная мно- многочлена), остаток, взятый с обратным знаком, принимаем за очеред- очередной многочлен строящейся системы. Более точно, полагаем /о(») = /(*), Д(*) = /'(*); /о (s) = qi (ж) Д (х) - h {х), deg /2 < deg Д; D) = qk(x)fk{x) - /*+i(z), deg Д+i < degД; /*-i(z) =q*(x)f8{x). По определению fa(x) = НОД(/,/') — отличная от нуля константа, поскольку мы предполагаем, что f(x) не имеет кратных корней (если мы этого заранее не знали, то, получив систему D), перешли бы к системе gk{x) = Д(х)/Д(х), О О < *)• Теорема 2. Только что построенная система /о(*) = /(*), Д(*) = /'(*), /2(х), ..., /.(*) E) является системой Штурма. Действительно, свойство ii) выполнено по предположению, а свойство i) входит в определение Д (х) = const ф 0. Если Д (с) = 0, то из D) видно, что /fc_i(c)/fc+i(c) ^ 0, причём fk-i{c) = 0 в точности тогда, когда /&+i(c) = 0. Но если это так, то 0 = Д-х(с) = Д(с) = = /fc-j-i(c) = Д+г(с) = ... вопреки тому, что Д(с) ^ 0. Стало быть, Д-1(с)Д+1(с) < 0, а это есть свойство ш). Наконец, предположим, что /о(с) = 0 для некоторой точки с € [а, Ъ]. Тогда /0(х) = (х - с)д(х), д(с) ^ 0 и /o(z)/i(z) = (x-c)[g2(x)-f (x-c)g(x)g'(a;)] = (x-c)g(x), где ^(х) = g2(x)-f (x-c)q(x)q'(x). Имеем g(c) = g2(c) > 0, и, следователь- следовательно, д(х) принимает положительные значения в малой окрестности ]с - 6, с + 5[ точки с. Множитель х - с, однако, способствует тому, что произведение fo(x)fi(x) меняет знак с минуса на плюс при воз- возрастании х и прохождении его через с. Таким образом, система E) обладает свойством iv). D Замечание 1. Система Ао/о(х), Ai/i(x), ..., АвД(х), E') получающаяся из E) умножением её членов на положительные константы Ло, Ль..., Ав, также будет системой Штурма. Будем на-
248 Гл. 6. Корни многочленов зывать её почти стандартной системой Штурма. Это полезно иметь в виду при вычислениях. Замечание 2. Условие отсутствия кратных корней у f(x) не является существенным при подсчёте числа различных веществен- вещественных корней, как показывает конструкция стандартной системы Штурма: следует перейти от Д(х) к <?*(х) = fk(x)/f8(x) и заметить, что Vc(g) = Ve(f). Замечание 3. Согласно лемме 3 из § 3 для каждого многочлена fi(x) системы Штурма существует такое число г», что вещественные корни этого многочлена лежат между —г» и г», Пусть М — любое достаточно большое число, скажем, М = тахо^«*Ч. Тогда веще- вещественные корни всех многочленов fi(x) = ащхк{ + ... расположены между —М и М. Более того, при х = М знак fi(M) совпадает со знаком его старшего члена o.(i)Mki. Конкретное значение величины М совершенно несущественно для нашей процедуры, поэтому при ра- разыскании общего числа различных вещественных корней многочлена f(x) мы полагаем чисто символически х = — М и х = М. Замечание 4. По преданию, сам Штурм так гордился своим (действительно замечательным) достижением, что обычно, изложив доказательство студентам, добавлял: "Вот теорема, имя которой я ношу". Рассмотрим несколько примеров. Пример 4. f(x) = х3 + Зх - 1. Находим fx{x) = f'(x) = Зх2 + 3; далее, /(х) = (Зх2+3)£х+2х-1 и /2(х) = -2х + 1; Зх2 + 3 = (-2х + 1) (-§* - |) + Т и /з(х) = — ^р- Согласно замечанию 1 в качестве системы Штурма можно взять х3 + Зх — 1, х2 + 1, — 2х + 1, — 1. Составим таблицу знаков для старших членов: х3 Зх2 -2х -1 2 1 Получаем V_m - Vm = 1, т.е. х3 + Зх - 1 имеет один вещественный корень. Пример 5. /(х) = х3 + Зх2 — 1. Легко видеть, что стандартная система Штурма для /(х) имеет вид х3 + Зх2 - 1, Зх2 + 6х, 2х + 1, 1, а таблицей знаков для старших членов будет г3 Зх2 2х 1 3 О Приходим к выводу, что /(х) имеет три вещественных корня: У-м — Ум = 3. Пример 6. /(х) = 1 + х + %j- +... + ^т (среэаммал экспонента). Очевидно, что вещественные корни этого многочлена,' если они есть, находятся в интерва- интервале ] — М, —£[, где E > 0 — достаточно малое вещественное число (как всегда, М — большое положительное число). В качестве нестандартной системы Штур- Штурма на отрезке [—М, — 8] можно взять тройку /о(х) = /(х), fi(x) = /'(х) = 1 + х + + ?«- + ... + jpx_ 1^| и -^гг = -/(*) + /4х) (проверить, что все свойства i)-iv)
§ 4- Многочлены с вещественными коэффициентами 249 выполнены). Из таблицы знаков /о А /2 -м д 1 + + (-II1- видно, что f(x) при чётном п не имеет вещественных корней, а при нечётном п имеет один отрицательный корень (как легко понять, стремящийся к —сю при возрастании п = 2т + 1). Пример 7. f(x) = ж3 + рж + q. Почти стандартной системой Штурма (см. замечание 1) для f(x) на любом отрезке [о, Ь] может служить /о = /, Д = Зж2 + + р, /2 = -2рж - Зд, /з = -4р3 - 27q2 с естественным ограничением f(a)f(b) ф 0. Полезно отметить, что /з = D(/) — дискриминант многочлена / (см. A6) из § 2, где следует заменить а и 6 на более традиционные коэффициенты р и q). Из общих соображений ясно, что /(ж) имеет либо один вещественный корень, либо три. Если рассмотреть три варианта для пары (sgnp, sgn D(f)) с учётом импликации р ^ 0 ==> D(f) ^ 0, то из таблицы для знаков 3 х2 -2рх D(f) м sgnp sgnD(/) + -sgnp sgnD(/) легко извлекается правило, согласно которому один корень будет при D(f) < 0, а три — при D(f) > 0. 4. Вещественные многочлены с вещественными корня- корнями. Мы остановимся ещё на практически важном случае, когда из каких-либо соображений известно, что все корни многочлена f(x) = = Х^=о akXn~k e Щх] вещественные. Для удобства введём два обоз- обозначения: га(/) — число положительных корней многочлена / (с учётом патностей); W(f) = К({ао> аь..., ап}) — число перемен знаков в упорядочен- упорядоченной последовательности коэффициентов многочлена /. Ясно, что всегда 0 ^ W(f) ^ п = deg/, причем W(-f) = W(f). Заметим также, что W(f) = W{aXk+a^X711 +...), где показатель к удовлетворяет единственному условию к > п — i\ (коэффициенты ai,...,^-! нулевые) и aao > 0. Если W(f) = 0, то, очевидно, / не имеет положительных корней. С другой стороны, у / может не быть положительных корней и в том случае, когда W(f) = deg/. Пример: f(X) = X2 — X + 1. Всё же, как мы увидим, символ VF(/) имеет прямое отношение к числу положительных корней многочле- многочлена /. Справедливо, например, следующее правило знаков Декарта: W(f) ^ m(/), причём m(f) = W(f) (mod2). He останавливаясь на его доказательстве, перейдём к интересующему нас случаю. Теорема 3. Пусть все корни многочлена f G Ш[Х] веществен- вещественные. Тогда m(f) = W(f). Доказательство. Будем исходить из наглядных соображе- соображений. По известной теореме Ролля из анализа (или по теореме о сред- среднем) между корнями а1 и Ь1 нашего многочлена f(X) найдётся чи- число с € М, а! < с < Ь', для которого f'{c) = 0. Отсюда следует,
250 Гл. 6. Корни многочленов что все корни производной f'{X) вещественны и m(/') = m(f) или () В самом деле, пусть с\ < сч < ... < сг — корни многочлена / кратностей п\, П2,..., пг, так что ni -f П2 + ... -f nr = deg/ = п. По теореме 5 из § 1 производная /' имеет корни ci,С2,...,сг кратностей rii — 1,пг — 1,... ,пг — 1, а в промежутках между ними по теореме Ролля ещё хотя бы по одному корню с[, 4,..., c'r_v Всего получается (п\ — 1) + ... + (пг — 1)+г — 1 = п — 1 вещественных корней. Так как deg /' = п — 1, то других корней у /' и нет. Пусть, далее, cj_i < 0, a cj,...,cr — все положительные кор- корни кратностей nj,...,nr: щ + ... + nr = m = m(/). Положитель- Положительными корнями производной /(X) будут корни с/,... ,сг кратностей nj — 1,...,пг — 1, корни с{,...,cj.__x и, возможно, ещё корень с\_г, т.е. число их m(f') = тп(/) — 1 или ш(/), как и утверждалось. Анали- Аналитическим выражением этого факта служит почти тавтологическая формула m(f) = m(f) +е, е = |A - (-1)«(/)+™(/')). F) Заметим ещё, что если f{X)=aoXn + ... + an-vXv, G) где ап-и — последний отличный от нуля коэффициент, то Здесь д{Х) = аоХп-т + ... + ЬХ\ а0 > 0, Ь > 0 (i/ < 0). Таким образом an-,, = {-l)mtfl.. .с^гЬ, причём cP'.-.cJJ-b > 0. Другими словами, (-1)^)ап_, > 0. (8) При п = 1,2 утверждение теоремы очевидно. Рассуждая теперь по индукции относительно п = deg/, допустим, что теорема дока- доказана для всех многочленов степени < п. Если в G) v > 0, т.е. ап = 0, то f(X) = X • А(Х), причем т(/) = т(/0 = W(/) (m(/i) = () по индукции). Остаётся рассмотреть случаи ап ф 0. Пусть f'(X) = па0Хп-1 + ... + рап-цХ»-1, ап^ ф 0. Тогда 2 \ W(f) = Щ/') + E, 5 = \(\ - ^nziL^ = 0 или * = 2 \ lOOl/ Но мы знаем (см. (8)), что (-1)т</>а„ > 0 и (-1)т^;)ап_м > 0. Поэтому 5 = A - (-l)m(/)+m(/'))/2 и, стало быть, S = е. Так как по предположению индукции W(f') = тп(/'), то окончательно имеем = m(/') + е или, сравнивая с F), m(f) = W(/). D
§ 4- Многочлены с вещественными коэффициентами 251 Следствие (частный случай теоремы Бюдана—Фурье). Пусть все корни многочлена f вещественны. Тогда число его корней, лежащих в интервале ]а, Ь[, равно f)W(f)d — разложения в ряд Тейлора (см. упр. 3). Доказательство. По определению число m(fa) положитель- положительных корней многочлена /а равно числу корней заданного многочлена /, больших, чем а. То же замечание относится к Д. Следовательно, число корней многочлена /, заключенных между а и Ь (а < 6), равно разности m(fa) — га(Д), которая по теореме 3 выражается в виде W(fa) ~ W(fb). □ 5. Устойчивые многочлены. Нормализованный многочлен /(X) = Хп + сцХ"-1 + ... + ап-гХ + ап с вещественными коэффициентами называется устойчивым, если все его корни лежат в левой полуплоскости (рис. 27): У / /(Л) =0, Л = а + г/3 =Ф а < 0. Терминология ведёт своё происхождение из тео- теории дифференциальных уравнений. Получаемые там критерии асимптотически устойчивого Рис-27 поведения физической (а в более широком смысле — механической, технической или экономической) системы в окрестности положения равновесия требуют, чтобы было lim eAt = 0, (9) где Л — произвольный корень многочлена /, ассоциированного с дифференциальным уравнением порядка п с постоянными коэффи- коэффициентами. Так как по формуле Эйлера (см. A5) из § 1 гл. 5) ext = = eatei/3t = eat(cos/3t -I- isin/?£), то доминирующим членом является eat, и условие (9) эквивалентно неравенству а < 0. Возникает своеобразная проблема локализации — проблема Рауса—Гурвица2\ когда непосредственно по коэффициентам мно- 2)Фактически поставленная гораздо раньше A868 г.) английским физи- физиком Д.К. Максвеллом и решённая для небольших степеней русским инжене- инженером И.А. Вышнеградским, который занимался задачей устойчивости регулятора A876 г.).
252 Гл. 6. Корни многочленов гочлена / надлежит выяснить, является ли он устойчивым. Эта ал- алгебраическая задача была решена ещё в 1895 г. Критерий Рауса— ГУрвица гласит слеующее. Многочлен f устойчив тогда и только тогда, когда выполнены неравенства Г1>0, Г2>0, ..., Гп>0, A0) где аг 1 0 0 0 0 ... О а3 а2 а\ 1 0 0 ... О B5 О>4 аЗ а2 а1 1 ... О CLf CLq B5 B4 B3 B2 ... О (предполагается, что а8 = О при s > п). Не пытаясь доказать теорему Рауса—Гурвица (это более умест- уместно делать в других курсах), мы обратим внимание на то обстоя- обстоятельство, что её формулировка своим изяществом целиком обязана теории определителей. Далее, согласно теореме 1 при выполнении условий A0) много- многочлен f(X) представляется в виде произведения множителей вида X + и, X2 + vX + w с и > 0, v > 0, w > 0, а это значит, что все коэффициенты устойчивого многочлена f(X) положительны: ai >0, а2 >0, ..., ап > 0. A1) Таким образом, условия A1) необходимы для устойчивости мно- многочлена f(X). He являясь в общем случае достаточными, они позволя- позволяют, однако, приблизительно вдвое понизить число детерминантных неравенств A0). Это удобно, так как вычисление определителей — трудоёмкое дело. Пример 8. При п = 2 система неравенств Pi > 0, Г2 > 0 эквивалентна более простой: oi > 0, 02 > 0, что, между прочим, видно из формул для корней квадратного уравнения. При п = 3 все сводится к неравенствам oi > 0, 02 > 0, аз > 0, а\а2 > аз> поскольку Гз = аз (аiO2 - аз). Наконец отметим, что критерий Рауса—Гурвица не решает всех вопросов, связанных с устойчивостью, поскольку на практике речь идёт о многочленах и о дифференциальных уравнениях, коэффици- коэффициенты которых зависят от параметра. В терминах самого параметра должны формулироваться и условия устойчивости, что представляет собой задачу совсем иной природы. 6. Зависимость корней многочлена от коэффициентов. Понятно, что корни многочлена являются функциями его коэффи- коэффициентов. Мы хотим теперь подчеркнуть, что эти функции непре- непрерывны, т.е. при достаточно малом изменении коэффициентов изме-
§ 4- Многочлены с вещественными коэффициентами 253 нение корней пренебрежимо мало. Кратные корни, впрочем, могут распадаться, и геометрически динамика изменения зачастую при- приобретает причудливые формы. Достаточно сравнить многочлены zn игп + е при е -> 0, чтобы почувствовать эту сложность. Качествен- Качественному и количественному сравнению многочленов способствует Теорема 4 (Руше). Если для двух многочленов fo{z) и fi(z) имеет место неравенство для всех z на границе замкнутой области D С С, то многочлен fo(z) + fi(z) имеет внутри D столько же корней, сколько и много- ыы fob). Доказательство этой теоремы, причём в более общем контексте, получается элементарными средствами теории функции комплексной переменной, поэтому мы его опускаем. □ Пусть теперь zq — корень кратности к многочлена /о(я) = aozn + + a\zn~l + ... + ап. Рассмотрим многочлен f(z) = (оо + S0)zn + (ах + й)*11-1 + ... + (ап + 6п) = fo(z) + fx(z) с \5i\ < 6, где 6 > 0 — сколь угодно малое вещественное число. Рас- Рассмотрим круг D = {z € С| \z - zo| ^ е} с центром в z0 и столь малого радиуса е > 0, что zq — единственный корень многочле- многочлена /о(z) в замкнутой области D. Функция \f(z)\ непрерывна и не обращается в нуль на окружности \z — 2го| = е — границе круга J9, поэтому /х = inf|2_zo|=£ |/oB)| > 0. Возьмём 6 столь малым, чтобы при \z — zo\ = е имело место неравенство |Л(г)| < /х. Тогда будут вы- выполнены условия теоремы Руше, и мы приходим к выводу, что f(z) и fo(z) имеют внутри D по одинаковому числу к корней. В частно- частности, простой корень (А: = 1) при малом шевелении коэффициентов остаётся простым, лишь чуть смещаясь. Фактически мы обеспечили ту локализацию корней многочлена f(z), которая гарантирует их непрерывную зависимость от коэффи- коэффициентов многочлена fo{z). Доказанный результат формулируется также в следующей форме. Теорема 5. Пусть /o(z) = zn + a\zn~x + ... + an — нормализо- нормализованный комплексный многочлен, Ci,..., сп — его корни. Для любого е G М, е > 0, существует S е Е, 6 > 0, такое, что для каждого нор- нормализованного многочлена f(z) = zn + a'lzn~l +... + а*п такого, что \aj -clj\ < 6, 1 ^ j ^ n, имеет место разложение f(z) = Щ=1(г~"с;)> причём \cfj - Cj\ < е, 1 ^ j ^ п. Можно привести доказательство этой теоремы, не опирающееся на теорему Руше (см., например: Amer. Math. Monthly. — 1989. — V. 96, № 4), но нам важнее обратить внимание на суть дела.
254 Гл. 6. Корни многочленов 7. Вычисление корней многочлена. Полное решение проб- проблемы локализации (особенно если учитывать все корни, включая комплексные, когда речь идёт не об интервалах, а об областях на плоскости С) даётся дорогой ценой. Остановимся вкратце на мето- методах вычисления "локализованного корня" с заданной степенью точ- точности. Пусть мы уже знаем достаточно узкий интервал ]а, Ь[ веществен- вещественной оси, содержащий единственный интересующий нас простой ко- корень многочлена f(x). Тогда f(a)f(b) < 0. Разделим интервал ]а, Ь[ на 10 равных частей. Одна из этих частей ]ai,bi[c]a,b[ (и только одна) обладает свойством f(ai)f(bi) < 0. Значит, с €]ai,bi[. Интер- Интервал ]ai,&i[ делим снова на 10 равных частей и выбираем ту часть ]u2)b2[c]ai,bi[, для которой /(аг)/^) < 0. Так как с €]ai,2>i[, то процесс можно продолжить, получая приближение к истинному знаг чению корня с точностью до 0,1, до 0,01 и т.д. Этот метод испыта- испытаний (десятичных, если делят интервал на 10 частей; двоичных, если делят интервал пополам) удобен, если мы не претендуем на вычисле- вычисления с большой точностью и располагаем простейшими вычислитель- вычислительными средствами. Универсальным, но весьма трудоёмким является метод Лоба- Лобачевского, позволяющий находить приближённые значения всех кор- корней одновременно, в том числе и комплексных, причём без предвари- предварительной процедуры их отделения. Широкое хождение получил метод линейной интерполяции (или метод ложного положения). Он заключается в том, что в качестве приближения к корню берётся число см), делящее интервал ]а,Ь[ на части, пропорциональные |/(а)| и |/(Ь)|. Другими словами, bf(a)-af(b) A) №-W - а Кусочек кривой у = /(ж) при этом заменяется хордой (рис. 28). Рис. 28
§ 4- Многочлены с вещественными коэффициентами 255 Процесс можно повторить, аналогичным образом получая при- приближение СB) И Т.Д. В достаточно малой окрестности ]а, Ь[ корня с кусочек той же кривой можно заменить отрезком касательной в одной из точек. Бели со — какое-то приближение к корню (со = а на рис. 28), то по теореме Лагранжа о конечном приращении имеем откуда при х = с получим 0 = /(с) = /(со) + /'(со)(с - со). Поэтому в качестве следующего приближения естественно взять а = со — - /(<*>)//'(<*>)• Положим ^ = 0,1,2,... A2) Предположив сходимость рекуррентной последовательности A2), а именно с* -> с при к -> оо, мы получим с = с- /(с)//' (с), откуда /(с) = 0. При правильном выборе исходной точки со все точки нашей последовательности будут лежать в интервале ]а, Ь[ и с = с. На рис. 28 показана лишь одна из четырёх возможных картинок, отвечающих поведению первых двух производных f'(x), f"(x) на интервале ]а,Ь[. Детали мы опускаем, предоставляя читателю самому рассмотреть оставшиеся случаи. Только что описанный метод Ньютона относится к числу наи- наиболее употребительных и быстро сходящихся. Элементарными мето- методами анализа показывается, что если \f"(x)\<M2 при хе[а,Ь) то \с\ — с\ ^ Tnnrfo "" С12- Поэтому выбрав точку со так, что М мы придём к оценке 7yrr\ck - с| ^ д2*. Как говорят, имеет место квадратичная (ниш сверхэкспоненциальнал) сходимость приближе- приближений к корню с. Метод Ньютона хорош тем, что он годится без из- изменений для вычисления произвольных комплексных корней много- многочленов из C[z]. В основу кладётся рекуррентная последовательность A2). Разумеется, ограничившись наброском голой схемы вычислитель- вычислительных методов, мы не коснулись фактической организации вычисле- вычислений. Современная вычислительная математика располагает для этой цели широким арсеналом средств. Входить в профессиональные тон- тонкости математика-вычислителя у нас нет возможности. 8. Рациональные корни целочисленных многочленов. О многочленах над Q и над Z мы имели возможность поговорить в п. 4
256 Гл. 6. Корни многочленов § 3 гл. 5, где обсуждалась проблема разложения данного многочлена над Q на неприводимые множители. Сейчас мы остановимся на го- гораздо более простом вопросе о выделении рациональных линейных множителей многочлена / Е Q[X], т.е. фактически о рациональных корнях. Умножив / на общий знаменатель коэффициентов, мы пе- перейдём к многочлену из Z[X], поэтому целесообразно с самого начала ограничиться рассмотрением целочисленных многочленов. Теорема 6. Пусть несократимая дробь p/q является корнем многочлена f(X) = аоХп + aiXn'1 + ... + ап е Z[X], aoan ф 0. Тогда р\ап и q\ao. Доказательство. Действительно, по условию +... + On-i-+On = 0. \Q/ \Q/ Я После умножения обеих частей равенства на qn получаем (ЮРп + aipn-lq + ... + an-lPqn-1 + anqn = 0, Таким образом, q\aopn, а так как q к р взаимно просты, то Аналогично, из равенства вытекает, что р\ап. Следствие. Рациональные корни нормализованного многочле- многочлена должны быть целыми числами. Итак, решение вопроса о наличии рациональных корней много- многочлена сводится к следующим действиям: 1) перебору всех делителей свободного члена и всех делителей старшего члена; 2) составлению из них несократимых дробей; 3) проверке посредством подстановки дроби в многочлен. На этом этапе можно воспользоваться методом Горнера. Бели все испытания приведут к отрицательному результа- результату, то это значит, что у многочлена нет рациональных корней. Громоздкий перебор всех делителей полезно начинать с ±1. Вы- Вычисление /A) и /(—1) не представляет затруднений. Если теперь це- целое число с является корнем многочлена /(X), то f(X) = (X—c)q(X)i где q(X) = boXn~~l + biXn~~2 +... + 6n_i. Из схемы Горнера непосред- непосредственно следует, что ft^GZ, О^г^п — 1. Поэтому частные тоже должны быть целыми числами. А это значит, что если d E е Z и d|an, но хотя бы одно из чисел /(l)/(d - 1) или /(-l)/(d + 1) не является целым, то заведомо f{d) ф 0. Разумеется, целостность /(l)/(d-l) и /(-l)/(d+l) не является гарантией того, что f(d) = 0.
§ 4- Многочлены с вещественными коэффициентами 257 Пример 9. /(X) = Х5+2Х4-15Х3-2Х+6. Имеем /A) = -8, /(-1) = 24. Делители d = ±6 сразу отпадают, поскольку d+1 не делит 24. С другой стороны, для d = 2 имеем /A)/B-1) G Z и /(-1)/B + 1) € Z, но /B) ф 0. То же относится и к d = — 3. Целым корнем на самом деле является делитель d = 3. УПРАЖНЕНИЯ 1. Пусть /(X) = aoXn + aiX*1" + ... + ап — вещественный многочлен степени п. Показать, что значение верхних границ положительных корней мно- многочленов /(X), Хп/A/Х), /(-X), Хп/(-1/Х) даёт нижние и верхние границы как положительных, так и отрицательных корней многочлена /(X). 2. В обозначениях упр. 1 пусть оо > 0, т — наименьший индекс, для кото- которого ат < 0, В — максимум среди абсолютных величин отрицательных коэф- коэффициентов. Показать, что для всякого положительного вещественного корня многочлена /(X). Указание. При х > 1 исходить из оценки f{x) ^ оохп — В-—ж_1 ~1 > >«=£гЧаох'»-1(*-1)-В]. 3. Пусть Р — поле нулевой характеристики, о € Р. Для любого многочлена / € Р[Х] степени п имеет место формула {формула Тейлора) /(Х) = /(а) + £М(* - а) + ф(Х - .,» + ... + ^1(Х - а)». Указание. Продифференцировать /с раз формальное выражение /(X) = = 53 6j(X — а)г и положить X — а. 4. Показать, что если /(о) > 0, /;(о) > 0,..., /(nHa) > ° ДЛ* вещественного многочлена /(X) степени п с положительным старшим коэффициентом ао, то /(с) = 0, с>0=^с<а. Указание. Применить упр. 3. 5. Воспользовавшись правилом знаков Декарта, найти знак дискриминанта многочленов X5 — X2 + 1, X3 — 6Х — 9 (см. замечание в конце п. 1). 6. Могут ли многочлены X5 — X — 1, X3 + аХ + 6 € Q[X] иметь общие комплексные корни? Напомним (см. упр. 11 из § 1), что многочлен X5 — X — 1 неприводим над Q. 7. Показать, что корни многочлена /(X) = X5 + иХА + vXz + w € R[X] со свободным членом w ф 0 не могут быть все вещественными. Указание. Удобно перейти к взаимному многочлену Х5/AХ) и далее вос- воспользоваться формулами A2) из § 1 и (8) из § 2. 8. Любой многочлен /(X) с f{x) ^ 0 для всех ж € К можно представить в гдед,НеЩХ]. Указание. При помощи теоремы 1 разложить /(X) на множители вида (X + оJ + Ь2 и воспользоваться формальным тождеством (Р2 + 92)(г2 + *2) = (pr + qsf + {ps - qr)\ вытекающим из соотношения \р + ig|2|r + is|2 = \{р + iq)(r + is)|2. 9. Получить самостоятельно критерий устойчивости многочленов степеней 3 и 4. При п = 4 записать его в виде неравенств: ai > 0, a4>0, aiO2>0, аз(аю2 - аз) ?
258 Гл. 6. Корни многочленов Указание. /(X) = X3 + аХ2 + ЬХ + с = (X2 + аХ + 0)(Х + в), где а = = а + в, 6 = /? + а0, с = /30, причем а, 0,0 € R. Устойчивость /(X) эквивалентна устойчивости пары многочленов Х2 + аХ + /?, Х + 0, т.е. выполнению неравенств а > 0, /? > О, 0>О. Легко проверяется, что эта система эквивалентна системе неравенств а>0,Ь>0,с>0, ab — с>0. Аналогичные соображения применить к вещественному многочлену степени 4. 10. Имеет ли многочлен /(X), стоящий в числителе несократимой рацио- рациональной дроби /(*) 3 1 2 Х-3 д(Х) X + 2 (X - IJ X - 1 X2 + 1' вещественные корни? 11. Показать, что все три корня неприводимого над Q многочлена f(z) = zz— — 7z — 7 — вещественные и лежат в интервале ] — 2,4[. Вычислить положительный корень методом Ньютона с точностью до третьего десятичного знака. 12. Опираясь на теорему Руше (теорема 4), показать, что многочлен f(z) = = z5 + 5z2 — 3 имеет два корня в единичном круге и три корня в кольце между окружностями \z\ = 1 и |г| = 2. 13. Сколько вещественных корней имеет многочлен zA + 12z2 + bz - 9? 14. Многочлены Лежандра Ро(Х) = 1, Pi(X) = X,... ,РП(Х),... определя- определяются рекуррентной формулой тРт(Х) - Bт - l)XPm-i(X) + (т - 1)Рт_2(Х) = 0. Показать, что: a)Pn(l) = l,Pn(-l) = (-l)n; б) {Рп, Pn-i, •.., Ро} — система Штурма для РП(Х) на отрезке [-1,1]; в) Рп(Х) имеет п различных корней на интервале ] — 1,1[.
Приложение НЕРЕШЁННЫЕ ЗАДАЧИ О МНОГОЧЛЕНАХ Ниже звёздочками отмечены задачи, решений которых в мате- математической литературе (по состоянию на 2000 г.) действительно не существует. Остальные задачи в принципе решены, но либо неалге- неалгебраическими, либо неэлементарными средствами. Понятно, что для решения открытых проблем все средства хороши. Формулировки задач сопровождаются небольшими комментари- комментариями, призванными способствовать пониманию существа дела и рас- расширению кругозора. Дополняющий их список литературы минималь- минимальный. 1*. Проблема якобиана. Пусть Д,..., /n £ С[Х\,..., Хп]. Под Vjfi = dfi/dXj понимается частная производная многочлена fa по j-й переменной Xj — результат применения оператора частного диф- дифференцирования (см. упр. 9 из § 1 гл. 6). Будем считать, что /*@,... ...,0) = 0, 1 ^ i ^ п. Введём новые переменные Х{,...,Х'п форму- формулами Х'г = /l(-^i)--- >-X"n)) ..., Хп = fn{Xi>.. . ,ХП). п Полиномиальное отображение F = (Д,..., /п): Х{ и> Хг', 1 ^ г ^ ^ п, определяет эндоморфизм (гомоморфизм в себя) алгебры много- многочленов C[Xi,..., Хп]. Его матрица Якоби ... 2>n/i обратима в точности тогда, когда определитель detJ(F) = ■Dxfn называемый якобианом и являющийся, вообще говоря, многочленом, будет отличной от нуля константой (элементом из С*). Если F — автоморфизм, т.е. если найдутся многочлены д\,..., дп такие, что то, как легко убедиться, якобиан обратим. Верно ли обратное утвер- утверждение? Другими словами, верна ли импликация det J(F) € С* => F — автоморфизм? (*)
260 Нерешенные задачи о многочленах Это и есть проблема якобиана, сформулированная О. Келлером в 1939 г. и остающаяся нерешённой при всех п ^ 2. Две специальные группы автоморфизмов алгебры C[Xi,..., Хп] видны сразу. Это группа GLn всех линейных невырожденных пре- преобразований и группа Вп, элементы которой получаются компози- композицией "треугольных" полиномиальных отображений вида Xi н+ Xi + ti(Xi+u... ,Xn), 1 ^ i ^ п, ие С[ХЬ... ,Xn]. В том, что эти отображения обратимы, убедиться совсем несложно. Например, при п = 3 имеем Х{ = Хг + tl(X2iX3), Х*2 = Х2 + *2(Х3), Х5 = Х3. Отсюда Каждый ли автоморфизм, оставляющий скаляры на месте, полу- получается композицией элементов из GLn и Вп? Предполагается, что при п ^ 3 это не так. Более того, гипотеза Кагаты гласит, что ответ должен быть отрицательным даже применительно к конкрет- конкретному автоморфизму F: X» н> Х[ вида Х{ = Хг - 2Х2(Х!Х3 + XI) - Хг{ХхХг + Х22J, Х*2 = Х2 + Хз(Х!Х3 + Х|), Х^ = Х3. Отметим, что J{F) = 1, причём X! = Х{ + 2Х£(ВД + X?) - Х£(Х{Х£ + Х^2), Хг = Х2 — Хз(Х{Хд 4- Х'2 ), Хз = Х3. Существует много разных подходов к проблеме якобиана (алгеб- ро-геометрических и функциональных), комбинирование которых привело к частичному успеху. Положим degF = maxi^i^n deg/t. Ес- Если п = 2 и degF ^ 150, то ответ на вопрос (♦) оказывается положи- положительным. Кроме того, доказано, что с точностью до GLn достаточно рассматривать многочлены вида fi = Xi + /w(Xi,...,Xn), I ^ i ^ n, где все компоненты hi — кубические однородные формы (deg hi = 3), а матрицаЯкоби J(H) для Н = (hi,..., hn) нильпотентна: (J(#))n = = 0. Правда, в процессе редукции число переменных п увеличивается по сравнению с исходным. Более подробно с имеющимися результатами относительно про- проблемы якобиана можно познакомиться по обзорной статье: Bass /Г., Connell E.H., Wright D. Jacobian conjecture// Bull. Amer. Math. Soc. — 1982. — V. 7, № 2. — P. 287-330.
Нерешенные задачи о многочленах 261 2*. Задача о дискриминанте (Е.А. Горин). Пусть — нормализованный многочлен, коэффициенты которого а», 2 ^ i ^ ^ п, суть рациональные функции на С (т.е. рациональные дроби из C(z)). Предположим, что дискриминант D(f) многочлена f тожде- тождественно равен 1. Возможно ли при этом, чтобы не все коэффици- коэффициенты а,{ были константами? Известно следующее. а) Если особенности (полюса) всех а» расположены в точках 0 и оо (либо знаменатель q несократимой дроби a» = p/q делится на г, либо degp > degg), то a», 2 ^ г < п, — константы. б) Если п = 3 или п = 4, то все а* — константы. При п = 3 дело сводится к рациональным решениям уравнения и2 + v3 = 1 (см. п. 4 § 2 гл. 6), которое в свою очередь редуцируется к уравнению Ферма степени 3. Но известно, что если /п + gn = ftn, где /,р,Л € C[z] и Н0Д(/,у,/1) = 1, то при п > 2 многочлены /,у,Л являются на самом деле константами. При п = 4 используется куби- кубическая резольвента Феррари. Случай п = 5 остаётся без ответа. 3. Задача о двух порождающих кольца многочленов. Из- Известная из математической литературы теорема Абъянкара—Моха утверждает, что если C[f(z),g(z)] = С[г], т.е. многочлены /,р по- порождают всё кольцо многочленов, то: i) пара f,g разделяет С, т.е. z\ ф z^ => f(z\) ф f{z%) или ii) производные f(z),g'(z) не имеют общих нулей. Для этой теоремы пока нет простых доказательств. Требуется найти элементарные подходы. Решающее утверждение в одном из вариантов доказательства: если для пары f,g выполнены свойства i), ii), то либо deg/|degy, либо deg#|deg/. Теорема Зайденберга—Лина (ДАН СССР. — 1983. — Т. 271, № 5) устанавливает в свою очередь, что если пара /, g G C[z] разделяет С, то где с € С, а НОД(А;,/) = 1. В частности, система f'{z) = 0, g'(z) = О имеет не более одного решения. Это утверждение сильнее, чем тео- теорема Абъянкара—Моха. К теореме Зайденберга—Лина также тре- требуется найти элементарный подход. Следует отметить, что замена С на Е невозможна. По-видимому, нет аналогов указанных теорем, где вместо пары /,у рассматрива- рассматривались бы тройки /,р,/1и т.д.
262 Нерешенные задачи о многочленах 4*. Задачи о критических точках и критических значе- значениях (В. Sendov, S. Smale, А.И. Кострикин, Э.Б. Винберг). Пусть f(z) — комплексный многочлен, 0/ = {в G C| f{9) = 0} — множе- множество его критических точек. Значения /(в), отвечающие критиче- критическим точкам в G 0/, иногда называют критическими. а) Доказать, что если все нули (корни) многочлена f(z) = = О/ь=1 (^ ~ ск) степени n ^ 2 лежат в единичном круге D\ = {z G е С| \z\ ^ 1}, то для каждого с* круг {z e C| \z-Ck\ ^ 1} содержит по крайней мере одну критическую точку. С результатами в этом направлении можно познакомиться по ста- статье: Miller M.J./I Trans. AMS. — 1990. — V. 321, № 1. — P. 285-303. Общая алгебро-геометрическая концепция, относящаяся к роли критических точек многочленов, изложена в книге: Marden M. Ge- Geometry of polynomials. — Providence, R.I.: AMS, 1966. Проблема Сендова уточняет один известный результат из этой книги, согласно которому любой круг Д., содержащий все нули мно- многочлена f(z), содержит также все нули его производной. В это очень легко поверить, предположив, что все нули f(z) вещественные, и про- просмотрев ещё раз доказательство теоремы 3 из § 4 гл. 6. б) Доказать, что если / — комплексный многочлен степени п такой, что /@) = 0, /'@) Ф 0, то 0€в, в п-1 п Смейл доказал существование критической точки в, для которой т.е. дана требуемая оценка с худшей константой. Для многочленов степени п ^ 4 проблема решена. Константа (п — 1)/п неулучшаема, как показывает пример многочлена f(z) = zn — п~ *z. в) Обозначим символом Сп множество так называемых консерва- консервативных многочленов f(z) = zn 4- aizn~~l + ... + an-iz, определяемых свойством: f'F) = 0 =Ф fF) = в. Таким образом, консервативный многочлен, рассматриваемый как отображение /: С -> С, оставляет начало координат и все свои критические точки на месте. Известно (Tischler D.// Complexity.— 1989), что \Сп\ = ^1\\ поэтому для консервативных многочленов степени п проблема Смей- ла, сводящаяся к доказательству неравенства |/'@)| ^ п ^ , реша- решается в принципе конечным перебором. Но для этого нужно распола- располагать явным описанием многочленов из Сп, что известно пока лишь при п ^ 6. Более слабое неравенство |/'@)| > 1 справедливо для любого / еСп.
Нерешенные задачи о многочленах 263 Было бы крайне интересно исследовать геометрию нулей и не- неподвижных точек консервативных многочленов. г) Пусть / — многочлен степени п с вещественными коэффици- коэффициентами и с вещественными критическими точками @/ С Щ. Мно- Множество всех таких многочленов обозначим через Vn. Каждому / Е е Vn сопоставим вектор cr/ е Жп~~1 по следующему правилу. Пусть 9\,..., вп-1 — критические точки для / (с учётом кратностей), рас- расположенные в порядке неубывания. Тогда cr/ = (/(#i),..., /@n-i)) — вектор критических значений. Очевидно, что вектор (ci,... ,cn_i) G £ Жп~г может иметь вид сг/ для некоторого / G Vn только в том случае, когда (-l)*(c*-Cfc+i) ^ 0 для всех к или, наоборот, (-1)*(с*- - Cfc+i) ^ 0 для всех к, т.е. последовательность ei,...,Cn-i "пи- "пилообразна" . Довольно сложным образом доказано, что всякому пилообразно- пилообразному вектору с = (ci,...,Cn_i) отвечает многочлен f 6 Vn такой, что erf = с. Многочлен f определён однозначно с точностью до линейной замены аргумента х и- ах + Ь, где а, Ь G R, а > 0. Существует ли элементарное доказательство этого факта! 5. Задача о глобальной сходимости метода Ньютона {Smale S.//Bull. Amer. Math. Soc. — 1985. — V. 13, № 2). Будем по- понимать под римановой сферой S множество С комплексных чисел с присоединённым символом оо, а под рациональным эндоморфизмом S в себя — отображение z и- P(z)/Q(z), где Р и Q — многочлены. Рациональный эндоморфизм Ньютона Nf : S -ь Sy ассоцииро- ассоциированный с комплексным многочленом f(z) степени п, определяется известной нам из п. 7 § 4 гл. 6 формулой A2): Число ( 6 С С S является неподвижной точкой для Nf (т.е. Nf(Q = С) в точности тогда, когда С — нуль многочлена /. В этом случае, кстати, значением производной N'f будет N'f(Q = (n-l)/n — число, встретившееся нам в п. 4, б). Метод Ньютона вычисления корня (нуля) многочлена / может рассматриваться как итерация отображения Nf. N/((o) = Co, Cm = = Nf(Cm-i) = iV^(Co). В математической литературе наших дней пару (iV/, S) считают динамической системой и применяют к её изу- изучению хорошо развитую технику. Как уже отмечалось, |iV£(С)| < 1, и, значит, существует окрест- окрестность U точки С такая, что limm-+oo N™(z) = С Для любой точки z G U. При этом С называется стоком (или притягивающей непо- неподвижной точкой для iV/), а открытое множество В = (Jm>o N7m(U) — бассейном стока С- Точка a G С называется стоком периода к для
264 Нерешенные задачи о многочленах Nf) если N$(a) = а и \(N$)'(a) < 1. При к > 1 точки а,ЛГ/(а),... ..., iVj~1(a) различны, причём в некоторой окрестности U Э ос ите- итерации iVUz) для z £ 17 будут приводить к асимптотическим циклам вокруг a,Nf(a),...,Nf~l(a), не давая в результате неподвижных точек. А это значит, что если Nf обладает стоком периода к ^ 2, то о глобальной сходимости Nf "для почти всех z G С" говорить не приходится. Построить многочлен / любой степени n ^ 3 с пе- периодическим стоком для Nf довольно легко. Например, при п = 3 таковым является многочлен fo{z) = t*zs — z + 1. Многочлены, до- достаточно близкие к /о, будут также обладать этим свойством. При п = 2 ситуация совершенно иная. Именно, пусть многочлен f(z) = z2 + az + b обладает двумя различными корнями £,77, и пусть L — прямая, перпендикулярная отрезку [£, rj\ и проходящая через его середину. Тогда непосредственно проверяется (хорошее упраж- упражнение), что для любой точки z G С \ L, т.е. почти всюду, последова- последовательность {NJl(z)} сходится к С или т]. Пусть, например, f(z) = z2—d, d E E, d > 0. В этом случае L = Ш — мнимая ось, проходящая через середину отрезка [—-\/d, Vd\. Так как Nf(t) G IR для любого t € Е и Nf(it) = it H—r-— = i It ^— I G E, то NFfa) G iE. Значит, начав с чисто мнимого числа z = it, мы никогда не сойдём с пря- прямой L и, естественно, не получим методом Ньютона приближения к л/d или — Vd. Наоборот, единственное условие Re г ф 0 гарантирует такое приближение, хотя, возможно, и не очень быстрое. Ещё одно замечание. Преобразованием гиагс достаточно боль- большим по модулю а многочлен /о степени п переводится в многочлен fi(z) = bozn + ... + Ьп такой, что |Ьо| ^ \Ьк\ для всех к. Далее, нули и критические точки многочленов /i и А/i для А 6 С* одни и те же. Аналогично, N\fx = Nfx, а это значит, что при обсуждении ме- метода Ньютона / можно брать из множества Vn{l) нормализованных многочленов, коэффициенты которых по модулю не превосходят 1. По лемме 3 § 3 гл. 6 все нули многочлена / G Vn(l) лежат в круге D2 = {z e C| \z\ ^ 2}. Пусть Bf = {z е С| Jim^^W = С(*)> /(CW) = 0} — объединение бассейнов всех стоков для JV/. Попросту, Bf — область сходимости метода Ньютона в применении к /. Специфика множества Vn(l) даёт нам возможность ограничиться рассмотрением пересечения В/П£>2» площадь которого обозначается v(Bf П D2). Тогда отношение _ v{Bf n £>2) _ v(BfnD2) f~ v{D2) " 4тг
Нерешенные задачи о многочленах 265 можно интерпретировать как вероятность того, что метод Ньюто- Ньютона будет сходиться для случайно выбранной точки из £>2- Мы вплот- вплотную подошли к формулировке главной задачи. Положим Ап = min At. Разумеется, 0 ^ Ап ^ 1. Согласно замечаниям, сделанным выше, Аъ = 1, в то время как Ап < 1 при п ^ 3. Требуется доказать, что при любом п имеет место неравенство Ап > 0. Хорошо бы также оценить Ап как функцию от п. Пока не доказано даже, что Аз > 0. * * * "Ещё многое имею сказать вам, но вы теперь не можете вместить". Еванг. от Иоанна, 16:12
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абелева группа 140 Автоморфизм группы 146 — поля 60 Аддитивная группа кольца 152 Аксиомы векторного (линейного) пространства 66 — группы 139 — теории определителей 130 Алгебра как наука 11, 15 — матриц 86 Алгебраическая структура (систе- (система) 134 Алгебраически замкнутое поле 232 Алгебраический элемент 184 Алгебраическое дополнение 110,129 Алгоритм деления 63, 187 — Евклида 194 Аргумент комплексного числа 170 Ассоциативная бинарная операция 135 Ассоциативное кольцо 152 Ассоциированная однородная сис- система 20 Ассоциированные элементы 61 Аффинные преобразования ве- вещественной прямой 150 Базис векторного пространства строк 69 — индукции 46 Базисные столбцы 76 Биективное (взаимно однозначное) отображение 36, 38 Бинарная алгебраическая операция 134 Бинарное отношение 41 Биномиальная формула 48 Биномиальный коэффициент 48 Блоки (клетки) матрицы 100 Вектор критических значений 263 Векторное пространство строк (столбцов) 66 Векторы—строки 66 Вероятностный вектор—столбец 98 Вероятность 265 Верхняя треугольная матрица 25 Вес многочлена 221 Вещественная ось 169 Взаимная (присоединенная) мат- матрица 121 Взаимно простые числа 63 элементы целостного кольца 193, 195 Взаимный многочлен 257 Включение множеств 34 Вырожденная матрица 87 Высший член многочлена 222 Гипотеза Нагаты 260 Главная диагональ квадратной матрицы 20 Главные неизвестные 24, 76 Гомоморфизм групп 147 — колец 156 График функции 41 Группа 139 — внутренних автоморфизмов 147 — симметрии правильного много- многоугольника 142
Предметный указатель 267 Двойная сумма 73 Двойное отношение четверок чи- чисел 177 Декартова степень 35 Декартово произведение 35 Делимость в целостных кольцах 190, 192 Делитель единицы в кольце 158 — нуля в кольце 158 — целого числа 61 Диагональная матрица 20 Динамическая система 263 Дискриминант алгебраического уравнения 227 — многочлена 227 — семейства элементов 227 Дистрибутивные законы кольца 83 Дифференцирование кольца 213 Дополнение к подмножеству 35 Дробь 159, 203 — несократимая 203 Евклидово кольцо 194 Единичная матрица 20 Единичное (тождественное) отобра- отображение 36 Единичный элемент 135 Естественное отображение 42 Закон сокращения в целостном кольце 158 Знак (сигнатура, четность) перес- перестановки 61 Знакопеременная группа 148 Изоморфизм групп 144 — колец 157 Инверсия относительно перес- перестановки 61 Интерполяционная формула Лаг- ранжа 211 Ньютона 211 Каноническая проекция 42 Квадратичная (сверхэкспонен- (сверхэкспоненциальная) сходимость 255 Квадратичное поле 176 Квадратная матрица данного по- порядка 20, 86 Класс эквивалентности 41 Классы вычетов 155 Код, исправляющий ошибки 18,165 Кольцо 152 — классов вычетов 155 — многочленов 182 — с делением 159 — функций 153 — целых чисел 153 Коммутативная диаграмма 37 Коммутативное кольцо 152 Комплексное сопряжение 170 Комплексные числа 169 Композиция отображений 37 Компонента решения 21 Консервативный многочлен 262 Конструктивные числа и поля 178, 179 Координаты вектора-строки 70 Корень из единицы 174 Корень (нуль) многочлена 208 Кососимметрическая функция 58 Кососимметрический многочлен 232 — определитель 116 Коэффициенты многочлена 183 Кратные множители многочлена 215 Кратный корень 209 Критерий невырожденности мат- матрицы 87, 122 — Рауса—Гурвица 252 — совместности линейной систе- системы 77 — Эйзенштейна неприводимости многочлена 200 Критические значения 262 Критические (экстремальные) точ- точки 241, 262 Левонормированное произведение 137 Лексикографическое упорядочение одночленов 221
268 Предметный указатель Лемма Гаусса 198 Лемма Даламбера—Аргана 235 — Коши о минимуме 234 Линейная зависимость векторов- строк 68 — оболочка 67 — однородная система 20 — система 19 — функция 80 Линейно зависимая (независимая) система 68 — упорядоченное множество 44 Линейное отображение 79 Линейные комбинации 67 — уравнения 19 Локализация корней многочлена 244 Максимальный элемент 44 Марковская (стохастическая) ма- матрица 98 Матрица линейного отображения 79 Матричное кольцо 86 Матричные единицы 91 Метод Гаусса 26 — испытаний 254 — линейной интерполяции 254 — неопределенных коэффициентов 225, 242 — Ньютона 255 — окаймляющих миноров 126 — последовательного исключения неизвестных 26 — Штрассена 28 Минимальный элемент 45 Минор матрицы НО Мнимая ось 169 — часть комплексного числа 169 Многочлен (полином) 182 — Лежандра 258 Множество 33 Модуль комплексного числа 170 — сравнения 155 Моногенный симметрический многочлен 224 Моноид 135 — преобразований 136 Мономорфизм 157 Монотонный одночлен 222 Морфизм 148 Мощность множества 35, 40 Мультипликативная группа поля 159 — полугруппа кольца 152 Наибольший общий делитель 63, 192 — элемент 44 Наименьшее общее кратное 63,193 Наименьший элемент 45 Невырожденная матрица 87 Независимые (непересекающиеся) циклы 54 Нейтральный элемент 139 Неопределенная линейная система 21 Неподвижная притягивающая точ- точка 263 — точка 263 Неприводимый многочлен 190, 197 Неравенство Коши—Буняковско го—Шварца 176 Несобственный делитель 61 Нечетная перестановка 57 Нижняя треугольная матрица 25 Норма числа в квадратичном поле 176 Нормализованный (нормирован- (нормированный, унитарный) многочлен 188 Нормальная фундаментальная сис- система решений 198 Область значений отображения 35 — определения отображения 35 Обобщенная ассоциативность 136 Обратимая матрица 87 Обратимый элемент кольца 158 моноида 138 Обратная матрица 87 Обратное отображение 38 Общий закон дистрибутивнос- дистрибутивности 154 Объединение множеств 34 Ограниченная стрелка 36 Однородный многочлен 187 Одночлен (моном) 187 Окаймляющий минор 126
Предметный указатель 269 Оператор дифференцирования 213 — частного дифференцирования 219 Определенная линейная система 21 Определитель Вандермонда 115 — матрицы 29, 104 — произведения матриц 118 — с углом нулей 117 Орбита 53 Ориентированный объем 103 Основная теорема алгебры 233 арифметики 62 Основные свойства определителя 107, 112 Отделение корней (нулей) много- многочлена 244 Отношение эквивалентности 41 Отображение 35 — биективное 36 — инъективное 36 — сюръективное 36 Пересечение множеств 34 Перестановка 51 Плоскость комплексных чисел 169 Подгруппа 140 Под кольцо 152 Подмножество 34 —, замкнутое относительно опе- операции 136 Подполе 160 Подстановка в многочлен 184 Поле 159 — Галуа 163 — комплексных чисел 169 — отношений (частных, дробей) 202 Поле разложения многочлена 237 — рациональных дробей 203 Полилинейная функция 105 Полиномиальная функция 210 Полная линейная группа 139, 140 — степень многочлена 186 Полное матричное кольцо 153 Положительная марковская мат- матрица 99 Полугруппа 135 Порядок на множестве 44 — перестановки 53 — степенного ряда 189 Порядок элемента 142 Постоянная функция 153 Постоянное отображение 38 Поточечная операция 153 Правило знаков Декарта 249 Правильная дробь 204 Представитель класса 41 Приведенная линейная система 20 Признак делимости 194 Примарная дробь 206 Примитивный (первообразный) корень из единицы 174 — многочлен 198 Принцип двойной индукции 50 — индукции 46 Присоединенная (взаимная) мат- матрица 121 Проблема якооиана 260 Произведение матриц 82 Произведение (композиция) ото- отображений 37 Производная многочлена 212 Производящая функция 189 Простейшая дробь 204 Простое поле 162 Простой корень 209 — элемент кольца 190 Пространство решений 96 — столбцов (строк) прямоуголь- прямоугольной матрицы 74 Прямоугольная матрица 20 Пустое множество 34 Разложение определителя 113 Размерность линейной оболочки 71 Разность множеств 34 Ранг матрицы 75 по столбцам (по строкам) 74 — произведения матриц 84 — системы векторов 71 Расширение поля 160 Расширенная матрица линейной системы 21 Рациональная функция 212 Редуцированный многочлен 210, 218 Результант 229
270 Предметный указатель Рефлексивность 41 Решение линейной системы 21 Свободные неизвестные 24 Свободный член уравнения 20 Символ Кронекера 86 Симметрическая группа 52 — разность множеств 40 — функция 217 Симметрический многочлен 220 Симметричность 41 Система линейных уравнений 19 — (ряд) Штурма 245 Скалярная матрица 20, 86 Собственное подмножество 34 Совместная линейная система 21, 77 Содержание многочлена 198 Специальная линейная группа 140 Сравнение 155 Срезанная экспонента 248 Стандартная система Штурма 247 Стандартный базис 70 Старший коэффициент 186 Степенная сумма 224 Степень многочлена 286 — элемента 137 Столбец матрицы 20 — определителя 105 Строка матрицы 20 — определителя 105 Ступенчатый вид линейной сис- системы 24 матрицы 24 Суперпозиция отображений 37,153 Схема Горнера 208 Сюръективное отображение 36 Таблица Кэли 144 Тело 159 Теорема Безу 208 — Бюдана—Фурье 251 — Вильсона 218 — Кронекера—Капелли 77 — Кэли 146 — Руше 253 — Ферма (малая) 161 Теорема Шевалле 218 — Штеиница 233 — Штурма 245 Тождество Эйлера 219 Транзитивность 41 Транспозиция 55 Транспонированная матрица 83 Трансцендентный элемент 184 Треугольная диаграмма 37 — матрица 25 Тригонометрическая форма комп- комплексного числа 171 Универсальное свойство кольца многочленов 184 Унимодулярная группа 140 Упорядочение множества 44 Устойчивый многочлен 251 Факториальное кольцо 190, 197 Факторизация отображений 43 Фактормножество 42 Форма 187 Формальный степенной ряд 188 Формула (интерполяционная) Лагранжа 211 Формула Лагранжа 243 — Лейбница 213 — Муавра 173 — (интерполяционная) Ньютона 211 — "полного развертывания" 104 — Стирлинга 60 — Тейлора 251, 257 — Эйлера 173 Формулы Виета 217 — Крамера 123 — Ньютона 225 Фундаментальная система реше- решений 98 Функция 35 — Эйлера 64 Характеристика поля 161
Предметный указатель 271 Целая рациональная функция 210 Целостное кольцо 158 Цепь 44 Цикл 53 Циклическая группа 142, 145 Частичный порядок 44 Частное 159 — дифференцирование 219 — от деления 63, 188 Четверная группа 151 Четная перестановка 57 Число перемен знаков 245 — Ферма 47 — Фибоначчи 27 Чисто мнимое число 169 Эквивалентность линейных систем 22 Эквивалентные матрицы 92 Элемент кольца нильпотентный 165 — множества 33 Элементарные матрицы 91 — преобразования 21, 74 — симметрические многочлены 221 Эндоморфизм алгебры многочле- многочленов 259 Эпиморфизм 148, 157 Ядро гомоморфизма 147, 156 — линейного отображения 97 Якобиан 259
Учебное пособие КОСТРИКИН Алексей Иванович ВВЕДЕНИЕ В АЛГЕБРУ Часть I ОСНОВЫ АЛГЕБРЫ Редактор Е.Ю. Ходан Оригинал-макет Н.Н. Андреева ЛР Nr9 071930 от 06.07.99. Подписано в печать 05.12.99. Формат 60x90/16. Бумага офсетная № 1. Печать офсетная. Усл. псч. л. 17. Уч.-изд. л. 18,7. Тираж 3000 экз. За Издательская фирма "Физико-математичсск МАИК "Наука/Интерпериодика[ 117864 Москва, ул. Профсоюзная, Отпечатано с оригинал-макета в Чебоксарской типогра 428019, г. Чебоксары, пр. И. Яковлева, 15