Содержание
Предисловие
От искусства решения уравнений к науке об алгебраических операциях
ЧАСТЬ I. АЛГЕБРАИЧЕСКИЕ ОПЕРАЦИИ
Алгебраические системы с одной бинарной операцией
Алгебраические системы с двумя бинарными операциями
Расширение полей
Поле комплексных чисел
Решение алгебраических уравнений с одной неизвестной
Многочлены
Приводимость многочленов
Значения и корни многочленов
Рациональные корни многочленов над полем Q
Вложение кольца в поле
Матрицы
ЧАСТЬ II. ЛИНЕЙНАЯ АЛГЕБРА
Линейная зависимость векторов
Пространства, связанные с матрицей
Системы линейных уравнений
Полилинейные формы и определители
Линейные образы в многомерной геометрии
Системы линейных ограничений
Билинейные, квадратичные и эрмитовы формы
Евклидовы и унитарные пространства
Проблема исключения
Линейные отображения
Заключение II части
ЧАСТЬ III. КОМБИНАТОРНАЯ АЛГЕБРА
Наложение комплексов и симметрические квазимногочлены
Группы подстановок
ЗАКЛЮЧЕНИЕ. Балет невылупившихся птенцов
Указатель терминов и имен
Text
                    Боится математики
тупая какофония,
а нам из уравнения
и музыка слышна.
В гармонии есть алгебра,
а в алгебре - гармония;
от их соединения
иэыйдет сатана!


А. А. Зыков Лекции по алгебре Одесса «Астропринт» 2007
ББК 22.14я73 3-966 УДК 512(075.8) Систематический, но не совсем традиционный курс алгебры для математических факультетов университетов и педагогических вузов, рассчитанный на студентов с далеко не идеальной подготовкой за среднюю школу. Создан на основе лекций, которые автор читал в Самаркандском университете имени А. Навои. Вводная лекция написана в соавторстве с доцентом Асадом Амоновичем Амоновым и старшим преподавателем Юсуфом Шариповичем Шариповым (кафедра алгебры и теории чисел СамГУ). Вторая и третья части за последующие 20 лет подверглись большим изменениям, чем пер- вая, в частности, добавлены раздел о линейных ограничениях (нера- венствах) и комбинаторно-алгебраическая теорема Редфилда—Пойя. Автор — Александр Александрович Зыков, доктор физ.-мат. наук, профессор-консультант Южного научного центра НАН и МОН Украи- ны. Тел. (38/0482) 44-46-02, Е-таП: <а!с!г1@2у1<оу.ос1е55а.иа>. Рецензенты: П. Д. Варбанец, профессор, зав. кафедрой алгебры Одесского национального университета им. И. И. Мечникова; Д. 3. Аров, профессор Южноукраинского педагогического университета им. К. Д. Ушинского; В. Н. Любота, кандидат физ.-мат. наук, доцент Одесского национального университета им. И. И. Мечникова. Художественное оформление Е. Г. Лобынцевой. 1602040000—108 3 318-2007 БСЗ °6ЪЯ™' © А. А. Зыков, 2007 15ВЫ 978-966-318-788-4
Содержание Предисловие ........................................................................................................ 4 От искусства решения уравнений к науке об алгебраических операциях (вводная лекция по алгебре) ....................................................................... 9 ЧАСТЬ I. АЛГЕБРАИЧЕСКИЕ ОПЕРАЦИИ Отображения..................................................................................................... 23 Алгебраические системы с одной бинарной операцией ............................... 27 Алгебраические системы с двумя бинарными операциями ......................... 42 Расширение полей ............................................................................................ 51 Поле комплексных чисел ................................................................................. 66 Решение алгебраических уравнений с одной неизвестной .......................... 75 Многочлены ........................................................................................................ 83 Делимость многочленов над полем ........................................................... 90 Приводимость многочленов ....................................................................... 96 Значения и корни многочленов ............................................................... 100 Рациональные корни многочленов над полем <0> ..........л...................... 106 Вложение кольца в поле ................................................................................ 111 Матрицы .......................................................................................................... 123 ЧАСТЬ П. ЛИНЕЙНАЯ АЛГЕБРА Линейные пространства ................................................................................. 151 Линейная зависимость векторов ................................................................... 158 Пространства, связанные с матрицей .......................................................... 167 Системы линейных уравнений....................................................................... 177 Полилинейные формы и определители ........................................................ 193 Линейные образы в многомерной геометрии............................................... 214 Системы линейных ограничений ................................................................... 223 Билинейные, квадратичные и эрмитовы формы.......................................... 247 Евклидовы и унитарные пространства ......................................................... 266 Проблема исключения.................................................................................... 291 Линейные отображения ................................................................................. 297 Заключение II части ....................................................................................... 320 ЧАСТЬ III. КОМБИНАТОРНАЯ АЛГЕБРА Гомоморфизмы и факторизация .................................................................... 323 Наложение комплексов и симметрические квазимногочлены .................. 341 Группы подстановок ....................................................................................... 361 ЗАКЛЮЧЕНИЕ, Балет невылупившихся птенцов ..................................... 381 Указатель терминов и имен ........................................................................... 391
ПРЕДИСЛОВИЕ Один мой знакомый надумал стать трубачом, но в музыкаль- ное училище так и не поступил: приемная комиссия не обнару- жила у него "ни слуху, ни духу". Однако предположим, что он все-таки оказался студентом училища (из-за недобора или "по звонку"): что бы делали потом с ним настоящие музыканты? А ведь в столь же нелепое положение зачастую попадали препода- ватели математического факультета СамГУ, где мне посчастливи- лось работать в 1982—1987гг. и куда, например, свободно при- нимали абитуриентов, не прошедших по конкурсу в кооператив- ный институт. Я говорю "посчастливилось" без иронии: хотя от студентов, не имеющих вообще никакого отношения к математи- ке, в конце концов удавалось избавиться, все равно заниматься приходилось по большей части с такими, у кого "слух" недоста- точно развит, а "дух" совсем еще не поставлен; и если бы не теплое, доброжелательное отношение и поддержка коллег, то при столь трудных условиях не смог бы появиться такой курс алгебры, который хотя и рассчитан на учащихся лишь с самым необходимым минимумом математических способностей и весьма неполными школьными знаниями, но может быть рекомендован как первоначальный даже студентам МГУ. Представленный в нем материал нуждается разве что в дополнениях, но не в пере- работке. Мы отказались как от концентризма широко распространенно- го учебника А. Г. Куроша, так и от "чрезмерного академизма" книги А. И. Кострикина, в то же время рекомендуя их для са- мостоятельной проработки некоторых разделов курса и для до- полнительного чтения. Изложение материала строго последова- тельное, на первый план выдвигается задача усвоения учащимися самого духа алгебры как науки об алгебраических операциях, причем отличие алгебраического подхода (к исследованию мате- матических объектов) от аналитического поясняется уже во вводной лекции и подчеркивается на протяжении всего курса. Я решительно не соглашался с коллегами по кафедре, когда они "из-за слабого состава студентов" обходили в своих лекциях вопрос об алгебраическом расширении: ведь это значит препода-
вать алгебру без алгебры! * То, что естественно и закономерно во втузах (где надо решать математические задачи всеми доступ- ными средствами, а не культивировать отдельно "дух алгебры", "дух геометрии" и "дух анализа"), совершенно недопустимо для будущих математиков — как научных работников, так и учите- лей. И если из поля рациональных чисел поле чисел действи- тельных возникает аналитически, то следующее расширение до поля комплексных чисел является алгебраическим — факт не скроешь, как тщетно пытался один герой О. Генри: "Не с!ешес1 Ше аПе^айопз Ьи1 Не соиМ по! с!епу Ше аШ^огз" **. Столь же решительно выступаю я против исключения из обя- зательной программы такой темы, как решение уравнений тре- тьей и четвертой степени: нельзя превращать курс алгебры в "Ивана, не помнящего родства". В то же время считаю вполне оправданным в отношении теоремы существования корня ограни- читься формулировкой: хоть это и "основная теорема алгебры", доказательство ее носит сугубо аналитический характер и в рам- ках самой алгебры неосуществимо, а в теории функций комплек- сной переменной непосредственно следует из теоремы Лиувилля. Систематическое изучение уравнений с одной неизвестной начинается со случаев первой и второй степени — не только для ликвидации школьных недоработок, но и для строгого обоснова- ния: теперь ведь всё делается в комплексной области! Кстати, попытки устранения пробелов с помощью повторительного курса школьной математики, как правило, оказываются малоэффектив- ными: вряд ли можно за 1—2 месяца хорошо усвоить набившую оскомину жвачку, для которой не хватило 10 или даже 11 лет. Здесь скорее выручит не "преемственность", а совсем иной под- ход: сначала "огорошить" студентов необычным материалом, опи- рающимся в основном не на твердые знания, а на некий мини- мум сообразительности и здравого смысла, и лишь затем, в процессе прохождения нового и интересного, постепенно "зама- ливать" старые грехи. Теории определителей (детерминантов) не место в первом семестре: для самой алгебры они там еще не нужны, а для * К чести коллег и вышестоящих, мне никто не препятствовал строить свой курс так, как я считал нужным. ** Непереводимая игра слов из новеллы О. Непгу "ТЬе тап Ы'^Ьег ир" (Кто выше?). Разберитесь!
аналитической геометрии достаточно тех сведений об определите- лях третьего порядка, которые непосредственно следуют из свойств смешанного произведения трех векторов. Зато во втором семестре определители п-го порядка с полным правом появятся не просто как вычислительное средство, а как полилинейные функции от элементов линейного пространства (что к тому же упростит изложение). Точно так же незачем изучать в первом семестре (до общей теории линейных пространств) метод Гаусса, а тем более начинать с него курс: в отдельных случаях, когда понадобится решить систему линейных уравнений, можно обой- тись и школьными приемами (напоминание об этом дано в исто- рическом плане во вводной лекции и может быть закреплено на первом же практическом занятии). Наконец, симметрические мно- гочлены (не выбрасывать же совсем из курса такую прелесть!) рассматриваются в третьем семестре в связи с общим понятием об алгебрах. С непривычки может показаться неуместной теория действий над матрицами в конце первого семестра. Однако на самом деле для определения вырожденности и невырожденности и для на- хождения обратной матрицы детерминанты не нужны, и кольцо квадратных матриц естественно вписывается в общее учение об алгебраических системах. Сложение и умножение прямоугольных матриц, с одной стороны, допускают ряд важных и наглядных интерпретаций, а с другой стороны, изучаются тоже в общем плане алгебраических операций. Такой перенос темы позволяет к тому же избежать во втором семестре перегрузок из-за теорий определителей и систем линейных ограничений (неравенств). Материал второго семестра — линейная алгебра и ее прило- жения к многомерной геометрии — в основном традиционный. Третья же часть нашего курса хоть и не посвящена специально комбинаторному анализу, но настолько пронизана духом комби- наторики, что это отразилось и в ее названии; а знакомство со знаменитой теоремой Редфилда—Пойя, по нашему мнению, столь же важно, как и с теорией чисел (для которой по министерскому плану отведен во втором семестре отдельный курс) *. * В университетах этот курс, как правило, читают отдельно, а в педагогичес- ких вузах объединяют с алгеброй и математической логикой.
Книга написана сжато и пособием для самообразования не является: если слабый студент отважится читать ее в одиночку, то самое большее, на что можно рассчитывать, — это иллюзия понимания вводной лекции. Однако тот, кто преодолеет азы под руководством опытного преподавателя, сможет уже сам созна- тельно прорабатывать материал примерно с темы "Поле комп- лексных чисел". Как показывает опыт, для слабого, но стара- тельного студента решающим критерием того, сможет ли он про- должать учебу на математическом факультете, служит способность его полностью разобраться в теореме о единственно- сти нейтрального элемента группоида (стр. 28) и толково объяс- нить ее кому-нибудь другому. Но и успешное преодоление этого "первого барьера" — не основание для самоуспокоения: в тексте всё чаще будут встречаться вопросы "почему?", отвечать на ко- торые самому себе необходимо, а также частичное предоставле- ние читателю некоторых рассуждений; здесь тоже может понадо- биться помощь более продвинутого друга или преподавателя. Кроме практических и лабораторных занятий, надо активно ис- пользовать еженедельные консультации, входящие в учебную нагрузку лектора. Задания для самостоятельной работы, а также ознакомление с теоремой о разбиении множества на классы эквивалентности требуют обращения к дополнительной литературе. Литература 1. Курош А. Г. Курс высшей алгебры. — М.: Наука (1946, ..., 1956), 1975. 2. Шилов Г. Е. Математический анализ, часть I: конечномерные линейные пространства. — М.: Наука, 1969. 3. Ефимов Н. В., Розендорн Э. Р. Линейная алгебра и многомерная геомет- рия. — М.: Наука, 1970. 4. Рыбников /С. Л. Введение в комбинаторный анализ. — Издательство Мос- ковского ун-та, 1972. 5. Тышкевич Р. И., Феденко А. С. Линейная алгебра и аналитическая гео- метрия. — Минск: Вышэйшая школа, 1976. 6. Ван дер Варден Б. Л. Алгебра. — М.: Наука, 1976. 7. Кострикин А. И. Введение в алгебру. — М.: Наука, 1977. 8. Зыков А. А. Логико-философское введение в высшую математику. — Одес- са: Астропринт, 1997, 1999, 2003.
9. Проскуряков И. В. Сборник задач по линейной алгебре. — М.: Физмат- гиз, 1962. 10. Фаддеев Д. /С, Соминский И. С. Сборник задач по вышей алгебре. — М.: Наука, 1972. 11. Комбинаторный анализ (задачи и упражнения) / Под ред. К. А. Рыбни- кова. — М.: Наука, 1982. 12. Сборник, задач по алгебре / Под ред. А. И. Кострикина. — М.: Наука, 1987.
А. А. Амонов, А. А. Зыков, Ю. Ш. Шарипов ОТ ИСКУССТВА РЕШЕНИЯ УРАВНЕНИЙ К НАУКЕ ОБ АЛГЕБРАИЧЕСКИХ ОПЕРАЦИЯХ (вводная лекция по алгебре) Как явствует из дошедших до нас письменных документов древнего Египта и Вавилона, уже за 3000 лет до нашей эры были известны не только четыре арифметических действия над целыми и дробными числами (а также извлечение корня), но и решение ряда задач такого типа, когда по результату действий над некоторым числом требуется восстановить это число. Про- стейшие из таких задач приводят к уравнению первой степени, имеющему в современных обозначениях один из видов х±а = Ь, а±х = Ь, ах = Ь. (На самом деле задача и ход ее решения писались словами и конкретными числами, поскольку ни буквенных обозначений, ни знаков действий и равенства тогда не было; но мы условимся ради удобства передачи сути дела пользоваться привычной теперь символикой.) Для решения третьего уравнения египтяне сразу делили Ъ на а (правда, более сложным способом, чем мы), а вавилоняне сначала находили по заранее составленной таблице обратную величину для а, после чего умножали на нее Ъ. Более сложные задачи типа ах + Ьх = с решались не по современной схеме (а + Ь)х = с, х = с:(а + Ь), ибо эквивалентные преобразования уравнений, в частности приведение подобных членов, содержащих искомое число, не были тогда изве- стны; в таких случаях пользовались правилом ложного положе- ния, которое мы поясним на одной задаче из египетского папиру- са: "Количество и его четвертая часть дают вместе 15; сосчитай мне это" (т. е. "найди исходное количество"). Решение начиналось словами: "Считай с 4; от них ты должен взять четверть, а именно 1; вместе 5". Затем производилось деление 15:5 = 3 и умножение 4x3=12, дающее искомое
число. Иначе говоря, для решения уравнения * + — я = 15 сначала 4 положим х = 4 (так проще, чтобы не появилось дробей), в ре- зультате чего левая часть примет значение 5, а так как это втрое меньше 15, то для получения "истинного" х из "ложного" последнее надо утроить. Нам этот путь кажется неуклюжим, однако, для "чисто арифметического" решения задач, приводящих к системе двух уравнений первой степени с двумя неизвестными, прием "ложного положения" и сейчас себя оправдывает (см. упражнение 1). В Вавилоне решались и более сложные задачи, например, приводящие к системам вида х + у = а, х • у = Ь. Формулировка самой задачи выглядела примерно так: "Длина и ширина составляют вместе а, площадь равна Ь\ каковы длина и ширина?" (ясно, что речь идет о прямоугольнике). Ход решения записывался как рецепт: "Половину от а отломи, получишь а/2" (всё, конечно, в конкретных числах). "Возведи а/2 в квадрат, вычти Ь и из разности извлеки корень" (для квадратных корней, как и для обратных чисел, имелись таблицы). "Прибавляя к а/2 полученное число, найдешь длину, а вычитая — ширину". Нако- нец шла проверка того, что найденные числа удовлетворяют условию задачи, т. е. что "ты решил правильно". Процедура решения отвечает нынешним формулам *1=а/2 + ^/(а/2)2-&, х2=а/2-^(а/2)2-Ь, но кем персонально и, главное, как она была открыта — неиз- вестно: рецептурно-догматическое изложение ("делай так") не содержит никаких доказательств или хотя бы пояснений, почему делать надо именно так, а не иначе. Проверку окончательного результата можно считать лишь зародышем доказательства. Особо интересен способ, которым справлялись китайцы около 2000 лет до нашей эры с задачами вида
Обозначений для искомых количеств, сложения, умножения и равенства не было, и система уравнений записывалась в виде таблицы конкретных чисел над столбцами которой затем совершались действия, соответ- ствующие последовательному исключению неизвестных. Все чис- ла были положительными (других тогда вообще не знали), одна- ко в процессе решения часто возникала необходимость вычесть большее число из меньшего; тогда, наоборот, отнимали меньшее от большего, но разность писали тушью другого цвета. Таким образом, над одними и теми же числами действовать надлежало в зависимости от их цвета: черное число вычитать там, где крас- ное надо было бы прибавить, и наоборот. Однако дальнейшие шаги, подготовившие введение отрицательных чисел, состоялись в других странах и много позже, и даже высокоразвитая матема- тика древней Греции прошла мимо этого. Одной из величайших заслуг греческих ученых VI—II веков до н. э. было развитие логики и широкое ее применение к есте- ствознанию, позволившее, в частности, превратить математику из набора отдельных фактов и правил в систематическую науку. Знаменитые "Начала" Евклида (около 300 лет до н. э.) открыва- ются формулировкой основных положений — определений, акси- ом и постулатов, из которых затем с помощью логических рас- суждений выводятся теоремы геометрии и арифметики. Алгебра при этом выступает в геометрической форме: известными и неиз- вестными величинами служат не числа, а отрезки, прямоугольни- ки, параллелепипеды (на самом деле их длины, площади и объе- мы); при таком подходе, например, уравнение ах =Ь сейчас сле- довало бы писать в виде
дабы размерности обеих частей совпадали, а в то время форму- лировка задачи выглядела так: На данном отрезке построить прямоугольник, равновеликий данному квадрату. Более слож- ные задачи на приложение прямоугольника к отрезку "с недо- статком" и "с избытком" (обо всех трех задачах и их связи с коническими сечениями — параболой, эллипсом и гиперболой — должно быть сказано в курсе аналитической геометрии, а более подробно прочесть об этом можно в учебниках по истории мате- матики) приводили к уравнениям вида которые решались геометрическим построением с полным обосно- ванием. Условия существования решения назывались диоризма- ми — они отвечали современным неравенствам между коэффици- ентами квадратного уравнения, обеспечивающим неотрицатель- ность его дискриминанта и положительность по крайней мере одного корня (см. упражнение 5). Причиной того, что основными действующими лицами древне- греческой алгебры были не числа, а геометрические объекты, послужило открытие в IV веке до н. э. пифагорейцами такого неожиданного явления, как несоизмеримость, в частности того факта, что диагональ единичного квадрата нельзя точно выразить ни целым, ни дробным числом. Приведем (опять в современных обозначениях) доказательство, близкое к пифагорейскому. Допустим, что диагональ квадрата со сторо- ной а=\ измеряется числом и. Так как пло- щадь квадрата, построенного на этой диагонали, вдвое больше площади а2 = 1 исходного квадра- та, то и2 = 2. Число и не может быть целым, поскольку 12<2, но уже 22>2, тем более 32>2 и т. д. Пусть Л — дробное число; пока- жем, что и это предположение ведет к противо- речию. Обозначим через т/п несократимую дробь, равную д,\ тогда (т/я)2 = 2, или
Отсюда следует четность т — иначе т2, как произведение двух нечетных чисел, само было бы нечетным, тогда как 2п2 четно. Записав т в виде 2й, получаем из (*) равенство 4&2 = 2я2, или откуда, как и выше, следует четность п. Итак, числа тип оба четны и дробь т/п можно сократить по крайней мере на 2, вопреки предположению о ее несократи- мости (т. е. о том, что при записи числа и в виде т/п все возможные сокращения уже сделаны). Чрезмерное внимание к логической безупречности в ущерб прикладной стороне математики, связанной с непосредственными измерениями и вычислениями (это считалось занятием, достой- ным рабов и ремесленников, но не ученой элиты, а величайший математик, физик и инженер древности Архимед был одним из немногих исключений), имело свои отрицательные последствия, послужившие в дальнейшем одной из главных причин упадка древнегреческой науки. По отношению к алгебре и арифметике это проявилось в том, что иррациональные числа так и не были тогда открыты (для отношений несоизмеримых величин суще- ствовала очень тонкая и глубокая теория, но сами эти отноше- ния числами не считались), а диоризмы создавали прочный имму- нитет против зарождения отрицательных и мнимых чисел. Математика Индии и арабоязычных стран первого тысячеле- тия нашей эры, впитав достижения древней науки Египта, Вави- лона, Китая (отчасти) и Греции, подарила миру важное нововве- дение — десятичную позиционную систему и число нуль. Хотя сам позиционный принцип широко применялся еще в Вавилоне, основание этой системы — 60 вместо 10 (остатки ее сохранились в виде деления часа на минуты и секунды, а круга — на граду- сы, угловые минуты и секунды) — приводило к громоздкости вы- числений. Индийские ученые VI—XII веков упоминают и отри- цательные числа, с* объяснением действий над ними, но только как "логическую возможность", отказывая этим числам в равно- правии с положительными. Хотя до нашей эры и за восемь столетий нашей было решено много задач алгебраического содержания, алгебры как отдельной науки еще не существовало, и основоположником ее по праву считается выдающийся среднеазиатский ученый ал-Хорезми (783—850). Он и его последователи развивали общие методы,
позволяющие без изменения корней уравнения приводить его к такому виду, в котором эти корни очевидны или по крайней мере находятся проще. Основные типы преобразований у ал-Хорезми — это ал- джабр ("восстановление") и ал-мукабала ("сопоставление"); пер- вое состоит в удалении вычитаемого из одной части уравнения, с последующим восстановлением, уже как слагаемого, в другой части, второе означает приведение подобных членов. К этим пре- образованиям добавляется и ранее известное деление (как и ум- ножение) обеих частей на одно и то же число. Например, для решения уравнения 7х — 27 = 9 — 5х проделывается цепочка пре- образований Каждая строка, включая последнюю, представляет собой уравне- ние, равносильное (эквивалентное) исходному в том смысле, что всякое конкретное число х, удовлетворяющее одному уравнению, удовлетворяет и другому. Каждый из вопросов существования, единственности и фактического значения корня имеет для всех пяти уравнений один и тот же ответ. Но если "угадать" корень исходного уравнения можно не сразу (а вопрос единственности и этим не решится), то для последнего уравнения все эти пробле- мы тривиальны: единственный его корень, по меткому выраже- нию алгебраистов тех времен, известен нам "поневоле". С помощью преобразований ал-Хорезми приводит любое урав- нение первой или второй степени к одной из 8 канонических форм, где каждая степень неизвестного содержится не более одного раза и только как слагаемое, а не вычитаемое (см. упражнение 7), и для каждого случая дает геометрическое реше- ние. От "ал-джабр" впоследствии европейцы образовали слово алгебра, а от имени ее создателя — термин алгоритм, озна- чающий общий способ (единую систему правил) решения любой конкретной задачи из некоторого класса задач.
К заслугам ал-Хорезми как математика следует добавить, что он один из первых оценил по достоинству десятичную позиционную систему счисления и активно ее пропагандировал; в своем арифме- тическом трактате он четко излагает правила действий, включая умножение столбиком и употребление нуля. Впоследствии это при- вело к появлению и широкому применению на Востоке десятичных дробей раньше, чем в Европе; в обсерватории великого Улугбека (1394—1449) синусы и тангенсы углов вычислялись с точностью до 9-го знака! Используя алгебраический аппарат ал-Хорезми, выдающийся математик Омар Хайям (1048—1123)* приводит любое уравнение 1-й, 2-й или 3-й степени к одной из 25 канонических форм (см. опять упражнение 7), в которой затем решает его с помощью геометрической алгебры и теории конических сечений древних греков; но его решение уже ближе по духу к нахождению точки пересечения графиков двух функций, нежели к построению от- резка. Лишь досадное упущение при разборе одного из случаев помешало Хайяму прийти к выводу, что кубическое уравнение может иметь три различных корня (см. упражнения 8 и 9). Вообще к трудам предшественников ученые стран Ближнего и Среднего Востока относились с глубоким уважением, в частности переводили и тщательно изучали сочинения греческих философов и математиков. И при изложении известных результатов, и при получении новых сохранялась античная строгость доказательств, но в то же время серьезное внимание уделялось приложениям математики, как непосредственно к практике (прокладка дорог и рытье каналов, землемерие, архитектура, торговля, сложные про- блемы раздела имущества и т. д.), так и к другим наукам (оп- тика, география и особенно астрономия). Получили "права граж- данства" иррациональные числа, поскольку их всегда можно с необходимой точностью заменять десятичными дробями, и дела- лись попытки (принципиально интересные, но, к сожалению, не завершенные) построить единую теорию рациональных и ирраци- ональных чисел. Говоря о возникновении алгебры как особого раздела матема- тики и об успехах алгебраистов средневекового Востока, было бы Также астроном, философ и поэт, автор широко известных четверостиший "рубай".
неправильно обойти молчанием некоторые упущения. Об одном из них, связанном с кубическими уравнениями, мы уже упомина- ли. Другое, более общего характера, относится к отрицательным числам: вместо того чтобы довести эту "логическую возможность" индийцев до систематизации и применения, еще более усугубили тенденцию избегать таких величин (а сведения о "красных и чер- ных" числах китайцев либо вовсе не дошли до Средней Азии, либо тоже не были там должным образом оценены). "Нетерпимо- стью" к отрицательным числам объясняется обилие канонических форм уравнений у ал-Хорезми и О. Хайяма, она же, видимо, яви- лась причиной того, что Хайям не создал (задолго до Декарта и Ферма) аналитическую геометрию, хотя и стоял на пороге этого открытия. В Европе пышный расцвет античной науки и культуры сме- нился длительной средневековой спячкой. Математика этого пе- риода не сделала почти никаких крупных открытий, шел главным образом процесс накопления материала, хотя и важный для дальнейшего, но слишком уж медленный. Только с XIV века пробуждается интерес к трудам математиков Греции, Индии и Средней Азии, в частности переводятся с арабских оригиналов на латынь оба трактата ал-Хорезми. Одной из важных заслуг математиков позднего европейского средневековья следует счи- тать более терпимое отношение к отрицательным количествам: кроме индийского толкования ("долг", в противоположность "иму- ществу"), им давали хорошо известное нам кинематическое объяснение. Несмотря на это, до равноправия величин обоих знаков, даже позже, в эпоху Возрождения, было еще далеко, и алгебраисты, действуя с отрицательными числами, называли их "фиктивными" (конец подобной дискриминации был положен лишь в XIX веке). Новый подъем науки в эпоху Возрождения охватил, конечно, и алгебру. Европейцев XVI века особенно интересовало числен- ное, а не "геометрическое", решение уравнений. В Италии даже устраивались публичные состязания по нахождению точных зна- чений корней уравнений степени выше 2. С. Ферро, Н. Тарталья, Дж. Кардано и Л. Феррари открыли общие способы решения уравнений 3-й и 4-й степени. При этом в ряде случаев невозмож- но было избежать промежуточных действий с выражениями типа которым в то время не могли приписать никакого смысла
и поэтому называли их "софистическими", "мнимыми" числами. Как отмечал Кардано, уравнение согласно греческому диоризму не имеет решений, однако ему удовлетворяют "значения" х1 = 5 + Л/-15 и х2 = 5-Л/-15 , если над корнями из отрицательных чисел действовать по тем же правилам, что и над корнями из положительных, в частности / /——\2 считать (>/-15} равным —15; французский математик Ф. Виет в 1591 году обнаружил, что и для таких "чисел" х\ и х2 его тео- рема о связи между коэффициентами и корнями сохраняет силу, а его итальянский современник Р. Бомбелли систематизировал правила действий над подобными "величинами". Но оперировать с "мнимыми" числами приходилось формально, без понимания их природы *. Лишь на рубеже XVIII и XIX веков выражения вида а + Ь^/^Л (с действительными а и Ь) получили название комплексных чисел, а их изображение точками плоскости устранило мистику; решающая роль в этом процессе, который привел к полному признанию комплексных чисел, принадлежит К.-Ф. Гауссу. Геометрическая алгебра древних греков поневоле опиралась на буквенную запись известных и неизвестных величин, но эта сим- волика не использовалась при объяснении правил количественных расчетов, и общие способы решения арифметических задач, в частности приводящих к уравнениям, по-прежнему излагались на словах и конкретных числах; лишь Диофант (~1П век н. э.) ввел буквенное обозначение неизвестной величины. Замену чисел бук- вами для постановки и описания хода решения задачи в общем виде употреблял Иордан Неморарий (XIII век), но и его подход не означал еще создания буквенного исчисления, так как резуль- тат действия над двумя выражениями каждый раз обозначался * Аналогично обстояло дело по отношению к "глухим" (иррациональным) чис- лам, хотя возможность их изображения на прямой и приближенного пред- ставления десятичной дробью с любой требуемой точностью ослабляли ми- стический налет.
новой буквой; например, запись закона (а + Ь)с = ас + Ьс выгляде- ла так: Если А — сумма а и Ь, е — произведение (1 на с, } — про- изведение а на с, § — произведение Ь на с, И, — сумма / и §, то е равно Н. Символика Виета тоже не отличалась краткостью: равенство Л3 + ЗВА = О он писал в виде однако начала алгебраического исчисления заложены именно здесь, ибо такая запись позволяет уже действовать с самими буквенными выражениями как с числами. Обозначения вскоре были упрощены англичанином Т. Гэрриотом, у которого запись того же равенства гораздо ближе к современной. Примерно в то же время (вторая половина XVI века) наряду со знаками дей- ствий +, —, х (последний часто опускался) возник знак =, а первая буква латинского слова гасЛх (корень) в сочетании с чер- той сверху, заменяющей скобки,. образовала у Виета знак ради- кала. Появление буквенной алгебры сильно подкрепило решимость действовать с различного рода величинами, в том числе и непо- нятной природы, по определенным правилам. Здесь мы прервем историческое повествование (дальнейшие сведения такого характера лучше давать в ходе изложения самой алгебры и в курсе истории математики) и лишь отметим харак- терную особенность современной алгебры. Если аналитический подход к изучению тех или иных объектов связан прежде всего с выяснением их внутреннего строения, то при алгебраическом подходе на первый план выдвигаются законы, по которым эти объекты комбинируются друг с другом. Математических приме- ров в дальнейшем будет достаточно, а сейчас мы проиллюстри- руем важность алгебраического подхода (и диалектическое един- ство обоих подходов) на примере, к самой алгебре непосред- ственно не относящемся. Открывая периодический закон (1869), Д. И. Менделеев исхо- дил не из внутренней структуры атомов (тогда еще не извест-
ной), а из "внешних" свойств химических элементов, в первую очередь их способности вступать друг с другом в определенные соединения. Однако сама таблица Менделеева сыграла решаю- щую роль при создании впоследствии физической модели атома, выявлении массы и заряда ядра, количества электронов в обо- лочках того или иного элемента. Тем самым первоначальный "алгебраический" подход широко распахнул двери подходу "ана- литическому". Упражнения 1. Внимательно прочитайте рассказ А. П. Чехова "Репетитор" и решите задачу о покупке синего и черного сукна так, как это должен был сделать Петя, т. е. начав с "ложного положения": допустим, что всё купленное сукно было синее... 2. Запишите решение системы с помощью современных формул и в виде вавилонского рецепта. 3. В древнем Вавилоне решались и более сложные системы: путем сведения к рассмотренным выше. Запишите ту часть рецепта, которая сводит решение системы (отдельно для случаев знака + и знака —) к системе, приведенной в тексте лекции, и произведите "стыковку" этой части с уже известной. 4. Запишите систему уравнений в виде китайской таблицы, на которой проведите последователь- ные исключения неизвестных так, чтобы найти их значения. Перед отрицательными слагаемыми ставьте знак +, но само чис- ло снабжайте чертой сверху, означающей "другой цвет".
Пояснение. Чтобы исключить х из второго и третьего уравнений, мы сейчас вычитаем из них удвоенное первое. В китайской записи соответствующие действия над столбцами ко- эффициентов (и свободных членов) преобразуют ее следующим образом: Далее аналогичными действиями, но оставляя неизменным уже второй столбец, придадим второй строке вид О 1 0. Наконец, с помощью третьего столбца (предварительно разделив все его числа на 7) приведем третью строку к виду 001. Числа под чертой, получившиеся в результате всех этих операций со стол- бцами, и будут искомыми значениями неизвестных х, у, г. 4'. Для нас более естественно записывать коэффициенты в том же порядке, как и сами уравнения, т. е. в строки, а не в столбцы. Исходной системе будет тогда соответствовать таблица а ход решения в общем случае сводится к надлежащему приме- нению трех типов операций над строками: 1) умножение или деление строки (всех ее чисел) на одно и то же число, отличное от нуля; 2) замена строки суммой или разностью ее с другой строкой, умноженной на произвольное число; сама "другая строка" при этом не меняется; 3) перестановка строк (в нашем примере не применялась). Решите в такой записи систему
вместо черты над числом можно уже ставить по-современному минус спереди. 4". Попытайтесь применить способ решения, описанный в п. 4', к системам и объясните результаты. 5. Сколько решений с точки зрения геометрической алгебры имеет каждое из уравнений Все ли эти уравнения могли встречаться у древних греков? 6. Докажите иррациональность чисел 6'. Может ли сумма иррациональных чисел быть рациональ- ным числом? А произведение? 7. Объясните количество канонических уравнений у ал-Хорез- ми (8) и Омара Хайяма (25), принимая во внимание, что уравне- ния, заведомо не имеющие положительных корней, не рассматри- вались. 8 (для особо желающих). Ознакомьтесь по книге А. П. Юш- кевича "История математики в средние века" (М., 1961) с подхо- дом Омара Хайяма к решению кубических уравнений и выясните, в чем состоит его "досадное упущение". 9. Уравнение очевидно, третьей степени* и имеет корни 1, 2, 3. Как вы дума- ете, почему простые примеры такого рода не навели О. Хайяма на мысль о существовании трех корней у кубического уравне- ния? 10. Решите уравнение л;2 + л;+1=0 и проверьте справедли- вость теоремы Виета для полученных комплексных чисел.
Часть I______________________ АЛГЕБРАИЧЕСКИЕ ОПЕРАЦИИ ОТОБРАЖЕНИЯ Пусть X и V — два непустых множества. Их декартовым произведением X х V называется множество {(^:, у)/х е X, у е V} всех таких упорядоченных пар элементов, что первый элемент принадлежит множеству X, а второй — множеству У. Примеры: тогда в общем случае ХхУфУхХ, причем если а, Ъ, с ё{1,2}, то даже (Хх У)ъ(УхХ) = 0. причем а Ф с\ тогда здесь ХхУфУхХ, но (X х У) п (У х X) = {(Ь,Ь)} Ф 0. 3. X и У — взаимно перпендикулярные числовые оси (точнее, множества точек этих осей), точка пересечения которых О слу- жит началом координат на каждой из них; тогда X х У — декар- това координатная плоскость хОу. При У = Х произведение ^х^ обозначается через X2 и назы- вается декартовым квадратом множества X. Например, если Х={а, Ь}, то Х2 = {(а, а), (&, а), (а, &), (&,&)}, причем все четыре пары различны, поскольку упорядоченные пары (р, ^) и (г, 5) счи- таются одинаковыми, т. е. (р, </) = (г, 5), в том и только том слу- чае, когда у них совпадают как первые компоненты, так и вто- рые: р = г&д = з. Аналогично декартов куб Хг = {(х, у, г)/х, у, г е X} — это множество всех упорядоченных троек элементов из X, и т. д. Естественно считать по определению Х[=Х и Х® = 0. Вопрос: верно ли, что Х2хХ = ХхХ2 = Х3 и ^х^° = ^? Пусть даны МФ0 и МФ0. Отображение / : М —> N множе- ства М в множество N относит каждому элементу х е М некото- рый элемент }(х) е М; / называется также функцией, заданной на
г4 Алгебраические операции множестве М и принимающей значения в множестве N. Строго определить это отображение можно как такое подмножество декартова произведения М х Л/', в котором для каждого х е М существует единственная пара (х, у), и тогда второй ее элемент у = }(х)еМ называется образом элемента х при отображении / (или значением функции / при значении х ее аргумента). Отображение / : М —> N называется инъективным, если раз- ные элементы М имеют в N разные образы, т. е. Ул^л^е УИ<для любых х{ и х2 из М>: х1=^х2=$ <влечет>/(л:1) ф[(х2). Отображение / сюръективно, если каждый элемент у е N имеет хотя бы один прообраз — такой элемент х е М, образом которого служит у\ т. е. \/у е N Зх е УИ<существует такой х в М, что>: }(х) = у. Отображение биективно (является биекцией, или взаимно однозначным соответствием) между М и N. если оно одновре- менно инъективно и сюръективно. Примеры: отображение /,: М -> N не инъективно и не сюръективно. \^
отображение /2: М —> N инъективно, но не сюрьективно, посколь- ку для элемента 3 е N нет такого х е М, чтобы было /2(л;) = 3. /3: М -* N — сюръективно, но не инъективно. отображение /4: М —»N инъективно и сюръективно, т. е. являет- ся биекцией множества М на множество N. А это вообще не отображение (элементы $ и * из М не имеют образов в Л/); это лишь соответствие, относящее (притом не всегда однозначно) некоторым элементам из М некоторые эле- менты из N.
Задача. Для каждой из функций ф,(лс) ==|лс|, <р2(х) = х2, Ф3(л;) = л;3, ф4 (*) = >/*, ф5 (я) = ->/*, Ф6(*) = >/!*[ указать свою пару множеств М,., Л^-сК (т. е. из действительных чисел) так, чтобы отображение ф,: М,- —> Л/', было а) инъективным, б) сюръективным, в) биективным (I = 1, 2, 3, 4, 5, 6). Пусть [(х, у) — функция двух аргументов (например х + у, х — у, х*у при х, у е К); ее можно рассматривать как отображе- ние (функцию одного аргумента), относящую каждой упорядочен- ной паре (х, у) некоторый элемент: Вообще функция /(А:,, л;2, ..., хт) от т аргументов, относящая каждому упорядоченному набору из т элементов множества М некоторый элемент множества Л/', — это отображение число т называется арностью отображения /. 0-арное (нульарное) отображение фиксирует некоторый эле- мент в N. поскольку у "функции" / при т = 0 совсем нет аргу- ментов, от которых могло бы зависеть ее значение; 1 -арное (унарное) относит каждому х е М элемент /(я) € М; 2-арное (бинарное) относит каждой упорядоченной паре эле- ментов х, у е М элемент /(я, у) е М', 3-арное (тернарное) каждой упорядоченной тройке х, у, геМ относит /(я, г/, г) е Л/'; и т. д. При М = М отображения называют также операциями (нульарной, унарной и т. д.) в множестве М. В алгебре бинарная операция часто обозначается символом *, и результат ее применения к элементам х, у (в заданном порядке!) пишется в виде х * г/; при таком обозначении (где символ * может быть заменен знаком той или иной конкрет- ной операции, например +, —, •, :) сама операция обычно назы- вается композицией, а результат х * у е М ее применения к паре элементов х, у е М — композицией этих элементов. Непустое множество М с заданным в нем набором операций (из М в М) произвольных арностей называется алгебраической системой.
АЛГЕБРАИЧЕСКИЕ СИСТЕМЫ С ОДНОЙ БИНАРНОЙ ОПЕРАЦИЕЙ О системах с одной нульарной операцией вряд ли надо что-то говорить особо. Случай одной унарной операции нам тоже пока не интересен; соответствующим историческим примером может служить множество N = {1, 2, ...} всех натуральных чисел с дей- ствием удвоения, считавшимся в древнем Египте самостоятель- ной операцией (а не частным случаем умножения). Напротив, бинарные операции играют в алгебре центральную роль: они важны не только сами по себе — во многих случаях к ним сводятся операции более высокой арности. Группоидом (М, *) называется произвольное непустое множе- ство М с заданной на нем композицией *, которая каждой паре (упорядоченной) элементов х, у е М относит некоторый элемент х * у е М. Примеры. Если М = М, а * — обычное сложение, то (М, *) = (М, +) — группоид; (М, •), где • — обычное умножение, — тоже группоид. Напротив, (М, —) и (М, :) — не группоиды (почему?). Если М = {1,2, ..., 10}, то (М,+) и (М, •) — не груп- поиды, ибо сложение и умножение чисел первого десятка могут выводить за его пределы: 7 + 8&М и 3«4ё М, хотя 7, 8, 3, 4 е М. Если х * у означает х*, то (М, *) — группоид, причем, в отличие от предыдущих примеров, здесь не всегда у * х = х * у. Несмотря на чрезвычайную общность понятия группоида (и, как следствие, почти полное отсутствие информации о группои- дах вообще), можно ввести очень важное определение и дока- зать теорему общего характера. Элемент е группоида (М, *) на- зывается нейтральным,, если х * е = е * х = х для любого х е М, или в записи с использованием логического квантора общности *, Не во всяком группоиде есть нейтральный элемент: в (М, +) нет, в (М и {0}, +) есть, а именно число нуль; в (М, *) нейтральным * Предполагается, что учащийся уже знаком с основными определениями и обозначениями математической логики (как и теории множеств), например, из курса "Введение в специальность". См. также книгу автора [8], упомяну- тую в Предисловии.
элементом служит число 1. В группоиде (М, *), где х*у = ху, имеем л; * \=х для любого х е М, однако число 1 ведет себя как нейтральный элемент только "с одной стороны" (справа), а уже 1 *хфх при хф\, так что 1 (и никакое другое натуральное число) не является нейтральным элементом. Теорема. В группоиде не может быть более одного нейтрального элемента. Доказательство. Пусть е и ё — нейтральные элементы группоида (М, *); покажем, что е = ё. Так как х*е = х для любого х е М, в частности и для х = ё, то е'*е = е'. А поскольку е'*х = х тоже для любого х е М, то ё * е = е. Но композиция ё * е — элемент М, однозначно опреде- ляемый по ё и е, следовательно, е = ё. Замечание. На самом деле здесь доказано более сильное утверждение (прежний результат при более слабых предположе- ниях): Если в группоиде (М, *) имеется как правый нейтральный элемент — такой е, что \/х е М: х * е = х, — так и левый нейтральный — такой е', что \/х е М: е'*х=х, — то е = ё и этот элемент (притом только он) служит нейт- ральным в данном группоиде. Группоид (М, *) называется полугруппой, если композиция * ассоциативна (сочетательна), т. е. Например, (М, +) и (М, •) — полугруппы, так как всегда напротив, (М, *) с х*у = ху — не полугруппа, ибо не всегда например, з'1'^(31)2. Еще пример: группоид (О,*), где О — множество всех рациональных чисел, а х * у = (х + у)/2 (среднее арифметическое), не является полугруппой, так как не для любых х, у, г е 0> значения совпадают (проверьте!). Полугруппа, обладающая нейтральным элементом, называется моноидом. Если этот элемент е явно указан, то моноид (М, *,е)
представляет собой алгебраическую систему с двумя операциями: бинарной (композиция *) и нульарной (фиксирующей элемент е\, но обычно записывают моноид просто в виде (М, *), не отмечая особо нульарную операцию. Для моноида (М, *) имеет смысл определение: элемент уеМ называется обратным для х е М, если х * у = у * х = е. Теорема. Никакой элемент моноида не может иметь более одного обратного. Доказательство. Пусть элемент х моноида (М, *) облада- ет обратными у и */'; покажем, что у = у*. Ввиду ассоциативности композиции, выражение у * х * у' без скобок имеет смысл, так как оба варианта расстановки скобок приводят к одному и тому же результирующему элементу: Замечание. Как и в теореме о единственности нейтрально- го элемента группоида, здесь на самом деле доказано более сильное утверждение: Если элемент х моноида имеет левый обратный — такой у, что у * х = е, — и правый обратный — такой у', что х*у'=е, то у = у' и этот элемент является единствен- ным обратным для х. Не обязательно каждый элемент моноида обратим, т. е. имеет обратный; но если х е М — обратимый элемент, то единственный ему обратный обозначается через х~*. Так как по определению обратного элемента х~* * х (= х * лг1) = е, то обратным для лг1 служит х, т. е. (х~*)~1=х. Из ассоциативности композиции * вытекает осмысленность выражений вида а * Ь * с ... с любым количеством "сомножите- лей", так как различные расстановки скобок приводят к одному и тому же результату. Доказательство этого в общем случае громоздко, и мы предпочитаем на первых порах вместо него предложить как упражнение вывод равенств для отдельных част- ных случаев, например последовательным применением закона ассоциативности.
Теорема. Композиция любого количества обратимых элементов моноида обратима. Доказательство. Пусть а, Ъ, с, А — обратимые элементы моноида (М, *); покажем, что для их композиции а * Ь * с * и обратным элементом будет яН * с~1 * Ь~] * от1 (то же самое рас- суждение проходит и при любом другом числе элементов). и точно так же Итак, обратный элемент для композиции обратимых эле- ментов — это композиция обратных элементов в обратном порядке. Аналогия: когда вы одеваетесь, то надеваете на себя сначала майку, затем рубашку, пиджак, пальто; когда раздевае- тесь, начинаете с пальто, после чего снимаете пиджак, рубашку, майку (для приличия мы рассматриваем только верхнюю поло- вину тела). В каждом моноиде один обратимый элемент заведомо есть — нейтральный е. Моноид, все элементы которого обратимы, назы- вается группой', ввиду особой важности этой алгебраической системы сформулируем ее определение без явного употребления понятий группоида, полугруппы и моноида. Система (М, *), состоящая из непустого множества М и за- данной в нем композиции *, называется группой, или, другими словами, множество М образует группу относительно бинар- ной операции *, если выполнены четыре условия: 1) для любых х, у € М однозначно определен элемент х * у е М\ 2) операция * ассоциативна;
3) в М имеется нейтральный элемент; 4) все элементы М обратимы. Примеры. (N,4-) — не группа (даже не моноид), так как не выполняется третье условие. (2, +), где 2 — множество всех целых -чисел, является груп- пой; здесь е = 0, а роль х~1 играет —х. (Ф, +) — группа. (О. •) — моноид, но не группа из-за необратимости нуля (паршивая овца всё стадо портит). (Ф \ {0}, •) — группа: множество всех отличных от нуля раци- ональных чисел образует группу относительно умножения. Задача. Покажите, что пару условий 3), 4) можно заменить более слабым требованием: в М есть левый нейтральный эле- мент е и каждый элемент х е М обладает левым обратным — таким уеМ, что у*х = е. Заменяется ли это условием суще- ствования в М таких элементов: а) левого нейтрального и право- го обратного? б) правого нейтрального и левого обратного? в) правого нейтрального и правого обратного? Теорема. В группе (М, *) при любых а, Ь е М каждое из уравнений однозначно разрешимо. Доказательство. Сначала допустим, что элемент х е М, удовлетворяющий первому уравнению, существует, и выясним, каков он (тем самым докажем его единственность), а затем про- верим, что он действительно удовлетворяет уравнению (т. е. докажем существование). Для второго уравнения рассуждение аналогично, и его предлагается провести самостоятельно. Итак, пусть х — конкретный элемент группы, для которого а * х = 6; тогда яг1 * (а * х) = а~1 * Ь, (а~1 * а) * х = а~1 * Ь, е * х = а~1 * Ь, х = а~' * Ь — только таким он и может быть. Урав- нению этот элемент удовлетворяет: Задача. Покажите, что в определении группы два пункта 3) и 4) можно заменить требованием разрешимости уравнений (*); достаточна ли разрешимость только одного из них?
Операция * в группоиде (М, *) называется коммутативной (переместительной), а сам группоид — коммутативным, если Коммутативную группу называют также абелевой\ во всех пре- дыдущих примерах группы были абелевыми. Важнейшими приме- рами неабелевых групп являются, в частности, Группы подстановок. Подстановкой п-й степени назы- вается биекция а: {1, 2, ..., п} -> {1, 2, ..., п}. Если и все различны), то подстановку пишут в виде а = |. . |; столбцы этой таблицы можно переставлять: важно ведь, во что переходит каждое из чисел, а не то, в каком месте это сказано. Например, если Пусть 5П — множество всех подстановок п-й степени, произведением а на р называется подстановка умножение подстановок не коммутативно.
При перемножении подстановок переставлять столбцы во вто- рой не обязательно, можно рассуждать и на исходной записи: а переводит 1 в 1, р переводит полученную 1 в 2, следовательно, ар переводит исходную 1 в 2; а переводит 2 в 3, р — 3 в 3, значит, ар переводит 2 в 3; а переводит 3 в 2, р — 2 в 1, поэтому ар переводит 3 в 1. Теорема. При любом п е N множество 5п образует груп- пу относительно умножения подстановок. При п = 1, 2 эти группы абелевы, при п>3 — неабелевы. Доказательство. Проверим для системы (5П, •) все четы- ре пункта определения группы. 1) Если а, ре 5П, то и аре 5П — это непосредственно ясно из определения произведения подстановок и в то же время яв- ляется частным случаем более общего утверждения: Пусть а: М -> N и р: N -> Р — биещии; тогда отображе- ние ар: М -»Р, относящее каждому х е М элемент р(а(л:)) е Л — тоже биещия. Его легко доказать, установив по отдельности инъективность и сюръективность отображения ар (= а-р). 2) Пусть а, р, уе 5П, / е {1, 2, ..., п} — любое и а(/)=/, Р(/) = *, У(^) = /; тогда ру(/) = /, а(р$Ш = 6, ар(0 = й, (ар)у(/) = /, т. е. образы любого элемента из {1, 2, ..., п} при отображениях а(ру) и (ар)у совпадают, а это и значит, что оба произведения — одна и та же подстановка: а(ру) = (ар)у. 3) Нейтральным элементом в 5П служит тождественная подстановка легко видеть, что для любой 4) Для той же имеем в самом деле,
Группа состоит из единственного элемента
(На месте каждой композиции х1 * л:у стоит тот элемент множе- ства М, который получается в результате.) Например, если элементы группы 53 обозначить через е = будет то таблица Кэли для этой группы Группа, заданная только законом композиции, называется абстрактной. Не всякая квадратная таблица, клетки которой (за исключением левой верхней) заполнены разнообразными эле- ментами, служит таблицей Кэли какой-то группы: заполнение должно быть таким, чтобы выполнялись все четыре пункта опре- деления группы.
Количество \М\ элементов группы (М, *) называется ее поряд- ком', группа с бесконечным множеством М считается группой бесконечного порядка', например, группа 5П подстановок п-й степени имеет порядок я! =1-2- ... • п, а группы (Ъ, +), (0>, +) и (О \ {0} •) — бесконечный порядок. Подсистемы и изоморфизм алгебраических си- стем. Пусть множество М Ф 0 образует алгебраическую систему относительно набора каких-то операций. Непустое подмножество ЛГ с М называется подсистемой этой системы, если относительно тех же операций оно образует систему того же типа, причем каж- дая операция в М' индуцируется той же операцией во всём М. Смысл этих терминов будет уточняться для той или иной алгебра- ической системы по отдельности, но второй из них хорошо иллю- стрируется следующим примером из математического анализа: /,(лс) = 51пл; в (—<х>,+о°) и [2(х) = $тх на —, — — две разные функции, так как области задания у них различны. Функция /2 индуцируется функцией Д на подмножестве — это значит, что *€ - , - => /2(л:) = %(х). При функция /2, в отличие от /!, не определена. Если на множестве М задана бинарная операция (отображе- ние) *, а на подмножестве М'сМ — операция *', то последняя индуцируется операцией * тогда, когда х*'у = х*у при любых х, у е ЛГ, иначе говоря, для элементов подмножества операция *' дает тот же результат, что и операция * во всём множестве. В таком случае штрих у звездочки можно опускать, т. е. обозна- чать индуцированную операцию тем же символом, что и исход- ную (аналогично обозначению $тх для функций }{(х) и /2(*)).
Пусть (М, *) — группоид, М'сМ, М'Ф0. Тогда (ЛГ, *) — подгруппоид исходного группоида, если во-первых, х, у е М' => х * у е М' (подразумевается справед- ливость импликации при всех х, у е М), т.е. (ЛГ, *) — тоже группоид; во-вторых, композиция * в М' индуцируется композицией в М. Аналогично определяются подгруппа и подмоноид. Пусть теперь (М, *) — группа, М'сУИ, М'Ф0 и операция * на М' — индуцированная. Для установления того, что (ЛГ, *) — подгруппа группы (М, *), достаточно проверить не все четыре пункта определения группы, а только первый и четвертый. В самом деле: 1), т. е. в данном случае х, уеМ'=$х*уеМ' для всех х, у из М, проверять необходимо — иначе подсистема (ЛГ, *) может не оказаться даже группоидом; 2) — ассоциативность — в М' выполняется автоматически, поскольку она имеет место для любых элементов М, а операция * — индуцированная; 3) вытекает из 4): если х е М' — любой, то, согласно 4), х~{ е ЛГ, а тогда, ввиду 1), е = х * х~1 е М'. Формально можно обойтись проверкой одного условия: х, у е М' => х * у~1 е М' (докажите!), но на практике обычно удобнее проверять 1) и 4) по отдельности. Примеры. Рассмотрим множество 5/г(1)с5/г подстановок, оставляющих на месте элемент 1, т. е. имеющих вид Ясно, что если то и что если то и Следова- тельно, подгруппа группы Множество подста- новок вида подгруппа группы и тем бо- лее подгруппа Вообще, если зафиксировать любые различные элементы где то множество
тех подстановок п-и степени, которые оставляют без изменения каждый из этих и элементов, будет подгруппой в 5„; крайние случаи: при и = 0 подгруппа совпадает со всей группой, а при & = п состоит из единственного элемента е и называется единич- ной подгруппой. Пусть (М, *) — моноид, М' — множество всех его обратимых элементов; ЛГ=^0, поскольку е е М'. Покажем, что (ЛГ, *) — подмоноид (М, *). 1) (М', *) — подгруппоид (М, *): х, у е М' => х * у е М', так как композиция обратимых элементов обратима; 2) е е М', поскольку нейтральный элемент обратим. Заметим, что (АГ, *) — не только подмоноид, но и группа, ибо по опреде- лению множества М' все его элементы обратимы. Две алгебраические системы называются изоморфными, если существуют такая биекция между их множествами и такая биек- ция между операциями, что соответственные операции над соот- ветственными элементами приводят к соответственным элемен- там, иными словами, в изоморфных системах все операции "дей- ствуют одинаково". Точное определение в общем виде громоздко, и мы будем давать его (как и определение подсистемы) для каждой конкретной алгебраической системы отдельно. Так, груп- поиды (М, *) и Ш, *) изоморфны, если существует биекция /:М->М, при которой Ух, уе М: /(* **/) = /(*)*/(#); упроще- ние записи: хотя значок ~ над М опускать нельзя, над * можно, ибо из того, элементы каких множеств соединяет знак компози- ции, уже ясно, в каком из двух группоидов эта операция рас- сматривается, именно Изоморфизм — отношение симметричное: если группоид изо- морфен другому, то последний изоморфен исходному. В самом
деле, пусть /: М —»М — изоморфизм; тогда отображение /^~1: М —» М, относящее каждому х е М тот единственный х е М, для которого }(х) = х, — биекция (почему?), притом изоморфизм: Г1(Х*У) = Г1(П*)*ПУ)) = Г1(П**У)) = Х*У = Г(Х)*Г(У) при любых х,уеМ и тех х,уеМ, для которых /(х) = л: и /(</) = #. Теорема. Если один из двух изоморфных группоидов (М, *) и (М, *) обладает каким-нибудь из свойств: комму- тативность, ассоциативность, наличие нейтрального эле- мента, обратимость всех элементов, — то и другой обла- дает тем же свойством. Доказательство. Коммутативность. Пусть в М всегда ^ * У = У * х и пусть х, у е М — любые, а / : М —> М — изоморфизм группо- идов. У х и у имеются прообразы — такие х, у е М (един- ственные, что в данном случае не важно), для которых }(х] = х и ?(у) = у. Имеем (объясните каждый шаг!): х * у = /(х) */((/) = = }(х * у) = !(у * х) = !(у] * /(*) = у * ^ . Ассоциативность. Пусть в М всегда х * (^/ * г) = (А: * у) * г, ;с, ^, ге М — любые, а х, у, г е М — их прообразы при изомор- физме / группоидов. Тогда
40 Алгебраические операции Нейтральный элемент. Пусть е — нейтральный элемент группоида (М, *); покажем, что ё = }(е) — нейтральный элемент в (А!, *). Возьмем яе М, и пусть х — прообраз этого элемента в (М, *). Равенства верны для любого хеМ, т. е. ёеМ удовлетворяет определению нейтрального элемента группоида (М, *). Обратимость. Когда в группоиде (М, *) есть нейтральный элемент е, тогда и изоморфный группоид (М, *) обладает таким ё - }(е) и определение обратного элемента имеет смысл для обоих группоидов. Если элемент х е М обратим, то для /(*)е М обратным элементом /(я)"1 служит }(х~1), ибо из х * х~{ = = х~1*х = е следует /(я) * !(х~~{) = $(х * х~{) = }(е) = § и анало- гично /(х"1)*/(л:) = е . Значит, если в (М, *) все элементы обра- тимы, то и в (М, *) — тоже. Следствие. Если один из двух изоморфных группоидов является группой (абелевой группой), то и другой — тоже группа (соответственно абелева группа). Пример. Пусть В — мнтожество из шести движений равно- стороннего треугольника ЛВС, переводящих его в себя: р0 — покой; р,, р2, рз — зеркальные отображения относительно бис- сектрис углов Л, В и С; р4 и р5 — повороты вокруг центра на 120° по часовой стрелке и против нее.
Произведением р, • ру- назовем движение, состоящее в последова- тельном выполнении [}, и ру; непосредственно составляем таблицу умножения этих движений: Так как все клетки заполнены элементами множества В = {р0, ..., Р5}, то (В, •) — группоид. Установив изоморфизм /: 53 —> В, мы в силу следствия получим, что (В, •) — группа. Чтобы легче было найти /, обозначим вершины треугольника цифрами 1, 2, 3; тогда ясно, что надо положить Переставляя в таблице умножения группоида (В, •) строки и столбцы так, чтобы придать вне- шним элементам (левее и выше черты) порядок р0, Ри р2> Рз> Р<н Рб> и сравнивая полученную таблицу с таблицей Кэли группы 53, убеждаемся в том, что /(ос,- • ос,-) == /(а,-) • /(ау) для всех а,-, а,- е 53. Упражнение. Пусть Р6 = {/1, ..., /6} — множество из шести функций: /,(*)=*, 12(х) = (х-1)/х, /3(х) = 1/(1 -х), /4(*)=1Д, /5(л:)=1— х, /6(л:) = х/(\ — х), а * — суперпозиция (подстановка функции в функцию): (/, * /2)(^) = /2(/1(^))- Показать, что — группа, изоморфная
АЛГЕБРАИЧЕСКИЕ СИСТЕМЫ С ДВУМЯ БИНАРНЫМИ ОПЕРАЦИЯМИ Пусть на множестве М=^0 заданы две бинарные операции, первую из которых будем называть сложением и записывать аддитивно, а вторую — умножением и записывать мультиплика- тивно, несмотря на то, что они могут не совпадать с обычными арифметическими действиями (и вообще множество М не обяза- но состоять из чисел); знак умножения часто опускают. Алгебра- ическая система (М, +, •) называется кольцом (множество М образует кольцо относительно операций + и •), если I (М, +) — абелева группа, II (М, •) — группоид, III умножение связано со сложением двумя дистрибутив- ными (распределительными) законами: Кольцо называется ассоциативным, если операция умножения ассоциативна: ху»г = х*уг*у т.е. (М, •) — полугруппа. Кольцо называется коммутативным, если операция умноже- ния коммутативна; в этом случае из двух дистрибутивных зако- нов достаточно проверять один, ибо другой будет из него следо- вать: пусть, например, установлено, что выполнен первый, тогда При наличии нейтрального элемента / по умножению само (М, +, •) называется кольцом с единицей. Примеры. Относительно обычных арифметических действий: (М, +, •) — не кольцо, так как (М, +) — не группа; заметим, что условия II и III здесь выполнены ("одна рана смертельная, но две другие, к счастью, не вызывают опасений"); налицо даже ассоциативность и коммутативность умножения, а также суще- ствование единицы. (Ъ, +, •) — ассоциативно-коммутативное число с единицей; заменив Ъ множеством только всех четных чисел, получим при- мер кольца без единицы (а что будет в случае множества всех нечетных чисел?). * Возможность опускать или не опускать точку в произведении позволила в данном случае обойтись без скобок.
(О» +» •) — ассоциативно-коммутативное кольцо с единицей. (М,+, х), где М — множество всех векторов трехмерного евклидова пространства, + — сложение векторов, х — векторное умножение, — является кольцом. Как следует из положений векторной алгебры, изучаемой в курсах геометрии, это кольцо не коммутативно, не ассоциативно и не имеет единицы. Вместо коммутативности в нем есть антикоммутативность благодаря которой и здесь оба дистрибутивных закона следуют друг из друга. В неассоциативных кольцах "почти ничего нельзя преобразо- вывать", если этот пробел не восполняется наличием каких-то других законов; в примере с векторами таким "компенсатором" служит тождество (Кольцо (М, +, •) называется лиевым,, если хх=^0 и ху • г + уг *х + гх*у = 0 при любых х, у, г е М\ предлагается самостоятельно доказать, что из хх = 0 следует антикоммута- тивность.) (Р,+, •), где Р — множество функций /: К -> К, определен- ных на всей действительной оси и принимающих действительные значения, причем для любых Д, /2 е Р функция Д+/2 относит каждому х е К значение /,(л;) + /2(я), а функция /!»/2 — значение /1(*)*/2(*)» — представляет собой ассоциативно-коммутативное кольцо с единицей, роль которой играет функция /(я) = 1 (а роль нуля — функция /(л;) = 0). Законы коммутативности, ассоциатив- ности и дистрибутивности сложения и умножения функций непосредственно следуют из тех же законов для действительных чисел. Примеры (М,+, х) и (Р,+, •) иллюстрируют такую возмож- ность, какая не имеет места для числовых колец с обычными арифметическими действиями: наличие ненулевых элементов, про- изведение которых равно нулю. Так, ххх = 0 даже если х — ненулевой вектор, а произведение двух функций
отличных от нуля кольца (Р,+, •), равно этому нулю: Л Л Элементы х и у кольца (М, +, •) называются делителями нуля, если хфО и уфО, но ху = 0\ при этом х — левый, у — правый делитель (для коммутативных колец такое различие теряет смысл). В предыдущих примерах кольца (2, +, •) и ((},+, •) — без делителей нуля, а (М,+, х) и (Р,+, •) — с делителями нуля. Займемся выводом простейших свойств произвольного кольца (М, +, •) из его общего определения. 0*х = х*0 = 0 при любом хеМ. (1) В самом деле, х*х + 0*х = (х + 0)*х = х*х, откуда, прибавляя к первой и последней частям равенства элемент —(х*х) и пользу- ясь ассоциативностью сложения, получаем 0*х = 0\ аналогично доказывается, что х*0 = 0. для любых х, у е М. Соотношение (—х)у = —(ху) означает, что элемент проти- воположный для ху\ но убедиться в этом легко: (—х)у + ху = = [(—х) + х]у = 0*у = 0 в силу (1) (и ху + (—х)у = 0, так как группа (М, +) абелева); аналогично доказывается, что х(—у) + ху (= ху + х(—у)) = 0. Элемент —(ху) можно записывать и без ско- бок: —ху. (—х)(—у) при любых Действительно, дважды применяя (2) и учитывая, что противопо- ложный элемент для противоположного — это сам исходный элемент, получаем (—х)(—у)=—[х(—у)] = —(—ху) = ху.
при всех Хц у{е М (т, п е Ъ). Этот общий закон дистрибутив- ности доказывается (т— 1)-кратным применением законов III с использованием ассоциативности сложения: Свойства (2) и (3) выражают "правило знаков при умноже- нии", но надо помнить, что — х означает элемент, противополож- ный (обратный по сложению) для х, а не "отрицательный": даже в обычной арифметике число — х не обязательно отрицательно (ведь могло быть х < 0), в кольце же общего вида понятия "по- ложительности" и "отрицательности" элемента не имеют смысла. Сумму х + (—у) можно записывать просто в виде х — у и назы- вать разностью элементов х и у. Теорема 1. В кольце без делителей нуля каждое из равенств сх = су и хс = ус при с ± 0 влечет х = у. Иными словами, равенство можно сократить с одной и той же стороны на множитель, отличный от нуля. В самом деле, если, например, сх = су, то с(х — у) = 0, и так как с Ф 0, а делителей нуля в кольце нет, то х — у = 0, т. е. х = у. Случай хс = ус аналогичен. В кольце с единицей обратимый элемент (имеющий обратный по умножению) называется еще делителем единицы. Теорема 2. В ассоциативном кольце (М, +, •) с единицей а) никакой делитель нуля не может быть делителем еди- ницы',
б) если с — делитель единицы, то (~с)~1 = -(с~[), т.е. выражение —с~{ имеет однозначный смысл. Доказательство, а) Пусть, например, ху = 0, где уф0, а х имеет обратный элемент х~[ (случай, когда хфО, а у имеет у~1, рассматривается аналогично). Тогда х~[(ху) = х~{ -0 = 0, отку- да, ввиду ассоциативности, (хх~[)у = 0, 1-у = 0 и у = 0, вопреки предположению, Кольцо из единственного элемента (который служит и нулем, и единицей) называется тривиальным. Если в кольце (М, +, •) имеет место 1 = 0, то оно тривиально, ибо тогда для всякого х е М: х = х • 1 = х -0 = 0. Нетривиальное ассоциативно-коммута- тивное кольцо с единицей, не имеющее делителей нуля, называ- ется целостным кольцом, или областью целостности] таково, например, кольцо целых чисел (Ъ, +, •). Ассоциативное кольцо с единицей, в котором каждый отличный от нуля элемент обратим, называется телом, а если к тому же умножение коммутативно, то полем. Примеры. Область целостности (Ъ, +, •) — не поле (даже не тело), ибо не у всех целых чисел, отличных от нуля, есть обратные; более того: делителями единицы здесь являются толь- ко 1 и —1 (докажите!). (О, +, •) и (К, +, •) — поля. В силу теоремы о делителях нуля и единицы никакое тело, в частности никакое поле, не имеет делателей нуля. Уже поэтому кольца (М,+, х) векторов и (Р,+, •) функций не явля- ются телами, тем более полями. Область целостности (в час- тности, тело и поле) не может быть тривиальным кольцом, так как 1 е М\{0] и поэтому 1ФО. Характеристика кольца. В числовых кольцах с обыч- ными арифметическими действиями числа 1, 1 + 1=2, 1 + 1 + 1=3, ... все различны. Но в произвольном кольце К = (Л1,+, •) суммы из п и из п + р единиц (п, р е М) могут оказаться одинаковыми,
или, что равносильно, сумма из р единиц — равной нулю *. Наи- меньшее количество р = р(К) единиц /, дающее в сумме 0, назы- вается характеристикой кольца. Если же / + /+ ... +1ФО при любом количестве слагаемых, то по определению считается р(К) = 0 (К — кольцо без характеристики). Примеры. Поле (О, +, •) с обычными сложением и умноже- нием обладает характеристикой р = 0. При р=\ мы имели бы тривиальное кольцо, как известно, не являющееся телом; поэтому тел характеристики 1 нет. Алгебраическая система ({0,1},+, •) с действиями 0 + 0 = 0, 0+1 = 1+0=1, 1 + 1=0, О-0 = 0-1 = 1.0 = 0, Ы = 1 (старинная русская арифметика "чёт-нечет") является полем ха- рактеристики р = 2; проверить выполнение всех пунктов опреде- ления поля предлагаем самостоятельно. Примеры полей с други- ми характеристиками будут рассмотрены позже. Теорема. Если (М, + •) — кольцо характеристики р, то сумма р слагаемых х+ ... +х = 0 для любого х е М. В самом деле, х +... + х = 1 • х +... + / • х = (/ +... + /)х = 0 • х = 0 при .—р—. ,—р_. р Ф 0, а "сумма нулевого количества слагаемых" считается рав- ной 0 по определению. Теорема. Если характеристика р=р(К) области целост- ности К отлична от нуля, то р — простое число. Доказательство. Допустим противное: характеристика некоторой области целостности имеет вид р = тп, где 1<т<р и \<п<р (т, п е М). Сумма из р единиц /+ ... +1 = 0. Сла- гаемые этой суммы можно распределить в т групп по п единиц; но тогда * Под "суммой из одного слагаемого а" (и "произведением из одного сомножи- теля а") понимается само а.
на основании дистрибутивного закона. Так как р — наименьшее количество единиц, в сумме дающих 0, то / + ...+ /*0 и 1—т—' в то время как / + ... + / = 0; но это невозможно, 1— Р—' поскольку К не имеет делителей нуля. О кольцах вычетов. Рассмотрим алгебраическую систему где теМ\{1}, а сложение и умножение определяются следую- щим образом: над числами производят обычное арифметическое действие, после чего результат заменяют его остатком от деле- ния на т. Например, в 27 = ({0, 1, 2, 3, 4, 5, 6},+, •): 1+3 = 4, 3 + 6 = 2, 3 + 4 = 0, 2-3 = 6, 2-4=1. 2т называется кольцом вычетов по модулю т. Как будет дока- зано в курсе теории чисел (II семестр), при т простом 2т — поле характеристики т. При т составном это только кольцо (ассоци- ативно-коммутативное, с единицей), но не поле, из-за наличия делителей нуля (так, в 26 имеет 2-3 = 0, хотя 2=^=0 и 3=^=0). Частный случай 22 (число 2 — простое!) был рассмотрен выше. Подкольцо и подполе. Общее определение подсистемы алгебраической системы примерительно к кольцам расшифровы- вается следующим образом: непустое подмножество М' с М эле- ментов кольца (М, +, •) является его подкольцом, если система (М', +, •) образует кольцо относительно операций, индуцирован- ных на М' исходными операциями + и * (обозначаемыми так же; допуская вольность, говорят: "относительно тех же операций"). Заменяя везде слово "кольцо" на "поле" или "тело", получаем определение подполя, соответственно подтела. Например, кольцо четных чисел является, а множество нечет- ных не является подкольцом в (2, +, •). Поле, а тем самым коль- цо, (С1,+, •) содержит подкольцо (2,+, •), не являющееся подпо- лем. Никакое из колец вычетов 2т при т > 1 не есть подкольцо в (2,+, •): хотя (0, 1, ..., т — 1} с 2, операция сложения (а при т>2 и операция умножения) в 2т не индуцируется одноименной операцией кольца целых чисел, т. е. это "другое действие".
Если М'сМ — непустое подмножество элементов кольца (М, -К •), то для проверки того, что (ЛГ, +, • ) — подкольцо, достаточно установить выполнение двух условий: а) (М', +) и (М', •) — группоиды, т. е. всегда из х, у е М' следует х + у е М' и х*у е М'\ б) если х е ЛГ, то — х е М'. В самом деле, так как ЛГсМ, а (Л1,+) — группа, то из пер- вой части а) и из б) уже вытекает, что (М', +) — тоже группа; вторая часть а) обеспечивает выполнение условия II: (М', •) — группоид; условие III (дистрибутивность) и коммутативность сло- жения автоматически выполняются на подмножестве М', коль скоро они выполнены на всём М. В случае, если (М, +, •) — тело, для проверки того, что (М', +, •) является его подтелом, достаточно кроме а) и б) про- верить еще выполнение условия в) если х е М'\{0}, то и х~1 е М'\{0}. Действительно, обратимость любого элемента хфО в М' влечет отсутствие там делителей нуля, что вместе со второй частью а) приводит к выводу: (ЛГ, +, •) — группоид; отсюда и из б) выте- кает, что это группа, ибо М'\{0} &М\{0}, а (М\{0}, •) — группа. Наконец, если (М, +, •) — поле, то коммутативность умножения в (ЛГ, +, •) получается автоматически. Изоморфизм колец и полей. Общее понятие изомор- физма алгебраических систем применительно к кольцам выража- ется следующим точным определением: кольцо (М, +, •) изомор- фно кольцу (М, +, •), если существует такая биекция / : М —» М , что для любых х, у е М: !(х + у) = !(х) + !(у) и 1(х.у) = 1(х)-1(у). Заметим, что операции + и • даже при М = М не обязатель- но одни и те же в обоих кольцах, хотя и обозначены одинаково (а при МПМ = 0 само понятие "одна и та же операция" и вовсе теряет смысл). Заметим также, что в определении изомор- физма на самом деле излишне заранее считать систему (М, +, •) кольцом — достаточно предположить, что (М, +) и (М, •) —
группоиды, ибо благодаря теореме о переносе свойств группоида на изоморфный система (М, +, •) вместе с кольцом (М, +, •) удовлетворяет условиям II и III, дистрибутивность же получается следующим образом: если *, у, г е М — любые, а х, у, г е М — такие, что /(*) = *, 1(у) = у, /(г) = 2, то аналогично (у + г)х = ух + гх. Из той же теоремы вытекает, что любое из свойств ассоци- ативности, коммутативности, существования единицы и обратимо- сти ненулевых элементов тоже переносится на изоморфное коль- цо; в частности, если (М, +, •) — поле, то его изоморфный образ (М', +, •) — тоже поле.
РАСШИРЕНИЕ ПОЛЕЙ Нам теперь удобнее сформулировать определение поля без явного упоминания кольца. Алгебраическая система (М, +, •) называется полем, если I (М, +) — абелева группа; II (М, •) — группоид, а (М\{0}, •) — абелева группа; III сложение и умножение связаны дистрибутивным законом (его ввиду коммутативности умножения можно записать в любой из двух форм). Равносильность обоих определений поля доказы- вается без труда; предлагаем это читателю. Вывод простейших свойств поля из его опре- деления. Так как в поле операция умножения коммутативна, то ху~1 = у~{х при любом уфО к запись каждого из этих произ- ведений в виде дроби х/у не приведет к путанице. Ниже пред- полагается, что х, у, г, г — произвольные элементы поля (М, +, •), причем те из них, которые помещены в знаменатель, отличны от нуля. х/у = г/г тогда и только тогда, когда Действительно, из ху~1 = гг~1 умножением обеих частей на уг и использованием ассоциативности и коммутативности получаем х1 = уг. Наоборот, из последнего равенства, предполагая уфО и ГФО, умножением на у~{г~{ получаем ху~1 = г{-[. В самом деле, = (хг± уг)(у{)~[ = (хг±уг)/уг\ при этом кзуФОкгфО следует у1ФО ввиду отсутствия делителей нуля, а (уг}~1 = 1~1у~1 =у~1{~1 благодаря коммутативности. Формулы предлагается доказать самостоятельно. Следствие: (—х)/(—у) = (х/у). Эти тождества выражают "правила действий с дробями".
Расширением Р = 1м, +, •) поля Р = (М, +, •) называется такое поле, что Р является подполем Р, притом собственным: л / л л \ л Л1сЛ1^МсМ&М*М), проще: Р — собственное подполе Р, л л т. е. Р с Р. Так же называют Р и в случае, когда оно содержит не само Р, а изоморфное ему подполе Р'. На одном примере мы продемонстрируем типичный для алгебры способ расширения, т. е. построения некоторого расширения заданного поля. изоморфизм Исторический процесс последовательных расширений поля 0> рациональных чисел состоял в том, что всякий раз, когда возни- кала необходимость оперировать с той или иной величиной, не выразимой никаким рациональным числом точно, но имеющей четкий геометрический смысл (диагональ единичного квадрата, длина полуокружности единичного диаметра или площадь круга единичного радиуса и др.) и допускающей рациональное прибли- жение со сколь угодно малой ошибкой, эту величину тоже назы- вали числом, хотя и "глухим", "невыразимым", "иррациональ- ным" *, как-то обозначали (^/2 , я и т. п.) и действовали с таки- ми числами по тем же правилам, что и с прежде известными. Правомерность подобной экстраполяции законов подтверждалась геометрическими построениями, а также приближенным вычисле- нием с любой наперед заданной точностью. Так, добавляя к рациональным числам "глухое" >/2 , для которого (л/2) =2, * Этот латинский термин можно перевести двояко: "не являющийся рацио- нальным (числом)" и "не поддающийся уразумению".
надо добавить и все числа вида х + г/л/2 с рациональными х и г/, а складывать и перемножать такие числа по правилам В качестве упражнения предлагаем проверить, что алгебраи- ческая система ({х + у\/2/х, уеО>\, +, •] является полем (суще- ствование (х + у^/2] во всех случаях, кроме х = у = 0, доказыва- ется школьным приемом "избавления от иррациональности в зна- менателе"). Таким путем получается, как мы покажем ниже, "самое экономное" из расширений поля О, приводящих к разре- шимости уравнения г2 = 2, коэффициенты которого принадлежат полю 0>, но которое в самом этом поле не имеет корней. Исторический путь присоединения >/2 к полю 0> нельзя счи- тать ошибочным (ведь результаты получаются правильные!), но он не обоснован: почему, например, не известное дотоле число, квадрат которого равен 2, можно добавить к рациональным чис- лам, а число, равное одновременно 2 и 3, — нет? Во втором случае противоречие видно сразу, но где гарантия, что и в пер- вом случае оно когда-нибудь не обнаружится? Эти сомнения отпадут, если мы построим из некоторых четко определенных элементов такое поле ф, которое содержит подполе 0)', изомор- фное О, но в котором уже разрешимо уравнение 22 = 2', где 2' — образ элемента 2 е <0> при изоморфизме /: О —> <0>'. Тот факт, что число вида х + у\/2 ("стихийно" возникшее в историческом процессе) полностью определяется заданием упоря- доченной пары (х, у) рациональных чисел, наводит на мысль взять за элементы ф всевозможные такие пары, а правила (*) подсказывают (не доказывают!) следующие определения сложе- ния и умножения пар:
Алгебраическая система ф — поле. Для доказательства надо проверить пункты I, II, III определения поля целиком, по- скольку пары чисел — новые объекты, не принадлежащие ника- кой ранее известной нам алгебраической системе. Но проверку некоторых подпунктов из I и II можно объединить. Для кратко- сти же условимся через ф обозначать как всю систему, так и множество 0>2 = {х,у)/х, у е 0} ее элементов. (Ф, +) и (Ф, *] — группоиды. Это непосредственно следует из определения действий над парами и из того, что (0,+) и (О» •) — группоиды. Сложение и умножение в ф коммутативны. Действительно, в силу коммутативности + и • в О и определения этих действий в ф , Сложение и умножение в ф ассоциативны. В самом деле, поскольку в О сложение ассоциативно. Далее,
равенство обеих полученных пар (во внешних скобках) следует из законов коммутативности, ассоциативности и дистрибутивнос- ти в поле О: "школьные" выкладки для установления покомпонен- тного равенства этих пар предоставляем читателю. В О справедлив дистрибутивный закон (III). Именно, и опять с помощью выкладок в поле О убеждаемся, что полу- ченные пары совпадают. (Ф» +) — абелева группа. Пункты 1 и 2 определения группы и ее коммутативность уже проверены. Но, очевидно, пара (О, О) является нейтральным элементом по сложению, а противополож- ным элементом для (х,у) служит пара (—х,—у). (Ф\{(0» 0)}» ') — абелева группа. Из всего сказанного выше уже следует, что (Ф, +, •) — ассоциативно-коммутативное кольцо (проверьте все пункты его определения!). Пара (1,0) служит нейт- ральным элементом по умножению: (х, г/) (1,0) = (х-\+2у-0, х • 0 + у - 1) = (х, у), аналогично (1,0) (х, у) = (х, у). Докажем обра- тимость каждого ненулевого элемента. Пусть (а, Ь) — ненулевая пара, т. е. по крайней мере одно из чисел а, Ь е 0> отлично от нуля; найдем такую пару (х, у), для которой
Ввиду коммутативности умножения в 0>, достаточно найти пару, удовлетворяющую уравнению (а, Ь) (х, у) = (1, 0); это и будет искомый элемент (а, &)~!, поскольку в системе (О, •) он может быть только один. Для поиска этого элемента запишем уравнение, которому он должен удовлетворять, в виде что равносильно системе двух уравнений относительно х и у в Исключая у из этих уравнений (умножением первого на а, вто- рого на — 2Ь и сложением), получим (а2 — 2Ь2)х = а, а исключение х дает (а2 — 2Ь2)у = — Ь. Множитель а2 — 2Ь2ФО: действительно, из а2 = 2Ь2 ввиду пред- положения (а, Ь)Ф(0, 0) следовало бы Ь^О и, далее, (аД)2 = 2, что невозможно (почему?). Значит, искомые числа х и у могут а -Ь быть только такими: х = —„——т, У- 2 0,2 * — а тот факт, и — 2& Л" ~~ ^& что найденная пара на самом деле есть (а, Ь)~\ проверяется непосредственно: Заметим, что для чисто формального доказательства обрати- мости пары (а,Ь) Ф (0, 0) достаточно произвести эту проверку, взяв найденную пару "с потолка" (и показав лишь, что знамена- тель дробных выражений отличен от нуля), но мы предпочли гаданию целенаправленный поиск.
Таким образом, все условия, содержащиеся в пунктах I, II и III определения поля, для системы (^ = (<0>, +, Л проверены (только в иной последовательности). Поле <ф пар содержит подполе, изоморфное <0>. Рассмотрим собственное подмножество <$' с <ф пар вида (х, 0), где х е <0>, и покажем, что оно образует в (ф подполе. На сей раз достаточно проверить три пункта: (<0!', +) и (О)', •) — группоиды; (а) и в самом деле, (х{,0) + (х2,0) = (х{+х2,0)е (У, (*„ 0) (*2, 0) = (х{х2 + 2-0-0, х{ • 0 + 0 - х2) = (х{х2, 0) е (У; -(*, 0) = (-*> 0) е <$'• (б) если (х, 0) е <0>'\{0, 0}, то л:=^0, но тогда и (х,0)-* = (х-*,0)еф\{0,0}. (в) Для доказательства изоморфизма полей <0> и (У определим отображение: / : <0>-> <0>', полагая /(*) = (*,()) при любом х е 0>. Ясно, что это биекция, притом изоморфизм, ибо /(*! + Х2) = (X, + Х2, 0) = (Х{, 0) + (Х2, 0) = 1(Х{) + }(Х2), /(*1*2) = (*1** 0) = (^И 0) (** 0) = /(*1)/(*2)- В поле о_ уравнение (х, у)2 = (2, 0) разрешимо. Заметим, что именно этого мы добивались расширением поля О: (х, у) е (} — это неизвестный элемент, (х, у)2 означает (х, у) (х, у), а элемент (2, 0) е 0 , принадлежащий подполю (У поля О, отвечает числу 2 при естественном изоморфизме / : О —> (У. Предварительный поиск пары (х, у) сейчас не нужен: "история" сразу подсказывает одно из решений (х,у) = (0, 1) («72 — число вида х + у^ с я = 0, у=1), и остается лишь проверка:
Требуемое расширение поля рациональных чисел построено. Предлагаем в качестве упражнения проверить, что уравнению (х, у)2 = (2, 0) удовлетворяет также пара (0, —1), и доказать, что других решений, кроме (0,±1), нет (здесь уже понадобится поиск, сводящийся к решению в рациональных числах системы двух уравнений для х и у). Так как в алгебраической системе главное — не природа эле- ментов (и тем более вид их записи), а правила действия с ними, то можно считать (ф' и 0> одним и тем же полем, а пару (х, 0) — лишь другим обозначением числа х, само же х — другим обозна- чением пары (х, 0); обозначением пары (О, 1) естественно считать символ л/2 . А тогда произвольная пара (х, у) запишется в виде х + г/л/2 , поскольку (х, у) = (х, 0) + (0, у) = (х, 0) + (у, 0) (О, 1), и такое представление единственно: если (*,г/) = (*',0) + (г/',0)(0, 1), то правая часть равна (х', 0) + (у'- О + 2 • 0 • 1, г/'-1 + 1-0) = = (*'»*/')» откуда х' = х и у' = у (равенство упорядоченных пар!). Итак, расширением поля О, приводящим к разрешимости уравнения 22 = 2, можно считать вместо поля (ф пар поле состоящее из чисел вида х + у\/2 с рациональными х, у и прави- лами действий (*). В согласии с диалектическим законом отрица- ния отрицания мы вернулись к тому, что стихийно возникло в историческом процессе, но на более высокой ступени понимания: 1 ^ теперь уже >/2, - л/2 , - + 5\/2 — не какие-то мистические о 7 "глухие числа", а иначе обозначенные пары (0,1), (0,—1/3), (3/7, 5) "вполне реального" поля ф (или соответствующие эле- менты любого изоморфного ему поля). Аналогичным путем можно из поля рациональных чисел полу- чить такое расширение 0(>/3), в котором разрешимо уравнение
22 = 3, такое <0>(л/2), где разрешимо 23 = 2, и т.п. Двумя после- довательными расширениями строится поле <0!(>/2, >/3) = = <0>(>/2)(>/3), в котором разрешимы оба уравнения г2 = 2 и 22 = 3, и т. д. Относя такого рода примеры на практические занятия, мы в лекциях осветим вопрос "наибольшей экономности" расширения. <^\^12) — не единственное расширение поля <0>, приводящее к разрешимости уравнения г2 = 2: тем же свойством обладают, например, поле <0!(>/2, >/3) и поле К действительных чисел. Однако единственность (с точностью до изоморфизма) будет иметь место при дополнительном требовании минимальности расширения: ни в каком собственном подполе этого расширения, содержащем <0>, уравнение г2 = 2 уже не имеет корней. Теорема. Все минимальные расширения -поля рациональ- ных чисел, приводящие к разрешимости уравнения г2 = 2, изоморфны друг другу. Доказательство. Минимальное расширение поля <0>, со- держащее корень уравнения г2 = 2, должно вместе с ^2 вклю- чать и все числа вида х + у^/2 (х, у е О) — иначе оно не обра- зовывало бы даже группоида относительно сложения или умно- жения. Покажем, что из равенства х{ + #,л/2 = х2 + у2\/2 следует х1=х2 и у\=у<2- (Обратное утверждение тривиально.) Пусть х{ + ^л/2 = х2 + у2^ — один и тот же элемент расшире- ния: тогда (у1 -у2)^2 = х2 -х1. Если #, =#2» то Х\=Х2 и утверж- дение доказано, в случае же У\^У<2 мы имели бы ^/2 = (х2 - х1 )/(у1 - у2) € (} , что невозможно. Благодаря единственности представления элементов расширен- ного поля в виде х + у^ (х, у е (ф), отображение / этого рас- ширения на поле пар ф, определяемое равенством
является биекцией; более того, / — изоморфизм: Итак, любое минимальное расширение поля 0>, содержащее корень уравнения г2 = 2, изоморфно полю <ф(>/2); а так как бинарное отношение изоморфизма полей — эквивалентность, то все такие расширения изоморфны друг другу. Теорема доказана. На примере поля 0>(^\ мы разберемся еще в одном интерес- ном вопросе: какой именно из двух корней уравнения г2 = 2 взят в качестве числа >/2? Ответ "положительный корень" имеет смысл при использовании таких дополнительных свойств число- вого поля, которые выражаются отношениями >, < и, как мы вскоре увидим, не вытекают из общего определения поля (и не во всяких полях могут быть естественно введены). Если исхо- дить только из условий I, II и III, то о двух корнях ^/2 и ~>/2 уравнения можно сказать лишь, что они противоположны друг другу, но называть первый "положительным", а второй "отрица- тельным" бессмысленно: с таким же успехом мы могли обозна- чить символом ^/2 пару (0, —1), и тогда пара (О, 1) получила бы обозначение
Аналогичное положение возникает при попытке как-то различить вершины при основании равнобед- ренного треугольника, отвлекаясь от его конкрет- ного расположения в плоскости с заданной ориен- тацией (позволяющей считать одну вершину "пра- вой", а другую "левой"). Полное равноправие обеих вершин выражается в том, что существует такое преобразование треугольника в себя, которое переводит эти две вершины друг в друга, — именно зеркальное отражение относи- тельно высоты. Равноправие в поле <0>(>/2] обоих корней урав- нения 22 = 2 выражается доказываемой ниже теоремой. Изоморфизм поля на самого себя называется автоморфиз- мом. Кроме тривиального автоморфизма /(*) = *, оставляющего без изменения каждый элемент, поле может допускать и другие. Теорема. Поле <0>(>/2) допускает такой автоморфизм /, при котором }(^2\ = -^/2. Доказательство. Определим отображение полагая /(*+ гл/2] = х-у^2 при всех х, у е {}; / — биекция (докажите!), притом изоморфизм:
Это искомый .автоморфизм: при л; = 0, у=1 получаем 1(Щ=-я. Теорема доказана; при л; = 0, у = —\ имеем /(-л/2) = >/2, так что автоморфизм / меняет местами корни уравнения 22 = 2. Пусть теперь Р — произвольное поле, а уравнение где п е N и все а, е Р(ап=/), не имеет корней в Р. Простым алгебраическим расширением Р(Ф) этого поля называется такое его минимальное расширение, в котором уравнение (**) разреши- мо (под д можно понимать любой из его корней, принадлежащих расширенному полю). Любопытно, что "составное" расширение — результат нескольких последовательных простых — всегда можно представить как одно простое; на дальнейшем изучении этого воп- роса мы в общем курсе не останавливаемся, а желающим предло- жим частный пример: найти такой элемент Ф и такое уравнение с рациональными коэффициентами, которому он удовлетворяет, чтобы простое расширение Р(Ф) совпало с полем В то же время никакими алгебраическими расширениями не- возможно превратить 0> в поле К действительных чисел — хотя бы уже потому, что последнее имеет мощность континуума, тог- да как О и все поля, получаемые из О последовательными про- стыми расширениями, только счетны. Вопросы, относящиеся к мощности — обобщению понятия количества элементов на бес- конечные множества — принято первоначально рассматривать в курсе математического анализа *: для получения К из О там применяют аналитические методы, с использованием свойства полноты, одну из формулировок которого выражает принцип вложенных отрезков: все отрезки последовательности, в кото- рой каждый следующий принадлежит предыдущему, имеют об- * См. также книгу автора [8].
щую точку. Такой подход возможен в полях, элементы которых сравнимы друг с другом ("больше", "меньше"). Поле (М, +, •) называется упорядоченным, если на множе- стве М задано отношение порядка <, удовлетворяющее условиям при любых х, у, г е М т. е. всякие два элемента сравнимы; В частности, поле рациональных чисел ф упорядочено тем отношением <, которое имеет общепринятый смысл, и расшире- ния <^(>/2), <0>(>/2,>/3), ..., К упорядочены тем же отношением. Вместо х<у пишут также у>х. Не всякое поле можно упорядочить: для этого необходимо (но, как мы увидим в следующем разделе, не достаточно), чтобы оно обладало характеристикой р = 0. Действительно, пусть р>0. Из (4) следует, что 0<1 или 1 <0\ но в первом случае, благо- даря (5) и (2), /</ + /</ + / + /<.., и дойдя до суммы из р единиц, получим 1 <0, и из 0 < 1 и 1 <0 согласно (3) вытекает 0 = 1, что невозможно; к такому же абсур- ду приходим и во втором случае. На упорядоченном поле (М, +, •), которое можно записать в уточненном виде (М, +, •, <), введем отношение строгого нера- венства х<у, означающего "х<у и хфу"', тогда вместо аксиом (3) и (4) достаточна одна: для любых х, у, г е М имеет место одно и только одно из трех отношений: х = у, х<у, у<х (или, в другой записи, х > у)\ после такой замены само упорядо- ченное поле позволительно обозначить через (М, +, •, <).
Действительное число х называется алгебраическим, если оно удовлетворяет некоторому алгебраическому уравнению с рацио- нальными коэффициентами, т. е. если существуют такое п е N и такие а0, аъ а2, ..., апеО>, причем ап=^0, что (не нарушая общности, можно здесь считать ап=1; почему?). Неалгебраическое число, т. е. не удовлетворяющее никакому уравнению указанного вида, называется трансцендентным *. Приведенные выше соображения, основанные на сравнении бес- конечных множеств по мощности, говорят о существовании аж кон- тинуума трансцендентных чисел, но еще не дают возможности на- звать конкретно хотя бы одно из них. Такие примеры нашел в 1844 году Ж. Лиувилль, но это были числа, специально им постро- енные, и лишь в 1883 году Ш. Эрмит доказал трансцендентность числа е = 2,718281828459045... (основание натуральных логариф- мов), уже прочно вошедшего к тому времени в математику; транс- цендентность же "истинно древнего" числа п = 3,14159265358... ус- тановил в 1892 году Ф. Линдеман, а 1907 г. Д. Гильберт сильно упростил оба доказательства. На основании теоремы Линдемана можно, например, сразу сказать без всяких вычислений, что равен- ство я3— Юл+ 0,41 =0 не является точным. Множество 0>[п] всех чисел вида а0 + а1я + а2я2 +... +апкп (п е М, все а,- е <0>) образует в К не подполе, а только кольцо, так как уже не содержит 1/я: из существования представления 1/я = а0 + а1я + а2я2 +... +аппп вытекало бы, что —1+а0я + + а1я2 + а2я3 + ... + а/гя" + 1 =0, вопреки теореме Линдемана. Но и добавление к суммам слагаемого а_{/п не превратит <0>[я] в поле: предлагаем читателю доказать невозможность представления 1/(1+я) = а_1/я + а0 + а1я + а2я2 + ... + апя/г. Забегая вперед, со- общим, что простое трансцендентное расширение <0>(я) поля О, т. е. минимальное поле, содержащее подполе О и число я, ап +а,я + а9я2 + ... + аяпп состоит из всевозможных чисел вида ———-——*—————*—, где Ь0 +Ь]п + Ь2п + ... + Ьтпт п, т е N и {0}, а0, ..., Ьт е О, и не все Ь> — нули. * "Непознаваемым" (лат.).
Всё сказанное остается в силе, если заменить п любым дру- гим трансцендентным числом. Теорема. Расширение поля не меняет его характери- стики. Весьма простое доказательство предоставим читателю.
ПОЛЕ КОМПЛЕКСНЫХ ЧИСЕЛ Как уже говорилось во вводной лекции, численное решение алгебраических уравнений степени более 2, даже при наличии у них действительного корня, привело к необходимости опериро- вать с числами непонятной природы, имеющими вид х + у\рЛ, где л/^Т — "мнимое" ("софистическое") число с "немыслимым" свойством п/-1) =-1. Предполагая однако, что коммутативный, ассоциативный и дистрибутивный законы сохраняют силу и для таких чисел, получаем правила их сложения и умножения: где *!, х2, у{, у2 е К — не "софистические" (хотя, возможно, и иррациональные) числа. Для обоснования этого математического детища эпохи Воз- рождения мы, как и при добавлении ^/2 к полю 0>, построим такое алгебраическое расширение поля К, в котором разрешимо уравнение г2 = — 1. Опять возникает мысль считать элементами нового поля упорядоченные пары (х, у) чисел, но теперь уже действительных, а сложение и умножение этих пар ввести в согласии с историей: Покажем, что система ({х, у)/х, у е К}, +, •) — поле, содер- жащее изоморфное К подполе, и что в таком расширении разре- шимо уравнение, соответствующее 22 = — 1. При этом мы будем подробно останавливаться лишь на тех моментах, где имеется существенное отличие от превращения поля О в (0)(>/2). Введем обозначение К ={(*, У)/Х, у&Щ и напомним еще раз, что равен- ство (х1,у1) = (х2,У2) означает х{ = х2 & у{ = у2.
То, что (М, +) и (М, •) — группоиды, притом коммутативные и ассоциативные, и что в алгебраической системе (&,+,-), кото- рую мы будем также обозначать просто через К , имеет место закон дистрибутивности, доказывается по прежней схеме; надо лишь вместо коммутативности, ассоциативности и дистрибутивно- сти в 0> ссылаться на те же законы в К и не забывать о раз- нице в определениях умножения пар. Остаются в силе и выводы о том, что (М, +) — абелева группа, а элемент (0,1) служит единицей ассоциативно-коммутативного кольца (И, +, •); прове- рим последнее: (1, 0)(1, я) = (1-я — 0-г/, 1 -у + 0 -х) = (х, у). Для доказательства обратимости любого ненулевого элемента (а,Ь) в К прибегнем сначала к "историческому" преобразованию где а2 + Ь2 =^0 (сумма квадратов действительных чисел, из кото- рых по крайней мере одно отлично от нуля). Это наводит на мысль сразу проверять, что пара служит обратным элементом для (а, Ь) =^(0, 0). И в самом деле,
Ввиду коммутативности умножения пар производить такую проверку при переставленных сомножителях излишне (хотя как упражнение и не вредно), а единственность обратного элемента установлена ранее для моноидов общего вида. Окончание доказательства того, что (М, +, *) — поле, дослов- но прежнее. Так же, как прежде, доказывается, что пары вида (х, 0) (теперь х е К) образуют подполе, изоморфное К, при есте- ственном изоморфизме }(х) = (х, 0); в частности, /(—1) = (—1, 0). Мы не только докажем разрешимость в К уравнения (х,у)2 = = (—1,0), но и найдем все его решения — теперь этот вопрос более важен, чем при построении поля ^(^/2\ Данное уравнение в развернутом виде (х2 — у2, 2ху) = (— 1, 0) равносильно системе двух уравнений х2-у2 = -1, ху = 0, все действительные решения которой надо найти. Ввиду отсутствия в К делителей нуля второе уравнение оз- начает, что х = 0 или у = 0. При х = 0 из первого уравнения получаем у2=1, т. е. г/ = ±1, а при у = 0 первое уравнение при- нимает вид х2 = — 1 и не имеет действительных решений; поэтому пары (О, 1), (0, —1), и только они, служат решениями уравнения (х, у)2 = (— 1, 0) в поле к. Трактуя символ числа х е К как другую запись пары (х, 0) из К и обозначая пару (О, 1) буквой /, получим для любого элемен- та поля К представление (х, у) = (х, 0) + (у, 0)(0, 1) = х + у.1 = х + 1у (принято писать х + 1у, но в то же время а + Ы, а не а + 1Ь).
Итак, искомое расширение КК/--11 поля К состоит из чисел вида х + 1у, где х, у е К, а /2 = — 1; но это уже не "мистические числа", а иначе обозначенные "вполне реальные" пары "вполне реальных" действительных чисел (снова вспомним диалектический закон отрицания отрицания!). И теперь справедлива Теорема. Все минимальные расширения поля действитель- ных чисел, приводящие к разрешимости уравнения г2= —1, изоморфны друг другу. Доказательство. Минимальное расширение поля К, со- держащее корень I этого уравнения, должно содержать и все числа вида х + 1у (х, уе К). Покажем, что если х1 + 1у1=х2 + 1у2, то х{ = х2 и у{ = г/2- Пусть х{ + 1у{ = х2 + 1у2, что равносильно 1(у1 — у2) = х2 — х{. Отсюда либо х{ = х2 & у{ = у2 (что и требовалось), либо у\ — у2фО', У — у но второй случай невозможен, ибо тогда было бы I = ———1еК. У1-У2 Благодаря единственности представления чисел расширенного поля в виде х + 1у, отображение [(х + 1у) = (х, у) является биек- цией рассматриваемого минимального расширения Щ/) поля К на поле пар К . Эта биекция / — изоморфизм: Аналогично прежнему, отсюда следует, что все минимальные расширения поля М, приводящие к разрешимости уравнения
22 = —1, изоморфны полю К, значит и друг другу. Теорема до- казана. Минимальное расширение К(/) поля К, содержащее элемент /, такой что /2 = — 1, называется полем комплексных чисел и обо- значается через С; так же можно называть и обозначать любое изоморфное ему поле; элементы С — комплексные числа х + 1у. Хотя поле С, будучи расширением К (а значит, и расширением 0>), обладает характеристикой р = 0, упорядочить его невозможно. В самом деле, допустим, что между парами элементов С удалось установить отношение <, удовлетворяющее аксиомам (1)—(6) упо- рядоченного поля. Так как /=^0 (почему?), то либо /<0, либо 1*>0. В первом случае по аксиоме (5) 0<— / и, согласно (8), О <(—/)(—/) = —1, 0 <(—/)(—1) = /, т.е. />0; во втором случае аналогично получаем противоречие I> 0 & г < 0. Нетривиальный автоморфизм /(* + и/) = х — 1у поля С называ- ется сопряженностью: если г = х + 1у, то число, сопряженное с г, по определению есть *г - х + 1у = х-1у\ непосредственно полу- чаем: 2 = 2, 2, + 22 = 2, + 22, 2^ =2^22, 2 • 2 = X2 + у2 ; Д6ЙСТВИ- тельное неотрицательное число ^1х2 + у2 (арифметический квад- ратный корень) называется модулем (абсолютной величиной) комплексного числа г и обозначается через |г|; таким образом, 2-2 = ^2 и -г\ - 2, . Непосредственными вычислениями можно также проверить, что но удобнее для этого другая форма записи комплексных чисел. Следуя Ж. Аргану (1806), будем рассматривать элемент поля К как пару координат точки в прямоугольной декартовой систе- ме хОу. "Чисто мнимые" числа вида 1у (у е К) изобразятся точ- ками оси ординат Оу, которая тем самым удостоится титула мни- мой оси, а числа х е К — точками действительной оси Ох. Про-
извольное же комплекс- ное число г = х + 1у изоб- разится вектором 02 , идущим из начала коор- динат 0(0, 0) в точку 2(х, у). Длина этого век- тора, очевидно, а угол ф до него от оси Ох, отсчитываемый про- тив часовой стрелки, называется аргументом аг§г числа г; иначе говоря, (|г|,ф) — полярные координаты точки 2. В силу равенств непосредственно следующих из школьного определения синуса и косинуса (в круге), получаем тригонометрическую форму ком- плексного числа: где угол ф при находится из равенств со5ф = —, 5тф = — с точностью до слагаемого 2&71(йе2), а И \г\ при г = 0 не определен. Легко видеть, что для аналитического выражения суммы г{ + 22 тригонометрическая форма неудобна и лучше пользовать- ся прежней, которую можно называть алгебраической. Но полу- чить оценки (1) из геометрического представления комплексных чисел не составляет труда: векторные изображения для г{ и г2 складываются по правилу параллелограмма (почему?), а его ди- агональ короче двухзвенной ломаной; равенство соответствует случаю, когда векторы-слагаемые коллинеарны и параллелограмм вырождается в отрезок. Таким образом, сразу получаем
значит, и отсюда далее следует т. е. и, наконец, Тригонометрическая форма особенно удобна для выражения произведения комплексных чисел: = ^^ -!г2| -[(сОЗф! С05ф2 - 51П (\>{ 51П ф2 ) + / (с05 ^ 5Ш ф2 + 511^ С05ф2)] = т. е. при умножении комплексных чисел их модули перемножа- ются, а аргументы складываются; предлагаем читателю строго доказать индукцией по п * справедливость этого утверждения для любого числа сомножителей. При одинаковых сомножителях по- лучаем отсюда формулу Муавра: Трудно даже себе представить, как можно обойтись без этой формулы при извлечении корня п-и степени из комплексного числа! Пусть с - |с|(со50 + /5т0) е С — заданное число, 0 = аг^г, запишем уравнение гп = с в тригонометрической форме: * Математической индукции посвящен § 7 книги автора [8]; см. также: И. С. Соминский. Метод математической индукции. — М.: ПТИ, 1956.
Из равенства комплексных чисел следует, что их модули равны, а аргументы могут различаться только слагаемым вида 2йк: отсюда г = !ж\ (арифметический корень) и ср = 0 + 2Й71 п , причем здесь достаточно брать лишь значения й = 0, 1, ..., п—\, так как при других и е Ъ получим для созф и зтф лишь повторения уже найденных (почему?). Геометрически все числа 2, удовлетворяю- щие уравнению гп = с, расположены по окружности радиуса ц\с\ в точках деления ее на п равных частей. Множество всех этих точек (й = 0, 1, ..., п — 1) мы не обозначаем (как принято) через ^ по следующей причине. В записи
один и тот же символ ц[~ слева и справа имел бы разный смысл: справа — арифметический корень, а слева — "многозначная функ- ция", из-за чего при действительном о 0 получаем абсурд, например л/8 = -\/8|со5 П + 1$'т К\ (сократив обе части на V 3 3 ) \/8=2, придем к равенству, которое при и =1,2 неверно). Для "многозначных функций" несправедливы даже простейшие соотно- шения вроде ^/8 + ^/8=2-\/8 (здесь левая часть имеет шесть раз- личных значений, а правая только три)*. Отдавая дань укоренив- шейся традиции, мы будем иногда употреблять знак «/^ , но каж- дый раз с оговоркой. Заметим, что и в задачниках до сих пор фигурирует неточная запись типа "найти все значения ^//". Более подробно о комплексных числах можно прочитать, на- пример, в книгах А. Г. Куроша и А. И. Кострикина. * См.: Ж. Дьедонне. Основы современного анализа. — М.: Мир, 1964. — С. 226.
РЕШЕНИЕ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ С ОДНОЙ НЕИЗВЕСТНОЙ Уравнение первой степени аг + р = 0, где а, ре С и а=^0 (при а = 0 это не уравнение, а либо банальное тождество 0 = 0, либо ложное утверждение вроде 1=0). Решение (очевидно, един- ственное): 2 = — р/ос. Но даже такие простые вещи требуют ново- го обоснования, поскольку теперь мы имеем дело с полем ком- плексных чисел, на которое нельзя механически переносить то, что было ранее известно только для чисел действительных. Уравнение второй степени аг2 + р2+у=0, где а, р, уе С и аф 0 (иначе уравнение — не второй степени или совсем не уравнение). Деля обе части на а и вводя обозначения р = р/ос, ^7 = у/а, получим приведённое квадратное уравнение 22 + р2 + ? = 0, (*) равносильное исходному. Для решения дополним первые два слагаемых до полного квадрата (разумеется, прибавив из вежливости то же самое и к правой части) и произведем другие очевидные преобразования: и если под ^р2/4-д понимать то значение корня, которое в двухэлементном множестве {ш/ш2 = р2/4 — ^} соответствует значе- нию и = О, то запись решения в виде г = -р/2±7р2/4-<7 будет корректной, поскольку у корня п-й степени с п = 2 значе- ние при и = 1 противоположно значению при и = 0. Квадратный трехчлен в левой части (*), очевидно, является полным квадратом тогда и только тогда, когда ^ = р-|^\ выражая здесь р и ^ через а, р и у, после несложных преобразований получим это условие в общем виде: Квадратный трехчлен а22 + р2 + у представляет собой полный квадрат (т. е. имеет вид (5г + е)2 с 5, ее С) в том и только том случае, если р2 = 4ау.
Уравнение третьей степени аг3 + рг2 + уг + 8 = О (а, р, у, 8е С, а =^0). Деля обе части на а и производя замену неизве- стной г = 2-р/3а, после подстановки, преобразований и уже привычных обозначений коэффициентов, а также опуская знак над новой неизвестной, получаем приведённое кубическое урав- нение 23 + рг + <7 = 0, не содержащее квадрата неизвестной. Способ его решения открыли С. Ферро (для ряда частных случаев) и Н. Тарталья (в общем виде), а Дж. Кардано записал общую формулу и исследовал все возможности. Решение ищется в виде г = и + V, с тем чтобы потом распо- рядиться оставшейся свободой в выборе и и V. Подстановка выражения для г в приведённое уравнение дает (и + 1>)3 + р(и + 1;) + <7 = 0, ИЛИ и* _|_ уз _|_ (з^ + р)(и + У) + ? = °- Подберем и и V так, чтобы было Зиу + р = 0; в итоге для двух неизвестных и3 и V3 получаем систему двух уравнений и3 + 03 = —</, из.уЗ = _рЗ/27, второе из которых — результат возведения в куб обеих частей уравнения м = —р/3. и3 и у3 служат корнями вспомогательного квадратного уравне- ния из которого
(или наоборот). Извлекая корни третьей степени, получаем для неизвестной 2 = и + V выражение в традиционной неточной запи- си: (формула Кардано), где для пары слагаемых и, V берутся не все 3-3 = 9 комбинаций значений, а только три, при которых иг) = -Е Решения исходного уравнения получаются отсюда о вычитанием р/За. Опуская подробный анализ всех случаев, отметим лишь, что если р, <7 е К и уравнение имеет три действительных различных корня, то в формуле Кардано оба слагаемых оказываются мни- мыми, и только в результате сложения мнимые части уничтожа- ются *; получить аналогичную формулу, не приводящую к появле- нию мнимых чисел на промежуточных этапах решения, невоз- можно. Уравнение четвертой степени осе4 + р23 + у22 + 8г + е= 0, где а, ..., ее С, причем а=^0. Деля на а, полагая 2 = 5-р/4а и опус- кая знак ~, получаем после преобразований, в новых обозначениях коэффициентов, приведённое уравнение четвертой степени 2* + р22 + ^2 + ^=^. Вводя добавочную вспомогательную неизвестную до, запишем уравнение в виде (г2 + р/2 + ш)2 = 2ш • 22 - ? • 2 + (ш2 + рю + Р2/4 - г) и постараемся так выбрать значение до, чтобы квадратный трех- член (относительно г) в правой части оказался полным квадра- том. Для этого должно быть * Для примера предлагаем решить по формуле Кардано уравнение г3-63г+ 162 = 0.
это уравнение третьей степени относительно до, а такие мы уже умеем решать. Достаточно найти один его корень ОУО — тогда после надлежащего обозначения коэффициентов в правой части уравнение примет вид (22 + р/2 + ш)2 = ((;2 + л)2, откуда 22 + р/2 + ш = ±(^2 + л), т. е. решение уравнения четвертой степени свелось к решению двух квадратных. "Извлечение квадратного корня из обеих частей равенства" обосновывается следующим образом: если и2 = у2, то (и — V)(и-\-V) = ^ и, ввиду отсутствия в поле С делителей нуля, и — V = 0 или и + V = ^, т. е. и = ±V. Итак, в XVII веке располагали решением алгебраических урав- нений степени п=\, 2, 3, 4 (а также двучленных уравнений гп = с любой степени); под "решением" имелось в виду решение в радикалах, — общая формула (или описание общего способа) для выражения корней уравнения через его коэффициенты с помощью следующих операций: (1) сложение, вычитание, умножение и деление; (2) извлечение корня любой натуральной степени; (3) отбор значений из заданного конечного множества. В XVIII веке шли поиски решения (в радикалах) уравнений любой натуральной степени. Вспомогательное уравнение, реше- ние которого позволяет решить и исходное, называется его ре- зольвентой. Так как резольвента для уравнения 4-й степени имеет степень 3, для уравнения 3-й степени — степень 2, а при решении квадратного уравнения можно усмотреть резольвенту первой степени, то казалось правдоподобным, что для уравнения 5-й степени резольвента окажется 4-й степени и т. д. Но суровая действительность опровергла это "заключение по неполной ин- дукции": резольвента уравнения 5-й степени, найденная Ж.-Л. Лагранжем в 1772 году, сама оказалась 6-й степени (из огня да в полымя!). Неверная гипотеза уступила место другой: алгебраическое уравнение степени п > 5 в общем случае неразрешимо в ради- калах,. П. Руффини дал неполное доказательство этого утвержде-
ния, завершенное уже в начале XIX века Н.-Х. Абелем, которого считают основоположником теории групп *. Но отсутствие общего решения уравнения, скажем, пятой степени в радикалах не означает невозможность написать такое решение для некоторых уравнений с конкретными числовыми коэффициентами: например, левая часть может разлагаться на множители. Развивая дальше теорию групп (и рассматривая так- же некоммутативные группы, в частности группы подстановок), Э. Галуа на ее основе установил критерий разрешимости в ради- калах конкретных уравнений (так, уравнение л:5 — х— 1=0 нераз- решимо); теория Галуа как отдельный спецкурс преподается в некоторых университетах и педагогических институтах. Рекомен- дуем популярные книги: О. Оре. Замечательный математик Нильс Хенрик Абель. — М.: Физматгиз, 1961. Л. Инфельд. Эварист Галуа. — М.: Молодая Гвардия, 1958. В свою очередь, неразрешимость уравнения в радикалах не означает отсутствия у него корней: уравнение *5 = х + 1 имеет действительный корень (немно- го больший 1) — его можно вычис- лить приближенно с любой требуемой точностью, только нельзя записать в виде результата действий типа (1), (2) и (3) над коэффициентами 1, —1, О данного уравнения. Более того, справедлива Основная теорема алгебры. Всякое алгебраическое уравнение с коэффициентами из С имеет в этом поле по крайней мере один корень. Доказательство этой теоремы, начатое Ж.-Л. Даламбером, завершил Гаусс; позже (XIX век) появились и другие доказатель- ства, но чисто алгебраического нет и быть не может, что не удивительно: хотя поле С является результатом алгебраического * Так как он рассматривал только коммутативные группы, то их теперь назы- вают абелевыми.
расширения поля К, последнее получено из 0> аналитически. По этой причине основную теорему алгебры мы в самом курсе ал- гебры принимаем без доказательства — потом, в теории функций комплексной переменной, она оказывается непосредственным следствием теоремы Лиувилля, которую мы сейчас не будем даже формулировать и лишь заметим, что доказательство ее не опирается ни прямо, ни косвенно на основную теорему алгеб- ры — иначе бы возник порочный круг! Таким образом, дальнейшие алгебраические расширения поля С невозможны; простые же трансцендентные расширения будут рассмотрены позже, в разделе "Вложение кольца в поле". Как мы знаем, расширение поля К до С связано с потерей упорядоченности. Жертвуя еще и коммутативностью умножения, У. Гамильтон в 1853 году построил тело кватернионов, содер- жащее С и состоящее из чисел вида а + Ы+ с] + сНг, где а, Ъ, с, (I е К, а I, /, и — "мнимые единицы", закон умножения которых друг на друга задается таблицей: Интерпретируя "мнимые единицы" как координатные орты *', /, &, можно записать кватернион в виде формальной суммы а + г скалярной и векторной частей, где г = Ы + с] + д,Ь\ сумма и произведение кватернионов выразятся тогда следующим образом: (01 + г{) + (а2 + г*) = (а\ + Д2) + (г{ + г2), (а{ + г{)(а2 + г2) = (а{а2 - г{г2) + (а{г2 + а2г{ + г{х г2), где г{г2 и г{ х г2 — скалярное и векторное произведения. Обрат- а-г ным для кватерниона а + г =^0 + 0 служит —2——Г» гДе а~ г — кватернион, сопряженный с а + г, а ^а2 + г2 — модуль обоих кватернионов.
У квадрата кватерниона (а + г)2 = (а + г)(а + г) = (а2 - г2) + 2аг (га = аг; почему?) скалярная часть имеет интересный физический смысл в специальной теории относительности. Если скорость света в вакууме принять за безразмерную единицу и выражать расстояния в единицах времени, то мировая точка М, определя- ющая в пространственно-временном континууме момент и место события относительно тела отсчета О — часов, находящихся в инерциальном состоянии, задается показанием часов I и радиу- сом-вектором г = ОМ , т. е. кватернионом I + г. Кватернионный интервал между двумя событиями, имеющими относительно О кватернионные координаты 1{ + г{ и ^2 + гъ ~~ это разность таких координат: А^ + Аг = (^2-^1) + (г2-г1). При замене часов (тела отсчета) О другими часами О', тоже находящимися в инерциальном состоянии, кватёрнионный интер- вал, согласно преобразованиям Лоренца, переходит в где V — вектор скорости часов О' относительно О, а X = VI - V2 . Из этой формулы видно, что по отдельности ни промежуток времени А^, ни пространственное расстояние |Дг| между двумя событиями не остаются неизменными при переходе от одной инерциальной системы отсчета к другой; однако можно показать (полезное упражнение по векторной алгебре!), что 1В курсе алгебры нет надобности выводить этот физический закон (тем более в общем виде), но полезно заметить, что в случае, когда часы О' равномерно удаляются от О со скоростью о по невращающемуся лучу, ко- торый принят за ось абсцисс декартовой системы Охуг, для интервалов времени и координат отсюда получаются формулы преобразований Лоренца хорошо известные из курса общей физики.
т. е. скалярная часть квадрата (А^ + Аг)2 кватернионного интер- вала (инвариант Мпнковского) при этом не меняется. О кватернионах можно прочесть, например, в книгах: М. Лагалли. Векторное исчисление. — М.; Л.: ГТТИ, 1936; И. В. Арнольд. Теоретическая арифметика. — М.: Учпедгиз, 1939; Е. Г. Гонин. Теоретическая арифметика. — М.: Учпедгиз, 1959. Упомянем, наконец, о комплексных кватернионах, отличаю- щихся от рассмотренных а + Ы + с] + с1Ь тем, что а, Ь, с, йеС (здесь мы предпочитаем скалярно-векторную форму записи, что- бы не смешивать орт I — одну из координатных единиц — с мнимой единицей I поля коэффициентов). Такие кватернионы, однако, образуют не тело, а только кольцо, из-за наличия дели- телей нуля, например 1— И и Ь + И (проверьте!).
МНОГОЧЛЕНЫ Школьные понятия о многочленах и действиях с ними нужда- ются в строгом определении и обосновании. Известно, например, что поскольку х=\ — корень уравнения х3 — х2 + х — 1 = 0, мно- гочлен левой части делится без остатка на дс—1; но если под символом х понимать неизвестное число, удовлетворяющее урав- нению, то перед нами — замаскированное деление нуля на ноль, и фактический смысл этого действия непонятен, хотя формально процедура деления многочлена на многочлен совершается без труда. Заметим еще, что в некоторых разделах математики (ком- бинаторном анализе и др.) широко используются "многочлены" вида а0 + а{х + а2х2 +.., содержащие бесконечно много ненулевых слагаемых ("формальные степенные ряды"), независимо от того, при каких конкретных значениях х полученный числовой ряд сходится *. В алгебре, в отличие от математического анализа, важны не вопросы сходимости, а законы образования коэффици- ентов при алгебраических операциях над такими суммами; вводя строго многочлены, в том числе и "бесконечные", мы так опре- делим их сложение и умножение, чтобы эти действия согласовы- вались со "школьными". Пусть К = (М, +, •) — произвольное кольцо. Образуем мно- жество М°°, элементами которого служат всевозможные бесконеч- ные последовательности элементов из М. Если а = (а0, о,, о2, ...) и Ь = (60, 6,, 62, ...) — элементы М°°, то считаем о = 6 тогда и только тогда, когда а1 = Ь1 при всех / = 0,1,..., а сложение и умножение в М°° определяем следующим образом: а4-6 = (о04-60, 0,4-6,, а24-62, ...), о-6 = (о060, 006,4-0,60, о0624-о,6, 4-о260, ...); общий (/-и) член второй последовательности имеет вид а06у + о,6н + о26у_2 + ... + оу60 = 2Хйу_л = X, а^; А=0 /?+/=/ в записи последней суммы предполагается, что индексы /г и / принимают целые неотрицательные значения, удовлетворяющие * т. е. последовательность частичных сумм 5п(х) = а0 + а,л: + ... + апхп имеет предел при п —> °°.
условию & + / = /. Здесь удобно называть /-м членом последова- тельности тот, который при обычном счете "по пальцам" оказал- ся бы (/+1)-м, поскольку счет мы начинаем не с единицы, а с нуля. Докажем, что система К°° = (М00,+, •) является кольцом. I. (М°°, +) — абелева группа: так как /-и член последователь- ности а + Ь равен а, + Ь-р то выполнение всех пунктов определе- ния абелевой группы в М°° непосредственно следует из выполне- ния их в М. Нулевым элементом группы (М°°, +) служит последо- вательность (0,0,...) из нулей кольца К, а противоположным элементом для а = (а0, а{, а2, ...) — последовательность — а = = (—а0, — аь — а2, ...). П. (М, •) — группоид: если а, Ь е М°°, то все ар Ь1 е М, а так как К — кольцо, то и все члены последовательности а& принад- лежат М, т. е. аЬ е М°°. III. Пусть а, Ь, с е М°°; тогда /-и член последовательности (а + Ь)с есть X (а*+ й*)с/= X (ад+ V/) = X ад+ X V/ , *+/=/ *+/=/ /г+1=/ /г+1=/ поскольку кольцо К дистрибутивно, т. е. равен сумме /-х членов последовательностей ас и Ьс; значит, (а + Ь)с = ас + Ьс\ равенство с(а + Ь) = са + сЬ доказывается аналогично. Теорема. Если кольцо К обладает любыми из свойств: 1) коммутативность, 2) ассоциативность, 3) существование единицы, 4) отсутствие делителей нуля, то теми же свойствами обладает и кольцо К00. Доказательство. 1) Пусть К коммутативно; тогда /-и член последовательности аЬ равен ^ а^ = ^ Ь^, а это (в *+!=/ /г+1=/ других обозначениях индексов суммирования) — /-и член после- довательности Ьа. 2) Пусть К ассоциативно; /-и член последовательности а»Ьс:
а /-и член последовательности аЪ*с: Е X °Л ' С« = X X °Л -С-»= Е "А ' Ст- /+т=/1 /г+р=/ I /+т=//г+р=/ /г+р+т=/ Но в кольце К всегда а^* Ьрст = а,ьЬр* ст, поэтому а~Ьс = = аЪ*с. 3) Если / — единица кольца К, то непосредственно имеем (/,0,0, ...)• (00,^,02, ...) = = (а0, аь а2, ...) • (/, 0, 0) = (а0, аь а2, ...), т.е. (1,0,0,...) — единица кольца К00. 4) Допустив, что кольцо К не имеет делителей нуля, рассмот- рим в К00 два произвольных ненулевых элемента а = (0,...,0,ат,ат + {,...) и Ь = (0, ..., О, Ьп, Ьп + {, ...), где ат и 6„ — первые ненулевые члены этих, последовательнос- тей; тогда (т + п)-м членом последовательности аЬ будет а0Ьт + п + а1Ьт + п_1 + ... + ат_1Ьп + 1 + атЬп + ат + 1Ьп_ { + ...+ + ат + пЬо = атЬп, поскольку а1 = 0 при 1<т и 6у = 0 при ]<п. Но из атфО и ЬПФО ввиду отсутствия в К делителей нуля следует аш&„ Ф О, т.е. аЬФ(0,0,...) в К~ Следствие. Если К — целостное кольцо, то таково же и К~ Однако если К — поле, то кольцо К00, будучи нетривиальным (почему?), полем не является из-за необратимости его нену- левого элемента (0,1,0,0,...): из существования такого Ь = (Ь0,Ь{,Ь2,...), что (0, 1,0, О, ...).Ь = (1,0, 0, ...), следовало бы 0.&0=Л т.е. 1 = 0. Пусть К — ассоциативное кольцо с единицей; таково же и К00. Нетрудно показать, что все элементы вида (а0,0,0,...) образуют в К00 подкольцо, изоморфное К, с естественным изоморфизмом /(а0) = (а0, О, О, ...), и такой элемент можно обозначить просто через а0, т. е. считать само К подкольцом К00; в частности, О = (0,0,...) и / = (/, 0,0, ...) — нуль и единица кольца К00.
Введем для элемента (0, /, 0, 0, ...) обозначение А:; тогда (0,0, 1,0, .,.) = х-х = х2, а элемент (0, 0, 0, /, 0, ...) = л>л;2 = = л;2«л; можно обозначить через х3 и т.д. и, считая по определе- нию л;°=/, доказать, что л:т «л;" = хп *хт = хт + п при любых целых неотрицательных тип. Элемент (0, ..., О, ат, 0, ...) представится как (ат, 0, 0, ...) • (0, ..., 0,/, 0, ...) с единицей на т-м месте, т.е. как атл:т, или в виде (0,...,0,/,0,...)-(ат,0,0,...) = ^та-, поэтому в кольце К00 любая степень элемента х перестановоч- на с любым элементом подкольца К (несмотря на то, что само К00 не обязательно коммутативно). Элемент а = (а0, ам ..., ат, 0, 0, ...) е М°°, в котором все ат + ^ = 0 (6 е М), однозначно представляется в виде а = (а0, 0, ...) + (0, а„ 0, ...) + ... + (0, ..., 0, ада, 0, ...) = = (а0,0, ...) + (а1,0, ...)(0,/,0, ...) + ...+ + (ат, 0, ...ДО, ..., 0, /, 0, ...) = а0 + а,* + а2л:2 + ... + апхп (докажите единственность!), т. е. в привычной записи многочлена от переменной х. Поэтому все те последовательности из М°°, в которых лишь конечное число членов могут быть отличны от нуля, называются многочленами, подробнее многочленами от переменной (формальной) х над кольцом К = (М,+, •); "фор- мальной" потому, что символ х, вообще говоря, не является обозначением какого-то элемента множества М (или переменной величины, принимающей значения из М); это вполне определен- ный "постоянный" элемент кольца К00 и не более, слова же "над кольцом К" выражают тот факт, что все коэффициенты много- члена принадлежат К. Подмножество тех элементов К00, которые являются многочленами от х, обозначается через К[х] *. Теорема. К[х] с К00 — подкольцо. Доказательство. (К[я], +) — группоид: если а, Ь е К[я], то в последовательности а + Ь наверняка равны нулю все те члены, номера которых (считая с нулевого) больше наибольшего из номеров т, п тех членов в а и Ь, которые отличны от нуля, т. е. а + Ье К[х]. * Причина употребления здесь квадратных скобок, а не круглых, будет объяс- нена позже.
(К[я], •) — группоид', в последовательности аЬ равны нулю все члены с номерами, большими т + п. Если а = (а0, а,, ...,ат, 0, ...)е К[*], то -а = (-а0, —а{9 ..., -ат,0,...)е КМ. Как мы уже знаем, этих трех условий достаточно для того, чтобы К[х] было подкольцом К00. На этом основании К[х] назы- вают кольцом многочленов (от х) над кольцом К, его элементы записывают не в виде последовательностей, а в привычной мно- гочленной форме (опять вспомним диалектический закон отрица- ния отрицания!), и из определения равенства последовательнос- тей непосредственно следует, что два многочлена равны (совпадают, являются одним и тем же элементом кольца К[х]) тогда и только тогда, когда соот- ветственно равны их коэффициенты при одинаковых сте- пенях формальной переменной. Многочлены из К[я] будем обозначать через А(х), В(х), С(х) и т. п. или просто Л, В, С, ..., т. е. прописными буквами, чтобы не путать их с элементами кольца К. Если А =А(х) = а0 + а{х + ... + атхт е К[я], где атФО, т>0, то число т = Ае§А называется степенью многочлена А, а ат — его старшим коэффициентом. В частности, если с!е^Л = 0, то много- член А = а0 (в котором старший коэффициент совпадает с млад- шим) не содержит х и фактически является ненулевым элементом кольца К; при а0 = 0 степень многочлена А = 0 не определена, но удобно считать ее отрицательной, не уточняя, какой именно. Теорема. (1) с!е^(Л + В) < тах{с!е^Л, с!е^В}; (2) с!е^(А« В) <с!е^Л + с!е^В, причем если произведение стар- ших коэффициентов многочленов А и В отлично от нуля кольца К, то имеет место равенство. Первое утверждение очевидно, и мы лишь заметим, что сте- пень суммы многочленов может оказаться строго меньше каждой из степеней слагаемых — когда йе^Л = йе^В и старшие коэффи- циенты в Л и В являются противоположными элементами кольца К. Для доказательства второго предположим, что
тогда наивысшей степенью многочлена А • В может быть самое большее т + п, причем старший член атЬпхт + п отличен от нуля тогда и только тогда, когда ат-Ьп =?=0*. Благодаря соглашению о том, что с!е^(0)<0, соотношения (1) и (2) сохраняют силу и тогда, когда хотя бы один из многочле- нов Л, В — нулевой. Рассмотрим теперь деление с остатком в кольце К[х]. Как прежде, считаем кольцо К ассоциативным и обладающим едини- цей /; значит, таково же и К[х]. Нам теперь будет удобнее записывать многочлены в порядке убывания, а не возрастания степеней х. Теорема. Пусть А = атхт + ат_{хт-1 + ... + а{х + а0 и В = Ьпхп + Ьп_{хп~1 + ... + Ь{х + Ь0 — многочлены из К[х], при- чем ВФО и старший коэффициент Ьп имеет обратный элемент Ь~1 е К . Тогда 1) существуют такие (?лев, Ялев е К[х], притом единствен- ные, что де§г/?лсв < де§гВ " Л = <?лев.В + /?лев; 2) существуют такие (?прав, Кправ е К[х], притом единствен- ные, что Ае%К <Ае%В и ^ = В. (?прав + ^прав. Многочлены (?лев и /<лев называются левым частным и левым остатком при делении А (делимого) на В (делитель), а (?прав и ^прав — правым частным и правым остатком. Доказательство их существования проводится по обычной "школьной" схеме деления многочлена на многочлен, но отдельно для левого и пра- вого деления, поскольку теперь кольцо К не обязательно комму- тативно. Начнем с левого деления. атхт+атЬ-п\_{хт-1+... атЬ-]хт-п + (ат.,-атЬ-\_,)хт-^... +(ат_{ -атЬ:\_№зГ^ +... Если с1е^Л<с!е^В, то сразу полагаем (?лев = 0 и Клев = А. Если же с1е^Л>с!е^в, то берем старший член частного (?лев равным атЬ~1хт~п для того, чтобы после умножения (?лсв справа на В * В частности, если кольцо К не имеет делителей нуля.
старший член полученного многочлена оказался таким же, как и в А: атЬ~1хт~п (Ьпхп + ...) = атхп +... (ввиду перестановочности сте- пеней х друг с другом и с элементами К). Разность А -атЬ~1 хт~п = (ат_! -атЬ~1Ьп_^хт~1 + ... представляет собой много- член степени т—1 (когда коэффициент при хт~1 отличен от нуля) или меньше; если степень этого многочлена меньше п, то берем его за Ялсв и полагаем <?лев= атЬ~1хт~п, в противном случае подбираем второе слагаемое (уже степени < т — п) с таким рас- четом, чтобы после умножения суммы обоих слагаемых на дели- тель получился многочлен, имеющий с делимым два общих слага- емых (атхт и Я™-!*"1"1), и т. д. Так как степени промежуточных остатков все время понижаются, то рано или поздно мы получим остаток степени < п; его и примем за /?лев, а за (?лев — сумму всех тех одночленов, которые возникали в частном на каждом шаге. Тогда будет А = (?лев • В + Ялев и (1е^/?лсв < йе^В, что и требо- валось. Сюда же относится случай деления без остатка, когда #лсв= 0, ибо Де§(0) < 0, а с!е^В > 0, поскольку Ьп Ф 0 ввиду обра- тимости этого элемента. Аналогично доказывается существование (?прав и /?прав, только подбор слагаемых частного (?прав теперь надо вести так, чтобы чле- ны делимого А получались от умножения членов (?прав на В слева: Единственность частного и остатка доказывается оба раза аналогично, и мы рассмотрим левое деление (опуская индекс "лев"). Предположим, что как-то получены два представления: А = (3*В + К = $*В + К, Ае%К<Ае§В, Ае§К<АеёВ; тогда (ф-0)»В = Л!-Л!. При <?-<?* О было бы с!е^ (<?-<?)> О, а так как у В старший коэффициент Ьп е К не является делителем нуля, то
тогда как Полученное противоречие говорит о том, что ф = ф , а следова- тельно, и Л> = Л!. Теорема доказана. Если кольцо К (значит, и К[х]) коммутативно, то, очевидно, Флев = Фправ и ^лев = ^пРав> частное и остаток обозначаем без индек- сов, и теорема принимает вид: для любых А, В е К[х], где старший коэффициент многочлена В обратим, существуют такие (3, Ке К[х], притом единственные, что А = (^В + К = = В(3 + К и ёе^Я < ёе^В. В случае, когда К = 0, многочлен В на- зывается делителем многочлена Л; говорят также: В делит А, или А делится на В. Делимость многочленов над полем Займемся подробным изучением делимости многочленов в предположении, что кольцо К является полем Р. Так как всякое поле тем более есть целостное кольцо, то и кольцо Р[х] (не поле!) — целостное (почему?) и для любых Л, Ве Р[х] Ае§(А±В) < тах{с!е^Л, с!е^В} и де^(ЛВ) = с!е^Л+ с!е^В. Лемма 1. 1) Если А делится на В, а В — на С, то А делится на С. 2) Если Ль Л2, ..., Лл делится на В, а Сь С2, ..., Сл — любые, то А{С{ + А2С2 +... +АьСь делится на В; в частности, А{±А2 и А1С1 делятся на В. (Л, В, С, Д, В, е Р[х}.) Доказательство. 1) Делимость Л на В означает существо- вание такого Р! е Р[х], что А = В(?1, а делимость В на С — су- ществование такого @2е Р[х], что В = (32С. Но тогда Л = ВР1 = СР2«Р1 = С.р2(?1, т. е. нашелся такой (^(^(^е Р[я], что Л = С(3, а это и означает делимость Л на С. 2) Если ЛЬЛ2, ...,ЛЛ делятся на В, то существуют такие О^Оа. -,<?*€ Р[л:], что Л! = В^ь Л2 = В^2, ..., ЛА; = В^. Но тогда
А{С{ + А2С2 + ... + А^Сь = В^С, + В(?2С2 + ... + В(?,С, = В(?, где (3 = (31С1 + (32С2 + ... + (Э1гС1ге Р[х], т. е. многочлен Л1С1+Л2С2 + + ...+Л^СЛ делится на В. Л е м м а 2. Пусть А, В е Р[х]. Делимость (или неделимость) А на В не изменится, если эти многочлены умножить на любые элементы поля Р, отличные от нуля. Доказательство. Если А делится на В, а с,я?е Р\{0}, то оба эти элемента поля Р обратимы, и из равенства А = В(^, где Р е Р[я], получаем сА = йВ • с^ф, причем сяМф е Р[я], т.е. сЛ делится на <з?В. Наоборот, если последнее имеет место, то суще- ствует такой (3'е Р[х], для которого сА = <1В*(3', откуда Л = В • с-1^', с-[Л(3'е Р[х], т.е. Л делится на В. Следствия. 1) Любой А е Р[х] делится на В е Р[х] степени с!е^В = 0 (т.е. на любой ненулевой элемент поля Р). 2) Если с!е^Л = 0 и А делится на В, то с1е^В = 0. В самом деле, если В = Ъ$ФО, то 6~ 1В = / , а на единицу поля любой А делится (в частном Л, в остатке 0). Если с!е^Л = 0 и Л делится на В, то Л = В@ при некотором (? е Р[л;]\{0}, и в случае с1е^В>0 имели бы йе^Л = с!е^(Вр) = с!е^В + Ае§<3 > Ае§В > 0. Многочлен со старшим коэффициентом / (и поэтому ненуле- вой) называется унитарным. Благодаря лемме 2 можно без нарушения общности при изучении делимости многочленов счи- тать их унитарными. Лемма 3. Если унитарные многочлены А, В е Р[х] делятся друг на друга, то А = В. Доказательство. Ясно, что с!е^Л = с1е^В — иначе много- член меньшей степени, ненулевой в силу унитарности, не делил- ся бы на многочлен большей степени. Но раз так, то при деле- нии Л на В (или наоборот) сразу же получаем в частном / (ввиду унитарности) и в остатке 0 (ввиду делимости). Наибольшим общим делителем НОД(Л, В) многочленов Л и В из Р[х] называется унитарный многочлен О е Р[х], удовлетво- ряющий условиям: а) Л и В делятся на О, т. е. О — их общий делитель ОД(Л, В); б) О делится на каждый ОД(Л, В). Единственность НОД для каждой пары многочленов, из которых по крайней мере один ненулевой, сразу следует из леммы 3. Заметим, что такое определение НОД применимо и к целым
числам, если требование унитарности заменить требованием по- ложительности; например, для чисел 12 и 8 оба числа 4 и —4 являются делителями и сами делятся на любой ОД(12, 8), но положительно из них только одно, именно НОД(12, 8) = 4. Вооб- ще между свойствами делимости целых чисел и многочленов так много общего, что некоторые факты относительно многочленов можно во избежание громоздкости иллюстрировать примерами на числах. Лемма 4. 1) Если А = апх,п + ап_{хп~{ + ... + а1х + а0е Р[х],АФО (п = с!е^Л > 0), то НОД(Л, 0) = а~1А. 2) Если А = В(? + К, то НОД(Л, В) = НОД(В, /?). Доказательство. 1) Многочлен а~1А унитарен, делит А (по лемме 2) и 0 (тривиально), всеми ОД(Л, 0) служат делители Л, и на них делится а~1А (опять по лемме 2), т. е. для а~1А выполнены все пункты определения НОД при В = 0. 2) Так как К = А — В(3, то по лемме 1 любой ОД(Л, 5), в том числе НОД(Л, В), делит также /? и поэтому является ОД(В,/?), а на последний делится НОД(В,/?). Применяя лемму 1 к равен- ству А = В(3 + К, аналогично получаем, что и НОД(Л, В) делится на НОД(В,./?). Но оба НОД — унитарные многочлены и по лем- ме 3 совпадают. С помощью леммы 4 легко обосновать алгоритм Евклида для нахождения НОД(Л, В), где ВФО. Пусть Иначе говоря, мы делим Л на В (с остатком ^), затем делитель В — на остаток ^ (с остатком /?2), потом сам /^ — на остаток К2 (с остатком ^3)> ^2 на ^з и Т-Д-» пока не получим нулевой остаток — а такое й>0, что /?л + 1 = 0, наверняка существует: при каждом делении степень остатка понижается по крайней мере на 1 и поэтому не может без конца оставаться неотрицательной.
Пусть г фО — старший коэффициент последнего ненулевого остатка /?Л; тогда, ввиду леммы 4, НОД(Л, В) = = НОД(В, К{) = НОП(К{, /?2) = ... = НОД(/?,_!, /?,) = = НОД(^,0) = г-1^. Пример: А = х5 - х* + х2-2х-2, В = 2х3 + х2- 4х - 2 над полем 0>. У последнего ненулевого остатка ^ старший коэффициент
Теорема-лемма. Для любых, многочленов А, В е Р[х], из которых по крайней мере один ненулевой, в Р[л:] существу- ют такие /У и 1/, что и А + 1/В = НОД(Л, В). Это основано на алгоритме Евклида: выражаем /?Л через /?Л-1 и /?Л_2» затем /?Л-1 через /?Л__2 и ^л-з и т- Д-. пока для /?Л не получится выражение вида /У'Л+УВ, после чего полагаем /7 = г~1/7/ и У=г-1У/ (дабы превратить многочлен /?Л в унитар- ный). Такое представление НОД(Л, В) не единственно: можно, например, заменить /У на (У + ЛВ, а 1/ на V — ЛД где Л=^0 — любой многочлен из Р[я]; но всегда НОД(/7, I/) = / (докажите!). В рассмотренном примере й=1 и сразу же К1=А — В(3 = = I *А +(—(3{)В, т. е. (7=1, У = —(?!. Более длинный пример мы во избежание громоздкости проиллюстрируем на числах А = 64, В = 28. здесь /7 = —3, У=7; предлагаем читателю найти какое-нибудь другое представление. Многочлены Л, В е Р[х] называются взаимно простыми, если НОД(Л,В)=1. Следствие. Л и В взаимно просты в том и только том случае, если существуют такие и и V, что 1/А+УВ=1. Импликация "=>" — частный случай теоремы-леммы; докажем "<=". Пусть такие И и V есть; тогда по лемме 1 "многочлен" / делится на любой ОД(Л, В), а по следствию 2 леммы 2 степень этого ОД равна 0, в частности с!е^НОД(Л, В) = 0. Значит, НОД(Л, В) = / ввиду унитарности этого многочлена.
Теорема!. Если НОД(Л, С) - /, то НОД(Л, ВС) = НОД(Л, В). (Л,В,Се Р[*], АФО, СФО.) Доказательство. По следствию из теоремы-леммы суще- ствуют такие /У!, У{ е Р[х], что 1ЛЛ+^С-Л а по самой теореме-лемме — такие /У2, У2е Р[х], что /У2Л+1/2В = НОД(Л, В), перемножая эти два равенства, получаем (У-Л+1/.ВС = НОД(Л, В), где (У=/71/72Л+/711/2В+/72У1Се Р[*] и 1/=1/,1/2е Р[*]. Отсюда следует по лемме 1, что НОД(Л, В) делится на любой ОД(Л, ВС), в частности на НОД(Л, ВС). Наоборот, Л и ВС делятся на любой ОД(Л, В), в том числе на НОД(Л, В). Так как оба НОД — уни- тарные многочлены, то по лемме 3 они совпадают. Следствие. Если НОД(Л, В,) = НОД(Д В2) =... = НОД(Д, В,) = = /, то НОД(Л, В,В2...ВЛ) = / (и е К). Иначе говоря, если А взаимно прост с каждым из В,, В2, ..., Вл, то он взаимно прост и с их произведением. Это легко доказыва- ется индукцией по /г. Теорема 2. Если А делится на В и на С, а НОД(В, С) = /, то А делится на ВС(Л, В, С е Р[*], ВФО, СФО.} Доказательство. Ввиду условия есть такой @ е Р[х], что А = В(3, а по следствию из теоремы-леммы — такие V, V е Р[х], что иВ+УС=1. Умножая последнее равенство на ф, получим иВ(Э+УС(Э = (Э. Так как многочлен В@ = Л по условию делится на С, то и (? в силу п. 2 леммы 1 делится на С, т.е. существует такой Ое Р[х], что (Э = СО. Отсюда А = Вф = В • СД = ВС« О, т.е. А делится на ВС. Теорема 3. Пусть с!е^4 = т>0 и с1е^В = я>0. НОД(Л, В) отличен от 1 тогда и только тогда, когда существуют такие С и О, что 0 < с!е^С < п — 1, 0<Ае§О<т—\ и АС = ВО. Доказательство. Если АС = ВО и НОД(Л, В) = /, а /7 и V такие, что (Л4 + 1/В=/, то /УВД + 1/ВД = С, т.е.
(иО+УС)В = С и АеёС = Аеё(иО+УС) + Ае%В>АеёВ = п вопре- ки условию. Наоборот, если Р с Ае§Р>0 — общий делитель А и В, то А = АР, В = ВР, так что можно положить С = В и 0 = А. Упражнения. 1) Наименьшим общим кратным НОК(Л, В) многочленов Л, В е Р[х] называется унитарный Ее Р[х], такой что а) Е делится на Л и на В; б) всякий С е Р[х], делящийся на Л и и, делится на Е. Показать, что НОК(Л, В) • НОД(Л, В) = АВ, значит, НОК(Л, В)=АВ тогда и только тогда, когда А и В вза- имно просты; пользуясь этим, дать более короткое доказатель- ство теоремы 2. 2) Распространить определения НОД и НОК на случай любо- го числа многочленов вместо двух и выяснить, какие из свойств НОД и НОК остаются при этом в силе. Приводимость многочленов Многочлен А е Р[х]\{0} (степени ёе^Л > 0) называется приво- димым над полем Р (или в кольце Р[*]), если существуют такие В, С е Р[х], удовлетворяющие условиям 0<АеёВ<Ае§А, 0 <с!е^С <с!е^Л, (*) что Л = ВС, т. е. если многочлен А можно представить как про- изведение двух (над тем же полем Р) с положительными степе- нями; ввиду равенства ёе^Л = с!е^В + с!е^С каждое из условий (*) влечет другое. Из этого определения непосредственно следу- ет, что все многочлены степени 1 и степени 0 неприводимы. Если многочлен А е Р[х] неприводим над полем Р, а Р — какое-то расширение Р, то, очевидно, А е Р[х], но над полем Р многочлен А уже может оказаться приводимым. Например, если Р = <0> и Р = (0>(л/2), то многочлен А = х2 — 2 из кольца ^[x} (тем самым и из кольца (ф(>/2)[л;]) неприводим над Р: допустив, что
и раскрывая скобки, запишем равенство в виде х2 + 0 - х + (-2) = х2 + (а + Ь)х + аЬ, откуда а + Ь = 0 и аЬ = — 2 (равенство многочленов) и затем а2 = 2, что невозможно при а е 0>. Но над полем Р = <ф(>/2 V т. е. в кольце 0(>/2)[л;], тот же многочлен А раскладывается: Х2-2 = (Х + Щх-^2). Другой пример: х2+ 1 (над К и над С) неприводим над полем К (докажите!), а над С имеем х2+ 1 = (х + 1)(х — I). Замечание. Если многочлены Л, В е Р[х] имеют общий делитель О над некоторым расширением поля Р, то не обяза- тельно О е Р[х]; однако всегда НОД(Л, В) е Р[х], ибо при нахож- дении НОД с помощью алгоритма Евклида над*коэффициентами исходных многочленов совершаются только такие операции (+, —, • и :), которые не выводят за пределы поля Р. Например, многочлены А = х*-х3 + х2-2х-2, В = 2х3 + х2-4х-2е <®[х] имеют ОД(Л,В) = л;- 72 е ®[х], но НОД(Л, В) = х2- 2 е <®[х]. Из этого замечания непосредственно следует Лемма. Если унитарные многочлены Л, В е Р[х] неприводимы над полем Р, то либо Л = В, либо НОД(Л, В) = 1. Напомним еще, что ввиду отсутствия в кольце Р[х] делителей нуля, если АС = ВС и СФО, то А = и, т. е. обе части равенства можно сократить на общий множитель неотрицательной степени; это не что иное, как теорема 1 о кольцах, примененная к Р[х]. Теорема. Любой многочлен 5е Р[х] можно разложить в произведение 5 = аЛ,Л2... Лл, где аеР — старший коэф- фициент 5, а все А-1 е Р[х] (среди них могут быть и одинако- вые) унитарны и неприводимы над полем Р. Для 5ФО такое представление единственно с точностью до пере- становки сомножителей.
Доказательство. Если 5 = 0, то а = 0, а за Д можно взять любые многочлены из Р[х] в любом количестве, так что однозначности заведомо нет. Пусть теперь 5ФО и, значит, стар- ший коэффициент а фО обратим, так что 5 можно представить в виде а»а-15, где второй сомножитель — унитарный многочлен. В случае неприводимости последнего представление 5 = аЛ,, с /г= 1 и Л1 = а~15, — искомое, а в случае приводимости разлагаем а~!5 до тех пор, пока не останется ни одного приводимого со- множителя; процесс разложения, очевидно, можно вести так, чтобы все сомножители оставались унитарными. Так как при каждом разложении одного сомножителя на два их степени мень- ше, чем у исходного, а многочлены степени 1 неприводимы, то процесс не может быть бесконечным, и мы придем к представ- лению 5 = а.ЛгЛ2 • ... • Л„ (**) где а е Р, и е М, все Д е Р[х] унитарны и неприводимы над Р, де§гЛ, + с1е^Л2 + ... + с!е&4Л = с1е&5 (если с!е^5 = 0, то /г = 0 и 5 = а). Осталось доказать единствен- ность представления (**). Пусть 5 = аЛ1Л2...ЛЛ = Ь5152...5, — два представления требуемого вида для многочлена 5 Ф 0 из кольца Р[х]. Оба элемента а, ЬФО ввиду унитарности всех Л, и Б! совпадают со старшим коэффициентом в 5, т. е. а = 6, и из правого равенства умножением на а~[ = Ь~{ получаем лА...4=ад...в, (***) Многочлен А{ не может быть взаимно прост с каждым В.(] = 1, 2, ...,/) — иначе по следствию теоремы 1 предыдущей рубрики он был бы взаимно прост и с их произведением, кото- рое ввиду равенства (***) заведомо делится на А{ с ёе^Л^О. Значит, есть такой Вг что НОД(Л1? 5у) ф /. По лемме в силу унитарности и неприводимости А{ и В, имеем Л1 = В/ и сократив обе части (***) на этот многочлен, получим
Применяя к этому равенству аналогичное рассуждение, найдем в правой части сомножитель, равный Л2, сократим на него обе части и т. д. до тех пор, пока в одной из частей равенства не будут исчерпаны все сомножители, т. е. останется /. Но тогда и в другой части останется /, поскольку обе части — унитарные многочлены одинаковой степени. Таким образом, / = й и много- члены Д совпадают с многочленами В-г только не обязательно в том же порядке. Теорема доказана. Группируя в разложении (**) одинаковые неприводимые со- множители и соответственно меняя нумерацию (после чего /г будет обозначать число групп, а не отдельных сомножителей), получим для многочлена 5 е Р[х] представление вида 5 = аД'Д2..Д*, (****) где а е Р, многочлены Д е Р[х] неприводимы над Р, унитарны и попарно взаимно просты, значит, все различны; при этом Нёе^Д + г2с!е§гЛ2 + ... + /^с1е^Д = с!е^5, число Г{ е N называется кратностью множителя Д в произведе- нии 5. Представление единственно с точностью до перестановки сомножителей Д между собой. Если все с!е^Д=1, то говорят, что многочлен 5 абсолютно приводим над полем Р (или в кольце Р[х}), а само Р является для 5 полем разложения. Задание для самостоятельной работы (по книге А. Г. Куроша [1]). 1) Дать чисто алгебраическое определение производной 5' от многочлена 5, вывести правила дифференцирования суммы и произведения многочленов и объяснить, почему здесь нельзя вос- пользоваться готовыми результатами из математического анализа. 2) Пусть поле Р имеет характеристику р = 0, а (****) — разложение многочлена 5 е Р[х] на неприводимые множители. Доказать, что 5/НОД(5, 5') = аДЛ2... Д, т.е. при делении мно- гочлена на наибольший общий делитель его со своей производ- ной получается многочлен с теми же неприводимыми сомножите- лями, что и у исходного, но в первых степенях (эту процедуру обычно называют отделением кратных корней). 3) Выяснить роль условия р = 0.
Значения и корни многочленов Мы знаем, что в выражении А(х) = апхп + а„_ !*"-1 + ... + а{х + а0 многочлена А = А(х)е Р[х] формальная переменная х определена как элемент (0, /, 0, ...) кольца многочленов над полем Р, а не "пустое место, которое можно заполнять любым элементом из Р". Однако процедуру подстановки элемента сеР вместо х в многочлен А(х) легко узаконить, полагая по определению, что результатом такой подстановки является элемент А(с) = апсп + ап_\сп~{ + ... + а{с + а0 е Р, полученный из с теми же действиями (и в том же порядке), какими А(х) получается из х *. Этот А(с) называется значением многочлена А(х) при х = с. Если А и В — один и тот же многочлен (что можно записать в виде Л = 5, А(х) = В(х) или А(х) = В(х)), то, очевидно, А(с) = В (с) при любом с е Р, но обратное утверждение справед- ливо не для всякого поля Р: например, над полем 22 = ({0, 1},+, •) (р(22) = 2) многочлены А(х) = х+1 и В(х) = = х2+\ различны, хотя Л(0) = В(0) (=1) и Л(1) = В(1) (=0). Мы не будем обобщать этот пример и лишь отметим причину явле- ния: в поле 2^2 так мало элементов, что возможности составлять над этим полем различные многочлены гораздо богаче. Элемент с называется корнем многочлена А(х) (или уравнения Л(*) = 0), если А(с) = 0. При этом сам с не обязан принадлежать тому же полю Р, над которым задан многочлен, а может входить в некоторое расширение Р:эР: определение остается в силе, поскольку Ае Р[х] влечет ЛеР[л;]. Например, многочлен х2 — 2 над полем О не имеет корней в самом 0>, но имеет их в поле <$(^} и в любых дальнейших расширениях. * Вопрос о смысле этого при первоначальном определении многочлена как последовательности элементов поля не прост и будет рассмотрен впослед- ствии.
Теорема Без у. Остаток от деления многочлена А(х) е Р[х] на двучлен х — с*, где с е Р, равен значению А(с). В частности, многочлен делится на х — с (без остатка, нацело) тогда и только тогда, когда с — корень данного многочлена. Доказательство. Деля с остатком А(х) на х — с, получаем А(х) = (х-с)<Э(х) + К(х), (*) где Ае^К(х) < Ае%(х — с) = 1, т. е. остаток К = К(х) на самом деле не содержит х и является просто-напросто элементом поля Р. Равенство многочленов (*) при подстановке вместо х любого элемента из Р переходит в равенство элементов этого поля; в частности, подставляя х = с, получаем А(с) = /?. Благодаря этой теореме можно выяснять, делится ли А(х) на х — с, не производя самого деления. Более того, существует удобный способ нахождения остатка /? и коэффициентов частно- го (3, требующий гораздо меньшего количества умножений, чем при непосредственной подстановке с в А(х); этот метод по тра- диции связывают с именем В.-Г. Горнера, хотя, как позже выяс- нилось, он был известен в Китае еще до нашей эры. Поскольку равенство многочленов (как элементов кольца Р[х]) означает равенство их коэффициентов (как элементов поля Р) при одинаковых степенях формальной переменной х, раскрытие скобок в правой части подробно записанного равенства (*) и приравнивание коэффициентов дает * Унитарный многочлен первой степени, при с = 0 — одночлен.
Сам процесс последовательного вычисления ^п_\, Цп-ъ •••> <7ь <7о и Л! удобно записывается в виде схемы Горнера (1812): Пример: разделим А(х) = 2х7 + 15л:6 + 24,0л;4- 27л:3 + Ю*2 + + 94л:+ 36 на х + 9 и выясним, будет ли А(—9) = 0. Здесь с = —9. Заполнив верхний ряд таблицы коэффициентами делимого А(х), последовательно заполняем слева направо ячейки нижнего ряда: Таким образом, <3(х) = 2х6-Зхь + 27х*-Зх3+Юх + 4, К = 0, т. е. А(х) делится на л; + 9 и Л(—9) = 0. Чтобы выяснить непосред- ственной подстановкой, является ли число —9 корнем многочлена Л, понадобилось бы 7 + 6 + 5 + 3 + 2+1=24 умножения, тогда как при вычислениях по схеме Горнера эта операция применена всего 7 раз (включая одно умножение на ноль). Из теоремы Безу непосредственно следует, что нулевой эле- мент поля Р служит корнем многочлена А(х) е Р[х] тогда и только тогда, когда свободный член а0 = 0; схема Горнера при с = 0 становится тривиальной, и для нахождения частного А(х)/х надо просто в многочлене А(х) уменьшить все степени х на еди- ницу. Задание (для желающих). 1. Описать и обосновать два варианта — "правый" и "левый" — схемы Горнера для многочле- нов над телом или некоммутативным (но ассоциативным и име- ющим единицу) кольцом вместо поля Р. 2. "Корни неприводимого многочлена имеют привычку ходить в гости всей семьей" — сказал один крупный математик; предла-
гаем сформулировать и доказать теорему, которую он имел в виду. Не мешало бы узнать и имя этого ученого (с ним мы еще встретимся в III семестре). 3. Систематизировать все возможные случаи взаимосвязи между корнями многочленов А, В и корнями их НОД(Л, В) и НОК(Л, В), а также любых их общих делителей ОД(Л, В) и крат- ных ОК(Л,В). Если многочлен 5 е Р[х] абсолютно приводим над полем Р, то представление (****) имеет вид 5 = а(Х-сУ(Х-с2)\..(Х-сЛ>, где с,, с2, ..., с^е Р — все различные корни многочлена, а г,, г2, ..., г^ е N — их кратности. Формально доказывается (см., на- пример, книгу [1]), что для любого многочлена над любым полем Р существует такое расширение Р :э Р, в котором данный мно- гочлен абсолютно приводим; при этом добавочными элементами (когда Р :э Р) служат... сам 5 и другие многочлены, определяе- мые с его помощью. Это напоминает столовую, где посетителю вместо заказанного блюда приносят на тарелке его название, вырезанное из меню. Но смеяться рано: хотя для непосредствен- ного применения в народном хозяйстве подобные интерпретации вряд ли полезны, они играют важную роль при исследовании логической структуры той или иной теории, в частности для доказательства ее непротиворечивости, а сама теория, строго обоснованная, уже может иметь ощутимые приложения. Поле Р, в котором абсолютно приводимы все многочлены над ним, называется алгебраически замкнутым', тогда любой много- член А(х) = апхп + ап_{хп-{ + ... + а1л; + а0 е Р[х] приводится к виду А(х) = ап(х - с,)(х - с2) ... (х - О, где с{, съ ..., сп е Р — все его корни, причем каждый фигурирует столько раз, какова его кратность. Раскрывая все скобки и приравнивая соответственные коэффициенты обоих выражений для А(х), получаем формулы Виета
известные из школы только для случая действительных коэффи- циентов и корней и обычно лишь при п = 2. Из основной теоремы алгебры повторным применением теоре- мы Безу получается важный результат: поле С комплексных чисел алгебраически замкнуто (другие примеры таких полей нам пока не понадобятся). Поле К действительных чисел не яв- ляется алгебраически замкнутым: уже многочлен второй степе- ни х2 + 1 над ним неразложим; но, как мы покажем, неприводи- мых многочленов степени п > 2 в Щх] быть не может. Лемма. Если А(х) е Щх], се С и А(с) = 0, то и А(с) = 0, иначе говоря, если комплексное число с = а + Ы служит корнем многочлена с действительными коэффициентами, то его корнем является и сопряженное число Т = а-Ы. Доказательство. Пусть А(х) = апхп + ап_{хп~~{ + ... + + а1л; + а0, где все а, е К, и пусть А(с) = апсп + ап _ {сп~! + ... + а,с + а0 = 0. Многократно применяя соотношения типа и учитывая, что а = а при а е И, в частности получаем
Предлагается самим доказать, что корни сие — одинаковой кратности. Теорема. Если АеЩх] и Ае%А > 2, то многочлен А = А(х) приводим над полем И. Доказательство. Так как К с С, то А е С[х] и по основной теореме алгебры этот многочлен имеет корень с = а + Ые С. Если 6 = 0, то Л делится на двучлен х — а е №[х] и, значит, приводим над полем К. Если же ЬФО, то по лемме корнем А служит и с = а - Ы * с, ипо теореме Безу А делится также на х - ~с; но эти двучлены взаимно просты (почему?), и по теореме 2 (о делимости многочленов над полем) А делится на произведение (х-с)(х-с) = = х2 - (с + с)х + ее е Щх], поскольку сумма и произведение двух со- пряженных чисел действительны. Так как йе^Л > 2, то многочлен Л, обладая в кольце Щх] делителем степени 2, приводим над полем К. Пример. Двучлен я4+ 4, на первый взгляд неприводимый над И, можно было бы разложить, найдя все корни 4-й степени из —4 и объединяя пары сопряженных сомножителей первой степени (рекомендуем как упражнение); но в данном случае проще воспользоваться искусственным приемом, не выводящим за пределы поля К: х* + 4 = х4 + 4х2 + 4 - 4л:2 = (х2 + 2)2 - (2л:)2 = = (*2 + 2л; + 2)(л;2-2л; + 2). Следствие. Всякий многочлен нечетной степени с дей- ствительными коэффициентами имеет по крайней мере один действительный корень. Это очевидно: для каждого мнимого корня есть сопряженный той же кратности, и при объединении множителей первой степе- ни в пары вида (х-с)(х-с) какой-то одночлен останется без пары и поневоле (точнее, по лемме) должен принадлежать Щх].
Заметим, что наличие действительного корня у многочлена нечетной степени над К легко доказывается и аналитически. Функция у = А(х) определена и непрерывна на всей оси (—<*>, <»), а так как при \х\ —> «> старший член многочлена Л(л;) по модулю растет быстрее суммы всех остальных, то найдется столь боль- шое положительное число Ь, что знак А(Ь) будет совпадать со знаком старшего члена в А при х = I.. Но ввиду нечетности йе^Л знаки А(Ь) и А(—Ь) противоположны, и по теореме Больцано в математическом анализе функция у = А(х), непрерывная на отрез- ке [—I, Ц и принимающая на его концах значения разных зна- ков, обращается в нуль по крайней мере в одной его внутренней точке. Общее разложение многочлена над К на неприводимые мно- жители выглядит следующим образом: где все а,-, с-г Я/, </, е Е (двучлены х — с{ и квадратные трехчлены здесь попарно различны); гр 5/ б N и г, + ... + гл + 25, + ... + 25; = п = дедЛ, причем все р^-4^^<0 (/=1, ..., /); почему? Рациональные корни многочленов над полем <0 Для многочленов с рациональными коэффициентами вопрос о приводимости над полем О не решается так просто, как в случае полей С и И, и универсальных критериев здесь нет. Так называ- емый критерий Эйзенштейна, изучение которого (например, по книге А. Г. Куроша [1]) составляет второе задание для самостоятельной работы, — это на самом деле не кри- терий, а лишь достаточное условие неприводимости; с его помо- щью доказывается, например, что многочлен хп + хп~1+ ... + х + 1 ни при каких п € N не приводим над полем О, откуда уже следует существование в 0>[х] неприводимых много- членов любой степени.
На первый план выдвигается теперь вопрос не о приводимо- сти, а об отыскании всех рациональных корней. Удобно считать коэффициенты многочлена А е 0>[х] целыми числами — это не нарушает общности задачи нахождения корней уравнения А(х) = 0, ибо они, очевидно, не меняются от умноже- ния многочлена на общий знаменатель всех дробных коэффици- ентов. Итак, пусть А(х) = апхп + ап_{х,п~{ + ... + а{х + а0 е 2[х] — заданный многочлен с целыми коэффициентами. Сначала зай- мемся целочисленными корнями, напомнив, что нулевой корень (и его кратность) выявляются тривиально. Теорема 1. Если х0фО — целочисленный корень многочле- на Ас. Ъ\х\, то х0 — делитель свободного члена а0 в А. Действительно, из Л(*0) = апх% + ... + ап_^ + ... + 0^+а0 = 0 следует, что а0 = л:0 • (-а^'1 -... - ^). С помощью этой теоремы отыскиваются все 'целые корни (или устанавливается их отсутствие). Пусть, например, А = А(х) = 2х7 - 2л:6 - 9л:5 - 7л:4 - 4л:3 - 4л:2 - 5л: - 3. Делителями свободного члена служат ±1 и ±3, так что целые корни могут быть только среди этих четырех чисел. Для их проверки удобно пользоваться "многоэтажной схемой Горнера": те ее "этажи", где КФО, в дальнейшем пропускаться (их мы затемнили). Каждому корню, поскольку он может оказаться кратным, отводится не менее двух "этажей". 1 - не корень; -1 - корень кратности 2; 3 - корень кратности 1; -3 - не корень.
Итак, многочлен А имеет два целых корня: —1 (кратности 2) и 3 (кратности 1). Частным от деления А(х) на (х+ \)2(х — 3) будет многочлен 2х* + х2+\, коэффициенты которого мы видим в последней незатемненной строке (и который вообще не имеет действительных корней, поскольку его значения при всех х е К положительны). В рассмотренном примере проверке подлежали всего четыре числа, но при наличии у свободного члена большого количества делителей некоторые из них, заведомо не являющиеся корнями, можно еще до применения схемы Горнера отсеять на основании следующих соображений. Делитель х0=^=±.1 не может быть кор- нем Л, если хотя бы одно из чисел А(\)/(х0— 1) и Л(1)/(л;0+1) — не целое: для любого такого делителя из А(х) = (х — Хо)(^(х) с (3(х) е %[х] должно следовать Л(1)/(*0— 1) = — 0(1) е 2 и Л(1)/(л;04-1) е 2. Числа л:0 = ±1 служат делителями любого а0е 2, и проверять их нужно в любом случае, но процесс непос- редственного вычисления значений Л(1) и А(— 1) фактически не содержит ни одного умножения и трудоемким не является. Пока- жем на примере А(х) = Зл:6 — л:5 + 9л:4 + Зл:3 — 56л:2 + 54л: — 12, как все'это использовать. Так как Л(1) = 0, то 1 — корень; с помощью схемы Горнера (или непосредственным делением) устанавливаем, что кратность этого корня равна 2, а для частного (3{(х) = Зл:4 + 5л:3 + 16л:2 + 30л: - 12 от деления А(х) на (х— I)2 число 1 — уже не корень. При этом Ф1(1) = 42, (3\(— 1) = — 26 (т. е. —1 — тоже не корень, иначе мы бы делили (д\(х) на х+1 столько раз, какова кратность корня). Делители свободного члена, подлежащие испытанию: ±2, ±3, ±4, ±6, ±12. "Кандидатуры" л:0 = —3, —4, 6, 12 и —12 отвергаем, так как для них соответствующие числа 42/(л:0— 1) — не целые. Не являются целыми и 28/(л:0+1) при л:0 = 2,4,—6 ("кандидатуры", уже "забаллотированные", естественно, больше проверять не надо). Таким образом, остаются только —2 и 3, которые испытываем по схеме Горнера:
-2 - корень кратности 1; 3 - не корень Итак, А(х) имеет целочисленные корни: л;, = 1 (кратности 2), х2 = — 2 (кратности 1) — а после деления А(х) на (х— 1)2(х + 2) получается многочлен (32(х) = З*3 — я2 + 18 — 6 уже без целых корней. Для нахождения всех рациональных корней многочлена нужна Теорема 2. Если А(х) = хп + ап_\хп-{ + ... + а1л; + а0 е ^[л:] — унитарный многочлен с целыми коэффициентами, то его рациональные корни могут быть только целыми. Доказательство. Допустим противное: А(р/д) = 0, где р, </е 2\{0}, <7=тМ и дробь р/</ несократима, т. е. НОД(р, </) = 1. Из равенства (р/^)п+ ап_{(р^)п~{ + ... + а,(р/</)+ 0о = 0 умножением на д^-1 и переносом в правую часть всех слагаемых, кроме первого, получаем рп/^ = -ап_^рп-^-ап_2рп-2^-...-а^р^п-2-а^^п-^, что невозможно: справа — целое число, а слева — несократимая дробь, ибо из НОД(р, ^)= 1 следует НОД(/Л ^)= 1 (почему?). Благодаря этой теореме все рациональные корни многочлена А = А(х) = апхп + ап_1хп-1 + ... + а1х + а0е 2[*], ап Ф О, находятся следующим образом. Умножим А на апп'] и перейдем от х к новой формальной переменной у = апх\ тогда апп~1А запи- шется как унитарный многочлен от у. * В соответствии с общим определением кольца /С00 последовательностей и его подкольца многочленов, смысл замены формальной переменной состоит в том, что многочлен (а0, а,, ..., ап) выражается через степени элемента // = (0, ап, 0, ..., 0), а не д: = (0, 1, 0, ..., 0). Кольцо К[у] многочленов от у изоморфно кольцу К[х] (запишите естественный изоморфизм!).
Каждому рациональному корню л:0 многочлена А взаимно одно- значно соответствует корень у0 = апх0 многочлена В, а по теоре- ме 2 этот корень может быть только целым. Следовательно, все рациональные корни исходного многочлена А(х) будут найдены, если мы отыщем все целые корни многочлена В(у) и разделим их на ап. В рассмотренном выше примере возник многочлен (?2(л:) = 3л:3-л:2+18л:-6, не имеющий целых корней; но так как он не унитарен, то дроб- ные корни могут быть. Умножая (32(х) на З2 и производя замену Зх = у, получим унитарный многочлен В(г/) = г/з_г/2 + 54г/-54, который в данном случае раскладывается очевидным образом на множители: В(у) = (у— 1)(г/2 + 54) — что избавляет нас от испыта- ния многочисленных делителей свободного члена 54, поскольку вто- рой сомножитель положителен при всех у е К. Из первого сомно- жителя получаем целый корень у0= 1 кратности 1, откуда находим рациональный корень л:0=1/3 многочлена Р2(Л:)- Таким образом, первоначальный многочлен примера А(х) = Зл:6 - л:5 + 9л:4 + Зл:3 - 56л:2 + 54л: - 12 имеет, кроме найденных ранее корней 1 (кратности 2) и —2 (кратности 1), также корень 1/3, и других рациональных корней у него нет. Примечание. Замену х = у/3 можно было сделать в исход- ном многочлене А(х) и искать все целые корни полученного.
ВЛОЖЕНИЕ КОЛЬЦА В ПОЛЕ Как известно, в кольце целых чисел не всегда выполнимо деление: не для любых т, п е % с п=^0 есть такое ^ е Ъ, что т = ^п. Обилие практических и теоретических задач, требующих деления данного количества на равные части (или в заданном отношении), привело к появлению дробных чисел, т. е., в конеч- ном итоге, к такому расширению кольца Ъ, которое превратило его в поле О рациональных чисел. Нам удобно заняться строгим обоснованием и обобщением именно такого процесса, хотя исто- рический ход событий был несколько иным: сначала на базе натуральных чисел появились положительные рациональные и лишь затем к ним добавились нуль и отрицательные числа. Мы уже рассматривали расширения полей; теперь нам пред- стоит расширять не поле, а кольцо, но так, чтобы новое кольцо, содержащее исходное (или изоморфное ему) в качестве собствен- ного подкольца, само было не только кольцом, но и полем. Поскольку поле — частный случай кольца, имеет смысл "гибрид- ный" термин надкольцо поля (аналогично подполе кольца — это такое подкольцо, которое само является полем, например, Р в Р[х}). Построение поля, изоморфно содержащего заданное коль- цо, называется вложением кольца в поле. Так как всякое поле ассоциативно, коммутативно и не имеет делителей нуля, то каждое его подкольцо удовлетворяет тем же условиям, которые поэтому необходимы для того, чтобы задан- ное наперед кольцо вообще можно было вложить в какое-то поле. Но, оказывается, этих условий и достаточно, причем ми- нимальное поле вложения данного кольца единственно с точнос- тью до изоморфизма. Теорема. Любое ассоциативно-коммутативное кольцо К без делителей нуля допускает вложение в поле, причем все минимальные поля, содержащие К в качестве подкольца, изоморфны друг другу. Доказательство. Сначала рассмотрим "вырожденный" случай, когда К — тривиальное кольцо. Двухэлементное поле Ъ2, подкольцом которого является это К, минимально, ибо всякое поле имеет 0 и / (О ф /); но поле, состоящее только из этих элементов, единственно с точностью до изоморфизма (докажите!).
Пусть теперь кольцо К = (М,+, •), удовлетворяющее услови- ям теоремы, не является тривиальным. Произведение любого числа его элементов можно записывать без скобок, а равенство сокращать на общий ненулевой множитель (почему?). Образуем множество /Ц2 с М2 всех таких упорядоченных пар элементов М, вторые компоненты которых отличны от нуля (М02 Ф 0 ввиду нетривиальности К), и эти пары будем вместо (А:, у) писать в виде дробей х/у. Две дроби х/и и у/V считаем равными, x/и = у/V, если XV = уи (в частности, когда на самом деле дробь одна и та же, т. е. x = у&и = V). Равенство дробей представляет собой эквивалентность на мно- жестве М02: рефлексивность и симметрия этого бинарного отношения очевидны, транзитивность доказывается следующим образом. Пусть х/и = у/V и у/у = г/гю (и, V, гюфО}\ это означает, что xV = иу и уи) = У2. Умножая первое равенство на ш и заме- няя в иугл) произведение угу на уг, получим (после перестановки сомножителей) хии *у = иг*у, откуда ввиду V Ф0 следует хии = иг, т. е. х/и = г/№. По известной теореме * множество дробей М2 однозначно разбивается на классы таким образом, что две дроби принадле- жат одному классу тогда и только тогда, когда они равны. Принимая сами классы за новые элементы, составим из них множество М=М02/(=), называемое фактор-множеством мно- жества М2 по отношению эквивалентности "=". Теперь надо так определить в М операции сложения и умножения, чтобы они соответствовали обычным арифметическим действиям с дробными числами. Пусть х, у е М, а х/и е х и у/у е у — какие-нибудь дроби из этих классов. Суммой х-\-у назовем тот класс, который содер- жит дробь (ху + иу)/иу, а произведением х*у — класс, содержа- щий ху/иу\ это действительно дроби, ибо из ифО&уфО следу- ет иуфО (почему?). Хотя выбор дробей х/и и у/у в своих клас- * Предполагается, что с теоремой о разбиении учащиеся знакомы (например, из курса "Введение в специальность" или книги [8]).
сах произволен, результирующие классы от него не зависят: если х'/и'= х/и& у'/V'= у^, то х'и = и'х & у'у = V'у, откуда (х^' + и'у')* иV = х'у'ш) + и'V'иV = х'и • V'V + у'г) • и'и = = и'х - V'V + V'у - и'и = XV - и'у' + у и - и'у' = (XV + у и) * и V, т. е. (х?у' + и'у')/и^' = (XV + иу)/иV', для произведения классов доказательство проще. Таким образом, (М, +) и (М, •) — группоиды. Оба группоида ассоциативны и коммутативны. В самом деле, пусть х, у, г е М, а х/и, у/V и г/до — дроби из этих классов. (х/и + у IV) + г/гю = (XV + иу)/иV + г/гю = = ((XV + иу) -№ + иV - г)/иV • до = (х • УОУ + и(уш + V2))/и - УОУ = = х/и + (у га) + V2)/V№ = х/и + (у/V + 2/ш), следовательно, (х + у) + г = х + (у + г). Соотношения х + у = = у + х, ху*г = х*уг и ху = ух проверяются без труда. В группоиде (М, +) нейтральным элементом 0 служит класс дробей вида 0/1 с 1ф 0, а противоположным элементом для клас- са А:, содержащего дробь х/и, — класс —х, содержащий (—х)/и. Таким образом, (М, +) — абелева группа. Нейтральным элемен- том в группоиде (М, •) является класс дробей вида 1/1 с гф О, а обратным для класса хфО, содержащего х/и с х Ф 0, — класс х~{, содержащий и/х. Все эти утверждения, а также выполнение дистрибутивного закона х(у + г) = ху + хг предлагаем доказать читателю. Итак, для алгебраической системы Р = (М, +, •) все пункты определения поля проверены (в ином порядке). Выделим подмно- жество МА с М таких классов, дроби которых имеют вид хг/1 с 1ФО, и покажем, что система КЛ = (МЛ, +, •) с теми же, как и в поле Р (точнее, индуцированными), операциями сложения и умно- жения является его подкольцом, изоморфным исходному кольцу К. Для этого достаточно 1) проверить, что (МА,+) и (МА, •) — группоиды, и 2) установить такую биекцию /: М —> МА, которая была бы одновременно изоморфизмом (М, +) на (Мл,+) и (М, *) на (М„ •)•
1) Если х, у е МЛ, а я*/* е к & уг'/г' е у, то класс х + у содержит дробь (х1- 1' + 1<уг)/П' = (х + у)-М'/М' и поэтому тоже принадле- жит МЛ; класс х у содержит дробь (хг-уг')/И'= (ху-И')/И'> а зна- чит, Х*у € МА. 2) Положим /(х) = х для любого А: е М, где л: — класс дробей х1/1 с ?т*=0, и покажем, что отображение /: М —> МА является изоморфизмом колец К и КА. / инъективно, потому что из х = у, т.е. х111 = у1'11', следует х11'= у11' и (после сокращения на М'ФО) х = у\ сюръективность же / очевидна: класс л: имеет в К прообраз х. Остается проверить, что !(х + у) = ?(х) + ?(у) и /(*•*/) = /(*)*/(*/)' но это фактически уже сделано (где?). Таким образом, кольцо К=(М,+, •) изоморфно подкольцу КА = (МА,+, •) поля Р = (М,+, •). Пусть Рт|П — минимальное поле, содержащее К в качестве подкольца *. Для любых х, и е М с и фО в Рт1п (но не обязательно в К) есть элемент хи~{\ отне- сем ему тот класс — элемент Р, который содержит дробь х/и. Это соответствие между некоторыми элементами Рт|П и всеми элементами Р взаимно однозначно, так как равенство хи~[ = уV~[ равносильно XV = уи, т.е. совпадению классов, содержащих дро- би х/и и у/V', сумме и произведению элементов Рт1п отвечают сумма и произведение их образов в Р, поскольку хи~1 + уV~^ = = (XV + иу) - (иа)-1 и хи~1 • уг~1 = (ху)-(ж)~-1. Следовательно, Рл изоморфно некоторому подполю поля Рт1п, значит, и самому Рт1п ввиду его минимальности. Итак, все минимальные поля, содержащие заданное подкольцо К, изоморфны полю Рт1п, значит, и друг другу. Теорема дока- зана. Если К0 — произвольное ассоциативно-коммутативное кольцо без делителей нуля, то кольцо многочленов К0[я] обладает теми же свойствами; минимальное поле, содержащее К0[я] в качестве подкольца, называется полем рациональных функций над коль- цом К0. Вопросы. 1) Что представляет собой поле рациональных функций над тривиальным кольцом? 2) Получится ли поле раци- ональных функций над нетривиальным ассоциативно-коммутатив- ным кольцом К0 без делителей нуля, если сначала вложить К0 в * Т. е. никакое Р'с РШ|П не содержит К в качестве подкольца. Равносильное определение: Рт1п — пересечение всех полей, содержащих К как подкольцо.
свое Рт1п, а затем построить поле рациональных функций над этим Рт1п? Будем теперь считать, что за исходное кольцо К0 взято неко- торое поле Р; поле рациональных функций над Р естественно рассматривать как его простое трансцендентное расширение и обозначать через Р(х), поскольку новый элемент х (формальная переменная) не удовлетворяет никакому алгебраическому уравне- нию над Р (почему?). Элементами поля Р(х) служат дроби (упо- рядоченные пары) А(х)/В(х), где А = А(х) и В = В(х)фО — эле- менты кольца Р[х] *, рассматриваемые с точностью до общего множителя (многочленного) в числителе и знаменателе. Укоре- нившееся название "рациональная функция" для такой дроби нельзя признать слишком удачным, ибо две равные дроби (один и тот же элемент поля Р(х)) не всегда представляет одну и ту же функцию аргумента х е Р: например, в поле Щх) поскольку х(х- 1)-(л:3+ \)(х + 2) = (х3 + 1)(х- 1) -х(х + 2), но при значении х=1 функция, задаваемая левой дробью в (*), не определена, тогда как функция, задаваемая правой дробью, при- нимает значение 1/2 (при х = — 2 левая дробь равна 2/7, а пра- вая не определена). Однако такое несовпадение может иметь место лишь при конечном числе значений х, полное же сокраще- ние обеих дробей приводит к одной и той же функции (опреде- ленной всюду, кроме, может быть, конечного числа значений я); поэтому в математическом анализе смешение терминов "рацио- нальная функция" и "дробь" не слишком опасно. Для упрощения записи условимся опускать "(х)" в обозначении (прописной бук- вой) многочленов, если под "я" подразумевается все время одна и та же формальная переменная (но не ее конкретное значение). Можно уже заметить, что формальная переменная х в поле Р(х) и элемент 6 & Р, трансцендентный над Р, в расширении Р(0) поля Р с алгебраической точки зрения ведут себя одинаково, т. е. имеет место * Обратите внимание на разницу между
Теорема. Поле Р(х) рациональных функций над полем Р и простое трансцендентное расширение Р(0) того же Р изо- морфны. Строго формальное доказательство этого очевидного факта здесь вряд ли было бы уместным, и мы лишь заметим, что оно основано на следующем: каждое из равенств над Р а„хп + ап_ {хп-! + ... + а{х + а0 = О, ап0п + ап_10п-1 + ... + а10 + а0 = 0 имеет место лишь при ап = ап_{ = ... = а{ = а0 = 0. На интуитивном уровне нам могут заметить, что "полной ана- логии" между такими, например, полями, как 0>(х) и 0>(п), все равно нет: в первом случае можно вместо переменной х подстав- лять различные числа, тогда как второе поле "постоянно", ибо л — определенное число. Постараемся возразить красиво: число л однозначно определено лишь общетеоретически, в конкретных же случаях его заменяют тем или иным рациональным прибли- жением в зависимости от требуемой точности *, так что факти- чески вместо я, как и вместо х, подставляются различные числа. Разложение дроби на сумму простейших. Пусть В е Р[х] — многочлен положительной степени, неприводимый над полем Р. Дробь вида А/ВГ, где Ле Р[л:], с1е^Л<с!е^В и ге М, называется простейшей относительно В; к таким дробям причис- ляем и нулевой элемент 0 поля Р(л:) (когда йе^Л < 0). Теорема. Всякую дробь С/5 е Р(х), где 5 = аВ[1В%...В2 — раз- ложение многочлена 5 на неприводимые сомножители, можно представить в виде суммы многочлена и простейших дробей относительно В{, В2, ..., В^ со знаменателями д,^...,^^,^...,^,...,^,^,...,^, и такое представление единственно (с точностью до перестановок слагаемых и сомножителей). * Отношение длины окружности к диаметру считали в древнем Вавилоне равным 3, в древнем Египте 3,16, а у Архимеда фигурирует значение 22/7. Формула Валлиса (1655) открыла возможность вычислять к с точностью до любого десятичного знака. Но и ныне наиболее "популярно" приближение с двумя знаками после запятой; в статье одного ученого-биолога, посвящен- ной расчету габаритов кита, смысл символа "к" пояснен очаровательной сноской: "Для гренландских китов к = 3,14".
Доказательство. Будем считать многочлен 5 унитарным, ибо при а = О выражение С/5 не имеет смысла, а в случае а Ф 1 можно заменить С на аС (и "восстановить истину" только в окончательном результате). Сперва докажем существование иско- мого представления, начав с частного случая, когда й=1, т. е. знаменатель данной дроби имеет вид 5 = Вг. Деление с остатком многочлена С на В приводит к равенству С = (ЭГ_1В+АГ, где с!е^ЛЛ<с1е^В (целесообразность именно такой индексации частного и остатка скоро выявится), откуда С/5 = С/В'= <?г-,/В'-'+Л/В', причем второе слагаемое — простейшая дробь (возможно, нуль). Деля далее (?Л_, на В, получаем <?,_,= ^Г_2В + АГ_^ (йееЛ^^аедЯ) и С/5 = (Эг-2/Вг-2 + Аг_1/В'-*+Аг/Вг, где уже два последних слагаемых — простейшие дроби. Продол- жая в том же духе, получим С/5 = <?1/В+Л2/В2 + ...+ЛЛ_1/Я'-'+ЛЛ/В', а после деления (?, на В, окончательно С/5 = <? + Л1/В + Л2/В2 + ...+ЛЛ_1/Я'-'+ЛЛ/В', где (?, Л,, Л2, ..., Л,_,, Аге Р[х] и все дроби в правой части — простейшие. Пусть теперь й> 1. В разложении 5 = Ц'1 »В2Л2...В^ оба сомно- жителя (разделенные точкой) взаимно просты (почему?), и по теореме-лемме найдутся такие (У, 1/е Р[х], что (;.в," +у.в^2...в;* =/, откуда С = С1/.В^2...В;* +СУ.В? и С/5 = СУ/В,Л' +С(У/В^..Д*. Первое слагаемое, как мы уже установили, допускает представ- ление в виде суммы многочлена и простейших дробей (относи-
^ 18______________________________Алгебраические операции тельно В,); поступая со вторым слагаемым, как с первым в слу- чае и = 2, и как с исходной дробью С/5 в случае и > 2, мы после и шагов и суммирования всех многочленов типа (? прихо- дим к исходному представлению (запись которого в общем виде дадим немного позже). Осталось доказать единственность. Пусть + ... — два представления, причем АФА (1</<^, 1<г<г,-). Такие две простейшие дроби — с одним и тем же знаменателем и оди- наковым /, но разными числителями — обязательно должны быть (почему?); предположим, что из всех пар таких дробей выписана именно та, в которой показатель степени г — наибольший. Ум- ножая обе части равенства \А~А}/В'1=((3-(3} + ... на многочлен В^...В^В^ ...В[А', получим равенство, в левой части которого сто- ит простейшая дробь, а в правой — ненулевой многочлен, что невозможно (почему?). Теорема доказана. Для записи в общем виде представления исходной дроби С/5 как суммы многочлена и простейших дробей заметим, что много- члены типа А различны при разных В и поэтому их точная за- пись требует не одного, а двух индексов: Ач- ("а и жи") будет означать числитель той дроби, знаменателем которой является В? (I = 1, 2, ..., и; /= 1, 2, ..., г,). Представление, возможность и единственность которого установлены теоремой, имеет общий вид где (3, А1}-еР[х], Ае§Аи<Ае%В1 при всех /=1,2,...,и и /= 1, 2, ..., г, (если Д-. = 0, то дробь представляет нуль поля Р(х) и соответствующее слагаемое в (**) отсутствует).
В случае Р = К, учитывая характер приводимости многочленов над полем действительных чисел, получаем Следствие. Всякая дробь С/8еЩх], где. и однозначно представима как, сумма мно- гочлена над К и простейших дробей в
Практически находить такое представление в конкретных слу- чаях удобно не по той схеме, по которой доказывалась теорема, а методом неопределенных коэффициентов, который мы разъясним на примере: С = 6х7 + 4л:6 + 2л:5 + 11 х4 + 15л:3 + 9л:2 + 1 Ол: + 11, 5 = 8л:6 + 4л:5 - 2л:4 - 5л:3 - 2л:2 + 4л: - 1. Деля (с остатком) С на 5, получаем (мы не только сократили дробь на х+1, но и умножили на 1/8 числитель и знаменатель, чтобы последний стал унитарным). У полученной дроби & = /=!, с, = 1/2, г, = 3, р^ = ^^ = ^, 5, = 1. Запишем дробь в виде суммы простейших с неопределенными (точнее, не определенными пока) коэффициентами: Для нахождения а, р, у, 8 и е приведем дроби правой части к общему знаменателю, взяв за него знаменатель левой, и сло- жим. Так как у равных дробей с одинаковым знаменателем чис- лители тоже совпадают, то
Раскрывая скобки в левой части, группируя ее слагаемые по степеням х и приравнивая коэффициенты при одинаковых степе- нях х справа и слева, получаем систему уравнений из которой а = 3/2, (3 = 0, у=1, 8 = — 1, 8 = 0. Искомое представ- ление: В общем случае система уравнений для определения коэффи- циентов а,,, ... р/5/, у/5/, полученная таким образом, всегда имеет единственное решение, что автоматически следует из существова- ния и единственности искомого представления дроби. (Как уп- ражнение, рекомендуем показать, что число уравнений совпадает с числом неизвестных, хотя одного этого, вообще говоря, не достаточно ни для существования, ни для единственности реше- ния; общая теория линейных систем излагается во II семестре.) Специальное обоснование для описанного процесса не нужно, поскольку его принципиальный вариант соответствует ходу дока- зательства теоремы, а правомерность метода неопределенных коэффициентов в свете теоремы не вызывает сомнений; и лишь один слабый пункт (который, наверное, заметили далеко не все) нуждается в подкреплении. Именно, частное от деления С на 5 мы сразу приняли за (? в равенстве (**), тогда как по ходу доказательства этот многочлен постепенно образуется из многих
слагаемых; не могли ли в результате возникнуть какие-то добав- ки к первоначальному частному? На самом деле из однозначности представления С = 5(3 + К с с!е^ < с!е^5 следует однозначность такого представления С/5 = (д + К/5, в котором последняя дробь правильна: степень числителя меньше степени знаменателя. Так как все простейшие дроби правильны, то для ликвидации указанного пробела в доказа- тельстве надо лишь убедиться в том, что сумма правильных, дробей есть правильная дробь', несложное доказательство этого утвержде- ния читатель сможет провести самостоятельно. В курсе математического анализа, где теорема и ее следствие применяются прежде всего к интегрированию рациональных фун- кций, рассматривают и другие способы разложения правильной дроби на сумму простейших. Вопросы. 1. Будет ли правильной дробью а) произведение, б) частное двух правильных дробей? 2. Как выглядит следствие теоремы о разложении на простей- шие дроби для рациональных функций над полем С комплексных чисел? 3. Остается ли сама теорема в силе для отношений многочле- нов а) над кольцом Ъ1 б) над кольцом 2,(1) целых комплексных (гауссовых) чисел?* в) над полем (ф(г') рациональных комплекс- ных чисел? г) над телом кватернионов? 4. Доказать, что ассоциативное, но не обязательно коммутатив- ное, кольцо без делителей нуля можно вложить в тело. 5. Пусть в ассоциативно-коммутативном кольце К = (Л1, +, •) выделено подмножество М0сМ\{0} элементов, не являющихся де- лителями нуля. Доказать, что К допускает изоморфное вложение в такое ассоциативно-коммутативное кольцо К с единицей, где вся- кий х е М0 имеет обратный элемент х~1. * Интересующимся рекомендуем книгу: А. Я. Окунев. Целые комплексные числа. — М.: Учпедгиз, 1941.
МАТРИЦЫ Если в девятиэтажном доме пять подъездов, то обозначая через а,-у общее число жильцов тех квартир 1-го этажа, двери которых выходят на лестничную площадку в /-м подъезде, можно составить таблицу (матрицу) из девяти строк и пяти столбцов, описывающую всю картину количественного распределения жильцов дома по лестничным площадкам. Элементы а!-/- матрицы — не обязательно числа, это могут быть, например, множества — списки жильцов. В общем случае матрицей, подробно р х ^-матрицей над М называется функция Л:{1,2,...р}х{1,2,...,<7}-»М, относящая каждой упорядоченной паре натуральных чисел *б {1,2, ...,/>}, /6 {1,2,...,?} (элементу декартова произведения) элемент а/уе М непустого мно- жества М произвольной природы. Обозначения матрицы: где индексы р и ^ у |я/у|| , означающие количества строк и стол- бцов матрицы, можно не писать, когда это не приводит к пута- нице. Две р х {/-матрицы считаются по опре- делению равными, А = В, если а1-/- = &//- при всех ге {1,2,...,;?} и /е {1, 2, ...,</}; говорить о равенстве или неравенстве матриц раз- ного размера — с неодинаковыми р или ^ — не имеет смысла.
Пусть теперь заданное множество — кольцо К = {М,+, •}. Сум- ма двух р х {/-матриц над кольцом К (или над множеством М) опре- деляется естественно: если то Ясно, что множество всех р х {/-матриц (с фиксированными р и ^) над одним и тем же кольцом образуют абелеву группу относительно операции сложения; нейтральным элементом этой группы служит нулевая р х ^-матрица все элементы кото- рой равны нулю кольца, а противоположной для А = ||а,у — матрица -А = Ц-а^. . Сложнее, зато и интереснее обстоит дело с определением произведения матриц. Наивное определение приводит к построе- нию над К кольца р х {/-матриц с теми же свойствами коммута- тивности, ассоциативности и наличия единицы, какими обладало само К (но не обязательно сохранится обратимость ненулевых элементов, и могут появиться делители нуля; почему?). Такое поэлементное произведение, введенное Ж. Адамаром, иногда применяется (например, в комбинаторном анализе), но соответ- ствующее матричное кольцо как алгебраическая система особого интереса не представляет по причине, которую удобнее разъяс- нить не на новых объектах, какими пока являются для нас мат- рицы, а на уже хорошо известных многочленах. Предположим, что для последовательностей элементов из К мы решили ввести умножение так же бесхитростно, как и сло- жение:
Получится, очевидно, кольцо с теми же "достоинствами", как и в случае матриц (уточните!), но такое, что если, скажем, его элемент Л равен аЬ + с, то 1-й член последовательности А выра- жается только через 1-е члены исходных последовательностей а, Ь и с: А( = аД + с1 — и никакие их члены с другими номерами в образовании с11 не участвуют. Построенное таким образом кольцо — всего лишь "механическая смесь" экземпляров исходного коль- ца К, никак не взаимодействующих друг с другом. Напротив, определение а • Ь = (а0, аь ...) - (60, Ь{, ...) = (аД, а^Ь{ + а^0, ...), при котором в формировании 1-го члена произведения участвуют не только /-е, но и другие члены сомножителей, привело к коль- цу К[л:] многочленов над К — качественно новой и очень важной алгебраической системе. Как подтверждают другие примеры (поля <ф(>/2) и т. д., поле С) и дальнейший исторический ход развития алгебры, такое "зацепление разных компонент" плодо- творно именно тогда, когда оно лежит в основе умножения, а не сложения *. Чтобы вместо поэлементного произведения матриц прийти к их умножению "с зацеплением", воспользуемся наглядным приме- ром. Имеется 3 продукта, из которых смешиванием в разных пропорциях готовят 5 разных блюд так, что на каждый грамм 1-го блюда расходуется а/у граммов /-го продукта; в свою оче- редь, каждый грамм /-го продукта содержит такие компоненты (в долях грамма): белков 6Ь углеводов 6/2, жиров 6/3 и воды Ьц (/=1,2,3,4,5; /=1,2,3). Требуется узнать компонентный со- став каждого блюда. Нахождение количества с^ граммов 6-го компонента (6= 1, 2, 3, 4) в /-м блюде — простая арифметическая задача. Например, для подсчета содержания жиров (6 = 3) во втором блюде надо сложить их количества, вносимые первым, вторым и третьим продуктами: С23 = а21^13 + а22^23 + а23^33- ТаКИМ обрЗЗОМ, ЭЛСМСНТЫ ИСКОМОЙ МЗТрИ- цы С = 1^1^ образуются из элементов заданных матриц по закону: * Подобного рода высказывания, впрочем, не следует воспринимать чересчур категорически — это мешает научному творчеству.
с,-А = а/1&1А + аА* + а1-з&3*- (О А вот чисто математический пример. Пусть переменные х{, х2, х3, *4, х5 выражены через переменные у{, у2, у$ равенствами где ац — постоянные (например, действительные числа), а пере- менные у-г в свою очередь, выражены через требуется выразить я-переменные непосредственно через г-пере- менные. Решение очевидно: заменим в (2) все (/-переменные их выражениями (3), раскроем скобки и произведем группировку по г-переменным; получим где элементы матрицы С = \сл ; выражаются через элементы мат- риц /1=11^.!! и В=\Ь^\ прежними равенствами (1). Разумеется, не задача о рациональном питании, а теория линейных преобразований послужила основой для создания исчи- сления матриц, в котором главную роль играет именно такой способ составления матрицы С по Л и В. Пусть над кольцом К даны матрицы А= ац\^ и В= 61Л |*, раз- меры которых, как видно из обозначений, следующим образом
согласованы: число столбцов первой матрицы совпадает с числом строк второй. Произведением А-В р х {/-матрицы А на ^ х г-мат- рицу В называется р х г-матрица с элементами (I = 1, 2, ..., р; и = 1, 2, ..., г). Записывая перемножаемые матрицы без явного указания размеров, надо всегда подразумевать, что количества строк и столбцов в сомножителях согласованы как сказано выше — иначе произведение матриц не имеет смысла; в другой записи, без "посредника" С, определение произведения выглядит так:
Умножение матриц над К не подчиняется коммутативному за- кону даже тогда, когда само кольцо К коммутативно. Во-первых, если А - А? и В = В?, где рф^, то запись А-В = В>А бессмыс- ленна, ибо при рфг не существует второе произведение, а при р = г матрицы А? • Вдр = (А- В)р и В* • Арр = (В• А)^ — разного раз- мера. Во-вторых, и при р = ^ = г, когда оба произведения суще- ствуют и одинакового размера, они не обязательно равны: если А'(В + С) = А'В + А-С и (В + С)-А = В-А + С-А нуждаются в доказательстве, и лишь ввиду аналогичности рас- суждений мы ограничимся выводом первого. Пусть Л = [|а^|| , 5 = ]й/Л,'Г и С = '\с.^ (при сложении матриц требование согласованности тривиально: размеры слагаемых дол- жны совпадать). Тогда поскольку в кольце К дистрибутивный закон а(Ь + с) = аЬ + ас выполняется. Если кольцо К ассоциативно, то и для матриц над К
всякий раз, когда обе части имеют смысл, т. е. размеры матриц согласованы. В самом деле, если то (объясните каждый шаг!). Благодаря ассоциативности умножения матриц, решение пре- жней задачи о преобразованиях переменных допускает компакт- ную запись. Именно, введем, наряду с матрицами коэффициентов также матрицы переменных тогда систему равенств (2) можно заменить одним матричным При соглашении, что в обозначении произведения матриц можно опускать или не опускать точку, закон ассоциативности запишется без скобок: А-ВС = АВ-С. Но мы предпочитаем в матричном произведении точку всегда сохранять, поскольку символ АВ будет у нас иметь другой смысл — припи- сывание к матрице А* справа матрицы Врг , в результате чего получается /?х(<7 + /-)-матрица (АВ)Р .
Х = А-У, (2') и точно так же система (3) равносильна матричному равенству У = В-2. (3') Заменяя в (2') матрицу У ее выражения из (3') и пользуясь ассоциативностью, получаем Х = А'(В'2) = (А-В).2 = С'2, где С=А-В\ но равенство Х = С-2 — не что иное, как матрич- ная запись системы (4). Такая запись в дополнительном обосно- вании не нуждается, если считать, что переменные л:,,...,г4 при- нимают значения из того же кольца К, над которым заданы "постоянные" матрицы Л, В и С *. Если в кольце К есть единица /, то единичная р х р-матрица служит левым нейтральным элементом по умножению для всех р х ^/-матриц, а единичная ^ х {/-матрица Ецщ — правым нейтраль- ным (проверьте, что Ерр • А% = А* • Е] = А$ для любой А$ над К), но просто нейтрального (двустороннего) элемента при р ф ^, оче- видно, нет, а кажущееся противоречие с замечанием к теореме о единственности нейтрального элемента в группоиде объясняется тем, что множество р х {/-матриц с неодинаковыми р и ^ не образует группоида относительно операции умножения (почему?). Числовые примеры (над 2) * Строго формально: элементы "переменных" матриц-столбцов X, V и 2 при- надлежат кольцу К[*1, ..., г4] многочленов от 5 + 34-4= 12 формальных переменных.
показывают, что произведение ненулевых матриц может быть нулевой матрицей даже тогда, когда само кольцо К не имеет делителей нуля. Дальнейшие свойства операции умножения мат- риц будут излагаться по мере надобности. Из всего сказанного выше видно, что сколько-нибудь хорошей алгебраической системы (типа кольца) относительно сложения и умножения множество М(К) матриц и над самым хорошим коль- цом (даже полем) не образует; то же имеет место для подмно- жеств р х ^/-матриц с фиксированными рФ^.\\ только при ^ = р множество МДК) квадратных, матриц порядка р, т. е. р х р- матриц, представляет собой кольцо К(МДК), +, •), которое мы для краткости будем обозначать снова через Мр(К). Доказатель- ство того, что это действительно кольцо и что на него переносят- ся с исходного К свойства ассоциативности и наличия единицы (но не коммутативности и отсутствия делителей нуля), состоит в отборе и упорядоченности ссылок на приведенные выше факты и примеры. Кольцо М^К), очевидно, изоморфно К, и можно ска- зать, совпадает с ним, если отвлечься от" разницы между ац =||а,,|| и а,, *. Но прежде чем заняться систематическим изу- чением колец М (К), рассмотрим важные примеры таких преобра- зований р х ^/-матриц, которые осуществляются умножением пре- образуемых матриц на квадратные преобразующие; будем при этом считать фиксированное кольцо К ассоциативным и обладаю- щим единицей /. 1. Предположим, что матрицу Л = |а-\Р (р>1) понадобилось I Ч \р переделать следующим образом: первую строку поставить на мес- то /,-й, вторую — на место /2-й, ..., р-ю на место 1р-й (/,, 12, ..., /р е {1, 2, ..., р} и все различны). Нетрудно проверить, что эта цель достигается умножением А слева на такую р х р-матрицу 5 . . . , в которой каждый столбец состоит из р — 1 нулей * Сказать-то можно, но снова вспоминается О. Генри: "Она сидела в розовых мечтах и в кимоно того же цвета". А это из какого произведения?
2. Рассмотрим такую переделку матрицы А%\ к элементам 1-й строки прибавляются соответствующие (т. е. из тех же столб- цов) элементы &-й строки, умноженные слева на один и тот же элемент X е К; при этом и ФI, а сама й-я строка остается неиз- менной. Это преобразование равносильно умножению данной матрицы А слева на преобразу- ющую матрицу Ел(К)рр9 которая отличается от Ерр только тем, что нулевой элемент 1-й строки в й-м столбце заменен на А,. 3. Умножение 1-й строки (т. е. всех ее элементов) матрицы А слева на ХеК осуществляется умножением всей А слева на матрицу Е1 (К)р, полученную из Ерр заменой 1-й диагональной единицы элементом А,. Аналогичные операции над столбцами матрицы А при усло- вии, что умножение ее элементов на А, производится теперь и одной единицы, причем единица первого столбца находится в 1{-й строке, единица второго — в 12-й и т. д. Например, где левый сомножитель — преобразующая матриц;
справа, равносильны умножению всей А справа на преобразую- щие ^ х {/-матрицы, отличающиеся от прежних, кроме размера (если ^Фр), тем, что роль строк теперь играют столбцы и наоборот. Например, где второй множитель в левой части — преобразующая матрица ^ (-п\ '• Преобразования типа 1—3 над строками или столбцами матриц называются элементарными', соответствующие преобразующие матрицы 5 будем называть мат- рицами элементарных преобразований строк, а 5 /2 Ец (А, У и Е; (А,)* — матрицами элементарных преобразований столбцов', их называют также просто элементарными матрица- ми. На примере покажем, как записывать последовательность элементарных преобразований в терминах преобразующих матриц. \а Пусть матрицу над Ъ подвергли следую- щим преобразованиям (в указанном порядке): * Но если в некоторой ^ х 4-матрице надо вторую строку заменить разно- стью ее с четвертой, то всю матрицу следует умножить слева на Е^ (-!)', •
ко второй строке прибавили первую, поменяли местами первый и третий столбцы, из первого столбца вычли удвоенный четвертый, умножили вторую строку на —1; при этом только первое действие совершено фактически над самой Л, каждое же последующее — над матрицей, полученной на предыдущем шаге. Всё преобразование исходной матрицы А в новую А' выглядит так: А-> = А'. С помощью преобразующих матриц и с использованием ассо- циативности матричного умножения процесс запишется так:
Преобразующие матрицы V (для строк) и V (для столбцов) осуществляют над заданной матрицей А уже не элементарные, а более сложные операции, состоящие в последовательном вы- полнении нескольких элементарных; порядок элементарных мат- риц при формировании их произведения /7 — обратный, а при формировании V — прямой. В процессе непосредственных пере- делок матрицы обязательно соблюдать по отдельности очеред- ность операций со строками и очередность операций со столбца- ми, перемежать же одни с другими можно как угодно — это следует из ассоциативности умножения матриц (и операций: вспомните умножение подстановок!). Так, в рассмотренном при- мере запись А —> и -А - V фактически означает, что сначала совер- шали оба действия над строками и лишь затем — над столбца- ми, тогда как первоначально было дано другое чередование дей-
ствий (но с неизменным порядком в каждой паре). Предлагаем самостоятельно проверить, что если то произведения И'-А-У, и-А-У и И'-А-У отличны от и-А-У. Ясно, что и в общем случае, если операциям над строками отвечают по порядку преобразующие матрицы (/,, 1/2, ..., 1/т, а операциям над столбцами — У,, У2, ..., Уп, то исходная матрица А окончательно перейдет в и -А - V, где V = Vт • ... • 1>2- V{ и 1/=1/,-1/2. ... • Уа. Приступим к изучению колец квадратных матриц порядка ре N над ассоциативным кольцом К с единицей /. Каждое МДК) тоже ассоциативно и обладает единицей Е = Ерр , а нулем служит матрица 0 = 0рр = |;0!|р. В дальнейшем у матриц из М = МДК) при фиксированном р мы не будем без надобности указывать этот размер. Займемся проблемой обратимости элементов кольца М. Матрица А е М называется невырожденной (или неособен- ной), если она обратима, т. е. если существует такая Л"1, назы- ваемая обратной матрицей для Л, что А~{ • А = А - А~{ = Е. Не- обратимая матрица (не имеющая обратной) называется вырож- денной (или особенной); таковы, в частности, нулевая матрица и делители нуля в кольце М (докажите!), но не только они (при- ведите примеры!). Согласно замечанию к теореме о единственности обратного элемента в моноиде, если для матрицы А = \а-ч известно суще- ствование таких X и У, для которых А-Х=У-А = Е, то отсюда уже вытекает Х=У = А~{, т. е. невырожденность А. Непосред- ственное нахождение матрицы Л"1 = \Хц \ состоит в решении сис- темы р2 уравнений с р2 неизвестными хп, х[2, •••, хрр, равно-
сильной одному матричному уравнению \\ац, • \х^,, = Е или *//1 • | а|у || = Е (с тем же решением, хотя кольцо К не обязательно коммутативно), а сам факт невырожденности матрицы А равноси- лен одновременной разрешимости обоих этих уравнений; если разрешимость (в кольце К) обеих систем р2 уравнений как-то установлена, то фактически решать достаточно одну из них, а если известно, что хотя бы одна система несовместна, то можно сразу заключить: матрица А — вырожденная. Вопрос: а нельзя ли воспользоваться результатом задачи к определению группы и утверждать, что из разрешимости уравне- ния А-Х=Е уже следуют разрешимость уравнения У-А = Е и равенство Х= У? Пример 1. Над кольцом К = ^6 (вычетов по модулю 6) рас- смотрим кольцо М2(^б) квадратных матриц второго порядка. Хотя элементы 2 и 3, будучи в К делителями нуля, необратимы, составленная из них матрица имеет обратную, роль кото- рой играет она сама (проверьте!). Напротив, матрица вырожденная: уравнение равносильно системе 2л:п=1, 2л;12 = 0, л;21=0, л;22=1, первое уравнение которой неразрешимо, ибо 2 — необратимый элемент кольца Ъ^ Рекомендуем, как упражнение, исследовать на вырожденность матрицы и для неособенных найти обратные; то же в предположении, что элементы всех семи матриц принадлежат кольцу Ъ.
Пример 2. Подмножество матриц вида в кольце М2(К) образует его подполе, изоморфное С, с изоморфизмом поскольку подкольцо же матриц вида О а , очевидно, изоморфно полю К. Пример 3. В кольце М2(С) подмножество М^ матриц вида а + Ы с + (И\ -с + (И а-Ы\ телу кватернионов. В самом деле, если обозначить с а, Ъ, с, и е К образует подтело, изоморфное
то любую матрицу из М^ можно представить в виде и биекция }(а^^ + Ь^{ +с^<2 +с^^ъ) = а + Ы +с] + ЛЬ будет изомор- физмом Мф на тело кватернионов. Для доказательства последнего фактически надо лишь проверить, что таблицы умножения мат- риц ^^, ^<2, ^г и "мнимых единиц" /, /, и различаются только обозначениями; предоставим это читателю. Пример 4. Множество матриц вида где а, ..., Л е К, образует кольцо, изоморфное кольцу комплекс- ных кватернионов; вместо громоздкой и малоинтересной непос- редственной проверки предложим читателю выяснить происхож- дение выражения (*) и найти среди таких матриц пару делите- лей нуля. Для этого достаточно скудных сведений о комплексных кватернионах из конца раздела "Решение алгебраи- ческих уравнений". Лемма. Матрица ЛеМДК) вида (/<й<р), в которой а^ — необратимый элемент кольца К, является вырожденной.
Для доказательства достаточно вывести противоречие из предположения о существовании такой Приравнивание элементов матриц что и Е дает р2 уравнений, но мы выпишем из них только те, кото- рые участвуют в дальнейших рассуждениях: Первое равенство показывает, что ап — обратимый элемент и, значит, не является делителем нуля; поэтому из остальных равенств первого столбца следует *21=Л:31= ••• =хы = 0> и равенства второго столбца принимают вид •^22^22 ^= ' "^32^22 == > • • •» •^62^22 ^= > откуда аналогично предыдущему заключаем, что а22 — обратимый элемент и л;32= ... = л;А2 = 0, и т. д.; последнее получаемое таким образом равенство х^а^= 1 противоречит необратимости аАА. Дальнейшими важными примерами на обращение служат уже известные нам элементарные матрицы. 1. Для матрицы обратной служит — это проверяется непосредственным перемно-
жением матриц и по смыслу ясно: для восстановления матрицы А из 5- А надо /гю строку вернуть на первое место, /2-ю — на второе и т. д. 2. При любом А,е К обратной матрицей для Е^(Х) служит Еш(—А,); например, (здесь р = 4, 1 = 2, й = 3). Это и понятно: если матрица А' полу- чена из А прибавлением к 1-й строке й-й строки, умноженной на А,, то для восстановления А надо к 1-й строке матрицы А' при- бавить ее й-ю строку, умноженную на —А,. 3. Матрица ЯДА,) является невырожденной в том и только том случае, если А, — обратимый элемент кольца К (докажите!), и тогда обратной матрицей будет ЯДАг1). Аналогичные утверждения справедливы и для тех элементар- ных матриц, умножение на которые матрицы А справа преобра- зует ее столбцы. Итак, проблема обращения (или установления необратимости) матрицы А е МДК) в принципе решена, но сама процедура в общем случае весьма трудоемка. Ее можно упростить в предпо- ложении, что все ненулевые элементы кольца К обратимы, т. е. что К — тело. Для этого понадобятся матрицы элементарных преобразований и лемма, в которой условие необратимости эле- мента а^ превращается просто в а^ = 0. На практике К — даже поле, но нам коммутативность умножения не понадобится. Пусть
где К — тело, а р е N. Опишем и обоснуем процедуру, по завер- шении которой либо образуется матрица Л"1, либо выясняется, что исходная А — вырожденная, причем последнее можно сразу заключить и в случае обрыва процесса на каком-то этапе. Если ап = а21 = ... = ар{ = 0, то мы скажем, что процесс обо- рвался на первом этапе (и, значит, А необратима), а если ка- кой-то ап Ф 0, умножим /-ю строку на а~{1 и переставим на пер- вое место; матрицами этих преобразований будут Е1 (а^1) и в случае /=1), а исходная матрица перейдет в В случае а'2} = ... = а'р\ =0 первый этап окончен, а если какой- нибудь а'ы ФО (2<&<р), то прибавим к й-й строке первую, умно- женную на -а^ , и аналогично обратим в 0 остальные ненулевые элементы первого столбца (если они еще были); соответствующие матрицы преобразований Е(-а[{] и т. п. Первый этап считаем завершенным, когда преобразуемая матрица примет вид
Если теперь агг = ... = а*2 = 0, то мы считаем процесс оборвав- шимся на втором этапе (и опять заключаем о вырожденности Л); если же не все элементы ниже а*г — нули, то, не трогая первую строку и действуя с остальными как на первом этапе, добиваемся, чтобы на месте а*гг оказалась /, а под ней — нули, после чего к первой строке прибавляем вторую, умноженную на -а[г. По завершении второго этапа (если процесс не оборвался раньше) матрица примет вид и т. д. Возможны два исхода. При первом исходе, когда все р этапов удалось осуществить, результатом будет единичная матрица: Е=йт- ... -б^-б^-Л, где [}{, 1}2, ..., ит — матрицы тех элементарных преобразований строк, которые были выполнены на всех р этапах, пронумерован- ные в порядке очередности выполнения: сначала операции перво- го этапа (в их последовательности), затем второго и т. д. Мат- рица и=Цт- ... -и2-и\ — единственная кандидатура на роль Л"1 (почему?), и остается лишь проверить, что А-0 = Е. Такая проверка" необходима, поскольку равенство Ц-А = Е означает лишь, что матрица I] — "левая обратная" для А. При втором исходе на каком-то й-м этапе процесс оборвется, так как будет получена матрица вида
(1<&<р), которая в силу леммы будет необратимой. Но тогда необратима и исходная матрица А — иначе ввиду обратимости матриц С/!, С/2, ..., С/л тех элементарных преобразований, после- довательность которых превратила А в Л(й), было бы обратимо и произведение Цп - ... - Ц2-и{-А = А(1г). Процедура обоснована, но ей еще не придана краткая форма; предварительно поясним всё сказанное на конкретном примере. Пусть Совершая над строками элементарные преобразования, будем помещать (над стрелкой) символ преобразующей матрицы, и процесс превращения А в Е запишется так: Кандидатура на роль А~1 — произведение
(чтобы "набить руку", проделайте все умножения семь отдельных примеров). Проверка: это заменит т. е. действительно 1} = А~1, поскольку и-А=А'1} = Е. Хорошо поняв описанную процедуру, нетрудно осмыслить и следующий, предложенный А. Н. Крыловым, изящный вариант ее реализации, при котором не нужно фактически выписывать пре- образующие матрицы. К заданной матрице /1 = ||а//|| Е тр (^) при- соединим справа единичную Ер, т. е. образуем р х 2р-матрицу и с помощью элементарных преобразований строк всей этой матрицы превратим ее левую половину в Е\ при этом правая половина автоматически перейдет в такую р х р-матрицу I]', что
Ц-А = Е (почему?) и останется лишь проверить равенство А-Ц = Е. В рассмотренном выше примере т. е. справа получилась прежняя матрица И (а равенство А-И = Е уже было проверено).
Можно было действовать и иначе: дописав к А матрицу Ерр не справа, а снизу, преобразовывать в полученной 2р х р-матри- це не строки, а столбцы, с тем чтобы наверху образовалась Ерр ; снизу автоматически сформируется такая V, что А-У=Е, и ос- танется лишь проверка равенства У-А = Е. Предлагаем проде- лать это на матрице прежнего примера и убедиться в том, что V = И. Элементарные преобразования со столбцами можно про- водить и на матрице АЕ, если каждую операцию над левой по- ловиной сопровождать точно такой же операцией над правой. Вопрос. Возникает идея преобразовывать в матрице АЕ сразу и строки и столбцы, что ускорило бы превращение левой половины в Е\ так, в нашем примере —» однако проверка показывает, что матрица
не является обратной для А. В чем ошибочность заманчивой идеи? Одним из многочисленных важных приложений задачи обра- щения матрицы является решение системы р уравнений с р неизвестными, где коэффициенты ац при неиз- вестных и свободные члены Ь1 принадлежат некоторому полю Р. Вводя матрицы запишем систему в виде одного матричного уравнения А-Х=В. (**) Под решением понимается не только процесс нахождения значений неизвестных, но и сама система значений, т. е. упорядо- ченная система х}, х2, ..., хр элементов поля Р, подстановка кото- рых вместо неизвестных превращает все уравнения (*) в равен- ства элементов поля. В равносильной форме: решение (корень)
уравнения (**) — это матрица X; над полем Р, для кото- рой справедливо равенство А - X = В . Теорема. Если А — невырожденная матрица, то уравне- о ние (**) имеет единственное решение X = А~} - В . о В самом деле, предположив сначала, что какое-то решение X о есть, мы из равенства А-Х = В умножением слева на Л"1 (и о пользуясь ассоциативным законом) получаем X = А~ -В, а затем подстановкой в (**) убеждаемся, что эта единственная кандида- тура и вправду является решением (сравните с теоремой об од- нозначной разрешимости уравнений в группе). Следствие. Если Ь{ = Ь2= ... = Ьр = 0 (тогда система (*) называется однородной), а матрица А —'- невырожденная, то единственным решением системы служит тривиальное (нулевое) Д = х2 = ... = хр = 0 . Примечание. Как отсюда вытекает, для наличия у одно- родной системы нетривиальных решений (хотя бы с одним х, Ф 0 ) необходимо, чтобы матрица А системы была вырожденной. Оказывается, это условие и достаточно, т. е. однородная система р уравнений с р неизвестными, матрица которой необратима, обязательно имеет нетривиальные решения; доказательство этого и способы нахож- дения всех решений даются в линейной алгебре (II часть книги). В качестве упражнения предлагаем применить матричный под- ход к четырем системам уравнений в упражнениях 4—4" вводной
лекции, а также к однородным системам, полученным из них заменой правых частей нулями. Как мы знаем, элементарные преобразования матриц встреча- лись еще в древнем Китае. Матричное умножение имеется у Бине и Коши (первая половина XIX века), а символическому исчисле- нию матриц как "цельных алгебраических объектов" посвятил в 1858 г. специальный трактат английский математик А. Кэли. Материал для самостоятельной проработки по книге Г. Е. Шилова: 1) Умножение матриц (над произвольным кольцом), разбитых на блоки. 2) Транспонирование матриц, теорема о транспонировании произведения матриц. Вопросы эти не сложны и не объемисты, а выдача задания перед самой сессией и включение в программу экзаменов явля- ется хорошей проверкой того, что студент в течение семестра приобрел хотя бы минимальный навык самостоятельной работы с математической литературой.
Часть II________ ЛИНЕЙНАЯ АЛГЕБРА Линейность — синоним правдивости: не терпит она искривлений, но будет примером учтивости для многих еще поколений. ЛИНЕЙНЫЕ ПРОСТРАНСТВА Логический путь развития науки почти никогда не совпадает с историческим. Теория алгебраических систем начиналась с абе- левых групп, а не с группоидов общего вида, и ясно, почему: об операции над элементами множества, характеризуемой только тем, что она однозначна, всегда выполнима на данном множестве и не выводит за его пределы, почти нечего больше сказать (даже теорема единственности нейтрального элемента как бы чудом появляется "из ничего"), тогда как групповая операция, со своими богатыми свойствами, фигурирует у Эйлера, Лагранжа, Гаусса и др. еще до появления общих определений группы, поля и кольца *. Систематическое же изучение алгебраических опера- ций, напротив, естественно начинать с наиболее общего (и наи- более простого, хотя и крайне абстрактного) случая, постепенно обогащая его конкретизацией самих операций и сочетанием их друг с другом. То же наблюдается и в отношении линейной алгебры. Прави- ло параллелограмма для сложения сил и скоростей, известное еще Архимеду и совершенно необходимое Ньютону, заявило о себе и в чистой математике при сложении комплексных чисел, однако нынешняя векторная алгебра (изучаемая в школьной ма- тематике и аналитической геометрии) родилась не на этой осно- ве, а была выделена популяризаторами науки во второй полови- не XIX века из гораздо более сложных гиперкомплексных систем Грассмана и кватернионов Гамильтона. До того все равенства, * Кстати, сам термин "группоид" — производный от "группа" — появился много позже.
относящиеся к направленным величинам и вектор-функциям, в том числе формулы Гаусса—Остроградского и Стокса из вектор- ного анализа, записывались в координатах (что по меньшей мере "утраивало" их громоздкость). Общеизвестная алгебра векторов в геометрическом простран- стве представляет собой алгебраическую систему с одной бинар- ной операцией — сложением векторов — и бесконечным множе- ством унарных: каждому числу (скаляру) отвечает операция ум- ножения вектора на это число, в итоге дающая вектор. Кроме законов, которым подчиняются бинарная операция и множество унарных по отдельности, имеют место и законы взаимосвязи операций обоих типов. Первоначальное определение линейного пространства удобнее всего дать не на слишком высоком уровне абстракции группоида, а на основании следующих обобщений "школьной" векторной алгебры: во-первых, под векторами не обязательно понимать геометри- ческие направленные отрезки (точнее, классы таких отрезков — см., например, [8]); во-вторых, пространство векторов, даже геометрических, не обязательно ограничивать тремя измерениями (эту возможность предусматривал еще П. Ферма в XVII веке); в-третьих, унарными операторами не обязательно должны быть действительные числа. Линейным (или векторным) пространством У(Р) над полем Р называется алгебраическая система (V, +, Р), на множестве V которой заданы бинарная операция + (сложение) и множество Р унарных операций (умножений вектора на скаляр с любой сторо- ны), удовлетворяющие следующим условиям: 1) У = (У,+) — абелева группа; 2) Р = (Р,+, .) _ поле; 3) \/хе V:/•* = *, где / — единица поля Р; 4) Усе, ре РУхе V: сс(рх) = (ар)*; 5) Уа, ре РУхе V: (а + $)х = ах + рх; 6) Уае Р\/х,уе V: а(х + у) = ах + ау. Как видно из записи этих аксиом, векторы — элементы V — обозначаются жирными буквами, скаляры — элементы Р — гре- ческими (в дальнейшем мы будем пользоваться также латински- ми курсивными). Обозначение сложения в V и в Р одним и тем
Линейные пространства __ ___ ___ __ /53 же символом путаницей не грозит (почему?). Нуль группы V — нулевой вектор — естественно обозначать через 0, противопо- ложный элемент для х — через —к, противоположный элемент для осе Р — через —а, а обратный для ыфО — через а"1; бла- годаря теореме 2(6) о кольцах (I часть), выражение —а"1 при а фО имеет однозначный смысл. Считаем также ха = ах при любых х е V и осе Р. Из этих шести аксиом непосредственно получаются, кроме известных теорем, относящихся по отдельности к абелевым груп- пам и к полям, также следствия: Доказательства. 7. 0-х = 0-х + 0 = 0-х + [х + (—х)} = = (0-х + х) + (-х) = (0-х+1 -х) + (-х) = (0 + 1)х + (-х) = = 1 • х + (—х) = х + (—х) = 0; здесь использованы определения ней- трального и противоположного элементов и ассоциативность сло- жения в группе V, аксиомы 3) и 5), определение нуля в Р, снова аксиома 3) и определение противоположного элемента в V. 8. х + (-1)х=1-х + (-1)-х = [1+ (-1)]х = 0-х = 0 (объясните сами каждый шаг!), а это и значит, что (—1)х — противополож- ный элемент для х. 9. а- 0 = а (0 -а) = (а-0)а = 0 • а = 0; здесь в качестве а взят произвольный вектор из V, остальные шаги предлагаем объяс- нить самостоятельно. 10. Если ои = 0 и ыфО, то х= 1 • х = (ос~1а)х = а~1(ах) = = сг10 = 0. Эти доказательства кажутся несколько искусственными, но сами утверждения столь естественны и просты, что мы предпоч- ли изложить их перед тем, как перейти к примерам. Примеры линейных пространств. Кроме очевидных примеров V3, V2 и V1 геометрических векторов (над полем К) в пространстве, в фиксированной плоскости и на фиксированной прямой, а также тривиального V0, состоящего только из нулево- го вектора, назовем еще целую серию тривиальных: каждое поле Р можно рассматривать как линейное пространство (Р, +, Р) над самим собой.
Очень важный нетривиальный пример составляют всевозмож- ные р х {/-матрицы с фиксированными р, </ е N над произвольным полем Р при естественном матричном сложении (оно определено в части I) и поэлементном умножении матрицы на элемент поля: если X = \хг Г , все х^е Р и а б Р, то* Выполнение аксиом 1)—6) проверяется без труда. Это линейное пространство будем обозначать символом М^(Р). В частности, при р=\ имеем пространство М^ (Р) ^-строк вида |!^||^ (пер- вый индекс у х можно не писать), т. е. длины ^, а при ^ = \ — пространство Щ (Р) р-столбцов вида Ц^Ц', т. е. высоты р (здесь у л: не пишем второй индекс). Аддитивная группа кольца Р[х] многочленов над полем Р образует над этим же полем линейное пространство. То же спра- ведливо для аддитивных групп бесконечных последовательностей Р°° элементов Р и для многочленов (над Р) степени не более п при фиксированном пе Ки{0} (но не степени ровно п\ почему?). Другие примеры будут рассматриваться по мере надобности. Непустое множество V с V векторов линейного пространства У(Р) = (У,+, Р) образует его подпространство У'(Р)сУ(Р), если алгебраическая система (V, +, Р) с тем же полем Р и теми же (точнее, индуцированными) бинарной операцией сложения векторов и унарными операциями умножения вектора на элемен- ты поля также является линейным пространством. Для этого * Право обозначать элементы поля Р как греческими, так и латинскими бук- вами часто позволяет делать запись более "членораздельной": в данном случае "греческие элементы" служат операторами, а "латинские" участвуют в формировании элементов абелевой группы (V, +)•
достаточно (и, очевидно, необходимо), чтобы подмножество У'=^0 в У(Р) удовлетворяло двум условиям: а) Ух, уе V: х + уе V; б) \/хе V \/ае Р. ах е V. Действительно, в силу а) (V, +) — подгруппоид группы (У,+), а в силу б) — х = (—1)хе V; на этом основании, как известно из части I, (V,+) — подгруппа (У,+), причем тоже абелева. Акси- омы же 4), 5) и 6) таковы, что, будучи выполнены для некото- рого множества векторов, автоматически сохраняют силу и для любого его подмножества, а 2) вообще не зависит от V и V. Примеры. 1. Тривиальным образом подпространствами У(Р) служат оно само и пространство из одного нуль-вектора. 2. Множество всех векторов геометрического пространства, параллельных фиксированной плоскости П, есть подпространство V2 с V3 (собственное, т. е. V2 с V3 & \2Ф V3) над полем К. Если р — прямая, параллельная плоскости П, то множество всех векторов, параллельных р, является собственным подпростран- ством предыдущего: V1 с V2, а тем самым и V1 с V3. 3. В пространстве М^ (Р) строки вида \\х{...хтО... 0\\ч с фикси- рованным т(^<т<^) образуют подпространство; при т = 0 оно состоит только из нулевой {/-строки ||0||9, при т = ^ совпада- ет со всем пространством. Строки же Цдс,...^/.../||^ не образуют подпространства (почему?). 4. Многочлены степени не выше п (при фиксированном п) образуют подпространство в пространстве всех многочленов над заданным полем. Пусть У,(Р), У2(Р), ..., У„(Р)сУ(Р) — подпространства ли- нейного пространства У(Р) = (V,+, Р), п>2. Их пересечение п П Ч (Р) = (V, П У2 П — П Ч,, +, Р) тоже является подпростран- п ством в У(Р): если х, у е П Ч и ае Р, то оба вектора х, у,
значит, также х + у и ш/, принадлежат всем УА, следовательно, и их пересечению. В то же время алгебраическая система Л УУ^,+, Р может не быть подпространством (примеры скоро Ь1 /г = 1 приведем), зато сумма подпространств Х^(">) = (^ '"^Р), ь=\ где Vх — множество векторов х е V вида х = х{ + х2 +... + хп с х^е У^ (и = 1, 2, ..., п), — подпространство У(Р): в самом деле, если у = у{ +у<2+ ... + Уп — другой вектор из УЕ, а ае Р, то векторы ХЬ + УЬ и ах^ принадлежат Уй при каждом и, следова- тельно, п п х + У = ^(*ь +^)е у1 и ал: = ^ал:Л е У1. А=1 Л=1 Сумма подпространств называется прямой и записывается в виде У1(р)еу2(р)е...еуп(р), когда V*, /е {1,2, ..., п}: *=*/ => у, ПУ/ = {0}. Например, если П1 и ГЬ — две непараллельные плоскости в геометрическом пространстве У3, а У^ и У22 — подпространства векторов, параллельных П1 и параллельных П2, то У!2ПУ22 — подпространство векторов, параллельных линии пересечения этих плоскостей, множество У^УУ^ не образует подпространства (почему?), а суммой У^+У22 (не прямой!) является всё У3. Если У1 с У3 — подпространство векторов, параллельных какой-то прямой, которая сама не параллельна плоскости П^ то сумма V = У,2 0 У1 — прямая. Линейные пространства У,(Р) = (V,, +, Р) и У2(Р) = (У2, +, Р) называются изоморфными, У,(Р) = У2(Р), если существует такая биекция /: У! —» У2, что для любых я, у^М\ и ае Р: !(х + у) = !(х) + !(у) и /(ах) = а/(*);
при этом сама биекция / (или =) называется изоморфизмом. Например, М^ (Р) = М{* (Р) при р = ^. Но так как, кроме три- виального изоморфизма п\\Хь\\]=\х^ (поставим строку "на 11 ' у11 к Пц I I « И! ч 1 ./ попа"), существуют и другие (скажем, /у!^!^ = р^^ ), то ут- верждение рф^ => М^ (Р) Ф Щ (Р) не столь очевидно, как мо- жет показаться на первый взгляд; оно будет доказано в следу- ющем разделе. Пространства я-строк и я-столбцов с /х е N над полем Р изоморфны пространству многочленов степени < /х — 1 над тем же полем (докажите!). Геометрический пример: если плоскости П1 и ГЬ в простран- стве V3 не параллельны, то подпространства У^ Ф У22 векторов, компланарных этим плоскостям, всё равно изоморфны; биекцию можно установить, например, поворотом вокруг линии пересече- ния плоскостей.
ЛИНЕЙНАЯ ЗАВИСИМОСТЬ ВЕКТОРОВ Система векторов аи а2, ..., ап е V линейного пространства У(Р) называется линейно зависимой, если существуют такие ^, А,2, ..., А,„ е Р> не все равные 0, что К1а1 + Ь2а2 + ... + Кпап = 0. (*) Напротив, эта система векторов линейно независима, если ра- венство (*) выполняется только при А,1=А,2= ... =Хп = 0. Вообще выражение такого типа, как в левой части (*), носит название линейной комбинации векторов (с коэффициентами из Р), а ре- зультирующий вектор (в данном случае 0) — значением этой линейной комбинации. Теорема 1. Система векторов линейно зависима тогда и только тогда, когда хотя бы один из ее векторов являет- ся значением некоторой линейной комбинации остальных (т. е. линейно выражается через них). Доказательство. Если система а\,а2, ...,ап линейно зави- сима, то для нее имеет место (*) при каких-то А,,, А,2, ..., А,п, среди которых есть \ФО. Тогда соотношение можно записать в равносильном виде т. е. представить й-й вектор системы как значение линейной комбинации остальных. (Все -А^"1, ... принадлежат Р; почему?) Наоборот, если какой-то вектор а^ системы представляется в виде то — соотношение типа (*), в котором коэффициент при а^ отличен от нуля. Следствие. Система векторов линейно независима в том и только том случае, если ни один ее вектор не является значением никакой линейной комбинаций остальных.
Примечание. Условие теоремы часто берут за определение линейной зависимости; тогда первоначальное определение стано- вится теоремой. Примеры. 1. Если какой-то вектор а^ системы — нулевой, то вся система линейно зависима, поскольку в равенстве 0-а1 + ... + 0-а,_1 + /.0 + 0.а, + 1 + ...+0.ап = 0 коэффициент при векторе а* = 0 отличен от 0. То же самое непос- редственно следует и из теоремы, так как нулевой вектор являет- ся значением линейной комбинации (тривиальной) остальных: 0 = 0-а/ + ... + 0-аЛ_1+0-аЛ + 1 + ...+0-ая. 2. Система, в которой встречаются одинаковые векторы, ли- нейно зависима: если, например, а2 = а{, то / - а, + (-/) • а2 + 0 • а3 + ... + 0 - ап = О (или а2 = / -а, + 0-а3 + ... + 0-ап). 3. Система из одного вектора а (п = 1) 'линейно зависима тогда и только тогда, когда а = 0. (Очевидно.) Теорема 2. Если некоторая непустая подсистема систе- мы векторов линейно зависима, то и вся система линейно зависима. Пусть, например, в системе аь а2, ..., ап линейно зависима подсистема первых т векторов, где 1 < т < п, т. е. существуют А,,, А,2, ..., А,т, не все равны нулю, такие что Х1а, + Х2а2 + ... + Хтат = 0. Но тогда и в левой части равносильного равенства Х1а1 + Х2а2 + ... + Хтат + 0-ат + 1 + ... + 0-ап = 0 не все коэффициенты равны нулю. Следствие. Если система векторов линейно независима, то такова же и всякая ее непустая подсистема. 4. Бесконечная система векторов называется линейно незави- симой, если независима каждая ее конечная подсистема. Так, система элементов {**/& = 0, 1,2,...} кольца Р[х] многочленов над полем Р независима, поскольку многочлен Х0 + А,,* +... +Хпхп является нулем этого кольца только при ^ = ^ =... = А,П = 0.
5. В пространстве ^-строк (над заданным полем Р) линейно независима система где все а^ФО\ в самом деле, векторное уравнение А,,а, + Х2а2 + ... + \ая = О равносильно системе А,, а, = А,2а2 = ... = \ая = 0 ^ скалярных, из которой А,, = А,2 = ... = А,9 = 0. Геометрические примеры. В пространстве V3 тройка векторов а, 6, с линейно зависима тогда и только тогда, когда она компланарна, а четверка а, 6, с, о? — всегда. В V2 пара а, 6 линейно зависима тогда и только тогда, когда ее векторы коллинеарны, а тройка — в любом случае. Наконец, в V1 линей- но зависима каждая пара векторов, а случай одного вектора уже рассмотрен в примере 3. Все эти утверждения фактически дока- зывались в векторной алгебре (при обосновании разложения вектора по координатной базе и определении его координат), так что остается лишь произвести "стыковку" языков геометрии и алгебры, что мы охотно доверяем читателю. Пусть V с V — непустое подмножество векторов линейного пространства У(Р). Рангом гп^ V этого подмножества называет- ся наибольшее количество яеКи{0} векторов такой линейно независимой системы а,, а2, ..., а„, которую можно составить из его векторов; иначе говоря, т§\' = п, если существует линейно независимая система п векторов, принадлежащих V, но всякая система п + 1 (а значит, и большего числа) векторов из V ли- нейно зависима. Подмножеству V, из векторов которого можно образовать сколь угодно длинные независимые системы, припи- сывается бесконечный ранг: г^пУ' = °о; другая крайность: мно- жество V = {0} — нулевого ранга, поскольку из нулевого векто- ра невозможно составить никакую линейно независимую систему. Ранг всего V называется размерностью (сНт) пространства У(Р) = (У, +, Р), т. е., по определению, сНтУ(Р) = г^пУ. Очевидно, 0 Ф V7 с V" => гп^У < гп^У". Множество У' значений всевозможных линейных комбинаций (с коэффициентами из Р) векторов подмножества У с У относи-
тельно операций пространства У(Р) образует подпространство: в самом деле: а) если я, уе\', то х = А,1л:1 + ... + А,тл:т и у = \1{у{ + ... + \1пуп, где *„ ...,*т, *л,...,*/пе V и А,,, ..., А,т, щ, ..., м,яе Р, а тогда х + у = А,,*, + ... + Хтл:т + \л1у1 + ... + \1пуп е V' *; б) для любого осе Р ах = аСА,,*, + ... + Хтл:т) = а - А,,*, + ... + а - А,тхт = = оА,г*1 + .-- + аА,т-*те V'. Подпространство ЦУ/) = (У/, Р) = (у',+, Р)с У(Р), порожден- ное подмножеством У'сУ, или натянутое на У', называется также линейной оболочкой этого подмножества; роль последнего может, очевидно, играть и система векторов (в которой, в отличие от множества, не обязательно все элементы различны). Лемма 1. Если в пространстве У(Р) система векторов А = {аь ..., ап] линейно независима, а система аь ..., а„, 6 зависима, то 6 е ЦА, Р)**. Действительно, согласно условию существуют такие Х1э ..., А,„, |1 е Р, не все равные 0, что А,, а, + ...+Хпап + |1б = 0, и при этом [ЛФО — иначе была бы зависимой сама А. Отсюда 6 = Нг-'Ма, + ... + (-|1-а>п, где коэффициенты в скобках принадлежат полю Р. В частности, если я = сНтУ(Р), то ЦА, Р) = У(Р). Теорема 3. Для любого непустого подмножества У7 с V векторов линейного пространства У(Р): ' Здесь нет надобности "приводить подобные члены", так как в определении линейной комбинации векторов не предполагается, что все ее векторы раз- личны. "* Последнее означает: 6еА, где ( А , +, Р) = Ь(А, Р); подобные упрощения записи, например * е У(Р), мы будем допускать и в дальнейшем.
Смысл теоремы (имеющей важные аналоги и за пределами линейной алгебры) весьма нагляден: если в самом множестве (системе) V нельзя найти более чем п линейно независимых век- торов, то их невозможно и "настряпать" из векторов V никаким линейным комбинированием. Доказательство*. Соотношение сНтЦУ, Р) >гпеУ очевидно, и надо лишь показать, что допущение о строгом нера- венстве приводит к противоречию. Пусть А = {а,, а2, ..., ап} — линейно независимая система, со- ставленная из векторов V' с п = т§\' (т.е. наибольшим возмож- ным), а В = {6,, 62, ..., 6„, 6п + 1} — линейно независимая система п + 1 векторов из V. Благодаря лемме 1 каждый вектор В ли- нейно выражается через векторы А. В частности, 61=Х1а,+Х2а2 + ...+Хпап, где не все А^ — нули, ибо равенство &! = 0 противоречит неза- висимости системы В; меняя в случае надобности нумерацию векторов в А, можно считать, что ^{ФО, а тогда и снова в силу леммы 1 векторы V линейно выражаются через &м а2, а3, ..., ап. В частности, где не все |12, |13, ..., Ц* равны 0 — иначе опять система В была бы линейно зависимой, — и пусть, например, |12=^=0; тогда и т. д. Продолжая в том же духе, мы после п шагов полностью заменим векторы А векторами 6,, 62, ..., 6„, через которые * Во многих пособиях по линейной алгебре прямое доказательство этой тео- ремы обходится, что мы считаем нецелесообразным. Другой крайностью представляется ее доказательство индукцией по числу п = гп^У (с базой индукции п = 0, как курьезно сформулировано в одном из учебников: "При п = О теорема ничего не утверждает и поэтому верна"); такое доказатель- ство можно предложить в качестве "упражнения на строгость".
по-прежнему будут линейно выражаться все векторы В, в том числе и &„ + !, а это противоречит линейной независимости систе- мы В. Теорема доказана. Кратко резюмируем: если среди векторов а{, а2, ... имеется п, но не более, линейно независимых, то размерность линей- ной оболочки, натянутой на систему а{, а2, ..., равна п. Следствие. Вектор Ье V пространства У(Р) = (У, +, Р) тогда и только тогда линейно выражается через векторы подмножества У'сУ, когда гп^(У'и{&}) = гп^У'. Система А = {ау-//'е/} векторов линейного пространства У(Р) = (У,+, Р), где / — индексное множество той же мощности И = [А| (см., например [8], §8), называется базой пространства, если Ц А, Р) = У(Р) и векторы А линейно независимы. Любой вектор х е V можно разложить по базе, т.е. представить как значение линейной комбинации конечного числа ее векторов ау-, а/2, ..., а/4 ; если п = тах^, /2, ..., Д}, то мы можем записать разложение вектора по базе в виде х = х^+х2а2 + ... + хпап, где коэффициенты л;,, х2, ..., хп е Р (в случае п>Ь по крайней мере п — Ь из них равны 0). Эти коэффициенты, называемые координатами вектора х в базе А, определяются однозначно: если х = Х& +... + хпап = х'м +... + х'пап (число п слева и справа мы полагаем одним и тем же, поскольку к "более короткой" сумме можно добавить слагаемые вида 0-а,), то (х,-х,)а,+... + (хп-хп)ап=0, откуда х[ = х\,...,х'п = хп в силу независимости векторов А. В конечномерном пространстве У(Р) благодаря лемме 1 лю- бые я = сНтУ(Р) линейно независимых векторов образуют базу, в бесконечномерном это не так: например, счетная система 1, х, х2, л:3, л:4, ... является базой пространства многочленов Р[х], а ее подсистема 1, л:2, л:4, ..., тоже счетная, — не является (почему?).
Лемма 2. В конечномерном пространстве У(Р) = (У, +, Р) любую линейно независимую систему векторов а{, ..., а^ е V с &<сНтУ(Р) можно дополнить до базы. Доказательство. В силу условия существует вектор 6 е V, не выражающийся линейно через данные и векторов; присоединив к ним 6, получим линейно независимую систему, ибо если А,1а1 + ... + А,лал + ц6 = 0, где А,,, ..., А,л, |1 е Р не все равны 0, то \ЪФО (почему?) и 6 выражался бы через аь ..., ай. В случае &+1=сНтУ(Р) система аи ..., а^ Ь — база, в случае же &+1<сПтУ(Р) добавим еще вектор се V, не выражающийся линейно через эти й+1 векто- ров, и т. д., пока не получим систему из я = сНтУ(Р) линейно независимых векторов, т. е. базу пространства У(Р). Теорема 4. Для любых линейных пространств У,(Р) и V2(Р) с11т(У1(Р) + У2(Р)) + с11т(У1(Р)ПУ2(Р) = = с11тУ1(Р) + с11тУ2(Р). (*) Доказательство. Если хотя бы одно из данных про- странств бесконечномерно, то равенство (*) тривиально: оо = оо. Пусть теперь оба пространства конечномерны и С = {с{, ..., с/} — база их пересечения, так что / = сИт(У1(Р)ПУ2(Р)). ' (1) В согласии с леммой 2 дополним систему С до базы А = {с{, ..., сь аь...,ат} пространства У,(Р) и в то же время до базы В = {с,, ..., с„ &,,...,&„} пространства У2(Р), где / + т = сПтУ1(Р) и / + п = сНтУ2(Р), (2) и покажем, что система / + т + п векторов 0 = {с„ ..., с„ а,,..., ат, 6„ ..., 6Я} пространства У,(Р) + У2(Р) линейно независима. Пусть V, + ... + V/ + Щв, + - + 1^т«т + V А + - + VпЬп = О, где все Хр |1у, V* е Р. Вектор
выраженный как через В, так и через А, принадлежит обоим пространствам У,(Р), У2(Р) с У,(Р) +У2(Р), значит, и их пересе- чению. Отсюда в силу единственности разложения этого вектора по базе А следует, что щ =... = \лт = 0. Но тогда А,1С1 + ...+А,/С/ + У1&1 + ...+Уп6п = 0> откуда А,, = ... = X/ = V! = ... = Vп = 0 ввиду независимости век- торов базы В. Так как, кроме того, сумма пространств У1(Р) + У2(Р) = = ЦО, Р) (почему?), то система О является базой этой суммы, значит, / + /я + /1 = (Шп(У1(Р) + У2(Р)). (3) Из (1), (2) и (3) следует доказываемое равенство (*). В случае прямой суммы любого числа г пространств (когда все их попарные пересечения нульмерны) сИт(У,(Р)е...е УЛ(Р)) = сНтУ1(Р) + ... + сНтУЛ(Р), (**) и ясно, что для построения базы прямой суммы достаточно выбрать базу в каждом слагаемом и объединить векторы этих баз. Упражнение. Пусть V с V = У( Р) — нетривиальное подпро- странство. Докажите (в случае конечномерного V) существование такого подпространства У" с V, что V = У' © V". Единственно ли это "прямое дополнение"? (для ответа можно воспользоваться гео- метрическим примером к определениям суммы и прямой суммы). Зафиксировав в линейном пространстве У(Р) базу а,, а2, .., мы можем свести действия с векторами к таким же действиям с их координатами, т. е. элементами поля Р: если * п — наименьшее такое, что х>ь = Уь = 0 при /е > п.
Отсюда сразу следует, что линейные пространства одинаковой конечной размерности над одним и тем же полем изоморфны, ибо если в каждом из них выбрать какую-нибудь базу, то коли- чество элементов этих баз будет одним и тем же; поставив в соответствие каждому вектору одного пространства вектор дру- гого с тем же упорядоченным набором из п координат, мы по- лучим изоморфизм пространств. Наоборот, если конечномерные пространства над одним и тем же полем изоморфны, то их размерности одинаковы: действительно, при изоморфизме нуле- вые векторы соответствуют друг другу (почему?), а линейной комбинации векторов одного пространства отвечает точно такая же линейная комбинация соответствующих векторов другого, в силу чего наибольшее число линейно независимых векторов в одном пространстве не может быть ни больше, ни меньше, чем в другом. В пространстве М^ (Р) есть ^/-элементные базы, например стандартная, составленная {/-строками ||/ О ... 0\\, \\0 1 ... 01 ..., \\0 0 ... /||, в силу чего сйтМ^ (Р) =^. Поэтому М^ (Р) - М^ (Р) тогда и только тогда, когда ^ = </'; отсюда, в частности, следует, что Щ (Р) ^ М^ (Р) при р Ф ^ (см. конец предыдущего раздела). Стандартная база удобна тем, что в ней координатами строки ||лг, х2... хп\\ служат сами ее элементы (почему?). (Докажите, что система ^-строк ||/ / ... /||, ||0 / ... /||, ..., ||0 о ... /|| тоже является базой пространства М|ДР).) Всё сказанное пере- носится дословно на пространство Щ (Р), элементы которого — р-столбцы — мы для компактности будем часто записывать в виде //х} х2... хп 11\ или просто //х{ х2... хп//. Стандартной базой этого пространства является система векторов (я-столбцов)
ПРОСТРАНСТВА, СВЯЗАННЫЕ С МАТРИЦЕЙ Пусть X = р.у | е М^ (Р) — р х ^/-матрица над полем Р. Ее строки (1= 1, 2,..., р), называемые также горизонтальными векторами, порождают подпространство — пространство строк этой матрицы, а столбцы — верти- кальные векторы 8, =8/*)= //*,, *2/ ... хр///€М'(Р) (/' = 1, 2, ..., </) — ее пространство столбцов ЗД = Ь({5„в2,..., 5,}, Р)сМГ(Р). С чисто алгебраической точки зрения каждое из пространств М|ДР), МС(Р), как абстрактное, т. е. с точностью до изоморфиз- ма, полностью характеризуется своей размерностью, так что они существенно различны лишь при рФ^^ Учет же внутренней структуры их элементов, в частности того факта, что подпрос- транства К(Я) и 8(Я) порождены строками и столбцами одной и той же матрицы (диалектическое единство алгебраического и аналитического подходов!), приводит к очень важному и на пер- вый взгляд неожиданному выводу: не только при р = ^, но и при рф^ сПтВД = с11т5(*). (!) Приступая к его обоснованию, предложим читателю освежить в памяти определение и свойства элементарных преобразований матриц (из I части). Пусть между столбцами матрицы X имеет место зависимость
что равносильно системе р скалярных равенств, которую удобно выписать в виде Мы утверждаем, что если произвести какие-то элементарные преобразования над строками матрицы X, в результате которых ее столбцы перейдут соответственно в $р $'2, ..., 5^, то соотно- шение (*) перейдет в '<7 <7 с прежними коэффициентами Х;-. В самом деле, перестановка строк в X повлечет в (**) такую же перестановку равенств, прибавление к 1-й строке матрицы ее й-й строки, умноженной на |1, — замену 1-го равенства на а умножение 1-й строки на \ЛФО — почленное умножение 1-го равенства на это ц; полученные равенства тоже, очевидно, будут справедливы. Итак, линейные зависимости столбцов при элементарных преобразованиях строк сохраняются; новые же зависимости по- явиться не могут, ибо все эти преобразования обратимы (тре- тье — благодаря условию \ъфО), и совершив над результирую- щей матрицей X' операции, обратные тем, с помощью которых она была получена из X (и в обратном порядке), мы восстано- вили бы исходную матрицу с сохранением и таких зависимостей
между столбцами, которых первоначально не было. Всё сказан- ное можно повторить, поменяв ролями строки и столбцы матри- цы X, поэтому справедлива Лемма 1. Элементарные преобразования строк матрицы не меняют линейных, зависимостей между ее столбцами, а преобразования столбцов — зависимостей между строками. В частности, линейно независимые столбцы (строки) остаются линейно независимыми. Следствие. При элементарных, преобразованиях, строк матрицы X не меняется сНт8(А), а при элементарных, пре- образованиях, столбцов не меняется сПтК(А). Выделим теперь в системе горизонтальных векторов X базу из т = сНтР(А) строк, допуская для удобства записи, что это гм ..., гт. Каждая из оставшихся строк (если т<р) является значени- ем какой-то линейной комбинации базовых, и, вычитая из после- дних р — т строк в матрице ее первые строки, умноженные на соответствующие коэффициенты этих линейных комбинаций, мы сделаем все строки, начиная с (т+1)-й, нулевыми; в результате столбцы матрицы примут вид //хГ], Х2( ... хт1 0 ... О//, откуда следует, что А\т$(Х) < т = А\тЦ(Х). (Строго говоря, здесь 8(А) — не исходное пространство столбцов, а изоморфное ему, но на размерности такая "подтасовка" не отражается.) Меняя ролями строки и столбцы матрицы X, точно таким же рассуждением приходим к выводу, что сНтР(А) < сНт8(А). Равен- ство (!) доказано, и на его основе можно дать определение: число гп%Х = А\тК(Х) = А\т$(Х) называется рангом матрицы X. Из всего сказанного выше следует, что ранг матрицы не ме- няется ни при каких элементарных преобразованиях строк и столбцов, как бы ни чередовались эти операции; продемонстри- руем на конкретном примере (где Р = <0>) процедуру практическо- го вычисления ранга:
откуда сразу видно, что гп§Х = 2 (кто этого не видит, пусть наденет очки). Лемма 2. Квадратная матрица (над некоторым полем Р) является невырожденной в том и только том случае, если ее ранг совпадает с порядком. Доказательство. Пусть X = \\хг Г — квадратная матрица порядка п (все х„ е Р). Совершая элементарные операции над строками, придадим этой матрице вид с возможно большим т. Соответствующая процедура, подробно описанная в I части, может иметь три исхода: 1) т = п, т. е. X' — единичная матрица (в ней строки и стол- бцы с номерами, большими т, на самом деле отсутствуют) и гп§гЯ=гп§гЯ' = гп§гЯял =я; 2) 0 < т < п, и тогда мы с помощью первых т столбцов матрицы X' сделаем все элементы ее (т+1)-го столбца нулями; в результате все горизонтальные векторы будут иметь элемент О на (т+1)-м месте, а размерность пространства, порожденного такими векторами, заведомо меньше п (почему?).
3) /п = 0, т. е. первый столбец исходной матрицы X состоит из одних нулей; в этом случае, как и в предыдущем, очевидно, что X — вырожденная матрица и гп§Х<п. Лемма доказана. т х п-подматрица заданной р х ^-матрицы X, где 1 < т < р и I <п<^, получается из X удалением р — т строк к ^ — п столб- цов (в частности, при т = р&^п = ^ из X ничего не удаляется, т. е. р х ^/-подматрицей матрицы Х% служит она сама). Говорят еще, что т х п-подматрица в X порождена ее т строками и п столбцами; если в X это строки с номерами /=1,2, ..., т и стол- бцы с номерами /= 1, 2, ..., п, то подматрицу будем называть начальной (она расположена в левом верхнем углу матрицы, как, например, Е™ в X' при доказательстве леммы 4). Теорема 1. Ране матрицы равен наибольшему порядку ее невырожденных квадратных подматриц. \\р Доказательство. Пусть X = \хЛ — данная матрица ранга '1<7 п\ для удобства можно считать, не нарушая общности, что в ней линейно независимы именно первые п строк и столбцов, и порож- денную ими начальную подматрицу мы обозначим через Хп. Доста- точно теперь показать, что 1) Хп — невырожденная матрица и 2) всякая квадратная подматрица порядка выше п в X — вырож- денная. 1. Из линейной независимости первых п столбцов матрицы X независимость столбцов в Хп автоматически не следует (поче- му?), но такая импликация заведомо имеет место в частном слу- чае, когда нижние р — п строк в X — нулевые, а этого можно достигнуть элементарными операциями, не меняющими п верхних строк, ибо они образуют базу пространства Р(А); независимость столбцов при этом не нарушится в силу леммы 1, и так как под- матрица Хп вообще не изменится, то она — невырожденная по лемме 2. 2. Пусть Ад, — квадратная подматрица матрицы X, порожден- ная какими-то ее и строками и и столбцами, где и > п\ так как гп§Х=п, то эти строки в X линейно зависимы, что на этот раз автоматически влечет такую же зависимость их (вернее, "урезан- ных" строк) и в Ад,. Следовательно, гп^А^ < п < Ъ, и по лемме 2 матрица Ал — вырожденная.
Примечание. Внимательно просматривая всё сказанное в обоих разделах до того, как речь зашла о равенстве (!), можно прийти к выводу, что коммутативностью умножения в Р мы ни разу не воспользовались. Однако само равенство (!) неверно, если Р — только тело. Например, для матрицы над телом кватернионов элементарными преобразованиями строк получаем: откуда сИтР(^)==2, в то время как оперирование со столбцами дает т. е. с11т8(^)=1. Предлагаем читателю ответить на вопрос: где именно при обосновании равенства (!) существенно используется коммутативность умножения в Р? (А обратима ли эта матрица ^?) Теорема 2. гп^(^- V) < тт{гп^Х, гп§У} (над полем Р). Доказательство. Пусть
— данные матрицы-сомножители и их произведение, т. е. 2* = ХцУи + ... + Х^УдЬ = УщХп + - + УдьХц, где 1=1,..., р и &=!,..., г. Это означает, что каждый столбец матрицы 2 как линейная комбинация (с коэффициентами л;п, ..., х-1д) столбцов V принадлежит пространству 5(У), а как комбинация (с коэффициентами */1Л, ..., у^) строк X — простран- ству Р(^). Поэтому гп%2 < А\т$(У) = гп%У и гп%2<й\тК(Х) = гп%Х. Предлагаем читателю самому построить пример двух матриц, ранг произведения которых строго меньше рангов обоих сомно- жителей, а также доказать, что если один из сомножителей — невырожденная квадратная матрица, то ранг произведения равен рангу другого сомножителя. В заключение раздела выясним, как преобразуются коорди- наты вектора при изменении базы линейного пространства. Пусть У(Р) — пространство конечной- размерности /х, А = {аь ..., ап} — одна из его баз, а 1 х я-матрица \х{ ... хп\ — строка координат вектора л:сУ(Р) в этой базе, так что, отожде- ствляя 1 х 1-матрицу с самим ее единственным элементом, можно написать х = х,а, + ...+хпап = \\х, ...хп\\-//а{ ... а„//, (1) где второй сомножитель в правой части — п х 1-матрица (стол- бец), элементами которой служат векторы базы А. Пусть, далее, В = {&!, ..., Ьп} — другая база пространства У(Р), векторы кото- рой заданы своими координатами в базе А: 6* = ^\а\ + ••• т*А = ||тЛ1 ... тЛ - //а, ... ап// (&=!,..., я; все тй/е Р), т. е. //&,... &„// = !.//а, ...а„//, (2) где Т = ТА(В)= |!ты|" * — матрица перехода от базы А к базе В. * Здесь Т — греческое "тау" прописное, в отличие от латинского Г, Т.
Если, в частности, сами векторы &1э ..., Ьп записаны как эле- менты пространства М"(Р) столбцов, а исходная А является стандартной базой Е = {е[, ..., еп] этого пространства, то строками матрицы перехода ТЕ(В) служат те же векторы 6Ь ... 6„, но рас- сматриваемые уже как элементы пространства М|ДР). Проверьте! Квадратная матрица Т должна быть обратимой (невырожден- ной) — иначе между ее строками ||тЛ1... тЛя||, а значит, и между векторами б^е В появится линейная зависимость, в противоре- чии с определением базы. Умножая обе части равенства (2) слева на матрицу Т"1, получим Т-'.//&1...6„// = Т-1-Т.//а1...ал//, или (поскольку 1~{-1 = Е=Епп и Е-//а{ ... ап11 = // а, ... а„//) //а, ...аУ/ = Т-'-//&,..•&«// — выражение векторов базы А через векторы базы В, откуда ясно, что Т~1=ТВ(А), т. е. матрицы перехода от А к В и от В к А взаимно обратны. Подстановка выражения Ца\...ап11 в (1) дает Таким образом, если в базе В, т. е. строка координат вектора х то, благодаря однознач- ности разложения вектора по базе, х х\\ - 1 х х Р-Т1 = л\ ••• Лп|! — \л\ •" лп\\ А и, значит, это искомые выражения новых координат вектора через старые и наоборот. Если пространство У(Р) бесконечномерно и имеет счетную базу А = {ар а2, ...}, то равенство (2), принимающее вид
х = х{а{ + л:2а2 + ... = \\х{ х2 ...|| • //а{ а2...//, сохраняет смысл при условии, что бесконечная строка \\х{ х2... || на самом деле может содержать лишь конечное число ненулевых координат. Такому же условию "фактической конечности" долж- ны удовлетворять и все строки "дважды бесконечной" матрицы * перехода к другой счетной базе В = {Ь{, 62, ...} в новой форме А.&г... //-Т-//«, «2- // равенства (2). То же относится к матрице Т"1 (в случае обрати- мости Т), поскольку в равенствах все произведения должны быть осмысленны. Мы не будем раз- вивать здесь "теорию бесконечных матриц" в общем виде и ог- раничимся одним важным примером. В пространстве (кольце) Щх] многочленов над полем К наря- ду со стандартной базой А = {1, х, х2, ...} имеется бесконечно много других, в том числе В = {л:(0), я(1), я(2), ...}, где л:(0)=1, х(п) = х(х— \)(х — 2)... (х — п+ 1) при п е N — квазистепени пе- ременной х **. Те элементы матрицы перехода * Для строгого введения "бесконечных матриц" достаточно в определении матрицы (часть I) над полем Р допускать вместо {1, 2, ... р} и {1, 2, ... ^} также множество Н; но произведение ||а,у|| • ||&/Л|| таких матриц будет иметь смысл лишь при условии, что никакое из выражений вида а^Ь^ 4-0,2^2* + ••• не содержит бесконечного числа ненулевых слагаемых. ** В комбинаторном анализе многочлен х(п) иногда называют убывающим факто- риалом, а в исчислении конечных разностей — обобщенной степенью х.
у которых />/>2, называются числами Стирлинга первого рода з(п, и) = тя + 11Й + 1, а аналогичные элементы обратной матрицы — числами Стирлинга второго рода 5(п, /г) = т^+1 Л+1 • Чтобы най- ти эти числа, надо в равенствах х(п) = 8(п, 1 )х + з(п, 2)л:2 + ... + $(л, я)*" и хп = 5(л, 1 )л:(1) + 5(л, 2)л:(2) + ... + 5(/г, /г);с(я) заменить квазистепени их выражениями, раскрывать все скобки и приравнять коэффициенты при одинаковых степенях х\ в пер- вом случае это сразу даст значения $(/г, и), во втором — систему уравнений для искомых значений 5(л, и) (и = 1, 2, ..., /г) при каж- дом п е N. Равенство Т~'Т = Е означает, что
СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ Вооружившись понятиями, символикой и результатами преды- дущих разделов, займемся вопросами существования, единствен- ности и фактического нахождения решений системы р уравнений с ^ неизвестными над некоторым полем Р; решени- ем называется система *,, х?, ... x^ элементов поля Р (или, быть может, некоторого его расширения Р), удовлетворяющая всем этим уравнениям, т. е. такая, что в результате замены в (*) символов неизвестных х{ соответствующими элементами X] полу- чаются р тождеств — равенств элементов поля. В матричной форме записи А х = Ь (1) этой системы, где А = а. \Р — матрица коэффициентов при неиз- 1 '<7 вестных, Ь = //Ьъ Ь2, ..., Ьр// — вектор (р-столбец, или р х 1-матри- ца) свободных членов, х= //х{ х2... хч//— ^/-столбец неизвестных, решением служит такой {/-столбец х = //х\ х<2 х<,//, для кото- рого А-х = Ь — равенство матриц с конкретными элементами поля. В силу коммутативности умножения этих элементов после- днее равенство можно записать и в виде Х\ 5, + Х2 82 + ... + )С^ 8ц =Ь ($У= //а{] а2] ...ар1//\ /=1,2,...,^), благодаря чему следствие из леммы 1 и теоремы за ней сразу дает критерий представимости вектора 6 как линейной комбинации векторов {$у}:
В терминах матриц называемых соответственно основной и расширенной матрицами системы (*), этот критерий выражает Теорема Крон е ке ра—Кап е л л и. Система (*) совместна (имеет решения, непротиворечива) тогда и только тогда, когда ранг ее расширенной матрицы равен рангу основной. Для решения, не только теоретического, но и практического, всех поставленных вопросов очень удобен метод полного исклю- чения неизвестных, который был известен еще в Китае за 2000 лет до н. э. (см. вводную лекцию). Процесс решения ведем на матрице Л6, пользуясь тем, что в силу леммы 3 элементарные операции над строками не меняют линейных зависимостей между столбцами, а значит, и множества решений исходной системы. С помощью процедуры, уже хорошо известной нам по I части (и примененной недавно при доказательстве леммы 4), придадим матрице АЬ вид
с наибольшим возможным т>0*, но теперь в случае т<р не прервем процесс, а, оставив в покое (т+1)-й столбец (верхние элементы которого уничтожать нечем), перейдем к (т + 2)-му, и т. д. В результате получится "ступенчатая" матрица где крестики означают какие-то элементы поля Р (не обязатель- но одинаковые). Если здесь не все 6*^,...,&" равны 0, то система (*) несов- местна — не имеет решений (не только в самом поле Р, но и ни в каком его расширении), ибо такой столбец //Ь* ... Ь*+{ Ь" Ц нельзя получить никаким комбинированием предыдущих (это ясно и из теоремы Кронекера—Капелли). При рассмотрении же случая Ь*+1 =... = Ь*р=0 (к которому мы относим и п = р) во избежание громоздкости записи удобно перестанов- кой столбцов матрицы (что соответствует одинаковой переста- новке слагаемых в левых частях всех уравнений) привести ее к виду * Случай т = О, когда система (*) фактически не содержит А:,, мы не исклю- чаем из общего рассмотрения по следующей причине: если коэффициенты системы — не фиксированные элементы поля, а зависят от каких-то пара- метров, то при конкретных значениях этих параметров некоторые столбцы коэффициентов могут становиться нулевыми без изменений совокупности переменных х] и их нумерации.
Система уравнений, соответствующая этой матрице, эквива- лентна исходной (*) — имеет те же решения; сохраняя в левых частях те неизвестные ^, х^, ..., х^ , которые отвечают столбцам, поставленным на первые п мест, и перенося остальные неизвес- тные в правые части, придавая ей окончательный вид В случае п = д система имеет единственное решение где все я/е Р. Если же п<д, то, придавая переменным х^} , ..., х^ произвольные значения из поля Р (или любого его расшире- ния Р) и, находя для каждой системы значений */я+м ..., х-,, свою систему х/}, х/,, ..., х1п при помощи уравнений (**), мы получим все решения системы (**), а значит, и исходной системы урав- нений (*). Сверху указаны первоначальные номера столбцов. Вторые индексы у элементов матрицы изменены: вмес- то о,*уя+1 пишем просто а,* и т. п.
Полученная матрица, очевидно, удовлетворяет условию сов местности, и ей отвечает система уравнений В качестве примера рассмотрим систему Преобразуем строки ее расширенной матрицы:
равносильная исходной. Придавая "свободным" неизвестным я3, х5 в правой части произвольные значения х3, х$ и находя по ним соответствующие х,,х2, х4, мы получим всевозможные первоначальной системы. решения Если считать, что система была дана над полем (ф, то при всевозможных значениях лг3, *5 € О получатся все рациональные решения системы; придавая же "свободным" неизвестным такие значения, как л/2, тг, / и т. п., мы будем находить решения, образованные элементами расширений <б(>/2), К и С поля О (а почему не просто "принадлежащие расширениям"?). Проверка (проделайте всё сами и разберитесь): Вопросы. 1) Можно ли в рассмотренном примере задать такие целые значения неизвестных х$ и л:5, чтобы х{, х2 и х4 тоже оказались целыми? 2) Всякая ли совместная система линейных уравнений с целыми коэффициентами обладает хотя бы одним решением в целых числах? Примечание. Метод последовательного исключения неиз- вестных (см., например, учебник А. Г. Куроша [1]), принципиаль- но не отличающийся от изложенного, по традиции связывают с именем Гаусса. Исторической несправедливости, однако, в этом нет, поскольку древние китайцы лишь находили неизвестные значения, молчаливо предполагая их существование и единствен-
ность, без какого бы то ни было исследования возможных слу- чаев. Практические рекомендации. Описанный процесс ис- следования системы линейных уравнений удобен с точки зрения теоретического обоснования и легко программируется; однако решение задачи вручную, даже если коэффициенты данной систе- мы — небольшие целые числа, почти всегда приводит к громоз- дким выкладкам с дробными выражениями. Чтобы по возможно- сти этого избежать, можно пользоваться искусственными при- емами — например, с целью упрощения матрицы АЬ совершать над ее строками не только те элементарные операции, которые фигурируют в общетеоретической части. Так, в рассмотренном примере сначала вычтем из нижней строки вторую и третью, из четвертой — утроенную первую, а из третьей — первую и вторую (все эти действия проделаем на одной матрице, чтобы не переписывать ее несколько раз с небольшими изменениями), затем из первой — вторую и удалим строки, состоящие сплошь из нулей, наконец, поменяем местами второй и третий столбцы и завершим процесс так, как описано в теории:
Придавая х2 и л:5 всевозможные значения из 2, получим все целочисленные решения исходной системы (аналогично находятся и все целые комплексные решения). Чтобы не только практически находить решения совместной системы (*), но и теоретически исследовать свойства множества всех ее решений, как цельного алгебраического (а в дальнейшем и геометрического) объекта, надо, наряду с подпространствами, рассматривать в линейном пространстве У(Р) = (У,+, Р) и дру- гие подмножества, вообще говоря, уже не являющиеся подпрос- транствами, но тесно с ними связанные. Пластом П = П(У) пространства У(Р) мы назовем непустое подмножество П с: V, такое, что множество Vп = {*-у^^у€П} всех разностей его векторов образует в У(Р) подпространство*. Это Уп называется направляющим пространством или, короче, направлением пласта П Два пласта П и П' с направлениями одинаковой конечной размерности параллельны, когда УП=УП,, т. е. их направления как множества векторов совпадают. Бинарное отношение парал- лельности пластов фиксированного направления является эквива- лентностью (поскольку равенство УП=УП, — эквивалентность на множестве всех подпространств пространства У(Р)), и ее класса- ми служат сами эти пласты (как множества векторов), так что любые два параллельных пласта либо совпадают, либо не пере- секаются. Поэтому нулевой вектор принадлежит только одному из параллельных пластов — тому, который является своим собственным направлением, а остальные пласты подпространств не образуют. * Пласт часто называют линейным многообразием.
Пусть #0 е П — произвольно выбранный вектор пласта; тогда всякий вектор х е П представляется в виде * = *0 + *, (***) где V = x — x^е Уп, и при фиксированном х0 такое представление единственно, ибо из x^ + V = x^ + V' следует г> = г/. При этом от выбора в (***) вектора х0е П, называемого вектором сдвига или просто сдвигом пласта, множество {x^ + V/Vе Уп} не зависит: если взять другой л:'0е П, то, ввиду #0 — л:'0е Уп, из x = x^ + V с г;е Уп будет следовать x = x'^+V' с V' = V + (*0 — х'0) е Уп, и на- оборот. Из всего сказанного ясно, что пласт П совпадает со своим направлением Уп тогда и только тогда, когда сдвиг л:0 принадле- жит Уп или, что равносильно, когда в качестве сдвига может быть взять вектор *'0=0. Размерность сНтП пласта П есть, по определению, размер- ность сПтУп его направления; она, вообще говоря, не равна рангу гп^П, а точнее, ибо в силу (***) все векторы П линейно выражаются через векторы множества Уп У {л:0}, в котором сам #0 не выражается через Уп тогда и только тогда, когда #0 ё Уп. Геометрическая иллюстрация. Как мы уже знаем, в обычном (точечном) трехмерном евклидовом пространстве Е3 век- торы — направленные отрезки (или упорядоченные пары точек), рассматриваемые с точностью до парал- лельного перенесения (см. [8]), — образу- ют над полем Е линейное пространство V3; пусть М с V3 — какое-то множество его векторов. Если зафиксировать точку О е Е3 и все векторы М откладывать от нее, то их концы образуют точечное множество МсЕ3, называ- емое годографом М. Ясно, что годограф одномерного пласта — прямая линия, а годограф двумерного пласта — плоскость. Когда пласт является в V3 подпространством, его годограф (прямая
или плоскость) проходит через точку О. (А каковы годографы всего V3 и множества {0}?). Различие между размерностью и рангом пласта весьма нагляд- но. Геометрическая прямая всегда одномерна (ведь не может же размерность прямой измениться от того, что ее перенесли!), но ранг множества радиусов-векторов ее точек равен 1 лишь тогда, когда она проходит через точку О — иначе в этом множестве за- ведомо есть два линейно независимых вектора. А в случае плос- кости (двумерной), не проходящей через О, таких векторов мож- но найти даже три. Возвращаясь к системе (*) линейных уравнений, в общем случае называемой неоднородной, рассмотрим соответствующую ей однородную систему которая получается заменой всех правых частей нулем поля Р; первая равносильна одному матричному уравнению А-х = Ь, (1) вторая — уравнению
Решения систем (*) и (*0) нам удобно сначала рассматривать над тем же полем Р, которому принадлежат коэффициенты и свободные члены, т. е. решениями уравнения (1) или (2) пока будут служить элементы линейного пространства М^(Р)*. Теорема 1. Множество V = Щ (Р, Л) всех векторов-реше- ний однородного уравнения (2) образует в Щ подпрост- ранство, а множество П всех решений неоднородного урав- нения (1) — пласт направления V. Доказательство. Если х{ и х2 — решения уравнения (2), а а е Р, то А • (*! + х2) = А • х{ + А • х2 = 0 + 0 = О, Л-(ах1) = а-(Л-х1) = а-0 = 0, т. е. х{ + х2 и а*! — тоже решения уравнения (2), в силу чего всё их множество образует подпространство УсМу(Р). Если, далее, х\ и х2 — два решения уравнения (1), то их разность удовлетворяет уравнению (2): А.(х'1-х'2) = А-х'1-А-х'2=Ь-Ь = 0, т. е. я'-л^еУ; поэтому множество П всех векторов-решений уравнения (1) является в М/(Р) пластом направления V. Пространство Апп(Л) = М* (Р, Л) с М* (Р) решений уравнения (2) называется аннулятором матрицы Л. Из теоремы 1 следует, что общее решение уравнения (1) — множество всех его реше- ний — представляет собой сумму его частного решения #0 и общего решения уравнения (2), т. е. имеет вид ' * = *о + Ь1/1+Ь2/2+..- + Ь,/,, (3) где векторы /^ образуют базу пространства Апп(Л), их число г = сПтАпп(Л), а параметры А,1э А,2, ..., А,л могут принимать любые * Но не элементы самого Р (если только ^=^=1); поэтому мы и говорим о решениях над Р, а не в Р.
значения, причем от выбора конкретного сдвига *0 е П и конкрет- ной базы {/^} в аннуляторе множество {х/А-х = 0} не зависит. Если значения параметров А,А брать из какого-то расширения Р поля Р, то формула (3) при прежних А:О и /А даст все решения над этим расширением, поскольку с самого начала можно было считать, что уравнение (1) задано над полем Р (а так как эле- менты матрицы А и вектора 6 на самом деле взяты из подполя Р с Р, то найденные векторы х0 и /^ оказываются над тем же Р автоматически). Поэтому весьма удобное соглашение о том, чтобы искать решения уравнений (1) и (2) над тем же полем, над которым даны эти уравнения, не умаляет общности задачи. Теорема 2. сНтАпп(Л;) = д-гп§(А^). Доказательство само собой получится при нахождении в пространстве Апп(Л^) базы /,, /2, ..., /м называемой также фунда- ментальной системой решений уравнения (2), т. е. системы (*0). Применение к последней метода полного исключения неизвест- ных дает равносильную систему число уравнений которой п = т%А (почему?). Придавая "свобод- ным" ^ — п неизвестным в правой части системы значений
получим ^ — п решений и, записав их в виде {/-столбцов, соста- *,Ч вим из них матрицу X^-п, ранг которой равен ^ — п из-за нали- чия единичной подматрицы Ед__п (порожденной /я + 1-й, /я + 2-й, •••» /^-й строками и всеми столбцами). Эти п — ^ столбцов и будут векторами /^ базы, так как, во-первых, они линейно независимы, а, во-вторых, всякое решение х0 = //х{ х2 ... Хд // системы (*0) представляет собой их линейную комбинацию, именно *0 =^^+^2/2+- + ^/^' что проверяется по всем ^ строкам: для /я + 1-й, /я + 2-й, ..., /я-й строк это тривиально, а для остальных ^ — п строк обусловлено тем, что коэффициенты л:,, х2, ..., ^ линейной комбинации удовлетворяют уравнениям (**0). Таким образом, найдена "наиболее простая" фундаментальная система; можно при надобности получать и другие, беря в каче- стве (д — п) х (д — я)-матрицы и находя из (**о) соответственно
вместо единичной любую невырожденную. Поскольку число г векторов базы пространства Апп(Л) равно ^ — п, где я = гп^Л, установлено и равенство теоремы 2. Проиллюстрируем сказанное на обоих вариантах решения пре- жнего числового примера. В первом варианте конкретная систе- ма (*) и соответствующая однородная (*0) приводятся к виду полагая в левой системе хг = хь = 0, находим сдвиг 2 10 л:0 = // - - 0 5 0 // ; из правой же системы при х3=1 и хь = О 33 II получаем вектор [{ = // - - - 1 0 0//, а при хг = 0 и хь= 1 — 15 33 вектор /2=//- - 0-21//; общее решение л: = л:0 + Х1/1 + Х2/2 о о неоднородной системы, таким образом, запишется в виде Во втором варианте неоднородная и однородная системы при- водятся соответственно к виду
откуда на этот раз получаем уже сдвиг д^ = //-4 0 10 5 0// и базу аннулятора /; = //1 1 -3 О О//, Г2 = //2 0 -5 -2 1// так что общее решение х - х^ + АД' + А,^' в расписанном по строкам виде будет Из теории следует, что системы равенств (4) и (4') определя- ют в пространстве М^(0) один и тот же пласт П; предлагаем читателю убедиться в этом непосредственно: приравняв правые части равенств, показать, что А,1э А,2 однозначно выражаются через А,[, А^ и наоборот. Из первого утверждения теоремы 1 и из теоремы 2 вытекает Следствие. Однородная система линейных, уравнений имеет нетривиальные решения тогда и только тогда, когда ранг ее матрицы меньше числа неизвестных', тем самым устранен пробел в конце I части. Что же касается целочисленных решений неоднородных уравнений и систем над кольцом 2, то такого рода вопросы, связанные со свойствами делимости, относятся к теории чисел и в курсе алгебры встреча- ются лишь эпизодически, а до создания общей теории линейных систем над произвольным кольцом (даже ассоциативно-коммута- тивным с единицей и без делителей нуля) еще очень далеко. Упражнения. 1. Можно ли разменять рубль только 3-копе- ечными и 15-копеечными монетами? 2. Пусть А = А? е М^(2) — матрица с целочисленными элемен- тами, причем г=д —гп^Л>0. Покажите, что а) в пространстве Апп(Л) имеется база /1э /2, ..., /л из цело- численных векторов (т. е. с элементами из 2);
б) не всякое целочисленное решение #0 уравнения А-х = 0 можно представить в виде А,^ + А,2/2 +... +А,Л/Л с целыми в) но зато при некотором т е Ъ (зависящем от #0) вектор т*0 такое представление допускает; г) а существует ли такое т, не зависящее от *0 ?
ПОЛИЛИНЕЙНЫЕ ФОРМЫ И ОПРЕДЕЛИТЕЛИ Пусть У = У(Р) — линейное пространство над полем Р. Линейной формой на V называется функция /:У—>Р, удовлетворяющая условиям Г(х + у) = Г(х) + 1(у) и /(о*На/(*) (Ь) при любых х, уе V, ае Р*; отсюда, взяв произвольный хе V, сразу получаем: /(0) = 1(0-х) = 0- !(х) = 0, /(-*) = /(-/ •*)=-/• /(*) = -/(*). Если пространство V обладает базой А = {а/у е /}, то всякий вектор хе V допускает однозначное представление х = х{а{ + х2а2 +..., где среди элементов х/ е Р — координат вектора в данной базе — не более конечного числа отличных от нуля. Из (Ь) сле- дует, что /(*) = х1[(а[) + х2[(а2) + ... = Ц*! х2 ...|| - //!(а{) /(а2) ...//. (Г) Функция Р\ V" —> Р от п аргументов, т. е. Р(х{, х2, ..., хп), или, в других формах записи, /7(..., д^_1э дср дс! + 1, ...), /г(..., дс;, ..., дсй, ...) и т. п., называется п-полилинейной (или просто полилинейной) формой на V, если она линейна по каждому аргументу при фик- сированных значениях остальных, т. е. /7(..., *,_!, Х + у, Х^{, ...) = = /7(..., *,._!, х, х| + 1, ...) + Т7!..., ^_!, г/, х1 + 1, ...) и /7(..., ^_ь ал:р х| + 1, ...) = аР(..., х^ъ х-„ х/ + 1, ...) при любых хъ х2, ..., А:, ^, ..., хп е V (/=1,2,..., п) и а е Р. Как и для 1-линейной формы /, получаем Р(х^ ..., О, хя, ...) = 0 и /^(х!, ..., — хм ..., хя) = — ^(х,, ..., хр ..., хп). В базе А при х1 = х1{а{ + -\-хаа<2 + ... прежнее (для п=\) координатное выражение теперь принимает общий вид * Название "линейная функция" для такой / мы считаем менее удачным, по- скольку оно уже давно утвердилось за функцией }(х) = Ьх + Ь, которая при ЬФО не удовлетворяет условиям типа (Ь).
суммирование формально ведется по всевозможным системам п чисел /!, /2, ..., /л е М, но на самом деле даже в случае бесконеч- ной базы А сумма может содержать лишь конечное число нену- левых слагаемых (почему?), а для конечномерных пространств V это число, очевидно, не превосходит (сИтУ)". Весьма важную роль в линейной алгебре играют совершенные полилинейные формы, принимающие значение 0 всякий раз, когда значения каких-либо двух аргументов совпадают. Такая форма является антисимметрической, или кососимметрической в сле- дующем смысле: при перестановке между собой значений любых двух аргументов значение формы переходит в противоположный элемент поля Р (а почему не сказать просто: "меняет знак"?). В самом деле, из первой части определения полилинейности формы Р следует /Ч'..., х + у, ..., х + у, ...) = /г(..., х, ..., х, ...) + + /=•(..., *, ..., у, ...) + /=•(..., у, ..., *,...) + /Ч..., у, ..., у, ...), а так как, ввиду ее совершенства, /г(..., * + */, ..., х + у, ...) = = /?(...,х,...,х,...) = /7(...,у,...,у,...) = 0, то УЧ...,*, ...,*/,...) = -/4...,*/,...,*,...). Лемма 1. Ясли Т7 — совершенная п-линейная форма на V, а векторы х}, я2, ..., хп линейно зависимы, то ( « о о Л Л *,, х2, ..., хя =0. Действительно, пусть, например, х} = Х2 х2+... + А,я А:, (А,2, ..., А,я € Р); тогда /^ о "\ ^А ( о А Т7 А:,, л:2, ..., А:Л = Х^77 */' Х2. -. ^ = О, V ) *-2 V У ибо, ввиду совершенства формы Т7, второй множитель каждого слагаемого — нуль поля Р.
Следствие. Если яхНтУ, то Р(х{, х2, ..., хп) = 0. Поэтому в дальнейшем мы всегда будем предполагать, что число аргументов совершенной полилинейной формы на про- странстве V не превосходит его размерности. Тривиальный пример формы, тождественно равной нулю, по- казывает, что утверждение, обратное лемме 1, в общем случае не имеет места. Однако справедлива Лемма Г. Если совершенная п-линейная форма Р на V, где п = А\тМ, отлична от тождественного нуля, а векторы *,, х2, ..., хп е V линейно независимы, то /ч х{, х2, ..., хп ^ 0. Действительно, в данном случае систему векторов {х1} можно взять за базу пространства V, а из р(%}, х2, ..., хп ]= 0 в силу (Р) следовало бы, что Р(хъ хъ ..., хп) = 0. Случай п = А\тМ имеет особое значение. Тогда сумма в (Р) содержит п\ слагаемых, отвечающих всевозможным перестанов- кам /ь /2, ..., /л индексов 1, 2, ..., п, и ее можно упростить, с тем чтобы значение формы Р везде было Р(а{, а2, ..., ая); для этого последовательными транспозициями — обменом места- ми — пар элементов, стоящих рядом, сначала переведем на пер- вое место тот вектор ау- , индекс которого /л = 1, затем на вто- рое — тот, индекс которого равен 2, и т. д. Каждая транспози- ция влечет появление перед Р множителя —/, и надо теперь выяснить, для каких исходных перестановок /ь /2, ..., /я резуль- тирующее произведение этих множителей будет /, а для каких —/. Вместо перестановок самих пронумерованных векторов удоб- нее рассматривать перестановки их индексов. Назовем опережением ^(/^ /2, ..., /„) элемента и в перестанов- ке количество тех ее элементов, которые, превосходя и, располо- жены, однако, раньше этого числа, а опережением
самой перестановки — сумму опережений всех ее элементов. Перестановка называется четной или нечетной, смотря по тому, четно или нечетно ее опережение. Лемма 2. Если Р — совершенная п-линейная форма на пространстве V размерности п, то при любых *!, #2, ..., хп е V и любой перестановке гь/2, ••-,*„ индексов Доказательство. Так как в перестановке /!,/2, ...,/„ все числа, предшествующие ^=1 (если они есть, т. е. ^=^1), заве- домо больше 1, то при постепенном перемещении этой единицы на первое место совершится с1{(11у /2, ..., 1п) транспозиций, и у полученной перестановки будет уже ^ = 0, а опережения Й2, ...,йл останутся прежними (почему?); затем, после перемеще- ния числа 2 на второе место, т. е. в результате Й2(/,, /2, ...,/„) транспозиций, получим перестановку с Й1 = й2 = 0 и прежними Й3, ..- &п\ и т. д. В итоге, проделав в общей сложности (1(1^ 12, ..., 1п) транспозиций, придем к натуральному порядку 1, 2, ..., п — перестановке, для которой я? = 0. Поэтому (—/)</ = / или —/ в зависимости от того, четна или нечетна исходная переста- новка. Благодаря этой лемме формула (Р) принимает вид Р(х„ х2, ..., лО = (ХН)" '*'/• **ь -^)/7(а1' ^' - а*)' (П где й = й(/1, /2, ..., /„), а суммирование распространяется на все п\ перестановок чисел 1,2, ..., п. Множитель перед Р в правой части называется определителем, или детерминантом * я-го порядка матрицы и обозначается * В русской литературе уже прочно утвердился термин "определитель", но ино- язычным тоже стоит иногда пользоваться, например, при ссылке на "опреде- ление детерминанта", дабы избежать оборотов вроде "масло масляное маслом помасленное".
он представляет собой функцию от матрицы т. е. или, что равносильно, от п2 аргументов х^е Р, с!е1: М^(Р) -> Р (с1е1: Р" -> Р), независимо от конкретного про- странства У(Р) и выбора в нем базы А. Таким образом, хотя все свойства детерминанта матрицы в принципе вытекают только из его "чисто арифметического" определения во многих случаях целесообразно рассматривать с!е1 как функ- цию с!е{: V" —> Р, выбирая пространство У = У(Р) и его базу А из соображений удобства. Из (О) сразу следует свойство предоставим читателю доказательство более общего утвержде- ния: определитель каждой из двух "треугольных" матриц равен произведению хпх22 ••- хпп элементов главной диагонали. Другое важное свойство, тоже выводимое только из (О), состоит в том, что если матрицу X транспонировать, т. е. сделать ее строки столбцами и наоборот (см. задание в конце I части), то
определитель полученной матрицы X1', как функция от п2 аргу- ментов, будет тождественно равен определителю исходной: или докажем это. Так как в (О) суммирование ведется по всем перестановкам чисел 1,2, ..., я, то в каждом из п\ произведений *,Л *2/2... х^ всякие два сомножителя принадлежат разным строкам и разным столбцам матрицы Х\ то же справедливо и для каждого произ- ведения *Л 1, х/з 2 ... */и>л аргументов матрицы X1'. Если во втором произведении последовательными транспозициями соседних со- множителей перевести я,-, на /,-е место, А:у.,2 — на /2-е и т. д., то получится произведение лс1Л| л:2*2... хя^ , тождественно равное исходному, с некоторой перестановкой йь Й2, ..., й„ вторых ин- дексов; для приведения последней к 1, 2, ..., п достаточно было бы проделать в обратном порядке ту же последовательность транспозиций соседних элементов, которая перевела 1, 2, ..., п в /!, /2, ..., /„, поэтому </(*!, *2» •••»*„) = <*(/!» /2» -••>/„)*. Таким обра- зом, между слагаемыми в суммах, определяющих с!е1^ и ёеПС7, установлена биекция, при которой не только тождественны соот- ветственные произведения, но и одинаковы множители вида (—1)* перед ними. Благодаря этому свойству, любое утверждение относительно столбцов определителя Ае1Х (точнее, матрицы X) справедливо и для его строк, и наоборот; имея в виду несколько столбцов или несколько строк, можно говорить о параллельных рядах, а свой- ства, в которых фигурируют такие ряды, выводить, например, только для столбцов. Пользуясь свободой выбора пространства V (над заданным полем Р) и его базы, назначим на роль У(Р) пространство я-столбцов М^(Р) со стандартной базой * Советуем читателю ознакомиться с весьма образной "геометрической" интер- претацией этого факта, предложенной Г. Е. Шиловым ([2], §1.3 и §1.4).
в которой координаты вектора совпадают с его элементами; тог- да равенство (Р') примет вид Р(8{,8ь...,8п) = (йе1Х)'Р(е{,е2,...,еп), где 5|,52,..., 5Я — столбцы матрицы X. Отсюда следует, что если вообще есть совершенная полили- нейная форма Т7: М|*(Р)-> Р, удовлетворяющая начальному усло- вию Р(е{,е2,...,еп) = 1 (Е) (и, значит, отличная от тождественного нуля), то это может быть только ёеЦГ. Чтобы эту единственную возможность превра- тить в действительность и пользоваться равенствами (Ы* = (1е№ = /Ч*,, 52, ..., а„) = Р(г{, г2, ..., гп) (ОР) для вывода дальнейших свойств определителей из свойств совер- шенных полилинейных форм, осталось показать, что сам опреде- литель, как функция столбцов {$у} матрицы X (а значит, и ее строк {г,}, т. е. столбцов матрицы ^т), воистину является такой формой и удовлетворяет условию (Е) *. Последнее сразу следует из свойства 1, а линейность йе1Х по каждому столбцу — из того, что столбец имеет во всех произве- дениях х1л х2]_2... хп]п выражения (О) ровно по одному представите- лю. Несколько сложнее проверяется лишь совершенство, и здесь нам будет удобнее показать, что йе1Х = 0, если матрица Х = \хч^ содержит две одинаковых строки. Итак, пусть х^ = х^ при некоторых / и /г (1</<&<п) и всех /=1,2, ..., п. Выделим в сумме (О) пару слагаемых вида * Это доказательство должно основываться только на определении (О), без использования свойств формы Р (почему?); считать его излишним — такая же логическая ошибка, как, например, установив (см. I часть), что решением уравнения а * х = Ь в группе может быть только элемент х = а~1*Ь, опус- тить затем проверку того, что этот х действительно удовлетворяет уравне- нию.
в силу равенства 1-й и /г-й строк матрицы эти слагаемые разли- чаются только множителем (—7)^-) и в сумме дают 0, ибо, как мы покажем, опережения <!(...) в них имеют разную четность. А так как все п\ слагаемых суммы (О) можно распределить по парам указанного вида, то равенство Ае[Х=0 будет справедливо. Перестановки /,, ...,/,, ...,Д, ...,/„ и /,, ...,/Л, ...,/,., ...,/„ получаются друг из друга транспозицией элементов /, и /Л, что меняет четность перестановки: в самом деле, если й = /+1, т. е. эти элементы стоят рядом, то, очевидно, и в обоих случаях д,1г (...,/*,//,-••)= ^у, (•••»//»/*»•••) ПРИ г=^*> &> поэтому й(..., Д, /,, ...) = с?(...,/,, Д, ...)± 1; если же между /, и /Л расположено т элементов, то транспозиция этой пары осуществ- ляется 2т +1 транспозициями пар соседних элементов (как?), из-за чего опережение с!(...) меняет свою четность нечетное число раз. Доказательство закончено *. Ради простоты формулировок можно говорить об элементах, строках и столбцах определителя, когда под ним понимается таб- личное выражение для йе!^, а не результирующий элемент поля. Из (ОР), совершенства формы Р и свойства 2 сразу получаем 3. От транспозиции двух, параллельных, рядов определи- тель "меняет знак", т. е. переходит в противоположный эле- мент поля. * Доказанное здесь общее утверждение, что транспозиция любых двух эле- ментов переводит четную перестановку в нечетную и наоборот, важно не только для теории определителей: см., например, теорию групп подстановок в III части.
Полилинейные формы и определители го\ А используя еще леммы 1 и Г, приходим к выводу: 4. Если определитель равен нулю, то в нем как строки, так и столбцы линейно зависимы: "наоборот", если зависима хотя бы одна из этих, двух, систем рядов, то определитель равен нулю *. В частности, определитель, содержащий ряд из одних, нулей или два одинаковых, параллельных, ряда, равен нулю **. Следо- вательно, матрица является вырожденной, т. е. гп%Х<п, в том и только том случае, если йе\Х = 0. Столь же непосредственно получается свойство 5 (линейность определителя относительно любого ряда): ' Здесь второе утверждение А V В => С сильнее, чем А & В => С — обратное для первого, так как обладает более слабой посылкой. Другой яркий при- мер: у равных векторов равны соответственные координаты в любой базе, но равенство координат в какой-нибудь базе уже достаточно для равенства векторов. Вообще со словом "наоборот" надо обращаться осторожно, как явствует из фразы в одном школьном сочинении: "На берегу женщина до- ила корову, а в воде всё отражалось наоборот". '* Широко известное рассуждение "при транспозиции двух одинаковых парал- лельных рядов определитель, очевидно, не меняется и в то же время дол- жен изменить знак, следовательно, он равен нулю" теряет силу для полей Р характеристики 2.
в частности, общий множитель любого ряда можно вынести за знак определителя. Следовательно, если Х=\х~\п и А,е Р, | Ч 1п то (Ы(АЛГ) = А," • (ЫЯ. Из всего сказанного выше уже вытекают свойства определи- телей второго и третьего порядка, выведенные геометрическим путем в векторной алгебре (разделе аналитической геометрии). Но если правило Саррюса по сути является лишь перефразиров- кой определения детерминанта для случая я = 3, то при п > 3 непосредственное вычисление с1еУ^ по формуле (О), вообще гово- ря, весьма трудоемко, и использование свойств 1—5 может суще- ственно упростить процесс. Не приводя здесь конкретных число- вых примеров (это следует сделать на практических и лаборатор- ных занятиях), отметим лишь, что установленные свойства позволяют без изменения значения определителя (как элемента поля Р) преобразовывать его табличное выражение (т. е. факти- чески матрицу X) с тем, чтобы в нем появилось как можно больше нулей, например придать ему один из "треугольных" видов (см. "довесок" к свойству 1), еще до ознакомления с тео- ремой Лапласа и ее особо важным частным случаем — разложе- нием определителя по элементам ряда, которые мы рассмотрим немного позже. 6. йеЦХ-У) = (йе1Х)-(№У). Доказательство. Так как гп^(^- V) < гшп{гп§^, гп^У} (вторая теорема раздела "Пространства, связанные с матрицей"), то в случае с1е1У = 0, т.е. гп%У<п, также гп§(Х-У)<п, Ае{(Х-У) = 0 и доказываемое равенство тривиально. Пусть теперь Ае{УфО, значит, У — невырожденная матрица. Линейно незави- симую систему У = {#„02, ...,*/„} ее строк (г/у = ||г/;1 у# ... #Д / = 1, 2, ..., п) можно принять за базу пространства М),(Р), поэ- тому Ае1У = Р(у{,у2, ...,*/„), где Р — совершенная я-линейная форма, удовлетворяющая усло- вию (Е), в котором теперь в, = ||/ 0 ... 0||, ег-\]р 1 ... 01 .... ея = ||0 0 ... /||
— стандартная база этого пространства. Строки г,, г2,..., гп мат- рицы Х-У раскладываются по базе V следующим образом: что и требовалось. В то время как при умножении матрицы на матрицу, согласно определению этого действия, должен соблюдаться порядок "стро- ки на столбцы11, умножение определителей можно, благодаря свойству 2, производить любым из четырех способов: "строки на строки", "строки на столбцы", "столбцы на строки", "столбцы на столбцы". 7. Если матрица X = '\х..Т имеет квазидиагональный вид: где главные диагонали квадратных подматриц Х1, Х2, ..., Х1 (2 < 1 < п) вместе составляют главную диагональ матрицы X, а все элементы вне этих подматриц равны нулю, то йе1Х = (йе1Х{)(йе1Х2) ... (йеЩ). Это можно при достаточно натренированном комбинаторном мышлении сразу получить из определения (О), но легче для восприятия провести доказательство в случае / = 2 (а нам только он и понадобится в теореме Лапласа), предложив читателю уже отсюда вывести по индукции результат для любого /.
Итак, пусть В выражении (О) для Ае1Х отличаться от нуля могут лишь такие слагаемые, в которых /,, ..., /Л е {1, ..., /г}, а /Л + |, ..., /я е € {/г + 1, ..., я}, поэтому сумму можно представить как двойную: <1е1* = X Е НУЧл-**.л •**н/+1-*|../.' (Л •-,/*) (А+1 ,".,/„) где й? = с?(/,, ..., Д, /л+|, ..., /„), внешнее суммирование ведется по всем /г! перестановкам чисел 1, ..., /г, внутреннее — по всем (я — /г)! перестановкам из /г+ 1, ..., я, в произведениях элементов матрицы X первые /г сомножителей принадлежат подматрице Х{, а следую- щие п — Ь — подматрице Х2\ при этом количество опережений ^ = ^, + ^2, где ^1 = ^(/1, ...,/*) и ^2 = <*(/'*+ 1» ...,/'„), поскольку ника- кое из чисел первой группы не превосходит никакого числа второй, так что (-/у* =(-/)* -(-У)^ . Отсюда с!е1^= ХН)^1,,-^' X Н^хм^...х^=(йе\Х{)(^1Х2). (Л--/*) (У* + 1-•-/«) Минором, а точнее, минором порядка Ь, или Ь-минором матри- цы Л" = |л;/.|Г (1<й<дг) называется определитель ее квадратной подматрицы, порожденной /,-й, г'2-й, -.., ^-й строками и /,-м, /2-м, ..., Д-м столбцами, где 1 < /, < /2 < ••• < ^^ ^, ^ ^]\<]2<---<1^-п- Из теоремы 2 раздела "Пространства, связанные с матрицей", по свойству 4 определителей получаем: ранг матрицы равен наибольшему порядку ее отличного от нуля минора,
а обозначение минора с указанием номеров порождающих его рядов матрицы имеет вид М = М^''^(Х) или просто М = Щ^'^1 ; при /г < п дополнительным для этого минора назы- вается (п — /г)-минор М = М1^'"^ , порожденный теми рядами мат- рицы X, которые не участвуют в формировании М, при прежнем порядке взаимного расположения их элементов (образно: М получается из X вычеркиванием строк и столбцов, порождающих минор М). Теорема Лапласа. Пусть в матрице выделены Ь<п строк с номерами, удовлетворяющими условию 1 < /, < 12 < ... < I* ^ п. Тогда й*Х = Ъ(-1)''*.1#^(Х).^^(Х). где /л =/, + 12 + ... + *'*, Л в/1 +/2 + ... + /'*, а суммирование Е ведется по всем системам номеров /',, /2, ..., /л столбцов, удовлетворяющим условию 1 </, </2< ... </л < дг. То же равенство справедливо, если в матрице X первоначально выделены /,-й, /2-й, ..., /л-й столбцы, а суммирование ведется по всем системам номеров строк, удовлетворяющим условию 1 < г'| < /2 < ••• < ^ ^ я- Доказательство. Свойство 2 определителей позволяет ог- раничиться доказательством первого утверждения. Сумму произ- ведений миноров на дополнительные и на множители ±1 спере- ди, т. е. схематически ^(-/)7*+У* -М - М, можно рассматривать как функцию /7 = /г(51, 52, ..., 5Я) столбцов матрицы X, и для дока- зательства равенства /г = с!е1Л' достаточно проверить, что эта функция — совершенная полилинейная форма на пространстве М|ЧР), удовлетворяющая условию (Е). Пользуясь свойством 7, запишем произведение в виде одного определителя п-го порядка:
где в табличной записи матрицы и ее определителя под М и М понимаются не сами миноры как элементы поля Р, а те подматрицы (порядка Ь и п — &), определителями которых они служат. Переста- новками первой строки на /,-е место и т. д. и аналогичными переста- новками столбцов мы с помощью (1{ — 1) + (12 — 2) + ... + (^ — К] + + (/.-1) + (/2-2)+ ... +(/*-*) = /* + /*-2(1+2 + ... + Л) транс- позиций преобразуем нашу квазидиагональную (с / = 2) матрицу в такую Х(М), которая получается из исходной X заменой нулями всех элементов, не принадлежащих ни М, ни М. Поэтому (_/)'*+'*М>М = (_/)2('*+/*Ь2(1+2+...+*) ^е!Х(М) = с!е1 Х(М) и /Чз,,^, ...,$„) = 1с1еЩМ), где М = М1;*""* (X). ]\,]ч,—,1ь >• 7 Из этой записи сразу получаются все требуемые свойства функции Р', остановимся на наименее тривиальном моменте — доказательстве совершенства формы Р. Пусть $,- = 5^ при каких- то /, т е {1, 2, ..., п}, 1 <т. Тогда все те слагаемые, в которых либо \<1<Ь & \<т<Ь, либо /г+1</<я & Ь+\<т<п, рав- ны нулю из-за наличия двух одинаковых столбцов, а остальные слагаемые можно сгруппировать по парам вида <1еЩЛ1) + с!еЩЛ1), где Х(М) — матрица, полученная из Х(М) транспозицией 1-го и т-го столбцов, в силу чего каждая такая пара дает нуль. Теорема доказана. Особо важную роль как в теории, так и при фактическом вычислении определителей играет частный случай теоремы с &=1. Тогда для "одноэлементного минора" М] = хц и дополни- тельного к нему минора М] порядка п — 1 получаем формулы разложения определителя: п _ (1е1* = ^(-/)/+/*/уМ; _ по 1-й строке, У=1 п (1е1Я = ^(-/)|+\М; _ по /-му столбцу.
Произведение Х^ = (-1)1*1 М^ — "минор со знаком" — называ- ется алгебраическим дополнением (или адъюнктом) элемента Хц в матрице X, и разложениям АегХ по строке и по столбцу можно придать вид йе1Х = 5>Л-!><Л (*) /=1 /=1 (/, /= 1, 2, ..., я), откуда следует свойство 8. Сумма произведений элементов ряда матрицы на их ал- гебраические дополнения равна определителю матрицы, а сум- ма произведений элементов ряда на алгебраические дополнения соответственных элементов другого параллельного ряда равна нулю, так как во втором случае эта сумма дает определитель с двумя одинаковыми параллельными рядами (объясните, почему). Первая часть широко используется не только в теории, но и при фактическом вычислении определителей, а блестящим примером применения обеих служит вывод явных формул для решения сис- темы с невырожденной матрицей Л = ||а/у.|| Именно, умножая эти урав- нения на алгебраические дополнения Ду элементов у'-го столбца (/= 1, 2, ...., п) и складывая, получим О • *, + ... + 0 • *,-_, + А • X; + 0 - х/+, + ... + 0 • хп = Ду, где Д = с1е1у4, а Ау — определитель матрицы, полученной из А заменой /-го столбца столбцом //и, Й2 ••• ЬПЦ свободных членов. Так как Д=^0 (почему?), то ху = Ау/А, т. е. решением данной системы уравнений может быть только столбец //х\ х2... хп //е М"(Р) элементов *у=Ду/ДЕР, или, в разверну- том виде.
(формулы Крамера). Непосредственно проверить, что найденные элементы действительно удовлетворяет системе, полезно как упражнение, но в принципе излишне, поскольку существование (и единственность) решения х = А~1-Ь уравнения А х = Ь с невырожденной матрицей А уже установлены в конце I части книги. Заметим кстати, что в общем случае вычисление опреде- лителей А и Ау- — не менее трудоемкий процесс, чем нахождение обратной матрицы Л-1; впрочем, запись ее в виде ||Лу/||/сЫЛ (проверьте!) имеет большое теоретическое значение. Займемся теперь вычислением некоторых определителей специ- ального вида, часто встречающихся не только в алгебре. 1. Пусть элемент хг8 в матрице X — изолированный, т.е. все остальные элементы в г-й строке и в 5-м столбце — нули; разла- гая определитель такой матрицы по любому из этих двух рядов, получим сЫ* = *гдг5=нгчАг- В частности, при 5 = г будет Ае1Х = хггМг, откуда следует, что при наличии в матрице нескольких изолированных диагональных элементов д^,...,д^, где 1 </<... <Ь < п — 1, как упражнение предлагаем вывести этот результат непосред- ственно из теоремы Лапласа.
вычтем в первой его записи из п-и строки (п — 1)-ю, умноженную на я,, в полученном определителе вычтем из (п— 1)-й строки (п — 2)-ю, умноженную тоже на я,, и т. д., а после этого (я — 1)-кратного применения свойств 4 и 5 разложим определи- тель по первому столбцу и из оставшегося определителя (п— 1)-го порядка (при остальных будут нулевые коэффициенты) вынесем общий множитель х2 — х{ элементов первого столбца, множитель х3 — х{ элементов второго, ..., множитель хп — х{ эле- ментов (п— 1)-го столбца: Действуя аналогично с определителей У(х2, хг, ..., хп) порядка п — 1 и т. д. и учитывая, что 2. Для нахождения определителя Вандермонда
окончательно получаем: У(Х1,х.2,...,хп)= П (*>-*,} \<1<1<П Следовательно, определитель Вандермонда отличен от нуля тогда и только тогда, когда все я,, х2, ..., хп различны. 3. Определитель матрицы А 4- хЕ, где А = \а1{ ^ и Е = Епп — матрицы из М^(Р), представляет собой многочлен п-й степени от переменной х\ для нахождения его коэффициентов применим общее определение детерминанта (О) к случаю, когда ^ = 0^ + 5^, где \1 при I - /, /Л „ ч 5 = \ (дельта Кронекера): 4 [0 при I * \ (1е1 !а, + 6^[ = ХНУ К +^4"(ач +5"^); перемножение двучленов в каждом из п\ произведений дает 2п слагаемых, а вся сумма после полного раскрытия скобок содержит 2" • п\ слагаемых; их теперь будем группировать по степеням х. Рассмотрим сумму тех слагаемых, которые возникли при фикси- рованном выборе п — Ь первых и & вторых членов из перемножа- емых двучленов. В одном крайнем случае & = 0 она сводится к единственному члену х*, при другой крайности Ь = п равна с1е1Л, в промежуточных же случаях 1 <Ь<п— 1 ввиду равенства (**) при- мера 1 равна М^-*(Л)-х*, где /,, ..., /Я_Л — номера тех двучленов,
из которых при перемножении были взяты первые члены. Обозна- чив через а* сумму всех (^) диагональных миноров /г-го порядка матрицы Л, окончательно можем написать Ае1(А + хЕ) = хп + а,*" -' + с2хп ~2 + ... + а„ _ {х + а„, где а„ = с!е{у4, а а, = ап + а22 +... + апп называется следом (1гЛ, или 5рЛ) матрицы А. 4. Пусть А(х) = |1а.;. 4- х [ , Л = Л(0) = |а/у|[ , а Л/у — алгебраичес- кие дополнения элементов а^\ найдем Де1А(х). Пользуясь линейностью определителя по столбцам и тем, что определитель с двумя (и более) одинаковыми столбцами (в дан- ном случае вида //х х ... х// равен нулю, получаем разлагая каждый из определителей суммы по элементам столбца //х х ... х// и вынося х за знак суммирования, приходим к фор- муле
4'. В частности, если все 5 (упражнение). Показать, что йе! ||а,. 4- Ъ{ |[ = 0 при п>2. 6 (упражнение). Доказать, что если йе1Х% = 0, то при всех /, . А| | -Л-10 •'Ми -Л| I -А-О! -А„1 / /, и, /: - »= 12 =...= ^._ и Л1= 2.=... = -^1 (если равен ЛЛ1 ЛЛ2 ЛЛя Л1/ Л2/ Ля/ нулю какой-то знаменатель, то нулем должен быть и соответ- ствующий числитель). Историческая справка. Системы нескольких линейных уравнений с тем же числом неизвестных решали последователь- ными исключениями еще в древнем Вавилоне и Китае, но в слу- чаях несовместности или неопределенности системы вплоть до конца XVII века ограничивались замечанием, что задача плохо поставлена. В 1693 году Лейбниц нашел условие разрешимости системы п + 1 уравнений с п неизвестными как равенство нулю суммы произведений, составленных из коэффициентов уравнений по "правилу знаков" и на самом деле представляющей собой оп- ределитель (я+1)-го порядка, и в письме Г.-Ф. де Лопиталю со- общил о своем открытии, но, к сожалению, не опубликовал его. Понятие определителя оформляется у Г. Крамера (1750) и Э. Безу (1779) в связи с проблемой нахождения алгебраической кривой, проходящей через заданные п точек плоскости, а А. Ван- дермонд (1771) выделяет из проблемы решения уравнений тео- рию определителей как самостоятельную. Название "детерми- нант", в частном случае введенное Гауссом, приобретает общий смысл, вместе с табличной записью, у О.-Л. Коши (1815) и Ж.-Ф.-М. Бине, а вертикальные линии добавил А. Кэли (1844); этим роль обоих в становлении теории определителей, конечно, далеко не ограничивается. Существенные вклады внесли также П.-С. Лаплас, Г. Вронский, К.Т.-Я. Якоби, Г. Грассман, Л. Гессе,
Дж.-Дж. Сильвестр и др. И хотя сейчас можно говорить об из- вестной переоценке определителей как аппарата для фактическо- го исследования и решения систем линейных уравнений, значение их теории за пределами этой исходной проблемы переоценить трудно, в чем мы еще не раз убедимся. Для самостоятельной работы: ознакомиться с фор- мулой Бане—Коша, например, по книге: Ф. Р. Гантмахер. Теория матриц. — М.: ГТТИ, 1953. — С. 17-18.
ЛИНЕЙНЫЕ ОБРАЗЫ В МНОГОМЕРНОЙ ГЕОМЕТРИИ По причине, ясной из Предисловия, мы не приветствует объе- динение курсов алгебры и аналитической геометрии во II семес- тре на математических факультетах. Реальное пространство рас- стояний и геометрических тел трехмерно, и если путем экстрапо- ляции привычных образов можно в какой-то степени развить "четырехмерное пространственное воображение" * (полезное хотя бы для наглядного представления о пространственно-временном континууме в теории относительности), то вряд ли имеет смысл стремиться к этому в отношении ЗМ-мерного фазового простран- ства, точкам которого отвечают всевозможные расположения N молекул газа в сосуде. Весь курс аналитической геометрии (а не только его планиметрическая часть) должен иметь геометриче- скую целенаправленность, самое же широкое использование в нем алгебры все-таки является вспомогательным средством. На- против, многомерные пространства и "геометрические" образы в них являются алгебраическими (отражающими структурно-логи- ческие и количественные отношения материального мира) и даже рассматриваются над произвольным полем Р, а не только К; привычную же геометрию привлекают для наглядной интерпрета- ции. Последнее отражено и в терминологии: нульмерные плас- ты — сами векторы пространства V — называют точками, од- номерные — прямыми, двумерные — плоскостями, а пласты больших размерностей — гиперплоскостями. Вопрос в том, от- носить ли гиперплоскости, гиперповерхности и т. п. в алгебру или в геометрию, имеет такое же принципиальное значение, как проблема административного подчинения Морского университета Министерству образования или Министерству морского флота **. * Выдающийся советский геометр Б. Н. Делоне создал учебный фильм "Вращение куба в четырехмерном пространстве", после просмотра которого алгебраист О. Ю. Шмидт (более известный тогда как полярный исследо- ватель) откровенно сказал: "Есть вещи, которые я понимаю, хорошо или плохо, но на этот раз не понял абсолютно ничего". Каждому свое: ведь и знаменитый "Челюскин", на борту которого находился Отто Юльевич, в 1933 году затонул, раздавленный льдинами Чукотского моря, без выхода за пределы трехмерного пространства! ** В "Министерстве геометрии" вводятся аффинные пространства, элемента- ми которых служат и точки, и векторы.
В аналитической геометрии связь собственно геометрии с алгеброй осуществляется через "мост с двусторонним движе- нием" — две основные задачи: I. В геометрическом пространстве дан образ (точка, систе- ма точек, линия, фигура, тело) и известно его расположение относительно некоторой координатной системы; найти ал- гебраические условия, которым должны удовлетворять теку- щие координаты точки, чтобы она принадлежала заданному образу. II. Даны алгебраические условия (одно или несколько урав- нений или неравенств), связывающие текущие координаты точки в некоторой системе координат; выяснить, какой гео- метрический образ представляет собой множество тех то- чек, координаты которых удовлетворяют данным условиям, и как расположен этот образ относительно координатной системы. В многомерной же геометрии (где "мост" соединяет алгебру с алгеброй) обе эти задачи теряют принципиальное звучание, но важны в техническом плане и применительно к таким "геометри- ческим" объектам, как пласты в конечномерном линейном про- странстве, выражаются, например, в переходе от параметричес- кого задания пласта к характеризации его одним или нескольки- ми уравнениями (задача I) и обратно (задача II). В самом деле, трудно вообразить "более геометрическое" зада- ние т-мерного пласта П = П(УП, л:п) в я-мерном (п>т) линей- ном пространстве У = У(Р) над произвольным полем Р, чем "проведение П чрез данную точку в данном направлении", т. е. выбор сдвига л:п € V и, если т>0, подпространства УпсУ; последнее же, в свою очередь, задается базой /,, /2, ..., /т, так что каждый элемент пласта П однозначно представим в виде * Обе эти записи не теряют смысла и при т = 0, так как, сумма нулевого числа слагаемых считается равной нулю. где все
Аналитическая геометрия (вместе с векторной алгеброй) не перестает быть геометрией от использования координат. Тем паче "степень геометричности" я-мерного линейного пространства V не уменьшится от предположения, что в нем выделена база и векторы задаются упорядоченными системами своих координат — элементов поля Р — в этой базе: х = (я,, х2, ..., хп). А поскольку линейные пространства одинаковой конечной размерности над одним и тем же полем изоморфны, то в качестве У = У(Р) мож- но брать М|ДР) или М"(Р), с соответствующей стандартной базой, и считать вектором х строку Ц*, х2... хп\\ или столбец /Л, х2 ...хп//. Если хп= //&, Ь2... ЬЛ и /у= ///,,, /2/, ..., /л// (/=1,2,..., т), то векторное равенство (*) запишется как система п скалярных: (/ = 1, 2, ..., п) или, что равносильно: Условие принадлежности данной точки (вектора) х = = //х{ х2... хп// данному пласту П точно выражается теперь так: хе П в том и только том случае, если при заданных я,, х2, ..., хп е Р система уравнений (***) разрешима относительно неизвестных {Ху}. Для решения задачи I надо путем исключения этих {А,у} из системы (***) получить такую систему уравнений относительно {*•}, которой удовлетворяют координаты точек х е П и только их; займемся строгим обоснованием соответствующей процедуры в практически удобной форме.
Основная и расширенная матрицы системы (***) имеют вид /-= |/1у. I и 1^(хп-х)*, условия же разрешимости системы в нашем случае гп§Цхп - х) = тп§Ь = т, (К) где первое равенство выражает теорему Кронекера—Капелли, а второе — тот факт, что коэффициенты А,у в разложении (*) оп- ределяются однозначно. Пользуясь элементарными преобразова- ниями строк и только перестановками первых т столбцов, при- ведем матрицу Цхп — х) к виду откуда ясно, что система (***) разрешима относительно {ХД в том и только том случае, если текущие координаты точки х удовлетворяют системе п — т уравнений с п неизвестными; эти уравнения независимы, поскольку сНтП = я (уточните!), так что число их уменьшить нельзя (а что бы тогда случилось?). Система (П) — искомая, задающая пласт П в пространстве М"(Р). А обратная задача II, когда от системы вида (П) надо * Не путать с произведением матриц
перейти к параметрической форме (**) записи пласта, уже реше- на в конце раздела "Системы линейных уравнений". При т = 0 система (П) содержит п уравнений и в силу усло- вия (К) однозначно разрешима, т. е. пласт П сводится к одной точке. При т = 1 система (П) содержит п — 1 уравнений и определя- ет одномерный пласт — прямую, проходящую через точку л:п в направлении вектора Уп =/=///,/2 .../„//; уравнения этой прямой удобнее всего получить из (**) (с т=\ и /,-/ = /,•) непосредствен- ным исключением единственного параметра А,. При т = п — 1 система (П) состоит из одного уравнения, оп- ределяющего в V гиперповерхность П наибольшей такой размер- ности, при которой П еще не совпадает со всем пространством. Наконец, если т = п, то текущие координаты точки к ничем не связаны'и П=У — "я-мерный пласт, проведенный в я-мер- ном пространстве через любую точку в направлении нулевого вектора". Рассмотрим теперь всевозможные взаимные положения двух пластов IX =П(У,, х{) и П2 = П(У2, *2) в пространстве У(Р). 1. Когда V, с У2 или У2сУ,, пласты параллельны (раньше это отношение мы ввели только для случая сПтУ, =сПтУ2). Если к тому же х2 — А:, принадлежит V, или У2, то, очевидно Г^сШ (первый пласт лежит во втором), соответственно ГЬ^Пь в час- тности, если еще и V, = У2, пласт один и тот же: П^Ш- 2. Когда IX и ГЬ не параллельны и IX П Ш^Ф. пласты пере- секаются и их можно, выбрав *0 е ГЬ П Ш, записать в виде П(У,, *0) и П(У2, *0), а тогда П, П ГЬ-ПМ П V,;) — тоже пласт, параллельный как Пн так и ГЬ» причем П) +П2==П^1 + У2, л:0) — единственный пласт наименьшей размерности, содержащий оба исходных; а так как размерность пласта — это размерность его направления, то по последней теореме раздела "Линейная зависи- мость векторов"
м п' \ Отсюда "алгебраически ясно", почему в точечном пространстве Е3 две плоскости не могут иметь толь- ко одну общую точку: размерность их пересечения (если оно не пусто) не меньше, чем 2 + 2 — 3=1. Но такое возможно уже при сПтУ = 4, и чтобы это не казалось "геомет- рическим парадоксом", привлечем "четырехмерное пространственное воображение". Именно, пусть П — плоскость, а ОМ — прямая, пересекающая ее в точке О. Всякая плоскость П', про- веденная через ОМ в том же про- странстве Е3, которому принадле- жат П и ОМ, пересекает П по пря- мой; но если мы ухитримся провести П' через ОМ так, чтобы выйти за пределы Е3, то П' П П будет состоять только из точки О*. 3. Пласты, которые не пересекаются и не параллельны, назы- ваются скрещивающимися; таковы, очевидно, П1 =П(У,, *,) и П2 = П^2, *2) в том и только том случае, если из их направлений VI, М2 ни одно не является подпространством другого, а разность сдвигов х2 — #, не принадлежит ни V,, ни У2 **. Минимальный * По представлениям одномерного существа, обитающего на прямой, два про- межутка (не отрезка!) не могут иметь только одну общую точку. Но этого легко добиться уже при выходе из "среды обитания" в содержащую ее плоскость. ** Впрочем, некоторые авторы употребляют термин "скрещивающиеся" только когда V, П ^2 = {0}, а при 0<сНт(У, П V2) < тт{сИтУ,, сПтУ2} говорят о частичной параллельности.
пласт П, содержащий П1 и ГЬ, притом единственный, можно записать, например, в виде П((У, + У2) Ф Ь, х), где Ь== = Цх2 —*,, Р) с: V — одномерное подпространство — линейная оболочка "вектора-перемычки" *2 — *,; размерность этого пласта А\тТ1 = А\т\1 + А[т\2-А[т(\1 П У2) + 1 <сНтУ, следовательно, сНт(П, П Ш ^ сНтП, + сИтП2 + 1 - А1т V. (!!) Так, в Е3 две прямые могут быть скрещивающимися, а уже прямая и плоскость — нет. Для фактического распознавания этих случаев предположим, что пласты П1=П(У,,х,) и П2 = П(У2, *2) в пространстве М"(Р) со стандартной базой заданы уравнениями где Л = ||а,и, С = ;|с,[, 6= //и, ... и,// </= /Ч ... </т// и все а|7, ^7, йл, й?Л € Р, т. е. системами из / и т скалярных уравнений с п неизвестными — текущими координатами вектора х. Объе- диняя обе группы уравнений, получим систему с расширенной матрицей два левых блока которой образуют основную матрицу А/С. Если гп§(А/С) = тах{гп^4, гп^С}, то имеет место случай 1; тогда
Задача II для "наибольшего" из пластов Пи ГЬ» соответствен- но для каждого из них по отдельности, решается как обычно. Если же гпё(А/С) > тах{гп§Л, гп§С}, то гпё(АЬ/С4) = гпё(А/С) =» П, ПП2^0 (случай 2) и пересечение пластов находится обычным решением объединен- ной системы (У); гп§(АЬ/Сс!)>гпё(А/С) =» П, ПП2 = 0 (случай 3), т. е. П[ и П2 — скрещивающиеся пласты, причем "степень их частичной параллельности" А\т(\{ П V2) = ^пё(А/С)-^пёА-^пёС (почему?). Особо важен частный случай, когда П1 — (п — 1)-мерная ("мак- си"-) гиперплоскость, заданная уравнением а{х{ + ... + апхп = Ь, (1) а П2 — прямая, параметрическое уравнение которой (одно век- торное, равносильное п скалярным): х-Хо+'М, . (2) где *0 = //%! ... хп// и I = //1{ ... 1п//. Принципиально этот случай не отличается от "чисто геометрического" (с я = 3, Р = К), и ход решения тот же: подставив в (1) их выражения ^=^4-Ц из (2), исследуем разрешимость полученного уравнения ( \ (а,/, +... + ая/||)Х = 6-1 а1х1 + ... + апхп \ (3) относительно неизвестной А,.
При а,/, +... + ап1п фО уравнение (3) имеет одно решение, подстановка которого в (2) дает единственную точку пересечения П, и П2: При а,/, + ... + ап1п = 0 возможны два подслучая: если о^ + .-. + а^ *й, т. е. хё Р, то решений нет — прямая не имеет с гиперплоско- стью общих точек, а если о, *,+ ...+ ая*я =й, то уравнению (2) удовлетворяет любое А,е Р — прямая целиком лежит в гиперплоскости. В плане УИРС (учебно-исследовательской работы студентов) предлагаем полный разбор по крайней мере одного (по выбору учащегося) из двух более сложных случаев: когда сНтП! < п — 1 или когда сИтП2===2. Вопрос "на посошок": а что может случиться, если уравнения (О), (1) или (2) брать "с потолка"?
СИСТЕМЫ ЛИНЕЙНЫХ ОГРАНИЧЕНИЙ Пусть У = У(Р) — линейное пространство над полем Р, а х — переменный ("неизвестный") вектор, пробегающий V. Логическую функцию (предикат) — отображение V -> {И, Л}, относящее каж- дому х е V одно из двух значений И (истина), Л (ложь), будем называть ограничением. В частности, эта функция может ока- заться логическим тождеством, т. е. всегда принимать значение И — такое "ограничение" на самом деле ничего не ограничивает; в другом же крайнем случае, когда функция тождественно ложна, ограничение равносильно полному запрету. Конечная система ограничений, будучи конъюнкцией логических функций, тоже яв- ляется ограничением, а множество удовлетворяющих ей векторов из V — пересечением таких множеств, определяемых исходными ограничениями по отдельности. Предполагая поле Р упорядоченным (см. конец раздела "Рас- ширения полей" I части), займемся ограничениями вида /(х) К Ь, где / — линейная форма, Ь — фиксированный элемент поля, а К — любое из пяти бинарных отношений =, <, <, >, > на Р. Система ограничений /,(*) Я, Ь(, /2(х) К, Ь„ ..., !т(х) Кт Ьт (т е Щ (1) определяет подмножество XV с V тех векторов х, для которых истинно высказывание [/,(*) Я, М & [/,(*) К2 Ь2] & ... & [/„(*) Кп Ьп], т т. е. XV = р|{*е \/ 1(х) /?, б,.}. Общая задача состоит в нахожде- 1=1 нии условий непустоты этого множества, исследовании его структуры и в систематическом способе получения всех его эле- ментов, подобно тому как это сделано для систем линейных уравнений — частного случая, когда все К1 — равенства. Множество XV е V называется выпуклым, если вместе с век- торами хр х2 оно содержит и все векторы вида т1 х} 4- т2 х2, где Т! и т2 — неотрицательные элементы Р, такие что т1+т2=/; для одноэлементного XV это условие выполнено тривиально, а для пустого — "в силу ложности посылки". Геометрически: выпуклое
множество вместе с любыми двумя своими точками содержит и все точки соединяющего их отрезка. Пересечение всякой систе- мы выпуклых, множеств является выпуклым множеством, ибо если х, и х2 — любые векторы из пересечения, то каждое множество системы содержит их оба, поэтому, в силу их выпук- лости, — и значение комбинации т,х,4-т2х указанного вида, которое тем самым принадлежит их пересечению. Теорема 1. Если XV с V — выпуклое множество и *,, ..., *Ле XV (й>2), а элементы т,, ...,тл€ Р удовлетворяют условиям т„ ..., тл>0 и т, + ... + тл = / то т, х, + ... + тЛ х^ е \У. Доказательство. При /г = 2 справедливость теоремы не- посредственно следует из определения выпуклого множества. Пусть для некоторого /г > 2 она уже доказана, векторы я,, ..., хл, хЛ+1 е XV , а неотрицательные т,,..., тл, тЛ + 1 е Р в сумме дают /; покажем, что значение ^Т^+.-. + Т^+Т^Х^ тоже входит в XV. В случае а = т, +... + т^ = 0 это утверждение тривиально, а при о 0 имеем 5 = 0(0-4, Х,+ ... 4- О'1!, ХЛ) + ТЛ+1 ХЛ+1, где все о^'т^О и о^1!! +...+ 0^4^=/. Вектор в скобках принад- лежит XV согласно индуктивному предположению, а так как а и тЛ + 1 неотрицательны, а + т* + 1 = / и для комбинации двух векторов теорема верна, то и 5 е XV. Теорема доказана индукцией по &. Всякое множество XV = {х е У//(х) /? и} выпукло', доказатель- ство одинаково для всех пяти типов отношения /?; например, если К есть <, то при любых хр *2 е XV и т,, т2€ Р таких, что т,, т2>0, Т|+т2=/, имеем ввиду линейности формы /: /(Т, ^4-... 4- Т2 Х2) = Т,/^,) + Т2/(*2) < Т,Ь 4- Т26 = 6, т. е. т, ^, + т2^2 е XV . Отсюда благодаря выпуклости пересечения выпуклых множеств вытекает
Теорема 2. Множество всех векторов хе V, удовлетво- ряющих системе ограничений (1), выпукло (в частности, оно может оказаться пустым). Ненулевой форме /(*) и элементу Ъ е Р отвечает разбиение пространства V на три попарно непересекающихся выпуклых множества: XV0 = {х € У//(л:) = &}, XV- = {* € У//(х) < Ь} и XV* = {А: е У//(х) > Ь}\ первое представляет собой пласт (гиперплоскость), и если про- странство V конечномерно, то сНт\У° = <11тУ— 1, а второе и тре- тье называются открытыми полупространствами, на которые XV0 разбивает V. Предлагаем читателю самостоятельно доказать утверждение (в геометрическом случае сйтУ = 3 очевидное): отрезок прямой, соединяющий две точки множества XV" У \У+, пересекает гиперплоскость XV0 в том и только том случае, если одна из этих точек принадлежит XV", а другая XV*. Мно- жества XV" У XV0 и XV* У XV0, называемые замкнутыми полупро- странствами (относительно гиперплоскости XV0), задаются соот- ветствующими ограничениями }(х) < Ь и /(*) > Ь. Таким образом, множество векторов хе XV с У(Р), удовлетво- ряющих системе ограничений (1), — это пересечение множеств трех типов: гиперплоскость, открытое полупространство, замкну- тое полупространство. Ясно также, что если XV' — множество решений другой системы ограничений (Г), являющейся следстви- ем (1), т. е. такой, что все решения (1) удовлетворяют также (Г), то XV с XV'; в частности, эквивалентные системы — каждая из ко- торых есть следствие другой — обладают одним и тем же множе- ством решений. Полный обзор всех возможных случаев в общем виде был бы чересчур громоздким (а на наглядном уровне — тре- бующим "многомерного пространственного воображения"), и для лучшего уяснения сути дела мы будем некоторые этапы общих рассуждений проводить на частных геометрических примерах (где сПтУ<3 и Р = К). Лучом с вершиной х0 называется множество векторов пространства М^Р), задаваемое параметрически: х = *0 + А,/ (см. (2) в конце предыдущего раздела) при дополнительном усло- вии А,>0 (это замкнутый луч, а для открытого А,>0).
Изучим сначала системы линейных ограничений, не содержа- щие строгих неравенств; так как неравенство }(х) < Ь равносиль- но —/(*)> — Ъ, а равенство /(*) = Ъ — конъюнкции двух нера- венств /(*)>& и — /(*)> — 6, то в теоретическом исследовании можно без потери общности ограничиться системами вида А-х>Ь\ (2) где матрица-столбец неизвестных, а неравенство между матрицами означает конъюнкцию неравенств между соответственными эле- ментами; очевидно, гп§А < п. Теорема 3. Если луч х = х0 + А,/ (А,>0) целиком принадле- жит множеству XV решений системы (2), то при любом #о е ^ ЛУЧ # = #о+А,/ тоже полностью принадлежит XV. Доказательство. Предположим, вопреки утверждению теоремы, что на втором луче есть точка х0 + АЛё XV (А,'>0). Значит, среди ограничений (2) имеется такое /(*) > и, что /(х0 + А/) = /(х0) + А/(/) - Ь (ПРИ всех ^^0), }(х'^>Ь и одновремен- но /(х'0 -Ь А//) =/(хо) + А,'/(0 <й при каком-то К>0. Но тогда К}(1)<0, откуда 1(1) < 0, и взяв достаточно большое Х>0, мы получили бы на первом луче точку, в которой /(*0 + А,/) < и. Примечание. В отличие от теоремы 1, справедливой для произвольного выпуклого множества, здесь существенно, что XV — множество решений системы линейных огра- ничений: без этого предположения теорема 3 теряет силу, как видно из рисунка, где пре- рывистой линией изображена часть границы выпуклого множества XV, не принадлежащая самому XV. Покажем прежде всего, как свести задачу выяснения совмес- тности и построения общего решения системы (2) к случаю, когда гп§А = п. Пусть г = гп§А<п (но /->()). Тогда с помощью элементарных операций над столбцами матрицы А (и не трогая строк) можно преобразовать ее в такую А', у которой последние п — г столб- цов — нулевые; это преобразование равносильно умножению А * Многие авторы предпочитают общий вид А-х<Ь. матрицы над полем
Системы линейных ограничений 227 справа на некоторую невырожденную матрицу С = ||^|^ (см. пос- ледний раздел I части книги). Произведя замену неизвестных х = С-х', где х = \х[||" = //х[ ... х'п// , и учитывая, что А-х = = Л-(С-х') = (А - С)-х' = А'-х', придадим системе (2) вид Л'•*'>&, (2') или, подробно, любое ее Ясно, что если система (2) совместна и решение, то вектор х' = С-х удовлетворяет системе (2х), и на- оборот, любой вектор //х\> х2, ..., х'г// е Щ(Р), являющийся решением (2х), после дополнения до п-мерного произвольными координатами *'+„ ..., хп и умножения слева на С"1 будет удов- летворять исходной системе (2). Поэтому, располагая общим вы- ражением х решения (2') в виде линейной комбинации конкрет- ных г-мерных векторов с коэффициентами-параметрами, мы для получения общего решения той же системы, но в пространстве М"(Р), пополним эти векторы п — г нулевыми координатами (обозначение х сохраним) и введем столько же дополнительных параметров у,, ..., у„_г; искомым выражением будет х = С-1-^ = С-1^' + у,С-1.е,' + ... + уп.гС-1-С„ (П где е\ = //0, 0, ... О, /,..., О// (с единицей на (г+1)-м месте), ..., е'п_г = //0, 0, ... О, 0, ..., 1//. У всех векторов, из которых составле- на комбинация х , нижние п — г координат равны 0, а векторы С~[-е\, ..., С~1-е'п_г — не что иное, как последние столбцы мат- рицы С"1. Заметим, что если в А начальная г х г-подматрица, образован- ная первыми г столбцами и строками, — невырожденная (этого
всегда можно добиться перенумерованием неизвестных и пере- становками ограничений исходной системы), то преобразование А-* А' удобно осуществлять без изменения самих первых столб- цов (т. е. просто аннулируя ими остальные): тогда в преобразу- ющих матрицах С и С"*1 начальными подматрицами будут Егг, и векторы, входящие в комбинацию х , от умножения (слева) на С"1 не изменятся. Всю процедуру, включая удобный способ одновременного нахождения матриц А' и С, мы проиллюстрируем на примере системы (над О) Допишем к А снизу матрицу Е = Е44 и, действуя со столбцами матрицы А/Е так, чтобы элементы последних двух столбцов в верхних пяти строках стали нулями, получим матрицу А'/С (вспомнив способ А. Н. Крылова для нахождения обратной мат- рицы, изложенной в первой части, объясните, почему теперь внизу возникает как раз такая С, что Л-С = Л'). В данном при- мере можно к третьему столбцу прибавить оба первых, а к чет- вертому — первый и удвоенный второй *: * В общем случае коэффициенты нужной комбинации столбцов находятся из системы г линейных уравнений с п неизвестными. здесь
Множество решений системы Далее находим (и на всякий случай прове- ряем, что
изобразить в плоскости х'Оу' нетрудно: если мы заштрихуем каждую из полуплоскостей, запрещаемых соответствующим огра- ничением, то искомым XV' будет часть плоскости, оставшаяся "чистой". Попытаемся представить себе наглядно переход от двумерных векторов к' к четырехмерным. Каждое уравнение системы, полу- ченной из (3') заменой неравенств равенствами, изображает в плоскости х'Оу' прямую, в пространстве Ох'у'г' — плоскость, проходящую через эту прямую и параллельную оси Ог', а в пространстве Ох'у'г'}' — гиперплоскость, которая с этой плоско- сти уводит нас в четвертое измерение параллельно оси 01''. Гра- * Отсюда, в частности, видно, что последнее ограничение в (3х) — "пятое колесо государственной телеги"; но показать чисто алгебраически, что оно является следствием предыдущих четырех, не так-то просто.
ница множества решений в двумерном случае — ломаная 5^ (из двух отрез- ков и двух лучей), в трехмерном — цилиндрическая поверхность 5'2 с на- правляющей 5х, и образующими, па- раллельными оси Ог', в четырехмер- ном — "дважды цилиндрическая" ги- перповерхность 5'3, направляющей которой служит 5'2, а образующие па- раллельны оси Ог'\ Можно считать также, что направляющей для 5'3 яв- ляется ломаная 5',, лежащая в дву- мерном подпространстве (и определяе- мая системой, которая получается до- бавлением к (У} ограничений г' = 0, *' = 0), а образующими — плоскости, проведенные через 5х, параллельно г'ОГ; при аналогич- ной интерпретации формулы типа (2") для решения исходной си- стемы (3) эти "двумерные образующие" уже не параллельны осям Ог' и ОГ, из-за чего в представлении типа (2") у последних двух векторов первые две координаты не обязательно равны нулю. Если вместо (3) взять несовместную систему, то несовместной будет и соответствующая (3х), однако формально всё сказанное останется -в силе: цилиндр с пустой направляющей представляет собой пустое множество решений системы. Теперь можно приступить к выводу критерия совместности и к построению общего решения системы (2) в предположении, что гп§А = я, следовательно, т > п. Теорема 4. При гп^А = п никакая прямая не может цели- ком принадлежать множеству V/ решений системы (2). В самом деле, если такая прямая есть, то с помощью невы- рожденной замены переменных сделаем одну из координатных осей, скажем Ох'„ параллельной этой прямой, а тогда любое решение '• х] преобразованной системы с матрицей А' будет * Для полной ясности не мешало бы обратиться к покойному Б. Н. Делоне (см. сноску в начале предыдущего раздела).
оставаться решением при произвольном изменении значения хп, что возможно лишь в случае, когда последний столбец в А' — нулевой, откуда гп^Л = гп§гЛ' < п вопреки условию. Теорема 5. Если система (2) с гп^Л = п совместна, то существует вектор хе\У, обращающий в равенства некоторые п ограничений системы (2), соответствующих линейно независимым строкам матрицы А. Доказательство. Обозначим через Р систему (п — 1 )-мерных гиперплоскостей, уравнения которых получаются из ограничений (2) заменой всех неравенств равенствами, возьмем произвольную точку *0 е XV и через нее проведем произвольную прямую *. В силу теоремы 4 эта прямая пересечет некоторую П1 е Р в точке *,. Через эту точку проведет в П1 произвольную прямую, и она должна пере- сечься с некоторой П2 ^ Р в точке х2. Через х2 проводим произволь- ную прямую в (п — 2)-мерном пласте П1 П Ш» и пусть *3 — точка ее пересечения с некоторой ГЬ е Р и т. д. Точки *0, *,, ... не обязатель- но все различны, но так или иначе мы через п шагов найдем точку хп € XV в нульмерном пласте П1 П Ш П ••• П П„, где ни при каком 1=1, 2, ..., п — 1 гиперплоскость П(+1 не параллельна пласту П1 П Ш П ••• П Ц, т. е. строка матрицы Л, соответствующая ги- перплоскости П, + 1» не является линейной комбинацией строк, отве- чающих Пи Ш, •••> Ц. Точка хп — годограф искомого вектора х. При т = п система совместна хотя бы уже потому, что в силу теоремы Кронекера—Капелли совместна система уравнений, получаемая из (2) заменой неравенств равенствами. Теорема 6. Система (2) с гп^А = п<т совместна в том и только том случае, если матрицу АЬ можно перестанов- кой строк преобразовать так, чтобы выполнялись условия: * А что при п == 1?
Доказательство. Пусть система (2) совместна, а *=//*, ... хп// — то ее решение, существование которого установлено теоре- мой 5. Расположим строки матрицы АЬ в таком порядке, чтобы начальная (угловая) п х я-подматрица была невырожденной, т. е. с определителем А=^=0, и ее строкам отвечала именно та система уравнений решением которой (единственным: почему?) служит х. Рассмот- рим вспомогательные определители (я+1)-го порядка (/ = я+1, ..., т), равные нулю при любых л:,, ..., хп е Р (поче- му?), в частности для вектора х\ но хеУ/, значит Так как в разложение А, по последнему столбцу слагаемое (апх{ + ... + а1пхп)-Л входит с коэффициентом (—1)(п+|> + <л + '> = /, то при х = х из 4 = 0, (4) и (4') следует т. е. второе условие теоремы.
Наоборот, предположим порядок строк матрицы АЬ таким, что условия теоремы выполняются, и пусть //*, ... хп// — решение сис- темы уравнений (4) (совместной, поскольку Д=^=0); подстановка его в тождества Дг = 0 дает отсюда и из второго условия такими же рассуждениями, как и выше, получаем ял *,+... + а1п хп > и. (/ = п +1, ..., т), т. е. вектор //х1 ... хп// , обращающий в равенства первые я ог- раничений системы (2) (с переставленными строками), удовлетво- ряет также остальным т — п неравенствам этой системы. Теоре- ма доказана, и мы предлагаем читателю полностью разобрать случай п = 1 (с определителями первого и второго порядка). Чтобы установить общий вид решения совместной системы (2) с гп§Л = я, рассмотрим линейно независимые подсистемы из п строк матрицы Л; каждая подсистема тех же строк расширен- ной матрицы АЬ задает систему п уравнений с п неизвестными, обладающую единственным решением (почему?), и если вектор- решение удовлетворяет всем остальным т — п ограничениям (во- обще говоря, в виде неравенств) системы (2), то этот вектор, а тем более точку, определяемую им как радиусом-вектором в геометрической интерпретации, естественно называть вершиной множества \У, в противном случае далее не рассматривать. Если х,, *2,..., хр — все вершины XV, то \<р<(™)\ нижняя оценка обусловлена теоремой 5 *, а тривиальная верхняя достигается, например, при т = п. * В случае несовместности системы (2) мы обнаружим это по отсутствию вершин (р = 0) без использования теоремы 6; она интересна в теоретичес- ком отношении, но непосредственная проверка выполнения ее условий не проще выявления всех вершин.
Так, в матрице А' системы (3) каждая из (|) = 10 пар строк линейно независима, но лишь у трех пар уравнений решения (под чертой) удовлетворяют остальным ограничениям, так что \У' (в плоскости х'Оу') имеет три вершины *. Пусть х^ — вершина, определяемая системой уравнений Л<й> • х = &<й>, (5и) т. е. х = А<Ь>~{ • 6</г>, где Л<й> и 6</г> — соответствующие "урезанные" подматрица и вектор после удаления т — п невыб- ранных строк из матрицы АЬ (и = 1, 2, ..., р). Исследуем по от- дельности множества \УЛ решений каждой из подсистем Л<Ь> - х > 6<#> (б'О исходной системы ограничений (2). Для нового искомого вектора у = Л<й> • х — 6</г> (6и) система (5\) преобразуется в у > О с очевидным общим реше- нием у<Ь>= //рЛ1 ... рЛл/( где рл/ — любые неотрицательные эле- менты поля Р. Так как Л<&> — невырожденная матрица, то преобразование (6и) обратимо: х = Л<Ь>~| • (6<й> + у), (б7,,) и общее решение системы (5\) х<Ь> = Л</г>-' • 6</г> + Л</г>-' - г/</г> = = ^+Л<й>-'7/р,1...р,л// (7,) имеет весьма наглядный геометрический смысл. При фиксированном /г е {!,..., р) каждая из п подсистем п—\ уравнений системы (5и) задает в пространстве М"(Р) свою пря- * В пространстве Ох'у'г'г' те же три точки, координаты которых пополнены двумя нулевыми, уже не будут вершинами множества ^', продолженного в третье и четвертое измерения.
мую р = ры (г=1,...,п), проходящую через точку *л. Часть р П ^л этой прямой не может содержать точек по обе стороны от Хъ, поскольку выпуклое множество АУЛ лежит целиком в одном из полупространств, разделяемых той гиперплоскостью, уравнение которой не вошло в подсистему, и пересечение р П ^*, будучи тоже выпуклым (почему?) и одномерным, пред- ставляет собой "граничный луч" множества АУЛ — прообраз той координатной "положительной полуоси", в которую переводится это пересечение преобразованием (6\). Так как общее решение системы у > 0 можно записать в виде »<*>-||РА1-РЛ7/в1 .»«„// где {е}} — стандартная база пространства М"(Р), то вторые сла- гаемые в (7и) должны иметь вид ИР*, - РЛ • /А<*>... '„<*>//= М,<ь> +... + р„А<*>; здесь /,.<*> = А<Ь>~{ • еу = //АЧ<Ь> ... Ап/<Ь>// / с!е1Л<*>, (8) Л/у-<й> — алгебраические дополнения элементов 1-й строки мат- рицы Л<&> (см. конец общей части раздела "Полилинейные формы и определители"). Таким образом, *<&> = х,+ рл|/,<й> + ... + рля/я<*>, (8,) т. е. \УЛ — "выпуклый конус", гранич- ные лучи которого имеют направления /!</г>, ..., /л<й> (см. рисунок при я = 3); эти м векторов, как образы ба- зовых {еу} при невырожденном прео- бразовании, линейно независимы. Любая точка хе XV должна, очевид- но, принадлежать всем р "конусам" (в частности, каждый из них содержит о р вершины всех остальных р — \ "конусов"). Если \У = Р|\УЛ —
// множество решений объединенной подсистемы У (5'л) исходной (2), то XV с XV ; впоследствии выяснится, что XV = XV, но пока удобнее исследовать структуру множества XV , не опираясь на "воспоминание о будущем". Всякий граничный луч "конуса" ХУЛ либо целиком сохранится и в \У, либо пересечется с каким-то другим "конусом" XV/ в точке, которая может быть только вершиной *, последнего, поскольку к п — 1 уравнениям луча добавится не вытекающее из них уравнение гиперплоскости, а полученная система п независи- мых уравнений — это ведь некоторая (5/) (1</<р); в силу выпуклости, часть луча, принадлежащая XV, — отрезок с конца- ми х^ и х1 (возможно, вырожденный, если решения систем (5и) и (5/), различающихся одним уравнением, на самом деле совпада- ют). Ясно, что множество XV представляет собой "выпуклый многогранник", который может либо занимать ограниченную часть пространства М"(Р), либо "простираться в бесконечность" (см. рисунок при я = 3); "гранями" XV служат гиперплоскости, ^ определяемые уравнениями объединенной системы У (5Л), а *=| "ребрами" — одномерные отрезки, соединяющие пары вершин "многогранника", и лучи, исходящие из его вершин.
Лемма. Каждый вектор х е XV можно представить в виде Р Ч * = 1Л**+Ев'/, Л=1 /=1 где *,, ..., хр — все вершины множества V/, 1{, ..., 1Я — направления всех его граничных лучей, а ос,, ..., оср, (3,, ..., р (3^ — неотрицательные элементы поля Р, причем ^ос^ =^ Д=1 Доказательство. Так как х е АУЛ при всех и = 1, ..., р, то этот вектор допускает р представлений п ^ = ^+ХМ <й>' (9,) с линейно независимыми векторами /,</г>,..., /„<&>, из которых первые р — 1 являются направлениями ребер-отрезков, соединяю- щих Хь с остальными вершинами \У *, а последние п — р+\ — направлениями ребер-лучей, исходящих из х^. Векторы первого типа совпадают по направлению с соответствующими ху-л:А (/=1, ..., &— 1, /г+1, ..., р), и порождаемое ими подпростран- ство МхсМ"(Р), будучи линейной оболочкой системы ранга р—1 (почему?), не зависят от /г, а векторы второго типа принадлежат такому подпространству М", что Мх П М" = {0} **. "Допущение, что это именно первые слагаемые, не нарушает общности, ибо при каждом /г можно произвести свою перенумерацию векторов {/;</г>}. ** Мх 0 М" = М" — прямая сумма подпространств.
Предполагая, что за /у-</г> при \<р взяты сами векторы ху-*Л, мы можем записать равенства (9и) в виде х = х,+ 5<й> + 5"<й>, (9'к) где сумма § < & > = У (3Лу (ху -*Л | * является вектором из М', а Н Ч У 5"</г> — вектором из М". Умножая эти равенства на неотрица- Р тельные элементы ос^е Р, такие что ^ГсхЛ =/, в остальном пока *=1 произвольные, и складывая, получим где а слагаемые третьей суммы уже имеют требуемый вид, посколь- ку все ослрл/ > 0. Нам надо так распорядиться оставшейся свобо- дой в выборе {осл}, чтобы сумма 5 обратилась в нулевой вектор. Если при каком-то /г все рЛ/ = 0, то искомой системой значе- ний служит, например, а^=/, ау = 0 при у^=/г; в противном слу- чае предположим нумерацию вершин такой, что $ч\ФО, и, пользуясь независимостью подпространства Мх от /г, выберем в нем базу 1х]-х0/] = 2,..., р\. Тогда при & = 2, ..., р и /' = &+!, ..., р, в силу чего * Здесь /г-е слагаемое заведомо равно 0, но мы не хотим усложнять общую запись суммы. Удобно также считать РЛЛ = 0.
в то же время Вычитая равенство (9х,) из (9\) с /г > 2 и пользуясь тем, что сумма М/0М//=М" — прямая, получаем 5</г>- 5<1> + (**-*,) = О, или, после расшифровки и группировки по векторам базы, !(Р*-А, )(*/-*. )+('-1рЛ *.-^. 1=о. /=2 V ) \ у-1 Д У откуда рл/ = р1у при 6=1, ..., р, / = * + !, .... р (10) /? и ХР*у=^~Р1* ПРИ ^ = 2, -.., Р, или, в развернутом виде, 7=1 Р*1 + - + Р...- 1 + Р*.*+ 1 + .- + Р*р = / - Р1Ь т. е., благодаря (10), РЛ1-ь^Р1у-=/, откуда /=1 висимо от Ь (Ф\), значит РА1 = р21>0 при 6 = 2, ..., р, и Р21+^Р1Л=/. (И) Л=1 неза-
Полагая ос, = р21, осЛ = р,Л>0 при и = 2, ...,р, будем иметь р ввиду (10) и (11) 2^0^=7, и при /г=1, />2 (аналогично при /=1, *>2) «.Р./ -СХ/Р/1 = Р2,Р,/ -Р./Р/. =0 (ибо р;1 =р2[), а при всех и, у = 2, ..., р тоже «А/ -<*/Р/* = Р.А/ -Р./Р/. =Р.*Р./ -Р./Р.* = #> что и требовалось. Теорема 7. Вектор л: = М"(Р) удовлетворяет совместной системе ограничений (2) ранга п тогда и только тогда, когда его можно представить в виде * = 2Х**+^Р/'/' (12) Л=1 /=1 где х{, ..., хр — все вершины, /,, ..., 1Я — направления всех ребер-лучей множества решений XV, а а,, ..., оср, р,, ..., р9 — р неотрицательные элементы поля Р, такие что Ха*=^- *=1 Доказательство. Если х € XV, то тем более х е XV и по лемме этот вектор допускает требуемое представление. Наобо- рот, если для вектора л:еМ"(Р) имеет место равенство (2), то Р слагаемое ^а=Х(Х*^ принадлежит XV по теореме 1, а векторы *=1 А *а+РЛ. (^а+Р|'|) + Р2'2. - ^ НаКОНСЦ, * = *« + ^ Р/'/ ~ ПО теореме 3. /=1 Теоремами 6 и 7 проблема, сформулированная в начале разде- ла, полностью решается для систем ограничений вида (2) с т§А = п. Если же гп§А<я, то формула общего решения полу- чается из (2") подстановкой вместо х' правой части равенства (12). Наконец, при наличии в-системе (2) строгих неравенств надо из множества XV удалить участки "граней", образованных
соответствующими гиперплоскостями; подробное описание этого случая можно найти, например, в [1*] или [2*] (см. ниже). Для иллюстрации всего сказанного воспользуемся прежними примерами систем (3) и (3х). Все три вершины множества XV' мы уже нашли, выясним направления его граничных лучей. Вершина х\ = //21/5 1/5// определяется системой уравнений где и по формуле (8)/,<!>= //4 -1//: (-15), /2<1>= //7 2//: (-15); но так как в этой формуле направления лучей можно задавать с точностью до положительного множителя из Р (деля (3/ на тот же множитель), то достаточно учитывать только знак с1е1Д'</г>, а не точное значение, и в нашем случае удобно считать /,<!> = //-4 1// /2<1>=//-7 -2// Для вершины х'2 = //О —I//будет и мы полагаем Наконец, для вершины х'3 = //1/2 —7/2//имеем Л'<3> = 5 1 1 1 с положительным определителем, Векторы пар /2<1>, /2<2> и /, <2>, /2<3>, соответствующих "встречным" лучам, в окончательном выражении (12) не фигури-
руют, и в качестве направлений граничных лучей множества XV' остаются а общее решение системы или, в координатах, ((XI, ос2, ос3> Р!> р2-0» ос, + ос2 +ос3= О- Предлагаем читателю самостоятельно проверить, что общее решение (2") системы (3) в данном примере имеет вид и записать его в координатах по отдельности. Примечания. 1. Предварительное сведение системы (2) к такой, ранг которой равен числу неизвестных, на практике почти всегда удобно, однако дальнейшее следование теоретическому плану приводит, как правило, к громоздким вычислениям. В [1*] дается упрощенная вычислительная схема. 2. Нахождение неотрицательных решений системы (2) равно- сильно решению системы (А/ Е\-х> \Ь{ ... Ьт 0 ... 0\т+п, где Е - Епп , а для неотрицательных решений уравнений А • к = 6 — решению системы ограничений (А/(-А/Е)).Х> ^ ...Ьт -Ъг..-Ьт 0...0?-; соответствующие вычислительные схемы тоже имеются в [1*].
3. В линейном программировании * — узловом разделе теории оптимизации — ищется наибольшее или наименьшее значение целевой функции Р(х) — линейного функционала Г : М,(Р) —> Р — при ограничениях вида (2) на аргумент х. Широко распространен- ный симплекс-метод решения этой задачи не требует полного исследования структуры множества XV допустимых значений аргумента. 4. При # = 0, когда XV — "конечный многогранник", формула Р (9) вида # = ^схлхл имеет важную физическую интерпретацию: Л=1 если Р = К, а все векторы откладываются от выделенной точки физического пространства (с евклидовой метрикой), то, распреде- ляя единичную массу по концам радиусов-векторов г1 так, чтобы в 1-й конец попала доля ос^ (1= 1, 2, ..., п), получим систему п п материальных точек, для которой Ха'Г* — радиус-вектор центра /=1 массы **. 5. При д = 0 в свете физической интерпретации (п. 4) числа осл можно назвать барицентрическими координатами точки х в я-мерном "многограннике" с вершинами х{, ..., хр\ однако подоб- ное наименование "полноценно" лишь тогда, когда р<пи эти р вершин не находятся в одном пласте размерности А\тТ[<р— 1, т. е. служат различными вершинами р-мерного симплекса, ибо только в этом случае числа а,, ..., ар (т. е. такое распределение единицы массы по р вершинам, при котором центр массы совпа- дает с заданной точкой х симплекса) определяются по х одно- значно (докажите!). Легко видеть, например, что если XV — квад- рат, то барицентрическими "координатами" его центра будут не только (1/4, 1/4, 1/4, 1/4), но также (1/2, 0, 1/2, 0) и др. В рас- смотренном выше примере (У) для каждой точки х е XV' система значений а,, а2, а3 — единственная, но в каком-нибудь другом примере, где, скажем, множество решений имеет вид, показанный * Не смешивать с программированием для вычислительных машин. ** Распространенное название "центр тяжести" неточно (почему? — вопрос не алгебраический).
на правом рисунке, такой однозначности уже не будет (разбери- тесь!). 6. Из результатов раздела "Системы линейных уравнений" непосредственно следует справедливость альтернативы Фред- гольма: либо система (с основной матрицей А) однозначно разрешима, либо однород- ная система (с матрицей Лт) * обладает нетривиальными решениями. Анало- гом этой альтернативы в теории линейных ограничений может служить теорема Минковского—Фаркаша: либо система * И такая же система с нетранспонированной А (почему?).
совместна, либо система обладает решением с неотрицательными г/,, ..., ут. Ее непосред- ственное доказательство сложно, но она обычно используется для получения результата типа теоремы 7 у нас. Попробуйте, наоборот, получить теорему Минковского—Фаркаша из наших теорем. Более подробное изложение теории линейных ограничений см. в книгах [1*] С. Н. Черников. Линейные неравенства. — М.: Наука, 1962. [2*] Д. В. Беклемишев. Дополнительные главы линейной алгебры. — М.: Наука, 1983. Кроме того, можно рекомендовать большую статью Фань Цзи в сборнике "Линейные неравенства и смежные вопросы" (М: ИЛ, 1959, стр. 214—262) и первые две главы (вместе с §3 дополне- ния) книги: Д. Б. Юдин, Е. Г. Голышпейн. Линейное программирование. — М.: Наука, 1963. Непосредственные доказательства теоремы Минковского—Фар- каша имеются также, например, в книгах: С. Т. Завало, В. М. Костарчук, Б. I. Харцет. Алгебра \ теор!я чисел. — К.: Вища школа, 1976. Л. Я. Кулаков. Алгебра и теория чисел. — М.: Высшая шко- ла, 1979.
Билинейные, квадратичные и эрмитовы формы 247 БИЛИНЕЙНЫЕ, КВАДРАТИЧНЫЕ И ЭРМИТОВЫ ФОРМЫ Среди М-линеных форм, наряду с линейными (N=1) и теми полилинейными, на которых основана теория определителей, осо- бого рассмотрения требуют билинейные (2-линейные), порождае- мые ими квадратичные, а также некоторая модификация в случае Р = С. Общее определение полилинейной формы при N = 2 при- нимает вид: Билинейной формой Р(х, у) на линейном пространстве У = У(Р) называется функция Г: У2->Р, линейная по каждому из аргументов, т. е. такая, что при любых * Напомним, что скалярный и векторный сомножители можно переставлять.
где а11 = Р(а1,а1), а А=А(Р) = |а/7|[ — матрица формы Р в базе А, Лт = ||а,-Л — транспонированная матрица. Если, наоборот, функция Р: V2" —> Р от 2п аргументов задана формулой п п ^(*1.-.Уя) = Х 2Х-ЭД /-1 у-« с любыми а„е Р, а в пространстве V выбрана какая-нибудь база А, то непосредственной проверкой убеждаемся в том, что Г, рассматриваемая как функция пары векторов (2), удовлетворяет условиям (1) и обладает в этой базе матрицей Л = ||а/у-||. Выясним, как меняется матрица формы Р при переходе к другой базе В = {6,, ..., &„}, где //Ь{... &„// = Т-//я,... ая// Т = ТА(В) — "тау-матрица" перехода от базы А к базе В (см. конец раздела "Пространства, связанные с матрицей"). Координа- ты векторов х и у преобразуются следующим образом: :*,... *я|| = ||-<... <||-Т, или //х1...хп // = ТТ- //х\...<//, аналогично ||г/,... уп\\ = Тт • //у[... ^ //, и из (3) получаем ^,г/)=и;...<|!.т./1.тт.//г/;...г/;/л т. е. матрица прежней формы Г в новой базе /Г^Т-Л-Т1. (4) Так как Т — невырожденная матрица, то гп^А^Р) = = гп§Л(/7), т. е. ранг матрицы билинейной формы не зависит от выбора базы пространства и поэтому называется рангом гп^Р формы. При гп§Р = п форма Р — невырожденная, при гп§Р<п — вырожденная. Примечания (и упражнения). 1. В отличие от ранга матри- цы А=А(Р), ее определитель при переходе к новой базе изменя- ется: согласно (4), сЫ/Г = сЫТ • (1еЫ • с!еГГ = с!еЫ • (с!е1Т)2. 2. Если формально произвести разные замены переменных:
(не связывая это с базами пространства), то матрица Л = ||а/у-|| п п билинейной формы Г = ^^а1/х1у] перейдет в Т,-Л-Т2Т. м м 3. Покажите, что произведение 1{(х)12(у) = (а,*, + ... + апхп)(Ь1у1 + ... + Ьпуп) двух ненулевых линейных форм — билинейная форма (на том же V) с матрицей ЩЦ" • |йу = |а1Ь]|[ ранга 1, и наоборот, всякая билинейная форма ранга 1 разложима в такое произведение, т. е. любую матрицу ранга 1 можно представить как произведение матрицы-столбца на матрицу-строку. 4. Пусть ^(л:, у) — произвольная фиксированная билинейная форма с Ае{А(Р)фО, а Цх) — любая линейная на том же V. Тогда Ву1е Р V* е Р: Р(х, */ь) = Цх). Докажите! Билинейная форма Р: V2 —> Р называется симметрической, если Р(у, х) = Р(х, у) *, и кососимметрической (в согласии с об- щим определением для полилинейных форм), если Р(у,х) = = —Р(х,у) на V. В пространстве У=У(Р) над полем Р харак- теристики р = 2 оба эти свойства равносильны**, а при р ^= 2 любая билинейная форма Р однозначно представима в виде Р(х,у) = Р1(х,у) + Р2(х,у), где Р{ — симметрическая, Р2 — кососимметрическая. В самом деле, при наличии такого представления, очевидно, также Р(У*х)*Р1(У*х)-Р*(У**\ и из обоих тождеств получаем * Тождество означает, что Ух, уе Р: Р(у, х) = Р(х, у). ** В общей логике — имеют одинаковый объем (как, например, свойства млекопитающего "быть парнокопытным" и "быть жвачным").
непосредственная проверка показывает, что Р} воистину являет- ся симметрической, а Р2 ~~ кососимметрической формой и что сумма их есть исходная ^(л:, у). Если в какой-нибудь базе А матрица А=А(Р) симметрична, т.е. ЛТ=Л, то форма Р — симметрическая: Г(У,х) = \\У1...уА\-А-//х1 ...*У/Ч1*. ...хп\\.А*.//У1 ...г/Л = = \\х1...хп\\-А-//у1...уп//=Р(Х,у) при любых х, у е Р; "наоборот", матрица симметрической формы симметрична во всякой базе: если Р(х, у) = Р(у, х), то ||*, ...хп\\-А-//у1 ...уп//=\\У1 ...уп\\-АУД, ...*„//= Ч1^...^МТУЛ,...*У/ при любых я,, ..., г/„ е Р, откуда, полагая *,-=/, х^ = 0 при Г^=/ и г// = /, ^/у'^0 при //=^=/, получаем аг; = а;/(/, /=1, ..., я). Так же взаимосвязаны свойства кососимметричности формы У7 и ее мат- рицы А=А(Р) (теперь Лт = —Л); докажите! Для заданной билинейной формы Р естественно возникает вопрос о выборе в пространстве У(Р) такой базы, чтобы матри- ца А(Р) имела возможно более простой вид; но вряд ли можно представить себе невырожденную матрицу проще такой, в кото- рой все элементы вне главной диагонали — нули. Если Р задана матрицей А в некоторой базе А, то задача сводится к подбору невырожденной матрицы Т, при которой Л/ = Т-у4-Тт — диаго- нальная. Как ясно из сказанного в предыдущем абзаце, для не- симметрической формы искомой преобразующей матрицы Т не существует. Ее может не быть и у симметрической Р, если пусть и тогда при любых матрица диагональна только если с!е1Т = 0, вопреки невырож-
денности Т. Покажем, что при р(Р)^=2 матрицу симметрической формы Р всегда можно преобразовать в диагональную. Пусть Л(/Г)=Л= |а/у п в некоторой базе А = //а{ ...ап//. Если а,,=^0 и какой-то а1] = а]1^0, то прибавим к 1-й строке первую, умноженную на -о^Ц/, после чего аналогичным образом преобра- зуем 1-й столбец; эта пара операций равносильна умножению матрицы А слева на | и справа на подобными парами операций мы сделаем элемент а,, изолирован- ным. Далее в случае а22^0 (в полученной матрице) аналогичны- ми парами операций превращаем и этот элемент в изолирован- ный, и т. д. Если же на каком-то шаге (возможно, что и на самом первом) оказалось ац = 0 (1<1<п), то при полном отсут- ствии в 1-й строке (и /-м столбце) ненулевых элементов перехо- дим к а/+,14 + |, а если какой-то а^а-^0 (/>/), то прибавляем к 1-й строке /-ю и к 1-му столбцу /-и, от чего диагональный нуль заменится элементом 2а^^=0, поскольку р(Р)=^=2, и далее можно преобразовывать матрицу как выше. В результате получится ди- агональная матрица у4' = Т-у4-Тт, где Т — преобразующая матри- ца вида ТЛ-ТЛ_1- ...Т,, сомножители которой — невырожденные матрицы элементарных преобразований (см. I часть книги), а Тт = Т,т - Т2Т - ... - Т,т . Новой базой будет В= //&,... &„//= Т 7/я, ...ая//, и замена переменных !*, ... хя|! = К ... <||-Т, //у, ... уя II = ТТ - //у{ ... у'„ Ц (5) п п переведет координатное выражение ХХа//^^/ данной формы Р в каноническое — вида
Проиллюстрируем на числовом примере с Р = К, я = 4 способ одновременного нахождения матрицы А' и преобразующей матри- цы Т без фактического вычисления всех элементарных матриц Т,, ..., ТЛ, основанный на уже хорошо известном нам приписыва- нии единичной матрицы. Пусть симметричная билинейная форма имеет в некоторой базе координатное выражение Допишем к ней единичную Е\ и в полученной матрице АЕ из второй строки вычтем утроенную первую: вычитая теперь из второго столбца утроенной первый, получаем матрицу (Справа началось формирование матрицы Т, преобразующей строки А; если бы мы дописали к А единичную матрицу не только справа, но и снизу, то на втором шаге началось бы т. е. матрицу
и формирование матрицы, преобразующей столбцы Л; делать это излишне, поскольку заранее известно, что в конце концов полу- чится Тт.) Прибавляя далее к третьей строке удвоенную первую и к третьему столбцу удвоенный первый, приходим к матрице или, умножив для удобства (чтобы избежать дробей) четвертую строку и четвертый столбец на 2, — к матрице из которой, как выше, получаем и для продолжения процесса сделаем третий диагональный элемент ненулевым, прибавляя к третьей строке четвертую и затем к третьему столбцу четвертый:
Наконец, удваивая (опять ради удобства) последнюю строку и последний столбец, получаем и, после вычитания третьих.- рядов яъ ^етверТыХ, Таким образом, и проверка (предоставим ее читателю) показывает, что Т-Л-ТТ = Л'. Если теперь в исходном координатном выражении для Р(х, у) произвести замену переменных (5), т. е. положить то после раскрытия всех скобок и приведения подобных членов получим каноническое выражение
оно не единственное хотя бы уже потому, что, положив далее (это повлечет появление в (5) дробных коэффициентов), получим Р(х, у) =.х&- х"у" - *з#з + х№> кроме того, можно перенумеровать переменные (одинаково в каждой паре). Итак, справедлива Теорема. Любую симметрическую билинейную форму над полем Р характеристики р(Р) Ф 2 можно с помощью невы- рожденной замены переменных привести к каноническому п виду ^цх'м. Предлагаем читателю доказать, что без требования симмет- ричности билинейная форма приводится к "полуканоническому11 виду Пусть по-прежнему поле Р обладает характеристикой р ф 2. Каждая симметрическая билинейная форма Р(х, у) на простран- стве У = У(Р) порождает функцию Р(х) = Р(х, х) одного вектор- ного аргумента (Р: V —> Р), называемую квадратичной формой. Соответствие взаимно однозначно: из следует Р(х, у) = 2-^{Р(х + у)- Р(х) - Р(у)]; эта билинейная форма называется полярной для квадратичной формы Р(х). Заметим, что и несимметрическая форма
порождает квадратичную Р(х) = Р(х, х), но не восстанавливается по ней однозначно; хуже того: матрицы разных билинейных форм, порождающих одну и ту же квадратичную, могут быть разного ранга! Например, если то Р\(х, х) = Р%(х, х), в то время как ранга 1, а Л(/*) = / О О -/ — ранга 2. Координатное выражение квадратичной формы после приведе- ния подобных членов имеет "треугольный" вид Р(х) = Оц*,2 4- 2а12*,*2 4-... + 2а,пх^п + + й^Я^ + ••• + 2а2пХЛ + но ее матрицу следует писать в симметричном виде А = = у4(/г) = ||аД где все а// = а{-/-, так как тогда процесс приведения ее к диагональной — в точности тот же, что и для соответству- ющей полярной формы, и ранг квадратичной формы гп§Р = гп§Л(/г) тоже не зависит от выбора базы пространства У(Р). Благодаря теореме существует такая база (не единствен- ная), в которой координатное выражение Г имеет канонический г вид Р(х) = ^а1х* . Если Р — упорядоченное поле (следовательно, с характерис- тикой р = 0=^=2), то каноническое выражение квадратичной фор- мы можно уточнить: где а,, ..., а5>0, а5 + 1, ..., аг<0, 0<8<г<п\ покажем, что число з (как и г) не зависит от выбора базы пространства У(Р).
Пусть, например, в базе А имеет место (6), а в базе В — аналогичное представление Р(Х) = ЙЛ'2 + -. + Ь^ 4- Ьм& 4-... 4- йг*г'2 (6') (&,, ..., 6, >0, &,+ ,, ..., Ьг<0), но с />$. Множество векторов, координаты которых в базе А удовлетворяют системе однородных линейных уравнений *,=0, ..., хг = 0, образует в V подпростран- ство V размерности п — г, а система х{=0, ..., х8 = 0, х^+1=0, ..., х'г = 0, в которой переменные ^ заменены их выражениями через {х^}: \\х\ ... я'я|| = ||я1 ... *Л'ТВ(А), — подпространство V" размерно- сти п — [г— (г — 5)] = п — г+ (/ — 5) > п — г, т.е. с11тУ"> сНтУ. Но, с другой стороны, для любого х е V" из (6) следует, что Р(х) < 0, а из (6х) — что ^(х) > 0, значит, Р(х) = 0 и х е Vх, откуда У"с V и сИтУ77^ сНтУ'. К аналогичному противоречию приводит и допущение 7<5. Итак, /==5. Доказанная инвариантность количеств "положительных квадра- тов" и "отрицательных квадратов" в каноническом выражении квадратичной формы называется законом инерции, число 5 — положительным индексом инерции, число г — 5 — отрицатель- ным индексом инерции, а их разность 25 — г — сигнатурой в§пР формы Р\ по» рангу и сигнатуре однозначно определяются оба индекса инерции. Однако условие гп§Р = гп§Р' & $§пР = ^п/7' не достаточно для того, чтобы матрицы А(Р] и Л(/г/) были связаны соотношением типа (4), как показывает хотя бы пример форм х,2 4- я2 и х,2 4- 2л:2. над полем (ф. Квадратичная форма Р с гп§/г== 5§п/г = п = сНтУ (значит, и 5 = я) называется положительно определенной и, очевидно, характеризуется тем, что Р(х)>0 при всех х^=0 (х е V). Критерий Сильвестра. Если Р — положительно опре- деленная квадратичная форма над упорядоченным полем Р, то в любой базе пространства У = У(Р) все угловые диа- гональные миноры матрицы положительны:
"Наоборот", если это условие выполнено в какой-нибудь базе, то форма Р — положительно определенная. Доказательство. Пусть Р — положительно определенная квадратичная форма на V, обладающая, следовательно, каноничес- п ким координатным представлением Р(х) = ^а1х*, где все а,>0. У /=1 соответствующей матрицы определитель а{ а2 ... ап > 0, а так как знак его сохраняется при переходе от канонической базы к любой другой (см. примечание 1 выше), то всегда с1еЫ > 0\ то же спра- * ведливо и для любой "усеченной" формы Рь(х) = ^1а1х* на подпро- /=1 странстве УлсУ векторов вида //х{ ... х& 0 ... О// (или изоморф- ном ему М*(Р)). Поэтому при всех 6= 1, ..., п. Наоборот, пусть все Ае\А(Р^ >0. Угловая подматрица Тл матри- цы Т, преобразующей А в диагональную согласно (4), приводит & х /^-матрицу формы /^ к диагональному виду с определителем а, а2... ал (почему?). Но из неравенства а1а2^.а^>0 при * = 1, 2,..., я, очевидно, следует, что все а,>0. Упражнение. Применив критерий Сильвестра к случаю я = 2 (и Р = К), вывести "школьный" критерий положительности квадратного трехчлена ах2 + Ьх + с. Невырожденная квадратичная форма Р(х) называется отрица- тельно определенной, если форма —Р(х) — положительно опре- деленная, т. е. Ух € У\{0}: Р(х) < 0. Предлагаем читателю дока- зать, что критерий Сильвестра в этом случае принимает вид: форма Р является отрицательно определенной тогда и толь- ко тогда, когда йе{А(Р^)<0 при нечетных Ь и Ае{А(Р^>0 при четных Ь. Форма, в каноническом представлении (6) которой I <8<г (имеются как "положительные квадраты", так и "отрица- тельные"), называется неопределенной. Наконец, вырожденную форму Р(х)-^а^ (г<п) с коэффициентами одного знака назы-
вают полуопределенной (или, например, неотрицательно опре- деленной). Остановимся еще на распадающихся квадратичных формах Г — представимых как произведение двух линейных: Г(х) = Ь{(х)Ь2(х) — над произвольным полем Р характеристики р^=2. Таковы, в частно- сти, все формы Г ранга 1, ибо полярная форма Р(х, у] для Г(х) имеет (в любой базе) ту же матрицу ранга 1 и, согласно примеча- нию 3, представима в виде Р(х, у) = 1^\(х)1^2(у), откуда Р(х) = /г(х, х) = Ь1(х)Ь2(х). Сюда же тривиальным образом относят- ся и нулевые формы (гп^/г = 0)*. Однако распадаемость полярной формы — только достаточное, но не необходимое условие распада- емости соответствующей квадратичной формы: например, Г(х) = я,2 - х2 = (х{ + х2)(х{ - х2), а Р(х, у) = х1у1 - х2у2 не распа- дается (докажите от противного!). Теорема. Ранг распадающейся квадратичной формы (над полем Р характеристики р=^2) не превосходит 2. Доказательство. Пусть Р(х) = 1^{(х}1^2(х], где /,,(*) = а,*, + а2х2 + ... + апхп, 12(х) = Ь{х{ + Ь2х2 + ... + Ьпхп. Если хотя бы одна из форм /,,, Ь2 — нулевая, то гп§Р = 0. Если же обе формы ненулевые и, например, а{=^0, то в случае линейной зависимости этих форм существует такое А,е Р, что ^2(x) = А,^,(^с), а в случае независимости можно без нарушения общности считать, что В первом случае переход к новым переменным х{ = 1^(х), х' = х1 при I > 2 приводит форму Г к виду ^2 с матрицей ранга 1, а во втором случае преобразование х[ = Ц(х), х'2 = 1^(х), х' = х1 при I > 3 придаёт Р вид х[х'2 с матрицей ранга 2, причем оба раза матрицы перехода (а значит, и обратные им) — невырожденные, поскольку * А может ли произведение ненулевых форм оказаться нулевой формой?
Теорема доказана, так что вопрос о распадаемости квадратич- ной формы Г (над Р с РФ2) остается открытым только при гп^/7 = 2 и решается по-разному для разных полей. Например, если Р = С, то двучлен а1х/12+а2х/22 всегда можно разложить, при Р = К можно в том и только том случае, когда а, и а2 — разных знаков, т. е. 5^п/г = 0, а при Р = <2 и этого недостаточно: уже х'2 - 2х'22 не раскладывается! Упражнения. 1. Билинейная форма Г на пространстве У = У(Р) определяет два подмножества: {хе \/Чуе V: Г(х,у) = 0} и {у е У/Ух е V: Р(х,у) = 0}\ докажите, что оба они являются подпространствами V. Г. Если здесь Г симметрична, то оба подпространства совпа- дают, и единое подпространство мы называем аннулятором Апп Р как самой Р(х, у), так и порожденной ей квадратичной формы Р(х) = Р(х, х) (последнее — в предположении р(Р)^=2); докажите, что сйт(Апп Г) = сНтV — гп§Р. Пусть на У==У(Р) с рф2 и ё!тУ = п заданы ненулевая квадратичная форма /г = /г(х), линейная форма /, = Цх) и "нуль- мерная форма" уе Р — элемент, не зависящий от х. Рассмотрим в V образ второго порядка — множество Г таких векторов, что если считать здесь "текущий" х радиусом-вектором, откладывае- мым от фиксированного начала, то множество Г концов таких х * Коэффициент 2 вводится для технического удобства.
образует гиперповерхность второго порядка. Для изучения тех свойств Г, которые не зависят от выбора базы А пространства V, возьмем такую А = {«,,..., а„}, в которой форма Р имеет кано- нический вид и, следовательно, координатная запись уравнения Г , будет где не все ^ = 0. Для каждого такого /, при котором преобразуем соответствующую пару слагаемых: в результате такой замены текущих координат (равносильной переходу от А к новой базе, в которой каноничес- кая форма Р остается прежней) и перенумерования переменных уравнение (8) примет вид где 1 <г<п и все ос,=^0, а в обозначениях новых коэффициентов и переменных штрихи опущены. Если здесь рг+1 =... = р„ = 0, то окончательный вид уравнения (8) будет в противном случае замена рг+ {хг+, + ... + Рл= х"+1 приведет (8') к окончательному виду (с опущенным двойным штрихом) в обоих случаях Может случиться, что левая часть исходного уравнения (8) разлагается на два линейных множителя /,, и /,2; тогда
распадающаяся гиперповерхность, она представляет собой пару пластов с уравнениями /^=0 и 1^2 = 0 (в частности, один "дваж- ды взятый" пласт, если эти уравнения равносильны), и приво- дить (8) к виду (9) или (10) незачем. Нераспадающиеся же ги- перповерхности подразделяются на центральные и нецентраль- ные, смотря по тому, имеет их приведенное уравнение вид (9) или (10); название обусловлено тем, что в первом случае хе Г<=>—хе Г при любом х е V, т. е. общее начало всех ради- усов-векторов служит центром симметрии гиперповерхности Г, а во втором случае такого центра у Г нет. При у=0 гиперповер- хность (8) — коническая, т. е. Ухе V \/А,е Р: хе Г=>Ъсе Г. Если в (9) г<п или в (10) г<п—\, то Г — цилиндрическая: ее направляющей служит гиперповерхность Г' размерности //<г, а образующими — проходящие через И (п — г— 1)-мерные плас- ты, не имеющие с /-мерным подпространством в V, содержащим П, других общих точек. Нераспадающиеся гиперповерхности, отличные от конических и цилиндрических, называются истинными', дальнейшая их клас- сификация, связанная с сигнатурой формы Р, имеет смысл в пространстве над упорядоченным полем Р. Гиперповерхность (9) при г = п, у=^=0 и а,,..., аг>0 — "гиперэллипсоид" (в У(К) "мни- мый", когда у>0), при а{ разных знаков — "гипергиперболоид" того или иного типа ("однополостный", "двуполостный" и т. п.) в зависимости от з^п/7. Гиперповерхность (10) — "гиперпараболо- ид", тип которого тоже зависит от в^п/ч В обычной декартовой плоскости V2 гиперповерхности Г — это кривые второго порядка, в пространстве V3 — поверхности второго порядка; они изучаются в курсе аналитической геомет- рии. В общем же случае линейных пространств для исследования величин такого рода, как длины полуосей эллипса, угол между асимптотами гиперболы и др., не охватываемых намеченной выше аффинной классификацией, надо в пространстве V ввести метрику, что и будет сделано в следующем разделе. В линейном пространстве У = У(С) над полем Р = С комплек- сных чисел важную роль играют не прежние билинейные формы в смысле определения (1), а их модификация, за которой прочно закрепилось имя первооткрывателя: эрмитовой (подробно: эрми- тово-билинейной) формой называется функция Н: V2 —> С, такая, что при любых х, х{, #2, у, *л, у2 е V и А,е С
Н(х{ + *2, у) = Я(*„ у) + Я(*2, у), #(*. У» + 02) = Н(х, у,) + Н(х, у2), Н(Хх,у) = КН(х,у), Я(хД*/)= ХЯ(х,*/), (11) где X — число, сопряженное с А,. Если в базе А = {а,, ..., ап} пространства V векторы х и у имеют выражения (2), где теперь я,,...,(/л — комплексные коор- динаты, то с а/; = Я(а^, ар, и наоборот, всякая функция от х и у, заданная формулой (12) с произвольными а/;-еС, удовлетворяет условиям (11). Если В = {61,..., 6Л} — другая база пространства V и IIЪ, ... ЬЛ = Т-//а, ... а„// ||х, ... *„|| = |К... < II-Т, ^ ... УЯ\ = Ы ••• Уп!-? , значит //у,...уп// = ^ .//у[...у'п//, где Т = |т;;.|[ и Тт=|т(/|[, то матрица Л = А(Н) = ||а(/1[ эрмитовой формы преобразуется в Л' = Т-Л-ТТ. (13) Отсюда ' гпдА' = гп§"Л = гп§Н — ране эрмитовой формы, а с!е1Л/ = (с1е1Л)-|с1е1Т|2, поскольку * с!е1 Т = '[т^. = |ту/1 = с!е1 Т и с • с = |с!2 для любого се С. Функция Я(х) = Я(х, х) одного векторного аргумента, порож- денная эрмитовой формой Я(х, у) на V и называемая эрмитово- квадратичной формой, теперь определяет свою "родительницу" однозначно: из тождеств * Не смешивать символ определителя | | с точно таким же обозначением модуля (абсолютной величины) комплексного числа.
(объясните, как .они получены из (11)!) выражаем откуда Матрица А у обеих форм, конечно, одна и та же. Эрмитова форма //(*, у] называется эрмитово-симметричной, если Н(у,х) = Н(х,у) и, следовательно, ее матрица А(Н] = Ца^-Ц в любой базе удовлетворяет условию Лт = А (т. е. все а/4. = а^ ), поскольку Я(ау, а.) = Я(а4., ау); такая матрица тоже называется эрмитовой; порожденная этой формой симметричная эрмитово- квадратичная форма Н(х) = Н(х,х) принимает при всех хе V только действительные значения (почему?), и у V существует п п база, в которой Н(х) = ^А,Лл;Л.к* = ^А,Л |*Л с действительными Л=1 Л=1 А,Л; процесс приведения формы к такому каноническому виду отличается от изложенного выше только тем, что если 1-я строка преобразуемой матрицы умножается на А,е С, то затем 1-й стол- бец надо умножить на X, а если к 1-й строке прибавляется /-я, умноженная на А,, то следует прибавить к 1-му столбцу /-и, ум- ноженный на X. Остаются в силе закон инерции и критерий Сильвестра (его формулировка не теряет смысла, поскольку все диагональные миноры матрицы Л, включая сЫЛ, — действитель- ные числа; почему?); доказательства почти дословно прежние.
Замечание. Для квадратичных (не эрмитово-квадратичных) форм над полем С закон инерции не имеет места, а формулиров- ка критерия Сильвестра становится бессмысленной; например, форма х* + х* заменой переменных я, = х(, х2 = 1х'2 преобразует- /2/2 л, „.111 + 1 ся в х> -х2 , а у формы с матрицей А= определи- 1 + / 1 тель Ае{А = 1 — 21 не является действительным числом. Историческая справка. Зачатки теории квадратичных форм усматриваются уже у древних греков — в теореме Пифа- гора и "геометрических уравнениях" конических сечений (см. вводную лекцию), а билинейные формы фактически фигурируют у Архимеда (сопряженные диаметры) и Аполлония (полюсы и поляры). Но и с появлением метода координат Декарта и Ферма, когда эти формы приобрели аналитический характер, они вначале применялись почти исключительно к кривым второго порядка. Задачу приведения квадратичной формы, как многочлена от п переменных, к каноническому виду, возникшую при исследовании экстремумов функций многих переменных (с приложением в пер- вую очередь к механике), решил в 1759 году Лагранж, а закон инерции открыли почти через столетие Якоби, Гаусс и Силь- вестр. Общее же изучение форм как функций от пар векторов линейного пространства — достижение конца XIX и начала XX века.
ЕВКЛИДОВЫ И УНИТАРНЫЕ ПРОСТРАНСТВА С помощью квадратичных форм можно метризовать линей- ные пространства У(К) и У(С), т. е. приписать в них каждому вектору число — длину, а каждой паре векторов — числовое зна- чение угла между ними. Действительное пространство У(К) с за- данной на нем положительно определенной квадратичной формой Р(х) называется евклидовым, а комплексное У(С) с заданной по- ложительно определенной симметричной эрмитово-квадратичной формой — унитарным. Рассмотрим оба случая по отдельности. Пусть УС = (У(К), Г) — евклидово пространство с фиксирован- ной формой Р(х)\ значение ее полярной формы Г(х, у) е К от заданной пары векторов х, у е УЕ называется скалярным произ- ведением этих векторов и, как правило, обозначается просто через (х,у). Из равенств (1) в начале предыдущего раздела и из положительной определенности Г(х) непосредственно вытекают свойства скалярного умножения: (*/, х) = (х, у) — коммутативность, (*[ + #2, у) = (*,, у) + (#2, у) — дистрибутивность, (А,х, у) = А,(х, у) при любом А, е К — однородность, (*,*)> О при всех х=^0, (О, 0) = 0. Длина (модуль) \х\ вектора х е Уе определяется как \х\ = ^Р(х) (арифметический корень из неотрицательного числа), а угол между векторами х и у из Уе — как такой ср = (р(х, у) е [0, я], для которого совф = ; корректность последнего определе- \*\'\У\ ния обеспечивается неравенством Коши-Буняковского * * О. Л. Коши получил его для пространства М'^С) со скалярным произведе- нием (Ц*,' ... *„||, //у{ .... уп//) = х}у} 4- ... 4- хпуп, а В. Я. Буняковский — для бесконечномерного пространства функций, непрерывных на фиксированном ь отрезке [а, Ь] с К, со скалярным произведением (/, #) = \ ?(1)ё(1)с11 \ в са- а мом же общем случае это неравенство связывают также с именем Шварца. Здесь, как и выше, | | может означать и длину вектора, и абсолютную величину числа; читатель должен уметь сам разобраться, что к чему, по смыслу величин, входящих в формулу. Другой пример: равенство \\х\ = |Х| • |*| (докажите его).
Евклидовы, и унитарные пространства 267 К*, 0)1 * М-101, (1) доказывамым просто и красиво. Именно, (\х — у, Ъг —*/)>0 при любых х, */е V и А,е К. (заме- тим кстати, что равенство здесь имеет место только при А,х — у = О, т. е. когда векторы к и у коллинеарны), или, в раскрытом виде, |х|2А,2 — 2(х, у)^ + \у\2 > 0. Но условие неотрицательности квадратно- го трехчлена относительно А,, с фиксированными х и у, равносильно (1) (а условие строгой положительности — строгому неравенству в (1)). С помощью этого неравенства из тождества получаются оценки т. е. неравенства треугольника а в случае, когда векторы ортогональны: (х, */) = 0 (х±у), — теорема Пифагора \х + у\2 = \х\2 + \у\*. Всякая система Х = {хи ..., хт} с УЕ попарно ортогональных ненулевых векторов линейно независима: предположив, что К{х{ + ... + А,*, + ... + Кяхп - О, и умножая обе части равенства скалярно на вектор хп получим М*и */) + ... + А.Д*,, х,) + ... + Хт(хт, Х1) = (0, х,) = О, т. е. ^(х/, ж/) = 0, где (х-„ х^ Ф 0, откуда следует, что все А,, = 0. При т = Аг = (ИтУе система X является базой пространства Уе, и такие ортогональные базы на самом деле есть: это все те (и только те) А = (а{,..., ап}, в которых метризующая форма Р имеет каноничес- кий вид, поскольку
тогда и только тогда, когда (а„ а,) = а, Ф 0 и (а(, а;-) = 0 при /=тН. Более того, базу А можно еще нормировать, умножая каждый а1 на 1/10/1; новые базовые векторы е1 = а1/\а1\ будут единичной длины, и в ортонормированной базе Е = {е{,..., еп} метризующая п форма выражается наиболее просто: ^00 = Х^2, а скалярное 1-1 произведение 1=1 матрица обеих форм — единичная Е = Епп . Наоборот, из равен- ства А(Р) = Е следует ортонормированность базы, в которой вычислена матрица форм Г (докажите!). При переходе от Е к другой базе В = {&,,..., 6П}, где ЦЬ\ ... Ьп// = Т-//е. ••• еп//, последняя тоже будет ортонормированной ((//&! ... 6п/у, ||б,,..., &Л) = Е) * в том и только том случае, если матрица перехода Т = ТЕ(В) удовлетворяет условию Т-ТТ = /: (или, что равносильно, Т~1=ТТ), поскольку //6, ... бУ/.||б|,...,бя||-т.//в1...еУ/-11в1...вя|1-тт- = Т.Е.Тт = Т.Тт Матрица, для которой транспонированная совпадает с обрат- ной, называется ортогональной. Для произвольной системы векторов X = {*,, ..., хт} с УЕ ее матрица Грама * Смысл такого обозначения станет наглядным, если скалярное произведение (х, у) писать в виде ху.
несет полную информацию о длинах этих векторов и углах между ними, независимо от выбора базы, но от него зависит координатное выражение элементов матрицы: если в базе А = {а„...,а„} х -||*, ... *я|| - //а, ... ал// у = ||а, ... ая|| - //у, ... */„//, то из равенств (3) предыдущего раздела получаем, когда Р — скалярное произведение: (х,у) = \\Х1...Хп\\-С(\)-//У1...ул//. (3) При переходе к новой базе В с //Ь{ ... Ьп// = 1-//а{ ... ап//, Т = ТА(В), будет 1*,... *п|| = к... дат, //и ... Уп// =тт. //</;... г/;//, и из (3) (^^«^..^(•Т-ОСА).!1.//^...^//, т. е. матрица 0(А) преобразуется по уже знакомому нам за- кону в 0(В) = Т.О(А).ТТ. Вернемся к системе векторов X = {*,,..., хт} с УЕ с произволь- ным т е N. где *л = ||ял, ... хЛя||-/^а, ... а„у/ (и = 1,..., т) в базе А. На основании (3), (*,., *у) = ||*п ... ^Л« 0(А) - //хп ... х1п II ([, /= 1,..., т), откуда 0(Х) = в частности, если А = Е, то
Теорема. гп^С(Х) = гп^Х = сНтЦХ). Доказательство. Если между векторами X имеется ли- нейная зависимость, то, как вытекает из определения скалярного произведения, точно такая же зависимость будет между соответ- ствующими строками (и столбцами) матрицы С(Х), откуда гп^С(Х) <гп^Х. Наоборот, если есть зависимость, скажем, строк 0(Х): М*|.*Л + -» + Ь«(*«.**)вО. *=!,..., т, (*) то А,,*,+ ... +А,т#т = 0, ибо вектор у== '^1х1 + ... + ^тхт е ЦХ) вви- ДУ (*) ортогонален всем *Л, значит, и всем хе ЦХ), в том числе самому себе: (у, */) = 0, откуда # = 0; таким образом, гп&Х<гп&0(Х). Следствие. Система X линейно зависима тогда и только тогда, когда гп^О(Х)<т, т. е. когда определитель Грама этой системы (1еЮ(Х) = 0. Число гп^С(Х) зависит только от углов между ненулевыми векторами системы X, поскольку умножение строк и столбцов матрицы 0(Х), соответствующих этим векторам, на модули пос- ледних не меняет ранга матрицы. Например, в евклидовой плос- кости для пары X = {*, у} ненулевых векторов в трехмерном евклидовом пространстве для тройки {*, у, г} нену- левых векторов определитель преобразованной матрицы Грама * Напомним, что ранг системы векторов — это наибольшее количество тех из них, которые образуют линейно независимую подсистему; оно равно размер- ности линейной оболочки ЦХ) — подпространства в УЕ, порожденного век- торами X.
и равенство его нулю представляет собой цельный алгебраи- ческий критерий компланарности этой тройки, который в чисто геометрической трактовке разбивается на несколько случаев. Два подпространства V, V" с Уе образуют ортогональную пару, V Л V", когда V*' е V V*" е V": (*', х") = 0; пересечение таких подпространств состоит только из нулевого вектора: если х е V & х е V", то (х, х) = 0, откуда х = 0. Предоставляем чита- телю доказать, что если два множества векторов X, V с Уе удовлетворяют условию V* е X V*/ е V: (~х, */) = 0, то их линейные оболочки ЦХ) и ЦУ) образуют ортогональную пару подпространств. Если Уе=У| + ...+ У, (сумма подпространств, см. раздел "Линейная зависимость векторов"), и если 1Ф\ => => V^±V| (/, /=!,...,/), то сумма — прямая: Уе= У! Ф ... в У;, / т.е. любой х е Уе однозначно представим в виде * = ^Гхл, где *А€ У, (*-!,...,/). В случае / = 2, когда Уе= Vх Ф V" & Vх 1 Vх, каждое из под- пространств Vх, У/х является ортогональным дополнением дру- гого до всего Уе и любой вектор х е Уе допускает единствен- ное представление х = х' + х", где х' принадлежит наперед заданному подпространству Vх с Уе, а х" — его ортогональ- ному дополнению V"; первое слагаемое называется проекцией вектора х на подпространство Vх, второе — перпендикуляром к Vх, а длину \х"\ можно назвать расстоянием вектора х от (до) подпространства Vх, хотя наглядный смысл этого проявится только в геометрической интерпретации. Фактическое нахождение х' и к" по данным х и V несложно. Пусть У'=Ь(Х), где X = {*,,..., #т}, причем эти т векторов,
задающие подпространство, даже не предполагаются линейно независимыми. Так как искомый *' принадлежит V, то должны существовать такие А,,, ..., А,те К, что х/ = Х1х, + ... + А,тхт; а чтобы второй искомый вектор х" = х — х' был ортогонален V, нужно подчинить числа А,Л условиям (х — к', хл) = 0, т.е. (*Л, *') = = (х^ х) при всех &=!,..., т, что дает систему т уравнений ее решение //А,1 ...А,т// существует; оно в случае с!еШ(Х) = 0 не единственно, но какое бы из решений мы ни выбрали, резуль- о о тирующие векторы х/ = Ал л:, +... + А,т хт и х" = х — х' от этого не зависят (объясните, почему). Если известны длины всех векторов X и углы между ними, то коэффициенты системы (6) в принципе определяются без всяких баз и координат, но на практике обычно пользуются координат- ным представлением векторов; базу в Уе можно выбирать произ- вольно, чаще всего употребляют ортонормированные базы: в них скалярные произведения вычисляются особенно просто. В терминах и обозначениях раздела "Линейные образы в мно- гомерной геометрии" задача о перпендикуляре формулируется следующим образом: в евклидовом пространстве Уе=(У(К), Р) задан пласт П = П(У/, хп) — параметрическим уравнением х = хп + А,,/, + ... + Хт/т, и дана точка *0ё П — радиусом-векто- ром, обозначенным тем же символом *. Требуется через точку *0 провести прямую Пи перпендикулярную П, и найти точку пересечения П\ П IX Для решения достаточно представить век- тор хп — *0 в виде суммы *' + х", где х' е Vх и х" ± Vх, и тогда П, п П = {хо + х"}, а сам х" можно принять за направляющий вектор искомой прямой ГГ и написать ее параметрическое урав- * На рисунке пусть читатель сам разберется, какими из жирных символов обозначены свободные векторы, а какими — радиусы-векторы точек.
нение: х = х0 + Хх"(А,е Р). Если х0еП, то при сНтП<я — 1 пер- пендикуляр определяется неоднозначно, а составить его уравне- ние в случае сНтП = я — 1 мы предлагаем читателю. Упражнение. Покажите, что если (п — 1)-мерная гипер- плоскость П задана в ортонормированной базе уравнением а{х{ +... + апхп = Ь, то вектор /= //^.../„//ортогонален П в том и только том случае, когда он коллинеарен вектору а= //а, ... аУ/ Числовой пример. Рассмотрим шестимерное евклидово пространство Уе = М^ (К, Р) векторов-столбцов х= //х{ ... х^// со скалярным произведением (х,у) = х1у[+ ... +х6у6, благодаря чему естественная база пространства будет ортонормированной. 4 Пусть пласт Пс:Уе задан параметрически: х = хп +^А,/#/ , где заметим, что система векторов X = {*,, *2, А:З, А:4} в данном случае линейно зависима, так что для конечной точки х е П числа {\} определяются неоднозначно, но, как мы еще раз убедимся, это
не влияет на окончательный результат. Зададим еще точку *о= //0 11—11 1// (своим радиусом-вектором) и не будем выяснять, принадлежит ли она пласту П — это потом опреде- лится само собой. Наша цель — получить уравнение вида х = х0 + М прямой, проходящей чрез л:0 ортогонально П, и найти точку пересечения — проекцию х0 на Ц Вычисляем
т. е. А,, =0, А,2 = — 1+2А,4, А,3=1—А,4. Проекция вектора л:п —л:0 на подпространство ЦХ) как мы видим, определяется однозначно (хотя гп^С(Х) = 3, а не 4). Вектор нормали к Ц *" = (*п - *0) - Xх = //0 0-110 -1// и уравнение перпендикуляра х = *0 + А,х" (проверьте, что дей- ствительно х±Хц /=1,2,3,4), точка пересечения его с П имеет радиус-вектор *0 + х"= //О 1 О О 1 О// Если в данных задачи изменить только точку *0, полагая те- перь х0= //0 1001 О//, то прежний процесс решения приведет, очевидно, к этой же точке, но будет уже х" = 0; в новых усло- виях пласт П является подпространством, а его ортогональное дополнение состоит из направлений / всевозможных нормалей (перпендикуляров) к П в точке *0. Найдите какие-нибудь две нормали, с последующей проверкой. Одно из важных приложений задачи о перпендикуляре мы тоже продемонстрируем на конкретном примере. Допустим, что непосредственное измерение длин х, у, 2, и, V затруднительно, но с помощью косвенных измерений удалось получить такие результаты:
Вследствие неизбежных погрешностей, даже небольших, в процессе измерений, получаемые таким образом системы уравне- ний, как правило, несовместны. Отбрасывание уравнений, "портя- щих систему", может привести к тому, что ранг оставшейся совместной системы окажется меньше числа неизвестных; но и без этого пренебрежение некоторыми из результатов косвенных измерений — это частичная потеря информации, способная лишь ухудшить конечный результат. Как найти х, г/, 2, и, V "наиболее точно", используя данные всех измерений? Слова "наиболее точно" сами нуждаются в уточнении. Суще- ствует много разных критериев "качества приближения" — они рассматриваются в курсах приближенных вычислений, обработки результатов наблюдений и др.; в "мире чистой алгебры" наибо- лее естественным представляется следующий подход. Прежде всего убеждаемся в том, что система А - к = 6, где несовместна, но гп§Л = 5 (упражнение для читателя). Принципи- альная важность требования, чтобы ранг основной матрицы был наибольшим возможным, т. е. равным числу неизвестных, ясна уже из банального примера: если результаты измерений двух ее ни обрабатывали, узнать, хотя бы приблизительно, значения и (3 по отдельности невозможно — можно только их сумму. величин ос и р привели к системе то как бы мы
Окажись в нашей задаче г^пЛ < 5, мы бы заключили, что сама система косвенных измерений "плохо организована" и не позво- ляет найти хотя бы "с приличной точностью" значения всех пяти неизвестных. В случае гп%АЬ = 5 вектор Ь принадлежал бы пространству 5 = 5(Л)сМ^(К) столбцов матрицы А (см. раздел "Пространства, связанные с матрицей"), но раз это не так, то естественно ис- кать в 5 такой вектор 6', для которого вектор-разность Ь' —Ь обладает наименьшей длиной, т. е., в силу обратной теоремы Пифагора, ортогонален подпространству 5. Обозначив через $,,..., $5 векторы-столбцы Л, вычисляем и решаем систему
т. е., округляя: * = 3,3; у = 2,3; 2 = 3,1; и =1,0; у =1,2. Чтобы читатель мог оценить качество полученного результата, скажем по секрету, как был изготовлен этот пример: сначала мы взяли лс = 3,3, у = 2,4, 2 = 3,0, и =1,0, 1>=1,2, затем составили систему уравнений с основной матрицей А и, наконец, "подпортили" не- которые из правых частей на ±0,1. От линейных образов в евклидовом пространстве перейдем к квадратичным. Преобразование одной базы пространства Уе в другую и соответствующую замену переменных назовем ортого- нальными, если ортогональна матрица перехода Т. При исследо- вании метрических свойств образов в Уе решающую роль играет возможность приведения квадратичной формы к каноническому виду ортогональным преобразованием. Логическое обоснование
такой возможности удобно начать с решения задачи, на первый взгляд искусственной: дана матрица ЛеМ^(Р), требуется так подобрать элемент ос из поля Р или некоторого его рас- ширения, чтобы матрица А — аЕ оказалась вырожденной. Зна- чимость этой задачи в столь общей постановке пока не усматри- вается, и многие важные проблемы, приводящие к ней, еще не удалось объединить "под одной крышей". Если сама А — вырожденная, то задачу решает значение а = 0 (возможно, и не только оно). В общем случае назовем матрицу А — аЕ, зависящую от параметра а, характеристической мат- рицей для А, и тогда искомое значение параметра должно быть корнем характеристического (или векового) уравнения А^(А-аЕ) = 0. (7) Лемма 1. При симметрической матрице ЛеМ^(К) все корни уравнения (7) — действительные числа. Доказательство. Пусть Л = ||аД аг/ = а/р все а„ е К. По основной теореме алгебры уравнение (7) обладает комплексными корнями; возьмем любой из них ос е С и покажем, что на самом деле ос е К. Из (7) следует существование у однородной системы (А - аЕ) • х = О нетривиального решения х = $ = /А, 52... 5„//е М^С); при нем справедливы п равенств * в поле С: умножая их на сопряженные числа 5,, 52, ..., 5„ и складывая, получаем * Здесь нам будет удобнее индексация коэффициентов а/;-, отвечающая транс- понированной матрице (напомним, что ЛТ=Л).
и, как легко показать (предоставить это читателю), обе суммы — действительные числа, причем первая заведомо отлична от нуля. Поэтому и ос е К. Каждый корень а уравнения (7) называется собственным зна- чением матрицы Л, а ненулевой вектор 5 е Апп(Л — аЕ) *, коорди- наты которого в естественной базе пространства М^Е) находятся из системы уравнений — собственным вектором, соответствующим этому значению. Вектор 5= //в{ $2 ••• вп// определяется системой (8) неоднозначно — по крайней мере с точностью до множителя из К, так что орт е\ = 8/\8\ тоже будет собственным вектором. Лемма 2. Если В = {е,', е'2, ..., е'п} — такая ортонормирован- ная база пространства М[,(К), в которой ортом е[ слу- жит собственный вектор симметрической матрицы Л = М^(К), а Т,=ТЕ(В) — матрица перехода от стандарт- ной базы Е = (е{, е2, ..., еп] к новой базе В, то в матрице А' = а^| = Т, • А • Т,т элемент а[{ — изолированный. Доказательство. Так как Це{ е'2 ... е'п //= Т{ •//е1 е2... еп// , ае,- //1,0,..., О//, е2= //О, 1, .... О//, .... еп= //0,0,...,!// то -г !| Iя строками матрицы 11=||т//| являются строки координат новых * Вспомните определение аннулятора матрицы (см. раздел "Системы линейных уравнений").
базовых векторов в старой базе, в частности, элементами первой строки ||тц т,о ... т1п|| — координаты собственного вектора 5 = 11$, $2 — 5п11- В матрице на основании (8) и ортогональности матрицы Т,. Итак, что и требовалось. будут изолированными уже и т.д., пока не получится диагональная матрица Т-Л-Т1, где Т = Тт-... • Т2-Т,, будучи произведением ортогональных матриц, Применяя далее эту лемму к матрице найдем для ортогональную такую, что в матрице равен при элемент
ортогональна (т<п\ а почему может быть т<я?). Тем самым доказана Теорема. Для любой симметрической матрицы А с дей- ствительными элементами можно найти такую ортого- нальную Т, чтобы матрица Т-Л-ТТ была диагональной. Следствие. Всякую квадратичную форму Р на евклидо- вом пространстве Уе можно привести к каноническому виду ортогональным преобразованием переменных,. При ортогональной матрице Т (Т-ТТ = /:): Ае{(А'- <хЯ) = с!е!(Т - (А -аЕ)- Тт) = с!е1Т - с!е!(Л - <хЕ) • (1е1Тт = = с!е!(Л - оЯ) - с!е!(Т - Тт) = с!е!(Л - оЕ), так что если А' — диагональная матрица, то (равенство многочленов от а), т. е. откуда следует, что коэффициентами ц в каноническом представ- лении /г = Та.л://2 квадратичной формы с матрицей Л(/Г) = Л на Уе как раз и являются корни характеристического • уравнения. Для каждого корня а, уравнения (7) 1-й элемент диагональной матрицы А' — щЕ равен 0, а координатное выражение вектора е' канонической базы в самой этой базе имеет вид //0 ... 1 ... О// с единицей на 1-м месте, следовательно, (/Г-а^)-< = <7, и™ Т.(Л-а/5).Тт.< = 01". Умножая последнее равенство на Гт = Г"1 слева, получим
Но Тт-е'= /Утп ...ъ(п // — столбец координат вектора е( относи- тельно исходной базы {е,,... еп}), и равенство (9^ означает, что Тт - е( е Апп(Л - а.Е) с М^(К). Пусть а,,..., сс^ — все различные корни уравнения (7). Если Ь(1) — кратность 1-го корня, то гп^(Л - а^) = гп2(Л' - <Х;Я) = п - &(/), поскольку в диагональной матрице А' — щЕ ровно &(/) элементов — нули; значит, сПтАпп(Л — а,/:) = Ь(1). Но из (А — а^Е) • х = 0 & (А' — а^Е) • х = О следует (а, - ау)Я • х = (а, - ау)х = О, и если 1Ф\, т. е. а^ау, то х = 0. Поэтому сумма всех ^ подпро- странств Апп(Л —а^) — прямая, и так как Я <7 2^ Й1т Апп (А - а.Я) = ^ ОД = я, ;=1 /=1 то всё пространство разлагается в прямую сумму "корневых подпространств": М7(К) = Апп(Л - а{Е) ® ... ® Апп(Л - а^), причем это разложение (свое для каждой симметричной матрицы А) определено по А однозначно с точностью до порядка слагае- мых. Таким образом, множество столбцов матрицы Т = ||т^|| разбива- ется на ^ классов, 1-й класс состоит из Ь(1) векторов своего "корневого подпространства" (/=!,...,</). Так как, согласно тео- реме, для заданной симметричной А существует ортогональная Т, преобразующая ее в диагональную, то все ^ подпространств автоматически оказываются попарно ортогональными *, и для построения матрицы Т достаточно в каждом из них найти свою * Тот, кого подобный "автоматизм" не убеждает, может сослаться на легко доказываемый факт: если Апп(А — аЕ), Апп(Л — а'Е) € УЕ и афа', то оба подпространства образуют ортогональную пару.
ортонормированную базу и объединить векторы этих баз. Проил- люстрируем всю процедуру на конкретном примере формы Р = х2-2у2- 2г2 +12 - и2 - V2 - 4ш2 - 2** + 8уг + биа. Здесь корни характеристического уравнения с!е1(Л — аЕ) = 0: Будем последовательно находить такие векторы (/=!,..., 7), которые после нормировки — деления каждого $,у на лз*;+... + 572у — становятся столбцами //ъ{]- ... т7/// искомой матрицы Т = |т.у \7. Для корня а, =—6 кратности 1:
гп§(Л + 6Я) = 6, сНтАпп(Л + 6Я) = 7-6=1, и из уравнения (Л + 6Е) •$,= О, т. е., в координатах неизвестного вектора $ь из системы 7$п— 541 = 0, 4$21 + 4531 = 0, 4$2, + 4$31 = 0, -5,, + 7$41 = 0, 555, + 3$61 = 0, 355, + 5$61 =0, 2571 = О сразу же находим 5И = 541 = 0, $51=$61 = 0, 571 = 0, а взяв 52, = 1, также 53, =—1, откуда 5, = //О 1 —1 О О О ОУд и после нормиров- ки получаем //О 1/>/2 -1/>/2 О О О О// — первый столбец искомой матрицы Т. При корне (Х2 = ос3 = ~4 кратности 2: уравнение (Л + 45) • 52 = 0 дает систему для компонент вектора $2
572 может быть любым (0-572 = 0); пользуясь этим, берем 572=1, 5,2 =... =542 = 0 — и получаем уже нормированный вектор $3: //000000 {// — второй столбец матрицы Т. Вектор $3 должен удовлетворять условию (А + 4Е)- $3 = 0, т-е- прежним уравнениям (*), в которых все 5у2 заменены на 5у3, а также быть ортогональным к $2: 573 = 0; уже нельзя считать 513, ...,516 нулями (почему?), но, полагая, например, 553=1, 563 = — 1, 513 = 523 = 533 = 543 = 0, мы удовлетворяем всем требовани- ям и получим $3= //О О О О 1 — 1 0// а после нормировки: //0000 1/>/2 -1/>/2 0// — третий столбец матрицы Т. Для корня а = 0 кратности 1: А — 0 • Е = А, гп§А = 6, с11тАппЛ = = 1; системе А - 54 = 0 удовлетворяет, например, вектор $4 = // 1 00 1 О О О//, или, после нормировки, //1/л/2 0 0 1/>/2 О О О// —четвертый столбец матрицы Т. Чтобы перевести дух, проверьте попарную ортогональность уже найденных четырех векторов. При корне а5 = а6 = а7 = 2 кратности 3: уравнение (А — 2Е)-85 = 0 приводит к системе
из которой получаем 575 = 0 и три независимых уравнения 535==525» 545 = ~515» 565 = 555> ( ) полагая 515 = 525 = 535 = $45=: °' 555 = 565=1, находим $5 = = //О 00011 0//, а после нормировки //0000 1/>/2 1/>/2 0// — пятый столбец матрицы Т. Вектор 56 должен удовлетворять не только системе типа (**), но и условиям 576 = 0, 56±55, т. е. уравнениям 536 ~ 526» 546 = ~516» 566 = 556» 556 + 566 = О, откуда 556 = 566 = 0, и можно взять 5,6= 1, 526 = 536 = 0, 546 = —1, от- куда 56 = //\ 00—1 О О О// а после нормировки //1/>/2 0 0 -1/>/2 О О О// —шестой столбец матрицы Т. И, наконец, для вектора $7 имеем 577 = 0, условия типа (**) и 571$6, т. е. 537 = 527» 547 = ~517» 557 = 567 = 0» 577 = О И 517 + 547 = 0» откуда 517 = 547 = 0, и остается возможность (единственная с точ- ностью до ненулевого множителя) 527==537=1, т. е. $7 = = //О 1 1 О О О О//, а после нормировки //О -1/л/2 -1/>/2 000 0// — седьмой столбец матрицы Т. Таким образом, и замена переменных приводит исходную форму Г к каноническому виду (Глупый вопрос: куда девалось
В унитарном пространстве Уи = (У(С), Н) скалярное произве- дение вводится с помощью положительно определенной симмет- ричной эрмитово-квадратичной формы Н(х) (см. предыдущий раз- дел): (х,у) = Н(х,у) — значению (комплексному) полярной фор- мы для Н. Отсюда вытекают свойства (совокупность которых можно было бы с самого начала взять за определение скалярно- го произведения в пространстве Уи): Длина вектора \х\ = ->/(*, х); как прежде, \Кх\ = |Х| • \х\. Но угол между векторами в общем виде не определяется (его косинус может не быть действительным числом) и рассматривается лишь случай ортогональности: х±у <=> (х, у) = 0. Неравенство Коши— Буняковского сохраняет силу, а его красивое доказательство требует небольшого усложнения, но можно дать и чисто фор- мальное краткое: при х = 0 (1) тривиально выполнено как равен- ство, а при х=^=0 получается из С^х — у, А,х —1/)>0 при ^ = (У> *)/(*, х) (и, значит, А, = (х, у)/(х, *)); проделайте! Вряд ли можно рассчитывать на помощь "геометрической ин- туиции" при изучении образов в я-мерном пространстве, каждое измерение которого как бы удваивается за счет выхода в мнимую область. Тем не менее, в расширенных курсах аналитической гео- метрии уже давно рассматривались "геометрические места" точек с комплексными координатами, удовлетворяющими заданному уравнению с действительными коэффициентами; если это уравне- ние второй степени, то соответствующий образ теперь называют квадрикой. Систематическое изложение теории квадрик имеется, например, в книге Р. И. Тышкевич и А. С. Феденко. Линейная алгебра и анали- тическая геометрия. — Минск: Вышэйшая школа, 1976*. * См. также книги М. М. Постникова по аналитической геометрии (М.: На- ука, 1973 и 1986).
В "чистую алгебру" мы этот материал не включаем и ограничим- ся конкретным примером для иллюстрации той роли, которую могут при изучении "сугубо вещественных" образов играть их "мнимые тени". Пусть в обычной декартовой плоскости хОу даны гипербола х2 — у2=\ и семейство у = 2х+\ параллельных прямых. Геомет- рическое место середин хорд, т. е. диаметр гиперболы, сопря- женный с направлением /г = 2, имеет уравнение у = -х*, но если ^ быть точными, то диаметром следовало бы считать не всю эту прямую, а часть ее, состоящую из двух лучей с вершинами занят серединами "хорд с мнимыми концами", не имеющих дру- гих действительных точек. "Мнимая тень" гиперболы, рассматри- ваемой как квадрика, в данном случае проявила себя "веще- ственно" тем, что восстановила цельность диаметра, нарушенную ограничениями типа древнегреческих диоризмов. промежуток же между этими точками ' Вспомним общую теорию кривых второго порядка из курса аналитической геометрии.
Напрашивается аналогия с телом и душой; хотя, конечно же, не следует поспешно отождествлять человека с квадрикой, дей- ствительные точки которой составляют его физическое, а мни- мые — астральное тело, но на более высоком уровне здесь есть тема для размышлений. По нашему мнению, вопрос о природе сознания и его отношении к физической материи является в своей основе не религиозным и не только философским, а нахо- дится на стыке физики, математики, биологии, кибернетики, кос- могонии и других наук, поэтому может решаться рационально. Еще меньше надежд на непосредственное геометрическое ос- мысление оставляют бесконечномерные пространства, имеющие фундаментальное значение для функционального анализа и мате- матической физики. Вещественным (комплексным) гильберто- вым пространством * называется евклидово (соответственно унитарное) пространство счетного числа измерений, обладающее свойством полноты, роль которого — такая же, что и у принци- па вложенных отрезков в поле К (и, при надлежащей модифика- ции, — в поле С). *Д. Гильберт (1862—1943) — выдающийся немецкий математик.
ПРОБЛЕМА ИСКЛЮЧЕНИЯ Исследование в общем виде систем алгебраических уравнений любой степени с любым числом неизвестных является предметом алгебраической геометрии * и ее специального раздела, относя- щегося к алгебраическим кривым **. Пусть сначала — многочлены из Р[л;], с1е§Л = т>0, с!е§гВ = я > 0. Исключить из них х — значит найти соотношение между коэффициентами ат» ат-1> •••» ао> ^л> ^л-1» •••» ^о> выполнение которого необходимо и достаточно для существования у системы А = О & В = О хотя бы одного корня, принадлежащего самому полю Р или некоторо- му его расширению. Наличие общего корня многочленов А и В равносильно условию НОД(Л,В)=^=1, т. е., по теореме 3 в конце подраздела "Делимость многочленов над полем", — существова- нию таких многочленов С, О е Р[х] с 0 < с1е§< С < я & &0<с1е§/}<т, что АС = ВО, и нам надо выразить это условие в терминах коэффициентов А и В. Пусть запишем равенство АС = ВО в развернутом виде: * См. трехтомник: В. Ходж и Д. Пидо. Метод алгебраической геометрии. — М.: ИЛ., 1954-55 (перевод англ, книги 1947 года). ** Р. Уокер. Алгебраические кривые. — М.: ИЛ, 1952 (перевод англ, книги 1950 года).
Раскрывая скобки и приравнивая коэффициенты при одинаковых степенях х, получаем Относительна неизвестных ..., -ч/!, —с?0 это система однородных уравнений, матрицу которой принято для удобства записывать в транспонированном виде: Хотя такая "общая" запись неточна: при тфп столбцы над пре- рывистой линией не стыкуются со столбцами под ней, — закон образования матрицы из коэффициентов {а} и {&,} ясен. Ее оп- ределитель К(А, В) называется результантом Сильвестра многочленов Л и В, а условие К(А,В) = 0 нетривиальной разре- шимости системы (*) служит критерием того, что Л и В не являются взаимно простыми (и, значит, имеют общий корень). В рассмотренной ситуации, когда Л, В е Р[х], полученный кри- терий практически малоэффективен: он лишь сигнализирует о наличии или отсутствии общего корня, тогда как процесс нахож- дения НОД(Л, В), по трудоемкости сравнимый с вычислением
определителя /?(Л, Б), выявляет все общие неприводимые (над Р) сомножители данной пары многочленов, чем наполовину решается задача фактического отыскания общих корней. Но тот же крите- рий весьма полезен уже при решении системы двух уравнений с двумя неизвестными, что мы разъясним на конкретном примере Считая, например, левые части этих уравнений многочленами от х, с коэффициентами, зависящими от г/, запишем систему (*) в виде и найдем результант:
обработку сомножителя третьей степени удобно пока отложить. Чтобы отыскать все решения исходной системы (*), надо для каждого корня у уравнения К(у) = О найти все общие корни х двух уравнен^0' (* Л и составить всевозможные пары \ х, у ; если система несовместна, то соответствующий корень у — посторонний и появился только из-за того, что при нем обращаются в нуль старшие коэффициенты в уравнениях этой системы. При у = 0 система 5(0) несовместна (второе уравнение прини- мает вид 1 =0). При # = -1 система 5(—1): — х3 — 1 = 0 & —х2 + х = 0 — имеет общий корень я = 1, что дает решение (1,—1) исходной системы (*).
При у2 = -1 можно исследовать каждый из корней х = ±1, но проще записать систему 5(=Ы) в виде (х-ф-х(х + 1)-11=0 & (х-1)ГИх + 1)-0=0, и при х = \ получаем два решения (1,±г), а при я=и=1 — проти- воречие: из у-х(х + 1)-1 = 0 и #-(х + 1)-1 = 0 ввиду у2 Ф О следует ;с=1 (уточните!). Наконец, если у — любой из корней последнего сомножителя в К(у), то у*=у2-у-1, (**) пользуясь этим, запишем систему 5(у) в виде или, заменяя первое уравнение разностью его со вторым, умно- женным на х, — в виде Так как у *0 (почему?), то из первого уравнения новой системы следует х = ±1. При х = 1 второе уравнение приводит к противо- речию # = 1, а при х--\ превращается в тождество; но так как последнее выведено благодаря условию (**), то получаем три решения: \-\,у 1, где у3-у2+у+\ = 0. Корни кубического уравне-
ния, вычисленные по формуле Кардано, имеют громоздкий вид, но их можно находить приближенно без помощи этой формулы. Из частного случая двух уравнений с двумя неизвестными вырисовывается общая схема решения системы любого числа уравнений с любым числом неизвестных: /1(*,1/,2, ...) = 0, й(*,г/,г, ...) = 0, С(*,г/,2, ...) = 0, ... (***) Исключая х из первого и второго, из первого и третьего и т. д. уравнений, получаем систему Кдм(у,г,...) = 0, Кл.с(у,г,...) = О, .... (****) содержащую на одно уравнение и на одну неизвестную меньше, чем (***); из нее аналогично исключаем г/, и т. д. Образовав (. \ всевозможные решения у, 2, ... системы (****), мы для каждо- го из них находим все корни х уравнения составляем совокупность <мс, у, г, ... > всех решений исходной системы (***). С результантом Везу мы встретимся в III части, при изуче- нии симметрических функций.
ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ Отображение* /:У-»У линейного пространства (V,+, Р) в себя называется линейным, если при любых к, у е V, а € Р /(*,») = /(*) + /(») и /(ах) = а/(х). Из определения сразу получаем (индукцией по /г), что это ото- бражение переводит линейную комбинацию векторов в такую же (т. е. с теми же коэффициентами) комбинацию их образов: /(а,*, + ... + ал) = а.Я*,) + ... + а,/(х,); (1) в частности, /(0) = 0 и /(—*) = —/(*). Отображение называется невырожденным, если при любых линейно независимых векторах *!, ..., #л их образы /(х,), ..., /(хл) также линейно независимы. Чтобы иметь возможность задавать и изучать конкретные отображения (слово "линейные" позволим себе опускать, по- скольку никакие другие в этом разделе не фигурируют), выделим в пространстве (V, +, Р) некоторую базу А = (а{, а2, ...} и будем задавать векторы к е V их координатами: Х = х1а1+х2а2 + ... = \\х{-х2 ... \\-//а{ а2 ...//= = а|*|+а2*2 + ... = ||а, а2 ... ||-//х, *2 •••// Как следует из (1), /(х) = Н*, *2 Л'//!(а,) /(а2) ..У/ (2) т. е. образ вектора х принадлежит линейной оболочке Ц/(А), V) системы /(А) = {/(«1), /(#2)* •••} образов векторов базы А; однако при вырожденном отображении / сама система /(А) может не быть базой пространства V (почему? сформули- руйте определение вырожденности отображения!). Ясно, что сопоставлять векторы с их образами надо в одной и той же базе А. Если * Часто употребляемые термины "преобразование" и "оператор" в данном случае кажутся нам менее удачными: по этимологии этих слов, преобразо- вание, изменяя объект, не сохраняет оригинала (так что преобразование по- ворота характеризуется углом между новым вектором и уже исчезнувшим старым), а оператор отличается от производимого им преобразования при- мерно так, как хирург от осуществляемой им операции.
матрица линейного отображения /: V —> V пространства У=У(Р) в себя, записанная в базе А этого пространства. Отсюда и из (2) следует /(Х) = ||*1 *2 -М-/Л*, а2 -// (5) причем матрица А зависит (как и координаты я,, я2, ... вектора х) от выбора базы А. В другой базе А' = {а\, а'2 ...}, образ /(*) прежнего вектора х € V выразится аналогично: /(х)-Цх', х'2 ... ||-Л'-//а', а'2 ...// (5') и нам надо выявить взаимосвязь между матрицами А и А'. Пусть IIа\ а'2 ...Ц = Т-//а, а2 ...// (5") где Т = Тд(А/) — обратная матрица перехода от базы А к базе А' (см. конец раздела "Пространства, связанные с матрицей"); тогда, как известно \х( х'2 ...|! = \х} х2 ...Ц-Т"1, и из (5'), (5") получаем /(*)Ч1*1 ^ ...II-т-1-л--т-/А, «2 -У/ (6) Вычитание (6) из (5) дает равенство II*, х2 ...КА-Т-^А'--?).//^ а2 ...//= //о о ...//, справедливое для любого вектора х = \\х{ х2...\\-//а{ а2...//. Полагая х{ = 1, х2 = ... = 0, обнаруживаем, что произведение первой строки матрицы (Л —Т-1-Л'-Т) на столбец //а{ а2...// линейно независи- мых векторов равно нулю поля Р, значит, вся эта строка — ну- левая; беря х{ = 0, х2 = 1, х3 = ... = 0, обнаруживаем аналогично,
что вторая строка матрицы — тоже нулевая, и т. д., т. е. вся матрица — нулевая и, следовательно, Л =Т~1-Л'-Т, или Л' = Т-Л-Т-1. Итак, доказана Теорема. Если Л=ЛА(/) и Л' = у4А,(/) — матрицы одного и того же Линейного отображения /: V -> V, в базах А и А' пространства У=У(Р), то Л/ = Т-Л-Т-1, Л=Т-1-Л/-Т, где Т = ТА(А') — матрица перехода. Ясно, что свойства отображения /, не зависящие от выбора базы, характеризуются теми из свойств матрицы Л=у4(/), кото- рые инвариантны относительно указанного в теореме преобразо- вания матриц с помощью обратимой матрицы. Испытанный под- ход к выявлению этих свойств состоит в выборе для заданного отображения / такой базы А, в которой матрица ЛА(/) имела бы возможно более простой вид. Отображение /, умножающее все векторы х е V на одно и то же А, € Р, обладает матрицей в любой базе А = {а,, аъ ... }: действительно, применив / к са- мим базовым векторам, получим ///(«,) /Ы •••//= /Лл, ^2 .»//= ЬЕ.//а{ а2 ...// т. е. у4А(/) = АД и для другой базы В Лв(/) = ТА(В) - А • Тд-'(В) = ТА(В) • КЕ - ГдЧВ) = КЕ = ЛА(/). При \ = 0 это / называется нулевым отображением и обо- значается через N. при \ФО — подобием (с коэффициентом А,), в частности, если А,= /, — тождественным, или единичным отображением /; так, Ух е V: УУ(х) = 0 & /(*) = *, кратко: ВД Е= 0 и /(*) = *. От рассмотренных только что отображений тривиальной структуры перейдем к более общим. Если отображение
/: V —> V конечномерного пространства с сНтУ = п имеет в ка- кой-то базе А матрицу Л = у4А(/), то в другой базе В его матрица В = ЛВ(/), вообще говоря, отлична от ЛА(/), однако характерис- тический многочлен у этих матриц — один и тот же: <Ы(В - аЕ) = (1е1(ТА(В) • А • Т^В) - <хЯ) = = с!е1(ТА(В).(Л-аг).ТА1(В)) = = (1е1(Л - аЕ)- (1е1(ТА(В) - Т^(В)) = (1е1(Л -аЕ), и поэтому определение его как характеристического многочле- на %(/) отображения / корректно. Для отображения, матрица которого имеет в какой-то базе А диагональный вид и если все \ различны, то / называется отображением простой структуры, распознать его по матрице Л(/) в любой базе легко: в поле Р характеристический многочлен йе1(Л(/) — а,Е) абсолютно приводим и все п его корней А,,- € Р различны. А та база А, в которой матрица Л(/) диагональна, находится следующим образом. Считая, что исходная матрица А = \\а " Д^на в стандартной II Ч п базе, находим для каждого корня \ такой ненулевой вектор х{ = = //х1{ ... х1п//, для которого Л-х| = Х|х|, или (А — \Е)-х1 = 0, т. е.
поскольку сЫ(Л — \Е) = 0, у каждой из этих систем есть нетри- виальное решение х1 = аг^0; покажем, что а,, а2, ... а„ (соб- ственные векторы отображения или его матрицы, отвечающие собственным значениям А,,, А,2, ..., А,„) линейно независимы. Пусть р,а, + р2а2 + — + Ряая —0, где все (3, е Р. Применяя к обеим частям равенства отображение /, с полученным равен- ством поступая аналогично и т. д. и каждый раз учитывая, что /(а,) = А^-а,-, мы после п — 1 шагов придем к системе Если эти равенства рассматривать как однородные уравнения относительно "неизвестных" векторов (З^, Р2а2, •••» Рла« *» то определителем системы будет определитель Вандермонда (см. п. 2 в конце раздела "Полилинейные формы и определите- ли"), и так как в данном случае он отличен от нуля (почему?), то все ргаг = 0, откуда (3, = (32 = ... = (Зп = 0 (а это почему?). * Легко понять, что теория систем линейных уравнений останется в силе, если неизвестные х, и правые части Ь} считать векторами. Можно также вместо одной системы иметь дело с п системами относительно координат векторов в стандартной базе (уточните!).
Итак, найденная система векторов А = {а,, а2, ..., ап} линейно независима и ввиду сНтУ = п является базой пространства V; а так как /(а,-) = А^а,- (/=1, 2, ..., п), то матрица ЛА(/) имеет вид (7). Матрица же ТЕ(А) перехода от стандартной базы к базе А обра- зована, очевидно, п строками а, еМ!,(Р). А что если в разложении (8) некоторые множители совпада- ют? Казалось бы, ничего особенного, просто в матрице (7) не все \ различны. Но полагать так — значит выдавать желаемое за действительное; вот простейший опровержительный пример. характеристический У матрицы многочлен имеет корень а, = а2=1 кратно- сти 2. Но попробуем найти такую невырожденную Т = ||т|у-||, чтобы матрица Т-Л-Г1 = ^22 | 122 ~~^91 -т,. -4 *П X воп- оказалась диагональной: для этого должно быть ти=1 реки невырожденности Т! Перед нами не "мелкое недоразумение", а фундаментальный факт, свидетельствующий о том, что даже в случае абсолютной приводимости многочлена %(/) отображение /, вообще говоря, не сводится к растяжениям (или сжатиям) вдоль каких-то п направ- лений. Другой яркий пример — поворот на угол ф=^&я, с мат- рицей (а в какой базе?), характеристи- ческий многочлен которой при §тф^0 не имеет действительных корней (проверьте!). Но в поле С этот же многочлен обладает корнями ос,2 = = со5(р±/5Шф, и при ф=^=&я они различны, так что диагональными
формами матрицы А будут соответствующую базу и преобразующую матрицу. найдем Здесь и так как 5тф=^0, система (9) имеет вид — 1х{— *2 = 0 & х{ — 1х2 = 0, откуда (с точностью до множителя из С), а, = Ц\ —1//\ точно так же и, например, и читатель может сам убедиться в том, что !с05ф-/51Пф 0 _ = I . Предлагаем также посмотреть, что О С08ф + 181Пф| изменится, если, например, взять а, = //г \// и прежний а2 = = III —\Ц (упражнение на действия с комплексными числами!). Упражнение. Привести матрицу А = \ !С05ф 51Пф к диа- гональному виду; выписать координаты (в стандартной базе) новых базовых векторов и преобразующую матрицу. Вопрос. Что изменится, если считать матрицу Л = Л(/) пер- воначально заданной не в стандартной, а в какой-то другой базе пространства V? Мы уже видели, что "тривиальная" и "простая" структуры отображения — это, как говорят в Одессе, "две большие разни- цы". Но от них обеих разительно отличается случай, когда у характеристического многочлена %(/) отображения /: V -> V имеются кратные корни. Здесь уже недостаточно "типично ана- литического" изучения структуры самого /, и этот подход надо сочетать с "типично алгебраическим" включением / в качестве элемента в некоторую алгебраическую систему.
Сумма / + # двух отображений пространства У=У(Р) и произведение ос/ = /(х отображения / яа элемент а е Р опреде- ляются так: [/ + $](*) = /(*) + ё(х), [<х/](х) = [/а](х) = а/(х) для любого хе V. (Символ комбинированного отображения пи- шем в квадратных скобках, если это нужно во избежание пута- ницы.) Легко проверить, что относительно этих операций множе- ство всех линейных отображений /: V —> V образует линейное пространство ({/}, +, Р). В нем мы определим еще произведение отображений / и § (в общем случае некоммутативное): [2/](*) = 2(/(*)Г ПРИ всех *€ V; это, в частности, позволяет ввести степень & е N У {0} отобра- жения / как /*(*) = /(/(.../(*).-.)) (& символов /) при &> 1 и /° = /, /°(х) = х и рассматривать многочлен от /: <?(/) = <7о/ + <71/+..- + <7,Л т. е. такое отображение, что при любом хе Р [<?(/)](*) = <7о* + ЧЛ(Х) + - + (/я/л(^), как результат (?(/) подстановки элемента / вместо переменной х в многочлен ^(x) = д0 +д{х + ... +^пxп е Р[х]. Из самого смысла отображений (не только линейных) следует, что /*./« = /* + « = в^я + * = ^я.^> откуда, по законам линейного пространства, а/л • Р/т = р/т • а/* (а, р€ Р), вследствие чего справедлива Теорема. Многочлены от одного и того_ же отображения перестановочны, т. е. (3\(!}-(3<2(!) = (Зъ(!}-(3\(!}* Легко показать также, что если Л = Л(/) = ЛА(/) — матрица отображения /: V -> V в базе А = {а,, а2, •••} пространства * Чтобы говорить о произведении / на §, многие авторы пишут символ ото- бражения справа от х: х(§ = §(((х)).
будет матрицей отображения (?(/) в той же базе *, и, таким об- разом, Ухе V: <Э(А)-х = двХ +д{А-х+... +^пАп • х. При изменении базы матрица (?(Л) преобразуется точно так же, как Л, т. е. переходит в Т •(?(/!)• Т"1, поскольку Многочлен (3 е Р[х] называется аннулятором отображения / или его матрицы (в любой базе) Л=Л(/), если (?(/) = N (нулевое отображение), соответственно ф(Л) = О (нулевая матрица). При й\т\ = п для любого / всегда есть такой многочлен степени не более я, как показывает Теорема Гамильтона — Кэл и. Характеристический многочлен Ае{(А — аЕ) пхп-матрицы служит ее аннулято- ром, иначе говоря, квадратная матрица является корнем своего характеристического многочлена. Казалось бы, тут нечего доказывать: подставив матрицу А вместо а в <1е1(Л — осЯ), получим определитель нулевой матрицы! Тому, кто не видит ошибки в этом "гениально простом" рассуж- дении, вряд ли имеет смысл разбирать и заучивать Доказательство**. Пусть характеристическая матрица Л, а Ду — алгебраическое дополне- ние элемента ац в Л , представляющее собой многочлен от х * Для этого достаточно проверить, что Л(/4-&) = Л(/) + А(§), Л(ос/) = оо4(/) и А(еП-А(8)-А(Г). "А. И. Мальцев. Основы линейной алгебры. — М.: ПТИ, 1956.
степени не выше п — 1 (почему?). Как известно из п. 8 раздела "Полилинейные формы и определители", характе- ристический многочлен %(Л) матрицы А. Перепишем матричное равенство (10) в виде где А(*] — матричный коэффициент при я*, полученный в резуль- тате разложения !Л; ! (например, по столбцам) на сумму матриц, в каждой из которых все элементы содержат множитель х в одинаковой степени. Раскрывая в (10') скобки и приравнивая коэффициенты при одинаковых степенях х, получаем и умножение этих равенств на А° = Е, Л, Л2, ..., Ап~\ Ап с пос- ледующим суммированием приводит к искомому равенству
Следствие. Если отображение /: V -> V (сНтУ<°о) имеет характеристический многочлен %(/) = <?(*), то (?(/) = N. При сНтУ<°о это следствие — непосредственное, а в случае сИтУ = оо? если %(/) все-таки существует, для осмысленности %(Л) достаточно рассмотреть действие / не на всём пространстве V, а на каком-нибудь его я-мерном подпространстве. Пусть / : V —> V — отображение пространства У = У(Р), а УсУ — его подпространство. Дадим определения: 1т/У/ = /(У/) = {/(^)А е Vх} — образ V при отображении /, короче, /-образ (под)пространства V; 1<ег/У/ = {х€ У//(х) = 0} — ядро (под)пространства V при отображении /, или /-ядро Vх *. Лемма. 1т^У гг Кег^У — подпространства V, причем сНтОгг^У) + сНт^ег^') = сПт V. (11) Доказательство. Пусть х, г/ е 1т/У/ и а е -Р. Согласно опре- делению /-образа существуют такие х', у'е Vх, что }(х'}=^х и /(^) = у- но Xх + у' е Vх и ах' е Vх, поэтому х + у « /(х7) + /(^) = = /(х7 + г/') е 1т,V и ад: = а/(х') = /(а*7) € 1т;Vх. Для [се^У рассуж- дение еще проще. Докажем (11). Если хотя бы одно из пространств 1т/У/ и ^ег^У' бесконечно- мерно, то тем более с!1тУ/ = оо и равенство (11) тривиально, поэтому мы можем считать оба подпространства конечномер- ными, а в этом случае легко доказать существование такого под- пространства V" с Vх, что УФ^ег^У = Vх и, значит, сНт V" + сНт^У) = сНт У. (1 Г) Индуцированное отображение / : V" —> {гт^У — биекция: Сюръективность. Если х е 1т/У/, а хх е У — такой, что /(х') = х, то представляя х' в виде суммы векторов х" е У/х и ХобЬе^У, получим х = /(х//)+ /(х0) = /(х//). * Образ (1таде) и ядро (1<егпе1) часто обозначают через 1т/ и 1<ег/, без яв- ного указания подпространства V, называя их образом и ядром отображе- ния,, что, на наш взгляд, неточно; более старые названия: область значе- ний и нуль-многообразие отображения /.
Инъективность. Если х, у е V" и /(*) = /(*/), то /(* — */) = = /(*) — /(*/) = 0> т- е- х — уе Кег^У; в то же время х — уе V", зна- чит х — уе V" П ^ег/У/ = {0}; отсюда * = */. Эта биекция в силу линейности / является изоморфизмом пространств V" и [гт^У, следовательно, сНтУ" = с11т(1т^У'), что вместе с (1Г) дает (11). Подпространство V —> V называется замкнутым относи- тельно отображения / : V —> V, короче, {-замкнутым, если /(ПСУ*. Теорема. /;Ъш аннулирующий многочлен отображения / разлагается в произведение Ь>2 попарно взаимно простых сомножителей, то V = V! Ф У2 Ф ... Ф УЛ, где все V,- {-замк- нуты. Доказательство проведем при & = 2; общий случай легко получается отсюда индукцией по Л. Пусть О = <?(*)€ Р[х], <?(/) = #, <? = <Э,<32, ФнФа^РМ и НОД((?,, (?2) =/. По следствию теоремы-леммы (подраздел "Делимость многочленов над полем" I части книги) существуют такие I/!, (72€ Р[*], что 1}$^ Ц2(32= 1. Поэтому ^1(/)Р1(/) + ^2(/)92(/) = / и для любого х е V х = /(х) = [1/1(/)]([<?1(/)](*)) + [^2(/)]([<?2(/)](*)) = = [<й(/)]([Ц(/)]М)+[<?2(/)]([г/2(/)](*)) (12) (произведение многочленов от / коммутативно!). Благодаря лемме, множества V, -[<?,(/)]( V) и У2 = [(?2(/)](У) -(?,(/)- и <?2(/)- об- разы всего V — являются его подпространствами, а так как ДУ)сУ, то /(V.) - [/<?»(/)]( V) = [(?»(/)](/(V)) с [<?!(/)]( V) = V, и точно так же /(У2)сУ2, т. е. эти подпространства /-замкнуты. * Традиционный термин "инвариантное подпространство" кажется нам удачным только в случае, когда /(У/) = У/.
Полагая, далее, в представлении (12) *,-[<?,(/)]([!/,(/)](*) 6 V, и *2-[02(/)([1/2(/)](*))е У2 будем иметь х = х{+х2 для любого к е V, т.е. У=У! + У2. Наконец, если хе У, П У2, то для некоторых г/,, у2 е V *-[01(/)]([1/1(Л](»1))-[02(/)]([1/2(/Ж»2)), откуда [<?!(/)(*) = [01(Л02(Л]([</2(Л](02)) = <?(/)([^2(/)]Ы) = О, точно так же [(?2(/)(х) — 0, и на основании (12) * = [^.(/)]([<?.(/Ж*)) + [1/2(Л([02(Л](*)) - о, т. е. сумма подпространств У! и У2 — прямая; У = У,ФУ2*. Тривиальный пример отображения / с матрицей ЛА(/) = = в естественной базе пространства У = М^(Р) показыва- ет, что обратная теорема не имеет места: подпространства V, = Ц//1 О//, Р) и У2 = Ц//0 ///, Р) оба /-замкнуты, V = = V! Ф У2, характеристический многочлен произведение двух множителей, которые, однако, не являются взаимно простыми. Если У = У,Ф У2е...Ф V,, /: У->У, А, ={а|°Х0,...} — база /-замкнутого подпространства V;, а отображение /: У4 -> У^ (инду- цированное) обладает матрицей Д = ЛА (/) (/= 1, 2, ..., &), то мат- рица ЛА(/) отображения всего пространства V в его базе А = А, у А2 и ... и А, имеет квазидиагональный вид (почему?) **, где блоки А, не обяза- тельно конечны. Мы особо остановимся на случае, когда Ъ = 2, * Не исключено, что одно из слагаемых — нулевое {0}. ** Очевидно и обратное: если матрица отображения / имеет такой вид в не- которой базе, то V разлагается в прямую сумму /-замкнутых подпрост- ранств.
подпространство V! конечно- мерно — сИтУ1 = т — и само VI, которое будем обо- значать просто через V, уже не разлагается в прямую сумму ненулевых /-замкну- тых подпространств; даль- нейшее же выделение пря- мых слагаемых из У2 пока отложим. Пусть / : V -> V и А = = {а!,а2, ..., ат} — база V. Важнейшим примером матрицы ЛА(/) является жорданова клетка где А, — один из корней характеристического уравнения %(/) = О, принадлежащий полю Р или такому его расширению Р, в кото- ром многочлен %(/) имеет хотя бы один корень; в частности, это может быть любое алгебраически замкнутое поле, например поле С комплексных чисел (случай же незамкнутого поля К будет впоследствии рассмотрен отдельно). Нетрудно показать, что если отображение /: V —» V имеет в некоторой базе А = {а,, а2, ..., ат] матрицу вида /(/), то про- странство V не может быть прямой суммой двух (значит, и большего числа) ненулевых /-замкнутых подпространств. В самом деле, если \1 = \1'®\1", где Vх, У"=^{0}, то из т базовых векто- ров какие-то (не все!) принадлежат Vх, остальные — V", и пусть, например, ат е V", а а- — последний базовый вектор, входящий в Vх; тогда /(а,) = Ал, + а/ + , ё Vх (почему?), т. е. про- странство Vх не является /-замкнутым. Займемся обоснованием обратного утверждения о существовании в пространстве V, не-
разложимом в прямую сумму ненулевых /-замкнутых подпрост- ранств, такой базы, в которой матрица отображения / имеет вид /(/). Для этого достаточно отыскать в V такую линейно незави- симую систему векторов а,, ..., ат_{, ат, что /(а,)-Ал,+ 02,..., /(ат_1) = Хат_1 + ат, /(ат) = Алт, (13) и перейти от стандартной базы Е к базе А = {а,,..., ат_2, ат}. Лемма. Если У=У(Р), §: V —> V — любое линейное ото- бражение, а вектор х е V и число г € N У {0} таковы, что все г + 1 векторов системы *(=г°(*)), е(х), 82(х),...,8'(х) (14) отличны от 0, но ёг+1(х)=0, то система В линейно неза- висима. Доказательство. Предположим, что «о* + <*18(х) + .- + <*,8г(х) = О, (15) где не все коэффициенты равны 0, и г — наименьшее, при ко- тором ос, Ф 0 (0<1<г); тогда Г-'^ + .-.+а,-,?^ + <*г8г(х)) = 0 + ... + 0 + а-м'(х) + 0 + ... + 0 = О в силу (15) и того, что вместе с §Г+[(х) = 0 также ёг+2(х) = = ... = 0; отсюда а,. = 0 (поскольку ёг(х)^®) вопреки допущению. Лемма доказана, причем из нее сразу следует, что г<сНтУ- 1. В нашей ситуации г<т— 1, и мы применим лемму к отобра- жению § = / —АУ, где А,е Р — корень характеристического урав- нения х(/) = 0. Всякое подпространство в V, очевидно, /-замкнуто тогда и только тогда, когда оно ^-замкнуто, а условие (13) в терминах отображения § имеет вид г(а,) = а2,...г(ат.|)-ат, $(<!„,)-О, (13')
и нам остается доказать существование такого хе У\{0}, при котором у системы (14) будет г = т— 1, после чего положить а,=х, а2 = г(*). .... ат_,=^-2(х), ат = ёгт~1(^)- Допустим, что нужного нам вектора х нет, т. е. г = тахтах\1/§1 (х) Ф О, 0 < / < т-\\< т-1; (16) жеУ *• •* тогда линейная оболочка Ь = Ц{х, §(х), ..., §г(х)}, Р) с V является подпространством размерности сПтЬ = г+1<т, и есть такое Vх размерности сНтУ = т — г— 1 > 0, что V = Ь Ф Vх; первое слагаемое здесь, очевидно, ^-замкнуто, и нам теперь до- статочно показать, что "прямое дополнение" Vх (определяемое неоднозначно) можно выбрать так, чтобы оно тоже было ^-зам- кнутым, вопреки предположению о неразложимости V в прямую сумму ненулевых /-замкнутых (значит, и ^-замкнутых) подпрост- ранств. Пусть у 6 У\Ь — вектор, для которого §(у) е Ь; тогда В(У) = «о* + в(а\* + - + «гГ~ Ч^)) при некоторых сс0, а,, ..., аге Р, т. е. #(2) = а0х, где г = г/~а,х-...-аг^-1(^). В случае а0фО векторы а~1х , х, &(х), ..., §г(х) составили бы последовательность типа (14) длины г + 2, вопреки определению (16) числа г. Следовательно, ос0 = 0 и г е 1сег5У, т. е. у = ОЦ* + ... + осг§г- '(*) + г е Ь + 1сег^У, а так как # € У\Ь, то у е (У\Ь) П ^ег^У. Выбрав в этом пересе- чении максимальную линейно независимую систему векторов V, образуем линейную оболочку ЦУ, Р), которая и будет искомым ^-замкнутым "прямым дополнением" подпространства Ь до всего V. Итак, получена
Теорема. Пространство У = У(Р) тогда и только тогда неразложимо в прямую сумму [-замкнутых подпрост- ранств, когда в некоторой базе А матрица ЛА(/) линейного отображения /: V -> V представляет собой жорданову клетку. Характеристический многочлен клетки /(/) при заданных т € N и А,е Р имеет вид %(/) = (А,— х)т, но если т>1, то, как мы убедились уже на примере с т = 2, не всякая матрица с таким %(/) является жордановой клеткой: одному и тому же корню лг = А, может отвечать и несколько клеток. В общем случае, при абсолютной приводимости характеристического многочлена: х(/)И-1)Ч*-МЧ*-^-ф-М'' (все А,, е Р, все гуеМ, г, + г2 +... + г5 = я), в принципе можно, взяв за А, любой из корней, скажем А,,, выделить жорданову клетку / порядка т < г, и выбрать в V базу, в которой матрица имеет блочный вид Но при т < г4 "потенциальные возможности" корня А,, еще не будут полностью исчерпаны, и из подматрицы А' удастся, в свою очередь, выделить следующую клетку У с тем же значением А, = А,,, ..., пока не получим систе- му клеток с суммой порядков, равной /у, после этого переходим к корню А,2, и т. д. Заметим, что "вылавливать" базы в /-замкну- тых слагаемых прямого разложения V удобнее не "с головы", а "с хвоста", поскольку соответствующие по (16) числа г заранее не известны. Заметим также, что вместо определения (16) числа г (что мы сделали ради технического удобства доказательства теоремы "от противного") достаточно было бы от последователь- ности (14) потребовать максимальности по включению, т. е. невозможности продолжить ее в сторону "головы" х. Всю проце- дуру приведения матрицы А к жордановой нормальной форме и нахождения преобразующей матрицы Т * мы проиллюстрируем на конкретном примере (с Р = К): * Важное приложение — к системам линейных дифференциальных уравнений с постоянными коэффициентами.
Характеристический многочлен с!е1(Л — хЕ) имеет корни А,,=— 1 (кратности 5) и ^2=1 (кратности 1). Из (5) ясно, что если А = {а!, ..., ап] — стандартная база пространства М),(Р), а векторы х и /(*) записываются как элементы этого пространства, то [(х) = \\х1 ... хя||-А В данном случае для нахождения собственных векторов, отвечающих собственному значению —1, образуем матрицу и решаем уравнение \х у г и V ш|!-(Л + /;) = 0^» т. е. систему 0 = 0&^ = 0&-^ + г/ = 0&0 = 0&2у = 0&0 = 0; ее общее решение имеет вид ||0 0 г и О до||, и в качестве базы "корневого" (для А,,= — 1) подпространства всех таких векторов можно взять, например, тройку ||0 О 1 0 0 0||, ||0 О О 1 0 0||, ||0 О О О О 1||. (17) Считая первый вектор этой тройки последним в "цепочке" (14), находим предпоследний из уравнения
равносильного системе 0 = 0&* = 0&-* + г/=1&0 = 0&21> = 0&0 = 0, из общего решения |0 1 г и 0 м;|| которой можно выбрать, на- пример, ||0 1 О О О 0||. Третий (с конца) вектор "цепочки" должен удовлетворять уравнению ||* у г и V ш||-(Л + Е) = ||0 1 О О О 0||, из общего решения которого выбираем ||1 1 000 0||, а попытка найти четвертый приводит к противоречивой системе 0= !&..., т. е. "пойманная за хвост" цепочка состоит из трех векторов, нумеруя которые "с головы", образуем первые три вектора а, = ||1 1000 0||, а2 = ||0 1000 0||, а3 = ||0 0 1 О О 0|| искомой базы пространства V. "Потенциальные возможности" корня Х,=-^1 этим не исчерпа- ны, и мы ловим следующую цепочку, взяв за ее "хвост" второй вектор системы (17); попытка найти "предхвостовой" вектор сра- зу приводит к противоречию, и мы полагаем а4 = ||0 0010 0||. Ловля третьей цепочки дает аналогичный результат: а5 = ||0 О О О О 1||. "Исчерпав" А,, =— 1, переходим к корню А,2=1; теперь и собственный вектор для А,2 = — 1 находится из уравнения
т. е. из системы -2х = 0 & х-2у = 0 & -х + у-2х = 0 & 0 = 0 & -2ш = 0, общее решение ||0 О О О V 0|| которой позволяет взять Таким образом, (проверьте!),
и в базе {а,, а2, а3, а4, а5, ае} квазидиагональная матрица состоит из четырех блоков: Для практики рекомендуем в "корневом" (при А, = — 1) подпро- странстве выбрать вместо (17) другую базу,- например {||0 0100 0||, ||0 01-10 1||, ||0 0-100 1||}, а в одномерном "корневом подпространстве" для А,= 1 — базу из одного вектора ||0 О О О 2 0||, и убедиться, что результирующая матрица /(/) будет прежней, но матрица перехода Т — другой. Рассмотрим еще пример, в котором многочлен %(А) не являет- ся абсолютно приводимым над полем Р (=К): Здесь %(А) = (х— 1)2(*2 — 2*+ 2), корень А,= 1 (кратности 2), ! 2 1 0 01 находим вектор || 1 1 0 0||, а из \\х у г 1\\-(А — Е) = \\1 1 0 0|| — вектор ||0 1 0 0|| и полагаем а{ = ||0 1 0 0||, а2 = ||1 1 0 0||, откуда
Как и следовало ожидать, в базе с первыми двумя векторами а, и а2 у квазидиагональной матрицы А' один из блоков является жордановой клеткой порядка т = 2, а другой не имеет такого вида. Как упражнение, предлагаем читателю показать, что в поле К жордановой формы для всей матрицы А не существует, и найти такую форму в предположении Р = С. А к какому "наиболее простому" виду можно привести матри- цу Л(/)е М„(К), не выходя за пределы поля К? Оказывается — к такому квазидиагональному, в котором блоки .'2т выглядят как прежде, но Л = Л^, Е = Е\ и О = 0% — не просто числа, а 2 х 2-матрицы с действительными элементами: и каждой паре ос±:р/ сопряженных корней уравнения ^(^) = о отвечает блок Л = Излагать доказательство (на- пример, по книге Г. Е. Шилова) мы считаем нецелесообразным, надеясь на решение следующей методической проблемы: выяс-
нить, для каких полей Р (и при каких дополнительных условиях) справедлива Обобщенная теорема Жордана. Пусть линейное отображение / : V —> V пространства V = У(Р) имеет характеристический многочлен %(/) = (?(*), разлагающийся на неприводимые множители: (д(х) = (Э{] (х) (3%(х)...(3ь(х) • Тогда в V существует база А, в которой матрица ЛА(/) имеет квазидиагональный вид с блоками где А1• — г,- х г1--матрицы специального вида '(какого?), соот- ветствующие множителям (?,(*), а Е = Ег; и О = ||0|Г| (I = 1, 2, ..., и).
ЗАКЛЮЧЕНИЕ II ЧАСТИ Наряду с поставленной только что научно-методической зада- чей, решить которую хотелось бы до выхода следующего тиража нашей книги, рассмотрим "менее срочную" теоретическую пробле- му не только математического, но и философского характера (о ней мы вскользь упоминали в разделе "Евклидовы и унитарные пространства"). "Геометрический" смысл собственных векторов и собственных значений линейного отображения /: V-» V пространства У = У(Р) довольно-таки ясен: вектор указывает то направление, в котором / действует как растяжение (или сжатие), не сопро- вождаемое поворотом, а значение — это коэффициент растяже- ния. На таких же /-замкнутых подпространствах, где индуциро- ванное отображение не имеет собственных векторов, оно носит характер вращения (в расширенном поле Р — некоторого "обоб- щенного растяжения"). В теории квадратичных и эрмитовых форм эти векторы и значения связаны с экстремальным свойством, а не отображени- ями, и попытки формально сопоставить с матрицей формы какое- то линейное преобразование не приводят к осмысленным выво- дам. Те же "собственные атрибуты" фигурируют и в теории графов. Графом (простейшим, или обыкновенным) называется конечное множество вершин вместе с множеством ребер, соеди- няющих некоторые пары различных вершин. Одним из средств аналитического задания я-вершинного графа служит матрица смежностей при какой-нибудь нумерации его вершин, где а/7=1 или 0, смотря по тому, соединены 1-я и /-я вершины можно или нет. При изменении нумерации матрица переходит в Т-1К/Ц-Т-1, где Т — невырожденная матрица перестановки (мно-
графа) не зависят от нумерации вершин, т. е. характеризуют сам граф, но не связаны ни с квадратичными формами, ни с линей- ными отображениями. Проблема состоит в создании неформальной общей теории собственных векторов и значений матрицы как чисто комбина- торного объекта. житель переставляет строки, точно так же — столбцы). Многочлен и его корни (составляющие спектр
Часть III_____________________ КОМБИНАТОРНАЯ АЛГЕБРА ГОМОМОРФИЗМЫ И ФАКТОРИЗАЦИЯ В конце раздела "Отображения" (I часть) мы ввели общее понятие алгебраической системы и в первой части книги изучали такие системы, как группоид, полугруппа, моноид, группа, коль- цо, тело, поле, а во второй части — линейные (векторные) про- странства. Теперь детализируем общее определение. Алгебраическая система 5 = (М, О.) — это пара, состоящая из непустого множества М элементов произвольной природы и из множества О, операций любых арностей над этими элемента- ми, не выводящих за пределы М: если со е О, — п-арная опера- ция, а я,, ...,*„ е М, то со(Х|, ..., хп)еМ. ' . Пусть наряду с § заданы другая система 5' = (ЛГ, И') и ото- бражение / : М У О, -» М' У О', такое что: 1) индуцированное отображение /:М—»ЛГ сюръективно; 2) индуцированное отображение / : Ф —» О' — биекция, сохра- няющая арности операций; 3) если сое О — п-арная операция, а х{, ..., хп е М, то /(ю(*,,.,^) = [/(а>)](/(*,),.,/(*„)). Тогда / называется гомоморфизмом / : 5 —> 5' системы § на систе- му 5' (в частности, изоморфизмом 5 на 5', если / : М —> М' — тоже биекция). В отсутствии сюръективности, / — гомоморфизм 5 в 8', или на /-образ 1111,5 = [!(х)/х е М}. В случае, когда ЛГсМ и О' = О, гомоморфизм /: 5 —> 5х назы- вается эндоморфизмом системы 8 (в себя при М' с М и яа себя при М' = М). Изученные в последнем разделе II части линейные отображения являются эндоморфизмами линейных пространств (когда "в себя", а когда "на себя" — пусть читатель обнаружит сам, просмотрев еще раз бегло этот раздел). Полным прообразом !~\х'} элемента х'е М' при гомоморфиз- ме / : 5 -» 5х называется множество {х е М/?(х) = х'}, непустое
в силу пункта 1) определения гомоморфизма; просто прообраз элемента х' — любой из тех х, для которых /(Л:) = А:/. Если М = {/'' (я')/*'е М'} — множество полных прообразов Х = [~1(х') всех элементов х' системы 5х, то, очевидно, будет корректным определение О, как множества таких операций ш на М, что й(Я„..., ^я) = со(л:|, .... *„), где х, € ^,, ..., яп € Хя, поскольку результат не зависит от выбо- ра прообразов в множествах Х1 е М. Система 5 = (М, И) назы- вается фактор-системой 5 яо отображению / и обозначается также через 5//, а отображение /:(Л!, П)-»(ЛГ, О'), при котором [(Х) = [(х) и ш(Аг1, ..., Хп) = со(^,, ..., хя) для задан- ных X, Х{, ..., Хп е М и каких-нибудь х е X, х{е Х{, ..., хпе Хп, будет изомофмизмом 5// на 5х. Если § = (Л1, *) и 5/ = (Л1/, *) — группоиды (штрих при знаке композиции * в 5х не пишем), то О = {*}, Ох = {*}, условие 3) имеет вид
и в случае ассоциативности 5 ассоциативным будет и 5х: где х', у', г' — любые элементы М', а х, у, г е М — какие-либо из их прообразов. По той же схеме доказывается, что при нали- чии в 5 нейтрального элемента е его образ }(е) служит таким элементов в 5х и что если элемент х е М обратим, то обратим и я' = /(;с): х'~{=}(х~1). Поэтому свойства быть полугруппой, моно- идом или группой переносятся с группоида на его образ. Рассмотрим случай, когда 5 и 5х — группы. Ядром Кег^З группы 5 при гомоморфизме / : 5 —> 5' называется подмножество N = {х е М/1(х) = е'} с М элементов, имеющих, своим образом ней- тральный элемент группы 5х. Это N образует в 5 подгруппу: если х, #€N=1(61^5, то /(* * у) = /(*) * 1(у) = е' * е'= е', т. е. х * у € М, а так как /(лг1) = (Я*))"1 = (е')~[ = е', то и х~1 е N. Под- группа N=1(61^5 занимает в группе 5 особое положение — она сохранится, если все ее элементы х заменить на а* я* яг1, где а € М — любой фиксированный элемент, т. е. УхеМУаеМ: а*х*а~1еМ, (1) поскольку /(а * х * а-1) = /(а) * /(*) * /(а-1) = /(а) * е' * /(а-1) = = /(а)*/(а-1) = /(а*а-1) = /(в) = в/ и при фиксированном а отображение х —> а * я * а"1 биективно (докажите!). Вообще, независимо от гомоморфизма, подгруппа Мс5, удов- летворяющая условию (1), называется инвариантной, нормаль- ной или нормальным делителем группы 5. Мы показали, что ядро Кег^З является в 5 нормальной подгруппой. Покажем, что справедливо и обратное: Если N с 5 — нормальная подгруппа, то существуют та- кая группа 5х и такой гомоморфизм /:5—> 5х, при кото- рых ^=^6^5.
За элементы 5х возьмем смежные классы разложения группы 5 по подгруппе N. определяемые следующим образом. Пусть аN означает класс (множество) {а * х/х е Щ при фик- сированном а е М\ назовем аЫ смежным классом, порожденным элементом а. Имеем: (а) если а'е аN, то а'N = аN, т. е. смежный класс порожда- ется любым своим элементом; (б) для любых а, Ь е М смежные классы либо не пересека- ются, либо совпадают, благодаря чему множество М является объединением смежных классов попарно без общих элементов. Действительно, (а) любой а' е аN можно представить в виде а' = а * х, где х е М; но х * х' е N при любом х' е М, поэтому а'МсаМ, а так как а = а'*лг1, где х~{ е N (почему?), то и аМса'М; (б) если уеаN{\а'Nф0, то аN = уN = а'N. Из (а) следует, что а' * х' = (а * х) * х' = а * (х * х') е аN, т. е. (в) элемент а * х е аN можно представать и в виде х' * а, где х' = а * х * а"1 е УУ, поскольку N — нормальная подгруппа. Смежные классы разложения группы 5 по подгруппе N при- мем за элементы группы 5х с законом композиции аN * ЬN'= (а * Ь)N, определение которого корректно благодаря тому, что результат не зависит от выбора порождающих элемен- тов в своих классах: если а/ = а*^1€аЛ^ и Ь' = Ь*х2еМ, то где х{, х2, х3, х3*х2еЫ. Ассоциативность композиции классов автоматически следует из ассоциативности групповой операции * в 5, нейтральным элементом группы 5х служит сама подгруппа М = еМ, а (аМ)~1 = а~1Ы (почему?). Искомый гомоморфизм /: § —> §' относит каждому элементу а е М смежный класс аN — элемент группы 5х = /(5), которая обозначается также через 5//У и называется фактор-группой группы 5 по ее нормальной под- группе N. Примечания. Условие нормальности подгруппы Л^с5 су- щественно использовано в рассуждении (где именно?). Благодаря нормальности Л^, можно в силу (в) смежные классы записывать
также в виде Nа. Но если подгруппа Яс5 не является нор- мальной, то левые смежные классы аН и правые смежные клас- сы На — не одно и то же, а факторизация 8 по Н не имеет смысла. В обоих случаях, однако, мощности всех классов, как и их количества при разложениях группы по подгруппе, одинако- вы, в силу чего для конечных групп справедливо важная Теорема Лагранжа. Порядок (число элементов) под- группы является делителем порядка группы. В разложении группы 5 по подгруппе Н ни один смежный класс, кроме самой Я, не является группой хотя бы уже потому, что не содержит нейтрального элемента. Примеры. 1. В абелевой группе все подгруппы нормальны. 2. В группе 5„ подстановок п-и степени (см. начало первой части книги) подмножество Ап четных подстановок (раздел "По- лилинейные формы и определители II части) образует подгруппу, притом нормальную; предлагаем читателю доказать это в каче- стве упражнения, основываясь на том, что каждую четную под- становку можно представить как произведение -четного числа (а нечетную — нечетного числа) транспозиций — перестановок пар элементов. Если 5 = К = (М, +, •) и 5'= К' = (М', +, •) — кольца, то ^ = {+, •}, О' = {+, •} (знаки операций не штрихуем), V*, уеМ: /(* + у)-/(х) + /(*/) & /(*• у) = /(*) • /(у), 1(0) = 0 (точнее, 0') и Ьег/К-фе М/}(х) = 0} — /-ядро кольца К. В случае, когда 1сег/К = {0}, отображение /: К -> К' инъективно (докажите!), т. е. представляет собой изоморфизм. Притом У*,г/еМ: /(*-у) = /(х)-/(у), ибо /(*) = /((* -У) + У) = !(х -у) + [(У)'. Для выяснения структуры ядра ^ег^К и его роли в кольце К = (Л1,+, •) понадобится следующее определение. Идеалом I кольца К называется подмножество со следующими свойствами: а) если х, у е /, то х — уе!', б) если х е /, то хг е I & гх е I при любом г е М. * Доказательство }(х -у) = }(х + (-1 )у) = /(*) + (-1 )/(*/) = /(*) - /(*/) предпола- гает наличие единицы в кольце К.
Так как из этих условий следует выполнение пунктов а) и б) рубрики "Подкольцо и подполе" (раздел "Алгебраические систе- мы с двумя бинарными операциями" I части), в чем убедиться предоставим читателю, то идеал кольца является его подколь- цом. Подмножество <а + /> = {а + х/х е /} с М называется смежным классом разложения кольца К по его идеалу /, порожденным элементом а е М\ как и при разложе- нии группы по нормальной подгруппе, здесь в роли порождаю- щего может выступать любой элемент класса, любые два класса либо совпадают, либо не пересекаются, а объединение всех клас- сов дает М\ никакой класс, кроме самого /, не является подколь- цом К, так как не содержит нулевого элемента (и не только поэтому). Определения суммы и произведения классов <а + /> + <& + /> = <(а + 6) + />, <а + />•<& + /> = <а& + /> корректны, ибо результирующий класс не зависит от выбора порождающих элементов в исходных классах (докажите!). Отно- сительно этих операций множество различных классов разложе- ния К по / образует фактор-кольцо К/7; проверка того, что все пункты определения кольца здесь выполнены, для читателя, усвоившего предыдущий материал, большого труда не составит. Нулевым элементом кольца К/7 служит сам идеал /. Теорема. При гомоморфизме колец /: К -» К' ядро ^ег^К является в К = (М, +, •) идеалом, а смежными классами служат полные прообразы элементов кольца К' = (Л1', +, • )• Доказательство. Если х, у е ^ег^К и г е М, то /(*) = /М = 0, /(*-!/) = /(*)-/00 = 0, ^-у€1сег,К, /(г*) = /(г)/(*) = 0, /(*г) = /(*)/(г) = 0, г*, хг € ^ег;К, т. е. Кег^К — идеал в К. Если, далее, а/ = /(а)€УИ/, то и 1(а + х) = /(а) + /(*) = а' при всех * € ^ег;К, и наоборот, т.е. <а + 1<ег/К> = !~1(а'). В частности, роль К' может играть фактор-кольцо К// по любому идеалу / кольца К, поэтому структуры всевозможных гомоморфизмов кольца полностью характеризуются его идеалами, т. е. "внутренними средствами".
Смежные классы разложения кольца К = (М, +, •) по его иде- алу / называют еще классами вычетов по модулю / *. Два эле- мента а, Ъ е М сравнимы по модулю /, если а — Ье /, что запи- сывается в виде а = Ь(тоА1), или а = &(/), или, наконец, просто а = Ь (последнее — когда всё время имеется в виду один и тот же фиксированный идеал); а*Ь означает а — Ь&1. Как и обычные числовые тождества и уравнения, сравнения по одному и тому же модулю можно складывать, вычитать и перемножать: если а = а' и Ь = Ь', то а ± Ь = а' ± Ь = а ± V = а' ± Ь', аЬ = а'Ь = аЬ' = а'Ъ' **. Пусть К = (Л1, +, •) — коммутативное кольцо. Идеал 1 = 1(а) = (а) = {ах + Ьа/хе М, и € 2}, порожденный одним элементом а е М (при наличии в кольце К единицы слагаемое /га излишне), называется главным ***. Теорема. В кольце Ъ целых, чисел и в кольце Р[х] много- членов над произвольным полем Р все идеалы — главные. Доказательство для К = ^ и для К=Р[я] проводится по одной и той же схеме. Пусть / — идеал в К = (М,+, •). Если / = {0} — нулевой идеал, то 1 = (0) — главный идеал, порожден- ный нулевым элементом кольца. Если же 1^={0}, то существует такой элемент афО, который в / является наименьшим положи- тельным числом (при К = ^) или унитарным многочленом наи- меньшей степени (при К=Р[*]); почему? Для любого х е I имеем x = а^-\-^, где 0<г<а, соответствен- но 0 < с!е§г < с!е§а (деление с остатком). Так как х, ^ е I, то а^ е I и г = х — аде1, откуда г = 0 в силу минимальности. Следовательно, x = а^, где ае! и ^ е М, т.е. / = (а) — идеал кольца К, порожденный его элементом а. * Ибо относительно сложения идеал образует абелеву группу, а такие группы в аддитивной записи часто называют модулями. ** Для кольца X целых чисел сравнения типа тождеств и типа уравнений (при наличии неизвестных элементов) подробно изучаются в курсе теории чисел. *** В некоммутативных кольцах надо различать правый и левый главные идеалы.
Примечания. 1. Для колец многочленов более чем одной переменной теорема не имеет места. Например, в кольце О.[х, у] идеал 1 = {Ах + Ву/А, Ве<0.[х,у]}, порожденный многочленами х и у первой степени, не является главным (покажите!). 2. Если К = (А1,+, •) — тело, в частности поле, то оно имеет лишь тривиальные идеалы: единичный {М} и нулевой {0} (дока- жите!). Поэтому гомоморфизм тел может быть только либо нуле- вым (/: К-»{$}), либо изоморфизмом, в частности автоморфиз- мом. Автоморфизмы полей подробно изучаются в теории Галуа (см. "Решение алгебраических уравнений с одной неизвестной" I части) и других разделах алгебры. Нам вскоре понадобится еще одна алгебраическая система. Пусть в линейном пространстве (V,+, Р) наряду со сложением и умножением на элементы поля введена бинарная операция * умножения элементов V друг на друга, удовлетворяющая усло- виям: 1) (V,*) — группоид*; 2) для любых х, у, г е V г* (х + у) = (г* х) + (г*у), (х + у) *г = (х* г) + (у * г); 3) V*, уе УУсс, ре Р: (о*) * (ру) = (<хр)(х * у). Система (} = (У,+, Р, *) называется алгеброй над полем Р**; она ассоциативна и/или коммутативна, если соответствующим свойством обладает композиция *. Размерностью (а также ран- гом или порядком) ей т О. алгебры Ц называется размерность пространства (V,+, Р), а базой алгебры — база пространства. При выделенной базе А =={«!, а2> •••} в О» Для нахождения композиции * Это условие не соблюдено для скалярного умножения векторов (см. раздел "Евклидовы и унитарные пространства"). ** Вообще под "алгеброй" понимается не только математическая дисциплина, но и алгебраическая система весьма широкого класса, и точные границы употребления этого термина в современной алгебре еще не установлены; мы используем его, следуя книге: Н. Г. Чеботарев. Введение в теорию алгебр. — М.; Л.: ОГИЗ, Гостехиздат, 1949 и книге А. И. Кострикина.
= *!*/!(«! * а^ + хмЖч * а2) + ... + Х2у1(а2 * а^ +^^2(^2 * ач) + - заданных векторов Х = ||*1 *2 -Ц-//«1 «2 •••// И */ = ||#1 Г/2 ...|| •//#1 #2 --У/ надо знать выражения композиций а1 * ау в базе А, т. е. коэффи- циенты с^} Е Р в разложениях Ч * а, = $4+^4+... = № С-1//«. «2-//, (2) называемые структурными константами алгебры (V,+, Р, *) и задающие ее (при фиксированном Р) с точностью до изомор- физма. В общем случае любой такой набор констант с^} е Р, из которых лишь конечное число отличны от нуля, определяет неко- торую алгебру, но если она ассоциативна, и/или коммутативна, то эти константы должны удовлетворять соответствующим соот- ношениям, которые мы сейчас выведем. Ассоциативность. Пусть V*, у, г е V: х * (у * г) = (х * у) * г. Тогда, в частности, при всякой базе А а так как и то (3) равносильно
здесь и в дальнейшем индексы I, /, &, р, ^ (а также г и др.) пробегают множество значений от 1 до п в случае конечной базы А = {аь а2, —} = {Я1. •••> я*К а если А бесконечна, то сум- мирование вида X ведется по всем слагаемым (в которых фи- Р гурирует индекс р), отличным от нуля — их должно быть конеч- ное число. "Наоборот", пусть в какой-то базе А имеют место (3), значит, и (4); тогда для любых х = ^храр, */ = Х#<А> р ч г = ^ггаг из А: г Коммутативность. Если Ух, у: х*у = у*х, то при всякой А для любых а,, ау€ А т. е. "Наоборот", если последнее выполнено для любых значений индексов в какой-нибудь базе А, то V*, у: х * */ = у * х. Желающим предлагаем выяснить, как преобразуются струк- турные константы алгебры при переходе к другой базе (см. упо- мянутую в сноске книгу Н. Г. Чеботарева). Исходя из общего определения гомоморфизма алгебраических систем, для алгебр (}1 = (У1,+, Р, *) и Ц2 = (У2, +, Р, *) он вводит- ся как линейное отображение /: (V,, Р)-»(У2, Р) пространств (II часть книги) при дополнительном условии
где х, у е У!, а звездочки слева и справа означают композицию в Ои соответственно в (}2. Ядро Кег^ = {х е \1^/}(х} = 0} является подалгеброй (с индуцированной композицией *) в С^ и, благодаря тому что х, у е 1сег^! => х — уе ^ег^, Ухе Кег^ Узе У^ г*л:е Кег^ & х * г е Кег^, именуется идеалом алгебры Ц,. Как и в случае колец, полными прообразами /"Ч*') элементов х' € У2 служат смежные классы разложения \^ по идеалу / = 1сег^1, и их независимо от гомо- морфизма / можно определить в О! "внутренним образом": они будут элементами фактор-алгебры С^//. Примеры. 1. Лиево кольцо (см. начало раздела "Алгебра- ические системы с двумя бинарными операциями" I части), в котором определено также умножение векторов на элементы поля Р, является алгеброй, не ассоциативной и не коммутатив- ной, над этим полем. 2. Поле комплексных чисел можно рассматривать как двумер- ную алгебру (С, +, К, •) над полем действительных чисел, с вы- деленной базой {1,1} и законом умножения (композиции) 1-1 = 1, 1 . [ = 1. 1 = ^ I. / = — 1 ? т. е. структурные константы здесь г(1) _ 1 г(1) _ Г(П _ П г{1) - -1 1^11 — 1, ^19 ~~" 21 ~~" ' 22 ~~" * г<2) _ 1 г(2) _ г№ - 1 г(2) _ П 41 ~~ А« 42 ~~ ^21 ~" А» ^22 ~~ ^' Эта алгебра ассоциативна и коммутативна. 3. Тело кватернионов представляет собой четырехмерную ал- гебру над полем действительных чисел, с базой {!,/,/,&}, ассоци- ативную, но не коммутативную; структурных констант здесь 64, мы предлагаем читателю выписать некоторые из них выборочно. Это тело содержит подполе комплексных чисел, однако алгеброй над ним не является (почему?). 4. Восьмимерная алгебра Кэли над полем К действительных чисел, с базой {1,/, у, ^,/, р, ^, г} и "таблицей умножения" (не для заучивания!)
не ассоциативна и не коммутативна; это "неассоциативное тело" является также двумерной алгеброй над телом кватернионов. Обоснование всего сказанного можно найти, например, в книге: А. Г. Курош. Лекции по общей алгебре. — М.: Физматгиз, 1962. 5. Кольцо М„(Р) квадратных п х я-матриц над полем Р (см. пос- ледний раздел I части) является алгеброй (М"(Р), +, Р, •) размер- ности п2, поскольку обладает базой {Еч/1, /=1,2, ..., п}, где Еч — матрица, у которой элемент 1-й строки в /-м столбце равен /, а осталь- ные п2— 1 элементов — нули. Композицией * служит матричное умножение, так что закон композиции базовых элементов имеет вид V*.-!-1""""» им.м,...,»} [о; при / * ь, (а каковы здесь структурные константы и сколько их?). Элемент 1е V алгебры (} = (У,+, Р, *) называется главной единицей, если к * 1 = 1 * к = к при всех к е V. Нулевая алгебра, в которой Уд:, у е V: х * у = 0, и лиева алгебра в примере 1 не имеют главной единицы (почему?), в примерах 2, 3 и 4 это эле- мент 1, в примере 5 — матрица Е = Еи +Е22+ ... +Епп. О важной роли алгебры примера 5 говорит Теорема. Для любой конечномерной ассоциативной алгебры О = (V, +, Р, *), обладающей главной единицей, существует изоморфная алгебра квадратных матриц (над полем Р) порядка с11т(}, а в отсутствие главной единицы — порядка 1 +<ЛтС1
Доказательство. Пусть А\тС1 = п€ N и А = {а,, ...., ап} — какая-нибудь база алгебры Ц, а /:(}-> МЦ(Р) — отображение, которое введем следующим образом. В плане определения / будем считать, что /(дс + у) = /(*) + /(*/) и /(ах) = а/(д:) при любых к, уе V, ае Р, и тогда для определения этой функции на всём мно- жестве V достаточно задать значения /(а,) при [= 1, ..., я, а чтобы / было гомоморфизмом — добиться выполнения условий /(а, * а,) = = /(а,) • /(ау) тоже на векторах базы А. С этой целью положим где из развернутой матрицы структурных констант при заданном [ видно, что в обозначении общего элемента левый нижний ин- декс — номер строки, а верхний (в скобках),— номер столбца. В силу ассоциативности алгебры Ц, равенства (4) выполня- ются при любых значениях (из множества {1, ..., п}) индексов и после их переименования посредством подстановки принимают вид и тогда М СрЬ Гомоморфизм / является изоморфизмом в том и только том случае, если ^6^0 = {х е У//(л:)= Опп} = {0}, а это условие заве- домо соблюдено, когда одним из элементов базы А служит глав- * Тот, кому наши "индексные трюки" кажутся подозрительными, может проде- лать все выкладки над полностью записанными матрицами при л = 3.
336 Комбинаторная алгебра ная единица алгебры. Если, например, выбрать а{ = 1 *, то верх- няя строка матрицы /(а,) будет иметь вид \\0 ... 11... 0||, где индекс г показывает, что единица расположена на 1-м месте (остальные элементы строки — нули), а верхней строкой матрицы /(*) для вектора дс = р, ... хп\\ •//а\ ... ап// окажется \\х{ ... хя|], так что при лг^О будет /(х)*Ояя. В случае отсутствия у алгебры Ц главной единицы положим (при произвольной базе А) />,)= 0 0 0 0 ... 1, . . 0 /(«-) где /(а,) определяется из (5); тогда /"(*) = ][>д<0= 0 0 0 *\ - х« /(*) />+*/)= о *, + »/, о о х„+Уя /(*) + /(») = /(*)+/». * Напомним, что согласно определению (5) отображение / зависит от выбора базы А; ее построение можно начать с любого ненулевого вектора.
при любых х = \\х{ ... хп\\-//а1 ... ал//, у = \\у1 ... у^-//а{ ... аУ/е е V, аЕ Р, и по правилу умножения матриц, разбитых на блоки,
= /(в|)'/(«/)* ПРИ всех а" я/еА> откуда /(**у) = /(*)*/Ы • Как и выше, из х=^0 следует, что матрица /(*) — ненулевая, т.е. отображение /: О—»МЦ*[(Р) — изоморфизм. Вопрос о наличии изоморфизмов /:0—>М^(Р) с п<А\тО, частично решается в книге Н. Г. Чеботарева. Примеры бесконеч- номерных алгебр встретятся нам в следующих разделах. 6. Пусть Ц = ((?,+, •) — произвольное тело. Подмножество Г=Г(С1) = {*е <ЗЛ/г/Е <Э:ху = ух} элементов, перестановочных со всеми элементами тела, называет- ся его центром; Т — подполе О (докажите!), а само Ц является алгеброй, тем более линейным пространством, над полем 7, и эта алгебра ассоциативна, если таково само тело Ц; размерность пространства называется размерностью сПтО. тела. В теле, рассматриваемом как алгебра над своим центром, еди- ница / является главной (почему?), и по теореме примера 5 эта алгебра изоморфна некоторой алгебре квадратных матриц над полем Т. Если это конечные п х я-матрицы, то их алгебра, а зна- чит, и изоморфная ей Ц, обладает размерностью А\тО, = п2, т.е. размерность любого ассоциативного тела, если она конеч- на, является точным квадратом. Отсюда сразу следует неассоциативность алгебры Кэли (при- мер 4). Тем, кто хочет углубленно изучать алгебру (в первом смысле этого слова), надо привыкнуть к царящей в ней эквилибристике терминами и понятиями и научиться формулировать точные опре- деления в каждом конкретном случае. Кстати, в данном выше определении алгебры не обязательно, чтобы Р было полем: во многих случаях это может быть лишь ассоциативно-коммутатив- ное кольцо с единицей. Примером систем, не подходящих и под это определение, являются булевы алгебры, которые играют важную роль в теории множеств и математической логике — см., например, книгу: А. И. Мальцев. Алгебраические системы. — М.: Наука, 1970. * Поскольку умножение матрицы \\0 ... 1 ... 0{ на п х л-матрицу /(а,-) "высекает" из последней 1-ю строку.
Упражнения. 1. Пусть С — группа (записанная мультипли- кативно); коммутатором пары ее элементов а, Ь называется элемент [а, Ь] = аЬа~1Ь~\ а коммутантом [С] группы — множе- ство всевозможных произведений конечного числа коммутаторов пар ее элементов. Докажите, что а) [6, а] = [а, Ь}~\ Ьа = [Ь,а]аЬ\ б) х[а, Ь]х~1 = [хах~1, хЬх~1} при любом х е С\ в) [6] — нормальная подгруппа группы С; г) фактор-группа С/[С] абелева; д) если С/N абелева, где N — нормальная подгруппа С, то [С]с#. 2. Алгебра (} = (У, +, Р, *) называется лиевой (алгеброй Ли)*, если (У,+, *) — лиево кольцо (см. пример 1 выше), т.е. в нем при любых х, у, г (х * у) * г + (у * г) * х + (г * у) * к = О (тождество Якоби), х * х = 0 (антикоммутативность) **. а) Какими соотношениями связаны (в базе А = {а,,а2, •••}) структурные константы лиевой алгебры Ц? б) Если эта Ц конечномерна, то существует ли изоморфная ей алгебра квадратных матриц порядка 1+сИтЦ? Историческая справка. Зачатки факторизации просмат- риваются уже в древнегреческой теории пропорций (равенство отношений у Евдокса и Евклида). На протяжении веков каждый, кто имел дело с простыми дробями, фактически сталкивался с факторизацией, не называя ее по имени или называя неправиль- но, что приводило к путанице и мешало пониманию сути дела. Чего стоит, например, избитая формулировка: "если числитель и знаменатель дроби умножить или разделить на одно и то же число (подразумевается: отличное от нуля), то дробь от этого не изменится". Дробь-то как раз изменится, а неизменным останется записываемое с ее помощью рациональное число — результат * Над полем Р. ** Ибо отсюда следует у*х = — х * у\ а верно ли обратное?
факторизации множества дробей по отношению "равенства" — эквивалентности, отличной от "совпадения"*. Отношение эквива- лентности в логическом плане рассматривает Лейбниц (называя его "подобием"), а Лагранж объединяет в один класс квадратич- ные формы с одинаковым дискриминантом; ряд других примеров факторизации мы находим у Гаусса. В процессе становления алгебраических, логических и других систем, теории множеств и прочих разделов современной математики бинарные отношения эквивалентности элементов встречались буквально на каждом шагу, независимость свойств классов разбиения от выбора в них представителей доказывалась отдельно в каждом конкретном случае, но общий характер этих рассуждений витал в воздухе, и абстрактная формулировка теоремы о разбиении, с универсаль- ным доказательством, появлялась параллельно и независимо, так что назвать ее "хронологического первооткрывателя" мы затруд- няемся. Что касается алгебр, то они в достаточно общем виде (но только над полями К и С) фигурируют у Г. Грассмана под име- нем гиперкомплесных систем (1830—1840); одной из них являет- ся тело кватернионов, обнаруженное несколько раньше У. Га- мильтоном. В 1878 году Г. Фробениус доказал, что над полем К действительных чисел не существует, кроме С и тела кватерни- онов, других ассоциативных алгебр конечной размерности. Алгеб- ры же над произвольными полями стали систематически изучать- ся только с начала XX века. Доказательство теоремы Фробениуса можно найти, например, в книге: Нечаев В. И. Числовые системы, -г- М.: Просвещение, 1975, а подробный исторический обзор — в книге: Бурбаки Н. Очерки по истории математики. — М.: ИЛ, 1963. На закуску предлагаем читателю разрешить следующий пара- докс. Как установлено в примере 6, размерность конечномерной алгебры должна быть точным квадратом; однако алгебра С над полем К является линейным пространством размерности 2. * Здесь мы отошлем читателя к книге [8] (см. конец предисловия), где это подробно разъясняется на "школьном" уровне.
НАЛОЖЕНИЕ КОМПЛЕКСОВ И СИММЕТРИЧЕСКИЕ КВАЗИМНОГОЧЛЕНЫ Понятия функции, операции и отображения, встречавшиеся нам до сих пор, включают требование единственности результата действия над заданными элементами, а пример в конце раздела "Поле комплексных чисел" I части книги показывает, к какому абсурду может привести наивное введение "многозначных функ- ций". Однако нередко встречаются и такие действия, доступные математическому изучению, при которых в зависимости от каких- либо дополнительных обстоятельств может получиться несколько различных результатов. Так, говоря авансом, результат "неодноз- начной операции" наложения А на В зависит не только от того, что и на что накладывается, но и от того, как накладывается. Для изучения подобных действий прежними алгебраическими средствами в случае, когда результатов С,, С2, ..., Сп конечное число и никакой из них не предпочтительнее остальных, имеет смысл, например, считать единственным результатов наложения А на В формальную сумму С{ + С^ + ... Ся, рассматривая тем самым Л, В, С,, ... как элементы некоторой алгебраической системы. Пусть 0 = (УИ, *) — произвольный группоид; композиция *, как и положено, однозначна, и никаких требований типа ассоциативности или коммутативности мы поначалу к ней не предъявляем, а знак * разрешаем опускать, благодаря чему, например, выражение (а * Ь) * с можем записать как (аЬ)с или аЬ * с, выражение (а * (Ь * с)) * Ь — в виде (а * Ьс)Ь и т. п. Теперь образуем алгебру 0(0) = (У, +, Р, *), где Р — любое поле нулевой характеристики, элементами V служат линейные комбинации комплексов, точнее, С-комплексов — конечных набо- ров (в фигурных скобках) элементов из М. Порядок расположе- ния элементов в наборе считается безразличным, но они могут повторяться, в отличие от элементов множества; два комплекса равны (один и тот же комплекс), когда они содержат одни и те же элементы, в одинаковых количествах. "Проникновение элемен- тов поля Р внутрь скобок комплекса" не предусмотрено, поэтому любая система (конечная) попарно различных комплексов линейно независима, а множество всевозможных С-комплексов служит базой пространства (V, +, Р), бесконечномерного даже тогда, когда группоид С состоит из единственного элемента, ибо комплексы {а}, {а, а}, {а, а, а}, ... все различны.
Во избежание путаницы в тонком различии между "одинако- выми элементами" и "одним и тем же элементом" (а, как изве- стно, где тонко, там и рвется), условимся составлять комплексы следующим образом: сначала берем множество различных симво- лов, скажем {х, г/, 2, и, V}, а затем заменяем символы элемен- тами УИ, причем разные символы — не обязательно разными элементами (к тому же каждый из них может быть как "перво- зданным", так и скомбинированным посредством операции компо- зиции группоида) *. Число мест, разделенных запятыми в записи комплекса Л, назовем его длиной /(Л), а под /(а,й, +...+ сстйт) будем понимать наибольшую из тех /(&,), для которых ос, Ф 0\ считаем по определению /(0) = 0. Ясно, что длина комплекса от замены символов элементами М не меняется. Наложение одного комплекса на другой определим, во избе- жание громоздкости записи, на конкретном примере. Символом наложения комплексов будет прежняя звездочка, которую, как и при композиции элементов группоида, разрешается опускать, если это не приводит к недоразумению. Пусть требуется наложить комплекс {а, а, Ь] на {&, с], где а, и, с е М. Накладываем сначала комплексы различных элемен- тов (т. е. множества) {х, г/, г} на {и, V}: * Строго говоря, комплекс — это отображение, не обязательно инъективное, конечного множества {х, ... V} в М. после чего, полагая получаем
поскольку выражения внутри фигурных скобок, разделенные за- пятыми, можно менять местами, а слагаемые — не только пере- ставлять, но и группировать. Предлагаем читателю проверить, что при х = г = а, у = V = Ь, и = с получится лишь другая запись тех же равенств. В общем случае, если /(&,) = /, и /(&2) = /2, количество слага- емых "произведения" й,&2 равно где & = тт{/1, /2} (покажите!); в представленном конкретном приме- ре /, = 3, /2 = 2, А; = 2 и число слагаемых 1 +3-2 + 3- 1 -2!= 13. Оче- видно, в &1&2 ровно одно слагаемое имеет длину /, + /2, все осталь- ные — меньшие длины; следовательно, 1(К{Ъъ) = 1(Ъ{) + 1(Н%) и /(^,^2) ^ '(^1) +1(^2) ПРИ любых г/!, г>2 е V (но почему <, а не = ?). Лемма 1. Если группоид С ассоциативен и/или коммута- тивен, то соответствующим свойством обладает и опера- ция наложения С-комплексов. В самом деле, если при раскрытии выражений &,Л2 * &3 и &1 * &2/г3 пРВДеРживаться одинаковой системы записи слагаемых (например такой, как в рассмотренном выше примере), то слага- емые, появляющиеся в обеих суммах на одинаковых местах, могут различаться лишь разной записью одного и того же эле- мента — скажем, ху * г и х * г/г, в ассоциативном группоиде С. При раскрытии же &,&2 и &2^1 в случае коммутативности С дело обстоит чуть-чуть сложнее лишь потому, что одинаковые слагае- мые обеих сумм могут оказаться на разных местах. Все это ясно видно уже на конкретном примере, а скрупулезное доказатель- ство в общем виде рекомендуем только особо желающим. Из самого определения операции наложения комплексов
следует, что где длины "сомножителей" и вычитаемых меньше длины исходно- го комплекса. Пользуясь этим (и, конечно, дистрибутивностью относительно +), можно любой 0-комплекс представить в виде линейной комбинации "одночленов", образованных из одноэлемен- тных комплексов только наложениями; например, или или, скажем, откуда ясно, что в общем случае такое представление не един- ственно *. Однако, как будет показано, единственность имеет место, когда группоид О — ассоциативно-коммутативный. Тогда во всех результатах композиций символы элементов множества М можно писать в любом порядке, без скобок (и знака *), а также использовать обозначения а2 = аа, а3 = ааа и т. д. Благо- даря лемме 1 то же относится и к "произведениям" комплексов: так, * Самый простой пример:
Два "одночлена" равны тогда и только тогда, когда они содержат одни и те же одноэлементные "сомножители", в одинаковых сте- пенях, или, что равносильно, когда равны комплексы, составлен- ные из элементов этих "сомножителей". Лемма 2. Любая конечная система попарно различных, "одночленов" из V линейно независима. Доказательство. Как мы уже знаем, если г/,, ..., г/т € V — попарно различные комплексы, то из а,0, + ... + ат0т = 0 (1) (а,, ..., ат € Р) следует а, = ... = ат = 0; покажем, что это верно и тогда, когда VI, ..., Vт — любые "одночлены" (разные!). Пусть г;.,..., ^ — те из них, которые обладают наибольшей длиной /, и а/4 = (а,5, ..., а/5)— ... ($ = 1, ...,&), а длины всех вычи- таемых меньше /. Записав (1) в виде «/, К, — в!/) + - + <Ч (а„, ..., ал/) = г>Е V, где /(^) < /, заключаем, что левая и правая части равенства по отдельности равны 0; а так как & комплексов левой части линей- но независимы, то с^ = ... = сс/4 -0. Предполагая теперь, что в (1) все нулевые слагаемые опущены, и опять выделяя "одночлены" наибольшей длины (уже < /), мы покажем, что коэффициенты при них — тоже нули, и т. д., пока не получим а, = ... = ат = 0. Из этой леммы непосредственно следует Теорема 1. Если С — ассоциативно-коммутативный груп- поид, то в алгебре (}(С) = (У,+, Р, *) представление С-ком- плекса в виде линейной комбинации таких, различных, эле- ментов множества V, которые получаются из одноэлемен- тных, комплексов при помощи только наложений, единственно (с точностью до перестановок слагаемых и ком- плексов-"сомножителей", а также формы записи элементов в комплексах). Например,
к сожалению, удобных общих формул для непосредственного выражения {а, а, ..., а} через {а}, {а2}, ..., и наоборот, {а"} через {а}, {а, а}, ..., не найдено, и мы ограничимся выводом двух рекуррентных формул, позволяющих получать такие выражения шаг за шагом. Для удобства записи будем отрезок последова- тельности (в частности это может быть вся конечная последова- тельность), состоящий из & одинаковых символов х, изображать в виде х<Ь>, так что, например, а, и, и, и, а, а, Ь можно на- писать как а, й<3>, а<2>, и, а комплекс {а, и, и, и, а, а, и} — не только в виде {а, й<3>, а<2>, и}, но и как {а<3>, й<4>}. Имеем Умножая второе равенство на — (я"1), третье — на (я"1)^"2), ..., последнее — на (—1)п~2(п — 1)(п — 2)...2 и прибавляя всё к первому, получаем а из этой формулы — ее "обращение"
2! Алгебры комплексов по модулю т. Подмножество 1тсУ алгебры Ц(О) = (V, +, Р, *), состоящее из нуля 0 и все- возможных линейных комбинаций комплексов с длинами не ме- нее заданного натурального числа т > 2, образует в Ц идеал, ибо ни разность таких комбинаций, ни результат наложения на любой комплекс, значит на любой элемент из V, в любом поряд- ке, не может содержать комплексов длины менее т. Фактор- алгебра ат(С) = 0,(С)/1т называется алгеброй (С-)комплексов по модулю т; ее элементы обозначаются как прежде, с той лишь разницей, что все комплексы длины > т считаются равными 0. Записав в Ц произвольный комплекс длины т в виде линейной комбинации "одночленов" с "сомножителями" меньших длин и приравнивая ее к нулю, мы получим в Цт зависимость, невоз- можную в Ц; поэтому теорема 1 (о единственности) в алгебре комплексов по модулю т не имеет места. Симметрические квазимногочлены. Пусть (Л1, +, 0) — коммутативный моноид (см. начало раздела "Алгебраические сис- темы с одной бинарной операцией" I части) в аддитивной записи, а элементами группоида С служат квазиодночлены — выражения вида х^ х%*... х™" (р € М), где х1 — формальные переменные и "по- казатели степени" т, е М трактуются тоже формально **; порядок * Обращаем внимание на то, что л = /+ ... + / (п слагаемых) — не само число я, а элемент поля Р; "излишества" же типа {а<1>} и 2! придают формулам единообразие. ** При подстановке вместо х, и т, конкретных чисел могут возникать выра- жения, либо вообще не имеющие смысла (О"1), либо не определяемые в рамках чистой алгебры и ); кому это не по душе, пусть не подставляет: на свете есть много других игрушек!
расположения "сомножителей" х™1 в квазиодночлене считается без- различным, а композиция * квазиодночленов определяется так же, как умножение одночленов в обычной "школьной" алгебре: показа- тели при одном и том же "основании" складываются. Определяя (также формально) квазимногочлены как линейные комбинации квазиодночленов над заданным полем Р нулевой характеристики, получим ассоциативно-коммутативную алгебру 0 = 0(0) = = (У,+, Р, *), и пусть С^ + 1 — ее фактор-алгебра по модулю т = ^+ 1, где ^ — заданное натуральное число. ^ Обозначим через ^х^х^...х^р (\<р<^} сумму всех таких квазиодночленов, которые получаются из выписанного замещени- ями нижних индексов (но без изменения индексов при "показате- лях степени") попарно различными числами множества {1, 2,..., </}; количество слагаемых равно числу ^\/(^ — р)\ разме- щений ^ предметов по р местам; при д = 0 и при ^<р считаем всю сумму равной нулю. Например, "Сомножители" вида х° под знаком Е опускать нельзя:
и даже тогда, когда можно считать л:°=/, лишь при <7 = 2 и в 1 1 тривиальном случае ^ = 0 суммы ^*Г и У^Г*2 совпаДают> а при любых р, г е {1, ...,</}, таких что 1<г<р, (докажите!). Подалгебра в С^ + 1, порожденная всевозможными суммами ^ вида V х^х%'2 ...х™р с \<р<^, называется ^-алгеброй симметри- ческих квазимногочленов. Теорема 2. Биещия устанавливает изоморфизм между ^-алгеброй симметричес- ких квазимногочленов и алгеброй комплексов по модулю ^+\ над тем же полем Р (и при том же группоиде О). Доказательство. Пусть * Напомним, что р, ^, г в дроби перед знаком Е — не сами числа, а суммы соответствующих количеств р, ^, г единиц поля Р. но в то же время
покажем, что Если хотя бы одно из чисел р, 5 больше ^, то соответствующие суммы в левой части (4) и комплексы в правой являются нулевы- ми элементами своих алгебр и тем самым соответствуют друг другу при данной биекции <-». Пусть теперь \<р<^, \<8<^\ будем доказывать (4) индукцией по р. Отметим прежде всего, что нижние индексы (замещаемые числами 1, ..., ^} под знаком не обязательно 1,2, ...,р: это могут быть любые различные числа или другие значки, в любом порядке. При р = 1 имеем Предполагая теперь соотношение (4) справедливым при некото- ром р > 1 и любых 5, покажем, что оно останется в силе, если значение параметра р увеличить на 1. Пользуясь уже доказанной частью теоремы и индуктивным предположением, получаем Итак, закон композиции базовых элементов ("таблица умноже- ния") в обеих алгебрах один и тот же, и продолжая естествен-
ным образом биекцию <-> на линейные комбинации (над тем же полем Р), мы установим изоморфизм между этими алгебрами. <7 I % % Пример. При С = Р = К выразим V--1--2- через степеннш Лт4 уК *3 суммы вида ^*,т ; считается, что возведение числа в иррацио- нальную степень определено (конечно, не без помощи анализа). В частности, при <?<3 исходная сумма равна нулю, и мы получаем соотношение между пятью степенными суммами (а будут ли они независимы, если ^ > 3?). В случае, когда О = (М У {0}, +) — моноид с обычным сложе- нием, композицией * служит обычное умножение, натуральные степени переменных понимаются уже не формально, а нулевая
степень считается главной единицей, совпадающей с единицей / поля Р, — алгебра квазимногочленов Ц = (У, +, Р, •) представля- ет собой кольцо многочленов Р[хи ;с2,...] от любого количества переменных. Важную роль играют элементарные симметричес- кие многочлены от заданного числа п е N переменных: при этом считается по определению о^, =0^2 =... =0. Обозначе- ние степенных сумм: 5^л) = я*+... + 5*. Так как в группоиде С = (М, *) символ а* означает а * а * ... * а (Ь раз), а в (М У {0},+) операция * — сложение, то под {/*} понимается {&} (под {!<&>}, как и прежде, — комплекс {/, /, ..., /} из & единиц поля). Учитывая еще, что (объясните, почему), мы из формул (2) и (3) получаем (формулы Ньютона). Из (У) последовательно находим (верхний индекс (п), здесь все время один и тот же, для простоты записи опущен):
(Напомним, что а^, = а^ = ... = 0; поэтому, например, при п = 2 будет 54 = а,4 - 4а?а2 + 2а^.) Многочлен А = А(х1у..., ял) е Р[х1у х2,...], не меняющийся ни при каких перестановках переменных х{,..., ял, называется симме- трическим, точнее, п-симметрическим *. Если ах^...х** (/!,...,/Ае {1, 2,..., л}, 1<&</г) — член Л, то и вся сумма я я а - ^ х,1"1... я™* содержатся в А\ разность же А - а - ^ лО... л^ либо нулевая, либо опять /г-симметрический многочлен, и из него, в свою я очередь, можно выделить сумму вида р-^Гхр...х? , и т. д., пока не будут исчерпаны все члены Л, так что сам А представится как линейная комбинация (над Р) симметрических многочленов вида я 2**Г— ** (с разными </, I <^ <п). Последние же, благодаря теоре- мам 1 и 2, выражаются через степенные суммы, а значит, с помощью формул (З7), — и через элементарные симметрические многочлены. Разумеется, единственность такого представления А не следует отсюда автоматически, но мы докажем, что она все-таки имеет место. Искомое выражение для А = А(х{,..., хп) е Р[х{, х2,...] — это многочлен Ла = Ла(а,, ...,ая)е Р[аи ..., ая], в котором а, считаются независимыми переменными и который после замены этих пере- менных соответствующими элементарными симметрическими мно- гочленами а|я) от Хц...,ха превращается в А. Тривиально, что если Л, Ве Р[х^ х21...], то из Ла = Ва следует Л = В, но нам надо доказать обратное утверждение, равносильное такому: если * Так, 3-симметрический многочлен *Х + *Х + Х-Х1 + х*х: + ^Х + х+х* не является 4-симметрическим (почему?).
многочлен, для которого нулевой, то сам С0 — тоже нулевой. Допустив, что многочлен С0 — ненулевой, рассмотрим в нем тот одночлен -уоро^о^... а™* (у=^0, ^1 + 2т2 + 3т3 + ... + /гтл = я, все т,-е N у {0}, а° =/, я,0 =/), у которого т! — наибольшее, т2 — наибольшее при этом т{у т3 — наибольшее при этих т{ и т2 и т. д. Из него подстановками а,. = а|п) образуется выражение а после раскрытия всех скобок — сумма, содержащая слагаемое т,+ш.2+...+тЛ т2+---+т* у"1* ул1 • Л2 , ..., лл , которое в С не может ни с чем уничтожиться (почему?), так что многочлен С — ненулевой. Итак, доказана Теорема 3. Любой симметрический многочлен можно выразить через элементарные симметрические с помощью операций сложения и умножения; это представление един- ственно (с точностью до перестановок сомножителей и слагаемых). Покажем на примерах, как практически осуществляется такое представление; при Р = 0> имеем или, без посредников в лице степенных сумм,
На этом же многочлене мы проиллюстрируем и метод неопре- деленных коэффициентов; хотя здесь запись решения с его помо- щью окажется более громоздкой, в общем случае дело обстоит иначе (см., например, упражнение 1). Так как данный многочлен (однородный) — степени 3, то в искомом его представлении могут участвовать только комбинации о^, <5{ъ<2 и а3; поэтому, полагая я = 3*, можем записать и, придавая переменным я,, х2, хг различные числовые значения, составить систему уравнений для нахождения неизвестных а, (3, у: Отсюда имеем в (*): ос = 0, Р=1, у = —3. Чтобы избежать "гадания" при выборе частных значений пере- менных (как показывают более сложные примеры, "систематич- ность" в нашем простом случае — только кажущаяся), можно действовать так: равную нулю разность переводим на язык комплексов, выражаем все комплексы через одноэлементные и применяем теорему 1; именно, * Задавать (почему?). можно, но не нужно, а п < 3 и вовсе нельзя
1 1 и из Д = 0 следует равенство нулю всех трех коэффициентов при "одночленах", откуда опять а = 0, р=1, у=— 3. В рассмотренном простом примере слагаемые правой части (*) /I очевидны, в общем же случае многочлена ^х^х^... х™" при методе неопределенных коэффициентов для выписывания всех слагаемых требуется систематический обзор наборов целых неотрицательных чисел л,, /г2, ..., п^ удовлетворяющих уравнению /г, + 2/г2-К.. -|-/гпд = т = т1 + т2 + ,.. + тЛ. (**) 5 Так, для многочлена А =^А(х^ *2, *3, х4, х5)= ^х^х^х^х^ , где п = 5, т = 8, Л = 4, уравнение (**) /г1 + 2п2 + 3/г3 + 4/г4 = 8 имеет 15 решений, которые мы выпишем, вместе с соответству- ющими а-произведениями, в таблицу Согласно теореме 3 существует единственная система чисел (Х1,а2, ..., а15 такая, что а,о? +а2а?52 +... + а,5а^ = ^х*х%х%х4, и
для нахождения этих коэффициентов надо, придавая конкретные значения переменным {я,}, составить систему уравнений относи- тельно неизвестных {а,}; любая система, которую можно так получить, совместна (почему?), требуется лишь, чтобы среди ее уравнений нашлось 15 независимых. Работа нудная, но читателю надо ее один раз проделать, прежде чем перейти к озна- комлению с другим способом решения задачи — при помощи наложения и редукции комплексов. На каждом шаге редукции некоторый комплекс {дг,<й,>, п2<&2>, ..., пг<Ь,>} с п1 > п2> ... > пг> 1 выражается через анало- гичные комплексы [п[ < % >, п^ < 1% >, ..., п5 < Ь'5 >} (п(> 1Ц> ... > п'$ > 1), в которых либо щ<щ, либо щ = щ & % < 6,. Процесс этот ветвящийся, его шаги не объединяются в одну цепочку ра- венств, но в результате мы приходим к выражению изначально заданного комплекса через комплексы {!<&>} (с различными 6 € 1^). Проиллюстрируем решение на конкретном примере комп- лекса {3, 2<2>, 1}, отвечающего (как в теореме*2) рассмотренно- 5 му выше многочлену Л = У Л^А^Л;^ и принадлежащего алгебре Ц6, поскольку п = 5. В данном случае #, = 1, и при первом шаге редукции мы наложим комплекс {1} на {3—1, 2<2>, 1} = {2<3>, 1}: {1}{2<3>, 1} = 3{3,2<2>, 1} + {2<4>} + {2<3>, 1<2>}; отсюда выражается исходный комплекс, что во избежание дроб- ных коэффициентов удобнее записать так: 3{3, 2<2>, 1} = {1}{2<3>, 1} - {2<4>} - {2<3>, 1<2>}, (а) и нам теперь предстоит редуцировать три комплекса, но уже с меньшими я, (здесь все три я, равны 2). Комплекс {2<3>, 1} с &, = 3 — один из результатов наложения (слагаемое 0 указывает на то, что есть и другие результаты, но все они обладают длинами более 5, а о числовых коэффициентах см. примечание ниже), откуда
23-3{2<3>, 1} = {1<3>}{1<4>}-22-32{2<2>, 1<3>}; (б) новый комплекс {2<2>, 1<3>} тоже ставим в очередь на редуци- рование. Для {2<4>} (у него Ь{ = 4): и равенство (в) можно заменить на 23 • 3 • 5{2<4>} = 5{1<4>}2 - 23{1<3>}{1<5>}. (в7) Дождался своей очереди и комплекс {2<2>, 1<3>} (/^=2): а это позволяет заменить (б) на 23 - 3 • 5{2<3>, 1} = 5{1<3>}{1<4>} - 32{1<2>}{1<5>}. (6х) С помощью равенств (6х), (в7) и (г) мы из (а), предварительно умноженного на 23-3-5, получаем откуда т. е. Для
а после перевода на язык многочленов: и окончательно, Примечания. 1. При наложении комплексов необходимо помнить, что в каждом из них порядок расположения элементов не играет роли, но все результаты наложения, среди которых могут быть и одинаковые, должны быть учтены. В описанном п способе выражения многочлена 2^^Г'^Г2••• ^Г через элементар- ные налагаемый комплекс всегда состоит из единиц, и для пра- вильного учета всех результатов наложения мы поступаем следу- ющим образом: 1) в комплексе, на который производится наложение, порядок элементов фиксируем; 2) единицы налагающегося комплекса считаем различными его элементами, отмечая это, например, с помощью штрихов; 3) после осуществления всех наложений штрихи опускаем и в полученной сумме комплексов приводим подобные члены. Всё это (кроме штрихов) отражено в первоначальной записи коэффициентов при решении конкретного примера. 2. С первого взгляда не ясно, всегда ли (а не только в рас- смотренном примере) на последнем этапе решения, после деле- ния обеих частей равенства на коэффициент левой части, в пра- вой не появятся дроби. Вместо дополнительного анализа всей процедуры проще сослаться на то, что результат (единственный!) можно было бы получить и другим путем: выразить все комплек- сы через одноэлементные, перейти к степенным суммам и под- ставить вместо них а-выражения по формулам (3') — а при этом дроби не возникают.
Упражнения. 1. Выразить многочлен (х{-х2)2(х2- х3)2 (х3-х{)2 через элементарные симметрические. 2. Не пытаясь решить уравнение х5 = х+1, найти сумму кубов его корней (ответ: —4). Темы для самостоятельной работы (по выбору): 1. Результант Безу (выраженный через корни многочленов) и связь его с результантом Сильвестра (через коэффициенты, см. раздел "Проблема исключения" II части). По книге А. Г, Куроша или Б. Л. ван дер Вардена. 2. Двумерные симметрические функции. По статье: А. А. Зы- ков, Алгебры комплексов. Математический сборник, 41 (1957), № 12, стр. 160-176.
ГРУППЫ ПОДСТАНОВОК С группой 5Я подстановок п-и степени, действующих на мно- жестве N = {1,..., п} с N. мы познакомились в разделе "Алгебра- ические системы с одной бинарной операцией" I части книги, с элементами этой группы оперировали в теории определителей (II часть) и симметрических многочленов (III часть), в связи с которыми за группой 5Я исторически закрепилось название сим- метрической. Насколько она важна в теории абстрактных групп (т. е. рассматриваемых с точностью до изоморфизма, независимо от конкретной природы элементов), показывает Теорема Кэли. Для любой конечной группы С = (Л1, *) из п элементов существует изоморфная ей подгруппа в 5Я. Доказательство. Пусть М = {§,,..., #я}. Для любого фик- сированного §, е М система композиций м1 = {§, * &, -, ёп * &} = {а,. -. а„} может отличаться от М только порядком расположения элемен- тов, поскольку отображение М—>М,, переводящее §^ в &* * §1 (& е ЛО, — биекция (докажите инъективность и сюръектив- ность!). Каждому §1 е М соответствует, таким образом, подстановка Е5 , и это отображение М —> 5„ инъективно, т.е. и - ч отображение /: С —»\т^С группы С в группу 5Я биективно; покажем, что / — изоморфизм. Если §„ §],е М и (напомним, что в записи подстановки столбцы можно распола- гать в любом порядке), то, согласно определению /, ^ =&**&' 2/, = ^ * ё1 = (и * &) * & = ^ * (а * ё,) при всех и € М; следова- тельно.
Но изоморфный образ группы — тоже группа, поэтому 1гпС, является в 5Я подгруппой. Вдохновленные этой теоремой, приступим к детальному изуче- нию подстановок, их действия на множестве N и свойств групп подстановок заданной степени п — подгрупп 5„; запись С с 5„ для групп будет означать не просто включение множеств их элементов, но тот факт, что С является подгруппой 5„. Опера- цию умножения подстановок обозначаем, как раньше, точкой, которую можно (но не всегда нужно) опускать, порядок (число элементов) \М\ группы С = (М, •) записываем также и виде |С|, а принадлежность § е М — в виде § е С. В отличие от элементов группы С, числа множества N. на котором она действует (совершает биекции — перестановки), мы будем называть объектами, что вполне естественно, поскольку никаких алгебраических операций над ними не производится и их роль могли бы играть различные предметы произвольной приро- ды; элемент § е С переводит объект х е N в объект §(х) е N. Пусть § е 8п — подстановка, действующая на N. и х е N. Объекты $(х), §2(*) = §(§(*)), ... не могут быть все различны, и Х*ЗЧХ) пусть §1(х) — первый повторяю- щийся объект этой последователь- ности. Ввиду биективности (чего и где?) должно быть §1(х) = х, так что последовательность образует замкнутый цикл длины /, каждый объект которого переводится подстановкой § в следующий по кругу. Этот цикл пишут более экономно в виде (х0, х{, ..., Х[_{), где *, = §'(*), / = 0, 1, ..., &(х) = х и символы объектов можно переставлять в круговом порядке, т. е. записать цикл и как (Х{,Х2, .-., */_1,*о) ИЛИ (^2. •— ^/-1, ^0» Х{) И Т. Д. (уТОЧНИТб!). ( * еМ ... еп~{(х)} В случае /= п вся подстановка ё =\ 9 (ё(х) В (х) ... х I
состоит из одного цикла длины п\ если же / < п, то в N найдет- ся объект г/, не совпадающий с &1(х) ни при каком /, и этот у породит новый цикл (г/0 г/, ... г/5_1) с 1<5<п—/ (у; = ё](у), I = 0, 1, ..., 5 — 1) и т. д., и вся подстановка выразится в виде произведения независимых, (попарно без общих объектов) цик- лов: § = (*о х{ ... х/^Хуо у{ ... у._|)...(о0 01 - 0г-1); (**) очевидно, / + 5 + ... + г = я. Порядок расположения циклов в (**) благодаря их независимости произволен, запись же подстановки § в виде произведения циклических подстановок оправдана тем, что сам по себе цикл означает подстановку, переводящую каж- дый его объект в следующий по кругу и не трогающую осталь- ных объектов N. В частности, подстановка, не меняющая объект х, содержат цикл (х) длины 1, транспозиция, переставляющая х иг/, — цикл (х у) длины 2. Пример: Л 234 56 7 89,0 ,П (^1 4 9 7 6 8 5 2 3 11 10^ V А А А ' Типом подстановок § е С с 5Я мы назовем одночлен г?(ё) ... г*я(в) от формальных переменных г,, ..., гя, где 5^(§) — количество циклов п длины / в ее разложении (**); /= 1, .., п\ г° = 1; ]^^.(§) = п * (так, указанная только что подстановка §е 5,, обладает типом г^г^ а Ы+2-2+1-6=11). Многочлен 2(0} = ЦС-,г^..,гп} = ±\г^\..г^ М ё*с называется цикловым индексом группы С. Например, * Распространенный способ записи типа подстановки просто в виде Г1... п'" может, как нам кажется, приводить к путанице.
а для нахождения 2(8п) в общем виде нужен обзор всех типов подстановок степени п и подсчет количества подстановок каж- дого типа. Ясно, что типы г,5^2... г$пп подстановок из 5„ взаимно одно- значно соответствуют системам 5 = {5,, 52,..., 5„} натуральных чи- сел, удовлетворяющих условию 5, + 252+... + П5„ = П *, (5) а каждому типу отвечает п\/з{ !...25252! ... п$п8п! подстановок, поскольку каждая из них определена с точностью до перестановки циклов одинаковой длины и до выбора начального объекта в каждом цикле. Отсюда, учитывая еще, что |5Л| =я!, получаем где суммирование ведется по всем системам натуральных чисел 5,, 52, ..., 5„, для которых имеет место соотношение (5) **. Тождественная группа подстановок п-элементного множества, состоящая из единственного элемента е = (1)(2)... (п), обладает цикловым индексом г"; индексы других групп будут вычисляться по мере надобности, а также найдут место в упражнениях. Сейчас рассмотрим комбинаторную задачу, красиво решаемую с помощью этих индексов; ее мы для наглядности (но без потери общности) подадим в конкретно "вкусном" оформлении. Допустим, что в проблеме рационального питания, на которой мы в первой части книги демонстрировали умножение матриц, нас интересует не просто компонентный состав (содержание белков, углеводов, жиров и воды) конкретного блюда, а количество различ- * С этим уравнением мы уже встречались (где?). ** Заметим, что разные группы подстановок, даже не изоморфные как абст- рактные, могут иметь один и тот же цикловой индекс (см. упражнение 6), но в задачах перечисления, которые мы здесь рассматриваем, это не играет роли.
ных блюд предписанного со- става, какие вообще можно приготовить из заданного ассортимента продуктов с известными составами. Ре- альные блюда, или кулинар- ные изделия, различаются не только содержанием ком- понентов, но и способом приготовления (варка, жаре- ние, печение, тушение и т. д.), пространственным рас- положением продуктов, их окраской и "доведением до вкуса" посредством приме- сей, существенно не влияющих на состав, и т. п. В курсе алгебры, в отличие от книги о вкусной и здоровой пище, вряд ли надо вни- кать во все кулинарные тонкости, однако благодаря "пищевому" оформлению строгая математическая формулировка даже не впол- не адекватной задачи станет на сытый (но не пересыщенный!) желудок более понятной *. Пусть ^ е N — количество всех компонентов, из которых со- стоят продукты (в нашем примере <7 = 4). Различных продуктов может быть и бесконечно много, но мы предполагаем, что каж- дым компонентным составом V = ^\, ...^я] обладает лишь конеч- ное число с(а) из них. Состав V будет удобно задавать не стро- кой самих элементов группоида У = (У,+), а квазиодночленном 1й)(о] - х^ ... х^ от формальных переменных (см. предыдущий раз- дел). Тогда ассортимент продуктов выразится квазимногочленом (формальным рядом) члены которого соответствуют всевозможным продуктам. * Автор — не чревоугодник, но попытка другой наглядной интерпретации — число различных произведений живописи — в данном случае кажется весь- ма искусственной: разве интересно, сколько разных картин можно создать, использовав точно заданные количества граммов каждой краски?
Компоновка изделия из продуктов данного ассортимента А теоретически состоит в том, что предполагаемый объем изделия разбивают на большое число п мелких ячеек, каждую из которой надлежит заполнить каким-либо одним продуктом (разные ячей- ки — не обязательно разными продуктами). Компонентный со- став V = ^{, ..., V;;) блюда равен сумме (векторной) составов про- дуктов, а квазиодночлен ОУ(^) — произведению квазиодночленов, задающих эти составы (почему?). Требуется по данному ряду (с) построить ряд с(10 = Хс(1>к-... <<, (С) где для каждого возможного состава V коэффициент С(а) озна- чает число различных изделий с этим составом. Для ясности произведем непосредственный подсчет на конкретном примере. Пусть п = 3, ^ = 4 и для обозначения формальных переменных используются вместо я,, х2, х3, х4 символы соответствующих компонентов: Б — белки, У — углеводы, Ж — жиры, В — вода. Ассортимент А включает продукты с компонентными составами БУВ, БЖ, БЖ. УЖ2, записи которых мы используем для обо- значения самих продуктов, а чтобы различать разные продукты одинакового состава, третий продукт подчеркиваем (при подсчете компонентов черта не учитывается); таким образом, в нашем примере ф) = БУВ + 2БЖ + УЖ2. Заполняя каждую из трех ячеек каким-либо продуктом ассорти- мента Л, можно всего приготовить 43 = 64 блюда:
(их компонентные составы указаны справа в квазиодиночленной записи). Если все эти блюда считать различными, то, суммируя соот- ветствующие квазиодночлены, получаем С = Б3У3В3 + 6Б3У2ЖВ2 Ч-12В3УЖ2В + 8Б3Ж3 + ЗБ2У3Ж2В2 + + 12Б2У2Ж3В + 12Б2УЖ4 + ЗБУ3Ж4В + 6БУ2Ж5 + У3Ж6; (1) так, при условии строгого соблюдения пропорции белков 37,5%, углеводов 25%, жиров 15,5%, воды 25% из данного ассортимента А продуктов можно приготовить 6 раз- личных кушаний. Приятного аппетита! Однако не только для этих шести блюд, но даже для тех, которые фигурируют в С с коэффициентом 12, разнообразие на самом деле далеко не столь велико, как кажется, поскольку мы пока считали разными и кушанья, получаемые друг из друга простой перестановкой двух ячеек, заполненных разными продук- тами. Фактическую идентификацию изделий кулинарии естествен- но задавать группой Сс5„ таких подстановок, которые, по мне- нию и повара и клиента, не меняют этого изделия. (Так как бинарное отношение "представлять собой одно и то же блюдо" по смыслу должно быть эквивалентностью, то С — не любое подмножество элементов 5Я, а подгруппа; докажите!). Рассмотрим в нашем примере (с я = 3) такой случай, когда блюдо считается не меняющимся от перемены местами содержи- мого первых двух ячеек, т. е. С = {е, (12)(3)}. Тогда в таблице 64-х изделий четыре блюда второй строки повторяются пятой строкой, блюда третьей строки — девятой, блюда четвертой строки — тринадцатой, блюда седьмой строки — десятой, блюда
восьмой и двенадцатой строк — соответственно четырнадцатой и пятнадцатой строками. Удаляя из таблицы строки 5, 9, 10, 13, 14, 15 и суммируя квазиодночлены оставшихся десяти строк, получаем В случае, когда изделие не меняется от подстановок (123) и (132) (вращение на столе круг- лого торта, без перевертывания вверх ногами), С = {е, (123), (132)}. Первое блюдо первой строки повторений не имеет, второе блюдо первой строки фигурирует также, как первое блюдо во второй и пятой стро- ках, и мы удаляем оба повторения; и т. д. В результате: Наконец, если разрешены любые перестановки ячеек (каша), то С = 53, в таблице останется лишь 20 различных блюд, и Покажем теперь на том же "пищевом" примере, как можно получить ряд (С) из (с) чисто алгебраически, без составления таблицы блюд, вычеркивания из нее повторений (при разных группах С) и т. п. Легко видеть, что при С = {е} всевозможные я-ячеечные блю- да компонуются из ассортимента А точно так же, как слагаемые произведения п одинаковых сомножителей с, иными словами, ряд (С) получается из циклового индекса г" единичной подгруппы группы 5„ подстановкой ряда (с) вместо переменной г,: у нас
я = 3, и мы предлагаем читателю убедиться в том, что выраже- ние С = (БУВ + 2БЖ + УЖ2)3 после раскрытия скобок совпадает с (1). На случаи же, когда в группе С могут быть подстановки, со- держащие циклы более чем единичной длины, результат экстрапо- лируется следующим образом: в цикловой индекс 2(0; гь ..., гя) надо вместо каждой из переменных гг подставить соответ- ствующий ряд сг=^фКГ.. <' (г= 1,..., п). Прежде чем переходить к формулировке и доказа- тельству этой теоремы в общематематическом виде, проверим на уже дегустированных блюдах, как она работает *. Если О = {е, (12)(3)}, то га = 2, цикловой индекс 2(0} = 1 , 3 \ = 2 (г!1+г122) И С = 1- [(БУВ + 2БЖ + УЖ2)3 + + (БУВ + 2БЖ + УЖ2)(Б2У2В + 2Б2Ж2 + У2Ж4)], что после раскрытия скобок дает (2). Если 0 = {е, (123)(132)}, то га = 3, 2(0) = - (г,3 +1^) и С = - [(БУВ + 2БЖ + УЖ2)3 + 2(Б3У3В3 + 2Б3Ж3 + У3Ж6)], О т. е. (3). Наконец, если О = 83 = {е, (1)(23), (2)(13), (3)(12), (123), (132)}, то га = 6, 2(6) = -(г3+32,22+223), * ТЬе ргоо! о! 4Ье рис1(Ип§ 15 т 1Ье еа11п§ (английская пословица).
откуда получается (4). Дополним нашу пропедевтику одним хоть и несъедобным, но очень важным и типичным примером из области задач перечис- ления различных видов графов, схем, сложных органических со- единений и др. Два обыкновенных графа (см. заключение II части книги) на- зываются изоморфными, если межу множествами их вершин можно установить такую биекцию, при которой две вершины одного графа смежны (соединены ребром) тогда и только тогда, когда смежны соответствующие вершины другого графа. Требу- ется для заданной пары (п, т) целых неотрицательных чисел пересчитать все неизоморфные (п, т)-графы, т. е. обыкновенные графы с п вершинами и т ребрами. Пусть X — множество вершин графа, \Х\ = п > 2. Любая пере- становка вершин, очевидно, переводит граф в изоморфный, но рассмотрение самих вершин в качестве объектов действия груп- пы 5Я не дало бы нетривиальных результатов, ибо структура графа определяется не индивидуальными свойствами каждой вер- шины по отдельности, а разбиением множества их пар на два класса: смежных и несмежных. Будем обозначать через А™ мно- жество всех неупорядоченных пар (х, у) различных элементов X * (в данном случае вершин или чисел 1, ..., п). Каждая подстановка вершин как-то переставляет и их пары. Все подстановки множества А121, индуцированные группой 5Я, образуют в симметрической группе степени (!|) подгруппу 5^' (а почему это подгруппа?), которая при пфЗ не совпадает со всей группой хотя бы уже по "чисто количественной" причине: я^СО» помимо которой имеет смысл отметить и другую: в симметрической группе 5Я для любых двух пар различных вер- * Просто X2 — это декартов квадрат, т. е. множество упорядоченных пар элементов X, а через Х(2} обычно обозначают множество неупорядоченных пар, в которых элементы не обязательно различны.
шин всегда найдется подстановка, переводящая вершины одной пары в вершины другой, тогда как с помощью подстановок из 5),21 невозможно перевести две пары с общим элементом в две непересекающиеся (как и обратно). Ячейками "кулинарного изделия" в лице графа служат объекты множества Х\2\ и каждую из них можно заполнить одним из двух "однокомпонентных продуктов": пустотой или ребром. Относя ребру формальную переменную х, мы можем пустоте отнести единицу (я°), поскольку при перемножении квазиодночленов показатели степеней складываются, а ребро + ребро = 2 ребра, тогда как пустота + пустота = пустота. Ряд "продуктов" с=1+х, и нам надо подставлять квазидвучле- ны сг=1+хг вместо переменных гг (г = 1, ..., (Ц')) в цикловой ин- декс ^(5|121) группы 5",21, действующей на ^21 Коэффициенты Ст полученного квазимногочлена С=1 + С,* + С2;с2 + ... и будут искомыми количествами неизоморфных (я, т)-графов. Чтобы найти индекс 2(5|,21), будем выяснять, какие циклы под- становок множества Л121 индуцируются циклами подстановок группы 5Я. Пусть 5 € 5Я и подстановке 5 соответствует в 2(5Я) под зна- ком суммы слагаемое г,5'... г*я . Индуцируемые в ^(5|,21) циклы разделяются на два типа: первые состоят из пар вершин, при- надлежащих в 5 одному циклу, вторые — из пар, входящих там в разные циклы. Рассмотрим сначала пару (1р, 1д) е Х^\ обе вершины которой принадлежат в 5 одному циклу (г,, ..., *Л) длины /г>1, где 1 <р<^<Ь. Под действием подстановки 5 эта пара переходит в (1р + \,1<, + \), а она, в свою очередь, — в (1р + 2, 1д + 2), ..., причем
*л-и = *1» ^ + 2 = ^2 и т- Д- Все (з) пар при /г нечетном распреде- ляются по (/г —1)/2 циклам длины /г, а при /г четном составляют один цикл длины /г/2 и /г/2 — 1 циклов длины /г. Теперь пусть в паре (г, у) е Я2' вершина / принадлежит циклу длины /г, а вершина у — другому циклу длины /(/г, /е М) под- становки 5 € 5„. Индуцированная подстановка распределяет все Ы пар по НОД(/г, /) циклам длины НОК(/г, /) *. Таким образом, сомножителю гл(/г>1) какого-нибудь одночле- на из 2(8п) отвечает в соответствующем слагаемом индекса 2(5^') либо сомножитель г[Л~|)/2, либо произведение 2Л/2г*/2~', смотря по тому, нечетно или четно число /г, а пара сомножите- лей глг, из 2(5Я) вносит в одно из слагаемых индекса 2(5^') со- множитель (2НОК(Л /))НОД(Л>/). Общая формула для искомого индекса громоздка, и составлять его лучше непосредственным просмот- ром всех пар сомножителей (в том числе одинаковых) и отдель- ных сомножителей гл с /г > 1 в каждом слагаемом исходного индекса 2(5„), для чего удобно записывать произведение повто- ряющихся множителей так, как это делал Гэрриот (см. вводную * Строго формальное доказательство этих чисто комбинаторных фактов только затуманило бы суть дела; общая картина станет совершенно ясной, если в первом случае рассмотреть цикл длины 7 и цикл длины 8, а во втором — пару циклов с длинами 8 и 12 (или даже 4 и 6).
лекцию). Рассмотрим подробно случай я = 4, для начала прело- жив читателю проверить, что 2(54) = ^(г14+6г12г2+3г22+8г1г3+6г4). Поскольку в аналогичном выражении для 2(5421) общий коэф- фициент тоже равен 1/24 (почему?), то мы будем по многочлену 242(54) составлять многочлен 242(542]). Слагаемое г4 = г,г,г,г,, очевидно, порождает пары только вто- рого типа в количестве (2) = 6, что вносит в 242(5421) член г,6; слагаемое 6г2г2 = &г}г^г2 обогащает 242 (5421) одночленом, со- держащим два множителя г{ (один за счет произведения г,г,, другой за счет г2) и два множителя г2 (за счет произведений г,г2), т. е. добавляет член Ьг\г\; слагаемые Зг2 = Зг2г2 и 8г,г3 вносят соответственно Зг2г2 и 8гз (объясните!); наконец, 6г4 (один цикл четной длины) вносит 6г2г4. Итак, после приведения подобных членов, 242 (5'21) = г,6 + 9г2г2 + 8г32 4- 6г2г4, и остается заменить г, на 1 +х, г2 на 1 + х2 и т. д.: 24С = (1+^)6 + 9(1+^)2(1+^2)2 + 8(1+^3)2 + 6(1+^2)(1+^4), откуда С = 1 + х + 2х2 + Зх3 + 2х* + х5 + х*. Предложив читателю самому разобрать случаи я =1,2, 3, высветим результаты:
Вопрос. При я = 4 мы видим, что СЛ = С6_Л (и = 0, 1, ..., 6 = = (2)); Имеет ли место такая симметрия и при любом п е Ю Переходим к обобщению рассмотренных примеров и к доказа- тельству замечательной теоремы, которая на них иллюстрирова- лась. Пусть даны: группа С е 8п подстановок; действующая на множестве объектов N = {!,..., п} сМ; множество /" = {/!,/2. •••}. элементы которого (произвольной природы) по традиции называются фигурами; отображение /:М-> Р, удовлетворяющее условию: Ух,*/е N [Зёе О: ё(х)=у =» /(*)=/(*/)]; коммутативный группоид У = (У, +, 0) в аддитивной записи, с нейтральным элементом 0; отображение ср: Р —> У", относящее каждой фигуре /е У7 ее содержание (о,, ..., уг), где г (конечное) зависит от /, а (0,,^..., ог) — сокращенная записать для (у,, ..., вг, О, О, ...); в дальнейшем под ф-образом ф(/) понимается не сама эта строка, а квазиодночлен
х?... х°г от формальных переменных; по отношению к ср требуется, чтобы полный прообраз каждой такой строки (или соответствую- щего квазиодночлена) был конечным. Формальный ряд с = с(Лф) = ХФ)*Г *?•••• (с) где V пробегает все различные ненулевые содержания фигур из Р, называется рядом фигур * При заданном / множество {(х, }(х))/х е Щ пар называют кон- фигурацией, точнее, {-конфигурацией (это "блюдо" или "кулинар- ное изделие" — результат "заполнения всех ячеек продуктами"); ее содержанием естественно считать сумму содержаний фигур, а при квазиодночленной записи ср-образов — произведение Пф(/(*)). Рассмотрим множество Р(С) всевозможных отобра- xеN жений /: N —> Р при фиксированной группе С. /,-конфигурация и /^конфигурация (/,, /2 е Р(С)) называются С-эквивалентными ("одна и та же конфигурация — с точки зре- ния группы С"), если З^е ОЧхеМ: /,(*) = Ш*)); это бинарное отношение действительно является эквивалент- ностью: Ке[. При § = е имеем VxеN: {(х) = [(е(х)). 8ут. Если VxеN: ?\(х) = }2(ё(х)) ПРИ некотором § е С, то ^еЛГ: ?2(у) = [1(ё-1(у)), ё~1е С, ибо у = 8(х), как и х, пробегает все объекты N. Тг. Если ЧхеМ: №) = №№) и Чу е V. Ш = Ш*Ш где §,, §2 е С» т0' беря у = ё\(х), получаем !М = [*(ёМ) = !3((ё2(ё{(х))) = [3((8&}(х)), §&* О. Пусть С(у) — количество тех классов С-эквивалентности, конфи- гурации которых обладают заданным содержанием г/ = (г/,,г/2, ...). Наша цель — получить ряд конфигураций * В упоминаемой ниже книге Дж. Риордана — энумератором; встречаются также термины "перечень", "запас" и др.
зная ряд фигур (с) и цикловой индекс 2(0; г^...,гп) группы Ос5„. Теорема Ре дф ил да —П ой я. С = 2(0; с^ ..., сл), где сг = ^с^)^1...^" , а г^ означает сумму г одинаковых элементов ^ группоида V (г,/= 1,..., я). Доказательство. Подстановка §еС типа г,5|(г)... г*л(^ не меняет конфигурацию в том и только том случае, если объекты конфигурации, принадлежащие одному циклу подстановки, имеют один и тот же /-образ, пусть С(е) = Ъс№*?-*п — ряд таких §-инвариантных конфигураций (С^(г/) — количе- ство тех из них, которые обладают содержанием V). Как и в частном случае С = {е}, здесь "комбинаторно ясно", что содержа- ния конфигураций формируются из содержаний фигур по тому же закону, по которому возникают показатели степени в одно- членах при перемножении многочленов, т. е. С(§) получится, если в каждом произведении г*|(в)... г5пп(ё} заменить переменные гг соответствующими рядами сг, проделать все умножения и в об- разовавшейся сумме привести подобные члены; поэтому Но каждое слагаемое правой части (после полного ее раскры- тия) отвечает ^-инвариантной конфигурации для какого-то § е С и поэтому слева фигурирует по одному разу в каждом из |0| квазимногочленов С(§). Следовательно, что и требовалось.
Упражнения 1. Подгруппа Л„с5„ (п>2) всех четных подстановок п объек- тов называется знакопеременной, или альтернирующей группой степени п и, очевидно, имеет порядок \Ап\ = п\/2. Найдите 2(Ап) двумя способами: а) непосредственным подсчетом, б) доказав предварительно, что 2(Л„; г,, г2, ..., г„) - 2(5„; г,, г2, ..., г„) + 2(5„; г1э -г2, ..., (-1)"-' г„). 2. Подгруппа С„с5„ (С„с5„ при я>2), порожденная подста- новкой (12... я), называется циклической группой степени п (а каков ее порядок |С„|?). Покажите, что 2(С„)= - Хф(*)гГ Я ' Л по всем делителям /г числа я, где ср: N —> N — функция Эйлера, определяемая следующим образом: ср(1) = 1, а при /г > 1 ф(/г) равно количеству натуральных. чисел, не больших /г и взаимно простых с ним. Подсчитайте, сколькими способами можно разместить равномерно в круговом порядке 10 бусинок — четыре белых, три красных и три синих, если размещения, получающиеся друг из друга вращениями круга, не считают- ся различными. 3. Те же вопросы, что и в предыдущем упражнении, решить для диэдральной группы /)„с5„, порожденной подстановками (1 2 ... п) и (1 п)(2 п — 1)(3 п — 2) ..., предварительно доказав, что -г{г(2п~1)/2 при п нечетном, 2(Д.) = 12(С.) + -2 ^ 1(^/2 +г^-1) при п четном. 4ч ; Сколько разных ожерелий можно изготовить из прежних 10 бусинок, если ожерелья, получаемые друг из друга вращениями и зеркальными отображениями, не считаются различными?
4. Сколькими способами можно окрасить вершины куба, ис- пользовав 3 раза черный и 5 раз белый цвет, если раскраски, переводимые друг в друга вращениями куба, считаются за одну и ту же? 5. Пусть Х(2) — множество всех упорядоченных пар различных элементов множества X с \Х\ = п > 2, а 5^2) — группа подстано- вок, индуцированная на Х(2) симметрической группой 5„. а) Вычислите цикловой индекс 2(5^2); г,, ..., гя) при я = 2, 3, 4. б) Какие комбинаторные объекты будут подсчитаны, если в этот индекс подставить вместо переменных гг соответствующие ряды сг? 6 (тема курсовой или части дипломной работы). Построить пример двух неизоморфных групп (абелевой и неабелевой) 27-го порядка с одним и тем же цикловым индексом 2 = ---\2\7 +26гз). Историческая справка. Во второй половине XIX века алгебраические методы стали широко применяться к решению задач перечисления структурных формул химических соединений, электрических схем и других комбинаторных объектов. Важный класс органических веществ составляют такие, структур- ные формулы которых имеют вид дерева — связного графа без циклов, и основополагающий вклад в решение задачи их перечис- ления, в частности, определения числа изомеров — соединений с одной и той же эмпирической формулой, но разными структур- ными (что существенно влияет на свойства вещества) — внес
Артур Кэли. Среди его многочисленных последователей особо выделяется Уильям Сноу Бернсайд, классический трактат кото- рого ВигпзМе №. ТЬеогу о{ ^гоырз оГ Пш1е огёег (2-пс1 есНИоп). СатЬпс^е ишуегзНу Ргезз: СатЬпс^е, 1911 пропитан духом комбинаторики. В 1927 году появилась работа Дж. Говарда Редфилда *, пред- восхитившая основные результаты Пойя и его последователей в этом направлении. Несмотря на престижность журнала, статья первооткрывателя долгое время оставалась незамеченной, вторая его статья (1940) была отклонена и лишь после смерти автора (1944) восстановлена и опубликована его дочерью**. Фундаментальный результат Редфилда переоткрыл и развил дальше выдающийся американский математик венгерского проис- хождения Дьердь Пойя *** (Оубг^у (Оеог^е) Р61уа), а Фрэнк Харари, Рональд Рид и др. решили на этом пути много задач перечисления графов с наперед заданными свойствами, что нашло отражение в стихотворении "ЕпытегаНопаГ четверки авторов под общим псевдонимом В1апсЬе ОезсагЧез; предлагаем наш перевод****: У Пойя теорема есть (ее и Редфилд знал), как вещи в куче перечесть и разложить навал. Деревья Пойя стал растить (как Редфилд до него): "Их ровно столько может быть, и больше ничего". * Кес1}Н(1 У. Н. ТЬе 1Ьеогу оГ ^гоир гейисес! сНзШЬиИопз. // Атег. Л. Ма1Ь. 49 (1927). 433-455. ** КесЦШ ^. Н. ЕпитегаИоп Ьу Ггате ^гоир апс! гап^е ^гоирз. // Л. ОгарЬ ТЬеогу 8 (1984), 205-224. *** Ро1уа С. КотЬта1оп5сЬе АпхаЫЬезИттип^еп Гйг Огирреп, ОгарЬеп ипс! сЬет15сЬе УегЫс1ип§еп. // Ас1а Ма1Ь. 68 (1937), 145-254. **** АНГЛИЙСКИЙ оригинал, см., например, в книге: Вег§е С. Ргтс1р1ез с!е СотЫпа1о1ге. Рапз. Оипос!. 1968.
Харари графы перечел (что Редфилд раньше мог), их список выложил на стол, сказав нам: Пойя — Бог! Из графов слойки делал Рид (и Редфилд так умел), и сколько графов данный вид имеют — всяк узрел. На нас Харари, Пойя, Рид пролили графский свет. Но Редфилд тоже не забыт: за ним приоритет! Примечание. В этом разделе книги использованы источ- ники: Риордан Дж. Введение в комбинаторный анализ. — М.: ИЛ, 1963. Харари Ф., Палмер Э. Перечисление графов. — М.: Мир, 1977. Для более подробного ознакомления с теорией графов жела- ющим можно рекомендовать: Харари Ф. Теория графов. — М.: Мир, 1973. Зыков А. А. Основы теории графов. — М.: Вузовская книга, 2004.
Заключение БАЛЕТ НЕВЫЛУПИВШИХСЯ ПТЕНЦОВ Так называется картина В. А. Гартмана и соответствующая пьеса фортепьянного цикла М. П. Мусоргского "Картинки с выставки", созданного им после посещения посмертной выставки своего друга. На сцене же нашего алгебраического театра танец невылупившихся птенцов исполняют те разделы алгебры, кото- рые в общем курсе могут быть представлены лишь кратким обзором, не претендующим на полноту. О масштабах современ- ной алгебры и о богатстве литературы по ней можно судить, перелистав двухтомник "Общая алгебра" под редакцией Л. А. Скорнякова (М.: Наука, 1990—1991), а некоторые "класси- ческие" разделы освещены, например, в книге Б. А. ван дер Вардена [6].
О теории Галуа мы уже упоминали в I части книги; добавим, что сюда относятся, кроме чисто алгебраических, и такие вопро- сы, как возможность геометрического построения с помощью только циркуля и линейки, в частности, доказательство неразре- шимости трех, знаменитых, задач древности: удвоение куба, трисекция угла и квадратура круга. Отдельных спецкурсов (или спецсеминароб) требуют теории групп и полугрупп, тел, полей и колец, алгебраическая геометрия и др., представленные в общем курсе лишь начальными сведениями. Так, по теории колец можно особо отметить две книги Н. Джекобсона: Теория колец (М.: ИЛ, 1947) и Строение колец (М.: ИЛ, 1961), а по полугруппам: Е. С. Ляпин. Полугруппы. М.: Физматгиз, 1960. При современной трактовке классических тем и в новых раз- делах алгебры важную роль играет теория категорий и функ- торов, которой специально посвящена книга М. Ш. Цаленко, Е. Г. Шульгейфер. Основы теории катего- рий. — М.: Наука, 1974. На этом разделе алгебры мы остановимся более подробно *. Категория А формируется следующим образом. а) Дано множество 06(А), элементы которого называются объектами категории. б) Для каждой пары объектов Л, В е 06(А) определено мно- жество Мг(Л, В) = МгА(Л, В), элементы которого называются морфизмами объекта А (начала морфизма) в объект В (конец морфизма). в) Для всякой пары морфизмов осеМг(Л, В), реМг(В, С), такой что начало второго морфизма совпадает с концом первого, однозначно определена их композиция — морфизм ос * р е Мг(Л, С). При этом должны соблюдаться три аксиомы категории: I. При любых Л, В, С, О е 06(А) множества Мг(Л, В) и Мг(С, О) либо не пересекаются (Мг(Л, В) п Мг(С, О) = 0), либо совпадают (когда А = С & В = О). II. Операция * ассоциативна: если а е Мг(Л, В), р е Мг(В, С), уе Мг(С, О), то (а * р) * у=а * (р * у) — и результирующий мор- физм можно записать без скобок: а * р * уе Мг(Л, О). III. Каждое множество морфизмов объекта А е 06(А) в себя содержит тождественный морфизм н/А е Мг(Л,Л) — такой, что * Начальные понятия см. также в книге: С. Ленг. Алгебра. — М.: Мир, 1968.
Балет невылупившихся птенцов_________________________383 ос*и/д = ос и и/А*р = р при любых а 6 Мг(Х,А) и ре Мг(Л, К) (Я, Ге 06(А)). Множество всех морфизмов категории А обозначим через МК(А), и сама категория будет парой А = (06(А), МК(А)), удовлетворяющей аксиомам I, II и III. Естественно считать все- гда 06(А)=^0, а то, что МК(А)=^0, следует из III. Морфизм можно, в частности, понимать как отображение одного объекта в другой или как бинарное отношение между объектами. Примеры. 1. Пусть М — фиксированное множество, объек- тами категории А служат его подмножества (не обязательно все): 06(А)с2м, а морфизмами — те пары Л, Ве 06(А), в которых Л с В; для обозначения морфизмов можно использовать угловые скобки: <ЛсВ>€ МК(А). Композиция <А с В> * <В с С> = = <Лс С>, очевидно, ассоциативна, и/д = <ЛсА>, а аксиома I выполнена потому, что каждое множество Мг(Л, В) с МК(А) од- ноэлементно (если не пусто). Г. То же, если М — группа, МК(А) — множество некоторых ее подгрупп, а <Рср>€ МК(А) означает, что Р —.подгруппа ($. 2. Пусть элементами 06(А) служат множества, элементами МК(А) — отображения А -> В (Л, В е 06(А)), а * — обычная компо- зиция отображений. Выполнение всех трех аксиом тривиально. 3. Если 06(А) состоит из высказываний*, <Л=>В>е Мг(Л, В) означает истинность импликации А =» В при конкретных Л, В е 06(А), а <А =» В> * <В =» С> = <А =» С>, то А — категория. 4. В теории графов важную роль играет операция стягива- ния ребра: если ху — ребро обыкновенного графа, соединяющее его вершины х и г/, то само оно удаляется, его концы отожде- ствляются в одну вершину <ол/>, каждая пара ребер вида хг, уг заменяется одним ребром <ху>г (дабы полученный граф по-пре- жнему был обыкновенным — в котором две вершины не могут соединяться друг с другом более чем одним ребром), а все остальные вершины и ребра остаются прежними. * См., например, книгу [8], указанную в конце Предисловия.
Пусть 06(А) — некоторое множество обыкновенных графов (задаваемых с точностью до изоморфизма), и если С,С2е е 06(А),то <С,С2> е Мг(С,, С2) означает возможность преоб- разовать граф С, в С2 последовательными стягиваниями ребер (включая и тривиальную "последовательность", оставляющую граф неизменным). Проверьте, что аксиомы I, II и III выполнены, т. е. А = (06(А), МК(А)) — категория. Естественным образом определяется изоморфизм двух катего- рий. А. 3. Зеликовский и Ле Тхук Зук (см. книгу А. А. Зыкова, упомянутую в конце последнего раздела III части) доказали, что графы О, и С2 изоморфны тогда и только тогда, когда изо- морфны их категории стягиваний А(С,) и А(С2) *; часть "тог- да" здесь не тривиальна (в отличие от "только тогда"); до появ- ления этого результата было уже привычным делом, что алгеб- раическая система определенного типа преобразований графа, заданная как абстрактная, не определяет граф однозначно (с точностью до изоморфизма). Функтором Г : А -> В из категории А в категорию В называет- ся отображение, однозначно относящее каждому объекту Л е 06(А) объект Р(А) е 06(В), а каждому морфизму осе МгА(Л, В) — мор- физм Р(а) е Мгв(/г(Л), Р(В)), причем а) УЛе 06(А): Р(1ЛД = *</,(А), б) Уае МгА(Л,В)Уре МгА(В, С): Р(а * Р) = /г(сх) * /ЧР). (Введенный таким образом функтор считается ковариантным, а заменяя равенство в б) на ^(ос * ф)=*р(ф) * Р(а), получим опре- деление контравариантного функтора.) Примеры. 5. Пусть А — категория групп (пример Г), В — категория множеств (пример 1), отображение Р : А —> В относит каждой подгруппе Хе 06(А) множество [X] ее элементов, мор- физму <АгсУ>€ МК(А) — морфизм <[Х]а[У]>е МК(В), отно- шение с первый раз означает "быть подгруппой", а второй — "быть подмножеством". Так как условия а) и б), очевидно, выполнены, то Р — функтор (его называют стирающим или пренебрегающим, поскольку он игнорирует алгебраическую структуру групп и подгрупп, сохраняя лишь их чисто теоретико- * Покажите мне, Ваше Графское Сиятельство, как Вы стягиваетесь, и я узнаю, кто Вы есть на самом деле".
множественные "скелеты"). Выясните, является ли отображение Р инъективным и/или сюръективным и как может измениться по- добный факт, если в А вместо групп фигурируют другие алгеб- раические системы. 6. Пусть категория А изоморфна некоторой подкатегории (сформулируйте естественное определение этого понятия!) В' категории В. Биективное отображение и/А в: А —> В', удовлетво- ряющее условиям а) и б), называется функтором вложения А в В, а композиция Р\А = Г * н/А в, где Р : А —> В — произвольный функтор, — ограничением Г на А. Например, если группу С рассматривать как категорию с одним объектом, морфизмами ко- торой Мг(С, С) служат элементы группы, то теорема Кэли будет не чем иным, как конструктивным доказательством существова- ния функтора вложения Г произвольной группы С порядка п в симметрическую группу подстановок 5„ (порядка п\), а ограниче- ние Р\н, где Н — подгруппа О, будет вложением Н в 5Я, инду- цированным вложением Р. 1. Любой гомоморфизм моноида в моноид .(рассматриваемых как однообъектные категории) является функтором. 8. Если изоморфизм алгебраических систем считается катего- рией (с какими 06 и МК?), то всякий функтор переводит изо- морфизм в изоморфизм (почему?). Связи линейной алгебры с геометрией восходят к классичес- ким работам А. Кэли и Дж. Сильвестра по теории алгебраичес- ких инвариантов, работам Г. Грассмана по многомерным про- странствам геометрии и, наконец, к "Эрлангенской программе" Ф. Клейна, с которой учащиеся должны быть знакомы из курса аналитической геометрии. Ясно, что чем "богаче" группа преобра- зований движения (и зеркальные отражения) с аффинные с проек- тивные геометрических объектов, тем "беднее" набор тех характеристик объекта, которые инвариантны относительно преобразований группы. Синтезу современной алгебры и современной геометрии посвящена книга Е. Артин. Геометрическая алгебра. — М.: Наука, 1964. Изучая в главе II отображения, мы ничего не говорили об их непрерывности — это свойство как бы автоматически обеспечи-
вается линейностью, но при отказе от нее должно явно опреде- ляться. Если дать точную трактовку понятию окрестности и(х) — множества точек, "достаточно близких" к данной точке х е М, то определение непрерывности (в х) отображения / : М —> N пространства (множества) М в N напрашивается само собой: для любой У(/(*)) с Л/" должна существовать такая 1}(х)а,М, что }(и(х))а:и(}(х)). В метрических пространствах (например, евклидовых) * можно определить Е-окрестность точки х как подмножество тех точек, расстояние которых от х меньше е; в более общих топологических пространствах понятие окрес- тности вводится аксиоматически. Топология — это раздел мате- матики, изучающий такие свойства геометрических (или более абстрактных) объектов, которые сохраняются при гомеоморфиз- мах ** — взаимно однозначных (биективных) непрерывных в обе стороны преобразованиях. Весьма плодотворным оказался симбиоз алгебраических и топологических свойств в одной системе — например, группе, наделенной топологией. Именно, в группе С = (М, *), как прави- ло, бесконечной (даже несчетной) для каждого элемента х е М вводятся окрестности У(;с)сЛ1, определение которых согласу- ется с групповой операцией следующим образом: при любых х, у е М а) для всякой [}(х * у) найдутся такие Ц(х) и У(г/), что Щх) * и (у) = {х * у/х е Ц(х) &уе 1](у}} с Щх * у), б) для всякой 1}(х) найдется такая Ц(х~1), что [/-!(*) = [х-1/х е [/(*)} с и(х~1). Как уже непосредственно ясно, для превращения абстрактной группы С = (УИ, *) в топологическую, или непрерывную, требу- ется выделить в множестве М систему {{1}(х)}/х е М} окрест- * Вообще метрическое пространство — это множество М с заданной мет- рикой — функцией р: М2 -> К, удовлетворяющее трем аксиомам Фреше: р(х,у)>0 и р(х,у) = 0 <=> х = у, Р(х,у)*=р(у,х), Р(*,0) + Р(0,2)*Р(Х,2) при всех х, у, г € М. " Не путать с гомоморфизмами.
Балет невылупившихся птенцов 387 ностей всех элементов, для чего, в свою очередь, достаточно задать базу — систему (и(е)} окрестностей нейтрального элемен- та группы. См. книгу Л. С. Понтрягин. Непрерывные группы. — М.: ГТТИ, 1954*, а также последнюю главу книги Ван-дер-Вардена [6]. Дальнейше- му развитию алгебраической топологии, или, что то же, топо- логической алгебры **, посвящена книга Э. Спеньер. Алгебраическая топология. — М.: Мир, 1977. Однако при таком симбиозе не сохраняется равноправие со- ставляющих "организмов": если введение окрестностей элементов не меняет чисто алгебраическую структуру группы, то замена топологических объектов алгебраическими, вообще говоря, сопро- вождается частичной потерей информации из-за того, что разные объекты могут превратиться в один и тот же элемент вследствие тождественных соотношений в группе. С целью уменьшения такого рода потерь, в теории гомологии: Картан А., Эйленберг С. Гомологическая алгебра. — М.: ИЛ, 1960, Маклейн С. Гомология. — М.: Мир, 1966, основанной параллельно и независимо Д. К. Фаддеевым, вместо одной группы (снабженной топологией) вводятся последователь- ности групп, а в К-теории: Атьян М. Лекции по К-теории. — М.: Мир, 1966 с помощью К-функтора каждому топологическому пространству Т сопоставляется кольцо К(Т), и каждому непрерывному отобра- жению /: Т —> Т — гомоморфизм колец /((/):/((Т) -> К(Т'). Но полностью избежать потери информации удалось пока только в некоторых частных случаях — например, как мы уже упоминали, для графов и категорий стягиваний. Важную роль в современной алгебре и ее приложениях игра- ют структуры — алгебраические системы с двумя бинарными операциями на частично упорядоченном множестве. Напомним, что множество М Ф 0 называется частично упоря- доченным, если на нем задано бинарное отношение < (оно может обозначаться и иначе), удовлетворяющее условиям: х<х (реф- * И его же книгу "Основы комбинаторной топологии" (М.: Наука, 1947, 1976). ** Однако "алгебраическая геометрия" и "геометрическая алгебра" — не одно и то же.
лексивность), х<у&у<х => х = у (антисимметричность) и х<у & у<г => х<г (транзитивность). Структурой (М, <, п, и) называется частично упорядоченное множество М с операциями пересечения и объединения элементов, удовлетворяющими двум условиям: если х, у е М, то пересечение (или нижняя грань) этой пары элементов V = х п у е М, и для всякого такого V' е М, что V/<x & V'<у, имеет место V'<V; если х, у е М, то объединение (или верхняя грань) этой пары элементов и = хи у е М, и для всякого такого и' е М, что и'>х & и'>у, имеет место и'>и. Примеры. 1. Множество 2м всех подмножество данного М, частично упорядоченное отношением с, становится структурой, если трактовать Хс\ V и X и V (X, V е 2м, т. е. X, V с М) как обычные пересечение и объединение. 2. Множество N всех натуральных чисел с частичным порядком "х делит у" образуют структуру, в которой х п у = НОД(л:, г/) и *иг/ = НОК(*,1/). Структура (Л1, <, п, и) дистрибутивна, если при любых х,у,геМ (х и г/) п г = (я п г) и (г/ п г). (*) Так, в примере 1 структура дистрибутивна, а в примере 2 — нет. Задание для самостоятельной работы. 1. Пока- жите, что в любой структуре (х п г) и (у п г) < (я и г/) п г и, сле- довательно, в условии (*) равенство можно заменить неравен- ством (в какую сторону?). 2. Докажите, что множество М с двумя бинарными операци- ями п и и становится структурой в том и только том случае, если его можно частично упорядочить так, чтобы выполнялись условия:
Литература Курош А. Г. Лекции по общей алгебре. — М.: Физматгиз, 1962. Биркгоф Г. Теория структур. — М. ИЛ, 1952. Это задание покажет, насколько учащийся проникся логико- алгебраической культурой, и должно быть выполнено независимо от того, намерен ли он в дальнейшем специально заниматься теорией структур. Упомянутые ранее булевы алгебры: Владимиров А. А. Булевы алгебры. — М.: Наука, 1969, Сикорский Я. Булевы алгебры. — М.: Мир, 1969 являются частным случаем структур.
УКАЗАТЕЛЬ ТЕРМИНОВ И ИМЕН Для термина указывается страница, на которой он введен в книге впервые, а также та, где он меняет смысл или уточняется. Для имен места их упоминания не указываются. абелева группа 32 Абель (АЬе! N1615 Неппк, 1802- 1829) абсолютная приводимость 99 абстрактная группа 34 автоморфизм 61 Адамар (Найатагс! Ласциез 5а1отоп, 1865-1963) адъюнкт = алгебраическое допол- нение алгебра (алгебраическая система) 330 — Кэли 333 — Ли 339 — (наука) 13, 338 алгебраическая геометрия 291 — система 26, 323 — топология = топологическая алгебра алгебраически замкнутое поле 103 алгебраические числа 64 алгебраический и аналитический подходы 18 алгебраическое дополнение 207 — расширение 62 алгебры комплексов 341, 347 алгоритм 14 — Евклида 92 ал-Хорезми (783-850) альтернатива Фредгольма 245 альтернирующая = знакоперемен- ная (группа) аннулятор 187, 260 антикоммутативность 43 антисимметрическая = кососиммет- рическая (форма) Аполлоний (260-170) Арган (Аг^апс! Леап КоЬег!, 1768— 1822) Артин (АгИп ЕтН, 1898-1962) аргумент комплексного числа 71 арность 26 Архимед (287-212) ассоциативность 28 Атья (А1цаЬ М1сЬе1 Ргапс1з, род. 1929) аффинная классификация гиперпо- верхностей второго порядка 262 аффинные пространства 214 база алгебры 330 — линейного пространства 163 — топологического пространства 387 барицентрические координаты 244 Безу (Вехой! ЕИеппе, 1730-1783) Бернсайд (ВигпзШе ААШНат 5по^, 1852-1927) бесконечные матрицы 175 биективность композиции биекций 33 биекция 24 билинейная форма 247 Бине (Вше! Ласциез РЫНрре Мап'е, 1786-1856) Бомбелли (ВотЬеШ На!ае1, 1526- 1572) буквенные обозначения 17—18 Буняковскпй Виктор Яковлевич (1804-1889) В Валлис (ШаШз ЛоЬп, 1616-1703)
Вандермонд (Уапс1егтопс1е А1ехапс1ге ТЬеорЬПе [СЬаНез Аи^из1е] 1735-1796) вековое = характеристическое (уравнение) векторное == линейное (пространство) вершина графа 320 — множества 234 взаимно простые многочлены 94 Виет (У1е1е Ргапомз, 1540-1604) вложение кольца в поле 111 Вронский (Шгопзк! Ноепе ЛизеГ, 1778-1853) выпуклое множество 223 выпуклый конус 236 вырожденная матрица 136 Галуа (СаЫз Еуапз1е, 1811-1832) Гамильтон (НатШоп ШПНат Ко^ап, 1805-1865) Гантмахер Феликс Рувимович (1908-1964) Гаусс (Саизз Каг1-РпейпсЬ, 1777— 1855) геометрическая алгебра греков 11— 12, 17 — — современная 385 Гессе (Неззе ЬисЫ& ОПо, 1811- 1874) Гильберт (НИЬеП Оаук1, 1862-1943) гильбертово пространство 290 гиперповерхности второго порядка 261 главная единица 334 главный идеал 329 годограф 185 гомеоморфизм 386 гомология 387 гомоморфизм 323 Горнер (Ногпег ШППат Сеог^е, 1786-1837) Грам (Огат Лог^еп Рейегзеп, 1850-1916) грань 237 Грассман (Сгаззтапп Негтапп Ойп1ег, 1809-1877) граф 320 группа 30 группоид 27 группы подстановок 32, 361 Гэрриот (Нагпо! ТЬотаз, 1560— 1621) д две основные задачи аналитической геометрии 215 двумерные симметрические функ- ции 360 двучленное уравнение 78 действительная ось 70 Декарт (ОезсагЧез Кепе, 1596— 1650) декартово произведение 23 деление с остатком 88 делимость многочленов 90 делители единицы 45 — нуля 44 Делоне Борис Николаевич (1890— 1980) дельта Кронекера 210 детерминант = определитель Джекобсон (ЛасоЬзоп №1Ьап, 1910-1999) диоризмы 12 Диофант (III век н. э.) дистрибутивность 42, 45 диэдральная группа 377 дополнительный минор 205 Дьедонне (О1еис1оппе Леап А1ехапс1ге Еи&епе, 1906-1992) Евдокс (408-335) Евклид (340-287) евклидово пространство 266 единичная подгруппа 38
ж Жордан (Логбап СатШе Мапе Еппетопс!, 1838-1922) жорданова клетка 310 — нормальная форма матрицы 313 3 задача о перпендикуляре 272 закон инерции 257 замкнутое подпространство 308 — полупространство 225 знакопеременная группа 377 значение линейной комбинации 158 — многочлена 100 И идеал кольца 327 — алгебры 333 изоморфизм алгебраических систем 38, 323 — графов 370 — линейных пространств 156 инвариантное подпространство 308 индексы инерции 257 индуцированная операция 36 инъекция 24 Иордан Неморарий (Логйапиз №гтюгапи5, XIII век) иррациональное число 52 истинные гиперповерхности второго порядка 262 С1го1ато ,#М) К Кардано (Сагйапо С1го1; [ЬПеготто], 1501-1576) Картан (Саг1ап Непп Раи1,рс Категория 382 квадратичная форма 255 квадратные матрицы 131 квадрика 288 квазидиагональная матрица 203 квантор 27 кватернионы 80 классы вычетов по идеалу 329 Клейн (Юе1п РеПх СНпзИап, 1844— 1925) кольца вычетов 48 — квадратных матриц 131 кольцо 42 — с единицей 42 — (поле, тело) без характеристики 47 коммутант 339 коммутативность 32 коммутатор 339 комплекс 341 комплексные числа 17, 70 композиция 26 конические гиперповерхности 262 — сечения 12 координаты вектора 163 корень многочлена 100 корневое подпространство 314 корни из комплексного числа 72 кососимметрическая форма 249 Кострикин Алексей Иванович (р. 1924) Коши (СаисЬу Аи^изИп Ьошз, 1769-1857)' Крамер (Сгатег ОаЬпе!, 1704— 1752) красные и черные числа 11 кратные корни 103 критерий Сильвестра 257 Кронекер (Кгопескег Ьеоро1с1, 1823-1891) Курош Александр Геннадиевич (1908-1971) Кэли (Сау1еу Аг1Ьиг, 1821-1895) Л Лагранж (Ьа^гап^е ЛозерЬ Ьошз, 1736-1813) Лаплас (Ьар1асе Р1егге 51топ, 1749-1827) Лейбниц (ЬеШтг Со1Гпес1 АМ1Ье1т, 1646-1716)
Ли (1ле Магшз ЗорЬиз, 1842— 1899) лиево кольцо 43 Линдеман (Ыпйетап Каг! Ьошз Регйтапй, 1852-1939) линейная зависимость 158 — комбинация 158 — оболочка 161 — форма 193 линейное многообразие = пласт — отображение 297 — программирование 244 — пространство 152 Лиувилль (ЫоиуШе ЛозерЬ, 1809— 1882) луч 225 Ляпин Евгений Сергеевич (1914— 2005) М Маклейн (МасЬапе Заипйегз, 1909-2005) Мальцев Анатолий Иванович (1909-1967) матрица 123 — Грама 268 — перехода 173 — смежностей 320 матрицы линейного отображения 298 — элементарных преобразований = = элементарные матрицы метод Гаусса 182 — неопределенных коэффициентов 120, 355 — полного исключения 178 — последовательного исключения 182 метризация 266 минимальное расширение 59 Минковский (Мтко^зк! Негтапп, 1864-1909) минор 204 мнимая ось 70 мнимое число 17, 66 многомерная геометрия 214—215, 288, 290 многочлен, кольцо многочленов 86 модуль (алгебраическая система) 329 — комплексного числа 70 моноид 28 морфизм 382 Муавр (Мо1уге АЬгаЬат с!е, 1667— 1754) мультипликативная и аддитивная запись группы 34 Н наибольший общий делитель 91 наименьшее общее кратное 96 наложение 341—342 начальная подматрица 171 направление пласта 184 невырожденная (неособенная) = = обратимая (матрица) нейтральный элемент 27 неоднородная система уравнений 186 непрерывность 385—386 непрерывные группы 386 неравенство Коши—Буняковского 266-267 неравенство треугольника 267 нетривиальные решения однород- ной системы 149, 191 нормальная подгруппа 325 нормированная база 268 нуль-многообразие = ядро Ньютон (№\У!ОП 1заас, 1643-1727) О область целостности 46 обобщенная теорема Жордана 319 образ 24, 307 обратимая и обратная матрицы 136 обратимость, обратный элемент 29 общее и частное решения 187
объект действия группы 362 — категории 382 ограничение 223^38*5" однородная система уравнений 149, 186 окрестность 386 Омар Хайям (1040-1123) операция 26 опережение 195 определитель 196—197 — Вандермонда 209 ортогональная база 267 — матрица 268 — пара подпространств 271 ортогональное дополнение 271 ортогональные векторы 267, 288 — преобразования базы 278 ортонормированная база 268 основная теорема алгебры 79 отделение кратных корней 99 открытое полупространство 225 отображение 23—24 — тривиальной структуры 299 отрицательно определенная форма 258 отрицательные числа 13 П параллельные пласты 184, 218 — ряды матрицы 198 — — определителя 200 параметрическая запись пласта 215 пересечение пространств 155 Пифагор (580-500) пифагорейцы 12 пласт 184 подгруппа 37 подгруппоид 37 подкольцо 48 подполе, подтело 48 подпространство 154 подсистема 36 подстановка 32 позиционная система счисления 13 Пойя (Рогуа Сеогде, 1888-1985) поле 46, 51 — комплексных чисел 70 — разложения 99 — рациональных функций 114 полилинейная форма 193 полное поле 62 полный прообраз 323 положительно определенная форма 257 полугруппа 28 полуопределенная форма 258—259 полярная форма 255 Понтрягин Лев Семенович (1908— 1988) поэлементное произведение 124 правильная дробь 122 приводимость многочленов 96 прием ложного положения 10 принцип вложенных отрезков 62— 63, 290 проблема исключения 291 произведение матриц 125—127 производная от многочлена 99 прообраз 24 простейшая дробь 116 простое алгебраическое расшире- ние 62 — трансцендентное расширение 64 пространства строк и столбцов 167 противоположный элемент 34 равенство матриц 123 — многочленов 87 разложения группы по подгруппе 326-327 размерность алгебры 330 — пласта 185 — пространства 160 — тела 338 разность 45 ранг билинейной формы 248 — матрицы 169
— системы векторов 160 распадающиеся гиперповерхности 261-262 — формы 259 расширение поля 52 рациональные корни многочлена 107 ребро-луч и ребро-отрезок 237 Редфилд (КесШей Л. Ноуагс!, 1879- 1944) резольвента 78 результант Безу 296, 360 — Сильвестра 292 решение (корень) системы уравне- ний 148-149, 177 — уравнения в радикалах 78 Рид (Кеас! Копай С., род. 1930) Руффини (КиШш Рао1о, 1765-1822) ряд фигур 375 — конфигураций 375—376 сдвиг пласта 185 сигнатура 257 Сильвестр (5у1уе51ег Латез ЛозерЬ, 1814-1897) симметрическая группа 361 симплекс, симплекс-метод 244 система линейных ограничений 223 скалярное произведение 266 скрещивающиеся пласты 219 сложение матриц 124 смежные классы 326 собственный вектор, собственное значение 280 совершенная полилинейная форма 194 сопряженные кватернионы 80 — комплексные числа 70 спектр графа 321 стандартная база 166 структурные константы 331 сумма, прямая сумма пространств 156 схема Горнера 102 сюръекция 24 Т таблица Кэли 34—35 Тарталья (Таг1а^11а М1ссо1о, 1499— 1557) тело 46 теорема Безу 101 — Гамильтона—Кэли 305 — Кронекера—Капелли 178 — Кэли 361 — Лагранжа 327 — Лапласа 205 — Минковского—Фаркаша 245 — Пифагора 267 — Редфилда—Пойя 376 топологическая алгебра 387 топологические пространства 386 транспозиция 195 транспонирование матрицы 150, 197 трансцендентное расширение поля 64, 115-116 трансцендентные числа 64 тривиальное кольцо 46 — решение системы уравнений 149 тригонометрическая форма комп- лексного- числа 71 удвоение 27 умножение матриц, разбитых на блоки 150 унитарное пространство 266, 288 унитарный многочлен 91 упорядоченное поле 63 Ф Фаддеев Дмитрий Константинович (1907-1989) фактор-алгебра 333 фактор-группа 326 фактор-кольцо 328 фактор-множество 112 фактор-система 324
Ферма (Регта! Р1егге, 1601—1665) Феррари (Реггап Ьос1оу1со, 1522— 1565) Ферро (Регго 5с1рюп с!е1, 1465— 1526) физическая интерпретация кватер- нионов 81 формальная переменная 86 формальные степенные ряды 83 Формула Бине—Коши 213 — Кардано 77 — Муавра 72 формулы Виета 103—104 — Крамера 208 — Ньютона 352 Фредгольм (РгесШо1т Епк 1уаг, 1866-1927) Фробеннус (РгоЬепшз РегсПпапс! Сеог^, 1849-1917) фундаментальная система решений 188 функтор 384 характеристика (кольца, тела, поля) 46 характеристическая матрица 279 характеристический многочлен мат- рицы 300 — отображения 300 характеристическое уравнение 279 Харари (Нагагу Ргапк, 1921-2005) Ц целостное кольцо = область целос- тности целочисленные решения 191 целые (гауссовы) комплексные чис- ла 122 центр тела 338 центральные и нецентральные гиперповерхности 262 циклическая группа 377 цикловой индекс 363 циклы подстановки 362—363 цилиндрическая гиперповерхность 262 Чеботарев Николай Григорьевич (1894-1947) Черников Сергей Николаевич (1912-1987) четные и нечетные подстановки 196 четырехмерное пространственное воображение 214 числа Стирлинга 176 число я 64, 116 Ш Шварц (ЗсЬ^агх Каг! Негтапп Атапс1и5, 1843-1921) Шилов Георгий Евгеньевич (1917— 1975) Шмидт Отто Юльевич (1891-1956) Э Эйлер Леонард (Еи1ег ЬеопЬапЗ, 1707-1783) эквивалентность 112 элементарные матрицы 133 — преобразования матриц 133 эндоморфизм 323 Энумерационал 379 Эрмит (Негт11е СЬаг1ез, 1822- 1901) эрмитова матрица 264 эрмитово-квадратичная форма 263 эрмитово-симметричная форма 264 эрмитовы формы 262 ядро 307, 325 . Якоби (ЛасоЫ Каг! Сиз1ау ЛасоЬ, 1804-1851)
Выражаю глубокую признательность Председателю Одесского областного Совета Николаю Леонидовичу Скори- ку и Президенту-организатору Одесского областного отде- ления форума "Интеллектуальное сотрудничество — Украи- на XXI столетия" Алексею Алексеевичу Козаченко. Сердечно благодарю мою верную подругу и помощницу Таисию Ефимовну Зыкову, взявшую на себя нелегкие хлопо- ты по изданию. Мы очень благодарны Елене Григорьевне Лобынцевой за безвозмездное художественное оформление обложки и рисунков; Татьяне Щуровой (библиотека им. Горького) и Владиславу Ременьяку (библиотека ОНУ им. Мечникова) за поиск и перепечатку картины В. А. Гартмана; нашей внучке Алёне за техническую помощь. Главное, все они, с одесским чувством юмора, прекрасно понимают, сколь важна эта книга студентам и преподавате- лям. А мне лично пусть она послужит рукотворным памят- ником. И только я несу ответственность за небольшие от- ступления от ГОСТа, которые были необходимы для точной передачи математического смысла текста^ А. А. Зыков В центре Новосибирска есть такой перекресток, проехать который не нару шив ни одного из правил дорожного движения невозможно.
Навчальне видання ЗИКОВ Олександр Олександрович ЛЕКЦН 3 АЛГЕБРИ Росшською мовою Зав. редакшею Т. М. Забанова Голов, редактор Ж. Б. Мельниченко Коректор /. О. Кокота Здано у виробництво 14.06.2007. Пщписано до друку 03.09.2007. Формат 60x84/16. Пашр офсетний. Гарштура 1л{егаШпа]а. Ум. друк. арк. 23,25. Тираж 900 прим. Зам. № 43. Видавництво 1 друкарня «Астропринт» (Свщоцтво ДК № 1373 в!д 28.05.2003 р.) 65082, м. Одеса, вул. Преображенська, 24 Тел./факс: 726-98-82, 726-96-82, 37-14-25 шшш.а5(горпп(.ос1е55а.иа