Text
                    Π РАВОЧ ΗΑ5Ι
,АТЕМАТИЧЕ(Ш
ИБЛИОТЕКА
ВЫСШАЯ АЛГЕБРА
фи!мАтги£-19'б2


СПРАВОЧНАЯ МАТЕМАТИЧЕСКАЯ БИБЛИОТЕКА ПОД ОБШЕЙ РЕДАКЦИЕЙ Л. А. ЛЮСТЕРНИКА и А. Р. ЯНПОЛЬСКОГО
А. П. МИШИНА и И. В. ПРОСКУРЯКОВ ВЫСШАЯ АЛГЕБРА ЛИНЕЙНАЯ АЛГЕБРА, МНОГОЧЛЕНЫ, ОБЩАЯ АЛГЕБРА Под редакцией П. К. РАШЕВСКОГО ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 1962
517.! Μ 71 АННОТАЦИЯ Настоящий выпуск посвящен основным понятиям алгебры. В нем излагаются теория определителей» решение систем линейных уравнений, теория матриц, свойства квадратичных форм, алгебра многочленов, отыскание корней многочленов с числовыми коэффициентами, а также элементы теории групп, колец и полей. Книга дает возможность читателю навести нужную справку и ознакомиться с основными фактами высшей алгебры, изложенными конспективно, без доказательств, но в систематической форме и с разбором ряда примеров. Книга предназначена для математиков, физиков и инженеров, применяющих в своей работе математические методы, а также для студентов и аспирантов. Справочная* математическая библиотека под общей редакцией Л. А, Люстернака и Л. Р. Янпольского. Высшая алгебра (линейная алгебра, многочлены, общая алгебра) М„ Физматгиз, 1962 г., 300 стр. с илл. Редактор В. И, Латышев. Техн. редактор Л. Ю. Плакше. Корректор Г. С. Плетнева* Сдано в -набор 4/1 1962 г. Подписано к печати 20/1V 1962 г. Бумага 84χΐ08/,2. Физ. печ. д. 9,376. Условн. печ. л. 15.38. Уч.-изд. л. 16,01. Тираж 25000 экз. Т-04732. Цена книги 90 коп. Заказ J* 1096. Государственное издательство физико-математической литературы. Москва, В-71, Ленинский проспект, 15. Ленинградский Совет народного хозяйства. Управление полиграфической промышленности. Типография J* I «Печатный Двор» имени А. М. Горького. Ленинград, Гатчинская, 26,
СОДЕРЖАНИЕ Предисловие 9 Введение 11 Глава I Определители и системы линейных уравнений § 1. Определители 13 1. Перестановки и подстановки 13 2. Понятие определителя любого порядка 16 3. Простейшие свойства определителей 18 4. Миноры и алгебраические дополнения элементов. Разложение определителя по строке или столбцу 20 5. Вычисление определителей с числовыми элементами· · 21 6. Методы вычисления определителей я-го порядка .... 22 7. Определитель Ваидермонда и связанные с ним определители 26 8. Якобисвы определители. Контииуант и связь с числами Фибоначчи 28 9. Миноры любого порядка» их алгебраические дополнения и теорема Лапласа 29 10· Разложение определителя по строке и столбцу. Окаймленные определители . . . ; 31 П. Умножение определителей. Теорема Бине —Коши. . . 34 12. Циркулянты и связанные с ними определители 36 13. Взаимные (или присоединенные) и ассоциированные определители» их миноры и формула Сильвестра. . . 38 14· Симметрические» кососнмметрические и псевдоснммет- рические определители 41 15. Кронекеровское произведение определителей 43 16· Неравенство Адамара и другие неравенства» связанные с определителями 43 § 2. Системы линейных уравнений 46 1. Общие сведения 46 2. Метод Гаусса исключения неизвестных 47 3. Правило Крамера 52 4. Ранг матрицы ♦ ♦ ♦ ♦.♦♦....; 54
6 СОДЕРЖАНИЕ 5. Общая теория линейных уравнение 59 6. Системы однородных линейных уравнений. Фундаментальные системы решений 62 7. Связь решений однородных и неоднородных систем . . 66 Глава II Матрицы и квадратичные формы § 1. Матрицы 67 1. Действия с матрицами 67 2. Единичная и обратная матрицы 71 3. Степени матрицы. Многочлены от матрицы. Перестановочные матрицы *. . . 75 4. Связь умножения матриц с элементарными преобразованиями. Разложение матрицы в произведение треугольных матриц 79 5. Многочленные матрицы, инвариантные множители и элементарные делители . > S2 6. Матричные многочлены 90 7. Характеристические числа и собственные векторы матрицы 92 8. Минимальный многочлен матрицы 95 9. Подобные матрицы . . . . \ „...*.... 98 10. Диагональная форма матрицы 101 11. Жорданова форма матрицы 106 12. Естественная форма и другие канонические формы матрицы ПО 13. Якооиевы матрицы ч 116 14. Ассоциированные и взаимные матрицы 118 15. Кронекеровское произведение матриц 120 16. Ортогональные и унитарные матрицы 122 17. Симметрические, кососимметрические и эрмитовы матрицы 129 18. Нормальные матрицы 136 § 2. Билинейные и квадратичные формы 137 1. Эквивалентность. Канонический и нормальный вид. Методы Лагранжа и Якоби приведения к каноническому виду. 137 2. Действительные квадратичные формы. Закон инерции. Индексы инерции и сигнатура 149 3. Положительно определенные квадратичные формы . . 152 4. Ортогональные преобразования квадратичных форм. Приведение квадратичной формы к главным осям. . . 154 5. Пара форм. Пучок форм 162 6. Экстремальные свойства характеристических чисел регулярного пучка форм 164 7. "Комплексные формы второго рода. Эрмитовы формы . 168 8. Ганкелевы формы ,,,,,..,,.,,,,., 172
СОДЕРЖАНИЕ Глава III Алгебра многочленов .« § 1. Общие свойства многочленов 175 1. Определения, примеры 175 2. Деление с остатком 176 3. Схема Горнера 176 4. Разложение многочлена по степеням разности 178 5. Наибольший общий делитель двух многочленов. ... 179 6. Взаимно простые многочлены 181 7. Представление d(x) = (/(*), g(x)) в виде d(x)=s = f(x)u(x) + g(x)v(x) 181 8. Уничтожение иррациональности в знаменателе 184 9. Наибольший общий делитель нескольких многочленов 185 10. Корни многочлена. Отделение кратных корней 185 11. Формулы Виета 187 12. Общие корни двух многочленов. Результант. Дискриминант 187 § 2. Интерполяционные формулы Лагранжа и Ньютона 190 § 3. Отыскание корней многочленов. Разложение многочленов на множители , 194 1. Решение уравнений второй степени 194 2. Решение уравнений третьей степени 195 3. Решение уравнений четвертой степени 199 4. Об уравнениях степени выше четвертой 201 5. Рациональные корни многочленов с рациональными коэффициентами 202 6. Разложение многочлена на множители первой и второй степени 203 7. Неприводимые многочлены 204 8. Разложение многочленов на неприводимые множители над полем рациональных чисел 205 9. Дробно-рациональные функции . . . 210 § 4. Границы корней многочлена. Теоремы о числе корней . ♦ . 214 1. Границы действительных корней многочлена с действительными коэффициентами 214 2. Теоремы о числе действительных корней 217 3. Границы комплексных корней многочлена 225 4. Число корней в левой и правой полуплоскости 229 5. Критерии устойчивости 238 6. Область устойчивости 240 § 5. Многочлены от нескольких переменных 240 1. Определения 240 2. Симметрические многочлены 242
8 СОДЕРЖАНИВ 8. Выражение степенных сумм через элементарные сим· метрические многочлены 245 4. Системы алгебраических уравнений с несколькими неизвестными 246 Глава IV Общая алгебра § I. Группы 249 1. Определение группы» примеры 249 2. Изоморфизм групп ι 252 3. Гомоморфизм 253 4. Подгруппы. Циклические группы 254 5. Системы образующих. Возрастающие последовательное· ти подгрупп 255 6. Смежные классы. Разложение группы по подгруппе . 257 7. Нормальный делитель группы ·. 259 8. Фактор-группа 261 9. Группы подстановок 262 10. Прямые произведения групп 265 11. Абелевы группы 268 § 2. Кольца 269 1. Определения» примеры 269 2. Изоморфизм. Гомоморфизм 271 3. Подкодьца. Идеалы 272 4. Прямые суммы колец 274 5. Фактор-кольца 274 § 3. Поля. Тела 275 1. Поля 275 2. Тела 278 § 4. Алгебры 278 § 5. Структуры I 281 1. Частично упорядоченные множества 281 2. Основные определения 283 . 3. Дистрибутивные и дедекиндовы структуры '. . 285 4. Булевы алгебры 287 Библиография 288 Указатель обозначений 290 Алфавитный указатель 292
ПРЕДИСЛОВИЕ В деятельности научных работников технических специальностей, а также математиков, физиков, химиков и др. нередки случаи, когда необходимо навести справку по тому или иному математическому вопросу без детального его изучения. Не всегда бывает легко отыскать соответствующую литературу, в особенности если вопрос не элементарный, а иногда непросто найти нужный результат в тексте какой-либо монографии и разобраться в нем в отрыве от предшествующего изложения. Издание серии справочников по высшей математике, как нам кажется, будет весьма полезным в этом отношении. Предлагаемая книга посвящена высшей алгебре. При этом в главах I и II собраны результаты, относящиеся к линейной алгебре (матрицы, определители, системы линейных уравнений, квадратичные формы); в главе III изложена алгебра многочленов (действия над многочленами, алгебраические уравнения с одним неизвестным и свойства их корней, дробно-рациональные функции, многочлены от нескольких переменных); глава IV посвящена важнейшим понятиям алгебры как современной математической науки (группы, кольца, поля и тела, алгебры, структуры). В кратком введении даны некоторые основные определения, используемые в дальнейшем, и его следует прочесть до пользования справочником. Доказательства отсутствуют, но формулировки результатов сопровождаются рядом примеров, разъясняющих их смысл. Интересующий читателя вопрос следует искать по подробному оглавлению или по алфавитному указателю в кони& едшги^
10 ПРЕДИСЛОВИЕ Добавим еще, что материал, наиболее часто встречающийся в приложениях, содержится в первых трех главах; четвертая глава имеет целью помочь читателю разобраться в незнакомых ему понятиях современной алгебры. При ссылке на параграф той же главы номер главы опускается; аналогично при ссылке на пункт того же параграфа опускается номер этого параграфа. Главы I и II написаны И. В. Проскуряковым, главы III и IV —А. П. Мишиной. П. К. Рашевский
ВВЕДЕНИЕ На протяжении всей книги встречаются следующие основные понятия: множество, числовое поле, матрица. Основные понятия и обозначения теории множеств даны в [34], стр. 22—24. Числовым полем К называется любое множество чисел, содержащее хотя бы одно число, отличное от нуля, и вместе с любыми двумя числами а и b содержащее их сумму а-\-Ь, разность а — Ьъ произведение аЪ и частное £ (если b^Q). Можно проверить, что все рациональные числа образуют числовое поле. Точно так же все действительные числа или все комплексные числа образуют числовое поле. Эти три числовых поля играют важнейшую роль во всей математике. Поле всех комплексных чисел обладает следующим важным свойством: любой многочлен ·степени п^>0 от одного переменного х с комплексными (в частности, действительными) коэффициентами имеет в том же поле комплексных чисел все η своих корней (см. гл. III). Это свойство поля комплексных чисел называется его алгебраической .замкнутостью. Кроме числовых полей, рассматривается также общее понятие поля, элементами которого* не обязательно являются' числа (см. гл. IV). В первых трех главах (за исключением специально оговоренных мест) речь будет идти только о числовых полях. Матрицей называется прямоугольная таблица чисел. Для обозначения матрицы применяются круглые скобки, или двойные вертикальные линейки, например: 12\ 3 4 5 6/ или • 11 211 3 4 5 б| В данном выпуске применяется первое обозначение. Числа, составляющие матрицу, называются ее элементами. Горизон-
12 ВВЕДЕНИЕ тальные ряды элементов матрицы называются строками, а вертикальные — столбцами. Если число строк матрицы равно числу столбцов, то матрица называется квадратной, а число строк — порядком этой матрицы. В дальнейшем для краткости под матрицами данного порядка подразумеваются квадратные матрицы этого порядка. При записи в общем виде элементы матрицы обозначаются обычно одной буквой с двумя индексами, из которых первый укрывает номер строки, а второй — номер столбца, например, матрица порядка η в общем виде запишется так: /ап αϊ* ... αίη\ I <h\ <*м · · · <hn I \αηί αΛί. . . αηη/ (читается: «я один, один, а один, два» и т. д., а не «я одиннадцать, а двенадцать»). Ряд элементов квадратной матрицы, лежащих на отрезке, соединяющем левый верхний угол с правым нижним, называется главной (или первой) диагональю, а на отрезке, соединяющем правый верхний угол с левым нижним, — побочной (или второй)· диагональю матрицы.
ГЛАВА I ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ § 1· Определители 1· Перестановки и подстановки· Перестановкой η чисел 1, 2, ... , η (или η любых различных между собой символов аь аь ... , ап) называется любое расположение этих чисел (или символов) в определенном порядке. Так как данные η символов можно занумеровать числами 1,^2, ... t л, то изучение перестановок любых η символов сводится к изучению перестановок этих чисел. Число всех перестановок из η чисел равно 1<·2·3 ..♦ л=л1 (читается: «/г-факториал»)· . Пример 1. Все перестановки чйСел 1, 2» 3 имеют вид: 123, 132, 213, 231, 312, а21. Число их 31=6. Говорят, что два числа в перестановке образуют инверсию, если большее число стоит впереди меньшего, если же меньшее число ςτοΗτ впереди большего, то — порядок. Способ подсчета числа инверсий: читаем числа перестановки в порядке их записи (слева направо), для каждого из чисел считаем, сколько чисел меньших данного стоит правее него, и все полученные числа складываем. Пример 2. В перестановке 528371964 число инверсий равно 4+1+5+1+3 + 2+1 = 17. Перестановка называется четной или нечетной, смотря по тому, будет ли число инверсий в ней четно или нечетно. Транспозицией называется перемена местами двух чисел перестановки. Транспозиция чисел I и у обозначается через (i, /). От любой перестановки η чисел к любой другой перестановке тех же чисел можно перейти путем ряда транспозиций, причем можно рбойтись не более чем η — I транспозициями.
14 ГЛ. Т. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [1 ПримерЗ. От перестановки 25134 к перестановке 42513 можно перейти путем четырех транспозиций: (2, 4), (2, 5), (1, 5), (1, 3). Все п\ перестановок чисел 1, 2, ... , η можно так расположить одну вслед за другой (без пропусков и без повторений), что каждая следующая · перестановка получается из предыдущей путем одной транспозиции. Каждая транспозиция меняет четность перестановки. При любом п^2 число четных перестановок из η чисел равно числу нечетных, т. е. ±п\. Подстановкой η чисел 1, 2, ... , η или подстановкой п-й степени называется взаимно однозначное отображение совокупности.этих чисел на себя, т. е. такое отображение, при котором каждому числу от 1 до л соответствует какое-то из этих чисел и двум различным числам всегда соответствуют два различных числа. Подстановка записывается двумя строками в общих скобках, причем каждому числу верхней строки соответствует стоящее под ним число нижней. Например, (2 1 3 4\ 3 1 4 2/ обозначает подстановку, в которой: 1—>1, 2-т*3, 3 — 4, 4 — 1 В зависимости от расположения чисел в верхней строке одну и ту же подстановку можно записывать многими способами. Например, записи /1 2 3\ /2 3 1\ /3 2 1\ \2 3 1/' [Ζ 1 2)> \\ 3 2) обозначают одну и ту же подстановку, при которой 1 переходит в 2, 2 в 3, 3 в 1. Каждая подстановка η чисел допускает п\ различных записей. Число различных подстановок η элементов также равно п\. Подстановка называется четной, если общее число инверсий в обеих ее строках четно, и нечетной, если нечетно. Иначе говоря, подстановка четна, если ее строки имеют одинаковую четность, и нечетна, если — противоположную четность. Четность подстановки не зависит от ее записи в виде двух строк, т. е. все записи одной и той же подстановки имеют одинаковую четность.
1] § 1. ОПРЕДЕЛИТЕЛИ 15 Пример 4. Подстановка /2 3 4 1\ _ /1 2 3 4\ V3 1 4 2^~\2 3 1 4) содержит в первой записи шесть, а во второй—две инверсии и» значит, четна. Число четных подстановок η элементов равно числу нечетных, т. е. у я! (если η ^2). Существует другой метод* определения четности подстановки. Циклом называется последовательность нескольких чисел, в которой первое число при данной подстановке переходит во второе, второе в третье и т. д., а последнее— в первое. Цикл обозначается заключением его чисел в общие скобки. Если число переходит само в себя, то оно одно образует цикл. Циклы, не имеющие общих чисел, называются независимыми. Любую подстановку можно разложить на независимые циклы. Пример 5. (ίΐΐί*!)^163)*25) <4>· Декрементом d подстановки называется разность между числом η всех ее элементов и числом k циклов в ее разложении: d=n — k. Четно'сть подстановки совпадает с четностью ее декремента. Так, в примере 5: η = 6, k=Z, d = 3, т. е. подстановка нечетна.. Наименьшее число транспозиций, необходимое для перехода от одной перестановки η чисел ah а* ... , ап к другой перестановке тех же чисел Ъь Ъ* ... , Ьп, равно декременту подстановки <*i <h ... ап\ Ь\ h ··· Ьп] (см. [20], задача 183). Следовательно, для любой перестановки η чисел существуют перестановки тех же чисел, которые нельзя перевести в данную перестановку менее чем П — 1 транспозициями. Можно ввести операцию умножения подстановок, дать другое определение цикла, - как некоторой подстановки, и истолковать разложение подстановки на независимые циклы как представление ее в виде произведения этих циклов. Об этом см. гл. IV, § 1, пп. 1 и 9, а также [11], стр. 33 — 36.
16 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [2 2, Понятие определителя любого порядка· Пусть дана квадратная матрица порядка п: fan al% 091 %1 = W *nl ая9 \Α\ = \αυ\ϊ = Определителем п-го порядка, или определителем матрицы А, при п^>\ называется число, полученное из элементов этой матрицы по формулам k*ii Яи ··· а\п\ \ап\ апЪ · · · апп I = 2 (— Xta\k&2k% ... «я*я = 2(— tf^il aW · · · %«· Здесь первые три выражения — обозначения определителя; первая сумма берется по всем различным между собой подстановкам ih.-Jj () причем $ — число инверсий в верхней, a t — в нижней строке этой подстановки, вторая сумма берется по всем перестановкам kb kb ... , kn и k — число* инверсий в этой перестановке. Аналогичный смысл имеет третья сумма. Все три суммы тождественно равны. Их слагаемые называются членами определителя; каждый член определителя равен произведению η элементов матрицы, взятых по одному из каждой строки и из каждого столбца, причем это произведение берется со своим знаком, если подстановка (*) четна, и с противоположным, если нечетна. Определитель первого порядка равен своему единственному элементу. Число всех членов определителя η-го порядка равно п\. Элементы, строки, столбцы и т. д. матрицы А называются, соответственно элементами, строками, столбцами и т. д. ее определителя |Л|. Призер 1. Определитель второго порядка: isai-*·*·-*·**
2] § 1. ОПРЕДЕЛИТЕЛИ 17 an Ям 0ι$ 081 β*» β*» Пример 2. Определитель третьего порядка: ев 011022088 + <*i*<fcs<*Sl "Ι" Λ*ία»*αί» — 01*022081 0180210S8 — 028082<*11· Это выражение получается по правилу треугольников (правилу Саррюса), его можно пояснить следующими схемами, на которых элементы, входящие в одно произведение с указанным знаком, соединены отрезками: + 1 Пример 3. Произведение элементов главной диагонали 0Ц028 ··. 0/w ПРИ любом η входит в определитель /t-го порядка со знаком плюс, так как ни первые, ни вторые индексы не образуют инверсий. Пример 4. Определить знак произведения элементов побочной диагонали flinfl*,n-i0s,rt-s ... ani определителя /t-го порядка. Так как индексы строк идут в порядке возрастания, то знак определяется четностью перестановки индексов столбцов я, я — 1, я— 2, ... , 1, в которой любые два числа' образуют инверсию, ™ я (я — 1) поэтому число всех инверсий равно С* = λ g— »и произведение элементов побочной диагонали входит в определитель /t-го порядка п{п-\) со знаком (—1) 2 . При я=*4Л, 4Λ4- 1 получим знак плюс, а при η = 4Λ + 2, 4Λ + 3— минус. Таким образом, для порядков 2, 3 получим минус, для 4, 5 — плюс, для 6, 7 — минус, для 8, 9 — плюс и т.д. Пример 5. Вычислить определитель d = Если не брать слагаемых, равных нулю, то из первой строки надо взять 012 или ап. Если берем aiit то из второй строки надо взять 021 или 02ΐί если берем α*ι, то из третьей строки надо взять 084 и из четвертой ai9. Перебирая так все возможности и учитывая знаки, получим: d = а 1202108404· — flaau<*si<*4s. — (*1*(*п<*иви + <* ι a<*s4<**i<*u.· 0 β» α«ι 0 «и 0 0 β« «ι» 0 0 αΜ 0 αΜ «4. 0
18 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3 Вычислять более сложные определители путем непосредственного применения определения было бы весьма неудобно. Для этого применяются специальные методы (см. пп. 5, 6). 3. Простейшие свойства определителей. Транспонированием матрицы (а также определителя) называется перемена' ролями строк и столбцов с сохранением их номеров. Таким образом, строки данной матрицы будут в той же последовательности столбцами транспонированной матрицы, и наоборот. Пример 1. Транспонируя матрицу Л=г( ), получим матрицу /1 4\ Л'= 2 5 . \3 6/ В случае квадратной матрицы (или в случае определителя) транспонирование сводится к повороту матрицы (или определителя) на 180° вокруг главной диагонали. Суммой нескольких строк одинаковой длины называется строка, каждый элемент которой равен сумме соответствующих элементов данных строк. Произведением строки на число называется строка, каждый элемент которой получен из соответствующего элемента данной строки умножением его на данное число. Линейной комбинацией нескольких строк одинаковой длины называется строка, равная сумме произведений данных строк на некоторые числа, называемые коэффициентами этой линейной комбинации. Если одна строка является линейной комбинацией других, то говорят также, что она линейно выражается через эти строки. Несколько строк одинаковой длины называются- линейно независимыми, если ни одна из них не выражается линейно через остальные. Пример 2, Равенство (1,-1, -3, -5) = 3(1, 1, 1, I) — 2(1, 2, 3,4) означает, что первая строка является линейной комбинацией двух других. Простейшие свойства определителей. 1. При транспонировании определителя его значение не изменяется. 2. Если все элементы какой-нибудь строки (или столбца) определителя равны нулю, то определитель равен нулю.
8] § 1. определители 19 3. При перестановке двух любых строк (или столбцов) определитель меняет знак. 4. Если.две строки (или два столбца) определителя одинаковы, то он равен нулю. 5. Если все элементы одной строки (или столбца) определителя умножить уа одно и то же число, то и весь определитель умножится на это число. Иными словами, общий множитель всех элементов строки (или столбца) можно выносить за знак определителя. 6. Если все элементы одной строки определителя пропорциональны соответствующим элементам другой строки, то определитель равен нулю. То же. верно и для столбцов. 7. Если все элементы i-й строки определителя представлены в виде суммы k слагаемых, то и весь определитель представляется в виде суммы k определителей, у которых все строки, кроме i-й, такие же, как в исходном определителе, а 1-я строка в первом определителе состоит из первых слагаемых, во втором — из вторых и т. д. То же верно и для столбцов. Например, |5 —3 II 15 —3 1 3 2 —7=1 . Г — 6 |4 0 —2| |4 0 —2 8. Если к одной строке определителя прибавить одну .или несколько других строк, умноженных на любые числа, то значение определителя не изменится. То же верно и для столбцов. В частности, к одной строке (столбцу) можно прибавить (или из нее вычесть) другую строку (соответственно столбец). 9. Если хотя бы одна строка определителя линейно выражается через другие его строки, то он равен нулю. Обратно, если определитель порядка η ^2 равен нулю, то хотя бы одна из его строк линейно выражается через другие строки. То же верно для столбцов. Пример 3. Определитель D, в котором любые два элемента а^ и akjy симметрично лежащие относительно главной диагонали, комплексно сопряжены, является сам числом действительным. В самом деле, пусть D = а + Ы. Транспонируя D, получим определитель D\ все элементы которого сопряжены соответствующим элементам определителя Ζλ Но определитель равен сумме + δ —3 1 2 1 —1 4 0—2
20 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [4 произведений (с надлежащими знаками) своих элементов, и по свойствам комплексных чисел» сопряженных сумме и произведению нескольких чисел» получим: D'*=a — bl. Так как D = D\ то а-\- bl = a — blt откуда £ = 0 и D = а — действительное число. Пример 4. Определитель D называется кососимметрическим, если любые два элемента, симметрично лежащие относительно главной диагонали, различаются только знаком, т. е. а^^ — ау (в частности, элементы.главной диагонали равны нулю). Кососимметриче- ский определитель D нечетного порядка η равен нулю. Действительно, вынося из каждой строки определителя D множитель —I, получим транспонированный определитель, равный D, т. е. D = = (— Yf D и Ds=0 в силу нечетности я. 4· Миноры и алгебраические дополнения элементе^· Разложение определителя по строке4 или столбцу· Минором М(j элемента atj определителя D порядка п^2 называется определитель порядка η — 1, полученный из D вычеркиванием i-й строки и /-го столбца, в пересечении которых стоит данный элемент аи. Алгебраическим дополнением элемента аи называется число Άυ=(—ΐγ+)Μυ. Определитель равен сумме произведений элементов Любой его строки (или столбца) на их алгебраические дополнения. В частности, если все элементы строки (или столбца), кроме одного, равны нулю, то определитель равен этому элементу, умноженному на его алгебраическое дополнение. Пример 1. Минор элемента агь определителя 0ц 018 #18 014 est a%% ап аи 0»ι 0»* 0»» <*м 041 04» 04· 044 есть Λί„^ 0ц 018 014 0»1 0·» 0»4 041 048 044 Алгебраическое дополнение элемента 088 есть А%%· Π ρ и м е ρ 2. Вычислить определитель 12 -3 4 1 Ми —2 Ь -1 3 2 с d 4 3
Ч § 1. ОПРЕДЕЛИТЕЛИ 21 Разлагая по третьей строке, найдем D«a(-1)* 1-3 1-2 1 + *(-!)· + <*(-07 2 4 3 2 -3 4 —2 3 —1 +«<-«· 2 —3 I 4—2 2 3—13 :8л+ 15*+12с— ДО. б· Вычисление определителей с числовыми элементами. Вычисление определителя порядка η можно свести к вычислению одного определителя порядка η—1. Пусть надо вы* числить определитель 10ц ап ... <*\п ι 0»1 Он £>= <hn Если все элементы первого столбца равны нулю, то D=0 (см. стр. 18, свойство 2); если аи = 0, но αΛ, ^0, то, переставив первую и А-ю строки, получим в левом верхнем углу элемент, отличный от нуля. Итак, без ограничения общности можно считать, что ап -ф 0. Ко второй строке прибавим первую, умноженную на ——, к третьей строке первую, умноженную на —^*»···> к л-й строке первую, умножен- 2sL ную на Определитель не изменит своего значения (см. стр. свойство 8) и примет вид |«и <*м ··· <hn 0β 0 bn ... Ьъ leottj^ylj-1 (см. п. 4). 0 6д4 ... Ьпп Пример. Вычислить определитель 6-5 8 4 D-I ° 7 5 2 1 7 5 8 7 _4 8-8-3
22 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [6 Имеем D = —12 9 -20 1 5 =— —19 7 -16 15 —12 19 —15 — 2 0 5 2 —12 \1 — '3 —1 —19 — 2 37 — 1 — 1 —IS I —12 -19 - -2 0 19 37—1 0 —15 — 1 —15 0, =s — -10 20 5 15—3—1 —10 —19 283 20 37 —556 283 —556 0 — ι ο| —10 2831 0 101 = 100. β. Методы вычисления определителей η-го порядка. Изложенный в предыдущем пункте метод вычисления определителей данного порядка с числовыми элементами неудобен в случае определителей с буквенными элементами или определителей с числовыми элементами, но высокого порядка п. Общего метода вычисления таких определителей не существует, если не считать вычисления определителя заданного порядка непосредственно по его определению (стр. 16). К определителям того или иного специального вида применяются различные методы вычисления, приводящие к выражениям более простым, чем выражения, получаемые прямо из определения. Ниже указаны некоторые из этих методов. 1) Метод приведения к треугольному -виду. Пользуясь свойствами определителя (см. стр. 18—19), приводят его к так называемому «треугольному» виду, когда все элементы, стоящие по одну сторону от главной диагонали, равны нулю. Полученный определитель треугольного вида равен произведению элементов главной диагонали, т. е. D = ап ах% 0 Дад 0 0 <*13 · я*а · <Нъ . >· *!ц ·· <hn - аи о о anawfln...an Случай, когда нули стоят справа от главной диагонали, сводится транспонированием к предыдущему или разбирается аналогично. Если удобнее получить нули по одну, сторону
6] § 1. ОПРЕДЕЛИТЕЛИ 23 от побочной диагонали, то, меняя в таком определителе D порядок строк или столбцов на обратный, найдем D= (— 1) 2 Dt, где η—.порядок D и Dt уже треугольного вида. Пример 1. \п п—1 ... 4 3 2 II η л—1 ... 4 3 3 I η л — 1 ... 4 5 2 1 л л—1 ... 7 3 2 1 £> = 2η—1 л—1 4 3 2 1 (по побочной диагонали стоят первые л нечетных чисел). Вычитая первую строку из всех остальных, найдем £> = л 0 0 0 л—1 λ(λ- -i) " η _ 0 0 0 0 J) 1 0 0 0 0 ι 2 1 0 0 0 ... ... ·.. ... 3 0 2 0 0 4 0 0 3 0 4 0 0 3 0 3 0 2 ,0 0 ... ... ... ···. ... 2 1 1 0 0 0 0 0 0 0 я — 0 0 0 0 = 1 η Ι 0 0 0 η—ll rtn-i) -Μ) Пример 2. Вычислить определитель порядка п: \а b b ... b \b a b ··· b \b b a ··· b («-!)! Dt \b b b ... a К первому столбцу прибавляем все остальные: |а + (л—1)£ b b ... b \a + (n—\)b a b ... b 0 = L + (/t— l)fr ^ α ... ^ « + («— l)^ ^. b
24 ГЛ. I. ОПРЕДЕЛИТЕЛИ Й СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [6 (первую строку вычитаем из всех остальных) o + (n—\)b b b ... b О α — b 0 ... О О 0 я — b ... О •Ь\ — [о+(*-!)*] (о-')*"1· 2) Метод рекуррентных соотношений. Данный определитель Dn порядка п> после преобразования и разложения по строке или столбцу, выражается через определители того же вида, но более низких порядков. Полученное равенство называется рекуррентным соотношением. Вычисляют столько определителей данного вида начальных порядков, сколько их входит в правую часть рекуррентного соотношения. Далее вычисляют определители следующих порядков, используя рекуррентное соотношение, до тех пор, пока не удастся заметить общую закономерность для получаемых выражений. Затем, пользуясь рекуррентным соотношением, можно доказать эту закономерность для Dn индукцией по /*. Пример 3. Вычислить определитель 3 2 1 3 0 1 0 0 0 0 ... 0 0 2 0 ... 0 0 3 2 ... 0 0 1 3 ... 0 0 О 0 0 0 ... I 3 Рекуррентное соотношение: Λι — 3/^i —2/n.f. -Находим /ι = 3, Λ = 7, Λ = 3Λ — 2/ι = 15, /4 = 3Λ —2/2s=31. Найденные определители вычисляются по формуле 7m = 2m+1 —1, докажем ее справедливость индукцией по числу /и. Для т = 1 формула верна; предполагая ее верной для всех /и < я, в частности, полагая /*-ι = 2Λ—1, y^Ls=2,i~i — 1, из рекуррентного соотношения будем иметь /л=3/я.1-2/л.2 = 3(2«-1)-2(2^-1]> = 2^-1, чхо и требовалось*.
β] § 1. ОПРЕДЕЛИТЕЛИ 25 3) Специальный случай рекуррентных соотношений. Пусть рекуррентное соотношение имеет вид Α»=/>Αι-ι + ?Α*-4> где ρ и q — постоянные (т. е. не зависящие от п) числа. В этом случае можно вывести формулу для вычисления Dn ([20], стр. 33,' 34). Если 0=0, то Dn=pP~iDif где Dx—определитель первого порядка данного вида. Если ? ?£ 0, то решаем квадратное уравнение л^—рх— 0 = 0. Пусть α и β— его корни. Если α^β, то Dn = c1p.n-\-c$\ где С\ = с9=- α(«-β) > "*— М«-р) ' Dh D<n — определители первого и второго порядков данного вида. Выражения для сх и с* можно найти непосредственно из равенств D, = сга -|- с& Da = с,а9 + с$\ Если д?£0, но а = р, то Яя = ал[(я— 1)*ι+*Λ где *l = ^ И ** = —. Пример 4. Вычислить определитель Якоби (стр. 28) я-го порядка: 5 3 0 0 ... 0 2 5 3 0 0 2 5 3 0 0 0 0 ... 2 5 Рекуррентное соотношение: Уя=г5Уя_1 —6УЯ.». Решаем уравнение *2 — 5*+ 6=0. Его корни: a=2, β=3. Далее находим /ι уравнений 5, Л = 19. Поэтому для с ι и с2 имеем систему 2ci + 3cas=5, 4ci + dcs=19, откуда Ci=s—2, с8 = 3 и, значит, в а^*1—2^».
26 ГЛ. Ь ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [7 7. Определитель Вандермонда и связанные с ним определители;* 1) Определителем Вандермонда называется определитель вида Д.- 1 дг, х\ х\ ... л*-1 1 дг9 х\ х\ ... х%~1 \ Хп Х*п Хп ... Х*!ГХ Он вычисляется по формуле At = (*« — ^ΐ)(·^3 — ^ΐ)..·(^Λ — *l)(*8— ^9)(ДГ4 — Х$... • ··· (χη — χύ··Λχη—-^λ-ι)555 JI (χι — χμ) (см. [11], стр. 50 или [20], стр. 32). Пример 1. II 1 1 ... 1 £> = 12 3... п+1 1 2* 3» ... (л+1)* 1 2· 3» ... (л+1)* 1 2* Зл (п f 1)л Этот определитель получается транспонированием из определителя Вандермонда с определяющими элементами дг,==1, xs = 2,..., дгд+1«я + 1. Поэтому /> = (2—1)(3—1)··. [(л + D—Π Χ Х(3_2)(4 —2)...[(п+1) — 2]... [(n-h I) —л1= 1! 2! 3! ... п\. Пример 2. | ап α»—ι^ι α»—Щ ап а*-*Ъ% а»-Щ D = *? <#+! <£|-Л+1 <£|-Λ-μ ·.. ^л+1 Вынося за определитель из первой строки а", . из второй — а* и т. д., придем к определителю Вандермонда с определяющими эле·
η ментами bt § 1. ОПРЕДЕЛИТЕЛИ Поэтому 27 Jut'. βι ' α, ' ' α„+, 2) К определителю Вандермонда приводится определитель вида D = 1 Х\ х\ ... .Kf-1 *{Ч-1 1 Xf ^1 ... *£-! Xff* 1 и*-1 ,,Ρ+1 (К/></*-1). Если через sn„p обозначим сумму всевозможных произведений элементов хь д:^ ...» хп> взятых в количестве η — р% и через Dn определитель Вандермонда из тех же элементов, то D = $n.pDn([20]f задачи 344, 346). ПримерЗ. I! хх 1 х% 1 хп х\ .. х\ .. А . . *»-* ХП ~(*ι+ *· + ... + *Λ) JJ (Xi — Xk)· Здесь ρ—η— 1. 3) Обобщенным определителем Вандермонда называется определитель я** я;» ... а\п\ а;> ар ... а}» А." «я1 а? алл где а1у а*..., ял — положительные и alf а*..., ад — действительные числа. Этот определитель тогда и только тогда равен нулю, когда среди чисел at или среди чисел о^ имеются равные. Достаточно рассмотреть случай, когда 0<α1<α2<...<αΛ и α1<α2<...<αΛ. Для этого случая можно доказать, что Dn^>0 (см [7], стр. 93).
28 ГЛ. I. ОПРЕДЕЛИТЕЛЯ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [8 8. Якобиевы определители· Континуант и связь с числами Фибоначчи. О якобиевых матрицах см. гл. К, § 1, п. 13. Якобиевым определителем называется определитель вида at bt 0 0 ... О О | — с9 Оъ Ъ* 0 ... О О О — сг На Ъг ... О О О О О О О . . . αΛ_ι и.. · "■· с η P«-t Разлагая его по последней строке» найдем рекуррентное соотношение Jn « anJn_t -{- bn^tcnJn^. Можно доказать следующий закон составления развернутого выражения для Jn\ берется сумма всевозможных произведений, одно из которых есть аха%а^..лп, а другие получаются из него путем замены одной или нескольких пар соседних множителей ataM на btcM. Пример 1. Λ ■" й \а%аьа^а% -+■ btCia6aAa% -|- a\b%cbaka% -|- + ахагЪьс^а% -f аха%а%ЬАс% + Ь%егЬьс^а% + + b\C%abbiC% + atbiC6bAc%. Частным случаем якобиевого определителя является так называемый континуант (ага^г9 ... ая)= Его название объясняется связью с цепными дробями, выражаемой равенством «1 -1 0 0 0 1 «« — 1 0 0 0 1 в, 0 0 0... 0 0 0... 0 0 1 ... 0 0 0 ... β„_ι 1 0 ... — 1 аа (α,ο, ... в„) «г 1 о, 1 «.+ +il
91 § 1. ОПРЕДЕЛИТЕЛЯ 29 (см. [30], стр. 29 или [20]» задача 539). Он равен сумме про· изведения аха% ... ап и всевозможных произведений, полученных из него вычеркиванием пар соседних множителей (при четном η результат вычеркивания всех η сомножителей считается равным единице). Пример 2. (аха%аьа^) = а^а6аА -|- а%а^ -|- аха^ -f- аха^ -f-1; (ахага^а%)^ = аха%аьа^% + αζα^α% +■ βι<*4β· + йха%а% + аха%аь + α§ + β» + ах. в* Частный вид континуанта 1 1 — 1 1 0 —1 0 0 0 0 ... 0 1 0 ... 0 1 1 ... 0 0 0 ...— 1 0 1 0 0 1 равен /t-му числу так называемого ряда Фибоначчи 1, 2, 3, 5, о, 13, 21, ··· , в котором каждое число, начиная с третьего, равно сумме двух предшествующих чисел ([20], задача 365). О других определителях специального вида см. § 1, пп. 7, 12, 13, 14, а также [20] и [24]. 9· Миноры любого порядка» их алгебраические дополнения и теорема Лапласа. Минором k-го порядка в определителе D порядка η (1 ^k^n) называется определитель Ж, составленный из элементов,, стоящих на пересечении любых k строк и любых k столбцов определителя D. В частности, минор /1-го порядка в D равен самому D. Минор нулевого порядка по определению считается равным единице. Дополнительным минором для минора Μ в определителе D называется минор М\ полученный из D вычеркиванием тех k строк и k столбцов, в которых стоит данный минор М. Алгебраическим дополнением минора Μ в определителе D называется его дополнительный минор М\ взятый со знаком плюс, если сумма номеров строк и столбцов определителя Д в которых стоит исходный минор Ж, четна, и со знаком минус» если нечетна.
30 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [9 М = лг= Пример 1. В определителе D4 —l<*(/li для минора второго порядка 0*1 я** I дополнительным минором.будет я« α4ι Ι и алгебраическим дополнением А »(— 1)·ΛΓ β -—ЛГ. Теорема Лапласа. Пусть в определителе D порядка η выделены любые k строк (или столбцов) (l^k^n — 1). Тогда определитель D равен сумме произведений всех миноров А-го порядка, Стоящих в выделенных k строках (или столбцах), на их алгебраические дополнения (см. [11], стр. 51). Обобщение теоремы Лапласа на случай разложения по нескольким группам строк (или столбцов) см. в [20], задача 466. Пример 2. Вычислить определитель 2 1 D = 4 0 5 2 0 Здесь десять миноров второго порядка, стоящих во второй и пятой строках, но только три из них отличны от нуля. Разлагая по этим двум строкам, найдем D = (-l)10 + (-!)" 3 4 4 I 6 4 I 6 I 5 7 4 5 2 12 3 Ι ι 3 2 4 4 5 2 5 1 1 з 1 5 1 1 3 + (-1)" 3 5 4 7 = 2-49+1(— 100) + 2 (— 1) = — 4. В частности, если в определителе D главную диагональ покрывают две квадратные матрицы без общих элементов с определителями Dt и D* и по одну сторону от них все элементы равны нулю, то D=*DiD$.
10] § 1. ОПРЕДЕЛИТЕЛИ 31 риме ρ 3. 3 2 0 0 4 5 0 0 6 7 2 3 8 9 3 7 13 2 112 S ""I 4 5-Π 3 7 = 7.5 = 35. Более общим является случай так называемых ступенчатых определителей: если з определителе D на главной диагонали стоит цепочка квадратных матриц с определителями Α, Ό* ... t Dki а по одну сторону от этой цепочки все элементы равны нулю, то D = DtD^ ... Dfc. Пример 4. 12 0 0 0 0 4 0 0 0 0 2 3 0 0 0 0 6 2 5 4 0 0 2 7 4 5 0 0 13 2 6 7 3 7 15 3 4 1 7 3 4 1 = (- 2). 3-9. (-5)*= 270. 10. Разложение определителя по строке и столбцу. Окаймленные определители. Окаймленным определителем для определителя D= ян *!* <*т называется определитель А = «и аХп дг, ап1 ., ипп ^п У η * Любой определитель порядка п^>\ можно рассматривать как окаймленный относительно минора Мпп элемента, стоящего в правом нижнем углу. Разлагая Dt по последнему столбцу, а затем все полученные миноры, кроме минора для zy по
32 ГЛ. Т. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ (10 последней строке, получим разложение этого определителя по последнему столбцу и последней строке: где A i) — алгебраическое дополнение элемента ау в определителе D (см. [30], стр. 22 или [23], стр. 61). Если надо разложить определитель по любой строке и любому столбцу, то, переставляя данные строку и столбец со всеми последующими, приходят к рассмотренному случаю. Разложение по строке и столбцу удобно применять в случае, когда легко вычисляются алгебраические дополнения всех элементов определителя D. Пример 1. Вычислить определитель ах 0 ... 0 хх 0 аг ... 0 хг Здесь Dx = D = 0 0., Ух Уг- ах 0 О а% У η ..О ..О О О Aij=0 при 1ф], Ац — — . Поэтому ^.о^^аа' где 0 = ахаг 1-1 Ж) Рассмотрим окаймленный определитель а.\\ Ям ... а>\п Х\\ ... Х\р I 091 Я*9 · · · ОЪп *91 · · · Х%р Δ = УР\ JV*
10J § 1. ОПРЕДЕЛИТЕЛИ Разлагая этот определитель по теореме Лапласа по последним ρ столбцам, а затем (при п^р) каждый из дополнительных миноров порядка η по последним' ρ строкам, получим: 1) Если р^п, то Δ = ( — 1)ρΣΛι^ ... уЛ ...Jp Xhi±... ipYhU ...Jp, где Aцш... / ixj% ... / — алгебраическое дополнение минора Mixl% · · · у Λ г · · /P в определителе D = \au ft . •^/ιί ^/ι9 ··· «^/ιρ χ1*\ Х1*Ъ ··· «^/tP Ai '.<t KV» · Vе Λ= Λ/» JV, J4, и сумма берется по всем индексам ilf if,...,ip; .Д, 7*···» Jp> удовлетворяющим условиям и<Ь<...<1Р Λ<Λ<·..</, Такое же разложение имеет место при окаймлении опреде* лителя D с помощью первых ρ строк и первых ρ столбцов. 2) Если р^>п, то Δ = 0. Пример 2. = «1 ах 0 0 0 α* Ο 0 0 аь Уп Ун Уи Уи Уп У%ъ L Хи х*ъ 1 Хы Хъ* 1 Х\х \Хи Хы 0 0 У* Ум Хн X* χ*** 0 0 Ухь Ун =* + а* Хц Χι% Xjt Хьг + az Ι I χ χ У п У"\* Уы Уп I ιι Χι% Ι Ι Уп SI *S8 1 | У*1 Уи Ун
34 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [И 11. Умножение определителей. Теорема Бине —Коши. Произведением определителей \ А \ = \ atj |* и | В | = | Ьц \пх одного и того же порядка η называется определитель |С| = = | С/у |7 того же порядка, все элементы которого вычисляются по одной из следующих четырех формул: *) £// = βη*/ι+ <*/**/*+ ··· -Μ/λ*/λ» 2) си = апЬц Н-я/2*9у+ ... +«/Ayi 3) С/у = а,/*/1 + я4/*/3+ ... +anibJn; 4) ^y = «i/*iy + ^Ay+ ··· +ляЛу В случае 1) элемент сц получается как сумма произведений элементов i-й строки определителя |А | на соответствующие элементы у-й строки определителя \В\. Поэтому говорят, что в данном случае произведение получено умножением строк первого определителя на строки второго. Во втором случае — путем умножения строк на столбцы, в третьем — столбцов1 на строки и в четвертом — столбцов на столбцы. Значение определителя | С | одно и то же во всех четырех случаях, хотя элементы Сц различны: |С| = |Л |·|β|. Умножение определителей тесно связано с умножением матриц (см. стр. 67—68). Пример 1. Перемножая четырьмя способами определители -VI-* получим: 3) 2 1 4 3 5 01 7 2\ — 4 — 5 4 И 1-1 = 10, 2) 6 5 = 10, 7 13 4) —6 4 2 1 3 = 1°> = 10. Умножение определителей можно использовать для вычисления некоторых определителей специального вида. Пример 2. Вычислить определитель Х\ Х% с Хь X* — Х% Х\ X* —Хь — Х% —Xi X\ Х% — Х\ Х% —Х% Х\ Возводя его в квадрат путем умножения строк на строки, получим на главной диагонали'одно и то же выражение *|4*| + + *1 + «*?> а вне главной диагонали нули. Поэтому Z>£ ==(.*}-j-*i+ -j-Jti-h·**)4· TaK как Αν содержит произведение по главной диаго- Dx =
Π] § 1. ОПРЕДЕЛИТЕЛИ 35 нали, равное х\> то из обеих частей последнего равенства можно извлечь корень со знаком плюс, откуда Dx = (xl-\-xl + xl-\-xiy. Пример 3. Вычислить определитель £> = И-1 Sn $д+1 .., Stn_2 где δΛ=χ* + Λ:*+ .·. +·*£ (* = 0, 1, 2, ....) — так называемые степенные суммы переменных хи *ь ... хп (в частности, «ο — Ό- Умножая сам на себя определитель Вандермонда So St Si St $2 Si S*. $a s4 ... $Λ-ι ... $Л ··· Sn+i va= 1 д^1 д^ ... Χχ 1 Д^2 «^2 **. Х% * *л «*л ··· *л путем умножения столбцов на столбцы и применяя выражение для* определителя Вандермонда, данное на стр. 26, получим Теорема Бине — Кош и. Пусть даны две прямоугольные матрицы А- В= <bpi bpi \ар\ ар* ·,·· **рп' \νρ\ "ρ* ··· vpn* одинаковых размеров /> X п. Умножая строки А на строки В, составим /Р чисел *// = */ι*/ι + *ί**/9 + ··· +ainbjn ft 7=1, % ..., ρ) и рассмотрим определитель D = \ctj\^ порядка ρ из этих чисел. Тогда: 1) Если р<,п, то АО,г,...ув(<,г,.../Рх
36 ГЛ. Ь ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [12 где A (hi* ...ip) и 5(/|/3.л lp) — миноры порядка ρ coot* ветственно матриц А и В, составленные из столбцов с номерами 2], i* . ·., ίρ. 2) Если />>л, то D = 0 (см. [6], стр. 17). Правило умножения определителей является частным случаем теоремы Бине — Коши при р=п. Пример 4. Применяя теорему Бине — Коши к матрицам /at а2 ... αΛ\ 1сх с, ... сп \ U *»·.. Ьп) U d*...dn)' получим равенство | ахсх + а%сг + ... + апсп axdx + a%d% + ... + andn I __ Mi + Mb + ··· + Ксп bxdx -(- bid% -(- ... + bndn \ «ι 4 - ι dt dk 12. Циркулянты и связанные с ними определители. Циркулянтом (или циклическим определителем) называется каждый из двух следующих определителей: аг йъ αζ ... αΛ_, ап >·Η /У.* ЯЛ-1 ап а1 а<ь (1$ а^ Ι #ι α9 Дз « #з α8 α4 · м аг α4 αΒ Ι «Λ α, я* ... αΛ_8 «я-2 ... αη α, ·· <*«-! ΛΛ .. αΛ α, .. CL\ <h \ ... αΛ_9 αΛ_ι | Для первого из них имеет место выражение где 2π£ , . . 2πΛ efe=COS —- -{-I Sin A = 0, 1, 2, ..., Λ—1, все значения УТ (см. [30], стр. 36 или [20J, задача 479). η · η
12J § 1. ОПРЕДЕЛИТЕЛИ Ρ Изменением порядка строк с номерами % 3, ..., η определителя Dn на обратный получается выражение для второго определителя: Пример. Вычислить определитель Аг £> = Здесь 1 α ά ап~1 1 а „Λ-2 аП-Х I α» ... 1 f(x)=\+ax + a*x* + ... +a"-*x*-> =^=Йг Пусть сначала а^ЬО и ап^/Ь\. Так как е£=1, / = 0,1,2,..., я — 1, то D-/W/C) »»/('^-(1-^(1(.!.^.(ι,^) · Для упрощения знаменателя в равенстве ** J 1 -в(χ — в0)(х — βι) ...(* — еЛв1) положим # = —. Получим ?-,в(т—•'Кт—») ♦· ·(т—-?) или, умножая на ant найдем 1— αΛ=(1 — α·0)(1— <»ι) ... (1 — α«Λ_ι). Иначе это можно доказать, раскрывая скобки в правой части и применяя формулы Виета для хп—1. Следовательно, Эта формула верна также при α as 0, так как обе ее части обращаются в единицу, и при аЛ«=1, так как при этом условии, умножая вторую строку D на а, получим строку, совпадающую с первой, и потому D=»0. Косим циркулянтом называется определитель вида «1 — «п — «я-1 1 —в» в, «1 —в» —в, в8 ..· в» в» ··· в»-1 «ι ·♦· в»-в -г-а4 ... at
38 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [13 Для него имеет место выражение 2»=/(%)/Ы/'(Ъ) .../(η„-,), где Дх) = а1 + а&+алх* + ... -f a„*»-» 1=со,Щ}11 + 1$1а0Ш11, k = 0t 1,2 „_l, — все значения корня /— 1 (см. [20], задача 493). Как циркулянт, так и косой циркулянт являются частными видами определителя ах я* anz ах *пгЛ* ап* аь ··· яя <h ··· λλ^ι a, ... αΛ_9 =/K)/(oti)/W.../(a/l.1)> ι a^ a$z a^z ... #) где ζ ass r (cos φ + i sin φ) — любое комплексное. число и «ft=^(cos£±^ + isini±^L), *=0,1,2 я-1, — все значения корня, -/ζ (см. [20], задача 494). Выражения для различных циркулянтов частного вида даны в [20], за* дачи 375, 376, 484—492, 495. 13· Взаимные (или присоединенные) и ассоциированные определители* их миноры и формула Сильвестра· Твердо установившихся обозначений и терминологии здесь не существует. Взаимным (или присоединенным) определителем для определителя D=|aiy|? порядка п~^1 называется определитель D=\ йц |f, где ά1β = Αυ (Ζ, j = 1, 2, ..., n\ т. е. определитель, полученный из данного определителя D путем замены его элементов на их алгебраические дополнения (с сохранением их расположения). Значения данного и взаимного определителей связаны равенством D=D',~1, где η — порядок D в Д (см. [20], задача 506). В частности, если /7=0, то и Д—О* и обратно.
13] § l ОПРЕДЕЛИТЕЛИ 3d Миноры данного и взаимного определителей связаны так: пусть Μ — минор порядка ρ определителя Ό порядка п, А — алгебраическое дополнение минора Му Ж*—минор взаимного определителя Д соответствующий минору'Ж, т. е. стоящий в тех же строках и столбцах, что и М. Тогда M=Dp'lA (см. [3], стр. 37). Обозначая через А алгебраическое дополнение минора Μ и применяя последнее равенство с заменой ρ йа η — р} получим Л = /)Д-^1Ж. Если Μ — минор второго порядка, стоящий в /-й и у-й строках и А-м и /-м столбцах определителя Д и Μ — допол- нительный минор, полученный из определителя D вычеркиванием указанных строк и столбцов, то АА1кААЦ\ = {-\Г^ОМ\ AJk An I где A si — алгебраическое дополнение элемента ast (см. [20], задача 508 или [3], стр. 39). Из последнего равенства вытекает, что если данный опре* делитель' D равен нулю» то все миноры второго порядка взаимного определителя D равны нулю, т. е. любые две строки (или два столбца) определителя D пропорциональны. Обозначая через Mi} минор и через Ац алгебраическое дополнение элемента ац взаимного определителя D, получим ^y = (-l)<+'D»-*a<y или A v = D"-\j (см. [3], стр. 39). Это равенство позволяет по элементам взаимного опреде* лителя D (или по минорам определителя D) найти элементы самого определителя D (см. [20], задача 512). Ассоциированным определителем для определителя D = = I aij I? (п ^ 2) называется определитель D = | а^ | J, где ау = Му (/, У=1, 2, ..., я), т. е. определитель, полученный из данного определителя D путем замены его элементов на их миноры. Его свойства похожи на свойства взаимного определителя D и могут быть выведены из последних. Именно:
40 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [13 D=D = Dn~i. Если Μ — минор порядка ρ определителя Д М' — дополнительный минор для Μ и Μ — минор ассоциированного с D определителя Ь, стоящий в тех же строках и столбцах, что и минор Mf то M = DP~XM' (см. [7], стр. 19). Понятия взаимного и ассоциированного определителей можно обобщить, беря определители, составленные из миноров любого порядка k определителя D или из их алгебраических дополнений. Пусть D — определитель порядка п^2 иА равно одному из чисел 1, 2, ..., п. Пусть N—Ck — п! Все сочетания по k чисел из 1, 2, ..., η занумеруем в про* извольном (но в дальнейшем фиксированном) порядке: sh $2, · · ·» sat. Пусть μ^ — минор порядка А, стоящий в строках определителя Д номера которых составляют сочетание sit и в столбцах, номера которых составляют сочетание $р o.i} — алгебраическое дополнение минора μ^ β Ζλ Тогда k-м ассоциированным определителем для определителя D называется определитель £)Λ = |μ^|^. k-м взаимным (или k-м присоединенным) для определи* теля D называется определитель бъ = \ ay |^. Dk и bk имеют порядок N=C%. Эти определители обладают следующими свойствами (см. [20]» задача 551): 1) значения определителей Dk и Dk не зависят от выбора нумерации .сочетаний из чисел 1, 2, ..., η по k\ 2) Dk = Dn_k; 3) DkDk = DN=DC"\ 4) Dk=DC"~H 5) Dk=Dck»-K Теорема Сильвестра. Пусть D=\atj\* — определитель порядка η^2, Μ=\α^\ξ — его минор порядка p(l^p<Cri), стоящий в левом верхнем углу, Ъц — минор, полученный путем приписывания к минору Μ снизу t-й строки и справа у-го столбца определителя D (i, j=p-\-1»
14] § 1. ОПРЕДЕЛИТЕЛИ 41 /j+ 2,..., n)t δ_|£^|/ι^ — определитель порядка η — ρ из всех элементов Ьц. Тогда имеет место формула Сильвестра b = Mn-p-1D (см. [7], стр. 21). 14. Симметрические» кососимметрические и псевдосимметрические определители. Определитель D = \aiJ\Tl называется симметрическим, кососимметрическим или псевдо- симметрическиМ) если его элементы связаны соответственно условиями: 1) ai} = a)b i, у=1, 2,..., п\ 2) *ij = — aih *>У=Ь 2»···, Щ 3) aif = — aJh ί, у=1,2,..., /г, l^j. Главные миноры (т. е. миноры, лежащие симметрично относительно главной диагонали, иными словами, лежащие в строках и столбцах с одинаковыми номерами) определителя одного из трех указанных типов сами имеют тот же тип. В симметрическом определителе элементы а1} и а)Ь лежащие симметрично относительно главной диагонали, имеют равные миноры и равные алгебраические дополнения: Иными словами, для симметрического определителя D взаимный определитель D (стр. 38) и ассоциированный определитель D (стр. 39) также будут симметрическими. То же верно и для £-го взаимного и /е-го ассоциированного определителей 4 и<£>* (стр. 40). Если D — кососимметрический определитель порядка /г, то взаимный определитель Ζ) и ассоциированный определитель D будут симметрическими, если η нечетно, и кососим- метрическими, если η четно, и, вообще, Λ-й взаимный определитель Ьн будет симметрическим, если разность η — k четна, и кососимметрическим, если нечетна, a Λ-й ассоциированный определитель Dk будет симметрическим, если k четно, и кососимметрическим, если k нечетно. Кососимметрический определитель нечетного порядка равен нулю (см. 1Щ, стр. 43).
42 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [14 Кососимметрический определитель четного порядка η равен квадрату некоторого однородного многочлена степени л/2 от его элементов (см. [30], стр. 45 или [20], задача 543). Ввиду условий aif = — a}i этот многочлен можно выразить лишь через элементы определителя, лежащие выше главной диагонали. Тогда он будет определен однозначно с точностью до знака и называется пфаффовым агрегатом или пфаф* фианом. О точном определении пфаффова агрегата см. [10], стр. 147—156 или [20], задача 545. Пусть Dn = | ai} |f — кососимметрический определитель четного порядка η и рп — соответствующий ему пфаффов агрегат, так что /)я=/£. Обозначим через ры пфаффов агрегат кососимметрического определителя Din> полученного из определителя Dn вычеркиванием я-й и i-й строк, а также я-го и /-го столбцов. Тогда имеет место рекуррентная формула: Λ=<*ι* Αι=2 (-1)ΜΛΛ« (я^4) (см. [20], задача 546). Пример 1. />8 = alg. Поэтому ри=ais, />24=ап; ри=alt и по рекуррентной формуле Pi =/>14<*14 —Pu<*U + />24024 = 022014 — 012024 + 012024* Далее, Ръ ==/>ιβ0ιβ —Рм<*м + Рьа^ьо —Piodio + Рьо<*ьо = = 024028010 024088010 + 028048010 — 084018020 + + #14026020 012046020 + 024018020 014028020 + + 012048020 — 022018040 + 018028040 012088040 + 022014080 — #12024080 + 012024086* Из рекуррентной формулы ясно, что,число слагаемых пфаффова агрегата/>„ равно произведению 1·3·5... (η—1) (л —число четное). Псевдосимметрический определитель, у которого все элементы главной диагонали равны между собой, равен сумме квадратов некоторых многочленов от его элементов, если он четного порядка, и сумме указанного вида, умноженной на элемент главной диагонали, если он нечетного порядка (см. [30], стр. 46).
16) § 1. ОПРЕДЕЛИТЕЛИ Пример 2. χ г q — г χ ρ — q —ρ χ χ a be — α χ τ q —b — г χ ρ —e —q ~ρ χ =x(x*+p* + q* + r*); =x* + (0* + Ъ* + с* +/>* + tf + гв)лг* + + (ар — bq + cr)*. 16. Кронекеровское произведение определителей· О кро- некеровхком произведении матриц см. стр. 120—122. Кронекеровским или прямим произведением двух определителей \А\ = \аи |f порядка л. и |B| = |fy|p порядка ρ называется определитель порядка пр, матрица которого строится по матрицам А и В данных определителей одним из следующих двух способов: 1) эта матрица состоит из р* клеток, расположенных в ρ строк и ρ столбцов, причем клетка в i-й клеточной строке и /-м клеточном столбце получается из матрицы А умножением всех ее элементов на число Ъф или 2) эта матрица состоит из л9 клеток, расположенных в η строк и η столбцов, причем клетка в i-й клеточной строке и /-М клеточном столбце получается из матрицы В умножением всех ее элементов на число а/у. В первом случае произведение называется левым, а во втором — правым. В обоих случаях кронекеровское произведение имеет одно и то же значение | А \р \ В |я. Пример. Левое произведение определителей |Л| = an ахг ахь 081 028 028 081 #88 088 "»*4fcfcl имеет вид 011^11 018^11 021&11 082^11 081&М 082^11 011^81 * 018^81 02I&8I 082^81 081^21 088^81 018^11 011^18 018^18 018^12 028^11 021^12 " 022^12 028^12 088^11 081^18 082^18 088^18 018^81 011^28 012^22 018^88 088^81 021^28 028^88 088^88 088&81 081^88 088^28 088^88 = \А\*\В\К 16. Неравенство Адамара и другие неравенства, связанные с определителями. Пусть А=(ац)*— квадратная действительная матрица. Для ее определителя имеет место
44 ГЛ. Т. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [16 следующее неравенство Адамара: Если | А | Φ О, то неравенство Адамара обращается в равенство тогда и только тогда, когда строки матрицы А попарно ортогональны, т. е. когда выполняются равенства я (см. [7], стр. 51). Неравенство Адамара имеет следующий геометрический смысл. Если элементы строк матрицы А считать координатами векторов /2-мерного евклидова пространства ([ 11 ], стр. 211 —212) в ортонормированной базе, то определитель | А | с точностью до знака равен объему n-мерного параллелепипеда, построенного на этих векторах, как на ребрах. Неравенство Адамара означает, что объем параллелепипеда не превосходит произведения длин его ребер, выходящих из одной вершины, и равен этому произведению тогда, и только тогда, когда ребра попарно ортогональны. Назовем квадратную действительную матрицу А положительно определенной, если все ее миноры, стоящие в левом верхнем углу, положительны,.т. е. если квадратичная форма с матрицей А положительно определенна. Для такой матрицы неравенство Адамара можно записать в другом виде. Вторая форма неравенства Адамара. Если А = (аи)* — положительно определенная матрица, то |Λ|<αηαΜ... annt причем знак равенства имеет место тогда и только тогда, когда матрица А диагональна, т. е. когда а^ = 0; 1ф}\ *,/=1, 2,..., η ([7], стр. 48). Определитель, составленный из элементов матрицы А, стоящих на пересечении k строк с номерами 1и 2*,..., lk и А столбцов с номерами jlt у*,..., /*, называется минором k-zo порядка матрицы А и обозначается через
16] § 1. ОПРЕДЕЛИТЕЛИ 45 Обобщенное неравенство Адамара. Если А = =(αί/)? — положительно определенная матрица и ρ — натуральное число (Х^р^п—I), то ι*ι·4ί ϊ:::£Κΐ!:::ί)· <"..> причем знак равенства имеет место тогда и только тогда, когда aiJ = aJi = 0; 1=1, 2,..., p; j = p-\- 1,... ,я (см. [7], стр. 50). Если использовать умножение прямоугольных матриц (стр. 67—68) и через Л' обозначить транспонированную матрицу Л, то обобщенное неравенство Адамара можно записать в следующей матричной форме. Пусть А=(В, Q — квадратная вещественная матрица, где В — матрица из первых р, С — матрица из последних η — ρ столбцов матрицы А(\ ^р^п— 1)., Тогда \А'А\^\&В\-\СС\. Если ffC= 0, то имеет место знак равенства. Если | А \ Φ О, то, обратно, b случае знака равенства получаем θΌ=0 (роль матрицы А в (1.1) теперь выполняет матрица А'А). В этой форме неравенство допускает следующие обобщения. Пусть А = (В, С) — вещественная прямоугольная матрица, причем β и С — матрицы соответственно из нескольких первых столбцов и остальных столбцов матрицы Л. Тогда \А'А\^\&В\\СС\. Если BfC=0, то имеет место знак равенства. Если столбцы матрицы А (как векторы) линейно независимы ([34], стр. 56—71), то, обратно, в случае знака равенства получаем Б*С = 0 ([20], задача 922 или [24], задача 518). Аналогичное неравенство верно и для матрицы с комплексными элементами. Обозначим через Л* матрицу, полученную из матрицы Л путем транспонирования и замены всех элементов числами, комплексно сопряженными. Пусть Л = = (В9 С) — прямоугольная комплексная матрица, где β и С — матрицы соответственно из первых и остальных столбцов матрицы Л. Тогда определители |Л*Л|, \В*В\, |С*С|
46 ГЛ. Т. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [1 будут неотрицательными действительными числами, причем |Л*Л|<|Я*Я||С*С|. Если 5*С=0, то имеет место знак равенства. Если столбцы матрицы А линейно независимы, то, обратно, из справедливости знака равенства следует 5*С=0 ([20], задача 925 или [24], задача 521). Приведем еще две оценки величины определителя. Если все элементы определителя D = \atj\* порядка η по модулю не превосходят положительное число М, то для модуля этого определителя выполняется оценка | D | ^ ΛΡγιΡ9 причем эта оценка является точной ([24], задачи 522, 524 или [20], задача 926). Если все элементы определителя D = \aij\tl действительны и удовлетворяют условиям 0^аи^М, то (см. [24], задача 523). § 2. Системы линейных уравнений 1· Общие сведения. Система линейных уравнений имеет вид Ям*1 + <^9 + ... + ^Л*Л = ** Здесь хи хъ...у'хп — неизвестные, а коэффициенты при неизвестных Uij и свободные члены Ь{ — числа из данного числового поля К (см. введение). Решением системы уравнений (1.2) называется упорядоченная система чисел «ι, α*..., &п> (1.3) (1.2)
2] ~§ 2. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 47 удовлетворяющая всем уравнениям данной системе, т. е. обращающая при замене неизвестных на соответствующие числа все уравнения^ верные равенства. Числа (1.3) называются значениями неизвестных хи *2>···> хп в данном решении. Система линейных уравнений называется совместной, если она имеет хотя бы одно решение, и несовместной (ът, противоречивой), если она не имеет решений. Совместная система называется определенной, если она имеет единственное решение, и неопределённой, если более одного решения. Неопределенная система линейных уравнений всегда имеет бесконечное множество решений. Две системы линейных уравнений называются эквивалентными (или равносильными), если каждое решение первой системы является решением второй, и обратно. Любые несовместные системы линейных уравнений с одинаковым числом неизвестных считаются эквивалентными. Для того чтобы две совместные системы линейных уравнений с одинаковым числом неизвестных были эквивалентны, необходимо и достаточно, чтобы каждое уравнение первой системы было линейной комбинацией уравнений второй системы, и обратно. ι Если каждое решение первой системы линейных уравнений является решением второй (но не обязательно наоборот), то вторая система -называется следствием первой. Любая система линейных уравнений считается следствием несовместной системы. Если каждое уравнение второй системы является линейной комбинацией уравнений первой системы, то вторая сиетема будет следствием первой. Если первая система совместна и вторая система является следствием первой, то каждое уравнение второй системы будет линейной комбинацией Уравнений первой системы. 2. Метод Гаусса исключения неизвестных. Элементарными преобразованиями системы линейных уравнений называются преобразования следующих *грех типов: 1) перестановка двух уравнений; 2) умножение обеих частей одного из уравнений на любое число, отличное от нуля; / 3) прибавление к обеим частям одного уравнения соответствующих частей другого, умноженных на любое число. Элементарные преобразования переводят данную систему уравнений в эквивалентную систему.
48 ГЛ. lv ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [2 Системой ступенчатого вида (или ступенчатой систе· мой) называется система вида aU Ь\Х*\ + α1, *ι +1**1 +1 + · · · + αίηχη = К ar% krxkr + ar, *,+!-**,+1 + · · · + arnxn = bn 0 = 1, 0 = 0, 0 = 0, где l^kt<^ki<^...<^kr^n и aitki^09 i = l, 2,..., r. Здесь через 0=1 и 0 = 0 обозначены уравнения, в которых коэффициенты при всех неизвестных равны нулю. При этом уравнения вида 0 = 1 и 0 = 0 могут и отсутствовать, но уравнение вида 0=1 входит не более одного раза. Пример 1. Система λγι+2λ·8 + ** — *ь+ лгв + 3лг7 = 5, Xt—Хъ -|г х% ■— лг 7=г 2, SXi -f- ** — дгв -f- дг 7 ^ 1» *6 +2*0 + 3*7 = 0, 0=1, 0 = 0 имеет ступенчатый вид. Любую систему линейных уравнений при помощи конечного числа элементарных преобразований можно привести к ступенчатому виду: Этим решение любой системы сводится к решению системы ступенчатого вида. Уравнения ступенчатой системы вида 0 = 0 можно отбросить, так как это приводит к системе уравнений, эквивалентной прежней. Ступенчатая система тГогда и только тогда совместна, когда она не содержит уравнения вида 0=1. Неизвестные xk , xk ,..., xkr, начинающие уравнения ступенчатой системы, называются главными, а остальные неизвестные— свободными. _ Решение совместной системы ступенчатого вида находят так: отбрасывают уравнения вида 0 = 0, затем из последнего уравнения находят выражение последнего главного неизве-
2] § 2. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 49 стного через свободные и подставляют это выражение во все предыдущие уравнения; в последнем из полученных уравнений снова находят выражение главного неизвестного через свободные и т. д. Полученные выражения главных неизвестных через свободные называются общим решением системы уравнений. Подставляя в общее решение вместо свободных неизвестных произвольные числа, найдем вполне определенные значения главных неизвестных. Ступенчатая система, содержащая свободные неизвестные и не содержащая уравнений вида 0=1, имеет бесконечное множество решений. Если же ступенчатая система не содержит свободных неизвестных и не содержит уравнений вида 0 = 1, то она имеет единственное решение. Ступенчатая система называется треугольной, если она не содержит уравнений, в которых коэффициенты при всех неизвестных равны нулю, и если число уравнений равно числу неизвестных. Система линейных уравнений тогда и только тогда имеет единственное решение, когда путем элементарных преобразований и отбрасывания уравнений вида 0 = 0 она приводится к треугольному виду. Практически удобнее приводить к ступенчатому виду не саму систему уравнений, а матрицу из коэффициентов при неизвестных и свободных членов, соединяя последовательно получающиеся матрицы знаком эквивалентности <-^. Пример 2. Решить систему уравнений Xi+ х* +2*4 + 3*8= 5, 2*ι + 4*2 — Хь + 5*4 + 4*в = — 1, *ι + 3*8 . +5*4 + 2*в=—3, 3*ι + 7*а—3*$ + 9*4 + 2*в = — 14, 2*1+8*8— 4*$ + 2*4 + 7*в= —Ю. Преобразуем матрицу Л 1 0 2 3 2 4—154 13 0 5 2 .3 7—392 \2 8 —4 2 7 (первую строку, умноженную соответственно на 2, 1, 3, 2, вычитаем из остальных) /11 0 2 31 Ό 2 —1 1 —2| 0 2 0 3—1 0 4—3 3 —7| \q 6—4—2 I
50 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [2 (вторую строку, умноженную соответственно на 1, 2, 3, вычитаем из следующих) 0 •I 1 -1 •1 2 1 2 I -5 (третью строку прибавляем к следующим) /110 2 3 'О 2 —I I —2 0 0 12 1 ,0 0 0 3 —2 \0 0 0—3 8 1 (четвертую строку прибавляем к пятой) Система уравнений привелась к треугольному виду *ι+ х% +2*| + 3*» = 5, 2лга—*$4- *it2*§=s — И, *s + 2*4+ *» = 3, Злг,— 2**=— 4, 6лг*=12. Она имеет единственное решение. Из последнего уравнения находим х* = 2; подставляем это значение хъ в предыдущее уравнение и находим из него *i = 0; подставляем эти значения дг< н хь в третье уравнение и находим x8=l; так же находим л* =—3, ^1 = 2, Пример 3. Решить систему уравнений 2*1— л* — *$+ 3*4=1, 4^ — 2лг8 — *» + х* = Ь, 6λγι —Злг8— *» — λγι = 9, 2λγι— *8 + 2*s—-12*4 — 10. Преобразуем матрицу ,2 —1—1 3 1 1\ /4 —2—1 1 5*1 16 —3 — 1 — 1 9)^ \2 — I 2 —12 10/
21 § 2. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 51 (первую строку, умноженную соответственно на %, 3, 1, вычитаем из следующих) /2 2—1—1 3 О 1—5 О 2—10 0 0 3—15 (вторую строку, следующих) умноженную /2 - ^1° ~ 0 \0 соответственно -1 0 0 0 — 1 • ι 0 0 з ι —5 0 0 на 2t 3t вычитаем из Система привелась к ступенчатой, которая после отбрасывания двух уравнений вида 0 = 0 превращается в следующую: 2*ι — *8 — *» +3*4=1, дг» — 5*4 = 3. Неизвестные х* и *$—главные, а *а и х4 — свободные. Система неопределенна. Из второго уравнения найдем выражение *$ через xt; подставив его в первое уравнение, найдем выражение *ι через х% и **. Общее решение имеет вид *i«=y** + *4 + 2, λγ, «5*4 + 3. Полагая в общем решении, например, х%% одно из решений: *2, *4=s — 1, найдем *ι**2, *а=*2, *$=Γ—2, *4=χ— 1, которое в отличие от общего решения называется частным решением данной системы уравнений. Пример 4. Решить систему уравнений 2*ι + 3*$+5*$ + *4 = 3, 3*1 + 4*8 + 2*$ + 3*4 s= — % *ι + 2*8 + 8*s — *4 = 8f 7*1 + 9*8+ *8 + 8*4=0. Преобразуем матрицу 2 3 5 3 4 2 1 2 8 7 9 1 1 . 3 -1 8 3 — 2 8 0
52 ГЛ. Т. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [3 (меняем местами- первую н третью строки и новую первую строку, умноженную соответственно на 3, 2, 7, вычитаем из остальных) 1 0 0 0 2 8 — 2 —22 — 1 —11 — 5 —55 — 1 6 3 15 8 — 26 —13 -56 (делим вторую строку на —2 и, умножив ее соответственно на 1 и 5, прибавляем к следующим) 1 2 8 0 1 11 0 0 0 0 0 0 1М на 9 и ' 1 2 8 0 1 11 0 0 0 ,0 0 0 -1 -3 0 0 | персст — 1 — 3 0 0 8 13 0 9 авля 1 8 13 1 0 Система прнвелась к ступенчатому виду, содержащему уравнение вида 0= 1, н потому несовместна. 3. Правило Крамера. Если дана система уравнений λιι*ι+··· + λιλ·*λ —*i» i=l» ... , я (т. е. число уравнений равно числу неизвестных) и определитель этой системы 4f=s|a;j|f ?£09 то система имеет единственное решение, которое находится по формулам Крамера xf= -J, j=\9 ... , η, где определитель df получен из определителя системы d заменой /-го столбца на столбец из свободных членов. Пример 1. Решить систему уравнений Xi— 2дга=1, 3*1— 4л* = 7. Определитель системы I 3 —4 J
3] § 2. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ S3 Поэтому можно применить правило Крамера. Находим Отсюда d\ е di 0 * ι = -τ = О» *2 = -т = А В случае, когда определитель d из коэффициентов при неизвестных равен нулю, правило Крамера неприменимо. Из общей теории линейных уравнений (п. 6) следует, что такая система будет либо неопределенной, либо противоречивой. Пример 2. Решить систему уравнений *1 + *2 + *8=1, *i + 2*a + 2*8 = 2, 2λγι + 3λγ2 + 3λγ8 = 3. Здесь d = di=d2 = dt = Ot так как третья строка равна сумме первых двух. Система приводится к ступенчатому виду *1+*2+*8=1, ** + *» = 1» 0 = 0 и неопределенна. Пример 3. Решить систему уравнений Xt+ х*+ **=1, 2*1 + 2*2 + 2*8=1, 3*1 + 3*2 + 3*8 = 2. Здесь снова d = di = d2 = dB=zOt так как третья строка равна сумме первых двух. Система приводится к ступенчатому виду *1+*2 + *8=1, 0=1, 0=0 и противоречива. Если определитель d из коэффициентов при неизвестных равен нулю, а хотя бы один из определителей, стоящих в числителях формул Крамера, отличен от нуля, то система несовместна.
54 ГЛ. ί. ОПРЕДЕЛИТЕЛИ П СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [4 4. Ранг матрицы. Рассмотрим прямоугольную матрицу из s строк и η столбцов (см. введение). Рангом системы строк (соответственно столбцов) мат· рицы А называется наибольшее число линейно независимых (§ 1, nt 3) среди них. Оказывается, что ранг системы строк матрицы равен рангу системы ее столбцов. Это число называется рангом матрицы. При транспонировании матрицы (стр. 18) ранг ее не изменяется. Элементарными преобразованиями матрицы А называются следующие преобразования: 1) перестановка двух любых строк, 2) умножение строки на число с, отличное от нуля, 3) прибавление к одной строке другой строки, умноженной на любое число, и аналогичные преобразования столбцов. Две матрицы называются эквивалентными, если от одной из них к другой можно перейти путем конечного числа эле· ментарных преобразований. При элементарных преобразованиях матрицы ее ранг не изменяется, иными словами, ранги эквивалентных матриц равны. Ступенчатой матрицей называется матрица, обладающая тем свойством, что если в какой-либо из ее строк первый отличный от «уля элемент стоит на А-м месте, то во всех следующих строках на первых k местах стоят нули, например: 2 13 2 6 0 0 10 3 0 0 0 2 7 0 0 0 0 0 Любая .матрица при помощи элементарных преобразований только строк приводится к ступенчатой. Ранг ступенчатой матрицы* равен числу ее ненулевых строк*
4] § 2. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 55 Канонической матрицей называется матрица, у которой в начале главной диагонали стоят подряд несколько единиц (число которых может равняться нулю), а все остальные элементы равны нулю, например: Люб^ю матрицу при помощи элементарных преобразований (как строк, так и столбцов) можно привести к канонической. Ранг канонической матрицы равен числу единиц на ее главной диагонали. Простейший метод вычисления ранга матрицы с число· выми элементами состоит в приведении ее элементарными преобразованиями к ступенчатой или канонической матрице. Пример 1. Найти ранг матрицы 2 3 5—3 — 2 13 4 3 —1 —» I. \ 5 6 —1 3—5/ При помощи элементарных преобразований приводим эту матрицу к ступенчатому виду, соединяя соседние матрицы знаком эквивалентности ~. Из второй строки вычтем первую и переставим эти строки: 1 ι _2 2—1 (1 1 — I 2 — 1 V 2 3 5 —3 —2 )~ 5 6—1 3 —5 / (из второй и третьей строк вычтем первую, умноженную соответственно на 2 и 5) ,1 ι _2 2» —1 ч '[О 1 9—7 О |~ \0 1 9—7 О/ (из третьей строки вычтем вторую) /11—2 2 — 1 ν >1 0 1 9—7 О I. \ О О 0 0 0 / Ранг матрицы равен двум. Последнюю матрицу легко привести к канонической. Вычитая первый столбец, умноженный на подходящие
56 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [4 числа, из следующих, обратим в нуль все элементы первой строки» кроме первого, причем элементы остальных строк не изменятся. Затем, вычитая второй столбец, умноженный на подходящие числа, из следующих, обратим в нуль все. элементы второй строки, кроме второго, и прлучим каноническую матрицу 1 0 0 0 0 \ О 1 0 0 0 ]. 0 0 0 0 0/ Другой метод вычисления ранга матрицы связан с вычислением определителей. Теорема о ранге матрицы. Если матрица имеет минор порядка г (см. стр. 44), отличный от нуля, для которого все содержащие его миноры порядка г—|— 1 (окаймляющие миноры) равны нулю, то ранг этой матрицы равен г. Из этой теоремы следует, что ранг матрицы (не все элементы которой равны нулю) равен наивысшему порядку отличных от нуля миноров этой матрицы. Вычисление ранга матрицы с помощью метода окаймления* надо вести от низших порядков к высшим. Сначала ищем минор первого порядка (т. е. элемент матрицы) или сразу второго порядка, отличный от нуля. Затем вычисляем окаймляющие его миноры следующего порядка, пока не найдем среди них отличного от нуля. Переходим к вычислению миноров, окаймляющих этот последний, и т. д., пока не найдем минор порядка г, отличный От нуля, для которого либо все окаймляющие его миноры порядка г+1 равны нулю, либо таких миноров вообще не будет (если матрица содержит г строк или г столбцов). Тогда ранг матрицы равен г. * Π ρ и м е ρ 2. Найти ранг матрицы 1 —2 3 — 2 4 \ 2—4 5 1 7 ). 1—2 1 8 2/ Минор первого порядка в левом верхнем углу равен 1^*0. Окаймляющий его минор второго порядка равен нулю: Добавляя вторую строку и третий столбец, получим окаймляющий минор 2 5 "^
4] §.2. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 57 Вычисляем окаймляющие его миноры третьего порядка. Второй столбец можно не добавлять» так как он пропорционален первому, и получится минор, равный нулю. Добавляя третью строку и либо четвертый, либо пятый столбец, получим миноры и 1 2 1 3 5 1 4 7 2 равные нулю; значит, ранг матрицы равен двум. Ранг суммы и произведения двух матриц. Сложение и умножение матриц определены в гл. И, § 1, п. 1. Ранг суммы двух (или нескольких) матриц не больше суммы их рангов ([20], задача 626). Любую матрицу ранга г можно представить в виде суммы г матриц ранга 1, но нельзя представить в виде суммы менее чем г таких матриц ([20], задача 627). Любую матрицу С ранга г можно представить в виде „произведения С=АВУ где Л состоит из г линейно независимых столбцов и В — из г линейно независимых строк ([20], задача 939). Если обозначим ранг матрицы А через гА, то для ранга произведения АВ двух квадратных матриц А и В порядка η имеет место Неравенство Сильвестра: га +гв— η^Гав<min(/Vb rB) [(6), стр. 61 или [20], задача 931). Такое же неравенство остается верным и для произведения прямоугольных матриц при условии, что η обозначает число столбцов матрицы А и число строк матрицы В. Ранг симметрической и кососимметри ческой матриц. Определения этих матриц даны на стр. 129. Главным минором матрицы называется любой минор, стоящий на пересечении строк и столбцов с одинаковыми номерами, т. е. расположенный симметрично относительно главной диагонали матрицы. Ранг симметрической или кососимметрической матрицы равен наивысшему порядку отличных от нуля главных миноров. Точнее, если условимся минор «нулевого порядка» считать равным. 1, то: если в симметрической (или кососимметрической) матрице существует главный минор D порядка г,
58 ГЛ. ί. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [4 отличный от нуля, а все содержащие его главные миноры порядков г+1 и г + 2 (или только порядка г+ 2 в случае кососимметрической матрицы) равны нулю, то ранг матрицы равен г ([3], стр. 59 — 60 или [20], задачи 631, 633). Если обозначим через Dk минор &-го порядка, стоящий в левом верхнем углу матрицы (по определению Д»=1), то путем некоторой перестановки строк и такой же перестановки столбцов симметрической матрицы можно получить такую симметрическую матрицу, в которой в ряду миноров Д>, Du D3, ...f Dr не будет двух нулей подряд и Dr&09 Dk=0 для всех А]>г. В случае кососимметрической матрицы ранга г аналогичным путем можно получить условия: миноры Д>, D^,.:.,Dr отличны от пуля, а все остальные миноры Dk равны нулю. Ранг г кососимметрической матрицы — всегда число четное. Пример 3. Найти ранг матрицы Так как матрица симметрическая, то достаточно знать лишь главные миноры Z>» = 0 4 8 = _16, Ds = 0 4 10 4 8 18 10 18 40 Другой главный минор, содержащий D8, будет 0 4 1 Наконец, 04 = 0 4 10 1 8 7 7 3 4 10 8 18 18 40 7 17 = 0. 1 7 17 3 = 0.
5] § 2. системы линейных уравнений 59 0 0 0 1 4 — 20 -52 7 10 — 50 — 130 17 1 — 5 — 13 3 (из второй и третьей строк вычитаем четвертую» умноженную соответственно на 4 и 10) = 0. так как имеются пропорциональные строки. Значит, ранг матрицы равен двум. 5. Общая теория линейных уравнений. Укажем метод, позволяющий формулировать свойства системы линейных уравнений в общем виде, не производя предварительных преобразований данной системы. Пусть дана система линейных уравнений йпХх + а1ъХъ-\-...-\-а1пхп = Ьь 1=1, 2, ... , $. (1.4) Матрицей системы уравнений (1.4) называется матрица из коэффициентов при неизвестных {ап ai3 4_[ <h\ я** \as\ as* ·· Расширенной матрицей называется матрица, полученная из матрицы системы добавлением столбца свободных членов! т. е. матрица (ап а,з ... аХп Ьх\ <h\ Яад · · · Hi fa j <*st α$* ··· asn bsl Вопрос о совместности системы (1.4) решает следующий Критерий Кронекера — Капелл и. Для того чтобы система линейных уравнений (1.4) была совместна, необходимо и достаточно, чтобы ранг матрицы А системы был равен рангу расширенной матрицы В. Пусть ранг матрицы системы равен г^1. В этом случае любой отличный от нуля минор порядка г матрицы системы будем называть главным минором системы, а любой минор порядка г -J-1, полученный из главного минора добавлением >
60 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [5 столбца соответствующих свободных членов и одной из оставшихся строк (если она существует), — характеристическим минором для, данного главного минора. Критерий совместности можно формулировать иначе. Для того чтобы система линейных уравнений была совместна, необходимо и достаточно, чтобы существовал , главный минор, для которого все характеристические миноры равны нулю или же вовсе не существуют (последнее имеет место при г = $). Совместная система линейных уравнений имеет единственное решение, если ранг г матрицы системы равен числу неизвестных п, и бесконечно много решений, если г<^п. Если при этом г^>0, то за главные неизвестные можно принять любые г неизвестных, из коэффициентов которых в некоторых г уравнениях системы можно составить минор порядка г, отличный от нуля. Остальные η — г неизвестных являются свободными. Свободным неизвестным можно дать любые числовые значения. При заданных значениях свободных неизвестных значения главных неизвестных определяются однозначно. Иными словами, существует единственное решение совместной системы линейных уравнений, в котором свободные неизвестные имеют заданные числовые значения. Правило для решения системы линейных уравнений. 1) Путем вычисления ранга матрицы системы и расширенной матрицы выясняют вопрос о совместности системы; если система совместна, то находят один из главных миноров D Φ 0 порядка г, равного рангу обеих матриц. 2) Берут г уравнений, в которых лежит минор D\ остальные уравнения отбрасывают; г неизвестных, коэффициенты которых входят в главный минор А объявляют главными и оставляют слева, а остальные η — г неизвестных объявляют свободными и переносят в правую часть. 3) Методом исключения неизвестных (п. 2) или по правилу Крамера (п. 3) находят выражения главных неизвестных через свободные. Полученные равенства называются общим решением. 4) Придавая свободным неизвестным любые числовые значения, из общего решения находят соответствующие значения главных неизвестных и тем самым находят решение исходной системы уравнений, которое в отличие от общего решения можно назвать частным решением. Указанным путем можно получить любое решение. Для этого свободным неизвестным
5] § 2. системы линейных уравнений 61 в общем решении надо придать та значения, которые они имеют в данном решении. Пример. Найти общее решение и одно частное решение для системы уравнений 2*i— *s + ** + 2*4 + 3*6 = 2, 6*! — 3*s + 2*s+4*4 + 5λγ5 = 3, 6*i — 3*2 + 4*s + 8*4+ 13*5 = 9, 4*i—2*8+ *s+ *4+ 2*5=1. Выписываем расширенную матрицу, отделяя чертой столбец свободных членов: 2 N—1 1 6—3 2 6—3 4 4 —2 1 2 4 8 1 3 5 13 2 2 3 9 1 Вычисляем ранг матрицы системы. Минор второго порядка в ее правом верхнем .углу 2 3 1 Содержащий его минор третьего порядка 1 2 3 D=' 4 5 1 2 = -1^0. — 1 1 — 3 2 —3 4 —2 1 2 4 8 1 3 '5 13 .2 Добавляя к нему третью строку и второй столбец, получим минор четвертого порядка =0. Добавлять первый столбец не надо, так как он пропорционален второму столбцу. Значит, ранг матрицы системы равен трем и D можно принять за главный минор. Для выяснения совместности достаточно вычислить единственный характеристический минор = 0. 1 2 2 4 4 8 1 1 3 2 5 3 13 9 2. 1 •^ 1 0 0 0 2 0 0 — 1 3 2 — 1 —1 1 1 — 1 —1
62 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [6 Значит, ранг расширенной матрицы также 'равен трем и система совместна. Принимаем x%f xAf хь за главные, а хи *ъ — за свободные неизвестные и решаем методом исключения неизвестных * систему уравнений л:$ + 2*4+3д:6=:2--2*!+ хь 2х9 + 4х4 + Ьхь = 3 — 6^ι + Злг2, х9 + лг4 + 2л:» =*1—4.^+2** Находим общее решение лг$=—4^+2*$— 1, Ха= О, Полагая, например, Xi = l, лг2 = 2, найдем л:» = — 1; лг4=а0;л:в = 1. Для того чтобы система линейных уравнений (1.4) была совместна при фиксированных значениях коэффициентов ai} при неизвестных и любых значениях свободных членов bit необходимо и достаточно, чтобы ранг г матрицы А системы был равен числу 5 уравнений системы. При' этом система имеет единственное решение, если число уравнений равно числу неизвестных, $=п, и бесконечно много решений, если $<ζη. В частности, для того чтобы система линейных уравнений (й.4) с фиксированными значениями коэффициентов ai} при неизвестных имела единственное решение при лю.бых значениях свободных членов bh необходимо и достаточно, чтобы данная система была системой Крамера, т. е. чтобы число уравнений было равно числу неизвестных и определитель системы был отличен от нуля. 6. Системы однородных линейных уравнений. Фундаментальные системы решений. Линейное уравнение называется однородным, если'его свободный член равен нулю. Система однородных линейных уравнений имеет вид Λ|ΐ*ι + ... + «ι,ι·*ιι = 0» i=1» 2* ···> л (1-5) Всякая система однородных линейных уравнений имеет нулевое решение xt=Xi = ...=xn = 0 и, значит, совместна. Для того чтобы система однородных линейных уравнений имела ненулевое решение, необходимо и достаточно,
6l· § 2ь СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 63 чтобы ранг г этой системы (т. е. ранг матрицы из кЪэффи- циентов при неизвестных) был меньше числа неизвестных я. Отсюда следует, в частности, что любая система однородных линейных уравнений, в которой число уравнений меньше числа неизвестных, $</*, имеет ненулевое решение. Для того чтобы система однородных линейных уравне: ний, в которой число уравнений равно числу неизвестных", $=/&, имела ненулевое решение, необходимо и достаточно, чтобы ее определитель был равен нулю. Любое решение Х\ 52= С\) Х^ як Cj, ,, ·, Хп = Сп системы линейных уравнений с η неизвестными можно рассматривать как строку (или столбец) fa, сь ..., сп). Поэтому имеют смысл такие понятия, как сумма двух решений, произведение решения на число, линейная комбинация решений, линейная зависимость или независимость системы решений (§ 1, п. 3). Свойства решений системы однородных линейных уравнений: 1) сумма двух решений есть решение, 2) произведение решения на любое число есть решение Из этих свойств следует: 3) линейная комбинация решений есть решение. В частности, если существует хоть одно ненулевое решение, то из него умножением на произвольные числа можно получить бесконечно много решений. Фундаментальной (или основной) системой решений для системы однородных линейных уравнений (1.5) называется линейно независимая система решений, через которую линейно выражается любое решение системы (1.5). Если ранг г системы уравнений (1.5) равен числу η неизвестных, то эта система не имеет фундаментальной системы решений, так как единственным решением будет нулевое решение, составляющее линейно зависимую систему. Если г<[л, то система (1.5) имеет бесконечно много фундаментальных систем решений, причем каждая из них состоит из п—г решений и любые η — г линейно независимых решений составляют фундаментальную систему. Правило для построения фундаментальной системы решений. Берут любой определитель Μ порядка я — г, отличный от нуля (например, определитель,
64 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [6 у которого элементы главной диагонали равны единице, а остальные — нулю). Свободным неизвестным придают поочередно значения, равные элементам первой, второй и т. д. строк определителя Ж, и каждый раз из общего решения находят соответствующие значения главных неизвестных. Полученные η — г решений составляют фундаментальную систему. Меняя произвольно исходный определитель Λί, можно получить всевозможные фундаментальные системы решений Пример 1. Найти общее решение и фундаментальную си* стему решений для системы уравнений 3*1+ 4*8+ *8 + 2*4 + 3*8=0/ 5*1+ 7*2+ *8+3*4+ 4*5 = 0, 4*1+ 5*8 + 2*8+ *4+ 5*в*= 0, 7*1+10*8+ *8+6*4+5*5 = 0. Данная система приводится к ступенчатому виду (п. 2): *1+*2+ *8— *4+2*в = 0, *8 — 2*8 + 5*4 — 3*в = 0, *4 =0. Главными неизвестными считаем хи *2 и хь а свободными—л* и *|. Из второго уравнения находим *2 = 2*8 + 3*6. Подставляя это выражение *з в первое уравнение, найдем: *1 ^ *— 3*8 —* 5*5· Итак, общее решение имеет вид хх β —3*8 — Ъхь дг8 = 2*8 + 3*5, *4 = 0. Давая свободным неизвестным поочередне 11 0 1 значения, равные элементам строк определителя I 1 |, найдек фундаментальную снетецу решений: *х — 3 — 5 Х2 2 3 *8 1 0 χ* 0 0 ** о 1 Если ранг системы однородных линейных уравнений единицу меньше числа неизвестных; г = п—1, то η — г=*
6] § 2. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 65 т. е. фундаментальная система состоит из одного решения и любое ненулевое решение образует фундаментальную' систему. В этом случае любые ^два решения различаются между собой лишь числовым множителем. В качестве решения %истемы η — 1 однородных линейных уравнений с η неизвестными, т. е. системы вида Яц*1 + ... + Я|,Л| — 0, 4 = 1, 2,..., п— 1, можно взять совокупность миноров, полученных из матрицы системы поочередным вычеркиванием каждого столбца, причем эти миноры берутся с чередующимися знаками. Таким образом, если М,= то 0%1 ... Я*, f-i Λ9, j+i ... 09л αΛ-1> 1 · · · ап-Ь ί-1 αΛ-1> ί+1 · · · αΛ-1> / , ί=1, 2, >> Λ, xt = Mu дг9 = —Ж9, дг8 = Л<8, ..., лгл = (~1)л+|Жл. При этом если не* все эти миноры равны нулю, то полученное решение составляет фундаментальную систему решений и все другие решения ему пропорциональны ([11], стр. 83 или [20], задача 748). В противном случае г <^ η — 1, и этот метод дает лишь нулевое значение. Пример 2. Найти общее решение и фундаментальную систему решений системы уравнений За: — 2у + 4г = 0, 2лг — 3,y + 5*=s0. Составляем матрицу системы: /8 «2 4\ \2 -3 б/' Поэтому 1 — 2 41 -3 5 Jt = = 2, у~- 3 4| 2 5 13 —21 = — 5.
66 ГЛ. I. ОПРЕДЕЛИТЕЛИ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ [7 Так как это решение ненулевое, то оно образует фундаментальную систему решений. Все решения ему пропорциональны. Значит, общее решение имеет вид: * = 2с, дта»—7с, 2== — 5с, где с — параметр, принимающий любые числовые значения. 7. Связь решений однородны^ неоднородных систем. Если в неоднородной системе линейных уравнений заменить все свободные члены нулями, то получится однородная система, называемая приведенной системой для исходной неоднородной системы. Решения данной неоднородной системы и соответствующей ей приведенной системы связаны следующим образом. 1) Сумма любого решения неоднородной системы и любого решения ее приведенной системы является решением неоднородной системы. 2) Разность двух любых решений неоднородной системы является решением ее приведенной системы. Из этих двух свойств следует: 3) Все решения неоднородной системы можно получить, прибавляя к одному (любому) ее решению поочередно все решения ее приведенной системы. Иными словами, общее решение неоднородной системы можно получить, если к любому частному решению этой системы прибавить общее решение ее приведенной системы. Пример. Найти общее решение системы уравнений Злг —2у + 4* = 5, . 2лг —Зу-|т5г = 4. Эта система имеет частное решение ;с=.у=2=1. Общее решение ее приведенной системы найдено в примере 2 предыдущего пункта и имеет вид: * = 2с, у=— 7с, г = — 5с, где Ь — пара- мет)), принимающий любые значения. Поэтому общее решение данной неоднородной системы уравнений имеет вид *=1+2с, j>:s=l—7с, 2=1— 5с, где с — произвольный параметр.
ГЛАВА II МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ § 1. Матрицы 1. Действия с матрицами. О ранге матрицы см. гл. I, § 2, п. 4. Определения матрицы, ее строк и столбцов, квадратной матрицы, ее порядка, главной и побочной диагоналей даны во введении. Прямоугольную (в частности, квадратную) матрицу из т строк и η столбцов мы будем называть (т, п)-матрицей или матрицей размеров тХп и обозначать сокращенно через Д=(в!/)лг,л» а квадратн/ю матрицу порядка η — через А=(ауУ*. Две матрицы с одинаковым числом строк и одинаковым числом столбцов будем называть матрицами одинаковых размеров. Для матриц определяются три основные операции: ело* жение, умножение и умножение матрицы на число. Суммой двух матриц А=(л*/)т.л и В = (Ьфт,п одинаковых размеров т\п называется матрица тех же размеров А + В = (alj)m, η + (blj)m,n = iflij + blj)m, n · Пример 1. /1 2 3\ , /1 — 2 1\ /2 0 4\ \4 5 6.)"М2 3—6J~~\6 8 О)9 Произведением двух матриц А=(а^)т%п и B = (bJk)np, которые заданы в определенном порядке (первая и вторая) и размеры которых связаны условием: число столбцов первой матрицы равно числу. строк второй, называется матрица С= (citk)rntP, элементы которой определяются
68 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [1 равенствами Cik = Jj*ijb/k> * = 1, 2, ..., /и; й=1, 2, ...,/>. (2.1) Таким образом, элемент произведения матриц А и В, стоящий в 1-й строке и А-м столбце, равен сумме произведений элементов i-й строки первой матрицы А на соответствующие элементы &-го столбца второй матрицы В. Про· изведение матриц А и В в данном порядке обозначается через А В или А-В. Для квадратных матриц одинакового порядка произведение А В (как и В А) всегда определено. Пример 2. Если то АО ( 0 3 6\ Произведение ВА не определено. Умножение Матриц тесно связано с линейными преобразованиями неизвестных. Пусть даны два линейных преобразования неизвестных: л *t =Σ я^У/· *= 1, 2, ..., /и; (2.2) Ρ yj = 2^bjkzkt j=U 2, ..., п. (2.3) Подставляя выражения для у; из равенств (2.3) в (2.2), получим снова линейное преобразование вида ρ */=Σ cikzkt i=l, 2, ..., /и. (2.4) Оно называется результатом последовательного выполнения или произведением данных преобразований (2.2) и (2.3). Если А = (aij)m, п> £ = iPjk)ntp> С = {Cik)m tJf
II § 1. МАТРИЦЫ 69 — соответственно матрицы коэффициентов преобразований (2.2), (2.3) и их произведения (2.4), то АВ = С. Прозведением матрицы А=(а^)тп на число с называется матрица сА = (са^)т>П9 получаемая умножением всех элементов матрицы А на число с. Действия над матрицами обладают следующими свойствами (во всех следующих равенствах предполагается, что все действия, встречающиеся в одной из двух частей равенства, имеют смысл, и отсюда следует, что действия в другой части равенства также имеют смысл): 1) Сложение матриц коммутативно: Л + ЛЗ=5-{-Лч 2) Сложение матриц ассоциативно: A-|-(i5-f-C)=(Л-f-i3)H-C. Из Ътих двух свойств можно вывести, что в любой сумме конечного числа матриц слагаемые можно писать в любом порядке и скобки, указывающие порядок действий, можно расставлять произвольно. Например, [С + (D -{- А)] -{- В = = [(А + В) -f- С) -f- Д и можно писать просто А + В + С + D. 3) Сложение обладает однозначной обратной операцией — вычитанием. Это значит, что для любых двух матриц А и В одинаковых размеров существует единственная матрица С со свойством В-\-С=А. Она называется разностью матриц 4 и В и обозначается через А—В. Свойство 3) эквивалентно следующим двум: За) Существует единственная матрица О данных размеров, называемая нулевой, такая, что ;4-4-0='Л для любой матрицы А данных размеров. Именно, нулевой матрицей служит матрица, у которой все элементы равны нулю. 36) Для любой матрицы А данных размеров существует единственная матрица — А тех же размеров со свойством А +(— Л) = 0. Именно, за матрицу — А надо взять матрицу, все элементы которой отличаются знаком от соответствующих элементов матрицы А. Умножение матриц не коммутативно, т. е. не обладает переместительным свойством. В общем случае АВФ В А даже для квадратных матриц одинакового порядка η ^2. > Пример 3. НИ)· -ЙЭ. «-(ИД··
70 ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [1 4) Умножение матриц ассоциативно: А(ВС) = (АВ)С. 5) Умножение матриц дистрибутивно относительно сложения: (Л + В)С= АС+ВС, С (А + В) = СА + СВ. Отсюда следует дистрибутивность умножения матриц относительно вычитания: (А — В)С = АС — ВС, С (А — В) = = СА — СВ. 6) a(bA) = (ab)A, где а, Ь — числа и А — матрица. 7) а(АВ) = (аА)В, где а — число и Л, В — матрицы. Матрицу, транспонированную для матрицы Л, обозначим через Л' (см. гл. I, § 1, п. 3). 8) Для транспонирования произведения матриц Справедлива формула (Л5)'= ВА\ и аналогично для любого конечного числа сомножителей. Обозначим определитель квадратной матрицы Л через | Л |. 9) Определитель произведения двух квадратных матриц одинакового порядка равен произведению их определителей: . |Л£| = |Л|.|Я|, и аналогично для любого конечного числа сомножителей. 10) Выражение минора произведения д-вух матриц через миноры сомножителей (обозначения даны на стр. 44): если Л — матрица размеров т χ η% В — матрица размеров п\р и С = АВ, то \kt k%... kr/ при г^п. Все миноры матрицы С порядка г^>п равны нулю ([6], стр. 19). Это равенство при т=р=г превращается в теорему Бйне—Коши (стр. 35). Пример 4. Умножая ненулевой столбец
21 § 1. МАТРИЦЫ 71 на ненулевую строку £=(#i 6S ... bp)t получим матрицу (ахЬ\ ахЬ% ... axbp \ аЖх агЬ% ... а%Ьр \ <*mbx ОтР* ... ambpJ в которой все миноры порядка выше первого равны нулю, но имеется элемент, отличный от нуля. Таким образом, ранг матрицы С равен единице. Об операциях над клеточными матрицами см. [6], гл. II, § 5. 2. Единичная и обратная матрицы. Единичной матрицей порядка η называется квадратная матрица Ε порядка я, обладающая свойством АЕ=ЕА = А для любой матрицы А порядка п. Таким образом, матрица Ε играет^ такую же роль при умножении матриц, какую число ^^рй'умножении чисел. Для любого порядка η существу*ег"единственная единичная матрица данного порядка. Она имеет вид П 0 ... 0\ О 1 ... О Е=\ ко о 1> Квадратная матрица А называется вырожденной (или особенной)^ если ее определитель равен нулю, | А \ = 0, и невырожденной (или неособенной), если | А \ -ψ 0. Обратной матрицей для квадратной матрицы А порядка η называется квадратная матрица Л"1 того же порядка, обладающая свойством АА~1 = А~1А=Е, где,Ε—единичная матрица порядка л. Вырожденная матрица не имеет обратной, так как из свойства 9) предыдущего пункта· следует, что произведение вырожденной матрицы на любую квадратную матрицу того же порядка будет снова вырожденной матрицей. Любая невырожденная матрица A = (aij)ni имеет единственную обратную матрицу, а именно: 1-1. Ми Ац \А\ \А\ Лц Ам \А\ \А\ \άΐη \\А\ Агп \А\ АпЛ \А\ Ап2 \А\ |Λ|/
72 ГЛ; II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [2 где Aij—алгебраическое дополнение элемента а^ в матрице А (стр. 20). Матрицей, обратной для матрицы А'\ будет матрица Л, т. е. (Л~1)~1 = Л. Определители двух взаимно обратных матриц являются числами взаимно обратными: | А | · | Л*"11 = 1. Матрица, обратная для произведения двух невырожденных матриц, равна произведению матриц, обратных сомножителям, взятым в.обратном порядке: (АВУ1 = ВГХА'\ и аналогично для любого конечного числа сомножителей. Методы вычисления обратной матрицы. 1. Используют указанный выше вид элементов обратной матрицы. Пример 1. Найти обратную матрицу для матрицы Находим: ~Ч:1-(14)- Этот метод неудобен для матриц высокого порядка. 2. Обозначим элементы t-ro столбца обратной матрицы Л*"1 для матрицы А = (а^У} через хи дг9, ..., хп. Приравнивая элементы i-ro столбца в матричном равенстве АА~1 = Е, получаем системы уравнений . . . ( 0 при * Φ /, \ 1 при * = /, где в правой части /-го уравнения стоит единица, а во всех остальных уравнениях — нули. Так как | А \ φ 0, то по правилу Крамера (гл. I, § 2, п. 3) эта система имеет единственное решение, которое можно найти методом исключения неизвестных (гл. I, § 2, -п. 2). Применение здесь формул Крамера привело бы к предыдущему методу вычисления обратной матрицы.
2] §Ь матрицы 73 Пример 2. Найти обратную матрицу для матрицы /О 1 ... Г> \ί Ί'...' оу Для элементов i-ro столбца обратной матрицы имеем систему уравнений Сложив все уравнения и разделив на η—1, получим η ΣΙ Вычитая отсюда каждое из уравнений системы, найдем ·*ι=#ιβ ... =*μ=*ι+ι = ··· = «*я: X,~~ л—1 1~~л—Г Отсюда л-1^ /2 —л 1 ... 1 1 / 1 2 — η ... 1 η—1 1 1 ... 2 — я> 3. Любую невырожденную матрицу А путем элементарных преобразований (стр. 54) только строк (или только столбцов) можно привести к единичной матрице/?. Применяя ту же последовательность преобразований к единичной матрице Е, получим обратную матрицу А"1. Удобно совершать элементарные преобразования над А и Ε одновременно, записывая обе матрицы рядом через черту ([20], задача 933). Пример 3. Найдем этим методом обратную матрицу для матрицы примера 1 этого пункта. Соединяем матрицы знаком эквивалентности ~: (ίβ|οι)~ (из второй строки вычитаем первую, умноженную на 4) /1 31 1 0\ ~(θ-7|-4ΐ]~
74 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [2 (к первой строке прибавляем вторую, умноженную на у, и затем -ι) вторую строку умножаем на \ О ^0 1 А~1 = Миноры обратной матрицы В = А~1 для невырожденной матрицы А порядка η следующим образом выражаются через миноры матрицы А Если то Jh ι.... ι,\ \Ч ft - W где система индексов #<й< ... <Оп-р дополняет систему ii < fe <... < ipy а система j\ <у*2 < ... <У*-р дополняет систему /ι <^уЪ <С · · · <С/р до полной системы индексов 1, 2, ..., η ([6], стр. 26 или [20], задача 972). С вычислением обратной матрицы тесно связано решение матричных уравнений вида АХ=В, ΥΑ = Β, (2.5) где Л, В — данные и Χ, Υ—искомые матрицы. Если А — прямоугольная или вырожденная квадратная матрица, то решение этих уравнений сводится к решению систем линейных уравнений для элементов каждого столбца матрицы X или каждой строки матрицы Υ; для получения этих уравнений надо приравнять элементы матриц в обеих частях равенства. Но если А — невырожденная матрица, то решения даются формулами Χ=Α-χΒ, Υ=ΒΑ'Κ (2.6) В частности, если матрица В состоит из одного столбца (как и искомая матрица X или К), то первая из формул (2.6) приводит к формулам Крамера (гл. I, § 2, п. 3). Однако эта формула удобнее формул Крамера в том случае, когда
31 § 1. МАТРИЦЫ 75 надо решать ряд систем уравнений, отличающихся лишь правыми частями. Тогда, найдя матрицу А*"1, легко вычислять Х= = А~ХВ для различных частных значений В. Пользуясь действиями с матрицами, можно при известных условиях свести вычисление определителя четного порядка к вычислению одного определителя вдвое меньшего порядка. \А В\ Пусть определитель Δ = порядка 2л разбит на че- \С D тыре клетки Д 5, С, D порядка п. Тогда имеют место Формулы Шура: Δ = |Λ£> — АСА-1В\, если \A\jtO; b = \AD — BD-lCD\, если |£>|^0; Δ = \ΑΟ — СВ\, если АС = СА; Δ = |Λί> — ВС\, если CD = DC ([6], стр. 45). 3. Степени матрицы. Многочлены от матрицы. Перестановочные матрицы. Матрицу А можно умножить саму на себя тогда и только тогда, когда она квадратная. Все матрицы в этом пункте (если не оговорено противное) предполагаются квадратными одного и того же порядка п. Степени матрицы определяются так: если k — натуральное число, большее единицы, то Ак есть произведение k матриц, равных А. Из закона ассоциативности' умножения матриц (стр. 70) вытекает, что это произведение имеет однозначный смысл. Далее, А1 = А, А*=Е> где Ε—единичная матрица. Степени с отрицательными показателями определяются лишь для невырожденных матриц. Именно, А"1 — обратная матрица (стр. 71), и при целом положительном ktk^>lf матрица А~* определяется как любая из двух равных* матриц (Α*)-ι = (Λ*~Τ· Определение корня из матрицы и связанного с ним понятия степени матрицы с дробным показателем см. в [6], гл. 8, §§ 6, 7. Степени матрицы с любыми действительными или комплексными показателями можно определить как специальный случай общего понятия функции от матрицы ([6], гл. 5). Для действий со степенями матриц справедливы следующие правила (где k и /—любые целые числа; в случае
76 ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [3 отрицательных показателей матрицы предполагаются невырожденными): АкАг = Ам, (2.7) (Ak)l = Akl, (2.8) {AB)k = AkB\ (2.9) если только АВ=ВА. Если AB=BAt то верна формула бинома Ньютона (Л + В)т = Ат + С1т Ат~гВ + С*т А т~*& +... + Вт, где т — целое положительное число. Матрицы А и В называются перестановочными, если оба произведения А В и В А имеют смысл и АВ=ВА. Две перестановочные матрицы обязательно являются квадратными одинакового порядка. Если А перестановочна с В, то А перестановочна с В~\ А'1 с В и А"1 с Вг\ если только обратные матрицы существуют. Из (2.7) следует, что все степени одной и той же матрицы А перестановочны между собой. Скалярной матрицей называется квадратная матрица вида А=сЕ, где Ε—единичная матрица. Для того чтобы квадратная матрица А порядка η была перестановочна со всеми матрицами того же порядка, необходимо и достаточно, чтобы она была скалярной ([11], стр. 105). Если матрица А перестановочна с какой-нибудь диагональной матрицей (см. стр. 89), у которой элементы главной диагонали попарно различны между собой, то эта матрица А сама диагональна ([20], задача 820). Значением многочлена № = с*хт + с1хт~* + ... + ст с числовыми коэффициентами с0, си ..., ст от матрицы А или значением многочлена f(x) при х=А называется матрица /(А) = с0Ат+ сгА^ +... + стЕ, где Ε—единичная матрица.
31 § 1. МАТРИЦЫ · 77 Из перестановочности степеней матрицы А следует, что все многочлены от матрицы Л перестановочны между собой и, в частности, перестановочны с матрицей Л. Частное матриц А и В имеет смысл лишь для невырожденного делителя Bt причем это частное имеет два значения: левое частное В~ХА и правое частное АВ~*. Оба эти частных совпадают тогда и только тогда, когда А и В перестановочны. Только в этом случае применяются обозначения частного А:В или ^. Рациональной функцией (где f(x) и g(x) — многочлены с числовыми коэффициентами) от матрицы А называется матрица h(A) = f-^ ( } g(AV Это значение h(A) имеет смысл тогда и только тогда, когда матрица g(A) не вырождена. Все рациональные функции от матрицы А перестановочны между собой и с матрицей Л. Обратная матрица А'1 для невырожденной матрицы Л, а потому и рациональная функция h(A) = ^=f(A)[g(A)r представляются в виде многочлена от матрицы Л ([6], стр. 98). При известных условиях можно определить значение любой функции f(x) от матрицы Л как значение некоторого многочлена от этой матрицы ([6], гл. 5, § 1). Поэтому значение любой функции от матрицы Л есть матрица, перестановочная с матрицей Л. Кроме многочленов от матрицы Л, могут существовать и другие матрицы, перестановочные с Л. Все матрицы, перестановочные с данной матрицей Л, тогда и только тогда являются многочленами от Л, когда все инвариантные множители (стр. 83) ее характеристической матрицы, кроме последнего, равны единице или (что то же самое) когда миноры (п — 1)-го порядка характеристической матрицы ХЕ — Л в совокупности взаимно просты ([б], стр. 184). Без этого условия матрицы,
78 гл. п. матрицы и квадратичные формы [3 перестановочные с Л» не могут исчерпываться многочленами не только от матрицы Л, но вообще ни от какой-либо одной матрицы ([6], стр. 184). В самом общем случае все матрицы X, перестановочные с данной квадратной матрицей А порядка п, находятся следующим образом. Пусть U—какая-нибудь невырожденная матрица, трансформирующая * матрицу А в жорданову матрицу А0> т. е. удовлетворяющая равенству А = С/А0Ц~1 (п. 11). Тогда X^UXqU-1, где Х0— любая матрица, перестановочная с жордановой матрицей Л0. Все матрицы Х9 находятся по следующему правилу: назовем прямоугольную (в частности, квадратную) матрицу правильной верхней треугольной, если ьсе ее элементы, стоящие ниже каждой из диагоналей, выходящих из левого верхнего и правого нижнего углов, равны нулю, а среди остальных элементов все элементы, стоящие на каждой параллели к указанным диагоналям, равны между собой, например: Пусть клетки Жордана, стоящие на главной диагонали матрицы Л0 в порядке сверху вниз, имеют порядки ри р^... ..., /?5 и на их диагонали стоят числа λ„ Xj, ..., \s (среди которых могут быть и равные между собой). Проведя горизонтальные и вертикальные линии, отделяющие клетки Жордана, мы разобьем матрицу Л0 на квадратные и прямоугольные клетки. Пусть A§=B(JfeJf — соответствующее разбиение на клетки матрицы Х0. Здесь Ха- — клетка размеров />аХ/у Матрица Х0 определяется условиями: ^ = 0, если λα * ^ λ^ и Ха. — любая правильная верхняя треугольная матрица, если \а = к Число независимых параметров в матрице XQ или число линейно независимых матриц X, перестановочных с Л» определяется формулой N=*nx + Зя2 -|- Ъпг +... + (2* — 1) nt9 где пх ^ щ ^ пг 3*. · · S* Я| > 0 — степени инвариантных множителей матрицы \Е — А, отличных от единицы ([б], стр. 183 — 184).
4]' § 1. МАТРИЦЫ 79 Пример. Если матрица ХЕ— А имеет инвариантные множители ^(λ) = ... = £*(λ) = 1, β,(λ) = (λ-Μ*, Я7(λ) = (λ — λ,)»(λ — λ»)«, το la b c\d <?j0 0^ ΛΌ = 0 а Ь 0 0а h k\Q О |о л|о о \θθΠ ml И О 0|0 // Число параметров a, bt ... ,шравно N=nx 4-Зя2 = 5 + 3-2 = 11. 0/g 00/ оУо 0 0 0 О d\0 О О ΟΙΟ О 4. Связь умножения матриц с элементарными преобразованиями. Разложение матрицы в произведение треугольных матриц. Каждое элементарное преобразование (стр. 54) строк (или столбцов) прямоугольной матрицы А размеров т\п можно заменить умножением матрицы А слева (соответственно справа) на квадратную невырожденную матрицу порядка т (соответственно п), полученную из единичной матрицы того же порядка применением того же самого элементарного преобразования. Пример. ,=(123У Прибавляя ко второй строке первую, умноженную на —2, получим матрицу Применяя то же преобразование к единичной матрице второго по· рядка» получим матрицу -и :)■ Тогда должно выполняться равенство РА = В, т. е. / 1 0\ /1 2 3\ _ /1 2 3\ |^_2 \) \4 5 6/ — \2 1 О/*
80 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [4 Любую матрицу А размеров тХп и ранга г можно представить в виде A=PRQ, где Ρ и Q — невырожденные матрицы соответственно порядков т и я, a R — матрица размеров /и χ я, у которой первые г элементов главной диагонали (выходящей из левого верхнего угла) равны единице, а остальные элементы равны нулю. Верхней (нижней) треугольной матрицей называется квадратная матрица, у которой элементы, отличные от нуля, могут стоять лишь на главной диагонали и выше (ниже) этой диагонали. Сумма, произведение, произведение на число и обратная матрица (в случае невырожденной матрицы), взятые для верхних (нижних) треугольных матриц/ снова будут верхними (нижними) треугольными матрицами. Любую квадратную матрицу А можно представить в виде A=PR или A = RQ, где /?, по желанию, верхняя или нижняя треугольная матрица, а Р и Q— невырожденные матрицы. Любую квадратную матрицу А =(ау)Ч ранга г, у которой первые г угловых миноров (т. е. миноров, стоящих в левом верхнем углу) отличны от нуля, /1 2 ... *\ (2.10) можно представить в виде произведения А = ВС, (2.11) где /Ьм 0 ... Bl **i А* .·· \Αιΐ Ьпъ ... Ьпп/ — нижняя треугольная, (cti cw ... cin\ 0 см ... Съп 0 0 ... спп/
4] § 1. МАТРИЦЫ 81 — верхняя треугольная матрицы. При этом первые г элементов главных диагоналей матриц В и С можно выбрать любыми, удовлетворяющими условиям ЬггСгг'· Ч-l (2Л2) Задание этих элементов однозначно определяет все элементы первых г столбцов матрицы В и первых г строк матрицы С. Эти элементы можно найти по формулам Р*-ткА r ckk λ II 2 Л 2. l\ 2 {l 2 i = kt k-\- 1, ... , η\ или по рекуррентным формулам bik= г- 1 См -. 1)· .. * — .. * ... k — ... * *=1, 2, η (2.13) *«- ft-l У*1 l=zkt A+l, ... ^л λ; *=1, 2, (2.14) В случае r<^n все элементы последних л — г столбцов матрицы В можно взять равными нулю, а элементы последних η — г строк матрицы С можно выбрать произвольными или, наоборот, элементы последних η — г столбцов матрицы В взять произвольными, а элементы последних η — г строк матрицы С "взять равными нулю ([6], стр. 37—38). Если А={ацУ* — симметрическая матрица ранга г, угловые миноры которой удовлетворяют условиям (2.10), то А представляется в виде А = В&, (2.16) где В=(ЬуУ*— нижняя треугольная матрица и β — матрица,
82 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [5 транспонированная для В. Элементы матрицы В находятся по формулам ъ 1 А1\ 2 ...*-1 1\ ί=Μ+1,...,η, | ik VraT \1 2 ... *—1 *]'*=1,2, ... , г; (2.16) bik = 0\ k = r-\-\, r-j-2, ... , л J ([б]гстр. 39). 5. Многочленные матрицы, инвариантные множители и элементарные делители. Многочленной матрицей или Х-матрицей называется прямоугольная (в частности, квадратная) матрица Л(к) = (а^(к))тп, элементы которой являются многочленами от одного переменного λ с числовыми коэффициентами.. Если все эти коэффициенты принадлежат к данному числовому полю К (см. введение), то будем матрицу Α (λ) называть Х-матрицей над полем К- Элементарными преобразованиями λ-матрйцы Α (λ) называются преобразования следующих типов: (I) перестановка двух строк, (II) умножение строки на число с, отличное от нуля, (III) прибавление к одной «строке другой строки, умноженной на любой многочлен /(λ), и аналогичные преобразования столбцов. Две λ-матрицы Α (λ) и В (λ) одинаковых размеров т Χ η называются эквивалентными, в символах Α (λ) ~ Β (λ), если от матрицы Α (λ) κ Β (λ) можно перейти при помощи цепочки из конечного числа элементарных преобразований. Отношение эквивалентности обладает тремя основными свойствами: 1) рефлективность: каждая матрица эквивалентна сама себе Α(λ)~Α(λ); 2) симметрия: если Α(λ)~β(λ), то £(λ)~Α(λ); 3) транзитивность: если Α (λ) ~ Β (λ) и В (λ) ~ С (λ), то Α(λ)~(7(λ). Отсюда следует, что совокупность всех λ-матриц данных размеров тХ,п разбивается на непересекающиеся классы эквивалентных матриц, т. е. на такие классы, что любые две матрицы из одного класса эквивалентны, а из разных классов — не эквивалентны между собой. Возникает вопрос о канонической форме λ-матрицы, характеризующей данный класс эквивалентных λ-матриц.
51 § 1. МАТРИЦЫ 83 Канонической яла нормальной λ-матрицей размеров т\и называется λ-матрица, у которой на главной диагонали стоят многочлены Et(\)t Яа(Х), ..., Ep(\)t где ρ—меньшее из чисел тип, причем не равные нулю среди этих многочленов имеют старшие коэффициенты, равные единице, и каждый следующий многочлен делится на предыдущий, все же элементы вне главной диагонали равны нулю. * Из этих свойств следует, что если среди многочленов £;(λ) имеются многочлены нулевой степени, то они равны единице и стоят в начале диагонали, если же имеются нули, то они стоят в конце главной диагонали. Так, матрица ПО 0 0 0\ О λ 0 0 0 0 0 λ (λ — 3) 0 0 КО 0 0 0 0У является канонической. Каждый класс эквивалентных λ-матриц размеров т\п содержит единственную каноническую матрицу, т. е. каждая λ-матрица Α (λ) эквивалентна единственной канонической λ-матрице С (λ), называемой канонической формой или нормальной формой данной матрицы Α (λ), а многочлены Ег (λ), Eq(K)f ... , Ер (λ), стоящие на главной диагонали С (λ), называются инвариантными множителями матрицы Α (λ). Здесь ρ — меньший из размеров матрицы Α (λ) ([14], стр. 107—112). Первый метод вычисления инвариантных множителей λ-матрицы состоит в приведении ее к канонической форме путем элементарных преобразований. Пример 1. Найти каноническую форму и инвариантные множители λ-матрицы / χ λ—1 λ—1 λ —2 л,Хч / λ λ· + λ λ-1 λ· + λ-1 ι' \λ+1 λ» + λ+2 λ + 1 λ» + 2λ + 3] \λ—1 λ —3 λ —3 —6 Третий столбец вычитаем из остальных: /! \2 0 λ—1 λ»+1 λ — 1 λ» 4 ι λ + ι 0 λ —3 — 1 > λ» λ» + λ + 2 — λ —3 ,
84 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [5 (из второй и четвертой строк вычитаем первую» умноженную соответственно на 1 и 2) П 0 λ—1 —1 \ О λ*+1 0 λ*+1 \ О λ*+1 λ+1 λ* + λ + 2/ \0 0 — λ—Ι — λ—1 / (из третьего и четвертого столбцов вычитаем первый, умноженный соответственно на λ— 1 и — 1) 10 0 О О λ»+1 0 λ» + 1 О λ» + 1 λ+1 λ» + λ + 2 О 0 —λ—1 —λ—1 (второй и третий столбцы вычитаем из четвертого) 10 0 0> 0 λ» + 1 О О ^' 0 λ»+1 λ + 1 О О 0 -λ—l Оу (из третьей строки вычитаем вторую и полученную строку при· бавляем к четвертой) 1 О О О' О λ»+1 О О О 0 λ+l О ,0 0 О О, (переставляем вторую и третью строки» а также второй и третий столбцы) 10 О О1 О λ+l О О О 0 λ»+1 О ,0 0 0 0, Это каноническая матрица; значит, матрица А (К) имеет инвариантные множители: Et(K)=\t Ε,(λ) = λ+1, £$(λ) = λ» + 1, £4(λ) = 0.
5] § 1. МАТРИЦЫ 85 Многочлены от λ с коэффициентами из числового (или любого) поля К сами поля не образуют, но они содержатся в поле рациональных функций от λ с коэффициентами из поля К Поэтому для λ-матриц верны основные свойства ранга, связанные с понятиями минора и линейной зависимости строк или столбцов. Так, при элементарных преобразованиях λ-матрицы ее ранг не изменяется и для λ-матриц верна теорема о ранге матрицы (стр. 56). Пусть дана λ-матрица А(к) = (а,ц(к))тп ранга г νι р= = min(/w, л). Делителями миноров этой матрицы называются многочлены .Α(λ), β*(λ)> ·.·> Dp(\\ где при k =5=1, 2, ..., τ многочлен Dk(\) определяется как наибольший общий делитель (гл. III) всех миноров &-го порядка матрицы Α (λ), причем коэффициент его старшего члена приведен к единице, и при £ = /·+ 1, г-{-2,..., р, по определению, Dk (λ) = 0. При элементарных преобразованиях матрицы Л (λ) ее делители миноров не изменяются ([14], стр. 109). Второй метод вычисления инвариантных множителей λ-матрицы основан на следующей связи их с делителями миноров: DkQ) = Ex(\)E%{\) ... Ek(\), k=\f 2, .„, p. (2.17) Отсюда находим Ε*Μ = Ί%%> *=Ь 2, ...,r (при k=\ принято £0(λ)=1), } (%Щ Ек0) = 0, k = r+U r + 2, ..., ρ (см. [14], стр. 112). Этот метод удобен в случаях, когда лишь немногие элементы λ-матрицы зависят от λ, как, например, в характеристической матрице \Е—Л. Пример 2. Найти инвариантные множители и каноническую форму λ-матрицы λ —3 —1 1 Λ(λ)=[ 0 λ —2 0 -1 —1 λ—Ι
86 ГЛ. И. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [5 Так как матрица содержит элементы, не зависящие от λ и отличные от нуля, то D, (λ)=1. Все миноры второго порядка, содержащие вторую строку матрицы, делятся на λ—·2. Вычисляем остальные три минора. Ι λ — 3 1 Ма,=1 { χ_ Ι = —λ + 2, Μ2ί = — 1 λ—1 -,λ·_4λ+4, Μ28 = Поэтому £>8(λ) = λ — 2. Разлагая определитель матрицы Α (λ) по второй строке, найдем D8 (λ) = (λ - 2) Л!22 = (λ - 2)». По формулам (2.18) находим инвариантные множители Ε,(λ)«1, Ε2(λ) = λ-2, Ε8(λ) = (λ-2)». Каноническая форма матрицы Л (λ) имеет вид ( 1 О О О λ —2 О \θ Ο (λ — 2)\ Аналогично случаю числовых матриц (стр. 79) каждое элементарное преобразование строк (или столбцов) λ-матрицы Α (λ) размеров т\п можно заменить умножением этой матрицы слева (соответственно справа) на так называемую элементарную λ-матрицу, полученную путем применения данного элементарного преобразования к единичной матрице порядка т (соответственно порядка я). Элементарные матрицы являются частным случаем обратимых λ-матриц, Обратная матрица для невырожденной квадратной λ-матрицы в общем случае не будет λ-матрицей, так как може1 иметь дробные элементы. Квадратная λ-матрица называется обратимой (или унимо- дулярной), если обрятная для нее матрица также является λ-матрицей. Для того чтобы квадратная λ-матрица была обратимой, необходимо и достаточно, чтобы ее определитель не содержал λ и был отличен от нуля, например: / λ» λ+2\ \λ-2 1 J* Произведение нескольких обратимых λ-матриц снова обратимо. Канонической формой обратимой λ-матрицы является еди-
5J § 1. МАТРИЦЫ 87 ничная матрица того же порядка. Любая обратимая λ-матрица разлагается в произведение конечного числа элементарных Х-матриц-([14], стр. 113—116). Признаки эквивалентности λ-матриц. Для того чтобы две λ-матрицы Α (λ) и В (λ) одинаковых размеров были эквивалентны, необходимо и достаточно каждое из следующих условий: 1) эти матрицы имеют одну и ту же совокупность делителей миноров; 2) эти матрицы имеют одну и ту же совокупность инвариантных множителей; 3) эти матрицы связаны соотношением β(λ) = Ρ(λ)Λ(λ)0(λ), (2.19) где Ρ(λ) и Q(X) — некоторые обратимые λ-матрицы ([14], стр. 113). Алгоритм для вычисления матриц Ρ (λ) и Q (λ). Приводим λ-матрицы Л (λ) и В (λ) одинаковых размеров т'Хп к общей канонической форме С (λ) путем элементарных преобразований (если канонические формы данных матриц окажутся различными, то эти матрицы не эквивалентны). Совершая в обратном порядке преобразования, обратные тем, которые переводят В (λ) в С (λ), мы получим цепочку преобразований, переводящих С (λ) в β (λ), и, поставив перед этой цепочкой преобразования, переводящие Α (λ) в С (λ), получим цепочку преобразований, переводящих Α (λ) в В (λ). Такую цепочку можно иногда построить, минуй каноническую форму С (λ). Матрица Ρ (λ) получится из единичной матрицы Ет порядка т путем применения к ней в том же порядке всех преобразований строк цепочки, переводящей Л (λ) в В (λ), а матрица QQ?) получится из единичной матрицы Еп порядка η путем применения к ней в том же порядке всех преобразований столбцов той же цепочки. Как цепочка, переводящая Α (λ) в В (λ), так и матрицы Ρ (λ) и Q(X) не определены однозначно. Элементарные делители. Пусть Α (λ) есть λ-матрица над числовым полем К (см. введение). Элементарными делителями над полем К матрицы Α (λ) называются максимальные степени неприводимых над полем К множителей (гл. III), входящие в разложения инвариантных множителей этой матрицы. При этом в совокупность элементарных делителей матрицы А (к) каждый из них входит столько раз,
88 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [5 в разложении скольких инвариантных множителей он встречается. Таким образом, если Es+t(\)t Es^(\)t ..., Ζ:,.(λ) —все инвариантные множители матрицы Л (λ), имеющие положительные степени, и если разложения их на степени попарно различных неприводимых над К множителей имеют вид- £|(λ) = [Λ,(λ)]^[Λ9(λ)]^ ...[frtt|(X)]4 1 (220) £ = 5+1, $ + 2, ..., r, j то совокупность элементарных делителей этой матрицы со· стоит из многочленов ^ι(λ) = [^+ι,ι(λ)]^Μ> ^(λ) = [ρ5+ι.9(λ)]^^, ..., ^(λ) = [^Γ(λ)]4 (2.21) где t=ts+t + tf5+9 +... + tr — число элементарных делителей. При расширении поля К (см. гл. III) делители миноров Dk (λ) и инвариантные множители Ek (λ) матрицы Α (λ) не изменяются, но элементарные делители могут измениться. Пример 3. Найдем элементарные делители λ-матрицы (10 0 0 0^ 0 λ* + 2 0 0 0 0 0 (λ'-4)» 0 0 0 0 0 О О J над полями рациональных, действительных и комплексных чисел. Матрица Α (λ) имеет каноническую форму. Поэтому на ее главной диагонали стоят инвариантные множители β.(λ)=.1, Ε,(λ) = λ» + 2, £$(λ) = (λ*-4)«, £4(λ)==0. Разлагая Ε* (λ) и Ε» (λ) на неприводимые множители над каждым из указанных полей, получим системы элементарных делителей: 1) над полем рациональных чисел: *,(λ) = λ* + 2, *2(λ) = (λ» + 2)», *$(λ) = (λ*-2)*; 2) над полем действительных чисел: *,(*) = **+ 2, Μλ) = (λ* + 2)*, *·(*> = (*+V^)8, 4 ^(λ) = (λ~νΤ)2; 3) над полем комплексных чисел: , ^(λ) = λ + 2ί, ^2(λ) = λ —2ί, *$(λ) = (λ + 202, ^4(λ) = (λ—2i)S
5] § 1. МАТРИЦЫ 89 Так, как над полем комплексных чисел любой многочлен положительной степени разлагается на линейные множители (гл. III), то элементарные делители любой λ-матрицы над полем комплексных чисел являются степенями многочленов первой степени, т. е. имеют вид (λ — \0)\ где \0 — некоторое число. Обычно под элементарными делителями (если не оговорено противное) понимают элементарные делители над полем комплексных чисел. Элементарными делителями λ-матрицы Л (λ) однозначно определяются ее инвариантные множители положительной степени. Последний из этих инвариантных множителей равен произведению различных неприводимых множителей в наивысших степенях, в которых они встречаются среди всех элементарных делителей. Предыдущий инвариантный множитель составляется по тому же правилу из оставшихся элементарных делителей, и т. д. Если еще даны размеры и ранг матрицы Л (λ), то этим однозначно определяются все ее инвариантные множители и, значит, ее каноническая форма.- Пример 4. Найти инвариантные множители λ-матрицы Α (λ) размеров б X S и ранга 5, если даны ее элементарные делители λ+1, λ+1,(λ+1)»,(λ-1)*, (λ-1)». Так как число всех инвариантных множителей равно меньшему из размеров матрицы, т. е. 6, а число инвариантных множителей, отличных от нуля, равно рангу, т. е. 5, то Εβ(λ) = 0. Далее, £*(λ) = (λ+1)·(λ-1)2, £*(λ) = (λ+1)(λ-1)*, £$(λ) = λ+1. Так как мы уже использовали все элементарные делители, то других инвариантных множителей положительной степени не может быть. Поэтому Ег (λ) ss Ει (λ) =s 1. Указанный выше метод вычисления инвариантных множителей по элементарным делителям оказывается полезным в случае диагональных и клеточно диагональных матриц. Квадратная матрица А называется диагональной, если все ее элементы, не лежащие на главной диагонали, равны нулю. Диагональная матрица А обозначается через А = {аь аь..., ап}, где в скобках указаны элементы главной диагонали. Аналогично квадратная матрица А называется клеточно диагональной, если на ее главной диагонали стоят квадратные матрицы Аи Л2,..., Ар а все элементы вне этой цепочки матриц равны нулю. Она обозначается через А = {АЬ Ла, ..., As].
90 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [6 Совокупность элементарных делителей клеточно диагональной (в частности, диагональной) λ-матрицы является объединением совокупностей элементарных делителей ее диагональных клеток ([14], стр. 118—119). В этом преимущество элементарных делителей по сравнению с инвариантными множителями. Пример 5. Найти каноническую форму диагональной λ-матрицы Λ(λ) = {λ2, 0, λ2 + λ, λ2— Ι, λ*—λ2}. Здесь порядок матрицы равен 5, а ранг равен. 4. Поэтому Еь (λ) = 0. Элементарные делители диагональных элементов: λ2, λ, λ -μ 1, λ + 1, λ — 1, λ2, λ + 1, λ — 1. Значит, £4(λ) = λ2(λ+!)(λ-1)=:λ*-λ2, £$(λ) = λ2(λ+1)(λ-~!) = λ*-λ2, £8(λ) = λ(λ + 1) = λ2 + λ, ^(λ)=1. Каноническая форма имеет вид {1, λ2 + λ, λ4—-λ2, λ4— λ2, 0}. Пусть А — квадратная матрица с элементами из данного поля К· Инвариантные множители и элементарные делители ее характеристической матрицы \Е—Л (или А—\Е) называются соответствейно инвариантными множителями и элементарными делителями матрицы Л. Все инвариантные множители матрицы А отличны от нуля, и сумма их степеней равна порядку η матрицы Л. Поэтому сумма степеней элементарных делителей матрицы А также равна ее порядку. Так как ранг матрицы \Е—А равен я, то по элементарным делителям матрицы А однозначно определяются ее инвариантные множители. О связи элементарных делителей матриц А и /(Л), где /(λ) — многочлен (или любая функция, для которой /(Л) имеет смысл), см. [6], гл. 6, § 7. 6. Матричные многочлены. Матричным многочленом называется выражение вида /ЧХ)=л0Х* + Л1Х*-'-Ь.. + Л„ где λ— переменное и Л0, А%9 ..., А$ — квадратные матрицы с числовыми элементами одного и того же порядка п. Число η называется порядком многочлена F(X). Если Л0 Ф· 0, то число 5 называется степенью матричного многочлена F(X). Если матрица Лф не вырождена, т. е. |Л0|^0, то матричный многочлен F(X) называется регулярным. Любую квадратную λ-матрицу можно представить в виде матричного
61 § 1. МАТРИЦЫ 91 многочлена, и обратно. Например, Два матричных многочлена одинакового порядка можно складывать, вычитать и умножать аналогично обычным многочленам с числовыми коэффициентами, с той разницей, что умножение числовых матриц, а потому и матричных многочленов не обязательно коммутативно. Степень суммы или разности двух матричных многочленов не выше большей из их степеней. Степень произведения двух матричных многочленов не выше суммы степеней сомножителей, а если хотя бы один из сомножителей регулярен, то равна этой сумме. Ввиду некоммутативности умножения для матричных много-, членов определяются два деления с остатком — правое и левое. Пусть даны два матричных многочлена F(\) = A0\s + A1V-t + ..;+As, 0(\) = Β^-\-Β1\<-ί + ... + Β< одинакового порядка я, причем многочлен О (λ) регулярен. Тогда существуют однозначно определенные правое частное Я (λ)· и правый остаток /?(λ), удовлетворяющие условиям /?(λ) = Ρ(λ)0(λ) + /?(λ), | причем или степень /?(λ) меньше степени О (λ), \ (2.22) или /?(λ) = 0, J а также левое частное Q(i) и левый остаток S(X), удовлетворяющие условиям F(X) = 0(X)Q(X) + S(X), | причем или степень S(X) меньше степени О (λ), ν (2.23) или S(X) = 0 J ([6], стр. 70). При правом делении делитель стоит справа, а при левом — слева от частного. Обобщенная теорема Без у. При делении матричного многочлена F(X) на регулярный многочлен \Е — А (или на Л — \Е) правый остаток равен правому значению делимого F(\) при λ = Λ, τ. е. матрице Ρω(Α) = Α9Α* + Α1Α*-ί + ... + Α$,
92 ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [" а левый остаток — левому значению делимого F(\) при λ = А т. е. матрице>(9)(Л)=ЛМ0 + Л5-М,+... + Л5. Отсюда следует, что F(\) тогда и только тогда делится справа {слева) на \Е— А или на А— \Е, когда Р(1)(Л) = С (соответственно F{%)(A) = 0). 7. Характеристические числа и собственные векторы матрицы41)· Характеристической матрицей для квадратной матрицы A = (aiJ)rl с числовыми элементами называется λ-матрица λ — Д|, —а13 ... —atny #21 λ Оад ... Оцп \Е — А = \ — αηί — апъ ... λ —< где λ — независимое переменное. Характеристическим многочленом матрицы А называется многочлен от λ, равны* определителю характеристической матрицы, т. е. λ — α„ —ап ... —ain — α2ί λ — Оэд ... — <hn \\E— A\ = ~ап\ —an* Корни характеристического многочлена называются характеристическими числами (или характеристическими корнями, или собственными значениями) матрицы А. Совокупность всех характеристических чисел λ,, λ^, ..., λΛ, где каждое число выписано столько раз, какова его кратностс как корня характеристического многочлена, называется спектром матрицы Л. Уравнение \\Е—Л| = 0 называется характеристическим (или вековым) уравнением матрицы А Собственным вектором матрицы А, принадлежащим собственному значению λ,, называется ненулевой вектор а = (<хь оъ, . ., <х„), для которого столбец X, составленный из его координат, удовлетворяет матричному уравнению *) Здесь даны понятия характеристических чисел и собственных векторов матрицы. Свойства собственных векторов линейных преобразований * (или линейных операторов) можно найти в любом учебнике высшей алгебры (см., например, [6], [И]).
7] § 1. МАТРИЦЫ 93 АХ=\Х. Это уравнение можно записать в виде (Х^£ — — А) Х=0. Отсюда ясно, что координаты вектора а являются решением однородной системы линейных уравнений с матрицей \tE — А, полученной из характеристической матрицы λ£? — А при λ = λ^ τ. е. системы — я/!*! — алхъ— ... + (λί — %) *j — . .· — «уЛ^Л = 0, /=1,2, ...,л. Часто в литературе встречается другое определение характеристической матрицы — как матрицы А — λ£. В этом случае характеристический многочлен определяется -как \А—λ£|, характеристическое уравнение принимает вид \А — λ£ | = О и в системе уравнений, служащей для вычисления собственных векторов, все коэффициенты изменяют знак. Но все существенные свойства характеристических чисел и собственных векторов остаются прежними. В частности, не изменяются спектр матрицы А и совокупность собственных векторов, принадлежащих данному характеристическому числу λ,. Характеристический многочлен матрицы А порядка η является многочленом n-й степени от λ со старшим коэффициентом, равным единице, и потому всегда отличен от нуля: Если записать его в виде \\E-A\ = -kn + ct\n-* + ... + ck\»-k + ... + cnt (2.24) то его коэффициенты следующим образом выражаются через элементы -матрицы А: ^ ck = (-l)fcSk, (2.26) где Sk — сумма всех главных миноров (т. е. миноров, симметрично расположенных относительно главной диагонали) порядка k матрицы А. В частности, '1 = -(Дц+ДМ + ... + 0> сп = (— \)п\А\. (2.26) Сумма диагональных элементов $л = Яц-|-<*ю-|-...-{-аЛ„ называется следом матрицы Л. Так как по формулам Виета корни характеристического многочлена (2.24) удовлетворяют равенствам КК ··· λΛ=(—iYct»
94 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [7 то из (2.26) следует λι + λ, + ...-|-λΛ = $Α> *Л ...ХЛ = |Л|, (2.27) т. е. сумма характеристических чисел матрицы Л равна ее следу, а произведение — определителю. Аналогично из (2.25) следует, что, вообще, значение элементарной симметрической функции ok (см. гл. III) от характеристических чисел матрицы Л равно сумме главных миноров порядка k матрицы А. Если под характеристическим многочленом понимать \А — \Е |, то формулы (2.24) — (2.26) изменятся так: \А-\Е\ = (-\)П« + сГ-1 + ... + ск\п-* + ... + сп; ([8], стр. 108). Формулы (2.27) не изменятся. Из (2.27) следует, что матрица А тогда и только тогда имеет хотя бы одно характеристическое число, равное нулю, когда она вырождена, |Л| = 0. Квадратная матрица А называется нильпотентной, если Ak = Q при некотором Целом положительном k. Матрица А тогда и только тогда* нильпо- дентна, когда все ее характеристические числа равны нулю. Теорема Гамильтона — Кэли. Любая квадратная числовая матрица А является корнем своего характеристического многочлена, т. е. аннулирует его при подстановке λ-* Л: если φ(λ) = |λ£— А |, то <р(Л) = 0([14], стр. 26 или [6], стр. 74). Если \ь λ,, ..., λΛ — спектр матрицы Л, то для невырожденной матрицы А спектр обратной матрицы А"1 образуют числа Xj \ Xf \ ..., λ; * и, вообще, для любого целого * спектр матрицы Л* имеет вид λ*, λ*, ..., λ£; если же матрица А вырождена, то последнее утверждение остается верным для целых положительных *. Если g(\)— любой многочлен с числовыми коэффициентами и Л — любая квадратная матрица порядка η со спектром \и λ^,..., Xm то матрица g(A) имеет спектр g(kt)t £гОД..., g'frn) №]> стр. 75). Отсюда в силу (2;27) находим \g(A)\ = g(\t) g(h)...g(K) = R(b el (2-28) где /?(φ, g) -r результант характеристического многочлена φ(λ) = |λ£?—А\ и данного многочлена g(\) (гл. III).
8| § 1. МАТРИЦЫ 95 Присоединенной матрицей для характеристической матрицы \В—Л, где A = (atMt называется матрица 5(λ)= =(*ί/(λ))?> где элемент by (к) есть алгебраическое дополнение элемента β/* (λ) из у-й строки и i-ro столбца матрицы λβ—г А. Матрица В (λ) есть матричный многочлен от λ степени η—1. Справедливо равенство (λ£ — Α)Β(\) = Β(\)(\Ε — Α)=\λΕ — А\Е, (2.29) где Ε—единичная матрица. Отсюда связь присоединенной и обратной матриц: В (λ) = | \Е — А | (λ£ — А)-К (2.30) Зная коэффициенты характеристического многочлена (2.24), можно вычислить присоединенную матрицу В (λ). Пусть φ(λ) = = |λ£—А\. Частное Α (λ, μ)=-^^ χ ~У есть многочлен от двух переменных λ и (а. Тогда £(λ)=Α(λ£, А) ([6], стр. 75—76). Если λ0 — любое характеристическое число матрицы А и 5(λ0) ^ 0, то каждый ненулевой столбец матрицы Β(λΦ) будет собственным вектором матрицы Л, принадлежащим значению λφ. Д. К. Фаддеев указал метод одновременного вычисления коэффициентов характеристического многочлена и присоединенной матрицы (см. [6], стр. 77). 8. Минимальный многочлен матрицы. Аннулирующим многочленом для квадратной матрицы А порядка η называется многочлен _/(λ) с числовыми коэффициентами, для которого f(A) = 0. Нулевой многочлен является аннулирующим для любой матрицы А. Любая матрица А порядка η имеет аннулирующий многочлен n-й степени. Таким многочленом по теореме Гамильтона — Кэли (стр. 94) будет характеристический многочлен матрицы А, т. е. φ(λ)=|λ£—А\. Любая матрица А имеет бесконечно много аннулирующих многочленов. Минимальным многочленом квадратной матрицы А порядка η называется отличный от нуля аннулирующий многочлен для матрицы А минимальной степени, взятый со старшим коэффициентом, равным единице. Для любой матрицы А
96 гл. п. матрицы и квадратичные формы [8 порядка η минимальный многочлен существует, определен однозначно и имеет степень не выше л. Пример 1. Минимальный многочлен нулевой матрицы равен λ, а единичной матрицы Ε равен λ— 1. Многочлен /(λ) тогда и только тогда является аннулирующим для матрицы Л, когда /(λ) делится на минимальный многочлен ψ (λ) этой матрицы. В частности, характеристический многочлен φ (λ) матрицы Л всегда делится на минимальный многочлен ψ (λ) этой матрицы. Некоторая степень минимального многочлена, например [ψ{λ)]Λ, где η — порядок матрицы Л, делится на характеристический многочлен φ (λ) той же матрицы. Пример 2. Найти минимальный многочлен инволютивной матрицы Л, т. е. матрицы, для которой Л2 = £. В данном случае Л2—Е = 0. Поэтому аннулирующим многочленом будет /(λ) = λ8—1. Так как минимальный многочлен делит любой аннулирующий, то возможны случаи: ψ(λ) = λ-1, ψ(λ) = λ + 1, ψ(λ) = λ*-1. В первом случае Л — Е = 0, Л = £. Во втором Л + £ = 0, Л = — Е. В третьем Аф±.Е. Итак, если Аф±.Е к А2~Е, то ψ(λ) = λ* — 1. Если Ζ)„_ι(λ) — наибольший общий делитель миноров (п—1)-го порядка характеристической матрицы λΕ— Л, а Οη(λ) = \λΕ — Л |, то минимальный многочлен ψ (λ) матрицы Л можно найти по формуле где Εη(λ)— последний инвариантный множитель матрицы λΕ — А (стр. 83) ([6], стр. 81). Отсюда ясно, что минимальный многочлен тогда и только тогда совпадает с характеристическим многочленом, когда Df^iQ)=l9 т. е. когда матрица \Е—Л имеет лишь один инвариантный множитель, отличный от единицы, именно Еп (λ). Минимальный многочлен клеточно диагональной матрицы А = {Аи Л2,..., As} равен наименьшему общему кратному минимальных многочленов диагональных клеток Л/.
S] § 1. матрицы 97 Пример 3. Найти минимальный многочлен матрицы 1 0 0 0\ 0 2 0 0 А~1 0 0 2 1 0 0 0 2/ Ищем минимальные многочлены диагональных клеток. Для Л = (1) <Μλ) = λ-1, для Л2 = (2) ψ8(λ) = λ—2, для Л8=( ~ ) ищем делители миноров: Di(\) = \t Ds(X) = = (λ —2)». По формуле (2.31) Минимальный многочлен матрицы А равен наименьшему общему кратному многочленов ψι (λ), ψ8 (λ), ψ, (λ), т. е. ψ (λ) =(λ — ι) (λ —2)». Приведенная присоединенная матрица. Пусть Οη_ι(λ) — наибольший общий делитель миноров (п—1)-го порядка матрицы \Е— Л. Так как все элементы присоединенной матрицы β (λ) (стр. 95) отличаются от этих миноров лишь, может быть, знаком, то /)Λ_ι(λ) буд^т наибольшим общим делителем всех элементов матрицы В (к). Поэтому θ(λ) = /ν.ι(λ)0(λ), (2.32) где С (λ) является λ-матрицей и называется приведенной присоединенной матрицей для характеристической матрицы ЬЕ- А. Из равенств (2.31), (2.32) и (2.29) на стр. 95 находим (\Е— Л)С(Х)=С(Х)(ХЯ — Λ) = ψ(λ)£. (2.33) Отсюда связь матрицы С (λ) с обратной матрицей: С (λ) = ψ (λ) (\Ε — А)'1. (2.34) Зная минимальный многочлен ψ (λ) матрицы Л, можно, найти приведенную присоединенную матрицу С (λ) матрицы λΕ — Л. Именно/пусть g(\f μ>)= ^* χ~ —многочлен
98 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [9 от двух переменных λ, μ. Тогда C(X) = g(\E, A) (2.35) (16], стр. 81). Переходя в равенстве (2.33) к определителям, получим | λ^— Л | J С(Х) | = [ψ (λ)]». (2.36) Если *λ0— любой корень характеристического многочлена матрицы Л, то (в отличие от β (λ)) С(Х0)^0 и любой ненулевой столбец матрицы С(Х0) будет собственным вектором матрицы А, принадлежащим- значению λ0 ([6], стр. ,81). 9. Подобные матрицы. Квадратная матрица А называется подобной матрице В, если существует невырожденная матрица Г, для которой В=ГХАТ. (2.37) При этом если элементы матриц А и В принадлежат числовому полю К (см. Введение), то преобразующую матрицу Τ всегда можно взять также с элементами из поля ΛΓ. Говорят также, что матрица А трансформируется в матрицу В при помощи матрицы Г. Отношение подобия обладает тремя основными свойствами: рефлективность: А подобна А; симметрия: если А подобна В, то и β подобна А; транзитивность: если А подобна В и В подобна С, то А подобна С. В силу симметрии можно говорить о подобии двух матриц без указания их последовательности. Из этих свойств вытекает, что множество всех матриц данного порядка с элементами ид поля, К разбивается на классы подобных' матриц так, что две любые матрицы из одного класса подобны, а из разных классов не подобны между собой. Возникает вопрос о канонической форме матрицы, характеризующей данный класс подобных матриц.' Этот вопрос рассматривается ниже в пп. 10—12. Критерий подобия матриц. Для того чтобы две матрицы А и В были подобны, необходимо и достаточно, чтобы их характеристические матрицы \Е — А и \Е— В (рассматриваемые как λ-матрицы) были эквивалентны (стр. 82) ([14], стр. 123 или [6], стр. 124). В силу критериев эквивалентности λ-матриц (стр. 87) и свойств элементарных делителей характеристических матриц
*ϊ § 1. МАТРИЦЫ 99 (стр. 90) для подобия матриц А и В (одинакового порядка) необходимо и достаточно каждое из следующих условий: 4) матрицы А и В имеют одинаковые инвариантные множители; 2) матрицы А и В имеют одинаковые элементарные дели· тели; 3) существуют обратимые λ-матрицы Ρ (λ) и Q (λ), удовлетворяющие равенству \Е— Β=Ρ(λ)(λ£— A)Q(\). (2.38) Таким образом, чтобы узнать, будут ли матрицы А и В подобны, достаточно найти инвариантные множители матриц λΕ-r-A и \Е—В любым из указанных, в п. 5 методов. Более сложным является отыскание преобразующей матрицы Т, удовлетворяющей равенству (2.37). Таких матриц бесконечно много. Если Г0 — любая такая матрица, то все преобразующие матрицы найдутся из равенства Т=СТ^ где С/— любая невырожденная матрица, перестановочная с А. Отыскание всех матриц, перестановочных с Л, дано на стр. 78. . Первый метод построения преобразующей м а τ ρ и ц ы. Из .(2.37) найдем: А Т= ТВ. Приравняв элементы, получим /г* однородных линейных уравнений для элементов ttJ матрицы 71 Надо взять любое решение этой системы, для которой матрица Τ не вырождена. Для этого можно сначала найти общее решение системы, заменить в определителе, |£*у ft все главные неизвестные их выражениями через свободные неизвестные. Получится многочлен, не равный нулю тождественно. Поэтому можно найти такие значения свободных неизвестных, для которых этот многочлен отличен от нуля. Этими значениями однозначно определятся все элементы матрицы Г. Пример 1. Доказать, что матрицы -с -J) ■ -с =;) подобны, и найти преобразующую* матрицу Г, для которой £ = = Т~1АТ.. Инвариантные множители характеристических матриц λ£—А и \Е—В одинаковы: £ι(λ)=1, Ε8(λ) = λ« — 3λ + 5. Поэтому матрицы А и В подобны. Полагая
140 ГЛ. II. МАТРИЦЫ Ό КВАДРАТИЧНЫЕ <ΦΟΡМЫ β и приравнивая элементы матриц в равенстве ЛГ=Щ получим x—3z = 4x + 3yt y—dt ==—3x'r-y9 y+2t=*—3* —f: Решая методом исключения, найдем два линейно независимых уравнения: y-f Зг-Ь3* = 0. Общее решение: лгя=2з + 3/, ^= — 3*—3*. Подставляя эти зна*гё- ния χ и у в определитель, найдем·' Беря, например, ζ = —1, *=1, получим |Г|==1, jts»lf· }?а*0, откуда Г* ■и :)· Второй метод построения- преобразующей матрицы. Если матрицы А и В подобны, то их характеристические матрицы λ£—А и λ£—В эквивалентны. По· этому существуют обратимые Х?матрицы Ρ (λ) и Q(\), удовлетворяющие равенству (2.38). Метод их построения указан на стр. 87. В данное случае достаточно найти лишь,матрицу Q(X). За искомую матрицу Г можно взять остаток от деления матрицы <3(λ) справа н# матрицу λ£—В (стр. 91). Если Q(X)=C0X*-f-Ci^~! + ... Н-С** то по обобщенной теореме Безу (стр. 91) r=Q<1>(5)==C0Bs + C1Bi-t+ ... *\~Cs. Однако практически удобнее матрицу Τ искать по схеме, аналогичной схеме Горнера для деления многочлена на двучлен χ—а (гл. III). Именно, ищем матрицы Dif определенные рекуррентным соотношением: Д0=С„ Di^Ci + Dt-iB, 1=1, 8, ..., sf T=D„ (2.39)
10] § 1. МАТРИЦЫ 401 Из критерия подобия следует, что если матрицы А и В "подобны, то равны их характеристические и минимальные мно**йлены. .Обратное утверждение неверно. Каждая матрица А подобна своей транспонированной матрице А\ так как матрицы \Е—А и \Е—Л' имеют.одинаковые делители миноров и потому эквивалентны. Если хотя бы одна из двух матриц А и В, например Д не, вырождена, то матрицы А В и В А подобны, так как Аф:^ВГх{ВА) В.. Это, утверждение неверно, если обе матри- дй А и £'вырождены. Если матрицы А и В подобны и /(λ) — любой многочлен, то и матрицы/(Л) й/(£) поАобны, и притом с той же преобразующей матрицей, т. е. если В = Т~\АТ, то /(В)=± Tlf(A)T. Матрица А подобна матрице В, полученной из А лкубой перестановкой строк- и такой же перестановкой столбцов. При этом B~T~xATt где Τ получается применением той же перестановки к столбцам единичной матрицы. Любая числовая матрица А подобна над полем, комплексных чисел треугольной · (по желанию, верхней или нижней) матрице. Вообще, матрица А, все элементы и характеристические числа которой лежат в числовом поле /С, подобна Над К треугольной матрице (п. 11). 10. Диагональная форма матрицы. Каноническая форма квадратной матрицы А порядка я, т. е. матрица В специального вида, характеризующая класс матриц, подобных данной матрице Л, определяется неоднозначно, если ставить задачу отыскания канонической формы В возможно более простого вида. Наиболее простым и практически важным является случай, когда данная матрица А подобна диагональной матрице В= =={λι, λ*, ..., λΛ} (стр. 89). При этом числа \it стоящие на диагонали матрицы В, являются характеристическими числами матрицы А с учетом их кратности. Однако, не любая матрица А подобна диагональной матрице. Именно, имеет Место Первый критерий существования ' диагональной формы. Для того чтобы матрица А с элементами из числового поля К (см. введение) была подобна над К диагональной матрице В, т. е. чтобы существовала невырожденная матрица Тс элементами из /С, удовлетворяющая равенству B=TlATf (2.40)
Ю2 ГЛ. И. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [10 необходимо и достаточно выполнение двух условий:: а) последний инвариантный множитель Еп(Ц (стр. 83) или, что то же самое, минимальный, многочлен ψ (λ) (стр., 96, (2.31)) матрицы А не имеет кратных корней; б) все характеристические числа матрицы А принадлежат полю /С Условия а) и б) можно заменить эквивалентным требованием: все элементарные делители матрицы А над полем К должны быть многочленами первой степени ([14], стр. 127). Если К—поле комплексных чисел, то условие б) всегда выполняется. Более простым является Достаточное условие существования диагональной формы. Если все характеристические числа матрицы А с элементами из числового поля К также лежат в поле К и характеристический многочлен^ \Е— А | не имеет кратных корней, то матрица А подобна над К диагональной матрице В. При этом на диагонали матрицы В должны стоять характеристические числа матрицы А. Любую числовую матрицу сколь угодно мзлым измене· нием элементов можно превратить в матрицу, подобную диагональной матрице над полем комплексных чисел. Второй критерий существования диагональной формы. Для того чтобы матрица А с элементами из числового поля К была подобна над К диагональной матрице В, необходимо и достаточно, чтобы все характеристические числа матрицы А лежали в поле К и чтобы матрица А имела η линейно независимых собственных векторов. Правило построения преобразующей матрицы Г, приводящей матрицу А к диагональной форме В. 1) Если характеристический многочлен не имеет кратных корней, то, беря для каждого корня \t любой собственный вектор еь {=1, 2, ..., я, получим линейно независимую систему векторов (столбцов). Невырожденная квадратная' матрица Т, образованная из этих столбцов, и будет •искомой преобразующей матрицей. 2) Если характеристический многочлен имеет кратные корни, тго для каждого корня λ, кратности k% ищем фундаментальную систему решений (стр. 63) однородной системы линейных уравнений a/i*i + ... +(*// —λ,)*, + ... +Я/Л*Л = 0, у=1, 2, ...,/!· (2.41)
10] § 1. МАТРИЦЫ 108 Если для каждого корня X/ эта фундаментальная система содержит ровно kt решений, то, ставя координаты решений всех' этих фундаментальных систем по столбцам матрицы Г, мы получим преобразующую матрицу. 3) Если хотя бы для одного корня λ, фундаментальная система решений для системы уравнений (2.41) содержит менее чем kt решений (можно доказать, что более kt решений она содержать не может), то матрица А не будет подобна диагональной матрице, и преобразующей матрицы Г не суще· ствует. Пример 1. Показать, что матрица 7 —12 6^ Л: (/ — и о \ 10 —19 10 J 12 —24 13/ подобна диагональной матрице В, и найти эту матрицу В и преобразующую матрицу Т. Вычисляем характеристический многочлен: λ— 7 12 — 6 — 10 λ+1Φ —10 — 12 24 λ—13 (ко второму столбцу Прибавляем удвоенный первый) λ— 7 2λ —2 — б _Ю λ—1 —10 — 12 0 λ —13 (из второго столбца выносим λ—1 и из первой строки вычитаем удвоенную вторую) λ+13 0 14 = (X — 1> | —10 1 —10 — 12 0 λ —13 (разлагаем по второму столбцу) λ + 13 . 14 — 12* λ —13 -<*-!> (к первой строке прибавляем вторую, затем из второго столбца вычитаем первый) = (λ-ί) λ+.Ι 0 — 12 λ —1 =(*-i)s(* + i); λι = Xg = 1, λ* = — 1·
104 ГЛ. 1Ь МАТРИЦЫ И КВАДРАТИЧНЫЕ <Й№МЫ [Ю Для корня 1 система (2.41) принимает вид 6*1— 12*1+ 6*$ = 0, 10*, — 20*, -|- Ю*· ш О, 12*! —24*,+ 12*$=Л>. Ее ранг равен единице и фундаментальная система состоит из двух решений/ например: *! = (2, 1,0), *,:=(1, 0,-1). Для корня —1 получаем систему 8*! —12*!+ 6*»=*0, 10*t — 18*f + 10*s« 0, 12*! — 24*8 +14*» s= 0 ранга 5. Фундаментальная система состоит из одного решения, на-' пример: *в = (3, 6, 6). Так как в обои* саучаЪх'число решений равно кратности корня, то матрица А подобна диагональной* матрице у1 0 0\ Я = (0 1 0Ь \0 0 —1/ Записывая координаты векторов еи *а> *· по столбцам, подучим.' преобразующую матрицу /2 л ач ГЦ 1 0 5 ; \0 —1 6/ Диагональная матрица В для данной матрицы А определена однозначно с точностью до порядка диагональных Элементов. Матрица Τ определена неоднозначно. Так, в предыдущем примере за et и е% можно принять любую фундаментальную систему решений соответствующей системы уравнений. Порядок столбцов в матрице Τ соответствует порядку диагональных элементов матрицы S. Примера Выяснить, подобна ли диагональной матрице матрица Л = ( 5 —3 3]. \_д о —2/ Вычисляя характеристический многочлен, например, разложением по третьей строке, Найдем
10] § 1. МАТРИЦЫ Ш Собственные векторы ищем из системы уравнений* 3*!— *84-2x$ = 0, —Χι — л:$ = 0. Ее ранг равен двум.. Фундаментальная система .состоит, из одного решения» например: £=(1, 1, —1). Так как трикратному корню — 1 соответствует один линейно независимый собственный вектор, то матрица А не будет подобна диагональной матрице. Если Действительная матрица А порядка η подобна над прл^'койп^ матрице ' 4£={λι> λ^, ..., \n}t не все диагональные элементы которой, действительны, то она над полем действительных чисел подобна действительной, клетрчйо дшаг^нальной .матрице В с клетками первого и второго порядка*,Именно если λ|.:= αχ «4- 1Ъ\, \i=*ai—ЛЬь λ8 =5с α9 rj- \Ь<ь где-«ислэ-.ал, ^, сл действительны:rf &Λ положительны, то Таким образом, клетки первого лодадка соответствуют действительным корням; а клетки второго порядка — парам сопряженные комплексных корней характеристического много· члена матрицы Α.. Преобразующая матрица Τ строится следующим образом: систему собственных векторов матрицы А можно . выбрать так, что , если для комплексного корня λ9Λ_, = αΛ-}-*** взят вектор ,*«м— #* + (?*» где векто-» ры Xkt yk имеют действительные координаты, то для λ3Λ = αΛ — ib/t' берется4 вектор' *9*=**—-pk> A=l» 2, ..., q. Для действительного λΛ берется вектор zk с действительными координатами. Тогда' по столбцам матрицы Τ должны стоять координаты векторов &U *и У* #9» · · · > yqt Xqt 390+1» · · · > %п ([6], стр. 234—232).
106 ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [И 11. Жорданова форма матрицы. Так как по предыдущему пункту не всякая матрица подобна диагональной, то рассматривают другие канонические формы матриц. Одной из простейших канонических форм, существующей для любой матрицы, является жорданова форма.' Клеткой Жордана называется квадратная матрица вида ίλ0 1 0 ... 0\ 0 λ0 1 ..; 0 \ I (2.42) 0 0 0 ... 1 / 0 0 0 ... λ0/ где на главной диагонали стоит одно и то же число λ0 и $се элементы одного ряда выше диагонали равны единице. Иногда ряд единиц пишут не выше, а ниже диагонали, что не вносит существенных изменений в теорию. }КорЬановой матрицей называется клеточно диагональ· ная матрица . * B = {Blt В»,.., Bs}f (2.43) в которой на главной Диагонали стоят любые клетки Жор· дана £„ Вь ..., В„ а все элементы вне этих клеток равны нулю. Пример 1. Матрица ρ 11 о о ι о о о | о\ /о 2 I о о ! о о о ! о \ |о о | 2 ϊ Гоо о'ГоΊ 0 010210001 О В Η : ч 1 I 0 0 ] 0 0 i 0 1 0 | О I 110 0 [ 0 0 1 0 0 1 ! О I о о ! о о 1 о о о ! о/ д : |м# · I ρ о i о о 1 о о о I о/ является жордановой. Она содержит четыре клетки Жордана: две клетки второго порядка с числом 2 на диагонали, одну клетку третьего порядка с числом 0 на диагонали и одну клетку первогр порядка с числом 0 на диагонали.
11] § 1. МАТРИЦЫ 107 Любая квадратная матрица Л, все элементы и характеристические < числа которой лежат в числовом поле К подобна над К жордановой матрице В. В частности, любая числовая матрица .подобна над полем комплексных чисел жордановой матрице. Вообще, так как любое поле К содержится в алгебраически замкнутом поле К (гл. IV), то любая квадратная матрица А. с элементами из К подобна над ~К жордановой матрице В. Для данной матрицы А подобная ей жорданова матрица В определена однозначно с точностью до порядка расположения клеток Жордана Ви Ц}ь ..., Bs на главной диагонали. Эта матрица В называется жордано· еой формой, матрицы Л. Таким образом, каждый класс подобных матриц с элементами из алгебраически замкнутого поля содержит одну или конечное число жордановых матриц, получаемых друг из друга перестановкой диагональных клеток. Две жордановы матрицы с элементами из поля К тогда и только тогда подобны между собой, когда они различаются лишь порядком следования клеток Жордана ([14], стр. 124, теорема 4). Пример 2. Матрицы 2 1 0<0\ /2 0 00\ О 2 0 0 \ [02101 0 0 2 0 I И I 0 0 2 0 I 000 2/ \0 0 0 2/ подобны, как жордановы матрицы, состоящие из одних и тех же трех клеток Жордана и различающиеся лишь расположением этих клеток. Эти матрицы* не подобны матрице 2 1 00\ 0 2 0 0 \ 0 0 2 1 Г 0002/ содержащей две клетки Жордана. Правило построения жордановой формы матрицы. Если все элементы и характеристические числа матрицы А лежат в числовом поле К то над этим полем элементарные делители матрицы А или, что то же самое, ее
Л* ГЛ. MI. МАТРИЦЦ И КВАДРАТИЧНЫЕ ФОРМЫ t!i характеристической матрицы \Е—А будут степенями линейных множителей, т. е. будут иметь вид (λ-λ,)4 (λ-λ9)4...(λ-λ/.; Для каждого элементарного делителя (λ — λ,)** строим клет> ку Жордана В,= 'λ, 1 О О λ, 1 ,0 0 О порядка kl с числом λ/ на диагонали. Клеточно диагональная матрица В = { Ви Вь ..., Bs} с этими клетками на диагонали и будет* жордановой формой Matрицы А. Пример 3. Найти жорданову форму матрицы /4—5 2 0 0 0 \ [5—7 3 0 0 0 6—9 4 0 0 0 О 0 0 0 .1 О |θ 0 0—440 0 0—212 с Ищем элементарные делители этой матрицы. Так как она клеточно диагональна, то можно искать элементарные делители каждой из двух клеток (стр. 90). Для клетки /4—5 2 Λι=Ι5 —7 3 \6 —9 4 делители миноров характеристической матрицы \Е — А\ будут Dt(k) — DM<k)**h 7>8(λ)=λ»(λ-ί). Их можно найти тем же методом, как в примере 2 на стр. 85. Поэтому инвариантные множители Ьавны 1, 1, λ8 (λ—1) и элементарные делители равны λ2, λ—1. Также для второй клетки
"1 §.!♦ МАТРИЦЫ 11,Ζ>8(λ)*λ—2> D$(λ) «*<λ-2)*. Инвариантные множители: 1, λ—2, (λ —2)2; элементарные делители; Д^Д'(λ--2)V Поэтому жорданова форма матрицы А содёр- жйт четыре клетки и имеет вид находим делители миноров: Ζ>ι(λ) = н: 1, λ — В? /° ι! 'оо I о'"о* оо 00 \оо о о ....... \\\ 'Т о о о о . о а о О 0 t о о J о о о. Q 2 1 |/ ..ΙΟ 0Ϊ02 Матрицу ι. Т, преобразующую данную* матрицу А к жордановой форме В, можно найти по общим методам, указанным в п. 9. Од? нако в данном случае существуют и более экономные пути построения матрицы Г, связанные со свойствами линейных операторов и выходящие за рамки настоящей главы (см., например, [6], гл. 6, $ 9 или [20], задача 1529). Вычисление значения многочлена f(x) от жордановой матрицы Bt=s { Bit £*'..· ,BS\ производится по формуле /(^)=*{/(£ι), /(Β№;ίι/(Β3)\>τ. е. сводится к вычислению значений этого многочлена от-жордановых клеток. Значение многочлена f(x) от жордановой клетки Во= Xt 1 0 ... 0< _/ 0 λφ 1 .Г. О ,0 0 0 ... λφ" порядка η вычисляется по формуле |/(λο)/(Αβ) —5Г ·- <n-i)lV /(*·)' /«"-"fro) <«-2)l. \ο /(λο) ,/ ([14], стр. 134, (3)). По той же формуле вычисляется значение любой функции f(x) от жордановой клетки 5* если
НО гл. и. матрицы и квадратичные формы 112 только значения имеют смысл. В частности» степени жордановой клетки £?ф вычисляются по формуле ви=1о λ* Щ-* ... СГ2 λ?-*+21 \0 0 0 ... λ* / Чтобы найти жорданову форму матрицы /(А), Где А —* данная квадратная матрица и f(x) — многочлен (или. любая функция, для которой значение /(А) имеет смысл), достаточно, по данному &ыше правилу построения жордановой формы, знать элементарные делители матрицы /(А). Об их вычислении см. [6], гл. 6, § 7. 12. Естественная форма и другие канонические формы матрицы. Жордановы матрицы, определенные в предыдущем пункте, не находятся во взаимно однозначном соответствии с классами подобных матриц над данным числовым полем/С, лишь с точностью до перестановки клеток Жордана. Укажем каноническую форму, свободную от этого недостатка, хотя и не столь детализированную, как жорданова форма· Пусть дан многочлен /(λ) = а0+V + α9λ* +:... + an-iX*1-1 + λ* степени п^>0 с коэффициентами из поля К со старшим коэффициентом, равным единице. Сопровождающей матрицей многочлена /(λ) называется матрица / 0 .1 0 ... 0 0 \ 1 0 0 1 ... 0 0 В=\ . I о о о ... о ι 1 \— <*ο —<*i —<h ··· —Лл-« —αΛ-ι/ Эта матрица является квадратной порядка я, равного степени многочлена /(λ). Последний инвариантный множитель матрицы \Е—В равен /(λ), а все остальные — единице.
щ § 1. МАТРИЦЫ 111 Матрицей· естественной формы (или матрицей, имеющей естественную нормальную форму) называется, клеточно диагональная матрица В =з {В\> Въ,· · ·, Bs }f где диагональные клетки Ви £*····£, являются сопровождающими матрицами многочленов /t (λ), /9 (λ),,.., fs {λ), каждый из которых (начиная со второго) делится на предыдущий. Эта матрица является квадратной порядка я, равного сумме степеней многочленов /;(λ). Последние 5 инвариантных множителей матрицы λΕ—В равны соответственно/ι (λ), Α(λ)> ••·>Λ(λ)> а остальные η—5 равны единице. Любая квадратная матрица А с элементами из некоторого числового поля К подобна- над К единственной матрице В естественной формы ([14], стр. 128, теорема 5). Две матрицы естественной формы тогда и только тогда подобны между собой, когда они совпадают. Таким образом, каждый класс подобных матриц с элементами из поля К содержит единственную матрицу естественной формы. Правило построения естественной формы. Пусть А —квадратная матрица порядка η с элементами из поля /С Одним из методов, указанных в п. 5, строим инвариантные множители ее характеристической матрицы λ£—А. Пусть Λ(λ),Λ(λ),...,Λ(λ) — все многочлены положительной степени среди них, взятые с сохранением их порядка (так что каждый из них делится на предыдущий). Для каждого из этих многочленов ft (λ) строим сопровождающую матрицу £;. Заметим, что для многочленов первой степени λ — а сопровождающей матрицей будет матрица первого порядка (а). Клеточно диагональная матрица В={Вг, Вь ..., В$) будет естественной формой матрицы Л. Π ρ и м е ρ 1. Найдем естественную форму матрицы А из примера 3 предыдущего пункта (стр. 108). Там были найдены элементарные делители матрицы λΕ—А: λ», λ —1, (λ — 2)*, λ —2. Поэтому инвариантные множители будут Ε* (λ) = λ* (λ — 1) (λ — 2)* = λ*—5Χ* + 8λ» — 4λ«, £,(λ) = λ —2.
112 ГЛ. U· МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ Р2 Откуда О О О О \0 ΟΟΟΟΟΙ .- \ о о . о о 1 О о —8 У Однако, та же матрица А приводится к жордановой форме с рациональными элементами, как и сама матрица Л. Пример 2. Найти естественную форму матрицы 2 1 О О .0 1 0—1 О Делители миноров матрицы А—2 —1 О tE—4«( О λ —1 \0 1 λ будут Di(X) = Dg(X) = l, так как минор второго порядка в правом верхнем углу равен единице, и Ζ>$(λ) = (λ—2) (λ* + 1). Инвариант· иые множители: BiQ)wmB%Q)wm\,· £,(λ)«λ· — 2λβ + λ — 2. Так как характеристический многочлен не имеет кратных корней» то матрица А подобна диагональной матрице /2 0 0>* над полем комплексных чисел. В то же время матрица А уже над полем рациональных чисел подобна матрице естественной формы /О 1 0\ В* Квазиестественная форма/ Естественная форма не всегда является клеточно диагональной матрицей с наименьшими порядками диагональных клеток среди матриц»
12] § Л. МАТЮЙЩ на подобны^ ; данной матрице Диад числовым полем Ял Это ЕВДйо^йф! -fen из примера 1. Укажем форму, удовлетворяющаяся^ минимальности порядков диагональных клеток для данного поля К· Квазиестественной матрицей называется клеточно див· тональная матрица В = {Si, Вь. ♦., Bs}> где диагональные клет- . ки являются сопровождающими матрицами многочленов вида Κ(λ)1Ρι> [^^)П...Ль(Х)]р^ причем многочлены е,(Х), е9(Х),.... ,r*5(fc) неприводимы над полем К и имеют старшие коэффициенты,, равные единяде. Любая квадратная матрица А с элементами «в некоторого числового поля К подобна над К квазиестественной матрице Ву определенной однозначно* с точностью до порядка следования диагональных клеток. Эту матрицу В будем называть кеазиестестдешой формой матрицы Д. Две квазиестественные матрицы с элементами из поля К тогда и только тогда подобны между собой, когда они отличаются не более/чем порядком расположения диагональных клеток ([14], стр. 129). Пради,ло> гтостроени^ ' квазиестественной формы. Пуать дана квадратная матрица А с элементами из поля К. Ищем элементарные делители над К характеристической матрицы \Е—Ли для каждого из них строим сопровождающую матрицу. Эти матрицы в любом порядке принимаем за диагональные клетки клеточно диагональной матрицы В. Пример 3. Найдем квазиестественную форму матрицы А из примера 3 предыдущего пункта. Элементарные делители матрицы λ# — А равны λ2, λ — Ι, (λ — 2)2, λ —2. Поэтому искома» матрица имеет вид рГТ\ 0 0 0 ' 0 \ ДО 0| 0 0 0 0 1 Г 0 0 I 1 I 0 0 0 I Но о VpHTj ° Г 10 0 0 Г 4 4| 0 I 10 0 0 0 0 if 2') I Эта матрица не является жордановой.
114 гл. и. матрицы и квадратичные формы {12 Обобщенная форма Жордана. Примеры!—3 показывают, что естественная и квазиестественная формы -не являются обобщением жордаиовой формы. Укажем такое обобщение, которое можно всегда осуществить, не выходя за пределы данного числового поля К (и вообще любого поля К характеристики нуль (гл. IV)). Обобщенной клеткой Жордана для многочлена вида [е(Х)]р, где β (λ) — неприводимый над числовым полем К многочлен степени А^>0 го старшим коэффициентом, равным единице, и ρ — целое положительное число, называется клеточная матрица (Л0 Ε О ,., О \ О А. В ... О \ О 0 0 ... £ / о о о ... aJ где Л о — сопровождающая матрица многочлена t(X) (в смысле, указанном в начале этого пункта) и Ε—единичная матрица порядка k. Матрица 50 состоит из φ* квадратных клеток порядка k и имеет порядок, равный kp. Ее характеристическая матрица \Е—50 имеет над полем К единственный элементарный делитель [β (λ)]' ([14], стр. 129, лемма 4). Обобщенной матрицей )КорЬана называется клеточно диагональная матрица В={ВЬ £9,..., Bs}, где все диагональные клетки являются обобщенными клетками Жордана. Любая квадратная матрица А с элементами из числового поля К (или любого поля характеристики нуль) подобна над К обобщенной матрице Жордана В. Матрица В определена однозначно .с точностью до перестановки обобщенных клеток Жордана. Она тогда и только тогда превращается в жорда- нову матрицу, когда все характеристические числа матрицы А лежат в поле К ([14], стр. 131). Заметим, что элементарный делителе [β (λ)]' обобщенной клетки Жордана £ф не изменится, если за матрицу Л0 взять любую матрицу порядка k с элементарным делителем β (λ). Это позволяет находить матрицы другой формы, подобные данной матрице А. Так, если К— поле действительных чисел, то неприводимыми над К будут лишь многочлены первой степени и многочлены второй степени λ*-|-/Α-|-0 с комплексными корнями α±φ, β т^О. Для элементарного дели·
12] § 1. матрицы 115 теля (λ*+/Λ + ί)Λ в матрице^ Д>. в качестве А0 можно.взять либо сопровождающую матрицу ί ._ __ L либо матрицу С· = ( _ о U. В самом деле,' Ι^-^·Ι = |λ7α λΙΙα | = λ'-2αλ + α* + β' = — * + !* + * Пример 4; Найти обобщенную жорданову форму над полем действительных .чисел для матрицы · /1 —I 0 0\ , [2 3 — 1 0\ Λ— 0 0 1 — 1* \0 0 2 3/ Характеристическая матрица: /λ —1 1 0 0 \ *\ 0 О —2 λ—3/ Разлагая ее опоеделитель по теореме Лапласа по первым двум столбцам, найдем делители - миноров: D4 (λ) = (λ2 — 4λ + 5)*, D* (λ) = 1, так как минор третьего порядка в правом верхнем углу равен [единице. Поэтому матрица Lc —Л над полем действительных чисел имеет единственный элементарный делитель (λ*— 4X-f-5)2. Бго кордо: 2±/, оба двойные. Обобщенная форма Жордана состоит из одной клетки В (01 1 0\ — 5 4 0 11 0 0 0 1 ΙΟ Ο —5 4/ Беря вместо сопровождающей [матрицы ί ^ Π матрицу Сл = = ( | q) согласно сделанному выше замечанию, получим другую форму матрицы, подобной матрице А, именно: , / 0 1 - 1 Оч /_1 о 0 1\ °.—I оо О η- Χ о О —Г О/ Матрица С (в отличие от В) не является обобщенной жорда- новой формой матрицы А.
1№ ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [13 18; ЯкобиеЬы матрйцы.^О вычислении якббйевых опре^ делителей см. гл. I, § 1, п. 8·. Доказательства приведенных ниже свойств якобиевых матриц см. в [7], гл. 2, § 1. Якобиевой матрицей называется матрица, у которой 'все элементы, стоящие вне главной диагонали и двух соседних с ней параллелей, равны нулю. Такую матрицу можно запи- сать в виде ι ах ~ЪХ 0 0 ... 0\ / — сх а% —Ьг 0 ... О \ 4« 0 — сг а9 --*8...0 L (2.44) \ 0 0 0 0 ;.. ап1 Мй .будем рассматривать лишь матрицы с действительными Элементами»,удовлетворяющими условиям ■V*>0» А=1, 2,..., /* — 1. (2.46) Положим /?0(λ)=1, Ζ)Λ(λ)=ΙΛ-λε|, Λ=1;2,..., η. .(2.46) Свойства многочленов Z)j» (λ) (некоторые из этих свойств сходны со свойствами ряда Штурм-а) (см. гл. III): 1) Если Dk(α)«= 0, Кk^η —Я,' τύ ",Ό^ι (α) n<DM (α) отличны от нуля и имеют противоположные знаки. 2) При переходе действительного переменного λ через корень многочлена Dk(\) слева направо произведение Ζ)Λ(λ) .Ам(*Х где А^>0, меняет знак с плюса на минус. 3) Все корни многочлена Dk(b)} k^>0} действительны и различны. 4) Если α и Ъ% a<^bt не являются корнями многочлена Dk (λ), то число его корней на отрезке [а, Ь] равно приращению числа перемен знака в ряду £>φ(λ), Ζ)ι(λ),..., D%Q) при переходе λ от а к Ь. б) Между двумя соседними корнями многочлена Dk(K)f где А^>0, лежит точно один корень многочлена Ζ)Λ_ι(λ). 6) Если λ1<^λ4<Γ,..<^λΛ — корни многочлена Ζ)Λ(λ), то при Х=Ху ряд £)0(Х), £>ι(λ)»···ι Ζ)Λ-ι(λ) содержит точно У — .1 перемен знака. ч 7) Если Uj=(utp Uyt...t unj) — собственный вектор; Соответствующий у-му по величине собственному значению \j
13] § Ι. матрицы 117. якобиевоймдт{>ицы (2.44) с условиями (2.45), то где Сj — произвольное число, отличное 6т нуля, k = 1,2,..., я; у=1, 2,..., д. Якобиева матрица называется нормальной, если ее эле· менты действительны и удовлетворяют условиям: bk^>0t **>0; Л=1, 2,..;, л—1. Так как условия (2.45) для нормальной якобиевой матрицы выполнены, то она обладает свойствами 1) — 7). Отсюда следует: ' 8) Собственные "значения λ^ нормальной ^кобйевой. матрицы действительны и^ различны. Если \г < λ* <\..<[ λΛ, то в ряду координат собственного вектора, соответствующего числу Ху, имеется, точно j — 1 перемен знака. Пусть Λ=(«ι, ώ9,...,αΛ) — любой л-мерный вектор с действительными координатами. Плоская ломаная с вершинамр Pit Рь. · · > Рн> где Ph имеет прямоугольные координаты xk = А, yh^s±uk, *=1, 2,..., я, называется и-линией. Точки пересечения'«-линии с осью Ох называются узлами и-линии или и-вектора. ш Рассмотрим вектор ϋ(λ) = («1(λ), Щ(λ),..., β.(λ)Χ координаты которого определяются равенствами а,(Х)=1, Η>(λ)=^;^;, Λ = 2, 3 я; (2,48) Свойства узлов л(Х)-линии: 9) Каждая точка и (Х)-линии, общая с' осью Ох, при 1 <^χ<^η является ее узлом (вытекает.из 1)). 10) #(Х)-линия при Х=Ху имеет точно у—1 узлов (вытекает из 6)). 11) Число узлов ,л(Х)-линии равно числу корней многочлена Ζ?Λ_ι'(λ) на интервале (— оо, λ) (вытекает из 4)). 12) Если X<Ct*> то' между каждыми двумя узлами #(Х)-линии лежит по крайней мере один узел «((х)-линии. 13) При непрерывном возрастании λ узлы #(Х)-линйи непрерывно смещаются влево/ 14) Узлы двух собственных векторов нормальной .якобиевой матрицы, принадлежащих двум соседним собственным значениям, перемежаются»
118 гл. и. матрицы и квадратичные формы [14 14. Ассоциированные и взаимные матрицы· Об ассоциированных и взаимных определителях см. гл. I, § 1, п. 13. Пусть Α = (αφΊ — матрица порядка п^2и ρ — целое число, причем l^p^n. Обозначим через N==C£ число сочетаний Ιι<^1%<^...<^ίρ из η чисел 1, 2,..., η пб р. Занумеруем все эти сочетания в произвольном, но в дальнейшем неизменном порядке: $и $*..., sjy. (2.49) Если $i — сочетание ii<C**<C···<*/> и sj — сочетание yt< ^/«^•••'О-р» т0 ми»ор Α (//'*'/)> стоящий на пересе* чении ρ строк с номерами iu I*..., ip и ρ столбцов с номерами ]ь fa..., jpf обозначим через Ъу. Для матрицы А порядка η р-й ассоциированной матрицей называется матрица порядка N= С£, составленная из миноров порядка ρ матрицы Л, взятых в определенном порядке: Ар=&№ Например, Ах = Л, Лп = (| А |). Свойства ассоциированных матриц: l)(AB)p = Ap-Bp. 2) (Еп)р=Ем где Еп и Е#—единичные матрицы соответственно порядков η и N. 3) Если | A j^O, то (£*), —(V* ([6], стр. 26). 4) (Xk)p = (Ap)k, причем для невырожденной матрицы А это верно при любом целом к, а для вырожденной — при целом неотрицательном к. 5) Если матрицы А и В подобны (стр. 98), то и р-е ассоциированные с ними матрицы подобны, причем если В = = Г-М Г, то ВР = (ТРГХ · А/. 7> 6) Если А = {ХЬ λ9,..., λΛ} — диагональная матрица, той р-я ассоциированная матрица также диагональна, причем Ар = = {λιΛ,···» ^λγ}, где на главной диагонали матрицы Лр стоят всевозможные произведения по ρ диагональных элементов матрицы А в следующем порядке: если st — сочетание *!<**<·..<*р> то ^=λ/Ιλ/2...λ/ρ. 7) При изменении нумерации сочетаний в последовательности (2.49) в /7-й ассоциированной матрице Ар происходит
mi § 1. МАТРИЦЫ 119 одинаковая. перестановка строк и столбцов, т. е. матрица Ар заменяется подобной матрицей (стр. 101), а характеристические числа этой матрицы не изменяются. Поэтому при вычислении характеристических чисел р-й ассоциированной матрицы можно выбрать наиболее удобный порядок нумерации в последовательности (2.49). 8) Если матрица А является треугольной и сочетания, в последовательности (2.49) занумерованы в лексикографическом порядке, то * р-я ассоциированная матрица Ар будет треугольной. При этрй под лексикографическим порядком понижается расположение, при котором сочетание /ι<ίί<ο· ·<!*/> предшествует сочетанию jt << А <С · · · ^ Л>» если пеР" вая из отличных от нуля разностей Jt — iu J%— ^,...,УР — ip положительна. Диагональные элементы треугольных матриц Л и Ар связаны так же, как было указано в свойстве 6). 9) Характеристические числа/?-й ассоциированной матрицы Ар (с учетом их кратности) равны всевозможным произведениям по ρ характеристических чисел матрицы А. 10) Если матрица А подобна диагональной матрице В = ==з {λι, λ^,..., Хя}, то р-я ассоциированная матрица Ар подобна диагональной матрице Вр = {\9 X»..., \#\, где \ получается по правилу, указанному в свойстве 6). Если Τ—матрица, преобразующая А в В, το Тр будет матрицей, преобразующей Ар в Вр. Иными славами, если матрица А имеет η линейно независимых собственных векторов и из их коорИинат, записанных по столбцам, образована матрица Г, то /?-я ассоциированная матрица Ар имеет N линейно независимых собственных векторов, координаты которых, стоят по столбцам матрицы Тр. Это значит, что если st — сочетание lt < i% <... < L и Sj — сочетание j\ </2 <С · · · <7ρ в последовательности (2.49), то i-я координата собственного вектора матрицы Apt соответствующего собственному значению £у = ХлХу2...ХУр, равна минору T\jXJ"'f) порядка ρ в матрице Τ ([6], стр. 67—68 или [7], стр. 81). Ассоциированной для матрицы А = (ау)* назовем матрицу А*=(ау)^ где aif — минор элемента atJ матрицы А. Таким образом, Л —частный вид Ап_г. Тогда:
120 гл. п. матрицы и квадратичные формы [15 иут(А}=л\ АГ~*А, где при я=2 надо считать |Л|°=1 ([20], задача 968). 1*2) Если матрица А ортогональна (или унитарна, п. 16), тб и р-я ассоциированная матрица Ар ортогональна (соответственно унитарна) (£20], задачи 973, 974). _ Присоединенной (или взаимной) матрицей для матрицы А = (ау)? называется матрица Д==(.а|у)^,гдеа|у — алгебраическое'дополнение элемента α μ в матрице А. Она обладает следующими свойствами: 13) Αλ = ΑΑ = \Α\Ε. U)(A) = \A\n-*A ([20], задача 96б> 15) (ΑΒ)=έλ ([20],^ задача 9Щ: О матрице, присоединенной к характеристической матрице Xf—Л, см. стр. 9Д 15. Кронекеровское произведение matpnib О кронекёров- ском произведении определителей см. гл. I, § t, п. 15. Пусть* все пары (/,./), где/=1, 2,..., т\ у=1,2,..м п; зЬнумеро- ваны в произвольно^, но в дальнейшем неизменном порядке: $и %..., smn. (2.50) Кронекеровскпм (или прямым) произведением двух матриц A = (alf)™n Β = (^)* называется матрица СвО^у)?·*, составленная из всевозможных произведений элементов матриц А и В в надлежащем порядке. Именно, Сн — й^Ь^ где (ii, ig)=^, (]\*-ίύ = *ρ ί, У = 1, 2,..., тп. Оно обозначается через С=ЛХ5. Свойства к ρ о н е к е ρ о в с к о г о произведения матриц: 1) В общем случае вопрос о коммутативности и ассоциативности кронекеровского произведения не имеет смысла, так как задание последовательности (2.50) позволяет умножать только матрицу порядка т на матрицу порядка п. 2) Кронекеровское произведение дистрибутивно: (Л + 5)ХС=ЛХС + 5ХС, где А и £ порядка /и, а С порядка /г,· ЛХ(В + 0=ДХ5-МХС, где А порядка т, а В и С порядка д.
16] § Ь МАТРИЦЫ ш ЪУ{А$)Х{СО)=г(АХС)(ВХР), где А9 В порядка т я С, ДЛЬрядка я ([20], задача. 963). Ч^щё, чем общее понятие кронекеровекого произведения, применяются следующие два его частных вида. Правим кронекеррвским . произведением матриц А = ==(аф™ и В = (ЬуУ* называется клеточная матрица Α χ·Β = = С=(Си)^ где Сц — ачВ% U /=ϊ, %...l m. Оно .получается из общего кронекеровского произведения, ее л иг-пары (ly j) в последовательности (2.50) занумеровать & лексикографическом ^порядке: (1, lXVOi-ak.'·■*· (Ι. η), (2, 1), (2, 2),..., (2, л),...,.(^ 1)/(/ίί;2),;ν, (m,7i); Левым кронекеровским произведением тех же матриц н^зыфается клеточная матрица А· X B = D = (Djj)^f Где /)// = = ^.*/у, /, /=1, 2,...; ,л. . Оно получается, если' в последовательности. (2.50) пары (ί, Д читаемые справа . налево, ^занумеровать в лексикографическом порядке: (Ϊ;Ί> (2, 1),...,(/и, 1), tl's 2>, (В-, 2),..., (/», 2),... , (1, л), (2, я),?.., (т, п). Эти произведения имеют, смысл для матриц любых,порядков и, кроме .свойств 2), 3), обладают еще следующими; 4) ΑΧ·Β=Β·ΧΑ 5) Ассоциативность: *ЛХ-(ВХ-С) = (АХ-5)Х-С, >X(B-XQ = =(Л-Х5)-ХС 61 Если /?£ — единичная матрица порядка А, то ^т X ***л ™ ^т* X **л == ^*тл· 7) Если Л и В -г- невырожденные матрицы, то (А Х*В)"% = вД^Х'Я·1, (Л-Х5)-1 = Л-1-ХВ-1 ([20], задача 96.4). 8) Если матрицы Аь В\ подобны соответственно матрицам Л2> Вь то кронекеровские произведения AtX Bt и Л* X В% (взятые при любых двух расположениях пар индексов в последовательности (2.50)) подобны между собой. В. частности, при изменении порядка нумерации пар в последовательности (2.50) матрица А X В заменяется подобной матрицей ([20], задача 1056).
122* гл. п. матрицы и квадратичные формы [[б 9) Кронекёровское произведение диагональных матриц диагонально. 10) Правое и левое кронекеровские произведения двух верхних (или двух, нижних) треугольных матриц являются верхней (нижней) треугольной матрицей. 11) Если λ,, λ*,.., Xm — спектр матрицы А и щ, μ*..· • ••t ν·η — спектр матрицы В, то спектр их кронекеровского произведения АХ В состоит из всевозможных произведений ХГ|Ау, 4=1, 2,».., /и,/=1, 2,..., η ([20], задача 1146). 12) Если матрицы А й В подобны диагональным матрицам, то это верно и для их кронекеровского произведения Α\χ Β. 16. Ортогональные и унитарные матрицы. Скалярным произведением двух я-мерныхве|рйров a = (ah α* ..., <хя), Ь = фи % .#,, β^- в случае действительных координат называется гчй*зю (а, Ь) = α,βι + «*fc + · · · + «*?/*> (2.51) а в случае комплексных координат — число (я, Ь) = α,Ρ", + oft +... + *Jnt (2.52). где чертой обозначено число, комплексно сопряженное данному числу. Можно дать другое, аксиоматическое определение скалярного произведения (см. [11], стр. 211—212). Если (я, #)=0, то векторы а и Ь называются ортогональными. Если (α, α)=1, то вектор а называется единичным или нормированным. Система векторов еи е9, ..., es называется ортонормированной, если (,„ еу)=^{ Ι ζΐ £* ^=1, 2 ι (2.53) Квадратная матрица А называется ортогональной, если ее элементы действительны и выполняется одно из следующих, пяти эквивалентных свойств: а) строки образуют ортонормированию систему, б) столбцы образуют ортонормиро- ванную систему, в) АА' = Е, г)· A'A=Ef д) А'= А-1. Здесь А' обозначает транспонированную матрицу Л. Аналогично определяются и комплексные ортогональные матрицы, но мы ограничимся лишь действительными матрицами.
16) § 1. МАТРИЦЫ 123 В случае комплексных чисел, близким понятием является понятие унитарной матрицы· Матрицей, сопряженной с матрицей Л, называется матрица Л* = Д\ полученная из А транспонированием1 и заменой всех элементов на комплексно сопряженные. Квадратная матрица А с любыми комплексными (в частности, действительными) элементами называется унитарной, если выполняется одно из· пяти эквивалентных свойств: а) строки образуют ортонормированную · систему (при этом скалярное произведение определяется по формуле (2.52)), б) столбцы образуют ортонормированную систему, в) А А*=Д г) А*А=Е% д) А* = А-К Унитарная матрица тогда и только тогда ортогональна, когда она действительна. Ортогональная или унитарная матрица не вырождена, причем определитель ортогональной матрицы равен it 1, а определитель унитарной матрицы по модулю равен 1. Произведение двух ортогональных матриц и матрица, обратная для ортогональной, ортогональны. Иными словами, все ортогональные матрицы данного порядка образуют группу относительно умножения {гл. IV). То же верно и для унитарных матриц. * Ортогональная матрица может не иметь действительных характеристических чисел. Например, матрица /cos φ —sin<p\ \Sin φ COS φ/ где φ Φ *π, имеет характеристические числа cos φ ± ϊ sin φ, причем sin φ ?£ 0·* Характеристические числа унитарной (в частности, ортогональной) матрицы4 по модулю равны единице. Поэтому все действительные характеристические числа (если они существуют) равны ± 1. Собственные векторы ортогональной или унитарной матрицы, принадлежащие двум различным собственным значениям, ортогональны. Две матрицы А и В называются ортогонально (или унитарно) подобными, если существует ортогональная (соответственно унитарная) матрица Г, удовлетворяющая равенству В=Т-гАТ. (2.54) Матрица А тогда и только тогда унитарна, когда она унитарно подобна диагональной матрице В, диагональные элементы которой по модулю равны единице» т. е. В={К λ* ...,λΛ}, M = l> l=h % ...» л. (2.55)
Ш ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ. Дри этом чисда λ], λ^, ..., λΛ, стоящие на диагонали матрицы Д образуют спектр матрицы Л, а столбцы преобразующей матрицы Τ состоят из координат ортонормированной системы η собственных векторов матрицы Л> принадлежащих собственным значениям λ,, λ^ !.., λ„ в соответствующем порядке ([6], стр. 224, теорема 6^· Действительная матрица Л порядка η тогда и только тогда ортогональна, когда она ортогонально подобна канонической ортогональной матрице B=ilC0S(fi ~sin<M \\Sin φι COS φι/ ' # * * /cos,, -sin(Pi t ; 1 \sin?, cos^/ . J Здесь 8ίηφΛ^>0, *=1, 2, ..., q; число элементов -j^l равно г, число элементов —1 равно $; 2q -|-r-f- «βл. Некоторые тиз чисел $\ г, 5 могут равняться нулю, т. е. клетки некоторых из указанных типов могут отсутствовать ([6], стр. 233). Клетки второго порядка, соответствуют парам комплексно сопряженных характеристических чисел, а первого — действительным характеристическим числам матрицы Л, так что спектр матрицы Л имеет вид λι as COS φι -|- ί Sin φι, λ^ ss COS φι — i Sin φι, ... • ••t ^-i = cos<jpg4-isin<P<?> ^=cos<fy— isin<f>0, λ*0+1 = . . . = λ^+Г = 1» ^g+r+l = . . · =5= Kn SBS 1. Ортогональная матрица 7, преобразующая матрицу Л к каноническому виду (2.56), строится следующим образом. Для комплексного характеристического числа λ^,ι = cos φΛ -f· -\-l$in<fk, Λ=1, 2, ..., q, кратности р существует/? ортогональных собственных векторов zu ..., гр с комплексными координатами. Их можно найти как решения системы однородных линейных уравнений с матрицей Л — \k-\Ey причем при отыскании вектора zs нужно требовать его ортогональности к уже построенным векторам zu ..., zs_t. Если &,= =*s + 'Λ ($= *> * · · > А гДе ;#5> Λ — векторы с действительными координатами, то векторы xs и доказываются
§ 1. МАТРИЦЫ 125 ортогональными и имеющими одинаковую длину ({20);.. вала· 4β.νΐδ$9)1 Нормируя эти векторы» получим два вектора, тюфрдааты которых надо поставить в двух соседних столб· йах'матрицы Г. Номера этих;столбцов должны совпадать с номерами столбцов s-й из'/? одинаковых диагональных клеток вида /cos φ* — sin Фь\ ,Λ *Λν « · канонической матрицы (2.56). При этом \sinY*. cosY*/ сначала надо написать столбец координат ректора, полученного , нормированием коэффициента мнимой части/ т. е. ys> Сти xs. При обратном порядке /eos <fi ' sin 9k\ бы вид N.r. · т*). \—1β1πφΛ COS φ*/ -а затем—действительной, части х, клетки матрицы (2.56) имели Для действительного характеристического числа \k кратности ρ тем же путем можно найти ортонормированную си· . стему ρ действительных решений системы однородных линейных уравнений с матрицей ft— \Е* Координаты этих векторов надо поставить в р столбцов матрицы Тс теми же номерами, как столбцы матриЦЦ В» содержащие' λΛ на диагонали. Пример. Для матрицы 3 2 3 2 з -\ 3 ι _± 1 1 { 3 3 3 / найти ортогональную матрицу Г, приводящую А к канонической ортогональной матрице В. Вычисляя скалярные произведения строк матрицы А% легко проверить, что эти строки ортонормированы. Значит, матрица А ортогональна, и задача разрешима. Вычисляем характеристические числа матрицы А: 1А — ХЕ\ = 1-х 2 з 1 3 1 3 1-х 3 * 2 τ 2 Ι 3 1 1-х\ з *·|
126 гл. п. матрицы а квадратичны): формы [№ <к первой: строке прибавляем вторую и. третыо)- 1—λ ι_χ ι_χ 1 1 \ ί 3 3· А —3 1 ■у Τ Τ λ (первый столбец вычитаем из остальных и разлагаем определитель по первой строке)' :(1-λ) —λ —1 1 1-^-λ -(1-λ)<λ«-λ+1)ί ι . ι Каноническая ортогональная матрица, ортогонально подобная матрице А, имеет вид В=1 гсову — 6in -g- 0Л stay coe-g- 0 Ищем ортогональную преобразующую матрицу Г, удовлетворяющую равенству (2.54). Координаты собственного вектора матрицы А для значения λι β -^ + -к-1 j/З" найдем из системы уравнений Так как определитель этой системы должен равняться нулю и уравнения не пропорциональны, то ранг системы равен двум и решение определено однозначно с точностью до числового множителя. Полагая *!=!, из первых двух уравнений.найдем
Щ % 1. матрицы 127 Отделяя действительную часть и коэффициент при щшмой части» получим два лектора: /1=(о,-^у%±ут), Λ-(».-τ·-ϊ)» ортогональных и имеющих одинаковую длину· Нормируя эти век· торы, найдем ^(ο,-^ντ,^η), *-(|*r.-4i*-,-4^). Координаты собственного вектора матрицы А для значения λβ = 1 найдем из системы уравнений 1 ι 2 1 Л Вычитая первое уравнение из остальных» найдем: х% — л*8 = 0, jCi— лг$=в0, откуда Arjsss^sssA:,4. Так как решение определено с точностью до множителя, то можно положить лГ|=л:2 = л:8= 1. Отсюда/8 = (1, 1» 1). Нормируя, найдем Нт^'Т^т^)· Записав координаты векторов eh e2t еь по столбцам, получим преобразующую матрицу / о ivw ±М \iv* -ϊν* iv*j Замечание. Решение предыдущей задачи позволяет выяснить геометрический смысл матрицы А. Эта матрица задает в орто- нормированной базе ортогональное преобразование трехмерного. евклидова -пространства R ((11), стр. 221). Каноническая форма В показывает, что это преобразование заключается в повороте пространства /? вокруг оси, определяемой вектором /$, на угол у в направлении от ех к е%. Так как | Г|==1, то ориентация тройки eit e*t 0% совпадает с ориентацией исходной базы./В случае трех-
128 ГЛ. И. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ Г16 мерного пространства' геометрический смысл преобразования, заданного матрицей At можно выяснить проще, ие отыскивая всей матрицы Г. В этом случае характеристический многочлен имеет хотя бы один действительный корень, в нашем примере λ9«1. «Соответствующий собственный вектор/8 = (1, 1,-1) определяет ось вращения. .Пусть Л —(л^){. Подобные матрицы А и В имеют один и тот же характеристический многочлен, в частности один и тот же след (стр. 93). Отсюда 2wt-f !-.«„ + *, + ** cosysa:flil + fl^+flM~1. В нашем примере это дает cos<p=-y, <р = -о*. Остается найти на· правление вращения. Для этого достаточно взяФь любо^й йектор о»" не коллинеарный /$, вектор bt полученный из α при данном преобразовании, и вектор /». Если смотреть >№ конца вектора /8 к началу, то направление поворота будет от ά к Ь. Вычислив определитель из координат ректоров α, 6,/$, мы узнаем» совпадают ли ориентации исходной' базы и тройки а, 6, /$, и этим определим направление вращения ^относительно исходной базы. В нашем примере, можно взять вектор а = (1, 0,0). Столбец координат его образа Ь равен произведению матрицы А на столбец координат вектора а, т. е. равен первому столбцу матрицы. А. Итак, д =э. \7> Т> —чг Вычисляем определитель, по столбцам которого стоят координаты векторов а, д, /$: =.1>0. Значит» преобразование, заданное матрицей А, является поворотом вокруг оси, определенной вектором /8 = (1, 1, 1), на угол -т- в на- правлении» -совпадающем с поворотом от первой оси исходной системы координат ко второй, если смотреть на плоскость этих осей со стороны положительной третьей полуоси. Это совпадает с полученным ранее поворотом на угол -*- от е\ к е*. Теорема Шура. Любая квадратная числовая матрица унитарно подобна треугольной матрице (по желанию,, верхней или нижней) ([20], задача 1548). Любая квадратная числовая матрица А представляется как в виде А = 1/С, так и в виде A=DV9 где С, D— верхние I 0 Ό 2 3 2 , 3 1 3 1 1 1
Π] § 1. МАТРИЦЫ 129 (нижние) треугольные и U} К—унитарные матрицы. Если матрица: Д не вырождена, то оба эти разложения един· ргвённы с точностью до диагонального унитарного множителя Μ sss {tlf e2,..., ея}, | е, | = 1. Если матрица Л действительна, то и матрицы С, Д ί/, V действительны. Таким образом, любая действительная матрица разлагается в произведение ортогональной и треугольной матриц. 17. Симметрические, кососимметрические и эрмитовы матрицы* О: ранге симметрических и кососимметрических матриц см. гл. I, § 2, п. 4. Пусть Л'— матрица, транспонированная.для Л, и Л*:?= = Л' — матрица, сопряженная для Л. Если А действительна, то Л* = Л'. (В настоящем пункте рассматриваются только квадратные матрицы.) Матрица А называется симметрической, если А'=А, ко.сосимметрияеской, если А'=~-А, > эрмитовой, если Л*=,Л, косоэрмитовой, если Л* =— Л. Действительные эрмитовы матрица совпадают с симметрическими, а косо- эрмйговы ~гг ς кососимметрическвми. О комплексных ортогональных, симметрических и косо- симметрических матрицах см. [6], гл. 11. Эрмитовы и косоэрмитовы матрицы связаны так: если в соотйошении A=±iB одна из двух матриц эрмитсра, то другая — косоэрмитова, и наоборот. Любая матрица Л однозначно представляется в виде суммы А = В -}-чС, где В *— симметрическая и С — кососимметриче- скай матрицы. При этом ^—' 5 » ° 2 · Далее, любая матрица Л однозначно представляется в виде A=:S-t-C, где В — эрмитова и С—косоэрмитова матрицы. При этом Наконец, любая матрица Л однозначно представляется в виде А = В+1С, (2.57)
130 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [17 где обе матрицы В, С эрмитовы. При этом D А + А* п А — А* 3 = — » С ——2Г"· Разложение (2.57) является матричным аналогом представления комплексного числа а в виде a = b-{-ic с действительными Ь, с. Из правила транспонирования произведения (АВ)'=В'А' и правила замены чисел на сопряженные (АВ) = АВ вытекает равенство (ЛЯ)* = Я*Л*. (2.58) Отсюда легко вывести, что произведение двух симметрических (или эрмитовых) матриц А и В тогда и только тогда будет симметрическим (соответственно эрмитовым), когда АВ=ВА. Далее, произведение двух кососимметрических (или косоэрмитовых) матриц А и В тогда и только тогда будет симметрическим (соответственно эрмитовым), когда АВ = ВА. Наконец, произведение двух кососимметрических (или косо- эрмитовых) матриц А и В тогда и только тогда будет кососимметрическим (соответственно косоэрмитовым), когда АВ = — ВА. Любую матрицу можно представить* в виде произведения двух симметрических матриц, из которых одна не вырождена (см. [24], задача 978 или [20], задача 1144). Характеристические числа эрмитовой (в частности, действительной симметрической) матрицы действительны. Характеристические числа косоэрмитовой (в частности, действительной кососимметрической) матрицы чисто мнимы, т. е. имеют вид W, где Ь — действительное число (в частности, некоторые из этих чисел могут равняться нулю). Собственные векторы матрицы любого из указанных видов, принадлежащие различным собственным значениям, ортогональны. Матрица А тогда и только тогда является эрмитовой, когда она унитарно подобна действительной диагональной матрице £ = {λ,, Xj,..., λη} ([6], стр. 223, теорема 5"). При этом числа λί9 стоящие на диагонали матрицы В, образуют спектр матрицы Л, л столбцы унитарной преобразующей матрицы Г, для которой В = 7х-1 AT, состоят из координат ортонормированной системы η собственных векторов матрицы Л, порядок которых соответствует порядку чисел λ^
17] § 1. МАТРИЦЫ 131 0 1 1 1 1 0 — 1 1 1 — 1 0 1 — 1 1 1 0 на диагонали матрицы В. Аналогичное утверждение верно для действительной - симметрической матрицы А с заменой унитарного подобия на ортогональное подобие, причем для получения ортогональной преобразующей матрицы Τ надо брать ортонормированную систему η собственных векторов с действительными координатами. Пример. Для матрицы л= найти подобную ей диагональную матрицу В и ортогональную матрицу Г, для которой £ = Г~МГ. Так как А — действительная симметрическая матрица, то задача разрешима. Ищем характеристические числа матрицы А: — λ 1 1—1 1 —λ —1 1 1 —1 —λ 1 —1 1 1 —λ (к первой строке прибавляем все остальные, первый столбец вычитаем из остальных и разлагаем определитель по первой строке) — λ—1 — 2 0 _2 —λ—1 0 2 2 — λ + 1 λ + 1 2 2 λ+1 А1^Лз = Аз^^1, А4 = — 3. Для собственных векторов с собственным значением 1 получаем систему линейных уравнений, эквивалентную одному уравнению Χι — Xt — Хг + Χα = 0. \А—\Е 1 = = 0-λ) = 0-λ)2 = (λ-1)*(λ' + 2λ-3); Надо найти три решения, составляющих ортонормированную систему. Первое решение можно взять любым, например at=(\t 1, 1, 1). Второе решение находим, добавив к прежнему уравнению условия ортогональности к at: Χι+Χ* + Χ$+Χ*=*0. Можно взять, например, а2 = (1, 1, —1, —1). Для отыскания третьего решения добавляем еще условия ортогональности к а2:
133 ГЛ. II. МАТРИЦЫ II КВАДРАТИЧНЫЕ ФОРМЫ [17 что · определяет решение однозначно с точностью- до числового множителя. Берем а,« собственным значением ι 1 τ 1 τ 1 ΤΙ -у 1 -у 1 1 У 1 ""У 1 ~У 1 2 1 У (1, — 1, 1, — 1). Собственный вектор с. л*»—з ищем из системы уравнений 8*ι+ **+ *·— *«**Ъ *ι +Зл*— лг«+ *4 = 0, αγι— л*. + Злга + *4±=0, —*i + *i+ х% + 3х*=*0. Сложив все уравнения и сократив на 4, найдем λγι + λγι +лг8'+ -j-jt4=s=0. Вычтя это уравнение из первого и второго уравнений предыдущей системы, найдем: Χι»**, Xt = xtt откуда хх + рш α «=ΛΓι4,^β=^ Можно взять 04α(1, —1,-1, 1). Нормируя векторы и записывая их координаты по столбцам, получим ортогональную матрицу 1 1 % 11 τ τ τ. τ г*И преобразующую матрицу Л к диагональному, виду В »{ 1, 1, 1,-3). Матрица А тогда и только тогда является косоэрмито- вой, когда она унитарно подобна диагональной матрице В с чисто мнимыми элементами на диагонали (среди которых могут быть и равные нулю). Действительная матрица А тогда и только тогда является кососимметрйческой, когда она ортогонально подобна канонической кососимметрйческой матрице Н(«, "7) («, "?).А....о}.0Ш0 Клетки первого или второго порядка могут отсутствовать. При этом клетки первого порядка соответствуют характеристическим числам матрицы Л, равным нулкТ, а второго по· рядка —парам сопряженных характеристических чисел ±iak с л*>0, Α=1, 2, ..., q ([6], стр. 232 — 233). Можно построить ортогональную систему собственных векторов z{'y #*...# *Λ> г^е ***-1=** + *У* принадлежит значению'^, а< Ztb:=Xk~—iyk—:значению ~iak> причем координаты векторов Хь yk действительны, Αβΐ,.2,,.., q. Векторы хк>Уь
17] § U МАТРИЦЫ т будут ортогональны и одинаковой длины ([20]» задача 1640)· Их можно пронормировать. Для нулевых характеристических4 чщрц йожно также взять векторы **7+ι,..., ζη действительными и ортонормированными. Записав координаты векторов в порядке УU *1> Уь *Ь · · · 9 У φ *φ #9д+Ь · · · > *п по столбцам, получим ортогональную матрицу Г, преобразующую Л к каноническому виду (2.59). ' Матрицы с положительным спектром. Эрмитова (в частности, действительная симметрическая) матрица А называется матрицей с положительным(или неотрицательным) спектром, если все ее характеристические числа положительны (соответственно неотрицательны). Для того чтобы эрмитова матрица А порядка η была матрицей с положительным спектром, необходимо и достаточно, чтобы все ее угловые миноры были положительны, т. е. АК 2β.Λ)>0, Λ=1, 2, ...,/ι. (2.60) Для того чтобы эрмитова матрица А порядка η была матрицей с неотрицательным спектром, необходимо и достаточно, чтобы все ее главные Да не только угловые) миноры были неотрицательны. Так, например, все угловые миноры матрицы ( ft t 1 неотрицательны, но ее спектр λ| = 0, λ^ =5—ί не является неотрицательным. Для любой матрицы Η с неотрицательные спектром существует единственная м'атрица F также с неотрицательным спектром такая, что F*=H. Эта матрица F называется ариф-> меттеским корнем из матрицы Η и обозначается через У~Н. Для любой матрицы А обе. матрицы АА* и А*А являются матрицами с неотрицательным ςπβκτροΜ, а для невырожденной матрицы А — матрицами с положительным спектром. Матрица АА* называется левой, а матрица Л*А— правой нормой матрицы А. Матрица У А А* называется левым, а матрица У А*А — правым модулем матрицы Л. Для любой матрицы Η порядка η с неотрицательным спектром матрица Υ Η представляется * в виде многочлена не выше
134 ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [17 (п—1)-й степени~от матрицы Я с действительными коэффициентами ([6], стр. 225). Полярные разложения матриц. ЛнГбая квадратная, матрица Л с комплексными элементами, представляется в каждом из двух следующих видов: A = HU, Л = #!#!, (2.61) где Η и Н% — эрмитовы матрицы с неотрицательным спектром и U и U\—унитарные матрицы. При этом матрицы Η и Ни определены однозначно матрицей Л. Матрица Η является левым, а матрица Нх — правым модулем матрицы Л. Если матрица Л не вырождена, то матрицы U и U\ также определены однозначно, а матрицы Я и Я| будут матрицами с положительным спектром. Если матрицу Л имеет действительные элементы,-то Η и-Д — действительные симметрические матрицы с неотрицательным спектром, а £/и U\ — ортогональные матрицы. Представления (2.61) являются матричным аналогом тригонометрической формы комплексного числа 2 = r(cos<p-Hsin<p) ([6], стр. 225, теорема 8; стр. 233, теорема 9). Существует также матричный аналог представления комплексного числа в виде z = rei<p (см. [6], стр. 227, (87), (88)). Если Л и В — эрмитовы матрицы, причем Л—.матрица с положительным спектром, то матрица АВ имеет действительный спектр. Если матрицы А и В являются матрицами с неотрицательным спектром и хотя бы одна из них не вырождена, то матрица АВ имеет действительный неотрицательный спектр ([8], стр. 138 или [20], задачи 1602, 1603). Сумма конечного, числа матриц с неотрицательным спектром будет матрицей того же типа, а если хотя бы одно из слагаемых является матрицей с положительным спектром, то такой же будет и сумма ([20], задача 1604). Матрица ранга г с неотрицательным спектром представляется в виде суммы г (но не менее чем t) матриц ранга 1 с неотрицательным спектром ([20], задача 4605). Матрица Л порядка η тогда и только' тогда является матрицей с неотрицательным спектром ранга 1, когда она представляется в виде А = Х*Х, где X — ненулевая строка из η чисел ([20], задача 1606). Если матрицы A = (aij)'[, В = (Ьу)1 являются матрицами с неотрицательным спектром, то и матрица С=(ауЬу)1, по-
Π] § 1. МАТРИЦЫ 135 лученная перемножением соответствующих элементов матриц А и В> будет того же типа ([20], задача 1607). Формулы Кэли. Эти формулы устанавливают связь между эрмитовыми (или косоэрмитовыми) и унитарными матрицами. Если Z7—-любая эрмитова матрица, то матрица U=(E-{-iF)(E — IF)^ = (F^IE)(F+IE)'1 (2.62) будет унитарной, не имеющей собственного значения, равного — 1. Второе выражение для U получается из первого вынесением множителя i из первой и — i из второй скобки. Если U—унитарная матрица, не имеющая собственного значения, равного — 1, то матрица F=i(E— U)(E+ Uyl (2.63) будет эрмитовой. Формулы (2.62) и (2.63) являются взаимно обратными и устанавливают взаимно однозначное соответствие между всеми эрмитовыми матрицами и всеми унитарными матрицами, не имеющими собственного значения, равного — 1 (161 стр. 228, (95)). Если F—любая эрмитова матрица, то К= — IF—любая косоэрмитова матрица, поэтому формулы (2.6,2) и (2.63) можно объединить в одну формулу: U= (Е — К) (Е + Ю'1 (2.64) ([6], стр. 235, (123), (124)). Если одна из матриц £/, К в равенстве (2.64) является косоэрмитовой (в частности, действительной кососимметрической), то другая будет унитарной (соответственно ортогональной), не имеющей собственного значения, равного —1, и наоборот. Формула (2.64) устанавливает взаимно однозначное соответствие между всеми косо- эрмитовыми (или действительными кососимметрическими) матрицами и всеми унитарными (соответственно ортогональными) матрицами, не имеющими собственного значения, равного — 1. При этом все невырожденные косоэрмитовы (действительные кососимметрические) матрицы отображаются на все унитарные (ортогональные) матрицы, не имеющие собственных значений, равных zh 1, а все вырожденные косоэрмитовы (действительные кососимметрические) матрицы — на все унитарные (ортогональные) матрицы, имеющие собственное значение, равное +*> но не имеющие значения, равного —1 ([20], задачи 1614, 1615).
J36 ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [IS 18. Нормальные матрицы* Матрица А с комплексными элементами называется нормальной, если она перестановочна со своей сопряженной матрицей Л* =Д', % е. если АА* а А* А. В частности, действительная матрица А нормальна, если ΑΑ'τε=ζΑΆ. Легко проверить, что унитарная, эрмитова, косо- эрмитова и действительные ортогональная, симметрическая, косо£имметрическая матрицы являются частными видами нормальных матриц. Нормальная матрица А тогда и только тогда является унитарной, эрмитовой или косоэрмитовой, когда ее характеристические числа соответственно равны по модулю единице, действительны или чисто мнимы (включая и случай равенства* нулю). Матрица А является нормальной тогда и только тогда, когда в представлении (2.57) (етру 129) эрмитовы матрицы В и С перестановочны и#% а представлении (2.61) (стр. 134) матрицы Я, $\а-также H^Ut перестановочны ([6], стр. 219, теорема 3 и dp;225, теорема 8). Матрица А является нормальной тогда и только тогда, когда она'унитарно подобна диагональной матрице В ([6], стр. 222, теорема 4). При этом столбцы унитарной матрицы Г, для которой 5= Г"1 А Г, состоят из координат ортонорми- рованной системы собственных векторов матрицы А. Матрица А порядка η с действительными элементами является нормальной тогда и только тогда, когда она ортогонально подобна канонической нормальной матрице вида. в= {{l ~«;)'···'ui ~$· «»*·.-4 (2·65> где все числа ak, bkt ck действительны и *Λ]>0, £=1, 2,... ,.., q. Клетки первого или второго порядка могут отсутствовать ([6], стр. 232, (107)). Клетки первого порядка соответствуют действительным корням ckt Аг=2#-|-1,..., я, д второго порядка — парам комплексно сопряженных корней ak ± lbkf k = 1, 2,..., q% характеристического многочлена матрицы А\ Преобразующая ортогональная матрица Τ строится аналогично случаю ортогональной матрицы (стр. 124 —125). Из канонического' вида (2.65) для действительной нормальной матрицы получаются, в частности, канонические виды: 1) для ортогональной матрицы, если <*{ + *!=!, А=1, 2,...,?; ск=±1, Л=2?4- W» W
I] § 2. ВЙЛЙНБЙНЫВ Я КВАДРАТЙЧЙЫВ ФОРМЫ 137 2) Д?гя действительной симметрической матрицы, если ?»(); 8>*^^^йств11тельной кососимметрической матрицы, если 4*=0> *=lt 2,..г# с* = 0, Α=*2?+1,..,, л. Бели матрица Л нормальна, · то каждая из сопряженных матриц А и А* представляется в виде многочлена от другой из этих матриц ([6], стр. 222, 2°). Собственные векторы нормальной матрицы, принадлежащие различным собственным значениям, ортогональны ([20], задача Ш& ' Матрица А тогда и только тогда нормальна, когда матрицы Л и Л* имеют одни и те же собственные векторы ([20], задача 1630). При этом рассматриваются как действительные, так и комплексные собственные значения и собственные век· торы. Если χ — собственный вектор нормальной матрицы Л со значением λφ, то тот же вектор χ будет собственным для матрицы Л* с сопряженным значением λ0 ([20], задача 1627). Если две нормальные (или действительные нормальные) матрицы Л и £ подобны, то оИй и унитарно (соответствен· но ортогонально), подобны Ц6]< стр. 23&, теорема 10). Любая- (конечная или бесконечная) совокупность попарно •перестановочных нормальных матриц имеет общую ортонор- мированную базу собственных векторов, и значит, при помощи одной и той же унитарной матрицы Г все матрицы этой совокупности можно привести, к диагональному виду ([6], стр. 237, теорема И*). При этом если все матрицы данной совокупности действительны, то существует ортогональная матрица Г, приводящая каждую из матриц этой совокупности к своему каноническому виду (2.65),. причем ортогональные матрицы — к виду (2.56), симметрические — к действительному диагональному виду и кососимметрические — к виду (2.59) ([6], стр. 238, теорема 12*). § 2· Билинейные и квадратичные формы 1· Эквивалентность. Канонический и нормальный вид· Методы Лагранжа и Якоби приведения к каноническому виду· Билинейной формой ох двух систем по η переменных *х%, х%,..., хп и уи jfa,..., уп называется многочлен с числовыми коэффициентами, однород-
138 ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [1 ный я имеющий первую степень относительно переменных каждого из этих рядов. Если ввести векторы X = \Х\, Хъ>...» Хп)* то билинейная форма будет функцией от этих векторов. Поэтому для нее применяется обозначение А (х\ у): η А (лг, у)= Σ atjXiyj- (2.66) Матрица Л = (а/у)? из коэффициентов, билинейной формы называется матрицей этой формы, а ранг этой матрицы— рангом билинейной формы. Если положить ул=хь 1=1, 2,..., л, то билинейная форма обратится в однородный многочлен второй степени от η переменных хи хъ... ..., хп> называемый квадратичной формой от этих пере· менных. Итак, каждой билинейной форме соответствует единствен· ная квадратичная форма. Двум различным билинейным формам может соответствовать одна и та же квадратичная фор· ма. Например, билинейным формам Х\У\-\-Х\У%-\-х%У1—х%у% и *ϋΊ +Злт^а — ХгУ\ — х*У% соответствует квадратичная форма х\-\-2ххх<ц— *\. Для установления взаимно однозначного соответствия между билинейными и квадратичными формами выделяют особый класс билинейных форм. Билинейная форма называется симметрической, если ее матрица симметрическая (стр. 129). Симметрическая билинейная форма не изменяется при перемене местами двух рядов ее переменных, т. е. А(х; у) = А(у; х). Любая квадратичная форма получается из единственной симметрической били· нейной формы, которая называется полярной билинейной формой данной квадратичной формы. Матрица полярной билинейной формы называется матрицей данной квадратичной формы. Таким образом, квадратичную форму можно записать в виде η А(х; х)= 2 «у ■*#*/» <*ij = ajh l,j=h2,...,n. (2.67)
1] § % ВИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 139 Выражение в правой части этого равенства можно при· нять. за определение квадратичной формы. Матрица квадратичной формы А=-(ауУ1, по определению, является симметрической. Ранг матрицы А квадратичной формы называется рангом, этой формы, определителе \А\ — дискриминантом квадратичной формы. Квадратичная форма называется не в и- рожденной, если |Л|т^0, и вырожденной (или сингулярной), если | Л | = 0. Полярная билинейная форма данной квадратичной формы следующим образом выражается через эту квадратичную форму: Л(лг, у)=^[А(х+у; х+у) — А(х; х) — А(у;у)] (2.68) ([8], стр. 53). Если коэффициенты a{j действительны, то билинейная и квадратичная формы называются действительными, а если комплексны, — комплексными. Для действительных форм значения переменных х%, у% обычно предполагаются действительными, а для комплексных — комплексными. Ряд свойств сохраняется также для форм с коэффициентами из любого числового-по ля (введение) или любого поля характеристики, не равной двум (гл. IV). Можно определять билинейную форму А(х; у) как функцию от двух векторов х, у аксиоматически определенного 'линейного пространства, линейную по каждому аргументу, и квадратичную форму А(х; х) как функцию вектора х, полученную из билинейной формы при у=х (|8]> § 4). Но мы будем пользоваться данными выше определениями билинейной и квадратичной формы как многочленов вида (2.66) и (2.67). Пусть X и Υ—столбцы переменных хи х*..., хп и У и Уь···* Уп* Транспонированные матрицы Х'\ Υ будут строками тех же переменных. При помощи умножения матриц билинейную форму (2.66) и квадратичную форму (2.67) можно записать в виде A^y)=XAY, (2.69) Α(χ>,χ)=ΧΆΧ. (2.70)
Ш гл. и. матрицы и квадратичные формы [Ί Если к билинейной форме (2.66) применить невырожденные Линейные преобразования переменных η η или в матричной форме X=SU, Y=TV, (2.71) то, подставляя выражения (2.71) в (2.69), получим новую билинейную форму η В(щ v)= ΙΤβΥ** ,5$ Виилъ матрица В которой связана с матрицей А исходной формы равенством В^&АТ (2.72) ([14], стр. 209). В частности, если применить одно и то же преобразование к переменным xi и yit то S=^= Г и (2.72) обращается в В=ГАТ, |Г|^0. (2.73) Из этого равенства легко вывести, что если билинейная форма А(х\ у) была симметрической, то и новая форма В (α, ν) будет симметрической. Поэтому если к квадратичной форме (2.67) применить невырожденное линейное преобразование переменных *i—§*VJ> 4=1,2,..., η, |r|=±|ily|f^0, (2.74) то получится новая квадратичная форма В(у; У)=* Σ buytyJP (2.75) матрица В которой связана с матрицей А исходной формы (2.67) равенством (2.73) ([в], стр; 239, (2) и-- (4)). Отсюда
1] ξ 2, БИЛИНЕЙНЫЕ Я КВАДРАТИЧНЫЕ ФОРМЫ 141 следует, что при невырожденном линейном преобразовании переменны^ Дискриминант квадратичной формы умножается на.к^йрат определителя преобразования, |£| = | Л |·| Τ\\ в- частности, при действительных невырожденных преобразованиях действительной. формы знак ее дискриминанта не изменяется· Две квадратичные формы, получающиеся одна из другой невырожденным, линейным преобразованием переменных, называются, эквивалентными (или конгруэнтными). Матрицы Ли В> связанные равенством (2.73), также называются конгруэнтными. Если коэффициенты квадратичных форм и коэффициенты линейного преобразования действительны, то формы называются действительно'эквивалентными, если комплексны,— комплексно эквивалентными, если принадлежат некоторому числовому полю К>—эквивалентными над по* лем К. Эквивалентность квадратичных форм обладает следующими свойствами: 1) рефлективность: каждая форма эквивалентна сама себе; 2) симметрия: если первая форма эквивалентна второй, то л вторая эквивалентна первой; 3) транзитивность: если первая форма эквивалентна второй, а вторая третьей, то первая эквивалентна третьей. Отсюда следует, что все квадратичные формы с коэффициентами из некоторого числового поля К от одних и тех же переменных разбиваются на непересекающиеся классы эквивалентных над А' форм. В частности, можно рассматривать классы действительно или комплексно эквивалентных форм. Из равенства (2.73) следует, что, эквивалентные квадратичные формы имеют одинаковый ранг. В случае любого числового поля К равенства рангов недостаточно для эквивалентности квадратичных форм. Квадратичная форма называется канонической; если она не содержит произведений переменных, т. е. имеет вид С(у; ^)=λινϊ+λ^ί+...+λ^. (2.79 Некоторые из коэффициентов λ| могут равняться нулю. Если формы (2.67) и (2.76) эквивалентны, то форма (2.76) называется каноническим видом формы (2.67). Любую квадратичную форму с коэффициентами из любого числового поля К (или любого поля характеристики, не равной двум) можно над этим полем привести к каноническому, виду при помощи невырожденного линейного преобразования
142 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [1 переменных. Укажем два метода отыскания таких4 преобразований. Метод Лагранжа. Пусть надо привести к каноническому виду квадратичную форму (2.67). Если форма нулевая, т. е. все ее коэффициенты аи равны нулю, то она уже является канонической. Если форма не нулевая, но все коэффициенты аа при квадратах переменных равны нулю, то существует коэффициент а^фО, 1ф]. Преобразование. *1=Уи */=У* Х\=Уь х%=У/> *к=Уь *?НУ, 1, 2 (2.77) является невырожденным и приводит форму к виду, где ап φ 0. Итак, можно считать, что ахг φ 0 уже в исходной форме. Тогда преобразование Х\=У\—Уъ **— У\+Уъ *к=Уь Α = ί,4,...,η,(2.78) приведет форму к виду, содержащему квадрат первого переменного. Если исходная форма не содержит χ*ν но содержит х\, то преобразование *1=Уь Ъ=Уи *к=Ук> к φ lfl (2.79) приведет форму к виду, содержащему квадрат первого переменного. Таким образом, без ограничения общности можно считать ап Φ 0. Тогда, выделяя все члены, содержащие хи получим А(х; х)—апх\ + 2ахгрс1х^...^2аХпхххп^А1{х\ х) = где Аъ(х; χ) = Αχ(χ\χ)—^(αχ%χ*-{-...-{-αΧηχη)*.— форма, не содержащая первого переменного. Применив преобразование У*=х* Уп = *п> (2.80) выделим из данной формы один квадрат, т. е. приведем ее к виду — X + Л9 Су; у), где А* (у; у) не содержит уг.
1] §2. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 143 С формой А9 (у; у) поступаем точно так же, оставляя неизменным первое переменное (лишь меняя его обозначение). Так как все преобразования (2.77)—(2.89) не вырождены, то после конечного числа шагов получим невырожденное линейное преобразование переменных, приводящее исходную форму к каноническому виду. Число квадратов с ненулевыми коэффициентами λ; в каноническом виде квадратичной формы равно рангу исходной формы и не зависит от выбора невырожденного линейного преобразования, приводящего данную форму к каноническому виду. Пример 1. Найти канонический вид и невырожденное линейное преобразование переменных, приводящее к этому виду квадратичную форму А (х; X) ш* Х%Х% + Х\Хг + ХьХг. Так как в этой форме отсутствуют квадраты, то совершаем преобразование Xt=yt—y*t x*=yt+y*t Хь—Уь. (2.81) Форма примет вид Αχ (У\ У) =У\ —ft + ЬгУь — (Ух + Уь)г —у\ — ft. Применив преобразование получим канонический вид формы Аш(*1 ζ) = ζ\ — ζ\ — ζ\. Из (2.82) найдем Λ —ft —** Λβ«·» Λ8*** Подставив эти выражения в (2.81), получим искомое преобразование Xl яав Ζχ — Z% — Zzf Χ%ζ=ϊ ΖχΑτ Z% — Ζ%% x% = zb. Метод Якоб и. Для применения этого метода квадратичная форма (2.67) должна удовлетворять некоторым специальным условиям. Изложение метода Якоби в геометрической форме можно найти в [8], § 6. Мы дадим изложение в алгебраической форме. Пусть квадратичная форма (2.67) имеет ранг г и все угловые миноры, т. е. миноры, стоящие в левом верхнем углу матрицы формы, от первого до г-го
144 ГЛ« Η. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [1 порядка отличны от нуля: /1 2 ... fc\ DkS=sA[l 2 ... A/960, A=ss1, 2> —' Г· (283) Тогда канонический вид формы (2.67) можно найти по формуле Якоби ([6]» стр. 245, (£б)). Коэффициенты ?того канонического вида легче вычислять не непосредственно, а иным путем» дающим также и выражение новых переменных j/y · через старые xt. Именно, в силу (2.83) вц?£0, и, л вычитая первую строку матрицы Л, умножению на подходящие множители, из остальных, можно привести $ίγ матрицу к виду (<*\\ Ли ... аы\ О а!ц ... aml Теперь также обращаем в нуль все элементы второго столбца, стоящие ниже о^, и т. д., пока не приведем матрицу к треугольному виду О, в котором все строки, начиная с (г + 1)-й, состоят лишь из нулей. Заменим нули в этих строках любыми элементами так, чтобы «получилась невырожденная треугольная матрица. Например» в последних η — г строках на главной Диагонали поставим единицы, а остальные элементы оставим равными нулю. Получим матрицу вида t\\ *19 ··· t\r \гаЛ ··· Ίλ О tn ... tir <9>г+1 ;.. tin Г=| 0 0 ...trr ir,r+1 ... trn О 0 .,. О 1 ... О О 0 ... О 0 , ... Эта матрица Τ и будет матрицей коэффициентов в выражениях yj через xt. Преобразование, обратное для построенного, приводит исходную форму (2.67) к каноническому виду (2.84).
1] § 2. БИЛИНЕЙНЫМИ4 КВАДРАТИЧНЫЕ ФОРМЫ Ш Элементы матриц Г и А связаны равенствами /1 2.../—1 *\ А[\ 2.../-1 у/. А>=— 5^" /=1, 1+1, -·> *? * — *· 2, .„, η D9=l. (2.86) Однако практически их удобнее вычислять указанным выше методом приведения матрицы -А к треугольному виду. При этом попутно, определяется ранг матрицы* А и проверяются условия (2.83) применимости метода ЯКоби. Из (2.85) находим f„ = ^~-, 1 = 1, 2, ...,ir, D0=l. (2.86) Поэтому канонический вид (2.84) можно переписать так: что позволяет его найти по матрице Т, не вычисляя миноров Dt. Пример 2. Найти канонически^ вид и соответствующее невырожденное преобразование переменных для квадратичной формы А(х; Χ)=χ1 + χ1-2χ1 + 1χ\- — 4*ιΛΤι + 2xtx$ — 2xtXi + 2х%хь + 2xtxA. Приводим матрицу формы к треугольному виду, обозначая «знаком "^эквивалентность матриц: 1 _2 1 — Г — 2111 1 1—2 О К г-1' 1 ° т> (первую строку, умноженную соответственно на 2, — 1, 1, прибавляем к следующим) ' v
146 ГЛ. It. МАТРИЦЫ И КВАДР4ТЙЧНЫБ ФОРМЫ [1 (вторую строку, умноженную на 1 н —-5-, прибавляем к третьей и о четвертой) 1 0 0 0 — 2 1 — 3 3 0 0 0 0 — 1 — 1 0 0 Из (2.87) находим канонический вид С (у, у)=у\ — ~оУ1 о У ι =»*ι — 2*2 + Х$ — ХЬ Уг***** У**=Х* Отсюда находим искомое преобразование переменных 2 1 х% =^ι — jy% +У* + j Уь Хь=Уы Х*=У* Другой вывод метод а\ Якоб и см. в [7], стр. 43—44. При выполнении условий (2.83) для формы ранга г метод Лагранжа проводится лишь путем преобразований вида (2.80) и дает тот же результат, что и метод Якоби. Однако как канонический вид данной квадратичной формы, так и преобразование, приводящее ее к данному каноническому виду, не определены однозначно. Так, если ап φ 0, то при выделении квадрата первого неизвестного можно выносить за скобку не —, а любой ненулевой множитель. Этот множитель и будет коэффициентом при квадрате первого переменного в каноническом виде. Если, например, вынести множитель aiU то вместо (2.80) получится преобразование yt = Xi при 1>1. При условиях (2.83) форма ранга г приводится к каноническому виду (2.76) путем нескольких преобразований этого вида, что дает в итоге треугольное преобразование специаль-
1] § 2. БИЛИНЕЙНЫЕ Я КВАДРАТИЧНЫЕ ФОРМЫ J47 ного вида Λ = *9 + £93*3 + ··· ^ГС*пхп> уп = хп (2.88) с определителем, равным единице. Обратное преобразование будет того же специального вида (2.89) Можно доказать» что при преобразовании вида (2.89) угловые миноры матрицы А квадратичной формы не изменяются, и поэтому канонический вид, к которому приводится форма ранга г при условиях (2.83) преобразованием вида (2.89), должен выглядеть так: ~ -j£ (2.90) Dr- C(y;^)=Z)tyi+g^+... ([20], задачи 1221, 1222). Итак» канонический вид не определен однозначно для дан- ного класса эквивалентных квадратичных форм. Мы укажем здесь нормальный вид для комплексных форм (а в следующем пункте—для действительных форм); однозначно определенный для каждого класса эквивалентных форм. За счет изменения нумерации переменных yt в каноническом виде (2.76) можно считать, что для формы ранга г выполняются условия λ/ т*0 при i —1, 2, ..., г; λ/==0 при is=r-j-l, ..., л. Тогда преобразование zi = YTlyl при i = l, 2, ..., г, zi=yi при 2=/»-{-1, ..., η будет невырожденным и приведет (2.76) к виду D(z; z)=z\ + *\+ ... +* (2.91) Этот вид называется нормальным видом исходной формы.
148 ГЛ, 1ΙΛ МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [1, Две. комплексные квадратичные формы тогда и только тогда комплексно, эквивалентна, когда они имеют, один и тот же нормальный вид, т. е. когда они имеют одинаковый ранг ([11], стр. 176). Так как ранг формы от η переменных может „принимать лн5бое значение от нуля до п, то число классов комплексно эквивалентных квадратичных форм от η переменных равно л-}-1. Канонический вид билинейных форм. Так как матрица квадратичной формы (2.67) и матрица ее полярной билинейной формы при одинаковом преобразовании перемен· ных преобразуются по одной и той же формуле (2.73), то любая симметрическая билинейная форма цри пбмощй невырожденного линейного преобразования переменных (а именно преобразования, приводящего соответствующую квадратичную фо])му к каноническому в^;^2>7^6); примененного к обоим рядам йеремещдаку&^ЫУ плодится к каноническому виду С (я; vysssXiuxvt + )^t%v% + ··· + Κ**ηνη· (2*92) Несимметрическую билинейную форму одинаковым преобразованием обоих рядоа переменных нельзя привести к каноническому виду. Билинейная форма (2.66) называется кососимметрияеской, 'если ее матрица А является кососимметрической (стр. 129). Ранг кососимметрической билинейной формы — всегда число четное. Любде кососимметрическая билинейная форма с коэффициентами из некоторого числового поля К посредством невырожденного линейного преобразования с коэффициентами из К, одинакового для обоих рядов переменных, приводится к нормальному виду . ·.. + иг-&г — Vr-ii (2.93) где г — ранг билинейной формы ([14], стр. 217). Из возможности приведения форм к виду (2.76), (2.91) и (2.93) вытекают соответствующие свойства матриц: 1) Любая симметрическая матрица с элементами из числового поля К конгруэнтна над К диагональной матрице. 2) Любая комплексная симметрическая матрица комплексно конгруэнтна диагональной матрице вида {1, ..., 1, 0,.;., 0}, где число единиц равно рангу данной матрицы.
2] § 2. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 149 3) Любая; косоошметрическая матрица ранга г с Элементами из числового поля К конгруэнтна над К матрице {(_?i)»·- (_ϊί)·0··;··0}> где число клеток второго порядка равно γ . Q. приведении.. к каноническому виду некоторых квадратичных форм частого вида см. [20], задачи 1193—1198. 2. Действительнее квадратичные формы. Закон инерции. Индексы инерции и сигнатура.;Все формы в этом пункте предполагаются действительными и под эквивалентностью форм понимается их эквивалентность над полем действительных чисел. Методы Лагранжа и Якоби приведения квадратичной формы к каноническому виду, изложенные в предыдущем пункте, в применении к действительной форме не выводят из области действительных чисел. Поэтому любая действительная квадратичная форма эквивалентна над полем действительных чисел форме канонического вида. За счет изменения нумераций переменных форму ранга г можно привести к виду С(у; jO = Xtyi+ ... +\Ур — Wp+i— ... t-~Wp+*> p-\+q=r, λ,>0, !«sl, 2, »·.., г. (2.94) При этом числа ρ и q могут равняться нулю. Действительное невырожденное преобразование переменных */ = 1/Г|Л> 1 = 1,2, ...,r, zl=yl; «=»r+l»...> η, приводит канонический вид (2.94) к виду Р + Ч=г> (2.95) называемому нормальным видом действительной квадратичной формы. Закон инерции квадратичных форм. Число ρ положительных и число q отрицательных коэффициентов в каноническом виде (2.94)- или в нормальном виде (2.95) данной квадратичной формы не зависит от выбора того действительного невырожденного преобразования переменных,
150 ГЛ. II. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [2 которое приводит исходную форму к этому виду ([11], стр. 176). Числа ρ и q называются соответственно положительным и отрицательным индексами инерции, их разность s=p—q называется сигнатурой квадратичной формы. Индексы инерции, ранг и сигнатура связаны следующим образом: т—Р^гЧъ s=p — q\ />=4 (' + $)> ? = y(r- (2.96) поэтому г и $- однозначно определяют ρ и φ и наоборот. Из закона инерции следует, что две квадратичные формы тогда и только тогда эквивалентны (в действительной области), когда они имеют одинаковый, нормальный вид, или одинаковые индексы инерции, или одинаковые ранг и сигнатуру. Число классов действительно эквивалентных квадратичных форм от η переменных равно о? · ^исл0 жетаких классов при заданном ранге г равно г-f-l, а при заданной сигнатуре ,5 равно 1 п~^ Н~ *> где П°Д 1а1 понимается целая часть числа а ([20], задачи 1203, 1205). Из записи канонического вида в форме (2.84) или (2.90) предыдущего пункта вытекает Теорема Як об и. Если для квадратичной формы я А (х-, x)=j^iaIJxlXj ранга г выполняются условия (2.83). предыдущего пункта, то положительный индекс инерции ρ равен числу сохранений знака, а отрицательный индекс инерции q — числу перемен знака в ряду чисел l.DhD, Dn (2.97) p=P(l, Du D*, q=V(l,Du Db Поэтому для сигнатуры имеем s=r — 2g=r — 2V(\, Dt, £>,.'.·.» A) (2.99) ([6], стр. 246, теорема 2). ...Dr),\ ...AM (2.98)
2J §2. билинейные и квадратичные формы 151 Формула (2.99) для сигнатуры сохраняет силу и в некси торых случаях, когда отдельные миноры в ряду (2.97) равны нулю. Именно, имеет место ..Правило Гульденфингера. Если для квадратичной формы ранга г. a) Dr ^ 0, б) в ряду миноров (2.97) нет двух нулей подряд, то сигнатуру этой формы можно определять из равенства (2.99), где при подсчете числа перемен знака нул^ опускаются ([6], стр. 246). Правило Фробениуса. Если для квадратичной формы рангл г. a) Vr^0f б) в ряду миноров (2.97) нет трех нулей подряд, то сигнатуру можно определять из равенства (2.99), причем если Dk = 0, но Dk_iDM φ О, то нуль опускается, если же Dk = Dk+t = Of но Dk_\Dk+i^Q> то V(Dk_t% Dh Dk+U D*+4) = /1 при Ζν,£>Λ+9<0, 12 при βΛ.,ΟΛ+9>0 ([6], стр. 246). Если в ряду миноров (2.97) имеются три нуля подряд, то знаки миноров Dk не определяют однозначно сигнатуры формы. Так, /для формы 2axtXi -{- Ья\ + cxl при а т^О, Ьс^>0 имеем Di = D9 = D8 = 0, D4 = — a*fo<0. Но при b^>0f с^>0 будет q=l, а* при £<0, c<^0 — 9 = 3. Так же знаки миноров (2.97) не определяют сигнатуры формы ранга г, если Dt*D^ ... D^i^O, но Dr = 0. Так, при а ф 0, афЪ форма ах\ -f- <Ча + Ъя\ 4" 2ахххъ -{- 2ахххг -{- 2&xr**r8 = = я(*1+** + *8)* + (* — α)χΐ имеет ранг два, но $=0 при а^>Ь^>0 и $=2 при Ь^>а^>0, хотя в обоих случаях Dt = a^>0t D% = D^=0 ([6}, стр. 247). Линейной формой называется однородный многочлен первой степени, т. е. многочлен вида а^-{-%** + ... + яя.*гл. Произведение двух линейных форм от η переменных является квадратичной формой от этих переменных. Однако не любая квадратичная форма разлагается в произведение линейных
152 гл. п. матрицы и квадратичные формы [3 форм. Для того чтобы квадратичная форма А(х, л:) = л = Σ ai 1*1*1 с комплексными или действительными коэф- фициентами разлагалась в произведение двух линейных форм, необходимо и достаточно выполнение следующих условий: 1) для комплексных линейных форм: ранг квадратичной формы ^ 2; 2) для действительных линейных форм: ранг квадратичной формы ^2 и при ранге 2 сигнатура равна нулю ([11], стр. 178). Из существования нормального вида (2.95) вытекает такое свойство матриц: любая действительная симметрическая матрица действительно конгруэнтна единственной (для данной матрицы) диагональной матрице вида {1, ..., 1, —1, ..., —1, 0, ...» 0}, где число элементов ± 1 равно рангу данной матрицы (элементы >-{-1, — 1 или 0 могут и отсутствовать). 3. Положительно определенные квадратичные формы. Действительная квадратичная форма л А(х;х)=* 2 auXiXi (2.100) называется положительно определенной, если А(х; х)^>0 при любых действительных значениях переменных xh хь ...,хп, не все из которых равны нулю; отрицательно определенной, если А(х; х)<С^0 при тех же условиях; неотрицательной, если А (х; х) ^ 0,. и неположительной, если А (х; х)^0 при любых действительных значениях переменных. Эти четыре свойства мы будем обозначать соответственно неравенствами Л(лг,х)>0; Л(лг, *)<0; A(x\ *)S*0, А(х;х)*^0. Формы А(х\ х)^>0 и А(х; х)<^0 называются знакоопре- деленными, а формы А(х; х)^0 и Л(лг, х)^0 — полуопределенными. Знакоопределенные формы всегда невырождены. Полуопределенные, но не знакоопределенные формы всегда вырождены ([6], стр. 248). Если А(х\ х)^>0 (или ^0), то — А(х; х)<^0 (соответственно <0). Поэтому каждому свойству форм одного знака соответствует определенное свойство форм противоположного знака.
3] § 2» БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 153 Критерии для положительно определенных квадратичных форм. 1) Для того чтобы действительная квадратичная форма от η неизвестных была положительно определенной, необходимо и достаточно, чтобы она приводилась к нормальному виду, состоящему из η квадратов с коэффициентами -f-1, т. е. к виду D(z; *) = *i + *5+ ... +4, . (2.101) или чтобы выполнялось одно из равенств: р=п, $=*=/!. 2) Критерий Сильвестра. Для того чтобы действительная квадратичная форма (2.100) была положительно определенной, необходимо и достаточно, чтобы все угловые миноры ее матрицы DirZ)9, .. 1 2 ... * Dnt где £>* = 1 2 *=1, 2, щ (2.102) главные миноры А ее матрицы положительны были положительны £>*>0, А=1, 2, ..., η (2.103) ([11], стр. 181). Отсюда можно вывести, что если А{х\ *)^>0, то и все it ij ... i/f\ U к · · · h I ([6], стр. 249). В частности, все коэффициенты при квадратах переменных положительны: akk^>0 (A=l, 2f ..., η). 3) Для того чтобы, действительная форма (2.100) была неотрицательной, необходимо и достаточно, чтобы все ее главные миноры были неотрицательны ([6], стр. 249, теорема 4). Неотрицательности одних угловых миноров для неотрицательности формы недостаточно. 4) Для того чтобы действительная квадратичная форма была положительно определенной (неотрицательной), необходимо и достаточно, чтобы все характеристические числа ее матрицы были положительны (неотрицательны). 5) Для того чтобы действительная квадратичная форма (2.100) была положительно определенной, необходимо и достаточно» чтрбы ее матрица А представлялась в виде А = СС, (2.104)
154 гл. п. матрицы и квадратичные формы [4 где С—невырожденная действительная матрица порядка щ С — транспонированная матрица. 6) Для того чтобы действительная квадратичная форма (2.100) ранга г была неотрицательной, необходимо и достаточно, чтобы ее матрица А представлялась в виде (2.104), где С — действительная матрица порядка η и ранга г. Можно считать, что первые г строк матрицы С линейно независимы» а остальные строки нулевые ([20], задача 1210г). Из свойств 1) — 6) при переходе к форме — А (х; х) получаются соответствующие свойства отрицательно определенных и неположительных форм. Отметим лишь свойство, соответствующее 2): 7) Для того чтобы действительная квадратичная форма (2.100) была отрицательно определенной, необходимо и достаточно, чтобы знаки угловых миноров (2.102) чередовались» причем Д<0. 8) Если обе квадратичные формы А(х; х)= 2 aijxixj и В(эг, х)=± 2 b^x^Xj положительно определенны (или неотрицательны), то и форма, η С (χ; χ)= 2 aifiijXiXj положительно определенна (неотри- цательна) ([20], задача 1220). 4. Ортогональные преобразования квадратичных форм. Приведение квадратичной формы к главным осям. Линейное преобразование переменных η λγ, = Σ *1/Ур ι = ί> 2> ··· » п> (2.105) называется ортогональным, если его матрица Т=фуУ* ортогональна, т. е. Т=Т~1 (стр. 122). Если к квадратичной форме η А (х; х)= 2 *ij*i*j (2.106) применить ортогональное преобразование переменных (2.105),
4] § 2. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 155 то равенство В=ГАТ, (2.107) связывающее матрицу А формы (2.106) и матрицу В формы, полученной в результате преобразования, можно переписать так: В=ГМГ. (2.108) В частности, если А(х;х) = х\ + х1-\-! ...-\-х*п, т. е. А=Е, то и В=Е, и х|4-^!+...+^=^+^+--+^л-Это тождество необходимо и достаточно для того, чтобы преобразование (2.106) было ортогональным. Итак, отношение конгруэнтности (2.107) превращается" в отношение подобия (2.108). Из того, что любая действительная симметрическая матрица ортогонально подобна действительной диагональной, матрице (стр. 131), следует, что для любой действительной квадратичной формы (2.106) существует ортогональное преобразование переменных (2.105), приводящее ее к каноническому виду ^ΟίΛ—g Μ· (2Л09) При любом таком преобразовании коэффициенты λ, при квадратах переменных оказываются характеристическими числами (с учетом их кратности) матрицы А данной формы ([6], стр. 251, теорема 7). Поэтому канонический вид (2.109) определен однозначно с точностью до порядка коэффициентов λ/ν Если форма (2.106) имеет ранг г, то можно считать λ, 9*0 при i = l, 2, .,. , г и λ| = 0 при i = r+l, ... , п. Ортогональное преобразование (2.105), приводящее форму (2.106) к каноническому виду (2.109), в общем'случае определяется неоднозначно. Для того чтобы ортогональное преобразование переменных (2.105) приводило действительную квадратичную форму (2.106) к каноническому виду (2.109), необходимо и достаточно, чтобы столбцы матрицы Τ составляли ортонормиро- ванную систему собственных векторов (с действительными координатами) матрицы Л данной формы. Порядок столбцов в матрице Τ должен соответствовать порядку коэффициентов λ; в каноническом виде (2.109). Столбцы, соответствующие простым корням, определены однозначно с точностью до знака, а соответствующие кратным корням определены не однозначно. Число· столбцов, соответствующих данному корню, равно кратности этого корня.
15d ГЛ« И. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [4 Пример 1/ Найти ортогональное преобразование переменных, приводящее к каноническому виду квадратичную форму А (х; х) =5 2λγιΛΓ* ·+· 2xtx9 — 2xi*4-— 2х*х9 + 2χ&ι -f 2xъх*. Matpnua этой формы была рассмотрена в примере 1 на стр. 131. Там были найдены собственные значения Xt = λ8 = λ8 = 1, λ4 =*—3 и ортогональная матрица, по столбцам кЪторой стоят координаты собственных векторов, [τ ·?. 1 I ι ι ι η Ύ- 2 1 1 2 2 1 1ι Поэтому ортогональное преобразование переменных Хш -« у (yi +^а — .У» -?Λ) , *» = у 0>ι —Λ +.У» —Λ) > *4 ■* γ {Уι —У% —Уъ +У*) приведет данную форму к виду В ОП У) *=У\ ±У\ +У1—Зу}. Ранг квадратичной формы (2.106) равен числу отличных от нуля собственных значений ее матрицы АУ индексы инерции— числу положительных и числу отрицательных среди этих значений, а сигнатура — разности этих чисел. Если при* непрерывном изменении коэффициентов действительной формы остается неизменным ее ранг, то остается неизменной также сигнатура, и наоборот ([6], стр. 251).
Щ § 2t БИЛИНЕЙНЫЕ И КВАДРАТИЧНЦБ .ФОРМЫ 157 Замвч^ани:£,> Приведение квадратичной формы к каноническому вуьрщнптощн ортогонального преобразования переменных йааы^|к?^акже приведением этой формы к главным осям. Это #аз£анй& объясняется связью с геометрией. 'Пусть дана централь· Нал гиперповерхность второго лбрядка я-мерного евклидова пространства: ι» 2 ацх&^с, ay-tajb сфО. (2.110) */-ι Приведя квадратичную форму» стоящую в левой части уравнения _к каноническому виду ортогональным^лреобразованием, получим уравнение 1—1 которое показывает» что новые оси координат являются осями сим· метрии или, как их называют» главными осями гиперповерхности. Направления этих осей заданы векторами» координаты которых стоят по столбцам матрицы Τ преобразования (2.105). За счет из· менения знака одного из столбцов можно считать | Г| = 1. Тогда новая система координат получается из старой путем некоторого «поворота». Из свойств перестановочных нормальных (в частности» действительных симметрических) матриц (стр. 137) следует» что совокупность двух или более действительных квадратичных форм тогда и только тогда имеет ортогональное преобразование переменных» одновременно приводящее к каноническому виду каждую форму данной совокупности» когда матрицы форм этой совокупности попарно перестановочна. В геометрической форме это означает» что две или более центральны.! поверхностей второго порядка тогда и только тогда имеют параллельные главные оси» когда их матрицы попарно перестановочны. Канонический вид неоднородного многр- члена 2-й степени. По аналогии с геометрией можно рассматривать более общую алгебраическую задачу — приведение любого (необязательно однородного) многочлена 2-Й степени от η переменных к каноническому виду путем ортогонального (не обязательно однородного) преобразования перемен· ных. Пусть дан многочлен ■η η Σ *ι/***> + 2 Σ*Λ + *· (2.112)
158 гл. п. матрицы и квадратичные формы (4 Во-первых, квадратичную форму из всех членов 2-й степени приведем к каноническому виду 2*гУ?> r^e г *"~ Ранг 9Т0Й формы, при помощи ортогонального преобразования пере· менных *i= ΣΡνϊρ 1=1» 2» ···> п. (2.113) После этого преобразования многочлен (2.112) примет вид (2.114) |М + 2|«Л+С, λ, 9* 0, { = 1, 2, „· , г.) Во-вторых, из равенства λ^ί+2%ι=λ/(Λ+^)9-^ ясно, что параллельный перенос yi=zi — Tj при 1 = 1, 2, ..., г, yt=Zi при i=r+l,...,/t приведет многочлен (2.114) к виду ΣΜί + 2 Σ Ь'ъ + с'; (2.115) (2.116) в-третьих, если не все. Ь'г+и ... , Ь'п равны нулю, то (п—г)-мерный вектор
4] § 2. вилвнейныв и квадратичные формы 159 можно дополнить до ортонормированной базы (п— г)-мерного пространства векторами Преобразование Ui=Zi при 1=1, 2, ... , г, я «1= Σ 4ijzj ПРИ * = ^-f-1» ... t n будет ортогональным. Обратное преобразование *| = й/ при 4 = 1, 2, ..., г, я «ι™ Σ tyiK/ при i=r+l я (2.117) (матрица которого получаемся в „ силу ортогональности транспонированием матрицы предыдущего преобразования) приведет многочлен (2.116) к виду ΣΜ? + 2λΓ+1αΓ+1-Κ, (2.118) iaml где λΓ+1 = |/ J] »?*0. Наконец, преобразование «, = ?,. при i^r+1, ifr+1 = vr+, gf^ (2.119). с^ Vn приведет многочлен (2.118) к виду §λ^? + 2λΓ+1νΓ+1. (2.120) Последовательное выполнение преобразований (2.113), (2.115), (2.117) и (2.119) дает ортогональное преобразование (в общем случае неоднородное), приводящее исходный многочлен (2.112) к одному из трех канонических видов: или (2.120)
100 ГЛ. II/МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРЙЫ [4 (λ/44 Φ- % ИЛИ ^\{0\ (</=λ/+1 = 0), (2.121) или JjMil + α (^^Ο,λ^^δ). (2.122) Если рассматривать многочлен (2.112) как левую часть уравнения гиперповерхности второго порядка в л-мерном евклидовом пространстве, то в случае канонического вида (2.120) поверхность имеет ось симметрии, а в случаях (2.121) и (2Л 22) центр симметрии. Приме ρΝ2. Да1№ги ^тод^а^б^; йр^Ьбразование, приводящее к каноническому ви^У: Ы^ог^Чйен 2х<хш + 2xtxt ί-*2Λ?ιΛΤ4—2х^хь + 2лг2лг4 + 2хгхА + βΧι + ' Квадратичная форма этого многочлена рассмотрена в примере 1. Так как теперь многочлен зависит от шести переменных, то преобразование (2.113) с учетом результата примера 1 принимает вид *ι—Τ(Λ+Λ+Λ+Λ)» ^ι — γίΛ+Λ — Λτ-Λλ *· —у(Л—Λ+>·--Λ)» *ι —y(?i—Λ—Λ+Λλ (2.123) Это преобразование приведет многочлен к виду Л+Я+Л-'ад + 4Л + !&|+Л+Л + 1. (2Л24) Полагаем *i—.yi + 2» JiKjra-t-l, *ιβΛ ПРИ ^ = 3, 4, 5, 6. Отсюда найдем преобразование, аналогичное (2.115), ylwmgl^2f jfc —* —1, Λ=**ί при ί = 3,<4, 5, 6. (2.125) Это преобразование приведет многочлен (2.124) к виду г\ + г\ + «| — 3*| + *· +·*· — 4. (2.126) Далее надо вектор αι==(Ι, 1) из коэффициентов при z%t z\ нормировать и дополнить до ортонормированной системы. Удобнее,, рднако, сначала строить ортогональную систему» a ytfe зате^ нормировать векторы. В данном примере η — г = 6—4 = 2, и для вектора а4 надо найти, лишь один вектор, к нему ортогональный. Этот вектор
4] § 2. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 161 ищем из условия ортогональности: Xt + xs=0. Можнр взять а*== ^(U'^i;· Нормируя, получим матрицу М-!)· Обратная матрица совпадает с той же матрицей ввиду ее .ортогональности и симметрии. Поэтому преобразование, аналогичное (2.117), имеет вид Zi^=ui при fael, 2,3,4, . Многочлен (2.126) принимает вид u\ + ut + ul — Зи} + /2" «6 — 4. (2.123) Наконец, полагая νΊΓαβ —4«= νΤ(ιι§ —2 уТГ)= УТ**, находим преобразование, аналогичное (2.119), щ = щ при ί?£5, ub=vb + 2 γΊΙ (2.129) Это преобразование приведет многочлен (2.123) к каноническому виду *? + vl + vl — 3*ϊ + УТ *6. (2.130) Выполнив преобразование (2.123), (2.125), (2.127) и (2.129), найдем неоднородное ортогональное преобразование, приводящее исходный многочлен к каноническому виду (2.130), 1 '31 3 Xl^-jiVl + Qi + Vb+V*) — тр, Л>=*у(*1+*,— Vb — tf4) — y, *· = γ(*1— *! + *,— tf4) — y, ^4«γ(νΐ —V8—V$+V4)—γ, *. — ■у/7(* + *·) + 2> лг« = у /2>6_*«) + 2. Ортогональная эквивалентность. Две действительные квадратичные формы А(х; х) и £(*; *) от η пере· менных λγι, λγ9, ... , дгд называются ортогонально эквива· лентными, если существует ортогональное преобразование вида (2Л05), которое после его применения κ форме А (х, X) и замены переменных yt снова, на JC/ переводит форму А{х\ х) в форму В(х; х). Ортогональная эквивалентность форм обладает рефлективностью, симметрией и транзитивностью (стр. 141). Поэтому все действительные квадратичные формы от η неизвестных распадаются на классы ортогонально эквивалентных форм. (2.127)
162 гл. п. матрицы и квадратичные формы [5 Две действительные квадратичные формы тогда и только тогда ортогонально эквивалентны, .когда их матрицы имеют одинаковые характеристические многочлены или, что то же самое, одинаковые характеристические числа ([20], задача 1265). Отсюда следует, что если в каноническом виде (2.109) писать коэффициенты λ, в определенном, например, невозрастаютем, порядке, то каждый класс ортогонально эквивалентных квадратичных форм (а значит, и' ортогонально подобных действительных симметрических матриц) однозначно характеризуется .содержащейся в нем формой (соответственно матрицей) канонического эида. б· Пара форм. Пучок фору. Все' формы в этом пункте предполагаются действительными. Свойства пучка квадратичных, форм применяются в теории малых колебаний механических систем (см. [6], гл. 10, § 8). Пусть дана пара квадратичных форм А(х;х) = ^ацх^ и В(х\ х)= J] V***/· (2Л31) ί./-1 Ι.Λ-1 Спрашивается, можно ли обе эти формы одним невырожденным линейным преобразованием неизвестных привести к каноническому виду? В общем случае эта задача не имеет решения. Так, формы А(х, х)=х\, В(Х} х)=хххг нельзя привести к каноническому виду одним невырожденным преобразованием (см. [11], стр. 231). Имеет место следующее достаточное условие разрешимости поставленной задачи. Если хотя бы одна из двух форм (2.131), например В(х; х\ положительно определенная, то существует невырожденное линейное преобразование переменных, приводящее эту форму к нормальному виду, а другую — к каноническому. Для отыскания такого преобразования практически наиболее удобно сначала найти невырожденное преобразование X=PYf (2.132) приводящее В(х; х) к нормальному виду Bt(y; j)=j*+ji + ...+j£. (2ЛЗЗ)
5] § 2. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 163 Применив4 то же преобразование (2Л 32) к форме А(х\ х), получим новую форму At(y\y)= 2 «Wy (2Л34) Для этой формы ищем ортогональное преобразование переменных Y=QZf (2.135) приводящее ее к каноническому виду А9(z; z) = \tz\ + \%zi^...+\nzl (2.136) Применив преобразование (2.135) к форме (2.133), получим форму с матрицей C?EQ==Q'Q=Ef т. е. снова форму нормального вида Β*(ζ; ΐ)Μ,+«Ι + ...+4 (2-137) Таким образом, невырожденное преобразование неизвестных X=PQZ (2.138) приводит форму А(х\ х) к каноническому виду (2.136), а форму В(х; х) — к нормальному виду (2.137) ([11], стр 232). Пучком квадратичных форм называется совокупность форм· А(х, χ) — \Β(χ, χ), (2.139) где λ — параметр, принимающий любые действительные значения. Если форма В(х, х) положительно определенная, то пучок называется регулярным. Уравнение |Λ —λ£| = 0 (2.140) называется характеристическим уравнением пучка форм (2.139) (или λ-уравнением), а его корни — характеристическими корнями или характеристическими числами этого пучка. Если λ0 — характеристический корень пучка (2.139), то существует ненулевой вектор z=(zit г*..., zn)f столбец Ζ из координат которого удовлетворяет уравнению (Α — λ05)Ζ=0, Ζ^Ο. (2.141) Вектор ζ с этим свойством называется главным вектором пучка (2.139), принадлежащим характеристическому числу V
164 ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ (6 Характеристическое уравнение регулярного пучка (2.139) имеет η действительных характеристических корней (считая их кратность) \ь λ^,..., λΛ, которым принадлежат главные векторы г* = (*ш ***>···> *nk)> *—It 2,..., it (2.142) Столбцы Zk из координат этих векторов удовлетворяют условиям AZk = \kBZk, А=1, 2,..., п. (2.143) Эти главные векторы можно выбрать так, чтобы выполнялись следующие условия ортонормиррванностщ! B(zt\ Bi)^ZiBZs^bliib#j№i&£r.<.b*. (2.144) •Здесь В{х, у)^#о^у(ь*:ЩШ1еЪ№я tyopu& квадратичной >формы В(х? X) (Щ έτρ. S52, теюрема 8). Главной матрицей регулярного пучка (2.139) называется матрица Ζ=(%)?, (2.146) столбцы которой состоят из координат главных векторов, удовлетворяющих условиям (2.144). Отсюда можно вывести, что столбцы главной матрицы Ζ линейно независимы, и значит, эта матрица не вырождена. Невырожденное линейное преобразование неизвестных Χ=ΖΥ, (2.146) где Χ, Υ—столбцы старых и новых переменных и Ζ—матрица преобразования, тогда и только тогда приводят положительно определенную форму В(х, х) к нормальному, а другую форму А(х, х) к каноническому виду, когда матрица Ζ является главной матрицей регулярного пучка (2.139), соответствующего данной паре форм. При этом коэффициенты λ| канонического вида формы А (х> х) являются характеристическими корнями (с -учетом их кратности) пучка (2.139), следовательно, канонический вид определен однозначно до порядка нумерации коэффициентов λ* ([6], стр. 254, теорема 9). в. Экстремальные свойства характеристических чисел регулярного пучка форм· Пусть дан регулярный пучок квадратичных форм (его определение' и свойства даны в
6] §2. ЭЙЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ J61 иредудухц^и пункте) . А (х, х) — \В (х, X). (2.147] Расположим характеристические числа этого, пучка в< неубывающем порядке: λ1<λ9<...<λΛ. (2.148; „Соответствующие главные векторы пучка .обозначим через ' *k — (*ш *jub...t *nk)\ k = \, %,..., п. (2.149; Два вектора xt у назовем ортогональными, если для ниц удовлетворяется равенство В(х, у) = 0. Главные векторь (2.149) можно считать попарно ортогональными и ненулевым* (даже ортонормированными, т. е. удовлетворяющими равен ствам (2.144) предыдущего пункта). • Наименьшее характеристическое число λ, регулярного пучка форм равно минимуму отношения этих форм: A1 = min^-|, х^О, (2.150. причем этот минимум достигается тогда и только тогда когда χ является главным вектором пучка, принадлежащий значению λ, ([6], стр. 258, теорема 10). р-е по величине ха рактеристическое число λ^ 2*^Lp^nt равно минимуму тоге же отношения/форм, причем минимум берется при условии что вектор χ ?Ь0 ортогонален к первым ρ — 1 попарно орто тональным главным векторам > _:.. А (X, X) дг^О, B(zi9 x) = 0, 4=1, 2,..., p—h Β(ζ(\Ζ;) = 0, 1ф), l,'j=l,2,...,p—l. (2.151 Этот минимум достигается тогда и только, тогда, когда век тор х является4 главным вектором пучка, принадлежащие значению λρ ([6], стр. 259, теорема 11). В этой характеристике числа λρ нужно знать первые /?—1 главных векторов, выбор которых в общем случае н< однозначен. А\ожно дать другую характеристику для \р.
166 ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [6 Говорят, что на вектор χ (или на переменные хи -**,... ..., хп) наложены А связей Lu I3,...; Lhf если его координаты удовлетворяют системе h линейных уравнений Мы будем рассматривать также специализированные связи 2*, А = 1, 2,..., η, заданные условиями ортогональности вектора х к главным векторам: Lk(x) = B(zk, *) = 0, А=1, 2, /#. , п. (2.163) Минимум отношения форм А(х, х) В{х> х) при условии, чго на вектор χ наложены h связей Lif Ι*,... ..., 1Л, обозначим через mini^; L\> L*···* ^л)· Тогда для /?-го характеристического числа λρ регулярного пучка форм (2.147) имеет место выражение \> = = max fmin(-=■; Lu £*...» Vi)l· (2·164) ^i·1* ip-iL v° /J где минимум берется при данных ρ — 1 связях, а максимум — при варьировании этих связей ([6], стр. 260, теорема 12). Формулу (2,151) можно переписать так: -g\ 1л% £*...· Ip-ij· (2.166) Применяя формулы (2.160), (2.165) и (2.154) с заменой А(х, х) на —А(х, х\ можно получить формулы (А ~ ~ ~ \ -β\ Ln> £*-!>···> ^л-р+«)> (2.157) λ^+,= min fmax(~; Lu L*...p V*)] (2Л68) ([6], стр. 261, теорема 13). Связи Lu £*..., Lh называются независимыми, если ранг матрицы из их коэффициентов равен А*
6] § 2. БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 167 Если на регулярный пучок форм (2.147) с характеристическими числами (2.148) наложить ft независимых связей Ц(х) = 09 Ц(х) = 09..., L%(x) = 0f (2.169) то из этих уравнений ft неизвестных из хь х*..., хп можно выразить через остальные η — А. Подставляя эти выражения в пучок (2.147), получим новый пучок Α* (ν; ν) — λβθ(*; *)/ (2.160) где через νί9 г>9,..., vn^h обозначены оставшиеся п — ft из переменных χί9 **.?»., χη. Пучок (2.160) QHoea будет регулярным. Его характеристические числа Μ<λ;<...<λ&_*4 (2.161) не зависят от того, какие из ft прежних неизвестных xt были исключены при помощи данных связе^ (2.159). При этом справедливы неравенства Xp<*J<W p=lf 2,..., n — h (2.162) ([6], стр. 262, теорема 14)..· Пусть даны два регулярных пучка форм: пучок (2.147) с характеристическими числами (2.148) и пучок А (х\ х) — \В (х\ х) (2.163) с характеристическими числами Χι <!*<... <ХЛ. (2.164) Если для любого х^О выполняется неравенство А(х; χ)^Ά(χ\ χ) В(х,х)^В(х;хУ то λρ^Χρ, р=1, 2,..., η ([6], стр. 263, теорема 15). Если вторые формы пучков (2.147) и (2.163) совпадают и Α (χι х)=А(х; х)+ 2 [Xt(x))\ /-ι где Xi(x), i=l> 2,..., г, — линейно независимые линейные формы, то λρ<λρ<λρ+Γ, p=lf 2,..., л, (2.165) причем вторые части неравенств имеют место лишь при р^п — г ([6], стр. 264, теорема 16).
Ш TJk П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМА .· φ Если первые формы пучков (2.147) « (2Л 63) совпадают и гле'Х^х), i«=l, 2,..., г,— линейно' независимые линейные формы, то имеют место неравенства Xp-f-<*p<V />=1, 2,../, л, ' (2.166) причем первые части неравенств имеют место лишь при р^>г ([6], стр. 264, теорема 17). • Веря в пучке (2.147) в качестве второй формы сумму квадратов ν . % и:к . В(х; *)^*$^&&А+Ц-А> из приведенных в этом "пункте свойств регулярного пучка форм получим экстремальные свойства характеристических чиЬел одной квадратичной формы Л(х; х) (см. [8], § 17). 7· Комплексные формы второго рода· Эрмитовы формы· В случае поля комплексных чисел, кроме билинейных и квадратичных форм, определенных в п. 1, рассматриваются били· нейные и квадратичные формы в другом смысле. Комплексные формы в смысле п. 1 будут называться формами пер· еого рода, а в новом смысле — формами второго рода. Эта терминология не является общепринятой, хотя она встречается в применении к линейным формам (см., например, [8], стр. 79). Билинейной формой второго рода называется функция от 2/1 комплексных переменных хи лг3,..., хп; у%, 1у«,..., уп> заданная при помощи выражения А(ъу)= Σ «iJ*i?J> (2-167) U-ι где ац (ί, j = 1, 2,..., η) — любые комплексные числа, а черта над у} означает, что при подстановке значений аргументов вместо у j подставляется число, комплексно сопряженное tyj% Коэффициенты αφ а следовательно, и запись билинейной формы в виде суммы (2.167) определены для данной формы однозначно.
7] §' & ЬШШНВЙНЫБ И КВАДРАТИЧНЫЙ ДОРМЫ 169 lAwfyiimja коэффициентов аи * А = (аиУ1 (2.168) называется матрицей билинейной формы (2.167), а ее ранг — рангом этой формы. Можно определить билинейную форму второго рода как функцию двух векторов х,у комплексного линейного пространства (см. [8], стр. 80). Мы <будем, считать вероры ху у заданными же координатами х=(хи лг9,*.., xn)> -./ НвадратичЯой формой, второго рода называется функция от η комплексных переменных хи **,..., хПУ полученная ,из билинейной формы второго рода при х=у иди и1ри x$sssyh i=lf 2,..., л, т. е. функция, заданная при понощр выражения А(хг, х)= У! a^Xj. (2.169) ι./-ι В отличие от квадратичных форм первого рода, коэффициенты aijy а следовательно и представление (2.169), однозначно определяются квадратичной формой второго рода. , Матриц^,,ранг, дискриминант, понятия невырожденной и вырожденной (или сингулярной) квадратичной формы для форм второго рода определяются аналогично случаю форм первого рода (стр. 138—139). Так как билинейные и квадратичные формы второго рода находятся во ^взаимно однозначном соответствии с их матрицами, то, в отличие от форм первого рода, между билинейными и квадратичными' формами второго рода . установлено взаимно однозначное соответствие, причем соответствующие друг другу формы имеют одинаковые матрицы. Поэтому значения билинейной формы второго рода должны определяться значениями соответствующей квадратичной формы. Существует следующая связь между этими формами: М*\У) = \[А(х+у\ x+y) + iA(x+ly; x+iy)- — A(x—y\x—y) — lA(x — iy\x-^iy)l(2.\10) A(y;x)=^[A(k+y; x+y)-iA(x+iy; x+iy)- — A(x—y; x—y) + lA(x — ty; x — iy)} (2.171) ([8], стр. 81-82, (1), (2)).
170 гл. п. матрицы и квадратичные формы [7 С помощью умножения матриц билинейная форма второго рода (2.167) записывается в виде A(x;ty) = X'AY, (2.172) а квадратичная форма второго рода (2.169)—в виде Л(лг, х) = Х'АХ, (2.173) где Χ, Υ—столбцы переменных *сь yh Если к форме (2.172) применить преобразования переменных X=SU, Y=T% (2.174) тр ее матрица преобразуется по формуле В=&АТ. (2.175) Матрица квадратичной формы (2.173) при преобразовании переменных * Х= ΤΥ (2.176) изменяется по формуле В=ГАТ. (2.177) Эта формула после замены Q= T принимает вид B=Q*AQ, Q* = Q'. (2.178) Из формул (2.175) и (2.177) следует, что при невырожденных линейных преобразованиях переменных ранг билинейной и квадратичной форм второго рода не изменяется. Среди форм второго рода аналогичную роль с симметрическими действительными билинейными и действительными квадратичными формами играют так называемые эрмитовы формы. На эти формы переносятся все основные результаты пп. 1—5 (причем всюду скалярное умножение векторов надо определять по формуле (2.52), стр. 122) (см. [6], гл. 10, § 9). Эрмитовой билинейной (или квадратичной) формой называется билинейная (соответственно квадратичная) форма второго рода, матрица которой является эрмитовой (стр. 129), т. е. обладает свойством A* = Af au = aJit I, 7»1, 2,..., п. (2.179) Из равенства (2.178) следует, что эрмитовы билинейная и квадратичная формы при линейном преобразовании переменных (2.176) переходят снова в эрмитовы формы.
7] § 2. БИЛИНЕЙНЫЕ И КВАДРДТИЧНЫЕ ФОРМЫ 171 Билинейная форма второго рода А {х\ у) тогда и только тогда будет эрмитовой, когда выполняется тождество А{Х1у) = А(уПЬ (2Л80) Отсюда и из равенств (2.170) и (2.171) следует, что квадратичная форма второго рода А(х\ х) тогда и только тогда будет эрмитовой, когда она имеет действительные* значения при любых комплексных значениях хи .%..., хп. Из условий (2Л 79) эрмитовости матрицы А следует, что ее элементы, стоящие на главной диагонали, и вообще все главные миноры А I.1.*'"**) действительны. На эрмитовы квадратичные формы переносятся методы Лагранжа и Якоби приведения к каноническому виду (п. 1). При. выделении первого члена по методу Лагранжа при ап φ о собираем все слагаемые, содержащие хх и xif и при· меняем тождество я η *ll*l*i + 2 *!**!**+ 2 ******* = η η -ά( Σ «■**·)-(Σ***)-- η η -•^ί Σ *·*·**) · (Σ *,λ**)· Таким образом, любая эрмитова квадратичная форма при помощи невырожденного комплексного линейного преобразования переменных приводится к каноническому виду *ιΛΛ + 4ν*Λ + · · · + ХпУп?п, (2Л81) где коэффициенты λ, действительны; для формы ранга г можно считать λ^Ο при 4=1, 2,..., г; λ| = 0 при 1 = = г-|-1,..., я. ч Для эрмитовых квадратичных форм сохраняют силу закон инерции, понятия индексов инерции и сигнатуры, их определение по знакам угловых миноров, правила Фробениуса и Гульденфингера (п. 2), а также определение и критерии положительно определенных форм (п. 3).
472 ГЛг II* М^РИЦЫ И КВАДРАТИЦНЬ1р ФОРМЫ {$ Из того, что любая эрмитова матрица унитарно подобна действительной диагональной матрице с характеристическими числами на диагонали (стр. 130), вытекает Приведение эрмитовой, квадратичной формы к главным осям. Любую эрмитову квадратичную фррму.(24 69) ρ матрицей А при помощи уни!арного преобразования переменных вида (2.176) можно привести к каноническому виду (2.181). Коэффициенты Xj этого вида будут характеристическими числами матрицы А 'и, следовательно, действительны и определены однозначно. Столбцы матрицы преобразования Г состоят из чисел, комплексно сопряженных координатам ортонормированной системы собственных векторов матрицы А. Напоминаем, что ортонормированную систему ректоров надо понимать в сщ*С4гё рк^лярйого умножения по формуле (2.Щ.{#$.;.\Щ.\ ""' - Свойства ~л?р& форм (* 5) и экстремальные свойства характеристических чисел регулярного пучка (п. 6) также переносятся на любые* эрмитовы формы (см. [6], гл. 10, § 9), 8. Ганкелевы формы. Пусть дана последовательность 2л—1 чисел % $и %..., 59л.9. Ганкелевой формой называется квадратичная форма от η переменных лг0, хь χ%,...,χη„ι вида S(x;x)= 2 smxixJ- (2.182) 1.У-0 Симметрическая матрица ганкелевой формы / $1 Л $8 ··· $л \ 5=К $9 $ι ... Vi I (2.183) называется ганкелевой матрицей. Для действительных ганке левых форм индексы инерции и сигнатура полностью определяются значениями^главных миноров их матриц. Следующие три предложения. справедливы для ганкелевых форм с коэффициентами из любого поля. 1) Если в ганкелевой матрице (2.183) первые h строк линейно независимы, а первые h +1 строк линейно зависимы
%\ § £, ^линейные и квадратичные формы пз ([6], стр. 274, лемма 1). 2) Если для ганкелевой матрицы (2.1JB3) при некотором А выполняются условия DA^0, DA+1= ... = Dn = 0, А<> (2,185) и если положить _ ,·' /1 2... A A + I+1X "—5л \1 2...А А-К/+1/ *,У=0, 1,..., η — Α — 1, (2.186) то Матрица 7"== (^#у)?-"л-"1 также ганкелева, и все ее элементы, лежащие выше второй диагонали, равны нулю ([6], стр. 274, лемма 2). 3) Если ганкелева матрица" (2.183) имеет ранг г и при некотором А выполняются условия Ζ)Λ9*0, DA+, = ... = Z)r = 0, A<r, . (2.187) то главный минор D{r) порядка г, стоящий на пересечении первых А и последних г — А строк и таких же столбцов, отличен от нуля, т. е. м /1 2...А п — r-f-A-f 1 ...п\ \12...А л — r + A-f-1 ... η) ν ' ([6], стр. 276, теорема 23). 4) Теорема Фробениуса. Для действительной ганкелевой формы (2.182) ранга г индексы инерции pf q и сигнатура $ мо>ут определяться по знакам угловых миноров (ср. п. 2) по формулам p=P(l, Dh Д*...,Д.), \ q=V(h Dh Z>*..., Dr\ I (2.189) s=r — 2V(l,DuDb...9Dr)tJ где Р и V обозначают соответственно число сохранений и перемен знака в ряду чисел, стоящем в скобках·
174 ГЛ. П. МАТРИЦЫ И КВАДРАТИЧНЫЕ ФОРМЫ [8 При этом предполагается, что Dr^0 и что в любой группе из т промежуточных миноров Окф0, DM = ...=Dh+m = Ot Дл+т+1^0 (2.190) нулевым минорам приписаны знаки по формуле signZ>A+y = (-l) * signD*. (2.191) При таком выборе знаков величины Р, V, Ρ—V, соответствующие группе миноров (2.190), получат значения: (т + \ . Р=< 2 т + \+* 2 (т + \ V= Д1+1—ε -Η при т нечетном, при т четном, при т нечетном, при т четном, при т нечетном, при т четном, e = (-l)?sign^giL. В случае Dr = Q сказанное остается верным, если заменить D-r на Ό^ΦΟ согласно (2.188) ([6], стр. 277, теорема 24).
ГЛАВА III АЛГЕБРА МНОГОЧЛЕНОВ [11] § 1. Общие свойства многочленов 1. Определения. Примеры. Многочленом (или полиномом) степени η {η -г— неотрицательное целое число) от переменного χ над числовым полем К (см. введение) называется выражение вида где а0,.. 0 ап — числа из К9 причем а0 φ О *). Многочлены нулевой степени — это просто отличные от нуля числа. Число нуль также считается многочленом; его степень не определена. Обычные обозначения · для многочленов: f(x)t g(x), <f(x) и т. д. Два многочлена считаются равными, если у них равны коэффициенты при одинаковых степенях переменного. Многочлены можно вкладывать, вычитать, умножать друг на друга. Суммой (разностью) двух многочленов f(x) и g(x) называется многочлен, у которого коэффициент при каждой степени переменного χ равен сумме (разности) коэффициентов при той же степени χ в многочленах f(x) и g(x). Пример. 1. /(*)=»*·— 4*· + *+ 1, g(x)=*x*+li /<*)+*<*>—*—а*»+*Ч:2; /<*)—*<*)—*·—5*· + *. Чтобы умножить многочлен f(x) на многочлен g(x), нужно каждый член многочлена /(лег) умножить на каждый член g(x), сложить полученные произведения и привести подобные члены. Степень произведения двух многочленов всегда равна сумме степеней сомножителей. *) Аналогично определяются многочлены над произвольным полем А не обязательно с числовыми элементами (гл. IV, § 3).
176 ГЛь III. АЛГЕБРА МНОГОЧЛЕНОВ р Пример 2. /(*)=*.**—Злг +2, g(x)=*x* + 2x —3; f(x)g(x)=x* + 2x*—3x*—3x* —6α:8 + &λ: + 2λ:8 + 4λγ—6= = ** — λ:·—7λγ·+ 13аг,— 6. Деление (нацело) одного многочлена На другой не всегда возможно. 2. Деление с остатком. Любой многочлен f(x) можнс разделить на любой другой многочлен #(#) (g(x)^£:0 с остатком, т. е, можно единственным образом представить многочлен f(x) в виде f(x)=g(x)q (х)-\-г(х), где q{x) я г (χ) — какие-то многочлены, причем степень; г (дг) меньше степени g(x) или же г(дг)=?=0; #.(#)г й^ывается частным от деления многочлена /(^) «а-^(х#/:(^) Называете я остатком от этого деления* E^V(v)^:?0> то говорят, что /(х) делится ни g{x) без остатка (нацело). Если g(x)— многочлен нулевой степени» т. е. ч^сло, тс на него делится без остатка любой многочлен f(x\. Тогда и только тогда /(лег) делится без остатка на g(x) и одновременно g(x) делится без остатка на f(x)t когда g(x)=cf(x\ где с Φ 0 — некоторое число. Пример Г. f(x)=stx*—l, g(x)=ax*-\-x+\. Здесь ** — l*s(**-f х+Ц{х—Д τ· е./(χ) делится на g(x) без остатка' (f Ос)β л: — 1, г (х) = 0)/ Пример 2. f(x) = 2x9 — 3x+\t g(x)=BX* — 4x—l. Здесь /(*)==£(*)?(*) +>·(·*)> где q(x)=z2, г(х)=*5х + 3. Если степень /(дг) меньше степени g(x), то частным от деления /(дг)чна g(x) является многочлен q(x)s±sOt а остатком — сам многочлен f\x). В общем случае для нахождения частного и остатка можно воспользоваться известным из курса средней школы правилом деления <уголком> (оно применимо к многочленам с коэффициентами из любого поля). 3. Схема Горнера. Если многочлен f(x)=sa^xA -\- + βιΛΓβ"*1 + ... + βΛ.ιΑΓ-|-αΛ нужно разделить с остатком на многочлен g(x)=x — Ь% то это проще всего сделать с помощью схемы Горнера, которая составляется так: выписываются в строку коэффициенты многочлена /(дг), начиная с а0; слева пишется число Ь\ затем под а0 пишется еще раз число во, под at пишется число аф-\-ау = Ьх, под я* — число bib-\-ai~b<i и т. д.; под ап пишется число ba.tbг-{- &п = Ьп.
3] § ί ♦ ОБЩИВ. СВОЙСТВА МНОГОЧЛЕНОВ 177 b^ уЯвляется остатком от деления fix) на х—Ь, а* ■ *14.ь»&" &Ά-ι -"" коэффициенты частного., Пример 1./(лг)==2*»—3* + 5, £(*) = * —4. Составляем схему Горнера: 12 0 — 3 5 .4.| 2 Г 29 121 f(x) = (χ — 4) (2лг* + 8лг + 29) + 121. Если нужно разделить с остатком многочлен /(лг) на многочлен g(x) = ax + bt а^гЬО, то можно сначала разделить его по ^методу Горнера на многочлен & (*)==*—ί—~j; если q(x) и г—частное и остаток от деления f(x) на g(x), а qt(x), Γι — частное и остаток от деления f(x) на & (лф то r = ru a q(x)—~qi(x). Пример«./(*)«*» —2** —10* + 3, £(лг)«2лг + 5. Берем gi (#)«χ + -s* * выписываем схему Горнера деления /(*) «a ft (х): ι ι —2—10 3 5 • 9 β U 1 "~ 2 4 8 Получаем /(*)«# (x) q (x) + г, где Остаток от деления произвольного многочлена f(x) на многочлен g(x)=x — b является числом, равным значению многочлена f(x) при х=Ь (теорема Без у). В силу этого метод Горнера удобен также для быстрого вычисления Значения многочлена при данном значении неизвестного. Пример З.Дк)= ж4— 2λγ·+** + *+1· Найти значение f(x) при *==.т-3. Составляем схему Горнера: 11—21 1 1 —3 I 1 —5 16 —-47 142 /(_3)=142.
178 ГЛ. Ш. АЛГЕБРА МНОГОЧЛЕНОВ (4 4. Разложение многочлена по степеням разности ([23J, стр. 97—98; [31], стр. 77—79). Для любого многочлена f(x)=a^ + axx»-l+... + an_xx+an и любого числа с можно написать разложение f(x) по степеням разности χ— с: f(x) = bQ(x-cr + t>1(x-c)"-t + ... + bn_i(x-c) + bn. Чгобы найти коэффициенты этого разложения, нужно сначала разделить с остатком f(x) на χ — с. В остатке получится bw частное будет каким-то многочленом q(x). Затем нужно q(x) разделить на χ — с; в остатке получится ЪПтЛ% частное — Ц\{х\ Затем делим. q\{x) на χ — с> вчостатке по-^ лучается £д.* и т. д. Вычисления удобно производить по схеме Горнера (п. 3). Пример 1./(а:)=а^ —5jc«—Заг»+9, <?=3.< Составляем схему Горнера, где в первой строке выписываем коэффициенты многочлена /(*), во второй получаем коэффициенты частного q(x) и остаток Ь\ от деления f(x) на χ — 3, в третьей строке получаем коэффициенты частного q% (x) и остаток Ь% от деления q(x) на χ—3 и т. д.: 1 _5 _3 0 9 3 | 1 —2 —9 —27 —72 I 1 —6 —45 1 4 6 I 7. 1 /(*) = (.* — 3)* + 7(лг—3)» + 6(х — 3)* — 45 (χ—3)—72. Коэффициенты разложения многочлена f(x) по степеням разности χ — с связаны со значениями этого многочлена и его производных*) при х=с: Поэтому схема Горнера» выписанная в предыдущем примере, позволяет также найти значения производных многочлена f(x) *) Производной аногочлена f(x)=aQXn+aixn-i+... + anrmix+an с коэффициентами из любого поля называется многочлен f(x) = naQx*~* + (n-\)aix"-* + ...+ an^
5] §1*. ОБЩИЕ СВОЙСТВА МНОГОЧЛЕНОВ 179 при х=с (в указанном примере эти значения: f(3) = —45, /'(3) = 6·2! = 12, /"(3) = 7·3! = 42,/ιν(3) = 4! = 24). Разложение многочлена по степеням разности χ — с может быть использовано при разложении дроби, знаменатель которой есть степень линейного двучлена, на простейшие (§ 3, п. 9). .Пример* Ф(^)=^'У . Берем многочлен /(*)=** +*+ 1 и разлагаем его по степеням разности χ — 6—2) as χ -f 2:. 1 11 —211—13 1 —3 1 /(*) = (лг + 2)»-3(* + 2) + 3. ^/ ν /(*) ! 3.3 Получаем Φ {χ) = ^qr^ β (JT+W " &+φ + (?+φ· Б. Наибольший общий делитель двух многочленов. Если каждый из многочленов f(x) и g(x) делится без остатка на многочлен у(х), то <?(х) называется общим делителем f(x) и #(·*)· Наибольшим общим делителем (н. о, д.) многочленов f(x) и g(x) называется такой их общий делитель d(x\ который делится на все другие общие делители многочленов f(x) и ^(дг) (обозначение: d(x) = (f(x), g(x))\ Для любых двух многочленов, не равных одновременно нулю, н. о. д. существует и оЬределен однозначно с точностью до постоянных отличных от нуля множителей. Из всех наибольших общих делителей многочленов /(дг) и g(x) обычно выбирается тот, у которого старший коэффициент равен 1. Пример ί./(*)=** —/at, g(x)=*x?+l. d(x)=x—i. Пример 2./(λ:)=6λ:+12, £(λγ) = 4λγ —2, d(x) = \. Бели известны разложения многочленов /(дг) и g(x) на линейные множители (§ 3, п. 6), причем f(x) = a.(x-*J* ... (x-ajp (*-fc)* .·. <*-№*; g(x)=b0(x-OL1)1^ ... (Χ-*ΡΥΡ(Χ-Ίι)4... (х-ъУ<
180 гл. in. Алгебра многочленов [5 (числа cty, р0, γΓ все различны между, собой), то ά{χ)ίτ= =(x — u1)mi....(x—*p)mp, где длякаждогоуО^5^···^)^;— наименьшее из чисел kJt lj. Пример 3.f(x) = (x—l)*(x + 2)*(x — 5)\ g(x) = (x-l)(x + 2)*(x + 7)(x+l)*;.d(x)~(x-\)(x + 2)*. Если разложения многочленов f(x) и g(x) на линейные множители не известны, то для нахождения их наибольшего общего делителя применяется алгоритм Евклида. Многочлен f(x) делится с остатком на g(#) (п. 2); получается остаток Γι (χ) (быть может, равный нулю); ватем, если Г|(дг)9^0, g(x) делится с остатком на г% (х); получается остаток г*(лг); если гъ(х)^Ь0, , то. 1%(х)>делится с остатком на r%(x)t и т. д. до получейия'Ъс0&к%равного нулю. Последний не равный нулю*Ъст^№'-1^1^)'Шляется н. о. д· многочленов f(x) и g(x). Если: уже rt-(x) = Of то наибольшим общим делителем многочленов f(x) и g{x) является g(x). Пример 4./(*)== 3**--2** + * 44 £(λγ) = λγ* — χ — 1. Делим с остатком f(x) на g(x):' f(x) = g(x)(Sx+l) + 5(x+l). Получаем п(лр)в5(*+1)^0. Делим g(x) на Γι(λγ): g(x) = rt(x)j,(x-2) + l; г.(ж)-19*а Μ*) делится на г*(лг) без остатка. Итак, (/(*), gC*)) — !· Применяя алгоритм Евклида, можно умножать делимое и делитель на любые не равные нулю числа, причем это можно делать даже в процессе самого деления. Этим пользуются при действиях с многочленами с целыми коэффициентами, чтобы не иметь дела с дробями. Пример 5. /(лг) = 2а^ + 2аг»+^— лг— 1, g(x) = 3x* + + 2** — лг Неделим с остатком (обычным образом) многочлен 3/(лг) на g(x) и получаем в остатке многочлен Г|(*)е=г6*$—х*—лг —7. Затем делим 2g(x) на rt(x): 6*4 4· 4*8 — 2аг+ 4 I бл:»—л:8—х —7 θχ4—дс·— χ*— lx *!! + * лг«+ 5лг*+ 5л: + 4 ! ВР + 30л:* + 30л:^Т Ьхь— л:* — лг — 7 • 31лг* + 31л: + 31
7] § 1. ОБЩИЕ СВОЙСТВА МНОГОЧЛЕНОВ Щ (Здесь в процессе деления произведено умножение на 6; символом | отделена'Й'часть частного, в которой произошло искажение.) Ofcta- ток^А&сле сокращения иа 31) равен г χ (χ) делится наг» (х) без .остатка, следовательно, г* (*)*=(/(*), £(*)). в. Взаимно простые многочлены. Два многочлена, н.о.д. которых равен 1, называются взаимно простыми. - Многочлены взаимно просты тогда и только тогда, когда у них нет ни одного общего корня (п. 10). Пример .1, /(*) = .*:* — 3jcs+.5, ^(^)=λγ8— ,4*+ 3. Здесь d(x)=x\t многочлены f(x) и g\x) взаимно просты. Если d(x) = (f(x), g(x))f% то многочлены fx(x)^l^l ft ίχ\ и gt (χ) ss %γ4 взаимно просты. Если многочлен γ (χ) взаимно прост с каждым из многочленов f(x) и g(x)t то он взаимно прост и с их произведением. Если произведение многочленов f(x) н g(x) делится на φ(*)# причем f(x) и <?(х) взаимно просты, то g(x) делится на φ (χ). Если многочлен f\x) делится на каждый из . многочленов <р(аг) η Ψ(λτ), которые между собой взаимно просты, то/(х) делится и на их произведение. 7. Представление d(x)=:(f(x),g(x))B виде d{x) = =zf(x)u(x)4-g(x)v(x). Наибольший общий делитель d(x) многочленов /(дг) и g(x) всегда можно представить в виде d(x)*=f(x)u(x) + g(x)v(x), (3.1] где и(х) и ν (х) —f некоторые многочлены, причем это можно сделать даже бесчисленным множеством различных способов, Если, в частности, многочлены f(x) и g(x) взаимно просты (п. 6), то получаем l=f(x)u(x)-\-g(x)v(x). Если степени многочленов /(дг) и g(x) больше нуля, тс многочлены и(х) и v(x) в равенстве (3.1) можно подобрать так, что степень и(х) будет меньше степени g(x)f д степень v(x) — меньше степени /(дг). При практическом отыскании многочленов и(х) и v(x] f (х\ удобнее вместо /(дг) и g(x) взять многочлены fi(x)=J--Lli gt(x)=^2 n сначала подобрать а(дг), гг(дг) так, чтобы выполнялось равенство l=fi(x)u(x) + gi(x)v(x). (3.2;
182 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ [7 Это делается следующим образом. Если fx (χ) или gt (χ) — многочлен нулевой степени, то многочлены и(х) и ν(χ) просто подбираются; например, при g1(x)=a^bO можно положить и (х) = О, ν (χ) =1/α. Если же степени ft (χ) и gx (x) положительны, то нужно написать и (х) и ν (χ) с неопределенными коэффициентами (считая степень и(х) меньше степени gx (χ), степень ν (χ) меньше степени fx (x)) и приравнять коэффициенты при одинаковых степенях χ в левой и правой частях равенства (3.2) (или же можно придавать переменному χ различные числовые значения и приравнивать единице получающиеся при этом значения многочлена ft(x) и (х) -|- -\-gi(x)v(x)); это даст систему линейных уравнений, решая которую (гл. I, § 2, пп. 1—3) найдем Неизвестные коэффициенты многочленов и{х) и v(x). Если теперь умножить обе части равенства (3.2) на d(x), το получится равенство (3.1) (с* теми же многочленами и(х) и ν(χ), что и в (3.2)). При таком способе отыскания и(х) и ν(χ) степень и(х) получается меньше разности степеней g(x) и d(x), степень v(x) — меньше разности степеней f(x) и d{x) (если только указанные, разности φ 0). При этом условии на степени многочлены и(х) и v(x)y входящие в равенство (3.1), определены уже однозначно. Пример Ι. /(λγ)=λγ7—2λγ· —λ:» — Πλγ1 — 6λ* — 4λγ* + 5* + +14, £(*)=** +л:+ 2. Здесь d(x)=g (λγ)=λγ8+λγ + 2, следовательно, можно взять α (лг) = О, *(*)=*!. Пример 2. /(л:)=гЗл:*—4*|+*» —Зл?+4лг--1, g(x)=* = 3ΛΓβ-4-5*44·*·—*» — Злг-|-1. Здесь ^(лг)=3лг» + 2л:8 + 2лг—1, /t (лг) = дг«—2лг +1, gt(x) = = лг8+л: — 1. Пишем для многочленов fi(x)t gt(x) равенство (3.2) с неопределенными коэффициентами и (х) и ν (χ)\ l==(A:g— 2x+l)(ax + b) + (x*+x— Ща# + Ъ). Приравниваем коэффициенты при одинаковых степенях χ и получаем систему уравнений [ а +«1=0, I b—2u + bi + ut=0f % | — 2b + a + bt — Л|=0, I ь —h — ι.
7] § 1. общив свойства многочлвнов 183 Решая эту систему, находим: д = 3, ^ = — 3, £=*5, £ι=4, τ. е. d(x)=f(x)(3x + 5) + g(x)(-3x + 4). Пример 3./(л:) = 2л:4—4л:» —Зл:* + 7л: —2, g(x)=*6x* + JL· fai __ К γ JL· | Здесь djx) '= 2л:* + 2х — 1, ft (л:)=х% —Зл:+2, gx (л:)=3л:— 1. Пишем равенство 43.2): 1 = <л:* — Зл: + 2)а + (Зл:— 1) (Ьх + с). Придавая χ последовательно значения 0, 1, 2, получаем систему уравнений 2а — <?=1, 2* + 2с=^1, 10* + 5с = 1. Решая эту систему, находим: я = 0,9, £ = —.0,3, с = 0,8. откуда *(л:)=/(л:)0,9 + £(*)'(-0,3* + 0,8Х Чтобы многочлен h(x)f отличный от н. о. д. d(x) многочленов f(x) и g(x), можно было представить в виде h(x)=f(x)ui(x) + g(x)v1(x)t (3.3) где щ(х\ vt(x) — некоторые многочлены, необходимо и достаточно, чтобы h(x) делился на d(x). Если при этом степень h(x) меньше суммы степеней f(x) и g(x), то многочлены щ (лг) и Ot (χ) можно подобрать так, что степень щ (х) будет меньше степени g(x)> а степень vt(x) — меньше степени/(jc). В этом случае щ(х) и vt(x) можно найти, записав их с неопределенными коэффициентами и приравнивая затем коэффициенты при одинаковых степенях χ в левой и правой частях равенства (3.3) (единственности щ(х\ νχ(χ) здесь может и не быть). Если же степень h(x) больше или равна сумме степеней/(лг) и g(x\ причем h(x)=d(x)k(x), то нужно сначала представить d(x) в виде (3.1), а затем положить щ(х)=и(х)к(х), Vt(x)=v(x)k(x). Пример 4. f(x)=x*—л:8— л: + 1, £(*)»** + *—2» Здесь 7(х)=х — 1, h(x) = d(x)k(x)t где k(x)=x*-^x* 4- + *+1· Так как степень h(x) меньше суммы степеней/(х) и g(x)t то пишем равенство ^ — l^*»—.*»—x+l)(ax + b) + (xi+x--2)(aixi + bix + el).
184 ГЛ. III. АЛГВБРА МНОГОЧЛСКОв [g Приравниваем коэффициенты при одинаковых степенях* jc. а + ах =1, — а + р+ at+ bls, =θ, — a — b—2at+ bt + *ι=0, я— b —2^i+ ct=0f . b ^-ι-1. Полученная система уравнений имеет бесчисленное множество решений. Любое из них дает коэффициенты таких многочленов Ui(x)t Vi(x)f что выполнено равенство (3.3). Например, можно взять ut(x) = x+.j, ^ М*)=;|(л-И). 8. Уничтож^ие иррщтт^н<ягцϋ знаменателе ([23], стр. $37^2'2Г8): Лрёгаставлейне н.о.д. многочленов /(*) и #(*) в виде (3.1) используется при решении, следующей эаДачи. Имеем выражение вида -W, где т(х) и g(x).— многочлены с рациональными коэффициентами, а α — корень многочлена f(x) тоже с рациональными коэффициентами, взаимно простого с g(x) (п.6). Требуется найти такой многочлен N(x) с рациональными коэффициентами, что ^^ssJV(a). Для решения задачи представляем (f(x)t ε(χ))*=1 * виде (3.1) и затем в качестве N(x) берем многочлен т (x)v(x) (или, лучше, остаток от деления этого многочлена на f(x))· Пример. Уничтожить иррациональность в знаменателе вы- . ю Ул г- ю ражения — V4— 2|^2 +2 :(*» —2). 14-2** + * — 2. Полагаем Ν(χ) = 2χ* + χ—2 и полу- чаем 'oVT-io ,2 yj- ^-2. , Υ4— 2^2+2 Другой способ уничтожения иррациональности в знаменателе, использующий симметрические многочлены, см. в [23], стр. 227.
Щ § h ОБЩИЕ СВОЙСТВА МНОГОЧЛЕНОВ №5 9. НаН^ьщий общий делитель нескольких многочлен ной. ЩШ яано несколько многочленов /{(х), ···,/,(<*)» то щ^ наибольшим общим делителем называется многочлен D(x)i на который делятся все данные многочлены и который сам делится на любой общий делитель многочленов fx (х\... ···>/*(·*)· Чтобы найти. D(x), нужно сначала Найти н.о.д. dt(x) многочленов ft(x) и /*(х), затем н.о.д. 4г(х) многочленов dt(x) и /8(лг)> н.о.д. dz(x) многочленов d^(x) и/4(дг) &4&·&''Λ^β)^(***(*\ fs(x))=D(*)- пример. fr(x)^K*—2x + 2%J%(x)±x* + 2lx—2f /»(*)=, ^2х*-Зх*—2хУ\,А(х) = х*-йх*Ух+1. . Здесь ^(лг) = лг— (1— i), d*(x)=\t </s (*)=»£> (л:) ==1. ' 10. Корни многочлена. Отделение кратных корней. Если при значении х=с многочлен f(x) принимает значение /(с) 2= 0, то число с называется корнем этого много· члена. Всякий многочлен ненулевой степени с' любыми числовыми коэффициентами имеет хотя бы один корень, действительный или комплексный (основная теорема алгебры комплексных чисел). Число с тогда и только тогда является корнем многочлена f(x\ когда f(x) делится бед остатка на χ — с. Если при. этом f(x) делится без остатка*на (л; — с)* (*^1), но уже не делится на (х — c)f*+\ то с называется k-кратным корнем (или корнем кратности k) многочлена /О). Корни кратности k=\ называются простыми корнями многочлена. Если каждый корень считать столько раз, какова его кратность, то получится, что, каждый многочлен степени.л (л^1) с любыми числовыми коэффициентами имеет η корней. Чтобы проверить, будет ли число с корнем многочлена f(x) и какой кратности, можно воспользоваться схемой Гор- нера (п. 3), где сначала f(x) делится на χ—ct затем, если остаток равен нулю, полученное частное делится снова на χ — сит. д. .до получения ненулевого остатка. Пример .1. /(х)=х* — 7х* + 9х* + Вх+16, c = 4. Составляем схему Горнера: ■ 4. 1 —7 1 —3 1 1 I 5 9 — 3 1 21 8 16 — 4 0 0. i=s 4 — корень кратности 2.
186 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ [10 Число с является λ-кратным корнем многочлена /(лг) тогда и только тогда, когда многочлен / (лг) и его производные *) до порядка k — 1 включительно обращаются в нуль при x=cf а /(л) (с) Ф 0. Корень кратности k^> 1 многочлена является корнем кратности k — 1 для его первой производной. Если разделить многочлен /(лг) на наибольшие общий делитель d(x) этого многочлена и его производной f(x)t fix) то получится многочлен j-J-~=φ (^имеющий те же корни, что и многочлен /(лг), но только первой кратности. Это позволяет найти все корни многочлена /(лг) путем отыскания всех корней многочлена <р(лг), степень которого меньше степени /(лг), если только d(x) — многочлен ненулевой степени. Пример 2. /(лг) = лг»«-5лг*л— 5*» + 45лг»'—108; /'(лг):=5лт< — 20л* — 15аг» + 00аг; </(лг) = лг» — 4лга — Злг + 18; Корни многочлена φ (лг) равны aj = —2, а2 = 3. Эти же числа (и только они) являются корнями /(лг); их кратности определяются по схеме Горнера (стр. 185). Укажем еще один способ, позволяющий иногда найти все кррни многочлена (и заодно определить их кратности). Пусть dt(x) — н.од. многочлена f(x) и его производной f(x)\ d*(x) — η·°·λ· многочлена dt(x) и его производной d[(x); ds(x) — н.од. d%(x) и d'%(x) и т. д., пока получится многочлен ds(x) нулевой степени. Положим V%(X\ — I£L v<k(x\ — Ul^L v (x\ — ds-i(x) и затем Все корни многочленов ^(лг), Р*(лг), ..., Fs(x) простые, причем корнями Ft(x) являются все простые корни многочлена /(лг) (и только они), корнями F2 (x) являются всё двукратные корни /(лг) и т. д., корнями F$(x) являются 5-кратные корни /(лг); корней выше s-Pi кратности многочлен /(лг) не имеет ([23], стр. 101—102; [13], стр. 165). *) См. сноску на стр. 178.
12] § U ОБЩИЕ СВОЙСТВА МНОГОЧЛЕНОВ 187 Пример а /{λγ) = λγ» + 6**+13*·+14λ:»+12* + & Здесь <Мл:) = л:* + 4лг + 4, d2(x) = x + 2t ^(дг)=1; vt(x) = x* + 2x* + x + 2t v*(x) = x + 2t ν8(л:) = χ + 2; Λ<*)**·+1, /Ъ(л:)=1, F9(x) = x + 2. Многочлен f(x) имеет лростые корни +1 и 3-кратный корень— 2. 11· Формулы Виета. Корни <хь ..., αΛ многочлена /(^) = а0^ + а1^^1 + ... + ая.,^ + ая (а0^0) связаны с его коэффициентами по формулам (формулы Виета): <*1 + <*а + ... + «л = — j£f ata8 -f" αια» + ··· + αια« Η" α*α» + · ·· + ал-1ал = ΊΓ # til аЬ «Λ ... «д-l +'«Λ ... *η-**η + .·. + «·«· ... «*β(— Ι)*"1^, («Ο «ι** ... ««==(-- 0я £*, #ο т. е сумма произведений корней во всевозможных сочетаниях, содержащих каждое k корней, равна (—l)kakla0 (k=\t 2, ..., η). Пользуясь формулами Виета, легко составить многочлен, имеющий наперед заданные корни. Пример. Пусть корни многочлена «ι = 5, as = /, as = /. Многочленом третьей степени, имеющим эти корни» будет, например, многочлен с коэффициентами я<>=1, αι= — (δ + ί + Ο — β_5 — 2/,аа = 5* + 5* + «= — 1 + 10/, αβ= —(5ί/)==5, т.е./(^)= 12. Общие корни двух многочленов· Результант· Дискриминант· Два многочлена f(x) и g(x) тогда и только тогда имеют общие корни, когда их наибольший общий делитель d(x) отличен от постоянной. В этом случае общими корнями f(x) и g(x) являются в точности все корни d(x). Пример 1. /(*)=2х* + х' + *х* + х—и £(*) = 2л* — — 5лг» + 4лга — 5лг + 2. Здесь d (*)=в2** — χ2 + 2л: — 1 = (2лг— 1)(лга + 1), общими корнями f(x) и g(x) являются числа -*-, if —/.
ГЛ. III,. АЛГЕБРА МНОГОЧЛЕНОВ ,(12 Укажем еще один способ, позволяющий установить лали- чие общих корней у многочленов (α* Φ 0,' Ь^фО\ Составим результант заданных многочленов; так называется определитель*) *(/. е)= Γ<20 fl| ... 0 α» at ... 0 0 0 ... .0. *ο ^ ... Ι 0 0 0 ... αη 0 ... α„ ... «', β».·^···.; Λ ο... b9 bt ... 0 0 Λ' ρ 0 ь. $ .строк, · η строк; он* равен нулю тогда и только тогда, когда f(x)-v-g(x) имеют хотя бы один общий корень. Пример 2./(*) = ** Здесь Л (Л *>- -&** + !, £(х)=2л* —5л:1—* — 1. 1 0 0 0 2 0 0 — 3 1 0 0 0 2 0 0 —3 1 0 —5 0 2 1 0 — 3 1 — 1 — 5 0 0 1 0 — 3 -1 — 1 —S 0 0 1 0 0 — 1 — 1 0 0 0 1 0 0 — 1 =543^:0, /(*). и g(x) общих корней не имеют. Другие выражения для результанта многочленов f(x) и П Й i— 1 У— 1 *) Определитель (ir+s)-ro порядка (см. гд. I, § ΐχ.
12| § Ϊ. ОВЩИЕ СВОЙСТВА МНОГОЧЛЕНОВ ί$9 (α//р/--^йО]?ни соответственно многочленов f(x) и g(x))\ η 1-1 s Результант многочленов используется при решении систем алгебраических уравнений с несколькими неизвестными (§ б, п. 4). Дискриминантом многочлена f(x) = atXpL\-aitfi-x-\-... ... + яя-|*+лл> имеющего корнями числа аи а* ... , а,,, называется произведение Дискриминант тогда и только тогда равен нулю, когда среди корней многочлена имеются равные (т. е. когда многочлен имеет хотя бы один кратный корень (п. 10))· Дискриминант связан с результантом многочлена f(x) и его производной f(x) по формуле позволяющей выразить дискриминант многочлена через его коэффициенты. Пример 3./(аг) = лг*—Злг + 7. Здесь /'(*)= а*8—3, {-\)*D(f) = R(f%f) = 0 1 о 3 о — 3 о — 3 о 3 7 — 3 0 —3 о о 7 о о — 3 = Ш5. D (/)=—1215; f(x) кратных корней не имеет. МожнсГ выразить D(f) через коэффициенты многочлена f(x) и другим путем, пользуясь тем, что D(f) является симметрическим многочленом от корней f(x) (§ 5, п. 2). '
190 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ [12 Выражение дискриминанта через степенные суммы (§ 5, й. 3): D(f) = a* — а2п-2 *1 $9 $Ъ 6g $9 Sg » · Sm β«-ι *я «я+i · · · 5*я-« (Si — сумма ί-χ степеней корней <хь о^, ... , ал многочлена Л*))· Пример 4. /(*) = *» +За:2—2. Согласно § 5 (конец п. 2 я п, 3), находим $!==—· 3, s8=9, s» = — 21, Si = 57. Отсюда *>(/) = 3 $1 s2 $1 s2 s8 58* s8 s41 = 3 — 3 9 -a 9 — 21 9 — 21 & = 108. Если /(лг) — многочлен с действительными коэффициентами, не имеющий кратных корней, то D(/)>0, если число пар комплексно сопряженных корней /(дг) четно, и <£>(/)<[0, если это число нечетно. Пример 5..Для многочлена /(*)=χ* — χ* + х* + 2х + 2 D(/) = 4360 > 0, т. е. либо все четыре корня многочлена f(x) комплексные (две пары комплексно сопряженных корней), либо f(x) вообще не имеет комплексных корней (число пар комплексно сопряженных корней f(x) равно нулю). Пример 6. /(λγ)=2χ» + 9λ* + 9* + ·7. Здесь £(/) = —9126 < 0, f(x) имеет одну пару комплексно сопряженных корней, т. е. имеет два комплексных и один действительный корень. § 2. Интерполяционные формулы Лагранжа и Ньютона Если £0, £ι,..., Ьп — различные между собой числа, £о» fι» · · ·» *я — какие-то числа, не все равные нулю, то существует ровно один многочлен f(x) степени не выще η со свойствами: f(b0) = c0f f(bi)=cit ... , f(bn) = cn*y Этот *) При с0 «=<?! = .. . = с„ = 0 всякий многочлен со свойствами f(bi) = ci (f = 0t l, 2, ...f rtj или имеет степень больше я, или тождественно равен нулю.
§ 2. ИНТЕРПОЛЯЦИОННЫЕ ФОРМУЛЫ ЛАГРАНЖА И НЬЮТОНА Щ многочлен можно найти одним из следующих трех способов: 1) Составляется система уравнений: ^0 + ^**1+ ··· + ΜΛ-ι + *Λ = ^ Если aQ, au ..., an_u an — решение этой системы уравнений (гл. I, § 2, пп. 1 — 3), то искомый многочлен: f(x) = abXn + alxn-i + ... + an_lx-{-an. Пример 1. #о = —1, #1=1, £а = 2, £а = 3; с0 = 4, ^ = 2, с*=—2, с8 = 0. Составляем систему уравнений: — *о+ Χι— *а + *а = 4, *о + Χι + *2 + *з = 2, 8лг0 + 4лг1+2лг2 + дгз= —2, 27лг0 + 9*ι + Злга + х* = 0. Решая эту систему, находим: a0 = l, at = — 3, α2 = —2, я8 = 6. Искомый многочлен: f(x)=zx* — Зх* — 2дг +6. 2) Формула Лагранжа: f(r\— \ г (х—Ьо)...(х — bk_t)(х — Ьш)...(x—bn) ' или, в другой записи, /^)-со|г^ + с1|г^ + ...+ сл^^, (3.4) где g(x) = (x — bQ)(x — bx)...{x — bn\ а 5*0*0» А = 0, 1, ..., /ι, — произведение тех же скобок, но с пропуском скобки (х — bk), gr(x)— производная многочлена g(x) ([23], стр. ПО). Пример 2. #о = 1, #1 = 3, #*=4; с0 = 2, Ci =—2, са=—1# Искомый многочлен: „гч .о(*-3)(*-4) «(*-!)(*—4) (дг —1)(лг —3) /W~" (1—3)(1 — 4> с (3—1)(3 — 4) (4—1)(4 —3) — =λ:2 —блг + 7.
192 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ [12 Формулой Лаграпжа удобно пользоваться, если нужно определить не коэффициенты многочлена f{x) степени не выше η со свойствами f(bi) = cl, ί = 0, 1, ..., η, а его значение при каком-нибудь значении χ=ί?η+ί. Пример 3. Зная, что fix) — многочлен не выше 3-й степени и что/(-2)=0>/(1) = 5,/(3) = -1,/(5)=~1, найти/(6). В силу формулы Лагранжа имеем f ,βν_ Л6 + 2)(6-3)(6-5) (6 + 2)(6-1)(6-5) /W-a(i+2)(l--3)(l-5) (3 + 2)(з_1)(3-5) (6 + 2)(6-1)(6-3) 6 (5 + 2)(5 —1)(5—3) 7 · Формула Лагранжа дает также разложение дроби на простейшие в том случае, когда знаменатель дроби не имеет кратных корней и разлагается над данным полем на линейные множители (§ 3, п. 9). Если Ь0, Ьи .·., Ьп — корни знаменателя дроби γβ?> где g(x)— многочлен (л+1)-й степени, f(x)— многочлен степени s^n, и если f(b9) = cQt f(bt) = cu ..., f(bn) = cnt то выражаем /(дг) с помощью формулы (3.4) и получаем /(X) _ Со , fj , ι Сп . g(*)~ *{ь.)(х-ъ.) "·" *·<*.)<*-*i> ^•••^«'(«(*-W х4- 1 Пример 4. Разложить дробь Φ (χ) = t_j на простейшие. Здесь *α = —2, *,=:3; с.«s—1, <?i«4; g*(b0) = — 5, £'(*ι) = 5. •W1" 5(аг + 2)+ 5(лг —3)# 3) Формула Ньютона ([23], стр. 111): /(*) = λ* + Μ* —*ο) + Μ*-^)(*-*ι) + ... ... + М* — *«)...(* — *Λ-ι)> где λθ находим, полагая в обеих частях равенства х = Ь0 (λ0 =f(b0) = с0), затем λ! находим, полагая в обеих частях равенства х = Ьх% и т. д. до Хя, которое находим, полагая в обеих частях равенства х=Ьп. Пример 5. £о = 1, £ι=— 2, £9 = 3; 00 = 4, с1 = 7|са=12. /(л;) = 4 + λ, (л:_ 1) + λΒ (а:— 1)(а: + 2).
I й. ИНТЕРПОЛЯЦИОННЫЕ ФОРМУЛЫ ЛАГРАЙ^А Й ЙЫОТОЙА Ш Полагая *=: —2, получаем: 7=г4г+Х!(— 3), Xtsas — 1. Берем лг=*3: 12 = 4—(3~1) + λ8(3—1)(3 + 2), 10= 10λ8, λ8= 1. Искомый многочлен: f(x) = 4 — (χ — 1) + (х — 0 (* + 2) = ** + 3. Если 60, *ι,..., £л — последовательные целые числа, то вычисления удобно производить по схеме, где в первом столбце выписываются числа с0, сь..., сд, во втором столбце — их разности Ас0 = сг — с0,..., ксп_г=сп—сп_и в третьем столбце — разности чисел, стоящих во втором столбце, Δ% = = Lcx — Ас0,..., Д9сЛ_9 = Асл.1 — Асл_9 и т. д. ([б], ч. I, стр. 97): Со сг Δ% Δ<?, ι i Δ% Тогда Х0 = с0, Х1 = Ас0, λ9=-2^,..., λη = -^. Примерб. ^asss—-2, ^sas—i, £2 = 0, ^8=1, ^4 = 2; c0 ==—8, C|=s — 3, Csa=s4, CB=sl3, C4 = 24. Выписываем схему: — 8 5 — 3 2 7 0 4 2 0 9 0 13 2 11 24 Искомый многочлен: /(аг) = -8 + 5(лг + 2) + (аг + 2)(л:+1)=:а:2 + 8л: + 4. Если уже построен/многочлен ft(x) степени не выше $($<Цп)> принимающий при x=b9, bu..., bs заданные значения с0, си ..., cs, то многочлен f(x) степени не выше η со свойствами f(bl) = ci, 1 = 0,1,..., η, строится по формуле f(x)=ft(x) + \s+t(x-b0)...(x-bs) + ... ... + М·* — Ь0)...(х—*Λ.ι> где λ,+1 находим, полагая лс=^5+1, и т. д. ([23], стр. 112). ι/46 А. П. Мишина, И. В. Проскуряков
194 hi. tit· АлгЕв£А~многочЛвноё fl Пример 7. £e=sl, fc=-2, £8 = 3, £»=0, b4 = 4; ce=s4, c|S=s7, c8=sl2, css=s3, c4 = —5. Многочлен /|(;с)гаг;с2 + 3 обладает свойствами /4(1)5=54, /t (— 2) » 7, /t (3) am 12, ft (0) as 3. Искомый многочлен: /(ΑΓ) = ΑΓ* + 3 + λ4(Α: —1)(λγ + 2)(λγ —3)λγ. Берем лг = 4: — 5=19 + λ4(4 — 1)(4 + 2)(4—3) · 4, λ4 = — -i. Следовательно, /(*) = -j*4 +J-*$ + f**-2x + 3. Общий вид всех многочленов, принимающих при дг=^0, *ι,..., *Λ соответственно значения с0, сь..., ся: F(x)=f(x) + <f(x)(x-b0)...(x-ba где /(дг) — многочлен не выше л-й степени со свойствами /(*0)—£о>···» f(K) = cn> a ?(*)— произвольный многочлен ([13], стр. 159). § 3. Отыскание корней многочленов. Разложение многочленов, на множители 1· Решение уравнений второй степени. Корни квадратного уравнения ллс9 + *дг-}-^ = 0· с любыми действительными или комплексными коэффициентами находятся по формуле х=я =-£- . Для корней «приведенного» квадратного уравнения x*-\-px-\-q=0 справедлива формула Пример 1. Решить уравнение (6 + 3/)**+ (5 + 40·* + + (1+0=0. Получаем: — 5 — 4/jb У 9 + 40/ — 12 — 36/ . χτ=ζ 12 + 6* "" __ —5—4/± / — 3 + 4/_ — 5 — 4ί±(ϊ+21) Ϊ2 + & 12 + 6/ » Xi'' \_ _ —6 — 61 ** г* Хг~~ 12+6/ =
2) § 3. отыскание корней многочленов 195 Пример 2. Решить уравнение хг + 1х — (4 — 2Q = 0. 2 Xx=2 — lt ΛΓ8=—2. Имеем: лг = - ^± γ~'—1+ 4-2/ = _ 1 + 2. Решение уравнений третьей степени. Чтобы найти все корни уравнения 3-й степени а^х? + αχχ* + а^х + а8 = О» удобно разделить обе части этого уравнения на аф, в результате чего получится уравнение вида ■*· + Μ* + Μ + Ьг = 0, (3.5) имеющее те же корни, что и исходное уравнение, а затем сделать замену неизвестного х=у — -тт. Эту замену проще всего осуществить, разложив многочлен /(αγ) = ^ + ^ιΑγ9-|- -|-**я + *8 по степеням x-\~~k с помощью схемы Горнера (§ 1, п. 4) и заменив затем х-^-4- через у. В результате указанной замены получится уравнение вида / + /У + ? = 0. (3.6) Корни этого уравнения находятся по формуле (формула Кардан о). Применяя эту формулу, нужно для каждого из трех значений корня брать то значение корня t-V-t- VW+Hl· w '/.β·
196 -Ι*Λ. III. АЛГЕЁРА МНОГОЧЛЕНОВ [2 для которого выполняется условие αβ = — —· (такое значение корня β всегда существует). Если уь уь у9 — корни уравнения (3.6), то хх—ух—у, *2=J>2 —j, Хг=Уг~ — -j — корни уравнения (3.5). Пример 1. Решить уравнение х* + 3х2 — 6лГ+20 = 0. Разлагаем многочлен, стоящий в левой части уравнения, по степеням χ + 1 и полагаем χ + 1 =.у. Получаем уравнение у* — 9у + -(-28 = 0. Его корни находятся по формуле y=V— 14+ /196 — 27+}/ — 14— /Ϊ96=Τ7. Значениями корня <х = у— 14+ "1^169 == у— 1 являются числа a, =s — 1, а2 = -^ + -^я- /, аз = γ 2~'" ^оответствУЮ1ДИе ИМ g g з значения второго корня: $t = ^— = — 3, β2 = =— = -я -Ц^-*, р,в-^в| + 1^1|.ОтсюдаЛвв1+р1в-4, ^2 = «2 + β» = 2 — / "|/ΊΓ, ys = а8 +J8 = 2 + / у1Г Корни исходного уравнения: xt = — 5, х2» 1 — / 1^3, дг8 = 1 + ί ]/" 3. Корни уравнения (3.6) можно также находить по формулам ^-^(α, + βΟ-ί^α,-βΟ, (ЗЛО) где в качестве а! берется любое из значений корня (3.8), а в качестве фг — то значение корня (3.9), для которого α1β1 = з· Пример 2. Решить уравнение xs — 9*2 + 2Lt — 5 = 0. Делаем замену х=у-\-3 и получаем уравнение уг— 6у + + 4 дО. Для него одно из значений корня α = у·— 2 + Υ А — 8 == в |/ —2 + 2/ есть at = 1 + /. Соответствующее ему значение второго корня ptsa— 7" =1 — /. По формулам (3.10Хнаходим:
2] $ 3. ОТЫСКАНИЕ КОРНЕЙ МНОГОЧЛЕНОВ 19? Уд ss 2, ул «в — 1 — }Лз, у$=— 1 + |/~3. Корни данного нам уравнения: *, = 5, л* = 2 — )/з» *$ = 2 + КЗ· Если в уравнении (3.6) /* = 0, то корни этого уравнения— все значения У — д\ если q = 0> то корни уравнения (3.6): ух = 0, y2t а=± V —Л Ε™Η />?*0 и 9 9* 0, но ί«ί·) -ы4·) =0, то корни уравнения (3.6) находятся так: Л-*, Л = Уе = -| (3.11) ([17], стр. 215). Пример 3. Решить уравнение х* + 3х— 2/=0. Здесь член с л:2 отсутствует, так что это уже уравнение вида (3.6); ρ«3, д = — 2/, Ш* + Ш$ = 0. Формулы (3.11) дают: λγ1== — 2/, л:, = л:8 = /. Если все коэффициенты уравнения (3.6)—действительные числа, то его корни можно найти без явного использования формулы Кардано (3.7) следующим образом ([21 ], стр. 452—454): 1-й случай. Пусть &=(%)*+ (%)*<°*У Тогда все три корня уравнения (3.6) являются действительными и находятся по формулам yk = 2fZI cost±*Z**\ (3.12) где k=\t 2, 3, а φ — наименьший положительный угол, удовлетворяющий условию cos<p= — ·|·|/—ί—} . Пример 4..у* —З.у-И=0· Здесь D = -j —1<0. 1 ι Применяем формулы (3.12): сое φ = — -=· уТв — 4-, φ = 120·; ^ = 2 сое 280*^ 0,348, ^$ = 2 сое 40* «* 1,532. ^ — 2см |МГ j"2**,*—1, 2,..^ т. с. ^ι = 2 сое 160*^—1,880, *) Число —108 D является дискриминантом многочлена, стоящего i девой части уравнения (3.6) (§ 1, п. 12). **) Здесь и в следующих формулах нужно брать положительное- значение квадратного корня.
198 ГЛ. III. АЛГВВРА МНОГОЧЛВНОв 'β 2-й случай. Пусть D>0. Тогда уравнение (3.6) имеет один действительный и два сопряженных комплексных корня. Если р<С;0, то эти корни находятся так: Y-i .. /-* л hear' ^-тег^**к=*«**** <313> где tgY=|/lg|·, sin<o=||/— (|·)*. Если />>0, то имеем формулы Λ=-2|Λ|^2φ, J4i-|/"|ctg2T±^|f (3.14) где tgY*=j/ tg-y, tga> = |y (|·) . Пример 5. У — 9>у-И2--0. Здесь D = 36—27>0, />=—9<0. 2 — V3* Применяем формулы (3.13); sin ω= -«- }/3$ = -*■*— , ω= 60°. tg<p=l/tg30ei=»0,833, φ«*39β50'; sin 2φ «a 0,984; ctg 2φ«» 0,182; ^^"^Ш"^"^8'520' ^^fijS"*'·3 # 0,182««1,760±0,546/. Пример 6. .к8 — 6лг*+17л:—25=0. Замена ν=л: — 2 дает уравнение уь + 5.у — 7 = 0, для которого 49 125 D = -т- + -ггг > 0,/>=5>0. Применяем формулы (3.14), причем вы- 2 /"125 числения производим с помощью логарифмов: tg<o = —— 1/ _f tg(180e —<o)=—tg<o=-^|/r^-f lgtg(180e-<o)=i,7886, 180е- — ω = 31β35\ ω =r 148^25'; tg φ= j/tg74e13', lgtg? = 0,1829, φ = =56β44';Λ=-2|/Γ-| ctg 113°28' — 2 |Α| ctg 66β32\ lg yx == 0,0496, Λ-1.121; λ,- j/§ ctg 113*28'* ^ ffiy - -0,561 ±. =t-Sr^32rSB=-°'561 ±2,438/; ^=3,121, лгм = 1,439 :fc 2,438/. В случае D>0 корни уравнения (3.6) можно также находить по формулам ([4], стр. 139): Р<0 Ух=— 2rch|-, j;M=rch|-±iK3rsh-|, при
3J § 3. ОТЫСКАНИЕ КОРНЕЙ МНОГОЧЛЕНОВ 199 где ch<p = 2pr, г=± ]/ — 4г , причем знак -{- или — выбирается в зависимости от того, д^>0 или #<[0; при jp>0 ;;,= — 2rsh-|-, j/9f3 = rsh|-±:i]/r3"rch-|-, где βΙιφ=-π-, r = ± ]/ £ причем знак квадратного корня опять выбирается совпадающим со знаком q. Пример 7. У —-6у + 9 = 0. Здесь -^- + :f7-' = -4 8>°» >=—б<0, ? = 9>0, и мы — 9 имеем: г== γ2 «»1,41, ch<p = — *»1,59, φ^1,05; .^^ *«— 21/Tch0,35«s — 2,99, y%*ъ* 1/2"ch0,35 ±ifiS yT sh0,35*« «* 1,49 ±0,86*. Пример 8. У»+9у—26 = 0. Здесь ^Γ+ζτ^β* p = 9>0, ?=—26<0, и мы имеем: r = — >^3"«s—1,73, sh9 = -^—2= **» 2,51, φ«*1,65; ^ι^ —3 у S r*2 VlTsh0,55«2,01, j>M^ — VS sh0,55Τ //3"/3" ch0,55** *»—1+3,48/. 3-й случай. Пусть D = 0. Тогда все корни уравнения (3.6) действительны, причем два из них равны между собой. Корни вычисляются по формулам (3.11) (при р-фО)- 3. Решение уравнений четвертой степени· Чтобы найти все корни уравнения 4-й степени, делят обе его части на коэффициент при xl· (что не меняет корней уравнения) и затем в уравнении л* + М3 + М* + М + *4 = 0 (3.15) делают замену неизвестного Ar=j/—~ (используя, как и в п. 2, схему Горнера). В результате получается уравнение У + /У9 + ^ + г = 0. (3.16) Если уь у* уъ уь — корни уравнения (3.16), то Х;=У1 т- ({=1, 2, 3, 4) —корни уравнения (3.15). ν·7·
200 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ [3 Корни уравнения (3.16) можно найти следующим образом. 1) Способ Φ ер ρ ар и. Составляется кубическое уравнение ζ*-\-2ρζ*-\-(ρ% — 4г)2г—У=0 (3.17) (кубическая резольвента уравнения (3.16)) и берется один из его корней ζ0. Затем составляются два квадратных уравнения: »«-V^H+ (£+£*-+_£=-)=(), (3.18) н«+у^«-ь(Ч^-1тг)=0· <ЗЛ9> Корни уравнений (3.18) и (3.19) служат корнями уравнения (3.16). Пример 1. Решить уравнение *4—4** + 7.*а — 2л:—5«=0. Замена у =» χ — 1 дает у*+,уа4-4У—3»0. Кубическая резольвента этого уравнения z* + 2z*-L· 13* —16 β 0; один из ее корней 20в1. Уравнения (3.18) и (3.19): и2 — и + 3 = 0, iif + tt —1=0; их корнш ^Μ«γ± "J/ j-Зв ^^ , ^»,4» — -g- ± ± l/ -j +1« "" "ξ "—. Корни данного нам уравнения: лгм=» 3:ЫУТГ у 1^ УТ β 2 > $>4== —2—· 2) Способ Эйлера ([23|, стр. ,,204 — 205, [17], стр. 222—225 или [31], стр. 156—158). Составляем кубическую резольвенту (3.17) и находим ее корни дг* zh z%. Корни уравнения (3.16) находим по формулам
4] § 3. ОТЫСКАНИЕ КОРНЕЙ МНОГОЧЛЕНОВ 20! где знаки YT^% УТХ, ΥΤ* выбираются так, чтобы выполнялось равенство \fz0 · γζχ · Υζ^ = —q. Пример 2. у4 — 6у* + 8у — 3 = 0. Здесь кубическая резольвента ζ9 — l2z* + 4Sz — 64 = 0 имеет корни2в = 21 = 2а = 4; l^i/ = rt 2f / = 0, 1,2. Корни данного нам уравнения 4-й степени: у1=Ц<2 + 2-2)=1, у2 = 1<2-2 + 2)=1, у$ = -*.(_2 + 2 + 2)=1, y4=-J.(-2-2-2)=-3. 3) Если в уравнении (3.16} # = 0 (биквадратное уравнение), то его корни находятся по формуле Пример 3. У + ЮУ + 9 = 0; y = ±.V—Ъ±. УТЬ^Ъ ; корни уравнения: у|>8 = + it ум = ±. Ы . 4. Об уравнениях степени выше четвертой. Говорят, что уравнение а^ + а^ + .^ + а^х + а^О разрешимо в радикалах, если его корни можно выразить через его коэффициенты с помощью действий сложения, вычитания, умножения, деления и извлечения корней. Любое уравнение степени η <; 4 разрешимо в радикалах, причем для каждого фиксированного η ^4 можно указать общую формулу, с помощью которой корни любого уравнения степени η выражаются через коэффициенты этого уравнения. Для η ^> 4 такой общей формулы уже указать нельзя (теорема Руффини—Абеля) ([23], стр. 392 или [17], стр. 279). Более того, для каждого л^>4 можно указать такое урав: нение степени я даже с целыми коэффициентами, что его корни вообще нельзя выразить через его коэффициенты с помощью указанных выше действий (для л = 5 таким будет, например, уравнение дг5 — 4дг — 2 = 0). Но наряду с этим для каждого η существуют и такие уравнения степени я, которыё^азрешимы в радикалах, например двучленное уравнение Xя — а = 0, корнями которого являются все значения
202 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ « [5 ч корня, /1-й степени из числа а ([11], стр. 126). Полностью вопрос об условиях, при которых данное уравнение разрешимо в радикалах, был исследован Галуа в тридцатых годах прошлого века ([5], ч. I, стр. 221). 5· Рациональные корни многочленов с рациональными коэффициентами· Многочлен f(x) с рациональными коэффициентами имеет те же корни, что и многочлен g(x) с целыми коэффициентами, получающийся из f(x) умножением на общее кратное всех знаменателей коэффициентов f(x). Рациональными корнями многочлена * g(x) = ai>xn + aixn-1 + ... + an_ix+an. (3.20) с целыми"коэффициентами могут быть только те несократимые дроби вида —, у которых/?—г делитель числа а„ q — делитель числа £ф, и даже только те из этих дробей, для которых при любом целом т' g{m) делится на ρ — mq. Если α0=1, то все рациональные корни многочлена (3.20) (если они у него вообще есть) необходимо являются целыми числами. Чтобы найти все рациональные корни многочлена (3.20), можно сначала умножить этот многочлен на а£~~' и сделать замену y=a^xf в результате чего получится многочлен k(y)=yn + btyn-* + ... + bn_iy + bn' . (3.21) опять с целыми коэффициентами. Чтобы найти все рациональные корни g(x), достаточно найти все целые корни h (у) и разделить их на #0. Для нахождения целых корней h(yy нужно, например, с помощью схемы Горнера проверить, какие из делителей числа Ьп являются корнями А 00 (§ Ьп.Ю), причем те делители ρ числа bnt для которых h (1) не делится на ρ—1 или h{—1). не делится на />-{-. 1, рассматривать не нужно; можно еще взять какое-нибудь целое число т Φ ± 1 и исключить из рассмотрения также те делители ρ числа Ьш для которых h (т) не делится на ρ—т или А(—т} не делится на р~\-т. Пример 1. g(x)=:2x* + 7x< + 3x*— Пл:* — 16л:— 12. Здесь Л(у)=.у* + 7у + бу* — 44V8— 128у— 192; делители числа 192: ±1, ±2, ±3, ±4, ±6, ±8, ±12, ±16, ±24, ±32, ±48, ±64, ±96, ±192; А(1)=—350, Л( —1)= —108; делители ρ числа 192, для, которых Л(1) делится нар—-.1 и Л(—1) делится на ρ +1: 2, 3, — 4, 8. С помощью схемы Горнера проверяем, что
6] § 3. ОТЫСКАНИЕ КОРНЕЙ МНОГОЧЛЕНОВ 203 h (2) φ 0, Λ(3)=:0, Л( —4) = 0, h (8) φ 0, причем — 4 —двукрат- ный корень h (у)." Рациональные корни g(x): xt = -^t **,*= —2. Вместо того, чтобы сразу переходить от многочлена (3.20) к многочлену (3.21), можно сначала путем испытания делителей числа ап найти все целые, корни хь ...» xk многочлена g(x) (каждый корень выписац столько раз, какова его кратность), а затем указайным выше образом найти все рациональные корни частного от деления g(x) на (дг— xt) ... ... (дг—х$. ч Пример 2. £(*)=3л:в— 5*4 — Юл:1.— 8** + *—2. , Число л: = 2—корень g(x) кратности 1, других целых корней g(x) не имеет. Частное от деления g.(x) на χ—2: gt(x) = 3xb + + βΛ:4 + 7Λ·$ + 4Λ·2 + 1. Умножение gt(x) на З4 и замена .у^Зд· nmv.hi(y)=y*+dy*+2\y'+36y*+S\. Λλ(1)=145, Лж<—1>=101. Ни для какого делителя ρ числа 81 fti(l) не делится нар— 1 (и hx (—1) не делится на р+ 1), т. е. ht (у) целых корней не имеет. Следовательно, gt (л*·) не имеет рациональных корней. Единственный рациональный корень многочлена g(x) есть αί = 2. Если для* многочлена (3.20) числа а& ап и хотя бы одно из чисел £(1), g(—1) нечетны или если числа а& ап и оба числа £(1), g(—1) не делятся на 3, то многочлен g(x) не имеет рациональных (в том числе и целых) корней ([11], изд. 4, стр. 352). ' / Пример 3. £(*) = 2а*— *т + 8л:4 + л:* — 5. Здесь числа а0 = 2, а8= — 5, £(1) = 5, £( —1) = 7 не делятся на 3, g(x) не имеет рациональных корней. 6. Разложение многочлена на множители первой и второй степени. Если многочлен f(x)=a9xn-\-aix*~1-\~... ...4-ΛΛ»ιΛΓ+αΛ имеет корни о^, о* ..., as соответственно кратностей kh ..., *5(*ι + ··· + *5 = η)» т0 его можно следующим образом разложить на множители: f(x)= а,(х — а,)*' (х — а*)**... (χ — as)ks (3.22) (разложение /(дг) на линейные множители). Разложение всякого многочлена на линейные множители единственно с точностью до порядка множителей. - Если /(дг) — многочлен с действительными коэффициентами и α — комплексный корень этого многочлена, то сопряженное с α число ά ([11], стр. 121) также является корнем /(дг), причем кратности корней α и ά совпадают. Если 7*
204 ГЛ. Ш, АЛГЕБРА МНОРОЧЛВНОВ [7 в разложении (3.22), написанном для многочлена с действительными коэффициентами, объединить попарна скобки, соответствующие комплексно сопряженным корням; этого многочлена, то получится разложение /(лс), на множители; также имеющие действительные коэффициенты: Квадратные трехчлены, входящие в это разложение» не имеют, действительных корней· и уже на линейные' множители с действительными коэффициентами разлагаться не могут. Такое разложение многочлена f(x) с действительными -коэффициентами единственно с точностью до порйдка .мйожителей. . Призер. . \ - л - = (*—П)(лг»4-1)(^-т2дг + 2)»; 7. Неприводимые многочлены. Многочлен f(x) степени п^\ с коэффициентами из поля К (стр. 175) называется неприводимым над этим полем, если он не может быть разложен в произведение многочленов степеней < л с коэффициентами из этого же поля; в противном случае многочлен f(x) называется приводимым над полем К. Все многочлены 1-й степени неприводимы над любым полем. Если К есть поле все* комплексных чисел, то многочленов выше 1-й степени, неприводимых над этим полем, не существует (см. предыдущий пункт). Над полем действительных чисел, кроме многочленов 1-й степени, неприводимыми являются также многочлены 2-й степени, не имеющие действительных корней, а все многочлены степени выше 2-й уже приводимы. Если К есть поле рациональных чисел, то для всякого η существует многочлен степени #, неприводимый над этим полем. Пример 1./(*)=** +1. Этот многочлен неприводим над полем действительных чисел, но приводим над полем комплексных чисел: f(x) = (χ +1) (χ — /). Пример 2./(*) = ** — 2. Этот многочлен приводим как над полем комплексных чисел, так и над полем действительных чисел: /(*) = (*— V%)(x+ Y%i Над полем рациональных чисел данный многочлен неприводим. Многочлен выше 1-й степени, неприводимый над некоторым полем, не может иметь в этом Поле корней (обратное неверно).
8] § 3. ОТЫСКАНИЕ КОРНЕЙ МНОГОЧЛЕНОВ 205 Если /(лг) — произвольный, а ρ (χ) — неприводимые многочлен, оба, ,с коэффициентами из поля /С, то либо f(x) делится без остатка на ρ (лг), либо же эти многочлены взаимно просты (§ 1, п. .6). Если произведение нескольких многочленов делится на неприводимый многочлен р(х), то хотя бы один из множителей делится на р(х). Всякий многочлен f(x) с коэффициентами из поля К, имеющий степень я^1, разлагается в произведение многочленов, неприводимых над этим полем, причем если многочлен /(лг) двумя способами разложен в произведение неприводимых множителей: /(лг)=р%(Х)р^(х).,.р$(лг) =sqx(лг)q^(x)... *..q't(x\ то s = i и, при соответствующей нумерации, имеют ме^то равенства qt (лг) == с${ (лг), i « ί, 2, ..., s, где' ct — отличные от нуля элементы поля /С ■ Если в разложении многочлена, /(лг) на неприводимые множители из „каждого из этих множителей вынеоги за скобку старший коэффициент, tq цолучйкя разложение /(лг) = «^lWftM-KW» TNl все л(лг),..lei; % ..м $ являются, неприводимыми многочленами со старшими коэффициентами, равными единице. Для всякого многочлена тако$ разложение уже вполне однозначно с точностью до нумерации множителей. Если неприводимый многочлен р(х) встречается в указанном разложении многочлена f(x) k раз, то р(хУ называется k-кратным множигИелеЛ Для /(лг), Если Даны разложения многочленов f(x) и g(x) на непри? водимые множители, то наибольший общий делитель d(x) этих многочленов равен произведению множителей, входящих одновременно в оба разложения, причем каждый множитель берется в степени, равной меньшей, из его кратностей в обоих данных многочленах. Пример 3. /(лг)=2(лг+ 1)(лг2 + 1)(лг«—лг+1)«, *(*)«* = 5 (х* + I)4 (х* — χ + I)2 (х2 + Зх + 4)8 — разложения многочленов на неприводимые множители над полем действительных чисел. d (лг)» (а:2 + 1) (лг* — л: + О2. 8. Разложение многочленов на неприводимые множители над полем рациональных чисел. Многочлен f(x) с рациональными коэффициентами неприводим над полем рациональных чисел (п. 7) тогда и только тогда,- когда над 'этим полем неприводим многочлен с целыми коэффициентами, полученный умножением f(x) на общее наименьшее кратное
206 гл. ш. а'лгебра многочленов [8 знаменателей всех его коэффициентов. Многочлен с целыми коэффициентами неприводим над полем рациональных чисел тогда и только тогда, когда он не разлагается на множители тоже с целыми коэффициентами, каждый из которых имеет более низкую степень, чем сам многочлен. Пусть ε(χ)=α*χη + αίχη-ί+ ... +an_tx+an (3.23) — многочлен с целыми коэффициентами. Критерий Эйзенштейна. Если можно найти такое простое число /?, что в многочлене (3.23) а0не делится на /?, все остальные коэффициенты делятся на р% но ant делясь на р, не делится на р\ то этот многочлен неприводим над полем рациональных чисел. Пример 1. g(*) = 3.*7 —4*· +2**—6*» —8лг —2. Здесь подходит число р.= 2, многочлен g(x) неприводим над полем рациональных чисел;' Пример 2. g(x)±=x*+x*+x* + x + l. К этому многочлену критерий Эйзенштейна непосредственно применить нельзя, но можно сделать замену х=у-{-1у в результате которой получится многочлен h (у)=^4 + ζν8 + 10у8 + 10у + 5, неприводимый в силу критерия Эйзенштейна (ρ = δ). Следовательно, и многочлен g(x) неприводим над полем* рациональных чисел. Критерий Полна ([31], стр. 111, 114). Пусть для многочлена (3.23) А — наибольшее из чисел |ах|, .,., \аЛ и k — целое число со свойством k^i—г + т· Тогда если g(k—1)^0 и g(k) — простое число, то многочлен g(x) неприводим над полем рациональных чисел. Пример 8.g(x) = x* — х*-\-х+\. Здесь Л=1; Л±=3— наименьшее целое число со свойством fc^j—ϊ + γ· g(3) = 22 —составное число, но g (4) = 53 —число простое. Многочлен g(x) неприводим над полем рациональных чисел. Критерий Кона ([31], стр. 118). Если коэффициенты многочлена (3.23) удовлетворяют условию О^в/^9, i = 0,1,..., л, и ЛГ=Оо10Л4-«llO^-f ··· +βΛ-ι10-ΜΛ — простое число, то этот многочлен неприводим над полем рациональных чисел. Пример 4. g(x) = 2x*+** + 5x*+6x + 3; Л^=21 563 — простое число; многочлен g(x) неприводим·
8] § 3. ОТЫСКАНИЕ КОРНЕЙ МНОГОЧЛЕНОВ 207 Приведем еще один критерий неприводимости ([24], зада· ча 681). Если многочлен (3.23) принимает значения ± 1 более чем при 2/целых значениях х% причем я=?=2/ или 2/-J-1, то он неприводим над полем рациональных чисел. * Пример 5. g(x) = x* — 3*2+3. Здесь ^·(— 1) = — 1, g(l)=l, g(2) = — 1. Многочлен g(x) не- приводнм. Другие.достаточные условия неприводимости многочлена с рациональными коэффициентами см. в [5], гл. IV, § 24 и [28], гл> I, § 4. - Для многочленов 2-й, 3-й и 4-й степени с рациональными коэффициентами можно указать, не только достаточные, но и необходимые условия неприводимости над полем рациональных чисел ([17], стр. 174—182). Многочлен 2-й или 3-й степени с рациональными коэффициентами приводим над полем рациональных чисел тогда и только тогда, когда он имеет хотя бы один рациональный корень. Многочлен 4-й степени f(x) i= χ* -|- btx* + b*x* -+- Ьгх -|- Ък с рациональными коэффициентами приводим над полем рациональных чисел тогда и только тогда, когда-либо он имеет рациональный корень, либо связанный с ним многочлен 3-й степени k(t) = Sfi — 4bJ* + (2btbz — Sh)t — (Ь\Ьк — 469&а + *з)*) имеет такой рациональный корень ί0> что — рациональные числа. В последнем случае /(Λ;) = [*« + (! + λ).* + (ίβ + μ)]χ хр+(т-х)*+в-|4 *) Если составить многочлен k (t) для левой части уравнения (3.16) ζ 4-» ^ и сделать в нем замену * =—i» то получится левая часть кубической резольвенты (3.17) уравнения (3.16).
208 ГЛ. HI. АЛГЕБРА МНОГОЧЛЕНОВ [8 где значения корней λ и \х нужно брать одного знака, если btt0 — #з^>0> и противоположных знаков, если btt0 — Ьг<^0* Пример 6. /(л:)=л:4 —4*» + 5ха —2. Здесь χ = 1 — корень f(x)t /(*) = (* — 1)(λγ» — 3λγ*+ 2*4-2). Многочлен χ* — 3*2 + 2лг + 2 рациональных корней не имеет (п. 5) и над полем рациональных чисел неприводим. Пример 7. /(.ν)=:Λ:4 — 2*» — 7лга— Юл: — 2. Рациональных корней нет. Многочлен k(t) = &t*+28t*-\-56t—36 имеет рациональный корень *о = -§· и λ = ]/"ТЦ- 1+7 =±13, μ=1/ ·2- + 2=±:γ — числа рациональные. bito—b9=—1+10>0, /(λγ)=(λγ» + 2λγ+2)(λ:» —4лг —1). Пример 8. /(л:) = 2л:' —Зл-» —л:* —Злг+1. По способу, изложенному в и. 5, определяем, что f(x) рациональных корней не имеет. Делим все коэффициенты /(х) иа старший коэффициент До = 2 и составляем многочлен »(„=«·-4(-|)<·+[2(-4)(-4)-»4]'- -[ττ-<ΚΗ+4Η·+*·+4<-?· Умножая k(t) иа 8 и делая замену ν = 4/, получаем многочлен c' + t^ + v—35, не имеющий рациональных корней. Следовательно, k{t) также не имеет рациональных корней. Многочлен f(x) ненри- водим над полем рациональных чисел. Если к многочлену (3.23) ни один из указанных выше критериев неприводимости применить нельзя, то приводим этот многочлен над полем рациональных чисел или нет, можно установить следующим образом ([27], стр. 66—68 или [13J, стр. 173—176). Переменному χ придают пг целых значений хи хь..., хт где m — i-{-1 при четном η и т = п *ϊ при нечетном я. Затем составляют всевозможные наборы целых чисел вида Си **» ···♦ Ст> рАв Ci(i=\f 2, ..., т) есть делитель числа g(xt) (всего получается S=2m$t ... $т наборов, где st — число всех положительных делителей g(X()). Для каждого такого набора строят многочлен hj(x) (/=1, 2, ..., S) стег пени ^ т — 1 со свойствами hj (χι) = cit где i = 1,2,..., m%
8] § 3. ОТЫСКАНИЕ КОРНЕЙ МНОГОЧЛЕНОВ 209 а числа ct взяты из /-го набора (§ 2). После этого для тех из многочленов hj (jt), все коэффициенты которых получились целыми и степень которых ^>0, непосредственным делением проверяют, делится ли g(x) на hj(x). Если g(x) не делится ни на один из этих многочленов, он неприводим над полем рациональных чисел. В противном случае получается разложение многочлена g(x) на множители более низкой степени с рациональными коэффициентами, из которого легко получить разложение на множители с целыми коэффициентами, с которыми дальше можно действовать так же, как раньше с многочленом g(x). При применении к многочлену g(x) указанного выше процесса возможны следующие упрощения: . если два набора чисел си с9, ..., ст и с'и сь ..., ст отличаются друг от друга лишь знаком, то многочлен hj,(x) строится только для одного из этих наборов; можно взять еще несколько целых значений переменного *m+b ^m+2» ···> хт+1> если хотя бы Для ОДНОГО ИЗ НИХ g(xm+h) не делится на hj(xm+k)f то делится ли g(x) на hj(x)f проверять не нужно. Пример 9. ^(λγ) = χ5 — 2λγ4— 3^$ + 6λγ8+λγ—1. Здесь £(0)=—1, *<1) = 2, #(-1) = 4, #(2)=1. Выбираем вначеиия #(0), g(\), g(2)t как имеющие меньше делителей,-и составляем наборы делителей выбранных чисел: 1 1 1 Ι—ι 1 — 1 1 — 1111 12 ι II ι 1 2 — 1 1 — 2 1 — 111 2 1.11 По формуле Ньютона (§ 2) строим для этих наборов многочлены Λ, (*)=!, Λ2(λγ) = — λ:2+α:+1, Λ8(λγ) = 2λγ* — 4λγ+1, Μ*) = = —λγ8 + 3λγ—1, Λβ(ΑΓ) = —λγ8 + 2λ:4·1. h%(x) = — 2x*+3x+U Λ7(λ:) = Заг* — блг+l, Λ8(α:) = —2λγ» + 5χ—1, где hj(x)(j= l, 2, ... ..., 8) — многочлен, принимающий при л: = 0, 1, 2 значения, стоящие в у'-м столбце выписанной выше таблицы. Числа h% (— 1)= = 7, /ц (— 1) = — 5, Л7 (— 1) = 10 и Л8 (— 1) = — 8 не являются делителями числа g(— 1) = 4, поэтому многочлены Л8(лг), Л4(*), 9h(x) и Л8(дг) не рассматриваем. Возьмем еще значение £(—2) = —19. Оно не делится на Л2(—2) = — 5, Л8(—2)=*—7 и Л#(—2) =—13. Многочлен g(x) неприводим над полем рациональных чисел. *) Наборы, отличающиеся от выписанных здесь лишь знаком, не берем·
210 ГЛ. Ш. АЛГЕБРА МНОГОЧЛЕНОВ I» Пример 10. g(x)=x*+x* — 6jc*—3* + 9. г(_2)=-1,е(1) = 2,г<2)=3. Составляем наборы делителей этих чисел: «i-.l с,= 1 с,=»1 — 1 1 1 . 1 — 1 1 1 1 — 1 II 111 2 111 — 1 2 1 η— ι II21 2 II' и 3 1 — 2 1 1 — 2 3 1111 2.1 — ι Из ill*) 2II —з II — 1 1 3 Ά\ — 1 з 111 ill —3 Строим соответствующие им многочлены (§ 2, формула Ньютона): hx (χ) = 1; hi (x)t hb (лг), hA (χ), hb(x), Λ# (χ) — многочлены с дробными коэффициентами; л7(лг)=элг2—3—делитель g(x\ £(*) = = (х% — 3) {χ* + лг—3), причем, многочлены г'#* — 3 и χ* + χ — 3 над полем рациональных чисел неприводимы (так как не имеют рациональных корней). Другой способ разложения многочлена с рациональными коэффициентами на множители более низкой степени с рациональными коэффициентами см. в [27], стр. 68. 9. Дробно-рациональные функции. Дробно-рациональной функцией (или просто рациональной дробью) называется вы- f(x) ражение вида -^Л, гДе /С*) и, g(x) — многочлены над некоих·*/ торым полем К (§ 1)» причем g(x) φ 0. Над дробно-рациональными функциями можно производить алгебраические операции по таким же законам, как над рациональными числами. Рациональная дробь ~т\ называется несократимой, если мно- гочлены ft(x) и gt(x) взаимно просты (§ 1, п. 6). Всякая рациональная дробь равна несократимой дроби, получающейся из нее путем деления ее числителя /(лг) и знаменателя g(x) на наибольший общий делитель /(лг) и g(x). „ - χ* — χ χ—1 Пример 1. , . 0 « as й , 0 Л Г. к F *8 + 2*8 —лг лг* + 2*— 1 Рациональная дробь называется правильной, если в ней степень числителя меньше степени знаменателя. Всякая рациональная дробь, отличная от многочлена (т. е. такая, что в ее *) См. сноску на стр. 209·
9] § 3. ОТЫСКАНИЕ КОРНЕЙ МНОГОЧЛЕНОВ 211 несократимой записи знаменатель имеет ненулевую степень), может быть единственным образом представлена в виде суммы некоторого многочлена и некоторой правильной дроби. Чтобы ftx) получить такое представление дроби -т-т, НУЖН0 разделить g{x) с остатком многочлен f(x) на g(x) (§ 1, п. 2); если при этом получится частное q(x) и остаток г(х), то будем иметь . /1*1 _а(х\±гМ. g(x)—q(x)^g(x)' г (χ) где -^ — правильная рациональная дробь. Пример 2 №-**+**-** + · пример г. ^(χ) ———-^ . Здесь Зх* + 2х* — 4лг + 6 = (аг8 — 2х + 3) (Злг*4-6* +5)— 12аг —9, /(*> -о^ » *.. . g . — 12лг —9 ^*)-3* + 6* + 5 + **-2* + 3· Правильная рациональная дробь -^р\ называется простей- шей, если g(x) является степенью некоторого многочлена р(х), неприводимого (п. 7) над заданным полем K(g(x)=p^(x), где k^l)f а степень многочлена f(x) меньше степени р(х). Если К—поле всех комплексных чисел, то простейшие дроби — это дроби вида , * у , где а и Ъ — комплексные числа и /^1; если К—поле всех действительных чисел, ·το простейшими являются рациональные дроби вида ( _«^ (а, Ъ — действительные числа, / ^ 1) и (χ*±\χ±Η \т > Где х*-^ btx-\-b^— многочлен с действительными коэффициентами, не имеющий действительных корней, аи а2 — действительные числа, m^zl. Основная теорема. Всякая правильная рациональная дробь разлагается в сумму простейших дробей, причем это разложение единственно. fix) Чтобы получить разложение дроби -^fk на простейшие g[X) над данным числовым полем К> нужно разложить многочлен g(x) на неприводимые над К множители и, если получится g(x)=Pll(x) ··· P*t*(x) (Pt(x)t ···> Pt(x) — неприводимые
212 гл. ш. алгебра многочленов [9 многочлены), написать f(x) _и\*>(х) , **,"(*) и<»{х) £(*)—/>*(*) ^ />*-1(*) + ··· + м^)+··· где vfp{x) (l = l9...9t;j=lf...9 Si при фиксированном i)— многочлен степени меньшей, чем степень·/^ (лг), взятый с неопределенными коэффициентами. Затем нужно все дроби правой части равенства (3.24) привести к общему знаменателю g(x) и приравнять сумму получившихся при этом числителей многочлену f(x). Сравнивая коэффициенты при одинаковых степенях χ в левой и правой частях получившегося равенства (или придавая переменному χ в левой и правой части равенства числовые значения), получим систему линейных * уравнений, решая которую (гл. I, § 2, п. 1—3) найдем коэффициенты многочленов uffl(x). Пример 3. Рациональную дробь /(*)_ 2-у4 — 2лг« + в** + 2лг + 7 gix)~ х* + 2х* + 2х*+4х* + х + 2 разложить на простейшие над полем действительных чисел. Здесь #(л;) = (л; + 2)(л;8 + 1)8, причем многочлены χ 4-2 н л:3+1 исприводимы. Пишем /(*) α . αιχ + α* . CjX + Cj gix)~Г+"5"Пл;* + 1)*~Г аг»+1 * Приводим все дроби к общему знаменателю g(x) и получаем равенство /<*)-« (*■ + I)3 + («ι* 4-«·)(*+2)+(**+«■) (х + 2) (х*+ 1), или 2x* — 2x* + 6x*+2x + 1 = i<* + Ct)xA + №i+c*)x* + + (2a + ai+ci + 2ci)x* + (2ai + ai+2ci + ci)x+(a+2a* + 2ct). Приравнивая коэффициенты при одинаковых степенях х% получаем систему уравнений (a +ct =2, 2ct +>· — — 2, . i 2a+ at 4-^+2^2 = 6, Ι · 2at 4-ag4-2ci +c%*=% [ a +2aa +2c, = 7.
9] § 3. ОТЫСКАНИЕ КОРНЕЙ МНОГОЧЛЕНОВ 2Ю Решая эту систему, находим: α = 3, αι=1, atss2, ci=—l,c8 = 0. Таким образом,^=г|1+^±^—3?фт. Пример 4. Ту же рациональную дробь разложить на простейшие над полем комплексных чисел. Здесь g(x) — (x + 2)(x + l)*(x—О2· В соответствии с этим пишем /(*)_ <* ι Ь , с . tf , * ^(д:)-лг + г^Слг + О2 """лг + М (лг — О2"1"^ —ί' Приводим все дроби к общему знаменателю g(x) и получаем равенство 2л:« —2лг» + бдг8 + 2л: + 7 = а(л:+02(А: —02 + ^(^ + 2)(jc — ί)* + + с(лг+2)(л; + 0(л; — 02 + ^(^ + 2)(αγ + ι)8 + + *(λ;+2)(λ: + 0»(*-0· Беря значение лг = — 2, получаем: 75«α·25, т. е. а = 3. Берем *=—/. Это дает: 3 — 4/=*£(2 — ι)(— 4), откуда £ = — -о+т*· При дг=/ получаем: 3 + 4» 4 (2 + 0 (—4), т. е. </ = — ~ — j t. Полагаем теперь последовательно χ = 0 и χ = — 1 и, используя уже найденные значения коэффициентов at bf d% получаем 7-3 + (l--J*)-2fc* + (l+£*) + *!, 15=12 + (_^_^+с(—2 —2/) + (—i+/) + ^(—2 + 2r)t или — 2d + 2W = 2, c(-2-2/) + *(-2+20 = 4t откуда c=s 2 , ia= 2""~ . Таким образом, /(*)_ J 2 — / 1—* 2 + i 1+1 g(x)~~x + 2 4(jc + 08 2(at + 0 4(at —02 . 2(at —0' /(ж) χ2 «4- 2 Пример 5. Разложить на простейшие дробь^-^=: г—^тй· Пишем: £И^ = 7—2L__|_- ___| - Приводим все g(x) (χ— })*^(х — I)2 ' *—1 к дроби к общему знаменателю и получаем: f(x) = α + £ (ж—1)+ +с(*—1)а. Полагая последовательно *=1, * = 0, ж = 2, находим: д = 3, £ = 2, с=1. Таким образом, л:» + 2_ 3.2 ]_ (лг_ 1)8 —(АГ_ i)8-t-(A:_ i)s-r л:—Г Еще о разложении дробей на простейшие см. § 1, п. 4 и § 2 (формула Лагранжа). ι
214 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ [1 § 4. Границы корней многочлена· Теоремы о числе корней 1· Границы действительных корней многочлена с действительными коэффициентами. Если ~ /(^)=а0д^ + а,д^1+ ... +an_tx-{-an (α0 φ 0) (3.25) — многочлен с действительными коэффициентами, то все его действительные корни (если они вообще существуют) заклю- чены в интервале (—Ν, Ν), где N=l+r—г, А — наибольшее из чисел \аг\, ..., \ап\ (ср. § 4,,п. 3). Пример 1. /(лг) = 5л:в — 11^ + 38^ + ^—100^—3. Здесь Л=100, W=rl+^ = 21. Можно указать и более точные границы корней много· члена (3.25). Число К называется верхней границей действие тельных корней многочлена (3.25), если этот многочлен не имеет действительных корней, больших или равных К\ аналогично определяются верхняя и нижняя границы положи· тельных или отрицательных корней многочлена. Если К\ —верхняя граница положительных корней /(λ), Κ% — верхняя граница положительных корней /(—дг), Кь^>0— верхч няя граница положительных корней многочлена x*f (—) ' и #4^>0 — верхняя граница положительных корней многочлена x?f ( ], то все отличные от нуля действительные корни многочлена /(лг), если .они вообще существуют, лежат внутри интервалов ί—/f2, —γ) * \Ί?> ^ч· Для определения верхней границы положительных корней многочлена можно применить один из следующих Методов. 1) Если в многочлене (3.25) а<>}>0, аи а*, ..., а^^О и #/<[0, то верхняя граница положительных корней этого многочлена находится по формуле *) Этот многочлен можно получить, написав все коэффициенты многочлена f(x) в обратном порядке: xnf (-) = αηχη + Яя-!**"1 + — + *ι* + *о.
1] . § 4. ГРАНИЦЫ КОРНЕЙ МНОГОЧЛЕНА 215 где β — наибольшая из абсолютных величин отрицательных коэффициентов f(x) (способ Маклорена)· Π ρ их ер 2. /(л:)=9л* — 9л:* — 36jc -fJL· Здесь /=2, В =r 36, ΛΓ=Κι == 1 +1/ ττ = 3. * . Рассмотрим многочлен /(—λ:)=9λ:4 — 9**+ 36* + 1. Для него верхней границей положительных корней служит число ίζ% = 1 + Τ/ тг — ^. Бе- рем дг«/Ш = лг4 —36а:» —9аг8 + 9. Здесь /=1, /Г» = 1 +36 = 37. Наконец, для xAf( J = л:* + 36*» — 9** + 9 имеем Ка = 1 + + *р/1Г=:4.. Следовательно, если многочлен f(x) имеет действительные корни, то они обязательно должны лежать в интервалах (—2,—«jj и (o7»3j (по способу, указанному в начале этого пункта, получился бы интервал (—5, 5)). 2) Если при х=с многочлен (3.25) и его производные /'(*), f"(x)>...,f{n){x) принимают положительные значения, то с является верхней границей положительных корней* /(дг) (способ Ньютона). Применяя способ Ньютона, значения /(с), /'(с),..., /(л)(с) проще всего находить по схеме Горнера (§ 1, пп. 3—-4). Пример 3. /(лг)=:3л:4 — 18л:»+14** +36л:+ 25. По способу Маклорена находим: К= 1 +-т =7·' Применяем способ Ньютона. Испытываем число с = 3: * —18 14 36 25 3 3—9 —13 — 3 .16 | 3 0—13 —42 Получили: /(3) « 16 > 0, но f (3) = — 42 < 0; с = 3 не подходит. Испытываем с = 4: 1 4 » 3 3 — 18 14 36 25 — 6 — 10 — 4 9 6 14 52 Так как получилась строка, состоящая целиком нз положительных чисел, можно дальше не считать (везде дальше будут получаться положительны* числа). / (4), /' (4), /" (4), /"' (4), /IV (4) > 0, с = 4 — верхняя граница положительных корней /(*).
216 ГЛ. III. .АЛГЕБРА МНОГОЧЛЕНОВ . [1 Для нахождения числа Ф с, для которого f(c)^>09 /'(<01>0> ···> /(Λ)(£)]>0, можно поступить и так: взять число си для которого /{п~г)(ci)^>Ot затем число сг^си для которого /л~*(£*)]>0, затем число c9^c%f для которого /(я"3)(^з)>0> и т. д. до ся = с. Пример 4. f(x) = л:» — 6а:8 + 1х + 5. Здесь /'(л:)=:3л:*—12л: + 7, /"(*) — блг—12 и можно взять Ci = 3, с8 = 4, с8 = 4. с = с8?=4 — верхняя граница положительных корней /(л:). > 3) Предполагая я<>!>0> представляем многочлен (3.25) (не переставляя его членов) в виде /(λγ)=/ι(λγ)+ ...+/$(#), где у каждого многочлена fi(x) (i=sl,..., $) старший коэффициент положителен и в ряду коэффициентов имеется толь· ко одна перемена . знака *) (/5 (х) может вообще не иметь перемен знака в ряду коэффициентов). Если при с^>0 /ι(<0]>0»·.·> fs(c)^>®> т0 с — верхняя граница положительных корней /(лг)([31], стр. 170). Пример 5. /(,<:)=:а:7+2л:в— За:8 — Злг4+лг· — 2ATf + *-|-2. Полагаем /1(Аг) = лг7 + 2л:в--.Зл:в —За:*, /, (х) = х* — 2л:*, fb(x)=x + 2. Тогда /i(3)>0, /2(3)>0, /»(3)>0 и с = 3 — верхняя граница положительных корней f{x). Если все. коэффициенты многочлена f(x) положительны, он вообще не имеет положительных корней (и верхней границей его положительных корней можно считать 0 или любое положительное число). Если в многочлене (3.25) а0<0, то нужно рассмотреть многочлен —f(x), имеющий те же корни, что и /(дг). Пример 6. /6с) = — 2л:4 — Зх*+5х* + 6. Здесь —f(x)^s2x4+3x9—5л:8—6. По способу Маклорена для многочлена —f(x) получаем: /С= 1 + 1/ у =» 1 + }/"3W2,74 (приближенное значение уТГ берем с избытком). Переходя к способу Ньютона, испытываем с = 2: 2 3—5 0—6 2 7 9 18 30 *) См..сноску на стр. 217·
2) § 4. границы корней многочлена 217 Получилась строка нз положительных чисел, с = 2 —верхняя граница положительных корней многочлена —/(*), т. е. и много· члена /(*). 2. Теоремы о числе действительных корней· Если каждый корень многочлена считать столько раз, какова его кратность (§ 1, п. 10), то число всех действительных корней многочлена /(*) = %^Η-Λι^!Η-...Η-ΛΛ-ι* + αΛ c Дв*- ствительными коэффициентами всегда имеет ту же четность, что и степень η многочлена. В частности, если η нечетно, то f(x) необходимо имеет хотя бы один действительный корень. Число положительных корней четно или нечетно в зависимости от того, одинаковые или противоположные знаки имеют #о и последний отличный от нуля коэффициент f(x). Если при х=Ь и дг=с f(x) принимает значения противоположных знаков, то на отрезке [Ь> с] лежит хотя бы один действительный корень многочлена f(x)f а общее число корней f(x) на отрезке [bf с] нечетно (если опять каждый корень считать столько раз, какова его кратность). Если значения f(b) и /(с) имеют одинаковые знаки, то на отрезке [bt с] либо вообще нет корней f(x), либо их там четное число. Число всех Отрицательных корней многочлена f(x) равно числу всех положительных корней многочлена /(—х). 'Теорема Декарта. Число положительных корней многочлена f(x) с действительными коэффициентами (подсчитываемых каждый столько раз, какова его кратность) либо равно числу перемен знака4') в ряду коэффициентов f(x), либо на четное число меньше. Пример 1. /(*) = ** — 2*+1. Знаки коэффициентов: Η 1-, т. е. имеем две перемены знака. Число положительных корней многочлена/(л:) — либо 2, либо 0. /(—х)=в~-х*^г2х+ 1. Здесь в ряду коэффициентов одна перемена знака. Число отрицательных корней f(x) равно 1. Теорема Декарта позволяет определить точное число положительных корней многочлена, если в ряду его коэффициентов нет перемен знака или имеется одна перемена знака. Если перемен знака больше одной, то иногда точное число *) Если в ряду чисел, расположенных в определенном порядке, имеется к переходов от одного знака к другому (числа, равные нулю, пропускаем), то говорят, что в этом ряду содержится к перемен знака. ·,..«·.
218 гл. ш. алгебра многочленов [2 положительных корней многочлена удается определить, при· меняя теорему Декарта и рассматривая, кроме того, знаки значений многочлена в отдельных точках или же поведение отдельных членов многочлена при изменении х. Пример 2. /(jc)s=jc4 — 2a:»—2х+\. В ряду коэффициентов f(x) .две перемены знака, т. е. f(x) имеет 2 или 0 положительных корней./(0)= I >0, /(!)=—2<0, т. е. отрезок (0, 1] содержит по крайней мере один корень многочлена /(*)· Следовательно, число всех положительных корней ,/(*) равно двум. /(— х)=х* + 2х* + 2х + 1. Отрицательных кор- 'ней многочлен f(x) не имеет. Пример 3. /(*)==·*7 + ·**—χ+\. В ряду коэффициентов,—две перемены знака. Но при 0< <х^1 единственный отрицательный член многочлена, — х, «покрывается» свободным членом I, а при х>1 член хг больше чем х. чСледовательно, при любом положительном значении χ многочлен f(x) принимает положительное 'значение и число положительных корней многочлена f{x) равно 0. Иногда точное число всех действительных корней многочлена с действительными коэффициентами можно определить/ применяя теорему Декарта и более детально рассматривая график этого многочлена на участках, заключенных между границами его действительных корней. Пример 4. /(*) = .*:» — 2л:1 — 8*» — ** — 9х+1. По, теореме Декарта, имеем 2 или 0 положительных корней. /(0)>0,/(1)<0, поэтому положительных корней два. Берем/(—*) = s=—х* — 2лг* Ц- 8jc*—л:8 + 9л: + 1. Здесь три Перемены знака, т. е. f(x) имеет один или три отрицательных корня. По методам п. I определяем, что все отрицательные корни многочлена f{x) лежат на отрезке [—3,-2]. Тем же способом определяем, что —2 нижняя граница действительных корней производной /'(«*)» т· е* на отрезке [—3,—2] /(*) — монотонная функция ([34], стр. 53). Следовательно, f(x) имеет один отрицательный корень. Общее число действительных корней многочлена f(x) равно 3. В некоторых случаях точное число всех действительных корней многочлена можно определить, применяя теорему Декарта и вычисляя дискриминант D(f) этого многочлена (§ 1, п. 12). Пример 5. f(x) = xA + x% — 4л: + 3. С помощью теоремы Декарта определяем, что число положительных корней /(х) равно 2 или 0, а число отрицательных корней равно нулю, т. е. либо все корни многочлена f(x) комплексные, либо у него два действительных и два комплексных корня. D (/)— = 5744>0, т. е. число пар комплексно сопряженных корней f(x) четно (§ 1, п. 12). Следовательно, все кории .многочлена f(x) комплексные.
2] § 4. границы корней многочдвна л 219 Пример 6. /(*) = =—лг» + 14лг+20. Усиление теоремы Декарта. Если все корни многочлена f(x) действительны, то число положительных корней f(x) равно числу перемен знака в ряду его коэффициентов, а число отрицательных корней равно числу перемен знака в ряду коэффициентов многочлена /(—х). -2— χ 1 1 1 1—л: 3 1 3 1 —лг| Здесь f(x) — характеристический многочлен симметрической матрицы (гл. II, § 1, п. 17), поэтому все его корни действительны. /(—лг) = д?· — 14л: + 20. Число положительных корней многочлена /\х) равно 1, число отрицательных корней равно 2. Если два рядом стоящих коэффициента многочлена f(x) равны нулю, но ап zfi 0, то заведомо не все корни f(x) являются действительными ([23], стр. 151); в частности, усиление теоремы Декарта применять нельзя. Число действительных корней многочлена f(x) степени η с действительными коэффициентами, больших фиксированного действигельного числа с, или равно числу перемен знака в ряду /(c), f(c), ..., f{n)(c), или на четное число меньше. Если все корни многочлена f(x) действительны, то число корней, больших с, в точности равно числу перемен знака в ряду /(с), /' (с),..., /<*> (с). Пример 7. /(лг>=лг4 — 3л:» + л:*—2лг + 1. .пгДдесьо. Я')--£ г or-—5> /"0)=-4, rrm-·, /iv(i)s=24. Получили одну перемену знака, многочлен/(л:) имеет один действительный корень, больший 1. ТеоремаБюдана — Фурье. Если действительные числа а и * (я<0) не являются корнями многочлена f(x) степени η с действительными коэффициентами, то'число действительных корней этого многочлена, лежащих между а и Ь и подсчитываемых каждый столько раз, какова его,кратность, либо равно, либо на четное число меньше разности между числом Si перемен знака в ряду чисел /(a), f'(a),...f /(Л)(а) и числом <Ss перемен знака в ряду, полученном из ряда чисел /(b), f'(b)\ ..., f(n>(b) заменой встречающихся в нем нулей такими отличными от нуля числами, что если fik'l)(b)#0, f(k)(b)=...=/<**-«>(*) = <), /(*+'>(ft)^0, то число сЛ+/, заменяющее /(Λ+/)(*)(ί = 0, 1,..., /—1), имеет
220. . ГЛ. Uh АЛГЕБРА МНОГОЧЛЕНОВ , ' (2 ΐοτ. же ,зна;с> что и f(k*l)(b)t если разность /—i четная, и противоположный знак, если эта разность нечетная. Пример 8. f(x)x=3x*—2л* + дс«+4лг*—*— 1. Определив число корней fix) на* отрезке [ — 2, 01. Имеем: /(-2)>0, f (-2)<0, /'(-r-2)>0, /"/-2><0, /^(-2)>0>/«4-2)<0,/<β,<-2)>0,/<^(-2)<0>/^(^2)>0, откуда 5^8; /(0)<0, /(0}<0, /'(0)>0, r\0)^0t /4(0)>0>/ί»)(0)<0> /{#>(0) = 0>/|^(0) = 0>/(в/(0)>0; составля- ем ряд знаков -| Η 1 |-; получаем $8«в7. Si—$s= 1, на отрезке [ —2, 0] лежит один корень многочлена /(*). Метод Штурма определения Числа действительных корней. Последовательность . отличных от нуля многочленов с дейстаительныц^ рядом Штур· ма дяя-'йНогЪ^^кЩ^.^^и: '·'* \у когда действительное переменное х, возрастая, проходит через корень многочлена f(x)f произведение /(х)*/% (х) меняет знак с — на +; 2) никакие два соседних многочлена fk(x)> A+iC*) (A== = 0^ 1, ..., т — 1) не имеют общих действительных корней; 3) если для некоторого действительного чи^ла α и некоторого номера k(l^k^m—1) /Λ(α) = 0, то числа /*.ι(α) и Λ+ι(α) имеют разные знаки; 4) fm{x) йе имеет действительных корней. Последовательность многочленов (3.26) называется рядом Штурма для многочлена /(лг) на отрезке [a, b]t если свойства 1), 2), 3), 4) выполнены на этом отрезке ([23], стр. 141). Теорема Штурма. ПусЛ f(x)г—многочлен с действительными коэффициентами, а и b (a<^b)—действительные числа, не являющиеся его корнями, (3.26)—ряд Штурма для f(x) на отрезке [а, Ь). Тогда число различных действительных корней многочлена f(x)f лежащих на отрезке [я, Ь)9 разно разности между числом перемен знака *) W(a) в ряду значений /(α), Λ (а)> · · ·» /т (а) и числом перемен знака W(b) в ряду значений /(*), /,(*), ..., /т(£).. Построение ряда. Штурм а. Берется многочлен /(дг)=/ф(х), его производная /'(λγ)=/ι(χ),' затем остаток rt(x), получающийся при делении f(x)'m f (x), с обратным *) См. сноску на стр. 217·
2] ·· § 4. грлница Ko^Hbfl многочлена &Г знш>м$^г\(х)=/%*(х)), вате* "остаток гг(х\ получающийся пр^й^лейии f (χ) на/а(дг), с обратным знаком ( — ri(x)= й^Й остаток от деления /Цх) на /8 (*) с обратным, знаком-^— г8(дг)=/4(дг)) и -т. дv до последнего неравного нулю остатка гт.,(дг)( — гт.,(дг)=/т(дг)); Если /т(х) не имеет действительных корней, то построенный ряд многочленов есть ряд Штурма для многочлена f(x)\ если /т(х) имеет действительные корни, но все они лежат вне отрезка [a, b)f то $то-— р*Ц_Шхурма для многочлена f(x) на отрезке [а, ЭД^ЁрнГ многочлен /т(х) имеет действительные корни на отрезке'[α, ί], то нужно разделить многочлены Л(х)>- /ι(*)>·ν» fm(x) на /т(х) и взять получившиеся' частные. Это будет ряд Штурма для "многочлена q0(x)=&t£ ([23], Тт\х) стр. 145), имеющего точно те же корни, что. и /(я),. толькЪ кратности 1 (§ 1, п. 10); разность W(a)—W(b) (α, b—действительные числа, не являющиеся корнями /О», вычисленная для этого, ряда, дает число различных, действительных корней многочлена f(x) на отрезке [а, Ь)\ при этом фактически деление на fm(x) можно не производить,. так как при любом действительном значении х = су не являющемся корнем многочлена f(x% число перемен знака в получающемся ряду значений частных совпадает с , числом перемен знака в ряду значений f9(c)f ft(c)f #v, /m(r). . Пример 9. Найти число различных действительных корней .многочлена т{х)=х*-±Ъх%-~x* + Sx—4,"расположенных на·отрезке [—1/1]. ·.·.·■ Берем многочлены /0 (х) *=/ (*), fx (x) «=/' (x)=Αχ*—%хг ·— ^•JqX — "ία" WW- на Λ W/Длится уже без остатка). Так как. на отрезке [—1, 1] многочлен /$ (х) корней не имеет, то получился ряд Штурма для. многочлена f(x) на отрезке [-И, 1]. Составляем таблицу, в первом столбце которой выписываем значения, которые придаются переменному xt в следующих столбцах выписываем знаки получающихся при этом значений многочленов ряда Штурма, в последнем столбце — число перемен знака X - — 1 1 /о<*) + /л(х) + /*(*) к ± ./»<*) — W 2 1
222 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ [2 ^(— 1)—\^(1) = 2— 1=г1. На отрезке [-г 1, 1] f(x) имеет одни корень. Пример 10. Для того же многочлена/(х) определить число различных действительных корней' на отрезке [—5, 5]. Построенный выше ряд многочленов не есть ряд Штурма на этом отрезке, так как /г(х) имеет на этом отрезке корень * = 2. Тем не менее выписываем таблицу: X — 5 5 /·(*) + /|<*) + /*<*) + + /«W + w 0 W(— 5) — №(5) = 3 — 0=3. На отрезке [—5,6] многочлен/(а:) имеет три различных корня· При построении ряда Штурма возможны упрощения: 1) если f(x) или один из остатков т% (χ) (Ι *^ί</«-7-1) не имеет действительных корней (не имеет корней нЪ отрезке [а, Ь]\ то на нем построение ряда Штурма (построение ряда Штурма на отрезке [а, Ь]) можно оборвать ([23], стр. 143); 2) производя деление с остатком, можно умножать делимое и делитель на произвольные положительные числа (там же); 3) если f(x) (или один из многочленов ft(x)9 1<^^ ^т — 1) делится без остатка на многочлен g(x), принимающий при всех действительных значениях χ неотрицательные значения и обращающийся в 0 только при таких значениях х=а, при которых /(а)^0, то f(x)) (или соответственно fi(x)) можно на g(x) разделить и дальше при построении ряда Штурма брать вместо f{x) (вместо fi(x)) получившееся частное. Пример U.f(x) = x* + 4x*-~3a:*+12* —24. Здесь /'(*) = = 6(;г4-2**—* + 2) имеет корнем число / и поэтому делится на х2-\-\ (§ 3, п. 6). После сокращения на этот многочлен и на число 6 получаем /1(х) = дг$— * + 2. Делим f(x) на ft(x) и берем остаток от этого деления (сокращенный на 2) с обратным знаком: f% (χ) = = **—6*+14. Этот многочлен не имеет действительных корней (§ 3, п. 1), и на нем можно остановиться. Получили ряд Штурма для многочлена f{x). Если нужно определить общее число всех различных действительных корней многочлена f(x) с действительными коэффициентами, то можно применить к f(x) теорему Штурма на отрезке [а, Ь\ где а — нижняя, Ъ — верхняя граница дей-
2] § 4. ГРАНИЦЫ КОРНЕЙ МНОГОЧЛЕНА 223 ствительных корней f(x) (п. ,1). Более простой способ — применить теорему Штурма на отрезке [а, Ь\ где а — такое большое по абсолютной величине отрицательное число, а 'Ъ — такое большое положительное число, что при лс=а и при х=Ь знаки всех членов ряда Штурма, построенного для многочлена' f(x)f совпадают со знаками старших членов этих многочленов; такие числа аир всегда существуют; символическое обозначение для них: —оо и -f-oo; фактически находить числа а и Ь не нужно. Если нужно узнать отдельно, сколько различных положительных и сколько различных отрицательных корней имеет многочлен f(x), то теорему Штурма применяют на отрезках [—со, 0] и [О, -|-оо]. Если нужно узнать точнее, в каких интервалах лежат корни, то рассматривают знаки значений многочленов ряда Штурма в различных точках этих отрезков. Пример 12./{л:)==4л:в + 4л:* — 15*4 — 16л:» + 12л*-f 16л: + 4. Берем ft(x) = -~/'(л:) = 6л:* + 5л:< — 15*»—12л*2 + 6л:+ 4, /8 (л:) = 50л:* + 57л:» — 84л:* — 114л: — 32 (это взятый с обратным знаком остаток от деления многочлена 9/(х) на /ι (*)), /$ (л:) = 2л* + х% — 4л: —2 (остаток с обратным знаком от деления/i (л:) на/2(л:), умноженный на ggg). ЛМдвлится на /9 (х) уже без остатка. Составляем таблицу: X — оо + ОЭ о — 1 1 2 /ι (.ν) т^^ . + + 0 —. + /.<*) + + — — —. + /·(*) _ + + + W з о 1 2 1 0* №(— оо)— №(+оэ) = 3, т. е. f(x) имеет три различных действительных корня. №(— оо)— №(0) = 2, W(0)—U?<+oo)=l, т.е. два из них отрицательны и один положителен. W(— оо)— W (—!) = !, №(—1)—№(0)=1, т. е. один из отрицательных корней меньше — 1, другой заключен между — 1 и 0. W(\) — W(2)=t\9 т.е. положительный корень лежит на отрезке [1, 2].
224 ГЛ. lib АЛГЕБРА МНОГОЧЛЕНОВ [2 Если нужно определить, сколько корней каждой задан- ной кратности (§ 1, п. 10) имеет многочлен f(x) на отрезке [а, Ь]9 то нужно составить многочлены dt(x)=(f(x), /(*)), d^(x) = (di{x\ d[(x)) и т. д. до ds(x) = (ds_t(x), d's-\{x)) (§ 1, п. 5) и для каждого*из них определить, сколько различных корней имеет этот многочлен на отрезке [а, Ь). Если f{x) имеет на отрезке [а> b] k0 различных корней, а di(x) — kt различных корней (1=1, 2, ..., $), то на отрезке [а, Ь\ лежат k0 — kx простых корней /(дг), kt — k% двукратных корней, кг — ^з трехкратных корней и т. д» Пример 13. Пусть f(x) — многочлен, рассмотренный в предыдущем примере. Для него dt (х)=/ш(х)=2х*-\-х*— 4* — 2, d2(x)=z 1. По методу Штурма определяем, что на каждом из отрезков (— оо, — 1J, [— I, 0J, [1, 2] dt(x) имеет по одному корню. Многочлен d%(x) вообще корней не имеет. Следовательно, на каждом из рассматриваемых отрезков f(x) имеет по одному двукратному корню, ι Метод квадратичных форм. Имеем многочлен /(х)=а«хп + а1хп-1-\- ... + ап_хх-\-ап с действительными коэффициентами. Составляем квадратичную форму (гл. II, § 2, л. 1) л- ι i, k = 0 где $м — сумма (ί-|-Α)-χ степеней корней этого многочлена (каждый корень берется столько раз, какова его кратность) *). Ранг этой квадратичной формы (гл. II, § 2, п. 1) равен числу всех различных корней многочлена f(x) (действительных и комплексных вместе), а сигнатура (гл. II, § 2, п. 2) равна числу различных действительных корней f(x) ([β], стр. 442). Пример 14. f(x)a*x*—2x* + bx—8. Здесь $о = 3, $! = 2, $* = — б, ss = 2, s4 = 50; b(xo> *и х*) = 3*J -f 4v0*i — 1*2*0** — β*ϊ + 4*i** + 50*1· Ранг квадратичной формы γ0 равен 3, сигнатура равна 1 (способы определения ранга и сигнатуры см. в гл. И, § % пп. 1,2). Следовательно, все три кория многочлена f(x) различны, причем только один из них действительный. *) Коэффициенты s/+ft можно найти, пользуясь их выражениями через коэффициенты многочлена /(*) (§ 5, п. 3).
3] §4. границы корней многочлена 22$ Если нужно определить отдельно число всех положительных или отрицательных, корней f(x), то указанный выше результат можно объединить с теоремой: число различных пар комплексно сопряженных корней многочлена f(x) плюс число различных отрицательных корней этого многочлена равно числу отрицательных квадратов в каноническом виде (стр. 141) квадратичной формы я—I Ъ(х» ...» *п-\)= Σ si+i+k*i*k ([15], стр. 161). Пример 15. /(*) = 2*4 —2** —2*+1. Здесь «о = 4, βι = 0, в8 = 2, $$ = 3, «4 = 0, «»=5, «β = 2, «7 = -2"ί Ъ <*о> *ь Хг, х%) = 4*} + 4*<^8 + 6*о*8 + 2*} + + 6*1*8 + 10*8*8 + 2*|; Ь С*о> *ь **> *а) = 4*8*ι + 6*0*8 + 3*! + 10*1*8 + + 5*1 + 4*8*, + 1*| = *} + *} + *|--*| (канонический вид φι). Ранг квадратичной формы φ0 равен 4, сигнатура равна 2, поэтому /(*) имеет два различных действительных н два различных комплексных корня (сопряженных между собой (§ 3, п. 6». В каноническом виде квадратичной формы φι имеется одни отрицательный квадрат. Так как уже известно, что/(*) имеет одну пару комплексно сопряженных корней, то оба действительных корня /(*) положительны. Замечание. Если ... + (<*n-i + t>n_ti)x + (an + bni) — многочлен с комплексными коэффициентами (ak, bk> k=0f 1, ..., л»—действительные числа), то его можно представить в * виде f(x) = g(x)-\-h (x) i, где g(x) = a^x? -f + αχχΤ-χ + ...-\-an_xx + an и к(х)=Ь^-\-Ь1хР-1-\- ... • · · ~\-bn_\X -\-bn — многочлены с действительными коэффициентами. Действительными, корнями многочлена f(x) являются все действительные корни наибольшего общего делителя многочленов g(x) н h(x) и только они. 3. Границы комплексных корней многочлена· Если /(х) = а9хл + а1хп^+ ... +ап_гх + ап (3.27) — многочлен с действительными или комплексными коэффи·
226 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ β циентами, то все его корни изображаются точками комплексной плоскости ([11], стр. 115), лежащими внутри круга с центром в начале координат радиуса N=1-f-rr-i, где А — наибольшее из чисел |at|, .♦., \αη\. Пример 1. /(л:) = (1+*).** — 3λγ* + *λγ + 2. Здесь A=Sf Ν=\+-γ=**3,\22. A Число N можно заменить числом Map-l-r-A» где ρ — любое положительное число, А% — наибольшее из чисел 9 ' Ρ* ιΛΊ I «И Ι*·Ι 1**1 ΙαΐΙ> Т"> "7«"* »·Μ Ϊλ=Γ ([24], задача 686). Пример 2. /(λγ) = λ^ —/αγ· + (3 —4ι)αγ+16. Здесь N=17. Возьмем д = 2. Тогда получим 'А = 2 (как наи- Λ С 16\ большее из чисел Ь "о"» т> "§")» Μ = 2+ 2 = 4. Все корни f(x) лежат внутри круга с центром в начале координат радиуса 4. Другие формулы для чисел, которыми можно заменить А/, см. в [24], гл. V, § 7. Если все коэффициенты многочлена (3.27) действительны и положительны, то при условии a0^>at}> ... ^>ап *се его корни лежат внутри круга радиуса 1 с центром в начале координат, а прц условии a0<^at<^ ... <^ая все корни лежат вне этого круга. ^Более общий результат: если все коэффициенты многочлена (3.27) строго положительны и если все отношения -^- последующего коэффициента к предыдущему заключены между положительными числами т и Μ (/и<-^-<М, k = lf 2,..., n\f то все корни этого многочлена лежат в кольце, заключенном между окружностями с центром в начале координат соответственно радиусов т и Ж ([11], изд. 4, стр. 295—296). Пример 3. f(x)=\\x* + Sx* + 7x*+5x* + 2x + l- Коэффициенты положительны и убывают, все корни/(х) лежат внутри круга радиуса 1 с центром в начале координат. Пример 4. /(л:) = Зл:4 + Зл:в + 5л:8 + 2лг-{-4.
3] § 4. ГРАНИЦЫ КОРНЕЙ МНОГОЧЛЕНА 227 5 2 * Отношения коэффициентов: 1, -— — 2. Все корни f(x) изображаются точками комплексной плоскости, лежащими между окруж- 2 ностями радиусов τ и*2 с центром в начале координат (или на самих этих окружностях). Об определении числа корней многочлена с действительными коэффициентами, лежащих внутри или вне произвольно заданной окружности, см. [15], § 10 или [29], гл. I, § 8. Если коэффициенты а0, at многочлена (3.27) действительны, причем а0^=И, at^0, то для действительной части Re (а) всякого корня а многочлена (3.27) справедливо неравенство Re (α) <ζ Г2—^»*ле с — лк>бое такое число, что \at\ ^ с, 1 = 2, 3, ..., л ([31], стр. 114—117). Если коэффициенты а0, ах многочлена (3.27) указанным условиям не удовлетворяют, то нужно сделать замену у=х-\~—, дающую многочлен, в котором отсутствует член ел—1-й степенью неизвестного, а затем умножить полученный многочлен на такое число, что в результате получится многочлен Н(у) = Ьцу* -j- Ьцуп~* -\^.,.. ... -f-Ь'п_ху4-Ьп с действительным старшим коэффициентом Ь0^\. Действительная часть Re (β) всякого корня р многочлена ft (у) удовлетворяет неравенствам где ct — любое такое число, что | bt | < cl9 1 = 2, 3, ..., η, а для действительных частей Re (а) корней а многочлена (3.27) справедливы неравенства -ш35Э1-ча)<»«<_ (Ref—)—действительная часть числа —) · Геометрически это означает, что все корни многочлена (3.27) изображаются точками комплексной плоскости, лежащими в полосе, ограниченной прямыми, параллельными мнимой оси и проходящими через точки, изображающие числа, стоящие в левой и правой частях неравенств (3.28).
228 гл. нь алгсбра многочленов. 13 Пример 5. /(лг) = (1-Н)** — 3** + *лг + 2. Замена у-=>х — γτη Дает многочлен Умножаем этот многочлен на τ—р-. и получаем ЛСУ)=У + --^— У Л—5~. Берем __ Тогда 1+1^4^+1 _ 1+^8,4+1 1+3,1 <^ j^ — ζ,υο. Так как *(*).—(ί*)~τ. то для действительных частей корней α многочлена/(дг) получаем: —1,55 < Re (α) < 2,55· Если нужно установить границы мнимых частей корней" многочлена f(x), то можно сделать в этом многочлене замену х = 1у. Если действительные части корней многочлена g(y)=f(iy) заключена между числами с и d, то между теми же числами заключены коэффициенты при мнимых частях у всех корней многочлена /(лг). Пример 6. /(л:) = |л:» —(1 + /)аг5 —/лг8 + (2 —0^ + в. Замена лг = (у дает ^0f) = -^ + (-l+0y+^ + (i+2/»f + 6. Для действительных частей Re (β) корней многочлена g (у) справедливы неравенства _,+/4^+T=_3<Re(p)<3=.i+^^+T.> Следовательно, все корни многочлена f(x) изображаются точками, комплексной плоскости, лежащими в полосе, ограниченной прямыми, параллельными действительной оси' и проходящими через точки, изображающие числа —& и 3/.
4] § 4. ГРАНИЦЫ КОРНЕЙ МНОГОЧЛЕНА 229 4. Число корней в левой и правой полуплоскости· а) Индексы Кош и ([6], гл. XV, §§ 2 и 3). Имеем рациональную функцию где k(x) и h(x)— многочлены с действительными коэффициентами. Индексом Коши функции Ф(х) в пределах от а до Ъ (а,Ь — действительные числа) называется разность между числом разрывов Ф(дг) ([34], стр. 48) с переходом от —со к -j-oo и числом разрывов с переходом от 4"°° к —°°» получающихся при изменении лг от а к Ъ. Индекс обозначается через Ια Φ (х). Если Ф(дг) имеет разрыв при х=а или при х = Ь, то такой разрыв не учитывается. 2х + 1 Пример 1. Ф(х) = - ·(αγ + 2)»(λγ-1)(λγ-4)(λ:-5)» · Если здесь х% возрастая, переходит через точку jc = —2 или л"= 1, то знак Ф(х) меняется с + на —; если χ переходит через точку лг=«4, то знак меняется с — на +; при переходе через точку х=Ь знак Φ (jc) не меняется. Поэтому, например, /!8Ф(*)=1 — — 2 = — 1. Если заставить χ изменяться от б к —3, то получится /ϊ»Φ(λ:) = 2—1 = 1. И определении индекса Коши вместо действительных чисел а и Ъ можно брать ±со. В предыдущем примере /+°°Ф(*)=-1, /~°°Ф(*)=1. — 00 +00 Если известны все действительные корни многочлена h (лг), причем h(x)=(x — atYi ... (x — amYmht(x) (<х„ ...,am — все различные между собой действительные корни h(x)f ht(x) — многочлен без действительных корней), то индекс функции Ф(лг)=-£^-£ проще всего вычислить, представив ее в виде где коэффициенты Af и коэффициенты многочлена q(x)— действительные числа, причем А\*}фО, 1=1, 2,..., т (такое представление функции Φ (χ) всегда возможно); если
230 ГЛ. Ш. АЛГЕБРА МНОГОЧЛЕНОВ [4 обозначить через АУ* те из коэффициентов А(/}> 1 = 1,2,...т, которым соответствуют нечетные показатели 1Ь то будем иметь /+^Ф(*)—SrignAf, (3.30) где sign ^4/^ есть 1 или —1 в зависимости от того, А\^^>0 или А\**<^0. При практическом нахождении а\1) сначала пишут равенство (3.29) с неопределенными коэффициентами, затем приводят все дроби, стоящие в правой части этого равенства, к общему знамейателю и находят а\\ исходя из равенства получившегося при этом числителя правой части (3.29) и числителя Ф(х). Если нужно определить /£ф(л;); то в формуле (3.30) берут только те Aft» которым соответствуют корни ah лежащие между а и Ъ (л<С<**<^)· Пример 2. *<*)-· ^_^(^^ + ^+φ ♦ Представляем Ф(дг) в виде (3.29): Ail) АП) М\) λ(%) ЛИ) ■ А?> q(x) + χ +3~ι~λγ* + 3λγ8 + 5 (многочлен λγ4 + 3jcs -J- 5 действительных корней не имеет). Приводим все дроби к оощему знаменателю, приравниваем числители в левой и правой частях равенства и полагаем сначала х = 0, а затем *=-3. Это дает Л'^-^О, W-(j£f!£}m> ► 0. Следовательно, / ф(*) = 2. Другие способы определения индекса Кощи рациональной дроби Ф(х) см. в [6], гл. XV, §§ 2 и 11. Пусть теперь ./(лг) — многочлен степени η с Действительными коэффициентами. Запишем его в виде , f(x)=a,xn + bifxn-1 + aixn-* + bixn-*+ ... . (3.31) и положим ft(x) = a9xn-aixn^ + a^cn-i— ..., /9 (χ) = Ь^'х — Μ""8 + Ьгх"-* — .. ♦ (3.32)
4] § 4. ГРАНИЦЫ КОРНЕЙ МНОГОЧЛЕНА .231 Тогда если t — число корйей многочлена f{x)f лежащие в правой полуплоскости (т. е. имеющих положительную действительную часть — см. [11], стр. 115), а 5 — число его чисто мнимых корней, то (каждый корень считается столько раз, какова его кратность, см. §1, п. 10). Число чисто мнимых корней многочлена f(x) равно числу действительных корней наибольшего общего делителя многочленов (3.32). Пример 3. f(x) = x* + x* — 2x— 1. Здесь многочлены /ι(χ)ζ=ίχ*—1 и /%(х) = х*-\-2х взаимно просты (§1, п. 6),. так что $ = 0. ^^^t^j*— 1 + 1 = 2 = 4 — 2tf б) Алгоритм Рауса ([6], гл. XV, §§ 3 и 4). Для многочлена (3.31) составляется схема Рауса ло> аь аа> ···» ^о> ^и *в» · · · · ^о> ^t* ^9» · · · t α0, αϊ, d%> ...» в первых двух строчках которой выписываются коэффициенты многочлена (3.31), а каждая следующая строчка получается из двух предыдущих так: из чисел первой из этих строк вычитаются стоящие под ними числа второй строки, умноженные на такое число, чтобы первая разность была равна нулю; эта первая разность отбрасывается, и строка начинается со второй разности. Такое построение схемы возможно, если в ряду &о» 4>> ^о» ··· не встречается числа, равного нулю (так называемый регулярный случай). В этом случае число корней многочлена (3.31), лежащих в правой полуплоскости, равно числу перемен знака*) в первом столбце *) См. сноску на стр. 217.
232 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ [4 построенной схемы (каждый корень считается столько раз, какова его кратность). Чисто мнимых корней многочлен f(x) в регулярном случае не имеет. Π ρ и м е ρ 4. / (χ)=χ* — 5х* + 2х* — χ* + χ + 3. Составляем схему Рауса: 1 — 5 2 — 2 77 ТО 1429 154 3 В первом столбце этой схемы четыре перемены знака, т. е. f(x) имеет четыре корня с положительной действительной частью. Остальные два корня многочлена f(x) имеют отрицательную действительную часть. Если при построении схемы Рауса для многочлена (3.31) в ряду £0> 4» d0t ... встречается число А<> = 0, причем и вся строка, содержащая ft0, оказывается состоящей из нулей, то нужно эту строку заменить строкой чисел (п — /п-{-1)£0, (η — т — l)et9 (п — т — Ъ)ег, ... , где е09 еи е* ... — элементы предыдущей строки, а т — число уже построенных строк схемы, и продолжать построение схемы Рауса дальше. Если это построение дойдет до конца (быть может, с еще несколькими заменами получающихся нулевых строк соответствующими числами), то опять число перемен знака в первом столбце получившейся схемы будет равно числу корней многочлена (3.31), лежащих в правой полуплоскости. Число чисто мнимых корней этого многочлена (подсчитываемых каждый столько раз, какова егр кратность) в данном случае равно η — т -\-1 — 2/, где т — число строк, получившихся до появления первой нулевой строки, а /—число перемен знака в первом столбце построенной схемы, начиная с т-ю места. 2-13 О 1 "5 · 17 2 3
§ 4. ГРАНИЦЫ КОРНЕЙ МНОГОЧЛЕНА 233 Пример 5./(лг)=л:8— лг7 + 2л^— х* + х* — 2** + лг—1. Составляем схему Рауса: -1 (заменили строку из нулей соответствующими числами) 1 — 1 1 6 1 3 16 — 1 — 2 — 1 . 2 — 1 1 4 2 3 16 -1 0 1 — 1 — 2 -1 — 2 1 -1 (опять замена нулевой строки) В первом столбце схемы три перемены знака, т. е. три кория многочлена f(x) лежат в правой полуплоскости. Число чисто мнимых корней/(а:): $=8— 3+1— 2· 1=4. Примерб. /(а:) = За:» + а:* + 6а:» + 2а;* + Заг + 1. Составляем схему Рауса: 3 6 3 12 1 ' 4 4 (замена нулевой строки) 1 1 2 (опять замена нулевой строки) 1 В первом столбце схемы перемен знака нет, ·/. e. f(x) не имеет корней в правой полуплоскости. Число чисто мнимых корней з = «5 — 2+1— 2.0 = 4. Если получилось Аф=0, но в строке, где стоит й0> имеются и числа, отличные от нуля, то нужно разделить многочлен (3.31) на наибольший общий делитель D(x) многочленов /?,(ΛΓ)=α0Λ^+- ахх*-*-\- α2χη"1^... и F^(x) = = Μ^Ι + ΜΛ~8 + ΜΛ~5 + ... (§ 1, п. 5). Если f(x)=D(x)f*(x)f (3.33) то число "корней f(x)> лежащих в правой полуплоскости, равно fι -f- tb где tt (соответственно ig) — число корней многочлена D(x) (соответственно /*(х))> лежащих в правой полуплоскости. При этом ij=r!^, где q — степень D(x)f $ — число действительных корней многочлена D(ly) (способ
234 ГЛ. 111. АЛГЕБРА МНОГОЧЛЕНОВ [4 нахождения 5 см. в п. 2), a t% определяется с помощью алгоритма Рауса, примененного к многочлену /* (х). Если при построении схемы Рауса для /* (дг) в первом столбце получится число 60 = 0, причем в строке, где оно получилось, будут стоять и числа, отличные от нуля, то нужно будет заменить й0 малой величиной β определенного (но произвольного) знака и продолжать построение схемы. Знаки получающихся дальше элементов будут определяться, исходя из малости и знака е. Если какой-то из. элементов первого столбца схемы окажется тождественным нулем относительно е, то его нужно будет заменить другой малой величиной η и продолжать вычисления. Число перемен знака в первом столбце построенной схемы будет равняться I*. Число чисто мнимых корней многочлена /(дг) в рассматриваемом случае равно & Пример 7./(лг)==Агв —αγ4 + 3λγ· —α:2 + 3λ:+1. Здесь #о = 0. Наибольшим общим делителем многочленов /?1(лЛ=лгв^-л:4 —а:2+1 иF*(x) = Sx* + Заявляется D(x) = x*+\t f(x) = D(x)f*(x\ где /*(л:)=л:«-2л:* + Зл:+1. ? = 2, 5 = 2, г1==0. Применяем алгоритм Рауса к многочлену /*(*) (причем вводим малый параметр е): 1 —2 1 е 3 -2 -i 1 е ι При любом достаточно малом по абсолютной величине значении е в первом столбце этой схемы две перемены знака, t% = 2. Многочлен f(x) имеет два корня в правой полуплоскости и два чисто мнимых корня. в) Теорема Рауса —Гурвица ([6], гл. XV, §§ 6, 8 и 12). Для многочлена (3.31) составляется матрица Гурвица /*о Ьх Ьг ... *Л_Д /а0 ах аг ... ал_И Н=\ ° b* bl ### *л~* [О До <*ι ··· Дл-*| 10 0 Ь0 ... Ьп^\
4] § 4. ГРАНИЦЫ КОРНЕЙ МНОГОЧЛЕНА Й35 (квадратная матрица η-го порядка (см. Введение), в которой те элементы ah bh которые в многочлене (3.31) отсутствуют, равны нулю). Миноры этой матрицы порядков 1, 2,..., η (стр. 44), стоящие в левом верхнем углу, называются определителями Гурвица и обозначаются через Δ„ Δ»..., Δ». (3.34) Если все эти миноры отличны от нуля, то число t корней многочлена (3.31), лежащих в правой полуплоскости, равно числу перемен знака в ряду -**%.% £-. (3.35) Чисто мнимых корней многочлен (3.31) в этом случае не имеет. Пример S. f(x) = 3x* + х* + 4х* + 2х* + 6х + 2. Составляем матрицу Гурвица: Я = /1 2 2 0 0\ 3 4 6 0 0 0 12 2 0 0 3 4 6 0 \0 0 1 2 2i α0 = 3, Δ,=Τ, ΔΒ = —2, Δ$ = — 4, Δ,*= — 8, Δ5 =—16. В ряду 3, 1, ΞΙ-= — 2, ^2 = 2, ^4 = 2, ^у =2 две перемены знака, f{x) имеет 2 корня в правой полуплоскости. Если некоторые из миноров (3.34) равны нулю, но ΔΛ φ 0, то необходимо ΔΛ-Ι φ 0, и если Δ, Ψ 0, Δ,+1 =.. .=Δ,+ρ = 0, Δ,+ρ+1 φ 0, (3.36) то Δ,.ι^Ο (если $>1), Δ,_ι?έ0 и /> — число нечетное. Число t корней многочлена (3.31), лежащих в правой полуплоскости, равно числу перемен знака в ряду (3.35), причем только нужно считать, что при условии (3.36) между числами т-*- Ч а**1*** ищется £-i (— 1)2 * перемен знака (8 есть 1 или — 1 в зависимости от того, имеют ли -г-*- и -£±£±*
236 ГЛ. Ш. АЛГЕБРА МНОГОЧЛЕНОВ [4 одинаковые или противоположные знаки); при $=\ £-*- заменяется на Δ^. если Δ1 = ...=Δρ = 0, Δρ+ίφΟ, то по тому же правилу определяется число перемен знака между числами а0 и τ^- (здесь опять необходимо Δ^ φ Ο и ρ — число нечетное). При ΔΛ φ О чисто мнимых корней многочлен (3.31) не имеет*. Пример 9. /(*) = *»+л:+ 2. Здесь Δ.= 0 2 0 1 1 0 0 0 2 = -4, Δ8 = -2, Δι = 0, а0 = 1; ρ = 1. Число перемен знака между а0 и ^: t = * — — (— 1) γ = 2, f(x) имеет два корня в правой полуплоскости. Если ΔΛ = 0, то нужно представить многочлен (3.31) в виде (3.33) и для определения числа 19 корней многочлена /*(дг), лежащих в правой полуплоскости, составить определители Гурвица для этого многочлена (тот из них, порядок которого равен степени /*(дг), необходимо отличен от нуля). Теоремой Рауса—Гурвица удобно пользоваться, когда коэффициенты многочлена зависят от параметров и требуется определить, при каких значениях параметров число t корней многочлена, лежащих в правой полуплоскости, будет иметь то или иное значение. Некоторые дополнения к теореме Рауса—Гурвица и другие способы определения числа корней многочлена, лежащих в левой или правой полуплоскости, см. в [6], гл. XV и [29], гл. I (особенно §§ 8 и 9). г) Случай комплексных коэффициентов ([6], гл. XV, § 18). Если f(x) — многочлен с комплексными коэффициентами, то для определения числа корней/(лг), лежащих в правой полуплоскости, нужно сначала сделать замену х = =1у. В результате получится многочлен где сki dk (A=0, 1, ..♦ , ή)—действительные числа. Если
4* § 4. ГРАНИЦЫ КОРНЕЙ МНОГОЧЛЕНА 237 аьФО, то нужно затем составить квадратную матрицу порядка 2л: jd0 dt ... dn О ...0\ О "...01 Л== с0 ct ... сп О d0 ... dn-i dn "-ΟΙ 0 Cq ... сд«1 cn ...01 (если </0 = 0> то вместо f(ly) нужно взять многочлен 1/(1у) и для него составить соответствующую матрицу). Миноры этой матрицы (стр. 44) четных порядков, стоящие в левом верхнем углу, обозначим через v«» V4» · · · » V9n· Если щп φ О, то число t корней многочлена /(лг), лежащих в правой полуплоскости, равно числу перемен знака в ряду 1, Vs, V4,··., VS/t, причем если в этом ряду имеются нули, то для каждой группы подряд идущих нулей (ν*Λ Φ °)> ν*Λ+* =...=ν*Λ+*ρ = °» (Vaa+*p+« Φ °) P + l нужно считать, что между у«л и ν*Λ+*ρ+* имеется HJ-" ПРИ /> нечетном и ^ 2~ ПРИ /* четном перемен знака (δ равно Гили —1 в зависимости от того, одинаковые или противоположные знаки имеют числа (—ΙΫ и У»*+»р+») Чисто мнимых корней многочлен /(л;) при ν«Λ ^ 0 не имеет. Пример 10. f(x)я»/л:· — л:8 + (5— 11/)л: — (4 + 20/). Здесь //(/y) = /y + /y + (-5+ll/)jf-(-20 + 4/) = = ~5jf + 20 + /(y+y+11^-4), /1 1 11 —4 0 0\ 0 0 —5 20 О О 0 1 1 И —4 О О 0 . О -5 20 О 00 1 1 11 —4 \θΟ Ο 0-5 2θ/ ' Выписываем ряд: 1, ν* = 0, V4= — 25, νβ = τ-15000. р = 1; счи- таем/ что между 1 и V4 имеем одну перемену знака. Дальше перемен знака нет, * = 1. Л =
238 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ 15 Если V2n = 0> то можно найти наибольший общий делитель D(y) (§ 1, п. 5) многочленов Ft(y) = c9yn-\-ciyl-1-\-.<. ... + сп и F%(£=d^+di)f-t+...-\-dn и разделить )(х) на многочлен D (— *лг). В частном получится многочлен f(x) степени к, для которого щк Φ 0. Число t корней /(лг), лежащих в правой полуплоскости, равно сумме числа Tt корней f(x)y лежащих в правой полуплоскости (это число находится указанным выше способом), и числа ^ корней D (—Ьг), лежащих в правой полуплоскости (оно равно ^-^, где q— степень, 5 — число действительных корней (§ 4, п. 2) многочлена D(y). Число чисто мнимых корней f(x) в данном случае равно $. Пример П. /(*) = **+ (— 1+2/)а:4 + (— 1— i)x* + ix* + + (—2—o^+(i—О- Здесь /«У) = <У* + (-1+2/)У + (-1+0^-/У+(1-2/)^+(1-/)= Наибольшим общим делителем многочленов ч Л(у) = -У-У+^ + 1 иЛ^)=^ + 2У+У-У-2^-1 является П(^)=У+^»— .у — 1. D(— /аг) = аг4 + ^8 + ^— 1; 7(дг)=лг—1 + /; τ; = ι, f=2, ζ=1^3=ι. /(дг) имеет два корня в правой полуплоскости и два чисто мнимых корня. б. Критерии устойчивости. В ряде прикладных областей, где исследуется устойчивость механических и электрических систем, приходится иметь дело с условиями, при которых все корни многочлена лежат в левой полуплоскости, т. е. имеют отрицательную действительную часть ([11], стр. 115). Многочлен с этим свойством называется многочленом Гурвица. ■ Если f(x) — многочлен Гурвица, имеющий действительные коэффициенты, то все его коэффициенты необходимо положительны ([11], изд. 4, стр. 318). Критерий Рауса ([6], стр. 425). Чтобы все корни многочлена f(x) с действительными коэффициентам» лежали
Ц § 4. ГРАНИЦЫ КОРНЕЙ МНОГОЧЛЕНА 239 в левой полуплоскости, необходимо и достаточно, чтобы все элементы первого столбца схемы Рауса (п. 4, б)) получались отличными от нуля и одного знака. Пример 1. f(x) = x* + x* + 3x + 2. Составляем схему Рауса: 1 3 1 2 .1 2 Все элементы первого столбца схемы положительны,/(*)— многочлен Гурвица. Пример 2. /(λγ) = 3λ* + λ^ + 6*» + 2λγ2 + 3λ:4·1 (п. 4, б)). Этот многочлен не есть многочлен Гурвица, что видно уже из того, что при составлении для него схемы Рауса в первом ее столбце появляется нуль (строка из нулей). Критерий Гурвица. ([6], стр. 436; [11], изд. 4, стр. 316). Чтобы все корни многочлена f(x) с действительными коэффициентами и положительным старшим коэффициентом лежали в левой полуплоскости, необходимо и достаточно, чтобы все определители Гурвица (п. 4, в)), составленные для этого многочлена, были положительны. Если старший коэффициент f(x) отрицателен, то нужно рассмотреть многочлен—/(#), корни которого совпадают с корнями f(x). Пример 3. f(x)=zx* + 2x* + 9x* + x + 4* Составляем матрицу Гурвица (п. 4, в)): (2 1 0 0\ 1940] 0210 ΙΟ 1 9 4/ AlS=2>0, Δ8 = 17>0, Δ$=1>0, Δ4 = 4>0; f(x) — многочлен Гурвица. Критерий Льенара и Шипара ([6], стр. 457). Необходимые и достаточные условия для того, чтобы все корни многочлена f(x) = а^хп -}- а^"1 +... -}- ап_хх-\- ап с действительными коэффициентами и а0^>0 лежали в левой полуплоскости, могут быть записаны в любом из следующих
//= 240 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ четыре^ видов: 1) αΛ>0, αΛ.9>0,...; Δ,>0, Δ8>0,...; 2) αΛ>0, αΛ_9>0,...; Δ9>0, Δ4>0,...; 3) λλ>0, алЛ>0, αΛ_8>0,...; Δ,>0, Δ8>0,...; 4) αΛ>0, αΛ_,>0, αΛ_8>0,...; Δ9>0, Δ4>0,... (Δι, Δ* Δ8,...— определители Гурвица (п. 4, в)). Пример 4./(л:)=л* + л:* + Зл:4 + л* + 5л:*+2х+1.· Здесь все коэффициенты положительны. Составляем матрицу Гурвица: /1 1 2000\ 13 5 10 01 0 112 0 0 0 13 5 10 Ιθ 0 1 12 0/ \0 0 1 3 5 1/ At = 1 > 0, но Δ$ = — 1 <?0, т. е. не все* корни данного многочлена имеют отрицательную действительную часть. Другие критерии устойчивости см. в [6], гл. XV, §§ 5, 14 и 15, [15] и [29]. 6· Область устойчивости. Каждому многочлену n-й степени с действительными коэффициентами можно поставить в соответствие точку n-мерного пространства, координаты которой равны частным от деления на старший коэффициент всех остальных коэффициентов многочлена. В таком «пространстве коэффициентов» многочлены Гурвица образуют некоторую л-мерную область, которая называется областью устойчивости. Если коэффициенты многочлена заданы как функции ρ параметров, то область устойчивости строится в пространстве этих параметров. Об исследовании области устойчивости (существенном, например, при проектировании новых систем регулирования) см. [6], гл. XV, §§ 15 и 17. § б. Многочлены от нескольких переменных 1· Определения. Многочленом f(xt9 χ* ... ^сп) от η переменных Χι,Хъ,...,Хпнад числовым полем К (см. введение)на- / зывается сумма конечного числа членов вида х^ х%*... лг**, где кц kb..., *Л—целые неотрицательные числа» с коэффициентами.
Μ § 5. многочлвнр от нескольких переменных 241 из поля К\ при этом предполагается, что многочлен подобных членов не содержит, и члены с коэффициентами, равными нулю, не рассматриваются. Два многочлена fx(χί9 χ*,...,χη) и Л (хь -**···» хп) называются равными, если равны их коэффициенты, при одинаковых членах. . Сумма Αΐν+Α9+··· + *Λ называется^ степенью члена лф j*rf·... χ** многочлена f(xu χ*...,χη); наибольшая из этих сумм называется степенью многочлена f(xh хь .,.; хп) по совокупности переменных. Многочлены нулевой степени— это отличные от нуля числа из К* Число нуль также считается многочленом; это единственный многочлен от η переменных, степень которого не определена. Если все члены многочлена f(xtf лг9, ·. .· хп) имеют по совокупности переменных одну и ту же степень st то такой многочлен называется однородным многочленом или формой $-й степени от η переменных (примеры: линейные формы, квадратичные формы— см. гл. II, § 2, п. 1). Степенью многочлена f(xh χ*·..>χη) по отношению к одному из переменных xt (/== 1, 2,..., η) называется наивысший показатель, с котррым xt входит в члены этого многочлена (эта степень может быть и нулевой). Из двух членов х\*х\*... х** и χϊιχΛ*... χ]* многочлена f(x\t χ*...» х^ тот считается выше, у которого показатель при xt больше, а если эти показатели равны, то тот, у которого показатель при х% больше, и т. д. (т. е. первый член выше второго, если первая -из разностей k) — lt (i=l, 2,... ..., л), отличная от нуля, положительна). Если все члены многочлена f(xu хг,..., χ J расположены, в таком порядке, что каждый следующий член ниже предыдущего, то говорят, что члены этого многочлена расположены лексикографически. Тот член, который при этом стоит на первом месте, называется высшим членом многочлена. Пример. f(xu х*, х%) = Ах* — 2х\х* — Ъххх\х\ «+- х\хь + х\ — лексикографическая запись многочлена, х\х% — высший член. Суммой многочленов ft (χί9 лс9,..., хп) и /9 (xtf дг^,..., хп) •называется многочлен, коэффициенты .которого получаются сложением соответствующих коэффициентов ft и /9; если при этом какой-то член входит лишь в один из многочленов /|, Д,,то. он считается входящим и в другой многочлен
242 ГЛ. III. АЛГВБРА МНОГОЧЛЕНОВ [2 с коэффициентом, равным нулю. Произведением многочленов А (х\> Хъ .··»хп) и Λ(χυ ■*·»···»хп) называется многочлен, полученный почленным умножением ft на /2 с последующим приведением подобных членов. Степень (по совокупности переменных) произведения двух отличных от нуля многочленов от η переменных равна сумме степеней этих многочленов, высший член произведения равен произведению высших членов сомножителей. 2. Симметрические многочлены. Многочлен f(xu хь... уХп) от η переменных называется симметрическим, если он не меняется ни при какой перестановке этих переменных. Чтобы проверить, является ли данный многочлен симметрическим, достаточно проверить, меняется ли он при перестановках любых двух из входящих в него переменных между собой. Пример 1. Многочлен f(xu x%f дг$) в х\х%хь + xtx\xb + х\ не является симметрическим, так как, если заменить в .нем везде Χι на Хьу а х9 иа хи получится многочлен •фт**! + хьх\хх + х\ Ф/(хи х*, *»)· Пример 2. f(xu x%, x*)=xi + xl + xi— 2χχχ% — 2λγια:$— — 2х*х* + 10 — симметрический многочлен от переменных хих2,хь. Симметрические многочлены от η переменных ct=xt -f- дг2 -|-... -|- хт 09 = Х\Хц -f- ΛΓιΑΓ8 -f-... -|- Хп-\Хт Ог = ΧχΧ*Χζ -|- ΧχΧ&ι -f-... -f- Xn-*Xn-\Xn, On_\ = ΧχΧ* . ·ΛΓ„_ι -f- ΛΓιΛΓ*. ЛСп_%Хп -)-... + ЛГ^з·. JtT^ cn = xtx%..jcn называются элементарными (или основными) симметрическими многочленами. Если g (χ) = а^х? -+- Λι**-1 +... ... + αΛ_ιΑΓ + ΛΛ — многочлен с коэффициентами из поля К от одного переменного (§ 1, п. 1), то значения элементарных, симметрических многочленов от η переменных при значениях переменных, равных корням многочлена g(x)t равны соответственно -&, g- (_lj»fli. (ср. § 1, п. 11). Симметрический многочлен от переменных хи дг9,..., хп, все члены которого могут быть получены из одного из них путем перестановок переменных хи **... }χη, называется моногенным
2] § 5. МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 243 многочленом ([23], стр. 214). Если αχ\*χ\*... х%*—высший член моногенного многочлена, то этот многочлен обозначается через S{axk^xk^... л;**). Пример 3. Моногенный многочлен от трех переменных S (х\х%) = Х\Х% + х\Хь + х\Х\ + *J*t + *J*i + *|*s· Пример 4. f(xu xit хь) =*f + x\ + x\ — 2λγι*2 — 2*i*t— - 2λγ2*$ + 10=S (*}) + S (- 2**,) + 10. Основная теорема о симметрических многочленах. Всякий симметрический многочлен от переменных хь хь..., хп можно представить в виде многочлена от элементарных симметрических многочленов (с коэффициентами из того же поля, в котором лежали коэффициенты симметрического многочлена); это представление единственно. Пример 5. /(*ь x*)~xl + xl— лг^-т-З = cf} — Зс8 + 3. Чтобы найти выражение данного симметрического многочлена через элементарные, нужно сначала разбить этот многочлен на однородные части (п. 1), собирая вместе все члены многочлена, имеющие одну и ту же степень по совокупности переменных, и затем выражать через элементарные симметрические многочлены каждую однородную часть отдельно. Чтобы выразить через элементарные симметрические многочлены однородный симметрический многочлен f(xlf дг2>..., хп)у нужно взять его высший член а^х^х**... Хпп (п. 1), выписать набор показателей в нем ku k%t..., kn и составить всевозможные наборы чисел вида 1Ь /9,...» /Л со свойствами: 1) сумма чисел /ι + /« + ... + /Λ в каждом наборе одна и та же и равна kt -|-*9 + · ·· + *»; 2) числа каждого набора идут, не возрастая, т. е. Ιχ^1%^...^/Λ; 3) член лг*иф... xfn не выше члена дг^дг**.. .дг*». После этого для каждого набора ltf /9,...,/Л нужно составить произведение cJi-J» ojt-fc ... c^f^no^n и многочлен f(xu хь ..., хп) приравнять сумме построенных так произведений, взятых с неопределенными коэффициентами *). Если найти эти коэффициенты, придавая различными способами численные значения переменным хь дг9,...,хп в обеих частях равенства, то *) Коэффициент при произведении о/ '...«„J^1 п°пп берется сразу равным а0.
244 Щ Ш· АЛГЕБРА МНОГОЧЛЕНОВ g получится выражение f(xit .**,...,,*„) через элементарные симметрические многочлены. Пример 6. /(*it χ* хь)=—х\х% —х\х\—х\х*—х\х% — — ΧΪΧ, — Х*Х\ + Х\Х*ХЬ + XtXpC* + XtXiXl Здесь/(хи Χί,χ*)— уже однородный симметрический многочлен, его высший член—х\х%. Составляем наборы показателей: 3 10 220 2 1 1 Полагаем f(xu #2, *$)=—o\a2 + aol + bota9. При xt = 1, хг = = —1, лг2=*0 имеем: /(*ь *2, *$) = 2, σι=0, σ2=— 1, σ$=0, откуда 2=λ· При » Xis=sATa=sx$=sl имеем: /(jcb x* *«)=*.—3, 0|==3, σ2 = 3, *$=!, откуда — 3s= —27+18 + 3£, b=2. f {Xu X* Хь) — — <4«2 + 2σ| + 2σ!σ$. Π ρ и μ е ρ 7. /(*,, *2, ..., *„)=S (λγ|λγ») + 2χ\ + 2χ| + ... + 2**. Разбиваем f(xuxit ..., *„) на однородные части ft (xt1лг2,..., **)=* = S(дс!агв) и /.(*!, ^2,...,^/t)=s2Ari + 2x| + ... + 2x*=S(2^}). Чтобы выразить Λ через элементарные' симметрические многочлены, выписываем наборы показателей 2 1 0 0 ... 0 1 1 1 0 ... 0 Это дает ft (xu xtt ·.., хп) = qX9% + ασ$. Полагая xt = лг2»лг$« 1, л;4 = ,..=*„=О, находим: 6=3·3+α·Ι, α=—3, /ι (**, jc2,...,*λ)= = σισ2 — 3σ$· Аналогично находим, что/2(*1, *2» •••»*л) = 2а|—4σ2. Таким образом, /(хь x%f ...,хп) = <tto% — 3σ$ +2*f — 4σ2· Пользуясь основной теоремой о симметрических много· членах, можно найти значение любого симметрического многочлена от η переменных при значениях входящих в него переменных, равных корням многочлена g(x) n-й степени от одного переменного» не зная самих этих корней. Пример 8. Найти сумму кубов корней аи α*, αβ, α4 многочлена g (χ)=7α:4 — 1 Αχ* — 1χ + 2. Берем симметрический многочлен f(xu *2, *·, *4)=s*j + N + χ1 + x\ + x\ и выражаем его через элементарные симметрические «· многочлены:/^, лг2, jc$, at4)=soJ — 3σισ2 + 3σ$. При значениях переменных л*1 = аь л*2 = а2, *» = «», λ*4 = «4 имеем: otrs2, σ3 = 0, σ.= 1 (см. начало этого пункта). Отсюда f(au ..., α4)=:α! + α} + -1-α· + α}=τ8 —0 + 3=11. 4 Пример 9. Найти дискриминант (§ 1, п. 12) многочлена* £(*) = *» — 1х—6., Берем симметрический многочлен
%] § 5. МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 245 Его высший член находим как произведение высших члейов сомножителей, произведению которых равен f(x%% *2, х$) (п. 1); получаем х\х\. Составляем наборы показателей: 420 4 1 1 330 3 2 1 222 и получаем: f(xu x%t ΛΓ$)==σ}σ| + ασ}σ$ + &*ι + <*ι«2«»+ <**!· Придавая переменным значения хх=х%*=\, дг8 = 0, затем jci = x2== = 1, лг$=—2, затем λγ1 = λγ8=:2, λγ$=—1, затем j?tss;ttss.Ysss 1, последовательно находим: &=—4, rf = — 27, a=s—4, с =18. При значениях переменных, равных корням аи а,, а* многочлена g(x), получаем /К а8| a$)==D(g)==0 + 0 + (--4)(--343> + 0 + + (—27)· 36 =s 400. 3. Выражение степенных сумм через элементарные симметрические многочлены· Степенными суммами называются симметрические многочлены $*=.*?+*£+...+** (&=1, 2,...)· С элементарными симметрическими многочленами (см. предыдущий пункт) они связаны формулами Ньютона (*<я), ** — s*-i«i+ **-««* — ··· + (— iyV*«*=0 (при /Г>я). Из этих формул можно последовательно находить выражения su $ь $з,... через а„ <з%,...,ап (или наоборот). Пример!. Пусть η ^ 3. Тогда Si = *i; s8 —$ι*ι+2σ» = 0, откуда Ss=e} — 2σ2; $9 — S2*i + Si*2— 3a* = 0, откуда s$ = *} — —Sa^t + 3<j$. Общие формулы, выражающие sk(k=lt 2, 3, ...) через *!·«*..·. «* ([23], стр. 211): 5Λ=λ V (—ΐ)2λι+3λι+···+(Λ+,)λΛ <*1+---+*«-1)*^.. j* ^J λι! ...λ„( ^ - где суммирование распространяется на все наборы неотрицательных целых чисел λ|, λ*..., λΛ со Свойством Xt -f- 2λ2 -|- + ·" + /*** ==&<йе/юая формула Варинга).
246 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ [4 Пример 2. Найти s4- При к = 4 нужно взять наборы: 1) Xt=s4, Х8 = ...=гХя=*0; 2) λ.^2, λ8 = |, λ8 = ... = λΛ = 0; 3) λ1=λ,= 1, λ,=λ4 = ...= = λΛ=:0; 4) λ, =2, λ,=λ$=:...=:λΛ=τΟ; 5) λ,=:λ*=:λ,=:0, λ4= 1, λ,-...-λ,-O. Это дает з4 = 4 [<-1)·*^ + <- 1)74тГ + + 2α| — 4^4. Обратно, элементарные симметрические многочлены от η переменных выражаются через степенные суммы по формул лам ([23], стр. 213) —2 .ТС** »■■·* ^ 1λι24./*λ1!...λΛ! где суммирование распространяется на те же наборы чисел λ, что и в первой формуле Варинга (вторая формула Барита). Пример 3. at-Lp^r<i + lb2:nl! M2+4nrg' = 1 t 1 .1 = TSl TSl5s+3"s·· 4. Системы алгебраических уравнений с несколькими неизвестными. Имеем систему уравнений /ι С^ь *ъ · · ·> -^/ι) = О, ) fs(Xb ХЬ · · ·> ·**) О, (3.37) где левые части всех уравнений — многочлены от η переменных хи х*..., хп с некоторыми числовыми коэффициентами. Говорят, что эта система уравнений имеет решение, если существуют значения переменных xt = аи jc*= a*..., хп = <хд, при подстановке которых во все уравнения системы эти уравнения обращаются в тождества. Частным случаем системы уравнений (3.37) является система линейных уравнений от η неизвестных; способы решения такой системы см. в гл. I, § 2. Другой частный случай — система двух уравнений произвольной степени от двух неизвестных g(xyy)=0.j (338>
4] § 5. МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 247 Для решения системы (3.38) нужно в каждом из много· членов f(xf y)f g(xf у) отнести одно из переменных, например у, к коэффициентам, т. е. записать эти многочлены в виде f(xfy)=a,(y)xn^ai(y)xn-i+...+an.t(y)x^an(y)f g(x,y) = b*(y)x$ + bi(y)xs-*+... + bs_t(y)x+bs(y). Затем, рассматривая /, g как многочлены только от, переменного х, нужно составить результант /?(/, g) этих многочленов (§ 1, п. 12) и найти его корни (/?(/, g) — многочлен от переменного у). После этого для каждого корня β0 многочлена R(f, g) нужно найти все общие корни многочленов f(xf fa) = a^%)xn + a1(%)xn-* + ... ... + *Λ-ι(βο)* + Μβολ £(*,βο) = Μβο)^ + Μβο) **-' + ... (3.39) Если такими общими корнями являются числа γ^» Το2)»···»ϊοΛ)> то пары чисел , (γ*1), β0), (γ<2>, β0),.. ·» (№> βο) служат решениями системы (3.38). Никаких решений, кроме получающихся описанным способом, система (3.38) не имеет. Если для корня β0 результанта /?(/, g) ot(0t)?£O или К (βο) ^ 0, то многочлены (3.39) заведомо имеют хотя бы один общий корень, если же α0(β0)=Ο и £0(β0) = 0, то многочлены (339) общих корней могут и не иметь; в последнем случае корню β0 результанта никакое решение системы (3.38) не соответствует. Пример 1. Решить систему х*У + х* + 2ху+у* = 0, л:* — блг—3у2 = 0. { Относим переменное у к коэффициентам и составляем результант многочленов f(xt у) = (у + \) х*-\-.2yx + у* и g(xty)=x* — — блг—Зу*: Шё) = У+1 0 1 0 2у .У+1 — 6 1 У 2у — 3jf» —6 0 У* 0 —гу =У<4у + 3)».
248 ГЛ. III. АЛГЕБРА МНОГОЧЛЕНОВ [4 о Корни результанта: βι= Ο, β2 =—~. Рассматриваем многочлены f(xf 0)=лг* и £(λγ, Q)=x* — 6x; их общий коренья γι=0. Рас- ·/ з \ ι β з 27 сматриваем теперь многочлены /ί xt — -—· 1 =ja:8 — -^ λ: — -^ СЗ \ 27 3 л:,—-у! =л:2—бл:—-|g-; их общие корни: 7^=3+3- УТ§> 3 - γ£*> = 3 — -J· у 19. Решения данной системы уравнений: 1) х=0, у=0; 2) λ: = 3+-|/Ϊ9Γ,^=-|;3) x = 3-j}fW> Д*=-|. Пример 2. Решить систему Г х*у*+ху*+х + у=09 \ х%у + ху +1 =0. Здесь удобнее отнести к коэффициентам переменное х. Получаем многочлены f(xty)=(x*+x)yM+y+xfg(xty)~(x*+x)yJir\ и составляем их результант: I х* + х 1 * I Л(Л«) —U* + * 1 "О -(*+!)»Л I 0 лг*+лг 1 I Корни результанта: γ, =0, γβ=3=—1. При этих знамениях переменного χ старшие коэффициенты многочленов f(xfy) и g(xty) обращаются в нуль» причем получающиеся многочлены общих корней не имеют (g(0/y)~g(— 1, /)= 1)· Следовательно, заданная систем* уравнений не имеет решений. Еше о решении систем алгебраических уравнений с не· сколькими неизвестными см. [13], гл. III, § 5.
ГЛАВА IV ОБЩАЯ АЛГЕБРА § 1· Группы 1. Определение группы, примеры· Пусть О — какое-то множество ([34], стр. 23—24) элементов (например, множество чисел, или функций, или каких-нибудь объектов геометрической природы и т. д.)· Говорят, что в множестве О определена алгебраическая операция, если каждым двум элементам а, Ъ из О, взятым в определенном порядке, однозначным образом поставлен в соответствие некоторый третий элемент с из О. Примеры алгебраических операций: сложение целых чисел (каждым двум целым числам ставится в соответствие их сумма), их вычитание; сложение векторов на плоскости; сложение или умножение квадратных матриц л-ro порядка (гл. II, § 1, п. 1); векторное умножение векторов трехмерного пространства. Алгебраическая операция, определенная в множестве О, бб.ычно называется или умножением, или сложением. В пер^ вом случае, если элементам а, Ь^О поставлен в соответствие элемент c£G, пишут c=ab, во втором случае пишут с=а-\-Ь. Множество О с определенной в нем алгебраической операцией (пусть она сейчас называется умножением) является группой, если выполнены следующие условия: 1) для любых трех элементов а, Ъ, c£Q a(bc)=(ab)c (ассоциативность умножения);
250 ГЛ. IV. ОБЩАЯ АЛГЕБРА [1 2) в множестве О существует такой элемент е, что для любого αξΟ ае=еа=а; 3) для любого a£Q существует такое d£ О, что аа'=а'а = е. Элемент е называется единицей группы, элемент d называется элементом, обратным а, и обозначается обычно через а~К Если операция, определенная в группе, называется сложением, то вместо единицы группы говорят о нуле группы (это элемент, обозначаемый символом 0 и обладающий свойством α + 0 = 0 + α=α для любого αξΟ), а вместо элемента а"1, обратного элементу а, говорят об элементе —а, противоположном а (а + (—а)=0). Примерами групп являются: 1) множество всех целых чисел относительно операции сложения (так называемая аддитивная группа всех целых чисел); 2) множество всех четных чисел относительно операции сложения (аддитивная группа всех четных чисел); 3) множество всех отличных от нуля рациональных чисел относительно операции умножения (мультипликативная группа отличных от нуля рациональных чисел); 4) множество всех векторов на плоскости относительно обычного сложения векторов; 5) множество всех невырожденных квадратных матриц /2-го порядка с действительными элементами относительно операции умножения матриц (гл. II, § 1, п. 1). „ Целые числа относительно операции умножения группы не образуют, так как для целого числа, отличного от ± 1, не существует обратного ему целого числа. По той же причине не образуют группы относительно умножения все квадратные матрицы /г-го порядка. Не является группой и множество всех векторов трехмерного пространства относительно векторного умножения векторов, так как эта операция не ассоциативна. Второе определение группы (равносильное приведенному выше). Множество О с определенной в нем алгебраической операцией называется группой, если:
1] § 1. группы 251 1) эта операция ассоциативна, 2) для любых двух элементов a, b£Q существует ровно один такой элемент χ ζ О, что ах=Ь, и ровно один такой элемент у ζ О, что уа = Ь. Если операция, определенная в группе, коммутативна (т. е. для любых элементов а, Ь группы ab = ba), то сама группа называется коммутативной или абелевой. Группы приведенных выше примеров 1, 2, 3, 4 абелевы, группа примера 5 не абелева. Еще пример не абелевой группы — множество всех вращений трехмерного пространства вокруг начала координат, где произведением двух вращений называется их последовательное выполнение. Если группа О состоит из конечного числа элементов, то она называется конечной группой, а число элементов в ней называется пррядком группы. Пример 1. Произведением двух подстановок /t-й степени (гл. I, § 1, п. 1) называется результат их последовательного выпол- /1 2 3 4\ k /1 2 3 4\ нения (например, если п = 4 и a —L 4 3 J» *=(, 4 з 2/' то ao=l 1, так как, например, число 1 при подстановке а переходит в 2, а число 2 при подстановке Ь переходит в 4, т. е. в итоге 1 переходит в 4, и т. д.). Это—алгебраическая операция, относительно которой множествовсех подстановок /t-й степени является группой. Единицей группы служит тождественная подстановка /I 2 ... п\ . Λ /12 ... п\ L Λ » элементом, обратным к подстановке . . 1, \1 2... я/' Vi h-lj является подстановка ( * * ***)· ^та гРУппа называется симметрической группой п-й степени и обычно обозначается через Sn. Это—конечная группа порядка п\ При п^З она некоммутативна (например, при η=4 для указанных выше подстановок а, Ь имеем: Если группа конечна, то умножение в ней часто задается с помощью таблицы Кэли, в первой строке и первом столбце которой выписываются все элементы группы, начиная с единицы (пусть эти элементы: at = e, о* ..., ап), а затем на пересечении строки, где стоит элемент аь и столбца, где стоит элемент aJt пишется элемент, равный произведению aflf.
252 ГЛ. IV. ОБЩАЯ АЛГЕБРА Ρ Пример.2. В симметрической группе 3-й степени пусть /1 2 3\ /12 3\ /I 2 3\ л'=<=(| 2 3).> *-ll 3 2}' а* = \2 1 з)' /1 Η /12 3\ /1 2 3\ β4βΐ2 3 lj' *·-ΐ8 I 2)' а* = [з 2 lj- Тогда таблица Кэли имеет вид \ е dj as «4 a» a« * <fc tf» a4 й% <*· e я* <*» <*4 <*» <*· <** e a» До <*s <*4 я» a* e a* <*9 a* Oi ab <*e <*», е- a» <*ъ <*· <*2 е я* я» <h а* <*% а% а% е 2· Изоморфизм групп· Говорят, что между элементами множеств (см. введение) Μ и N установлено взаимно одно· значное соответствие, если каждому элементу множества Μ поставлен в соответствие некоторый вполне определенный элемент множества Ν, причем различным элементам из Μ соответствуют различные элементы в TV и всякий элемент из N соответствует некоторому элементу из М. Две группы О и Я называются изоморфными, если между их элементами можно установить взаимно однозначное соответствие, при котором для любых элементов a, b£Q и соответствующих им элементов cl, l/^Н элементу а6 = с будет соответствовать элемент c?=cfb'. Пример 1. Аддитивная группа О всех целых чисел (п. 1) изоморфна аддитивной группе Η всех четных чисел (для установления изоморфизма между ними можно каждому числу Λζα поставить в соответствие число 2Λζ#). Пример 2. Мультипликативная группа (п. 1) всех положительных действительных чисел изоморфна аддитивной группе всех действительных чисел (изоморфизм: а -* lg a). Изоморфное отображение группы на себя называется автоморфизмом этой группы. Пример 3. Одним из автоморфизмов аддитивной группы всех целых чисел является отображение, при котором каждому целому числу ά ставится в соответствие число — а. „
3] § 1. группы 253 Если две группы изоморфны, то изоморфное соответствие между ними можно установить, вообще говоря, многими способами. Изоморфные группы могут отличаться друг от друга только природой своих элементов и, быть может, названием операции, определенной в группе. Но все свойства изоморфных между собой групп, вытекающие из свойств определенных в них операций и не зависящие от природы элементов группы, одинаковы. Например, если группа абелева (п. 1), то и все изоморфные ей группы абелевы. В алгебре изоморфные друг другу группы не считаются существенно различными. 3. Гомоморфизм. Пусть каждому элементу группы Q соответствует однозначно определенный элемент группы Я, причем если элементам a, b£Q соответствуют элементы а', V ζ Я, то элементу ab=c соответствует элемент d=ctt/. Такое отображение Q->H называется гомоморфизмом; говорят, что группа Q гомоморфно отображена в группу Я. Если при этом на каждый элемент группы Я отображается хотя бы один элемент группы G, то говорят о гомоморфном отображении группы О на группу Я; гомоморфизм в этом случае называется эпиморфизмом. Вообще говоря, при гомоморфизме в данный элемент группы Я могут переходить различные элементы группы О, а также может не переходить ни одного. Пример I. Если каждому четному числу поставить в соответствие число I, а каждому нечетному поставить в соответствие число — 1, то получится гомоморфное отображение аддитивной группы всех целых чисел в мультипликативную группу всех отличных от нуля рациональных чисел (п. 1, примеры I и 3). Это отображение будет также гомоморфным отображением аддитивной группы всех целых чисел на мультипликативную группу, состоящую из чисел — 1, I. Пример 2. Если каждой невырожденной квадратной матрице /1-го порядка с действительными элементами постаэить в соответствие определитель этой матрицы (гл. I, § 1, п. 2), то получится гомоморфное, отображение группы (по умножению) всех действительных невырожденных квадратных матриц я-го порядка на мультипликативную группу всех отличных от нуля действительных чисел. При всяком гомоморфном отображении группы О в группу Я единица группы О (или нуль, если групповая операция — сложение) переходит в единицу (в нуль) группы Я. Совокупность всех элементов группы О, переходящих в единицу (в нуль) группы Я, называется ядром данного гомоморфизма. В приведенном выше примере 1 ядро гомоморфизма соста-
254 ГЛ. IV. ОБЩАЯ АЛГЕБРА И вляют все четные числа, в примере 2 — все матрицы с определителем, равным 1. Гомоморфное отображение группы в себя называется эндоморфизмом этой группы. Примером эндоморфизма может служить отображение, при котором каждому элементу группы ставится в соответствие единица этой группы. Если группа О гомоморфно отображена на какое-то множество Λί, в котором определена алгебраическая операция (п. 1), то относительно этой алгебраической операции множество Μ само* необходимо является группой. 4. Подгруппы. Циклические группы. Подмножество А (см. введение) группы О называется подгруппой этой группы, если вместе с каждым элементом а оно содержит также обратный ему элемент а"1 и вместе с каждыми двумя элементами а, Ъ оно содержит и их произведение аЪ. Эти два требования можно. заменить одним: для любых элементов а, Ь(^А элемент ab"1 должен лежать в А. Всякая подгруппа данной группы О сама является группой относительно той операции, которая определена в G. Пример 1. Аддитивная группа всех четных чисел (п. 1) является подгруппой аддитивной группы всех целых чисел, которая сама является подгруппой аддитивной группы всех комплексных чисел. Пример 2. Множество всех четных подстановок η элементов (гл. I, § 1, п. 1) является подгруппой в группе всех подстановок η элементов (п. 1). Эта подгруппа называется знакопеременной группой п-й степени и обычно обозначается через Ап. В любой группе подмножество, состоящее только из единичного элемента группы, является подгруппой. Эта подгруппа называется единичной подгруппой данной группы и обычно обозначается символом Е. Сама группа также всегда является своей подгруппой. Всякая подгруппа, отличная от всей группы, называется истинной подгруппой этой группы. Подгруппами симметрических групп (п. 1) исчерпываются, по существу, все конечные группы: всякая конечная группа порядка η (п. 1) изоморфна (п. 2) некоторой подгруппе группы всех подстановок я-й степени (теорема Кали). Если в группе О взять какой-нибудь элемент g и все степени этого элемента *) (или все его кратные, если опера- *) έη ПРИ я>0 — произведение η элементов, равных g;a £ΓΛ—· произведение η элементов, равных g"1, или, что то же, элемент, обратный g*. g~nr=(g~iyt=*(gn)~i; g° = * (no определению).
Ч: § 1. ГРУППЫ 255 ция в группе — сложение), то также получится подгруппа группы Q. Эта подгруппа называется циклической подгруппой, порожденной элементом g, и обозначается через {g\. Если подгруппа {g} совпадает со всей группой G, то сама группа О называется циклической группой. Если для элемента g группы О существует такое натуральное чисдо *, что gk = e (е — единица группы G), то g называется элементом конечного порядка. Наименьшее натуральное число η со свойством gn = e в этом случае называется порядком элемента g. Если ни для*какого натурального числа * равенство gk=e не выполнено, то g называется элементном бесконечного порядка; в этом случае все степени элемента g (включая и отрицательные) различны между собой; в частности, ни одна из этих степеней не равна е% кроме g° = e. Если элемент g группы О имеет бесконечный порядок, то циклическая подгруппа {g} бесконечна. Если g — элемент порядка я, то подгруппа {#) также имеет порядок η (п. 1); она -состоит из (различных между собой) элементов е, gt ίΓ*> ...» gn^tt которым равны все остальные степени элемента g, положительные и отрицательные. ПримерЗ. Аддитивная группа всех целых чисел (п. 1) есть бесконечная циклическая группа (она состоит из всех кратных числа 1). Пример 4. Все значения корня n-й степени из 1 образуют (относительно умножения) циклическую группу порядка я, порожденную любым из первообразных корней /t-й степени из 1 ([11], стр. 128). Все бесконечные циклические группы изоморфны между собой (п. 2). Изоморфны между собой также все конечные циклические группы одного и того же порядка п. Всякая подгруппа циклической группы сама является циклической группой. б. Системы образующих. Возрастающие последовательности подгрудп. Пусть Μ — какое-то непустое подмножество группы О. Совокупность всех элементов группы О, равных произведениям (положительных и отрицательных) степеней элементов из Μ (в каждое произведение входит конечное число множителей), является подгруппой группы О. Эт*а подгруппа называется подгруппой, порожденной множеством М, и обозначается
256 ГЛ. IV. ОБЩАЯ АЛГЕБРА [* k к через \Щ. Общий вид элемента подгруппы {М}: аи1 ... аип9 где каждое kt (1=1, ..., η) — какое-то целое число, а а*х, ..., йа —элементы множества Ж, среди которых могут быть и одинаковые (например, а\а^х а1ь ага^^{М), если <*ι> я* α$ζΛ). Подгруппа {М} содержится в любой подгруппе группы G, содержащей целиком множество Mt и является пересечением всех подгрупп группы G, содержащих М. Множество Μ называется системой образующих подгруппы {М). Если подгруппа \М) совпадает со всей группой О, то Μ — система образующих группы О. Если при этом множество Μ конечно, то О называется группой с конечным числом образующих. Пример 1. Множество всех элементов группы G всегда является ее системой образующих. Пример 2. Одной из систем образующих мультипликативной группы (п. 1) всех положительных рациональных чисел является множество всех простых чисел. Пример 3. Число 1 является системой образующих аддитивной группы всех целых чисел (п. 1). Другая система образующих той же группы — числа 2, 3. Если множество Μ состоит из одного элемента, то порожденная им подгруппа есть циклическая подгруппа, порожденная этим элементом (п. 4). Если множество Μ состоит из всех элементов, принадлежащих некоторым подгруппам А, В, ... группы О, то подгруппа {М} называется подгруппой, порожденной заданными подгруппами, и обозначается через {А, В, ..'.}. Подгруппа, порожденная некоторым множеством подгрупп группы О, состоит из всех элементов группы, равных произведениям элементов, взятых из этих подгрупц. Это — минимальная подгруппа группы О, содержащая все заданные подгруппы. Пусть подгруппы Аи А* .·., Ая,... группы О таковы, что Ai^A^cz ... ^Ап^ ... (4:1) (возрастающая последовательность подгрупп). Тогда подгруппа, порожденная этими подгруппами, совпадает просто с множеством всех элементов группы О, каждый из которых принадлежит хоть одной из этих подгрупп, и называется объединением возрастающей последовательности под*
щ § 1. группы 257 групп (4.1). Может случиться, что объединение возрастающей последовательности подгрупп группы О совпадает с самой этой группой. Пример 4. Аддитивная группа (п. 1) всех рациональных чисел является объединением возрастающей последовательности своих циклических подгрупп гоЧтНтН-^Ш* Пример 5. Множество всех комплексных чисел, являющихся" корнями из 1 ([11], стр. 127) степеней, равных степеням некоторого фиксированного простого числа р, представляет собой группу относительно умножения. Эта группа есть объединение возрастающей последовательности (циклических) подгрупп Atcz:At(ZZ ..., где Αι (/=1, 2, ...) состоит из всех корней р'-й степени из 1. Эта группа (как и всякая группа, ей изоморфная) называется группой типа />°° или квазициклической группой. Группы типа р°° играют большую роль в? теории абелевых групп. 6. Смежные классы. Разложение группы по подгруппе. Если А— подгруппа, g—произвольный элемент группы Q, то через gA обозначается множество всех элементов группы Q, получающихся при умножении элемента g на всевозможные элементы из подгруппы А (т. е. множество всех элемен^ тов вида gat где α ζ А). Это множество называется левым смежным классом группы О по подгруппе А, определяемым элементом g. Аналогично правым смежным классом Ag группы О по подгруппе А, определяемым элементом g, называется множество всех элементов вида ag, где я ζ Λ. Если групповая операция — сложение, то левые и правые смежные классы обозначаются соответственно через g-\-A и A + g. Пример 1. В группе всех подстановок третьей 'степени (п. 1) возьмем подгруппу А, состоящую из подстановок *== /1 2 3\ /1 2 3\ /12 3\ v ^(l 2 з)иа = (1 3 2)·и возьмем элемент ^= (^2 3 jj.Тогда левый смежный класс gA будет состоять из подстановок &=g = /1 2 3\ " /Г 2 3\ - - . . = \2 3 1/ и ^а \3 2 l)' а пРавый смежный класс Ag—из /1 2 3\ /1 2 3\ подстановок*g = g=(2 3 ι)" ^=(2 1 з)· Каждый левый смежный класс определяется любым из входящих в него элементов, т. е. если g{£ gA, то giA=sgA.
258 ГЛ. IV. ОБЩАЯ АЛГЕБРА [6 Два любых левых смежных класса группы О по подгруппе А или- совпадают» или не имеют ни одного общего элемента. Одним из левых смежных классов группы G по подгруппе А является сама подгруппа А (А = еА, где е — единица группы G); все остальные левые смежные классы по подгруппе А подгруппами группы G не являются. Эти же утверждения верны для правых смежных классов. Число всех различных левых смежных классоь группы О по подгруппе А всегда равно числу всех различных правых смежных классов группы О по этой же подгруппе (в бесконечном случае это означает, что мощность множества всех различных левых смежных классов группы О по подгруппе А совпадает с мощностью множества правых смежных классов). Это число (в бесконечном случае —мощность) называется индексом подгруппы А в группе О. Если группа О конечна, то ее порядок (п. 1) равен произведению порядка любой ее подгруппы А на индекс этой подгруппы в группе Q (теорема Лагранжа). Отсюда следует, что порядок всякой подгруппы конечной группы является делителем порядка группы. Также порядок любого элемента (п. 4) конечной группы является делителем порядка этой группы. Обратно, если порядок конечной группы О делится на простое число р, то Q обладает элементами порядка ρ (теорема Коши). Если в произвольной группе О выбрана какая-то подгруппа Л, то все элементы группы О можно разбить на непересекающиеся классы, объединяя вместе те элементы, которые лежат в одном и том же левом смежном классе группы Q по подгруппе Л. Такое разбиение называется левосторонним разложением группы Q по подгруппе А. Если вместо левых смежных классов взять правые смежные классы по подгруппе А, то получится правостороннее разложение группы Q по подгруппе А. Пример 2. В симметрической группе 3-й степени Ss (п. 1), /1 2 3\ /12 3\ /1 2 3Y элементы которой ах =* = (j 2 з)' а*\\ 3 2/' а* = \2 1 з]· /1 2 3\ /12 3\ /1 2 3\ . *4=\2 3 l),ae==U 1 2J,ae = \3 2 1)'возьмем подгруппу А, состоящую из элементов е и αβ. Тогда при левостороннем разложении группы S8 по подгруппе А множество ее элементов разобьется на классы: 1) г, а9 (смежный класс еА = А), 2) aiy аь (смежный класс аъА)у 3) #8, <?4 (смежный класс аьА), а при правостороннем разложении получатся классы: 1) е% at (смежный класс Ае = Л), 2) ai% йА
ч § 1/группы 259 (смежный класс Аал)г 3) аь> аь (смежный класс Ааь). Индекс подгруппы Л в группе Sa равен 3. Пример 3. Как при левостороннем, так н при правостороннем разложении аддитивной группы всех целых чисел (п. 1) по подгруппе, состоящей из всех целых чисел, делящихся на 3, в один класс будут объединяться те целые числа, которые при делении на 3 дают один и тот же остаток. Всего получится три класса: 1) класс Во чисел, делящихся на 3 без остатка, 2) класс В% чисел, дающих при делении на 3 в остатке 1, и 3) класс В% чисел, дающих при делении на 3 в остатке 2. Если в произвольной группе О в качестве подгруппы А взять саму группу О, то (как правостороннее, так и левостороннее) разложение группы О по подгруппе А будет состоять только из одного класса (в который войдут все элементы группы О). Если же в качестве подгруппы А взять единичную подгруппу Ε (π· 4), то каждый элемент группы О будет составлять отдельный смежный класс. 7. Нормальный делитель группы. Если при левостороннем и при правостороннем разложении группы О. по некоторой ее подгруппе Η (п. 6) классы, на которые распадаются элементы группы О, получаются одинаковыми, то подгруппа Η называется нормальным делителем группы О (или инвариантной подгруппой.) Пример 1. В примере 2 п. 6 подгруппа А группы $в не является нормальным делителем этой группы. Пример 2. Если индекс подгруппы И в группе G равен 2, то Μ — нормальный делитель группы и: и при левостороннем, н при правостороннем разложении группы G по подгруппе И одним нз смежных классов является сама подгруппа //', а второй смежный класс состоит нз всех элементов группы и, не лежащих в И. Например, знакопеременная группа /ι-й степени (п. 4), индекс которой в симметрической группе п-й степени Sn (п. 1) равен 2, является нормальным делителем группы Sn. Подгруппа И тогда и только тогда является нормальным делителем группы G, когда для любого элемента g группы О gH=Hg. Это равенств!) означает, что для всякого элемента А из Η можно найти в Η такие элементы К и А", что gh=h'g, hg=gh". (4.2)
260 ГЛ. IV. ОБЩАЯ АЛГЕБРА , [? Пример 3. Если группа О абелева (п. 1), то всякая ее подгруппа Η является нормальным делителем (для получения равенств (4.2) достаточно взять h* *= h" = Λ). Элементы gt и g* группы О называются сопряженными в этой группе, если в О существует такой элемент g, что (в этом случае говорят также, что элемент g9 получен из gt трансформированием элементом g). Если А — подгруппа, g—фиксированный элемент некоторой группы О,' то совокупность всех элементов вида g^ag, где а пробегает всю подгруппу А, есть снова подгруппа группы О. Эта подгруппа называется подгруппой, сопряжен* ной с А в группе О. Пример 4. Подгруппа At группы $$ примера 2 п. .6, состоящая из элементов е и а%% сопряжена с рассматривавшейся там подгруппой A: A\=^aJ*Aab. Подгруппа Η группы О тогда и только тогда является нормальным делителем этой группы, когда вместе с каждым элементом h она содержит и все элементы, сопряженные с h в группе О. Пример 5. Пусть G — группа всех невырожденных квадратных матриц /t-го порядка с действительными элементами (п. 1, пример 5), Η — ее подгрупоа, состоящая из всех матриц, определитель которых (гл. I, § 1, п. 2) равен 1. Тогда если матрица А лежит в /У, то в // лежит н всякая матрица вида ВгхАВ (В — любая невырожденная матрица), так как 1В* ίΑΒ | = | Я*1 \\А 1| В | = \А | = I (стр. 34, 71). Следовательно,// — нормальный делитель группы G. Нормальные делители группы О и только они совпадают со всеми подгруппами, сопряженными с ними в О. • Всякий нормальный делитель группы О является «ядром некоторого гомоморфизма (п. 3) этой группы; обратно, ядро всякого гомоморфизма группы О является нормальным делителем в О. В любой группе единичная подгруппа (п. 4) и сама группа являются нормальными делителями. Если других нормальных делителей в группе нет, она называется простой группой. Примером простой группы глужит знакопеременная группа п-& степени (п. 4) при я ^5. Существуют и бесконечные простые группы·
ft § ί. ГРУППЫ. 261 Если в. группе О все подгруппы, являются нормальными делителями, причем группа О не абелева (п. 1), то она называется гамилыпоновой группой. Пример такой группы см. в [12], стр. 58. . 8· Фактор-группа· Если в множестве всех смежных классов группы О по нормальному делителю Я (пп. 6 и 7) ввести операцию по правилу (giH)(giff)—(gtgi)H (при аддитивной записи (gt + H)+(gi + H)=(gt + gi) + H)f то это будет алгебраическая операция*) (п. 1), относительно которой множество всех смежных классов группы О по нормальному делителю Я само окажется группой. Эта группа называется фактор-группой группы О по нормальному делителю Я и обозначается через О/Я. Единицей факторгруппы, О/Я является смежный класс Я. Элементом, обратным элементу фактор-группы gH, является смежный класс g~xH. Порядок фактор-группы Q/H равен индексу Я в О (пп. 1 и 6). Пример 1. Фактор-группа аддитивной группы всех цедых чисел (п. 1). по подгруппе всех чисел, делящихся на 3, состоит из трех элементов — классов £0, Вх и В% (п. 6, пример 3). Это — циклическая группа 3-го порядка, порожденная, элементом Bt (п. 4) (групповая операция — сложение). Пример 2. В мультипликативной группе О всех отличных от нуля рациональных чисел (п. 1) числа 1,— 1 составляют нор* мальиый делитель Я. Смежные классы по этому нормальному делителю являются парами чисел с, — с, где с — некоторое положительное рациональное число. Произведением смежных классов си — сх и ctt — Ci является смежный класс группы О по нормальному делителю Я, состоящий из чисел ctc%f — ctci (ciHc%H = (<?ι<?8) /У). Фактор-группа G/H изоморфна (π» 2) мультипликативной группе всех положительных рациональных чисел (этот изоморфизм можно получить, ставя в соответствие смежному классу с, — с число с). Пример 3. Если в мультипликативной группе О всех невырожденных квадратных матриц я-го порядка1 с действительными элементами взять нормальный делитель И, состоящий из всех матриц, определитель которых равен 1 (п. 7, пример 5), то смежные классы по И будут состоять из всех матриц/с одинаковым определителем. Если каждому смежному классу поставить в соответствие действительное число, равное определителю всех *) Если &'//=£,//, giH=g*Hf то (f[gl)M^(gigi)Hf т. е. смежный класс (g\g%)H не зависит от выОора элементов gu g* в данных смежных классах giH, ggH.
262 ГЛ. IV. ОБЩАЯ АЛГЕБРА Р> матриц, входящих в этот смежный класс, то получится изоморфизм между фактор-группой G/H и мультипликативной группой всех отличных от нуля действительных чисел (пп. 1 и 2). Пример 4. Пусть G — аддитивная группа всех векторов на плоскости, выходящих из начала координат» Η — ее подгруппа» состоящая из всех векторов» лежащих на оси ординат. Тогда // — нормальный делитель группы О», а каждый смежный класс группы О по Я представляет собой совокупность всех векторов плоско· сти, выходящих из начала координат и имеющих конец на некоторой (фиксированной) прямой» параллельной оси ординат. Фактор· группа G/H изоморфна (п. 2) аддитивной группе всех действительных чисел (для установления изоморфизма между этими группами можно каждому смежному классу группы G по нормальному делите· лю Η поставить в соответствие то действительное число, которое изображается точкой пересечения прямой» на которой лежат концы всех векторов данного смежного класса» с осью абсцисс)· Если каждому элементу g группы О поставить в соответствие смежный класс gH группы О по некоторому ее нормальному делителю Я, то получится гомоморфное отображение группы О на фактор-группу Q/H. Оно называется естественным гомоморфным отображением О на Q/H. Ядром этого гомоморфизма (п. 3) является нормальный делитель Я Совокупность всех элементов группы О, переходящих при естественном гомоморфизме в один и тот же фиксированный элемент группы QfH> является смежным классом группы О по нормальному делителю Я Если группа О гомоморфно отображена на какую-то группу О и Я—ядро этого гомоморфизма» то необходимо Я является нормальным делителем группы О, а группа О изоморфна (п. 2), фактор-группе О/Η (теорема о гомоморфизмах групп). Π ρ и м е ρ 5. Пусть {а}.—бесконечная циклическая группа, {Ь} — циклическая группа порядка η (η. 4). Если каждому элементу ак группы {a} (л— любое целое число) поставить в соответствие элемент bk группы {£}, то получится гомоморфное отображение группы {а} на группу {Ь}. Ядром этого гомоморфизма является циклическая, подгруппа группы {<?}, порожденная элементом ап. Фактор-группа {a}f{an) изоморфна группе {Ь}. 9. Группы подстановок ([27]; [23]; [5], ч. 1). Группы подстановок — это подгруппы симметрических групп (п. 1). При их изучении обычно для удобства пользуются записью подстановок в виде произведений циклов. Циклом или циклической подстановкой называется такая подста-
9] § 1. группы 263 новка чисел 1,2,..., я *), которая одно из этих чисел 1Х переводит в число 4» к переводит в /8 и т. д., ifc_t переводит в lk (k^n), lk переводит в ilt а все остальные числа оставляет на месте. Эта подстановка обозначается через (Ιί9 ί*,..., lk). Циклы (iu i*,..., lk) и, например, (ί9,..., ik, ix) равны между собой. Число k называется длиной цикла. Цикл длины 1 — это тождественная подстановка. Чтобы представить произвольную подстановку чисел 1, 2,..., η в виде произведения циклов, нужно взять любое из этих чисел (например, 1), затем число, в которое оно переводится данной подстановкой (пусть это число—/9), затем число, в которое /а переходит при этой подстановке, и т. д. до числа ji9 переводящегося данной подстановкой в первое из взятых чисел (в нашем случае в 1), и выписать цикл (1,/*..., j()\ после этого нужно взять какое- нибудь из чисел 1,2,..., я, которое пока еще не встречалось (если такое число существует), и, начиная с него, сделать то же самое и т. д., пока не будут использованы все числа 1, 2,..., п. Тогда мы получим несколько циклов, не имеющих общих действительно перемещаемых ими чисел, произведению которых (в любом порядке) и будет равна данная подстановка. Циклы, не содержащие общих действительно перемещаемых ими чисел, называются независимыми. Те циклы, входящие в произведение, длина которых равна 1, обычно не пишут. При этом условии всякая подстановка разлагается в произведение независимых циклов единственным образом. 1/12345678\ „«^,,™ ПрИМер 482 15 7463) = (Ι83)(4576)· Пример 2. Подстановки, составляющие симметрическую группу 3-й степени, записываются в виде произведений циклов так; аА = (1), а, = (2,3), а, = (1,2), а4 = (1,2,3), а* = (1,3,2), ав = (1,3). Цикл длины 2 называется транспозицией. Всякую подстановку можно представить также в виде произведения транспозиций (например, Щ, 4,..., /Λ) = (ί„ ia)(/,, it).·Ά» ί*)). Это представление не единственно, но всякая четная подстановка (гл. I, § 1, п. 1) разлагается всегда в произведение четного числа транспозиций, а всякая нечетная подстановка — в про- *) Вместо подстановок чисел 1,2,..., η можно говорить также о подстановках η каких-то элементов «ι,..., «Λ; если вместо этих элементов писать только индексы, с помощью которых они занумерованы, то получится в точности то же самое, как если бы речь шла о подстановках чисел.
264 ГЛ. IV. ОБЩАЯ АЛГЕБРА β доведение нечетного числа транспозиций. .Всякую четную подстановку можно, представить также в виде произведения циклов длины 3 (например, (1,2) (1,3) = (1,2,3), (1,2) (3,4) ss = (1.3,2)(2,4,3)). Порядок (п. 4) цикла как элемента группы подстановок, в которой он лежит, всегда равен его длине. Порядок подстановки, представленной в виде произведения независимых циклов, равен * общему наименьшему кратному длин этих циклов. Если подстановка а представлена ft виде произведения циклов, то, чтобы получить сопряженную с нею (п. 7) подстановку b~xab, нужно числа, составляющие эти циклы, подвергнуть подстановке. Ь. * Пример 3.а = (\Ц111) =(2fi)(3t4,5); Группа подстановок η элементов at,.,, ая называется транзитивной, если для любых двух из этих элементов ait dj в группе имеется подстановка, переводящая а, в ау. Если это условие не выполнено, группа называется интранзитив- ной. Пример 4. Симметрическая группа я-й степени (п. 1) тран- зитивна. Знакопеременная группа я-й степени (п. 4) при я^З также транзнтнвна. Пример 5. Подгруппа симметрической группы я-й степени (я>2), состоящая из подстановок (1), (1, 2), интранзнтивна. Транзитивная группа подстановок элементов alt..., ап называется импримитивной, если множество элементов at,..., ап можно разбить на непересекающиеся части (области импримитивности) так, что каждая из этих частей будет содержать больше одного элемента и каждадоодстановка группы будет переводить все элементы любой из этих частей либо снова в элементы этой же части, либо в элементы другой части, одной и той же для всех элементов первой части. Все области импримитивности состоят из.одинакового числа элементов. Если множество аь..., <хя на области импримитивности разбить нельзя, то группа называется примитивной. Пример 6. Симметрическая группа любой степени и знакопеременная группа лтй степени при я^.З являются примитивными*
10] § 1. группы 265 Пример 7. Если число η простое» то всякая транзитивная группа подстановок η элементов примитивна. Пример 8. Подгруппа группы Sit состоящая из подстановок (1), (1,2Ш,4), (1,3) (2,4), (1,4) (2,3) (так называемая четверная группа Клейна), импримитивна; областями импримитивности для иее являются,, например, подмножества 1,2 и 3,4. В любой группе Ρ подстановок элементов сц,..., ая совокупность Ра1 всех подстановок, оставляющих какой-нибудь фиксированный элемент otj на месте, является подгруппой. Если группа Ρ транзитивна, то подгруппы Рв1,...> Р*п сопряжены в ней между собой (п. 7), а индекс каждой из них в группе Ρ (п. 6) равен п. Отсюда следует, что порядок (п. 1) транзитивной группы подстановок η элементов всегда делится на число η (п. 6). Транзитивная группа Ρ подстановок элементов оц,..., ая примитивна тогда и только тогда, когда подгруппы Ραί (isssi,..., n) являются ее максимальными истинными подгруппами. Если это условие не выполнено и существует такая подгруппа Q группы Р, что PaiCZQCZP пРи некотором i, то областями импримитивности для группы Ρ служат подмножества множества оц,..., ая, каждое из которых состоит из всех элементов, в которые щ (I фиксировано) переводится подстановками, принадлежащими одному и тому же правому смежному классу группы Ρ по подгруппе Q (п. 6). 10. Прямые произведения групп· Группа О называется прямым произведением (или прямой суммой, если групповая операция — сложение) своих подгрупп //ι,·.., НПУ если: 1) каждая подгруппа //* (ί=1,..., η) является нормальным делителем (п. 7) группы О; 2) группа О порождается (п. 5) подгруппами #,,..., #я; 3) пересечение (см. введение) всякой подгруппы Ht (ί = 1,..., η) с подгруппой, порожденной всеми подгруппами Яу, j Φ U содержит только единицу группы. Требование 3) можно заменить более слабым: пересечение всякой подгруппы Hi (i=2,..., n) с подгруппой, порожденной ПОДГруППаМИ #ι,,..., tfj.i, ДОЛЖНО СОСТОЯТЬ ЛИШЬ ИЗ единицы группы. Второе определение прямого произведения (равносильное первому). Группа О называется прямым произведением своих подгрупп tfi,..., Яя, если:
266 ГЛ. IV. ОБЩАЯ АЛГЕБРА [Ю 1) каждый элемент g группы О однозначно записывается в виде произведения g=ht... hn, где ή,ζ Ht (i=l,..., n)\ 2) элементы любых двух подгрупп Щ и Hj (ΙΦΙ) перестановочны между собой (т. е. hthj=hjhit если ht ζ Hit h* ζ Hj). Если группа О является прямым произведением (прямой суммой) своих подгрупп Нь Я*..., Нп, то пишут: 0= = #ιΧ#*Χ.. .X ^(соответственно G=#ι + #а -f · · · +*/ίΛ). Подгруппы Htt //*···; Ηη называются прямыми множите- лями (соответственно прямыми слагаемыми), входящими в данное прямое разложение группы G. Если 0=Ηίχ...χΗη ΐΛθ^ε=Ηί...ΗηφίζΜί91 = = 1,..., η), то элементы ht,. ·., hn называются компонентами элемента g соответственно в прямых множителях Hit..,t Нп. Для любого i (2=1,.·., η) компонента произведения двух элементов группы О в Я/ равна произведению компонент этих элементов в Hit т. е. если g—hv...hnt g=h\...An, то gg,=(hih\)...(hnhtn). Пример 1. Четверная группа Клейна V (п. 9) является прямым произведением своей подгруппы Ни состоящей из подстановок (1) и (1,2) (3,4), и подгруппы Я8, состоящей из подстановок (1) и (1,о) (2,4). Она же является прямым произведением подгруппы Н\ и подгруппы Η в, состоящей из подстановок (1) и (1,4) (2,3), а также прямым произведением подгрупп Н% м Нв: V = Ht X Я2= Пример 2. Все действительные квадратные матрицы я-го порядка (см. Введение) с положительным определителем (гл. I, § 1, п. 2) образуют относительно умножения матриц (гл. И, § 1, п. 1) группу и, в которой множество Н\ всех матриц с определителем, равным 1, является нормальным делителем. Множество Н% всех скалярных Матриц (гл. II, § 1, п. 3) с положительным числом на главной диагонали также является нормальным делителем группы О. В пересечении Нх с Н% ([34], стр. 23—24) лежит только единичная матрица, являющаяся единицей группы G; G~H\ χ Η%. Если Q=HiXHiX...XHn, причем каждое Ht (i = = 1,...,п) само является прямым произведением своих подгрупп, Я| = #цХ...Х/У|ц, то для группы Q можно получить новое прямое разложение: О = Нп X... X #Uj X... ... Χ Ηηχ X... X Hnkfl. {продолжение прежнего прямого разложения группы О). Еще прямое разложение группы О можно
10] § 1. группы 267 получить, разбивая произвольным образом множество подгрупп #!,...,#д, входящих в ее исходное прямое разложение, на непересекающиеся части и заменяя подгруппы, входящие в каждую из этих частей, их произведением (т. е. подгруппой, ими порожденной (п. 5)). Пример 3. Пусть О — группа (по сложению) всех векторов трехмерного пространства, выходящих нз начала координат, Ии Н2, Йь — ее подгруппы, состоящие соответственно из всех векторов оси xf оси у и оси з, выходящих из начала координат, Л и £ — подгруппы, состоящие из векторов плоскости хОу и векторов плен скости уОг. Тогда Л = Нх + //*, В = //* + Я8, G = А + Нь = Нх + + Н% ·+- Ηζ = Η χ -\- В, Если G=#iX#* то фактор-группа Q/Ht (п. 8) изоморфна (п. 2) подгруппе #*; аналогично фактор-группа О/Нъ изоморфна Н\. Если С — подгруппа группы О, содержащая внутри себя прямой множитель Нь то C=#jXA где D—'пересечение ([34], стр. 23—24) подгрупп С и Н* Если 0 = #ιΧ...χ#Λ и Н\ — подгруппа группы Ht (i==l,..., n)t то подгруппа, порожденная в группе О всеми подгруппами Hi (п. 5), является прямым произведением этих подгрупп: {Я;,..., Н'п) = Н[ Χ...χΗ'η. Определение прямого произведения (прямой суммы) можно дать и для случая бесконечного числа прямых множителей (прямых слагаемых): группа О называется прямым про- изведением (прямой суммой) некоторого множества своих подгрупп НЛ (обозначение: Q = UHa или соответственно 0= = 2#α)> если G порождается этими подгруппами и если α подгруппа, порожденная в группе О любым конечным числом подгрупп Йау является их прямым произведением (прямой суммой). Указанные Bbiuie свойства прямых произведений верны и для случая бесконечного числа множителей, Пример 4. Мультипликативная группа всех отличиых от нуля рациональных чисел (п. 1) является прямым произведением своей подгруппы, состоящей из чисел —1,1, и бесконечного числа бесконечных циклических подгрупп, каждая из которых порождается некоторым простым числом. Пример 5. Группа (по сложению) всех многочленов (всех степеней) от одного переменного χ с действительными коэффициентами является прямой суммой своих, подгрупп, каждая из которых состоит из всех многочленов вида axfct где k фиксировано (£=0, 1, 2,...)t а коэффициент а пробегает все действительные числа.
268 ГЛ. IV. ОБЩАЯ АЛГЕБРА 111 Если \#t.···» ΛΓΛ — какие-то группы, то всегда можно построить группу, являющуюся прямым произведением подгрупп, изоморфных (п. 2) #|,..., Hn. Такая группа получится, если взять множество всех последовательностей вида (Αι,..., Ая), где ht — элемент группы Ht (isl,..., n), и перемножать последовательности почленно: (Αι,..., АЯУХ Х(А;,..., «)—(Μι.'.... Ш (Αι. Κ ζ Я„ £=1,,...,я). Если дано бесконечное множество групп //„, то так же можно построить группу, являющуюся прямым произведением подгрупп, изоморфных Нл. Ее элементами будут системы элементов А^ взятых по одному из каждой группы Яв, причем только в каждой такой системе все элементы, кроме конечного числа, должны быть единицами соответствующих групп. 11. Абелевы группы. Когда рассматриваются вбелевы группы (п. 1), групповая операция обычно называется сложением. Абелева группа О тогда и только тогда является прямой суммой (п. 10) своих подгрупп Нл (а пробегает некоторое множество индексов), когда каждый ее элемент g однозначно записывается в виде суммы конечного числа элементов, взятых из различных групп На. Пример!. Аддитивная группа (п. 1) всех комплексных чисел является прямой суммой аддитивной группы всех действительных чисел и аддитивной группы всех чисто мнимых чисел ([11], стр. 115). Всякая абелева группа с конечным числом образующих (п. 5) является прямой суммой конечного числа бесконечных циклических (п. 4) подгрупп и конечного числа циклических подгрупп, порядки которых (п. 4) являются степенями простых чисел (основная теорема об абелевых группах с конечным числом образующих). Π ρ и м е ρ 2. Циклическая группа 12-го порядка, порожденная элементом а, является прямой суммой циклической подгруппы 4-го порядка, порожденной элементом За, и циклической, подгруппы 3-го порядка, порожденной элементом 4а: {а} = {За} 4- {4а}. Абелева группа, которую нельзя разложить в прямую сумму ее истинных подгрупп, называется неразложимой. Бесконечные циклические группы и циклические группы, порядки которых— степени простых чисел, являются неразложимыми. Если абелева группаг с конечным числом образующих двумя способами разложена в прямую сумму бесконечных циклических групп и циклических групп, порядки которых-*-
1] § 2. КОЛЬЦА 269 степени простых чисел, то в обоих разложениях число бесконечных циклических слагаемых, число конечных циклических слагаемых и совокупность их порядков будут одинаковыми. Всякая подгруппа А абелевой группы О с конечным числом образующих сама является группой с конечным числом образующих. Если при этом в разложении группы О в прямую сумму бесконечных циклических групп и циклических групп, порядки которых — степени простых чисел, имеется г бесконечных циклических слагаемых (г^О) и простому числу ρ соответствуют слагаемые порядков р*1,...9р*к^ где (всего kp слагаемых, kp^0)f а в разложении группы А в прямую сумму бесконечных циклических групп и циклических групп, порядки которых — степени простых чисел, имеется 5 бесконечных циклических слагаемых и простому числу ρ соответствуют слагаемые порядков /Р*,...,р *> (βι^.··2*β/ ), то необходимо Кги для любого простого числа ρ lp^kp и Pi<al9...,f)| ^at . Об абелевых группах, уже не обязательно обладающих конечными системами образующих, см. 112], гл. VI—VIII. § 2. Кольца 1. Определения, примеры (см. [5]). Множество R с двумя определенными в нем алгебраическими операциями (§ 1, п. 1), сложением и умножением, называется кольцом, если относительно операции сложения оно является абелевой группой (§ 1, п. 1), а операция умножения связана с операцией сложения законами дистрибутивности, т. е. для любых трех элементов а, Ъ, с £ R а (b-\-c) = ab-\-ac и (b-\-c)a = ba-\-ca. (4.3) Умножение, определенное в кольце, не обязано быть ни ассоциативным, ни коммутативным. Если умножение, определенное в кольце R, ассоциативно (т. е. для любых трех элементов а, Ъ, с ζ R a (be) = (ab) с), то кольцо R называется ассоциативным кольцом. Если, кроме того, умножение, определенное в R, коммутативно, то R называется коммутативным кольцом. В коммутативном кольце второе из равенств (4.3) является следствием первого.
270 ГЛ. IV. ОБЩАЯ ЛЛГББРЛ Π Если в кольце R для любого элемента а выполнено условие а9=0 и для любых трех элементов а, Ь, с а(Ьс)т\-Ь(са)-{-с(аЬ) = 0 (тождество Якоби), то R называется кольцом Ли. Пример 1. Все целые числа относительно обычных операций сложения и умножения чисел образуют коммутативное кольцо. Пример 2. Вое рациональные числа, все действительные числа, все комплексные числа относительно обычных операций сложения и умножения образуют коммутативные кольца. Пример 3. Все многочлены от одного переменного с произвольными числовыми коэффициентами относительно обычных операций сложения и умножения многочленов образуют коммутативное кольцо. Пример 4. Ассоциативное, но не коммv^aj^*HOB, кольцо образуют все квадратные матрицы n^olnop^^^ дошкольными числовыми элементами (если опять склэдьГвЗтьи;. умножать матрицы обычным образом, oil. гл. И, § 1, п. I). Пример 5. Множество всех векторов трехмерного пространства» где векторы складываются обычным образом, а произведением двух векторов называется их векторное произведение, является неассоциатнвным кольцом. Это кольцо есть кольцо Лн. Абелева группа, которая получится, если в кольце рассматривать только одну операцию сложения, называется аддитивной группой кольца. Нулевой элемент этой группы называется нулем кольца. Произведение любого элемента а кольца на нуль равно нулю кольца: α-0 = 0. Если для элементов я, Ъ некоторого кольца ab=Q, ·ηο а^О и b^0t то а и Ъ называются делителями нуля (а — левый делитель нуля, Ъ — правый). Если в кольце R делителей нуля нет, то R называется кольцом без делителей нуля. Коммутативное кольцо без делителей нуля называется областью целостности. Пример 6. Всякое кольцо, в котором элементы — числа, а операции — обычное сложение и умножение чисел, является областью целостности. Пример 7. Все функции, определенные и непрерывные ([34], стр. 48) на отрезке [—1,1], относительно обычных операций сложения и умножения функций образуют кольцо с делителями нудя (например, произведение функций , /*л_/0 при — 1<лг<0, (х при—1<лг<0# /llhVnpH0o<l; /8W~ \0нри0<л:<1, ни одна из которых не равна нуЛю кольца, является нулем).
2t § 2. КОЛЬЦА 271 Если для элементов a, bv Ъ% кольца выполнено равенство аЬх = аЬг (или bia = b%a), причем а^О не есть левый (соответственно— правый) делитель нуля, то Ьх=*Ьь, т. е, на отличные от нуля элементы, не являющиеся делителями нуля, равенства можно сокращать. Производить сокращение на элемент, являющийся делителем нуля, нельзя. Пример 8. В кольце всех квадратных матриц 2-го порядка (пример 4) для матриц справедливо равенство ABi=ABt, хотя ΒιφΒ%. Здесь А — левый делитель нуля: например, ^ Qj ^ ?] = ^ Д Элемент е ^ольца R называется единицей этого кольца, если для любого элемента α ζ R ае = еа = а. Единицы в кольце может и не быть. Если в кольце R единица есть, то R называется кольцом с единицей. Пример 9. Кольцо всех целых чисел есть кольцо с единицей. Пример 10. Все четные числа образуют кольцо без единицы. В'кольце с единицей е для элемента ауЬО может существовать обратный ему элемента"1 со свойством аа~1=сг1а = е (но может такого элемента и не быть). Элементы кольца с единицей, для которых в этом кольце обратный элемент существует, называются делителями единицы. Пример 1KB кольце всех квадратных матриц л-го порядка единицей является единичная матрица (гл. II, § 1, п. 2). Обратный элемент существует для всякой невырожденной матрицы (гл. II, § I, п. 2); для вырожденных матриц обратных им элементов не существует. 2. Изоморфизм. Гомоморфизм. Кольца R и Q называются изоморфными, если между их элементами можно установить такое взаимно однозначное соответствие (§ 1, п. 2), что если элементам α^α^ζ R соответствуют элементы Ьь £9 £ Q, то элементу αχ^α^ соответствует элемент bi~\-bi и элементу <hfl% — элемент ЬХЬ^ Пример 1. Кольцо всех квадратных матриц л-го порядка с действительными элементами (п. 1, пример 4) изоморфно кольцу всех линейных преобразований, действующих в действительном л-мер- ном линейном векторном пространстве (сложение и умножение преобразований определяется обычно; см. [8], [11], [14], [16], [32]}.
272 ГЛ. IV. ОБЩАЯ АЛГЕБРА [3 Говорят, что кольцо R гомоморфно отображено в кольцо Q, если каждому элементу кольца R поставлен в соответствие однозначно определенный элемент кольца Q, причем если элементам аь ва кольца R соответствуют элементы Ь%, Ь* ζ Q, то элементу ах ·+· а9 соответствует Ъх + Ь* элементу αχα^ соответствует Ьфъ Если при этом на каждый элемент кольца Q отображается по крайней мере один элемент кольца /?, то говорят о гомоморфном отображении кольца R на кольцо Q; гомоморфизм в этом случае называется эпиморфизмом. Пример 2. Если каждому многочлену от одного переменного с любыми комплексными коэффициентами поставить в соответствие свободный член этого многочлена, то получится гомоморфное отображение кольца всех многочленов с комплексными коэффициентами на кольцо (на самом деле даже поле) всех комплексных чисел. Если кольцо R гомоморфно (в частности, изоморфно) отображено на кольцо Q, причем кольцо R ассоциативно (п, 1), то и кольцо Q ассоциативно; если кольцо R коммутативно, то и Q коммутативно; если R — кольцо с единицей (п. 1), то и Q — кольцо с единицей, причем единицей кольца Q является образ единицы кольца R. Если кольцо R может быть гомоморфно (или изоморфно) отображено на* некоторое множество Μ с двумя алгебраическими операциями (§ 1, п. 1), то Λί само является кольцом относительно этих двух операций. * Если кольцо R гомоморфно отображено в кольцо Q, то множество всех элементов кольца /?, переходящих при этом в нуль кольца Q, называется ядром этого гомоморфизма. 3. Подкольца. Идеалы. Подгруппа А (§ 1, п. 4) аддитивной группы кольца R (п. 1) называется подкольцом этого кольца, если она вместе с каждыми двумя элементами alt aq содержит также их произведение ata%. Подкольцо А кольца R называется левым (соответственно правым) идеалом этого кольца, если оно вместе с каждым элементом а содержит также все элементы вида га (вида ar)t где г—произвольный элемент кольца R. В коммутативных кольцах понятия левого и правого идеала совпадают. Если подкольцо А произвольного кольца одновременно является и левым, и правым идеалом, то оно называется двусторонним идеалом этого кольца. Пример 1. В кольце всех целых чисел числа, кратные некоторому фиксированному числу /г, составляют двусторонний идеал. Пример 2. В кольце всех квадратных матриц /г-ro порядка множество всех матриц, у которых последний столбец состоит из
3] § 2. кольца .273 нулей, является левым идеалом, а множество всех матриц, у которых последняя строка состоит из нулей, является правым идеалом. В любом кольце элемент 0 и само кольцо являются двусторонними идеалами. Если других двусторонних идеалов в кольце нет, оно называется простым кольцом. Примером простого кольца служит кольцо всех квадратных матриц п-го порядка с любыми комплексными (или с любыми действительными) элементами (п. 1, пример 4). Также всякое поле (§ 3) является простым кольцом. Если в кольце R дано некоторое «множество (см. введение) элементов N, то наименьший (левый, правый или двусторонний) идеал кольца R, содержащий все элементы из N, называется (соответственно левым, правым или двусторонним) идеалом, порожденным множеством N; этот идеал является пересечением ([34], стр. 23—24) всех (соответственно левых, правых или двусторонних) идеалов кольца R, содержащих множество N. Идеал, порожденный одним элементом а, называется главным идеалом (обозначение: {а)и (а)г или (а), в зависимости от того, идеал левый, правый или двусторонний). Если R— коммутативное кольцо, то главный идеал (а), порожденный элементом а этого кольца, состоит из всех элементов вида ra-\-nat где г ζ /?, η — целое число. Если R — коммутативное кольцо с единицей, то (а) состоит просто из всех элементов вида га, где г £ R. Если R — кольцо с единицей е, то само оно является главным идеалом, порожденным элементом е. Область целостности (п. 1) с единицей, в которой каждый идеал — главный, называется кольцом главных идеалов. Например, кольцами главных идеалов являются: кольцо всех целых чисел, кольцо всех многочленов от одного переменного с коэффициентами из любого поля (гл. Ш, § 1). Если R — кольцо главных идеалов и е — делитель единицы этого кольца (п. 1), то любой элемент а£ R можно представить в виде α = α е-1 е. Такое разложение элемента а называется тривиальным. Если для элемента ρ φ О кольца R нетривиальных разложений не существует (т. е. из равенства p=cd всегда следует, что с или d — делитель единицы), то ρ называется неразложимым или простым' элементом (например, простое число в кольце целых чисел, многочлен, неприводимый над данным полем (гл. III, § 3, п. 7), в кольце всех многочленов с коэффициентами из этого поля).
274 ГЛ. IV. ОБЩАЯ АЛГЕБРА [5 ' В кольце главных идеалов всякий отличный от нуля элемент является произведением простых элементов. Если при этом а = ριρι ...ps = qxq^ ...qt — два разложения элемента а на простые множители (не являющиеся делителями единицы), то s=t и pi совпадают с qj с точностью до порядка нумерации и до множителей — делителей единицы. 4· Прямые суммы колец. Если аддитивная группа произвольного кольца R (п. 1) разложена в прямую сумму своих подгрупп Аа (§» 1, п. 10), где α пробегает некоторое множество индексов, причем каждое Аа является двусторонним идеалом (п. 3) кольца Rt то говорят, что кольцо R разложено в (двустороннюю) прямую сумму. Если дано какое-то множество колец Ra> то всегда можно построить кольцо, являющееся двусторонней прямой суммой идеалов, изоморфных Ra. Для этого нужно построить абелеву группу, являющуюся прямой суммой подгрупп Ra, изоморфных аддитивным группам колец Ra (§ 1, п. 10), и определить на ней умножение по формуле (аар α'α/ζ /?β/, ί=1,..., η, причем некоторые из элементов ач или ач могуг быть и нулями); произведение aai аа( находим, пользуясь правилом умножения в кольце Rai. б. Фактор-кольца. Пусть R — произвольное кольцо, А — его двусторонний идеал. Тогда можно построить фактор-группу (§ 1, п. 8) аддитивной группы кольца /?(п. 1) по подгруппе, состоящей из всех элементов идеала А. Если в множестве всех смежных классов г-\-А(г£ /?), являющихся элементами этой фактор-группы, ввести еще вторую операцию, умножение, по правилу (г-|-Л)(г'-|-,4) = /т'4-Л (г, г* ζ R), то получится кольцо, называемое фактор-кольцом кольца R по двустороннему идеалу А (обозначение: R/A). Пример. Фактор-кольцо кольца всех целых чисел по идеалу А, состоящему из всех четных чисел, содержит два элемента: смежный класс α0=ζιΟ^-Α=·Α и смежный класс α, = 1 +А Эти эле· менты складываются по правилу а0 + а0 = а0, а0 4- at = at + а0 = at at + at =s α0 и умножаются по правилу а0а0 = α0, a0at = ata0 = a0t αχαχ s α 1#
1] § 3. ПОЛЯ. ТЕЛА 275 Если каждому элементу г кольца R поставить в соотрет- ствие определяемый им смежный класс г + Л по двустороннему идеалу А, то это даст гомоморфное отображение (п. 2) кольца R на фактор-кольцо R/A, ядром которого будет являться идеал А (п. 2). Если кольцо R гомоморфно отображено на какое-то кольцо Q и А — ядро этого гомоморфизма, то А необходимо является двусторонним идеалом кольца R, а фактор-кольцо RjA изоморфно Q (теорема о гомоморфизмах колец). § 3. Поля. Тела 1. Поля (см. [5]). Полем называется коммутативное кольцо (§ 2, п. 1), состоящее не только из нуля, в котором для любого элемента а Φ 0 и любого элемента Ъ существует ровно один такой элемент х, что ах = Ь. Элемент χ называется частным от деления элемента b на элемент а (обозна- чение: лг= —1 · Примерами полей служат: кольцо всех рациональных чисел, кольцо всех действительных чисел, кольцо всех комплексных чисел. Все комплексные числа, являющиеся корнями многочленов с рациональными коэффициентами, также образуют поле, называемое полем алгебраических чисел. Кольцо всех целых чисел полем не является. Но всякое его фактор-кольцо (§ 2, п. 5) по идеалу, состоящему из всех чисел, кратных некоторому простому числу р, является полем (поле классов вычетов по модулю р). Еще пример поля — все дробно-раци- f(x) ональные функции ) \, где/(дг) и g(x) — многочлены с дей- ствительными коэффициентами, причем g(x) φ 0. Всякое поле обладает единицей (§ 2, п. 1). Для любого отличного от нуля элемента поля существует обратный ему элемент (§ 2, п. 1). Множество всех отличных от нуля элементов поля образует относительно умножения, определенного в поле, абелеву группу (§ 1, п. 1) (мультипликативную группу поля). Никакое поле не содержит делителей нуля (§ 2, п. 1). Единственными идеалами поля (§ 2, п. 3) являются нулевой идеал и само поле. Множество с двумя алгебраическими операциями (§ 1, п. 1), изоморфное полю (§ 2, п. 2), само является полем. Всякое
276 ГЛ. IV. ОБЩАЯ АЛГЕБРА [1 гомоморфное отображение одного поля в другое (§ 2, п. 2) является или изоморфизмом, или отображением, переводящим все элементы поля в* нуль. Если некоторое целое положительное кратное единичного элемента е поля Ρ пе=е-\-е+ ...-\-е (п слагаемых) равно нулю, то наименьшее целое положительное число ρ со свойством pesszO называется характеристикой поля Р;р всегда является простым числом. Если никакое целое положительное кратное единичного элемента поля Ρ нулю не равно, то Ρ называется полем характеристики нуль. Пример поля характеристики ρ — поле классов вычетов по модулю р, пример поля характеристики нуль — любое числовое поле (например, поле всех действительных чисел). Множество Ρ элементов поля Ρ называется подполем этого поля, если оно само является полем по отношению к тем операциям, которые определены в Ρ; Ρ тогда и только тогда является подполем поля Р, когда оно вместе с любыми двумя элементами а, Ъ содержит также α + ft, ab, a — ft*) и ί (если ft^O). Если Ρ— подполе поля Р, то Ρ называется расширением поля Р. Поле, не имеющее никаких подполей, кроме него самого, называется простым полем. Примеры простых полей — поле классов вычетов по модулю р, поле всех рациональных чисел. Всякое поле характеристики ρ содержит подполе, изоморфное (§ 2, п. 2) полю классов вычетов по модулю р, а всякое поле характеристики нуль содержит подполе, изоморфное полю -всех рациональных чисел. Если в поле Ρ даны подполе Ρ и множество элементов Ν, то наименьшее подполе Р" поля Р, содержащее Ρ и Ν, называется полем, полученным присоединением к полю*Рг множества N (обозначение: Ρ" χ=Ρ(Ν)). Поле Ρ(Ν) состоит из всех элементов, получающихся из элементов поля Ρ и множества N путем сложения, вычитания, умножения и деления, и является пересечением (см. введение) всех подполей поля Р, содержащих Ρ и N. Если множество N состоит из одного элемента а, то Р" называется простым расширением поля Р. Если при этом* α является корнем некоторого многочлена/(х) с коэффициентами из поля Ρ (гл. III, § 1), то P"=siP(a) *) α —ft —элемент, являющийся решением уравнения Ь + х=*а4
Ч § 3. ПОЛЯ. ТЕЛА 277 называется простым алгебраическим расширением поля Я', а элемент α называется алгебраическим относительно Р\ если же не существует многочлена */(*) с коэффициентами из Я', корнем которого был бы элемент а, то Ρ* = Я' (а) называется простым трансцендентным расширением поля Я', а элемент α называется трансцендентным относительно Р. Если простое алгебраическое расширение Я'(а) поля Ρ полу· чено присоединением к. нему элемента а, являющегося корнем многочлена f(x) степени η с коэффициентами из Я', неприводимого над полем Я* (гл. III, § 3, п. 7), то каждый элемент поля Я'(а) однозначно записывается в виде ^о Ч™ αια Η~··· ...-{- ап_г α11"* -|- αΛ_ι а*"1, где я0, ..., ял_1 — элементы поля Я'. Если Я'(η) — простое трансцендентное расширение поля Я', то каждый его элемент имеет вид~~у где /(η) и #(η) -φ О— какие-то многочлены от η с коэффициентами из поля Я'. Пример 1. Простое алгебраическое расширение поля рацио· нальных чисел, полученное присоединением к нему числа α = γ2 , состоит из всех чисел вида a + £8j/2~+c У*~, где а, Ь, с — рациональные числа. Пример 2. Поле всех комплексных чисел является простым алгебраическим расширением поля всех действительных чисел, полученным из него присоединением корня i многочлена хг +1. Пример 3. Поле всех дробно-рациональных функций вида ~~» где / (х) и g(x)—многом лены с рациона льны ми коэффициентами о ν*/ (g(x)zfiQ)t является простым трансцендентным* расширением поля рациональных чисел. Если f(x)— многочлен с коэффициентами из поля Я (гл. III, § 1), то всегда существует такое расширение Я поля Я, что f(x) является произведением многочленов первой степени с коэффициентами из ^/(jc) = Oi(jp — αϊ).·. ...(χ — αΛ), где 0β€ Λαι € Я,4= Ι,...,/i. Подполе поля Я, полученное присоединением к полю Ρ элементов аь..., ал, называется полем разложения многочлена f(x) (аь..., а„— корни f{x)). Если все корни любого многочлена с коэффициентами из поля* Я лежат уже в самом поле Я, то поле Я называется алгебраически замкнутым. Примерами алгебраически замкнутых полей являются: поле всех комплексных чисел, поле алгебраических чисел.
278 ГЛ. IV. ОБЩАЯ АЛГЕБРА Ρ Если каждый элемент некоторого расширения Ρ поля Ρ является алгебраическим относительно Я, то поле Ρ назы- вается алгебраическим расширением по ля Р. Всякое простое алгебраическое расширение поля Ρ является алгебраическим расширением. Для любого поля существует такое алгебраическое расширение, которое является алгебраически замкнутым полем, т. е. уже дальнейшего алгебраического расширения не допускает (теорема Штейница). 2. Тела. Телом называется ассоциативное кольцо (§ 2, п. 1), состоящее не только из нуля» в котором для любого элемента α ψ О и любого элемента Ъ существуют такой элемент χ и такой элементу, что ax=bt ya=b. Отличие тела от поля состоит в том, что умножение в теле не- обязано- быть ком· мутативным. Пример тела, не являющегося полем, — тело кватернионов (§ 4). Иногда в определение дела требование ассоциативности кольца не включают. § 4. Алгебры Кольцо А (§ 2, п. 1) называется алгеброй над полем Ρ (§ 3), если его аддитивная группа (§ 2, п. 1) есть вектор· ное пространство ([34], стр. 58) над полем Ρ и если умножение в А связано с умножением на элементы из Ρ фор· мулой α (α*)=(αα)* = α(α£) (а,Ь £ Α,αζ Ρ) ([34], стр. 23). Если векторное пространство, которое служит аддитивной группой алгебры Л, является я-мерным ([34], стр. 58), то число η называется ракгом алгебры А. Алгебры конечного ранга называются также гиперкомплексными системами. Если алгебра А является кольцом Ли (§ 2, π 1), то она называется алгеброй Ли ([19], стр. 379). Если какая-то алгебра является не только кольцом, но даже телом, она называется алгеброй с делением. Пример 1. Множество всех векторов трехмерного пространства, в котором векторы складываются и умножаются на числа обычным образом, а произведением двух векторов является их векторное произведение, есть алгебра Ли над полем действительных чисел. Π ρ и м е ρ 2. Множество всех квадратных матриц я-го порядка с комплексными элементами, в котором обычным образом опреде-
§ 4. АЛГЕБРЫ 279 лены операции сложения и умножения матриц н операция умножения матрицы на комплексное число (гл. И, §1, п. 1), является алгеброй ранга я2 над полем комплексных чисел. Пример 3. Все комплексные числа относительно обычных операций сложения и умножения комплексных чисел и обычной операции умножения комплексных чисел на действительные числа образуют алгебру с делением ранга 2 над полем действительных чисел. Пример 4. Всякое поле является алгеброй ранга 1 над самим собой. Если векторное пространство над полем Р, служащее аддитивной группой алгебры Λ, имеет базис еи...,еп ([34], стр. 56), то достаточно знать, чему равны произведения элементов этого базиса друг на друга, чтобы знать, чему равно произведение любого элемента алгебры А на любой другой ее элемент (если a, b £ А,' причем а== <Χι^ι Η— · · · ...+ ал*д, 6 = ^1 + ... + βΛ^Λ(α/,ρ<ζ/>,ί=1»...Μτοβ* = = <*ιΜ + «itaft + · · · + αιΡ/Α*/ι + «$1***1 + · · · + a/tfW)· Отсюда — задание алгебры конечного ранга таблицей умно· женин, где для любых двух элементов еь ej базиса векторного пространства, служащего аддитивной группой алгебры» указывается линейная комбинация элементов этого базиса, равная произведению e^j. Пример 5. Если в алгебре всех; комплексных чисел над полем действительных чисел в качестве базиса взять элементы 1, /, то таблица умножения будет выглядеть так: 1 ι 1 1 г / i —1. Пример 6. Если в алгебре всех квадратных матриц /г-го порядка над полем комплексных чисел в качестве базиса взять матрицы Еу{1> jcsl,...jii), где на пересечении /-й строки и /■го столбца стоит единица» а остальные элементы—нули, то произведение в этой алгебре будет задаваться таблицей умножения ( Еи при ./=*, ад*-\0 nPH^fc
280 ГЛ. IV. ОБЩАЯ АЛГЕБРА Если умножение элементов базиса ассоциативно или коммутативно, то и вообще умножение, определенное в алгебре, соответственно ассоциативно или коммутативно. Алгебра, аддитивной группой которой служит ч 4-мерное, векторное пространство над полем действительных чисел с базисом .1, i, /, k и в которой умножение задано таблицей умножения 1 ί J k 1 1 ι J , ft ι ι —1 —ft J I I ft -1 —i ft ft -J I -i. называется алгеброй кватернионов. Это — некоммутативная, но ассоциативная алгебра с делением. Ее элементы называются кватернионами. Они однозначно записываются в виде ζ sss α · 1 + pi -f- V + &*> гДе α» Ρ» Τ» * — действительные числа. Кватернион 5 = α · 1 —$i — τ/ — bk называется сопряженным с ζ; ζ2 = α* + β*+ϊ* + & =| ζ |* (обобщение квадрата модуля комплексного числа). Обратным для кватерниона ζ Φ 0 является кватернион ζ~ν = * . Поле действительных чисел, поле комплексных чисел и алгебра кватернионов являются единственными ассоциативными алгебрами с делением конечного ранга над полем действительных чисел (теорема Фробениуса) ([16], стр. 368). Две алгебры Л и Л' над одним и тем же полем Ρ называются изоморфными, если между их элементами можно установить взаимно однозначное соответствие, которое дает изоморфизм колец А и Ά' (§ 2, п. 2), причем если элементу α £ А соответствует элемент d £ А\ то для любого α £ Ρ элементу а а соответствует α of. Говорят, что алгебра А над полем Ρ гомоморфно отображена в алгебру С над тем же полем, если кольцо А гомоморфно отображено в кольце С (§ 2, п. 2), причем если элементу α £ А соответствует элемент с £ С, то при любом α ζ Ρ элементу а а соответствует элемент ас.
π § б. СТРУКТУРЫ 281 Пример 7. Алгебра всех комплексных чисел над полем действительных чисел изоморфна алгебре всех квадратных матриц второго порядка вида I ) с действительными элементами α, β. Подкольцо В (§ 2, п. 3) алгебры А над полем Ρ называется подалгеброй этой алгебры, если его аддитивная группа (§ 2, п. 1) является подпространством ([34], стр. 58) пространства, служащего аддитивной группой алгебры А. Если подалгебра В является левым, правым или двусторонним идеалом кольца А (§ 2, п. 3), то она называется соответственно левым, правим или двусторонним идеалом алгебры А. Множество β элементов алгебры А тогда и только тогда является левым идеалом этой алгебры, когда оно вместе с каждыми двумя элементами Ьх и Ьг содержит их разность Ьх — Ь<ь и вместе с каждым элементом Ъ содержит также произведение аЪ любого элемента αζΑ на элемент Ъ и произведение ab любого элемента α поля Ρ на элемент Ь. Пример 8. В алгебре кватернионов кватернионы вида α·1 + + (М образуют подалгебру (изоморфную алгебре всех комплексных чисел над полем действительных чисел). Пример 9· В алгебре всех квадратных матриц второго порядка над полем комплексных чисел матрицы вида!* Л образуют левый идеал. Пример 10. Во всякой алгебре с единицей е ( § 2, п. 1) над полем Ρ (состоящей не только из нуля) совокупность всех элементов вида οι, где αζΡ, является подалгеброй, изоморфной полю Р. Если В—двусторонний идеал алгебры А над полем Р, то можно взять фактор-кольцо А/В (§ 2, п. б). Если в этом фактор-кольце ввести операцию умножения на элементы из поля Ρ по правилу a(a+5) = aa + JB (αζ Ρ, αζ Α), то получится алгебра над полем Р, называемая фактор-алгеброй, алгебры А по идеалу В. § б· Структуры 1. Частично упорядоченные множества. Множество 5 называется частично упорядоченным, если для некоторых его элементов а, Ь определено соотношение а^Ь (словами: «а меньше или равно Ь»9 или «а предшествует £», или «а содержится в *»), причем выполнены условия: 1) всегда а^а;
282 ГЛ. IV. ОБЩАЯ АЛГЕБРА Ρ 2) из а^Ь и Ь^а следует а = Ь (т. е. элементы а и Ъ совпадают); 3) из a^b, b^c следует а^с (транзитивность). Если а^Ь, но афЪ, то пишут а<^Ь. Вместо а^Ь пишут также Ь^а μ говорят: «Ь больше или равно а», или *Ь следует за а», или <Л содержит я»; вместо a<CJ> пишут также Ь^>а. Если Ь^>а и в данном частично упорядоченном множестве нет элемента χ со свойством b^>x^>at то говорят, что Ъ покрывает я. Пример 1. Множество S состоит из всех подмножеств А, £,. ·. некоторого множества Μ (включая пустое множество)» причем считается, что А^В, если каждый элемент подмножества А Лежит также и в В (пустое множество считается содержащимся в любом другом). Пример 2. Множество S состоит иэ^всех подгрупп- А, В,... , некоторой группы О (§ I, н. 4), а соотношение А^В означает, что А содержится в В. Пример 3. Множество S состоит из всех натуральных чисел, а соотношение а^Ь означает, что. число а является делителем числа Ь. Пример 4. Множество S состоит нз всех действительных однозначных функций ([34], стр. 48), определенных на отрезке [0, 1], причем считается, что/(x)^g(x), если в каждой точке отрезка [0, lj/(*) принимает значение, меньшее или равное значению g{x) в этой точке. Частично упорядоченное множество называется упорядо* ченным (или линейно упорядоченным); если для всякой пары его элементов а, Ъ имеет место или a^bt или Ь^а. Например» множество всех действительных чисел, где а^Ь означает, что число а меньше или равно числу Ь. Если множество 5 частично упорядочено (упорядочено) при помощи некоторого отношения ^, то при помощи этого же отношения ^ оказывается частично упорядоченным (упорядоченным) и любое его подмножество. Если между элементами двух частично упорядоченных множеств 5 и S' можно установить такое взаимно однозначное соответствие (§ 1, п. 2), что для любых а, Ъ £ 5 и соответствующих им элементов а', Vζ S' из соотношения а^Ъ всегда следует соотношение d^V и наоборот, то множества S и У называются изоморфными. Изоморфизм частично упорядоченного множества с самим собой называется авто» морфизмом.
2] δ б. структуры 283 Пример 5. Если S—множество всех действительных чисел и а^Ь означает, что число а меньше или равно числу Ъг то автоморфизмом множества S будет» например» соответствие а —► а + 2. Если в частично упорядоченном множестве 5 заменить заданную упорядоченность на противоположную, т. е. считать, что Ь<,ау тогда и только тогда, когда при прежней упорядоченности было a^bf то получится опять частично упорядоченное множество, называемое двойственным множеству & Пример 6. Множество S*, состоящее из всех подмножеств А В,... некоторого множества Λί, где считается, что А^В9 если каждый элемент подмножества В лежит также в Д двойственно множеству S примера 1. 2. Основные определения ([2]). Частично упорядоченное множество S(n. 1) называется структурой, если для любых двух его элементов а, Ъ существуют элементы с, d £ 5 со свойствами: 1) с^а9 с^Ь; 2) если <f^.a и <f ^Ъ (с* ζ S), то необходимо сг^с\ Ъ)Л^ау d^b; 4) если uOah dr^b (d' £S)t то необходимо d'^d. Элемент с называется пересечением элементов а и Ъ (обозначение: с=а(~)Ь), элемент d называется их объединением (обозначение: d=a \Jp). Пример 1. Частично упорядоченные множества примеров 1 — 4 предыдущего пункта являются структурами, причем в первом из них пересечениями и объединениями подмножеств множества Μ являются их пересечения и объединения в теоретико-множественном смысле ([34], стр. 23—-24), во втором примере пересечением двух подгрупп является их пересечение в теоретико-множественном смысле, а объединением является подгруппа, порожденная (§ 1, п. 5) двумя данными подгруппами, в третьем примере пересечением является общий наибольший делитель, а объединением — общее наименьшее кратное двух заданных чисел, в четвертом примере пересечением (объединением) функций f{x) и g(x) является функция; принимающая в каждой точке отрезка [0, 1] наименьшее (наибольшее) из значений, принимаемых в этой точке функциями f(x) и g(x). · В любой структуре 5 для всякого конечного множества ее элементов aif...,an существуют такие элементы с, d, что c^a^d (i=l, ...,η) и если c^ty (i=l,...,η), с'ζ 5 (или dr 5* л,·· i = 1....»п> dr ζ S\ то с' ^ с (соответственно d'^d); с-называется пересечением, d—объединением элементов аь...,ап. Если пересечение и объединение существуют для каждого множества элементов структуры 5 (может быть, и бесконечного)» то структура 5 называется полной.
284 ГЛ. IV. ОБЩАЯ АЛГЕБРА [2 Всякая конечная структура является полной. Примерами полных структур являются также структура всех подгрупп данной группы (пример 1) структура всех подколец (§ 2, п. 3) данного кольца (где для подколец Л, В считается, что А*^В, если А содержится в В). Если в структуре 5 имеется такой элемент а0, что для всякого b£ S имеет, место а0^£, то аф называется нулем структуры 5 и обозначается через 0. Если в «S имеется такой элемент аи что для любого b £ 5 имеет место Ъ ^ ait то at называется едишщей структуры и обозначается через 1. В любой структуре, состоящей из конечного числа элементов, нулем является пересечение, а единицей — объединение всех элементов структуры. В структуре всех подгрупп данной группы нулем является единичная подгруппа (§ 1, п. 4), _ единицей— вся группа. В структуре примера 4 предыдущего пункта ни нуля, ни единицы нет. Подмножество (см. введение) структуры, содержащее вместе с любыми двумя элементами их пересечение и их объединение, называется подструктурой данной структуры. Очевидно, всякая подструктура сама является структурой относительно частичной упорядоченности, заданной во всей структуре. Но подмножество структуры может быть структурой относительно этой же частичной упорядоченности и в том случае, когда оно подструктурой не является. Пример 2. Структура всех нормальных делителей (§ 1, п. 7) произвольной группы О (где для нормальных делителей Н, К считается, что Η ^ а, если Η содержится в К) является подструктурой структуры всех ее подгрупп. Пример 3. Структура всех подгрупп группы (пример 1) не является подструктурой структуры всех подмножеств множества всех элементов этой группы. Две структуры называются изоморфными, если они изоморфны как частично упорядоченные множества (п. 1). Всякое частично упорядоченное множество, изоморфное структуре, само является структурой. Если структура состоит из конечного числа элементов, то для нее .можно построить диаграмму: элементы структуры изображаются точками плоскости так, что если Ь^>а, то точка, изображающая Ь, лежит выше, чем точка, изображающая а\ точки, соответствующие элементам, из которых один покрывает другой (п. 1), соединяются отрезками.
31 § 5/ структуры 285 Пример 4. Пусть группа Q есть прямое произведение (§ 1, п. 10) двух своих циклических подгрупп 2-го порядка (§ 1, п. 4): 0 = {α} Χ {Ъ}. Тогда структура подгрупп группы О имеет диаграмму, изображенную на рис. 1,где Л = {а}, £={£}, С*={аЬ}у £ —единичная подгруппа (§ 1, п. 4). Второе определение структуры. Множество 5называется структурой, если в нем £ определены две алгебраические Рис. 1. операции (§ 1, п. 1), умножение и сложение, ставящие в соответствие всякой паре элементов а,Ь £ 5 их произведение ab и их сумму а-\-Ь, причем эти операции коммутативны и ассоциативны (т. е. ab = baf a + ft=ft + a, a(bc) = (ab)ct α + (* + c) = (a + *)+c), удовлетворяют при всяком α ζ 5 условиям аа = α, α-\-α = α и связаны между собой условием: если ab=at то a-\-b = bf и обратно. Это определение структуры эквивалентно приведенному выше. Для доказательства нужно пересечение и объединение элементов а, Ъ (в смысле первого определения) считать соответственно их произведением и суммой и, наоборот, нужно считать, что а^Ь, если ab=a (в смысле второго определения). 3. Дистрибутивные и дедекиндовы структуры. Если в структуре «9 сложение и умножение связаны законом дистрибутивности, т. е. для любых трех элементов а, Ь, с ζ S (a + b)c = ac + bcf (4.4) то структура 5 называется дистрибутивной. Закон дистрибутивности в структуре может быть выражен также в форме (я-(-<:)(£-{-<:) = aft-{-с. Структура «S тогда и только тогда является дистрибутивной, когда в ней из равенств ac = bct α-J-с = £-{-<? (α, bt с £ S) вытекает равенство а = Ь. Пример 1. Всякая структура, являющаяся линейно упорядоченным множеством (п. 1), дистрибутивна (например» структура всех целых чисел, где а*^.Ь означает, что число а меньше или равно числу Ь). Множества примеров I, 3, 4 il 1 также я§ляются
286 ГЛ. IV. ОБЩАЯ АЛГЕБРА [3 дистрибутивными структурами. Структура всех подгрупп дан· ной группы G дистрибутивна тогда и только тогда, когда G есть или циклическая группа, или объединение возрастающей последовательности циклических групп (§ 1, пп. 4, 5). Всякая подструктура (п. 2) дистрибутивной структуры дистрибутивна. Структура, двойственная (п. 1) дистрибутивной, также дистрибутивна. - Структура тогда и только тогда не является дистрибутивной, когда она содержит подструктуру (п. 2), которая имеет вид одной из двух диаграмм, изображенных на рис 2 и 3. Рис. 2. Рис. 3. Если в структуре .5 равенство (4.4) выполнено при условии, что а^с (а без этого условия может и не выполняться), то структура 5 называется дедекиндовой (или модулярной). Структура 5 является дедекиндовой тогда.и только тогда, когда для любых элементов a, bt с ζ S выполнено равенство (ас + Ь) с = ас + Ьс. Другое необходимое, и достаточное условие дедекиндовости структуры 5: для любых элементов а, Ь, с ζ S из равенства ac = bct a-\-c = b-^-c и 'соотношения а<~Ь должно следовать равенство а = £. Пример 2. Структура всех нормальных делителей произвольной группы является дедекиндовой. Π ρ и м е ρ 3. Дедекиндовой является всякая структура, имеющая диаграмму, изображенную на рис. 2. Всякая подструктура дедекиндовой структуры и структура, двойственная (п. 1) дедекиндовой, сами являются де- декиндовыми структурами·
4] § 6. СТРУКТУРЫ 287 Структура 5 тогда и только тогда не является дедекиндо- вой, когда она содержим подструктуру, имеющую вид диаграммы, изображенной на рис 3. 4. Булевы алгебры. Структура 5, содержащая 0 и 1 (п. 2), называется структурой с дополнениями, если для всякого ее элемента а существует такой элемент Ъ £ S, что af)b=Ota\Jb=l. Дистрибутивная структура (п. 3) с дополнениями называется булевой апгеброй. Структура ^сех подмножеств данного множества (п. % пример 1) Ьсегда является булевой алгеброй. Обратно, всякая к о- н е ч н а я булева алгебра изоморфна (п. 2) структуре всех подмножеств некоторого множества. Произвольная булева алгебра изоморфна подструктуре структуры всех подмножеств некоторого множества. В булевой алгебре дополнение к каждому элементу единственно; дополнение к пересечению (объединению) двух элементов равно объединению (пересечению) дополнений к каждому из этих элементов. В любой булевой алгебре £ справедлив бесконечный дистрибутивный закон: если для бесконечного множества элементов..., αα,... из 5 в 5 существует объединение \Jaa и для некоторого элемента αζ S в S а4 существует объединение \J (a (~\ яа), то а «п<и«.)=и(«гк)· а а Подалгеброй булевой алгебры называется ее подструктура (п. 2), содержащая вместе с каждым элементом а его дополнение d. Если в булевой алгебре назвать произведением двух элементов их пересечение, а суммой элементов я, Ь назвать элемент (af]b) \J (a'f\b) (οι и V — дополнения соответственно к элементам а и Ь\ то получится коммутативное кольцо с 1 (§2, п. 1), для каждого элемента а которого 2а = 0 и а*=а (так называемое булево кольцо с единицей). Обратно, если/в булевом кольце с единицей считать а^Ь, если b=abf то получится булева алгебра, где а(\Ъ—аЬ (в смысле умножения, определенного в кольце) и a\Jb = = а -{- b — ab.
БИБЛИОГРАФИЯ 1. Александров П. С.» Введение в теорию групп» №, Учпедгиз, 1938. 2. Б и ρ к г о φ Г., Теория структур, М., ИЛ, 1952. 3. Б о χ е ρ Μ., Введение в высшую алгебру, М., Гостехиздат, 1933. 4. Бронштейн И. Н. и СемендяевК. Α., Справочник по математике для инженеров и учащихся втузов, Гостехиздат, изд. 7, 1957. 5. Ван-дер-Варден Б. .^Современнаяалгебра, ч! 1 и 2, Гостехиздат, 1947. йГантмахер Ф. Р., Теория матриц, Гостехиздат, 1953. 7. Г а н τ м а х е ρ Φ. Р. и К ρ е й н Μ. Г., Осцилляциониые матрицы и ядра и малые колебания механических систем, Гостехиздат, изд. 2, 1950. 8. Г е л ь φ а н д И. М., Лекции по линейной алгебре, Гостехиздат, изд. 2, 1951. 9. Д ж е к о б с о н Н., Теория колец, ИЛ, 1947. 10. К а г а н В. Ф., Основания теории определителей, Государственное издательство Украины, Одесса, 1922. 11. К у рош А. Г., Курс высшей алгебры, изд. 6, Физматгнз, 1959. 12. К у ρ о ш А. Г., Теория групп, нзд. 2, Гостехиздат, 1953. 13. Лялин Е. С, Курс высшей алгебры, изд. 2, Учпедгиз, 1955. 14. Μ а л ьце в А. И., Основы линейной алгебры, изд. 2, Гостехиздат, 1956. 15. Μ е й м а н Η. Η., Некоторые вопросы расположения корней полиномов, УМН, 4:6 (34), 1949. 16. О к у н е в Л. Я., Высшая алгебра, изд. 4, Гостехиздат, 1949. 17. О к у и е в Л. Я., Кольцо многочленов и поле рациональных функций, Энциклопедия элементарной математики, кн. 2, Гостехиздат, 1951. 18. О к у н е в Л. Я., Основы современной алгебры, Учпедгиз, 1941. 19. Π о н τ ρ я г и н Л. С, Непрерывные группы, изд. 2, Гостехиздат, 1954. 20. Проскуряков И. В., Сборник задач по линейной алгебре, Гостехиздат, 1957. 21. Смирнов В. И., Курс высшей математики, т. I, изд. 16, Гостехиздат, 1956. 22» Современная математика для инженеров, под редакцией Беккен- баха Э. Ф., ИЛ, 1958.
БИБЛИОГРАФИЯ 289 23. С у ш к е в и ч А. К., Основы* высшей алгебры, изд. 4, Гостехиз- дат, 1941. 24. Фаддеев Д. К. и С о м и и с к и й И. С, Сборник задач по высшей алгебре, изд. 2—6, Гостехиздат, 1949—1955. 25. Фаддеев Д. К. и ФаддееваВ. Н., Вычислительные методы линейной алгебры, Физматгиз. I960. 26. Фрезер Р., Дункан В., К о л л а р Α., Теория матриц и ее приложения к дифференциальным уравнениям и динамике, ИЛ, 1950. 27. Чеботарев Н. Г., Основы теории Галуа, ч. 1, ОНТИ, 1934. 28. Чеботарев Н. Г., Теория Галуа, ОНТИ, 1936. 29. Чеботарев Н. Г. и Μ е й м а н Н. Н., Проблема Рауса — Гур- вица для полиномов и целых функций, Труды Матем. ин-та им. В. А. Стеклова, т. XXVI, изд. АН СССР, 1949. 30. Ч е з а р о Э., Элементарный учебник алгебраического анализа и исчисления бесконечно малых, ч. 1, ОНТИ, 1936. 31. Шапиро Г. М., Высшая алгебра, изд. 4, Учпедгиз, 1938. 32. Ш и л о в Г. Е., Введение в теорию линейных пространств, Гос- технздат, 1952.* 33. Шмидт О. Ю., Абстрактная теория групп, изд. 2, ОНТИ, 1933. 34. Математический анализ (функции, пределы, ряды, цепные дроби), СМБ, М., Физматгиз, 1961.
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ Ay — алгебраическое дополнение элемента 20 А — ассоциированная матрица 119 Ъ — ассоциированный определитель 3d А (<**» У) — билинейная форма 138 λ — взаимная (или присоединенная) матрица 120 Ь — взаимный (или присоединенный) определитель 38 id) — двусторонний идеал» порожденный элементом а кольца 273 {аи ait..., ап) — диагональная матрица 89 D(f) — дискриминант многочлена f(x) 189 Ε — единичная подгруппа 254 е — единичный элемент группы» кольца, поля 250, 271, 275 Ап — знакопеременная группа /t-й степени 254 Ια Φ (*) — индекс Коши рациональной функции Ф(х) в пределах от а до Ь 229 А (г, х)'— квадратичная форма 138 i>ft — k-Pi ассоциированный определитель 40 bk — k-Pi взаимный (или при- . соединенный) определитель 40 {Аи А%,..., As\ — клеточно-диа- гональная матрица 89 ata%abt^a^ — кон тин у ант 28 А X В — кронекеровское произведение матриц 120 А* ХВ — левое кронекеровское произведение матриц 121 (а)е — левый идеал, порожденный элементом а кольца 273 £А g+,Α —ΐ левый смежный кйаСс.по Шдавулпе Д определяемый элементом g 257 (<*и βΐ2 ·.. α,Λ ?1.?":ν??1^)?- матРи- \*мат · ·· апп/ ца л-го порядка 12, 67 (ац)т>п — матрица размеров т Χ η 67 i4 , ) — минор матри- цы Л 44 Λί/y — минор элемента ац 20 S (αχ?1 χζ*... хял) — моногенный многочлен с высшим членом а*?1*.1..**** 243 <*(*)«(/(.*), #(*)) — наибольший общий делитель (н. о. д.) многочленов f(x) и g(x) 179 0 — нулевой элемент группы, кольца 250, 270 в"1 — обратный элемент к элементу а группы, кольца, поля а и b — объединение элементов структуры 283 \А\ — определитель матрицы А 16
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ 291 ЛИ flu . #21 <*22 · •*2ft *Л1 «*Л2 « иял > l<tyl? — опреде- (: литель я-го порядка 16 а П Ь — пересечение элементов структуры 283 {Λί} — подгруппа, порожденная множеством элементов Μ 255-256 {Л,£,...} — подгруппа, порожденная подгруппами А% В, ... 256 g~kAg — подгруппа, сопряженная с подгруппой А 260 2 3456\ Λ - « . Λ «J — подстановка 14 ,651423/ (163) (25) (4) — подстановка, записанная в циклах 15 Ρ(Ν) — поле, полученное присоединением к полю Ρ множества N 276 АХ'В — правое кронекеровс- кое произведение матриц 121 (а)г — правый идеал, порожденный элементом а кольца 273 Ag,A + g— правый смежный класс по подгруппе А, определяемый элементом g 257 •—α — противоположный элемент для элемента а группы 250 А + В,\\ Аа — прямая сумма подгрупп данной группы или идеалов данного кольца 266, 274 А X В, Д Аа — прямое произ- ^ ведение групп 266 Ар — р-п ассоциированная матрица 118 #(/> g) — результант многочленов /(*) и g(x) 188 Sn — симметрическая группа я-й степени z51 Л* — сопряженная матрица 123 «*—*? + *$ + ... + *£ — степенные суммы 245 (*» Λ (*и h) — транспозиция 13, Л' — транспонированная матрица 18 О/А — фактор-алгебра, факторгруппа, фактор-кольцо 261, 274, 281 (βι, fls,..., ak) — цикл (циклическая подстановка) 263 {&} — циклическая группа, порожденная элементом g 255 W{a).— число перемен знака в ряду значений многочленов ряда Штурма при лг = а ^ — эквивалентность матриц 55, 82 «ь σ2» ...» σ« — элементарные симметрические многочлены 242
АЛФАВИТНЫЙ УКАЗАТЕЛЬ Автоморфизм группы 252 — частично упорядоченного множества 282 Адамара неравенство 43—44 обобщенное 45—46 Алгебра 278 — кватернионов 280 — конечного ранга 278 — Ли 278 — с делением 278 Алгебраическая замкнутость 11 — операция 249 Алгебраический элемент 277 Алгебраическое дополнение минора 29 элемента 20 — число 275 Алгоритм Евклида 180 — Рауса 231 Аннулирующий многочлен матрицы 95 Арифметический корень из матрицы 133 Ассоциативность операции 249 Беэу теорема 177 обобщенная 91 Билинейная форма, см. форма билинейная Бине—Коши теорема 35 Булева алгебра 287 Булево кольцо 288 Бюдана—Фурье теорема 219 Вандермонда определитель 26 Варинга формулы 245» 246 Взаимно однозначное соответствие 252 — простые многочлены 181 Виета формулы 187 Возрастающая последовательность подгрупп 256 Высший член многочлена 241 Гамильтона—Кэли теорема 94 Гамильтонова группа 261 Ганкелева матрица 172 — форма 172 Гаусса метод 47 Гиперкомплексная система 278 Главная матрица пучка 164 — (первая) диагональ матрицы 12 Главные неизвестные 48, 60 Главный вектор пучка 163 — идеал 273 — минор матрицы 57 системы линейных уравнений 59 Гомоморфизм алгебр 280 — групп 253 — колец 272 — полей 276 Гомоморфное отображение естественное 262 Горнера схема 176 Границы корней многочлена 214 Группа 249, 250—251 — абелева 251 * неразложимая 268 — аддитивная 250 кольца 270 — гамильтонова 261 — знакопеременная 254 — кваэициклическая (типа /?°°) 257 — Клейна четверная 265 — коммутативная 251 — конечная 251 — мультипликативная 250 поля 275
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 293 Группа подстановок 262 < импримитивная 264 интранзитивная 264 примитивная 264 транзитивная 264 — простая 260 — симметрическая 251 — с конечным числом образующих 256 — типа р°° (кваэициклическая) 257 · — циклическая 255 бесконечная 255 Гульденфингера правило 151 Гурвица критерий 239 — матрица 234 Гурвица многочлен 238 — определитель 235 Двойственность 283 Дедекиндова структура 286 Декарта теорема 217 , усиление 219 Декремент подстановки 15 Деление без остатка 176 — матричных многочленов 91 — с остатком 176 Делители миноров 85 Делитель единицы 271 — нуля 270 Диаграмма 284 Дискриминант 189 — квадратичной формы 139 · Дистрибутивность 269 Длина цикла 263 Дополнение в структуре 287 Дробно-рациональная функция 210 Евклида алгоритм 180 Единица группы 250 — кольца 271 — поля 275 — структуры 284 Жордана клетка 106 Жорданова матрица 106 обобщенная 114 — форма матрицы 107 Закон ассоциативности 249 — дистрибутивности 269 Закон инерции квадратичных форм 149 — коммутативности 251 Значение многочлена от жорда- иовой матрицы 109 от матрицы 76 Идеал алгебры (левый, правый, двусторонний) 281 — кольца, главный 273 (левый, правый, двусторонний) 272 —, порожденный данным множеством 273 Изоморфизм алгебр 280 — групп 252 — колец 271 — структур 284 — частично упорядоченных множеств 282 Инвариантные множители 83 Инверсия 13 Индекс подгруппы 258 Индексы инерции 150 — Коши 229 Интерполяционная формула Лаг- ранжа 191 Ньютона 192 Каноническая квадратичная форма 141 — λ-матрица 83 — матрица 55 Каноническая форма λ-матрицы 83 Канонический вид билинейной формы 148 Кардано формула 195 Квадратичная форма 138 второго рода 169 вырожденная 139 знакоопределенная 152 невырожденная 139 положительно определенная 152 полуопределенная 152 сингулярная 139 эрмитова 170 Квадратичные формы конгруэнтные 141 Кваэиестественная форма матрицы 113
294 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Кватернионы 280 Клейна группа (четверная) 265 Клетка Жордана 106 Кольцо 269 — ассоциативное 269 — без делителей нуля 270 — булево 288 — главных идеалов 273 — коммутативное 269 — Ли 270 — простое 273 — с единицей 271 Коммутативность операции 251 Компонента элемента в прямом множителе 266 Континуант 28 Корень из матрицы арифметический 133 — кратности k 185 — многочлена 185 — простой 185 Коши индексы 229 — теорема 258 Крамера правило 52 Кратность корня 185 Критерии неприводимости многочленов 206—209 — существования диагональной формы матрицы 101—102 Критерий Гурвица 239 — Кронекера—Капелли 59 — Льенара и Шипара 239 — подобия матриц 98 — Полна 206 — Рауса 238 — Сильвестра 153 — Эйзенштейна 206 Кронекера—Капелли критерий 59 Кронекеровское произведение матриц 120, 121 определителей 43 Кубическая резольвента 200 Кэли таблица 251 — теорема 254 — формулы 135 Лагранжа метод 142 — теорема 258 — формула (интерполяционная) 191 Лапласа теорема 30 Левостороннее разложение труп· пы по подгруппе 258 Лексикографическая запись многочлена 241 Линейная комбинация строк 18 — форма 151 . Линейно упорядоченное множество 282 Линейные преобразования неизвестных 68 λ-матрица над полем 82 Льенара и Шипара критерий 239 Маклорена способ 214—215 Матрица 11 — ассоциированная 119 — билинейной формы 138, 169 — верхняя треугольная 80 — взаимная 120 — вырожденная 71 — ганкелева 172 — Гурвица 234 — диагональная 89 — единичная 71 — жорданова 106 обобщенная 114 — инволютивная 96 — каноническая 55 — квадратичной формы 138 — квадратная 12 — квазиестественная 113 — клеточно-диагональная 89 — кососимметрическая 129 — косоэрмитова 129 — многочленная 82 — невырождейная 71 — неособенная 71 — нижняя треугольная 80 — нильпотентная 94 — нормальная 136 каноническая 136 — нулевая 69 — обратная 71 для произведения матриц 72 — ортогональная 122 каноническая 124 — особенная 71 — р-я ассоциированная 118 — положительно определенная
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 295 Матрица приведенная присоединенная 97 — присоединенная 95, 120 — расширенная 59 — симметрическая 129 — системы уравнений 59 ■— скалярная 76 — с неотрицательным спектром 133 — сопровождающая 110 — сопряженная 123 — с положительным спектром 133 — ступенчатая 54 — треугольная 80 — унитарная 123 — характеристическая 92 — эрмитова 129 — якобиева 116 нормальная 117 Матрицы перестановочные 76—79 — подобные 98 — эквивалентные 54 Метод Гаусса 47 — квадратичных форм 224 — Лагранжа 142 — приведения к треугольному виду 22 — рекуррентных соотношений 24 f специальный случай 25 — Штурма 220 — Якоби 143 Методы вычисления обратной матрицы 72—74 Минимальный многочлен матрицы 95 Минор дополнительный 29 — Λ-го порядка 29, 44 — произведения матриц 70 — элемента 20 Многочлен 175 — Гурвица 238 — матричный 90 — моногенный 242 — неприводимый 204 — нулевой степени 175, 241 — от η переменных 240 — приводимый 204 Многочлен симметрический 242 — характеристический 92—94 Множество' линейно упорядоченное 282 — упорядоченное 282 — частично упорядоченное 281 Множитель многочлена /(-кратный 205 Модуль матрицы 133 Модулярная (дедекиндова) структура 286 Наибольший общий делитель (и. о. д.) двух многочленов 179 нескольких многочленов 185 , отыскание 179, ' 180. 205 Независимые циклы 15, 263 Неравенство Адам ара 43—44 обобщенное 45—46 — Сильвестра 57 Неразложимый (простой) элемент кольца 273 Норма матрицы 133 Нормальная λ-матрица 83 — фррма λ-матрицы 83 — якобиева матрица 117 Нормальный вид квадратичной формы 147, 149 — делитель группы 259 Нормированный (единичный) вектор 122 Нуль группы 250 — кольца 270 — структуры 284 Ньютона способ 215 — формула (интерполяционная) 192 — формулы для степенных сумм 245 Область импримитивности 264 — устойчивости 240 — целостности 270 Образующие элементы группы 256 Обратимые λ-матрицы 86 Обратная подстановка 251 Обратный элемент в группе 250
296 АЛФАВИТНЫЙ Обратный элемент в кольце 271 в поле 275 Общее решение системы линей· ных уравнений 49, 60 Общий делитель многочленов 179 Объединение возрастающей по· следовательности подгрупп 256 — элементов (в структуре) 283 Однородный многочлен (форма) 241 Определитель 16—18 — ассоциированный 39 Л-й 40 — Вандермонда 26 обобщенный 27 — взаимный 38 Л-й 40 — второго порядка 17 — Гурвица 235 — кососимметрический 20, 41, 42 — я-го порядка 16 — обратной матрицы 72 — окаймленный 31 — присоединенный 38 т Л-й 40 — произведения матриц 70 — псевдосимметрический 41» 42 — симметрический 41 — ступенчатый 31 — третьего порядка 17 — Якоби 28 Ортогональная матрица 122 каноническая 124 , геометрический смысл 127—128 Ортогонально подобные мат· рицы 123 — эквивалентные квадратичные формы 161 Ортогональное преобразование переменных 154 Ортогональные векторы 122 Ортонормированная система векторов 122 Основная теорема алгебры комплексных чисел 185 об абелевых группах с конечным числом образующих 268 УКАЗАТЕЛЬ Основная теорема о разложении рациональных дрорей на простейшие 211 о симметрических многочленах 243 -Основные (элементарные) симметрические многочлены 242 Остаток от деления многочленов 176 Отделение кратных корней 186 Отрицательная степень элемента группы 254 Отрицательно определенная квадратичная форма 152 Пара форм 162 Пересечение (в структуре) 283 Перестановка 13 Перестановочные матрицы 76—79 Побочная (вторая) диагональ матрицы 12 Подалгебра 281 — булевой алгебры 288 • Подгруппа 254 — единичная 254 — инвариантная 259 — истинная 254 — , порожденная данным множеством элементов 255 . —, — заданными подгруппами 256 — циклическая 255 Подкольцо 272 Подобные матрицы 98 Подполе 276 Подстановка 14 — обратная 251 — циклическая 262 Подструктура 284 Покрытие (в структуре) 282 Поле 275 — алгебраически замкнутое 277 — алгебраических чисел 275 — классов вычетов 275 — простое 276 — разложения многочлена 277 — характеристики нуль 276 Полином 175 Полная структура 283 Полярные разложения матрицы
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 297 Порождение подгруппы подгруппами 256 элементами 255 Порядок конечной группы 251 — матрицы 12 — элемента 255 Правило Гульденфингера 151 — Крамера 52 — Саррюса 17 — треугольников 17 — Фробениуса 151 Правостороннее разложение группы по подгруппе 258 Приведение квадратичной формы к главным осям 157 Приведение к каноническому виду билинейной формы 148 квадратичной формы 141—142 многочлена 2-й степени 157 нескольких квадратичных форм' (одновременное) 157 — эрмитовой квадратичной формы к главным осям 172 Приведенная система уравнений 66 Приведенное квадратное уравнение 194 Признаки эквивалентности λ-мат- риц 87 Присоединение элемента к полю 276 Продолжение прямого разложения 266 Произведение матриц 67—68 — матрицы на число 69 — многочленов 175 от η переменных 242 — подстановок 251 Производная многочлена 178 Пространство коэффициентов 240 Противоречивая система линейных уравнений 47 Прямая сумма групп 265» 267 колец 274 Прямое (кронекеровское) произведение матриц 120 определителей 43 Прямое произведение групп 265» 267 — слагаемое 266 Прямой множитель 266 Пучок квадратичных форм 163 Пфаффов агрегат 42 Равенство многочленов 175, 241 Разложение группы по подгруппе 258 *" — многочлена на линейные множители 203, 277 по степеням разности 178ч — на множители (в кольце главных идеалов) 274 Разность многочленов 175 Разрешимость уравнений в радикалах 201 Ранг алгебры 278 — билинейной формы 138, 169 — квадратичной формы 139 — матрицы 54, 57—58 — произведения матриц 57 — суммы матриц 57 Расширение алгебраическое 278 — поля 276 — простое 276 алгебраическое 276 трансцендентное 277 Рауса алгоритм 231 — критерий 238 — схема 231 Рауса—Гурвица теорема 234 Рациональная дробь 210 несократимая 210 правильная 210 - простейшая 211 — функция от матрицы 77 Рациональные корни многочлена (способ нахождения) 202—203 Регулярный матричный многочлен 90 — пучок квадратичных форм 163 — случай (в схеме Рауса) 231 Результант 188 Решение системы линейных уравнений 46 Руффини—Абеля теорема 201 Ряд Фибоначчи 29 — Штурма 220 на отрезке 220
298 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Саррюса правило 17 Свободные неизвестные 48, 60 Сигнатура 150 Сильвестра критерий 153 — неравенство 57 — теорема 40 — фррмула 41 Симметрический многочлен 242 , выражение через элементарные 243 Система алгебраических уравнений 246 — линейных уравнений 46 неопределенная 47 несовместная 47 определенная 47 — образующих 256 Скалярное произведение векторов 122 След матрицы 93 Смежный класс (левый, правый) 257 Собственные векторы матрицы 92 — значения матрицы 92 Совместная система линейных уравнений 47 Сокращение в кольце 271 Сопряженные подгруппы 260 — элементы группы 260 Спектр кронекеровского произведения матриц 122 — матрицы 92 — многочлена от матрицы 94 Способ Маклорена нахождения границы действительных корней многочлена 214—215 — Ньютона нахождения границы действительных корней многочлена 215 — Феррари решения уравнений 4-й степени 200 — Эйлера решения уравнений 4-й степени 200 Степени матрицы 75 Степенные суммы 245 , выражение через элементарные симметрические многочлены 244—245 Степень многочлена 175 от л переменных 241 Степень члена многочлена от η переменных 241 — элемента 254 Структура 283, 285 — дедекиндова 286 — дистрибутивная 285 — модулярная 286 — полная 283 — с дополнениями 287 Ступенчатый вид системы линей»· ных уравнений 48 Сумма матриц 67 — многочленов 175 от л переменных 241 Схема Горнера 176 — Рауса 231 Таблица Кэли. 251 ,. — умножений, (для алгебры конечного ранга) 279 Тело 278 — кватернионов 278 * Теорема алгебры комплексных чисел (основная) 185, — Beiy 177 , обобщенная 91 — Бине—Коши 35 — Бюдана—Фурье 219 — Гамильтона—Кэли 94 — Декарта 217 , усиление 219 — Коши 258 — Кэли 254 — Лагранжа 258 — Лапласа 30 — об абелевых группах с конечным числом образующих (основная) 268 Теорема о гомоморфизмах групп 262 колец 275 разложении рациональных дробей на простейшие (основная) 211 ранге матрицы 56 симметрических многочленах (основная) 243 — Рауса—Гурвица 234 — Руффини—Абеля 201 — Сильвестра 40 -*· Фробениуса 280
АЛФАВИТНЫЙ УКАЗАТЕЛЬ 299 Теорема Фробениуса о ганкеле- вых формах 173 — Штейница 278 — Штурма 220 — Шура 128 — Якоби об индексах инерции 150 Тождество Якоби 270 Транспозиция 13, 263 Транспонирование 18 — произведения матриц 70 Трансформирование элементом группы 98, 260, 264 Трансцендентный элемент 277 Треугольная система линейных уравнений 49 Узлы 0-линии 117 Умножение матриц 67—68 — определителей 34 — подстановок 251 Унимодулярные λ-матрицы 86 Унитарная матрица 123 Унитарно подобные матрицы 123 Упорядоченное множество 282 Уравнение биквадратное 201 — вековое 92 — второй степени 194 — двучленное Щ — третьей степени 195 — четвертой степени 199 Фактор-алгебра 281 Фактор-группа 261 Фактор-кольцо 274 Феррари способ 200 Фибоначчи ряд 29 Форма билинейная 137—-138 второго рода 168 — — кососимметрическая 148 — — полярная 138 симметрическая 138 эрмитова 170 — квадратичная 138 — матрицы естественная нор· мальная 111 — (однородный многочлен) 241 Формула Кардано 195 — Лагранжа (интерполяционная) Формула Ньютона (интерполяционная) 192 — Сильвестра 41 Формулы Варинга (1-я и 2-я) 245, 246 — Виета 187 — Кэли 135 — Ньютона для степенных сумм 245 — Шура 75 Фробениуса правило 151 — теорема 280 о ганкелевых формах 173 Фундаментальная система решений 63 Характеристика поля 276 Характеристическая матрица 92 Характеристические миноры системы линейных уравнений 59-60 — числа (корни) 92 кососимметрической матрицы 130 косоэрмитовой матрицы 130 ортогональной матрицы 123 симметрической матрицы 130 унитарной матрицы 123 эрмитовой матрицы 130 Характеристический многочлен 92—94 Характеристическое уравнение 92 — — пучка форм 163 Цикл 15, 262 Циклическая группа 255 — подгруппа 255 — подстановка 262 Циркулянт 36 — косой 37 Частично упорядоченное множество 281 Частное матриц 77 — от деления многочленов 176 элементов поля 275 — решение 60
300 АЛФАВИТНЫЙ УКАЗАТЕЛЬ Четвертая группа Клейна 265 Четная перестановка 13 — подстановка 14 Числовое поле 11 Штейница теорема 278 Штурма метод 220 — ряд 220 — теорема 220 Шура теорема 128 — формула 75 Эйзенштейна критерий 206 Эйлера способ (решения уравнений 4-й степени) 200 Эквивалентные квадратичные формы 141 Эквивалентные λ-матрицы 82 — матрицы 54 — (равносильные) системы линейных уравнений 47 Элемент алгебраический 277 — бесконечного порядка 255 — кольца простой (неразложимый) 273 — конечного порядка 255 Элемент противоположный 250 — трансцендентный 277 Элементарные делители 87—88 клеточно-диагоиальной матрицы 90 — λ-матрицы 86 — (основные) симметрические многочлены 242 — преобразования λ-матрицы 82 матрицы 54 системы линейных уравнений 47 Эндоморфизм группы 254 Эпиморфизм группы 253 — кольца 272 Эрмитова билинейная форма 170 — квадратичная форма 170 — матрица 129 Ядро гомоморфизма 253, 272 Якоби метод 143 — теорема 150 — тождество 272 Якобиева матрица 116 Якобиевы определители 28