Text
                    ЗНАКОМСТВО
С ВЫСШЕЙ
МАТЕМАТИКОЙ
Л.С. ПОНТРЯГИН
АЛГЕБРА
э

Л. С. ПОНТРЯГИН ЗНАКОМСТВО С ВЫСШЕЙ МАТЕМАТИКОЙ • АЛГЕБРА МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОИ ЛИТЕРАТУРЫ 1987
ББК 22.143 П56 УДК 512.64(0.23) Понтрягин Л. С. П56 Знакомство с высшей математикой: Алгеб- ра.— М.: Наука, Гл. ред. физ.-мат. лит., 1987.— 136 с. 20 к. 100 000 экз. «Знакомство с высшей математикой» — серия небольших на- учно-популярных книг, предназначенная школьникам старших клас- сов, интересующимся математикой. Две книги из этой серии уже были опубликованы. Это «Метод координат» (1977 г. и 1987 г.) и «Анализ бесконечно малых» (1980 г.). «Алгебра» — третья книга в этой серии. В ней приведены основные результаты алгебры, вклю- чая теорию определителей. Этот раздел составляет основную часть книги. Кроме того, в книге содержится раздел, посвященный кор- ням многочленов и комплексным числам. Для школьников старших классов, интересующихся математи- кой. Может быть полезна также преподавателям средней и высшей школы. nJZ~0^4_ 43.87 ББК 22.143 Рецензент член-корреспондент АН СССР И. Р. Шафаревич © Издательство «Наука». Главная редакция физико-математической литературы, 1987
ОГЛАВЛЕНИЕ Предисловие . . ....................................... 4 Глава 1. Теория определителей........................... 5 § L Векторные пространства , . .....................5 § 2. Линейные отображения векторных пространств и матрицы , » * *.....................................12 § 3. Определители ......................21 § 4. Решение системы линейных*уравнений.............33 § 5. Элементарные преобразования матриц.............42 § 6. Ранг матрицы , ................................52 § 7* Евклидовы векторные пространства...............57 Глава 2. Корни многочленов , . » .......................66 § 8. Комплексные числа . »..........................66 § 9. Основная теорема алгебры................... . 73 § 10. Алгоритм Евклида..............................81 § И. Наибольший общий делитель двух многочленов . . 85 Глава 3. Приведение матриц к каноническому виду . ... 94 § 12. Связь между линейными отображениями и матрицами 96 § 13. Многочлены от матриц и отображений............101 § 14. Жорданова форма матрицы......................111 § 15. Квадратичные формы ..........................116 § 16. Экспонента квадратной матрицы.............. . В;3 Глава 4. Примеры .....................................127
ПРЕДИСЛОВИЕ Несколько лет тому назад я решил написать серию небольших книг под названием «Знакомство с высшей математикой», предназначенную для школьников, инте- ресующихся математикой. Две книги из этой серии «Ме- тод координат» и «Анализ бесконечно малых» уже опуб- ликованы. «Алгебра» является третьей книгой в этой се- рии. В ней приведены основные результаты алгебры, включая теорию определителей. Этот раздел составляет главную часть книги. Кроме того, книга содержит раз- дел, посвященный корням многочленов и комплексным числам. При этом правила перемножения комплексных чисел, взятых в тригонометрической форме, доказывают- ся без использования формул тригонометрии для коси- нуса суммы и синуса суммы. Большую работу при редактировании этой книги проделал С. М. Асеев, за что я выражаю ему благодар- ность.
Глава 1 ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ § 1. Векторные пространства В этом параграфе будет рассмотрено важнейшее для линейной алгебры понятие векторного пространства. Определение 1. Последовательность х = (х1, х2..................хп) (1) из п действительных чисел, расположенных в определен- ном порядке, указанном в формуле (1), называется п-мерным вектором. Совокупность Ап всех «-мерных векторов называется п-мерным векторным простран- ством. Числа х1, х2........................хп называются координатами вектора х (см. (1)). Вектор считается равным нулю и обозначается через О, если все его координаты равны нулю. Произвольный вектор х из Ап может быть умножен на действительное число с. Для получения этого произ- ведения каждая координата вектора х умножается на число с. Таким образом, сх = (сх1, сх2, схп). (2) Каждые два вектора х (см. (1)) и У = (f/1. У2..уп) из Ап могут быть сложены. При этом координаты их складываются, так что * + У = (х1 + у1, х2 4- у2.хп + уп) (3) .{см. гл. 4, пример 1). В
А) Если Х1г *2. ...» *Л (4) — совокупность из k векторов пространства Ап, то, поль- зуясь операциями (2) и (3), можно составить их линей- ную форму: Z = С% + С2Х2 + ... + ckxh, (б) где с1, с2..ск — действительные числа. В дальнейшем мы будем пользоваться сокращенными7 обозначениями для суммирования. Именно, если в одно- члене один и тот же обозначенный греческой буквой ин- декс встречается один раз вверху и один раз внизу, то это означает сумму по всем значениям этого индекса. Таким образом, формула (5) переписывается в виде Z — саха. Совокупность из k векторов (4) считается линейно независимой, если вектор, определенный формулой (5), обращается в нуль лишь при условии, когда с1 = с2 — ... = ск — 0. В противном случае, т. е. если существуют такие числа с1, с2, (6) не все равные нулю, что вектор г, определяемый фор- мулой (5), обращается в нуль, совокупность (4) назы- вается линейно зависимой. Если к совокупности линейно зависимых векторов (4) присоединить еще несколько векторов Xfe+i, Xk+2, • •, Xt, то расширенная совокупность *1, Х2....xt будет линейно зависимой. Именно, если совокупность коэффициентов (6) осуществляет линейную зависимость векторов (4), то мы имеем соотношение саха + 0жй+1 + ... + 0*г = 0, а = 1, ..., k, причем не все числа последовательности с1, с2, ..., ск, ck+l = 0, ..., с1 = 0 равны нулю. Если в векторном пространстве Ап, состоящем из всех векторов вида (1), рассмотреть те векторы, для ко- торых i-я координата обращается в нуль, то мы получим также векторное пространство Д'1-1, но размерности 6
п—1, которое называется координатным подпростран- ством пространства Ап. Докажем теперь следующее важное предложение. В) Совокупность (4) векторов п-мерного простран- ства Ап при k> п всегда линейно зависима. Для доказательства достаточно рассмотреть случай k = n-j-l. Доказательство будем вести индук- тивно. Отметим прежде всего, что для п = 1 утвержде- ние В) справедливо. Пусть х, у — два вектора простран- ства А1, причем * = (*'), у = (у1). Если числа х1, у1 оба равны нулю, то мы имеем соот- ношение сх + dy = О при произвольных end, так что в этом случае векторы х и у линейно зависимы. Если хотя бы одно из чисел х1, у1 не равно нулю, то мы имеем следующее соотно- шение: у'х — х1у = 0. Таким образом, при п = 1 утверждение В) верно. Пусть теперь *1» *2> • • • > ^«+1 (7) — совокупность из п + 1 векторов пространства А". Со- средоточим внимание на последних координатах всех векторов совокупности (7). Если все эти координаты равны нулю, то совокупность векторов (7) принадлежит к (п—1)-мерному пространству и, согласно предполо- жению индукции, линейно зависима. Допустим теперь, что хотя бы один вектор, например хп+ъ имеет послед- нюю координату, отличную от нуля. Тогда для каждого вектора X/ совокупности (7) при / п можно подобрать такое число dj, что вектор у/, определяемый формулой у/ = х/ —d/Xft+i, и, (8) имеет последнюю координату, равную нулю, и потому лежит в (п— 1)-мерном векторном пространстве. Следо- вательно, по предположению индукции векторы yi, у2, .. ..., уп линейно зависимы. Таким образом, существует совокупность чисел с’, с\ ..., сп, 7
(причем не все эти числа равны нулю) такая, что имеет- ся соотношение сауа — 0» а = 1, .. •, п. Из этого и из формулы (8) вытекает саха — (cada) хп+1 = 0, а = 1, ..., п. Таким образом, совокупность векторов (7) линейно за- висима. Итак, предложение В) доказано. Базис векторного пространства С) Обозначим через е, вектор из А", все координаты которого равны нулю, за исключением i-й координаты, которая равна 1, т. е. положим «! = (!, 0..0), е2 = (0, 1, .... 0), е„ = (0,0, ...» 1). Ясно, что вектор х (см. (1)) записывается в виде х = хаеа, а = 1, ..., п, причем коэффициенты х1, х2, ..., х", входящие в эту формулу, однозначно определены вектором х. Таким образом, каждый вектор х в векторном пространстве Ап выражается в виде линейной формы относительно век- торов eh е2, еп, (9) причем коэффициенты этой линейной формы определены однозначно. Система векторов, обладающая этим свой- ством, называется базисом векторного пространства Ап. Построенный нами базис (9) не является единственным. Оказывается, что любая линейно независимая система векторов е{, е'2, е'п, (10) содержащая п векторов пространства Ап, является ба- зисом этого пространства. Действительно, пусть х — произвольный вектор про- странства Ап. Тогда векторы <.....< линейно зависимы, поскольку содержат п + 1 вектор (см. В)). Таким образом, мы имеем соотношение сх 4* с“е' = 0, а=1,..., п, (11) 8
причем в этом соотношении не все коэффициенты равны нулю. В частности, коэффициент с не может быть равен нулю, так как если бы он был равен нулю, то оказалось бы, что векторы системы (10) линейно зависимы. Поль- зуясь этим, разделим соотношение (И) на величину—с. Для того чтобы не вводить новые обозначения, будем считать просто, что с = — 1, а остальные коэффициенты сохраним. Таким образом, получаем х = сае'а, а = 1, .... п. Если бы вектор х мог быть записан аналогично через систему (10), но с другими коэффициентами, т. е. если бы имело место соотношение * = dae'a, а = 1, ..., п, то, вычитая последнее соотношение из предыдущего, мы получили бы соотношение (с“ — da) е' = 0, а — 1, .... п, что ввиду линейной независимости векторов системы (10) приводит к равенству с1 = d‘, D) Пусть х{, х2, .... хр (12) — некоторая линейно независимая система векторов из Ап. Если р <. п, то систему (12) можно дополнить век- торами хР+1.....хп так, что система *1, *2.....Хр, Хр+1, ...» Хп линейно независима. Докажем утверждение D). Если предложение D) не- верно, то, присоединяя к системе (12) вектор ei (см. С)), мы получим расширенную систему в1> Ху ...» хр обязательно линейно зависимую. Вектор ei ненулевой. Поэтому среди векторов системы (12) обязательно най- дется вектор xq, выражающийся в виде линейной ком- бинации через остальные векторы расширенной совокуп- ности. Значит, любой вектор пространства Ап можно вы- разить в виде линейной комбинации векторов Cii хь • • •> i, x^-j-i, • • •» Хр, 9
Исключим вектор xq из расширенной совокупности век- торов и добавим к ней вектор е2. Из линейной незави- симости векторов е2 следует, что среди векторов Xi.....хд-1г xq+lt хр обязательно найдется вектор, который можно исключить. Продолжая этот процесс, мы придем к выводу, что любой вектор пространства А" можно представить в виде линейной комбинации векто- ров еь .... ер, что невозможно, так как векторы (9) линейно независимы. Следовательно, предложение D) верно. Из предложения С) видно, что данное в начале па- раграфа определение «-мерного векторного пространства Ап при помощи координат вектора (см. (1)) не является инвариантным, так как оно зависит от случайно выбран- ного базиса (9), а базисов в пространстве Ап существует бесчисленное множество. Поэтому мы дадим другое ин- вариантное определение n-мерного пространства Ап. Определение 2. Множество А элементов назы- вается векторным пространством, если в нем определены две операции: сложение и умножение на действительные числа, причем выполнено условие: если с и d—два чис- ла, а х, у, г — элементы пространства А, т. е. три век- тора, то имеют место соотношения (x + y) + z = x + (y + z)> х + у = у + х, (с + d) х = сх 4- dx, с(х + у) = сх + су, с (dx) — (cd) х, 1 • X — X. Кроме того, предполагается, что имеется нулевой вектор О, удовлетворяющий условиям х 4- 0 = х, 0х = 0. При помощи операций, имеющихся в векторном про- странстве Д, можно составить линейную комбинацию для произвольной системы из векторов Х{, ..., ха, т. е. построить вектор z = саха, а — 1, .... п, где с1, ...» сп — действительные числа. ю
Таким образом, мы можем ввести понятие линейной зависимости и линейной независимости векторов, как это быдо сделано раньше (см. С) Ё) Если в векторном пространстве А имеется п ли- нейно независимых векторов, но нет п + 1 линейно неза- висимых векторов, то считается, что векторное простран- ство А имеет размерность п и оно обозначается через Ап. Выбирая в пространстве Ап п линейно независимых векторов, мы получим базис и при помощи него коор- динатную запись любого вектора. Векторное подпространство F) Пусть А — векторное пространство и В — такое подмножество его векторов, что наряду с двумя векто- рами х vty из В в В входит также х -f- у, а наряду с век- тором х в В входит и его произведение на произвольное действительное число, т. е. вектор сх. Тбгда В, очевидно, представляет собой векторное пространство в силу тех операций, которые имеются в А. Множество В назы- вается векторным подпространством пространства А. Если векторное пространство А имеет конечную размер- ность п (см. Е)), то его подпространство В имеет раз- мерность, не превосходящую п. G) Пусть А" — n-мерное векторное пространство, а Вр и Ся—два его векторных подпространства размер- ности р и q соответственно. Если для векторных под- пространств Вр и Сч нулевой вектор является единствен- ным общим вектором, а р + q — п, то векторное про- странство А" распадается в прямую сумму своих вектор- ных подпространств Вр и Ся. Именно, каждый вектор х из Ап представляется в виде суммы x = y + z, где у — вектор из Вр, а г — вектор из Сч, причем слагае- мые у и z однозначно определены вектором х. Для доказательства этого утверждения выберем в подпространстве Вр базис #2» • • •» &pf состоящий из р элементов, а в подпространстве Ся базис £р+2> •••, еп, И
.состоящий из q элементов. Объединяя эти две последо- вательности векторов, мы получим последовательность ......еп. (13) Докажем, что эта совокупность составляет базис про- странства Ап. Так как число векторов системы (13) рав- но размерности пространства Ап, то достаточно дока- зать, что векторы системы (13) линейно независимы. До- пустим, что имеет место противоположное, именно, имеет место соотношение саео = 0, а=1, ..., п, (14) причем не все коэффициенты с1, входящие в это соотно- шение, равны нулю. Обозначим через у сумму первых р членов суммы (14) и через z сумму остальных членов. Тогда получим два вектора у и z, причем оба они одно- временно не могут обращаться в нуль, так что хотя бы один отличен от нуля. При этом соотношение (14) пере- писывается в виде p + z = 0, или, иначе, у = — Z, где у <= Вр, —z е Сч. Таким образом, мы приходим к выводу, что вектор- ные подпространства Вр и С’ имеют общий вектор, от- личный от нуля, что противоречит предположению. Таким образом, система (13) является базисом про- странства Ап и каждый вектор х из А" может быть запи- сан в виде х = с“ео, а = 1, .... п. Обозначая через у сумму первых р слагаемых последней суммы, а через z— сумму остальных слагаемых, прихо- дим к выводу, что x = ^4-z, где у^Вр, Сч. Таким образом, утверждение G) до- казано. § 2. Линейные отображения векторных пространств и матрицы В этом параграфе будет показано, как линейное ото- бражение одного векторного пространства в другое за- дается матрицей. 12
Здесь будем пользоваться сокращенными обозначе- ниями для суммирования (см. § 1, А)). Определение 3. Пусть Ар и В9— два векторных пространства размерности р и q соответственно. Отобра- жение <р пространства В4 в пространство Ар, т. е. такое отображение, которое каждому вектору у^В9 ставит в соответствие вектор Х = фУ из пространства Ар, называется линейным, если выпол- нено следующее условие: каковы бы ни были векторы Ui, у2 из В9 и два действительных числа с1, с2, имеем ф (с'ух + с2у2) = С'ЩЦ 4- с2фу2. Множество всех у е В9, переходящих при отображе- нии ф в нулевой вектор пространства Ар, называется яд- рол* линейного отображения ф. Согласно общепринятым обозначениям оно записывается в виде ф_,0. Непосред- ственно проверяется (я здесь этого делать не буду), что ядро отображения ф есть векторное подпространство пространства В9. Точно так же легко проверяется, что совокупность всех векторов х е А” вида фр, где у е В9, есть векторное подпространство пространства Ар. Оно обозначается через <рВ9. Если фВ’ = Ар, то про отобра- жение ф говорят, что оно есть отображение на простран- ство Ар. Заметим, что множество D действительных чисел яв- ляется одномерным векторным пространством. В случае если Ар есть множество D, отображение ф называется линейной формой, заданной на пространстве В9. Если ф и % — два линейных отображения простран- ства В9 в пространство Ар, а с, d — два действительных числа, то определяется линейное отображение Ф = сф 4- d%, которое задается формулой ФУ = сфу4-йх?- U5) Легко проверяется, что отображение ф, заданное этой формулой, является линейным отображением простран- ства В9 в пространство А°. Таким образом, множество всех линейных отображений пространства Вч в про- странство Ап является векторным пространством. Позже мы покажем, что это векторное пространство имеет ко- нечную размерность pq. 13
Допустим, что наряду с упомянутыми векторными пространствами Ар и Вр имеется еще третье векторное пространство Сг размерности г и дано линейное отобра- жение т) векторного пространства С в векторное про- странство В4. Тогда мы можем определить линейное отображение векторного пространства Сг в векторное пространство Ар, ставя в соответствие каждому его век- тору z вектор х = фТ]г. (16) Тот факт, что отображение, заданное формулой (16), является линейным, непосредственно проверяется. Оно по определению считается произведением отображений т) и <р и записывается как фц. Если имеется еще и чет- вертое векторное пространство Ds размерности $ и х есть линейное отображение пространства Ds в простран- ство Сг, то, кроме произведения фт], определено произве- дение трс, а также два произведения (фТ])«, ф(тр<)- Легко проверяется, что оба отображения, выписанные в предыдущей строке, совпадают между собой. Именно, имеет место равенство (фп)«==ф(п«)> (17) т. е. произведение отображений ассоциативно. Действи- тельно, оба выражения, стоящие в равенстве (17), мож- но описать следующим образом. Если и — произвольный вектор из пространства Ds, то к вектору и применяем отображение х. К полученному вектору х« применяем отображение т]. К полученному вектору грш применяем отображение ф, так что оба выражения, стоящие в ра- венстве (17), получаются последовательным примене- нием к вектору и отображений х, т), ф. Отсюда и выте- кает равенство (17). Расскажем теперь, как отображение ф можно запи- сать в координатной форме при помощи таблицы, назы- ваемой матрицей. А) Пусть е1( е2.ер, (18) /р /2..fq (19) — базисы пространств Ар и Bq соответственно. Вектор ф/у имеет в базисе (18) некоторые координаты, завися- щие от номера /, так что этот вектор можно записать 14
в виде ^! = хрел, а=1..........р. (20) Если У = 0 = 1> •••,<?, есть некоторый вектор из В*, то <ру — х = х“еа, а=1........р. (21) Умножая соотношение (20) на у! и суммируй его по /, получим х°еа = х“уРеа, а=1, ...,р, 0 = 1, .... q. (22) При этом мы использовали линейность отображения <р. Из соотношения (22) следует соотношение х1 = х1^, 0 = 1,..., q. (23) Последняя формула дает нам выражение координат век- тора x — tpy в базисе (18) через координаты вектора у в базисе (19). Таким образом, это соотношение пред* ставляет собой координатную запись отображения <р. Числа xj, i = 1.....р; j= 1, ..., q, естественно запи- сать в виде прямоугольной таблицы х} х'2 ... x'q *1 «2 ••• 4 (24) xf Хр ... XPq Эта таблица называется матрицей. Число ее строк рав- но р, а число столбцов равно q. Кратко мы будем го- ворить, ч'го (24) есть матрица размеров (р,q). Таким образом, р есть высота матрицы, q — ее ширина. Вся матрица (24) обозначается обычно одной буквой. В дан- ном случае обозначим ее через X. Кратко можно записать Х = Цх*|[, i=l.......р; /=1..........q. Таким образом, линейное отображение <р определяет матрицу X и само определяется этой матрицей, если заданы базисы (18), (19) обоих пространств Ар и Вч (см. гл. 4, примеры 2—4). Если ф — линейная форма, заданная на Вч, т. е. отображает векторное пространство Вч в векторное пространство D действительных чисел, то число q>y 15
записывается в форме = ₽ = 1, ...» <7. (25) Если ф и х — два линейных отображения простран- ства В4 в пространство Ар, с и d—два действительных числа, то определено отображение <р (см. (15)). Пусть отображениям <р, ф, х соответствуют матрицы X, У, Z. Положим x-iwi' r=i»;i. z=k;i- В силу (23) мы имеем (<P!f)“ = x^P, р = 1, = р = 1, .... р; (%»)“ = ф3. р=1, .... р. В силу (15) получаем х\ = ср) + dzlr Если положить X = cY + dZ, то получим Х = ||^ + ^||. Последняя формула определяет умножение матрицы размеров (р, q) на число и суммирование двух матриц этого размера. Из нее видно, что пространство всех мат- риц размеров (р, q) есть векторное пространство раз- мерности pq. В) Пусть Ар, В4, Сг — три векторных пространства указанных размерностей, <р — линейное отображение пространства Вч в пространство Ар, а ф— линейное ото- бражение пространства Сг в пространство В’. Пусть «I, е2, ер; flt f2.....f9; glf g2.....gr — базисы рассматриваемых трех векторных пространств Ар, Вр и Сг соответственно. В этих базисах отображению ф соответствует некоторая матрица У = ||у{|| размеров (q, г). Именно, если 2 = z^gy, y = ^Z = ytffi, то в силу предложения А) имеем У1 = У1^ (26) и матрица /=1, ..., q; fe=l, .... г, соответст- вует отображению ф. Если теперь Х = |х)| — матрица, 16
соответствующая отображению <р, то в силу А) х‘ = х^. (27) Подставляя координаты вектора у из формулы (26) в последнюю формулу, получаем xi = х^4- Таким образом, отображению <рф соответствует матрица, задаваемая формулой Z=1......Р' ₽ = !.•••. <7! k = \.....г. (28) Матрица (28) считается произведением матриц X и Y и записывается в виде XY, так что мы имеем *г=кИ11- . (29> Здесь отображению <р соответствует матрица X разме- ров (р, q), а отображению ф соответствует матрица Y размеров (q, г). Отображению <рф соответствует матрица XY размеров (р, г). Здесь мы установили операцию ум- ножения матриц X и Y в случае, если матрица X имеет ширину q, а матрица У —высоту q. Говорят, что мат- рица XY образуется путем перемножения строк матрицы X на столбцы матрицы У. Если наряду с пространствами Ар, В4, С рассматри- вается еще четвертое пространство Ds и отображение % пространства Ds в пространство Сг, причем отображе- нию % соответствует матрица Z размеров (г, s), то опре- делены произведения матриц XY, YZ, (XY)Z, X(YZ). Поскольку имеет место ассоциативность при перемно- жении отображений (см. (17)), то для соответствующих матриц она тоже имеет место, т. е. мы имеем (XY)Z = X(YZ). Правую часть равенства (27), определяющую коор- динаты вектора х через координаты вектора у, можно трактовать как произведение матрицы X на одностолб- цовую матрицу г/, где $ представляет собой выписанные в виде столбца координаты вектора у, т. е. матрицу раз- меров (q, 1). Само равенство (27) теперь может быть записано в виде * = Х$, 17
где матрица f представляет собой столбец, в котором выписаны координаты вектора х. Она имеет размеры (Р, О- С) Если в предложении А) число q равно числу р, то матрица X, соответствующая отображению <р, имеет размеры (р, р) и является квадратной. Особый интерес представляет случай, когда пространство В’ совпадает с пространством Ар. Тогда матрица X отображения <р пространства Ар самого в себя является квадратной раз- меров (р, р), но при этом выделяется играющая особую роль единичная матрица. Именно, если отображение ср есть тождественное отображение, т. е. имеет место соот- ношение фХ = Х, то мы имеем e/ = cpez, и потому в формуле (20) надо считать f/ = e{ и все числа х], при которых i ф j, равны нулю, а числа х\ равны единице. Такая матрица называется единичной и обозначается через Е. Для ее записи применяется так называемый символ Кронекера. Это (1, i = j, 10, i =5^ /. Таким образом, мы имеем Е = [б'|- Если отображение ф в предложении В) является тожде- ственным отображением пространства В4 — Ар на себя, то ему соответствует матрица У = Е, и из (29) имеем ХЕ — Х. Точно так же, если отображение ср в предложении В) яв- ляется тождественным отображением пространства Вр — Ар на себя, то соответствующая ему матрица яв- ляется единичной матрицей Е, и мы имеем EY = Y. Особо большую роль единичная матрица играет при рассмотрении отображений пространства Ар самого на себя. Если <р — такое отображение, а X — соответствую- щая ему матрица, то мы имеем соотношение ХЕ = ЕХ = Х, 18
так что в множестве всех матриц, описывающих отобра- жение пространства А? в себя, единичная матрица Е играет роль единицы в отношении умножения. Билинейные формы D) Пусть Ап — n-мерное векторное пространство и е1г е2, ...» еп (30) — некоторый его базис. Функция f (х, у) от двух пере- менных векторов х и у пространства Ап называется би- линейной формой, если она является линейной формой относительно каждого из векторов х и у (см. определе- ние 3). Положим (31) Пусть х = хаеа, у = у% — запись векторов х и у в базисе (30). Оказывается, что f (х, у) = аврха/. (32) Числа ац называются коэффициентами билинейной фор- мы f (х, у) в базисе (30). Они естественным образом со- ставляют матрицу, если i принять за номер строки, a j за номер столбца: -4 = ||л«И> «, / = 1, ..п. Таким образом, билинейной форме f(x,y) соответствует в базисе (30) квадратная матрица А порядка и. Если функция f(x,y) не меняется при перестановке ее аргу- ментов, т. е. имеет место соотношение f(x,y) = f(y, х), то билинейная форма f(x,y) называется симметричной. Симметричной билинейной форме f(x,y) соответствует симметричная матрица А, т. е. матрица А, удовлетво- ряющая условию ац = ац. Если в билинейной форме f(x,y) заменить вектор у вектором х, т. е. положить У = х, то мы получим квадратичную форму f(x,x), соот- ветствующую билинейной форме f(x,y). Квадратичная форма f(x, х) является функцией одного вектора х про- странства А". Таким образом, каждой билинейной фор- ме соответствует квадратичная форма. Ясно, что для по- лучения любой квадратичной формы достаточно исполь- зовать лишь симметричные билинейные форм'ы. Если 19
исходная билинейная форма несимметрична, то квадра- тичная форма, соответствующая ей, получается из сим- метричной билинейной формы которая задается формулой f (*> У) = у (f (х, y) + f (у> *))• Если коэффициенты билинейной формы f(x,y) суть ац, то коэффициенты <5,, билинейной формы f(x,y) задаются по формуле йц —~2(aiJ + Я//). Квадратичная форма f{x, х) называется положительно определенной, если она положительна при любом х^=0: f (х, х) > 0 при х =/= 0. Докажем соотношение (32). Так'как f(x,y) есть ли- нейная форма относительно х, то мы имеем f (х, y) = f (х“е а, у) = xaf (еа, у). (33) Далее, так как /(еа, у) есть линейная форма относитель- но у, то мы имеем I («а. у) = f (ва> z/pe3) = У*Ч (еа, ер) = /аар. Подставляя последнюю формулу в формулу (33), полу- чаем формулу (32). Каждой билинейной форме f(x,y) соответствует в ба- зисе (30) матрица А ее коэффициентов. В связи с этим возникает вопрос, нельзя ли выбрать базис (30), т. е. систему координат в пространстве А", таким образом, чтобы матрица А получила наиболее простой вид. Эта задача будет решаться позже для случая симметричных форм или, что то же самое, для случая квадратичных форм. Е) Симметричная билинейная форма / (х, у) двух пе- ременных х и у однозначно определяется соответствую- щей квадратичной формой как функцией одной перемен- ной. В самом деле, мы имем f (х + у, x + y) = f (х, х) + f (х, y) + f(y, x) + f(y, У)- Но. так как f(x, y) — f(y, х), то из этого получаем f(x, y) = ^[f(x + у, х 4- у) — f (х, х) — f (у, у)]. Здесь слева стоит билинейная форма f(x,y), а справа—. квадратичная форма от переменных х, у и х + у. 20
§ 3. Определители В линейной алгебре играют важную роль так назы- ваемые определители или детерминанты. Каждой квадратной матрице Х = |х»|, /=1, .... п-, определенным образом ставится в соответствие некото- рое число D(X), являющееся вполне определенной функ- цией элементов матрицы X. Эта функция D(X) назы- вается определителем или детерминантом матрицы X. Определители обладают.рядом замечательных свойств, которыми и объясняется их роль в алгебре. Сформули- руем заранее свойства а) и Ь), являющиеся основными, а) Пусть «'=(44 •••> 4) — i-я строка матрицы X. Оказывается, что если рассмат- ривать х1 как n-мерный вектор, то определитель D(X) является его линейной формой, т. е. записывается в виде D(Z) = d“4 <х=1, .... г, где коэффициенты этой линейной формы, т. е. числа dl, d2, ...» dn, уже не зависят от элементов i-й строки матрицы X. Ь) Пусть X' — матрица, получающаяся из матрицы X перестановкой местами двух ее строк. Тогда оказы- вается, что D(X') = —D(X), т. е. при перестановке двух строк матрицы X определи- тель ее меняет знак. Если присоединить к этим двум свойствам а) и Ь) еще нижеследующее свойство с), то этими тремя свой- ствами, как мы докажем позже, функция D(X) опреде- ляется однозначно. с) Если Х = Е — единичная матрица, то мы имеем D(£)=l, т. е. определитель единичной матрицы равен единице. Конструктивное определение функции D(X) довольно сложно. Изложению полной конструкции предпошлю не- которое ее описание. 21
Функция D(X) определяется как сумма взятых с оп- ределенными знаками произведений вида <34> где последовательность & = (/i> Ь •••> ]п) состоит из расположенных в некотором порядке нату- ральных чисел а = (1,2, .... п). Таким образом, произведение (34) содержит один мно- житель, взятый из каждой строки, и один множитель, взятый из каждого столбца. Знак, с которым произведе- ние (34) входит в сумму, составляющую D(X), опреде- ляется довольно сложно. Он зависну от того, в каком отношении порядок чисел последовательности b нахо- дится к порядку чисел последовательности а. Перед тем как перейти к описанию выбора знака в произведении (34), дадим формулу для определителя D(X) в случае п = 2. При п = 2 имеем D(X) = x\x22-x^2 (см. гл. 4, пример 5). А) Перестановки. Пусть а —(1,2, ..., п) — последовательность натуральных чисел от 1 до п и 6 = (Л> /2. •••> in) — последовательность тех же чисел, расположенных в каком-то порядке, быть может, и прежнем. Последова- тельность Ь называется перестановкой последователь- ности а. В дальнейших рассмотрениях не играет суще- ственной роли, что последовательность а состоит из первых и натуральных чисел, расположенных в возра- стающем порядке. Важно, что а есть последовательность из и различных символов, расположенных в определенном порядке, а Ъ есть последовательность тех же символов, расположенных также в определенном порядке, быть мо- жет, совпадающем с порядком последовательности а. Последовательность символов b называется перестанов- кой последовательности а. 22
Если (и, v)—произвольная пара символов из после- довательности а (подразумевается, что и и v — два раз- личных символа), то в последовательности b они могут стоять в том же порядке, что ива, или в противопо- ложном. В первом случае говорят, что порядок в после- довательности b на паре (и, о) сохранен, а во втором нарушен. Если число таких пар (u,v), на которых поря- док при переходе от а к b нарушен, четно, то последова- тельность b называется четной перестановкой последо- вательности а, в противном случае — нечетной. Если перестановка b четная, то ей ставится в соответствие число 4-1, если перестановка & нечетная, то ей ставится в соответствие число —1. Это записывается в следующем виде: Согласно определению последовательность а может рас- сматриваться как перестановка последовательности Ь, и потому определено число = Из самого спо- соба подсчета четности или нечетности следует равен- ство Это следует из того, что пару (и, v)' можно брать как в последовательности а, так и в последовательности Ь, и факт нарушения порядка имеет место в обоих случаях. Если последовательность Ь' получается из последова- тельности b путем перестановки в b местами двух сим- волов, то мы будем говорить, что Ь' получена из Ъ пу- тем парной перестановки. Среди парных перестановок следует выделить парные перестановки двух соседних символов. Оказывается, что имеют место четыре следую- щих свойства перестановок: 1) При парной перестановке двух соседних символов в b четность перестановки b меняется на противополож- ную. Таким образом, если Ь' получена из Ь путем пар- ной перестановки соседних символов, то мы имеем 2) Всякая парная перестановка символов последова- тельности Ь может быть получена путем последователь- ного применения нечетного числа парных перестановок 23
соседних символов. Отсюда следует, что при парной пе- рестановке справедлива та же формула (35), что и при парной перестановке соседних символов, т. е. если Ь' по- лучена из b путем парной перестановки, то Н—[т]- 3) Всякая перестановка Ь может быть получена из а путем конечного числа парных перестановок. 4) Если а, Ь и с — три перестановки из п символов, то имеет место формула Й-ИН]. Докажем свойства 1)—4). Докажем 1). В последовательности Ь возьмем два соседних символа Д, jk+i- Если на паре (jk,jk+i) есть нарушение порядка, то на паре (jk+i, jk) его уже не бу- дет, и наоборот, если на паре (/*, /Л+1) нет нарушения порядка, то на паре (Д+ь Д) оно уже будет. Если по- следовательность Ь' получена из последовательности b путем перестановки символов jk и Д+ь то на подсчет числа нарушений порядка может влиять только пара (jk, jk+i); других изменений при переходе от Ь к Ь' не произойдет. Таким образом, свойство 1) доказано. Докажем свойство 2). Пусть jk, ji — два символа из последовательности Ь, подвергающейся парной переста- новке, причем k < I. Отрезок символов в Ь, начинаю- щийся с jk и кончающийся р, заменим символами 1, 2, ..., р — 2, р — 1, р. В этой последовательности произведем парную переста- новку двух последних соседних между собой символов, т. е. чисел р— 1 и р. Тогда получим последовательность 1, 2, ..., р — 2, р, р — 1. В этой последовательности произведем парную переста- новку соседних символов р — 2 и р. Тогда получим по- следовательность 1,2.....р, р — 2, р — 1. Передвигая таким образом число р налево, мы поста- вим его в конце концов на первое место, т. е. получим последовательность р, 1, 2, ...» р — 2, р — 1, 24
произведя при этом р — 1 парную перестановку сосед- них символов. Теперь точно таким же способом в по- следней последовательности перегоним символ 1 в конец последовательности, производя парные перестановки со- седних символов. При этом мы должны будем произ- вести р — 2 парных перестановки соседних символов. После этого произойдет парная перестановка символа 1 и символа р в результате 2р — 3 парных перестановок соседних символов. Итак, утверждение 2) доказано. Утверждение 3) будем доказывать индуктивно по числу п. Пусть Ь — та перестановка, которую мы хотим получить из последовательности а путем конечного числа парных перестановок. В последовательности Ь имеется число п. Путем одной парной перестановки его можно поставить на последнее место. Это очевидно. Если п уже стоит на последнем месте, нам никакой пе- рестановки делать не нужно. Пусть теперь в последо- вательности b символ п уже стоит на последнем месте. Тогда последовательность Й = (/Ь /2> /п-1) является перестановкой последовательности d = (l, 2, ...» /г-1). В силу предположения индукции последовательность 5 можно получить из последовательности й путем конеч- ного числа парных перестановок. Таким образом, мы перевели последовательность а в последовательность b путем конечного числа парных перестановок. Утвержде- ние 3) доказано. Докажем 4). Пусть р—число парных перестановок, при помощи которых можно перевести последователь- ность а в последовательность &, a v — число тех парных перестановок, при помощи которых последовательность b можно перевести в последовательность с. Тогда после- довательность а можно перевести в последовательность с при помощи ц 4-v парных перестановок. Таким обра- зом. 1т] = (-1)и> [т] = (-1)"> = !?+v. Итак, свойство 4) доказано. Следовательно, предложение А) полностью доказано. 25
Для иллюстрации предложения А) рассмотрим все перестановки последовательности а ==(1,2, 3), состоящей из трех символов, и выясним четность и не- четность этих перестановок. Пусть & = (1, 2, 3), так что b совпадает с а. В последовательности b ни на одной паре символов не нарушается порядок, имеющий- ся в а, поэтому перестановка b четна. Пусть Ь = (2, 1, 3). В этой последовательности Ь имеется нарушение поряд- ка на паре (1,2). В последовательности а она стоит в порядке (1,2), а в последовательности Ь — в порядке (2, 1). На других парах нарушения порядка нет, по- этому последняя перестановка Ь в этом случае нечетна. Пусть $ = (1, 3, 2). В этой перестановке имеется нарушение порядка на паре (2,3). В последовательности а она стоит в порядке (2,3), а в последовательности Ь — в порядке (3,2). В других парах нарушения порядка нет, поэтому пере- становка Ь нечетна. Пусть b = (2, 3, 1). В этой перестановке Ь имеется нарушение порядка на парах (1,2) и (1,3). Других нарушений порядка нет, поэтому перестановка b в этом случае четна. Пусть Ь = (3,1,2). В этой перестановке Ь имеется нарушение порядка на парах (1,3) и (2,3). Других нарушений порядка нет, поэтому перестановка в этом случае четна. Пусть Ъ = (3, 2, 1). В этой перестановке Ь имеется нарушение порядка на парах (1,2), (1,3), (2,3). Таким образом, перестановка b нечетна. Перейдем теперь к конструктивному описанию опре- делителя. 2б
В) Согласно определению, данному в предложе- нии А), последовательность а' из и различных символов называется перестановкой последовательности а из тех же п символов, если в а' переписаны те же символы, которые входят в а, но в некотором порядке, быть мо- жет, совпадающем с а, а может быть, отличном от а. Оказывается, что переход от последовательности а к последовательности а' однозначно определяет переход от любой перестановки Ь последовательности а к неко- торой определенной перестановке Ь' последовательности а'. Таким образом, переход от последовательности а к последовательности а' определяет некоторую операцию перехода от любой перестановки b к некоторой переста- новке Эту операцию мы обозначим через ф и будем называть операцией перестановки. Операция переста- новки ф строится следующим образом. Выпишем под последовательностью а последовательность b так, чтобы под каждым элементом х последовательности а ока- зался некоторый элемент у последовательности Ь. Эти два элемента составят столбик х у* Так мы получили по- следовательность из п столбиков. Если мы подвергнем эту последовательность из п столбиков некоторой пере- становке, то она определит некоторую перестановку по- следовательности а и некоторую перестановку последо- вательности 6, причем перестановки эти тесно связаны между собой. Поэтому обозначим через фа перестановку, полученную из а, и через фй перестановку, полученную из Ь. Ясно, что перестановку столбиков можно выбрать так, чтобы ф(а)=а'. Тогда положим Ь' = <рЬ. Так мы получили некоторую перестановку Ь' последовательности &, однозначно определенную перестановкой а' последова- тельности а. Оказывается, что переход от последователь- ности b к ее перестановке Ь' определяет ту же операцию перестановки ф, которую определил переход от а к а'« Докажем это. Пусть с—‘Некоторая перестановка по- следовательности а и с' — та перестановка последова- тельности с, которая индуцируется переходом от а к а'< Докажем, что переход от Ь к Ь' индуцирует тот же са« мый переход от с к с'. Для того чтобы убедиться в этом, достаточно выписать под последовательностью а сперва последовательность &, а под b последовательность с так, х чтобы образовались трехэтажные столбики вида у. z 27
Оказывается, что имеют место нижеследующие утвер ждения 1), 2), 3): 1) Если а и b — две различные перестановки, то <ра и <pb также различны. Для доказательства этого выпи- шем последовательности а и b друг под другом. Так как последовательности а и b различны, то существует стол- бик *, в котором нижний элемент нё совпадает с верх- ним. Ясно, что при любой перестановке полученных так столбиков из столбика получится столбик из тех же двух элементов, различных, между собой, так что <ра =# Ф&. 2) Если epi и ф2 — две операции перестановки, совпа- дающие на а, т. е. если Ф1& :=: то операции перестановки ф1 и ф2 одинаковы на любой другой перестановке &,_т. е. из ф1О = <р2а следует ф1& = = ф2&, иначе говоря, ф] = ф2. Для доказательства этого напишем под последовательностью а последовательность Ь. Каждой из перестановок ф1 и ф2 последовательности а соответствует перестановка столбиков. Но так как на а Ф1 и ф2 совпадают, то перестановки столбиков, соответ- ствующие ф1 и ф2, одинаковы. Поэтому ф(& = ф26. 3) Имеет место равенство rf| = pil (36) L о J I J Для доказательства этой формулы выпишем друг под другом последовательности а и Ь. Операцию переста- новки ф можно рассматривать как перестановку полу- ченных столбиков. Согласно предложению А) она может быть осуществлена путем некоторого числа Парных пе- рестановок. То же число парных перестановок доста- точно для перехода от а к фа и от b к ф&. Таким обра- зом, равенство (36) доказано. Определение 4. Пусть Z = ||x//||, л, /=1, (37) — квадратная матрица размеров (п,п). Ее мы будем называть квадратной матрицей порядка п. Пусть a = (it, i2, z„) 28
— некоторая перестановка последовательности нату- ральных чисел 1,2, п, b = (h, h, /„) — перестановка последовательности а. Тогда определи- тель D(X) задается формулой с<*>=ЕтЖ, <38> ь Здесь суммирование ведется по всем перестановкам Ь последовательности а. Докажем, что если вместо последовательности а взять любую ее перестановку «' = («{. i'2, .... t'„) = <pa, а вместо последовательности Ь взять последователь- ность *'=(/;« &.... /;)=<₽&. то определитель D(X) можно задать формулой 1331 V '1 п Докажем формулу (39). Заметим прежде всего, что если выписать друг под другом последовательности а и Ь так, как это сделано в предложении В), то опера- ция <р перестановки столбиков равносильна перемене по- рядка множителей в одночлене хр ... х'р, причем од- ночлен этот не меняется. Таким образом, мы имеем ра- венство х*1 ... xin — x>l, ... х‘". (40) '1 In '1 In В силу утверждения 3) предложения В) [£НЯ <41> Из формул (40) и (41) следует равенство (39). Таким образом, в формуле (38) последовательность а может быть заменена любой ее перестановкой а', а b — соответствующей перестановкой Ь' (см. В)). Определение 5. Каждой матрице Aelx/I’ /=1.........рг /=1........* 29
размеров (р, q) взаимно однозначно ставится в соответ- ствие транспонированная к ней матрица размеров (р, р), которая обозначается через Хг Для того чтобы запи- сать матрицу Ху в виде формулы, положим Хт = [7 = ||«/1. ^ = 1...<b /=1........Р- Тогда элементы матрицы U задаются формулой и/ ~ хг Для того чтобы наглядно описать процесс получения матрицы Хт, отметим, что матрица %т получается из матрицы X путем поворота последней вокруг главной диагонали. Главная диагональ матрицы X — это линия, идущая из верхнего левого угла направо вниз под уг- лом 45°. Тогда при повороте матрицы X ее строки пре- вращаются в столбцы матрицы Xх, а столбцы X в строки XT. С) Пусть X — матрица размеров (р, q) и Y — мат- рица размеров [q, г). Тогда можно'составить произведе- ние Z—XY, причем матрица Z имеет размеры (р, г). Оказывается, что имеет место соотношение 7т=ут^т. (42) Для доказательства этой формулы положим XT = U, Y7 = V, Z~r = W. Пусть г = |й|, z- И1-. Для транспонированных матриц U, V, W имеем «/ = 4 Ч = Ур wk — zr В силу этих формул получаем ™k = Zi = Х№ = У*Х& = Таким образом, формула (42) доказана. _ Теорема 1. Пусть X — произвольная квадратная матрица порядка п (см. (37)), а Ху — транспонирован- ная к ней матрица. Тогда Хг также есть квадратная матрица порядка п. Оказывается, что имеет место ра- венство D(XJ) = D(X). (43) 30
Таким образом, матрица X и транспонированная к ней матрица Хт имеют равные определители. Доказательство. Для доказательства формулы (43) положим хт={/=||«Я1- При этом и1! = х{. (44) В силу определения 4 имеем °<и>=Z [1Ж <«> ь где О = (/[, Z*2> • • • > ^*п) — некоторая фиксированная перестановка из п первых натуральных чисел, а 6 = (h>b •••> /п) — произвольная перестановка из п первых натуральных чисел. Суммирование ведется по всем перестановкам Ъ. Заменяя элементы матрицы U элементами матрицы X по формуле (44), получаем <«> ъ Здесь в отличие от формулы (38) последовательность нижних индексов (см. (46)) считается фиксированной, а последовательность верхних индексов произвольной и суммирование ведется по этой произвольной переста- новке верхних индексов. В формуле (38) фиксирован- ной является последовательность верхних индексов, а последовательность нижних индексов является произ- вольной, и по ней ведется суммирование. Для того чтобы преобразовать сумму (46) в сумму (38), мы в каждом слагаемом суммы (46) переставим множители таким об- разом, чтобы верхние индексы составили некоторую фик- сированную последовательность й = •••» V)’ При этом окажется, что нижние индексы составят про- извольную перестановку $ = (?i. 7г> • • •> 7») 81
из первых п натуральных чисел. Выпишем теперь после- довательность Ь под последовательностью а так, чтобы образовалась двухэтажная пара строк. Заметим, что пе- рестановке множителей в слагаемом суммы соответ- ствует перестановка столбцов в этой полученной двух- этажной последовательности. Вместо того чтобы гово- рить о перестановке множителей, мы можем теперь говорить о перестановке столбцов. Обозначим через <p* такую операцию перестановки '(см. В)), что ф(,6 = й. Из утверждения 1) в В) следует, что двум различным перестановкам Ь\, &2 соответствуют различные операции перестановки <р&,, <р&2- Действительно, если бы имело место равенство ф^^ф^ при Ь\ то две различные операции перестанойки ф*. и ф»2 переводили бы bi и &2 в одну и ту же перестановку й, что, согласно утвержде- нию 1) п. В), невозможно. Таким образом, операции пе- рестановок фь все различны и число их равно числу пе- рестановок из п элементов. Положим теперь $=Ф»а. (47) Как было установлено в утверждении 2) в В), двум различным перестановкам Ь\ и &2 соответствуют две раз-, личные операции ф^ и фб2. Поэтому число так получен- ных перестановок (см. (47)) первых п натуральных чи- сел равно числу перестановок из п элементов. Таким образом, фьа = b пробегает совокупность всех различ- ных перестановок из п первых натуральных чисел. Так как в силу утверждения 3) в В) то имеем Теперь формула (45) приобретает вид где = i2> •••» гп) — некоторая фиксированная последовательность из п первых натуральных чисел, а £ — ( h> h> • • •» In) 32
— произвольная перестановка из первых п натуральных чисел. Так как qb(a)=b пробегает совокупность всех различных перестановок из первых п натуральных чи- сел, то суммирование здесь можно вести по Ь. Таким образом, формула (46) переписывается в виде: D(u) = y Г412'И2... xln, “'LbJ Л <2 in О а эта формула совпадает с формулой (38). Таким обра- зом, теорема 1 доказана. Так как при переходе к транспонированной матрице строки и столбцы меняются местами, то в силу тео- ремы 1 из всякого результата, относящегося к опреде- лителю, сформулированному в терминах строк, следует аналогичный результат для определителей, сформули- рованный в терминах столбцов. Из свойств а) и Ь), сформулированных в начале этого параграфа в отноше- нии строк, будут следовать следующие свойства а') и Ь'), относящиеся к столбцам: а') Определитель D(X) матрицы X является линей- ной формой относительно элементов каждого столбца матрицы X. Ь') При перестановке местами столбцов матрицы X определитель D(X) меняет знак. § 4. Решение системы линейных уравнений Здесь будут описаны некоторые свойства определи- телей, дающие, в частности, возможность их вычисления не при помощи громоздкой формулы (38), а несколько проще. А) Если в матрице Х = ||л:}||, 1=1, ..., п, j—1, ..., п, переставить местами две соседние строки — или, как мы будем говорить, пользуясь терминологией, введенной в § 3, «произвести парную перестановку соседних строк»,— то вновь полученная матрица U будет иметь определи- тель, отличающийся от определителя матрицы X знаком, т. е. будет иметь место формула D (U) = - D (X). (48) Так как каждая парная перестановка символов некоторой последовательности может быть получена в результате 2 Л. С. Понтрягин 33
нечетного числа парных перестановок соседних сим< волов, то из сказанного следует, что если матрица U no*j лучена из матрицы X путем перестановки местами дву» ее различных строк, то имеет место формула D(U)=-D(X). (49) Точно так же, если матрица V получена из матрицы X парной перестановкой двух столбцов, то имеет место равенство D(V) = — D(X). (50) Из формулы (49), в частности, следует, что если в мат< рице X есть две равные строки с различными номерами, то определитель £>(Х) матрицы X равен нулю: D(X) = 0. То же верно и для столбцов (см. (50)). При доказательстве формулы (48) будем считать, что матрица U получается из матрицы X перестановкой k-й. и (&+ 1)-й строк матрицы X. Поэтому элементы мат* рицы = ||и/1 определяются формулами Цу - X^f t ki I k 1 , U^ = X^+l, и^+1=^х^. Согласно определению 4 (см. (38)) имеем ь где а = (1,2, ..., п), й = 0'1,/2, ...» /„)• Производя в правой части последней формулы замену элементов матрицы U на элементы матрицы X, получим ^ (^) = [у] xitxi2 ♦ • • xit *x^+i • • • х‘п’ ь что можно иначе записать формулой D w -жж ь где а' = (1,2, ...» 6-1,6+1,6, й +2, ...» п). Так как в силу утверждения 4) п. А) § 3 тж] 34
и очевидно, что = — 1, то j. Пользу- ясь этим соотношением, получаем о VJ) - £ [v]x‘l'A • “ - D <x>• b Соответствующее утверждение для столбцов, т. е. фор- мула (50), следует из равноправия столбцов и строк. Таким образом, предложение А) доказано. В) Пусть Х = |х'||, Z=l, .... р, — произвольная, вообще говоря, неквадратная мат- рица размеров (р, q). Выделим две возрастающие после- довательности натуральных чисел: *1<4< ... <ir, r^p\ ii< ]2< ••>< js, s^q. (51) Рассмотрим теперь матрицу X, состоящую из элементов матрицы X, входящих в строки с номерами й, z2, ..., ir и столбцы с номерами /1, /2, .... is- Именно, положим х[г х1.г х\г h 1г Js Матрица X имеет размеры (г, s). Она некоторым опре- деленным образом составлена из элементов матрицы X. Такого рода матрицы широко употребляются в алгебре, но для них нет специального названия. Я их буду назы- вать подматрицами матрицы X. Для того чтобы задать матрицу X, нужно указать номера строк и столбцов, от- меченных формулой (51). Будем употреблять несколько другую, но эквивалентную формулировку. Именно, гово- рят, что матрица X получена из матрицы X-вычеркива- нием всех строк, номера которых не совпадают с чис- лами й, i2, ..., ir, и всех столбцов, номера которых не совпадают с /1, /2, ..., js. С) Пусть X = ||xj||, i=l, ...,п, /=1, .... п, (52) — произвольная квадратная матрица порядка п. Пусть далее k — номер некоторой строки матрицы X, I — номер 2* 35
некоторого столбца матрицы X. Таким образом, в мат- рице X есть элемент xkt. В формуле (38), описывающей определитель D(X), имеются члены, содержащие мно- жители х^. Их сумму обозначим через сф Опишем эту сумму. Вычеркнем из матрицы X k-ю строку и /-й столбец. Так полученную' подматрицу матрицы X размеров (п—1, п— 1) обозначим через Xlk. Определитель ее на- зывается минором элемента xkt матрицы X. Оказывает- ся, что сумма of задается формулой а» = (-1)»+'х‘£)(Х'). (53) Докажем предложение С), именно формулу (53). Рассмотрим сперва случай, когда k = 1, I — 1, т. е. когда элемент х^ стоит в верхнем левом углу матрицы X. Будем считать, что при построении суммы (38) а = (1, 2, ..., га), & = (/1,/2, .... /„), где Ъ — произвольная перестановка последовательности а. Слагаемое в сумме (38), содержащее множитель х\ имеет вид у! у2 уП « Л ] 9 9 • • • 1 Z2 П Все эти слагаемые соответствуют перестановке &, зада- ваемой формулой &=(1,/г......in)- Положим & = (2, з....п), Ь = (/2, /з» • • • > in)- Теперь мы можем написать а = (1, d), b = (1, 6). Ясно, что для получения перестановки b из последова- тельности а путем парных перестановок нужно перестав- лять только символы, входящие в й, таким образом, чтобы получить перестановку Поэтому [а 1__pl 7J LT? Из этого следует, что 6 36
Сумма, входящая в правую часть последнего равенства, очевидно, равна определителю матрицы Х\, так что мы получаем а‘ = хр(Х‘). Для получения формулы (53) при произвольных k и I произведем парную перестановку fe-й строки матрицы X с предшествующей строкой, т. е. со строкой с номе- ром k—1. В полученной матрице произведем парную перестановку строки, стоящей на (k—1)-м месте, с предшествующей строкой. Так будем продолжать, пока не переставим k-ю строку матрицы X на первое место. При этом мы произведем k—1 парных перестановок соседних строк. Точно так же передвинем /-й столбец на первое место. Для этого будем передвигать его по- степенно налево. Тогда мы произведем I—1 парных пе- рестановок соседних столбцов. Полученную в результате этих операций матрицу обозначим через U. Так как при перестановках строк и столбцов матрицы X было произ- ведено всего (k—1) + (/—1) парных перестановок со- седних строк и столбцов, то мы имеем (см. А)) £)(£/) = (-!)*+*£> (X). (54) В матрице U в левом верхнем углу стоит элемент а при вычеркивании из матрицы U первой строки и пер- вого столбца мы получим подматрицу, которая совпа- дает с подматрицей матрицы X, получающейся вычер- киванием Л-й строки и 1-го столбца. Из формулы (54) следует формула (53). Итак, предложение С) дока- зано. Дадим теперь определение разложения определителя матрицы по элементам Л-й строки и элементам 1-го столбца. D) Имеют место две следующие важные формулы: D(X) = (-1)‘+«?J)(X?). (55) D(X)=.(-1)z+MdUp)- (56) Формула (55) дает разложение определителя по эле- ментам k-й строки, а формула (56) дает разложение того же определителя по элементам 1-го столбца. Для доказательства формулы (55) соберем в сумме (38) сначала все члены, содержащие элемент xf. При этом их сумма дается формулой (53). Затем соберем все члены суммы (38), содержащие множитель х£, и, 37
продолжая так далее, наконец, соберем все слагаемые, содержащие множитель х*. Этим будет исчерпана без перекрытий вся сумма (38), так как в каждый ее член входит ровно один множитель из &-й строки. Таким об- разом, формула (55) верна. Точно так же доказывается формула (56). Е) Пусть X — произвольная квадратная матрица по- рядка п (см. (52)). Положим Xk = (х*, X*, . . ., X*). Здесь в правой части выписаны подряд все элементы k-н строки матрицы X. Мы хотим рассматривать их как координаты вектора xk. Таким образом, мы будем пони- мать строку как вектор. Точно так же положим = (х), х|, ...» х?). Здесь в правой части равенства выписаны элементы /-го столбца. Мы будем рассматривать их как координаты вектора хг. Таким образом, мы будем понимать столбец матрицы- X как некоторый вектор. Обратим теперь вни- мание на зависимость определителя D(X) от элементов k-й строки и от элементов /-го столбца. Для этого по- ложим D(X) = D(xk) и D(X) = D(xi). Из предложения С) следует, что функции D(xk) и £>(х;) являются линей- ными формами относительно векторов хк и Xi. Пусть « = («!, «2...«п) — некоторый n-мерный вектор. Составим теперь сумму D (Х%) = (- l)k+auaD (Х?)-. (57) Правая часть последнего равенства отличается от пра- вой части равенства (55) только тем, что вместо вектора хк, составленного из элементов £-й строки матрицы X, поставлены элементы вектора и и полученная так мат- рица обозначена через Х“- Таким образом, правая часть равенства (57) представляет собой определитель мат- рицы Х“, в которой k-я строка заменена строкой «. Про- делаем то же самое для столбцов. Пусть в = (01,е2,...»еп) — некоторый вектор размерности п. Составим сумму D (хО = (- 1)/+₽е3Д (Хр). (58) 38
Правая часть последнего равенства отличается от пра- вой части равенства (56) только тем, что вместо I го столбца матрицы X поставлен столбец 6 и полученная так матрица обозначена через Х1в- Так что правая часть равенства (58) представляет собой определитель мат- рицы Xf>, в которой l-й столбец заменен столбцом 0. Пусть теперь и = хт, т. е. вектор и состоит из элементов строки с номером т матрицы X. Таким образом, сумма (57) дает нам опре- делитель матрицы Х*т, полученной из матрицы X заме- ной k-й строки матрицы X на т-ю ее строку. Таким об- разом, при tn—k формула (57) дает нам определитель D(X), а при m^=k — нуль, так как это есть определи- тель матрицы, которая имеет две совпадающие строки. Итак, мы получаем (- 1)т+“х?£> (х£) = б?£> (X). (59) Здесь в правой части стоит символ Кронекера б^, кото- рый равен единице, когда его индексы нижний и верх- ний равны между собой, и нулю, если индексы не равны между собой. Проделывая те же выкладки для /-го столбца, мы получим следующую формулу: (- l)m+f4 D (4) = 6^D (X). (60) В случае, если £)(Х)=И=0, мы можем соотношения (59) и (60) разделить на D(X). Для того чтобы переписать эти соотношения в удобной для нас форме, положим (61) Таким образом, формулы (59) и (60) переписываются .теперь в виде = (62) (63) Положим теперь Пользуясь этим обозначением, мы можем переписать формулу (62) в виде XY = Е, (64) 39
где Е — единичная матрица, а формулу (63) в виде YX = E. (65) Формулы (64) и (65) показывают, что матрица У яв- ляется обратной для матрицы X как справа, так и слева и потому обозначается через X-1. Таким образом, мы до- казали, что если определитель D(X) не равен нулю, то у матрицы X существует обратная матрица Х~1 = У. До сих пор рассмотрение определителей ничем не было оправдано. Теперь, пользуясь результатами, изло- женными в предложении Е), мы можем показать, что определители дают нам аппарат для решения важной и естественной алгебраической задачи, — именно, для ре- шения системы уравнений первой степени с несколькими неизвестными. Мы будем рассматривать системы из п уравнений с п неизвестными. Перенеся все члены, со- держащие неизвестные величины в левую сторону урав- нения, а известные величины в правую сторону урав- нения-, мы можем записать систему таких уравнений в виде а£х“ = с‘, /=1, 2, ..., п, а = 1,2......п. (66) Здесь крординаты вектора х = (х*, х2, ..., хп) являются неизвестными величинами, а сам вектор х — неизвестным вектором. Коэффициенты при этих неизве- стных составляют матрицу Д = |а^|; i=l, 2.......п, /=1, 2, ..., п. Здесь координаты вектора с = (с’, с2..сп) являются правыми известными частями системы урав- нений (66). F) Будем трактовать векторы х и с как матрицы размеров (n, 1), т. е. как одностолбцовые матрицы вы- соты п. Тогда систему (66) можно переписать в следую- щем виде: Ах —с. (67) Здесь слева стоит матрица А размеров (п,п), умножен- ная на одностолбцовую матрицу х размеров (n, 1), а 4а
справа — одностолбцовая матрица с размеров (n, 1). Если определитель D(A) матрицы А отличен от нуля: D (Л) =# О, то уравнение (67) имеет решение х = А~'с (68) и притом единственное. Следует отметить, что если Д(Л) = 0, то решение си- стемы (67) все же может существовать. Для получения решения системы (67) в случае £>(Л)#=0 достаточно умножить соотношение (67) на матрицу А~1 слева. Решение это единственно. Допу- стим, что существуют два решения х\ и х2. Тогда мы имеем два соотношения Axi — с, Ах2 = с. Вычитая второе из этих равенств из первого, получим A (xj — х2) = 0. Умножив это соотношение на Л-1, получим *1 — *2 = 0. Таким образом, Xi — х2, и наши решения совпадают между собой. Дадим теперь более традиционную запись решения системы уравнений (66). Теорема 2. Решение системы (66) дается форму- лой xi__(69) х —ЩаГ' (Ь9) где матрица Л* получается из матрицы А заменой ее l-го столбца столбцом с. Таким образом, для получения неизвестной величины х1 нужно в матрице А заменить ее 1-й столбец столбцом с и определитель этой матрицы разделить на определитель D(Л). Доказательство. Для доказательства формулы (69) мы воспользуемся формулой (68), написав ее в развернутом виде. Пусть Тогда в силу (61) имеем 6/ = (—1)‘+' . 01 ' D(A) 41'
формула (68) запишется в виде ?=_ (_!)>« £^1 с» = (_1)Wd(4) л(л’) = Р(Д) — D(A) {см. (58)). Таким образом, теорема доказана. § 5. Элементарные преобразования матриц В этом параграфе будут описаны так называемые элементарные преобразования матриц и их определите- лей. Будет показано, что элементарным преобразова- нием матрицу можно привести к более простому виду, удобному для вычисления ее определителя. Такими удобными для вычисления определителей видами мат- риц являются так называемые треугольные и диагональ- ные матрицы. Их определение будет дано в предложе- нии А) этого параграфа. После описания элементарных операций мы применим полученные конструкции для до- казательства важнейшей теоремы, — именно, теоремы о том, что определитель произведения двух квадратных матриц равен произведению их определителей. Это бу- дет заключительная теорема настоящего параграфа. А) Пусть —-квадратная матрица порядка п. Главной диагональю матрицы X называется прямолинейный отрезок, веду- щий из левого верхнего угла х| в правый нижний, т. е. к элементу х^. Элементы, лежащие на этом прямоли- нейном отрезке, т. е. элементы х{, х’...х" (70) называются диагональными элементами матрицы X, они составляют ее главную диагональ. Матрица X называет- ся треугольной, если все ее элементы, лежащие справа от диагонали, равны нулю, т. е. если выполнено соот- ношение xj = O при / > I. Частным случаем треугольной матрицы является так на- зываемая диагональная матрица, в которой от нуля от- личны только элементы матрицы, стоящие на ее главной
диагонали, т. е. элементы (70). Оказывается, что опре- делитель треугольной матрицы равен произведению ее диагональных элементов, т. е. если X — треугольная мат-* рица, то D(X) = x}x|... х* (71) Докажем последнюю формулу. Определитель Д(Х); треугольной матрицы X будем вычислять по формуле (38). Пусть — отличное от нуля слагаемое в сумме (38). Здесь мы предположим, что а = (1, 2, ..., л), 6 = (/н/2, ..., /„). Исходя из слагаемого (72), определим натуральное чис- ло k, обладающее тем свойством, что при i k jt = 1. Если натурального числа, обладающего- этим свойством, нет, то считаем, что k = 0. Докажем, что k = п. Допу- стим противоположное, т. е. что k <. п. Тогда в произве- дении (72) существует множитель х^1 . Так как /й+1¥* =й&+1, то имеются две возможности: /*+1 > k 4- 1 и Если имеет место первое из этих нера- венств, то в силу треугольное™ матрицы X множитель' хН1 —0 и одночлен (71) вообще не рассматривается. Если имеет место второе неравенство, т. е. /ft+i < k + 1, то при i — jk+i мы имеем = I = /*+ь Таким образом, в ряду нижних индексов одночлена (71) имеется два равных: /,- и /*+ь что невозможно, так как Ь есть пере- становка натуральных чисел а. Так, мы имеем /1 = 1, /2 = 2../„ = «, и потому [у}= 1. Таким образом, единственное слагае- мое, отличное от нуля, входящее в сумму (38), является произведением диагональных членов матрицы X, и мы получаем формулу (71). В § 4 были доказаны важнейшие свойства опреде- лителя D(X} матрицы X, сформулированные еще в на-< чале § 3 (см. а), Ь) § 3). Эти свойства определителя могут быть сформулированы как в терминах строк, как это сделано в начале § 3, так и в терминах столбцов, что сделано в конце § 3 (см. а'), Ь') § 3). Однако, опре- делитель £)£Х) является не единственной функцией 43
матрицы, удовлетворяющей этим условиям. Если умно- жить функцию D(X) на произвольную константу, то мы получим функцию, удовлетворяющую тем же условиям. Поэтому мы рассмотрим произвольную функцию матрицы X, удовлетворяющую указанным условиям, причем усло- вия эти будем рассматривать в терминах столбцов, т. е. в виде а'), Ь') § 3. Для того чтобы сформулировать вы- сказанные условия, будем записывать матрицу X в сле- дующем виде: ^ = 11*1*2 ••• *Л- Здесь Xi, Xi, ..., хп обозначены столбцы матрицы X. Их мы можем трактовать как одностолбцовые матрицы или как векторы. В) Обозначим через F(X) функцию квадратной мат- рицы X порядка п, удовлетворяющую двум следующим условиям: 1) При перестановке двух столбцов матрицы X функ- ция F(X) меняет знак (см. Ь') § 3). В виде формулы это запишем так: F(X)== — ... xq... хр... x„||), p<q. Из этого следует, что если два столбца матрицы X со- впадают, то F(X) — 0. 2) F(X) является линейной формой относительно столбца Xk матрицы X. В виде формулы запишем это так. Пусть xk = СУ + dz. Тогда П11*1*2 ... хк ... *J|) = ==с/7(||х1ж2 ••• У-- *„||) + </Г(||Ж1Ж2 ... г...*„||). В дальнейшем мы всегда будем обозначать через F(X) функцию матрицы X, удовлетворяющую условиям 1) и 2). С) Введем так называемые элементарные операции над матрицей X, при которых функция F(X) либо ме- няет знак, либо остается неизменной. 1) Операция перестановки столбцов. При ней функ- ция матрицы меняет знак. 2) Прибавление к одному из столбцов линейной ком- бинации нескольких других столбцов с действительными коэффициентами. При этой операции функция F(X) не меняет своего значения. Напишем это в виде формульц 44
для определенности, для n-го столбца следующим обра- зом. Пусть саха, а = 1, 2, ..., и—1, — линейная форма относительно первых п — 1 столбцов матрицы X. Тогда F(X) = F(\\xlx2... хй + с°жо||), а=1, 2, ..., n- 1. (73) Докажем последнюю формулу. В силу свойства 2) предложения В), которым обладает функция F(X), мы имеем F(X) = c“F(||x1x2-.. xJD + Fdlx^... х„||). (74) Так как матрица Цжрег ••• ж«||, i п— 1, имеет два рав- ных столбца, — именно, i-й и последний, — то в правой части формулы (74) все члены, кроме последнего, равны нулю, и мы получаем из нее формулу (73). Операция 2), прибавление к некоторому столбцу ли- нейной комбинации нескольких других столбцов, часто будет состоять в прибавлении только одного столбца, умноженного на действительный коэффициент. Теперь мы займемся доказательством важной тео- ремы 3. Перед тем как сформулировать ее, напомню, что линейной зависимостью между столбцами матрицы X на- зывается зависимость между ее столбцами как векто- рами. Именно, столбцы Х\, Хг, .... хп матрицы X счи- таются линейно зависимыми, если существуют действи- тельные числа с‘, i=l, .... п, не все равные нулю, такие, что имеет место соотношение саха = 0. (75) Теперь мы можем сформулировать и доказать тео- рему. Теорема 3. Определитель D(X) квадратной мат- рицы Х=ь||х* | тогда и только тогда равен нулю, когда столбцы матрицы X линейно зависимы. Доказательство. Теорема 3 состоит из двух утверждений: 1) Если столбцы матрицы линейно зави- симы, то определитель ее равен нулю. 2) Если опреде- литель D(X) матрицы X равен нулю, то столбцы мат- рицы X линейно зависимы. Первое утверждение мы докажем для функции F(X). Так как определитель D(X) матрицы X есть частный случай функции F(X), то первая часть утверждения тео- ремы будет доказана. 46
Допустим, что имеет место линейная зависимость «75) между столбцами матрицы X, при этом хотя бы один коэффициент с1, входящий в линейную зависимость ’(75), не равен нулю. Допустим, что это коэффициент с". Будем считать, что он равен единице. Тогда в силу формулы (73) мы получим F(X) = F(\\x{x2... ^.10||) = 0. . Допустим, что определитель D(X) матрицы X равен нулю, и докажем, что столбцы ее линейно зависимы. Доказательство будем вести индуктивно, по порядку п матрицы X. При п = 1 утверждение очевидно. Если все элементы последней строки матрицы X равны нулю, то так как столбцов она имеет п, а размер- ность каждого столбца как вектора равна п—1, то в силу предложения В) § 1 эти столбцы как векторы ли- нейно зависимы. Таким образом, мы должны рассмот- реть случай, когда не все элементы последней строки матрицы X равны нулю. Допустим для определенности, что отличен от нуля последний элемент последней стро- ки. Путем перестановки двух столбцов матрицы X, от чего может измениться только знак определителя £)(Х), мы можем всегда добиться этого. Таким образом, нам следует рассмотреть лишь случай, когда х* #= 0. Рас- смотрим теперь столбец матрицы X с номером т. е. вектор Xi. Можно подобрать такие действительные числа С/, что вектор ci%n имеет своей последней координатой нуль. Произведем п—1 элементарных операций. Прибавляя к каждому столбцу с номером /, —1, последний столбец с коэффициентом Сц мы получим матрицу X со столбцами *1 + сххп, Х2 + С2Хп, .... Хп_1 + Сп-!»», хп. (76) В последней строке этой матрицы будут идти нули до последнего элемента х". Вычеркнем теперь в матрице X последний столбец и последнюю строку. Тогда мы по- дучим матрицу Хп- Разлагая определитель матрицы X по элементам последней строки, мы получим D(X) = x"D(x"). Так как D(X) = 0, х" 0, то £>(Х«) = 0. 4G
Матрица Хп имеет порядок п— 1, и по предположению индукции столбцы ее линейно зависимы. Столбцы эти совпадают с первыми п — 1 столбцами, выписанными в строке (76), за исключением того, что в матрице X по- следние элементы в столбцах (76) все равны нулю. Именно поэтому можно выписать вместо зависимости столбцов матрицы Xh зависимость между первыми п— 1 столбцами в формуле (76). Коэффициенты этой линей- ной зависимости обозначим через Ь\ Тогда мы получим Ьа (ха + сахп) = Ьаха + Ьасахп = 0. Это соотношение представляет собой линейную зависи- мость между столбцами матрицы X. Таким образом, тео- рема доказана. Следствие теоремы 3. Система линейных уравнений хй“ = 0, Z=l, ...» п, (77) где £*, g2, .... gn — неизвестные, тогда и только тогда имеет нетривиальное решение, т. е. такое решение, у ко* торого не все / = 1, ..., п, равны нулю, когда опре* делитель матрицы X равен нулю: D (А’) = 0. Доказательство. Если определитель D(X) мат- рицы X равен нулю, то в силу теоремы 3 столбцы мат- рицы X линейно зависимы, т. е. система (77) имеет не- тривиальное решение. Если, наоборот, система (77) имеет нетривиальное решение, то столбцы матрицы X линейно зависимы и, следовательно, в силу теоремы 3 определитель D(X) равен нулю. Замечание. Если в матрице X столбцы линейно зависимы, то функция F(X) обращается в нуль. Это утверждение было доказано при доказательстве первой части теоремы. Докажем теперь еще одну теорему. Она у нас будет играть вспомогательную роль, поэтому мы назовем ее леммой. Лемма 1. Если определитель D(X) матрицы X от- личен от нуля, то матрицу X элементарными преобразо- ваниями можно привести к диагональному виду, причем все ее диагональные элементы отличны от нуля. Доказательство. Доказательство будем вести индуктивно по порядку п матрицы X. При п = 1 утвер- ждение очевидно. 47
Разложим определитель матрицы X по элементам последней строки (см. D) § 4). Запишем это разложе- ние (см. (55)) в виде D(X) = (-l)n+ax"D(x“). Так как определитель £>(%)=/= О, то хотя бы одно из сла- гаемых, стоящих в правой части последнего равенства, отлично от нуля. Перестановкой столбцов матрицы X можно добиться того, чтобы отличным от нуля было по- следнее слагаемое, т. е. чтобы имели место неравенства хпп^0, £>(Х")=#0. Применяя к матрице X элементарную операцию прибав- ления последнего столбца, умноженного на некоторое число, к каждому из предыдущих столбцов матрицы X, можно достичь того, чтобы в полученной матрице вся последняя строка состояла из нулей, кроме последнего ее элемента xh- Полученную матрицу вновь обозначим через X. В этой матрице X все элементы последней стро- ки, кроме последнего элемента xh, равны нулю. Добьем- ся теперь того же для последнего столбца. Для этого составим п— 1 уравнений с п— 1 неиз- вестными и1, и2, ..., ип~х. Система уравнений будет следующая: х‘„иа = — х‘„, i — 1, 2, ..., п — 1. а п1 ? 7 j Эта система из п—1 уравнений с п—1 неизвестными уже рассмотрена нами в предыдущем параграфе. Так как определитель матрицы коэффициентов А’" отличен от нуля, система имеет решение. Следовательно, числа и1, и2, ..., и"-1 существуют. Произведем теперь над мат- рицей X элементарную операцию, — именно, прибавим к последнему ее столбцу все предыдущие, т. е. столбцы *„ х2, .... умножив каждый столбец Xi на число и*. Тогда в по- следнем столбце так полученной матрицы обратятся в нуль все элементы, кроме последнего х". Полученную матрицу вновь обозначим через X. В ней в последнем столбце и последней строке есть единственный эле- мент Хп, отличный от нуля. Определитель матрицы XJ для нее отличен от нуля. Каждая элементарная опера- 48
ция над матрицей X, меняющая только ее первые п— 1 столбцов, т. е. столбцы х2, •••, хп-ъ порождает эле- ментарную операцию над столбцами матрицы X" и на- оборот. Это происходит потому, что в последней строке матрицы X все элементы, стоящие на местах 1, 2, ... ..., п—1, равны нулю. По предположению индукции элементарными операциями матрицу Xh можно привести к диагональному виду, а все эти элементарные опера- ции можно рассматривать как полученные в результате элементарных операций над столбцами х1( х2...*n-i матрицы X. Так как матрица Xh приведена теперь по предположению индукции к диагональному виду, то по- лученная матрица X оказалась диагональной. Итак, лемма 1 доказана. Докажем теперь еще одну лемму. Лемма 2. Оказывается, что для функции F(X) мат- рицы X, удовлетворяющей условиям 1), 2) предложе- ния В), всегда выполнено соотношение F (X) = D (X) F (Е), (78) где Е — единичная матрица. Доказательство. В случае, если D(X) = 0, фор- мула (78) верна, так как функция F(X) = 0 (см. заме- чание к теореме 3). Теперь рассмотрим случай, когда Д(Х)#=0. Для до- казательства приведем матрицу X к диагональному виду, пользуясь элементарными операциями, что возможно в силу леммы 1. Каждая элементарная операция, заклю- чающаяся в перестановке столбцов матрицы X, одновре- менно меняет знак функций F(X) и D(X). Таким обра- зом, нам осталось доказать лемму 2 лишь в предполо- жении, что матрица X диагональная и на диагонали стоят отличные от нуля числа. Итак, мы будем предполагать, что матрица X диаго- нальная с отличными от нуля диагональными членами, и будем расематривать функцию F(X). Функция эта яв- ляется линейной формой относительно каждого столбца матрицы X. Поэтому из каждого столбца этой матрицы X мы можем вынести за знак функции F(X) числовой множитель, — именно, из столбца с номером i числовой множитель х.. В результате получим соотношение F(X) = x[xl ... xhF(E). 4&
Оно получается в результате вынесения из каждого столбца множителя, стоящего на диагонали. В конце концов мы получим диагональную матрицу, где на диа- гонали стоят единицы, т. е. матрицу Е. В силу предло- жения А) произведение х|х| ... х", стоящее перед F(E), равно D(X). Таким образом, формула (78) доказана. Перейдем теперь к главной теореме настоящего па- раграфа, для которой были доказаны предыдущие две леммы. Теорема 4. Пусть X и Y — две квадратные мат- рицы одного и того же порядка п. Тогда имеет место следующая формула: D(XY) — D(X)D(Y). (79) Таким образом, определитель произведения двух квад- ратных матриц одного порядка равен произведению оп- ределителей этих матриц. Доказательство. Положим XY = Z=[z'4. Л- = |х}|, Г = |й|. Покажем теперь, что элементарным операциям над матрицей Y соответствуют элементарные операции над матрицей Z. Начнем с перестановки столбцов. Пусть У = — матрица, полученная из матрицы Y переста- новкой столбцов с номерами р и q. Тогда мы имеем = ПРИ k^p, k^q, v/q = yf, vfp = yf. Положим W = XV. Тогда = = 4 пРи k=£p, k^=q. Далее, ^х^р = х^ = г^ wh = ^ = ^=zp. ( ’ Таким образом, перестановке двух столбцов матрицы Y. соответствует перестановка столбцов матрицы Z с теми же номерами. Докажем теперь, что F(Y) = D(XY) является линейной формой относительно Л-го столбца уь матрицы У, 60
Пусть fti и Лг — два n-мерных вектора. Подставим ©место k-ro столбца матрицы У линейную комбинацию етих двух векторов, т. е. положим Л = + М2- Полученную таким образом матрицу обозначим через Z. Подставляя на место й-го столбца у* матрицы У столбцы Л1 и Л2, мы получим матрицы, которые обозна- чим через Hi и Я2. Положим, далее, P = XHlt S = XH2, k-й столбец матрицы Р обозначим через рь а k-й стол- бец матрицы S обозначим через sk. Мы имеем теперь pk^ Xahlt Sk== Xah2‘ Отсюда видно, что при замене столбца ук матрицы У линейной комбинацией векторов ht и h2 с коэффициен- тами С] и с2 в матрице Z k-й столбец заменяется линей- ной комбинацией cipft 4- c2sk. Так как определитель D(Z) является линейной формой k-ro ее столбца, то мы в ко- нечном счете получаем D (Z) = CiD (XHi) + c2D (ХН2) = CiF (Я,) + c2F (Н2). Таким образом, доказано, что функция F(Y) являет- ся линейной формой £-го столбца матрицы У и функция F(Y) удовлетворяет обоим условиям 1) и 2) предложе- ния В). Таким образом, в силу леммы 2 имеем F (Y) = D (Y) F (Е). Но так как D(XE)= D(X), то последняя формула пере- писывается в виде D (ХУ) = F (У) = D (X) D (У). Итак, формула (7$)) доказана и доказательство теоремы завершено. Замечание к теореме 4. Квадратная матрица X имеет тогда и только тогда обратную матрицу, когда определитель ее отличен от нуля. Уже было доказано (см. Е) § 4), что если Я(Х)=/=0, то матрица X имеет обратную матрицу. Но если опреде- литель матрицы равен нулю, то уравнение XY = E 51
неразрешимо относительно У. В силу теоремы 4 мы имеем Й(/)О(У) = О(£)=1, что невозможно, если D(X) = 0 (см. гл. 4, пример 6). § 6. Ранг матрицы Здесь будет описано понятие ранга матрицы. Затем на этой основе будет дан критерий разрешимости си- стемы линейных уравнений, число неизвестных в кото- рой может не равняться числу уравнений. А) Пусть Х = ||х)|, /=1, ...» р, j—l,...,q, — произвольная матрица размеров (р, q). Как было рас- сказано в § 2 (см. предложение А)), этой матрице со- ответствует линейное отображение <р векторного про- странства В9 размерности q в векторное пространство Ар размерности р. Как было сказано там же, образ <рВ9 пространства В’ в пространстве Ар является векторным подпространством пространства Ар. Рангом матрицы X называется размерность векторного пространства <рВ9. Пусть <?i> е2, .... ер, (81) А, А. (82) — базисы пространств Ар и В9, при помощи которых матрица X определяет отображение <р. <рА есть вектор в пространстве Ар, который, будучи записан в базисе (81), является /-м столбцом матрицы X. В виде фор- мулы это запишем так: фА=*/- Таким образом, среди столбцов матрицы X имеется столько линейно независимых столбцов, каков ранг мат- рицы X. Обозначим это число линейно независимых столбцов через f. Оказывается, что матрица X имеет квадратную подматрицу порядка г с определителем, не равным нулю, и не имеет квадратной подматрицы по- рядка s> г с определителем, отличным от нуля. Оказывается, далее, что матрица X имеет г линейно независимых строк. Таким образом, число линейно неза- висимых строк матрицы X равно числу линейно незави- симых столбцов матрицы: и то и другое равны рангу г, матрицы X (см. гл. 4, пример 7). 62
Докажем предложение А). Изменим прежде всего нумерацию базисных векторов (82) так, чтобы линейно независимыми столбцами матрицы X стали столбцы х{, х2, ..хг. Составленную из этих столбцов матрицу обозначим че- рез U. Тогда мы будем иметь f/ = ||wj.||, и* = х>, 1 = 1, ...» р, /=1, ... г. Заметим прежде всего, что Р>г> так как, если бы было р < г, то мы имели бы г линейно независимых векторов в пространстве Ар размерности р<г, что невозможно (см. предложение В) § 1). Если р = г, то матрица U квадратная и столбцы ее линейно независимы, поэтому определитель ее отличен от нуля (см. теорему 3). Таким образом, в случае р = г для матрицы X найдена квадратная подматрица U по- рядка г с определителем, отличным от нуля. Рассмотрим случай, когда р> г. Вычеркнув из мат- рицы U строку с номером k, получим некоторую мат- рицу Uk размеров (р—1,г). Допустим, что столбцы матрицы Uk линейно зависимы. Тогда существуют числа с1, с2, сг, не все равные нулю, такие, что и^а = о при i Ф k. Но при i = k это равенство невозможно, так как тогда оказалось бы, что столбцы матрицы U линейно зави- симы. Таким образом, «*са = у#=0, и мы получаем сах1а = уе{к, а = 1, 2...г. Итак, базисный вектор ек пространства Ар является ли- нейной комбинацией векторов xi, х2 • • •. хг, составляю- щих базис подпространства фВ’, так что вектор е* ока- зывается вектором, принадлежащим векторному под- пространству фВ’ пространства Ар. Следовательно, мы пришли к выводу, что если у матрицы U вычеркнуть k-ю строку и полученная матрица будет иметь линейно 63
зависимые столбцы, то базисный вектор е* пространства Ар принадлежит векторному подпространству фЖ. Здесь число k может принимать значения 1, 2, ..., р>г. Если бы оказалось, что при вычеркивании из матрицы U лю- бой строки с номером k р мы получаем матрицу Uk, столбцы которой линейно зависимы, то оказалось бы, что в пространстве фВ"7 имеется р > г линейно независи- мых векторов, что невозможно, так как р > г. Таким образом, найдется такой номер k строки матрицы £7, что при вычеркивании й-й строки в этой матрице мы полу- чим матрицу Uk, столбцы которой линейно независимы. Этот процесс можно продолжать до тех пор, пока вы- сота матрицы U, получаемой путем последовательного вычеркивания строк, не станет равной г. Тогда остав- шаяся матрица будет квадратной и в ней столбцы будут линейно независимы, так что определитель этой матрицы отличен от нуля (см. теорему 3). Итак, мы нашли в мат- рице X квадратную матрицу порядка г, определитель которой отличен от нуля. Допустим теперь, что у матрицы X есть квадратная подматрица 0 порядка s, определитель которой отличен от нуля. Изменим нумерацию строк и столбцов матрицы X таким образом, чтобы e=|ej|, ej=4 t= i, 2............ /=1, 2,..., s. Покажем теперь, что у матрицы X, полученной изме-, нением порядка строк и столбцов, первые s строк ли- нейно независимы. Допустим противоположное. Тогда имеет место соотношение сах® = 0, а = 1, 2, . s, у=1, 2, q, (83) причем не все числа Ср с2 •.. > cs равны нулю. Из отношения (83), в частности, получаем сах“ = 0, а = 1, 2, /=1,2,...,$. Это соотношение показывает, что во взятой нами квад- ратной подматрице © строки линейно зависимы, что не- возможно, так как определитель ее отличен от нуля.. Транспонируя матрицу X, т. е. беря матрицу Хт, мы из сказанного можем сделать вывод, что если у матрицы X имеется квадратная подматрица U порядка s с опре- делителем, отличным от нуля, то в матрице Хт имеется 64
s линейно .независимых строк. Это значит, что в исход- ной матрице X имеется s линейно независимых столб- цов. Но так как число линейно независимых столбцов матрицы X равно ее рангу г, то справедливо неравен- ство s г. Таким образом, мы показали, что в исходной мат- рице X ранга г имеется квадратная подматрица порядка г с определителем, отличным от нуля, но не имеется квадратной подматрицы большего порядка с определи- телем, отличным от нуля. Одновременно мы показали, что в матрице X имеется ровно г линейно независимых строк и ровно г линейно независимых столбцов. Итак, предложение А) доказано. Применим теперь вышесказанное к решению общей системы линейных уравнений. Именно, мы рассмотрим систему уравнений вида a£«/" = 6r, i=l, 2, .... р, а— 1, 2, ...» q. (84) Здесь У = (У1> У2../) — неизвестные величины. Числа а} составляют коэффи- циенты системы уравнений (84) и образуют матрицу Л=|Д'|, .= 1, 2, ... р, i-l,2....,4. »-(&', 6!....»’) — известные правые части. Таким образом, матрица А, составленная из коэффициентов системы уравнений (84), имеет р строк, т. е. высоту р, и q столбцов, т. е. ширину q. Нижеследующая теорема отвечает на вопрос: при ка- ких условиях система (84) имеет решение. Теорема 5. Присоединим к матрице А, имеющей ширину q, еще один столбец, — именно, столбец b (см. '(85)). Полученную так матрицу обозначим через В. Матрица В имеет размеры (p,q+ 0- Оказывается, что система (84) имеет решение тогда и только тогда, когда матрицы А и В имеют одинаковые ранги. Доказательство. Пусть ранг матриц А и В ра- вен г. Это значит, что в матрице А существует г линейно независимых столбцов (см. А)). Присоединяя к этим столбцам столбец Ъ (см. (85)), мы получим г +1 ли- нейно зависимых столбцов, так как в противном случае матрица В имела бы как минимум ранг r+ 1. Выписы- вая эту линейную зависимость, мы видим, что систему 1^84) разрешима. Если система (84) разрешима, то 55
столбец b линейно зависит от столбцов матрицы А и, следовательно, ранг матрицы В равен рангу матрицы А (см. А)). Итак, теорема 5 доказана. В случае, если система уравнений (84) имеет реше- ние, опишем совокупность всех решений, так как реше- ние может быть не единственно. Обозначим ранг матриц А и В через г, считая уже, что ранги этих матриц равны. Меняя нумерацию неиз- вестных системы (84) и нумерацию ее уравнений, мы можем добиться того, чтобы квадратная подматрица в порядка г матрицы А, определитель которой отличен от нуля, стояла в верхнем левом углу матрицы А, так что мы имеем 0 = |а'|, 1 = 1, 2,..., г, /=1, 2, ...» г. Как это видно из доказательства предложения А), пер- вые г строк матрицы В линейно независимы, остальные линейно зависимы от них. Для того чтобы удобно запи- сать этот факт, обозначим компоненты вектора Ь через а'+1, i=l, 2, ..., р. Запишем теперь в виде формулы тот факт, что последние строки матрицы В линейно за- висят от первых г ее строк: а/= uaap i = г + 1, г + 2, ..., р, а = 1, 2....г, / = 1, 2, ..,, q + 1, где Ur+t, Ur+г, • • •, Up суть числа. Это показывает, что в системе уравнений (84) последние р — г уравнений ли- нейно зависят от первых г уравнений и потому являются их следствием, так что их можно отбросить, не меняя решения. Таким образом, нам достаточно решить систему уравнений о.ауа = Ь1, z = l, 2....г, а=1, 2, ..., q, или, что то же самое, систему уравнений аауа = b$tp, z=l, 2, ..., г, а = 1, 2, ..., г, Р = г+ 1...... Здесь неизвестным yr+i, ..., уч можно придать произ- вольные значения и решать полученную систему по спо- собу, указанному в теореме 2. Таким образом, совокуп- ность решений системы уравнений (84) зависит от q — г. параметров yr+i, .... уч. 56.
§ 7. Евклидовы векторные пространства Определение 6. Векторное пространство Еп на- зывается евклидовым, если в нем определено скалярное произведение. Именно, в Еп задана некоторая симмет- ричная билинейная форма f(x,y) с положительно опре- деленной квадратичной формой f(x, х) и скалярное про- изведение (х, у) задается формулой (*> y) = f(x, у). Длина вектора |*|> 0 определяется формулой 1*12 = (*> *)• Пусть е(, е2, • • •> еп — некоторый базис пространства Еп, так что х = хаеа, у = у%. Тогда в силу предложения D) § 2 мы имеем (*. у) = f (еа, е₽) хау$. (86) Из предложения Е) § 2 следует, что, зная длину каждого вектора, можно вычислить скалярное произве- дение двух любых векторов этого пространства. Ортонормальная система А) Система векторов elf е2, ер (87) называется ортонормальной, если имеет место соотноше- ние ( 1, i = ], (еь е/) = д</ = |0 . /=1......р, (88) Таким образом, каждые два различных вектора системы (87) ортогональны между собой, а длина каждого век- тора (87) равна единице. Ортонормальная система (87) всегда линейно неза- висима. Действительно, если имеет место соотношение с°е0 = О, 57
то, умножая это соотношение скалярно на е,, получаем Ci = 0. Таким образом, если р = п, то система ei> е2, ...» (89) является ортонормальным базисом пространства Еп. В случае ортонормального базиса (89) скалярное произ- ведение (86) в координатной форме записывается в виде (*» У) = f (*> У) = Е хаУа = Базис (89), удовлетворяющий условию (88), назы- вается ортогональным, потому что каждые два различ- ных его вектора ортогональны между собой; он норми- рован потому, что длина каждого вектора равна еди- нице. В дальнейшем будет установлено (см. предложение С)), что в евклидовом векторном пространстве Еп всегда имеется ортонормальный базис. В) В евклидовом векторном пространстве Еп каждая линейная форма фх (см. определение 3) задается в виде скалярного произведения фх = (и, х) (90) некоторого вектора и на вектор х, причем вектор и од- нозначно определяется линейной формой ф. Выберем в пространстве Еп некоторый ортонормаль- ный базис. Тогда линейная форма ф определяется ра- венством (см. (25) § 2) фх — dpX₽. Тогда вектор и = («1, и2, ..., ип) задается формулой и1 — dt. При таком выборе и равенство (90) выполнено. Дока- жем, что вектор и однозначно определяется линейной формой ф. В самом .деле, допустим, что одновременно имеют место два равенства фх = (и, х), фХ = («’, х). Тогда мы имеем (« — я1, х) = 0 при произвольном х. Следовательно, при х = и — «* имеем (« — «’, и — а‘) = 0. 68
Это возможно лишь тогда, когда и — и1 — 0. С) Каждая линейно независимая система векторов *2» •••> %р (91) однозначно определяет ортонормальную систему векто- ров 8,, е2, ер. (92) Процесс перехода от системы векторов (91) к системе векторов (92) называется ортонормированием. Опишем его. Так как система векторов (91) линейно независима, то вектор *1 =/= 0 и, следовательно, его длина | Xi | #= 0. Мы полагаем е‘-|х||- Далее полагаем 82 = *2-(*2> 81)8Г Мы имеем (е', Cj) = (х2, ej — (х2, «О = 0. Таким образом, векторы ei и ортогональны между со- бой. При этом вектор е' =И= 0, так как векторы х{ и х% линейно независимы, а следовательно, линейно незави- симы векторы и е'. Теперь нормируем вектор е'. Именно, положим 82 = 8Ж|* Таким образом, получаем («2, «г)=1. Пусть si, 8г, .... 8г уже построены так, что они состав* ляют ортонормальную систему. Построим вектор 8i+i« Положим 8«+l = Xi+l (*i+P 81) 81 ~ (*<+!> 8а) 82 ~ (*Ц-1 > ®i) 8i Прежде всего, вектор е'+1 0, так как из линейной не* зависимости векторов Xi, хг, .... xl+i следует линейная независимость векторов •••> *1+1» 69
Умножая вектор е'+1 на произвольный вектор еу, j^i, получаем Таким образом, построенный вектор е' , ортогонален ко всем векторам 8р 82, е. и отличен от нуля. Нормируя вектор е'+1, т. е. полагая мы получаем вектор e,+i. D) Каждое векторное подпространство Вр евклидова векторного пространства Еп само естественным образом является евклидовым векторным пространством. Дей- ствительно, каждая пара векторов из Вр является парой векторов из Еп, и потому для нее определено скалярное произведение. Вектор z пространства Еп, ортогональный каждому вектору из подпространства Вр, считается ор- тогональным всему пространству В”. Обозначим через С совокупность всех векторов пространства Еп, ортого- нальных векторному подпространству Вр. Оказывается, что С является векторным подпространством простран- ства Еп размерности q — п — р, причем векторное про- странство Еп распадается в прямую сумму своих подпро- странств Вр и С — Cq. Подпространство Cq называется ортогональным дополнением подпространства Вр. Ока- зывается, что подпространство Вр является ортогональ- ным дополнением подпространства Cq. Для доказательства данного утверждения выберем в евклидовом векторном пространстве Вр ортонормаль- ный базис ер е2....гр. Данную систему векторов дополним до максимальной линейно независимой системой векторами xP+i, ..., хп (см. D) § 1). Тогда мы получим максимальную линейно независимую систему 81, ®2...8^, Хр+1, .... Хп. Теперь подвергнем эту систему процессу ортонормирова- ния (см. С)). При этом первые р векторов ei, е2, .... ер не изменятся, а векторы xp+i, хр+2, .... хп заменятся дру- гими векторами. Вновь полученную систему запишем в виде 81, 8g, Ер, Ер+1, 8П. 60
Последняя система является ортонормальным базисом пространства Еп, так что каждый вектор х пространства Еп записывается в виде X = Ха8а. Для того чтобы вектор х был нормальным ко всему про- странству необходимо и достаточно, чтобы он был нормальным к каждому вектору 8t-, i= 1, 2, р. Та- ким образом, должно быть выполнено условие (х> еО = 0, i= I, 2, ..р. Из последнего условия вытекает х1 = 0, ..., хр = 0. Таким образом, вектор z, нормальный ко' всему про- странству Вр, записывается в виде z = р = р + 1, ..., п. Совокупность всех векторов такого вида составляет век- торное подпространство Cq пространства Еп размерности q=n — р, которое является ортогональным дополне- нием подпространства Вр. Ясно, что подпространство Вр в свою очередь является ортогональным дополнением подпространства Cq. Дадим геометрическое описание скалярного произве- дения двух векторов пространства Еп. Е) Пусть *> у — два линейно независимых вектора пространства Еп. Совокупность всех векторов и = сх + dy, где с и d — произвольные действительные числа, состав- ляет двумерное векторное подпространство Е2 вектор- ного пространства Еп. Множество Е2 является векторным двумерным евклидовым пространством, иначе говоря, евклидовой плоскостью. Таким образом, векторы х и у являются линейно независимыми векторами плоскости Е2, и ясно, что такое угол между ними. Обозначим его через <р. Оказывается, что скалярное произведение век- торов х и у выражается в следующем виде: (*> y) = l*llff|cosq>. (93) 61
Для доказательства формулы (93) ортонормируем пару векторов х, у. Мы получим тогда два вектора еь е2> составляющих базис двумерного евклидова простран- ства Е2. При этом * = l*lei. У = IУI («1 cos <р + е2 sin <р). Таким образом, (*> У) = (I х iBj, |y|(8j cos ф-|-в2 sin ф)) = |х|| у|созф. Таким образом, формула (93) доказана. В случае, если х и у линейно зависимы, следует считать, что угол ф между ними равен нулю или л. При этом оба они выра- жаются через один и тот же вектор * = 1*1»!, 9=±1у|81. Тогда мы имеем (*, у) = | х || у |cos О или (*» У) = 1*11 У Icosn. Таким образом, формула (93) имеет место для любых двух векторов х и у из Еп. F) Отображение ф евклидова векторного простран- ства Еп на евклидово векторное пространство £" назы- вается изоморфным, если оно линейно (см. определе- ние 3) и сохраняет скалярное произведение, т. е. если для двух любых векторов х и у из Еп имеет место фор- мула (фх, фу) = (х, у). Как это следует из Е) § 2, сохранение скалярного про- изведения вытекает из сохранения длины векторов при отображении ф. Именно, если для любого вектора х^Еп имеет место соотношение |фх| = |х|, то при отображении ф сохраняется и скалярное произве- дение. В евклидовом векторном пространстве определено расстояние р(х, у) между каждыми двумя его векторами х и у. Оно задается формулой Р(*> У) = 1*-01« 62
Ортогональные матрицы G) Пусть Еп — евклидово векторное пространство размерности п и en е2, е„ (94) — некоторый его ортонормальный базис (см. предложе- ние А)). Пусть далее, <р— некоторое изоморфное отобра- жение пространства Еп на себя (см. F)). Матрица Х = |х^|; i = l.....п, j=l,...,n, соответствующая отображению <р в ортонормальном ба- зисе (94), называется ортогональной. Если <pi и <р2— два изоморфных отображения пространства Еп на себя, то отображение <pi<p2 есть тоже изоморфное отображение, поэтому произведение двух ортогональных матриц есть также ортогональная матрица. Матрица X, соответствую-, щая отображению <р, определяется соотношениями <ре/ = х“еа. Дадим теперь четыре характеристики ортогональных матриц. Мы имеем ч>е/==*/ = (х)’ 4 •••’ х7)- Это. значит, что элементы /-го столбца матрицы X яв- ляются координатами вектора (ре,- в базисе (94). Так как отображение <р сохраняет скалярное произведение, то (ф«/. Ф**) = бу*- Переписывая это выражение в координатной форме, по- лучим S xfxk = (95) а=1 ' Ясно, что если для матрицы X выполнено это соотноше- ние, то она является ортогональной. Можно сказать, что столбцы матрицы X составляют ортонормальную си- стему векторов. ОказьЕвается, что соотношение (95.) эквивалентно соотношению ХГХ = Е. (96) Условия (95) и (96), наложенные на матрицу X, сфор« мулированы в терминах столбцов. Оказывается, что их 63
можно сформулировать в терминах строк. Именно; имеет место соотношение п Ех$ = б* (97) 0=1 р р Соотношение (97) можно переписать в виде формулы ХХТ = Е. (98) Оказывается, что если матрица X удовлетворяет од- ному из соотношений (95) — (98), то она ортогональна. Относительно (95) это утверждение уже было высказа- но как очевидное. Нам остается показать, что каждое из соотношений (96) — (98) эквивалентно соотношению (95). Оказывается далее, что определитель ортогональной матрицы D(X) удовлетворяет условию £>(Х) = ±1. (99) Докажем, прежде всего, эквивалентность соотноше- ний (95) и (96). Для этого положим ' Хт = С7 = |и/||, так что «/=4 Соотношение (96) записывается в виде UaXk == бй- Заменяя здесь и!а через х^, мы получим формулу (95). Таким образом, соотношения (95) и (96) эквивалентны. Эквивалентность соотношений (97) и (98) доказы- вается аналогично. Докажем соотношение (99). В силу теоремы 1 D{X^ = D{X). В силу этого, теоремы 4 и соотношения (96) мы имеем £)(Х)О(Х)=1, откуда и следует формула (99). Таким образом, в ча- стности, определитель ортогональной матрицы отличен от нуля, и поэтому ортогональная матрица имеет обрат- ную (см. замечание к теореме 4). Теперь докажем, что соотношения (96) и (98) экви- валентны. Для этого соотношение (96) умножим справа 64
на Х~1. Тогда мы получим Умножая это соотношение на X слева, получим ХХГ = Е. Таким образом, из соотношения (96) вытекает соотно- шение (98). Аналогично из соотношения (98) следует соотношение (96). Таким образом, соотношения (96) и (98) эквивалентны. Итак, все соотношения (95)—(98) эквивалентны друг другу и означают ортогональность матрицы X (см. гл. 4, пример 8). 3 Л. С. Понтрягин
Глава 2 КОРНИ МНОГОЧЛЕНОВ § 8. Комплексные числа Здесь я кратко рассказываю о том, как возникли и утвердились в математике комплексные числа. Затем даю их определение, описываю правила действий над ними, употребляя при этом их геометрическую интер- претацию, но не пользуюсь при этом как известными тригонометрическими формулами косинуса суммы и си- нуса суммы. Историческая справка Комплексные числа были введены в математику для того, чтобы сделать возможной операцию извлечения квадратного корня из любого действительного числа. Это, однако, не является достаточным основанием для того, чтобы вводить в математику новые числа. Оказа- лось, что если производить вычисления по обычным пра- вилам над выражениями, в которых встречается квад- ратный корень из отрицательного числа, то можно прийти к результату, уже не содержащему квадратный корень из отрицательного числа. В XVI в. Кардано нашел фор- мулу для решения кубического уравнения. Оказалось, что именно в том случае, когда кубическое уравнение имеет три действительных корня, в формуле Кардано встречается квадратный корень из отрицательного числа. Поэтому квадратные корни из отрицательных чисел стали употреблять в математике и назвали их мнимыми числами — тем самым они как бы приобрели право на нелегальное существование. Полные гражданские права мнимым числам на грани XVIII—XIX столетий дал 66
Гаусс, который назвал их комплексными числами, дал им геометрическую интерпретацию и, что самое глав- ное, доказал основную теорему алгебры, утверждающую, что каждый многочлен имеет хотя бы один действитель- ный или комплексный корень. Определение комплексных чисел Мы будем исходить из того, что действительные чис- ла нам известны. Мы знаем, что для них определены два основных действия — сложение и умножение — и имеют- ся обратные к ним действия — вычитание и деление. Для этих действий выполняются хорошо известные правила, которые обычно употребляются совершенно автомати- чески — поэтому я их не буду здесь формулировать. Поставим теперь перед собой задачу расширить по- нятие числа таким Ъбразом, чтобы уравнение «2+1=0 имело решение. Корень этого уравнения объявляется новым числом и обозначается через i. Таким образом, для I имеем Р = -\. (1) Так как в множестве новых чисел содержатся все дей- ствительные числа и элемент i и так как в нем воз- можны действия сложения и умножения, то в этом мно- жестве должны содержаться всевозможные многочлены относительно i с действительными коэффициентами, в частности все многочлены первой степени, т. е. выраже- ния вида z = x + yi = x + iy, где х и у — действительные числа. Эти выражения и на- зываются комплексными числами. Действия над ними мы определим как действия над многочленами, учиты- вая при этом условие (1). Комплексные числа вида z = х + 01 = х являются действительными числами. Комплексные числа вида z = 0 + yi = yi называются чисто мнимыми числами. Пусть Zi =Х\ + yii, z2 = *2 + — два комплексных числа. Согласно высказанному правилу сумма и произ- з* 67
ведение этих комплексных чисел определяются равен- ствами Zi + z2 = (-«i + У+ (*2 + Уд) = (*i + *г) + (г/i + У2) h (2) ZjZ2 = (%! + ytl) (Х2 + y2l) = XtX2 + (Xty2 4- y,X2) I + + У\У2? = C*l*2 — У\У2> + (*1У2 + УА) i- (3) При получении последнего равенства мы использовали условие (1). В случае, если число zi=Xi действительное, полу- чаем x{z2 = х{х2 + x{y2i. (4) Из формул (2) и (3) видно, что сумма и произведе- ние двух комплексных чисел есть также комплексное число. Для того чтобы убедиться, что действие вычитания, обратное действию сложения, существует, достаточно найти число —z, противоположное числу z, а для того чтобы убедиться в том, что возможно деление, доста- точно для z =# 0 указать число z-1, обратное числу z = x+yi. Числа эти, как легко видеть, задаются фор- мулами — z = — х — yi, ___I y_i X2 + у2 X2 + у2 Таким образом, величина z-1, обратная к z, существует всегда, когда z =# 0. Геометрическое изображение комплексных чисел Обозначим через Р плоскость нашего чертежа и вы- берем на ней прямоугольную систему координат (рис. 1). Комплексное число z = х + yi мы поместим в точку z — — (х, г/) с координатами х, у. Обозначим также через г вектор, идущий из начала координат О в точку z. Та- ким образом, буква z обозначает у нас одновременно комплексное число, точку z, изображающую это комп- лексное число, и вектор z, соответствующий этому комп- лексному числу. При этом изображении действительные числа попадают на ось абсцисс, поэтому ось абсцисс на- зывается действительной осью плоскости Р комплекс- ной переменной, а чисто мнимые числа попадают на ось ординат, поэтому ось ординат называется мнимой осью 68
плоскости Р комплексной переменной. Нуль попадает в начало координат. Длина вектора z называется модулем комплексного числа z = х + yi и обозначается | z |: |Z| = +д/л^+г/2. Комплексные числа z, удовлетворяющие условию |z| = l, составляют окружность радиуса 1 с центром в начале координат. На этой ок- ружности лежит число 1. Из точ- ки 1 отложим по окружности дугу заданной длины <р в направлении против часовой стрелки. Конец этой дуги обозначим через (<р). Если ф — отрицательное число, то для получения (ф) нужно от- ложить от точки 1 длину дуги |ф| по часовой стрелке. Как из- вестно, абсцисса точки (ф) есть cos ф, а ее ордината sin ф. Таким образом, комплексное число (ф) задается форму- лой (ф) = cos ф + i sin ф. (5) Итак, всякое комплексное число z, по модулю равное 1,записывается в виде (5). Если z — произвольное комп- лексное число, модуль которого |z| = p отличен от 0, то z число — является комплексным числом, по модулю рав- ным 1, и потому записывается в виде (5). Из равенства z ... — = COS ф + I Sin ф мы получаем z = р (cos ф + i sin ф). (6) Запись (6) называется тригонометрической формой комплексного числа z. Число ф называется аргументом комплексного числа z. Если модуль р комплексного чис- ла z отличен от нуля, то аргумент его определен с точ- ностью до слагаемого 2&л, где k — целое число. Если же модуль р комплексного числа равен 0, то формула (6) также имеет место, однако в этом случае аргумент комп- лексного числа вовсе не определен. Числа р и ф называются полярными координатами точки z. 69
Геометрическое истолкование действий над комплексными числами Из формул (2) и (4) следует, что комплексные чис- ла складываются и умножаются на действительные чис- ла, как векторы. Геометрический смысл сложения комплексных чисел очевиден: вектор z\ + z%— это диагональ параллелограмм ма, построенного на векторах zi и Z2. Отсюда вытекает важное неравенство |г1 + г2|<|г1| + |г2|. (7) Для того чтобы дать геометрическое истолкование умножения комплексных чисел, нужно употребить опе- рацию поворота вектора, или, что то же самое, комп- лексного числа. Повернув вектор z против часовой стрел- ки на угол а, мы получим некоторый новый вектор, ко- торый обозначим через /?a(z). Геометрически ясно, что операция поворота Ra имеет следующее свойство: если а — действительное число, то •^а+р (^) == Ra (Rp fc))> Ra (flZ) = &Ra (z)> Ra (21 + 22) = Ra (zl) + Ra Из последних двух формул следует, что если ai и а2—* два действительных числа, то имеет место соотношение Ra (ОА + a2z2) = aiRa (z{) + a2#a (z2). (8) Непосредственно ясно также, что J?0(l) = cosa +t sin а. (9) Докажем теперь, что поворот комплексного числа z = х -|- yi на угол а равносилен умножению его на комплексное число cos a + i sin a, т. e. что Ra (z) = (cos a + i sin a)z- (10) Для этого рассмотрим сначала отдельно поворот на угол л/2. В этом случае cos-^- -J- i sin-^- = i и равенство (10) принимает вид /?«/2(z) = iz. Проверим эту формулу. С одной стороны, геометрически очевидно, что /?л/2(1) = — i, Rtt/2(i) = — 1. С другой стороны, il = i, И = —1. Та< ким образом, (1) = Л, /^(0==«. 70
Из формулы (8) непосредственно вытекает iz = i(x + iy) = xi + у (— 1) = = *Ял/2 0) + ^Я/2 (О = ЛЯ/2 (х1 + ^0 = =Rn/2(x + “/)=Rn/2(z). Таким образом, формула (10) доказана для а = л/2. Пусть теперь а — произвольное действительное чис- ло. При z = cos а + i sin а получаем == iz = /?л/2 (f) = #л/2 (cos а + i sin а) = = cos (а +^-) + i sin (а +4г) = = R„(cosf+ /sinf)=/?e(0- GO Таким образом, формула (10) доказана при z = i. Перейдем теперь к доказательству формулы (10) для произвольного комплексного числа Z = X + 1У‘ В силу формул (8), (9), (11) имеем Ra (z) = Ra (х + iy) = xRa (1) 4- yRa (z) = = x (cos a + i sin a) + У (cos a + z sin a) = = (cos a + i sin a) (x + yi) — (cos a + i sin a) z. Таким образом, формула (10) полностью доказана. Применяя формулу (10) к комплексному числу z = cos р + z sin р, получаем (cos a + z sin a) (cos p + z sin p) — Ra (cos p + z sin p) = = Ra (R₽ (1)) = Ra+fj (1) = cos (a 4- P) + i sin (a + P). Таким образом, (cos a + i sin a) (cos p + z sin P) = cos (a + p) + z sin (a+p). Производя перемножение комплексных чисел, стоя- щих в левой части, по формуле (3), мы получим (cos a + z sin a) (cos P + z sin p) = = (cos a cos p — sin a sin p) + (sin a cos p + cos a sin P) z\ Значит, мы получили формулы для косинуса и синуса суммы: cos (a + р) = cos a cos p — sin a sin p, sin (a + p) = sin a cos p + cos a sin p. 7t
Для произвольных комплексных чисел, которые мы запишем в виде г (cos а + i sin а), s(cos р + i sin £) по- лучаем r (cos а + i sin a) s (cos p + i sin p) = = rs (cos (а + P) + i sin (a + p)). (12) Таким образом, при перемножении двух комплексных чисел их модули перемножаются, а аргументы склады- ваются. Формулу (12) очевидным образом можно распростра- нить на произвольное число сомножителей. Если все эти сомножители равны между собой и равны комплекс- ному числу г (cos a + i sin a), то мы получаем (г (cos a + i sin a))n = rn (cos na + i sin na). Эта формула очень интересна. Она дает возможность извлечь корень n-й степени из произвольного комплекс- ного числа p(cos ф + i sin ф) Рис. 2 Именно, оказывается, что количество корней п-й степени из числар(соэф+ -Н‘5тф)=#0 равно п, причем корни эти'распо- ложены на окружности п____________ радиуса Vp с центром в начале координат и со- ставляют вершины пра- вильного n-угольника. Это утверждение я предостав- ляю для доказательства читателям. В частности, корень n-й степени из единицы имеет п значений, которые являются вершинами пра- вильного n-угольника, вписанного в единичный круг, при- чем одна из его вершин есть единица (рис. 2). В виде формулы эти корни записываются следующим образом: /V л 2kn . . . 2kn c n 1 a 1 V1 = cos----------h i sin----, k — 0, 1, 2, ..., n — 1. v n i n ’ Комплексно сопряженные числа При рассмотрении комплексных чисел важную роль играют так называемые комплексно сопряженные числа. Если z = х 4- iy — некоторое комплексное число, то чис- 72
ло z, комплексно сопряженное с числом г, определяется формулой z = x — iy. (13) Таким образом, число z, комплексно сопряженное с чис- лом z, является зеркальным образом числа г относи- тельно действительной оси, и мы имеем, в частности, z = z. Если z — т (cos а + i sin а), то z = г (cos а — i sin а) — г (cos (— а) + i sin (— а)), и, следовательно, аргументы двух комплексно сопряжен- ных чисел отличаются лишь знаком. Из формул (2), (3) следует, что Z1 4-22 = 2! 4-Z2. (14) Из формул (8), (13) следует, что 2^=2!Z2. (15) Заметим еще, что равенство 2 = 2 (16) имеет место тогда и только тогда, когда z есть дей- ствительное число (см. гл. 4, примеры 9—11). § 9. Основная теорема алгебры Здесь будет доказана основная теорема алгебры, утверждающая, что всякий многочлен положительной степени с комплексными коэффициентами имеет по край- ней мере один комплексный корень. При этом действи- тельные числа считаются частным случаем комплексных чисел. Эта теорема впервые была доказана Гауссом в 1799 г. для частного случая многочленов с действитель- ными коэффициентами. Гаусс показал, что всякий такой многочлен имеет по крайней мере один действительный или комплексный корень. Это значит, что, рассматривая корни алгебраических уравнений (т. е. корни многочле- нов), мы не можем прийти к новым числам. Здесь эта теорема доказывается для многочленов с комплексными коэффициентами. Доказательство основной теоремы алгебры основано на конкретном рассмотрении комплексных чисел. Стро- 73
гое доказательство основной теоремы алгебры, опираю- щееся на теорию функций комплексной переменной, при- ведено в моей книге «Анализ бесконечно малых» (см. пример на с. 246). Здесь я привожу не строгое, но геометрически убе- дительное доказательство, основанное на рассмотрении путей в плоскости комплексной переменной и их дефор- маций. Доказательство это не только доказывает тео- рему, но до некоторой степени объясняет, почему она верна. Как следствие основной теоремы алгебры мы дадим разложение многочлена с комплексными (в частности; действительными) коэффициентами на множители. Пути в плоскости комплексной переменной Если точка z в плоскости Р комплексной переменной перемещается во времени, когда время t меняется в пре- делах /о < 6, то мы считаем, что в плоскости Р за- дан путь (рис. 3). Таким образом, путь есть функция z(0 действительной переменной t, принимающая комп- лексные значения^и заданная на отрезке to t ti". z(f), to^t^ti- Формула эта задает путь. Речь идет здесь о движе- нии точки, осуществляемом, естественно, без скачков, так что функция z(t) является непрерывной. Мы не уточняем здесь понятие непрерывности, считая, что оно интуитивно ясно как движение точки. Следует отчетливо понимать, что путь есть процесс движения, а не та ли- ния, которую описывает движущаяся точка. Одну и ту же линию можно описать разными способами. 74
В процессе движения точка z(f) в разные моменты времени может попадать в одну и ту же точку плоско-! сти, так что не исключается равенство Z(/2) = z(/3) ПрИ t^tz. Таким образом, путь может иметь самопересечения. Он может даже состоять из одной точки, именно, в случае, когда точка z(t) вовсе не перемещается при изменении t. В дальнейшем, если это не будет оговорено специ- ально, мы всегда будем предполагать, что путь не проходит через начало коор- динат, т. е. что величина z(t) ни при каком значении t не обращается в нуль. Точка z{to)=zo называется «ача- лом пути, а точка г(Л) = = zi — его концом. Если имеет место равенство zo = zi, то путь называется замк- нутым (рис. 4). Так как комплексное число z(t) не обращается в нуль, то для всякого значения t определен аргумент <р(0 комплексного числа z(t), но он определен лишь с точностью до слагаемого 2£л (k— целое число). Эта не- однозначность для нас нежелательна. Для того чтобы освободиться от нее, мы выберем для начальной точки Zo вполне определенный аргумент <ро = ф(/о). Затем по мере возрастания t будем выбирать аргу- мент ф(/)' точки z(/) так, чтобы при малых изменениях t он менялся мало. Этим неоднозначность выбора аргу- мента будет устранена. Добавление к аргументу числа 2kn при k #= 0 привело бы сразу к резкому изменению величины ф (/). Выбрав начальное значение аргумента ф(/0) = ф0 и следя за тем, чтобы аргумент ф(/) точки z(t) менялся вместе с t непрерывно, мы получаем впол- не определенную функцию ф(0, меняющуюся непре- рывно, т. е. без скачков. Если выбрать начальное значе- ние аргумента ф0 иначе, изменив его на 2kn, то он будет отличаться от ранее выбранного ровно на 2kn на всем протяжении изменения I. Отсюда следует, что при таком способе построения функции q>(t) величина Ф (Jd — ф (/0) (17) 75
не зависит от случайно выбранного начального значения аргумента числа го- Если путь замкнут, то точки zo и z\ совпадают и, следовательно, их аргументы <p(f0) и <р(6) могут отли- чаться лишь на 2£л. Поэтому число (17) в случае замк- нутого пути есть 2£л. Целое число k называется индек- сом замкнутого пути в плоскости комплексной перемен- ной z. Следует еще раз подчеркнуть, что индекс замкну- того пути можно определить лишь в том случае, когда путь не проходит через начало координат. Индекс k имеет простой геометрический смысл. Имен- но, он указывает, сколько раз точка z(t), описывая замкнутый путь, обходит начало координат (рис. 5). Рассмотрим простой пример. Путь 1 4- г (cos t +1 sin /), 0^/^2л, (18) является замкнутым. Он описывает окружность с цент- ром в точке 1 и радиуса г и проходит окружность с те- чением времени t равномерно против часовой стрелки. Если число г меньше 1, то окружность не содержит внутри себя начала координат и индекс пути равен 0. Если г больше 1, то окружность содержит внутри себя начало координат и индекс пути равен 1 (проверьте это самостоятельно). В случае г=1 путь проходит через начало координат и- его индекс не определен. Если чис- ло г меняется, то путь (18), как говорят, деформируется (рис. 6). Мы видим на этом примере, что во время де- формации замкнутого пути его индекс не меняется, если только путь в какой-то момент деформации не проходит через начало координат. Говоря, что путь описывается движением точки во времени, мы лишь хотели придать более интуитивный 76
характер определению пути. В действительности же речь идет о зависимости комплексной переменной z от неко- торого действительного параметра t (который можно обозначить и другой буквой). Так, например, путь (18) можно записать в виде 1 + г (cos а + i sin а), 0<а<2л, (19) где параметром уже яв- ляется не /, а а. Ясно, что путь (19) описывается точкой 1 + z, когда точка z описывает путь г (cos а + i sin а), О а 2л. пути 1+r(cosa+islaa)npU' изменении г Здесь г есть числовой па- Рис. 6 раметр, от которого зави- сит сам путь. Говорят, что при изменении г путь (19) деформируется. Дадим более сложный пример замкнутого пути, кото- рый мы обозначим через Кп- Его зададим формулой z = (1 + s cos t) (cos nt + i sm.nf)> 0 t 2л. Рис. 7 Деформация пути. Здесь мы считаем, что 0 s < 1, и потому |z|=l + s cos t и положителен при произвольном t. Путь Кп имеет самопересечения. При п = 2 одно самопересечение, при п = 3 два. Введем понятие деформации пу- ти. Будем считать, что путь дефор- мируется, если он постепенно ме- нятся-без скачков в зависимости от некоторого параметра, который для пути (19) обозначен через г, а во- обще может быть обозначен и дру- гой буквой, например s (рис. 7). Таким образом, деформирующийся путь записывается формулой z(a, s), ao^as^aj, (20) Здесь при каждом фиксированном значении параметра s мы имеем определенный путь, описываемый во время 77
изменения а от а0 до аь а при изменении s сам путь ме- няется, деформируясь. Ясно, что если путь (20) замк- нут, т. е. если при любом значении $ имеет место равен- ство z(a0, s) = z(a„ s), то в течение деформации индекс пути должен меняться без скачков. А так как он есть целое число, то индекс этот остается постоянным. Ко- нечно, это верно только в том случае, когда для произволь- ного значения S путь (20) не проходит через начало коорди- нат. В противном случае для этого значения s индекс пути не определен. Таким образом, мы можем высказать следую- щее утверждение. Если замкнутый путь не- прерывно деформируется, не проходя в процессе деформа- ции через начало координат, то индекс его не ме- няется. Дадим еще один пример замкнутого пути: rn (cos па +1 sin па), 0^а^2л. (21) Ясно, что путь этот описывается точкой z", когда точка г описывает замкнутый путь: т (cos а + i sin a), 0 < a < 2л. Видно, что когда а меняется от 0 до 2л, аргумент точки zn меняется от 0 до 2пл. Таким образом, индекс пути (21) равен п (рис. 8, где схематически показан случай п = 3). Комплексные функции комплексной переменной Если числовое значение комплексной переменной ве- личины w можно найти, зная числовое значение другой комплексной переменной величины г, то переменная ве- личина w называется функцией переменной величины z, что записывается в форме w — f(z). 78
Если комплексная функция f(z)' комплексной пере- менной z имеет производную, то она называется анали- тической функцией. Теория аналитических функций яв- ляется теперь одним из важнейших разделов матема- тики. Здесь нас будут интересовать лишь аналитические функции очень частного вида, именно многочлены*). Рассмотрим многочлен w = f(z) = zn + alzn~l+ ... +an_iz + an, (22) где Д1, а2, ..., ап—комплексные коэффициенты, ап—. неотрицательное целое число, которое называется сте- пенью многочлена. Целью нашего исследования будет доказательство того, что многочлен (22) положительной степени имеет корень, т. е. что уравнение f(z) = O, где f (г)— многочлен (22) и п > 0, имеет решение. Для доказательства этого мы рассмотрим замкнутый путь f (г (cos а + i sin а)), 0 < а < 2л, (23) который описывает точка f(z), когда точка z описывает замкнутый путь г (cos а + i sin а), О С а < 2л. Случай, когда свободный член ап многочлена f(z) равен 0, не требует рассмотрения, так как в этом слу- чае многочлен f(z) имеет очевидный корень z = 0. По- этому мы будем считать, что ап ф 0. Замкнутый путь (23) зависит от параметра г и при изменении параметра т деформируется. При г = 0 число z равно 0, и путь f(z) состоит из неподвижной точки ап. Таким образом, его индекс при г = 0 равен 0. Мы докажем, что если взять г достаточно большим, то индекс пути (23) равен п. Но по предположению п #= 0, поэтому при изменении числа г от большого значения к нулю путь (23), дефор< мируясь, пройдет при каком-то значении г через начало координат, а это и значит, что при некотором значении z функция f(z)' обратится в нуль, т. е. корень у этого мно- гочлена существует (рис. 9). Для доказательства того, что при достаточно боль- шом г замкнутый путь (23) имеет индекс, равный п, *) Замечание о производной имеет целью лишь указать на су- ществование теории аналитических функций. В дальнейшем произ- водная функции комплексной переменной использоваться не будет. 79
продеформируем этот путь в более простой, индекс кото- рого легко сосчитать. Прежде всего мы разобьем многочлен f(z) на сумму двух многочленов f (z) = zn + g (z), где g(z) задается формулой g (z) = ^z"-1 + a2zn~2 + ... +a„_!z + an. Так как коэффициенты Рис. 9 ai, а2, ...» an многочлена g(z) суть вполне определенные чис- ла, то они все не превосходят по модулю некоторую констан- ту с. Из неравенства (7), рас- пространенного на произволь- ное число слагаемых, следует, что при |z| > 1 |g(z)Knc|z'»-11. (24) Рассмотрим многочлен f(z, s), зависящий от параметра s, O^s^l, задаваемый сле- дующей формулой: f (z. s) = zn + sg (z). Мы имеем равенство z" = f (z, $) — sg(z), откуда |z"Klf(z, s)l + | — sg(z)K|f(z, s)|-|-nc|z,I-1|s<. (cm. (24)). Отсюда следует <lf(z. s)| + /ic|zn-‘| | f (z, s) |> I zn I — nc\zn~' |. Обозначим |z| через г, тогда последнее неравенство принимает вид | f (z, s)\^rn — ncrn~l = rn—' (r — cn). Таким образом, при г > cn правая часть предыду- щего неравенства положительна. Следовательно, модуль функции f(z,s) не обращается в нуль ни при каком зна- чении s, если только г > сп. Обратим внимание теперь на тот факт, что при з = 0 многочлен f(z,s) превращается в известный нам много- член z", а индекс пути z", когда z описывает окруж- 80
ность r{cos а + i sin а), нами уже сосчитан (см. (21)). Он равен п. При $ = 1 многочлен f(z, s) превращается в многочлен f(z), и определяемый им путь (23) имеет индекс, тоже равный п. Итак, мы доказали, что индекс пути (23), определяемый многочленом f(z), при г > сп равен п. Таким образом, при меняющемся г от 0 до сп + е, где е > О, путь (25) деформируется, причем при г — 0 этот путь превращается в одну точку и его индекс равен 0, а при г = сп + е его индекс равен п. Из этого видно, что в процессе изменения г путь (23) при неко- тором значении г проходит через начало координат и, следовательно, многочлен f(z) при некотором значении z, \z\ сп + 8, обращается в нуль. Итак, основная теорема алгебры доказана (см. гл. 4, пример 12). § 10. Алгоритм Евклида Деление многочленов При делении целого положительного числа а на це- лое положительное число b мы приходим к равенству a = bh + k, (25) где h и k — целые неотрицательные числа и k < Ь. Чис- ло h называется частным, a k — остатком при делении числа а на число Ъ. Эта формула получается в результате деления одного целого числа на другое целое число и описана в ариф- метике с использованием знака |_: 256121 . Этот спо- соб излагается в начальных классах средней школы. Точно так же со знаком |____ можно делить друг на друга и многочлены: х3 + 4х2 + 5х + 11 х2 + 6х + 7. В ре- зультате получается следующее: Будем исходить из двух многочленов a(z) = aozp + ai2₽-1+ ••• + ар, 6(z) = 6Jz’ + 61z’-1+ ... +&?. Мы будем предполагать здесь, что числа а0 и &о не равны нулю, так что многочлен а (г) имеет степень р, а многочлен b(z) имеет степень q. В результате деления многочлена а (г) на многочлен Ь(г) при помощи |____ придем к следующему равенству, аналогичному 81
равенству (25): a (z) = b (z) h (z) + k (z), (26) где степень многочлена k(z) меньше q. Многочлены h(z)' и k(z) называются соответственно частным и остатком при делении многочлена а (г) на многочлен b(z). Если k(z)^0, то говорят, что многочлен a(z) де- лится на многочлен b(z), a h(z) является частным от их деления. Равенство (25) доказано в арифметике, а равенство (26) должно доказываться в алгебре. Но деление много- членов не входит в ныне действующую школьную про- грамму. Чтобы доказать равенство (26), мы должны по- строить такие многочлены Л(г) и fe(z), которые удов- летворяют этому равенству. Процесс этого построения представляет собою очень важный алгоритм, осуществ- ляемый при помощи знака |____, так называемый алго* ритм Евклида. Опишем его в общем виде. Если р < q, то тогда ft(z) = 0, k(z)= a(z), и равен- ство (26) выполнено. Теперь мы будем строить многочлены ft(z) и fe(z) в предположении, что р q. Сперва построим равенство a(z) = 6(z)/i1(z) + «1(z), (27) в котором степень многочлена ai(z) меньше р. Для этого положим Л,И=Л2»-,. Тогда разность a(z) — b(z)hl(z)^=ai(z) имеет степень, меньше р, так как в этом многочлене коэффициент при zp равен нулю, а остальные степени г, входящие в этот многочлен, очевидно, меньше р. Таким образом, равенство (27) построено. Если многочлен ai(z) имеет степень меньше q, то ра- венство (27) уже является равенством (26). В противо- положном случае к многочлену ai(z) применим ту же процедуру, которая применена к многочлену а (г) при построении равенства (27). И тогда мы получим для него равенство «I (z) = Ь (z) h2 (z) 4- а2 (z), причем степень многочлена az(z) уже меньше, чем сте- пень многочлена ai(z). Если многочлен ^2(z) уже имеет степень, меньшую чем 9, то, подставляя ai (z)’ из послед- 82
него равенства в равенство {27), мы получим a (z) = b (z) (z) + h.2 (z)) + a2 (z), которое уже является равенством (26). Если многочлен 02(2) тоже имеет степень, большую чем q, то мы продол- жим наше построение дальше и в конце концов докажем нужное равенство (26). Здесь мы описали процесс деления многочлена a(z) на многочлен b(z), т. е. нахождение многочленов ft(z)' и k(z), входящих в равенство (26). Докажем теперь, что эти многочлены h(z) и k(z) однозначно определены мно- гочленами a(z) и b(z). Допустим, что наряду с равен- ством (26) имеет место равенство a(z) = b(z)h0(z) +k0(z), причем степень многочлена ko(z) меньше q. Вычитая это равенство из равенства (26), получим b (z) (ft (z) — ft0 (z)) = ft0 (z) — k (z). Так как степень многочлена b(z) равна q, а степень мно- гочлена ft0(z)—ft(z) меньше q, то последнее равенство может иметь место лишь при условии ft(z) — fto(z)^O, так что и ft(z)— fto(z) s 0. Заметим, что при делении многочленов не могут воз- никнуть комплексные числа. Именно, если многочлены а (г) и b(z) имеют действительные коэффициенты, то многочлены h(z) и ft (г) также имеют действительные коэффициенты. Разложение многочлена на множители Теперь существующий по основной теореме алгебры корень многочлена fo(z) = zn + aiZn~l+ ... +ап, п>0, с комплексными коэффициентами обозначим через аь Докажем,что многочлен f0(z) делится на двучлен z — аь Применяя формулу (26), мы получим частное, которое обозначим через fi(z), и некоторый остаток в виде мно- гочлена нулевой степени, т. е. число, которое мы обо- значим через ft. Таким образом, мы им'еем fo (z) = fi (z) (z - cq) + ft. Так как fo(ai) = O, то, полагая в этом равенстве z=ai, получаем ft = 0. 83
Итак, многочлен f0(z) разделился на z— си, и мы имеем ft) (z) = (z —ajfjz), где fi (z) — многочлен степени и—1, который, очевидно, начинается с члена zn~{. Если п > 1, то и— 1 > 0; тогда многочлен fi (z) будет положительной степени и по дока- занному ранее имеет некоторый корень аг. Таким обра- зом, по только что доказанном}7 многочлен fi(z) разла- гается на множители: Л (z) = (z — а2) f2(z). (28) Продолжая этот процесс дальше, мы получим разло- жение fo(z) на и линейных множителей: fo (z) = (z — aj (z — a2) . .. (z — an). Числа ai, аг, ..., an являются корнями многочлена fo(z), и других корней многочлен f0(z), очевидно, не имеет. Может, однако, оказаться, что один и тот же ко- рень встречается в этОхМ разложении несколько раз. Группируя равные между собой корни, мы получаем разложение /о(z) = (z — аУ*(z — a2)fts ... (z — aq)\ (29) где все корни аь аг, ..., aq различны. Число k\ на- зывается кратностью корня ai, число &г — кратностью корня аг и т. д., число kq— кратностью корня а?. Таким образом, число различных корней многочлена f0(z) мо- жет быть и меньше чем п. Однако если учитывать крат- ность каждого корня, то сумма кратностей в точности равна и. В этом смысле многочлен f0(z) имеет ровно п корней. Рассмотрим теперь случай, когда все коэффициенты многочлена f0(z)— действительные числа. О корнях та- кого многочлена можно высказать некоторые весьма ин- тересные дополнительные соображения. Из формул (14) — (16) легко получить, что для мно- гочлена fo(z) с действительными коэффициентами имеет место равенство fo(z) = fo (z). Из этого равенства следует, что если ai есть корень мно- гочлена f0(z) с действительными коэффициентами, то at есть также его корень. В случае, если ai — действитель- ное число, то это утверждение бессодержательно. В слу- 84
чае, если щ не есть действительное число, то утвержде- ние указывает на существование наряду с корнем он от- личного от него корня Таким образом, если сц — не действительное число, то многочлен fi(z) (см. (29)) имеет делителем z— ан и мы получаем разложение на множители fo (z) = (z- cq) (z — at) f2 (z). Таким образом, мы выделили у многочлена fQ(z) квад- ратичный множитель ёг (z) = (z — cq) (z — Й!) = z2 — (cq 4- aj z + a^p Многочлен g<z(z) очевидным образом имеет действитель- ные коэффициенты. Отсюда следует, что /2(г)—также многочлен с действительными коэффициентами, так как он получается в результате деления многочлена f0(z) на действительный квадратичный трехчлен g2(z) (см. (28)). Таким образом, если ои — действительный корень, то мы имеем разложение fo(z) = ^i (z)A(z), где gi(z) = z — ai, а если ai — не действительный ко- рень, то мы имеем разложение Zo(z) = ^2(z)A(z). Таким образом, в обоих случаях f0(z) делится на дей- ствительный многочлен первой или второй степени. § 11. Наибольший общий делитель двух многочленов Многочлен b(z) считается делителем многочлена а (г), если при делении a(z) на b (г) не получается ос- татка, т. е. в формуле (26) k(z) == 0. Многочлен &(z) считается общим делителем двух многочленов a0(z) и ai(z), если он является делителем каждого из этих двух многочленов. Общий делитель c(z) двух многочленов а0(г) и ai(z) называется их наибольшим общим делителем, если он делится на каждый общий делитель b (г) многочленов a0(z) и ai(z). Существование наибольшего общего делителя двух многочленов не очевидно. Ниже оно будет доказано при помощи алгоритма Евклида, т. е. при помощи таких опе- раций, которые совершаются без всяких трудностей, кроме громоздких вычислений. Но прежде всего мы до- 85
кажем, что два наибольших общих делителя c0(z) и ci(z) двух многочленов a0(z) и ai(z) по существу совпа- дают. Именно, они могут отличаться друг от друга толь- ко числовым множителем, отличным от нуля. Докажем это. Так как c0(z) является наибольшим общим делите- лем многочленов ao(z) и a-'z), a ci(z)—их общим де- лителем, то c0(z) делится на Ci(z), и, следовательно, мы имеем тождество c0(z) = A1(z)c1(z). (30) Аналогично, мы имеем формулу c1(z) = ft0(z)c0(z). (31) Подставляя выражение Ci(z} из формулы (31) в фор- мулу (30), мы получаем Со (z) = h0(z)hl(z)c0(z). А так как при перемножении многочленов степени их складываются, то из последней формулы следует, что многочлены ho(z) и hi (г) имеют степень нуль, т. е. яв- ляются числами. Таким образом, единственность наибольшего общего делителя многочленов a3(z) и ai(z) нами доказана. Перейдем теперь к построению наибольшего общего делителя c(z) многочленов а0(г) и ai(z)'. Для этого про- изведем деление многочлена ao(z) на многочлен ai(z). Запишем формулу (26) для этих многочленов в виде a0(z) = al(z)hi(z) + a2(z), (32) т. е. обозначим остаток от этого деления через a2(z). Те- перь подвергнем многочлен ai(z) делению на многочлен a2(z) и формулу (26) запишем в виде at (z) = а2 (z) h2 (z) + a3 (z), (33) т. e. обозначим остаток от деления через as(z)\ Теперь' подвергнем делению многочлен a2(z) на многочлен a3(z) и запишем формулу (26) в виде а2 (z) = а3 (z) Л3 (z) + а4 (z). Так как в процессе этого построения степень остаточ- ного многочлена все время снижается, то мы дойдем до такого остатка, который будет иметь степень нуль, а при делении на многочлен степени нуль остаток, очевидно, 85
равен нулю. Таким образом, в конце концов мы получим тождества ап-2 (z) = an_t (z) й„_! (z) + ап (z), (34) a„-i(z) = a„(z)/in(z). (35) Если теперь b(z) есть общий делитель многочленов ao(z) и ai(z), it) из формулы (32) следует, что он яв- ляется делителем a2(z). Из формулы (33) следует, что многочлен b(z) является делителем многочлена a$(z). Таким образом, последовательно мы докажем, что мно- гочлен b(z) является делителем всех построенных нами многочленов Oq(z), a,(z), .... an(z), (35) в частности многочлена an(z). А из формулы (35) сле- дует, что многочлен an(z) является делителем an-i(z), из формулы (34) следует, что он является делителем art_2(г). В конце концов мы установим, что an(z) являет- ся делителем многочленов a0(z) и ai(z). Таким образом, доказано, что an(z) делится на любой делитель много- членов ao(z) и ai(z) и сам является их делителем. Сле- довательно, многочлен an(z) является наибольшим об- щим делителем многочленов a0(z) и ai(z). Докажем теперь следующий важный результат, имеющий многочисленные применения в алгебре. А) Общий наибольший делитель с (г) двух много- членов a0(z) и ai (z) может быть записан формулой c(z) = Po(z)ao(2!) + pi(z)a1(z), (37) где po(z), pi(z)—некоторые многочлены. Докажем это утверждение. Подставляя выражение многочлена Ог(г) из формулы (32) в формулу (33), мы получим формулу «з (z) = р2 (z) а0 (z) + <7о (z) 01 (z). Продолжая этот процесс дальше, мы получим формулу ,(37). Таким образом, формула (37) доказана. Устранение кратных корней Нахождение корней многочлена является одной из наиболее старых и трудных задач алгебры. Первона- чально ее пытались решить при помощи формулы в виде алгебраических выражений, включающих извлечение корней. Это очень удачно сделано для квадратного урав- 87
нения. Для кубического уравнения также имеется фор- мула, но уже мало значительная в смысле приложений, для уравнений четвертой степени также есть формула, но лишенная всякого практического значения. Позже было доказано, что для уравнений выше четвертой сте- пени общей формулы решения уравнений в радикалах не существует. Полная теория о возможностях нахож- дения корней многочлена при помощи радикалов была построена Галуа. На пути решения проблемы отыскания корней многочлена лежит следующая гораздо более про- стая задача: для многочлена f(z), имеющего как про- стые так и кратные корни, найти такой многочлен g(z), который имеет те же самые корни, что и f(z), но только простые. Эта задача решается при помощи алгоритма Евклида, т. е. при помощи деления многочленов. Ее ре- шение мы рассмотрим здесь. Пусть а (г) и b(z)— два многочлена, a p(z)—их про- изведение Р (z) = a (z) b (г). Обозначим через йр а2, ..., а? совокупность всех чисел, каждое из которых является корнем хотя бы одного из многочленов a(z) и b(z). Тогда эти многочлены могут быть записаны в следую- щем виде (см. (30)): a (z) — (z — a,)*» (z — а2)йг ... (z — a,)*?, (38) b (z) = (z — cq)'* (z — a2)'2 ... (z — a,/*. (39) В обоих этих разложениях некоторые показатели степе- ней могут равняться нулю и мы будем считать, что крат- ность соответствующих корней является нулем. Оче- видно, мы имеем p(z) = (z-aI)ft>+z«(z-a2)fe2+/2 ... (г-а,Л+'«. Таким образом, при перемножении многочленов крат- ности корней у них складываются. Исходя из разложения многочленов о (z), b(z) на множители (см. (38) и (39)), легко найти их наиболь- ший общий делитель c(z). Для этого обозначим через /«1 наименьшее из чисел ki и 1\, через /п2 наименьшее из чисел k2 и /2 и т. д., через mq наименьшее из чисел kq и lq. Тогда наибольший общий делитель многочленов -а (г) и b(z) задается формулой с (z) = (z — a!)"1» (z — a*)'"2 ... (z — a,)m?. 88
Этот простой способ нахождения наибольшего общего делителя двух многочленов требует, однако, нахождения всех корней обоих многочленов, и поэтому он практи- чески мало пригоден, так как сводит простую задачу к очень трудной,-Между тем нахождение наибольшего об- щего делителя двух многочленов, как было показано ранее, представляет собой очень простую задачу, ре- шающуюся при помощи алгоритма Евклида, т. е. при помощи деления многочленов. Выясним теперь, как связаны между собой кратности корней многочленов а0 (z) и a1(z) = a'(z), т. е. кратности корней многочлена ao(z) и его производной a'0(z). Оказывается, что если корень а многочлена a0(z) имеет кратность k, то тот же корень для многочлена ai(z) = a'Q(z) имеет кратность k—1. Но, конечно, кроме корней, являющихся корнями многочлена ao(z), много- член a' (z) может иметь и другие корни. Докажем, что если а — корень многочлена а0(г) крат- ности k, то тот же корень является корнем многочлена at (z) = а'о (z) кратности k — 1. Из разложения (30) многочлена a0(z) на множители следует, что если а — корень многочлена ao(z) крат- ности k, то ао (z) = (z — a)k b (z), причем b(z) уже не делится на z—а и, следовательно, не имеет а своим корнем. Дифференцируя последнее со- отношение, получаем ао (z) = at (z) — k (z — a)*-1 b (z) + (z — а)к b' (z), (40) (z — a)*-1 b (z) = a{ (z) + J (г — a? b' (z). (41) Из формулы (40) видно, что ai(z) делится на (z — a)*-1, а из формулы (41) следует, что ai(z) не делится на (z — а)к. В самом деле, если бы ai(z) делился на (z — a)ft, то b(z) делился бы на z — а. Таким образом, кратность корня а для многочлена ai(z) есть k—1. В частности, если a — простой корень многочлена a0(z), то а не будет корнем многочлена a' (z). Таким образом, если ao(z) имеет разложение (30), то наибольшим общим делителем многочленов fl0(z) и ai(z) является многочлен с (z) — (z — a/*-1 (г — аг)*2-1 ... (z — a9)V*. 89
Отсюда видно, что многочлен а0(г) делится на мно- гочлен с (г), и частное имеет вид = (z — cq) (2 — qj) ... (z — а9). Таким образом, сформулированная в начале пара- графа задача о нахождении многочлена g(z), имеющего те же самые корни, что и многочлен f(z), но только кратности 1, решена. Именно, для нахождения много- члена g(z) следует сначала при помощи алгоритма Евклида найти общий наибольший делитель многочле- нов f(z) и f'(z) и затем разделить многочлен f(z) на этот наибольший общий делитель. Подсчет числа действительных корней многочлена на заданном отрезке Нахождение комплексных корней многочлена являет- ся задачей более сложной, чем нахождение его действи- тельных корней, так как в случае комплексного корня нам приходится фактически решать уравнение с двумя неизвестными, которыми являются действительная часть корня и его коэффициент при мнимой части. Поскольку нами дан способ, позволяющий свести вы- числение корней многочлена к вычислению корней мно- гочлена, имеющего только простые корни, то мы займем- ся здесь именно этим случаем многочлена с простыми корнями. Здесь будет дан результат, позволяющий в значительной степени облегчить приближенное вычисле- ние действительных корней многочлена. • Будем рассматривать многочлен Ь0(х) действительной переменной х, имеющий только простые корни, и дадим способ определения числа этих корней на заданном от- резке Так как все корни многочлена Ь0(х) простые, то многочлены Ьа(х) и bl(x) = b'0(x) не имеют общих корней и ни для какого значения х не могут од- новременно обращаться в нуль. Для решения этой задачи рассмотрим последователь- ность действительных чисел b0, bt...bn. (42) Будем считать, что ни одно из этих чисел не обращается в нуль. Почти что само собой понятно, что значит число перемен знака в этой последовательности (42). Опреде- лим его формально. Мы будем считать, что между &0 и 90
Ь\ имеется перемена знака, если одно из этих чисел по-' ложительно, а другое отрицательно. Обозначим через pt в этом случае число 1. Если же числа Ьо и bi оба поло- жительны, либо оба отрицательны, то будем считать, что перемены знака между ними нет. В этом случае обо-, значим через pi число, равное нулю. Точно так же опреч. делим число р2, которое оценивает перемену знака ме- жду bi и Таким образом, мы получим последователь- ность нулей и единиц Р1> Р2> •••» Рп- Сумма всех чисел из этой последовательности есть чис- ло перемен знака в последовательности (42). Исходя из многочленов Ьа(х) и bl(x) = bo(x), путем последовательного деления построим последовательность многочленов. Разделим многочлен Ьо(х) на многочлен bi(x) и за- пишем формулу (26) в виде Ьо (х) = (х) bi (х) — &2 (х). Разделим теперь многочлен &i(x) на многочлен fe2(x) и запишем формулу (26) в виде bi (х) = h2 (х) Ь2 (х) — &з (х). На k-м шаге этого процесса мы получим тождество bk-i (х) = hk (x) bk (х) - bk+i (х). (43) Продолжая этот процесс до конца, мы придем к после- довательности многочленов МД bi(x), .... bn\x). (44) Процесс построения этой последовательности почти в точности совпадает с процессом нахождения наиболь- шего общего делителя двух многочленов, только много- члены ряда (44) могут отличаться от многочленов ряда (36) знаками. Так как многочлены Ьй(х) и Ьп(х) взаим- но просты, то последний член последовательности,— именно, Ьп(х) — есть число. Заметим прежде всего, что ни при каком значении x — Xq два рядом стоящих многочлена последователь- ности (44) не могут обращаться в нуль. В самом деле, если Ьк(х0)'= bk+i(xo) = 0, то из соотношения (43) сле« дует, что bk-i (х0) = 0. Продолжая этот процесс, мы прич дем к выводу, что многочлены Ь0(х\ и &i(x) обращаются^ 91
в нуль при х = х0, а это невозможно, так как они не имеют общих корней. Пусть теперь х возрастает, начиная от значения go и кончая gi. Ясно, что при таком росте х число перемен знака последовательности чисел (44) может измениться. А это может произойти только при прохождении х че- рез такое значение хо, при котором один из членов по- следовательности (44) меняет знак, т. е. проходит через нуль. Допустим, что при х = х0 мы имеем й*(хо) = О и при росте х вблизи точки х0 знак функции й*(х) ме- няется. Полагая в соотношении (43) х = Хо, получим равенство bk-i(xo) = — bk+i(xo)‘ Таким образом, числа &*_i(x0) и fe*+i(x0) имеют проти- воположные знаки. Если при х, близком к х0, число (х) имеет знак, совпадающий со знаком bk-i(x), то знаки чисел Ьь(х) и bk+i(x) различны. Таким образом, между Ьк-1(х) и bk(x) перемены знака нет, а между &*(х) и bk+i (х) перемена знака есть. Если при прохождении точки х через хо знак числа Ьк(х) меняется, то для этого х между bk-i(x) и Ьк(х) перемена знака есть, а между Ьк(х) и &*+1(х) перемены знака нет. Таким образом, устанавливается, что при прохождении точки х через Хо, при котором Ьк(хо) обращается в нуль, число перемен знаков в трехчленной последовательности bk-i(x), Ьк(х), Ьк+1(х) не меняется (см. табл. 1). Номер k обладает лишь тем свойством, что у него есть предыдущий номер k — 1 и Таблица 1 bft(x) bk+lM При х < х0 + + — При х > х0 + — последующий k + 1. Таким образом, число перемен зна- ка в последовательности (44) может измениться лишь тогда, когда при прохождении х через хо меняет свой знак либо первый член последовательности (44), либо самый последний ее член. Но последний член не может менять знака, так как это есть число. Посмотрим теперь, как меняется число перемен зна- ка в последовательности (44), когда в точке хо первый 92
член последовательности (44) обращается в нуль. Если при х, близком к х0, но меньшем хс, 6о(х)>О, то при прохождении х через точку х0 функция Ьо(х) изменит знак. Но при х = х0 число &i(x0) будет отрицательным, так как при этом функция 60(х) убывает, и следова- тельно, производная ее Ь[(х) отрицательна. Таким обра- зом, при х, близком к го, но меньшем хо, между Ь^х) и Ь\(х) имеется перемена знака, а при х, большем хо, но близком к хо, между 6с(х) и &Цх) перемены знака нет. Поэтому при прохождении точки х через х0, при кото- ром функция 60(х) обращается в нуль и убывает, пе- ремена знака между 60(х) и &i(x) исчезает. Точно так же устанавливается, что если при переходе через точку хо функция 60(х) возрастает, то перемена знака между 60(х) и 61 (х) исчезает. Итак, установлено, что перемена знака в последовательности (44) при изменении х мо- жет произойти лишь тогда, когда х проходит через ко- рень многочлена 60(х), при этом каждый раз одна пере- мена знака исчезает. Следовательно, когда х возрастает от go ДО gi, в последовательности (44) происходит потеря одной перемены знака при прохождении х через корень многочлена bQ(x). Поэтому для нахождения числа кор- ней многочлена bQ(x) между g0 и gi надо сравнить чис- ловые последовательности 6оО 610 М1о), (45) МУ, МУ- (46) Число перемен знака в последовательности (45) может быть лишь больше, чем число перемен знака в последо- вательности (46). Разность между числом перемен знака в последова- тельности (45) и числом перемен знака в последова- тельности (46) есть число корней многочлена bo(x)t на- ходящихся в промежутке go х gi.
Глава 3 ПРИВЕДЕНИЕ МАТРИЦ К КАНОНИЧЕСКОМУ ВИДУ Теперь, когда построены комплексные числа, можно рассматривать комплексные векторы, т. е. векторы, ко- ординаты которых являются комплексными числами, и комплексные векторные пространства, состоящие из комплексных векторов. Линейные отображения комп- лексных векторных пространств друг в друга приведут нас к матрицам, элементы которых являются комплекс- ными числами. Все результаты первой главы, верные для действительного случая, верны и для комплексного случая. Если, однако, рассматривать задачу, сформулиро- ванную для действительного случая, а комплексные чис- ла появляются в ней в результате каких-нибудь вычис- лений, то приходится делать различие между комплекс- ными и действительными величинами. Для того чтобы выделить все действительные векторы в некотором ком- плексном векторном пространстве, надо задать в нем некоторый действительный базис #2> • • • > и тогда действительный вектор х в рассматриваемом пространстве запишется в виде х = хаеа, а — 1, ..., и, где xi, х2, ..., хп — действительные числа. Если в том же базисе выбран комплексный вектор X — X CL === 1 f • • •» 94
где х1, х*, х«—комплексные числа, то можно опре- делить вектор х, комплексно сопряженный х, положив х = х еа. (1) В дальнейшем, если, исходя из некоторого действи-. тельного векторного пространства Ап с базисом вр #2> • • •, мы будем рассматривать векторы с комплексными коор- динатами, то придем к комплексному векторному про- странству А", которое естественно считать комплексным расширением действительного прос1ранства Ап. В комп- лексном расширении Ап действительного векторного про- странства Ап определено понятие комплексно сопряжен- ного вектора (см. (1)). Если в действительном вектор- ном пространстве Ап задана симметричная билинейная форма f(x, у), то она записывается в виде f(x, у) = аа^хау^, а, р=1, .... п, где х и у — действительные векторы, а коэффициенты ац=а}1 — также действительные числа. Переходя к комплексному расширению Ап действительного вектор-» ного пространства Ап, мы можем задать комплексную симметричную форму f(x, ?)==аарх“/, (2) где векторы х и у уже принадлежат пространству Ап. Подставим теперь вместо вектора у в билинейную фор« му (2) вектор х, т. е. положим у = х. Оказывается тогда, что f(x,x) есть действительное число. В самом деле, мы имеем f(x, х) = аархах3, f (х, х) = аарх“х3 = аарх“х3. Таким образом, мы получаем /(х, х) = /(х, х), а это и зцачит, что число /’(х, х) действительное. В ча- стном случае, когда Ап есть действительное евклидово векторное пространство, мы приходим к выводу, что ска- лярное произведение (х, х) вектора на сопряженный ему вектор есть действительное число: (X, X) = (х, х). 95
§ 12. Связь между линейными отображениями и матрицами В этом параграфе мы будем рассматривать линей- ное отображение <р векторного пространства Ап в себя. При выбранном базисе такому отображению ф соответ- ствует вполне определенная квадратная матрица А = II а) II- Однако при смене базиса матрица эта опреде- ленным образом меняется. Поскольку в первую очередь мы интересуемся линейными отображениями, то нас бу- дут соответственно интересовать такие свойства соответ- ствующих матриц, которые не меняются при смене ба- зиса. Преобразование матрицы при смене базиса Пусть ф— линейное отображение векторного про- странства в себя и #1> #2» • • • > ^п, (3) — некоторый базис пространства Ап. При этом базисе отображению ср соответствует квадратная матрица Д = || ^ ||, 1=1, ..., и, j = 1, ..., и. Элементы матрицы А определяются из формулы Ф(е/) = а/1еа. Пусть теперь fl, f2, fn (4) — некоторый другой базис пространства Ап. В этом но- вом базисе отображению ф соответствует матрица, ко- торую мы обозначим через В = ||< i, /== I, 2, .... п. Установим связь между матрицами А и В. А) Пусть = a=l, .... п, / = 1, .... п, (5.) — связь между базисами (3) и (4). Коэффициенты этого соотношения составляют матрицу S = ||s/|], t, / = 1, ...» п. 96
Элементы /-го столбца этой матрицы являются коорди- натами вектора в/ в базисе (4). А так как векторы ei, е2, ..е„ линейно независимы и, следовательно, оп- ределитель матрицы S отличен от нуля, так что она имеет обратную матрицу S-1. Оказывается, что матрицы А и В связаны соотношением B = S~’AS. (6) Таким образом, В получается из А при помощи транс- формирования матрицы А матрицей S. Докажем соотношение (6). Пусть s-1=T'=||4||, так что ы = Умножая соотношение (5) на ti и суммируя полученный результат по /, мы получим fl-t^' Таким образом, мы имеем Ф (fi) =“ $Ф (е3) »= /?а₽ео = fiafflfy. Следовательно, В = TAS == S-’AS. Собственные значения и векторы Здесь нам придется употреблять тождественное ото- бражение векторного пространства на себя. Его мы бу- дем обозначать стандартным образом через 0, так что” всегда имеет место соотношение 0* = х. Тождественному отображению векторного пространства А" на себя соответствует единичная матрица Е — ||б/1|. В) Пусть А” — n-мерное векторное пространство и е2, еп (7) — некоторый его базис. Далее, пусть <р — некоторое ли- нейное отображение пространства А" в себя и — матрица, соответствующая отображению ср в базисе (7). Число X называется собственным значением отобра- 7з4 Л. С." Понтрягин 97
жения <р, а ненулевой вектор h — собственным вектором отображения <р, соответствующим этому собственному значению, если выполнено соотношение Фй = Xft = XOft. (8) Для того чтобы сделать попытку вычислить собственное значение X и собственный вектор ft, нужно перейти к координатной записи вектора ft и вместо отображения ф употребить соответствующую ему матрицу А. Тогда со- отношение (8) перепишется в виде = Xft' = X6aft“. Перенесем все члены этого соотношения в левую часть равенства. Тогда мы получим (йа-Лба) Ла = 0. (9) Для того чтобы это уравнение имело ненулевое решение Л, согласно следствию из теоремы 3 необходимо и до- статочно, чтобы определитель матрицы А — КЕ был ра- вен нулю. Таким образом, для числа X мы получаем уравнение £>(Л-Х£) = 0. Девая часть этого уравнения представляет собой много- член n-й степени относительно X. Многочлен %(г) = Д(Л —z£) называется характеристическим многочленом матрицы Л. Очевидно, что он имеет степень п. Таким образом, соб- ственное значение является корнем многочлена %(z) степени п. Если исходное векторное пространство Л" действительно, то матрица Л тоже действительна и ха- рактеристический многочлен этой матрицы есть дей- ствительный многочлен, но он может не иметь действи- тельных корней. Таким образом, собственное значение X может оказаться комплексным. Вектор ft, являющийся решением системы уравнений (9), тоже может быть комплексным. Таким образом, при нахождении соб- ственных значений и собственных векторов нельзя огра- ничиться только действительными величинами, так как собственные значения и собственные векторы могут ока- заться комплексными. Оказывается, что характеристиче- ский многочлен %(z) матрицы Л является в действитель- ности характеристическим многочленом отображения ф, 98
т. е. не зависит от случайного выбора базиса (7), а за- висит только от отображения <р. Докажем последнее утверждение. Перейдем от ба- зиса ((7) или (3)) к базису (4). Тогда отображению <р будет соответствовать матрица B = S-1AS (см. А)), где матрица В зависит от базиса (4). Мы имеем В — ХЕ = S~* AS - XS~lES = S~X(A — XE) S и, далее, D (В — XE) — D (S"1 (A - XE) S) = = D (S'1) D (A - XE) D(S) = D(A — XE). Таким образом, характеристические многочлены матриц А и В совпадают и, следовательно, характеристический многочлен зависит от отображения ф, а не от выбран- ного в пространстве Ап базиса. Собственные векторы с различными собственными значениями С) Оказывается, что собственные векторы отображе- ния <р с попарно различными собственными значениями линейно независимы. Утверждение это будем доказывать индуктивно по числу векторов. Пусть Л2, • • •, X? — попарно различные собственные значения отображе- ния ф, а Л2> •••, Лг, (10) — соответствующие этим собственным значениям соб- ственные векторы. Когда r= 1, система эта линейно не- зависима, так как собственный вектор по определению отличен от нуля. Допустим, что при r = s—1 система эта линейно независима. Докажем, что система линейно независима при г = s. Допустим, что имеется соотноше- ние caha = 0, а=1, (11) Применяя к этому соотношению отображение ф, полу- чаем соотношение c%ftu = 0. (12) *M* 99
Умножая теперь соотношение (11) на и вычитая по- лученное из соотношения (12), мы придем к соотноше- нию = a=l, 2, s—1. В этом соотношении содержится только s—1 собствен- ных векторов и потому по предположению индукции все коэффициенты соотношения равны нулю, т. е. мы имеем с1 (Л1- М = 0, c2(Z2-Zs) = 0.....CS-1(V1-M = O, откуда получаем с1 = 0, с2 = 0, ...» с3-1 = 0. В силу этого соотношение (11) приобретает вид с% = 0 и, следовательно, cs = 0. Таким образом, из соотноше- ния (11) вытекает обращение в нуль всех коэффициен- тов Ci, а это означает, что система (10) при r — s ли- нейно независима. D) Если характеристический многочлен %(z) отобра- жения q> не имеет кратных корней, то базис в простран- стве Ап можно выбрать таким образом, что соответ- ствующая отображению ф матрица А имеет диагональ- ный вид, причем на диагонали стоят корни многочлена x(z). Это значит, что если задана квадратная матрица А порядка п и корни ее характеристического многочлена %(z) все попарно различны, то можно подобрать такую квадратную матрицу S с определителем, отличным от нуля,что матрица S-’AS имеет диагональный вид. Докажем это утверждение. Пусть А|, %2> • • ч (13) — корни многочлена %(z). Согласно предположению все они различны, поэтому в силу предложения С) соответ- ствующие собственным значениям (13) собственные век- торы Лр Л2, • • • ’ линейно независимы и их можно принять за базис про- странства А",— именно, положить f{ = hit t = l, 2, п. Тогда мы имеем ф(/<) = 100
Отсюда видно, что матрица В, соответствующая выбран- ному базису, имеет диагональный вид, причем на диаго- нали стоят числа Xj, Х2, .т. е. корни характери- стического многочлена %(z) отображения ф. Предложение D) трактуется как приведение мат- рицы А к диагональному виду при помощи трансформа- ции ее невырожденной матрицей S. Такой канонический вид для матрицы А мы получили в предположении, что все корни характеристического многочлена %(z) мат- рицы А различны между собой. Но если характеристи- ческий многочлен %(z) матрицы А имеет кратные корни, то матрицу, вообще говоря, нельзя привести к диагональ- ному виду. При наличии кратных корней характеристи- ческого многочлена %(z) матрицу А можно привести к более сложному, так называемому жорданову виду. Для доказательства этого результата требуется более слож- ная теория, которая будет изложена в следующих па- раграфах. § 13. Многочлены от матриц и отображений Пусть Rn—некоторое векторное пространство раз- мерности п, в котором задан некоторый фиксированный базис е1» 02> • • • > Тогда каждому линейному отображению ф пространства Rn в себя соответствует некоторая определенная мат- рица А (см. А) §2). Если ф и ф— два отображения про- странства Rn в себя, которым соответствуют матрицы А и В, то можно составить произведение фф отображений Ф и ф как последовательное проведение отображений ффх, и этому произведению отображений фф соответ- ствует произведение матриц А и В. Таким образом, можно определить любую степень фп отображения ф и этому отображению фп соответствует квадратная мат- рица Ап. Поскольку отображения пространства Rn в себя можно складывать и умножать на любое число (см. § 2), причем этим операциям соответствуют те же опе- рации над соответствующими матрицами, то можно со- ставить любой многочлен относительно отображения ф. Именно, если f(z) = a6zm + aizm-l+ ...+ат (14) — некоторый многочлен относительно переменной г, то вместо z в него можно подставить отображение ф, т. е. 101
получить многочлен f (ф) = + а^т 1 + .. • тЬ лт0, где 0 — тождественное отображение пространства Rn в себя. В формулу (14) вместо z можно поставить так- же матрицу А, которая соответствует отображению ср» и тогда мы получим матрицу / (Л) = а0Ат + а,Ат~' + ... + атЕ. При этом отображению /(ф) соответствует матрица ДА). Результат применения отображения ф к вектору х мы будем обозначать через фх. Тогда можно записать причем Дф)х означает применение отображения Дф) к вектору х. Минимальный аннулирующий многочлен Теперь нам нужно обратить особое внимание на ну- левое отображение, которое переводит каждый вектор х пространства Rn в нуль и соответствующую ему нулевую матрицу. То и другое мы будем обозначать одним зна- ком 0. А) Многочлен Дз) называется аннулирующим мно- гочленом отображения ф, если Дф)—нулевое отображе- ние и соответственно f(Л)-— нулевая матрица. Оказы- вается, что для каждого отображения ф существует ан- нулирующий многочлен. Именно, характеристический многочлен %(z) отображения ф аннулирует отображе- ние ф, т. е. мы имеем Х(Ф) = О, (15) или, что то же, х(А) = 0. (16) Докажем эквивалентные между собой соотношения (15) и (16). Для этого выпишем соответствующее соот- ношение, определяющее матрицу А = || а/1|- Имеем фв/ = а?еа, i = 1, 2, ..., п, или, иначе, (а?е-д?<р)ео = 0. (17) Рассмотрим матрицу 102
элементы которой определяются формулой = й/0 — S/qp. Элементы матрицы L являются многочленами нулевой и первой степени относительно отображения ф и по- этому сами являются отображениями. Соотношение (17) при помощи матрицы L записывается в виде /?ва = 0. (18) Минор элемента // матрицы L, взятый с надлежащим знаком, обозначим через так что мы имеем = £>(£) 6} (19) (см. § 4 гл. 1). Умножая соотношение (18) на М/ и суммируя полученный результат по г, получим Л4^ер = 0. (20) В силу соотношения (19) левая часть последнего равен- ства переписывается в виде D(L)6“ea и равенство (20) получает вид D(L)6/4 = D(L)e/ = 0. о (hiII) есть характеристический многочлен %(г) отображения ф. Поэтому последнее соотношение перепи- сывается в виде Х(<р)е/ = О и, таким образом, характеристический многочлен %(ф) отображает в нуль каждый базисный элемент вектор- ного пространства Rn, и, следовательно, любой вектор х пространства Rn. Итак, мы имеем Х(<р)х = 0, и потому многочлен %(z) является аннулирующим мно- гочленом отображения ф. Из предложения А) следует, что всякое отображение Ф векторного пространства Rn в себя имеет аннулирую- щий многочлен, — именно, многочлен %(z). Но, конечно, это не единственный аннулирующий многочлен для ото- бражения ф, так как, умножив %(z) на некоторый мно- гочлен, мы получим снова аннулирующий многочлен. Среди всех аннулирующих многочленов отображения ф выделяется один, — именно, минимальный аннулирую- 103
щий многочлен, — играющий важную роль для дальней- шего. В) Оказывается, что все аннулирующие многочлены отображения ср минимальной степени — обозначим ее че- рез г—отличаются лишь числовыми множителями. Тот из этих многочленов, у которого коэффициент при стар- шей степени г равен единице, мы будем обозначать че- рез Д(г) и назовем его минимальным аннулирующим многочленом, так что он оказывается единственным. Ока- зывается далее, что всякий аннулирующий многочлен отображения ср делится на минимальный аннулирующий многочлен Д(г). Докажем предложение В). Заметим прежде всего, что если f(z) и g(z)—два аннулирующих многочлена отображения <р, то их наибольший общий делитель также есть аннулирующий многочлен. В силу предло- жения А) § 11 мы имеем ft(z) = a(z)f(z) + &(z)g(z), (21) где a(z) и b(z)— надлежащим образом подобранные многочлены. Подставляя в последнее соотношение вме- сто г отображение <р, мы видим, что h(z) есть аннули- рующий многочлен отображения ф. Допустим теперь, что многочлены f(z) и g(z) имеют минимальную сте- пень г. Так как h(z)— тоже аннулирующий многочлен, то он имеет степень, не меньшую чем г. А так как он является делителем каждого из многочленов f(z) и g(z), то степень его равна ровно г, и потому многочлены f(z) и g(z) отличаются от ft(z) только числовым множите- лем, а следовательно, и между собой они также отли- чаются числовым множителем. Этим первая часть пред- ложения В) доказана. Пусть f(*) = A(*) — минимальный аннулирующий многочлен отображения <р, a g(z) —произвольный аннулирующий многочлен ото- бражения ф. Из формулы (21) следует, что многочлен ft(z) является аннулирующим многочленом отображения Ф и потому имеет степень не меньше чем г. А так как A(z) имеет степень г и делится на h(z), то h(z) и A(z) отличаются лишь числовым множителем. Из того, что g(z) делится на ft(z), следует теперь, что g(z) делится и на A(z). Итак, предложение В) доказано. 104
Разложение минимального аннулирующего многочлена на взаимно простые множители С) Допустим, что векторное пространство /?п разла- гается в сумму своих подпространств Ri и R2 размер- ности р и q соответственно, и допустим, что разложение это является инвариантным относительно отображения <р пространства Rn в себя, т. е. фхе/?| при <р х е /?2 при х е R2. Иначе это записывается так: ф/?! az Ru ф/?2 <= R2. Выберем теперь базис пространства Rn: elt е2, ер, ер+1, ..ер+9, p + q = ti, (22) так что первые р векторов этого базиса составляют ба- зис пространства /?1( а оставшиеся q векторов состав- ляют базис пространства R2. Матрица ' Л = ||аЯ, соответствующая отображению ф в этом базисе, имеет тогда специальный вид,— именно, ее элементы удовлет- воряют условиям: ai при К р, j> р имеем а/ = 0, при i> р, j< р имеем aj = 0. al ... а* 0 ... 0 Z р а2 а2 • • • ар о о ... о л = о аР+1 0 0 ... 0 a"+I о «Г1 =1« XI- ап Матрица А, как говорят, разбивается на два блока. В ле- вом верхнем углу стоит квадратная матрица порядка р, которую мы обозначим через Ль а в правом нижнем углу — квадратная матрица порядка q, которую мы обо- значим через А2. Как легко видеть, изучение матрицы Л полностью сводится к изучению ее блоков Л1( Л2. При 5 Л. С. Понтрягин 105
этом матрица At соответствует отображению <р, дей- ствующему в пространстве Ri, а матрица Л2 соответствует отображению <р, действующему в пространстве /?2. В ча- стности, имеет место нижеследующее предложение D). Утверждение С) сводится к описанию структуры матрицы А в специальном базисе (22) и это нетрудно проверить. Я привожу утверждение С) без доказатель- ства. D) Если матрица А разбивается на блоки Ai и Л2 (см. С)), то имеет место соотношение Р(Л)»Р(Л1)/>(Л2). (23) Из этого, в частности, следует, что характеристический многочлен x(z) матрицы Л разлагается на множители: X(z)=“Xi(*)X2(2). (24) где %i(z)—характеристический многочлен матрицы Ль а X2(z)— характеристический многочлен матрицы Л2. Дей- ствительно х(х) = £)(Л — zE), а матрица Л — гЕ разби- вается на два блока. Отсюда и из формулы (23) следует формула (24). Для доказательства предложения D) рассмотрим матрицы где матрицы Ai и Л2 разбиваются на блоки, причем блок Eq есть единичная матрица порядка q, а Ер— еди- ничная матрица порядка р. Разлагая определитель мат- рицы Л[ по элементам последней строки, мы докажем, . Продолжая этот процесс даль- что Р(ЛЭ“2)| о £° ше,мы убедимся,что ЩЛ1) ==£>(Л1).Точно так же дока- зывается, что D (Л2) « D (Л2). Легко проверяется, что ^“Го Л,|=л- В силу теоремы 4 и последней формулы имеем Р(Л) = Р(Л{Л2) = 1)(Л1)1)(Л2) и доказательство пред- ложения D) завершено. Таким образом, формула (23) доказана. Е) Пусть <р—линейное отображение векторного про- странства Rn самого в себя и Д(з)—минимальный ан- нулирующий многочлен отображения ф. Допустим, что 106
многочлен Д(г)' разлагается на два взаимно простых множителя: A(z) = A! (z) Д2 (z). И так как ДДг) и Д2(г) по предположению взаимно про- стые, то мы имеем 1 = р2 (z) Д2 (z) + Pi (z) Д] (z), (25) где pi(z) и p2(z)—два надлежащим образом выбран- ных многочлена (см. (37) § 11). Обозначим через Ri векторное подпространство пространства Rn, состоящее из всех векторов пространства Rn, обращающихся в нуль при действии отображения ДДф), и через R2 векторное подпространство пространства Rn, состоящее из всех век- торов, обращающихся в нуль при действии отображения Д2(ф). Оказывается тогда, что пространство Rn разла- гается в прямую сумму своих векторных подпространств Ri и R2. При этом разложение пространства Rn в сумму двух подпространств инвариантно относительно отобра- жения ф, так что ф отображает подпространство Ri в себя и подпространство R2 в себя. Рассматривая отобра- жение ф на подпространстве Ri, мы обозначим его че- рез фь а рассматривая отображение ф на R2, мы обо- значим его через ф2. Оказывается тогда, что многочлен Д1(г) есть минимальный аннулирующий многочлен ото- бражения фь а Д2(г) есть минимальный аннулирующий многочлен отображения ф2. Докажем утверждение Е). Подставляя в соотноше- ние (25) вместо z отображение ф, получаем для произ- вольного вектора х из пространства Rn равенство х = Р2 (ф) д2 (ф) X -ь Р1 (ф) Д, (ф) х. (26) Положим *1 = Рг (ф) А2 (ф) *, *2 = Р1(ф)Л1(ф)*- (27) Тогда Д) (ф) *i = Рг (ф) Д1 (ф) Аг (ф) х = р2 (ф) Д (ф) х = 0. (28) Точно так же имеем Д2 (ф) х2 = р, (ф) Д, (ф) Д2 (ф) х = pi (ф) Д (ф) х2 = 0. (29) Здесь имеется коммутативность между Д1(ф) и р2(ф), Д2(<р) и Р1(ф), так как оба множителя являются много- членами относительно ф. Таким образом, мы установили, что X! €= Х2 €= R2. (30) 107 5 й
Из формул (26), (27) и (30) следует, что произвольные вектор х пространства Rn разлагается в сумму X = Xj Ч- Х2, где «1 <= /?|, *2 е #2- Покажем теперь, что если имеют место одновременно два соотношения х г Rt, хе R2, то х = 0. Из соотношений (28), (29) следует, что Д1(ф)х = 0, Дг(ф)х = 0. Таким образом, оба слагаемых в правой ча- сти равенства (26) равны нулю и, следовательно, х = 0. Итак, установлено, что Rn разложено в прямую сумму своих подпространств Ri и R2. Покажем теперь, что это разложение в прямую сумму инвариантно относительно <р. Для этого достаточно показать, что ф/?2 <= R2. (31) Для того чтобы убедиться в этом, применим к вектор- ному пространству ф/?1 отображение Д1(ф). Тогда мы по- лучим Д1 (ф)ф₽1 = фД| (ф)₽1 =0. Точно так же получаем Д2 (ф) Ф#2 = фДг (ф) #2 = 0- ' Здесь имеется коммутативность между ф и Д1(ф), ф и Дг(ф), так как оба множителя являются многочленами относительно ф. Таким образом, соотношение (31) до- казано. Доказано уже также, что Д1(г) есть аннулирую- щий многочлен отображения фь а Дг(г)—аннулирую- щий многочлен отображения фг. Это вытекает из самого определения подпространств Ri и R2. Докажем, что мно- гочлены эти являются минимальными аннулирующими многочленами отображений ф1 и ф2. Допустим, что минимальными аннулирующими мно- гочленами отображений ф1 и фг являются соответственно многочлены Ai(z) и Д2(г). Положим Д(г) = Д1(з)Д2(г). Применяя Дф к соотношению х = х( + Хг, где Xi е Rlt х2 е R2, мы приходим к соотношению Д (ф) х = 0 108
при произвольном xeR". Таким образом, Д(<р) есть аннулирующий многочлен отображения <р. Если бы Д1 (г)} не был минимальным аннулирующим многочленом ото- бражения фь то Д1 (z) имел бы степень, меньшую чем Ai(z). Точно так же, если бы Д2(х) не был минималь- ным аннулирующим многочленом отображения ф2, то многочлен Дг(г) имел бы степень, меньшую чем Д2(г). В обоих этих случаях произведение Д1(г)Д2(г)= Д(г)^ имело бы степень, меньшую чем Д(г), и многочлен Д(г) не был бы минимальным аннулирующим многочленом отображения ф. Итак, предложение Е) полностью доказано. Из предложений Е) и С) следует, что если минималь- ный аннулирующий многочлен Д(г) некоторой матрицы А разлагается на два взаимно простых множителя: Д(г)= Д1(х)Д2(г), то при надлежащем выборе базиса матрица Д разбивается на два блока Ai и А2, причем Д1(г) есть минимальный аннулирующий многочлен мат- рицы 41, а Д2(г)—минимальный аннулирующий много- член матрицы А2. Это вытекает из того, что разбиение матрицы на два блока происходит при специальном вы- боре базиса (см. С)). Будем говорить просто, что мат- рица А, минимальный аннулирующий многочлен которой разлагается на два взаимно простых множителя, разби- вается на два блока, не упоминая при этом о специаль- ном выборе базиса. Такое разбиение матрицы А на блоки можно вести до тех пор, пока мы не дойдем до бло- ков с минимальными аннулирующими многочленами, ко- торые уже нельзя далее разложить на взаимно простые множители. В дальнейшем мы сосредоточили свое вни- мание на изучении такой матрицы А, минимальный ан- нулирующий многочлен которой уже нельзя разложить на два взаимно простых множителя. Многочлены, кото- рые нельзя разложить на взаимно простые множители, являются многочленами вида (z — X)*. Именно на та- кие множители разлагается многочлен Д(г), причем X является корнем многочлена Д(г). Нижеследующее пред- ложение F) дает ответ на вопрос: какие корни имеет многочлен Д(з)? F) Корнями минимального аннулирующего много- члена Д(з) отображения ф являются собственные значения матрицы А, соответствующей отображе- нию ф. Докажем предложение F). 109
Пусть Л — собственное значение отображения ф с соб- ственным вектором h 0. Тогда мы имеем фй = М. (32) Применяя к этому соотношению операцию ф, получаем Ф2Л = Х2Л. Продолжая этот процесс дальше, докажем, что Ф*Л = Л*Л. Из этого легко следует, что для произвольного много- члена f(z) имеет место соотношение /(Ф)Л = /(Л)Л. Подставляя в это соотношение вместо многочлена f(2) многочлен Д(2), получаем Д (ф) А = Д (Л) Л.’ В левой части этого равенства стоит нуль, а в правой части множитель h отличен от нуля, поэтому множитель Д(Х) обращается в нуль, т. е. мы имеем Д(Х) = О, и уста- новлено, что собственное значение Л, отображения ф яв- ляется корнем многочлена Д(2). Допустим теперь, что Л есть корень многочлена Д(2)’. Тогда Д(2) = (2-Л)^(2). (33) Так как многочлен g(z) имеет степень меньшую чем Д(2), то он не является аннулирующим многочленом отображения ф, и потому существует такой вектор А, что £(Ф)Л = А=АО. (34) Подставляя в соотношение (33) вместо z отображение Ф, получаем (см. (34)) (ф — Л0) А = О, откуда следует фЛ = ЛА, т. е. к является собственным значением отображения ф. Итак, предложение F) полностью доказано. G) Пусть ф — линейное отображение векторного про- странства Rn в себя и А — соответствующая ему мат- рица. Пусть, далее, % (г) - (г - Xi)‘* (г - • • • (Z - Лг)*' (35) ио
— разложение характеристического многочлена х(2)' отображения ф на множители и Д(г) = (г-11)’«(г-Л2)’* ... (г-1г)’г — разложение минимального аннулирующего многочлена Д(г) отображения <р на множители (см. F). При повтор- ном применении предложения Е) матрица А разбивает- ся на блоки AIt А2, Аг, причем минимальным анну- лирующим многочленом блока At является (z — kt)4i. В силу предложения F) матрица А,- имеет единственное собственное значение if. Если матрица А разбивается на блоки, то характеристический многочлен матрицы А является произведением характеристических многочле- нов соответствующих блоков (см. D)). Из этого разло- жения следует % (z) = (z - !/ (г - 1/2 ...(z- Кг)рг, (36) где pi — порядок матрицы At. Сравнивая соотношения (35) и (36), мы видим, что p, = ki. Таким образом, по- рядок блока At матрицы А равен кратности собствен- ного значения U отображения ф. § 14. Жорданова форма матрицы Здесь мы будем рассматривать линейное отображе- ние ф с единственным собственным значением X. Со- гласно доказанному ранее минимальный аннулирующий многочлен отображения ф имеет вид (z — 1)\ Положим ф = ф —19. А) Пусть hi — вектор, удовлетворяющий условиям -ф/Л1 = О, ф'-1*! «0= 0. (37) Положим Л1 = &1» Л2 = фЛ1, ..., ht = фй/_1, h}+i = ^hf. Последовательность векторов Ль Л2, ..., Л/ назовем жордановой. Из соотношений (37) следует, что Л/ =# 0, Л/+1 =0. Таким образом, (ф —19) hi = Л2, или, что то же, фЛ] = 1А[-J- Л2. 111
Далее, (<p — XG) Л2 — Л3 или, что то же, фЛг = ХЛ2 + Л3 и т. д., (ф — Л0)Л/ = 0 или, что то же, фЛ/ = Khj. Если теперь Л— векторное подпространство простран- ства R" с жордановым базисом hi, h*, hj, то мат- рица А, соответствующая отображению ф, на простран- стве R имеет вид Л. 1 О ... О л О X 1 ... О О О О ... 1 Матрица эта называется жордановым блоком с соб- ственным значением X. Теперь мы докажем, что матрица А с единственным собственным значением X при надлежащем выборе ба- зиса разбивается на жордановы блоки. В) Пусть R — векторное пространство размерности п и S — его векторное подпространство. Система векто- ров Яр • • •» (3 >) называется линейно зависимой относительно подпро- странства S, если существуют такие константы с1, с2, ... ..., сг, не все равные нулю, что вектор са*а принадле- жит S, в противном случае система (38) называется линейно независимой относительно S. Линейно незави- симая система (38) пространства R относительно S на- зывается базисом пространства R относительно S, если для каждого вектора ж пространства R найдутся такие константы с1, ..., сг, что вектор X - Саха принадлежит пространству S. Ясно, что базис простран- ства R относительно S всегда существует и что всякую линейно независимую относительно S систему векторов пространства R можно дополнить до базиса в про- странстве R относительно подпространства S. Теорема 6. Пусть ф — линейное отображение век- торного пространства Rn в себя u X — единственное соб- 112
ственное значение отображения <р. Тогда при надлежа- щем выборе базиса в пространстве Rn матрица А, соот- ветствующая отображению ф, разбивается на жорданов ы блоки (см. А)), стоящие вдоль диагонали матрицы А. При этом каждый блок имеет собственное значение X. Доказательство. Пусть (z— X)fc — минималь- ный аннулирующий многочлен отображения ф. Положим ф = Ф — Л0. Обозначим через St множество всех векторов х из /?", удовлетворяющих условию ф'* = 0. Множество St представляет собой векторное подпро- странство пространства Rn. При этом имеют место сле- дующие включения: R" = Sfe=>Sfe_l => ... о S1 о So = 0. Пусть Bi — конечная совокупность векторов простран- ства Sk, составляющая его базис относительно подпро- странства S*_i. Докажем, что векторы фВ1, входящие в пространство S*-i, линейно независимы относительно подпространства Sk-г- Пусть «1> «2....«Z — совокупность всех векторов, входящих в Вь Допу- стим, что имеет место соотношение с°фео е S*_2. Тогда вектор фс“еа е- Sft_2. А это значит, что вектор с s S^_i. Это возможно лишь при условии, что все коэффициенты с1 = 0. Поскольку векторы конечной совокупности фВ1 век- торного пространства S*-i линейно независимы относи- тельно S*_2, конечную совокупность фВ1 можно допол- нить до базиса В2 пространства Sk-\ относительно пространства S*_2. Точно так же устанавливается, что век- торы конечной совокупности фВ2 векторного простран- ства S2 линейно независимы относительно Sk-з, и по- тому конечную совокупность фВ2 можно дополнить до из
базиса В3 пространства S2 относительно подпространства Sk-з- Рассуждая так дальше, мы дойдем в конце концов до базиса В* в пространстве Si относительно простран- ства So, и потому Вк есть обычный базис в простран- стве Si. Докажем теперь, что совокупность векторов, принадлежащих ко всем базисам Bi> ^2....Bft, составляет базис В пространства Rn. Допустим, что имеет место линейная зависимость ме- жду векторами совокупности В: сЧ+...=0, (39) причем на первом месте выписаны слагаемые, принадле- жащие В[. Применяя к этому соотношению отображение ф*-1, мы получаем соотношение с V4 = 0. Но это значит, что конечная совокупность векторов ф*-1В1, составляющая часть базиса BA_i пространства Вь линейно зависима, а потому все коэффициенты с1, с2, .. , сг равны нулю. После того как это доказано, мы докажем точно так же, что все коэффициенты при элементах В2, входящих в соотношение (39), также равны нулю, и тем самым в конце концов установим, что совокупность векторов В линейно независима в про- странстве R". Докажем теперь, что произвольный вектор Xi в про- странстве Sk = Rn линейно выражается через векторы, принадлежащие В. Так как векторы конечной совокуп- ности Bi составляют базис в пространстве S* относи-, тельно Sk-i, то вектор Xi может быть записан в виде «1 = с“еа + х2, где х2 е Sfe-i. Таким образом, вектор выражается ли- нейно через векторы, принадлежащие конечной совокуп- ности Bi и еще добавочный вектор х2, принадлежащий пространству S*_j. Продолжая этот процесс дальше, мы докажем в конце концов, что вектор Xi линейно выра- жается через векторы, принадлежащие В. Таким обра- зом, установлено, что В есть базис в пространстве S* = Rn. Разобьем теперь конечную совокупность векторов В на попарнонепересекающиесяжордановы серии (см. А)). 114
Для этого выделим в В подмножество В всех векторов, которые будут служить начальными векторами hi жор- дановых серий (см. А)). К множеству В отнесем прежде всего все векторы совокупности Въ затем все векторы совокупности В2) не принадлежащие к ее части фВ1, за- тем все векторы совокупности В3, не принадлежащие к ее части $В2. Продолжая этот процесс дальше, мы дойдем до векторов совокупности В* и включим в В те векторы из Вк, которые не принадлежат совокупности фВ*_]. Выберем начальный вектор hi нашей жордановой се- рии из конечной совокупности Bi, причем hi не принад- лежит к совокупности фВг_ь Выбранный вектор hi при- надлежит векторному пространству S*-/+i и не принад- лежит векторному пространству Sk-i. Итак, tf^hi О, Ф*-/+1л1==о. Таким образом, мы имеем последовательность векторов hi, h2 = ^hi, Л3 = фй2, .... hk_l+i = ^hk.{, $hk_t+i = 0, и векторы Лц h2, Л*_<+1 (40) составляют жорданову серию длины k — i + 1. Жордановы серии типа (40) исчерпывают всю сово- купность В и не пересекаются между собой. Таким образом, мы нашли совокупность жордановых серий, составляющих вместе базис пространства Rn, н каждой жордановой серии соответствует жорданов блок матрицы А. Следовательно, теорема 6 доказана (см. гл. 4, пример 13). С) Пусть исходное векторное пространство /?" яв- ляется действительным и отображение <р тоже действи- тельное, т. е. переводит каждый действительный вектор в действительный. Тогда характеристический многочлен x(z) отображения <р имеет действительные коэффициен- ты и, следовательно, наряду с каждым комплексным собственным значением X имеется сопряженное ему комплексное собственное значение %. Как было показано ранее (см. G) § 13), собственному значению X в про- странстве Rn соответствует некоторое векторное подпро- странство R' такое, что матрица А', соответствующая отображению ф пространства R' в себя, имеет мини- мальный аннулирующий многочлен (z — X)fe. В силу тео- 115
ремы 6 базис в пространстве /?', состоящий из жорда- новых серий векторов, является комплексным базисом. Как это видно из построения жорданрвых серий векто- ров в предложении А), отображение ф — <р — Х0 являет- ся комплексным. В векторном подпространстве R" век- торного пространства Rn (R" = R') можно взять базис, составленный из жордановых серий, имеющихся в про- странстве R', но сопряженных с ними. Оказывается, что минимальный аннулирующий многочлен (2 ~ к)к’ ото- бражения <р на подпространстве R" имеет тот же пока- затель k", что и аннулирующий многочлен (з — X)v на пространстве R'. В самом деле ясно, что (з —X)** яв- ляется аннулирующим многочленом отображения <р на подпространстве R". Если бы этот аннулирующий много- член (z — не был минимальным, а минимальным был многочлен (з — X)ft’, где k" < k', то, переходя от собственного значения А к сопряженному ему собствен- ному значению X, мы пришли бы к заключению, что (з — Х)к’ является аннулирующим многочленом отобра- жения ф на подпространстве R'. Таким образом, оба по- казателя k' и k" должны быть равны между собой. Та- ким образом, для двух комплексно сопряженных соб- ственных значений X и X определены два векторных под- пространства R' и R", причем пространство R" сопряже- но пространству R' в том смысле, что каждый вектор из R" сопряжен некоторому вектору из R' и наоборот. Предложение С) имеет значение при отыскании дей- ствительных решений действительных обыкновенных дифференциальных уравнений. § * § 15. Квадратичные формы Пусть Еп — действительное евклидово векторное про- странство размерности п, f(x,y)— действительная сим- метричная билинейная форма, заданная на этом про- странстве, и f(x,x)—соответствующая ей квадратичная форма. В координатном виде при выборе в Еп некото- рого ортонормального базиса билинейная форма f(x,y) записывается так: f(x, у) = аа^хау^ (см. D) § 2). Здесь Л = (|а//|| не
представляет собой квадратную матрицу порядка п. Эта запись отличается от обычной формы записи матриц, привычной нам, тем, что оба индекса стоят внизу, но мы будем считать, что первый индекс i указывает номер строки, а второй индекс /— номер столбца. Квадратич- ная форма f(x, х) записывается в виде f(x, х) = (цЛ5. Основной задачей настоящего параграфа является выбор такого ортонормального базиса в пространстве Еп, при котором квадратичная форма записывается в наиболее простом виде. А) Пусть Л = ИМ — матрица, соответствующая действительной квадра- тичной форме f(x,x), заданной на Еп при некотором ор- тонормальном базисе г» е2.....еп. (41) Квадратичной форме f(x,x) соответствует линейное ото- бражение <р пространства Еп в себя с матрицей А = j а' ||, которое в координатной форме при базисе (41) задается формулой а‘ = а(/. (42) Матрицы А и А, выписанные как квадратные таблицы, полностью совпадают. Они отличаются только тем, что элементы их обозначены по-разному. Оказывается, что так заданное отображение ф при помощи базиса (41) не зависит от случайно выбранного базиса, но определяет- ся самой квадратичной формой f(x,x). Собственные зна- чения отображения ф называются собственными значе- ниями квадратичной формы f(x,x), а собственные вркторы его называются собственными векторами квадра- тичной формы. Оказывается, что все собственные зна- чения квадратичной формы являются действительными числами, а при надлежащим образом выбранном орто- нормальном базисе Ль Л2, hn (43) в пространстве Еп матрицы А и А имеют диагональную форму, причем на диагонали стоят собственные значе- ния квадратичной формы f(x, х), а векторы, составляю- щие базис (43), являются собственными векторами с этими собственными значениями. 117
Докажем предложение А). Докажем прежде всего, что отображение <р, заданное в координатной форме при помощи базиса (41) формулой (42), в действительности определяется самой квадратичной формой /(*,*) и не зависит от выбора ортонормального базиса (41). Квад- ратичная форма f(x,x) однозначно определяет симмет- ричную билинейную форму f(x,y) (см. Е) § 2). Далее, билинейная форма f(x,y), рассматриваемая как функ- ция вектора х, однозначно определяет такой вектор и (у), что f(x, у) = (и(у), х) (см. В) § 7), где вектор и(у), естественно, зависит от у. При базисе (41) мы имеем f(x, у) = аа&хах^ = а^у&ха = (и(у), х), где «(У) = («ip/. • • •, Таким образом, координаты вектора и(у) в квадратич- ной форме определяются формулой и‘ = «/рЛ Отсюда видно, что вектор и {у) задается формулой «(У) = ФУ> причем линейное отображение <р однозначно определяет- ся симметричной билинейной формой j(x,у), которая в свою очередь однозначно определяется квадратичной формой f (х,х). Таким образом, мы доказали, что линей- ное отображение <р однозначно определяется квадратич- ной формой f(x,x). Теперь докажем, что любое собственное значение к отображения <р действительно. Собственное значение X отображения <р определяется соотношением aiaha = khl — Miaha, (44) где Л = (й1,Л2, ..., ft") — отличныйот нуля вектор.Умно- жая это соотношение на Я1 и суммируя по I, получаем aapft“Ae = f(ft, й) = Л(Л, Л). Согласно доказанному ранее (см. введение к гл. 3) би- линейная форма равно как и скалярное произве- дение (Л,Л), являются действительными числами, при- 118
чем (й, й)#=0. Отсюда следует, что % есть действитель* ное число. Доказательство того, что матрица А при надлежа- щим образом выбранном ортонормальном базисе (43) в пространстве Еп имеет диагональную форму, причем на диагонали стоят собственные значения квадратичной формы, соответствующие собственным векторам (43), будем вести индуктивно. При п = 1 утверждение оче- видно, так как тогда матрица А является матрицей пер- вого порядка и представляет собой действительное число. При п > 1 собственный вектор Ль соответствующий некоторому собственному значению X = Хь выберем за первый элемент ортонормального базиса пространства Еп. Пусть *i. Л2....Л„ (45) — некоторый ортонормальный базис пространства Еп, на- чинающийся с собственного вектора Ль Обозначим через Еп~1 векторное подпространство пространства Еп с бази- сом Л2, Л3, • • •, Лл. Обозначим через В матрицу, соответствующую квад- ратичной форме f(x, х) в базисе (45). Согласно формуле (31) § 2 матрица В=||йг/|| определяется формулой Л// = f (Л/, Лу). Соотношение (44) для матрицы В записывается в виде Умножая это соотношение скалярно на вектор Л/, / > 1, получаем £ AiA/=W р-i Правая часть последнего соотношения ввиду ортонор- мальности базиса (45) обращается в нуль при / =/= 1, так что мы имеем ^i/ = f(^i» A/) = XIS1/ = O при />1. Таким образом, f(x,y) в новом ортонормальном базисе (45) записывается в виде f (х, у) = Xjx’i/1 Ч- ba(ixayfi, а, 0 = 2, м п. 119
Матрица В = ПМ> Л/ = 2, .... га, соответствует билинейной симметричной форме в под- пространстве В"-1, в которую превращается исходная билинейная форма f(x,y), когда оба ее аргумента х и у принадлежат f(x,y). Следовательно, по предположению индукции утверждение А) для нее верно. Таким обра- зом, окончательно билинейная форма f(x,y) в надлежа- щим образом выбранном ортонормальном базисе (43) приобретает вид f (*> У) = + W + • • • + ЬпХпуп, причем собственный вектор hi соответствует собствен- ному значению Хь собственный вектор hi соответствует собственному значению Х2 и т. д. Квадратичная форма f(x, х) принимает вид f (X, X) = Х1 (х1)2 + Х2 (х2)2 + ... + Х„ (хп)2. (46) Итак, предложение А) полностью доказано. Говорят, что квадратичная форма f(x,x) в надлежа- щим образом выбранном ортонормальном базисе может быть записана в виде суммы квадратов координат век- тора, причем каждый квадрат берется с действительным коэффициентом. Коэффициент этот может быть как по- ложительным, так и отрицательным числом, а также нулем. Закон инерции Мы доказали, что квадратичную форму f(x, х) можно привести к виду (46), если взять в евклидовом вектор- ном пространстве Еп ортонормальный базис. Если от- казаться от ортонормальности базиса, то квадратичную форму / (х, х) можно привести к еще более простому виду. П) Квадратичную форму f(x, х), заданную в действи- тельном векторном пространстве Еп, надлежащим вы- бором базиса можно привести к следующему виду: f (Х, X) = 8, (X1)2 4- 82 (X2)2 + . . . + 8„ (X")2, (47) где числа ei, 82..8П принимают значения ±1 и 0. Докажем предложение D), воспользовавшись резуль- татом предложения А). Если число X; положительно, то 120
положим Hi = Если число Xi отрицательно, то положим Hi = V^i и, наконец, если Xi равно нулю, то положим Hi=l. Вместо координат х1, х2, , хп, в которых записана квадратичная форма (46), введем новые координаты £2....положив Подставляя значения х1 в выражение квадратичной фор- мы (46), получим f (х, х) = е, (I1)2 + ®2 Й2)2 Г)2. Все числа еьвг, ..., вя принимают значения ±1 и 0. Та- ким образом, предложение D) доказано. Предложение D) было доказано в предположении, что квадратичная форма f(x,x) задана в евклидовом векторном пространстве Еп, так как при этом в качестве промежуточного результата использовалась каноническая форма (46) квадратичной формы. При доказательстве существенную роль играла евклидовость пространства Еп. В действительности для установления канони- ческого вида (47) квадратичной формы f(x, х) не тре- буется евклидовость пространства Еп. В пространстве Rn, которое не является евклидовым, можно произволь- ным образом ввести скалярное произведение и при по- мощи этого скалярного произведения доказать промежу- точное предложение (46). Сейчас мы займемся каноническим видом (47) квад- ратичной формы f(x, х), причем квадратичная форма f(x, х) задана в произвольном векторном простран- стве Rn. Е) Пусть Rn—n-мерное векторное пространство, а elt е2, .... еп (48) и />. f2...fn (49) — два базиса в пространстве R". Пусть, далее, ct ot₽ х = х еа, у = у' 121
— векторы, заданные в пространстве /?". Допустим, что. в базисе (48) квадратичная форма f(x,x) записывается в виде f (х, х) = 8, (*1)2 + 82 (Х2)2 + . . . 4- 8Р (хР)2 + + 8р+1 (*₽+1)2 + • . . + СО2 + • • • + 8„ (х")2. (50) При этом базисные векторы «1, е2.....еп занумерованы так, что 8t = 82 = •.. = ер= 1, 8р+1 =еР + 2== • • • =8р+9= 1, 8р+?*1 в 8р+Р+2 == • • • = 8П = 0. Допустим, далее, что та же самая квадратичная форма f(jh У) в базисе (49) записывается в виде f (9, ») = 4 (<?)’ + 4 (Л’ + • • + V (/)’ + +>;+. go2+... +^(/+т+ ... •..+»;(/)’. (ап причем 8i=... =8р=1, fy+i = • • • =ер'+<7' = —1, / 7 п ер'+<7'+1 = • • • = 8Л = 0. Оказывается, что имеет место следующая теорема инва- риантности: р = р', q = q'. (52) Докажем соотношения (52). Доказательство будем вести от противного. Допустим, что Р=/=/, и предположим для определенности, что р'<р. (53) Обозначим через /?+ векторное подпространство про- странства с базисом 8j, ^2, • • •, ер, и через R- векторное подпространство пространства Rn с базисом /рЧ-1....fp'+q'i •••» tn- Запись (50) квадратичной формы показывает, что если вектор X&R+ и х^О, то f(x,x)>0. Точно так же 122
запись '(51) квадратичной формы f(y,y) показывает, что если вектор yeR~, то f(y,y)^O. Ввиду неравенства (53) сумма размерностей пространств R+ и R- больше п, и потому пространства эти пересекаются по ненуле- вому вектору. Докажем это. Пусть ер 62, ...» ер, fp'+i, • ••» fn — последовательность векторов. Ввиду неравенства (53) общее число этих векторов больше п, и потому они ли- нейно зависимы. Запишем их линейную зависимость в виде: «4 = 6%. «=1. .... Р, Р = р'+1, .... и, (54) при этом коэффициенты а1 и Ь>, вместе взятые, не могут все обращаться в нуль. Справа стоят элементы базиса (49), поэтому они линейно независимы, и, следователь- но, коэффициенты а1 не могут все одновременно обра- щаться в нуль. Мы нашли отличный от нуля вектор к, стоящий в левой части соотношения (54), который при- надлежит обоим пространствам /?+ и R-. На этом век- торе квадратичная форма f(x, х) положительна, по- скольку х е R+, и она неположительна в силу того, что же/?-. Таким образом, мы пришли к противоречию и неравенство р' < р исключается. Точно так же доказы- вается, что неравенство р < р' невозможно. Таким об- разом, доказано, что р — р'. Применяя полученный ре- зультат к квадратичной форме —f(x,x), мы приходим к выводу, что q — q'. Итак, доказано, что в квадратич- ной форме f(x, х) число положительных коэффициентов и число отрицательных коэффициентов в каноническом виде инвариантны. Но так как число нулевых коэффи- циентов равно п — р — q, то этим самым доказана инва- риантность числа нулевых коэффициентов. Мы дока- зали, следовательно, так называемый закон инерции для квадратичных форм. § 16. Экспонента квадратной матрицы Этот параграф не вполне подходит под заголовок гл. 3, так как здесь не приводится к каноническому виду никакая матрица, однако результаты этого параграфа нужны для теории обыкновенных дифференциальных уравнений и их нужно куда-то поместить. По своему духу этот параграф ближе всего примыкает к гл. 3. 123
Экспонентой exp z называется функция exp z — ег, которая задается рядом *‘=1+-t+4+4+-«-+4-+- <55> Если вместо z в правую часть этого равенства подста- вить квадратную матрицу А и если окажется, что мат-' ричный ряд сходится, то мы определим функцию еА. Оказывается, что, подставляя в ряд (55) произвольную квадратную матрицу порядка п, мы всегда получаем сходящийся ряд и функция еА всегда определена. Сходи- мость ряда, составленного из квадратных матриц по- рядка п, определяется как сходимость ряда для каждого отдельного элемента матрицы, стоящего на определен- ном месте. Для доказательства этого нужно произвести неслож- ные оценки. А) Пусть В = |4,‘|. Л=|оЛ — две квадратные матрицы порядка п, элементы кото- рых имеют оценки где а и b — некоторые положительные числа. Оказы- вается тогда, что для матрицы ВА = С = ||с/|| имеют место оценки | с/1 nba. (56) Докажем последнее соотношение. Мы имеем Cf = baOj, а = 1, ..., п. В правой части этого равенства стоят п слагаемых, каж- дое из которых по модулю не превосходит произведение Ьа, и, таким образом, неравенство (56) доказано. В) Пусть Л—1«/| — квадратная матрица порядка п, для элементов кото- рой имеются оценки I в/1 о» 124
где а — некоторое положительное число. Если k — целое неотрицательное число, то для матрицы А‘ = И имеют место оценки |с‘|<(паЛ Докажем это утверждение. Доказательство будем вести индуктивно по числу k. Так как А° — Е, то для k = 0 утверждение верно. Положим теперь Тогда по предположению индукции имеем Далее, Ак = ВА. Так как для матриц А и В уже имеются оценки, то в силу предложения А) мы получаем для элементов мат- рицы А* оценку, указанную в формулировке предложе- ния В). С) Матричный ряд ел, где А — квадратная матрица произвольного порядка п, всегда сходится. Для доказательства этого утверждения рассмотрим член получаемого ряда В силу предложения В) При суммировании правых частей этого соотношения мы получим сходящийся ряд. Таким образом, матричный ряд еА всегда сходится. D) Пусть t — действительное число. Определим мат- ричную функцию /(/), положив где А — некоторая квадратная матрица порядка п. Тогда оказывается, что -М- = А/(/) = /(/) А. (57) 125
Для доказательства последнего соотношения выпи* шем функцию е‘А в виде ряда /(0 = Л’ + -^ + -^-+... +££+... В силу оценок, полученных ранее (см. С)), ряд этот можно дифференцировать по t. Осуществляя дифферен- цирование, мы получаем соотношение (57).
Глава 4 ПРИМЕРЫ Здесь будут даны примеры, иллюстрирующие и разъ- ясняющие содержание трех первых теоретических глав. К § 1 Пример 1. Определение 7. Вектором называется направлен- ный отрезок, т. е. такой отрезок, о котором известно, в каком его конце находится начало вектора и в каком его конце конец вектора. Таково геометрическое определение вектора. Если от- резок рассматривается как принадлежащий плоскости Е2, то он двумерен. Если отрезок рассматривается как принадлежащий трехмерному пространству Е3, то он трехмерен. Вводятся операции сложения векторов и ум- ножения их на действительные числа. Далее опреде- ляется равенство векторов и доказывается, что для каж- дого вектора из Еп (п = 2,3) существует равный ему вектор, начинающийся в заданной точке простран- ства Еп. Пусть и — вектор пространства Еп (и = 2,3). Тогда существует равный ему вектор V, начинающийся в на- чале координат О. Обозначим через b конец вектора v. Координаты точки Ь являются числами. Их два или со- ответственно три в зависимости от п. Они являются ко- ординатами вектора и или вектора и. Таким образом, между векторами из Еп и парами или тройками чисел '(в зависимости от п) устанавливается соответствие. Каждому геометрическому вектору ставится в соответ- ствие вектор пространства Ап, заданный определе- нием 1. 127
К § 2 Пусть Ап — n-мерное векторное пространство (см. определение 1) и ф— отображение пространства Ап в себя. Рассмотрим несколько типичных примеров отобра- жения ф. Пусть е2, ..., еп — базис пространства Ап. Зададим отображение ф соот- ношением фв^ = cij еа. Таким образом, отображение ф задается матрицей А— — IIII- Пример 2. Допустим, что матрица А, задающая отображение ф, является диагональной и что на диаго- нали стоит одно и то же число X. Тогда в силу формулы (23) гл. 1 для каждого вектора х отображение ф опре- деляется формулой Ф*==Лх. (1) Такое отображение ф является растяжением простран- ства Ап с центром в начале координат с коэффициентом- Л. Если |Х|< 1, то фактически отображение ф является сжатием. Заданное формулой (1) отображение ф назы- вается подобием с центром в начале координат. Пример 3. Допустим теперь, что матрица А, опре- деляющая отображение ф, является диагональной и что на диагонали первый элемент равен нулю, а остальные равны единице. Тогда отображение ф представляет со- бой проектирование пространства Ап на его подпростран- ство А"-1 с базисом е2, ..., еп в направлении вектора et. Пример 4. Пусть матрица А, задающая отобра- жение ф, является диагональной, причем первый диаго-. нальный элемент равен —1, а остальные диагональные элементы равны +1. Тогда отображение ф является зеркальным отображением пространства Ап на себя от- носительно его подпространства Ап~1 с базисом е2, ... ..., еп в направлении еь К §§ 3, 4 Пример 5. Рассмотрим систему двух линейных уравнений относительно двух неизвестных х1, х2: а\хх + а2х2 = с1, afx' + alx2 = с2. 128
Исключим неизвестное х2 из системы уравнений (2), ум- ножив первое из уравнений системы (2) на al, а вто- рое на al и вычтя одно уравнение из другого. Тогда мы получим (a\di — ak?) х1 — ale' — ok2- Таким образом, мы имеем t а|с* ~ а2с2 а\а2 — a'2af Аналогично получаем „2 _ «к*-«к* X 12 1 о ’ а\а,2 — «2а1 Обе дроби (3) и (4) имеют один и тот же знаменатель D (Д) = ci\U2 — Этот знаменатель называется определителем матрицы А = |а/||, i— 1.2; /= 1,2, второго порядка. Таким об- разом, мы пришли к представлению об определителе квадратной матрицы второго порядка. Положим (3) (4) Тогда для х1 и х2 формулы (3) и (4) можно переписать в виде D (Л.) 2 Д(42) х ~ D (4) ’ D (4) • В следующих параграфах эта конструкция будет обобщаться на случай решения системы п уравнений с п неизвестными при помощи определителей. К § 5 Пример 6. Пусть А = ||а/||, В = ||&/|| — две треу- гольные матрицы порядка п. Это значит, что при / > I умеем. О/ = 0, &/ = 0. Докажем, что матрица С = АВ = =Цс/[ также является треугольной. Мы имеем Cfe = dabk- 129
Докажем, что при k > I имеем с* = 0. В самом деле, если а>/, то Оа = 0. Если а<г, то a<k и потому Ьь = 0. Следовательно, сь = 0 при k > i. К § 6 Пример 7. Пусть * = (**, ..., хр), у = (у1, .... у4) — два отличных от нуля вектора размерностей р и q со- ответственно. Определим матрицу Д = ||а/|| формулой а\ = х1у'. Тогда ранг матрицы А равен единице. К § 7 Пример 8. Пусть Еп — n-мерное евклидово про- странство. Отображение ф пространства Еп на себя на- зывается вращением, если оно сохраняет длины всех векторов, т. е. если |фх| = |х|. Дадим пример вращения пространства Е2. Пусть х — (х\х2). Зададим отображение <р формулами (фх)1 = х1 cos а + х2 sin а, 7 42 1 • I 2 (5) (фх)2 = —х' sin а 4- х2 cos а. ' Легко проверяется, что заданное формулами (5) отобра- жение ф является вращением. В действительности ф есть поворот плоскости Е2 вокруг начала координат на угол а. К § 8 Появление комплексных чисел побудило математи- ков сделать попытку дальнейшего обобщения действи- тельных чисел, присоединив к ним не одну мнимую еди- ницу, а несколько. Эта попытка имела ограниченный успех. Были построены кватернионы с тремя мнимыми единицами, но при этом пришлось отказаться от комму- тативности умножения. Дадим определение кватернио- нов. 130
Пример 9. В основу кватернионов положены три мнимые единицы, которые обозначаются через г, /, k, (6) так что каждый кватернион записывается в виде Х = Х0 + xj + X2j + Xsk. Здесь хо, Xi, хг, Хз — действительные числа, коммутатив- ные по умножению с единицами (§). А единицы (6) пе- ремножаются по следующим правилам: i* = f=k2=-l, ij=?k, ki = j. Кватернион x, сопряженный к кватерниону х, задается формулой х = х0 — Xii — x2j — x3k. Легко проверяется, что хх = | х I2 = Хо + Xi + xl + Хз- Из этого следует, что кватернион х~1, обратный к ква- терниону х по умножению, задается формулой Легко проверяется, что ху = ух. Кватернион х, по модулю равный единице, т. е. удовлет- воряющий условию |х|= 1, записывается в виде х = cos а + и sin а, где и — чисто мнимый кватернион, т. е. и = U\i + щ + 4- uzk, а а — угол. Ввиду отсутствия коммутативности умножения по- пытки построить теорию кватернионных функций не имели успеха, но кватернионы имеют красивые геомет- рические применения. Укажем их. Пример 10. Совокупность всех кватернионов К представляет собой четырехмерное евклидово векторное пространство. Длина каждого вектора-кватерниона х оп- ределяется как |х|. Четырехмерное векторное простран- ство К. всех кватернионов разлагается в прямую сумму одномерного векторного подпространства действитель- ных кватернионов D, имеющих вид х = х0, и трехмер- 131
ного векторного пространства чисто мнимых кватернио- нов 1, имеющих вид и = uxi-\- u2j -|- u3k. Каждому кватерниону а, по модулю равному единице, поставим в соответствие линейное отображение fa евкли- дова векторного пространства К на себя, задаваемое формулой fax = axa~l. Легко проверяется, что линейное отображение fa пере- водит каждое линейное подпространство D и / само на себя. Далее, оказывается, что отображение fa является, вращением евклидова векторного пространства К (см. пример 8). Докажем это. Для этого подсчитаем модуль кватерниона аха~1. Имеем | axa~l р = аха~'аха~1 = = axa~la~lxa = axa~laxa~l = axxa~l == | х f. Пример 11. Оказывается, что при помощи отобра- жения fa можно получить любое вращение евклидова векторного пространства К, получающееся в результате непрерывного изменения из тождественного, причем та- кого, что в процессе изменения все время мы имеем вра- 'щение и пространство D переводится в себя. Таким об- разом, отображение fa описывает все вращения про- странства /, получающиеся непрерывным образом из’ тождественного. Доказательство этого нетривиального утверждения я предоставляю читателю. К § 9 В 1545 году Кардано дал формулу решения кубиче- ского уравнения в радикалах. Дадим вывод его фор- мулы. Пример 12. Рассмотрим кубическое уравнение z3 + az + & = 0. (7) К такому виду легко привести любое кубическое уравне- ние. Представим теперь z в виде z = х + у. Тогда уравнение (7) запишется в виде х* + У* + Зхг/ (х + у) 4- а (х 4- у) 4- Ь = 0. (8; 132
Наложим на х и у дополнительное условие ху--------------------------(9) Тогда уравнение (8) запишется в виде ^ + tf = -b. (10) Так как имеет место соотношение (9), то хУ = -^. (11) Из соотношений (10) и (И) следует, что х3 и у3 яв- ляются корнями квадратного уравнения и2 -Ь Ьи — = 0. Таким образом, и для z получаем формулу Кардано Ясно, что, применяя формулу Кардано, нельзя брать произвольные значения кубических корней, а надо брать такие пары кубических корней, чтобы их произведение равнялось —а/3. Оказывается, что величина 4- -~- является отрицательной тогда и только тогда, когда уравнение (7) имеет три действительных корня. Это утверждение приводится здесь без доказательства. Ука- зание на доказательство имеются в § 4 книги «Матема- тический анализ для школьников». Таким образом, в формуле Кардано встречается извлечение корня из от- рицательного числа именно в том случае, когда корни кубического уравнения действительны. В этом случае два кубических корня, стоящих в формуле Кардано, из- влекаются из комплексно сопряженных величин и при извлечении кубических корней следует также взять комп- лексно сопряженные величины. Тогда сумма кубических корней, входящих в формулу Кардано, оказывается действительной. То обстоятельство, что именно в случае действительных корней кубического уравнения (7) в формуле Кардано появляются мнимые числа, очень сильно содействовало введению комплексных чисел. 133
К § 14 Проиллюстрируем доказательство теоремы 6. Пример 13. Выпишем базис пространства 7?" = разбив этот базис на строки. В качестве первой строки выпишем базис пространства S* относительно его под- пространства Sk-i, т. е. векторы системы В\. Пусть он состоит из векторов е2, .... ег. Во вторую строку вы- пишем векторы системы В2 — сначала векторы феь ... ..., tyer, а затем векторы er+i, ...» er+Sl, причем под вектором ei первой строки выпишем вектор а далее векторы ег+1.......er+S1, не входящие в фВр В третью строку выпишем векторы системы В3 — сначала векторы i|>2ei....ф2ег, далее фег+1» • • •» ’|’er+Sl, а затем векторы er+S1+i.....er+S1+S2, не входящие в i|)B2. Продолжая этот процесс дальше, мы получим последовательность строк, причем первая состоит из векторов системы Bi, вторая из векторов системы В2, третья из векторов си- стемы В3 и т. д. Каждая из таких строк справа может выступать из-под предыдущей строки на несколько эле- ментов. Таким образом, эти. строки образуют лесенку со ступеньками, расположенными справа. В качестве верхней площадки лесенки взята система Вь Взяв вектор h\ из строки Bi, находящийся на ступеньке этой строки и выступающий из-под предыдущей строки, мы получим жорданову серию hi, фЛь ..., ф*-,+1Л1: B| &i е2 • • • В2 аК tye2 ... фег er+i ... er+Sl В3 'l’2»! $2е2... ty2er ter+i •.. ’К-н, e,+S1+i ... er+S1+S!,
Лев Семенович Понтрягин ЗНАКОМСТВО С ВЫСШЕЙ МАТЕМАТИКОЙ АЛГЕБРА Редакторы С. М. Асеев, В» В. Донченко Художественный редактор Т. Н. Кольченко Технический редактор Е. В. Морозова Корректоры О. А. Сигал, М. Л. Медведская ИБ № 32456 Сдано в набор 16.09.86. Подписано к печати 06.02.87. Формат 84X108/32. Бумага тип. Кв 2. Гарнитура литературная. Печать высокая. Усл. печ. л. 7,14. Усл. кр.-отт. 7,25. Уч.-изд. л. 6,28 Тираж 100 000 экз. Зак. № 312. Цена 20 коп. Ордена Трудового Красного Знамени издательство «Наука» Главная редакция физико-математической литературы 117071 Москва В-71, Ленинский проспект, 15 Ленинградская типография № 2 головное предприятие ордена Трудового Красного Знамени Ленинградского объединения «Тех- ническая книга» им. Евгении Соколовой Союзполиграфпрома при Государственном комитете СССР по делам издательств, по- лиграфии и книжной торговли. 198052, г. Ленинград, Л-52, Из- майловский проспект, 29.
ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ ИЗДАТЕЛЬСТВА «НАУКА» ВЫПУСТИЛА В СВЕТ В 1987 ГОДУ ВТОРОЕ ИЗДАНИЕ КНИГИ'. Л. С. ПОНТРЯГИН «ЗНАКОМСТВО С ВЫСШЕЙ МАТЕМАТИКОЙ. МЕТОД КООРДИНАТ» Книгу можно приобрести в магазинах Союзкниги и Академкниги
20 коп.