Text
                    3. И. БОРЕВИЧ
ОПРЕДЕЛИТЕЛИ
И МАТРИЦЫ
ИЗДАНИЕ ВТОРОЕ
Допущено Министерством
высшего и среднего специального образования СССР
в качестве учебного пособия
для студентов высших учебных заведений
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1970

517. 1
Б 82
УДК 512. 83
АННОТАЦИЯ
Предлагаемая вниманию читателей книга является введением в линейную алгебру и составляет часть университетского курса по высшей алгебре. В ней изложены темы: теория определителей, теория систем линейных уравнений, действия над матрицами, алгебраическая теория квадратичных форм. Изложение этих тем, сопровождаемое большим количеством примеров, проводится на конкретной основе без использования понятия векторного пространства и имеет своей целью подготовить читателя к последующему естественному восприятию абстрактных понятий линейной алгебры.
В качестве приложения в книге изложена на матричном языке общая теория приведения уравнений кривых и поверхностей 2-го порядка к каноническому виду.
Книга рассчитана на студентов университетов, педагогических институтов и технических вузов, а также лиц, начинающих самостоятельное изучение высшей алгебры.
2-2-3 178-69
ОГЛАВЛЕНИЕ
Предисловие ........................................... 4
Глава I. Теория определителей...................... 5
§ 1.	Определители второго и третьего порядков	.	.	5
§ 2.	Определение определителя n-го порядка	....	11
§ 3.	Транспозиции........................... 19
§ 4.	Свойства определителей................. 25
§ 5.	Примеры вычисления определителей....... 49
§ 6.	Определитель ступенчатой матрицы .......... 60
Глава П.	Системы линейных уравнений................ 66
§ 7.	Основные понятия........................... 66
§ 8.	Теорема Крамера............................ 67
§ 9.	Ранг матрицы. Элементарные преобразования 72
§ 10.	Метод исключения неизвестных............... 83
§ 11.	Условие совместности....................... 91
§ 12.	Однородные системы линейных уравнений . .	99
Глава III. Действия над матрицами.................... 102
§ 13.	Умножение матриц......................... 102
§ 14.	Сложение матриц и умножение матрицы на число......................................... 119
§ 15.	Определитель произведения	квадратных матриц 127
§ 16.	Обратная матрица......................... 131
§ 17.	Характеристический многочлен............. 142
Глава IV. Квадратичные формы......................... 153
§ 18.	Приведение квадратичной формы к диагональному виду..................................... 153
§ 19.	Вещественные квадратичные	формы.......... 168
§ 20.	Ортогональные преобразования переменных	176
§ 21.	Приведение квадратичной формы к диагональному виду ортогональным	преобразованием	183
§ 22.	Приведение к каноническом} виду общего уравнения линии и поверхности 2-го порядка ...	191
ПРЕДИСЛОВИЕ
Настоящая книга является введением в линейную алгебру. В ней изложены четыре темы: определители, системы линейных уравнений, матрицы и действия над ними, квадратичные формы.
Рассчитана книга главным образом на лиц, начинающих изучение высшей алгебры и еще не владеющих абстрактными алгебраическими понятиями. В силу этого изложение материала проведено на конкретной основе и имеет целью подготовить читателя к естественному восприятию абстрактных понятий при изучении им линейной алгебры в дальнейшем. В частности, теория систем линейных уравнений изложена без привлечения понятия многомерного векторного пространства.
В книге приведен лишь самый необходимый минимум упражнений, которых начинающему читателю, конечно, недостаточно. Имеется в виду, что читатель использует соответствующие разделы многократно изданных и легко доступных задачников: Д. К. Фаддеев и И. С. Сомин-ский «Сборник задач по высшей алгебре» и И. В. Проскуряков «Сборник задач по линейной алгебре».
Автор выражает глубокую* благодарность и признательность члену-корреспонденту Академии наук СССР профессору Дмитрию Константиновичу Фаддееву, в постоянном общении с которым писалась эта книга.
3. Боревич
ГЛАВА I
ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ
§ 1. Определители второго и третьего порядков
Понятие определителя возникло в связи с проблемой отыскания формул для значений неизвестных в системе линейных уравнений.
Рассмотрим- систему двух линейных уравнений с двумя неизвестными:
ахх-\-Ь^у—си 1
Чтобы найти неизвестное х, умножим первое уравнение на bit а второе на —bi. Складывая полученные левые и правые части, получим
(chbi — a^bi) х — Cibt — abi.
Аналогично, умножая первое уравнение на — as, второе на alt найдем
(atb3 — (kbi) у = ахСч — ajCi.
Предполагая, что афч — ачЬ\ Ф 0, получаем
a,62 — eg&j ’	° afii — atbt'	' '
Непосредственной проверкой легко убедиться, что зна чения для х и у, даваемые формулами (2), действительно удовлетворяют системе (1). Нами доказано, таким образом, что если аА — аА^О, то система (1) имеет единственное решение, определяемое формулами (2).
5


Рассмотрим таблицу чисел
составленную из коэффициентов при неизвестных х и у системы (1). Такую таблицу чисел называют (квадратной) матрицей 2-го порядка. Обозначим ее для краткости одной буквой А. Выражение а&г — сцЬ1, стоящее в знаменателе формул (2), определяется числами матрицы (3) по следующему правилу: надо взять произведение чисел, расположенных на главной диагонали (так мы называем диагональ, идущую из левого верхнего угла в правый нижний), и вычесть из него произведение чисел, расположенных на второй диагонали. Так полученное выражение aib^— ajji называется определителем 2-го порядка, составленным из элементов матрицы А (или короче: определителем матрицы А), и обозначается через
М1 =
Например, если
«1 Ь, а^ bt
— а\Ь% — а.гЬ1.
|Л| =
= 2-8 —5-3 = 1.
2 3
5 8
Еще пример:
— 1 2
— 3 4
= (—1)-4 —(—3)-2 = 2.
Правило, по которому вычисляется определитель матрицы 2-го порядка, схематически можно изобразить следующим образом:
6
Приняв введенное определение определителя 2-го порядка, замечаем, что числители в формулах (2) могут быть представлены теперь в виде
С\Ь^ -— c%bi —
Ci й
bi bt
= | AiI, aiCi — a^i==
ai
<h
Ci
Ci
где матрицы Ai и Л8 получаются из А заменой первого, соответственно второго, столбца на свободные члены. Формулы (2) принимают теперь следующий вид:
X —	-Ч	<М	= LA1 «=-Ml ’ y	Ci	— M.I
	«1		at bt b%	Ml
(4)
Напомним еще раз, что эти формулы применимы лишь в случае, когда. | А | Ф 0.
Пример. Пусть требуется решить систему уравнений
2х— Зу =— 7, 1
5x-4~4z/=12. J
Составляем матрицу из коэффициентов при неизвестных
2 —3
5	4
Л =
и вычисляем ее определитель
| Л| = 2-4 —(—3)-5 = 23.
Так как | Л |	0, то формулы (4) применимы.
Вычисляем числители:
— 7 —3
12	4
2 —7
5	12
= -284-36 = 8,
= 24 4-35 = 59.
Следовательно,
V —.1 Л, I 59
|Л|—23’	23-
7
Рассмотрим теперь систему трех линейных нений с тремя неизвестными:
арс + Ь^у -J- Ciz = и2х —|— Ь$у —|— c.2z = dit a3x-}-b3y-\-c3z = d3.
урав-
(5)
Чтобы найти х, умножим уравнения системы (5) соответственно на — Z>8c2, &8Ci — bic3, — b^ и сложим полученные левые и правые части. После приведения подобных членов (относительно х, у и г) окажется, что коэффициенты при у и z равны нулю. Предполагая, что коэффициент при х отличен от нуля, получим
__ dibsc$ -|- d9b9Ci -|-	— d^b^c^ — d2biCs — d^b^c^
d^b^c^ -j- u^b^c^ — cijb^c^ — a^b^Cs — d9b9Ci ,
Составим,	как и выше,	таблицу чисел из коэффи-
циентов при	неизвестных:	
		bi ci
	А = а2	Ь$ ,
	&3	Ь» с3
Эта таблица чисел называется квадратной матрицей 3-го порядка (у нее три строчки и три столбца). Выражение, стоящее в знаменателе формулы (6), составлено из чисел матрицы А по следующему правилу. Произведение чисел, расположенных • на главной диагонали, и два произведения чисел, расположенных в вершинах двух равнобедренных треугольников с основанием, параллельным главной диагонали, и с вершиной в противоположном углу, берутся со знаком плюс. Три произведения, которые строятся по такому же .правилу, но относительно второй диагонали, берутся со знаком минус. Схематически это правило может быть изображено следующим образом:
Так составленная сумма шести слагаемых (из которых три взяты со знаком плюс, а три — со знаком минус) называется определителем (3-го порядка) матрицы А и обозначается через
1Д| =
01
Оа
а»
bi Ci
Ь-1
С3
Например, если
1
2 3
1 4
2 5
то
Mi-
1 2
2 1
— 1 2
3
4
5
= 1-1-5 + 2-2-3 + (— 1)-2-4 — (- 1)-1-3 —
— 2-2-5—1 •2-4 = —16.
Итак, знаменатель в формуле (6) представляется в виде определителя | А |. Что касается числителя, то, поскольку он получается из знаменателя заменой оь а2, о3 соответственно на dlt d,, d3, его можно представить в виде определителя
di bi Ci di bi c<i d3 b3 Ci
= IA|.
Аналогичным образом, если уравнения системы (5) умножим последовательно на а8с2 — а*с3, aic3— a3ci, a.2ct — aiCi и результаты сложим, найдем формулу для у. Наконец, умножая уравнения (5) последовательно на а3Ь3— aibi, a3bt — aib,i, aibt — ajh, найдем формулу для z. Окончательно будем иметь
где матрицы Ai, Ait А3 получаются из А заменой соответствующего столбца на свободные члены.
Заметим, что формулы (7) нами выведены в предположении, что | А | =/= 0.
В качестве примера решим систему 2х— 3y-\-5z — 1, х -|- 2у — 3z — 7, Зх— у — 2z = 5.
Так как определитель
2—3	5
— 3	8-54-27—30—6—6=—28
— 2
отличен от нуля, то формулы (7) применимы. Имеем
1 —3
7	2
5 —1
= — 89,
1	5
7 —3
5 —2
поэтому
85
28’
= — 85,
Чтобы получить формулы, аналогичные формулам (4) и (7), для систем п линейных уравнений с п неизвестными при любом п, надо дать определение определителя квадратной матрицы п-го порядка. Сделать это таким же способом, каким мы ввели определители 2-го и 3-го порядков, затруднительно, так как число слагаемых, из которых составляется определитель, очень быстро растет с увеличением порядка (определитель п-го порядка содержит п! слагаемых, что уже при п = 4 равно 24). Мы вынуждены поэтому избрать иной путь, основанный на использовании некоторых сведений из теории перестановок. Обобщение формул (4) и (7) на общий случай будет дано нами в § 8.
10
I
Упражнения
1.	Вычислить определители:
— sin х cosx а а О а . а О
Отв. а) — 29; b) 1; с) 0; d) 2а3.
2.	Решить систему
Зх + 7^ = —11, |
5х— 2у = 9.	J
Отв. х= 1, =— 2.
3.	Решить систему
x4-2y+3z = —7;
2х+ y + 2z = — 2, Зх4-2>+ г==3. ;
Отв. х = 2, > = 0, z =— 3.
4.	Проверить, что
1 Xi х*
1 х2 Х$
1 Х3 Xg
= (XS — Xi) (x8 — Xi) (x8 — x8).
§ 2. Определение определителя п-го порядка
Квадратная таблица п2 чисел, расположенных в п строчках и п столбцах, будет называться нами матрицей п-го порядка. Чтобы подметить общее правило составления определителей матриц п-го порядка, присмотримся внимательнее к определителям 2-го и 3-го порядков. Отвлекаясь пока от знака, поставим вопрос: чем характеризуются произведения, входящие в состав определителя? Прежде всего мы замечаем, что число сомножителей в каждом произведении равно порядку матрицы. Далее, если мы обратимся к какому-нибудь конкретному произведению, то увидим, что в нем сомножители взяты по одному из каждой строчки и по одному из каждого столбца. Так обстоит дело для определителей 2-го и 3-го порядков, и в этом мы
11
убеждаемся, анализируя определения первого параграфа. Естественно предположить, что мы получим разумное определение определителя матриц n-го порядка, если в его основу положим эту подмеченную закономерность.
Условимся сначала об одном весьма удобном способе обозначения элементов матрицы. Место каждого элемента в матрице вполне определяется указанием номера строчки и номера столбца, в которых находится наш элемент. Чтобы в обозначении элемента отразить его местонахождение в матрице, уславливаются все элементы матрицы обозначать одной буквой, но снабжать ее двумя индексами, из которых один обозначает номер строчки, а второй — номер столбца. Обычно эти индексы пишут справа внизу, причем сначала ставят номер строчки, а рядом — номер столбца. Например, a2S (или читается: а — два-пять) есть элемент матрицы, расположенный во второй строчке и в пятом столбце; элемент aik расположен в i-й строчке и k-м столбце. (Конечно, вместо а можно взять любую другую букву.) Воспользовавшись введенной системой обозначений, матрицу n-го порядка запишем теперь в виде
Оц йц ...
. ал а& ... ain	/1 \
аЛ1 .. Оял
Выясним, сколько можно составить различных произведений из элементов матрицы А, взятых по одному из каждой строчки и по одному из каждого столбца. Заметим, что под различными мы понимаем произведения, составленные разными способами, так что разные в нашем смысле произведения могут случайно оказаться равными по своим значениям. Пусть Р — некоторое такое произведение. Множитель из первой строчки, входящий в Р, имеет вид а]а, где а — номер столбца, т. е.	Множитель из второй строчки
имеет вид ar?, 1 fJ п, и т. д. Наконец, множитель из n-й строчки имеет вид ап„,, 1 w п. Таким образом,
(2)
12
С другой стороны, все сомножители в этом произведении взяты по одному из каждого столбца, а значит, все вторые индексы а, 3,..., ш различны (если бы, например, а=!3, то это означало бы, что и а,,. принадлежат одному столбцу). Но в таком случае они образуют перестановку (ар ... ш) из чисел 1, 2, С произведением Р связывается, таким образом, некоторая вполне определенная перестановка: (ар ... <и). Наоборот, если взять какую-нибудь произвольную перестановку (ар ... <о) из чисел 1, 2,..., п и по ней составить произведение (2)., то это произведение, очевидно, будет иметь множители по одному из каждой строчки и по одному из каждого столбца. Из этих рас-суждений следует, что число интересующих нас произведений, из которых будет строиться определитель матрицы (1), равно числу всех перестановок из чисел 1, 2,..., п, т. е. равно п!.
Дадим теперь следующее предварительное определение.
Определение. Определителем матрицы А п-го порядка называется сумма всех л! произведений элементов этой матрицы, взятых по одному из каждой строчки и по одному из каждого столбца; при этом каждое произведение снабжено знаком плюс или минус по некоторому правилу.
Предполагая, что А есть матрица 4-го порядка, рассмотрим несколько примеров.
1.	Произведения ОцО^Оц и а1га^а^ацам не входят в определитель матрицы А, так как число сомножителей в них не равно порядку матрицы.
2.	Произведение aittyia&au также не входит в определитель, так как два сомножителя, и а.2>, принадлежат одному и тому же (второму) столбцу.
3.	Произведения апа^а^а^ и а^зйцЯза содержат множители по одному из каждой строчки и по одному из каждого столбца — следовательно, они входят в состав определителя.
Чтобы приведенное выше определение сделать полным, надо еще сформулировать правило для знака, с которым берется то или иное произведение.
Рассмотрим опять определители 2-го и 3-го порядков, применив новую систему обозначений элементов
13
с помощью двойных индексов:
вц Gia
Gji Gaa
= GiiGaa — GiaGai>
Gil Gia #13
Gai Gj-> G23 = GiiGaaGga G12G23G31 -f- G13G21G32 —
G31 G32 G33
— GiiGaaGsa — #и#21#зз — G13G22G31.
Во всех произведениях мы выписали сомножители в порядке следования строчек (первые индексы расположены в натуральном порядке). Присмотримся к перестановкам, которые образуют номера столбцов в этих произведениях. В определителе 2-го порядка в первом произведении (которое берется со знаком плюс) номера столбцов образуют натуральное расположение, во втором же произведении (которое берется со знаком минус) они образуют перестановку (21), в которой расположение номеров 1 и 2 противоположно их нату-
ральному расположению.
В определителе 3-го порядка номера столбцов в произведениях, которые берутся со знаком плюс, образуют
перестановки
(1 2 3),
(2 3 1),
(3 1 2),
а в трех остальных произведениях — перестановки
(1 3 2),] (2 1 3), (3 2 1)J
(3)
(4)
В пяти перестановках (3) и (4) (кроме первой) взаимное расположение некоторых пар номеров противоположно их расположению в перестановке (1 2 3). Такое явление называют инверсией (или беспорядком).
Определение. Пусть имеется перестановка (а р ... и>) чисел 1, 2, ..., п. Мы говорим, что два числа, входящих в эту перестановку, образуют инверсию, если большее число из нашей пары предшествует
14
меньшему. Число пар, образующих инверсию, называется числом инверсий перестановки.
В натуральном расположении (1 2 ... п) нет пар, образующих инверсию. С другой стороны, наибольшее возможное число инверсий содержится в перестановке (n п — 1.-.2 1); здесь каждая из С„=пар образует инверсию. В перестановке (3 1 5 2 4) имеются четыре пары, образующие инверсию: 3 и 1, 3 и 2, 5 и 2, 5 и 4.
Легко видеть, что для определения числа инверсий в некоторой перестановке (а (3 ... <о) следует подсчитать, сколько для каждого числа имеется следующих за ним меньших чисел, а затем все найденные значения сложить. Например, число инверсий в перестановке (4 7 1 5 3 6 2) равно
3+54-04-2+14-14-0=12.
Определение. Перестановка называется четной, если она содержит четное число инверсий, и называется нечетной в противном случае.
Натуральное расположение (1 2 ... п) содержит 0 инверсий — следовательно, это четная перестановка. Перестановка (2 6 1 5 3 4) нечетная, так как у нее 7 инверсий.
Возвращаясь к перестановкам (3) и (4), легко замечаем, что три первые перестановки четные, а три остальные — нечетные. Это наблюдение мы и кладем в основу нашего следующего определения.
Правило для знака. Пусть Р — фиксированное произведение, входящее в состав определителя матрицы А п-го порядка. Выпишем сомножители в порядке следования строчек:
Р==	• • • anm.
Тогда номера столбцов дадут перестановку (а {3... ш). Произведение Р берется со знаком плюс, если эта перестановка четная, и со знаком минус, если она нечетная.
Обозначим через s число инверсий в перестановке (а р •••“)• Тогда, объединяя вместе случаи четной и нечетной перестановок, можно сказать, что произведение Р входит в определитель со знаком (— l)s (последнее означает, что знак определяется множителем (— l)s).
15
Пример 1. Произведение аца& ...а„„ элементов, стоящих на главной диагонали (из левого верхнего угла в правый нижний), всегда берется со знаком плюс, так как натуральное расположение (1 2 ...и) является четной перестановкой.
Пример 2. Произведение	. ап_13ап1 эле-
ментов второй диагонали входит в определитель со п(п-У)
знаком (— 1) 2 , так как перестановка (п п — 1... 2 1) п (п— 1)
имеет ——- инверсии.
Пример 3. Рассмотрим произведения и	входящие в состав определителя матрицы
4-го порядка. Чтобы определить знаки, с которыми эти произведения входят в определитель, надо их переписать в виде а^аиа^а^ и ацймаззац- Выписываем теперь перестановки из номеров столбцов: (3 14 2) и (2 4 3 1). В первой перестановке мы имеем три инверсии, во второй — четыре. Следовательно, первое произведение входит в определитель со знакО1М минус, второе —со знаком плюс.
Данное нами определение определителя n-го порядка-основывается на аналогии с определителями 2-го и 3-го порядков. Последние же были введены с целью получить компактные формулы для решений систем линейных уравнений (с двумя и тремя неизвестными). Разумность определения определителя в общем случае будет подтверждена в § 8, где мы получим формулы для значений неизвестных системы п линейных уравнений с п неизвестными, аналогичные формулам (4) и (7) из § 1 (опять-таки при условии, что определитель, составленный из коэффициентов при неизвестных, отличен от нуля).
Для определителя матрицы (1) принято обозначение
4Zh йн ... Й1Л
। .,	я«1	... atn
«л!	^л2 • • • ^лл
Если для обозначения суммы мы воспользуемся знаком 2» то определитель матрицы (1) можно будет 16
записать в виде формулы
M! = S±P= S ±auaj5 ... апт. р	(V 3 ... ш)
В первой сумме Р пробегает все п! произведений элементов матрицы А, взятых по одному из каждой строчки и по одному из каждого столбца. Во второй сумме суммирование ведется по всем п! перестановкам (я 3 ...<о) из чисел 1, 2, ..., п. В обоих случаях знак перед каждым произведением определяется согласно сформулированному выше правилу.
Вычисление определителя матрицы п-го порядка, основанное на одном лишь определении, представляет собой весьма трудоемкий процесс, так как число слагаемых, из которых составляется определитель, очень быстро растет с увеличением п (для определителя 4-го порядка имеем 24 слагаемых, для 5-го порядка — 120 слагаемых и т. д.). В дальнейшем нами будут указаны быстро приводящие к цели методы для вычисления определителей, основанные на свойствах последних. Однако в некоторых простейших случаях можно все же найти значение определителя, пользуясь только определением. Пусть, например, какая-нибудь строчка матрицы (или столбец) состоит сплошь из пулей. Так как в любое произведение, входящее в состав определителя, входит сомножитель из каждой строчки, в том числе и из строчки, состоящей из нулей, то все эти произведения будут равны нулю, а значит, их сумма также равна нулю. Таким образом, если все элементы какой-нибудь строчки (или столбца) матрицы п-го порядка равны нулю, то ее определитель равен нулю.
Отметим еще один важный частный случай. Пусть в матрице А (см. (1)) все элементы, расположенные выше главной диагонали, равны нулю, т. е. пусть ай = 0, если только a>t. В этом случае те произведения (входящие в состав определителя | А |), которые содержат в качестве сомножителей хоть один элемент, расположенный выше главной диагонали, будут равны нулю. Выкинем все эти заведомо равные нулю произведения, содержащие множители а,а с aj>t. Оставшиеся произведения будут иметь вид
где
aj 1	a2^2, ...» ал<Гп.
Но из этих неравенств последовательно получаем 04 = !, a2 = 2, ...» an = n.
(Напомним, что натуральные числа ab a2, ...» ая попарно различны.) Таким образом, только одно произведение, а именно ацйп ... апп, не содержит элементов, лежащих выше главной диагонали. Так как это произведение входит в состав определителя со знаком плюс, то окончательно получаем
#11	0	0	... 0
Ща.	#22	0	... 0
#31	#32	#33	... 0
Яп1	• • • &ПП
--#ц#22 • . • CLnn,
Аналогичная формула может быть получена и для случая, когда равны нулю все элементы, расположенные ниже главной диагонали. Итак, если все элементы матрицы n-го порядка, расположенные выше (или ниже) главной диагонали, равны нулю, то определитель такой матрицы равен произведению элементов, лежащих на главной диагонали.
Квадратные матрицы, у которых все элементы выше или ниже главной диагонали равны нулю, иногда называются треугольными матрицами.
Замечание. Говоря об определителе матрицы, мы до сих пор предполагали, что порядок матрицы ^2. Ясно, что вполне допустимо рассматривать таблицу, состоящую лишь из одного числа, т. е. квадратную матрицу 1-го порядка. Применив определение определителя к этому случаю, мы легко увидим, что если А = || а ||, то |А| = а, т. е. определитель матрицы 1-го порядка равен (единственному) элементу этой матрицы.
Упражнения
1. Какие из произведений
1) Яз1#4з#1402з, 2) 014021033042, 3) 08304а081014
18
входят в состав определителя матрицы 4-го порядка и с каким знаком?
Отв. 1) не входит; 2) входит со знаком плюс; 3) входит со знаком минус.
2. Пользуясь определением, вычислить определители:
1)	0 0 0 1	2)	2 10 3	3)	10 0 2
	0 0 2 2		— 12 0 4		3 0 0 4
	0 3 3 3		— 2 3 0 5		0 5 6 0
	4 4 4 4		— 3 4 0 6		0 7 8 0
Отв. 1) 24; 2) 0; 3) 4.
3. Показать, что произведение элементов второй диагонали матрицы л-го порядка входит в ее определитель со знаком плюс при п = 4£ и л = 4/г~(-1 и со знаком минус при п = 4£-|-2 и п = 4Л + 3.
§ 3. Транспозиции
В формулировке правила для знака, с которым то или иное произведение входит в состав определителя n-го порядка, существенную роль играет понятие перестановки. Естественно поэтому, что при доказательстве свойств определителей нам придется использовать некоторые сведения из теории перестановок. Изложению этих сведений мы и посвятим настоящий параграф.
Напомним, что перестановкой из и предметов (не обязательно чисел) называется расположение этих предметов в некотором определенном порядке. Если мы переставляемые предметы занумеруем натуральными числами 1, 2, ..., п (т. е. к каждому предмету привяжем номер), то произвольная перестановка предметов будет однозначно определяться перестановкой их номеров. (Например, для перестановки (Х3Х1Х4Х2) предметов Хъ Хо, Х3, Х4 соответствующей перестановкой номеров будет (3 1 4 2).) В силу этого мы можем ограничиться рассмотрением перестановок чисел 1, 2, ..., п.
Пусть дана произвольная перестановка (а р ...w) чисел 1, 2, ..., п. Если мы в этой перестановке поменяем местами два числа, то в результате получим новую перестановку тех же чисел. Например, после перемены местами чисел 4 и 5 в перестановке (2 5 3 4 1) мы получим перестановку (2 4 3 5 1).
Определение. Операция перехода от одной перестановки к другой, при которой два числа меняются
19
местами, а остальные остаются на своих местах, называется транспозицией.
Записывать транспозиции мы будем так:
(2 6 1 5 4 3)->(5 6 1 2 4 3).
(Здесь 2 и 5 поменялись местами.)
Теорема 1. От произвольной перестановки можно перейти к любой другой при помощи нескольких последовательно выполненных транспозиций.
Утверждение этой теоремы довольно очевидно. Например, переход от (5 1 7 4 2 3 6) к перестановке (3 4 1 5 7 6 2) достигается следующими транспозициями:
(5 1 7 4 2 3 6)->(3 1 7 4 2 5 6)->(3 4 7 1 2 5 6)-> ->(3 4 1 7 2 5 6)->(3 4 1 5 2 7 6)->(3 4 1 5 72 6)^
->(3 4 1 5 7 6 2).
Доказательство. Доказательство теоремы проведем индукцией по числу п чисел, входящих в рассматриваемые перестановки. При п — 2 имеется только две перестановки (12) и (2 1), и от любой из них мы переходим ко второй при одной транспозиции. Таким образом, при п — 2 теорема справедлива.
Пусть теперь пЭ^З, и пусть теорема уже доказана для перестановок п — 1 чисел. Рассмотрим две произвольные перестановки п чисел:
(« ₽ 7 •••“).	(1)
(’•' р' f ... а)')-	(2)
Предположим сначала, что а = а'. В этом случае (р у ... ®) и (р' у'...«') будут являться перестановками одних и тех же п — 1 чисел. Следовательно, по индукционному предположению от первой из них можно перейти ко второй при помощи нескольких последовательно выполненных транспозиций. Если эти же транспозиции (и в том же порядке) выполнить в перестановке (1), то получим, очевидно, перестановку (а Р' f ... а/), т. е. перестановку (2) (поскольку а = а'). Таким образом, в случае а = а' теорема доказана.
Пусть теперь а^а'. Исходная перестановка (1) имеет в этом случае вид
(а р 7 .../ ...ш)	(1а)
20


(а' совпадает с одним из чисел 3, 7,	, <в). Поменяем
в (1а) числа а и а' местами (т. е. сделаем одну транспозицию). Получим перестановку
I	(а' р 7 ... а ... а>).	(3)
Сравнивая (3) и (2), видим, что у этих перестановок I числа, стоящие на первом месте, совпадают. Следовательно, по только что доказанному при помощи нескольких транспозиций мы можем перейти от перестановки (3) к перестановке (2). Таким образом, и в этом случае перестановка (1) может быть переведена при помощи транспозиций в перестановку (2). Теорема 1 доказана.
Теорема 2. При, выполнении одной транспозиции перестановка переходит в перестановку противоположного наименования, т. е. четная перестановка переходит в нечетную, а нечетная — в четную.
Доказательство. Пусть мы имеем перестановку
(a р ... X ... р ... ш)	(I)
из п чисел 1, 2....п. Поменяв здесь местами X и
[1, мы получим перестановку
(а р ... р 7i 7s ... 7m X ... ш).	(И)
Нам надо показать, что перестановки (I) и (II) имеют противоположные наименования, т. е. если (I) — четная перестановка, то (II) — нечетная, и наоборот.
Можно, очевидно, предполагать, что X р, так как если это не так, то мы вправе перестановки (I) и (II) поменять местами.
Всего мы имеем —	пар из п чисел 1,
2,	.... п. Разобьем все эти пары на четыре группы.
1.	Группа, состоящая только из одной пары: X и р.
2.	Пары, образованные числом X со всеми промежуточными числами 7Ъ 7s, ..., 7m. Число пар в этой группе равно т.
3.	Пары, образованные числом р со всеми промежуточными числами 7i, 7s,..., 7m.
4.	Все прочие пары.
В каждой из перечисленных групп обозначим соответственно через si, s>, s3, s4 число тех пар, которые образуют инверсию в перестановке (I). Тогда общее
21
число инверсий в перестановке (I) будет S = Sj	S3 -f- Si.
Аналогично, если через 6, /2, t3, ti обозначить число пар в каждой из групп, образующих инверсию в пе-рестановке (II), то число всех инверсий в перестановке (II) будет
t — ti ~Ь Ч- I* 4“
Для доказательства теоремы 2 мы должны установить, что числа з и / имеют противоположную друг’ другу четность, т. е. что разность з — t есть число нечетное.
Так как по нашему предположению Х<^р., то единственная пара из первой группы будет образовывать инверсию в перестановке (II) и не будет ее образовывать в перестановке (I). Другими словами,
S1 = 0, Л = 1.	(4)
Обозначим через р число тех из промежуточных чисел 7->, ..., тт, которые меньше К. Ясно, что эти р чисел вместе с X дадут нам все те пары из второй группы, которые образуют инверсию в перестановке (I). Все прочие промежуточные числа (их число равно т — р) будут больше X, поэтому во второй группе мы будем иметь ровно т — р пар, образующих инверсию в перестановке (II). Этим доказано, что
Si = p, ti — m — p.	(5)
Аналогично, обозначив через q число промежуточных чисел 71, 72, ..., 7т, меньших р., мы установим, что
s3 — m — q, t3 = q.	(6)
Обратимся теперь к парам последней группы. Пусть р и <з — произвольная пара из четвертой группы. Если р и а отличны от X и р., то числа р и о в перестановках (I) и (II) стоят на одинаковых местах, и поэтому они одновременно либо образуют инверсию в обеих перестановках, либо нет. Рассмотрим далее случай, когда одно, и только одно, из чисел нашей пары совпадает с X или р. Пусть, например, р = Х. Тогда с от-22
лично от и, 71, 72, •••, 1т (в противном случае мы имели бы пару из первой или второй группы). Если а в перестановке (I) расположено слева от X, то в перестановке (II) оно также будет слева от X. Если же в (I) число <з находится справа от X, то (поскольку в отлично от промежуточных чисел 71, ..., 7^ и от р.) оно будет находиться справа от X и в (II). Рассмотрев аналогичным образом случай р = у., мы убедимся в том, что взаимное расположение всех пар из четвертой группы в перестановках (1) и (II) одинаково. Следовательно, каждая пара из этой группы, образующая инверсию в (I), будет образовывать ее и в (II), и наоборот, а значит,
Si = ti.	(7)
В силу (4) — (7) мы имеем теперь
S — t = $1 4~ $2 “h S3 4" s4 — Л — ii — ^3 — ii =
= р-\-т — q — 1— т-\-р — q = 2(p — q) — 1.
Таким образом, разность s—t есть число нечетное. Но в таком случае s и t — числа разной четности, а значит, перестановки (I) и (II) имеют противоположные наименования. Теорема 2 доказана.
Замечание. Может случиться, что переставляемые числа X и [1 стоят рядом (т. е. /п = 0). В этом случае вторая и третья группы пар отсутствуют (в частности, р = 0, q = 0) и доказательство несколько упрощается .
Следствие. При четном числе транспозиций перестановка переходит в перестановку того же наименования, а при нечетном — в перестановку противоположного наименования.
Действительно, по теореме 2 при одной транспозиции наименование перестановки меняется. После выполнения второй транспозиции в полученной перестановке наименование опять изменится, — значит, после двух транспозиций мы получим перестановку с исходным наименованием. После трех транспозиций мы получим перестановку противоположного наименования по сравнению с исходной и т. д.
23

Теорема 3. Число всех четных перестановок ьи п чисел равно числу всех нечетных перестановок и равно следовательно, (п^2).
Доказательство. Обозначим через а числе всех четных и через b число всех нечетных нереста-новок из п чисел. Так как всего мы имеем и! перестановок из п чисел, то а-}-Ь = п1> Нам надо доказать, что а = Ь.
Выпишем отдельно в виде таблицы все четные пе-? рестановки (таблица содержит, следовательно, а перестановок). Поменяем затем в каждой из выписанных четных перестановок первые два числа местами (перестановка (4 1 5 3 2) перейдет, например, в перестановку (1 4 5 3 2)). Мы получим в результате вторую таблицу, состоящую опять-таки из а перестановок. Все перестановки новой таблицы, очевидно, попарно различны, так как если бы в ней нашлись две одинаковые перестановки, то после вторичной перемены местами первых двух чисел в этих перестановках мы пришли бы к двум совпадающим перестановкам в первой таблице, чего не может быть (ведь все а перестановок первой таблицы различны). Далее, по теореме 2 все а перестановок второй таблицы будут нечетными. Число всех нечетных перестановок из п чисел мы обозначили через Ь. Но поскольку у нас нет уверенности, что во второй таблице (содержащей а различных нечетных перестановок) будут присутствовать все нечетные перестановки, то мы можем написать пока только неравенство
а^Ь.
Аналогичным образом, поменяв местами роли четных и нечетных перестановок, мы докажем, что
b а.
Из полученных неравенств следует теперь, что а — Ь, и теорема 3 доказана.
Замечание. Теорема 3 показывает, что в определителе произвольного порядка число слагаемых, которые берутся со знаком плюс, равно числу слагаемых, которые берутся со знаком минус.
24
Упражнений
1 Перейти от перестановки (7 5391628 4) к натуральному расположению при помощи транспозиций.
Отв. Минимальное число требуемых транспозиций равно 4.
2.	Чему равны числа So, Sg, s$, t%t £g, (см. доказательство теоремы 2) в случае транспозиции
(7 5 3 9 1 6 2 8 4) — (7 5 8 9 1 6 2 3 4)?
3.	Пусть перестановка («1 а2 ... ал) из чисел 1, 2, п имеет $ инверсий. Сколько имеется инверсий в перестановке
4.	Пусть Р—произвольное произведение, входящее в состав определителя матрицы А n-го порядка (см. (1) из § 2). Запишем это произведение в порядке следования номеров строчек:
••• йлал>
и в порядке следования номеров столбцов:
р==Ч'вм - %«•
Доказать, что перестановки (04 а2 ... ал) и (^ |32 ... рл) имеют одно и то же число инверсий.
5.	Пусть
есть произведение, входящее в определитель матрицы А п-го порядка, в котором сомножители записаны в произвольном порядке. Обозначим через s и t число инверсий в перестановках («1 «2 ап) и (31 'Зл) соответственно. Доказать, что произведение входит в определитель | А | со знаком (—
§ 4. Свойства определителей
В § 2 уже отмечалось, что вычисление определителей произвольного порядка значительно облегчается, если пользоваться их свойствами. В настоящем параграфе будут сформулированы и доказаны основные свойства определителей.
Наряду с матрицей
^11 ^12 • • •
л _ ^21 ^22 • • • dln I
|] Ufii &пп {
25
рассмотрим матрицу
Ои a-ц ... anl I
Л' =	#22 • • • &п1 !
*••••• •
О1я а^п • • • апп
которая получается из А заменой строчек на столбцы. Строчки матрицы А' являются, стало быть, столбцами для А. Можно также сказать, что Л' получается из А переворачиванием вокруг главной диагонали. Переход от матрицы А к матрице Л' называется транспонированием, а сама матрица А' называется транспонированной с А.
Непосредственной проверкой легко установить, что при п = 2 и п — 3 определитель транспонированной матрицы равен определителю исходной матрицы. Оказывается, что это свойство сохраняется и для любого п.
Свойство 1. При транспонировании определитель матрицы не меняется. Другими словами, определитель транспонированной матрицы равен определителю исходной.
Доказательство. Возьмем произвольное произведение
Р — а^ . апап,
входящее в состав определителя | Л | (вторые индексы аь а2, ..., ая различны). Все сомножители в этом произведении являются также и элементами матрицы Л', взятыми по одному из каждой строчки и по одному из каждого столбца, а значит, произведение Р входит и в состав определителя |Л'|. Аналогичным образом убеждаемся, что всякое произведение, входящее в | Л'|, входит и в | Л |. Таким образом, определители |Л| и | А' | составляются из одних и тех же произведений. Для доказательства свойства 1 остается теперь проверить, что каждое произведение Р входит в наши определители | Л | и | Л' | с одним и тем же знаком.
Если через з мы обозначим число инверсий в перестановке («1 а2 ... ая), то, согласно правилу для знака, произведение Р будет входить в | Л | со знаком (— l)s.
Займемся теперь определением знака, с которым Р входит в определитель |Л'|. Раньше, в частности при
26 ,
формулировке правила для знака, элементы матрицы мы обозначали двумя индексами, из которых первый указывал на номер строчки, а второй — на номер столбца. В матрице А' в результате операции транспонирования обозначения оказались другими: здесь первый индекс обозначает номер столбца, а второй — номер строчки. Чтобы в А' систему обозначений сделать прежней, введем для ее элементов новые обозначения, полагая Ьч—ап. Тогда матрица А' примет вид
i’ll &12 ... Ь\п
Д'___ bit Оц bin
bn\ bni ... bnn
Теперь у каждого элемента первый индекс обозначает номер строчки, а второй — номер столбца.
Произведение Р в новых обозначениях имеет вид
Р — Ьа^Ьа^ ... Ьп^П.	(1)
Перепишем это произведение в порядке следования строчек матрицы Д', т. е. так, чтобы первые индексы расположились в натуральном порядке:
Р — b^b®* • • • bn$n.	(2)
Если через t мы обозначим число инверсий, в перестановке (^i	... ₽„) номеров столбцов, то, согласно пра-
вилу для знака, произведение Р будет входить в определитель |Д'| матрицы Д' со знаком (—1/.
Мы должны показать, что (—l)s — (—1/. Для этого достаточно, очевидно, установить, что числа s и t имеют одинаковую четность.
В силу теоремы 1 из § 3 от произведения (1) мы можем перейти к произведению (2) при помощи транс-позициий (под транспозицией понимается здесь перемена местами двух сомножителей). Пусть для этого понадобилось г транспозиций. При транспозиции сомножителей одновременно претерпевают транспозицию прикрепленные к ним первые и вторые индексы. При этом в результате выполнения наших г транспозиций перестановка (aj а2 ... а„) первых индексов переходит в натуральное расположение, а натуральное расположение вторых индексов переходит в перестановку
27
(?i	••• Ря). Запишем последние два факта в виде
(ai аг ... ал)-> ... ->(1 2 ... п),
(1 2 ...	р,...р„).
г транспозиций
Предположим, что число s четное. Тогда переста новки (а, а8 ... ая) и (1 2 ... п) имеют одно и то ж< наименование (обе четные), а значит, по следствию теоремы 2 из § 3 число транспозиций г должно быть четным (при нечетном г наименование изменилось бы). Но при четном г перестановка (^	• • • ря) также чет-
ная, так как ее наименование должно совпадать с наименованием натурального расположения. Этим доказано, что при четном s число t также четное.
Аналогичным образом устанавливаем, что при нечетном з число t также нечетное (в этом случае число транспозиций г будет нечетным).
Таким образом, числа s и t всегда имеют одинаков вую четность, и, следовательно, (—l)s —(—1/.	I
Итак, определители | А | и | А' | составлены из одних и тех же п! произведений, при этом произвольно взятое произведение Р входит в оба определителя с одним и тем же знаком. Следовательно,
|А|= 2 (-l)4«1alei...aWe=S(-irP = =^(-iyp= 2 (-1)%д?а...ч = 1л'1-
Р	(IMs...P„)
Свойство 1 доказано.
Замечания. 1) При доказательстве свойства 1 нами установлено, что числа s и t имеют одинаковую' четность. Можно было бы показать (см. упражнение 4 из § 3), что в действительности s — t.
2) Доказательство свойства 1 было бы намного проще, если бы мы воспользовались утверждением упражнения 5 из § 3.
Доказанное свойство 1 означает, что с точки зрения теории определителей строчки и столбцы матрицы занимают равноправное положение. Если поэтому нам будет известно некоторое свойство определителей, относящееся к строчкам, то можно будет сказать, что 28


такое же свойство имеет место и по отношению к столб цам.	Л	.
Свойство 2. Если в квадратной матрице поменять местами две строчки (или два столбца), оставив остальные на своих местах, то определитель полученной матрицы будет равен определителю исходной с противоположным знаком. Короче: при перемене местами двух строчек (или столбцов) определитель меняет знак.
Доказательство. Согласно свойству 1 достаточно ограничиться рассмотрением случая, когда переставляются строчки.
Предположим, что в матрице
			
	ац		• • ^in
			• • ajn
	ам	ал3 .	• • апп
п-го порядка меняются местами i-я и /-я строчки. В результате этой транспозиции строчек мы получаем
матрицу
ан ав-... ain
я ji	Я у‘2 •	• • &jn
	 *	' • ^in |
ащ	аЯ2  	• • &пп
i-я строчка
/-я строчка
Нам надо доказать, что |В| =— | А |.
Возьмем произвольное произведение
Р — а^а.#^ ... aia. ... ajo^ ...	(3)
входящее в состав определителя | А |. Все сомножители в этом произведении являются также и элементами матрицы В, причем и в матрице В они принадлежат разным строчкам и разным столбцам. Но это значит, что Р входит и в состав определителя [ В |. Ясно, что
2»
всякое произведение, входящее в | В |, будет входип также и в | А I. Следовательно, состав всех п! произведений для обоих определителей один и тот же. Для доказательства свойства 2 нам достаточно теперь установить, что произведение Р входит в определители | А | и | В | с противоположными знаками.	'
В произведении (3) сомножители расположены в порядке следования строчек матрицы А. Если поэтому через s мы обозначим число инверсий в перестановке
(а1 а3 ... а,- ... ау ... а„)	(4)
номеров столбцов, то знак произведения Р, с которым оно входит в |Д|, будет равен (— l)s.	!
Для определения знака, с которым Р входит в | В |, введем для элементов матрицы В новые обозначения,' полагая
O/a ===
В этих обозначениях матрица В принимает вид
в=	bn bn bji	bn bn bp	• • • bjn ... bin • • • b jn	z-я строчка /-я строчка
	Ьщ		• • • bnn	
(индексы соответствуют теперь номерам строчек и столбцов). Перепишем произведение (3), используя введенные обозначения:
Р --
Чтобы применить правило для ‘определения знака, мы должны сомножители здесь расположить в порядке следования строчек матрицы В. Для этого нам надо лишь поменять местами множители Ьп. и bja. (все остальные занимают требуемые места):
Р =	• • • bfaj • • •
30
Если через t мы обозначим число инверсий в перестановке
(«1 а8 ... а, ... а, ... ал),	(5)
то знак, с которым Р входит в |В|, будет равен (—1)'.
Перестановка (5) получается из (4) одной транспозицией (а,- и а; поменялись местами). Следовательно, по теореме 2 из § 3 эти перестановки имеют противоположные наименования (числа s и t — разной четности), а значит,
(-!)' = -(-1)\
Мы показали, таким образом, что всякое произведение Р, входящее в | А | со знаком (— l)s, входит также и в |В|, но с противоположным знаком —(—1/. Следовательно,
|B|“S(- i)'p=S-(-I)s^==
= -Ш-1И=~И1
\ р	/
(Р пробегает все п! произведений). Свойство 2 доказано.
Свойство 3. Если квадратная матрица имеет две одинаковые строчки (или два одинаковых столбца), то ее определитель равен нулю.
Доказательство. В силу свойства 1 опять достаточно ограничиться рассмотрением случая равных строчек. Пусть t-я и /-я строчки матрицы А одинаковы, т. е.
Л/1=Я/1, 0/2 —— Оу2, ••• , ^in — CLjn*
Поменяв в матрице А эти строчки местами, мы получим матрицу В, которая ничем не будет отличаться от матрицы А. Определители одинаковых матриц, очевидно, равны, поэтому | В | = | А |. С другой стороны, по свойству 2 имеем | В j — —IА |. Таким образом, |Л| =—|Л|, откуда 2|Л|==0, а значит, |Л| = 0.
| Свойство 3 доказано.
Чтобы сформулировать следующее свойство определителей, нам необходимо предварительно ввести два новых понятия и доказать относящиеся к ним некоторые вспомогательные утверждения.
31
Определение. Пусть дана матрица А п-го порядка. Вычеркнем в ней i-ю строчку и k-й столбец и сдвинем, не нарушая порядка, оставшиеся элементы. Определитель полученной матрицы (п — 1)-го порядка называется минором элемента i-й строчки и k-го столбца матрицы А и обозначается нами через &ik.
Например, если
	ch	b,	Cl	di	
л =	a2	bi	Ci	di	(6)
		b3	C3	d3	
		h	Ci	di	
то минорами элементов второй строчки третьего столбца и четвертой строчки четвертого столбца будут соответственно определители
	fli bi di		ai bi Ci
Д23==:	a3 bs d3	,	&ii =	a2 b2 Ci
	a.i bi di		#з b% c3
Так как определитель всякой матрицы есть число, то миноры элементов матрицы также являются числами. Для матрицы n-го порядка имеем, очевидно, па различным образом составленных миноров (для каждого элемента свой минор).
Лемма 1. Если все элементы первой строчки матрицы А, кроме ан, равны нулю, то ее определитель равен произведению элемента ап на его минор:
	an 0	0 ... 0		
	#21 ац П-23	. . . Пол		
M| =	#31 а#> Изз ... а,\п	—	
	cirf! cini an% ... апп		
			#22	#23 • • • #2п
= #цАц = #и •			#32	#33 • • • #3д
			#п2 #лЗ • • • #лп
Доказательство. Определитель | A j состоит j из п\ слагаемых. Однако многие из них равны нулю. 32	i


Это будут те произведения, которые содержат нулевой множитель из первой строчки. Выбросим все эти нулевые слагаемые. Тогда можно будет сказать, что определитель | А | составлен из произведений вида
Р ===	(7)
где индексы 0, 7, ... , ш образуют, очевидно, перестановку чисел 2, 3, ..., п. Определитель | А | мы можем, следовательно, записать в виде суммы
М1= S ±апа^ ...
(₽т ...<»)
в которой суммирование ведется по всем (п — 1)! перестановкам (0 7 ... <о) из чисел 2, 3..п (перед каж-
дым произведением знак, разумеется, поставлен в соответствии с правилом для знака). Все слагаемые этой суммы содержат общий множитель ац. После вынесения его за скобку мы получим
1 I — ( У1 ——	.	(8)
\(₽7 •••<“)	/
Докажем, что выражение, стоящее в скобках правой части равенства (8), равно определителю | А* | матрицы (п—1)-го порядка
	«22	«23	... ain
Д* =	«32	«33	. . . «зя
		«пЗ	• • • «ля
которая получается из А удалением первой строчки и первого столбца.
Прежде всего замечаем, что слагаемыми рассматриваемой суммы являются все (п — 1)! произведений элементов матрицы А*, взятых по одному из каждой строчки и по одному из каждого столбца и снабженных некоторым знаком. Для доказательства нашего утверждения надо, следовательно, лишь убедиться, что перед каждым произведением стоит именно тот знак, какой требуется согласно правилу для знака. Другими словами, надо убедиться, что произведение (7) и произведение
Р* =	• • • ^Па>
2 3, И. Боревич
33
входят соответственно в определители | А | и | А* | с одним и тем же знаком.
Чтобы для элементов матрицы А* индексы соответствовали номерам строчек и столбцов, мы должны все индексы уменьшить на единицу. После такого изменения обозначений вторые индексы в произведении Р* будут образовывать перестановку (р — 1, -(— 1, ..., <о — 1). Число инверсий в ней, очевидно, такое же, как и в перестановке (₽ f ... <о) чисел 2, 3, ..., п. Обозначим это общее число инверсий через s. Тогда знак, с которым Р* входит в | А* будет равен (—1)\ С другой стороны, число инверсий в перестановке (1 р у ... <о) также равно s, так как стоящая на первом месте единица не образует инверсий с последующими числами. Следовательно, произведение (7) входит в |Л| с тем же знаком (—1)\
Таким образом, доказано, что Р и Р* входят в | А | и | А* | с одинаковыми знаками, а значит, равенство (8) можно переписать в виде | А | =ац | А* |. Но определитель | А* | равен минору Ди, поэтому |Л| = ацДц, и лемма 1 доказана.
Замечание. Лемма 1 справедлива также и для случая, когда нулевые элементы расположены в первом столбце (достаточно применить свойство 1).
Рассмотрим теперь матрицу
	Ли	• • ai,ki
		
л =	0	.. 0
		• •	k~i
alk a!.fr+1	••• Я1л
k	ai-A,k±b •	• •	-1, Л
aik	0	.. 0
	#z-d,Z?+l •	
сП1 ... ап unk ап< j+i ... ап„
у которой равны нулю элементы произвольно взятой 1-й строчки (кроме одного элемента aik), и попытаемся распространить утверждение леммы 1 на этот более общий случай. Совершая перестановки строчек и столбцов, преобразуем нашу матрицу так, чтобы к ней можно было применить лемму 1. Будем передвигать t-ю строчку вверх, переставляя ее последовательно с соседними строчками (чтобы не нарушить взаимного расположе-
34
ния других строчек). Так i __ 1 перестановок строчек, определитель мЛяет знак к определителям, получим
как нам придется сделать а при каждой перестановке (свойство
2), то, переходя
О
Оц
О
01, Л-1
oik
Olk
О	... О
01,л+1	••• «1л
\А | = (- 1)'
Я/-1.1 ••• О(-1,Л-1	O/-l,fe+l ••• Oi-l,n
0/+1,1 •••	Oi+ltk 0/^.1,йц.1 ... О/цД’Я
оЛ1 ... ол&_1 ank &n,k+i ••• опп
с нулями находится теперь наверху. Чтобы alk оказался в левом верхнем углу, надо k-м. поставить на место первого. Переставляя его
Строчка элемент столбец k — 1 раз с соседними слева столбцами, мы придем, в силу свойства 2 для столбцов, к равенству
1Д|=(-1)«-» (-1)*-*
«/л	0	...0	0	...0
aik	«И	aiyk-l	... din
		••	ai-iyk+i	... Д/~1>Л
ai+l,k	ai+l,l •	•• ai+iyk-i ai+itk+l	...
ank	ani	•• arhk-l atiik+i	••• ann
К матрице, стоящей под знаком определителя в правой части полученного равенства, можно применить теперь лемму 1. Замечая, что числа i-\-k — 2 и i-\-k имеют одинаковую четность, мы последнее равенство, согласно лемме 1, можем переписать так:
|Л|==а«(-1)‘+*
или
011	• •• 01,/f-l	01, M	•• • 01Я
o,-_i.i	• ••	ai-i, fe+l	... O/_l,n
O/+i,i	• •• 0/4-1, Л-1	Я/4-1, /?4-l	• • • Oi+if л
anl	• • • &n, fe-1	Л4Л	••• ann
| Л |==a/fe(—1)‘+* Д/й, где Д,*— минор элемента а«.
(9)
2'
35
Полученный результат приводит нас к выводу о целесообразности следующего определения.
Определение. Пусть А — матрица n-го порядка. Минор kik элемента i-й строчки и k-го столбца матрицы А, взятый со знаком (— 1)'4*, называется алгебраическим дополнением этого элемента.
Если алгебраическое дополнение элемента аг* обозначено через Aik, то, согласно определению, имеем
Л« = (-1)г+йД«.	(10)
Например, для элементов с2 и матрицы (6) алгебраические дополнения соответственно равны
		bi	di
Л23=(-1)2+3Ди = -	«3	&3	di
		bi	di
		bi	Ci
Л44 = (-1)1+‘Ди =	а2	bi	Ci .
		Ьъ	Ci
Для элементов, расположенных на главной диагонали, алгебраическое дополнение совпадает с минором: Ац — = (—1)а/Дн = Дп. Миноры двух соседних элементов строчки (или столбца) всегда приобретают противоположные знаки, так как при изменении i или k на одну единицу четность числа i-\-k меняется. Распределение знаков у миноров (для получения алгебраических дополнений) можно изобразить следующим образом:
Приняв введенное определение алгебраического допол-36
нения, мы получаем, в силу равенства (9), следующую лемму.
Лемма 2. Если все элементы i-й строчки матрицы А, кроме элемента aik, равны нулю, то ее определитель равен произведению элемента ац, на его алгебраическое дополнение Aik".
14 |=ам4«.
В дальнейшем мы часто будем пользоваться следующим почти очевидным фактом.
Лемма 3. Если в матрицах А и В п-го порядка все строчки, за исключением i-й, одинаковы, то алгебраические дополнения соответствующих элементов i-й строчки этих матриц равны между собой.
Действительно, вычеркивая в матрицах А и В i-ю строчку и k-н столбец, мы получим одинаковые матрицы п — 1-го порядка. Следовательно, для элементов i-й строчки и £-го столбца матриц А и В миноры равны. Так как оба минора снабжаются одним и тем же знаком (—то алгебраические дополнения также получаются равными.
Очевидно, что леммы 2 и 3 справедливы также и по отношению к столбцам.
Сохраняя для матрицы А n-го порядка обозначение, введенное в начале параграфа, переходим к формулировке следующего свойства определителей.
Свойство 4. Определитель матрицы А п-го порядка равен сумме произведений всех элементов какой-нибудь одной фиксированной строчки на их алгебраические дополнения, т. е. для любого 1=1, 2, ...» п имеет место равенство
|4 \—aiiAii-{-aiiAit-]-...-\-ainAin, (И)
называемое разложением определителя | А | по элементам i-й строчки.
Аналогично для любого k=l, 2, ..., п имеет место разложение определителя | А | по элементам k-го столбца'.
| Д |=ОцАц	ЯзаД а* + • • • 4" ankA nk.
(12)
Доказательство. Наряду с матрицей А рассмотрим матрицу
	ан	#12	• • • #1Л	
	#М,1	#/-1.2	• • • #/-1, п	
в=	Х1	*2	• • * %п	(13)
	#/+1,1	#14-1,2	••• #14-1, Л	
	аЛ1	#/z2	• • • #лп	
получающуюся из А заменой элементов ее i-й строчки значениями хь х2, ..., хп, которые будем считать переменными. Согласно лемме 3 алгебраические дополнения Ац, А ......А 1п элементов i-й строчки матрицы А
будут также алгебраическими дополнениями соответствующих элементов i-й строчки матрицы В при любых значениях Xi, х2, ..., хя.
Каждое слагаемое, входящее в определитель |В|, содержит один, и только один, сомножитель из i-й строчки, т. е. содержит одну, и только одну, из переменных Xi, х2, ..., хп. Обозначим через Si сумму тех слагаемых из | В |, которые содержат Xi, через S2— сумму тех слагаемых, которые содержат х2, и т. д., наконец, через S„ — сумму тех слагаемых, которые содержат хп. Ясно, что тогда
I в |=Si s2 • • •+sn-
Так как все слагаемые суммы Sk содержат множитель xft, то
Sk — хкТ k,
где Тк — некоторое число, не зависящее от переменных Xi, х2, ..., хя. Имеем, следовательно,
|В|=х1Т14-...4-ХйТй4-...4-хлТя.	(14)
Выберем теперь для наших переменных следующие значения:
Xj —• 0, . •., х^_1 —— 0, хк 1)	0, • • •, хя —— 0, (16)
39
При этих значениях правая часть равенства (14) будет равна Тк. Левая же часть обратится в определитель
ап	Gilt	... ain
a^i,i ...		* • •
0	1	... 0
•••	&i+l,k	•••
ПЛ1	&nk	• • • &nn
Так как здесь все элементы t-й строчки, кроме одного, равны нулю, то, по лемме 2, последний определитель равен 1 • Aik = Aik- Таким образом, при значениях (15) равенство (14) принимает вид
Aik = Tk (6=1,2.....п).
Подставляя найденные значения для Tt, Т\, Тп в (14), получаем тождество
| В | = Xi А п	х^А в 4~...+хпА in,	(16)
справедливое при любых значениях переменных хь Xi, ...» хп. Положим теперь в равенстве (16)
xi=ati, Xi=ait, xn=ain.
Так как при этих значениях переменных матрица В превращается в Л, то получаем разложение (11).
Что касается разложения (12), то оно может быть доказано точно таким же образом (надо будет использовать леммы 2 и 3 для столбцов). Можно также для доказательства (12) применить свойство 1.
Доказанное свойство 4 позволяет вычисление определителя п-го порядка свести к вычислению п определителей (п—1)-го порядка.
Пример 1. Вычислить определитель 2—11	1
а Ь с d
Д= 1	12—1’
—1112
разложив его по элементам второй строчки.
39
Получим
Д =® Л Л 21 —ЬА 22 -1~ СЛ 28 “I- ^Л 24 ==
=---0Л21 ~^^22 — СД28 ”1“ d^n
= 9a4-12d — 9c 4-3d.
Пример 2. Вычислить определитель
—х 10—1
—1 —х 0	1
1 —1 0 —х
1	2 3	4
В данном случае для разложения целесообразно выбрать третий столбец, так как наличие нулевых элементов дает возможность не вычислять соответствующих алгебраических дополнений (произведение нуля на любое число равно нулю). Получим
Д	0 • Л is	0 • Л23	0 • Л зз	3 • Л 43 = — ЗДзз^=
1 —1
—X
—1
1
= —3
—х	1 =3х* + 9х.
—1 —х
Пример 3. Вычислить определитель п-го порядка
д =	а	— b	0	...	0	0 0	а	— Ь	...	0	0 0	0	а	...	0	0 0	0	0	...	а	— Ъ —Ь	0	0	...	0	а	(17)
40
Разложив наш определитель по элементам первого столбца, получим
Д==д	a	—b	...	0	0 0	a	...	0	0 0	0	...	a	—b 0	0	...	0	a -Н-*)(-1Г*		Л-1 —b	0	...	0	0 a	—b'	...	0	0 0	0	...	— b	0 0	0	...	a	—b	• Л-1
Так как в первом определителе нули — под главной диагональю, а во втором —над главной диагональю, то оба они равны произведению элементов, расположенных на главной диагонали. Таким образом,
А = а • ап-1 + (— b) (—l)w (— Ь)п-' = а» — &».
Свойство 5. Сумма произведений элементов одной строчки матрицы А n-го порядка на алгебраические дополнения соответствующих элементов другой строчки равна нулю, т. е.
ajiAii-^-aflAit-^...-^-ajnAin—О при (18)
Аналогично для столбцов
Я1И1*4"а«Л4*4-...-|-ал/Лл*==0 при l^k. (19)
Доказательство. Обратимся к равенству (16) из доказательства свойства 4. Если мы положим
*^1 —Ц/1, -^9—"Цуа, •••, кп — а}п, то правая часть равенства (16) превратится в сумму ЩлАц-\-арАц-}-. .--\-ajnAin. Что касается матрицы В, то она превратится в матрицу, у которой строчка из элементов (Z/i, а^, .... aJn встречается дважды (на месте i-й и /-й строчек). Так как по свойству 3 определитель такой матрицы равен нулю, то получаем, следовательно, равенство (18). Равенство (19) можно
41


доказать либо таким же способом, либо с помощью свойства 1.
Свойство 6. Если все элементы какой-нибудь строчки (или столбца) матрицы п-го порядка умножить на число с, то ее определитель также умножится на с.
Доказательство. Умножив все элементы t’-ft строчки матрицы
	Пи		• • •	«1л
л =			...	&in
	ani			^пп
на число с, мы получим матрицу
	Яи	П12	. . .	ain
Ai =		са& ...	сащ
		йп2 . . .	апп
По лемме 3 алгебраические дополнения Ан, Ац, ... ..., A tn элементов t-й строчки матрицы А равны алгебраическим дополнениям соответствующих элементов t-й строчки матрицы At. Разложив определитель |Л1| по элементам t-й строчки, мы получим
| Л11 = сацА и	са{гА ц 4~ • • • 4~ catnA ;п —
= с (апЛ п -|- а^А <2 -}” • • •	амЛ ;я).
Так как выражение в скобках равно | А | (свойство 4), то |Л4 = с|Л |. Этим свойство 6 для строчек доказано. В силу свойства 1 оно справедливо и для столбцов.
Свойство 6 может быть сформулировано также следующим образом: общий множитель для элементов какой-нибудь строчки (или столбца) матрицы п-го порядка можно выносить за знак определителя.
Свойство 7. Если матрица п-го порядка имеет две пропорциональные строчки (или два пропорциональных столбца), то ее определитель равен нулю.
Доказательство. Пусть l-я и /-я строчки матрицы п-го порядка пропорциональны, т. е.
Ц/1 — сац, acaiit ..., ajn — са^п*
42
Тогда
ап da ••• atn
da йц • • • Л/л
ар dp ... ajn
ddn СОц .. • Cdiji
(Здесь мы применили свойство 6 о вынесении общего множителя из строчки за знак определителя и свойство 3 о равенстве нулю определителя матрицы с равными строчками.) Свойство 7 для столбцов следует из свойства 1.
Свойство 8. Если все элементы i-й строчки матрицы п-го порядка представлены в виде суммы двух слагаемых
aik=a’ik 4- a'-k	(k = 1, 2, ..., и),	(20)
то ее определитель можно представить в виде суммы определителей двух матриц, у которых элементами i-й строчки являются соответственно первые и вторые слагаемые разложений (20), а все остальные строчки — такие же, как у исходной матрицы'.
Ди	#12	Л1Л
ail +	-р #z*2 . . .		ain 4“
аЛ1		^пп
	ац	#12
С=		
	dnl	С1п2
din		#11	#12	...	#1Я
Qin	+	#г’1	^12	• • • Щп
апп		Ял2 • • • dnn
 (21)
43
Аналогичное утверждение, разумеется, имеет место и для столбцов.
Доказательство. По лемме 3 алгебраические дополнения элементов i-й строчки для всех трех матриц, стоящих под знаком определителя в (21), одинаковы. Обозначим их через Ан, Ati, .... Дгл. По свойству 4 определитель слева равен
(#й -f-ан) Ац (ан 4“ att) Ац • • • ~|“	ain) А{„. (22)
Аналогично, применив то же свойство к определителям справа, получим, что их сумма равна
(ацА/i -|- ацАц	... -f- a't„A in) 4~
4~ (aii А и	а1зА й 4~ • • • 4“ ainA in). (23)
Сравнивая выражения (22) и (23), видим, что они равны между собой, т. е. левая часть равенства (21) действительно равна правой. Свойство 8 доказано.
Ясно, что если все элементы какой-нибудь строчки представлены в виде суммы k слагаемых, то определитель можно представить в виде суммы k определителей.
Пример 1. Найдем значение определителя
14~ 2а 1 а х 14-26 2 b х
1 -|- 2с 3 с х 14-2d 4 d х
Элементы первого столбца являются здесь суммами двух слагаемых, поэтому согласно свойству 8 имеем
	1 1 а х		2а 1 а х
	1 2 b х		2Ь 2 b х
Д =			
	1 3 с х		2с 3 с х
	1 4 d х		2d 4 d х
В первом определителе первый столбец пропорционален последнему, во втором же первый столбец Пропорционален третьему. Следовательно, по свойству 7 оба они равны нулю, а значит, Д = 0.
Пример 2. Вычислить определитель п-го порядка 1	1	1	...	1	1
О	2	2	...	2	2
. О 0 3 ...	3	3
Д =
О	0	0	...	п—	1 п— 1
х	х	х	... х n-j-x
Элементы посл'едней строчки представим в виде сумм
O-f-x, 0-|-х, ...» 0+х, n-j-x. Тогда
1	1	1	...	1	1
О	2	2	...	2	2
О	0	3	...	3	3	.
О 0 0 ... п— 1 n— 1
О 0 0 ... О п
1	1	1	...	1	1
О	2	2	...	2	2
О	0	3	...	3	3
О 0 0 ... п— 1 п— 1 х	х	х	...	х	х
В первом определителе под главной диагональю везде нули, поэтому он равен произведению элементов главной диагонали, т. е. 1-2-3 ... (n—1)-п = п!. Второй определитель равен нулю, так как у него первая и последняя строчки пропорциональны. Таким образом Д==п! 4-0 = п!.
Свойство 9. Определитель матрицы п-го порядка не изменится, если к элементам одной ее строчки прибавить соответствующие элементы другой строчки, умноженные на одно и то же произвольной чиело. to же самое справедливо и для столбцов.
Доказательство. Для разнообразия доказательство этого свойства проведем для столбцов. Пусть
45
к элементам k-ro столбца матрицы
0ц	...	aik	...	ац	..	aJn
021	• • •	C^k	• • •	02/	• •	•	02л
0«1	...	dnk	...	Q,ni	...	dnn
прибавлены соответствующие элементы /-го столбца, умноженные на число с. Для определителя полученной матрицы At имеем
	011	• • • 01ft + Cd\i . ..	dU ...	01n
|Л1 =	021	• • • 02ft "Н ^2/ • • •	02/	02я
	0«1	• • • 0flft C@nl * • •	anl • • •	ann
0ц	• • •	Qik	• • •	0ц	• • •	ain
0м	...	а%ь	...	Ощ	...	а^п
O'ftl	• • •	Ctflk	• • •	ani	• • •	^nn
Ъп
0ц
021
Ш1/ ... Ян
Cd^i . •. dfy
=|Л| + 0=1Л|
Gni ... canl ... anl ... ann
(при выкладках мы использовали свойства 8 и 7 для столбцов). Таким образом, |Л1| = |Л|, а это и требовалось доказать.
Пример 1. Вычислить определитель
1	2	3	4
0	2	5	9
Л==	0	0	3	7	‘
—2 —4 —6 1
Здесь целесообразно первую строчку, умноженную на 2, прибавить к четвертой. Так как при таком пре-46
образовании определитель не меняется, то
	1	2	3	4	
	0	2	5	9	
д=	0	0	3	7	= 1-2-3-9 = 54.
	0	0	0	9	
Пример 2. В определителе
1	2 3 4
1	3 3 4
1—17 4
1-259
легко можно получить нули над главной диагональю. Для этого первый столбец, умноженный на —2, прибавим ко второму. Затем в полученном определителе первый столбец, умноженный на —3, прибавим к третьему. Во вновь полученном определителе опять первый столбец, умноженный на —4, прибавим к последнему. Так как, по свойству 9, при наших преобразованиях матрицы определитель не меняется, то в результате этих трех последовательно выполненных операций мы получим
1	000
	1	1 0	0	
Д==	1	—3 4	0	= 1.1.4.5 = 20.
1—425
Пример 3. Вычислить определитель п-го порядка
	п	п— 1	п — 2	...	2	1
	п— 1	п	п— 1	. . .	3	2
д =	1	п— 1	п		4	3
2	3	4	... п п—	1
1	2	3	...	n—	1 п
Вычтем здесь из первого столбца второй (т. е. к первому столбцу прибавим второй, умноженный
47
на —1), затем из второго столбца вычтем третий, из третьего — четвертый и т. д., наконец, из предпоследнего столбца вычтем последний. В результате мы получим
д=	1	1	1	...	1	1 — 1	1	1	...	1	2 —1	—1	1	...	1	3 —1	-1	—1	...	1	п — —1	—1	—1	...	—1	п
В полученном определителе первую строчку (умноженную на 1) прибавим последовательно ко всем остальным:
1	1	1	...	1	1
О	2	2	...	2	3
.	0	0	2	...	2	4
О	0	0	...	2 п
О	0	0	...	О	п-Н
= 1.2-2- - -2-(n + l) = 2"-4(n4-l).
Упражнения
1.	Как изменится определитель матрицы п-го порядка, если ее столбцы записать в обратном порядке?
п (п—1)
Отв. Приобретет множитель (—1). 2
2.	Вычислить определитель (17), пользуясь лишь определением определителя.
3.	Доказать свойство 3, основываясь только на определении определителя (без использования свойства 2).
4.	Вычислить определитель, разложив его по элементам последнего столбца, 1 1 3 х 13 1^ 3 11*’
Illi?
Отв. 4x + 4j4-4z—20Л
48

5.	Вычислить определитель
1+^1У1 1+*1Л 1+*!Л
1+-ЧЛ 14-*«Л 1+*,Л 14-х, УI 1+х,Л 1+xjJa
Отв. 0.
6. Вычислить определители п-го порядка
1	1 1...	1 1
— X	а	а...	а а
— X	— х	а...	а а
— X	— X —X...	а а
— X	— X —X...	—.	х а
Ь)	1 1 1...1 1	
	— х х 0...0 0	
	— х 0 х...О 0	
	— х 0 О...х 0	
	— х 0 0...0 х	
Отв. а) (я + х)71*1; Ь) их71"1.
§ 5. Примеры вычисления определителей
1. Вычислить	определитель
Д==	2	3—4	5 3—5	2	4 5	4	3	—2 -4	2	5	3
Если к этому определителю мы непосредственно применим свойство 4, то получим четыре определителя 3-го порядка. Но такой путь вряд ли целесообразен. Поставим перед собой цель, пользуясь свойством 9, получить, например, в первом столбце три нулевых элемента. Предварительно сделаем вспомогательные преобразования, уменьшающие числа первого столбца, а именно: к последней строчке прибавим третью, затем Из третьей вычтем вторую и, наконец, из второй вычтем
49
первую. Тогда будем иметь
2	3—4	5
1—8	6—1
Д =
2	9	1—6
16	8	1
Если теперь четвертую строчку вычесть из второй, а затем ее же, но умноженную на 2 вычесть из первой и третьей, то получим
	0	— 9	— 20	3
д =	0	— 14	— 2	— 2
	0	— 3	— 15	— 8
	1	6	8	1
	 —	— 9 —20	3 — 14	—2	—2 — 3 —15 —8	=3
(выносим из строчек множители —1, —2, —1 соответственно)
9 20 —3
= 2 7 1
3 15
(третий столбец вычитаем из второго и, умноженный на 7, — из первого)
= —2(210+1219)== —2858.
2. Вычислить		определитель п-го		порядка
	п	п— 1	п — 2 ... 2	1
	1	п	п— I ... 3	2
Д =	1	1	п ... 4	3
	1	1	1	... п	и— 1
	1	1	1 ... 1	п
Вычтем из первой строчки вторую, из второй — третью и т. д., наконец, из предпоследней — последнюю 50
(последняя остается без изменения). Получим
д=	п— 1	—1	—1	...	—1	—1 0 п — 1 —1	... —1	—1 0	0	п —	1 ...	—1	—1 0	0	0	... п— 1 —1 1	1	1	...	1	п	п
Элементы последней строчки представим в виде сумм двух слагаемых:
о-}-1, 04-1	 04-1,	(п —1)4-1.						
Применив свойство 8, будем				иметь		
	п— 1	-1	-1 .	.. —1	— 1	
	0	п — 1 -	-1 .	.. —1	— 1	
Д=	0	0	п — 1 .	.. —1	— 1	+
	0	0	0	..	.. п— 1	— 1	
	0	0	0 ..	0	п — 1	п
		п— 1 •	-1	— 1 ..	. —1	— 1
		0	п — 1	— 1 ..	. —1	— 1
	+	0	0	п — 1 ..	. —1	— 1
		0	0	0	..	. п — 1	— 1
		1	1	1 ..	1	1
В первом определителе нули под главной диагональю, во втором мы можем последнюю строчку прибавить ко всем предшествующим и пблучить нули над главной диагональю. Таким образом, п 0 0 ... О О
1 п 0 ... О О
д = (п—1)л4-	1 1 п ... 0 0	= (n — ir-f-n’-1.
1 1 1 ... п О
1 1 1 ... 1 1
51
3. Определитель вида
1 Xi х! ... х"~1 д _ 1 Хз х2 ... х»"1
1 x„ ХА...Х"'1
называется определителем Вандермонда порядка п (или степенным определителем).
Вычтем в определителе Дя из каждого столбца, начиная с последнего, предыдущий столбец, умноженный на хя. В результате этих операций последняя строчка примет вид
1, 0, 0, ..., 0.
Что касается произвольней i-й строчки при 1 i < п — 1, то она будет выглядеть следующим образом:
1, Х{ — Хп, Xt(Xi Хя), Xi(Xi Хп), ...» X? *(X/ Хя).
Разлагая полученный определитель по элементам последней строчки, получим
Д„ = (-!)»+»	Х1 —хя	х,(х1 —х„)., Ха — Хп	xa(xs — x„) ..	хп Цх^ — Хп) .. хп-‘(ха — х„)
	ХП-1 хп ХП-1 (хп~1 хп) •'	” Хп—1(ХП~1 хп)
Вынесем теперь из строчек множители Xi — хя, Xj хя,..., хя_1 хя:
Дд—(	1)” 1 (Xi хя) (Хз хп)... (хя_1 хя) X
	1	Х1	х!	... х“-2
	1	х2	х%	... х*-2
	1	хп-1	Л-1	••• Х"~? п—1
Если каждую из п— 1 разностей в полученном равенстве мы умножим на —1, то это равенство примет вид
Д« == (%п	Х\) (хл Хз) ... (хя Хя_1) Дя_1,
где Дд—1 — определитель Вандермонда порядка п—1.. С определителем Дя_( мы можем поступить точно так же, т. е. выразить его через Д„_4. В результате для
52	'
дл получим выражение
Дя = (Хп Xi) (Хп Х3) ... (хя Хя_1) X
X (Хп-1 Xj) (хл_1 ~~ Xi) ... (Хд_1 Xn_i) • Дд_?.
Продолжая этот процесс дальше, мы на (п— 2)-м шаге найдем выражение Дя через определитель Д8, который равен
1 Xj = (х,-х1).
1 Х^
В итоге получим
Д« == (хп Х1) (хя Xi) ... (хя xn_i) X
X C^n-l ^1) (^я-1 xi) . .. (Xn_i — xn_i) X
Х(*з —Х1)(х3 —х2)Х
Х(*« —*0-
Если воспользоваться знаком И, применяемым для обозначения произведений, то полученное значение для Дя можно записать в виде
д»= П (xt~xj)
(произведение распространяется на все те пары индексов i и / среди значений 1,2,..., и, для которых i /).
Из формулы для Дя следует, что если значения Xi, Xi,..., хп попарно различны, то определитель Вандермонда ДЯ = Д„(Х1, хг...хя) отличен от нуля. Действи-
тельно, все сомножители в формуле для Дя отличны от нуля, поэтому и их произведение отлично от нуля.
Приведем конкретный пример определителя Вандермонда:
1111
1	2	4	8	=
1	3	9	27
1	4	16	64
= (4- 1)(4 — 2) (4 — 3) (3 — 1) (3 —2) (2 — 1)=12.
53
4. Пусть нам дан определитель n-го порядка (а Ф Р)
а + р	оф	0	...	О	О
1	а + р	ар	...	О	0
д _	0	1	а + р	...	О	О
О	0	0	...	а + р	ар
О	0	0	...	1	а + Р
Представим элементы первого столбца в виде сумм двух слагаемых:
а + р', 1+0, 0 + 0, ..., 0 + 0.
Тогда по свойству 8 из § 4 определитель Дл может быть представлен в виде суммы двух определителей:
а ар	о	...	О	О
1	а + р	ар	...	О	О
О 1 а + р ... О О
О О
О О
О ... а + р ар
О ... 1 а + Р
р	ар	0	...
О а + р	ар
О 1 а + р ...
О
О о
о о о
0	0	0	... а + р ар
0	0	0	... 1 а + р
Второй из этих определителей после разложения по первому столбцу дает нам рдл_1, где Дл_1— определитель такого же вида, как и исходный, но на единицу меньшего порядка.
С первым определителем поступим следующим образом. Первый столбец, умноженный на р, вычтем из второго, затем полученный второй столбец, умноженный на р, вычтем из третьего и т. д. В конечном итоге, 54
как легко видеть, мы придем к определителю
а	0	0	...	0	0 1	а	0	...	0	0 0	1	а	...	0	0 0	0	0	...	а	0 0	0	0	...	1	а	ч• II
Нами получено, таким образом, соотношение Ад =	РД«-1»
связывающее заданный определитель порядка п с определителем такой же структуры порядка п — 1. Соотношения такого типа носят название рекуррентных.
Обращаясь к определителям типа Дя при малых п, легко находим, что
Д1 = а-|~Р,
ар а-|-р
а р ар О
Д8=	1	а-|-р ар
= а’ + ар + р’,
= а84-а4р + ар9 + р’.
О 1	а-4-р
Полученные результаты мы можем записать также в виде д_	д _«’-₽*	д _»‘-₽‘
д*—	д’— т=р	д8—
Найденные значения подсказывают нам, что, по-види-мому, для любого порядка k справедлива формула
а*+1 _ й*+1
* а —р •
Это пока что только догадка. Но мы можем попытаться доказать справедливость написанной формулы для всех k методом математической индукции, используя найденное рекуррентное соотношение. Предположим, что справедливость формулы уже установлена для k — п — 1, т. е. что
.	ал — В»
А —--------!_
«-1	а — р •
55
Тогда
д _ a»j ад _ал_1_3аЯ-₽я_“"+,-?я+‘
Таким образом, если формула справедлива при 6=п— 1, то она справедлива и при k = n, а значит, она справедлива при всех k. Выражение для определителя Дл найдено.
Для определителя Дл можно легко получить другое рекуррентное соотношение. Разложим определитель Дл по элементам первого столбца. Один из получающихся миноров будет равен Д„_1, второй же разложением по первой строчке сводится к Дл_2. В результате мы получим рекуррентное соотношение
Дл = (» + ₽) Дл л ~
связывающее определитель Дл с определителями такого же типа двух предшествующих порядков. Пользуясь этим новым соотношением, мы могли бы, конечно, также доказать справедливость подмеченной формулы для ДА.
Укажем еще на один прием вычисления рассмотренного определителя Д„. Вернемся для этого к выводу нашего первого рекуррентного соотношения. Поменяв роли а и р, мы тем же способом получим еще одно соотношение:
ДЛ —РЛ_|“аДЛ-Ь
Нахождение значения для Дл сводится теперь к решению системы двух линейных уравнений с двумя неизвестными Д„ и Дял:
Дп = ®л ~Ь РДл-1,1
Дл — ?” + аДл-1 • J
(Конечно, нас интересует только неизвестное Дл.)
5. Вычислить определитель
	01	X	X ..	.. X
	У		X .<	X
д=	У	У	а3 ..	X
	У	У	У ••	• л
56
Представим элементы первой строчки в виде сумм двух слагаемых:
(ai — х)-}-х, 04~х, ...» 0 + х,
и разложим определитель А на телей:
ai—х 0 0 ... 0
сумму двух определи-
	У	О* X ... X	
Д =	У	У (h ... X	
У У У ---ап
XX X ... X у di X ... X
У у а3 ... X
У У У -а.
Первый определитель после разложения по элементам первой строчки записывается в виде — x)D, где D — минор элемента at — х. Во втором определителе мы вынесем из первой строчки х за знак определителя, а затем первую строчку, умноженную на у, вычтем из всех прочих строчек. В результате под главной диагональю окажутся нули, а на главной диагонали будут стоять элементы 1, а3— у, а3 — у, .., ап — у. Для определителя А мы получаем представление
A = (ai — x)D4-x(a4 — у)(а3 — у) ... (ап — у).
Рассмотрим полученное равенство как тождество относительно переменных х и у. Если в этом тождестве мы поменяем местами переменные х и у, то получим некоторое новое равенство. Но определители А и D при перемене местами х и у не меняются, так как такая перемена сводится к транспонированию соответствующих матриц (см. свойство 1 из § 4). Поэтому мы имеем
Д = (а1 — y)D-\-y(cii — х)(а3 — х) ... (ап — х).
Определитель А может быть найден теперь из системы двух уравнений с двумя неизвестными. Исключив D, получим окончательно
А = х — ^) (°а —	(gi — X) (а8—X)... (ая — х)
X— у
Рассмотренные нами примеры показывают, что вычисление определителей п-го порядка требует умелого использования свойств определителей с учетом специфических особенностей того или иного определителя.
57
Встречавшиеся в примерах приемы позволяют выделить следующие методы вычисления определителей:
1)	для численных определителей — получение нулей в какой-нибудь строчке (или столбце) и сведение к одному определителю на единицу меньшего порядка;
2)	преобразование матрицы определителя к треугольному виду (с нулями выше или ниже главной диагонали);
3)	получение рекуррентного соотношения с последующим применением метода математической индукции;
4)	получение двух (или нескольких) рекуррентных соотношений и нахождение определителя из системы линейных уравнений.
В конкретных примерах перечисленные основные методы используются, как правило, в сочетаниях друг с другом.
Упражнения
1.	Вычислить определители
а)
12 3 4
2 12 3.
3 2 12’
4 3 2 1
7	8	5	5	3
10	И	6	7	5
5	3	6	2	5
6	7	5	4	2
7	10	7	5	0
Отв, а) —20; Ь) 5.
2.	Вычислить определитель
0 х у г х 0 z у у z 0 х z у х 0
Отв. х4 4 у4 4 z4 — 2х2у8 — 2x2z2 — 2yaza =
== + У + ^) (*—У — ^) (* + У — *) (*—У + *).
3.	Вычислить определитель (порядка п -f- 1)
х 0	0	...	0	а0
— 1 х	0	...	0
0 — 1	х	...	0	cg
0	0 0 ... х ап,г
0	0 0 ... — 1 ап
Отв. а0 +	+ а2х2 +... 4- апхп.
Указание. К первой строчке прибавить вторую, умноженную на х, третью, умноженную на х2, и т. д., наконец, последнюю, умноженную на хп. Затем разложить полученный определитель по первой строчке.
58
4.	Вычислить определитель я-го порядка
а + р	ар	О	...	О	О
2 а + р	ар	...	О	О
О	1	а + р...	О	О
О	О	О	... а + 3	а3
О	О	О	...	1	а + р
п
Оте, ап + рЛ.
Указание. Представить в виде суммы двух определителей по первому столбцу или получить рекуррентное соотношение разложением по последнему столбцу.
5.	Вычислить определитель n-го порядка
1	а	0 ...	0	0
1	1 + и	а	0	0
0	1	1 +а ...	0	0
0	0	0 ...	1+а	а
0	0	0 ...	1	1+а
Отв, 1.
6. Вычислить определитель
1
2
3 4
— я
1
2
3
— а
— а
1
2
— а — а — а
1
а а а а
пп—\п—2п—3 ...	1
Отв, (1 + й)я— ап.
Указание. Из каждого столбца, начиная с первого, вычесть последующий; затем представить в виде суммы двух определителей по последнему столбцу.
7. Вычислить определитель n-го порядка
х —у 0 ... О О
О х —у ... О О
О 0 х ... О О
Указание. Разложение определителя по элементам первого столбца и (второй раз) по элементам последнего столбца дает два различных рекуррентных соотношения.
8. Вычислить определитель n-го порядка
х+1	1 1 ..	.. 1 1	
— 1	х 0 .<	,.	0 0	
0	— 1 х ..	,.	0 0	•
0	0 0..	х 0	
0	0 0..	. — 1 X	я
59
Ome. -----г-.
x— 1 9. Вычислить определитель п-го порядка
ха а ... а b х 0 ... О b 0 х ... О
b 0 0 ... х п
Отв. хп — (п — 1) abxn~*.
10. Вычислить определитель п-го порядка
а + 1	х	х	...	х	х
1	а	х	...	х	х
1	0	а	...	х	х
1
1
О 0 ... а х
О 0 ... О а п
Отв. ап + (в — х)я-1.
11. Вычислить определитель
1 + *1	1	1 ... 1
2	2 +	2	...	2
3	3	3 -|- х8 ...	3
п	п	п ... п-^хп
л	Л 1 1 1 2 .	. п
Отв. XiXt ...	1 + — + — + ••• + —
§ 6. Определитель ступенчатой матрицы
Рассмотрим матрицу
ап	ап	...	aim	0	...	О
аи	а^я	...	ato	0	...	О
От1	ОтЛ	• • •	^тт	0	...	О
^тгц1, 1	2 • • • От+1, т ®т+1, т+1 • • • ®/п+1, п
O„i йп9 • • • ^пт &п, ш+1	• • • ^пп
п-го порядка, у которой все элементы aik при 1 i «с т и m-\-l^k^n равны нулю. В дальнейшем такую матрицу будем называть ступенчатой. Обозначим через Ai матрицу /п-го порядка, расположенную в левом верхнем углу матрицы А, и через Д4 — матрицу порядка п — т, расположенную в правом нижнем углу. Матрицы Ai и А3 называются диагональными клетками 60


ступенчатой матрицы А. Символически матрицу А можно записать также в виде
“|в Л2
где В —прямоугольная матрица, имеющая п— /пстрок я tn столбцов, а О — прямоугольная матрица, имеющая т строк и п— т столбцов и состоящая сплошь из нулей.
Теорема 1. Определитель ступенчатой матрицы равен произведению определителей ее диагональных клеток, т. е.
I Л I - А1 О — । л_ । , д ।
1л1=в
Доказательство. Доказательство теоремы мы проведем индукцией по порядку т верхней диагональной клетки Л1. Если т=\, т. е. Л1=||оц|| — матрица 1-го порядка, то утверждение теоремы справедливо, так как оно в этом случае превращается в утверждение леммы 1 из § 4 (см. замечание в конце § 2).
Предположим теперь, что т^2 и что для случая, когда порядок верхней диагональной клетки равен т— 1, теорема уже доказана.
Разложим определитель | Л | по элементам первой строчки:
| Л 1=011 Ли -[-а^Л 12	-|-й!1тЛ1т.	(1)
Здесь Л« — алгебраическое дополнение элемента в матрице Л (6 = 1, 2, .... /и). Согласно формуле (10) из § 4 мы имеем
Ли==(-1)1+*Ди,
где Дц, —минор элемента alk в матрице Л, т. е определитель матрицы порядка n—1, полученной вычеркиванием в Л первой строчки и k-го столбца. Но после такого вычеркивания мы получаем, очевидно, ступенчатую матрицу (обозначим ее через Л1*’), у которой верхняя клетка имеет порядок т—1. К матрице Л1А) применимо поэтому индукционное предположение. Определитель верхней диагональной клетки матрицы Л(А) совпадает с минором Д£* элемента aik в матрице Лр Что касается нижней диагональной клетки в Л(й), то
61
она совпадает с А3. Следовательно, на основе индук» ционного предположения мы имеем
=	(2)
Обозначим через Ли алгебраическое дополнение элемента йи в матрице At. Так как Лй = (—1)1+*Ди, то из (2) вытекает равенство
Aih	Atk • | At |.
Возвращаясь к разложению (1), получаем теперь
I А I (йцЛй	OitAlt 4~... 4* &1тА 1т) • I At I = I Л1 I • I Л21,
что и требовалось доказать.
Введенное нами понятие ступенчатой матрицы легко. может быть обобщено. Именно будем под ступенчатой матрицей понимать матрицу вида *
(3)
где Л1, At, .... Ак — квадратные матрицы, называемые! диагональными клетками (выше клеток находятся нули,/ а ниже — произвольные числа). Индукцией по числу! диагональных клеток k легко установить, что и в этом случае определитель ступенчатой матрицы равен произведению определителей ее диагональных клеток, т. е.
|Л| = |Л1|.|Л4|...|ЛА|.
Ввиду свойства 1 из § 4 как теорема 1, так и ее обобщение справедливы и для «перевернутых» ступен чатых матриц, т. е. для случая, когда нули находятся ниже диагональных клеток.
Доказанная нами теорема 1 является частным слу чаем одной более общей теоремы. Эту теорему, назы ваемую теоремой Лапласа, мы сформулируем здесь бе! доказательства.
Пусть нам дана квадратная матрица n-го порядкг
ЙЦ ЙЦ ... Й1„ flsl й» ... Й2п
О-гЛ • • • ®лл
62
Зафиксировав некоторое натуральное число k<^n, выберем в А какие-нибудь k строчек и k столбцов. Пусть это будут строчки с номерами 6 <Ja <С • • • и столбцы с номерами /1 <СЛ<С-Из элементов на пересечениях выбранных строчек и столбцов можно образовать определитель Л-го порядка
^2/2 • • •
aikh aikh ... atk/k
Этот определитель называется минором k-го порядка матрицы А. Вычеркнем теперь в А выбранные строчки и столбцы. Определитель полученной таким образом матрицы порядка п — k называется дополнительным минором для первого минора. Дополнительный минор, взятый со знаком
(_ i)«i+i»+-+«*+A+-+4t
называется алгебраическим дополнением исходного минора.
При k = 1, когда выбирается одна строчка и один столбец (с номерами, скажем, i и /), введенные понятия минора, дополнительного минора и алгебраического дополнения для данного минора превращаются соответственно в хорошо известные нам понятия элемента а,7 (определителя 1-го порядка), минора Дгу и алгебраического дополнения Ац.
Приведем еще пример для k = 2, п = 5. Если в матрице А мы выберем 2-ю и 5-ю строчки и 3-й и 4-й столбцы, то соответствующим минором будет
&23 #24
#54
Алгебраическое дополнение для этого минора равно
(___ |)2+5+3+4
^11^12^13
^31^32^33 •
^41^42^45
63
Теорема 2 (теорема Лапласа). Выделим в матрице А п-го порядка какие-нибудь k строчек. Тогда ее определитель | А | может быть представлен как сумма произведений всевозможных миноров k-го порядка, составленных из выбранных k строчек, на их алгебраические дополнения. То же самое справедливо и для случая, когда выбраны k столбцов.
Чтобы составить какой-нибудь минор из заданных k строчек, мы должны выбрать еще k столбцов. Так как это можно сделать С* способами, то сумма, о которой говорится в теореме Лапласа, состоит из С„ слагаемых.
Для определителя 4-го порядка, в котором выбраны две первые строчки, теорема Лапласа дает следующее разложение:
11 а b х у а. р	1 1 с d z t 7 8	—	1 1 а b	•(-	| у+2+1+2		z t 78	+		
+	1 1 а с	•(-	_ | у+2+1+3		\у t |р 8		1 1 a d	, (	 | у+2+1+4	У 2 ? 7	
+	1 1 b с		_ iy+2+2+З		х t а 8	4"	1 1 b d	. (	 | у+2+2+4	х г « 7	+-
Покажем теперь, как с помощью теоремы Лапласа может быть получена теорема 1. Выберем в ступенчатой матрице А, выписанной в начале параграфа, перЕГые т строчек. Одним из мийоров, построенных на этих строчках, будет определитель верхней диагональной клетки | Ai | (если взять первые т столбцов). Всякий другой: минор из выбранных строчек обязательно захватит стол-? бец из нулей и поэтому будет равен нулю. Следовав тельно, разложение Лапласа в этом случае своди- I тся к одному слагаемому (все остальные равны? нулю). Дополнительный минор для |Л1| равен | поэтому
| А | = | Ai 1 • (— 1)1+2+-+’п«+2+...+/п| Ai । == [Л1|. |Л^ 64
упражнения 1. Вычислить определители		
а)	2 3 0 0 0! 4 5 0 0 О’ 17 11 1 — 1 3 2 3 4 9 8 4 9 16	i Ь) >
Отв. а) — 4; Ь) 42. 2. Вычислить определитель,		
второй и четвертой строчкам,		
1	2 0	0 0	0
3	8 0	0 0	0
— 2	3 2	— 1 0	0
7	2 3	2 0	0
5	— 1 3	5 7	— 5
2	3 7	2 2	— 1
применив теорему Лапласа ко
Отв. 168.
12 3 15
0 10 5 1
2 12 3 2
0 3 0 1 3
3 2 13 4
3 3. И. Боревич
Г Л А В A II
СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ
§ 7. Основные понятия
Система т линейных уравнений с п неизвестными имеет вид
&11%1 + ^12X3	. —р а\пХп ==
^21*1 “|“ ^22*2 “Г • • • ~h ainXn	(1)
“Т'^2^2“Ь* • *~\-^тпхп = ^т* >
В общем случае число уравнений в системе не обязательно совпадает с числом неизвестных: т может быть меньше, равно или больше числа п.
Числа aik (вещественные или комплексные) называются коэффициентами системы, bi — свободными чле-нами\ Xi, х2, ..., хп — неизвестными.
Определение. Совокупность п чисел аь а2, ...
ап называется решением системы (1), если после замены неизвестных xi9 х2, •••» хп числами аь а2, ..., ая соответственно каждое из уравнений системы превращается в верное равенство.
Пример 1.
х —у —}— Z = 1, 1 2х4"2у_1_2г = 3. J
Эта система двух уравнений с тремя неизвестными решений не имеет, так как любая тройка чисел, удовлетворяющая первому уравнению, не может удовлетворять второму.
Пример 2.
*+*/ =1. I
2x-f-7t/ = —3. J
66
Легко видеть, что эта система имеет единственное решение: х = 2, у — — 1.
Пример 3.
2х-^-2у — 2, 
Зх 4~ Зу == 3.
Пара чисел, 1,0 есть одно из решений этой системы трех уравнений с двумя неизвестными; —1,2 —другое решение. Эта система имеет бесконечно много решений: значения х = а, у=1—а при любом а удовлетворяют системе.
Приведенные примеры систем показывают, что, вообще говоря, система может либо вовсе не иметь решений, либо иметь единственное решение, либо иметь их несколько (как мы увидим в дальнейшем, в последнем случае система всегда имеет бесконечно много решений).
Определение. Система, не имеющая ни одного решения, называется несовместной. Система, обладающая хотя бы одним решением, называется совместной.
Система примера 1 несовместна. Системы примеров 2 и 3 совместны.
Относительно каждой системы линейных уравнений могут быть поставлены следующие вопросы.
1.	Совместна заданная система или нет?
2.	В случае, если система совместна, как определить, сколько она имеет решений — одно или несколько?
3.	Как найти все решения системы?
Дать ответ на все эти вопросы и должна теория линейных уравнений.
§ 8. Теорема Крамера
Ограничимся сначала рассмотрением систем, у которых число уравнений равно числу неизвестных.
Пусть мы имеем систему п линейных уравнений с п неизвестными:
unXi -|-fljaXj -|~...	й1лхя = bi,
u-iiXi	a^Xi 4* • • • 4~ йзлхя = Ь^,	ц)
O-nlxl 4- anlxi “b • • • 4- annxn — ba- .
3
67
Определитель
Clu а^2 • Cl] п
Д==
С1ц Ci'll • • • Cl 2 п
С^п! С1п2 . . . апп
составленный из коэффициентов при неизвестных, называется определителем системы (1). Введем дополнительное ограничение, предположив, что определитель Д этой системы не равен нулю. При этом предположении в § 1 нами были получены формулы для решений систем двух линейных уравнений с двумя неизвестными и трех линейных уравнений с тремя неизвестными. Сейчас мы получим аналогичные формулы для произвольного п.
Теорема Крамера. Если определитель Д системы п линейных уравнений с п неизвестными отличен от нуля, то эта система имеет единственное решение. Это решение может быть найдено по формулам
»=£. *=£..........х. = ^,	(2)
где Дй — определитель, получающийся из А заменой k-го столбца свободными членами системы
Aft-	П11 .	• • Д1, k-Л	Ch, Jfe+1 . .  • fla, k-i bi a^ k+i •	 • a\n ' • Clift	(3)
	an\-	• • an, k-i bn an< £+i.	• • С1Пп	
Формулы (2) носят название формул Крамера.
Доказательство. 1°. Предположив сначала, что решение существует, докажем, что оно единственное.
Пусть числа «1, а?.а„ образуют решение системы
(1), определитель которой А не равен нулю. Тогда мы имеем п верных равенств:
ЙЦа1 4~ ОнОЦ + • • • + Д1пал — > Я21®1 + й2&Ь 4“ •  • 4“	= bi,
(4)
anPi 4- a^-i 4-... 4- anrp.n — bn. ,
Умножим левую и правую части каждого из равенств (4) последовательно на алгебраические дополнения Ли, Л>ь • • •> элементов первого столбца определителя Д и сложим все полученные левые и правые части. В результате получим
(ДцЛ11 “Г	~Ь • • • ~Г апМл1) а1 -|-
-т- (а^Лц	а-нАц -j- ал2Л„1) а2
4" (О1„Ац -J- а-2ПАз1 -|-... -ф- a„„A„i) а„ =
= Ь\А и -f- Ь$Ам -j- •. • -j- 6лЛП1.
Коэффициент, стоящий здесь при дь равен Д, как сумма произведений элементов первого столбца определителя Д на их алгебраические дополнения (свойство 4 из § 4). Коэффициенты же при а2, а3,..., ал все равны нулю, как суммы произведений элементов 2-го, 3-го, ..., п-го столбцов определителя Д на алгебраические дополнения того же первого столбца (свойство 5 из § 4 для столбцов). Следовательно, мы имеем
Да1 — biAи -j- ЬзАл -}-••• 4~ bnAni-
Совершенно таким же образом (если равенства (4) умножим последовательно на алгебраические дополнения Aik, Aik....Ank элементов k-vo столбца определи-
теля Д и результаты сложим) получим
Разложим определитель (3) по элементам k-vo столбца. Так как матрицы определителей Д и Д/; отличаются лишь элементами k-vo столбца, то, по лемме 3 из § 4 (примененной для столбцов), алгебраические дополнения элементов bi, bit --^Ьц в определителе Д6 соответственно равны А1к, Aik,---, Ank- Следовательно,
ДА = biAik + Ь^А^ 4" • • • + b„A nk-
Равенство (5) принимает теперь вид
Дал = Дй (k=\, 2,..., п).
Вспоминая, что Д 0, окончательно находим
». = г, ..............................«5)
69
Если теперь допустить, что система (1) имеет еще решение, скажем	%, то, повторив приведенное
рассуждение для этого решения, мы получим для Зь За,..., 3« формулы, в правых частях которых будут стоять те же выражения, что и в формулах (6). Но тогда 04 = 3!, а* = ^ ап = 3л-
Нами доказано, таким образом, что если (при Д Ф 0) система (1) имеет решение, то это решение единственно, и оно может быть найдено по формулам (2).
2°. Для доказательства существования решения нам достаточно проверить, что совокупность чисел (6) образует решение системы (1). Заметим при этом, что выражения (6) имеют смысл, так как по условию Д ф 0.
Подставив числа (6) вместо неизвестных xit х.>.хп
в левую часть t-ro уравнения системы (1), мы получим
ац +	+ ... Н-П/л у =
— (Ь[Ац +... + Ь,Ац -}-... 4~ ЬпАп\) 4*
~Ь 4'	4* • • • 4“ biAit	bnAni) 4-
+	(М.Л -Ь • • + biA ,-„ + •••+ М„л) =
= (ац А и 4* ацАл (z,nXjn) 4*
4" Д 4"	4" • • • 4" ainA in) 4"
~1 д (o/i Ап\ 4" вцАпг | -... -1  ainA„n)—
=т'о4"---4"т,д4_---4-у-о=б;.
При выкладках мы воспользовались тем, что
Щ\А j\ + а&А j2	. -г atnA jn — /
( 0 при I /
(свойства 4 и 5 из § 4 для строчек).
70
Таким образом, при замене неизвестных xt, хг,..., хп числами (6) каждое уравнение системы (1) превращается в верное равенство (тождество), а это и значит, что эти числа образуют решение. Теорема Крамера доказана полностью.
Пример. Решить систему линейных уравнений
Xi — 2X1 + Зх3 — х4 = 6, 2X1 -4 Зл*2	4хз —J— 4Х| —	7,
3xi 4”	— 2х3 — 2X1 = 9,
Xi — Зхз 4- 7х3 4* 6x4 == — 7.
Вычисляем определитель системы:
	1	— 2	3	— 1	
д=	2	3	— 4	4	— 35.
	3	1	— 2	— 2	
	1	— 3	7	6	
Так как Д -ф. О, то система имеет единственное решение, и для его нахождения мы можем применить формулы Крамера (2). Вычисляем определители:
	1 —2		6 — 1		
	2	3	— 7	4	=0,
—	3	1	9	— 2	
	1	— 3	— 7	6	
Д
1	— 2	3	6	
2	3	— 4	— 7	—	70
3	1	-2	9	
1	— 3	7	— 7	
71
Следовательно,
х, = 5'=2,	х,=4 = -1.
*=г=°'	**=г=-2-
Замечание. В случае, когда число неизвестных п велико, практическое использование формул Крамера затруднено в связи с необходимостью большого числа вычислений. (Требуется вычислить п-]- 1 определителей порядкам; в § 10 нами изложен другой, более удобный для практических целей способ решения систем линейных уравнений с числовыми коэффициентами.) Однако формулы Крамера имеют весьма важное значение в теоретическом плане, поскольку они дают возможность явно записать значения для неизвестных через коэффициенты системы.
Упражнения
1. Решить систему с помощью формул Крамера:
Зхх ф- 8х2 ф- Зх3 — х4 = 4,
2хх ф- З.г2 + 4х3 ф- х4 — — 4,
X} — Зха -— 2х3 — 2х4= 3, 5хх — 8ха ф- 4х3 ф- 2х4 = — 8. ,
Отв. Xi = 2, х2 = 1, х3 = — 3, х4 = 1.
2. Решить систему линейных уравнений:
Xi ф- х2 ф- х3 ф- х4 = 0, хх — х2 — х3 ф- х4 = 0, 2хх ф- Зх2 ф- х3 — х4 = 0, Здгх “*• 2д?2 ф— х3 2х4 —- 0, t
§ 9. Ранг матрицы. Элементарные преобразования
В предыдущем параграфе нами исследованы системы линейных уравнений, у которых число неизвестных совпадает с числом уравнений и определитель которых не равен нулю. Теперь мы должны перейти к исследо*’ ванию и решению произвольных систем линейных уравнений. Однако предварительно нам надо будет познакомиться с некоторыми сведениями, относящимися к теории прямоугольных матриц. Это отступление обус-72
ловлен° тем, что произвольная система линейных уравнений (см. (1) из § 7) с точностью до обозначения неизвестных вполне определяется таблицей коэффициентов при неизвестных и свободными членами, и поэтому свойства системы должны проявляться в свойствах соответствующей матрицы.
Итак, пусть нам дана прямоугольная матрица (т. е. таблица тп чисел, расположенных в т строчках и п столбцах)
Лц Я12 ... а\п
Л   #21 #22 • • • #2л	(1 \
&тА	п
Конечно, в частном случае допускается равенство т = п, т. е. матрица А может быть квадратной.
Пусть k — какое-нибудь натуральное число, не превосходящее /пип. Выберем в А произвольным способом k строчек с номерами	и столбцов с
номерами	Из элементов матрицы 4,
лежащих на пересечении выбранных k строчек и k столбцов, можно образовать определитель
aiife • • * ttiJk aisj\ ahh • • • ahJk
aikfl aikh • ’ • aikjk
Этот определитель называется минором k-го порядка матрицы А.
С понятием минора матрицы мы уже встречались в § 6, но там мы рассматривали лишь случай квадратной матрицы. Здесь же мы ввели понятие минора для произвольных прямоугольных матриц. При k — 1 под минором 1-го порядка мы понимаем, разумеется, элемент atj матрицы А.
Из т строчек мы можем Ckm различными способами выбрать k строчек. Аналогично из п столбцов можно выбрать С* различными способами k столбцов. Следовательно, в матрице с т строчками и п столбцами мы имеем С* • С* различным образом составленных миноров &-го порядка.
73

Пример. Для матрицы
определители
b, d
У, t
2 3 4 b с d У z t
1 2 4 a b d х у t
являются минорами 2-го и 3-го порядка.
Предложение 1. Если в матрице А все миноры k-го порядка равны нулю, то равны нулю и все миноры более высокого порядка (если таковые существуют).
Доказательство. Возьмем в матрице А произвольный минор (&4~1)'г0 порядка. Он равен сумме произведений элементов какой-нибудь строчки на их алгебраические дополнения. Но алгебраическое дополнение любого элемента нашего минора с точностью до знака (см. формулу (10) из § 4) равно некоторому минору &-го порядка матрицы А. А так как все миноры &-го порядка матрицы А по условию равны нулю, то равны нулю рассматриваемые алгебраические дополнения и, далее, равен нулю выбранный минор (6-|-1)-го порядка. Итак, все миноры порядка k -f-1 матрицы А равны нулю. Аналогичным образом докажем, что все миноры порядка Л-|-2 матрицы А также равны нулю и т. д. Предложение 1 доказано.
В теории систем линейных уравнений существенную роль играет понятие ранга матрицы. Именно в терминах ранга в § 11 и будет сформулировано необходимое и достаточное условие для совместности произвольной системы линейных уравнений.
Определение. Рангом матрицы А называется такое целое число г, что среди миноров г-го порядка матрицы А имеется хоть один, не равный нулю, а все миноры (г-]-1)-го порядка (если только их можно составить) сплошь равны нулю.
Если все элементы матрицы равны нулю, то ранг такой матрицы считается равным нулю (здесь равны нулю миноры всех порядков).
Пусть ранг матрицы А равен г. Тогда, согласно предложению 1 (которое надо применить для k = r-^-1),
74
в матрице А равны нулю все миноры порядка выше, чем г. Следовательно, ранг матрицы может быть определен как наивысший из порядков не равных нулю миноров этой матрйцы. Если поэтому о некоторой матрице известно, что все ее миноры &-го порядка равны нулю, то ранг этой матрицы меньше k.
Примеры. Найдем ранги следующих матриц:
1 °1
О О о о!
113 1
2 14 3
12 5 0
5 4 13 6
1 1
2 3
4 9
Ранг матриц At и равен 1, так как все миноры 2-го порядка этих матриц равны нулю, а среди миноров 1-го порядка, т. е. среди элементов этих матриц, есть не равные нулю. Ранг матриц At и равен 2. Действительно, 1 2	1 1
О И Ф О 0 5	2 1
(миноры 2-го порядка матриц А3 и соответственно), а все миноры 3-го порядка обеих матриц равны нулю (для Ла — четыре минора, для — шестнадцать миноров 3-го порядка).
Ранг матрицы А3 равен 3, так как единственный минор 3-го порядка этой матрицы не равен нулю.
На примере матрицы В> мы видим, что задача определения ранга матрицы (если исходить только из определения), вообще говоря, требует вычисления большого числа определителей. Существует, однако, прием, позволяющий свести объем вычислений к минимуму. Прием этот основан на использовании элементарных преобразований матриц.
75
Определение. Под элементарными преобразованиями матрицы понимаются следующие операции:
Г) умножение какой-либо строчки матрицы на число, отличное от нуля-,
2°) прибавление к элементам одной строчки матрицы соответствующих элементов другой строчки, умноженных на одно и то же число-,
3°) перемена местами двух строчек-,
1*, 2*, 3* — аналогичные операции над столбцами.
Применяя к матрице А какое-либо элементарное преобразование, мы получаем новую матрицу В. Этот факт мы будем записывать так: А — В.
Предложение 2. Элементарные преобразования обратимы, т. е. если матрица В получается из А при помощи какого-либо элементарного преобразования, то и матрица А может быть получена из В также при помощи некоторого элементарного преобразования (называемого обратным к первому).
Доказательство. Пусть матрица В получается из А умножением i-й строчки на число с Ф 0. Умножая i-ю строчку матрицы В на с-1 (т. е. применяя к В элементарное преобразование), мы получим исходную матрицу А. Пусть В получается из А прибавлением к i-й строчке элементов /-й строчки, умноженных на число а. Прибавляя к элементам i-й строчки матрицы В элементы ее /-й строчки, умноженные на —а, мы возвращаемся к матрице А. Наконец, если В получается из А перестановкой i-й и /-й строчек, то, переставляя в В те же i-ю и /-ю строчки, мы снова получим исходную матрицу А. Совершенно аналогичным образом проверяется обратимость элементарных преобразований над столбцами.
Предложение 3. Элементарное преобразование третьего типа (т. е. 3° или 3*) равносильно нескольким последовательно выполненным преобразованиям первых двух типов.
Доказательство. Пусть мы имеем элементарное преобразование
типа 3°, при котором отмеченные строчки поменялись местами (при сохранении всех остальных без изменения). Переход от Л к В при помощи преобразований типа 1° и 2е может быть осуществлен следующим образом:
ai Ь, ...
щ-j-bi-}-bt...
(Iq bi ...
ai b-i
at bt ...
ai bi ...
Здесь мы к верхней из выписанных строчек прибавили нижнюю, полученную верхнюю строчку вычли из нижней, затем снова к верхней строчке прибавили нижнюю и, наконец, нижнюю строчку умножили на с = — 1. В результате этих операций мы от А пришли к В, т. е. получили тот же самый эффект, что и при элементарном преобразовании 3°. Это и составляет содержание предложения 3.
В дальнейшем ранг матрицы А мы будем обозначать через гА.
Теорема 1. При элементарном преобразовании ранг матрицы не меняется. Другими словами, если А В, то гА —Гц.
Доказательство. 1) Предположим, что В получается из А умножением i-й строчки на с Ф 0. Рассмотрим в матрицах Л и В одинаковым образом составленные миноры Д и 8 (некоторого порядка k). Матрицы Л и В отличаются только элементами i-й строчки. Поэтому В = Д, если i-я строчка не входит в состав миноров, и 8 = сД, если входит. Отсюда следует (поскольку с 0), что 8 и Д либо одновременно отличны от нуля, либо одновременно равны нулю. Но в
77
таком случае наибольший порядок не равного нулю минора для обеих матриц будет один и тот же, т. е. Га—г в.
2) Пусть В получается из А прибавлением к i-й строчке элементов /-й строчки, умноженных на а. Положим гА — г и докажем, что в матрице В все миноры порядка г 1 равны нулю.
Пусть 8 — произвольный минор (г 1)-го порядка матрицы В. Если t-я строчка матрицы В не входит в 8, то 8 является также минором (r-f- 1)-го порядка матрицы А, а потому 8 = 0 (так как ранг матрицы А равен г, то все ее миноры порядка г -f- 1 равны нулю).
Пусть в 8 входят обе строчки — i-я и /-я:
8 =
dikt 4~	Cliks, -\-V-Ctjkz • • •


В силу свойства 9 из § 4 определитель 8 равен определителю
rtiki &tks • • •
П-jki rijk^ . ..
т. е. равен определителю порядка г 4-1 матрицы А. Так что и в этом случае 8 = 0.
Осталось рассмотреть случай, когда i-я строчка входит в 8, а /-я не входит. В этом случае, применяя свойства 8 и 6 из § 4, мы имеем
й«’*14“ v-ajki й<*2 ай/Л1 • • •
— • • •			— Д —осД]
Здесь Д есть минор порядка г -|- 1 матрицы А, поэтому Д = 0. Что же касается определителя Дъ то он, строго говоря, не является минором матрицы А, так как в нем
78
выписанная строчка может оказаться не на своем месте. Но при помощи транспозиций с соседними строчками мы можем эту строчку передвинуть в надлежащее место так, чтобы взаимное расположение строчек в Ai соответствовало их расположению в матрице А. Этим мы преобразуем определитель At в минор А' (порядка г А- 1) матрицы А. Из равенств Д' = 0 и Ai = ±A' следует теперь, что А1=0, а значит, равен нулю и минор 8 —
А —|— aAt.
Объединяя вместе разобранные случаи, мы можем констатировать, что если АВ и гА = г, то все миноры (г-Н 1)-го порядка матрицы В равны нулю и, следовательно, гв^г, т. е. rBs^rA. Теперь, в силу обратимости элементарных преобразований (предложение 2), в нашем рассуждении матрицы А и В можно поменять местами. В результате мы получим также неравенство гА^гв, которое вместе с предшествующим дает нам равенство гА = гв. Этим мы завершили доказательство теоремы 1 для элементарного преобразования типа 2°.
3) Справедливость теоремы 1 для элементарного преобразования 3° следует, ввиду доказанного, из предложения 3.
Для столбцов доказательство проводится, конечно, аналогично.
Доказанная теорема I может быть с пользой применена к вычислению ранга (для матриц с конкретными числовыми элементами), а именно, если при помощи нескольких последовательно выполненных элементарных преобразований мы перешли от матрицы А к некоторой другой матрице С, то, согласно теореме 1, гс = гА. Вычислив ранг гс, мы тем самым будем знать и ранг гА. Оказывается, что, отправляясь от любой матрицы А, всегда можно прийти к такой матрице С, вычисление ранга которой не представляет затруднений. Для этого следует добиться, чтобы в матрице С было достаточно много нулей.
Пример. Найти ранг матрицы
|	1	3	2	0	5
2	6	9	7	12
:—2—5	2	4	5
|	1	4	8	4	20
79
Подвергнем эту матрицу следующим преобразованиям. Ко второй строчке прибавим первую, умноженную на —2, затем к третьей строчке прибавим первую, умноженную на 2, наконец, из четвертой вычтем первую. После этих трех последовательно выполненных элементарных преобразований получим матрицу
1	3	2	0	5
0	0	5	7	2
0	1	6	4	15
0	1	6	4	15
Вычитая из четвертой строчки третью, а затем переставив местами вторую и третью строчки, получаем
1	3	2	0	5
0	1	6	4	15
0	0	5	7	2
0	0	0	0	0
Ранг полученной матрицы равен 3, так как минор 3-го порядка, лежащий в левом верхнем углу, не равен нулю, а все миноры 4-го порядка равны нулю. Следовательно, ранг исходной матрицы также равен 3.
Если мы в последней матрице третью строчку разделим на 5 (т. е. выполним еще одно элементарное преобразование типа 1°), то получим матрицу
1	3	2	0	5
0	1	6	4	15
0	0	1	I
О	э
0	0	0	0	о
с единицами вдоль «главной диагонали». Матрицу такого вида мы будем называть трапециевидной. Трапециевидная матрица в общем случае выглядит следующим
80

образом:
1 0	С12 1	С13	 С1‘3		
0	0	• • •	1 сг. Г+1	• • • ^гп
0	0	... 0	0	... 0
0	0	... 0	0	... 0
Частным случаем трапециевидной матрицы является тре
угольная матрица вида
1 а b с О I d е 0 0 1/ 0 0 0 1
Другими примерами трапециевидных матриц являются lab	I а b с\
0 1с	0 1 d Л
0 0 1’ 0 0 0
В рассмотренном примере мы привели матрицу к трапециевидной форме при помощи элементарных преобразований только над строчками матрицы. В общем случае для перехода к трапециевидной матрице приходится помимо преобразований 1°, 2° и 3° применять еще и преобразование 3*.
Теорема 2. Всякая матрица при помощи элементарных преобразований над строчками и при помощи перестановок столбцов может быть преобразована в трапециевидную матрицу.
Доказательство. Пусть нам дана произвольная прямоугольная матрица (1) (см. стр. 73). Если все ее элементы равны нулю, то она сама является трапециевидной (число единиц на главной «диагонали» равно нулю). Допустим, что не все элементы матрицы (1) нули. Тогда, переставляя строчки и столбцы (т. е. применяя преобразования 3° и 3*), мы можем не равный нулю элемент поместить в левый верхний угол. Можно
81
считать теперь, что <2ц	0. Разделив первую строчку
на ан (преобразование 1°), мы получим матрицу, у которой ац = 1. Вычтем теперь первую строчку, умноженную соответственно на a.2t, Озь •••, ami, из всех последующих строчек (преобразования 2°). В результате мы придем к матрице
1	Сц	С13 ... С\п
О Gjj	Ogg ... й.»я
О ami d/ns • • • Отп
Если окажется, что все элементы а'ц равны нулю, то мы уже достигли цели: полученная матрица трапециевидная. Если же не все dtj нули, то при помощи преобразований 3° и 3* добиваемся того, чтобы Ф О, а затем при помощи преобразований 1° и 2° приходим к матрице
1	С1-2	С13 ••	•
0	1	£23 • •	
0	0	а33 ..	
0	0		• • ими
Если здесь все a"j равны нулю, то все готово. Если же не все alj нули, то продолжаем наш процесс дальше. В результате на некотором шаге мы либо исчерпаем все строчки (число единиц на главной «диагонали» будет равно т), либо придем к матрице, у которой несколько последних строчек состоит сплошь из нулей. В том и другом случае мы получим трапециевидную матрицу. Теорема 2 доказана.
В заключение параграфа сделаем следующие два замечания.
Замечание 1. Если к матрице А ранга г приписать строчку или столбец из нулей, то ранг полученной матрицы будет также равен г.
Действительно, не равный нулю минор r-го порядка матрицы А будет также минором r-го порядка и' матрицы В, и, с другой стороны, всякий минор матрицы В порядка г +1 равен нулю, поскольку он либо ‘ 82
является минором (г-|-1)’го порядка матрицы Л, либо содержит строчку (или столбец) из нулей.
Замечание 2. Если к матрице А приписать какую-нибудь строчку (или столбец), то ранг полученной матрицы В может превосходить ранг исходной матрицы не более чем на одну единицу.
Действительно, если гд = г, то, очевидно гв^г. Возьмем произвольный минор 8 порядка г -j-2 матрицы В. Если в 8 приписанная строчка (или столбец) не входит, то 8 будет также минором порядка г-}-2 матрицы А и поэтому 8 = 0. Если в 8 приписанные элементы входят, то, разлагая 8 по этим элементам, мы выразим наш минор через определители порядка г 4- 1, которые будут уже минорами (г-|-1)-го порядка матрицы А. Так что и в этом случае 8 = 0. Таким образом, все миноры порядка r-j-2 матрицы В равны нулю, а значит rB ==С г 1.
Упражнения
1. Вычислить ранги матриц
a)	3	4	—2	1-	5	b)	2	3	—1	4	11
	4	—3	5	2	—3		3	2	5	—3	4
	5	15	—11	1	18	J	4	—3	2	1	7
	7	—24	26	5	—27		1	8	2	0	—2
Оте. а) 2; Ь) 3.
2. Показать, что всякая матрица ранга г при помощи элементарных преобразований может быть преобразована в матрицу, у которой элементы at
1> ^22, • • • , агг вдоль главной «диагонали» равны 1, а все прочие элементы равны 0.
§ 10. Метод исключения неизвестных
Мы изложим здесь способ решения систем линейных уравнений, который носит название метода последовательного исключения неизвестных или метода Гаусса.
Пусть нам дана произвольная система т линейных уравнений с п неизвестными:
ctuXi -|- ацХч -]- ainxn ~ bj, UnXi 4“ #22-^2 + • * • ^lnXn ~== b'lt
(1)
amlXi amiXi + amnxn = bm.
83
г
Матрица
|1 Яп Ц|2 ... (71л !' а», а.щ ... ain I
I	• • • fynn
составленная из коэффициентов при неизвестных, называется матрицей	системы (1).	Матрица
#11	Я12	...	Й1Л	bi
&____ #21	#22	•••	#2Л	Ь*
#тп1	#т2	• • •	#глл
получающаяся из А добавлением столбца из свободных членов системы (1), называется расширенной матрицей системы (1). Матрица В, очевидно, вполне определяет систему (1) с точностью до обозначения неизвестных.
Определение. Под элементарными преобразованиями системы линейных уравнений понимаются следующие операции:
1°) умножение какого-либо уравнения системы на число, отличное от нуля’,
2°) прибавление к одному уравнению другого уравнения, умноженного на произвольное число’,
3°) перемена местами двух уравнений в системе.
Делая элементарное преобразование в системе, мы получаем новую систему. Очевидно, что каждому элементарному преобразованию системы соответствует аналогичное преобразование над строчками расширенной матрицы этой системы, и наоборот, каждому элементарному преобразованию над строчками расширенной матрицы соответствует некоторое элементарное преобразование в системе. Таким образом, элементарные преобразования в системе сводятся к соответствующим преобразованиям над строчками ее расширенной матрицы. Отсюда, в силу предложения 2 из § 9, следует,-в частности, что элементарные преобразования системы, обратимы, т. е. если мы, сделав элементарное преобразование, перешли от одной системы к другой, то хМЫ можем вернуться от полученной новой системы к перво-м

начальной, выполнив опять некоторое элементарное преобразование.
В некоторых случаях может возникнуть надобность записать неизвестные в другом порядке. Ясно, что в матрице Л для этого потребуется по-другому расположить ее столбцы. Согласно теореме 1 из § 3 переход в матрице А к другому расположению столбцов может быть осуществлен посредством нескольких элементарных преобразований типа 3*.
Определение. Две системы линейных уравнений от одних и тех же неизвестных называются равносильными, если каждое решение одной из них является решением другой, й наоборот (или если обе системы несовместны).
Заметим, что число уравнений в системах может быть различным.
Если мы имеем две равносильные системы, то, определив решения одной из них, мы тем самым будем знать решения другой. Ясно, что решать мы будем ту систему, которая проще.
Уравнение вида
О • Xi -j- 0 • Хз 4~ • • • И- 0 • хп = О удовлетворяется, очевидно, при любых значениях неизвестных. Следовательно, если мы припишем такое уравнение к некоторой системе или, наоборот, вычеркнем его из системы, то новая система будет равносильна. первоначальной.
Теорема. При элементарных преобразованиях система переходит в равносильную систему.
Доказательство. Пусть в системе (1) сделано одно из элементарных преобразований. Полученную систему мы обозначим через (1').
При преобразованиях 1° и 2° одно из уравнений в системе, например первое, заменяется соответственно на уравнение вида
+ са^х* -]-••• + cainxn = cbif
(°и 4- a&2i) Xi	(#12	а#2?) Ха --р... -J- (#i« 4” »#зл) хл =
= bi —р <*ь*.
Ясно, что если числа аь а2, ..., ал удовлетворяют всем уравнениям системы (1), то они удовлетворяют и этим двум уравнениям. Следовательно, всякое решение
85
системы (1) является также решением и системы (Г) (в случае преобразования 3° это очевидно). Благодаря обратимости элементарных преобразований справедливо и обратное: всякое решение системы (Г) является ре. шением и системы (1). Таким образом, если системы (1) и (Г) имеют решения, то эти решения для обеих систем одинаковы. Ясно также, что если одна из систем (1) или (Г) несовместна, то несовместной будет и дру. гая система. Следовательно, системы (1) и (Г) равносильны, а это и требовалось доказать.
При помощи элементарных преобразований мы можем значительно упростить заданную систему. Решив полученную упрощенную систему, мы, согласно теореме, найдем тем самым и решения исходной системы. При-этом упрощений можно достигать, конечно, разными способами.
Метод Гаусса решения систем линейных уравнений состоит в том, что при помощи элементарных преобразований систему приводят к такому виду, чтобы ее матрица из коэффициентов оказалась трапециевидной или близкой к трапециевидной; при этом иногда приходится изменять нумерацию неизвестных, т. е. применять преобразования 3*. После того как матрица системы приняла трапециевидную форму, уже не представляет труда разобраться в вопросе о совместности системы, определить число решений и найти сами решения.
Для иллюстрации рассмотрим несколько примеров.
Пример 1. Решить систему
Xi —I- 2х2 — Зх3 —5x4=== 1,
Xi —j— Зх2 — 1Зхз -j-" 22x4 — 1 3%1 —j— 5х2 “"j- х3 — 2x4:== 5, 2xi —Зх-2 “-р ^Хз — 7x4== 4.
Пользуясь элементарными преобразованиями, подвергнем систему упрощению. Для этого из второго, третьего и четвертого уравнений вычтем первое, умноженное соответственно на 1, 3, 2. Мы получим
Xi -2х2 — Зхз —5x4 = 1,	1
х2—10х3-|-17х4 = — 2, I — х2-}-10хз—17x4 = 2,	j
— Х2+Юхз — 17x4 = 2.	J
86
Второе уравнение прибавим теперь к третьему и четвер тому- В результате приходим к системе
Xi ~г~ 2х.> — Зх3 “I- 6x4 — 1,
Xi — 10х;, -4-17x4 = — 2,
0 = 0,
0 = 0.
Последние два уравнения превратились в уравнения вида 0-Xi —р-0 • Х2 —0 • Хз —0 • Х4 = 0. Эти уравнения удовлетворяются при любых значениях неизвестных, й их можно отбросить. Чтобы удовлетворить второму уравнению, мы можем для х3 и xt выбрать произвольные значения х3 = а, Х4 = р, тогда значение для х.2 определится уже однозначно: х2=10а—17р— 2. Из первого уравнения значение для Xi также находится однозначно: xt = —17а -|- 29р -j- 5. Так как последняя система равносильна заданной, то формулы
х( = — 17а 4- 293 4-5, х2 = 10а — 173 — 2, Х3 = а, Х4 = ?
при произвольных аир дают нам все решения заданной системы.
Пример 2. Рассмотрим систему
Xi — 2х4 Зхз — 4x1 = 2, 3xj 4- 3Xi — 5х3 4“ Х4 == — 3,
—2xi “I- %% 2х3 — 3x4 — 5, 3xi 4- Зх3 — 1ОХ4=8.
Так как каждому элементарному преобразованию системы соответствует элементарное преобразование над строчками расширенной матрицы этой системы и наоборот, то можно вместо системы оперировать с расширенной матрицей этой системы (производя при этом
87
элементарные преобразования только над строчками):
1	—2	3	—4	2	
3	3 —	5	1	—3	
—2	1	2	—3	5	
3	0	3	—10	в|	
		1	—2	3	—4	2
		0	9	— 14	13 —9
	—>	0	—3	8	—11	9
		0	6	—6	2	2
		1	—2	3	;	—4	2
		0	—3	8	1 —11	9
		0	9	—14	13 —9
		0	6	—6	i	2	2
	1 —2	3	—4	2	1 —2	3	—4	2
	0 —3	8	—11	9	^0—3	8 —11	9
	0	0	10	—20	18	0	0 10 —20 18
	0	0	10	—20	20	0	0	0	0	2
Таким образом, заданная система равносильна следующей:
Xi — 2х2-|- Зх3— 4х4 = 2, )
— Зх-2-|- 8х3—11X4 = 9, I
10хз — 20х4=18, |
0 = 2. J
Полученная система несовместна, так как ее последнее уравнение 0'Х14-0-х2-}-0хз-|-0-Х4 = 2 не может быть удовлетворено никакими значениями неизвестных. Следовательно, заданная система также несовместна.
Пример 3. Решить систему
Xi —|— 2х-2	Зх3 — 2x4 — 1,
2xi — Xi — 2х3 — Зх4 = 2, ЗХ] ~|“ 2х-2 — х3 -j- 2x4 = — о, 2xi — Зх2-|-2хз4- *4=11.
88
акввяж»»
При помощи элементарных преобразований над строчками упрощаем расширенную матрицу системы: 123—21 2 —1 —2 —3	2
3	2—1	2	—5
,2—3	2	1	11
12	3—2	1
0 —5	—8	1	0	>
"*0—4	—10	8	—8
0-7—4	5	9
(из второй строчки вычтем третью и изменим знак у второй строчки)
12	3—21
0	1—2	7	— 8
0 —4 —10	8	—8
0—7—4	5	9
12	3—2	1
0	1	— 2	7	— 8
0	0	—18	36	—40
0	0	—18	54	—47
12	3—2	1
^01—2	7—8
0 0 —18 36 —40 ’ 0 0 0 18 —71
Заданная система равносильна, таким образом, следующей:
—1~ 2х^ —|- Зх3 — 2x4 == 1, х^— 2х3-|- 7xi = — 8, - 18х3 36х4 —40, 18x4 = —7.
Эта система имеет единственное решение:
2	43	13	7
Xi = ^-. Х4 = —та. Ха=^-. Х4 = — та
89
(находим сначала из последнего уравнения, затем х3 из третьего и т. д.).
Для сравнения рекомендуем решить систему этого примера при помощи формул КраАмера.
Упражнения
1.	Решить системы линейных уравнений:
а)	л*! — х2 + 2х3 — Зх4 = 1, л*1 + 4х2 — х3 — 2х4 = —2, х4 4х2 —|— Зх3 —• 2^4 — —2, Xj — 8х2 + 5х3 — 2х4 = —2;
Ь)	хх + 2х2 — Зх3 + 4х4 = 7, 2xi 5х2 “£- х3 — 2х4 ——- о, 3xi — 7х2 + 4х3 + 5х4 = — 11, 7xi + 2х2 — х3 + 11х4 = 6;
с)	Xi —2х2 + Зх3 4х4 == 7,
2X1 +	+ 2х3 + Зх4 = 6,
3xi + 2х2 + х8 + 2х4 = 7, 4xi + Зх2 Ч~ 2х3 Ч~ л*4 == 18,
Отв. a) Xi— — 8, х2 = 3 + а, х3 = 6 + 2а, х4 = а (а — произвольно); Ь) несовместна; с) Xj=2, х2= 1, х3==5, х4 =— 3.
2.	Решить систему при всевозможных значениях параметра t:
2х— уЧ~ 3z =— х + 2у — 6z = fx + 5y—15z = 8.
Отв. При 17^ 5 и —1 система несовместна. Если ^ = 5, 9	15а+ 17	,	.
тох =------г- V —----f. z = a если же ^ = —1, то х = —3,
5 ,	5	’	’
j/ = 3a+ 1, z = a (a — произвольно).
3.	Решить систему при всевозможных значениях параметра t: х+ у— z = 2, х + ty —
(1 + 0* + 2<у —te = 3 + 2t .
Отв. При Z + 0 и t^A система имеет единственное решение х = 2, ^ = у, — . При £ = 0 система несовместна; при t = 1: х — 3— a, у = <х, z= 1. 90
4.	Решить систему линейных уравнений
х3 -|- х3 4- • • • 4- ^п~14" хп — О»	1
4"4" ••• 4" xn~i 4- хп = 1>	I
•г14“л‘2	4“ ••• 4- xn-i 4~ хп = 2, j
Х1 4- Х2 + Х8 + ••• 4" ХП—1	—1» J
Отв. —	(k = 1, 2, ..., п).
Указание. К системе приписать уравнение О = О и к нему прибавить остальные уравнения.
§11. Условие совместности
В предыдущем параграфе нами был изложен довольно простой метод для практического решения системы линейных уравнений с числовыми коэффициентами, дающий возможность, в частности, ответить на вопрос о совместности системы. Однако этот метод не дает возможности сформулировать условие совместности системы в терминах ее коэффициентов и свободных членов. Кроме того, в случае существования решений он не дает явных формул для этих решений, подобных формулам Крамера. В то же время и то и другое необходимо при рассмотрении различных теоретических вопросов.
В этом параграфе мы исследуем в общем виде произвольную систему т линейных уравнений с п неизвестными:
Я1Л-Г a^xt . + alnxn = bi,
QilXi -j- йцХ.	<1-1ПХп=Ь>,	(Р
“Т" ''' Т ^тп^п==: Ьт. ,
Рассмотрим матрицу А этой системы и ее расширенную матрицу В:
	«11	ап ..	•• «1л		«11	ап ..	.. а(л	bl
д=	«•21	«2*2 •	.. «2л	,	8 =	«21	«22	. <	 • O-in	bi
	«ml	«m2 • 	> • «тл		I ат1	«m2 •	• • &тп	ьп
Ясно, что ранги этих матриц связаны неравенством при этом, согласно замечанию 2 из § 9, ранг
91
матрицы В может быть лишь на одну единицу больше Гд.
Вопрос о совместности системы (1) полностью решается следующей теоремой.
Теорема Кронекера—Кап ел л и. Для того чтобы система линейных уравнений была совместна, необходимо и достаточно, чтобы ранг матрицы этой системы был равен рангу ее расширенной матрицы, т. е. чтобы гА = гв.
Доказательство. Необходимость. Пусть система (1) совместна и аь а2, ..., ал — какое-нибудь ее решение. Тогда имеют место равенства
0Ца1 4“ 012а2 4“ * • • 4~ 01лал — Ь1»
021а1 4~ 022а2 4“" • • • 4”	—bi,
0/п1а1 4“ 0/л2а2 4“ • • • 4“ атп*п — Ьт.
В расширенной матрице В системы (1) выполним следующие элементарные преобразования. Из последнего столбца вычтем первый столбец, умноженный на аь второй, умноженный на а2, и т. д., наконец, n-й столбец, умноженный на ал. Получим матрицу
0ц	0п ... ауп	bi — Яной — a12a2 —... — ainart
021	022 • • • 02Л	&2  0‘>lal — 022^2 — • • • — Oirftn
^tnl 0/n2 • • • &тп bm ami^i am%%%	. .. йтп^п
В силу выписанных выше равенств последний столбец матрицы С состоит из нулей:
0ц
021
0/п1
012 • • • 01Л О а&2 * • • а2п О
&т2 • • • ^тп О
Так как матрица С получается из В при помощи элементарных преобразований, то гс — гв по теореме F из § 9. С другой стороны, С отличается от А только столбцом из нулей, поэтому гс = гА (замечание 1 из §9). Следовательно, гв — гА) и необходимость условия ieO* ремы доказана.
92

Достаточность. Предположим, что ранги матриц А и В равны, и докажем, что система (1) совместна.
Пусть г обозначает ранг матрицы А. Среди миноров г-го порядка матрицы А имеется минор, отличный от нуля. Не нарушая общности рассуждения, можно считать, что отличный от нуля минор r-го порядка расположен в левом верхнем углу:
д=	ап ап	.. ап .		^0.
	ап		.. агг	
(Это всегда можно устроить посредством изменения нумерации неизвестных и перестановок уравнений в системе. )
Выделим в системе (1) первые г уравнений и составим из них новую систему
#1Л 4~ ацх% • 4~ ainxn — bi, otiiXi 4- Qi-iXt 4~••• 4“ Огпхя = bt,
(2)
апх14- аГ2х2 4~••• 4" агпхп — Ьг.
Заметим, что в случае г — т система (2) будет совпадать с системой (1).
Покажем, что системы (1) и (2) равносильны (при выполнении условия гв = г4 = г).
Тот факт, что каждое решение системы (1) (если оно существует) является также и решением системы (2), очевиден. Мы должны проверить, что и, наоборот, каждое решение системы (2), если оно существует, является также решением системы (1).
Пусть ai, а2, ..., а„— произвольное решение системы (2), так что имеют место равенства
Л11я1 4- й1'2а'2 4“ • • • 4“ а1лял >
4“	+ •••-!- а2лал == ^2, ,	(3)
«Г!®! ( ^Г2Я2 I * • • 4- 4лЯЛ- ^Г‘ .
Числа у.1, аг, ..., а„ удовлетворяют, конечно, первым г
93
уравнениям системы (1). Мы должны убедиться, что они удовлетворяют и последним т — г уравнениям, т. е. что при s =г-1-2, ..., т справедливы равенства
as№ + as&i + ... + asn*n = bs.	(4)
Рассмотрим расширенную матрицу
	an	aH	... ain	bt a>i	a23	... a>n	b-i
	ari	arl	... arn	br 0/--1,1	2 ••• ar+i, n br+\ fynl	• • • ^mn
и подвергнем ее, как и при доказательстве необходимости, элементарным преобразованиям: из последнего столбца вычтем все остальные столбцы, умноженные соответственно на аь а2,	а„. Мы получим матрицу
с=
a4	• •	• ain			in n
ari	•	•• arn	br	-ariai	• . —«„„a rn n
ar + i	, 1 ’	• • ar + i, n	br +	1-S-+1, iai	. — a	a, • r + i,n n
aM. ml		• • amn	bm		. — a a mn n
Первые г элементов последнего столбца матрицы С равны нулю в силу равенств (3). Что касается остальных элементов последнего столбца, то о них нам пока ничего не известно. Нашей задачей является доказательство равенств (4) для всех s=r-}-l, г-|-2, ..., т. Но доказательство этих равенств, очевидно, равносильно доказательству того, что все прочие элементы последнего столбца матрицы С также равны нулю». Положим для краткости (при s — гЦ-1, ..., т);
Ъ = bs — asi^ - asiy.i —... — asn2n. (5) 94
Тогда матрицу С можно будет переписать так:
	«12	«1-2	. < а-п	«1Л • •	^'1п	0 0	
с=	«г!	аг^ «г 4-1, 2	•	‘ $ ft ' а	0 1г+1	•
		«m2	• • &тп	Тт	
Матрица С получена из В при помощи элементарных преобразований, поэтому ранг С также равен г. Но в таком случае все ее миноры порядка г+1 равны нулю. В частности, равен нулю и минор (г+1)-го порядка, составленный из столбцов с номерами 1, 2, ...
г, и из строк с номерами 1, 2, ..., г, s (где s — любое из чисел r+ 1, ..., т), т. е.
«И Я12	• • •	«1г О
«21	«-22	• • •	«2г О
Лг1	^г2	• • •	&гг
asi • • •	&sr	7$
Разлагая этот определитель по столбца, получим
Д-ъ=о.
элементам последнего
Но Л ф 0, поэтому полученное равенство свидетельствует о том, что = 0. Таким образом, все числа (5) равны нулю, а значит, справедливы равенства (4). Это доказывает, что всякое решение системы (2) удовлетворяет всем уравнениям системы (1).
Установлено, таким образом, что системы (1) и (2) равносильны. Вопрос о существовании решений у системы (1) сведен, следовательно, к вопросу о существовании решений у системы (2).
Если г — п, то система (2) есть система п уравнений с п неизвестными и с не равным нулю определителем (Д ф 0). Согласно теореме Крамера она имеет единственное решение. Следовательно, система (1) также имеет единственное решение.
85
В случае г<^п неизвестным хг+).....хп придадим
произвольные значения аг+), ап и рассмотрим систему
filial 4“ йцХг 4“ Olrxr —	— Oi, r + l®r+l — • • • — 01лал>
а-21Х14“	4- • • • 4- airxr — b.2 — a.2, r+iar+i —... — ainin,
—|— ar^X-2 4- ... - arrXr — br ar< r +	.  • ®*ггр-п'
Определитель Д этой системы г уравнений с г неизвестными не равен нулю, а потому она имеет единственное решение
Xi = ai, x2 = a2, .... xr — v.r.
Совокупность чисел аъ ........ аг, аг+1.....а„ будет,
очевидно, решением системы (2). Так что в этом случае система (2) имеет бесконечно много решений (ведь значения для неизвестных хг+)......хп можно выбрать
бесконечным числом способов). Следовательно, система (1) при г<^п также имеет бесконечно много решений/
Таким образом, если гА = гв, то система (1) совместна.
Теорема Кронекера — Капелли доказана полностью.
Из доказательства теоремы Кронекера — Капелли легко получить также ответ на вопрос о числе решений (в случае совместности системы).
Теорема о числе решений. Пусть для систе-мы т линейных уравнений с п неизвестными выполнено условие совместности, т. е. ранг г матрицы из коэффициентов системы равен рангу ее расширенной матрицы. Тогда, если ранг матрицы системы равен числу неизвестных (r — п), то система имеет единственное решение. Если ранг матрицы системы меньше числа неизвестных (г<^п), то система имеет бесконечно много решений, а именно-, некоторым п — г неизвестным можно придавать произвольные значения, тогда оставшиеся г неизвестных определятся уже единственным образом.
В самом деле, если r — п, то система (2) имеет единственное решение. Если же г<п, то система (2) имеет бесконечно много решений и все ее решения являются решениями системы (1).
Замечание 1. Если ранг матрицы системы линейных уравнений равен числу уравнений, т. е. если 96
г = т, то система совместна при любых свободных членах. Действительно, в этом случае ранг расширенной матрицы также равен т, так как ранг матрицы не может быть больше числа ее строчек.
Замечание 2. Доказательство теоремы Кроне-кера — Капелли позволяет также дать явные формулы для решений системы (в случае ее совместности). Если уже известно, что система совместна, то, чтобы найти ее решения, необходимо:
1)	отыскать в матрице системы А ранга гА — г отличный от нуля минор r-го порядка Д;
2)	отбросить те уравнения, которые соответствуют строчкам матрицы А, не входящим в определитель Д;
3)	члены с коэффициентами, не входящими в определитель Д, перенести в правую часть, а затем, придавая неизвестным, находящимся в правой части, произвольные значения, определить по формулам Крамера оставшиеся г неизвестных из системы г уравнений с отличным от нуля определителем Д.
Пример. Решить систему
х — 2//-|-Зг — 5ы = 2, 2х -у 4z -I- и — — 3, Зх — Зу 8г — 2и = — 1, 2х — 2у-\ 5z — l2u —	4,
следуя доказательству теоремы Кронекера — Капелли.
Вычисляем ранг матрицы этой системы и ранг расширенной матрицы. В обоих случаях он равен 3. Следовательно, система совместна. Так как ранг матрицы системы меньше числа неизвестных, то система имеет бесконечно много решений: одно неизвестное может быть взято произвольно. Минор
1 -2 3
2	14=1
3 —3 8|
отличен от нуля, поэтому последнее уравнение отбрасываем и неизвестному и придаем произвольное
4	3. И. Боревич	97
значение а. Оставшиеся неизвестные определяются системы
х — 2у -|- 3z —	2 Н- 5а,
2х -ф- у 4- 4z — — 3 — а, Зх — Зу 4- 8z = — 1 4- 2а.
из
Решая последнюю систему (по формулам Крамера или иным способом), находим х = 30 4-71а, у= — 7—15а, г — —14 — 32а. Присоединяя сюда и — а и придавая а произвольные значения, получаем все решения заданной системы.
Заметим, что приведенный нами путь решения примера не является единственным. В качестве А можно было взять минор
1 4	1
— 3 8 — 2 , — 2 5 —12
который также отличен от нуля. В этом случае мы отбросим первое уравнение и х придадим произвольное значение, а все остальные неизвестные найдем из трех последних уравнений. Ответ мы получим, конечно, в другой форме.
Замечание 3. Изложенное в настоящем параграфе применимо, разумеется, и к случаю, когда число уравнений в системе совпадает с числом неизвестных. Пусть А — определитель некоторой системы п линейных уравнений с п неизвестными. Если А 0, то ранг матрицы из коэффициентов г равен чйслу неизвестных п, и поэтому система совместна при любых свободных членах (см. замечание 1) и имеет единственное решение. Этот факт совпадает, как видим, с теоремой Крамера, которая только к этому случаю и применима. Если же А = 0, то г<^п, и тогда возможны два случая: либо система несовместна (если гв Ф г), либо она имеет бесконечно много решений (если гв — г). Мы видим, таким образом, что система п линейных уравнений с я неизвестными имеет единственное решение тогда и только тогда, когда определитель этой системы отличен от нуля.
98
§ 12. Однородные системы линейных уравнений
Линейное уравнение вида
«1X1-4-... 4- апхп = b
называется однородным, если в нем свободный член b равен нулю. В соответствии с этим систему линейных уравнений мы называем однородной, если все ее свободные члены равны нулю. Произвольная однородная система линейных уравнений имеет, таким образом, вид
4“	4~	•	•	•	“Г	а1п*п — О,
«21X1 4~ «22*^2 4"~ * ’ * “Г z==‘ О,
^1X1 4- ^т^-2 ~j— • • • 4~ ttinnXn 0* ,
(1)
Однородная система всегда совместна, так как она имеет следующее очевидное решение:
Xi = 0, х2 = 0, ..., хп — 0.
Это решение (у которого все значения неизвестных равны нулю) называется нулевым или тривиальным. Всякое другое решение (если оно есть), у которого значение хоть одного неизвестного отлично от нуля, называется ненулевым или нетривиальным.
Совместность системы (1) можно, конечно, установить и с помощью теоремы Кронекера — Капелли: так как расширенная матрица В получается из матрицы системы А приписыванием столбца из нулей, то, по замечанию 1 из § 9, мы имеем гв — гА, а значит, система совместна.
Для однородных систем представляет особый интерес вопрос о существовании ненулевых решений.
Обозначим ранг матрицы системы (1) через г и применим к ней теорему § 11 о числе решений. Если г — = п, то система имеет единственное решение, и так как этим единственным решением является нулевое решение, то ненулевых решений в этом случае нет. Если же г<^п, то система имеет бесконечно много решений и среди них, понятно, имеется бесконечно много ненулевых решений (ведь нулевое решение только одно). Имеет место, таким образом, следующая основная теорема об однородных системах.
4*	99
Теорема 1. Для того чтобы однородная система линейных уравнений имела ненулевое решение, необходимо и достаточно, чтобы ранг матрицы системы был меньше числа неизвестных (г<^п).
В частном случае, когда число уравнений совпадает с числом неизвестных (т — п), условие г<^п равносильно, очевидно, тому, что определитель системы равен нулю (Д = 0). Для этого частного случая мы можем поэтому сформулировать следующую теорему.
Теорема 2. Для того чтобы однородная система п линейных уравнений с п неизвестными имела ненулевое решение, необходимо и достаточно, чтобы определитель этой системы был равен нулю.
Отметим еще один частный случай, когда т<^п. Так как ранг матрицы не может быть больше числа ее строчек (как и числа столбцов), то rs^m. Следовательно, если т<^п, то и г <^п, а значит, по теореме 1, система имеет ненулевое решение. Этим доказана сле-
дующая теорема.
Теорема 3. Если число уравнений в однородной системе линейных уравнений меньше числа неизвестных,
то эта система имеет ненулевые решения.
Пример. Покажем, что на плоскости с декартовой системой координат три точки (хь yi), (хг, у8), (х3, г/з) — лежат на одной прямой тогда и только тогда, когда определитель
Х1
Д = х^
У1
yt
1
1
1
*з у3
равен нулю. Пусть ах-\-Ьу-}-с = 0 есть уравнение прямой, на которой лежат наши точки. Тогда
ах] -j-by-i Ц-с = 0, aXi -j- by.2 с = О, ах» -|- Ьу3 -4- с = 0. >
(2)'
Так как а, Ь, с не равны 0 одновременно, то последние равенства означают, что однородная система трех уравнений с тремя неизвестными и с определителем Д имеет ненулевое решение, а тогда, по теореме 2, Д = 0. Наоборот, если Д —0, то существуют а, Ь, с, не рав-100
ные 0 одновременно, для которых выполнены равенства (2). Если бы а и b вместе равнялись нулю, то и с равнялось бы нулю, т. е. все три числа а, Ь, с были бы нулями, а это не так. Следовательно, хотя бы одно из чисел a, b отлично от 0, а значит, ах-\-Ьу-\-с=Ъ является уравнением прямой. Координаты наших точек удовлетворяют этому уравнению, поэтому все они лежат на одной прямой.
Упражнения
1.	Решить систему
*i + 2х2 + х3 + *i = 0, ’
2Х} ~I- 5Xg “I- *3 4" 5Xj == 9, ’
Зл*! + 8*2 + *3 + 9*4 = 9. -
Отв. х{ = — За + 50, х2 = а — 30, х8 = а, х4 = 0 (а и 0 произвольны).
2.	Решить систему при всевозможных значениях параметра X:
(2 — X) л*1 4“	*2 +	*з 9, j
*i 4" (2 — X) *g-|~	*з==9, ?
*14“	*2 4“ (2—X) х8 = 0. J
Отв. При X = 1 xt = a, х2 = 0, х3== —a—0; при Х = 4 Xi=-a, *2 = а, *з = а; при остальных значениях X система имеет только нулевое решение.
3.	При каких X однородная система
— ^-*14“ *г4“-’*	4" *п = 9, ’
*i—Хх24-...	4-*л = 0> ,
*14“ *2 4”,е* —Ххл=о
имеет ненулевые решения?
Отв. При Х = п—1 и Х=—1 система имеет ненулевые решения.
Г Л A В A III
ДЕЙСТВИЯ НАД МАТРИЦАМИ
§ 13. Умножение матриц
В различных разделах математики часто приходится иметь дело с переменными xt, х2, хг-, которые являются функциями других переменных yi, уг, ... • • • > Уп-
Xi =<?1 (t/Ь у-г, •••, Уп),
Xi =<fi (yh yi..yn), ,
xm—<fm(yt, y-2, •••, у„)• .
Такого рода выражение одной системы переменных через другую носит название преобразования переменных.
Одним из примеров преобразований переменных являются формулы преобразования координат в аналитической геометрии. Пусть на плоскости мы имеем две прямоугольные декартовы системы координат хОу и x'Otf с общим началом О, причем вторая система расположена под углом а относительно первой. Тогда, как известно, координаты х, у произвольной точки М. в первой системе координат выражаются через координаты л/, У той же точки во второй системе по формулам
X — х' cos 1 — if sin а, | у — х' sin а -\-у’ cos а. J
Если одну из координатных систем, например x'Otf, мы заменим на косоугольную и при этом изменим мас-102
штабы на каждой из ее координатных осей, то формулы преобразования координат примут более общий вид:
х — ax' by', 1 у = ex' -|- dy', J где коэффициенты могут быть любыми вещественными числами, удовлетворяющими единственному условию ad — be ф 0.
Аналогичные формулы преобразования координат имеют место и для точек пространства:
х = atf 4- bit/ 4-у = а2х' 4“^/ 4“^, ’ г = а3^4“М'4“^'. -
Приведем еще один пример. Пусть через начало О некоторой системы координат Oxyz в пространстве проведена плоскость Р, на которой выбрана своя система координат uOv (с тем же началом О). Каждую точку пространства М спроектируем на плоскость Р. Тогда координаты и, v проекции будут выражаться через координаты х, у, z проектируемой точки по формулам
u — aiX-{-a2y~\-a^zt 1
v = Ь}Х 4~ Ь2у 4- b3z, )
где а3, bi, b2, Ь3 — некоторые постоянные вещественные числа.
Во всех рассмотренных нами примерах одна система переменных выражается через другую при помощи однородных многочленов первой степени. Такие преобразования носят название линейных. Дадим определение линейного преобразования в общем виде.
Определение. Линейным преобразованием переменных называется выражение одной системы переменных Xi, х2, ..., хт через новую систему переменных уь Уь • ••> Уп при помощи линейных однородных функций*.
Xi — a^yi 4" ar2Z/2 4~ • •• 4~ агпУп>
Xi — a2iyi 4“ а&У* 4“ • • • 4" а*пУп> м (j)
Хт = С1П1\У1 “j~ ^т^Уч 4~ • • • 4~ Umnyn. <
103
Здесь а,7 — постоянные числа (вещественные или комплексные). Заметим, что число старых переменных
Xi, Xi, хт и число новых переменных yit уг, ...» уп не обязательно одно и то же.
Матрица
ап	ап	...	Я1я
_	du	ва	•••	Chn
&ml	&mi	• • •	&тп
составленная из коэффициентов при переменных уи уг, .... уп, называется матрицей линейного преобразования (1).
Если матрицы двух линейных преобразований одинаковы (т. е. имеют одинаковое число строчек и столбцов и соответствующие элементы обоих матриц равны), то эти преобразования могут отличаться друг от друга лишь наименованием переменных, что не имеет существенного значения. Мы условимся поэтому два линейных преобразования считать одинаковыми или равными, если их матрицы равны. Например, линейные преобразования
Xi == 2^i	3z/2, 1	х = 2« —Зу, )
о и	of
Xt= У1 — 2уг J у= и — 2и ) одинаковы, так как оба преобразования имеют одну и ту же матрицу
2	3
1 —2 ’
Пусть помимо линейного преобразования (1) задано другое линейное преобразование, выражающее переменные yi, уч, уп через третью систему переменных Zi, zs, ..., zp:
yi — bttZi -|- bjiZ-г -|-... bjpZp,
У2 = Ьц2\-[-baZi-]-.. btpZp, >	(g)
yn==bntZi bni2i-\-. ••-{-bnpZp.
Матрицу линейного преобразования (2) обозначим через В. Так как переменные хь х2, ..., хт являются 104
функциями переменных уь ylt ..., уп, а последние в свою очередь являются функциями zif z^ ..., zp, то переменные х>, .хт можно рассматривать как функции от zb Zt, ..., zp. Чтобы получить явное выражение переменных хь х>, хт через zb z2, zp, следует выражения для yif у^ уп из (2) подставить в правую часть равенств (1). После приведения подобных членов получим
Х1 —-j-CizZi -j- . .. 4“ C\pZp, X* — C<aZ[ 4*' ^2’2^2 ~г • • • 4" CfyZpt
Хт
'трьр,
где Cij — некоторые новые постоянные числа.
Таким образом, в результате последовательного выполнения двух линейных преобразований переменных мы снова получаем линейное преобразование. Операция замены двух последовательно выполненных линейных преобразований одним называется умножением линейных преобразований. Полученное при этом линейное преобразование называется произведением двух данных линейных преобразований.
Обозначим матрицу линейного преобразования (3) через С и найдем формулы, выражающие элементы матрицы С через элементы матриц А и В. Элемент счесть коэффициент при Zj в выражении для xh Мы имеем X/ — a^yi 4~	4" • • • Н- а1пУп —
= ан (• • • 4- jzj • • •) 4- аг2 (• • • 4- btjZj 4~ • • •) 4"
’Т" &in (• • • 4“ bnjZj 4“ • • •)
= . . .4~(ail^lj “Г Л/2&2/4“-	••
Следовательно,
^г7 = ^/1^1/4“а/2^2/4^ ♦ • • 4~ ainbnj*
Таким образом, элемент г-й строчки /-го столбца матрицы С равен сумме произведений элементов i-й строчки матрицы А на соответствующие элементы /-го столбца матрицы В.
Поскольку линейное преобразование (3) есть произведение линейных преобразований (1) и (2), то матрицу
105
С естественно назвать произведением матриц А и В. Мы приходим, таким образом, к следующему определению произведения матриц, заданных вне связи с линейными преобразованиями.
Определение умножения матриц. Пусть даны две матрицы
Ian	аи	...	а\п
ja>i	ал	...	а:п
!,.......................
l|	•••	&тп
Ьц ... Ь1Р
Ьц Ьц ... Ь2р
ЬП1 Ьп2 ... Ьпр
,(4)
в =
причем число столбцов матрицы А равно числу строчек матрицы В. Произведением матрицы А на матрицу В называется матрица
Си	Сц	. ..	Cip
Сц	Сц	. ..	Cip
Сщ\	•	•	•	Стр
обозначаемая через АВ, элементы которой вычисляются по формулам
п
Cij —— ацЬ\ j -}- aiibi j	... —ainbnj = ctiSbSj
s~ 1
(7=1, 2, ..., т\ /=1, 2, ..., р).
Согласно нашему определению не всякие две матрицы можно перемножить. Произведение двух матриц имеет смысл тогда и только тогда, когда число столбцов первого множителя равно числу строчек второго множителя. При этом в произведении получается матрица, число строчек которой равно числу строчек первого множителя, а число столбцов равно числу столбцов второго множителя. Схематически последнее-утверждение можно изобразить следующим образом:


106
Что касается правила для вычисления элементов в произведении двух матриц, то его схематически можно изобразить так:
1
1
1
Возвращаясь к линейным преобразованиям, можно сказать теперь, что матрица произведения двух линейных преобразований равна произведению матриц этих преобразований.
Пример 1. Перемножить матрицы
1 2 3 Л = , , „ 4 5 о
Произведение АВ и
столбцов матрицы А равно числу строчек матрицы В:
2
4
1
и В —
3
9
1
смысл,
поскок
число
АВ =
1.1 _|_2.1 4-3.1 1 • 1 4-2.24-3-3 1.14-2.44-3.91
4.14.5.14.6.1 4.14-5-24-6.3 4-1-|-5• 4-|-6• 9 |— _________________________________ I 6 М 36 II — I 15 32 78 ||*
Произведение	В на Л	здесь не 1	чмеет смысла.
Пример	2. Пусть		
			1	2
Л =	2 1 -	- 1 „ > 1	3=1—2.
	0 3	5	1	3
Тогда			
			2	7	9 1
АВ= 2	! —1	BA —	2 —5 —11 |
£	1	9 ’		2	10	14 j
Оба произведения, АВ и ВА, здесь имеют смысл, но являются различными матрицами (даже различных порядков).
107
Пример 3. Пусть 12 5
Л = |1 3’
Тогда
11 -1911
АВ== I? — 12||’
-2	3||
3 - 5-|-
ВА —
— 1 - 1 I
1 О,

Пример 4. Заданы два линейных преобразования:
— 3z/i 4- у*, Хз — — У\ -г Уг< .
У\ — гз — гз — 1/2 — 2?1 -j-	-4- 2з — 3Zf.
(а)
(Ь)
Найти произведение линейных преобразований (а) и (Ь). Матрица искомого линейного преобразования равна
1 —2 3	1 - 1	1	1 1 —1 —1! 2 1	1—3	=	— 3—1 —3 5 5	4-2-6 1	0	2 — 2
следовательно,
Xi — — 3z, —	— 3z3 + 5г4, '
Хз — 5zi + 4zs — 2z3 — 6г4, Хз— Zi -L-2z3 —2г4. ,
Из примеров 2 и 3 следует, что умножение матриц не подчиняется перестановочному (коммутативному) закону, т. е., вообще говоря, АВ Ф В А (речь идет о случае, когда оба произведения, А В и В А, имеют смысл). Конечно, в некоторых отдельных случаях может оказаться, что АВ = ВА. Например,
1 2|| — 1 8
— 1 з| -4 7
1 2Ц~
-1 3| II-
9 221| п 13 |г
— 1 8
— 4 7
Если для двух матриц А и В имеем АВ —В А, то матрицы А и В называются перестановочными. Очевидно, что это может иметь место только в случае, когда А и В — квадратные матрицы одного и того же порядка.
108
Матрица
hi, а-,...........а„||.
состоящая из одной строчки, называется просто строчкой. Матрица
bi bi
состоящая из одного столбца, называется столбцом. Произведение строчки на столбец имеет смысл, очевидно, только при условии, что «длина» строчки равна «высоте» столбца. При этом в произведении получается квадратная матрица 1-го порядка (имеющая одну строчку и один столбец), т. е. просто число. Например,
П 2 3|| | — 4 =|| — 3|| = —3.
Произведение столбца на строчку всегда имеет смысл. Например,
ах ay az bx by bz
Каждую матрицу мы можем рассматривать как совокупность строчек (записанных в определенном порядке) или как совокупность столбцов. Например, если для матриц (4) мы положим
S,- = h,i а,ч ... а,л!|, Tj =
I bnj то эти матрицы можно будет записать в виде
А —
Si
Si
B — ^Ti Ti...TPl
109
Замечая теперь, что
SjTу У I Cti'&lj । • • • Т
(согласно правилу умножения строчки на столбец), мы можем произведение АВ представить в виде
	jSiTt	S1T2 .	• • StTp
АВ =	|S2Ti	S.2T, .	.. s.,Tp
	1 SmT 1	SmT<i ..	• • srnT p
Если длина строчек матрицы А равна высоте столбца Т, то имеет смысл произведение АТ, которое является, очевидно, столбцом (число строчек этого столбца равно числу строчек матрицы Л). Легко видеть, что для матриц (4) произведение АВ может быть записано также и следующим образом:
ЛВ = Л||Л Т2 ...	11=11 ЛТ, ATi ... ЛТД (5)
Аналогично
АВ —
Пользуясь правилом умножения матриц, можно линейное преобразование (1) записать в виде одного матричного равенства. Действительно, введем в рассмотрение столбцы
из переменных х2, х-2, ..., xm и у2, у.2, ..., у„
НО
соответственно. Тогда
antji -\-аР2у* -т---- + а}пуп а^У1 + а^у> Ч~ • •. + ^пУп
&т1У1 Ч- С^т^У'! “Ч • • • “Т" ^тпУп
Xi
х2
Хт
Мы видим, таким образом, что система равенств (1) равносильна матричному равенству
X = AY.
(Здесь мы использовали условие равенства матриц: две матрицы равны тогда и только тогда, когда они имеют одинаковое строение и равны их соответствующие элементы.)
Как мы уже отмечали, умножение матриц некоммутативно. Однако для матриц справедлив сочетательный (ассоциативный) закон умножения.
Теорема 1. Пусть А, В и С — три матрицы, для которых произведения АВ и ВС имеют смысл. Тогда произведения (АВ) С и А (ВС) также имеют смысл и имеет место равенство
(АВ)С = А(ВС).
Доказательство. По условию число столбцов матрицы А равно числу строчек матрицы В, а число столбцов матрицы В равно числу строчек матрицы С. Следовательно,
(эта схематическая запись означает, например, что А имеет т строчек и п столбцов). Тогда
AB = G —
ill
Отсюда легко усматриваем, что произведения (АВ) С и А (ВС) имеют смысл; при этом
Q
(AB)C = GC = U = т
__?
A(BC) = AH=V = in\
Таким образом, матрицы (AB)C = U и Д(ВС) = У имеют одинаковые строения. Для доказательства теоремы надо теперь убедиться, что соответствующие элементы этих матриц равны.
Будем обозначать элементы всех встречающихся в доказательстве матриц соответствующими строчными буквами с двумя, как обычно, индексами внизу (первый индекс — номер строчки, второй — номер столбца). Тогда, согласно правилу умножения матриц, для любого i — 1, 2........ти любого 1, 2................ q мы
будем иметь
«1/ = gilClj + giiCij +:• 4" gipCp j =
= («11^11 4~ aitbn 4" • • • 4- ain^nt) C1 j 4-
4* (cii 1 bn 4- ИцЬц 4- ... 4-	Cij
4	| Cli-blp 4“ ’ • • I Qinbnp) Cpp	(6)
4~	4- * • * 4“ Q'inhnj —
— «л (biiCtj । bfcCij । ... 4~ bipCpj) 4“ ait (bilCi j -{-	j 4~ • • • 4“ Ь-IpCp j) 4“
4 ~	(bniCl j T" bn«Cij 4- . .. - — bnpCpj).	(7)
Выражение (6) легко преобразуется в (7); для этого надо в (6) раскрыть скобки и привести подобные члены относительно а», ai3, .... ain. Следовательно, ы,7 = о,7, т. е. соответствующие элементы матриц U и V равны, а значит, и сами матрицы равны. Таким образом, (АВ)С = А(ВС), и теорема 1 доказана.
Замечание 1. Вторую часть доказательства теоремы 1 можно записать короче, если воспользоваться знаком суммирования £ и использовать один простой факт, относящийся к двойным суммам. Пусть индексы i и / независимо друг от друга пробегают значения 1 = 1, 2......т и /= 1, 2........... р, и пусть каждой
паре I, j этих индексов сопоставлено некоторое число d,y. 112
Числа dij мы можем, конечно, расположить в виде прямоугольной матрицы Dem строчками и р столбцами. Просуммировав в матрице D элементы каждой строчки, мы получим выражения
р	р	р	'
d\j, — J d*jt	— 2 dmj.
j = i	7= i	j= i
Сумма о всех чисел dij тогда примет вид ’ т	т / р \
С другой стороны, мы можем определить сначала сумму элементов каждого столбца матрицы D и сложить затем все полученные значения. Следовательно, сумму о мы можем записать также в виде
р ( т х
X (S м
Сравнивая оба результата, мы приходим к формуле
т , р к р / т \
2 2<|=2(£Ч	<8>
i=iV=i /	/
означающей, что в двойной сумме можно изменить порядок суммирования.
Вернемся к доказательству теоремы 1. В силу отмеченного свойства двойных сумм равенство Uij — Vij может быть установлено следующей выкладкой:
Замечание 2. Пусть последовательность матриц Л, Д2, •••, Ат такова, что произведение AiAi^ любых Двух соседних матриц имеет смысл. Тогда индуктивно может быть определено произведение AiA> ... а именно, считая, что для случая т — 1 сомножителей
113
произведение уже определено, полагаем
Л1Д-2 • • •	— (Д1Д-2 • • • Д 777-1) Д777-
ЧИСЛО строчек в этом произведении равно числу строчек первой матрицы Дь а число столбцов равно числу столбцов последней матрицы Ат. Пользуясь теоремой 1, индукцией по числу сомножителей т легко можно показать, что для любого i— 1, 2, ..., т—1 имеет место равенство
Д1Д2... Ащ — (Д1Д2 ... Ai) (Дi+i ... Дт)- (9)
В начале § 4 для случая квадратных матриц нами было введено понятие транспонированной матрицы. Перенесем это понятие на случай произвольных прямоугольных матриц.
Определение. Пусть дана матрица
Матрица
Д =
Д' =
	ai2 .	.. а1п
^21	а^ .	
«7771	аГЛ^ .	• • Щпп
ЯЦ	П-21	G ml
	..	. ат%
ain	скп	• G/nn
получающаяся из А заменой строчек на столбцы, называется транспонированной с А. Операция замены матрицы А на А' называется транспонированием.
При транспонировании, как видим, меняется строение матрицы (если т п), а именно:
п	т
если А — т , то Д' = Л,
Например, если	
\\а	b	с Д = А || Я]	Р]	С1	21 со
114
то
|| а а;
A’=\b bi к с,
х\ у\-
z
При транспонировании строчка превращается в столбец, а столбец — в строчку.
Если операцию транспонирования применить дважды, то мы вернемся, очевидно, к исходной матрице:
Д" = (Л')' = Л.
Связь между элементами матриц Л и А' выражается формулой
a;7=ay/)	(10)
где a'ij обозначает элемент i-й строчки /-го столбца матрицы А'.
Теорема 2. Пусть А,.и В — две матрицы. Если произведение АВ имеет смысл, то
(АВ)' = В'А'.
Другими словами, чтобы транспонировать произведение матриц, надо транспонировать сомножители и записать их в обратном порядке.
Доказательство. Пусть
Тогда
А =
т
п
в'=р
А' = „
так что произведение В'А'
имеет смысл. Далее,
ЛВ —G =
Матрицы (АВ)' и В'А’ имеют, таким образом, одно и
-115
то же строение. Для доказательства теоремы остается теперь проверить, что соответствующие элементы матриц G’ и U совпадают.
Обозначим элементы всех встречающихся здесь матриц соответствующими строчными буквами с двумя индексами (из которых первый обозначает номер строчки, а второй — номер столбца). Тогда, согласно формуле (10), мы будем иметь
п	п
Uij= bisk's] ==	й] sb si :==gji == gij*
s = 1	s — I
Таким образом, соответствующие элементы матриц U и G' равны между собой, а значит, G' = t/, что и требовалось доказать.
Замечание. Теорема 2 легко может быть обобщена на случай произвольного числа сомножителей. Например, если АВ и ВС имеют смысл, то (АВСу =С'В'АГ.
Среди квадратных матриц п-го порядка особую роль играет матрица
1 0 ... 0II 0 1 ... о!
I
0 0 ... 1||
у которой все элементы, расположенные на главной диагонали, равны единице, а все прочие равны нулю. Эта матрица называется единичной матрицей п-го порядка и обозначается через Еп или, если ясно, чему равен ее порядок, через Е. Свое название матрица Е получила благодаря следующему свойству.
Теорема 3. Для любой прямоугольной матрицы А с т строчками и п столбцами мы имеем
ЕтА — А,	АЕп = А.
Действительно, элемент ;-й строчки /-го столбца матрицы EmA=U равен
u ij = 0 • a\j -j— ...	1 • aij	0 • атj = aij,
а значит, U = Л. Аналогичной проверкой устанавливается и второе равенство.
116
Для единичной матрицы Е = Еп соответствующее линейное преобразование переменных имеет вид
*1 =Уь
*> =	У1,
^п. ==	Уп' t
(И)
Это преобразование оставляет, по существу, все переменные без изменений; меняется только их наименование. Преобразование (11) называется тождественным преобразованием.
Очевидно, что линейное преобразование с матрицей А не изменится, если до него или вслед за ним выполнено тождественное преобразование (меняется только наименование старых или соответственно новых переменных). Этим мы еще раз другим способом убедились в справедливости теоремы 3.
Две квадратные матрицы одного и того же порядка всегда могут быть перемножены, при этом в произведении получится опять-таки квадратная матрица того же порядка. В силу этого мы можем определить степени квадратных матриц.
Пусть А — произвольная квадратная матрица и-го порядка. По определению полагаем
А° — Е, Л! = Л, A2 = AAt Л3 = ЛЛЛ,...
(здесь Е — единичная матрица n-го порядка). В силу ассоциативности умножения матриц произведение
ЛЛ^
т раз
не зависит от способа расстановки в нем скобок (см. замечание 2 к теореме 1), поэтому степень Ат определена однозначно.
Из определения легко следует (см. равенство (9)), что для любых целых неотрицательных k и I имеют место формулы
XMz = 4*bZ,	(12)
(4*)'=MW.
117
Из первой формулы в качестве следствия получаем, что
ЛМ'^ЛМ*.	(13)
т. е. две степени одной и всегда перестановочны.
той же- квадратной матрицы
Упражнения
Перемножить матрицы
1.
з 1
4
1
— 2
4
а)
2
3
2
1
2
— 2
1
— 2
5
Ь)
2
3
— 1
3
— 2
02 3 41|
5
с)
d)lp
1
Отв. а) — 1
2
0
12
3
20
1 Ь) ; d)
19;
11°
О
с)
0
0 ’
1
— 3
3
-1
з 411
2 I
3
4
2
1
— 2
1
— 3
1
2
1
2
1
1
1
— 2
3
— 5
4
6
6
5
2
7
2. Найти х, у, z из равенства
z = 1.
произведение
Отв. х = 2, у = — 1, 3. Найти двумя способами
Отв. 116
П
80
8
541
15 '
1
2
— 1
— 2
1
5
1
2
3
2
— 2
1
2
— 1
3
1
— 1
2
3
2
1
— 2
3
4
— 1
3
1
5
2
4.	Найти все матрицы, Отв.
перестановочные с матрицей
а -]- 8 5а а 8
где а и р— произвольные числа.
118
5.	Для произвольной матрицы А обозначим через А матрицу, изучающуюся из А заменой всех ее элементов комплексно сопряженными числами.
Доказать, что если АВ = С, то Д5 —С-
6.	Квадратная матрица n-порядка называется симметричной, если она совпадает со своей транспонированной матрицей. Доказать, что если две симметричные матрицы перестановочны, то их произведение есть симметричная матрица.
7.	Найти степени
с
а)
11| * Ь) || cos © — sin © || * 11|	|| sin © cos ||
Отв. a) |l I n || b)
||O 1|:
COS nep
Sin Пер
— sin nep || COS nep ||
8.	Пусть A — квадратная матрица п-го порядка, у которой все элементы, расположенные на главной диагонали и ниже ее, равны нулю. Доказать, что тогда Ап есть нулевая матрица (т. с. состоит сплошь из нулей).
9.	Найти n-ю степень матрицы
II1 2 3
А = О —3 — 6 .
||0	2	4‘
Отв. А.
10.	Пусть А и В — две квадратные матрицы. Доказать, что сумма элементов, стоящих на главной диагонали, для матриц АВ и ВА одна и та же.
§ 14. Сложение матриц и умножение матрицы на число
Определение. Пусть даны две матрицы А и В одинакового строения. Их суммой называется матрица С~ А В того же строения, элементы которой равны суммам соответствуюи их элементов матриц А и В.
Элементы матрицы С — А -р В определяются, стало быть, формулами
Oi j — a; j —|— bf j,
где aij и bij — элементы матриц А и В соответственно. Например,
|| 1	—2	31	|2	3	4|_||3	1	7
|j5	1	— з|ч|1	3	5!=||б	4	2'
Подчеркнем еще раз, что складывать можно только Матрицы с одинаковым числом строчек и с одинаковым
119
числом столбцов. Выразим этот факт схематически.
п	п	II
Очевидно, что сложение матриц подчиняется переместительному (коммутативному) и сочетательному (ассоциативному) законам, т. е.
Д + В = В4-Л,	(1)
(Л4-В) + С = Л-НВ + С).	(2)
Действие сложения матриц может быть распространено, разумеется, и на случай любого числа слагаемых. Вычитание для матриц (как и для чисел) определяется как действие, обратное сложению. Разностью В — А матриц В и А (одинакового строения) называется такая матрица X, что
А-^Х-^В.
Легко видеть, что матрица X, удовлетворяющая этому условию, всегда существует, и притом только одна. Ее элементы х,7-определяются равенствами
х,7 = &,7 —а,7.
Таким образом, при вычитании матриц вычитаются соответствующие элементы этих матриц.’ Например,
II	7	5	113	3	3|| 11-2	4 21
|2	9	— 7	||5	—2	—9|| = ||-3	11 2Г
Матрица О, все элементы которой равны нулю, называется нулевой матрицей.
Очевидно, что
А-\-О = А,	А — А=О.
Разность О — А обозначается через — А, так что Д-Н — Д) = О. Например, если
Матрица — А называется противоположной матрице А, 120
Теорема 1. Сложение матриц связано с умножением распределительными (дистрибутивными) законами:
(А-]-В) С —АС А-ВС, D(A-±-B) = DA-±DB
(при этом предполагается, что выражение слева или справа имеет смысл).
Доказательство. Предположим, что левая часть первого равенства имеет смысл. Тогда А и В имеют одинаковое строение. Пусть они имеют по т строчек и по п столбцов. Такое же строение имеет и матрица А-'гВ — Н. Так как НС имеет смысл, то С состоит из п строчек и, скажем, из р столбцов. Произведение НС — Х имеет т строчек и р столбцов. Обратимся теперь к правой части. Так как число столбцов в матрицах А и В совпадает с числом строчек в С, то существуют произведения АС = Н и BC=V; при этом оба они имеют т строчек и р столбцов. Следовательно, их сумма U + V = Y имеет смысл и также имеет т строчек и р столбцов. Установлено, таким образом, что матрицы Х — (А-гГВ)С и Y — = АС ВС имеют одинаковое строение. Сравним соответствующие элементы этих матриц.
Обозначим, как и прежде, элементы матриц соответствующими строчными буквами. Тогда для любого t=l, 2.....т и любого /=1, 2......... р мы будем
иметь
п	п	п
Xij—г	J ЛIscsj =	(&is “Г bjs) Cs J = ;	^^5/)===
5 = 1	5=1	5=1
п	п
'=== CLisCs]' Xj bisCsj === Ui j “j” j == У i j* 5=1	5 = 1
Таким образом, X = Y и первое равенство теоремы 1 Доказано (мы предполагали, что левая часть имеет смысл; можно было исходить из предположения, что правая часть имеет смысл).
Второе равенство доказывается аналогично.
Замечание. Доказанный нами дистрибутивный закон умножения может быть распространен, конечно, на случай произвольного числа слагаемых, а также 121
на случай разности. Например,
А(В^В^ ... 4-Вт) = ЛВ1 + ЛВ4- ...
(Л1 4- Ai) (Bi 4~ В^	B3) —
— A1B1 4* A1Bi A1B3 -f~ Л2В1 4" AiB-i -j~ АгВь (A — B)C — AC — BC.
Определение. Произведением матрицы А на число а называется матрица, получающаяся из А умножением всех ее элементов на а.
Обозначается это произведение через аЛ или Ла.
Пример.
Il ai а-2 Оз || || ®Oi «а2 аа3 а|р1 bt &з|| ||а&1 abi аЬз
При умножении матрицы на число ее строение, как видим, сохраняется.
Очевидно, что
1-Л = Л, (—1)Л = -Л,	0-Л=0.
Легко проверяются также следующие свойства:
афЛ) = (ар)Л,	(3)
(а4-^)Л=аЛ+М.	(4)
а(Л4-В) = аЛ4-аВ.	(5)
Теорема 2. Если произведение АВ имеет смысл, то
а(ЛВ) = (аЛ)В = Л(аВ).
Другими словами, чтобы умножить произведение матриц на число, достаточно один из сомножителей умножить на это число.
Доказательство. Пусть матрица А имеет т строчек и п столбцов, а матрица В — п строчек и р столбцов. Ясно, что все три произведения имеют одно и то же строение. Далее, для любого i — 1, 2,..., т и любого /=1, 2,..., р мы имеем
а У, aisbsj= У, («fl/s) bsj= 2 Qis (^sj).
S = 1	s = l	5 = 1
Следовательно, элементы, стоящие на одинаковых местах, у всех трех матриц совпадают, а значит, сами эти матрицы равны.
122
Квадратная матрица вида а 0 ... О О а ... О
О О ... а
у которой элементы, стоящие на главной диагонали, равны а, а все прочие равны нулю, называется скалярной матрицей.
Пользуясь правилом умножения матрицы на число, скалярную матрицу можно представить в виде
аЕ,
где Е— единичная матрица соответствующего порядка. Так как
аД=а(ЕД) = (аЕ)Д,
аД=а(ДЕ) = Д(аЕ),
то, следовательно, умножение матрицы на число равносильно умножению этой матрицы слева или справа на соответствующую скалярную матрицу. Например,
a	° II	а	ь	с\	1	1 aa ай ас		—	
0	«II	X	У	Z	II 11лх — а	ay az а b с х у Z	II	1	а	ь	с	1 ' II	||	х	у	Z	1	а 0 0 | 0 а 0 j 0 0 а|
Пусть нам заданы матрицы
Д1, Да,..., Ак
одного и того же строения. Тогда для любой системы чисел «1, ag,..., afc имеет смысл выражение
И-®зДз-|- ... Н~абД*>	(б)
являющееся, очевидно, матрицей того же строения. Это выражение называется линейной комбинацией матриц Л, Д.2,..., Ak с коэффициентами а1( а2. а*.
Из свойств (3) — (5) следует, что сложение двух линейных комбинаций вида (6) при фиксированных матрицах Ai, До,..., ДА сводится к сложению соответству-
123
ющих коэффициентов (приведению подобных членов), а умножение линейной комбинации (6) на число а сводится к умножению всех ее коэффициентов на а.
В § 13 мы показали, как линейное преобразование (1) из § 13 может быть записано в матричной форме. Точно так же, разумеется, мы можем записать в матричной форме и любую систему линейных уравнений.
Если матрицу системы
Я11Х1 ~Г012*2	... -\-alnxn = bj,
Ь*'
$21-^1	^22*^2 j • • •	।	' ^2,	(7\
i fyniXi ~f“ • • • “F
мы обозначим через А, столбец из неизвестных х|( xitхп — через X и столбец из свободных членов bt, Ьг.... bm — через R, то эта система примет следую-
щую матричную форму:
AX = R.	(8)
Если аь а2,..., а„ — какое-нибудь решение системы (7), то составленный из этих чисел столбец будет удовлетворять уравнению (8) (с неизвестным столбцом X). Наоборот, всякий столбец, удовлетворяющий уравнению (8), дает нам систему чисел, составляющих решение системы (7). Таким образом, для решения системы (7) в матричной интерпретации надо найти все столбцы, удовлетворяющие уравнению (8). Существование таких столбцов равносильно совместности системы (7).
Если в системе (7) все свободные члены мы заменим нулями, то получим однородную систему. В соответствии с изложенным эта однородная система может быть записана в виде матричного уравнения
АХ = О,	(9)
где О — нулевой столбец. Так как для столбцов (являющихся прямоугольными матрицами частного вида) определено сложение и умножение на числа, то можно говорить о сумме решений уравнения (9), о произведении решения на число, а также о линейной комбинации решений.
Теорема 3. Произвольная линейная комбинация решений уравнения (9) является также решением это?0 124
уравнения. В частности, сумма двух решений и произведение решения на число являются решениями.
Доказательство. Достаточно ограничиться рассмотрением линейной комбинации двух решений. Пусть столбцы Ut и удовлетворяют уравнению (9), и пусть а и 0 — произвольные числа. Так как AUt = O и AUi = O, то
Л (o.Ut + $U->) = А (а^) Н- А ($и>) = a (AUt) 4- р (AUt) =
= аО -j- $0 = 0.
Таким образом, вместе с Ut и столбец at/j-j-P^ также удовлетворяет уравнению (9).
Теорема 4. Пусть Т9 — какое-нибудь фиксированное решение уравнения (8) (мы предполагаем, стало быть, систему (7) совместной'). Тогда всякое решение уравнения (8) имеет вид
Тъ + U,	(10)
где U — некоторое решение соответствующего однородного уравнения (9). Наоборот, сумма (10) при любом решении U уравнения (9) является решением уравнения (8).
Доказательство. Пусть столбец Т удовлетворяет уравнению (8), так что AT = R. Положим U = = Т— То. Тогда AU = A(T — T<,) = AT-AT9 = R-— R=O. Таким образом, Т = Tq-‘\-U, причем AU = O. Наоборот, если AU = O, то A(To-lrU) = AT»-}- AU = = R-{-O = R. Теорема 4 доказана.
В заключение параграфа введем понятие многочлена от матрицы. Пусть А — квадратная матрица п-го порядка, и пусть
f(x) = ao + aix-j-ajx2-}- ...	xm
— многочлен от переменной х. Выражение +	••• -НюЛ"’
называется многочленом от матрицы А и обозначается через f(A). Здесь Е = А°— единичная матрица п-го порядка. Ясно, что f(A) является также квадратной матрицей п-го порядка.
125
Пример. Пусть
1 2
1 1
f(x) = xl — 5x4-7, ё(х) — х* — 2x4-3.
Тогда
Теорема 5. Пусть f(x) и g(х) — два многочлена и А — квадратная матрица. Тогда, если
f(x) + g(x) = <f(x), f(x)g(x) =Ф(х), то
/(Л) + £(Л) = ?(Л), f(A)g(A) = ф(Л).
Доказательство. Вспомним правила сложения и умножения многочленов. Сложение многочленов сводится к выполнению действий вида
ах* -j" рх* = (а 4“ ?) **
(приведение подобных членов). Умножение многочленов происходит на основе распределительного закона: сначала перемножают одночлены по правилу
ах* • pxz — aflx*+z,
а затем приводят подобные члены. Но в силу свойства (4) мы имеем
аЛ* + рЛ* = (а4-р)Л*.
Далее, согласно теореме 2 и формуле (12) из § 13 мы имеем также
аЛ* • $А1 = ар (Л*Л;) = ар Л *
Мы видим, таким образом, что матрица Л ведет себя по отношению ко всем рассматриваемым операциям точно так же, как и переменная х. Следовательно, если мы будем, например, перемножать многочлены / (Л) и 126
g(A) по правилам умножения многочленов, то в результате получим многочлен от матрицы А, коэффициенты которого будут такие же, как и у <|> (х), т. е. получим ф(Л).
Следствие. Два многочлена от одной и той же матрицы всегда перестановочны, т. е.
f(A)g(A) = g(A)f(A).	(11)
Действительно, обе части равенства равны гр (Л). (Равенство (И) является обобщением формулы (13) из § 13.)
Пример. Так как
х3 — 1 = (х — 1) (х2-j-х1), то
Л3-Е = (Л-£) (А*^А + Е)==(А* + А + Е)(А-Е).
Упражнения
1.	Представить строчку 5 = || 10 —5 —31| в виде линейной комбинации строчек
S1==||l 2 —1||, 52 = ||4 3 5||, 53 = ||3 -1 2[|.
Отв. S = 33, — 2Ss + 533.
2.	Показать, что формула А2— В2 —(А— В)(А-\~В) имеет место тогда и только тогда, когда матрицы А и В переста-
новочны.
3.	Доказать, что если Д2 = Д, то матрица В = 2 А—Е удовлетворяет условию В2=-Е.
4.	Найти f(A) и g(A), если /(х)=х3— 7х-|-9, g(x) = х3 — Зх2 + Зх — 1,
£(Д)= 0 о
о о о о о о
§ 15.	Определитель произведения квадратных матриц
Если А и В ~ две квадратные матрицы n-го порядка, то их произведение АВ также является квадратной матрицей n-го порядка. Как связаны между собой определители |Л|, |В| и | АВ | этих трех матриц?
127
Если мы возьмем, например,
3
1 2
В =
2
I
3
то
|В|=5,
|ЛВ| =
= 20.
| Л | = 4,
8 9
4 7
Бросающаяся в этом примере в глаза закономерность выражается следующей теоремой.
Теорема. Определитель произведения двух квадратных матриц п-го порядка равен произведению определителей перемножаемых матриц:
I лв|=| а
Доказательство. Рассмотрим следующий определитель порядка 2п:

Gil	..	ащ	0	0 .	.. 0
ап	бЬо . .	а>п	0	0 .	.. 0
ащ	Оп2 ..	•	&пп	0	0 .	.. 0
1	0 ••	.	0		fel-2 •	• • fej/г
0 -	-1 ..	.	0		fe.,-2 .	•• fe-2»
0	0 ..	. —1	bnl	&Л2 •	• • &пп
А О
—Е В
Так как матрица, стоящая здесь под знаком определителя, есть ступенчатая матрица с диагональными клетками Л и В, то, по теореме 1 из § 6,
Д = |Л|.|В|.	(1)
Вычислим определитель Д другим способом. Для этого преобразуем его так, чтобы все элементы матрицы В (в правом нижнем углу) превратились в нули. Это легко сделать с помощью диагональных элементов левой нижней клетки — Е. Чтобы, например, избавиться от fen> следует к (и-|-1)-му столбцу прибавить первый, умноженный на Ьн. В общем же случае, чтобы удалить надо к столбцу с номером и-}- j прибавить k-н столбец, умноженный на fe^y. В результате этих п‘ операций 128
левая часть определителя останется без изменений, правый нижний угол займут нули, а на месте нулей в правом верхнем углу окажутся некоторые новые элементы. Так как при наших преобразованиях величина определителя не меняется (свойство 9 на § 4), то мы получим
ап	^12 ...	а\п Си fra ... С\п
^21	^2*2 • • •	^*2л £‘21 £*2*2 • • • £2л
&п\	• • • &пп ^п! Сп2 • • • Спп
— 1	о	...	О	О	О	...о
О	-^1	...	О	о	О	—О
О	0	...	-1	о	о	... о
Обозначим квадратную матрицу п-го порядка, появившуюся здесь в правом верхнем углу, через С.
Чтобы преобразовать полученный определитель в ступенчатый, мы поменяем местами строчки с номерами п—1, п~р2,..., 2п соответственно с 1-й, 2-й,..., п-й строчкой. В результате получим
— Е О
А С
Д = (-1)"
= (-1)”|-£|.|С| =
Таким образом, для Д мы нашли другое выражение:
Д = |С|.
(2)
Разберемся теперь, что же представляет собой матрица С. Перепишем наш исходный определитель Д еще раз, выделив в нем лишь интересующие нас места:
	(/)
Пл а& ..	, (1:„	
— 1	0 ..	. o...&v...
0	—1 ..	.	0 ...	...
0	0 ..	. -1 ... bnj ...
б 3. И. Боревич
129
До наших первоначальных преобразований на пересечении пунктирных линий в правом верхнем углу стоял нуль. При выполнении преобразований к этому нулю мы прибавили произведения
atib4, anb>j.. а,-Ay-
После всех преобразований там должен оказаться элемент Cij. Следовательно,
... -}-ainbnf.
Таким образом, элементы матрицы С составляются по тому же правилу, что и соответствующие элементы произведения АВ; значит, С = АВ. Сопоставляя этот факт ,с равенствами (1) и (2), мы и получаем утверждение теоремы.
Замечание. Теорема справедлива, конечно, и для случая любого числа сомножителей.
Доказанная теорема в' некоторых случаях может  оказаться полезной при вычислении определителей. Пусть, например, требуется найти определитель матрицы
а	Ь	с	d
— b	a	d	—с
А =	;	. -
— с —d	а	b
— d	с	—b	а
Составим транспонированную с ней матрицу а —Ь —с —d ba —d с с d а —Ь d —с b а
и найдем произведение А А':
as+t>s+cs+(is	0	0	0 в
АА “	0	0	О I'
О	О.	О	а2+«>2-|-сг+^|
Имеем |ЛЛ'| = |4ПЛ'|= |Л1*==(а*4-&2 + с* + поэтому
| А | = ± (а2 + Ь2 4- с2 -f- d2)2.
130
Чтобы установить, какой здесь нужно взять знак — плюс или минус, обращаем внимание на тот факт, что слагаемое а1 входит в определитель со знаком плюс как произведение элементов, стоящих на главной диагонали. Следовательно,
|^| = (aa + &9 + c9-J-d2)2. Упражнение
Вычислить определитель матрицы \а 8 с d b a d с с d а Ъ ’ d с b а умножив ее предварительно на матрицу 1111 1 1-1-1 1-1 1—1-1—1—1 1
Отв. (а + b + с -|- d) (а b— с — d)(a — b -|- с— d) • • (а — Ь — с d).
§ 16.	Обратная матрица
Как известно, для каждого числа а Ф 0 существует такое Ь, что ab = l. Число b называется обратным для а. Если мы зафиксируем натуральное число п и будем рассматривать квадратные матрицы п-го порядка, то в этом множестве матриц единичная матрица Е будет играть роль единицы (теорема 3 из § 13). Естественно поставить вопрос о существовании обратной матрицы, т. е. такой матрицы, которая в произведении с данной дает единичную матрицу Е. Этому вопросу мы и посвятим настоящий параграф.
Определение. Пусть А — квадратная матрица п-го порядка. Квадратная матрица X (того же порядка п) называется обратной для А, если АХ = ХА — Е.
По поводу данного определения следует сделать следующее пояснение. Поскольку умножение матриц, вообще говоря, некоммутативно, мы должны учитывать возможность того, что АX ф ХА. В нашем определении
б*
131
на матрицу X наложено два условия: АХ — Е и ХА = Е. Ввиду этого матрицу X можно было бы назвать двусторонней обратной для А. Если же о некоторых матрицах Y и Z нам известно лишь, что AY=Е и ZA = Е, то Y естественно назвать правой обратной, a Z— левой обратной для А. В дальнейшем, однако, мы увидим, что это разнообразие обратных матриц фактически отсутствует: либо обратной матрицы вообще нет, либо она только одна (и притом двусторонняя).
Предположим, что для матрицы А существует правая обратная матрица Y, так что
AY — E.
Перейдем в этом равенстве к определителям. Так как | Е | = 1 и | AY | = | А | • | Y | по теореме § 15, то
IЛ |-|Г |= 1.
Отсюда заключаем, что | А | Ф 0 (в противном случае левая часть равнялась бы нулю). Тот же вывод, конечно, мы получим, если предположим, что для А существует левая обратная матрица.
Этим доказано, что если | А |==0, то для А не существует ни левой, ни правой обратной матрицы.
Определение. Квадратная матрица А п-го порядка называется особенной, если ее определитель равен нулю. Если же | А [ Ф 0, то А называется неособенной матрицей.
Особенные матрицы, как доказано нами, обратных не имеют. Займемся изучением неособенных матриц.
Пусть нам дана неособенная матрица
ац 6Z12 ... а\п
д  Л21 а2% ... а^п	/1\
• • • О'ПП
определитель которой мы обозначим через А. Рассмотрим соответствующее ей линейное преобразование переменных
П12^2 -И ••• ~\-а\пУп>
Х2 = 6Z21Z/1 4" О^у* + . . . + СкпУп) ,	(2)
xn—aniyi -j- ^пиУ'2	аппУп* ,
132
Предположим, что для матрицы А существует правая обратная. Обозначим ее через В и рассмотрим соответствующее ей линейное преобразование переменных
(t = l, 2, .... n).	(3)
/=1
Так как АВ — Е, то произведение линейных преобразований (2) и (3) является тождественным преобразованием:
Xi = Zi (i = 1, 2, ., n).
Следовательно, если в (3) вместо Zj мы подставим Xjt а затем полученные выражения
=== jXj	(4)
подставим в (2), то после выполнения всех необходимых действий все равенства (2) превратятся в тождества вида Xi = Xi (i— 1, 2,	л). Но это значит,
что значения (4) составляют решение системы линейных уравнений (2) с неизвестными yif yif ..., уп и со свободными членами xif х2, ..., хп.
Таким образом, если линейное преобразование (2) мы рассмотрим как систему линейных уравнений относительно неизвестных yit у2, ..., уп и решим ее, то, поскольку решение должно иметь вид (4), мы найдем элементы матрицы В.
По условию | А | — Д Ф 0, поэтому к системе (2) применимы формулы Крамера:
Д«	До	Дм
Уп~~£,
где Д7-— определитель матрицы, получающейся из А заменой /-го столбца на свободные члены.
Обозначим, как обычно, через А у алгебраическое Дополнение элемента матрицы А. Тогда, раскладывая каждый из определителей Ду по элементам /-го столбца (где стоят переменные х1(	..... х„), мы
133
получим
^=^*+^4- ...
У* = Х1 + Х2 + • • • + хп,
,. _Ain „ | Asn „ ।	। Ann v
Уп- — Х1-\—д-Хз-|- ••• -|--д-хл.
Так как выражения (4) и (5) должны совпадать, то фактически мы нашли вид матрицы В (в предположении ее существования).
После этих предварительных рассуждений исследуем теперь вопрос об обратных матрицах, не опираясь на линейные преобразования переменных.
Определение. Пусть дана квадратная матрица (1), и пусть Atj обозначает алгебраическое дополнение элемента а^. Матрица
Лц Л-21 ... Л„1
Т   Л1-2 Ац ... Лд2
fhrt • • • finn
в строчках которой расположены алгебраические дополнения элементов соответствующих столбцов матрицы А, называется взаимной для А.
Взаимная матрица Л получается, таким образом, .. из матрицы Л заменой каждого элемента на его алгебраическое дополнение с последующим транспонированием. Ясно, что понятие взаимной матрицы имеет смысл для любой квадратной матрицы (как неособенной, так и особенной).
Теорема 1. Для взаимной матрицы А квадратной матрицы А п-го порядка мы имеем
ЛЛ = ЛЛ = ДЕ,
где Д = | Л | и Е — единичная матрица п-го порядка. Доказательство. Вычислим произведение Л Л:
С = ЛЛ
... Ajt ...
... А уз ...
• • • @in
Л уя ...
134
I
(Напомним, что в /-м столбце матрицы А стоят алгебраические дополнения элементов , /-й строчки ма-	:
трицы А.) Согласно правилу умножения матриц, для	\
элементов Сц матрицы С имеем	- 1
С,-j — йцА ji -|- вцА ji -j- ... -j- Л/дЛjn- (6)	1
Но согласно свойствам 4 и 5 из § 4 правая часть ра-	•
венства (6) равна Д при t = / и равна нулю при i j.	,
Следовательно,	1
С/,- = Д, Cij~Q при	,
Таким образом, А 0 ... О
1 0 ... О
О 0 ... 1
О 0 ... А
Аналогично проверяется и второе равенство АА=ДЕ.
Теорема 1 доказана.
Предположим опять, что А -- неособенная матрица, так что | А | — Д -ф 0, Положим
Х = |Л.	(7)
Тогда
АХ = а(^Л)=4(ЛЛ) = 1.ДЕ = £
и аналогично
ХА — Е.
Таким образом, матрица (7) является двусторонней обратной для А. Этим мы установили, что всякая неособенная матрица имеет обратную.
Пусть теперь Y — какая-нибудь правая (в частности, двусторонняя) обратная для Л, так что AY = E. Умножив это равенство слева на матрицу (7), получим Х(АУ) = ХЕ, (ХА)У = Х, EY = X, Y = X.
Аналогично из ZA — E также следует, что Z = X. Таким образом, для неособенной матрицы существуют только одна правая обратная и только одна левая обратная; обе они совпадают между собой и совпадают с единственной двусторонне обратной матрицей (7).
135
Объединим полученные результаты об обратной матрице.
Теорема 2. Особенные матрицы обратных матриц не имеют. Всякая неособенная матрица А имеет единственную обратную матрицу, обозначаемую через Л"1. Если |Л| = Д^0, то обратная матрица для А имеет вид
Ац ’ Ащ Д д' ••• д
Л, А 22	^П2
А	А ••• А .
л-=р=
А1Л Аъп	Afin
А	А	А
Пример. Найти обратную матрицу для
Так как определитель | А | = Д = 3 отличен от нуля, то обратная матрица Л-1 существует. Вычисляем миноры всех элементов матрицы Л:
Следовательно, взаимная матрица для Л
— 3 3
Л= —9 6
б
12
11
— 7 5
136
а значит,
	— 1	1	21
л-’ = |л' =	— 3	2	4
о	7	5	11
	3	3	3
Теорема 3. Произведение		ЛВ	неособенных ма-
триц А и В является неособенной матрицей, при этом (АВ)~' — В ‘Л"’,
т. е. обратная матрица произведения двух матриц равна произведению их обратных матриц в обратном порядке. Обратная матрица Л-1 для неособенной матрицы А также неособенна, и
(Л“’П = Л.
Доказательство. Если | Л | £. О и | В | Ф 0, то, согласно теореме § 15, определитель |ЛВ| —|Л|-|В| также отличен от нуля, так что АВ— неособенная матрица. Проверим, что матрица В 'Л'1 удовлетворяет матричному уравнению (АВ) X — Е. Действительно,
(АВ) (ВЛА~1) = АВВ~1А-' = А (ВВ~1) Л"1 = = Л£Л1 —ЛЛ~1 = £.
Таким образом, произведение В-1 Л-1, является правой обратной матрицей для АВ, & значит (в силу единственности), оно совпадает с (Л В)'1. Этим доказано первое утверждение теоремы. Далее, если |Л |^0 и, значит, Л'1 существует, то, переходя в равенстве ЛЛ-1 = В к определителям, получим | ЛЛ~* | = | Л 11 Л"11 = 1, откуда следует, что | Л"11 Ф 0; при этом
(8)
Матрица Л удовлетворяет, очевидно, матричному уравнению А^Х — Е, поэтому она является обратной матрицей для Л"1. Теорема 3 доказана полностью.
Замечание. Первая часть теоремы 3 справедлива, очевидно, и в случае произвольного числа сомножителей. Например, если Л, В и С — три неособенные матрицы п-го порядка, то
(АВС)-1 = С'В1А~1.
6 3. И* Боревпч	137
Вернемся теперь снова к линейным преобразованиям
переменных.
Определение. Линейное преобразование переменных с квадратной матрицей А называется неособенным, если матрица А неособенная, и называется особенным, если матрица А особенная.
Если преобразование (2) неособенное, то для него, как мы видели, существует обратное преобразование, выражающее переменные у\, yt......уп через xit х2, ...
..., хп. Этим обратным преобразованием является преобразование (5). Таким образом, имеет место следующая
теорема.
Теорема 4. Для всякого неособенного линейного преобразования переменных с матрицей А существует обратное преобразование, которое является также линейным, и его матрица равна А "1.
Связь между обратным линейным преобразованием и обратной матрицей может служить средством для нахождения обратной матрицы. Именно, если для заданной неособенной матрицы А мы выпишем линейное преобразование переменных с матрицей А, а затем найдем для него обратное преобразование, то тем самым мы найдем и А'1.
Пример 1. Найти обратную матрицу для
2
О
3
1
1
2
1
2
1
А —
Прежде всего проверяем, что | А |	0, так что об-
ратная матрица существует. Линейное преобразование
Xi = 2yi -|- у* Уз, х2 — 2yi 4- у3, х3 = 3yi 4~ У14- 2уз •
имеет матрицу А. Находим для него обратное преобразование, решая систему относительно неизвестных yt, у*, у* 1	1
У1 =	Xi — -g- Х2 — -g-Хз,
.1	2
у2==	X14-J Xi — -g-Хз,
п ।	1	4
Уз = — 2X1 4~ у х* "t~ "з^з-
138
Следовательно,
_ £____£
.3 з
Пример 2. Найти обратную матрицу для
А =
О 1 ... 1
1 0 ... 1
1 1 ... О
(на главной диагонали — нули, а все остальные элементы— единицы). Так как | А | — (— I)"'1 (п — 1) # О при п^2 (п — порядок матрицы), то Д'1 существует. Составляем соответствующее преобразование переменных:
х> — У* 4" 4~ • • • 4" Упл 4" Уп* xi—yi 4- л 4- • • • 4- у п-i 4- Уп*
xi—У\-\-у*	4- • • • 4~ Уп~\ 4~ Уп>
хп = У1 + У1 + Уз + ••• 4~Ул1-
Сложив все эти равенства и разделив затем на п—1, мы получим
»+».+	+».=I|+z=„+_T +-'1-
Сопоставив теперь полученное равенство с каждым из равенств нашего преобразования, мы найдем
„ _(2 — n)xt + х1 + ...+хп
У1 =------------------------
х,(2 — п) xs +... -f-xn у*=--------------------------
. _4~^8 ~Ь ••• ~Ь (2 п)хп
Уп—	я—1
6
139
Следовательно,
2 — п 1	...	1
1	1	2 — п ...	1
1	1	... 2 — п
Рассмотрим систему п линейных уравнений с п неизвестными:
ацХ!-}- atiXi -j- ... -J- alnxn ~blt ' ОцХ2 4- ... й2пхп=Ь>,
aK1Xi4-ап2х24- ... -\-аппхп — Ь„. .
(9)
Запишем эту систему в матричной форме:
AX — R,	(10)
где А — матрица системы, X— столбец из неизвестных, R — столбец из свободных членов. Предположим, что определитель | А | = А системы (9) отличен от нуля. Тогда, по теореме Крамера, система имеет единственное решение, и, с другой стороны, для А существует обратная матрица А~1. Будем под X в (10) подразумевать столбец из решения системы (9). Умножим обе части равенства (10) слева на Л"1 (произведение имеет смысл, так как Л-1 — квадратная матрица п-го порядка , а АХ и R — столбцы высоты п). Мы получим
Л’1 (ЛХ) = (Л-1Л) X = EX = X AlR.
Таким образом, для столбца решений системы (9) имеем
X = A~'R.	(11)
Пример. Решить систему
7 Xi 4- 2х; 4~ Зхз	13,
9xi -f- Зх2 4“ 4хз 15,
5х] 4~ Х-2 4- Зх3 = 14.
Определитель системы здесь отличен от нуля. Для матрицы системы находим обратную и применяем 140
итаьзияьгУ-* г. -	- > .г
формулу (11):
Xi
Xi
Xs
5
— 7
— 6
— 3
6
3
— 1 3
Следовательно, Xi — 2, x2=—5, x3 = 3.
Формула (11) является, по существу, матричной записью формул Крамера. Действительно, в /-й строчке взаимной матрицы А стоят алгебраические дополнения Ay, A2j....Anj элементов /'-го столбца матрицы А.
Следовательно, матричное равенство
равносильно следующим п равенствам:
•*7 = У	• •• Anjbn) (/ = 1, 2,... ,п).
Но выражение в скобкак равно определителю Ду, получающемуся из Д заменой /-го столбца свободными членами. Следовательно, формула (11) равносильна формулам	(/=1, 2, . ..,п), что и утверждалось.
Упражнения
1.	Найти обратные матрицы для следующих матриц:
а)П 2Г	; b)	4 5
|з И		1 2
		5 7
d)	1 2	3 4
	0 1	2 3
	0 0	1 2
	0 0	0 1
51	с)		1	2	2
2			2	1	— 2
2|			2 — 2	1
е)		1 1	1 ... 1	
		0 1	1 ... 1	
		0 0	1 ... 1	•
		0 0	0 ... 1	
Отв,
а)|) 1 — 211 Ъ)	— 18	— 25	2° II	С) 1	1	2	2
— 3	7 ’ 4-	12	17	— 13		2	1	— 2
	— 3	— 3	з|	' “9	2	-2	1
141
d)
1—2	10
0	1—2	1
0	0	1-2
0	0	0	1
e)
— 1	0	...	О
1	-	1	...	о
О	1	...	о
О	0	0 ... 1 — 1
О	О	О ... О 1
1 О О
2. Решить, уравнений
пользуясь формулой (11), систему линейных
Отв. Xi = — 2, х2 = 5, xs = — 3,	= 1.
3.	Показать, что если одна из квадратных матриц n-го порядка А и В особенная, то их произведение АВ есть также особенная матрица.
4.	Две квадратные матрицы л-го порядка А и В называются подобными, если существует такая неособенная матрица С того же порядка п, что С~1АС = В. Доказать, что определители подобных матриц равны.
5.	Пусть квадратная матрица А порядка п имеет раш 2. Чему равна ее взаимная матрица Д?
6.	Для определителей матрицы А порядка п и ее взаимной матрицы А доказать соотношение
7.	Пусть квадратная матрица А такова, что Ат = Е (Е—единичная матрица). Показать, что матрица А неособенная. Чему равна ее обратная матрица?
8.	Пусть Ат = О (О — нулевая матрица). Доказать, что матрица Е-\- А + Д2 + + Л"1-1 является обратной для Е — Д.
9.	Матрица называется целочисленной, если все ее элементы— целые числа. Доказать, что для квадратной целочисленной матрицы С обратная матрица существует и является также целочисленной тогда и только тогда, когда | С | == ± 1.
10.	Решить матричные уравнения
УЛ = В,гДеД = [2 5|( в==|1 2||.
ош.х=ц_? -;ц,	-’|.
Указание. Найти обратную матрицу А
§ 17. Характеристический многочлен
Пусть А — квадратная матрица порядка п. Если X — столбец высоты п, то произведение АХ имеет смысл и также является столбцом высоты п. При рассмотрении ряда вопросов для данной матрицы А приходится разыс-142
кивать ненулевые столбцы X, для которых умножение на А слева равносильно умножению на некоторое число X, т. е. для которых имеет место равенство
ДХ = ХХ.	(1)
Нулевой столбец, конечно, при любом X удовлетворяет этому соотношению. Однако ненулевые столбцы, удовлетворяющие условию (1), существуют далеко не при всяком X.
Определение. Число X называется собственным числом квадратной матрицы А, если существует ненулевой столбец X такой, что ДХ = ХХ. Если X — собственное число матрицы А, то всякий столбец X (в том числе и нулевой), удовлетворяющий условию ДХ = ХХ, называется собственным столбцом матрицы А, соответствующим собственному числу X.
Займемся выяснением вопрос собой собственные числа данн (и существуют ли они вообще).
Пусть
Ли Ян ... а\п Л _ а'П ^22 • • •
что же представляют квадратной матрицы

^л2 • • • О'пп
п
Матричное равенство (1) равносильно системе п равенств
ицХ1 4~ a\iXi . 4~ ainxn == Xxi, ^21Xi а^х± -j-... 4~ ainxn = X%2,
4“ ^«2^2 + • • • 4- ^nn^n ^%П9 ‘
которые можно также переписать в виде
(an — X)xj 4-	анГ>4-...-4	аыхп = Ъ,
ад 4~ (^22 — X) Xt 4-... 4-	а^пхп = О,
(3)
ап\Х{ 4~ antX} 4-... 4- (апп — 1)хп = 0.
Существование ненулевого столбца X, удовлетворяющего Условию (1), равносильно, таким образом, существованию ненулевого решения у системы п линейных однородных уравнений (3) с п неизвестными. Но согласно Гореме 2 из § 12 система (3) имеет ненулевое решение 143
тогда и только тогда, когда ее определитель равен нулю, т. е. когда
#11 X	012	•••	#1д
#21	#22--X ... Озл
ап1	ЯпЯ	• • • апп
(4)
Следовательно, собственные числа X матрицы А характеризуются тем, что для них обращается в нуль определитель (4).
Определение. Пусть t — переменная. Определитель
	аИ —	t ап .	• •	#1/1
<?А (0 =	#21	—— t . ।	,. а%п
	#л!	#л‘2	• • #л/г
= \A—tE\ (5)
называется характеристическим многочленом матрицы А.
Тот факт, что определитель (5) является многочленом от переменной t, очевиден (любое из nl произведений, из которых составлен этот определитель, является многочленом от f). Произведение элементов главной диагонали определителя (5) является, очевидно, многочленом от t степени п; при этом коэффициент при ? равен (— 1)". Все же другие произведения, входящие в состав этого определителя, будут многочленами от t степени, строго меньшей, чем п. Следовательно, степень характеристического многочлена <рд (/) равна порядку л матрицы А и его старший коэффициент равен (— 1)“.
Предыдущие наши рассуждения позволяют сформулировать следующую теорему.
Теорема 1. Все собственные числа квадратной матрицы совпадают с корнями ее характеристического многочлена <рд (/).
Действительно, если X — собственное число матрицы А, то, как мы видели, обращается в нуль определитель (4), а значит, X — корень многочлена (5). Наоборот, если X — корень характеристического многочлена, т. е. срд (X) = 0, то ввиду (4) система (3) имеет ненулевое решение, и, следовательно, существует ненулевой столбец, удовлетворяющий условию (1); последнее же означает, что X — собственное число матрицы А.
144
Согласно теореме 1, чтобы найти собственные числа квадратной матрицы, надо составить ее характеристический многочлен и найти его корни.
Чтобы найти все собственные столбцы матрицы А, соответствующие данному собственному числу X, надо, очевидно, найти все решения системы (3). Эти решения будут удовлетворять и системе (2), а значит, столбцы из решений будут собственными столбцами матрицы А.
Пример. Найти собственные числа и собственные столбцы матрицы
1	—1	-1	—1
О	2	0	0
А— 0	0	1	—1 •
0	0	13
Находим характеристический многочлен = = |Л — tE\. Он равен (/—1)(/ — 2)3. Значит, матрица имеет два собственных числа: >4 — 1 и Х2 = 2. Для каждого К составляем теперь систему (3):
— х-1 — х3 — Xi = 0,	— Xi — ха — х3 — xt = 0, '
х2	=0,	0 = 0,
— х4 = 0,	— х3 — х4 = 0,
Хз —[—2х4 = 0,	Хз —j— х4 = 0. .
Решая эти системы, получаем, что собственными столбцами матрицы А для собственных чисел X — 1 и X = 2 соответственно являются столбцы
а
0 0
о
где а и й — произвольные числа.
До сих пор на элементы матрицы А мы не накладывали никаких ограничений, они могли быть любыми вещественными или комплексными числами. Если мы предположим, что элементы матрицы А вещественны, то отсюда еще нельзя сделать никакого вывода о ее собственных числах. Характеристический многочлен, конечно, будет иметь вещественные коэффициенты, но его корни могут быть комплексными. Например, для матрицы
111 —21 h — и
145
характеристический многочлен равен f* + 1. Однако если помимо условия вещественности предположить еще, что матрица симметрична, т. е. совпадает со своей транспонированной, то тогда все ее собственные числа обязательно будут вещественными. К доказательству этого неожиданного факта мы сейчас и переходим.
Для любого комплексного числа а = а-\-Ы через а мы будем обозначать комплексно сопряженное число а — Ы. Имеют место следующие формулы:
Гй=^-1-р,
оф =0$.
Действительно, если а = a4~bi, $=с-\-di, то
а	? = (а + с) + + *0£ » а₽ == (ас — bd) -J- (ad 4- be) i
и
а 4- р — (а 4- с) — (Ь 4- d) i' = (а — Ы) 4- (с — di) == а 4~ р, ар = (ас — bd) — (ad 4- be) i = (a — bi) (c — di) — ар.
Условие вещественности а может быть выражено, очевидно, в виде равенства
а = а.
Для произвольной матрицы А с комплексными элементами через А будем обозначать матрицу, получающуюся из А заменой всех ее элементов на комплексно сопряженные числа. Матрица А вещественна, очевидно, тогда и только тогда, когда
А = А.
Предполагая, что для прямоугольных матриц А и В произведение АВ имеет смысл, докажем формулу
АН = А В.	(6)
Пусть с,7 = а,-1Ь1/4_- ••~!rainbnj—- элемент t-й строчки и /-го столбца матрицы АВ. Тогда элемент t-й строчки и /-го столбца матрицы АВ равен
с,7 = anbij 4-... 4" ainbnj — aubij 4-... 4- ainbnj =
— ацЬу 4” • • • 4_ ainbnp
146
а это совпадает с элементом Z-fi строчки и /-го столбца матрицы АВ. Равенство (6), таким образом, установлено.
Справедлива, очевидно, и следующая формула:
М) = аЛ.	(7)
Теорема 2. Все собственные числа вещественной симметричной матрицы вещественны.
Доказательство. Пусть А — вещественная симметричная матрица и X— ее произвольное собственное число. Тогда, согласно определению собственного числа, существует ненулевой столбец X, для которого
АХ = 1Х.	(8)
Пока еще не доказано, что X вещественно, мы должны с ним обращаться как с комплексным числом. Элементы Xi, Xi, ..., хп столбца X мы также считаем комплексными. Составим выражение
X' АХ.	(9)
Так как X' — строчка длины п (транспонированный столбец X), А — квадратная матрица порядка п и X — столбец высоты п, то произведение (9) имеет смысл и является квадратной матрицей 1-го порядка, т. е. просто числом. Вычислим произведение (9) двумя способами, по-разному расставив скобки. Так как по условию матрица А вещественна и, значит, А — А, то
Х,ЛХ = Х'(ЛХ)=Х,(ЛХ)=Х,(ХХ)==Х,(ХХ)=Х(Х,Х).
При выкладках мы воспользовались последовательно формулой (6), равенством (8), формулой (7) и теоремой 2 из § 14.
Воспользовавшись теперь симметричностью матрицы А, т. е. наличием равенства А’ = А, получим
Х'ЛХ = (Х'Л')Х = (ЛХ)'Х = (ХХ),Х = (ХХ,)Х=Х(Х,Х).
Здесь мы применили теорему 2 из § 13, равенство (8), очевидную формулу (аЛ)' = аЛ' и теорему 2 из § 14. Сравнивая теперь оба результата мы приходим к равенству
Х(Х'Х)==Х(Х'Х).	(10)
147
Вычислим произведение в скобках:
*2
X- X----1| X} Хд . . . Хп ||
~ Х]Х1 4“ *2*2 4- • • • 4- *п*9 ~
Н*112 + Ы2+ •••+>,. г*
(произведение ad равно квадрату модуля |а| комплексного числа а). Так как столбец X ненулевой, то модули |xi|, |х2|,	|х„| не все нули, а потому Х'ХТО.
Сокращая (10) на этот отличный от нуля множитель, приходим к равенству
Х = Х,
из которого и вытекает, что собственное число X вещественно. Теорема 2 доказана.
Установим также одно свойство собственных столбцов симметричной (не обязательно вещественной) матрицы.
Теорема 3. Если собственные столбцы X и Y симметричной матрицы А соответствуют различным собственным числам X и р, то они удовлетворяют соотношению
X'Y =0.
Доказательство. По условию АХ — ).XnAY — = |1У. Составляем произведение X'AY и вычисляем его двумя способами:
X'AY = X' (AY) = X’ (|*У) == р (X'Y), X'AY = (Х'А') Y = (АХ)’ Y = (XX)' Y=(XX') Y=X (X'Y).
Следовательно, p. (XT) — X (XT), откуда, ввиду условия p ф X, и вытекает равенство ХТ — 0. Теорема 3, таким образом, доказана.
Теоремы 2 и 3 будут нами использованы в главе IV.
Рассмотрим характеристический многочлен матрицы второго порядка
я
Он равен
148

Вычислим теперь «р (Л):
ф (Л) = Л« - (a -I- d) А Н- (ad - be) Е =
___|| о2 ~г be ab 4- bd II || а'2 -ф- ad ab -|- bd j| |i са -j- cd cb d’21|	|| ac -j- cd ad d2||
ad — cb 0
0
ad — cb
0 °!|
0 Oil-
Мы видим, таким образом, что <р(Д) равно нулевой ( матрице, т. е. матрица А является как бы корнем своего | характеристического многочлена. Этот факт справедлив,  оказывается, и для матриц произвольного порядка. ?
Теорема 4 (теорема Гамильтона — Кэли). < Если ® (?) есть характеристический многочлен квадрат- | ней матрицы А порядка п, то	|
<?(А) = О,
где О — нулевая матрица п-го порядка.
Прежде чем доказывать эту теорему, сделаем несколько замечаний о так называемых полиномных матрицах.
Полиномной матрицей называется матрица, элементами которой являются многочлены от одной перемен-
ной /. Например:
Действия над полиномными матрицами производятся по I тем же правилам, что и над числовыми (с сохранением	•
обычных свойств). Полиномную матрицу в приведенном	I
примере можно представить в виде	<
li —7 5
7 5| , || 5 0
1 0|т-1 3
Ясно, что всякая полиномная матрица может быть j записана аналогичным образом:	’

(11)
где Во, Вь .... Вт — числовые матрицы.	!
Два многочлена от переменной t называются равными, если у них равны коэффициенты при одинаковых степе-	<
нях t. Так как равенство двух матриц сводится к равен-	*
ствам соответствующих элементов, то, как легко видеть, |
149
две полиномные матрицы равны тогда и только тогда, когда у них в представлении вида (11) равны матричные коэффициенты при одинаковых степенях t.
Доказательствотеоремы 4. Рассмотрим поли-номную матрицу
В —A — Et.
Ее определитель Д = | А — Et\ равен, разумеется, характеристическому многочлену <р(/) матрицы А. Положим
Д = <р (/) = а0 + ait + atf -f-... -J- antn
(для симметрии мы здесь положили а„ = (—1)").
Составим для матрицы В взаимную матрицу В. Каждый элемент матрицы В с точностью до знака является минором порядка п — 1 матрицы В. Но поскольку все элементы в В содержат t в степени не выше первой, то любой минор матрицы В (порядка п—1) является многочленом степени не выше п—1. Таким образом, все элементы взаимной матрицы В — многочлены степени п — 1. Представление (11) для матрицы В имеет, следовательно, вид
В Во+Bit 4- Bit*+...+Bn.itn-\
Согласно теореме 1 из § 16 мы имеем
ВВ = ДЕ = ?(/)£.	(12)
Найдем представление вида (11) для левой части:
ВВ = (А — Et) (Ва + Bit + В^ +... 4- Впл/""1) =
= 4Во4- ABit + ABJ* 4-... 4- ABn^it"-1 —
-Во/- Bit2 -...-вп_^-вп^п =
= АВ0 4- (ABi — Во) 14- (ABj — Bj) t2 4~ •. •
...4-(AB„_i-- Bn_itn.
С другой стороны, представление (11) для правой части равенства (12) имеет вид
<Р (0 Е = айЕ 4- diEt 4- aiEt14-... •4- а„ ЛЕГ 14- anEtn. 150
Следовательно, по условию равенства двух полиномных матриц из (12) вытекает следующая система равенств:
А Во = а0Е, АВ{ —Во —aiE, АВ.2 — В2 = а2Е,
АВп 1 Вп_2— ап <Е, Bn-i== йпЕ •
Домножив эти равенства слева соответственно на Е, А, А3,., Д'1-1, Ап, мы получим новую систему равенств:
АВо
А1 В{ - АВо
АВ2 — A-Bi
= аоЕ, — aiA, — а2А'2,
AnB„ i — An ,B„^ = all_iAt'1, -АпВ^ =апАп.
Сложим теперь полученные матричные равенства. Слева, как легко заметить, все члены попарно сокращаются, т. е. мы получим в результате нулевую матрицу О порядка п. Справа же мы получим сумму айЕ -|- а2А + -\-a2Ai-\-...-{-anAn, которая, согласно определению многочлена от матрицы, равна © (Д). Таким образом, мы пришли к равенству <р(Д) = О, и теорема Гамильтона — Кэли доказана.
Упражнения
1.	Найти собственные числа и собственные столбцы матриц
а) II2 1II	Ь) || 1	1	11|	с) || 1 —2	21
2 3 Б 0	1	1 •	—2 —2	41.
II0 0 1И II 2	4—2;
Оте. а) X = 1, 1| а || X = 4, || а || b) X = 1, || г ||
(а И Р произвольны).
2.	Доказать, что любая линейная комбинация собственных столбцов матрицы, соответствующих одному и тому же собственному числу X, является также собственным столбцом для того же собственного числа X.
151
г
3.	Квадратная матрица А называется кососимметричной, если А' = — А. Доказать, что все собственные числа вещественной кососимметричной матрицы имеют вид \=bi с вещественным b (т. е. расположены на мнимой оси).
4.	Квадратная матрица Д (с комплексными элементами) называется эрмитовской, если Д' = А. Доказать, что все собственные числа эрмитовской матрицы вещественны.
5.	Квадратная матрица С (с комплексными элементами) называется унитарной, если С'С — Е. Доказать, что все собственные числа унитарной матрицы по модулю равны единице (| X | = 1).
У казание. Для собственного столбца X рассмотреть произведение Х'С’СХ.
6.	Пусть X является собственным столбцом для двух квадратных матриц п-\ о порядка А и В (собственные числа, вообще говоря, различны). Доказать, что тогда X является собственным столбцом и для матриц АВ, А-{--В, аА. Чему равны соответствующие собственные числа?
7.	Пусть X — собственный столбец квадратной матрицы Д X — соответствующее собственное число и / (£) — произвольный многочлен. Основываясь на предшествующей задаче, показать, что X является также собственным столбцом матрицы / (А), соответствующим собственному числу /(X).

ГЛАВА IV
КВАДРАТИЧНЫЕ ФОРМЫ
§ 18. Приведение квадратичной формы к диагональному виду
Теория квадратичных форм имеет ряд приложений в математике и в смежных с нею дисциплинах (например, в теоретической механике). Особенно важна эта теория для исследования линий и поверхностей 2-го порядка. Общее уравнение линии 2-го порядка на плоскости имеет вид
{/) = 0,	(1)
где F (х, у) — многочлен второй степени. Если (1) является уравнением центральной кривой (эллипса или гиперболы), то после параллельного переноса начала координатной системы в центр кривой ее уравнение примет вид
ах2 2bxy -{-cy2 — h	(2)
(новые координаты мы здесь обозначили теми же буквами х и у, что и старые). В левой части уравнения (2) стоит однородный многочлен второй степени (степень каждого его члена равна двум). Такой многочлен называется квадратичной формой от переменных х и у.
Сделаем теперь поворот координатных осей на некоторый угол а. Старые координаты (х, у) произвольной точки плоскости выражаются через новые координаты этой же точки, как известно, по формулам
x=x'cosa—- if sin a,)
, .	।	}	(3
y — x sin a-J- у COS a. J
153
Угол а, оказывается, всегда можно подобрать так, чтобы в новых координатах уравнение кривой (2) приняло вид
=	(4)
Особенностью уравнения (4) является то, что в нем стоящая слева квадратичная форма не содержит члена с произведением х'у'.
При преобразовании уравнения (2) в уравнение (4) преобразуется фактически только стоящая в левой части квадратичная форма. Именно, выражения для х и у из (3) мы подставляем в форму ах* ЧЬху -ф- су* и после выполнения всех необходимых действий приходим к форме Xx^-j-P#2- Формулы (3) мы можем рассматривать при этом как преобразование переменных (неособенное, поскольку определитель из коэффициентов равен 1). Таким образом, с алгебраической точки зрения преобразование уравнения (2) в уравнение (4) является преобразованием квадратичной формы при помощи неособенного линейного преобразования переменных.
Вот эту задачу приведения квадратичной формы при помощи линейного неособенного преобразования переменных к наиболее простому виду мы и рассмотрим в этом параграфе в самом общем виде.
Определение. Квадратичной формой называется однородный многочлен f = f(xi, х2, ..., хп) второй степени от п переменных.
Примерами квадратичных форм являются
х'1 + xl +	-\-х2а, у, XiXj,
х* + 2 г/2 + 5г2 — Зху 4- Ixz — \Qyz.
Согласно данному определению коэффициентами квадратичной формы могут быть любые числа (в том числе и комплексные). Если все коэффициенты квадратичной формы f вещественны, то она называется вещественной. Если же в качестве коэффициентов формы f допускаются комплексные числа, то f называется комплексной квадратичной формой.
Укажем для квадратичных форм одну специальную форму записи. Считая, что в форме f — f(xi, xit ..., хп) уже выполнено приведение подобных членов, обозначим 154
коэффициент при xl через ац, а коэффициент при XiXj — XjXi (i /) через
так что
2tz j у — ci i j 4~ ci ji — 2ci ji , di j •=. dji.
Для члена, содержащего XiXj, мы получим тогда следующую симметричную форму записи:
2dijXiXj = dijXiXj -j- cijiXjXi.
Вся квадратичная форма f может быть записана теперь в виде
f(xb Хг, хп)~
= апх‘
+ aJ2XiX2	alnxix„ +
4“ d-2iX%Xi —J— d^Xj
~F • • • ~F a$nXiXn -j-
(6)
4“ ^nlXnXl “F an2%nx2 4~ • • • "T ann^n>
Ясно, что коэффициенты al7 формы f в записи (6) определены однозначно. Составленная из них матрица
йц	П12	• •	•
#2J	d&2	. . .	d±n
• • •	О-пп
называется Mdmput^eti,KeddpdtnuHHotiформы} (х^х^... ,хл). Ввиду условия (5) элементы матрицы Д, расположенные симметрично относительно главной диагонали, равны между собой. Следовательно, А' = А, т. е. А — симметричная матрица.
Очевидно, что для любой симметричной матрицы А всегда можно указать такую квадратичную форму, что ее матрица совпадает с А. Если две квадратичные формы имеют одну и ту же матрицу, то эти формы могут отличаться друг от друга только обозначением переменных, что не имеет существенного значения. Две такие квадратичные формы мы можем считать одинаковыми. Таким образом, квадратичные формы вполне определяются своими матрицами.
155
Пример. Для квадратичной формы f(xt,x.2, х3)==. = 2х;-j-4xjX._.-'- 2xjX3-j-х.2х3 запись (6) имеет вид
f=2x-4-2xiX« -f-XjXa -j-
—|— 2х2х( —j— 0 • х:, —j—2~ х2х3 —j—
+ Х3Х1 Ч-^-ад + О-х^.
Следовательно, ее матрица равна
2 2 1
2 ° 4
1 Т 0
Для квадратичной формы может быть дана компактная матричная запись, а именно, пользуясь правилом умножения прямоугольных матриц, мы можем выражение (6) записать в виде произведения строчки на столбец, а затем в виде произведения трех матриц: /(%!, х2, ..., хп) =
—	(#11X1 -j- а12Л-2 4“ • • • “Г а1пХп) 4"
4~ Х2 (a^Xi 4~ ^2*2^2 + • • • + а*ПХп) 4~
4- хп (finiXi 4- ап^2 4-... 4- аппхп) =
= ||х1х2... ХЛ||
anxt 4- 0i2X2 4- • • • + aln*n 021X1 ~4 и^х^ “j—... ~4 a^nxn
^nlxl + ^л2^2 ~|— • • • 4* ^nnxn
#11 012 ... a,\n
= 11 Xi x2 ... xn [I
021	^22
02n
^n2	• • • ^nn
Таким образом,
f (Xi, x2, ...» хЛ) = XrAXt
Xi
x2
xn
(7)
где X — столбец из переменных х., х.2( xn, а X'— строчка из тех же переменных (транспонированный ( столбец).
156
I
Легко видеть, что если А — произвольная симметричная матрица порядка п и X — столбец из переменных высоты п, то произведение Х'АХ являегся квадратичной формой и матрица этой квадратичной формы равна А.
Пусть теперь нам задано линейное преобразование переменных
*1 = Cnyi -j- С1^У2 -J- . ..	с1пУп>
— с„У1 с^уг . -j- c%nyni .
= сп\У\	сп^у^ ... —сппуп, t
выражающее переменные хь ха, ..., хп через новую систему переменных yh у^ ..., уп (число переменных в обеих системах одно и то же). Если через С мы обозначим матрицу преобразования (8), а через X и Y — столбцы из старых и новых переменных соответственно, то преобразование (8) примет следующую матричную форму:
X — CY	(9)
(см. § 13, стр. 111). Мы будем рассматривать исключительно неособенные линейные преобразования переменных, т. е. будем предполагать, что | С | Ф 0. В этом случае для преобразования (9) существует обратное преобразование
У =	(10)
выражающее новые переменные через старые (§ 16, теорема 4).
Подставив выражения для хъ х2, ..., хп из преобразования (8) в квадратичную форму /(Xi, х.2, ..., хл), мы получим
f (хи • • •, хп) =f ।	Cij-yj, 2	• • •, 2 c^jyj\•
V=--i j=i	/=i	/
После выполнения всех необходимых действий правая часть превратится, очевидно, в квадратичную форму g(yi, Уь •••, Уп) от новых переменных уи у^ уп-Будем говорить в этом случае, что форма g (ylf у^ ... ,#„) получена из f(xb х2, ..., хп) в результате линейного преобразования переменных (8).
157
Очевидно, если полученную форму glyjt, у>..уп)
подвергнуть обратному линейному преобразованию переменных (10), то мы вернемся к исходной форме f(xb Х-1...х„).
Пример. Подвер гнем форму f — x'i -ф- XiX2 -j- х| преобразованию
Xi = yi -ф- yit 1
Xi — yi — Уг. /
Мы получим форму
ё—(yi 4~ у-^г 4~ (yi 4~ у*) (yi Уд 4~	уд*—tyi Н- у*-
Подвергая ее обратному преобразованию
„ __Х1 + Х2 ___Xi — х2
У1 2 ’У'2	2 ’
мы приходим к исходной форме
3	4- (фр)*=4- XlXi 4-х*-
Выясним, как меняется матрица квадратичной формы при линейном преобразовании переменных.
Подвергнем форму (7) преобразованию (9). Так как X'= (CY)'— Y'C' (теорема 2 § 13), то мы получим
f—X'AX = Y'C'ACY — g(yt, у.2, .... уп).
Рассмотрим квадратную матрицу В — С АС. Так как В' = (С'АС)' = С'А’С”— С АС —В,
то матрица В симметрична, а значит, она и является матрицей квадратичной формы g — Y'BY. Таким образом, можно сформулировать следующую теорему.
Теорема 1. Если в квадратичной форме с матрицей А сделано линейное преобразование переменных с матрицей С, то полученная квадратичная форма будет иметь матрицу С'АС.
Пример. Квадратичная форма
7Xj -ф- 5x14~ 2х| — 8xiX2 -ф- 2Х1Х3 — 6х2х3 после преобразования
Xi = yi -ф- Уъ 4- уз, х> — yt -j-2//-14-2г/з, • Хз = «/14- yi + ^Уз .
158
перейдет в форму с матрицей
	11	1	1	7	—4	1	1	1	1
С'АС==	1	2	1	—4	5	—3	1	2	2
	1	2	2 |	1	—3	2	1	1	2
2 0	0
= 03	0
0 0—1
т. е. в форму	—
Квадратная матрица вида
ai	0	... О II
О аа ... ОI
О 0 ... а„
у которой все элементы вне главной диагонали равны нулю, называется диагональной матрицей. В соответствии с этим мы даем следующее определение.
Определение. Квадратичная форма вида
а1х1 4“ • • • 4“ апХЛ>
не содержащая членов с произведениями различных переменных и имеющая поэтому диагональную матрицу, называется диагональной квадратичной формой.
Диагональную квадратичную форму часто называют также канонической.
1 Нашей ближайшей задачей является доказательство того, что всякая квадратичная форма при помощи неособенного линейного преобразования переменных всегда может быть приведена к диагональному виду. Сформулируем предварительно два вспомогательных утверждения.
Лемма 1. Произведение двух (или нескольких) последовательно выполненных неособенных линейных преобразований переменных является также неособенным преобразованием.
Утверждение этой леммы, по существу, содержится в теореме 3 из § 16. Действительно, неособенность преобразований X — CY и Y— DZ означает, что матрицы
159
С и D неособенные. Но тогда матрица CD, т. е. ма-трица линейного преобразования X = С (DZ) = (CD) Z, также неособенная.
Лемма 2. Если у квадратичной формы (6) имеется хотя бы один ненулевой коэффициент, то надлежащим неособенным линейным преобразованием переменных X = CY она может быть преобразована в форму, у которой коэффициент при у\ отличен от нуля.
Доказательство. 1) Пусть ац^0. В этом случае сама форма f обладает требуемым свойством и никакого преобразования делать не надо (можно сделать тождественное преобразование).
2) Предположим, что ап=0, но при некотором 1^2 отличен от нуля коэффициент при xl, т. е. ац -ф 0. В этом случае достаточно изменить нумерацию переменных, т. е. сделать преобразование вида
Хл — yt, xt = yh хk — у4 при kj'-l, k^i.
Это преобразование, очевидно, неособенное (здесь легко усматривается обратное преобразование), и после его выполнения получим
ацх\ = ацу\
Выписанный член ai{yl не имеет себе подобных, а потому он сократиться не может. Таким образом, поскольку ац 0, для рассматриваемого случая лемма доказана.
3) Остается рассмотреть случай, когда ап==а22 = ... ...=апп — 0, т. е. когда все диагональные коэффициенты равны нулю. По условию форма имеет хоть один ненулевой коэффициент. Пусть а,ут^0 (/=#;/). Чтобы свести рассматриваемый случай к случаю 2, нам достаточно сделать какое-нибудь неособенное преобразование, только бы появился квадрат одной из переменных с ненулевым коэффициентом. Сделаем, например, преобразование
Xj = y/ + yi,
xk = yk при k^j
(в частности, xt — yi). Преобразование, как легко видеть, неособенное (обратным для него будет преобразование 160

yj—Xj — x^ yk — xk при k Ф j). После выполнения преобразования получим
f —	2aijXiXj -f-	2aijtji (yj г/,) 4~ • • • —
=• • • 4- ^atjyiyj + 2аиу1 +...
Член 2aijifl является здесь единственным членом с yi, поэтому после приведения подобных членов он не сократится. Полученная нами форма содержит, таким образом, квадрат переменной с ненулевым коэффициентом (2а,-у	0), и, значит, к ней применимо рассужде-
ние пункта 2. Для завершения доказательства леммы 2 остается сослаться на лемму 1.
Теорема 2 (теорема Лагранжа). Всякая квадратичная форма при помощи неособенного линейного преобразования переменных может быть приведена к диагональному виду.
Доказательство теоремы проведем индукцией по числу переменных п. При п — 1 утверждение теоремы справедливо тривиальным образом: всякая квадратичная форма от одной переменной имеет вид ах* и является, следовательно, диагональной (всякая матрица 1-го порядка диагональна).
Предположим теперь, что п^2 и что для форм от п — 1 переменных теорема уже доказана. Пусть f — f(xit ..., х„) — квадратичная форма от п переменных. Если все коэффициенты формы f — нули, то доказывать нечего (сама форма f уже диагональна с нулевыми коэффициентами при квадратах). Пусть не все ее коэффициенты нули. Если ац = 0 (в обозначениях (6)), то согласно лемме 2 можно совершить неособенное линейное преобразование переменных так, чтобы после преобразования формы коэффициент при квадрате первой переменной был отличен от нуля. Можно считать поэтому, что уже с самого начала ЙЦ 0.
Выделим в форме (6) все члены, содержащие хс.
f — a^Xi2anXiXt..,-\-2ainXiXn-[-g(x«, ..., xn).
Здесь g является, очевидно, формой от п— 1 переменных Хг, ..., хп. Преобразуем теперь выписанную сумму так, чтобы все члены с Xi вошли в квадрат линейного
161
выражения:
f All [Xi 2X1	x2-|- . . . 4 ~~~	4- g (x2, ..xn)—
\	\all	“11 H
=а,1(Х1+йХ2+---+^г4 ~
—	au(^ Xi +... +	xn'f + g (Xi...x„) ==
\all	“11 J
—	flu^i 4"	*2 4~ • • • + хл)2 + ft (x*> • • •» *«)•
Здесь fb как и g, опять-таки является квадратичной формой от п — 1 переменных х2, . . •, хп.
Сделаем преобразование переменных
z/1-^x1 + ^x24-... + ^^, “11 “11
Уъ =	х2,
(11)
Уп =
Хп
Преобразование (11), очевидно, неособенное. В нем новые переменные выражены через старые. Обычно же мы всегда старые переменные выражаем через новые. Найдем поэтому для (11) обратное преобразование: а.,	а,„	)
Хг=Ух~ -—	-*уп,
“и	“11
х2=	У*>	(12)
Хп—	Уп* .
После выполнения преобразования (12) (или (И)) форма примет вид
/ =	Уп)-
По индуктивному предположению существует неосо-бенное линейное преобразование
У1 = С 1'^'1 4" • • • + c'lnznt j ......................>
Уп Сп^'1 4~ • • • “Г ^пп^т )
при которОхМ форма fi приводится к диагональному ВИДУ
fi (yi, • • •, Уп)=4- • • •+
162
Для нашей исходной формы f вслед за преобразованием (12) выполним следующее преобразование переменных:
yi = Zi,
У'1 —	+ • • • +
Уп===:	Cn&Z -j- . .. —р СппХп.
(13)
Определитель этого преобразования
10	0
0 ^22	• • • Сл2

7^ 0,
0 СЛ2 • • • спп
Спи.
следовательно, преобразование (13) неособенное. После его выполнения вслед за преобразованием (12) форма f приобретает вид
f(%i, х2,	хЛ) = апг; + а2г| + ... + алг^
Таким образом, после выполнения двух (а может быть, и трех, если у первоначальной формы коэффициент при квадрате первой переменной был равен нулю) неособенных линейных преобразований форма f приняла диагональный вид. Значит, теорема 2 доказана, так как по лемме 1 несколько последовательно выполненных неособенных линейных преобразований переменных равносильны одному неособенному преобразованию.
Метод доказательства теоремы 2 указывает нам также прием для фактического приведения квадратичной формы к диагональному виду. В доказательстве мы выделили только один квадрат линейного выражения и сослались затем на индуктивное предположение. В конкретном примере для приведения формы к диагональному виду надо процесс выделения квадратов продолжать до тех пор, пока не придем либо к форме с нулевыми коэффициентами, либо к форме от одной переменной (которая всегда является диагональной).
163
Пример 1. Привести к диагональному виду форму
f(xt, х-2, x3) — x1xi^2x1xa^-4xix.i.
Так как здесь нет членов с квадратом переменной, то делаем вспомогательное преобразование с целью получить квадрат:
Xi — #,, Xt — У1 + l/i, Хз= Уз- .
(14)
В полученной после этого преобразования форме выделяем квадрат линейного выражения, в котором содержатся все члены с у\.
f — У1 (У1 + Уз) 4“ %У1Уз 4" 4 (У‘ 4“ У«) Уз —
—yi 4~ У№ 4" уз 4- 4«/-2«/з=
= [yt 4~ у У* ~г"	— (у у* 4~ Зу») 4" 4у^уз —
= {yi 4" у и* "Ь — 4	—9^-
Делаем преобразование
Zi — yi 4" у У4- 4" Зуз>
Zs=	У2,
2з=	Уз-
Обратным для него будет
У\ —— Z\ 2*
У2 =	Zi,
Уз—	Z3-
(15)
В полученной форме выделяем квадрат, содержащий все члены с z2:
f = z\ - 1А 4- Z2Z3 - 9z| = zl -1 (Zi - 2z3)2 - 8zf.
164
Этим определилось преобразование
Ui=Zit
Ui = и3=^
z2 — 2z3,
для которого сразу же находим обратное:
Zi = г.2 = £з =
и>2 -j-- 2и3, из.
(16)
В результате трех последовательно выполненных неособенных линейных преобразований (14), (15) и (16) форма приняла диагональный вид:
f — —	—	(17)
Чтобы найти матрицу результирующего преобразования, мы должны перемножить матрицы преобразований (14), (15) и (16):
1 О О
1 1 О
О 0 1
О 1
О о
о
1
1	0	0				
0	1	2	=			
0	0	1	1	1 2	— 4	
			1	1 2	— 2	= C.
			0	0	1	
Следовательно, неособенным линейным преобразованием, приводящим форму f к диагональному виду (17), является
1 л I
Xi — Ui — j “г — I
Xi — Ui 4“ 2 ui — 2u3, I
Xi =	Ui. J
(18)
165
Для проверки вычислим произведение С'ДС, где А — матрица заданной формы:
Как и следовало ожидать, мы получили матрицу квадратичной формы (17).
Пример 2. Привести к диагональному виду форму
f = Xi -j— 3%2 “I- xj 2X[X*2 — 4%iX3.
Имеем
f — (xi —х% — 2%з)’2 Н” 2хз Н” 4%2-^з — Зхз==
== (xi ~г -Хз — 2%з)3	2 (%з ~Ь Хз)2 — 5х|.
Следовательно, при помощи преобразования
У\ = Xi	%2 — 2%з,	Xi = yi	—	у^ 3//з,
у2=	Х2-4- Хз,	Х2=	у* — у3,
Уз=	Хз,	Хз=	уз
форма приводится к виду
у\ + 2у1 — 5у1.
Простота выкладок во втором примере обусловлена тем, что в нем ни в начале, ни по пути не приходилось применять вспомогательное преобразование леммы 2. Ввиду этого матрица линейного преобразования переменных оказалась треугольной.
Замечание. В процессе доказательства теоремы 2 при приведении квадратичной формы к диагональному виду мы производили над ее коэффициентами только рациональные действия (сложение, вычитание, умножение, деление). Следовательно, если заданная квадратичная форма .вещественна (т. е. имеет вещественные коэффициенты), то при приведении ее к диагональному
виду изложенным приемом все встречающиеся по пути коэффициенты будут также вещественными. В частности, вещественными будут коэффициенты неособенного линейного преобразования, приводящего форму к диагональному виду, и коэффициенты самой диагональной формы.
Ясно также, что квадратичная форма с рациональными коэффициентами приводится к диагональному виду неособенным линейным преобразованием, все коэффициенты которого рациональны (см. рассмотренные выше примеры).
Упражнения
1. Привести форму х2х3 (от трех переменных) к диагональному виду.
Отв. —Х1=У1 — ^у2—Уз, 1
। 1	>
*2=У1+2№	I
*8 =	Л	I
(здесь коэффициент при у| равен нулю).
2.	Привести к диагональному	виду	квадратичную форму
X] + Xl + Xl + Х| + XtX2 + XiX3 4- xtx4 + х2х3 + х2х4 + х3х4.
3	2	5
Отв. yl + -^у1 + ^У1 + ^У| пРи преобразовании переменных с матрицей
!	1	1	1
2	2	2
°	!	1	1
О	О
0	0	11
4
0	0	0	1
3.	Привести к диагональному виду квадратичную форму от 2п переменных
Х1Х2 + *3*4 + • • • + Х2П-ЛХЪП'
Отв. у? — уН-у| — у1 + ---+у1п-1—~У*п- Матрица преобразования— клеточно-диагональная матрица с и одинаковыми клетками второго порядка
на главной диагонали.
167
§ 19. Вещественные квадратичные формы
Начиная с этого параграфа и до конца главы мы будем рассматривать исключительно вещественные квадратичные формы. Именно этот случай наиболее важен в приложениях.
В конце § 18 мы видели, что вещественная квадратичная форма может быть приведена к диагональному виду при помощи вещественного неособенного линейного преобразования переменных. Это приведение может быть осуществлено бесконечным числом способов, т. е. существует бесконечно много преобразований, приводящих одну и ту же форму к диагональному виду. При этом коэффициенты при квадратах в диагональной форме также определены не однозначно.
Так, в примере 1 из § 18 (стр. 165) форма f при помощи преобразования (18) приведена нами к виду (17). Легко проверить, что та же самая форма f приводится к виду
(I)
если сделать следующее преобразование переменных:
Xi = Ui — щ — 2щ, j
Х2 = Ui	и% — и$, I
1 I
Хз=
Сравнивая диагональные формы (1) и (17) из § 18, легко подмечаем, что, хотя коэффициенты при квадратах переменных у них и не совпадают, в обоих случаях число положительных и число отрицательных коэффициентов одно и то же. Это является, оказывается, общей закономерностью.
Теорема 1 (закон инерции квадратичных форм). Если вещественная квадратичная форма вещественными неособенными линейными преобразованиями переменных приведена двумя способами к диагональному виду, то в обоих случаях число положительных коэффициентов, число отрицательных коэффициентов и число нулевых коэффициентов при квадратах новых переменных одно и тоже.
Прежде чем приступать к доказательству теоремы 1, сделаем одно замечание о значениях квадратичных 168
форм. Если в квадратичной форме f (xj, х5, ..., х„) вместо переменных мы подставим какие-нибудь числовые значения хГ, х?,..., х'п и произведем все необходимые вычисления, то в результате получим некоторое число. Это число называется значением квадратичной формы f при заданных значениях переменных и обозначается через /(xf, xf...Хп).
Пусть теперь для формы f (xi, х8, ..., хя) выполнено неособенное линейное преобразование переменных
п
Х1=^СиУ] (i = l, 2.........п)	(2)
/=1
с матрицей С, в результате которого форма f перешла в форму g yif..., уп). В силу неособенности матрицы С для произвольных значений х*, х?,..., Хп существует единственный набор значений z/f, у*, Уп такой, что
х? — У, Cij-yJ (г = 1, 2,.... п).
Значения yf, у* мы будем называть значениями, соответствующими значениям xf, х*,..., х„ при преобразовании (2). Утверждается, что
х?,..., Xn)=g{y'\, yt.... У*).	(3)
В самом деле, форма g определяется равенством
g («/1..Уп) = f (S • • •» S
поэтому
g(y?....=	.....==/(*?............xt).
Ясно, что значения х?,..., х*г и у*, ..., у„ однозначно определяются друг через друга не только преобразованием (2), но и обратным ему преобразованием.
Доказательство теоремы 1. Пусть вещественная квадратичная форма f (хь х2,... хЛ) при помощи вещественных неособенных линейных преобразований
7 3. И, Боревич
169
переменных двумя способами приведена к диагональному виду:
f(xh Xi,..., хп) = aryl 4-... + ЛрУр — ?1Ур+1 —... — ^у'р^,
(4)
/(*ь Xi,..., хп) = ytZi +...4-— 8,z;+1 —... — 85z;+s.
(5)
Мы считаем, что здесь все аг, у*, 8Z строго положительны, так что форма (4) при квадратах новых переменных имеет р положительных коэффициентов, q отрицательных и п — р — q нулевых, а форма (5) — г положительных, s отрицательных и п — г — s нулевых. Конечно, может случиться, что положительные, отрицательные и нулевые коэффициенты при квадратах новых переменных расположены вперемежку, но, поскольку изменение нумерации переменных является неособенным линейным преобразованием, мы всегда можем коэффициенты при квадратах расположить в любом порядке, не меняя при этом самих коэффициентов. Заметим еще, что в конкретных случаях некоторые из коэффициентов (положительные, отрицательные или нулевые) могут фактически отсутствовать.
Мы должны показать, что
р — г, q = s, n — p — q — n — r — s. (6)
Выпишем соответствующие линейные преобразования переменных (вещественные и неособенные), выразив при этом, против нашего обыкновения, новые переменные через старые:
(i==l, 2....п),	(7)
— S dUxJ (i = 1, 2,..., n).	(8)
>=i
Приступая к доказательству первого из равенств (6), предположим, вопреки утверждению теоремы, что рфг-Для определенности можно, конечно, считать, что р<^г-Л4ы покажем, что тогда для старых переменных можно найти такие вещественные значения xf, х%,..., х*, не равные одновременно нулю, что соответствующие им
170
значения новых переменных у\, у%.....у„ и z?, z*,..., z*
будут удовлетворять условиям
yt — O.....Ур — 0,	(9)
z?+i = 0...z£ = 0.	(10)
Вычислив затем по формуле (3) значение f(xt...х„)
двумя способами с помощью диагональных форм (4) и (5), мы получим несовместимые между собой неравенства f(xf,..., х^)<0 и f(x*,.... х£)>0.
Итак, пусть р<^г. Рассмотрим следующую систему линейных однородных уравнений:
С11Х1 -j- С12Х2	-ф-
I ^1п^п ----- 0,
Ср1Х1 + Ср2Ха +•••-{- сряхл = о, ^+1,Л 4" ^r+1.2^2 4” • • • Т dr+lnXn ~
dniXi 4- dniX-2 -{-...-j- dnnxn = 0. j
Система эта получена приравниванием к нулю первых р линейных выражений справа в преобразовании (7) и последних п — г линейных выражений в преобразовании (8). Число уравнений в системе (11) равно
р + (п — г) = п — (г — р),
что строго меньше п (поскольку г^>р). Но раз число уравнений в однородной системе меньше числа неизвестных, то, по теореме 3 из § 12, она имеет ненулевое решение. Ввиду вещественности преобразований (7) и (8) коэффициенты системы (11) также вещественны, а значит, ненулевое решение этой системы мы можем выбрать вещественным. Пусть это будет х*, х$,.. , хя. Этим мы и нашли искомые значения для старых переменных. Если теперь в соответствии с преобразованиями (7) и (8) мы найдем соответствующие значения для новых переменных у%, у*.....у% и zf, z*,..., z*, то для этих
значений будут выполнены, очевидно, условия (9) и (10).
Согласно равенствам (4), (5) и формуле (3) мы имеем f (xf........х?) = -	- • • - - №+?	(12)
f (xf...хл) = 7izf2 4-... 4- v?2.	(13)
7
171
Квадрат вещественного числа неотрицателен, поэтому из (12) следует, что
/(х?,..., х*)^0.	(14)
(Знак равенства здесь возможен ввиду того, что в случае p-\-q<^ n ненулевые значения у* могут оказаться только среди значений </₽+9+i,. ••, Уп.) С другой стороны, в силу неособенности преобразования (8) не все г? равны нулю (в противном случае все х* были бы равны нулю); поэтому, учитывая (10), мы заключаем, что хоть одно из значений г?.....z* отлично от нуля, а значит, из
(13) вытекает неравенство
/(х?......х*)>0.	(15)
Таким образом, предположение о том, что р^г, привело нас к противоречащим друг другу неравенствам (14) и (15). Следовательно, р = г, т. е. число положительных коэффициентов в обеих диагональных формах (4) и (5) одно и то же.
Второе из равенств (6) может быть доказано аналогичным способом. Но можно поступить и следующим образом. Рассмотрим форму — f (xJ(..., х„). При помощи тех же неособенных вещественных преобразований (7) и (8) форма — f приводится к двум диагональным формам, получающимся из (4) и (5) умножением на — 1. Первая из них будет иметь q, а вторая s положительных коэффициентов. Но по доказанному число положительных коэффициентов в обоих способах приведения одно и то же. Следовательно, q — s.
Третье из равенств (6) является очевидным следствием первых двух. Теорема 1 доказана.
Среди вещественных квадратичных форм особую роль играют формы, выделяемые следующим определением.
Определение. Вещественная квадратичная форма называется положительно определенной, если положительны все ее значения при вещественных значениях переменных, не равных нулю одновременно.
Положительная определенность вещественной формы /(%!,..., хп) означает, стало быть, что
f (xt...Хп) > 0,
172
если только среди вещественных х* хоть одно значение отлично от нуля. Если все значения переменных равны нулю, то значение квадратичной формы, конечно, всегда равно нулю.
Примерами положительно определенных квадратичных форм являются
+ 4 +	+
2х2-[- 5y2 + 7z2, х*-[-ху + у‘, (Xi 4- Хг %з)2	(х-2 -|- Хз)г 4~ Хз.
Теорема 2. Для того чтобы вещественная квадратичная форма была положительно определенной, необходимо и достаточно, чтобы при приведении ее к диагональному виду вещественным неособенным линейным преобразованием переменных все коэффициенты при квадратах новых переменных были положительны.
Доказательство. Пусть вещественная форма f (xi,..., хп) вещественным неособенным преобразованием (2) приведена к диагональному виду
ai//i 4~	+ • • • + ап1/п-
Если х*, х*,..., Хп — какие-нибудь значения старых переменных и //*, у*..у"п — соответствующие им значе-
ния новых переменных; то, согласно формуле (3), мы имеем
/ (хТ...X?) = ajуР -L-	4-... 4- а-пУп*. (16)
Пусть все коэффициенты аь а2,..., положительны. Тогда, если вещественные значения х*,...,х* не все нули, то вещественные же значения у*,..., у'п также не все нули (в силу неособенное™ преобразования (2)), и поэтому правая часть равенства (16), а значит, и левая его часть положительны. Таким образом, при положительных af форма f положительно определенная.
Наоборот, пусть форма f положительно определенная. Положим
Z/i=0,	=0,	1, //F+i = 0,	^ = 0. (17)
Соответствующие значения х*, ...,х£ старых переменных, очевидно, вещественны и не равны нулю одновременно, так что /(Xj, ..., Х/9>0. Но согласно (16)
173
и (17) f(x*,..., х*) = аг, следовательно, а,4>0 при всех i = 1, 2....п.
Квадратичную форму
4~ х14~ • • • 4- х\
мы будем называть чистой суммой квадратов. Чистая сумма квадратов в качестве своей матрицы имеет, очевидно, единичную матрицу.
Теорема 3. Вещественная квадратичная форма является положительно определенной тогда и только тогда, когда она вещественным неособенным линейным преобразованием переменных может быть приведена к чистой сумме квадратов.
Доказательство. Если форма приводится к чистой сумме квадратов, то, согласно теореме 2, она положительно определенная. Наоборот, пусть f(xi,..., хп)-~ положительно определенная квадратичная форма. Приведем ее вещественным неособенным преобразованием (2) к диагональному виду
f = щу\ + v-tyl + • • • ~г v-nlTn-	(18)
По теореме 2 все коэффициенты а,- здесь положительны. Сделаем вслед за преобразованием (2) следующее преобразование переменных:
21.
У«1 1
У1 =
(19)
Уп =
1

У“п
При выполнении этого вещественного и неособенного преобразования форма (18) приобретает вид
zi + г:з Н- • • • 4~ zn>
т. е. переходит в чистую сумму квадратов. Для завершения доказательства теоремы 3 остается только заметить, что последовательное выполнение преобразований (2) и (19) равносильно одному вещественному неособенному преобразованию (см. лемму 1 из § 18).
174
Приведем без доказательства критерий, позволяющий устанавливать положительную определенность вещественных квадратичных форм непосредственно через их коэффициенты, без приведения к диагональному виду.
Теорема 4. Для того чтобы вещественная квадратичная форма от п переменных была положительно определенной, необходимо и достаточно, чтобы все п миноров ее матрицы, расположенные в левом верхнем углу (порядков 1, 2, ..., и), были положительны.
Другими словами, если для вещественной квадратичной формы f(xt, Xi, ..., хп) с матрицей
ан ан ... ain 021 Ой •  • О'2п
0л1 Ол2 • • • Оля
мы положим
Он 012 ••• 01*
Д* = aii aii -"aik (k=l, 2, .... n),
Qkl ••• 0**
то эта форма f будет положительно определенной тогда и только тогда, когда
Д1>0, Д2>0........д„>о.
Например, форма
Зх, —4%2 ~т“ 4xi — 4х>хз
является положительно определенной, так как для нее
Заметим, что наряду с положительно определенными формами иногда рассматривают также и отрицательно определенные формы. Так называются вещественные квадратичные формы, все значения которых при
175

вещественных значениях переменных, не равных одновременно нулю, отрицательны. Отрицательно определенные формы характеризуются тем, что при приведении их вещественными неособенными линейными преобразованиями переменных к диагональному виду все коэффициенты при квадратах новых переменных отрицательны. Вещественная квадратичная форма называется неопределенной, если она обладает как положительными, так и отрицательными значениями (при вещественных значениях переменных). Наконец, если среди значений формы нет отрицательных или нет положительных, но нулевые значения возникают не только при нулевых значениях переменных, то такая форма называется полуопределенной.
Упражнения
1.	Показать, что всякая вещественная квадратичная форма от п переменных вещественным неособенным линейным преобразованием переменных может быть приведена к виду
>1 4-у1 + ...+у1— ^s+I — •••— Уг (Г^п).
2.	Показать, что для любой положительно определенной квадратичной формы (не обязательно диагональной) все коэффициенты при квадратах переменных положительны.
3.	Доказать, что вещественная симметричная матрица А является матрицей положительно определенной квадратичной формы тогда и только тогда, когда ее можно представить в виде А = С'С, где С—вещественная неособенная матрица.
4.	Выяснить, какая из квадратичных форм
2xf -f- Зл^ 4- 4x1 — 4х^2 — 2xtx3 + 4х2х3, 2xj + %Х1 + 4xf — 4xiX2 — 2xtx3 — 4х2х3
является положительно определенной.
Отв. Первая форма положительно определенная, вторая —нет. 5. Доказать необходимость условия теоремы 4.
Указание. Установить, что для положительно определенной квадратичной формы f (хь ... , хл) «частичная» форма /(хь ... , x/j, 0, ..., 0) также положительно определенная. Использовать затем упражнение 3.
§ 20. Ортогональные преобразования переменных
В начале § 18 мы упоминали о задаче приведения общего уравнения кривой 2-го порядка к каноническому виду путем надлежащего выбора новой системы координат. Именно эта задача и послужила для нас 176
отправным моментом в построении теории приведения квадратичных форм к диагональному виду. Изучая вопросы приведения квадратичных форм, мы допускали произвольные неособенные линейные преобразования переменных. Однако в случае декартовых прямоугольных систем координат с одинаковым масштабом по всем координатным осям формулы преобразования координат являются преобразованиями весьма специального вида. Так, в случае поворота координатных осей на угол а вокруг неподвижного начала координат старые координаты х, у произвольной точки плоскости выражаются через ее новые координаты х', у' по формулам (3) из § 18. Среди преобразований вида
У = ^х' ~г^Уг )
формулы (3) из § 18 выделяются, как можно показать, условиями
М + Рч = b ^2 + P-i — h	(2)
= 0,	(3)
Если мы рассмотрим преобразование декартовых прямоугольных координат плоскости, при котором новая система получается из старой поворотом на угол а с последующим изменением направления одной из координатных осей на противоположное, то в этом случае формулы преобразования координат, записанные в виде (1), будут характеризоваться условиями (2), (3) и вместо (4) условием
"-------1.	(5)
Р-1 Р-2
Легко показать, что при выполнении (2) и (3) автоматически имеет место одно из условий (4) или (5). Следовательно, объединяя оба случая вместе, можно сказать, что преобразование (1) выражает формулы преобразования прямоугольных координат на плоскости (с сохранением начала и масштаба) тогда и только тогда, когда
177
выполнены условия (2) и (3). Равенства (4) и (5) свидетельствуют при этом о сохранении или, соответственно, об изменении ориентации координатных осей.
Рассмотрим теперь с такой же точки зрения формулы преобразования координат в пространстве.
Пусть в пространстве заданы две декартовы прямоугольные системы координат с общим началом и с одинаковым масштабом по всем координатным осям. Координаты х, у, z произвольной точки пространства в одной системе координат выражаются через ее координаты л/, /, z' во второй системе по формулам вида
X = XjAf	У$у' —j— ^iZ',
z = ItX' 4- Vi/ -|- v3z'.
(6)
В аналитической геометрии доказывается, что преобразование (6) выражает формулы преобразования декартовых прямоугольных координат в пространстве (с сохранением начала и масштаба) тогда и только тогда, когда его коэффициенты удовлетворяют условиям
При этом
р-14~ = 1, ’ ^+^1 + ^=1, 4^2 4“ Н1Н2	—о,
4" p-ip-з 4~ о, ^2^3 4“ Р'ЗР-З 4“ V2V3 = 0.
Hl
Vl
^2	^3
Н2 Из
v3
(7)
(8)
(9)
Обе координатные системы имеют одну и ту же ориентацию координатных осей тогда и только тогда, когда определитель (9) равен 4-1-
Из коэффициентов формул преобразования координат (6) составим матрицу
Xi	Х2	Х3
Hi	Н-2 Нз
V1	Vg
(Ю)
178
и рассмотрим векторы в пространстве, координатами которых в первой координатной системе являются столбцы матрицы (10). Равенства (7) геометрически означают, что эти три вектора все единичной длины, а равенства (8) — что они попарно ортогональны (рассматриваемые векторы образуют координатный базис второй системы координат).
Обобщим теперь линейные преобразования вида (1) и (6) (с условиями (2) — (3) и (7) — (8) соответственно) на случай произвольного числа переменных. Для этой цели введем следующее вспомогательное определение.
Определение. Вещественный столбец Т высоты п называется нормированным, если сумма квадратов его элементов равна 1. Два вещественных столбца Т\ и одной и той же высоты п называются ортогональными, если сумма произведений их соответствующих элементов равна 0.
Равенства (7) и (8) означают, например, что столбцы матрицы (10) нормированы и попарно ортогональны.
Если воспользоваться правилом умножения строчки на столбец, то условие нормированности столбца Т может быть выражено в виде равенства
ГТ=1,	(11)
а условие ортогональности столбцов Л и 7\— равенством
т;т2 = о	(12)
(или, что то же самое, равенством Т'Д\ = 0). Всякий ненулевой вещественный столбец
ai
ап
может быть превращен в нормированный столбец путем умножения его на надлежащий множитель. Действительно, нормированность столбца аТ означает, что
-j-	= 1,
179
поэтому надо взять .	I
V а\ + ^ + ...+^
(сумма квадратов под знаком корня отлична от нуля, так как столбец ненулевой).
Определение. Вещественная квадратная матрица называется ортогональной, если все ее столбцы нормированы и попарно ортогональны. Линейное преобразование переменных называется ортогональным, если его матрица ортогональна.
Условие ортогональности вещественной матрицы
Сц	Ch ... С\п
С-21	. С$п
Сп\ спЪ • • • ^пп
выражается, согласно определению, равенствами
+	+	1	(/=1, 2, ..., n), j
При п — 2 и п = 3 эти равенства превращаются, очевидно, в условия (2)—(3) и (7)—(8) соответственно. Следовательно, при и = 2 и п = 3 ортогональные преобразования переменных, и только они, выражают формулы преобразования декартовых прямоугольных координат (при переходе от одной системы к другой с сохранением начала и с одинаковым масштабом по всем координатным осям).
Теорема 1. Для того чтобы вещественная квадратная матрица С была ортогональной, необходимо и достаточно, чтобы
С'С = Е
(Е— единичная матрица).
Доказательство. Представим матрицу С в виде совокупности столбцов С = || Т\	... Тп\\ и положим
С'С = Х. Согласно правилу умножения матриц элемент i-й строчки и /-го столбца матрицы X равен
Xij—T ;Т j.
С другой стороны, условие ортогональности матрицы С 180
равносильно тому, что
Т'.т —I 1 при i = f’
1	( 0 при i Ф ]
(см. формулы (11) и (12)). Следовательно, матрица С ортогональна тогда и только тогда, когда Х — Е.
Теорема 2. Для того чтобы линейное преобразование переменных с вещественной квадратной матрицей было ортогональным, необходимо и достаточно, чтобы при этом преобразовании чистая сумма квадратов переменных переходила опять в чистую сумму квадратов новых переменных.
Доказательство. Чистая сумма квадратов переменных x'i	как квадратичная форма, в ка-
честве своей матрицы имеет единичную матрицу Е. После линейного преобразования переменных с матрицей С форма xj -ф-... х„ перейдет, согласно теореме 1 из § 18, в квадратичную форму с матрицей С’ЕС — С'С. Следовательно, полученная форма будет чистой суммой квадратов тогда и только тогда, когда С'С — Е, т. е. когда матрица С ортогональна.
Теоремы 1 и 2 мы можем рассматривать, разумеется, как другие определения ортогональной матрицы и ортогонального преобразования переменных.
Теорема 3. Ортогональные матрицы обладают следующими свойствами:
1)	определитель ортогональной матрицы С равен ±1;
2)	произведение ортогональных матриц есть ортогональная матрица,
3)	единичная матрица Е ортогональна-,
4)	для ортогональной матрицы С обратная матрица существует и равна транспонированной матрице С';
5)	для ортогональной матрицы С обратная матрица С'1 также ортогональна.
Доказательство. 1) Перейдем в равенстве СС = Е к определителям. Тогда, в силу теоремы из § 15 и свойства 1 из § 4, получим |С'С| = |С'| |С| = ==|С|4=1, откуда |С| = ±1.
2) Пусть Ci и С-2 — две ортогональные матрицы (одного и того же порядка), и пусть C = CiC-2. Тогда, согласно теореме 2 из § 13, мы имеем С'С = (CiCi)' CiC2 = = CjCjC1C!! — СгЕС1 = С'^ = Е, а значит, матрица С ортогональна.
181
Свойства 3) и 4) очевидны.
5) Пусть С — ортогональная матрица. Тогда
(С1)' С 1 = (С')' С~‘ = CC~l = Е, т. е. матрица ортогональна.
Следствие. П роизведение двух (или нескольких} последовательно выполненных ортогональных преобразований переменных является ортогональным преобразованием. Для ортогонального преобразования переменных обратное преобразование также ортогонально.
Первое утверждение следует из того, что при умножении линейных преобразований перемножаются их матрицы. Второе вытекает из теоремы 4 § 16.
Обратимся теперь к вопросу о построении ортогональных матриц.
Лемма. Пусть мы имеем k нормированных и попарно ортогональных столбцов Tit Tit ..., Tk высоты п (с вещественными элементами). Если k<^n, то можно построить нормированный столбец Т, ортогональный ко всем столбцам Tt, Т3, ..., Tk.
Доказательство. Пусть
Ортогональность столбца Т к столбцам 7\, Т3.....Tk
равносильна выполнению следующих равенств:
CnXi -j-CaiXj -|~... -4- cniXn—О, C12-V1 4~ СаХг -|~ CniXn = О,
ClkXl -f- CikXi -1- ... -J- Cnkxn = 0. .
Для определения столбца Т мы получили однородную систему k линейных уравнений с п неизвестными. Так как k<^n, то, по теореме 3 из § 12, система имеет ненулевые решения. Пусть ai, а3, ..., ап — какое-нибудь ненулевое вещественное решение системы (коэффициенты Cij по условию вещественны). Положим
Ci = ——т=— (i — 1, 2, ..., п). ^i + - + <	-
182
Столбец с элементами Ci, с%, .,., сп будет, очевидно, нормированным и ортогональным ко всем столбцам Ть
Повторное применение доказанной леммы (пока не получим систему из п нормированных попарно ортогональных столбцов) позволяет сформулировать следующую теорему.
Теорема 4. Для любой системы k нормированных попарно ортогональных столбцов Ти ..., Tk существу-ет ортогональная матрица С, первые k столбцов которой совпадают с заданными столбцами Tlt ..., Tk.
Следствие. Для любого нормированного столбца Т существует ортогональная матрица С, первый столбец которой совпадает с Т.
Упражнения
1. Понятия нормированное™ и ортогональности могут быть перенесены и на строчки. Показать, что в ортогональной матрице все строчки нормированы и попарно ортогональны.
2. Построить ортогональную матрицу, две первые строчки
12	2	1 II	II 2	1	2 II
-у----Т	Т II и	IIТ	“5----5"	•
о	о	о ||	| о	о	о ||
Отв. Надо добавить одну из строчек
3. Ясно, что целочисленная матрица является ортогональной тогда и только тогда, когда в каждой строчке и в каждом столбце имеется только один отличный от нуля элемент, равный ±1. Доказать, что всего имеется 2пп\ целочисленных ортогональных матриц порядка п.
4. Доказать, что всякая ортогональная матрица 2-го порядка с определителем +1 имеет вид
COS а — sin а sin а cos а
§ 21. Приведение квадратичной формы
к диагональному виду ортогональным преобразованием
В предыдущем параграфе мы видели, что для решения задачи приведения общего уравнения кривой 2-го порядка на плоскости или поверхности 2-го порядка в пространстве важно уметь приводить вещественные квадратичные формы к диагональному виду
183
ортогональным преобразованием переменных (а не произвольным неособенным преобразованием, как это мы делали в § 18 и 19).
В дальнейшем столбец из переменных xt, х3, ..., х„ мы будем обозначать через X, столбец из yt, yt,..., уп — через Y и т. д.
Теорема 1. Каждая вещественная квадратичная форма f(xs, х-2, ..., хп) с матрицей А при помощи некоторого ортогонального преобразования переменных X = CY может быть приведена к диагональному виду
Kyi Н" 4~ • • • ^пУ'п-	(1)
Коэффициенты Хь Х2, ..., Хл при квадратах новых переменных с точностью до порядка определены формой f(xi, .... хп) однозначно: они совпадают с корнями характеристического многочлена ср (/) — | А — tE | матрицы А. Столбцы Т,, Tt.... Тп ортогональной матрицы
С являются собственными столбцами матрицы А, соответствующими собственным числам Хь Х2>	Х„.
Доказательство. 1°. Предположим сначала, что для формы / существует ортогональное преобразование X = CY, приводящее ее к виду (1). Докажем, что при этом предположении справедливы оба последних утверждения теоремы.
Согласно теореме 1 из § 18 мы имеем равенство
Xi 0 ... О
О 0 ... Х„
Характеристический многочлен матрицы справа (см. § 17), очевидно, равен (Xj— /) (Х.2— /)... (ХлНайдем характеристический многочлен матрицы слева. Мы имеем
|С'ЛС —/£| = |С'ЛС-С'(*£)С| =
= \C'(A — tE)C\ = |С'|.| Л — tE\-\C\ = = |С'|-|С|-?(О = |С'С|-ср(О = |£|-?(О = ?(О.
(При выкладках мы воспользовались равенством С'С=Е, в силу которого С' (tE) C — t(C' ЕС) = t (С С) = tE, 184
затем теоремой 1 из § 14 и теоремой из § 15.) Таким образом,
?(/) = (Х1-0(х2-0...(Хл-0,
а значит, числа Хь Х2, ..., Х„ являются корнями характеристического многочлена ?(/) матрицы А. Этим доказано второе утверждение теоремы.
Обратимся теперь к равенству (2). Так как для ортогональной матрицы C' = C't, то, умножая (2) на С слева, мы получим
X, 0 ... О
О 0 ... Хя
Выполним умножения слева и справа, выразив матрицу С через ее столбцы: С = ||7'1 T2...T„|!. Согласно изложенному в § 13 произведение слева может быть представлено в виде совокупности столбцов ||ЛТ1 АТ,... ДТЛ||. Что касается произведения справа, то оно, как легко видеть, представляется в виде совокупности столбцов следующим образом: ||XjT, Х2Т\... Х„ТЯ||. Из равенства
\\ATt АТ,... ДТ„|| = ||/1Т1 ).,Т, ... ХЯТЯ|| получаем теперь, приравнивая соответствующие столбцы, что
ДТ1 = Х,Т1, ДТ8 = Х,Л.....лт„=хятя. (3)
Мы доказали, таким образом, последнее утверждение теоремы 1.
2°. Доказательство существования ортогонального преобразования, приводящего квадратичную форму к диагональному виду, мы проведем индукцией по числу переменных п. При п — 1 доказывать нечего, так как всякая форма от одной переменной диагональна. Пусть п 2, и пусть для форм от п — 1 переменных теорема уже доказана. Обозначим через X какое-нибудь собственное число матрицы А, т. е. матрицы нашей квадратичной формы /(xi, ..., хп) от п переменных. Так как матрица А вещественна и симметрична, то, по теореме 2 из § 17, число X вещественно. Найдем какой-нибудь
185
ненулевой вещественный собственный столбец Т матрицы А, соответствующий собственному числу X, т. е. такой столбец, что
АТ±=-ЛТ.	(4)
О существовании Т свидетельствуют результаты § 17. Домножив Т на надлежащий множитель, мы можем превратить его в нормированный столбец, не нарушая при этом равенства (4). Можно поэтому считать, что столбец Т в (4) нормированный, т. е. что
ТТ=1.	(5)
Согласно следствию теоремы 4 из § 20 мы можем построить ортогональную матрицу Ci = ||T 7\ ... Т„||, первый столбец которой совпадает с Т. Выполним ортогональное преобразование переменных X = CtY (с ортогональной матрицей Ci). После преобразования форма f(xt, , хп) перейдет в форму, матрица которой равна С;ЛС1 (теорема 1 из § 18). Найдем в этой матрице первый столбец (в силу симметричности матрицы мы тем самым будем знать и первую строчку):
с;лс!=с;ацт т*... тп\\=с\
о...
При выкладках, наряду с правилом умножения матриц (см. § 13), мы воспользовались равенствами (4) и (5), а также тем, что Т'гТ = ... = Т'пТ = 0 (последнее имеет место в силу ортогональности столбцов матрицы С|). После преобразования Х = С1У форма / примет, следовательно, вид
f =	+	.....Уп),
185
где g — некоторая (вещественная) квадратичная форма от п — 1 переменных. К форме g мы можем применить индукционное предположение. Значит, существует такая ортогональная матрица D порядка п—1, что после преобразования
У-2	Z-2
Уп zn | получим g(yt..............ул) = М + --- + М«.
Рассмотрим матрицу п-го порядка
Так как все ее столбцы, очевидно, нормированы и попарно ортогональны, то она является ортогональной матрицей. После ортогонального'преобразования Y —C^Z форма (6) перейдет, как легко видеть, в форму
Xzj -I- XgZjj -f-...	(7)
Итак, после двух последовательно выполненных ортогональных преобразований переменных форма f приняла диагональный вид (7). Остается сделать ссылку на следствие теоремы 3 из § 20, и теорема 1 доказана.
Замечание I. Из пункта 1° доказательства теоремы 1 следует, что если мы построили ортогональную матрицу С, все столбцы которой являются собственными столбцами матрицы А, то преобразование X — CY и будет тем ортогональным преобразованием, которое приводит форму f к диагональному виду. В самом деле, из равенств (3) при обратном рассуждении легко по лучить равенство (2).
Замечание 2. При построении столбцов ортогональной матрицы С мы должны наряду с условием нормированности столбцов соблюсти и условие их попарной ортогональности. Однако когда мы строим
187
матрицу С из собственных столбцов вещественной симметрической матрицы Л, то за условием ортогональности надо следить только для собственных столбцов, отвечающих одному и тому же собственному числу л. Действительно, согласно теореме 3 из § 17 собственные столбцы вещественной симметрической матрицы, соответствующие различным собственным числам, автоматически ортогональны.
Пример. Квадратичную форму
f ==: -j- х«2 ~Н хз Н~~	4X1X2 ~4xiX3 4X1X4 -j— 4X2X3 —
—4X2X4	4X3X4
привести к диагональному виду ортогональным преобразованием переменных.
Составляем матрицу А квадратичной формы f и находим для нее характеристический многочлен. В данном случае он равен
<?(0=(7 —0(—1—О’-
Следовательно, после надлежащего ортогонального преобразования X=CY форма примет вид
7У\-У1~У\-УЬ	(8)
Для каждого собственного числа находим теперь все собственные столбцы матрицы Д.
где а, р, 7 произвольны. Из первой серии нам надо выбрать один столбец, из второй — три. Выбирая ненулевые столбцы, вначале следим только за ортогональностью. Согласно замечанию 2 ортогональность столбцов из различных серий автоматически имеет место. Из второй серии первый столбец мы можем взять произвольно (только бы он не был нулевым). Второй столбец выбираем так, чтобы он был ортогонален первому. Наконец, третий надо выбрать так, чтобы он был ортогонален первым двум. В качестве искомых четырех 188
столбцов можно взять, например,
1
1
1
1
— 1
— 1
— 1
— 1
— 1
Умножая каждый из найденных столбцов на подходящий множитель, мы превращаем их в нормированные столбцы (в данном случае все столбцы надо умножить на . Расположив затем эти нормированные и попарно ортогональные собственные столбцы матрицы А в соответствии с расположением отвечающих им собственных чисел в диагональной форме (8), мы получим ортогональную матрицу С, для которой преобразование X = CY и осуществляет переход от заданной формы f к форме (8).
Ортогональным преобразованием, переводящим форму f в диагональную форму (8), таким образом, является преобразование
1	।	1	।	1 I 1
А'1 = у У1 г У Уг I У У» у У4’
1,1 1 1
х> = -j У1 + у У-i — у Уз — у Уь
1	1.1 1
Хя — у У‘ ~~ У У1 + У Уз — у У1,
1	1 1,1
*4 = У У1 — у У* — у Уз + yf/i.
(9)
До сих пор мы занимались вопросом приведения к диагональному виду только одной квадратичной формы. Естественно поставить вопрос, нельзя ли две квадратичные формы одновременно одним и тем же неособенным преобразованием переменных привести к диагональному виду. В общем случае ответ оказывается отрицательным. Однако в некоторых частных случаях такое одновременное приведение возможно. Оно возможно, например, если одна из форм положительно определенная.
Теорема 2. Пусть даны две вещественные квадратичные формы /(xi, ..., хп) и g(X[, ..., хп), из которых
189
одна положительно определенная. Тогда существует такое вещественное неособенное линейное преобразование переменных, при котором обе формы одновременно приводятся к диагональному виду.
Доказательство. Предположим, что форма f положительно определенная. По теореме 3 из § 19 при помощи некоторого неособенного вещественного преобразования X = BY форма f приводится к чистой сумме квадратов:
?=у1+у1+---+у*-	(10)
Подвергая тому же преобразованию X = BY форму g, мы получим некоторую форму h от новых переменных:
g-(xi, ..., xn) = h(yh ..., уп).
По теореме 1 при помощи надлежащего ортогонального преобразования переменных Y ~CZ форма h может быть приведена к диагональному виду:
h = Xjzj -р -{— • •. Ma.
При том же преобразовании Y = CZ форма (10), согласно теореме 2 из § 20, перейдет в чистую сумму квадратов.
Таким образом, после вещественного неособенного преобразования X = (BC)Z обе формы f и g одновременно приняли диагональный вид:
g =	-j“ ^2 4“ • • • +
Теорема 2 доказана.
Упражнения
1.	При помощи ортогонального преобразования переменных привести к диагональному виду квадратичные формы:
a)	+ xf + хз +	+ 2xiX2 — 2x^4 — 2х3х3 + 2х3х4;
b)	xf + Х1 + Х1 + х\ + 2x^2 + 2х3х4;
с)	4xtx2 — 2X4X4 — 2х2х3 + 4х3х4;
d)	х| + Х1 + xl + xl + 2xiX2 + 2x4X3 — 2xiX4 — 2х2х3 +
4- 2х2х4 + 2х3х4.
Отв. Преобразованием (9) каждая из форм приводится к виду: +	b)2y* + 2yi;
с)	— yl — Зу> d) + 2у] + 2у* — 2у*.
190
I
I	2) Квадратичную форму
+ 2*з — 4*Л + 4x^8
привести к диагональному виду ортогональным преобразованием переменных.
1	2	2
0ms. у'[ + 4yj — 2у|;	— Л-[- — Л-|-	(
2	1,2
х‘ = .
•	2,21
*г=	3-.У1+-3 Л—уЛ .
3. Пусть все собственные числа вещественной симметричной матрицы А больше вещественного р.. Доказать, что квадратичная форма с матрицей А — рЕ положительно определенная.
4. Пусть даны две вещественные квадратичные формы. Доказать, что одна из них может быть преобразована в другую ортогональным преобразованием переменных тогда и только тогда, когда характеристические многочлены их матриц совпадают.
§ 22. Приведение к каноническому виду общего уравнения линии и поверхности 2-го порядка
Общим уравнением второй степени называется уравнение вида
F(xit Хг, ... , хп) = 0,	(1)
где F(xx, , хп) — многочлен второй степени от п переменных Xi, Xt,... , хп. Многочлен F мы можем, очевидно, представить в виде суммы
п
Ffo......хл) = /(х1.......x„)4-22&iXi	+ c,
1=1
т. е. в виде суммы квадратичной формы f, линейной формы (однородного многочлена первой степени) и свободного члена с. Если через А мы обозначим матрицу квадратичной формы f, через X — столбец из переменных хь х.>....хп и через Т — столбец из коэффициен-
, тов bit b-2, ... , Ьп, то, пользуясь матричной записью, мы сможем многочлен F записать в виде
F(xt,	, х„) —Х'ЯХ Ц-2ХТ-|-с.	(2)
Имея в виду приложения к аналитической геометрии,
191

мы будем считать коэффициенты многочлена F вещественными. Заметим, что матрица А ненулевая, так как в противном случае многочлен (2) имел бы степень-^ 2.
Если п = 2, то уравнение (1) является уравнением линии 2-го порядка на плоскости в декартовой прямоугольной системе координат. При п = 3 уравнение (1) есть уравнение поверхности 2-го порядка в пространстве. Для общего уравнения линии на плоскости или поверхности в пространстве в аналитической геометрии ставится задача отыскания новой прямоугольной системы координат (с одним и тем же масштабом) так, чтобы уравнение данной линии или поверхности приняло наиболее простой вид.
Переход от одной прямоугольной системы координат к другой (как на плоскости, так и в пространстве) может быть осуществлен в два приема: 1) путем парал-лелыюго переноса начала координат в новую точку с сохранением направления осей и 2) путем поворотов осей при сохранении начала.
При параллельном переносе начала формулы преобразования координат, выражающие старые координаты произвольной точки через ее новые координаты, имеют вид
(l<i<n),	(3)
где Vi — координаты нового начала относительно старой системы координат (здесь п равно 2 или 3). Если через X мы обозначим столбец из старых координат х,-, через Y — столбец из новых координат yt и через V — столбец из координат У; нового начала, то формулы (3) можно будет записать в виде одного равенства:
X = V-\-Y.	(4)
При поворотах осей вокруг неподвижного начала формулы преобразования координат, как мы видели в § 20, в матричной форме могут быть записаны в виде
Х = СУ,	(5)
где С — ортогональная матрица (2-го или 3-го порядка).
Приведение уравнения (1) к простому (так называемому каноническому) виду с алгебраической точки зрения сводится, таким образом, к упрощению многочлена (2) при помощи преобразований переменных вида 192
(4) и (5). Мы сейчас решим эту задачу при произвольном п.
Прежде всего возникает вопрос, нельзя ли избавиться от членов, содержащих переменные в первой степени. При помощи преобразования (5) этого сделать нельзя, так как для ненулевого столбца Т ввиду неособенности матрицы С' столбец СТ всегда ненулевой, а значит,
Х'Т = (CY)'T = Y’C’T^O
(форма Х'АХ при преобразовании (5) переходит, как мы знаем, опять в квадратичную форму).
Подвергнем многочлен (2) преобразованию (4) и посмотрим, нельзя ли столбец V подобрать так, чтобы исчезла линейная часть:
^ = (У' + У')Л(У + У) + 2(У, + У')7, + с =
= Y'AY -[-Y’AV + WAY -\-WAV -\-2V'T + 2Y'T + c.
Так как WAY — (WAY)’ — Y'A'W' — Y'AV, to
F=Y’AY + 2Y'(AV + T)+cit	(6)
где ct — WAV-j-2WT-)-c. Отсюда видим, что первые степени новых переменных будут отсутствовать, если столбец V удовлетворяет условию
AV + T = O	(7)
(справа стоит нулевой столбец). Определение столбца V сводится, как видим, к решению системы п линейных уравнений с п неизвестными. Поскольку вещественная симметричная матрица А и столбец Т могут быть произвольными, то система (7) может оказаться как совместной, так и несовместной. (Совместность системы (7) при любом столбце Т мы можем гарантировать лишь при неособенной матрице А.) В нашей задаче приведения многочлена F к наиболее простому виду мы должны поэтому различать два случая в зависимости от того, будет ли матричное уравнение (7) разрешимо относительно столбца V или нет.
Предположим сначала, что уравнение (7) разрешимо. Тогда после преобразования переноса X — V -j-Y многочлен F ввиду (6) примет вид
F — Y'AY-j-Ci.
193
I-
Сделаем теперь вслед за переносом ортогональное преобразование переменных Y — CZ, приводящее квадратичную форму Y’AY к диагональному виду. Наши два последовательно выполненных преобразования X = = У-4-У и Y — CZ равносильны одному преобразованию
X = V-|-CZ.	(8)
В результате этого преобразования многочлен F принимает вид
F = \zl -f-... -J- й-	(9)
(Некоторые из коэффициентов X,-, но не все, могут, конечно, случайно оказаться равными нулю.) Сформулируем полученный нами результат.
Теорема 1. Пусть дан многочлен второй степени 1 от п переменных, записанный в виде (2). Если уравнение (7) разрешимо относительно столбца V, то при помощи преобразования переменных вида (8) с ортогональной матрицей С многочлен F приводится к каноническому виду (9).
Рассмотренный нами случай (разрешимость уравнения (7)) соответствует в аналитической геометрии так называемым центральным линиям и поверхностям 2-го порядка. Начало новой координатной системы находится в центре линии или поверхности, так как для всякой точки (?i,..., z„), удовлетворяющей уравнению F= 0, симметричная с ней относительно начала точка (—Zi,..., —zn) также удовлетворяет этому уравнению.
Обратимся теперь ко второму случаю, когда уравнение (7) неразрешимо. Как уже было отмечено, это может случиться только при особенной матрице А. Для особенной матрицы А существует ненулевой столбец То такой, что АТо — 0 (теорема 2 из § 12). Переписав последнее равенство в виде ДТ0 = 0-То. убеждаемся, что нуль является собственным числом матрицы А.
Подвергнем переменные многочлена (2) ортогональному преобразованию X = CY так, чтобы квадратичная форма Х'АХ приняла диагональный вид. Так как среди собственных чисел матрицы А имеются нулевые, часть коэффициентов при квадратах новых переменных будет равна нулю. Опустим эти квадраты с нулевыми коэффи-194


циентами. Мы получим для многочлена (2) в новых переменных выражение
F — ^iyi + • • • + КУг -|- 2 У, Cijji + с,
i=i
где г<^п и Xj ф 0, ..., \ ф 0 (столбец из с,- совпадает со столбцом СТ). При помощи параллельного переноса здесь можно избавиться теперь от первых степеней переменных i/i....уг. Действительно,
^iyi + ^cilJi = К [yi +
поэтому после параллельного переноса
~ ху +Zi	(ю)
yj — zj	J
многочлен F примет вид
F — Xjzj-j-...\rzlr 2 У CjZj-\-d, (11) ;=г-Н
где
Коэффициенты cr+i, , сп не могут быть все равными нулю. В самом деле, если бы су==0 при то это означало бы по доказанному выше, что разрешимо уравнение C'ACV -\-С'Т = О, а тогда и уравнение (7), как легко видеть, было бы разрешимым вопреки нашему предположению.___________
Положим р. = Yс^+1	• • • + Сп. Так как сумма квад-
ратов элементов
Д+1.....£«	'	(12)
р*	р*
равна 1, то, по следствию теоремы 4 из § 20, существует ортогональная матрица Do порядка п — rt первый столбец которой состоит из чисел (12). Составим клеточно-диагональную матрицу
195
где Е — единичная матрица порядка г. Легко видеть, что D — ортогональная матрица (ее столбцы нормированы и попарно ортогональны). Сделаем в выражении (11) ортогональное преобразование переменных Z= DU. Так как обратное преобразование U — D 'Z — DrZ имеет вид
иг —
и, —
то после преобразования получим
F =	-р 2[iur+i d.
Нашим последним преобразованием будет параллельный перенос
«Г + 1-	2(Х I ®Г + 1, I	(13)
ui==wi (iVr4-l). .
После его выполнения получим
F — biW'i-]- ... + X/W;4-2(мх»г+ь	(14)
Чтобы перейти от (2) к (14), мы выполнили вперемежку два ортогональных преобразования X = CY и Z — DU и два переноса (10) и (13). Запишем эти переносы в виде Y = Vi4-Z и U = и найдем вид окончательного преобразования, выражающего хг через Wj. Мы имеем
X = CY = С( 4- Z) = CVi 4- CDU = CV. +
4- CD(y3 4- iv)=c Vi 4- CDVi 4- cdw = v0 4- cdw, где Vo — некоторый столбец. Мы убедились, таким образом, что результирующее преобразование X = Vo 4" 4~ CDW в рассматриваемом случае также имеет вид (8), т. е. может быть разбито только на два преобразования — параллельный перенос с последующим ортогональным преобразованием.
Нами получена следующая теорема.
196
Теорема 2. Пусть для многочлена (2) уравнение (7) неразрешимо. Тогда при помощи преобразования переменных вида (8) с ортогональной матрицей С этот многочлен может быть приведен к виду
F = XjZj -j-... -J- Xrz; -|~ 2p.zr+i (Xi -ф 0, ... , Xr 0; р. ф 0;
Случай теоремы 2 соответствует так называемым нецентральным линиям и поверхностям 2-го порядка.
Применим доказанные теоремы к изучению общего уравнения 2-го порядка на плоскости. Согласно теоремам 1 и 2 каждое уравнение линии 2-го порядка в надлежащей системе координат имеет один из следующих видов:
+	= 0	(W0),
Хх2 =---2р.у (Х^О, |Х^0).
Перебирая возможные нулевые значения для Х2 и с и учитывая знаки встречающихся коэффициентов, мы приходим к следующим геометрическим образам (аир положительны):
1)	ах‘2 = 0 — одна прямая;
2)	ax2-|-p«/2 = 0— одна точка;
3)	ах2 — р«/2 = 0 — две пересекающиеся прямые;
4)	ах2 = 1 — две параллельные прямые;
5)	—ах2 = 1 — пустое множество;
6)	ах2 —J— Pi/2 = 1 — эллипс;
7)	ах'2 — рг/2 — 1 — гипербола;
8)	—ах2 — ру2= 1 — пустое множество;
9)	ах2 — у — парабола
(в случае 9 надо, быть может, дополнительно изменить направления осей).
Аналогично общее уравнение 2-го порядка в пространстве определяет один из следующих геометрических образов (а, р, у положительны):
1)	ах2 = 0 — одна плоскость;
2)	ах2-1-pz/2 = 0— одна прямая;
3)	ах2 — ру2 — 0 — две пересекающиеся плоскости;
4)	ax2-|~P//2-|-iz2 = 0 — одна точка;
5)	ах2 4- р#2 — 7?'2 = 0 — конус;
6)	ах2=1—две параллельные плоскости;
7)	— ax'2 — 1 — пустое множество;
197
8)	ах9-}"^9— 1—эллиптический цилиндр:
9)	их- — ру2= 1 — гиперболический цилиндр;
10)	— ах2 — j3y2= 1 — пустое множество;
11)	ах2 -j- ру2 -j- fz2 = 1 — эллипсоид;
12)	ах2 + р«/2 — уг2= 1 — однополостный гиперболоид;
13)	ах2 — 8«/2 — fz2 = 1 — двуполостный гиперболоид;
14)	— ах2 — ру2 — 7Z2 = 1 — пустое- множество;
15)	ах2 = «/ —параболический цилиндр;
16)	ax24~?«/2 = z — эллиптический параболоид;
17)	ах2 — Pf/2 = z — гиперболический параболоид.
Пример 1. Привести к каноническому виду уравнение поверхности
2х[ + А — 4X1X2 — 4х2х3 + 12xi — 8х2 Ц- 8х3	6 — 0.
Уравнение (7) здесь разрешимо: Vi ——1, щ = 2, и3 = 0. Делаем параллельный перенос по формулам (4): Xi = — 1 + z/i, х2 = 2 4- yt, Хз = у3. У равнение принимает вид
2г/! + У1 — 4Z/i№ — 4^з — 8 = 0.
При помощи ортогонального преобразования 2	2	1
У1 =	у	“И у Z'2 “Г у 2з,
2	.1	,2
Z/-2---з"	“Г у ^2  3* ^3,
1	2.2
Уз —	з 2^1 з ^2"р з %з
квадратичная форма в левой части уравнения приводится к виду 4zf4-^2 — 2z|. Следовательно, в новой координатной системе уравнением поверхности будет
4 ।	_ I
2*8	4
(однополостный гиперболоид).
Пример 2. Привести к каноническому виду уравнение поверхности
2х|	2х^	Зхд —j— 4xi%2 —j— 2xi Хз 2x^X3 IOX2 1 = 0.
Уравнение (7) в данном случае не имеет решения — значит, поверхность нецентральная. Выполним ортого-198
иальное преобразование, приводящее квадратичную форму к диагональному виду:
1.1	1
Хй = ~F= У1 + "7^ У*-7= Уз, I
/3^	/6	/2
1	2
Хз = Ух-------zzz U}.
/3	/б
После этого преобразования уравнение принимает вид
5/4 + 2у1 Ч- 10 У1 +р= у. - 2=	4- 1 =0.
Делаем теперь параллельный перенос, чтобы избавиться от членов с yi и yt и свободного члена:
1	।	5	.	11/2 .
У1 =----7=4-21, yi =-----— 4-Zi, Z/з =----------Г^З-
/з	2|/6 1	40	1
Окончательно уравнение принимает вид
5г| + 2г1 = 5К2гз
(эллиптический параболоид).
Упражнения
1. Привести к каноническому виду уравнение линии
х2 4-у2 + Злу + х + 4у = 0.
5 ,й . 1	о . х'+у'	. . х' — у'
Отв. -Yx-* + y^-=l; х = -2 + -^(	.
2. Убедиться, что линия, определяемая уравнением
9х2 — бху -f- у1 — х -J- 2у — 14 = 0,
является параболой.
Зенон Иванович Боре вин Определители и матрицы AL, 1970 г., 200 стр. с илл. Редактор А. Ф. Лапко Техн, редактор В. Я. Кондакова Корректор Г. С. Плетнева
Сдано в набор 13/VI 1969 г. Подписано к печати 3/XI1 1969 г. Бумага 84Х108’/з2. Физ. печ. л. 6,25. Условн. печ. л. 10,5. Уч.-изд. л. 9,11, Тираж 58 000 экз. Т-16035. Цена книги 32 коп. Заказ № 616.
Издательство «Наука»
Главная редакция физико-математической литературы
Москва, В-71, Ленинский проспект, 15
Ордена Трудового Красного Знамени Ленинградская типография № 1 «Печатный Двор» имени А. М. Горького Главполиграфпрома Комитета по печати при Совете Министров СССР, Ленинград, Гатчинская ул., 26.

тенэ'п
и II
Ilillu

.....I!
h::ie:
in in
llihll Hinn ullih !!!l!!! iillili .....I! IliilE! !!!!!!!
lld.ll
Ilillu IE!!!!!
mil n.i.ii
!!!!!!) Ililii! IIEIili Ullin
иши iidiii IIIU iiiliu
О)
О)
со
ф
m
ф