/
Author: Окунев Л.Я.
Tags: математика алгебра высшая математика естественные науки высшая алгебра точные науки
Year: 1958
Text
Л. Я. ОКУНЕВ
ВЫСШАЯ
АЛГЕБРА
Допущено
Министерством высшего образования СССР
в качестве учебника для педагогических институтов
и учебного пособия для государственных университетов
ГОСУДАРСТВЕННОЕ
УЧЕБНО-ПЕДАГОГИЧЕСКОЕ ИЗДАТЕЛЬСТВО
МИНИСТЕРСТВА ПРОСВЕЩЕНИЯ РСФСР
Москва 1958
ПРЕДИСЛОВИЕ
Эта книга предназначена для студентов педагогических
институтов и университетов и в отношении как характера, так и
плана изложения во многом существенно отличается от моего
учебника „Высшая алгебра", выдержавшего несколько изданий.
Не останавливаясь на деталях, отмечу следующее.
В главу II внесен ряд методических улучшений, позволяющих,
на мой взгляд, более отчетливо изложить линейную
зависимость /г-мерных векторов.
Поскольку в главе IV излагается общая теория многочленов
над произвольным числовым полем, я счел целесообразным
начать эту главу с комплексных чисел. Материал этой главы
подвергся основательной переработке.
Глава V посвящена основной теореме алгебры и вопросу
решения алгебраических уравнений в радикалах. В § 33 и 34
этой главы дается представление о разрешимости
алгебраических уравнений в радикалах и рассматриваются уравнения
третьей и четвертой степени, а в § 35 излагаются необходимые
и достаточные условия разрешимости уравнений третьей степени
в квадратных радикалах. Затем эти условия применяются
к некоторым классическим задачам из теории геометрических
построений. Заключительный параграф (§ 36) главы V содержит
некоторые исторические сведения, относящиеся к вопросу
решения уравнений в радикалах, а также краткое изложение
идеи метода Лобачевского приближенного вычисления
комплексных корней.
Глава VI посвящена численному решению алгебраических
уравнений. При этом способы Ньютона и прямолинейного
интерполирования излагаются в тесной связи с методом
итераций, что мне кажется вполне оправданным.
Глава VII написана мною заново. В нее я включил
параграфы, посвященные результанту и исключению неизвестного
из системы двух алгебраических уравнений высших степеней
с двумя неизвестными. Понятие результанта вводится здесь
по Сильвестеру и с меньшей громоздкостью. Попутно отмечу,
что лемма о высшем члене произведения двух многочленов
излагается уже в § 42, так как она используется не только
для доказательства основной теоремы о симметрических много-
3
членах, но и для простого доказательства теоремы об отсутствии
делителей нуля в. кольце многочленов от нескольких
неизвестных над числовым полем. Доказательство леммы проводится
методом математической индукции.
В конце книги помещено приложение, посвященное вопросу
неразрешимости алгебраических уравнений в радикалах. Это
приложение уже выходит за пределы программы курса высшей
алгебры и по своему содержанию труднее, чем предшествующие
главы книги. Оно предназначено для читателей несколько
более узкого круга, желающих углубить и дополнить свои
знания по высшей алгебре. Изложение я здесь сознательно
сделал более лаконичным,—это будет способствовать более
активному и глубокому восприятию материала.
В книге содержится ряд упражнений, необходимых для
усвоения курса.
В заключение приношу благодарность всем товарищам
и особенно А. И. Мальцеву, критическими замечаниями и
советами которых я воспользовался в своей работе над
рукописью.
30 марта 1957 г.
Л Я- Окунев
Глава первая
ТЕОРИЯ ОПРЕДЕЛИТЕЛЕЙ
§ 1. Определители второго порядка
Теория определителей имеет важное значение не только
в алгебре, hq и в других математических дисциплинах,
например в аналитической геометрии. Мы начинаем курс высшей
алгебры с теории определителей, тесно связанной с уравнениями
первой степени со многими неизвестными.
Простейшим примером уравнения первой степени, или, как
мы будем говорить, линейного уравнения, является уравнение
с одним неизвестным. Всякое уравнение первой степени с одним
неизвестным молено привести к виду
ах=Ь. (1)
Если а ф О, то, разделив обе части уравнения (1) на а,
получим единственное решение, или, как его называют, корень
уравнения: х=—. В случае а=0 и ЬфО уравнение (1) не
а
имеет решений, так как, очевидно, всякое число, умноженное
на нуль, должно дать нуль1. Наконец, если а = 0 и & = 0, то
любое число будет удовлетворять уравнению (1); в этом случае
рассматриваемое уравнение будет иметь бесчисленное множество
решений.
Несколько сложнее случай двух линейных уравнений с двумя
неизвестными:
a.x + b.y^c,, j
а2х+ b2y=*c2. J ^ '
Найдем решение системы уравнений (2), т. е. найдем такую
пару значений х=ау у = р неизвестных, которая удовлетворяет
обоим уравнениям (2).
1 Под словом „число" мы подразумеваем комплексное и, в частности,
действительное число,
5
Умножим первое уравнение системы (2) на Ь2, а второе на Ъ1
и затем вычтем из первого уравнения второе. Получим:
{alb2—a2b1) x=clb2—c2b1. (3)
Подобным же образом исключая х, получим:
(а А—а А) У = а1с2—а2с1. (4)
Если выражение алЬ2—а2Ьх не равно нулю, то, разделив
обе части уравнений (3) и (4) на alb2—a2biy находим:
_ c)b2 — c2bl ахс2 — а2С1 ,с\
0^2 — 02&1 #1^2 — й2Ьх
Можно убедиться, что в случае а1Ь2—а2Ь1фО
совокупность значений (5) неизвестных х и у образует решение
(и притом единственное) системы уравнений (2), но мы этого
показывать не будем, так как аналогичное исследование
будет проведено для системы п линейных уравнений с п
неизвестными. Таким образом при помощи формул (5) можно
решить любую систему линейных уравнений с двумя
неизвестными, для которой а1Ь2—а2Ь1фО.
Пример. Решить систему уравнений
2х—5у = 1,
Зх+ у=4.
По формулам (5) сразу получаем корни:
Ы_4.( — 5) 21
х=
У=
2-1 _3( —5) 17
2-4 —31 _ 5
2-1 — 3(— 5) " 17
Еще раз обращаем внимание на то обстоятельство, что
формулы (5) можно применять только в случае а1Ь2—а2Ь1фОу
так как деление на нуль невозможно. Легко убедиться на
примерах, что в случае я А—а2Ь^=0 система (2) либо
противоречива, либо имеет бесчисленное множество решений.
Вернемся теперь к формулам (5) и установим, по какому
закону они составлены.
Напишем следующую табличку коэффициентов при
неизвестных системы (2):
а> Ьх {А)
а2 Ь2 .
Эту табличку мы назовем матрицей второго порядка, а
коэффициенты аи Ьи а2у Ь2—ее элементами. В первой строке мат-
6
рицы идут коэффициенты первого уравнения, а во второй—
коэффициенты второго уравнения. Составим два произведения
„крест-накрест" alb2 и а2Ь{. Если из первого произведения
вычесть второе, то получится общий знаменатель дробей (5):
D=axb2—#2^i«
Это выражение называется определителем (или
детерминантом) второго порядка, составленным из элементов матрицы (Л),
при этом аи а2, Ъи Ъ2 также называются элементами
определителя D. Определитель D обычно обозначают символом
D=
аг Ьх
а2 Ь2
Теперь нетрудно подметить общий закон составления
числителей формул (5). Числитель для х получается из
знаменателя заменой коэффициентов ах и а2 свободными членами
уравнений: сг и с2. Точно так же числитель для у получается
из знаменателя путем замены коэффициентов свободными
членами сг и с2. Таким образом,
clb2—c2bl =
ал.
1^2"
a2ct =
Сх
Ci
ах
а2
Ьг
ъА
сЛ
C-i\
и формулы (5) принимают следующий чрезвычайно легко
запоминаемый вид:
х =
|с,
\сг
1 а,
I 02
ч
М
Ч
ч
У =
[fll
'а2
И1
|02
С\ I
С2 1
ьЛ
ь%\
(6)
Пример. Решить систему уравнений:
5*—Зу-7,'
2х—5у = 1.,
Прежде всего составляем определитель системы:
15-31
£>=
2-5
=5-(—5) — 2-(—3) =—19.
Далее, составляем числитель для х, для чего первый
столбец определителя D надо заменить свободными членами 7 и 1.
Получаем:
А= lilJP =7-(—5)—I- (-3) =-32.
7
Подобным же образом, заменяя в D второй столбец
свободными членами, получаем определитель:
D2 =
5 7
2 1
= 5-1—2-7 = —9.
Так как D^O, то по формулам (6) находим, что
D, = — 32 _ 32 £>2 —9 9
D ~~ — 19 ~~ 19
У =
D
— 19 • 19
§ 2. Определители третьего порядка
Обратимся теперь к системе трех линейных уравнений:
агх + bLy + cxz=dlt
a2x + b2y + c2z = d2,
a3x + bBy + csz=d3,
(1)
с тремя неизвестными. Решая и эту систему при помощи
методов, употребляемых в элементарной алгебре, мы после
несколько более громоздких выкладок получим:
D-x=d1b2cs + d2bbCi + dsb1c2—dibsc2—d2b1cs—dsb2cu
D-y = axd2c^ + a2d3cx + aBd1c2—a1d^c2—a2d^c^—a3d2cly
D• z=aib2ds + a2b$di-\- a$bxd2—axb3d2—a2b{d3—asb2dlt
(2)
В левых частях уравнений (2) коэффициентом при
неизвестных является одно и то же выражение:
D=a1b2cs + а2Ьъсх-\г аъЬ1с2—а1Ьгс2—а2Ь1с3—агЬ2с1. (3)
Постараемся разобраться в структуре выражения (3), для
чего составим табличку из коэффициентов при неизвестных
системы (1):
ах Ьх сх
а2 Ь2 с2 . (А)
&3 ^3 ^3
Назовем эту табличку матрицей третьего порядка, а аъ Ь1У
Съ а^ Ь2у съ а3, ЬЗУ с3—ее элементами. Само выражение (3)
мы будем называть определителем (или детерминантом)
третьего порядка, составленным из элементов матрицы (Л),
и будем обозначать через
ах
а2
аь
Ьг
ь,
ь,
С\
Сг
с*
Проведем в матрице (А) „левую" главную диагональ а1Ь2св,
идущую слева вниз, и „правую" главную диагональ схЬ2аъ,
идущую справа вниз. Кроме двух главных диагоналей, можно
провести еще четыре „неполных" диагонали b1c2y ci2b2, Ъха2 и
с2Ь2. Условимся называть неполную диагональ „левой", если
она параллельна леЕОй главной диагонали, и „правой", если
она параллельна правой главной диагонали. Легко видеть, что
произведение ахЬгсъ элементов левой главной диагонали
входит в определитель D со знаком плюс, а произведение аьЬ^сх
элементов правой главной диагонали—со знаком минус. Каждое
из остальных четырех слагаемых определителя D представляет
собой произведение из трех элементов, причем два элемента
находятся на неполной диагонали, а третий элемент—в
противоположном углу. Это произведение берется со знаком плюс
в случае левой неполной диагонали и со знаком минус в
случае правой неполной диагонали. Например, одна из неполных
диагоналей проходит через а2 и Ь{\ в противоположном углу
находится элемент св; поэтому получаем произведение а2Ъхсъ
которое следует взять со знаком минус, так как элементы а2
и Ьг лежат на правой диагонали.
Этот способ получения определителя D третьего порядка
называется правилом Саррюса.
Пример. Вычислить определитель
D=
1 2 3
2 2 1
3 1 2
Пользуясь правилом Саррюса, получаем
D=l-2-2 + 2-1.3 + 3-2-l-3-2-3—2-2-2—1-Ы = -11.
Посмотрим теперь, что представляет собой выражение,
стоящее в правой части первого уравнения (2). Нетрудно
сообразить, что оно есть также определитель третьего порядка,
а именно:
А=
4
d2
d3
Ъх сх
Ъ% с2
Ьъ сь\
Поэтому первое из уравнений (2) принимает вид:
а± Ьх сг
&2 "2 ^2
#з ^з ^з
•х =
d{ bx Cj
#2 ®2 ^2
аъ 03 сь
(4)
Аналогичный результат получается и для остальных
неизвестных:
(5)
\аг Ьх сх
&2 &2 ^2
#3 #8 С3
al bl сх
а2 Ь2 с2
аъ о3 с9
•У =
•z =
а1 dl cx
&2 (l^ ^2
&ъ ^з сг
al b1 dx
а2 b2 d2
аъ Ьъ йъ
(6)
Если определитель D отличен от нуля, то уравнения (4),
(5) и (6) можно решить относительно неизвестных:
х =
1 di
di
1 d3
ь,
6г
h
Cl 1
Сг
Сз 1
D
at dx cx
fl2 d% С*
a3 d^ c3
z= ■
ax bx rfj
fl2 ^2 d%
Ад ^з ^з
D
D
(7)
Нетрудно убедиться, что при D Ф О совокупность значений (7)
неизвестных в самом деле образует решение (и притом
единственное) данной системы линейных уравнений (1), но мы эту
проверку производить не будем (аналогичная проверка будет
проведена в общем случае системы п линейных уравнений
с п неизвестными).
Итак, получается следующая теорема:
Если определитель Dy составленный из коэффициентов
системы (1), отличен от нуля, то система (I) имеет
единственное решение, получаемое по формулам (7).
Пример. Решить при помощи определителей систему:
ZX\—4^2 \ «^3 =—*-** "^1—W^2 \ *->X§ — \j) Xi — Х% ~\~ Х^ = 2*
Прежде всего вычислим D:
2-4 1 t
' = -10-12-1 + 5 + 4 + 6 = -8.
D=
-5 3
-1 1
Так как D Ф 0, то система допускает решение и притом
единственное. Вычисляем теперь остальные три определителя:
А=
-3-4.1
0-5 3,
2-4- 1
= -8, А=
А>=
2-4-3
1-5 0
1-1 2
2-3 1
1 0 3
1 2 1
= -24.
=-16,
10
Таким образом,
*i =
D
Д
1» «^2— п —^» "^3 —
D
Р3
D
= 3.
В качестве контроля можно найденные значения
неизвестных подставить в уравнения. Легко убедиться, что система
решена правильно.
Задачи. 1. Вычислить значения следующих определителей второго
порядка:
* 2 51
1 — 1 б
2. Вычислить определители:
1+ i 2 — i
Ъ — i 3i
где
i = Y— 1.
COS a sin a
Sin a COS о
a + *i a
a a -f *2
3. Проверить справедливость следующих тождеств:
а)
б)
в)
г) ах
Д) сц
а -\- ах b + Ьл
с
а-\- ах b
с + сх d
Vb,
i
=
a b
с d
a b
с d
+
+
a
i *i
с d
flj b
C\
d
j
aa! -j- Ьсл аЬг -f 6dx
aLc + ^d 6jc + ddx
a b
с d
ax 6,
bx cx
62 C2
a% C2
Д3 Сг
-Ьл
— a2
ax Cl
U2 C2
ax cx
«3 C3
+ *i
+ a3
ax bx
0,2 t>2
la, cx
I ci2 C2
= 0;
= 0.
4. При помощи определителей второго порядка решить следующие
системы линейных уравнений:
а) 7х + 2у = 3, 11* — Ъу = 4;
б) х cos а + у sin а = 6, — * sin а +у cos а = с\
в) 17и —15и = 0, 11н + 21с=0.
5. При помощи правила Саррюса вычислить следующие определители
третьего порядка:
1 +а 1 1
1 1 +а 1
1 1 1 -fa
6. Распространить тождества задачи 3 на определители третьего порядка.
7. При помощи определителей третьего порядка решить следующие
системы уравнений:
а) *+У+г = — 2, Зх + у + 4z = — 13, 8* + 9у + 5г = — 5;
б) Ьх + ау = — 2а&, — 2су + bz = bc, сх + аг = 0, а + О, 6^0, с ^ 0.
11
12 3
2 3 1
3 1 2
»
1 2 4
1 3 9
1 4 16
§ 3. Определители высших порядков
Изучение структуры определителей второго и третьего
порядка дает возможность ввести понятие определителя любого
порядка. Для этого рассмотрим так называемую систему
двойных индексов: каждый элемент определителя обозначим одной
и той же буквой а с двумя индексами внизу, первый индекс
будет указывать номер строки, а второй—номер столбца,
занимаемого элементом. Например, элемент определителя
третьего порядка, находящийся во второй строке и в третьем
столбце, мы обозначим через а23.
Определители второго и третьего порядка в новом
обозначении выглядят так:
ап аг
22 I
— С1пй22 #12^21»
(1)
11 #12 1
Clot do
#31 #32
*23
— #Ц#22#33 ~Ь #12#23#31 Н~ #13#21#32— (4)
#13#22#31 #12#21#33 #11#23#32«
Ниже мы убедимся, насколько полезна подобная система
обозначений.
Отвлечемся несколько в сторону и займемся на первый
взгляд посторонними вещами.
Из элементарной алгебры известно, что из п чисел 1,
2, ..., п можно составить всего Ь2-...-/г перестановок.
Произведение l-2'...'Л принято сокращенно обозначать ^ерез п\
и называть „п факториал".
Например, из трех чисел 1, 2, 3 можно составить всего 3!=6
перестановок: 123, 132, 312, 321, 231, 213.
Среди написанных шести перестановок выделяется первая,
123—в ней числа идут в натуральном порядке; в остальных
перестановках этот порядок нарушен. Возьмем, например,
перестановку 132; мы видим, что число 3 стоит впереди числа 2.
Такое явление, когда большее число находится впереди
меньшего, будем называть беспорядком, или инверсией. Таким
образом, в перестановке 132 наблюдается лишь одна инверсия.
Рассматривая далее 312, находим, что 312 имеет уже две
инверсии: 3 стоит впереди 2 и 3*—впереди 1. Перестановка 321
содержит три инверсии, и т. д.
Подсчет числа инверсий довольно удобно выполнять так:
прежде всего находим, сколько чисел перестановки стоит
впереди 1; затем 1 вычеркиваем и подсчитываем, сколько чисел
стоит впереди 2 (не считая зачеркнутой единицы); после этого
вычеркиваем 2 и подсчитываем,сколько чисел стоит впереди 3
(зачеркнутые числа не считаются), и т. д. Пусть впереди 1
было кх чисел, впереди 2 — к2 чисел и т, д., наконец, впереди
12
n — kn чисел. Тогда общее число инверсий в рассматриваемой
перестановке равно kx + k2 + . .. -f- kn.
Пример. Подсчитать число инверсий в перестановке
531642.
Впереди 1 стоят два числа (5 и 3). Зачеркиваем 1:
5 3 Г 6 4 2
Впереди 2 стоят четыре числа (5, 3, 6 и 4). Зачеркиваем 2:
5 з * б ь г
Впереди 3 стоит одно число (5). Зачеркиваем 3:
Впереди 4 стоят два числа (5 и 6). Зачеркиваем 4:
Впереди 5 ничего не стоит. Зачеркиваем 5:
Наконец, впереди 6 также ничего не стоит (все
вычеркнуто). Следовательно, искомое число инверсий равно 2 + 4 +
+ 1+2 = 9.
Вернемся к определителю (1) второго порядка. Члены в
правой части (1) сознательно написаны так, что первые
индексы букв идут в натуральном порядке. Что касается вторых
индексов, то они образуют всевозможные перестановки из двух
чисел 1 и 2, а именно 12 и 21. Первой перестановке отвечает
член #и#22> взятый со знаком плюс, а второй перестановке—
член #i2#2i> взятый со знаком минус. Мы видим, что среди
вторых индексов букв члена, взятого со знаком плюс,
наблюдается четное число инверсий (нуль считается числом четным!),
а со знаком минус—нечетное число инверсий. Заметим еще,
что каждый член содержит по одному и только по одному
элементу из каждой строки и столбца определителя.
Подмеченная закономерность остается в силе и для
определителя (2) третьего порядка: при натуральном расположении
первых индексов букв каждого члена, вторые индексы
образуют всевозможные перестановки из трех чисел: 1, 2, 3; члены
с четным числом инверсий во вторых индексах букв имеют
знак плюс; с нечетным числом инверсий—знак минус. Наконец,
каждый член содержит по одному и только по одному
элементу из каждой строки и столбца определителя.
Подмеченную закономерность можно положить в основу
обобщения понятия определителя.
13
Пусть п2 величин atj расположены в виде следующей
квадратной таблицы:
аи а12 . . . а1п
a2i а22 . . . а2п
Назовем таблицу (А) матрицей п-го порядка, а входящие
в нее величины а^—элементами матрицы и введем
следующее определение.
Определение. Определителем (или детерминантом) п-го
порядка из п2 элементов матрицы (А) называется
алгебраическая сумма всевозмоэюных членов, представляющих
собой произведение п элементов, взятых по одному и
только по одному из каждой строки и каждого столбца
матрицы. Знак члена равен ( —1)', где t—число инверсий в
перестановке вторых индексов элементов члена, когда сами
элементы члена расположены в порядке возрастания
первых индексов.
Таким обоазом, член имеет знак плюс при четном t и
минус при нечетном t. Кроме того, очевидно, что определитель
#-го порядка имеет всего п\ членов.
Определитель /г-го порядка принято обозначать символом:
ап а12 . . . а1п
#21 ^22 • • • &2п
I ап\ ап2 • • • апп |
Пример 1. Найти, чему равен определитель четвертого
порядка.
I 0 0 0 аи I
D I 0 0 а23 О
О а32 О О
| а41 0 0 0 |
Согласно определению, D есть алгебраическая сумма
41 = 24 членов, но здесь только один член
#14#23#32#41
отличен от нуля. Мы записали этот член з порядке
-возрастания первых индексов его элементов; что касается вторых
индексов, то они образуют перестановку 4321, содержащую
1 Это обозначение введено известным английским математиком XIX
столетия Кэли (A. Cayley, 1821 — 1895).
14
шесть инверсий. Следовательно, член аиа2гаВ2аа надо взять
со знаком плюс, и мы получаем, что
*-) — #14^23^32^41*
Из этого примера видно, что правило Саррюса не годится
для определителей выше третьего порядка.
Пример 2. Найти, при каких значениях / и у член
^oiaiia2ja4BaB2 определителя пятого порядка имеет знак минус.
Индексы / и у могут принимать только следующие
значения: а) /=^4, у'=5 или б) 1 = 5, у = 4, так как при других
значениях / и / произведение dri]aua2JaABas2 будет содержать по
меньшей мере два элемента из одного столбца. Чтобы
определить знак члена, надо расположить элементы члена в
порядке возрастания первых индексов и затем подсчитать число
инверсий в перестановке, образуемой вторыми индексами.
Перемещая надлежащим образом элементы, получаем:
aUa2;a В2а4 ВаЫ-
Пусть а) /=4, у=5. Тогда получим перестановку 45231,
содержащую 8 инверсий. Следовательно, при *=4, /=5 член
имеет знак плюс.
Пусть затем б) /=5, У=4. Вторые индексы образуют
перестановку 54231, содержащую 9 инверсий. Следовательно, в этом
случае получается знак минус.
Итак, данный член имеет знак минус только при /=5,у=4.
§ 4. Транспозиции
Перейдем к изучению свойств перестановок, играющих
важную роль в теории определителей.
Если в некоторой перестановке
abc . . . /
из п элементов поменять местами какие-нибудь два элемента,
например а и с, получится новая перестановка
cba ... /
из тех же п элементов.
Эта операция перемещения двух элементов называется
транспозицией; мы ее обозначим символом (а, с).
Будем теперь рассматривать в качестве элементов
перестановки первые п чисел 1, 2, . . ., п натурального ряда. Легко
сообразить, что при помощи транспозиций всегда можно
перейти от одной перестановки к любой другой перестановке тех
же чисел 1,2,.. ., /г. Поясним на конкретном примере
способ перехода при помощи транспозиций от одной перестановки
к другой.
15
Рассмотрим перестановки
34568712 (А)
. 87245631. (В)
В перестановке (Л) на первом месте стоит 3, а в
перестановке (В) на первом месте стоит 8; чтобы получить из (А)
перестановку с 8 на первом месте, применим к (Л)
транспозицию (3,8), получим:
84563712. (А,)
Теперь сравниваем (Аг) с (В). В (Аг) на втором месте
стоит 4, а в (В)—7. После транспозиции (4,7) перестановка (Аг)
перейдет в перестановку
87563412 (Л2)
с числом 7 на втором месте. Дальнейший ход преобразования
таков (слева в скобках указаны выполняемые транспозиции):
(2.5) 87263415 (Л3)
(4.6) 87243615 (Л4)
(3,5) 87245613 (Л5)
(1,3) 87245631 (В)
Все перестановки из п чисел 1, 2, . . ., п можно разбить
на два класса, а именно, назовем перестановку четной (или
четного класса), если число ее инверсий четное, и нечетной
{нечетного класса) в противном случае. Например,
перестановка 231 является четной, так как она имеет две инверсии.
Но если мы применим к перестановке 231 транспозицию
(2,3), то получим перестановку 321 с тремя инверсиями, т. е.
нечетную перестановку. Оказывается, что вообще справедлива
следующая теорема.
Теорема 1. От одной транспозиции четность
перестановки меняется.
Доказательство. Рассмотрим прежде всего случай,
когда транспонируемые числа ink находятся рядом, т. е.
перестановка имеет вид AikB. Буквой Л здесь обозначена
группа чисел, находящихся влево от /, а буквой В—группа
чисел, находящихся вправо от k. После транспозиции (/, k)
получится перестановка АЫВ. Очевидно,что до и после
транспозиции число инверсий, образуемых / с группой Л или В,
остается неизменным. То же самое можно сказать и
относительно k. Допустим теперь, что в перестановке AikB числа Ik
расположены в натуральном порядке; тогда в перестановке
АЫВ числа Ы будут давать инверсию. Мы видим, что в этом
случае после транспозиции число инверсий увеличивается на
16
единицу. Если же допустить, что в перестановке AikB числа ik
находятся в инверсии, то после транспозиции инверсия между
ними исчезает. В том и в другом случае происходит
изменение количества инверсий на ± 1, т. е. на нечетное число.
Переходим ко второму случаю, когда между
транспонируемыми числами ink находится т чисел, т. е. перестановка
имеет вид:
Aiixi2 . . . imkB. (1)
Обозначим через р количество тех чисел ixi2 . . . im,
которые находятся в инверсии с /, и через q количество тех чисел
hh • • • *m* которые находятся в инверсии с k. После
транспозиции (/, k) перестановка (1) превратится в
Akixi2 . . . imiB. (2)
Очевидно, что те числа ixi2 . . . im, которые находились в
инверсии с /, уже не будут давать с / инверсию. Зато остальные
т—р чисел из ixi2 . . . im после транспозиции будут
находиться в инверсии с i. Таким образом, после транспозиции
количество инверсий, возникающих среди iti2 ... im относительно/,
уменьшится на р и возрастет на т—р, т. е. в общей
сложности возрастет на т—р—р = т—2р. Точно так же количество
инверсий, возникающих среди ixi2 ... im относительно k, после
транспозиции возрастет на m—2q. Наконец, после
транспозиции происходит либо потеря, либо возникновение инверсии
между ink. Отсюда в перестановке (1) количество инверсий
после транспозиции (i, k) возрастет на
(m—2p) + (m—2q) ± \=2{m—p—q)± 1,
т. е. изменится на нечетное число. Таким образом, класс
перестановки (2) должен быть противоположен классу
перестановки (1).
Из доказанной теоремы вытекают следующие свойства
транспозиции.
1. Чтобы перейти от одной перестановки к другой того
же класса, надо выполнить четное число транспозиций.
Напротив, чтобы перейти от одной перестановки к другой
противополоэюного класса, надо выполнить нечетное число
транспозиций.
2. Из п чисел 1, 2, . . . , п можно составить — четных
перестановок и столько же нечетных.
Свойство 2 не столь очевидно и потому нуждается в
доказательстве. Приводим его.
Доказательство. Мы знаем, что из п чисел 1,2, ..., п
можно составить всего п\ перестановок. Пусть среди них
имеется р четных и q нечетных перестановок.
17
Совершим над каждой четной перестановкой одну и ту же
транспозицию, например (1, 2). Тогда в силу доказанной выше
теоремы получится р нечетных и притом различных
перестановок. Следовательно, q>p.
Точно так же, подвергая нечетные перестановки
транспозиции (1, 2), получим q различных четных перестановок.
Значит, р> д.
Сопоставляя неравенства q>p и р > q, приходим к
выводу, что p = q.
Из свойства 2 сразу получается, что определитель п-го
порядка имеет одинаковое число положительных и отрицатель-
п\
ных членов, а именно —.
2
При помощи теоремы 1 можно установить другой способ
подсчета знака члена определителя, а именно: пусть член
определителя /г-го порядка ^/ .а^^... а1п/-п записан таким образом,
что первые индексы его элементов не идут в порядке
возрастания. Как установить знак этого члена? Очевидно, что,
переставляя элементы надлежащим образом, всегда можно первые
индексы расположить в натуральном порядке, после чего можно
найти знак члена, подсчитав число инверсий в перестановке
вторых индексов элементов. Однако, как мы сейчас увидим, знак
члена можно установить иначе, совершенно не переставляя
его элементов.
Теорема 2. Знак члена
аи*аи, • • • аМп (3)
определителя п-го порядка равен знаку кисла (—1)*+/, где
s—число инверсий в перестановке первых индексов i^ . . . int
a t — число инверсий в перестановке вторых индексов
hh • • • У„.
Доказательство. Прежде всего покажем, что если
в члене (3) поменять местами два каких-нибудь элемента, то
четность числа s+t не изменится.
В самом деле, поменяем, например, элементы аь^ и а.^
местами. Тогда первые индексы элементов члена составят
перестановку
/2*i . . . 1п> (А)
а вторые—перестановку
JJx * • • in- (*>
Мы видим, что произошла транспозиция индексов il9 i2 и
j\y А- Поэтому, обозначив через s' и V число инверсий в
перестановках (А) и (В), получим согласно теореме 1, что
разности s'—s и t'—t суть нечетные числа. Отсюда следует, что
число
(s' + tr)-(s + *) = (*'-*) + (V-t)
18
как сумма двух нечетных чисел четно, т. е. числа s' + t' и
s-\-t одинаковой четности.
Переходим к доказательству самой теоремы. Меняя каждый
раз местами два элемента члена (3), мы в конце концов
расположим элементы члена в порядке возрастания первых
индексов:
W • • • <*пап.
Теперь знак члена равен (—1) , где t —число инверсий в
перестановке втсрь.х индексов охх2 . . . ап. Так как здесь первые
индексы расположены в порядке возрастания, то s'=Q\ значит,
s + t и V должны быть одинаковой четности. Тем самым
теорема доказана.
Пример. Найти знак члена ахъаЪ2аиаг1 определителя
четвертого порядка, не перемешая его элементов.
Получаем, что s = 5, t=4. Следовательно, (—l)s+t=(—1)9 =
= — 1.Член имеет знак минус.
Задачи. 1. Подсчитать число инверсий в следующих перестановках:
а) 45123, б) 849762315, в) 2,4, . . ., 2л, 1, 3, . . ., 2п—1, г) 2л, 1, 2л-1, 2,
2л-2, 3 я + 1, л.
2. Какая перестановка из л чисел 1, 2, . . ., л имеет наибольшее число
инверсий?
3. Определить знак члена a21a13a5Laua61a^ba3e определителя седьмого
порядка, не перемещая элементов.
4. Какой знак имеет член ал1ал_! 2- •'• а\ определителя л-го порядка?
§ 5. Подстановки
Введем теперь более широкую операцию, чем
транспозиция,—подстановку. *
Подстановкой из п элементов
0ь я* • • •» ап (А)
называется замена каждого элемента аь произвольной
перестановки элементов (А) вполне определенным элементом aj из
той же совокупности (Л), причем так, что различные элементы
заменяются различными элементами.
Обычно подстановку обозначают символом
5 =/Ча2...М (1)
К ak • • • aJ
Мы видим, что под элементами аъ а2, . . ., ап первой строки
находятся во второй строке соответственно а., а., . . ., а1п. Это
означает, что S— подстановка, заменяющая в произвольной
перестановке элементов (А) элемент аг на ailf a2 на а/а, . . .,
ап на at . Например,
1п
(аг а2 #з аЛ
аг аА а2 aJ
(2)
19
есть подстановка четырех элементов аъ аъ а3, я4> которая
заменяет аг на ах (т. е. оставляет ах неизменным), а2 на av аь
на а2 и а4 на аъ.
Отметим еще, что порядок записи элементов первой строчки
обозначения подстановки несущественен. Так, подстановку (2)
можно записать и в таком виде:
аъ а4 аг а2\
а2 #з ai aJ
отчего характер замены, конечно, не изменится, потому что
по-прежнему элемент аъ заменяется элементом аъ a4—as,
ах—аг и а2—аА.
Если рассматривать только номера элементов, то запись
подстановки еще более упрощается: вместо подстановки (1)
можно рассматривать подстановку
'I 2 ... п\ (3)
h ... in)
из п чисел 1, 2, ...,//. В дальнейшем мы так и будем
поступать.
Применяя подстановку (3) к некоторой перестановке из п
чисел 1, 2, . . ., /г, мы, очевидно, получим новую перестановку
тех же чисел. Например, если применить подстановку (2)
к перестановке 1342, то получится 1234.
Возьмем теперь две подстановки чисел 1, 2, 3, 4:
с /1 2 3 4\ с_/1 2.3 4
6l"Ul 2 3J' ^~\2\ 4 3
и посмотрим, что произойдет, если сначала выполнить
подстановку Slt а затем подстановку S2. Подстановка Sx заменяет 1
на 4, a S2—4 на 3. Таким образом, число 1 под влиянием
двух подстановок Sx и 52 заменяется числом 3. Следующее
число 2 подстановкой Si заменяется 1, а 1 заменяется
подстановкой S2 числом 2; значит, 2 под совместным влиянием Si
и S2 переходит в 2. Легко, далее, видеть, что 3 под
совместным влиянием Si и S2 переходит в 1. Наконец, 4 под
совместным влиянием 5i и S2 переходит в 4. В результате получилась
подстановка
5.= (l 2 3 4'
\3 2 1 4У
которая одна производит то же действие, что обе подстановки
Si-и S2, произведенные последовательно одна за другой.
Вообще, назовем произведением подстановок S и Т из п
чисел 1, 2, . . ., Аг такую третью подстановку из тех же чисел,
20
которая одна производит то же действие, что обе подстановки
S и Т, произведенные последовательно одна за другой.
Произведение подстановок 5 и Г мы будем обозначать через ST.
Таким образом, подстановка S3, получившаяся в нашем
примере, есть произведение S^ подстановок S2 и S2 из
четырех чисел 1, 2, 3, 4.
Нетрудно убедиться, что умножение подстановок в отличие
от обычного арифметического умножения чисел не
коммутативно: не всегда ST равно TS.
Например,
'1 2 3 4\ /1 2 3 4\ /1 2 3 4>
но
4321/ U 1 2 3/ 3214
1\ /12 3 4\/1 2 3 4\ , /1 2 3 4\
V \4 3 2 \) \\ 4 3 2 J* \3 2 1 4/'
Среди всевозможных подстановок чисел 1, 2, . . ., п имеется
одна, так называемая тождественная или единичная
подстановка
, /12. . .п\
\\ 2 . . .я/
которая при умножении подстановок ведет себя аналогично
числу 1 при а рифметическом умножении, а именно: для любой
подстановки
s=/l 2. . .п
имеет место равенство SI = IS=S.
Аналогия умножения подстановок с арифметическим
умножением чисел простирается и дальше. Во-первых, для
каждой подстановки S всегда существует обратная
подстановка S~\ характеризующаяся равенством
ss-l=s~xs=i.
Эта обратная подстановка имеет вид:
5_1=/aia2. . .a\
\1 2 ... л/
И в самом деле, если 5 переводит 1 в alf то S~l переводит аг
в 1; следовательно, произведение SS"1 переводит 1 в 1. Точно
так же 55-1 переводит 2 в 2, 3 в 3, . . ., /г в /г, а это и
значит, что 55_1=У. Подобным же образом можно убедиться, что
S~lS=I.
21
Во-вторых, умножение подстановок из кисел 1, 2, . . ., п
подчиняется сочетательному закону:
(ST)U=S(TU).
Покажем справедливость этого равенства. Пусть
подстановка S переводит некоторое число а в р, подстановка Т
переводит р в у и подстановка U переводит ] в5, Тогда ST
переведет а в ?» после чего U переведет ? в S. Таким
образом, (ST) U число а переводит в 8.
Посмотрим, как ведет себя S(TU). Подстановка S
переводит а в р, a TU переводит (3 в 8; значит, S{TU) переводит а
в 8, т. е. производит такое же действие, что и (ST) U.
Следовательно, (ST) U=S(TU).
Рассмотрим теперь частный, но важный случай подстановки.
Назовем подстановку S из чисел 1, 2, . .., п k-членной
циклической, или k-яленным циклом, если она а2 переводит
в число а2, отличное от аь а2—в число а3, отличное от а2, . . .,
аЛ1—в число а^, отличное от аЛ_1? и ak—в исходное число ах
(&<#), a прочие числа (при k < п) оставляет неизменными.
Циклическая подстановка обычно обозначается символом
(а1а2 • • • aft)-
Например,
1 2 3 4 5\
2 3 4 15/
есть четырехчленная циклическая подстановка (1234).
Очевидно, что транспозиция (ij) есть на что иное, как
двучленная циклическая подстановка.
Тождественную подстаьовку / мы будем рассматривать как
одночленный цикл (а), где а—любое из чисел 1, 2, . . . , п.
Заметим еще, что запись цикла можно начинать с любого
числа, входящего в его состав. Например, подстановку (3125)
из п чисел 1, 2, . . . , п можно записать в виде (1253) или
в виде (5312) и т. д.
Нетрудно убедиться, что всякую подстановку из чисел
1, 2, .. ., п можно представить как произведение
независимых циклов. Независимых в том смысле, что никакие два цикла
разложения не имеют общих чисел.
Для наглядности обратимся к конкретному примеру.
Возьмем подстановку
1 2 3 4 5 6 7 8\ (4)
3 4 5 6 7 8 12/*
Она число 1 переводит в 3, число 3—в 5, число 5—в 7 и
7—в исходное число 1. Таким образом, получается цикл (1357).
Однако в цикл (1357) вошли не все ччсла подстановки,
например не вошло число 2. Поэтому начнем новый цикл
22
с этого числа (или с какого-нибудь другого числа, не
вошедшего в первый цикл). Подстановка (4) число 2 переводит
в 4, 4—в 6, 6—в 8 и 8—в исходное 2. Получился цикл (2468),
и все числа подстановки (4) исчерпаны.
Итак,
/1 2 3 45 67 8\ (1357) (2468).
\3 4 5 6 7 8 1 2)
Рассмотрим еще один пример: разложим на независимые
циклы подстановку
/1 2 3 4\
\4 1 3 2)'
Здесь 1 переводится в 4, 4—в 2 и 2—в 1. Получился цикл
(142). Но в этот цикл не вошло число 3. Число 3
переводится в 3 (т. е. не меняется); записыьаем это так: (3).
Получился одночленный цикл и
Впрочем, цикл (3) можно опустить, так как он является
тождественной подстановкой. Тогда разложение примет более
простой вид:
Очевидно, что этот способ разложения на произведение
циклов применим к любой подстановке. В силу независимости
циклов порядок их следования может быть произвольным.
В свою очередь, всякий цикл можно представить в виде
произведения транспозиций, но такое произведение уже не
будет разложением на независимые циклы. Таким образом,
порядок следования транспозиций имеет уже существенное
значение.
Например, цикл (2356) можно разложить следующим
образом на транспозиции:
(2356) = (23)(25)(26).
Действительно, первая транспозиция (23) переводит 2 в 3, а
остальные транспозиции (25) и (26) число 3 не изменяют.
Следовательно, произведение (23)(25)(26) число 2 переводит
в 3. Затем число 3 транспозицией (23) переводится в 2, после
чего 2 транспозицией (25) переводится в 5, а 5 транспозицией
(26) не изменяется. Значит, произведение (23)(25)(26) число 3
переводит в 5. Далее, число 5 транспозицией (23) не
изменяется, а транспозицией (25) переводится в 2, после чего 2
23
транспозицией (26) переводится в 6. Таким образом, произведение
(23) (25) (26) число 5 переводит в 6. Наконец, (23) и (25) число
6 не изменяют, а (26) число 6 переводит в 2; поэтому (23)
(25) (26) переводит 6 в исходное число 2. Отсюда получается,
что (23) (25) (26) = (2356).
Вообще, рассуждая подобным образом, можно убедиться,
что всякий к-членный цикл (а^ . . . ak) разлагается на
такое произведение к—\ транспозиций:
0*1*2 • • • аЛ) = (а1а2)(а1а3) . . . (а^).
Теперь докажем следующую теорему.
Теорема 1. Всякую подстановку из п чисел 1, 2, . . ., п
можно разложить на n—s транспозиций, где s—число
независимых циклов (включая и одночленные), на которые
разлагается данная подстановка.
Доказательство. Пусть подстановка
\аг а2 . . . ал /
распадается в произведение s независимых циклов:
S=(hi% . . . ikl) (АЛ • • . Л2) (^2 • • • **Д
Но каждый /г-членный цикл разлагается на k—1
транспозиций1; поэтому рассматриваемая подстановка 5 разлагается на
(k1-\) + (k2-\)+ ... +(V-i)=
= (*i + *2+ ... +*,)-(!+ . ■ ■ +\) = n-s
s раз
транспозиций, что и требовалось показать.
Разность п—s, называемая декрементом подстановки,
позволяет разбить множество подстановок из п чисел 1, 2, . . ., п
на два класса.
Теорема 2. Если р—число инверсий в перестановке
aia2 • • • ал из чисел 1,2, . . . , п, то декремент подстановки
$_П 2 ...,ч
\а1 «2 . . . ая/
имеет ту же четность, что и число р.
Доказательство. Пусть подстановка 5 разлагается на
s независимых циклов (включая и одночленные); тогда ее
декремент равен n—s. Если применить подстановку 5 к пере-
1 Это утверждение верно и для одночленного цикла, так как k — 1 = О
при k = 1.
24
становке 123 ... /г, то, очевидно, получится а2а2 . . . ал. Так
как S согласно теореме 1 р слагается на п—s транспозиций,
то выходит, что перестановку а2а2 . . . аЛ .можно получить из
перестановки 123 ... /г при помощи n—s транспозиций. Отсюда
на основании теоремы 1 § 4 заключаем, что число n—s
транспозиций должно иметь ту же четность, что и число р
инверсий в перестановке olxt.2 ... ап.
Таким образом, при любом способе разложения подстановки
в произведение независимых циклов ее декремент имеет одну
и ту же четность.
Будем называть подстановки с четным декрементом
подстановками четного класса или просто четными
подстановками, а с нечетным декрементом—подстановками нечетного
класса или нечетными подстановками.
Теорема 2 приводит к одному довольно удобному способу
установления знака члена определителя.
А именно, составляем подстановку
о_ Ihh • • • ln \
U/2 • • • Jn)
члена a>ijxaij^ • • • ainjn определителя /г-ro порядка, в верхней
строке которой пишется перестановка первых индексов
элементов члена, а в нижней строке перестановка вторых
индексов элементов члена. Если декремент этой подстановки является
четным, то член будет иметь знак плюс, если нечетным, то—
минус.
Возьмем, например, член а%1аъ%а^а1Ъа^агъ определителя
шестого порядка и составим подстановку
5= /6 3 5 1 4 2\
\1 6 2 3 4 5/
Найдем декремент подстановки, для чего разложим ее на
независимые циклы:
S=(613)(52)(4).
Получилось s=3; декремент п—s=6—3 = 3 есть нечетное число.
Значит, рассматриваемый член имеет знак минус.
Задачи. 1. Какая получится перестановка, если к 615324 применить
/12345б\
подстановку (^ 2 4 5 6 х 3J?
2. Найти произведение S^S2 и S2S\ подстановок:
а> с /1234\ „,1234,
5l==Ul2 3J' 5a"Ul4 3r
б) /123456Х _/123456\.
1 \ 4 5 6 3 1 2 / ' 2~~Ul4523/;
25
в)
Si
-С
2 3
3 2
7) s2=(l 2 3
6/, V6 7 1
в
/1 2 3 4 5 6\
(б 1 5 4 3 2/
4 5
3 5
6 7N
2 4/
3. Сколько различных подстановок можно составить из п чисел 1,2,,.., л?
4. Разложить подстановку
- 2 3 4 5 6\
«а произведение независимых циклов.
5. Следующие подстановки из чисел 1, 2 9, записанные в виде
произведения независимых циклов, представить в обычной записи: а) (56) (12) (34),
б) (189) (56) (234), в) (1345) (789).
6. Найти произведение S^ и S2S1 подстановок Sx=(56) (189) и Sz=
=(1345) (782) из девяти чисел, не обращаясь к обычной записи.
7. Установить при помощи декремента класс следующих перестановок:
а) 612345, б) 38617452, в) 10129837465.
§ 6. Свойства определителей
Определители п-то порядка имеют широкое применение
в различных областях математики. Причина этого отчасти
заключается в том, что они обладают замечательными свойствами,
которые, как мы увидим впоследствии, облегчают вычисление
определителей.
Свойство 1. Значение определителя п-го порядка не
изменится, если его строки заменить столбцами, сохраняя
порядок следования.
Операция замены в определителе строк столбцами с
сохранением порядка следования обычно называется
транспонированием определителя. Таким образом, в свойстве 1
утверждается, что от транспонирования значение определителя не
изменяется.
Доказательство. Нам надо показать, что определители
А =
#11 #12 • • • #
#21 #22
Лп
а,
'2л
#,
л1
а
л2
#„
Д1 =
11
*21
12
...а,
... а
п\
л2
а, ап
1л 2л
• • #„
равны.
Пусть
а'А
#,
inJn
О)
произвольный член определителя А. Очевидно, что элементы
члена (1) будут также находиться по одному и только по одному
в каждой строке и в каждом столбце определителя Л1#
Следовательно, (1) есть вместе с тем и член определителя Д1#
Точно так же убеждаемся, что, обратно, всякий член
определителя Д2 является членом и определителя Д. Далее, если снова
26
(1)—член определителя А, то этот член входит в А со знаком
(—1)5+/, где s—число инверсий в перестановке ixi2. . Лп и t—
число инверсий в перестановке /\j2. . ./„. Но с таким же точно
знаком входит член (1) и в определитель Д1# Отсюда следует,
что А,=А.
Только что доказанное свойство 1 важно в следующем
отношении. Пусть для строк (столбцов) определителя А п-го
порядка имеет место некоторое свойство Е. Тогда можно
быть уверенным, что свойство Е верно и для столбцов (строк)
определителя. В самом деле, в силу свойства 1 мы можем, не
изменяя значения, транспонировать определитель А, после чего
столбцы станут строками, а строки—столбцами.
По этой причине свойство 1 иногда называется свойством
равноправности строк и столбцов определителя.
Свойство 2. Определитель п-го порядка, у которого
две строки (два столбца) одинаковы, равен нулю.
Доказательство. Пусть у определителя А п-то порядка
одинаковы k-я и /-я строки:
aki = an> ak2 = ai^ • • •» akn = ain>
Возьмем произвольный член определителя
*i«V- •а*"-аь" •*!».• (2)
Знак этого члена равен (—1)', где t—число инверсий в
перестановке а(3 . . .[х. . . v . . . со. Наряду с членом (2) рассмотрим
член
<W • •**• • '<V • 'ап<* (3)
того же определителя. Член (3) равен члену (2), так как в силу
совпадения k-й и 1-й строк
Однако, член (3) входит в определитель А со знаком,
противоположным знаку члена (2). Действительно, знак члена (3)
равен (—1)'', где У—число инверсий в перестановке ар...
... v ... |х ... со. Но перестановка ар ... v ... \i... со получается
из перестановки ар . . . |i . . . v . . . со при помощи транспозиции
(|iv). Следовательно, t и V—числа различной четности и потому
знак (—1)'' противоположен знаку (—1)'.
Поскольку члены (2) и (3) равны, но имеют
противоположные знаки, они должны в определителе А уничтожаться. Таким
образом, получается попарное уничтожение всех членов
определителя, вследствие чего А=0.
Справедливость свойства 2 для столбцов следует из
равноправности строк и столбцов определителя.
27
Свойство 3. Если все элементы какого-нибудь столбца
(строки) определителя п-го порядка умножить на одно и
то же число т, то значение определителя умножится на т.
Доказательство. Умножим, например, элементы v-ro
столбца определителя А /г-го порядка на т. Тогда элементы
aiva2v> • • • > ат этого столбца превратятся в таи, таъ, . . . , тапГ
Если до умножения каждый член определителя имел вид
аиаъ.
.а
/V
. а
то после умножения он примет вид:
аыа2?. . . (mah) . . . аП(й = та1аа2^. ..аь. .. ялш,
т. е. умножится на т. Что касается знака, то до и после
умножения член должен иметь один и тот же знак (—1)', где t—
число инверсий в перестановке ар ... v ... со.
Свойство 4. Если все элементы какого-нибудь столбца
(строки) определителя п-го порядка обладают общим
множителем, то его можно вынести за знак определителя.
Например,
1 5
2 6
3 7
10
2
4
=2-
1 5 5
2 6 1
3 7 2
Мы здесь вынесли за знак определителя общий множитель 2
элементов третьего столбца.
Свойство 4 непосредственно вытекает из свойства 3.
Свойство 5. Определитель п-го порядка, у которого
элементы двух строк (столбцов) соответственно
пропорциональны, равен нулю.
Доказательство. Пусть, например, пропорциональны
k-я и 1-я строки определителя А. Это значит, что каждый
элемент k-й строки отличается от соответствующего элемента 1-й
строки на один и тот же множитель т, т. е. определитель
выглядит так:
ап а12 . . . а1п
тац mat2 . . . та±п
ап а12 ... а1п
ат ап2 • • • ап
28
-Если теперь на основании свойства 4 вынести общий
множитель т за знак определителя, то получится определитель
с двумя одинаковыми строками. Такой определитель согласно
свойству 2 равен нулю.
Свойство 6. Пусть каждый элемент k-u строки (столбца)
определителя п-го порядка А есть сумма двух слагаемых.
Тогда определитель А равен сумме двух определителей того
же порядка, причем в одном определителе k-я строка
{столбец) состоит из первых слагаемых, а в другом—из вторых
слагаемых. Остальные строки {столбцы) того и другого
определителя те же, что и в определителе А.
Доказательство. Пусть в определителе
Д21
aki
ат
а12 .
Й22 •
ат •
ап2 ■
■ а1п
■ ■ O-hn
■ О-пп
каждый элемент k-й строки есть сумма двух слагаемых:
akl = Ckl+dkV. ak2 = Ck2 + dk2> • ' • > akn = Ckn + dkn.
Обратимся к произвольному члену определителя:
аы% • • • (%+<**) • • • ап»-
Он имеет знак (—1)', где t— число инверсий в перестановке
ар ... [х ... со. Раскроем скобки; тогда наш член распадется
на два члена:
aiAp • • • (%+<U • • • **. = *!Ар •••%••• апЛ
+аиа2р . . . d^ ... аПш.
Но произведение я1а#2р • • • cki • • • апа> есть член определителя
#11
#21
Г*1
ат
#12 •
#22 •
Ck2 ■■
ап2-
■ аы
■■ а2п
• Ckn
и входит в Д2 со знаком (—1)', а произведение а. «2б . . . dt
а есть член определителя
'**
А2 =
а
11
«21
«12
«22
Чп
*2п
"k\
dbo . . . d.
*k2
kn
a
nl
a
n2
a„
и входит в А2 с тем же самым знаком ( — 1)'. Отсюда
справедливость свойства 6 становится очевидной: Д = Д1+Д2.
Пользуясь методом математической индукции, нетрудно
свойство 6 распространить на случай любого числа слагаемых.
Свойство 7. Определитель п-го порядка не меняет своего1
значения от прибавления ко всем элементам какой-нибудь
строки (столбца) соответствующих элементов другой
строки (столбца), умноженных на одно и то же число.
Доказательство. Прибавим к элементам k-й строки
определителя А соответствующие элементы 1-й строки того
же определителя, умноженные на некоторое число т. Имееьс
£>=
«и
«21
а
12
«22
In
2л
(akl+mail) (ak2+mai2) • -Д, K/rW/J
«,
а„
а
In
«,
л1
«
л2
«„
Мы видим, что каждый элемент k-й строки определителя D
является суммой двух слагаемых. Отсюда по свойству 6
£>=
«11
«21
akl
ап
ат
«12 •
«22 •
ak2 •
ап .
<*л2.
. «1л
• «2л
• «Лл
• • а1п
• • «лл
+
«И
«21
тап
«л
ат
«12 •
«22 •
mat2 .
«/2 . .
«л2 •
. «1л
• . «2л
. . таг
• «/л
• • апп
30
Первый определитель этой суммы есть А, а второй равен нулюг
так как у него две строки пропорциональны. Следовательно,
D = A, что и требовалось показать.
Свойство 7, как мы увидим впоследствии, значительно
упрощает вычисление определителей.
Свойство 8. Если поменять местами две строки (столбца)
определителя п-го порядка, то определитель изменит знак
на противоположный, а по абсолютной величине не
изменится.
Доказательство. Подвергнем определитель
А =
#11 #12 • • • #1л
akl ak2 . . . а1
Hi "72
Jen
atl at2 ... at
In
anl an2 . . . an
следующим преобразованиям. Прибавим к его k-й строке 1-юг
Получим:
ап
#12
а
п\
Ы2
Пп
(akl+an) (ak2+al2) . . . (akn+aln)
а,
In
В определителе А' из/-й строки вычтем k-ю. строку. Получим:
Д"=
а
и
—а,
ki
а,
п\
*п2
*\п
(#*i+#n) (#*2+#/2) . . . (#*„+#/*)
-ak2 ... -#,
kn
31
Наконец, прибавим в определителе А" к &-й строке /-ю.
Получим:
аи а12
а
An
ап ап
Чп
Ч\ ~ak2 . . . —я,
£л
*л1
*л2
ап
а\\ а\ъ - - - а
1л
ап а12 . . . а
/л
аЛ1 ал2 . . . а
£л
ал1 ал2
• ^п
Все эти преобразования по свойству 7 не изменяют
значения определителя. Следовательно,
ап а12 . . . а1п
ак1 ak2 . . . а,
£л
#п #/2 ... ah
ат ап2 . . . лл
(2ц Л
12
*1л
а71 а/2 . . . а
/л
аЛ1 ak2
а
kn
ап\ ап2
что и требовалось показать.
Задача. Проверить на определителях второго и третьего порядка все
основные свойства определителя л-го порядка.
§ 7. Миноры и алгебраические дополнения
В этом параграфе мы увидим", что всякий определитель п-го
порядка можно выразить через определители низшего порядка.
Введем прежде всего следующие определения.
Определение 1. Минором Ми элемента аи определителя
ап а12 ... аХ] . . . а1п
#21 а22 • • • а2/ . . • а2п
д =
ai\ ai2
aLj . . . ain
ап\ ап2
а
'nj •
а„
называется такой новый определитель, который получается
из А вычеркиванием строки и столбца, проходящих через
данный элемент.
32
Пример. Найдем минор М2Ь элемента а2ь определителя
ап
«21
«31
Я41
«12
«22
«32
«42
«13
«23
*«33
«43
«14
«24
«84
«44
£>=
Согласно определению надо вычеркнуть вторую строку и
третий столбец, так как элемент а23 стоит на пересечении этих
строки и столбца. Таким образом,
М
23
а
11 Q12
а
14
■Q?7 Щ?з и,
22 42J и24
в* а
32 'Л 33 @34
U3 &44
а и а 12 о 14
@31 ^32 ^34
Я* О 42^44
Определение 2. Алгебраическим дополнением элемента
atj определителя А называется минор Mbj этого элемента,
взятый со знаком (—1)/+/.
Алгебраическое дополнение элемента аи мы будем
обозначать через Ац. Таким образом, Л/у=(—1)/+/Af. •.
Пример. Найдем алгебраическое дополнение элемента а2Ъ
определителя предыдущего примера. Выше было обнаружено,
что
М9
аЛ
*31
«12
«32
«42
а
14
*34
а
14
отсюда
^23 = (-1)2+3^23 = -^23=-
42
«И
а
32
*42
*34
«.*
Теперь мы можем сформулировать следующую теорему.
Теорема 1. Каждый клен произведения аиАи элемента
аи определителя А п-го порядка на его алгебраическое
дополнение Atj есть такэюе член определителя, и притом
с тем же самым знаком, что и в произведении aliAii.
Доказательство. Каждый член минора Му элемента
«/,- имеет вид:
(и
аи%
а. * а ,,
33
где af) .. . (iv . .. со—некоторая перестановка чисел 1,2, . . .,
у—1, у-И, . . . , ft. В первых инаекснх элементов члена (1) не
встречается /. а во вторы* индексах не встречается / потому,
что минор Му не содержит элементов /-й строки иу-го столбца
определителя А. В минор Му член (1) входит со знаком
(—1/ , где if—число инверсий в перестановке ар ... pv ... со.
Очевидно, что в алгебраическое дополнение Ау этот член
войдет со знаком
(_l)'«(_l)''_(_l)*WW.
Отсюда получается, что каждый член произведения atjAr
имеет вид: J
аиаи% • • • Л1-1,Ач-ь • • • аяо, (2)
и входит в ЛцАц со знаком (—1)'+я-''.
С другой стороны, (2) есть член и самого определителя А,
так как (2) есть произведение элементов А, взятых по одному
и только по одному из каждой строки и столбца
определителя А.
Найдем, с каким же знаком входит член (2) в определитель А.
Число s инверсий в перестановке
/12... (/-1) (7+1) . . п (3)
первых индексов элементов члена (2) равно /—1. В самом деле,
1, 2, . . . , /—1 меньше /ив перестановке (3) находятся
позади /. Следовательно, каждое из этих чисел находится в
инверсии с /. Остальные числ* /+1, . .. , п% хотя и расположены
позади /, но больше / и потому не образуют инверсию с /.
Число t инверсий в перестановке
yap ... jiv ... а) (4)
вторых индексов элементов члена (2) можно подсчитать так.
Прежде всего, где-то среди чисел a, р, . . . , p., v, . . . , со
имеются 1,2, . . ., у—1. Очевидно, что кшдое из чисел 1,2, ...
. . . ,у— 1 находится в инверсии с у. Что касается /+1, . . . , п,
то эти числа уже не нах)дягся в инвепсии с у. Таким образом,
относительно / получается у—1 инверсий. Сюда надо е це
добавить число if инверсий в перестановке ар ... p.v ... со.
Следовательно, числ) t инверсий в перестановке (4) р«вно/— 1-Й'.
Таким образом получается, что знак члена (2) в определителе
А равен
т. е. в определитель А член (2) входит с т*м же самым
знаком, что и в произведение a^A^. Теорема доказана.
34
Теорема 2. Если в определителе п-го порядка все
элементы i-й строки (столбца), кроме alJt равны нулю, то
такой определитель равен произведению элемента atj на
алгебраическое дополнение Л/у- этого элемента.
Доказательство. Действительно, если в определителе
А все элементы i-й строки равны нулю, кроме а1;-, то все члены
определителя, кроме членов вида
а1«<Ьз
« а. а-, л
an« = aijaua2?
а/-1,А+ь
а„
равны нулю. А эти члены входят в а^Ау. Обратно, согласно
теореме 1 каждый член произведения а^-Ау входит в
определитель Д и притом с тем же самым знаком. Следовательно,
Только что доказанная теорема 2 имеет большое
практическое значение. Ее практическое значение заключается в том,
что, получая на основании свойства 7 определителя (см. § 6)
нули в какой-нибуль строке или столбце определителя /г-го
порядка и применяя затем теорему 2, мы переходим к
определителю низшего, (/г—1)-го порядка. В свою очередь,
определитель (п— 1)-го порядка можно свести к определителю
(я—2)-го порядка и т. д., пока не придем к определителю
третьего и даже второго порядка.
Поясним сказанное на примерах.
Пр,имер 1. Вычислить определитель
D =
12 3 4
10 12
3-1-1 0
12 0-5
При помощи свойства 7 (см. § 6) преобразуем D так, чтобы
все элементы какой-нибудь строки (или столбца) оказались
нулями, кроме одного. Лучше всего делать нули во второй
строке, так как числа, стоящие в этой строке, невелики и к
тому же один нуль уже есть. Вычтем из элементов третьего
столбца элементы первого. Тогда по свойству 7 получим:
D=
12 2 4
10 0 2
3-1-4 0
1 2-1-5
35
Затем вычтем из элементов четвертого столбца элементы
первого, умноженные на 2. Получим:
£>=
12 2 2
10 0 0
3 -1 -4 -6
1 2-1-7
Наша цель достигнута: все элементы второй строки, кроме
первого, обратились в нули. А теперь согласно теореме 2
имеем:
D=a2Ai = b(-l)2+1
Вторая строка полученного определителя имеет общим
множителем —1, а первая 2. Вынося эти множители за знак
определителя (см. § 6, свойство 4), получим:
2 2
4 -6
1 -7
=
2 2 2
-1 -4 -6
2 -1 -7
£>=2.
1 1
1 4
2 -1
В этом определителе целесообразнее делать нули в первой
строке. Вычтем из второго столбца первый. Определитель
примет вид:
II 0 II
£>=2- 1 3 6 .
|2 -3 -7\
Затем вычтем из третьего столбца первый. Получим:
1 0 0|
D=2-\
3
-3
откуда
£>=2-1.(-1)
i+i
3 5
-3 -9
= 2-
3 5
-3 -9
Вынося из второй строки общий множитель —3, получим
окончательно:
D=-6-
3 5
1 3
= -6(9-5) = -24.
Итак, £>=— 24.
36
Пример 2. Вычислить определитель
V„ =
1 ах а,\ .
1 а2 #2 .
л-1
. Я2
1 ап ап .
Ля-1
называемый определителем Вандермонда или степенным
определителем.
Вычтем из каждого столбца предыдущий, умноженный на ах.
Получим:
10 0
V
1 а2—<Zj Cl'i^CL'i — #i)
1 ап—ах ап{ап—ах)
а2—а1 #2 (#2—а\) •
а3—я, а3(а3—а,) .
О
я« 2 (лл—я,)
#2 (^2—*^l)
Я/а—#1 Ял(ЯЛ—^l) . . • «я (^п"а\)
или, вынося за знак определителя общие множители каждой
строки,
1 #2 #2
1 аь аз . . . Яз~
^=(a2-ai) (<*e—*i) • • • (*n—*i)
п-2
. #2
п-2
ап
1 а„ ап
Мы видим, что в правую часть равенства вошел определитель
Вандермонда для п—\ букв а2, as, . . . , ал. Обозначим его
через 1/я_г
Подвергая Vn_x аналогичным преобразованиям, получим:
^-l = (V-a2)(<V-<*2) • • • [ап-а2) Vn-2>
где Vrt_2— определитель Вандермонда для п—2 букв а3» аА$ ... ,ал.
Точно так же получим, что
Vn_2=[aA-az){ab-ad • • • {ап-аз) К-г>
где Т/^^з—определитель Вандермонда для /г—3 букв а4> ... , аЛ>
и т. д. Так, понижая постепенно порядок определителя, мы в
конечном счете получим, что
Vn={^2—^i)(^—ai) • • . (Яц—Ях) • • • К—Яя-i).
37
Пример 3. Показать, что определитель
#11 #12 • • • #1л
О Я22 • • • #2л
О О
. #„
у которого все элементы ниже главной диагонали ап а22... апп
равны нулю, равен произзедению диагональных элементов:
Д = #п#22
ап
Так как в определителе А все элементы первого столбца,
кроме #ц, равны нулю, то
I #22 #23
О а..
А = #!
• #2„
• #8л
О О
#»
Точно так же
и
Ai =
^22 ^23 •
0 а33 .
0 0 .
т. д. В конце концов
А
Задачи. Вычислить
а)
1 2 1
5 0 -
2 -1
1 1 5 -
в)
cos"-1^
ее
со
)S a2
S <х„
• • «2П
• • «8л
• • апп
— a22
Л33 Л34 . .
. as
0 a44 . . . at
1 0 0 . . . a„,
мы получим, что
= Лца22 • • • апп •
> определители
4 3 1
-1 0
6 3
-1 2 |
6)1
*
12 3 4 5
23451
3 4 5 12
4 5 12 3
5 12 3 4
>
cos""2a1 sin aa . . . Sln"-I<*j 1
COs"_2a2 sin »2 . . . sln""1^
cos"-2
x„ sin a
„ . .. sin"
ч1
1 Подобным же образом можно показать, что определитель, у которого
все элементы выше главной диагонали аХ1агг • • • о-пп равны нулю, равен
произведению диагональных элементов.
33
§ 8. Разложение определителей по элементам строки
и столбца. Правило Крамера
В § 8 мы ввели понятие определителя п-го порядка, рас»
смотрели его основные свойства (§ 6) и на конкретных
примерах указали практический метод вычисления определителей
любого порядка.
Теперь мы собираемся показать, какую роль играет
определитель п-го порядка в решении системы п линейных
уравнений с п неизвестными.
Предварительно докажем следующие две теоремы.
Теорема 1. Какук? бы строку (столбец) определителя Д
п-го порядка мы ни взяли, определитель А всегда равен
сумме произведений элементов этой строки (столбца) на
их алгебраические дополнения.
Иными словами, имеет место такое разложение
определителя А по элементам строки или столбца:
b = aaAa + ai2Al2 + . . . + ainAln (/=1,2, . . . , п) (1)
или
Ь = аиАи + а21А21-+ . . . + anlAni. (2)
Доказательство. В силу свойства равноправности строк
и столбцов можно ограничиться выводом разложения (1).
По теореме 1 предыдущего параграфа члены произведения
Яд Л д являются также членами определителя А и притом с
теми же знаками. То же самое можно сказать и относительно
ai2Al2, . . . , alnAln. Далее, никакие два произведения alkAlk и
ааАп(1Ф k) не могут иметь общих членов: если бы у них был
общий член, то он содержал бы элементы alk и aib т. е.
содержал бы два элемента из одной (j-й) строки, что для члена
определителя невозможно.
Таким образом, сумма
ааАа + al2Ai2 + . . . + ainAtn (3)
состоит из различных членов определителя А. Для
окончательного доказательства теоремы остается показать, что сумма (3)
исчерпывает все члены определителя Д.
Произвольный член определителя А можно записать в виде
ашаиаГр . . . а/в1|1а/+ь . . . ап(а, (4)
где оф . . . р ... со—перестановка чисел °1, 2, . . . , k—1,
& + 1, ... , /г, так как он содержит по одному и только по
одному элементу из каждой строки и столбца определителя
и, в частности, содержит какой-то элемент alk из /-й строки.
Но из самого выражения (Ф) члена видно, что он входит
в alkAlk. Следовательно, сумма (3) действительно исчерпывает
все члены определителя.
39
Теорема 1 является обобщением теоремы 2 предыдущего
параграфа и может быть также использована для вычисления
определителей.
Пример. Вычислить определитель
12 3 4
D =
раскладывая по элементам какой-нибудь строки (столбца).
Разложим D по элементам второй строки:
1
3
1
0
-1
2
1
-1
0
2
0
-5
D—#21^21 I #22^22 I ^23^23 I #24^
^К124»
или, так кака21 = 1, а22=0, а23=1, а24=2,
D=A,
А 23 "Ь ^24 ~~
2
-1
2
3
-1
0
4
0
-5
1
3
1
2
-1
2
4
0
-5
+ 2
1 2 3
3 -1 -1
1 2 О
Находим значение каждого из определителей третьего
порядка по правилу Саррюса. Получим:
D=-3-63+2.21 = -24.
Необходимо, впрочем, отметить, что такое вычисление не
всегда оказывается удобным; в большинстве случаев метод
вычисления, данный в § 7, скорее приводит к цели.
Теорема 2. Сумма произведений элементов какой-нибудь
строки (столбца) на алгебраические дополнения
соответствующих элементов другой строки (столбца) определителя
п-го порядка равна нулю.
Иными словами:
апАА + а12Ар+ . . . + ainAjn-=<d, {}Ф]\ /,/=1, ... , п),
Д1И1/ + Я2АН- • • • +ansAnt=°> (s¥=*; s, *=1, ... , п).
Доказательство. Кроме данного определителя
ап аг
а
In
А =
аЦ ai2 . •. ain
ап aJ2 . . . а
jn
ап\ ап2 • • • ап
40
рассмотрим еще вспомогательный определитель
ап а12 .
Яд Я/2 •
ап ai2 .
I anl ап2 •
. . а1п
• • а1п
• • ain
• • &пп \
у которого 1-я иу-я строки одинаковы, а все строки, за
исключением у-й, совпадают с соответствующими строками
определителя А. Он, очевидно, равен нулю (см. § 6, свойство 2). С
другой стороны, разлагая D по элементам у-й строки, получим:
aiXBn + ai2Bj2 + . . . + ainBJn = D=0, (5)
где Bjk(k=\, 2, . . . , п)—-алгебраическое дополнение элемента
aik у-й строки определителя D. При составлении
алгебраического дополнения Bjk мы вычеркиваем в D у-ю строку (и &-й
столбец), т. е. вычеркиваем единственную строку,
отличающую D от Д. Следовательно, BJk = AJk, где Ajk—алгебраическое
дополнение элемента aJkJ-u строки определителя Д. Таким
образом, равенство (5) принимает следующий окончательный вид:
апАА + ai2Aj2 + . . . + alnAJn=0.
Справедливость теоремы для столбцов очевидна в силу
свойства равноправности строк и столбцов.
После введения этих теорем можно уже перейти к системе
п линейных уравнений с п неизвестными:
а\\Х1 ~Т~ ai2X2 + • • • + a\nXn~V\i ]
#21"*! Н~ «22-^2 + • • • + a2nXn = ^2t I //?\
anixi ~Ь ап2х2 + . . . + annxn = bn. J
Назовем решением системы (6) совокупность таких значений
лг1 = а1, х2 — а2, ... , хп = а.п
неизвестных, которые удовлетворяют всем уравнениям системы.
Если система (6) имеет хотя бы одно решение, то она
называется совместной. Две системы п линейных уравнений с
одними и теми же п неизвестными называются равносильными,
если каждое решение одной системы является решением и
другой или если обе они несовместны.
41
Составим определитель
йц а
12
#21 #22
• #1Л
• #2Л
#Л1 #л2
ап
из коэффициентов при неизвестных системы (6); его называют
определителем системы. Покажем, как при помощи теорем 1
и 2 можно решить при А Ф 0 данную систему уравнений.
Умножим первое уравнение системы (6) на Аиг, второе
уравнение на A2s, . . . , п-е на Ans и затем сложим почленно
полученные уравнения:
+ aniAns) хг +
+
Г ans^ns) xs +
н-
~Г annAns)Xn =
+ bnAns.
{л11А18 + а%хАи+ . . .
+
+ (0lA* + a2sA2s + • ■
+
+ (auAu + a2nA2s + .
= b1Als + b2A2s + .
Но по теореме 2 все суммы вида
alk™\S "Ь #2*^2.9 + • • •
равны нулю. Поэтому все скобки, кроме
0iHi, + *aH*+ • • • +^А^=А
(см. формулу (2)), пропадут, и мы получим:
А • xs=bxAu + b2A2s + . . . + bnAns.
апЪАп
nk^ns V1 ^ S)
(7)
Займемся правой частью уравнения (7). Возьмем
определитель
ап а12
#21 #22
. . Ь*
а
In
а,
2Л
#Л1 #*2
Ьп • • • #ЛЯ
отличающийся от А только s-u столбцом, в котором
коэффициенты als, a2s9 .... ans при неизвестном xs заменены
величинами Ьъ &2, . . . , &„, которые обычно называют свободными
кленами. Разложим А5 по элементам s-ro столбца. Тогда как
раз получится правая часть уравнения (7). Следовательно, (7)
можно переписать так: А-л:5=А5.
1 Индекс s предполагается равным одному из чисел 1, 2, ... , п.
42
Мы получили новую систему уравнений:
Д-^-сД,, Д-л;2 = Д2, . . . , Д.хЛе=Дя. (8)
Покажем, что система (8) при Д Ф 0 равносильна
первоначальной системе (6).
Пусть хх^аи д;2=а2, . . ., д;л=ал—решение системы (6). Тогда
мы имеем равенства:
0/А + ^2«2 + . . . + aln*n = bh (/=1,2, . . . , п). (9)
Если к равенствам (9) применить все те преобразования,
которые мы проводили для системы (6), то равенства не
нарушатся, и мы получим:
Д.а1 = Дч Д*о(о = До Д.сс = Д„
т. е. Xi = ait д*2=а2, . . ., хп=а,п—являются решением системы (8).
Обратно система (8) при Д Ф 0 имеет единственное решение:
Подставим эти значения неизвестных в левые части уравнений (6).
Возьмем, например, первое уравнение. После подстановки мы
получим:
^11*1 + ^2+ ... +а1ЛДл=&1Д,
или,заменяя Д5 их выражениями ^s=b1Ais + b2A2s + . . . + bnArs,
Яп (Мп + Мм + • ■ • + МлО + ai2 (Ми +
+ М22 + ... + Мя») +
+ ... + а1я (Mi« + М»я + ... + M*i) = M.
Раскроем скобки и соберем вместе члены с одинаковыми bt.
Получим:
bi (апАп + а12А12 + . . . + а1лЛ1я) +
+ h (апА21 + а12А22 + . . . + а1пА2п) +
+ . • • + Ьп (апАп1 + а12Ап2 + . .. + а1пАпп) = Ь^. (10)
По теореме 2 все скобки левой части равенства (10), кроме
первой, должны равняться нулю. Что касается первой скобки,
то она по теореме 1 равна Д, поэтому равенство (10)
превращается в тождество
Подобным же образом проверяются и остальные
уравнения системы (6).
43
Следовательно, единственное решение системы (8) (при &Ф0)
является также и решением системы (6).
Итак, если А Ф 0, то система (6) имеет единственное
решение, которое находится по формулам:
_ ^1 _ А2
х1 — —, х2 — —-
Л А
*!.=
(И)
Решение системы п линейных уравнений с п неизвестными
по формулам (11) известно под названием правила Крамера.
Пример. При помощи правила Крамера решить систему:
*i +х2 + х3 + хА = \0,
Xi Хг -\- Х3 Xt= 2,
1хг—Зх2 + 4х3 + xt = 12,
3xt + 4хг—Зх3 + 9х4 = 38. )
Составляем и вычисляем определитель системы:
1111
1-1 1-1
2-341
3 4-3 9
•68.
Мы видим, что Д Ф 0. Следовательно, правило Крамера
применимо. Затем составляем и вычисляем определители Дх, Д2,
Дз, V
Д,=
10 1 1 1
-2 -1 1 -1
12-3 4 1
38 4-3 9
1 1 10 1
1 -1 -2 -1
2-3 12 1
3 4 38 9
= -68, Д2=
= -204, Д4 =
10
-2
12
38 -3
1 1
1 1
1 -1
4 1
-136,
10
-1
-3
4
1 -2
4
-3
12
38
=-272,
откуда по правилам Крамера
Дг 1 Лз Г) Д.1 О &4
Д а А Д
= 4.
Правило Крамера пригодно лишь в случае А Ф 0. Однако
можно привести многочисленные примеры систем уравнений с
определителем Д=0. Совместны ли подобные системы, а если
совместны, то как найти их решения? На этот вопрос мы от-
44
ветим со всей подробностью во второй главе, а пока заметим,
что при А = 0 система п линейных уравнений с п неизвестными
либо несовместна, либо совместна, но имеет уже не
единственное, а бесконечное множество решений.
В заключение рассмотрим один особый случай п линейных
уравнений с п неизвестными. Мы имеем в виду однородные
уравнения.
Система п линейных уравнений с п неизвестными
называется однородной, если все свободные члены bt равны нулю,
т. е. если система имеет вид:
апхг + а12х2 + . . .+а1пхп = 0, ]
яЯ1*1 + 0я2л:8 + . • .+аяпхя=0. )
Эта система, очевидно, имеет решение:
*i=0, х2=0, . . . , хп=0,
в котором все неизвестные равны нулю. Такое решение
обычно называется нулевым или тривиальным. Посмотрим,
что получается, когда однородная система допускает и
ненулевое решение
хг = аъ х2=а>2> • • • » хп=ап*
где по меньшей мере одно из аъ а2, . . . , ап отлично от нуля.
Пусть, например, <*3ф0. Тогда мы можем написать, что
**S " ~ S*
или, так как А5=0,
VA = 0.
Но сс3фО. Следовательно, А = 0.
Итак, мы показали, что ненулевые решения однородной
системы (11) могут быть только в случае Д=0.
К тому же выводу можно прийти и на основании
следующих соображений. Пусть определитель А системы (12) отличен
от нуля. Тогда система имеет единственное решение,
определяемое по правилам Крамера, а именно нулевое. Иными
словами, ненулевые решения могут быть лишь при А=0.
Во второй главе нашего курса будет показано, что и,
обратно, когда А=0, однородная система (12) обязательно имеет
ненулевые решения.
Пример. При каких значениях k система уравнений
kx+y + z=0, |
x + ky — 0=0, I
2x-y + z=0 J
имеет ненулевые решения?
45
Необходимым условием является равенство нулю
определителя системы:
\k 1 II
А= 1 k— 1 =0.
12 — 1 1|
Раскрывая определитель, будем иметь: (k+\) (k—4)=0, откуда
получаем два значения для k: kt=—\ и кг=\.
Проверим, имеет ли система при этих значениях k
ненулевые решения. При kt = — \ система такова:
-х+у+г=0л
л:—у—2=0,1
2x—y+z=0.)
Мы видим, что второе уравнение является следствием первого,
так как отличается от него лишь знаками всех членов. Таким
образом, в действительности мы имеем не три, а два уравнения
с тремя неизвестными, т. е. неопремеленную систему. Чтобы
ее решить, перенесем z в первом и третьем уравнениях в правую
часть:
-x + y = -z,
2x—y = —z,
откуда найдем, чтод;= — 2z,y = — 3z. Если положить z, например
равным 1, то получим как раз ненулевое решение: х=— 2
у = _3, 0=1.
Предоставляем читателю самостоятельно разобрать случай
^2=4 и найти в этом случае ненулевое решение.
§ 9. Теорема Лапласа
Как мы уже знаем, всякий определитель можно разложить
по элементам строки или столбца (см. § 8, теорема 1).
Существует, однако, более общая формула разложения, основанная
на обобщении понятий минора и алгебраического дополнения.
Выделим в определителе А п-го порядка какие-нибудь k
строк и k столбцов. Элементы, стоящие на пересечении этих
строк и столбцов, образуют определитель М k-то порядка,
который мы назовем минором ft-ro порядка. В частности,
каждый элемент определителя А мы рассматриваем как минор
первого порядка. Вычеркнем затем в определителе А эти k
строк и столбцов и сдвинем оставшиеся элементы. Мь^ получим
второй минор М (/г—/г)-го порядка. Миноры М и М
называются взаимно-дополнительными.
46
Пример. Выделим в определителе пятого порядка
ап а12 #13 #14 «is
#21 «22
#24 «25
«31
«41
«61
«32
«42
«52
«33
«43
«53
«34
«44
а-х
^04
«35
«45
«56
первую и пятую строки, третий и четвертый столбцы. Мы
получим следующие два взаимно-дополнительных минора:
М =
«13 «14
«63 «54
М =
#21 «22 «25
«31 «32 «35
«11 «12 а а к
Hi "42
45
Так обобщается понятие минора, данное в § 7. Теперь
остается обобщить понятие алгебраического дополнения.
Введем такое определение.
Определение. Алгебраическим дополнением минора М k-го
порядка называется дополнительный минор М,
умноженный на
( _ 1) («1 + «2 Н- • • • + «ft) + (3, + Э2 -h ... + ЭЛ) ^
где av а2, . . . , ak и plf р2> . . . , pft соответственно
номера строк и столбцов, выделяемых в определителе А для
получения минора М.
Например, алгебраическим дополнением минора
м =
«13 «14
«63 «64
определителя пятого порядка является
( — l)U+5) + <3 + 4)
#21 #22 «25
«31 «32 «35
«41 t
*42 «45
—
«21 «22 «25
«31 «32 «35
«41 «42 «45
Нашей основной целью будет теперь доказательство
следующей теоремы.
Теорема Лапласа. Выделим в определителе А п-го
порядка какие-нибудь k строк. Составим всевозможные
миноры k-го порядка, образованные из элементов, находящихся
на пересечении этих строк и произвольных k столбцов
определителя. Тогда сумма произведений всех таких
миноров на их алгебраические дополнения равна определителю А.
Аналогичный результат получается, когда выделяются k
каких-нибудь столбцов.
47
Пример. В определителе
3 2
D =
О 1
10 5 3
3-125
1-1 1-1
выделим первые две строки и составим всевозможные миноры
второго порядка, содержащиеся в этих строках. Это будут
миноры:
М4 =
3 2
-1 0
2 0
0 5
М*=
М,
3 0
-1 5
2 1
0 3
Мл =
3 1
-1 3
мй=
О 1
5 3
А теперь напишем соответствующие алгебраические
дополнения:
Л1=(-1)(1 + 2>+(,+2>
Л3=(-1)(1 + 2)+(1 + 4)
Л5=(-1)(1 + 2) + (2 + 4)
2 5
1 -1
-1 2
-1 1
3 2
1 1
Л2=(-1)(, + 2> + (1 + 3)
Д = / J) 0 + 2} + (2 + 3)
Лв=(-1)(1 + 2) + (3 + 4>
-1 5
-1 —1
3 5
1 -1
3 -1
1 -1
Отсюда согласно теореме Лапласа
D--
+
3 2
1 0
2 0
0 5
•
|-
2 5
1 -1
13 £
1 1 -1
3 0
-1 5
2 11
0 3
•
•
-1
-1
3 2
1 1
5
-1
+
н
0 1
5 3
•
3 1
1 3
3 -
1 -
•
-1
-1
-1 2
-1 1
=
+
-2- (—7)—15-6 + 10-1 + 10- (-8) -6-1 + (-5).(-2) = -170.
Тот же результат получается при помощи обычного
метода вычисления определителя.
Прежде чем переходить к доказательству теоремы
Лапласа, укажем один способ подсчета числа инверсий в
перестановке и рассмотрим лемму, роль которой будет аналогична
роли теоремы 1 § 7.
Пусть ага2 . . . akak . . . ап (k < п) —некоторая
перестановка из п чисел 1,2, . . . , п. Обозначим через т число
инверсий в этой перестановке. Тогда:
rn=p + q+{*1 + *,+ . . .+a,)-Ali±i)-, (1)
48
где р—число инверсий в ссга2 . . . ak и q—число инверсий в
аЛ + Л + 2 • • • V
Справедливость формулы (1) обнаруживается следующим
образом. Пусть а^, а. . . . , а., —те же числа аь а2, . . . ,
аЛ, но взятые в порядке возрастания: а, < а. < . . . <а7 . Так
как а^—наименьшее среди аь а2, . . . , аЛ, то числа 1, 2,
. . . , а^—1 должны встречаться в аЛ + 1аЛ + 2 • . . ая и все
они находятся в инверсии с al±. Следовательно, аЛ + 1аЛ , 2. ,.ая
образуют а^— 1 инверсий с а/1# Аналогично, аЛ + 1аЛ,2. . . ая
образуют а/а— 2 инверсий с а/2, так как все числа,
меньшие а/£| за исключением а^, находятся в аЛ + хак + 2.. ,ая, и т. д.
Наконец, аЛ + 1аЛ + 2 . . . ая образуют «/я—Л инверсий с а.
Отсюда следует, что аЛ + 1аЛ + 2 • • • ал образуют относительно
всех чисел аи а2, . . . , аЛ
(^-1) + К-2)+. . .+(*,,-*) =
= К+«/,+ - • -+«/я)-0+2+. . . +*) =
= (а2 + а2+ . . .+«4)-^±!)
инверсий.
Для получения полного числа т инверсий в перестановке
аха2 . . . а*аЛ + 1 . . . ая остается добавить число ^ инверсий
в o^ag . . . аЛ и число q инверсий в аЛ + 1аЛ , 2 . . . а„. В
результате получается формула (1).
Лемма. Каждый член произведения минора М k-го
порядка определителя А на алгебраическое дополнение А
этого минора является также членом определителя А,
и притом с тем же знаком, что и в произведении МА.
Доказательство. Пусть аи а2, ..., ak и рь р2, . .., $k—
номера строк и столбцов определителя А, на пересечении
которых находятся элементы минора М. Номера остальных
строк и столбцов определителя обозначим через aA + 1, aft . 2>
..., «я и Ря + 1, РЛ+2, ..., Ря.
Каждый член минора М имеет вид:
где /ь /2, ... ,*Л—перестановка из чисел р,, р2, ..., ря, и входит
в ЛГ со знаком ( — l)p + t\ где /7—число инверсий в а^.. .аЛ и
^—число инверсий в Мг---**-
Каждый член дополнительного минора Ж имеет вид:
49
гДе »*+Л+2- ^-'„-перестановка из чисел рА + 1, pft+2, ....
Р„, и входит в М со знаком (—\)9 + '\ где ^—число инверсий
в a*+1«ft+2. • • *я и ^2-число инверсий Bik + 1ik+2. . .in.
Очевидно, что в алгебраическое дополнение этот член войдет
со знаком
(_1)(а« + аг + --- + а*) + (?» + ?* + --- + р*)(_1)? + 'а =
==(_lj(°i + «* + --- + «k) + (S>i + h + --- + h) + <' + t^
Отсюда каждый член произведения МА имеет вид:
а«Ла«А- • -aW4+i'*+r ' '"«А (2)
и входит в УИЛ со знаком
/ 1ч(«1 + «1+-" + «л)"+ (?!+?•+••• + ?*)+' + * + '■ + '»
С другой стороны, (2) есть член и самого определителя А,
так как (2) есть произведение элементов А, взятых по одному
и только по одному из каждой строки и столбца
определителя.
Найдем, с каким знаком входит член (2) в определитель А.
Число s инверсий в перестановке
*iV--aA+i---aii
первых индексов элементов члена (2) по формуле (1) равно
Число t инверсий в перестановке
iih • • • hh + i • • • ln
вторых индексов элементов члена (2) по той же формуле (I)
равно
*1 + *1 + (*1 + <1+.-- + *»)- *(*2+1) -
=*, + U + (Pi + h + ... + h) - ^^,
так как iu /2, ..., ik суть те же числа (Зь (32, .. ., рл.
Следовательно, член (2) входит в А со знаком
Ь {Ъ-\-\\
(—!)* + ' = / j ч(«1+«И +«*)+ (?1+Э»+- • -+Эл)+Р+^+^+^- 2—V^ =
= V_l )(«!+««+•• •+«*> + (Prf М- • • • +?*) +Р-И+Л+^ ^
т. е. с тем же знаком, что и в произведение МА. Лемма
доказана.
50
Теперь теорема Лапласа доказывается без труда.
Доказательство теоремы Лапласа. Пусть в
определителе А выделено k строк с номерами а19 ..., ak.
Номера остальных строк А обозначим через «л+1, ..., ап. Затем
обозначим всевозможные миноры &-го порядка, порожденные
элементами этих строк, через mv Mv ..., Afv, а их
алгебраические дополнения
надо показать, что
соответственно через Av A
2»
А . Нам
МХАХ
ЖД+...+ ЖД = А.
Согласно лемме каждое из произведений MiAi состоит из
членов определителя А и притом с тем же знаком, что и в
определителе. Никакие два произведения МЬАЬ и MjAj не
могут иметь общих членов, так как миноры Miy Mj отличаются
друг от друга по меньшей мере одним столбцом. Таким
образом, сумма
М1А1 + М2А2+ . . . +ЛГЛ (3)
состоит из различных членов определителя А. Для
окончательного доказательства теоремы остается показать, что в состав
суммы (3) входят все члены определителя А.
Обратимся к произвольному члену определителя А. Его
можно записать в виде
а . а .
. а . а
. CL„
Из этого выражения члена видно, что он входит в
произведение AL4, где М—минор &-го порядка, образованный из
элементов, находящихся на пересечении выделенных строк и
к столбцов с номерами iu /2» • • •» **. а А—алгебраическое
дополнение М. Следовательно, сумма (3) действительно
исчерпывает все члены определителя.
§ 10. Умножение определителей
Среди приложений теоремы Лапласа наиболее замечательно
одно: при помощи теоремы Лапласа произведение двух
определителей всегда можно представить в виде одного
определителя.
Перемножим, например, определители
д=
01 Ьх
а2 &2
Я.=
а1
а2
аз
Pi
Р.
Рз
Ti
Тг
Тз
51
Легко видеть, что определитель пятого порядка
\аг bL О О О
D-
а2 Ь2 О О О
«i ^i ai Pi Ti
и2 ^2 а2 р2 ^г
Рз Тз
ид v~ а.
где к и 'У—произвольные величины, равен произведению DXD2.
Действительно, разлагая D по теореме Лапласа по минорам
первых двух строк, получаем:
D =
Но особенно замечателен тот случай, когда перемножаются
определители одинакового порядка. Мы собираемся доказать
следующее правило.
Правило умножения определителей. Чтобы перемножить
два определителя п-го порядка
«1 Ъх
\<h b2
«i Pi Ti
«2 Р2 Ъ
«з Рз Тз
*1=
11
а
In
а,
пХ
а„
'In
Jnl
надо элементы i-u строки определителя Aj умножить на
соответствующие элементы j-го столбца определителя А2
и все эти произведения сложить:
cij=allblj + ai2by + . . . + ainbnj (/, у=1,2,
Определитель
п).
А-
'In
^nl •
и будет произведением определителей Ах и А2.
Пример. Перемножим
А1 =
1 0 2
1 1 0
3 2 1
и
Аа =
2 0
7 1
— 1 1
5
0
-1
52
Вычисляем Су. Элемент сп равен сумме произведений
элементов первой строки определителя Дх на соответствующие
элементы первого столбца определителя Д2:
си = 1-2 + 0-7 + 2-(-1)=0.
Точно так же находим, что
с„ = 1- 0 + 0-1 +2-1 = 2, с18=1-5 + 0-0 + 2-(-1) =3,
с21=(-1)-2+1-7 + 0-(-1)=5, с22=(-1)-0+1-1+0-1 = 1,
с28 = (-1)-5+1-0 + 0-(-1) = -5, с31 = 3-2 + 2-7 + 1-(-1) = 19,
^2 = 3-0 + 2-1 + 1-1=3, с33=3-5 + 2-0+1-(-1) = 14,
10 2
-1 1 0
3 2 1
•
2 0 5
7 1 0
-1 1 —1
=
0 2 3
5 1 -5
19 3 14
Доказательство правила умножения. По
теореме Лапласа определитель порядка 2/г
ап а12 .
^21 ^22 •
ат ап2 ■
-1 0 .
0 -1 .
0 0..
• • «2„ 0
• • апп 0
. .0 Ьи
. .0 Ь21
.-1 Ьп1
0.
0 .
0 .
ь22. .
ьп2. .
. .0
. .0
. .0
• ьы\
• Ь2п
■ ьпп
равен произведению AiA2. Преобразуем определитель А так,
чтобы элементы Ъц превратились в нули. Для этого умножим
первый столбец на Ь1Ъ второй—на Ь21 и т. д., /г-й—на bnl и
прибавим к (/г+1)-му столбцу. Затем умножим первый
столбец на &12, второй—на Ь22 и т. д., /г-й-—на Ьп2 и прибавим
к (л + 2)-му столбцу. Вообще, умножим первый столбец на
blki второй—на Ь2кит. д., /г-й—на bnk и прибавим к (/г + £)-му
столбцу.
После всех этих преобразований определитель А примет
следующий вид:
ап а12 .
#21 #22 •
ап1 агЛ ■
1-1 0. .
0 —1 . .
0 0 . .
• • аы
• «2„
• апп
. 0
. 0
. -1
Cll
С21
Cnl
0
0
0
С12 • •
С22 . .
сп2 . .
0.
0.
0 .
• сы
• cin
•Спп
. .0
• • 0
. .0
Ъ\
Разложим полученный определитель по минорам последних п
строк. Мы видим, что минор
М =
-1 О
О -1
О . О. . . -1
(-1)"
есть единственный минор, отличный от нуля. Его
алгебраическое дополнение А равно:
А = / j \ [(Я+1Н- • • • +2л] + (1+2+ . . . +л)
'л1
= (-0'
л(2л+ 1)
-11
ил1
. £
1л
. £„
откуда
А = МА = (-\)2п(п + 1)
^и
^л1
. С
In
-11
'nl
С1п
так как 2/г (л + 1)—четное число.
Приводим еще один вывод правила умножения
определителей я-го порядка, не использующий теоремы Лапласа.
Обратимся к определителю
-11
■^1
. с
In
. с„
где по-прежнему си=апЬг. + ai2b2J + ... + ainbnJ (i, у=1, 2,
..., п).
Рассматривая элементы первой строки определителя А как
суммы п слагаемых, мы можем А разложить на сумму п
определителей /г-го порядка. В свою очередь, рассматривая
элементы второй строки каждого из таких п определителей как
суммы п слагаемых, мы каждый из них разложим на сумму п
определителей, в результате чего А разложится на сумму п2
54
определителей п-го порядка, и т. д. В конечном счете мы А
представим в виде суммы пп определителей вида
D,=
a2i!>kl
a2ih* ■
■ auhn
■ flaA*
a.,, b, , a. b., . . . a„, b; „
Выносим за знак определителя Dk общий множитель аи
элементов первой строки, общий множитель a2i элементов второй
строки, ..., общий множитель а . элементов я-й строки:
А* = а1«/Ы •
. а ■
ьк1 ь.2.
*<-1 bU
. Ь:
. ь,
(1)
Если числа iu i2, . . ., /я не все различны, то определитель
в правой части равенства (1) будет иметь по меньшей мере
две одинаковые строки и потому будет равен нулю, а значит,
и Dk будет равно нулю. Таким образом, остаются
определители Dky у которых все iu /2, ..., /„ между собой различны,
т. е. образуют некоторую перестановку чисел 1, 2, ..., п.
Попарно переставляем строки определителя в правой части
равенства (1) так, чтобы элементы первой строки имели
индекс не /ь а 1, элементы второй строки—не /а, а 2, ...,
элементы лг-й строки—не гл, а п. При каждой такой перестановке
строк определитель будет по свойству 8 (см. § 6) менять знак
на противоположный, и мы в результате получим:
Ak=(-i)4i/4 ■ • -ашт
ьп ь12. . . ь1П
#21 #22 • • • b2n
Ьп1 Ьп2 • • • Ьпп
(2)
где t— число инверсий в перестановке /^---'л- Число t
получилось потому, что каждая перестановка строк
определителя правой части равенства (1) вызывает транспозицию в
перестановке hi2...in и число транспозиций, необходимых для
перехода от перестановки ixi2. .. ln к перестановке 12 ... п
должно иметь ту же четность, что и число инверсий t в
перестановке hi2...in (см. на стр. 17 свойство 1 транспозиции).
55
Мы видим, что в правой части равенства (2) появился
определитель А2. Таким образом, А является суммой слагаемых
вида
Dk= (— 1 )*аиа21 ... ani A 2, {ixi^... in — произвольная
перестановка чисел 1, 2, ..., п)
с общим множителем А2. Вынося общий множитель А2 за
скобку, мы внутри скобок получим сумму всевозможных
слагаемых вида
т. е. определитель Ax. Отсюда получается, что А^А^, а это
и требовалось показать.
Из основного правила умножения вытекают еще три
способа умножения определителей /г-го порядка, а именно:
1. Если транспонировать определитель А2 и применить
основное правило умножения определителей, то получится
определитель А с элементами
ClJ=ailbJl + ai2bJ2 +
+ ainbjn>
(/, у = 1, 2, ..., /г),
равный произведению А2 А2 определителей А2 и А2 (способ
комбинирования строк со строками).
2. Если транспонировать определитель Д1 и применить
основное правило умножения определителей, то получится
определитель А с элементами
си=аиь1; + а21ьу+--- + ащьпр е./=ь 2, •••> ")>
также равный А2Д2 (способ комбинирования столбцов со
столбцами).
3. Если, наконец, транспонировать оба определителя А2 и А2,
то получится определитель с элементами
cv=aubji + *2ibj2+••• + "**»> С У=1. 2, •••> п)>
снова равный AXA2 (способ комбинирования столбцов со
строками).
Само основное правило умножения определителей иногда
называют способом комбинирования строк со столбцами.
Задачи. 1. Перемножить определители по основному правилу:
а)
в)
а Ь
ах Ь1
1 2
1 3
1 -1
1 5
О 8
-1 7
2 4
3 9
с
d
сх dx
; v)
и
5 1
2
3 1 6
2 3 1
12 3 4
4 12 3
3 4 12
2 3
4 1
и
1 2 3
3 1 1
1 5 5
.
56
ства:
2. При помощи правила умножения определителей вывести тожде-
а) (abi-aj)2^ (а2 + b2) (a2 + b2) - (о^ + Ю,)2;-
б) (а2 + Ь2) {а2 + Ь2) =(аах - ЬЬг)2 + (аЬг + агЬ?и
Указание. Для вывода первого тождества следует перемножить
\а b
\аг Ь1
а для вывода второго тождества
a b
—6 а
а ах
b Ьг
—Ьх ах
§ 11. Вычисление буквенных определителей
Если вычисление определителей с числовыми элементами
обычно не вызывает особых затруднений, то с буквенными
определителями дело обстоит сложнее. При вычислении
буквенных определителей требуются известные навыки и умение
учитывать индивидуальные особенности данного определителя.
Чтобы читатель имел некоторое представление о том, какие
при этом используются приемы, рассмотрим несколько
примеров.
Пример 1. Вычислить определитель
D=
Преобразуем определитель D так, чтобы у него все
элементы ниже левой главной диагонали (идущей слева вниз)
стали равными нулю. Для этой цели прибавляем к последнему
столбцу определителя предыдущие столбцы и затем выносим
за знак определителя общий множитель (аг + а2+ .. .+ап + х)
элементов последнего столбца. Будем иметь:
I ах + х #2 • • • ci„
«1 +
й\
«1
«1
«1
X
а
а2
г +
«2
а2
а2
а3 .
х а3 .
а3+х .
а3 .
а3 .
п — 1 п
п—1 п
п—1 п
■ • ап-1+Х ап
■ -ап-Х ап + Х
D=(a1+...+an+x)-
а2
а2-\-х
*п-1
1
*1
а2
а2
. . ап_,+х 1
а
п-\
1
57
Вычитаем из первых п—1 столбцов полученного определителя
его последний столбец, умноженный соответственно на аи а2,
..., an-v Это даст определитель
D=(a1+...+an+x)
х 0 .
О х .
О 0.
0 0.
0 1
0 1
. х 1
. 0 1
у которого все элементы ниже левой главной диагонали равны
нулю. Такой определитель, как известно, равен произведению
диагональных элементов. Следовательно,
£>= (аг + а2 + .. . + ап + х) х
п-\
В некоторых случаях выгоднее сразу раскладывать
определитель по элементам строки или столбца. Рассмотрим хотя
бы такой пример.
Пример 2. Вычислить определитель #-го порядка
А =
a b 0 ... 0 0
0 а Ь ... 0 0
0 0 0
& 0 0
. . a b
. . 0 а
Раскладываем А по элементам первого столбца:
Д = а-
а Ь 0 .
0 а Ъ .
0 0 0.
0 0 0..
..00
..00
. a b
. 0 а
+ M-i)"+1
=ап + (-1)п+1Ь",
Ь 0 0 .
a b 0 .
0 0 0.
0 0 0..
..0 0
. 0 0
. Ь 0
. a b
так как в первом миноре все элементы ниже левой главной
диагонали равны нулю, а во втором—выше левой главной
диагонали равны нулю.
Иногда целесообразно выражать данный определитель п-го
(произвольного) порядка через один или несколько
определителей того же типа, но низших порядков. В качестве
иллюстрации рассмотрим следующий пример.
58
Пример 3. Вычислить определитель п-го порядка
|а +1 а 0 . . . О О
1 a+U... О О
Ап=
О 0 0 . . . а +1 a
О 0 0... 1 а + 1
Раскладываем Ап по элементам первого столбца:
la 0 ... О О
Ап = {а+\)Ап_-
1 а+1
О
О
О 0 . . . а + 1 a
О 0 ... 1 а+1
где Лп_1—определитель того же типа, что и Лл, но (/г—1)-го
порядка. Разлагая в правой части последнего равенства
вычитаемый определитель по элементам первой строки, получаем:
Ап = (а+1)Ая_г-аА^29 (1)
где Лл2—определитель того же типа, что и Лл, но (п—2)-го
порядка.
Мы пришли к так называемому рекуррентному или
возвратному соотношению, выражающему определитель Ап через
определители низшего порядка того же типа. Пользуясь
рекуррентным соотношением, можно получить и общее
выражение Ап. Для этой цели преобразуем соотношение (1) так:
А—аАп ,=А„ л—аАп 9.
п п—1 п—1 п—z
Отсюда следует, что Ak—aAk_1 при любом k = 2, 3, ... есть
величина постоянная. Найдем ее:
а+1 а
1 а+1,
а+1 а О
1 а+1 а
О 1 а+1
= а2 + а+ 1,
= а3 + а2 + а + 1,
откуда
Итак,
или
Ач—аА2 = \.
\~аАп-1 = ^
= «Vi + l.
59
и мы получаем следующую систему равенств:
Ап-1 = аАп-2+^
As = aA2+\,
откуда
Ап = а(аАп_2+\) + \=а2Ап_2 + а+\=а2(аАп_3+1) +
+ а+\= ... =ап-2А2 + ап~3 + ап-4+ ... +1.
Но А2=а2 + а+ 1. Следовательно,
Л а-\
при аФ\9 а при а=1
В заключение разберем пример на вычисление
определителя путем умножения его на некоторый определитель.
Пример 4. Вычислить определитель
I # b с d \
R— — & а ^ — с \
— с — d а Ъ
— d с —Ъ а \
Умножаем В на В (т. е. возводим В в квадрат), пользуясь
способом комбинирования строк со строками. Получим
\a2 + b2 + c2 + d2 О О О I
R2 \ О a2 + b2 + c2 + d2 О О I
О 0 a2 + b2 + c2 + d2 О
I 0 0 0 a2 + b2 + c2 + d2\
или В2 = (а2 + b2 + c2 + d2y, откуда
B=±(a2 + b2+c2 + d2)2.
Найдем, какой знак, + или —, следует брать. Перемножая
элементы левой главной диагонали определителя В, получаем
член а4 определителя. Этот член входит в В со знаком + .
Следовательно,
B=(a2 + b2 + c2 + d2)2.
Заканчивая главу, посвященную теории определителей, приведем
некоторые исторические сведения.
Зарождение теории определителей следует отнести к концу XVII в.
В 1693 г. Лейбниц, изучая линейные уравнения со многими неизвестными,
60
впервые подметил общий закон составления определителей. В письме к Ло-
питалю от 28 апреля 1693 г. Лейбниц сообщает, что своему открытию он
обязан особому способу обозначения коэффициентов уравнения. Этот
способ обозначения состоял в том, что каждый коэффициент обозначался двумя
числами (система двойных индексов). Эти результаты Лейбница не были
опубликованы, и потому они остались неизвестными его современникам.
В 1750 г. женевским ученым Крамером была опубликована работа,
посвященная теории алгебраических кривых. В приложении, помещенном
в конце своего сочинения, Крамер указывает общий закон составления
определителей и приводит общую формулу решения системы п линейных
уравнений с п неизвестными—как раз ту формулу, которую мы вывели в § 8.
Однако ни Лейбниц, ни Крамер не дали более или менее законченной
теории определителей. Первые шаги в этом направлении были сделаны
французским математиком Вандермондом в мемуаре, доложенном Парижской
академии наук в 1771 г.
Дальнейшее и притом значительное развитие теория определителей
получила в 1812 г., когда появились работы двух французских математиков
Бине и Коши, причем особенно важное значение имел мемуар Коши.
Отметим, что правило умножения определителей, которое мы рассмотрели
в § 10, было установлено Бине и Коши.
С этого момента определители становятся одним из важных орудий
математического исследования. В настоящее время нет почти ни одной
отрасли математики, в которой определители не имели бы приложений. Мы
их встречаем в алгебре, в аналитической геометрии, в механике, в теории
дифференциальных уравнений, в теории функций, в теории чисел и т. д.
Задачи. 1. Вычислить определители:
а)
abed
d a b с
с d a b
b с d a
6)
'
а + хх а а
а а -f- Х2 . . . а
а а . . . а + хп
в)
а1 — 1 а1а2 • '
сипа-, а0 — 1 . .
апа1 апа2
а0а
п
Г-п
«1~\
Г)
2л
1
0
0
а2
2а
0
0
0 .
а2 .
0 .
0 .
. . 0
. . 0
.. 1
. 0
0 0
0 0
2а а»
1 2а
2. Вычислить определитель
D =
—a bed
b —a d с
с d —а Ь
deb —а
путем умножения его на определитель
1 _i __i _i
Н =
1—111
11—11
111-1
Ф0.
Глава вторая
ЛИНЕЙНЫЕ УРАВНЕНИЯ
§ 12. /z-мерные векторы и линейная зависимость
В общей теории линейных уравнений с несколькими
неизвестными большое значение имеет понятие линейной
зависимости. Но прежде чем вводить это понятие, поговорим об
/г-мерном векторе.
Под n-мерным вектором мы будем подразумевать
упорядоченную систему п чисел (alt а2, . . . , ап), т. е. систему
чисел, взятых в определенном порядке (в том порядке, в
каком они написаны). Числа at обычно называются компонентами
или координатами /г-мерного вектора, а число п—
размерностью вектора. Сам вектор (аи а2, . . . , ап) мы часто будем
обозначать малой жирной латинской буквой, например, а.
В соответствии с определением два /г-мерных вектора
а = {аъ а2, . . . , ап), b=(blt b2 bn)
следует считать равными тогда и только тогда, когда их
одноименные компоненты совпадают, т. е. аг = Ьъ а2=Ь2, . . . , ап = Ьп.
С понятием /г-мерного вектора мы, по сути дела, уже
встречались. Так, строку или столбец определителя /1-го порядка
можно рассматривать как /г-мерный вектор. Решение аь . . . , ап
системы п линейных уравнений с п неизвестными также можно
рассматривать как /г-мерный вектор. Положение шара радиуса,
равного единице, в пространстве можно определить при
помощи трехмерного вектора (а, й, с), где а, Ь, £—координаты
центра шара. Одним словом, понятие /г-мерного вектора
встречается и оказывается полезным в самых разнообразных
отраслях математики, механики, физики.
Введем теперь операции сложения векторов и умножения
вектора на число.
Под суммой а + b двух /г-мерных векторов
а={аг ап), b = (blt . . . , bn)
мы будем подразумевать /г-мерный вектор
62
Исходя из этого определения сложения, мы не можем
говорить о сумме векторов различной размерности. Таким
образом, если речь будет идти о сумме векторов без указания их
размерности, то само собой будет подразумеваться, что
размерность векторов одинакова.
Умножение вектора а=(аъ . . . , ап) на число с мы
определим следующим образом:
с-а = а-с = (саъ . . . , сап).
Нетрудно убедиться, что сложение и умножение векторов
подчиняются основным алгебраическим законам, а именно:
1. Сложение векторов подчиняется коммутативному
(переместительному) закону: а-\- b = b + а для любой пары
a, b /г-мерных векторов.
2. Сложение векторов подчиняется также и
ассоциативному (сочетательному) закону: (а + Ь) + с = а + (Ь + с)
для любых трех /г-мерных векторов а, Ь, с.
3. Умножение вектора на число подчиняется
дистрибутивному {распределительному) закону.
с(а + Ь) = с-а + с-Ь, (с + d)-a=ca-\- da
для любых чисел с и d и любых /г-мерных векторов а и Ь.
4. Умножение вектора на число подчиняется
коммутативному закону: са = а-с для любого числа с и вектора а.
5. Выполнимость вычитания: уравнение а + х = Ь, где
а и &—произвольные п мерные векторы, всегда разрешимо,
т. е. существует по меньшей мере один /г-мерный вектор
х = (съ . . . , сп), удовлетворяющий этому уравнению.
Коммутативность сложения векторов легко проверяется
следующим образом. Из самого определения сложения
вытекает, что
а + Ь = (а1у . . . , an) + (blt . . . , b„) = (a1 + bu . . ., an + bn),
b + a = (bl9 ьп) + (аи . .., an) = (b1 + a1, . . . , bn + an).
Ноаг + Ьх=Ьг + al9 . . . , an + bn = bn + an, так как для сложения
чисел коммутативный закон верен. Следовательно,
а -\- b = b + a.
Аналогично проверяются и законы 2—4.
Закон 5, т. е. выполнимость вычитания, проверяется также
без труда, а именно: если
а=(аи . . . , ап)у b = (blt .. . , bn), x = (xlt . . . , хп),
то уравнение а + х=Ь принимает вид:
(аг + хи ... t an + xn) = (blt . . . , bn),
откуда
а1 + х1 = Ьъ ап + хп = Ьп. (1)
63
Но система (1) линейных уравнений имеет, очевидно,
единственное решение х1 = Ь1—аъ x2 = b2—a2f . . . , хп = Ьп—ап, так
как для чисел вычитание всегда выполнимо, и притом
однозначно выполнимо. Таким образом, векторное уравнение
а + х = Ь
имеет, и притом единственное решение х = (Ь1—аи . . ., Ьп—ап).
Это единственное решение мы будем обозначать через Ь—а и
называть разностью векторов & и а.
В частности, разность а—а двух одинаковых векторов
равна вектору (0, 0, ... , 0), у которого все компоненты равны
нулю. Вектор (0, 0, . . . , 0) обычно обозначается через 0 и
называется нулевым вектором. Нетрудно убедиться, что
а + 0=а для всякого /г-мерного вектора а, т. е. нулевой
вектор ведет себя при сложении векторов аналогично числу нуль
при арифметическом сложении чисел.
Отметим далее, что разность О—а обозначается через—а
и называется вектором, противоположным вектору а.
Пользуясь понятием противоположного вектора, можно разность
Ь—а векторов Ь, а рассматривать как сумму Ь + (—а). В
самом деле, если *
а = (а1} . . . , ап), b = (b1, . . . , bn),
то
b-a = (b1-au . . . , bn-an) =
= (bi, . . , , bn) + (—alf . . ., -an) = b + (-a).
Наконец, имеют место и такие почти очевидные свойства:
1) a(ba) = (ab)a, где а, Ь—произвольные числа,
а—произвольный /г-мерный вектор.
2) a(a—b) = aa—abt (a—b)a = a-a—b-a, где a,
b—произвольные числа и a, b—произвольные /г-мерные векторы.
3) \-а=а, (—1)-а = —а, 0-а=0, а 0=0, где
а—произвольное число и а—произвольный /г-мерный вектор.
4) Если аа = 0, аФО, то а=0.
Проверку этих свойств предоставляем читателю.
Благодаря всем перечисленным выше свойствам операций
сложения векторов и умножения вектора на число для /г-мер-
ных векторов можно проводить алгебраические
преобразования, аналогичные тем, которые проводятся для чисел. Так,
члены суммы нескольких векторов можно переставлять
произвольным образом, группировать так или иначе в скобки,
числовые множители можно выносить за скобки, переносить
члены из одной части равенства в другую с противоположными
знаками и т. п.
Теперь можно перейти к понятию линейной зависимости.
Система т n-мерных векторов aly а2у . . . , ат называется
линейно зависимой, если можно подобрать такие числа
64
clt c2, . . ., cm, среди которых по меньшей мере одно
отлично от нуля, кто
сгаг + с2а2 + . . . + стат=0. (2)
Если же равенство (2) возможно только в том случае,
когда все числа съ с2, .. . , ст равны нулю, то система
векторов аи . . . , ат называется линейно независимой.
Пр име р. Возьмем следующую систему трехмерных
векторов:
а1==(1, 3, 3); а2 = (1, 1, 1); а8 = (-2, -4, -4).
Нетрудно заметить, что
^1 + я2 + Яз = 0.
Таким образом, рассматриваемая система векторов линейно
зависима.
Однако любая пара ее векторов будет уже линейно
независима. В самом деле, если бы, например, пара векторов аг
и а2 была линейно зависимой, то имело бы место равенство
сгаг + с2а2=0,
в котором хотя бы одно из чисел сг и с2 отлично от нуля.
Пусть для определенности сгфО. Тогда ax=ka2i где k=
= ——. Отсюда компоненты вектора аг были бы
пропорциях
ональны соответствующим компонентам вектора а2у чего в
действительности нет.
Система векторов, в частности, может состоять и из одного
вектора а. Легко видеть, что такая система линейно зависима
тогда и только тогда, когда а = 0, т. е. когда а—нулевой
вектор. Действительно, равенство са=0 при а Ф О возможно
только при £ = 0. Если же а=0, то са = 0 при любом числе с.
Исходя из определения линейной зависимости, можно
сделать следующие выводы.
Г. Если система т п-мерных векторов аъ аъ . . . , ат
линейно независима, то любая часть этой системы будет
и подавно линейно независима.
В самом деле, возьмем для определенности alt . . . , ak
(k < т) и покажем, что эта часть системы векторов аъ . . ., ат
будет также линейно независимой. Предположим противное:
пусть она линейно зависима. Тогда будет иметь место
равенство
с1а1+ . . . +ckak=0,
в котором по меньшей мере одно число сь / = 1, 2, . . . , k,
не равно нулю. Это равенство можно переписать следующим
образом:
сгаг + . . . + ckak + ck+i ak+i + . . . + смат =0,
65
полагая Ck+i = 0, . . . , ст=0. Но последнее равенство
свидетельствует о том, что система векторов аъ ..., ат линейно
зависима, что невозможно.
2°. Пусть для /г-мерных векторов Ь, аъ . . . , ат имеет
место равенство
b = k1a1 + . . . +kmam,
где ku . . ., km некоторые числа (часть из них и даже все
могут быть равными нулю). Мы будем в таком случае говорить,
что вектор Ь является линейной комбинацией векторов
аъ . . . , ат или линейно выраэюается через векторы
аъ . . . , ат. Оказывается, что понятия линейной зависимости
и линейной выражаемости при т > 1 равносильны: система
n-мерных векторов аъ . . . , ат в случае т > 1 тогда и
только тогда линейно зависима, когда по меньшей мере
один вектор этой системы линейно выраэюается через ее
остальные векторы.
Действительно, если система векторов а1у . . . , ат линейно
зависима, то имеет место равенство
*А+ • • • +стат=0,
в котором хотя бы один из коэффициентов с. отличен от нуля.
Пусть, например, ст Ф 0. Тогда
ат = кРЛ ... +km_lam_v глек.= -^-,
т. е. вектор ат линейно выражается через остальные векторы
системы.
Обратно, если, например, вектор ат линейно выражается
через векторы av . . . , ат_х:
ТО
*Л+ ••• +^-i^-i+(-l)-^=0, (3)
откуда система векторов аи .. ., ат линейно зависима, так как
в равенстве (3) коэффициент при ат отличен от нуля, а именно
равен —1.
Пример. Рассмотрим следующую систему четырехмерных
векторов:
^ = (1, -1, 1, -1), а2=(1, 0, 2, 0), а8 = (1, -5, -1, 2),
а4 = (3, -6, 2, 1).
Легко убедиться, что система линейно зависима, а именно
01 + 02 + 08-04 = 0. (4)
(56
Из равенства (4) видно, что любой вектор системы можно
линейно выразить через ее остальные векторы. Например,
Немаловажную роль будет играть следующая теорема.
Основная теьрема о линейной зависимости. Если каждый
из n-мерных векторов
<*ъ «2, . . . , ат (5)
линейно выражается через n-мерные векторы
ьъ ьъ ..., ьк (6)
и k < //г, то система векторов (5) линейно зависима.
Доказательство. Воспользуемся методом
математической индукции. Покажем прежде всего, что при k=\ теорема
верна.
Если fe = l, то ai = dibv где д^—некоторые числа. Если хотя
бы один вектор системы (5) является нулевым, например аъ
то система (5) линейно зависима, так как
1-а1 + 0-а2+ ... +0.ат=0.
Если все векторы а1у а2, . . . , ат ненулевые, то ни одно
из чисел dlt d2, . . ., dm не будет равно нулю. Отсюда
следует, что
bi=—am и av=-±-am,
dm dm
в силу чего ах и ат линейно зависимы, а потому и вся
система (5) линейно зависима:
Ьв1+0-а2+ ... +0'ат-1-ф-ат=0.
ат
Таким образом, при k=l теорема верна.
Допустим теперь, что теорема верна при некотором k— 1,
и покажем, что тогда она будет верна и при k.
Если хотя бы один из векторов системы (5) нулевой, то,
как мы уже выше убедились, вся система линейно зависима.
Поэтому пусть ни один из векторов системы (5) не является
нулевым. По условию каждый вектор аи . . . , ат линейно
выражается через векторы Ьъ . . . , bk. Следовательно,
«i = rfn*i+ . • . +dlkbk, |
a2=d21b1 + . . . + d2kbky I (jj
^m = dmlbi-]r . . . +dmkbk. J
67
В каждом равенстве (7) по меньшей мере один коэффициент
dr отличен от нуля; в противном случае некоторые векторы
системы (5) были бы нулевыми. Мы всегда можем
предположить, что dmk Ф 0. Действительно, если бы это было не так,
то мы соответствующим образом перенумеровали бы векторы
систем (5) и (6). Будем теперь исключать вектор bk1 для чего
вычтем почленно из первого, второго, . . . , (т —1)-го
равенства (7) последнее равенство, умноженное соответственно на
Получаем:
x\k
umk
u2k
umk
^m — \k
umk
ei=diA +
+ d\
1£-1&£-1>
a2 = d2lbx + . . . + d2k_xbk_v
^m-l = dm~U^+ • ' ' +4
ГДС
a. = a- —a .
m-\ k-l^k-V
" lJ dmk «'
Мы видим, что векторы av . . ., dm_x линейно выражаются
через векторы biy . . . , bkV Но т—\ > ft— 1, так как по
условию т > ft, и согласно нашему допущению теорема верна
для ft—-1. Следовательно, система векторов а[, .. ., о!т_х
линейно зависима:
сга[+ ... +cm_lam_l=Q
• у Ст-1 ОТЛИЧНО ОТ
и по меньшей мере одно из чисел cv
нуля. Подставляя выражения а[, . . . , am_v получаем отсюда:
c^-ta")+---+c"Aam-1
um-\k
*mk
о,
или, раскрывая скобки и группируя соответствующим образом
члены:
слал + ... +ст лат л +сат = 0у
11' ' т — 1 т — 1 ' т т '
где
j*ifc am-\k
Ст~ С\ j ' ' * Ст-\ j
а-mk "тк
Система векторов (5) оказалась линейно зависимой, т. е.
теорема справедлива и для случая ft векторов Ьи . . . , bk. Тем
самым теорема полностью доказана.
68
Задачи. 1. Показать, что система трехмерных векторов
ax = (\t 1, 1), в2 = (1, 2, 3), а3 = (1. 3, 6)
линейно независима.
2. Показать, что система векторов
ai = (l, О О, ди д1Л),
ада = (0, 0, 1, ат1 amk\
где ац — произвольные числа, линейно независима.
3. Является ли система /г-мерных векторов
ах = (1, 0 0), аа = (0, 1 0), ап = (0, 0 1),
а = (av a2 ап),
где av а2> . . . , ал—произвольные числа, линейно зависимой?
4. Является ли система векторов
<*1 = fall» fll2 ^l/z). «2 = (0, fl22, -.., «ал), • • • ,
an = (0, 0 a„rt)
линейно зависимой при ац ф 0?
5. Пусть
ах = (an, aJ2, . . •. , a^) аш = (ami. ат2 amk)
— некоторая линейно независимая система /г-мерных векторов.
Показать, что система /г-мерных .удлиненных" векторов
Ь1 = Кг а12 aW fll*+l а\п) bm=z
= (ami. ^ш2» • • • . a>mhamk+v • • • » am/?)
также линейно независима.
§ 13. Ранг системы векторов
Дальнейшие свойства линейной зависимости тесно связаны
с понятием ранга.
Под рангом системы /г-мерных векторов подразумевается
максимальное число линейно независимых векторов этой
системы.
В частности, ранг системы аи ... , атУ состоящей только из
нулевых векторов, считается равным нулю.
Примеры. 1. Найдем ранг системы векторов
а, = (1, 2), a2 = (-2, -4)f a8 = (l, 2).
Прежде всего видим, что вся система линейно зависима:
#1 + #2 + #8 = 0.
69
Затем нетрудно заметить, что каждая пара векторов системы
также линейно зависима:
2^+02=0, ах—а3=0, а2 + 2а3=0.
Однако каждый вектор системы уже линейно независим, так
как отличен от нулевого вектора. Следовательно, ранг данной
системы векторов равен единице.
2. Легко убедиться, что ранг системы векторов
а1 = (1, 0, 0), а2 = (0, 1, 0), а8 = (0, 0, 1),
в4 = (1, 2, 3)
равен трем.
Действительно, вся система векторов линейно зависима:
ai = a1 + 2а2 + За3.
Однако первые три вектора аи а2, аъ линейно независимы, так
как, подставляя в равенство
схах + с2а2 + с3а3=0
выражения векторов аи а2, аъ в координатной форме,
получаем:
(си с%% с8)=0,
откуда ^ = 0, с2=0, cs=0.
Рассмотрим теперь две основные теоремы о ранге системы
векторов.
Теорема 1. Если ранг системы n-мерных векторов
<*i> • • • , ат (1)
равен г, г> Г, то в системе (1) существует г линейно
независимых векторов, через которые линейно выраэюается
каждый вектор системы (1). Обратно, если в системе (1)
существует г линейно независимых векторов, через которые
линейно выражается каждый вектор системы, то ранг си-
стемы (1) равен г.
Замечание. Если ранг системы (1) равен нулю, то,
очевидно, в системе не существует линейно независимых векторов.
Доказательство. Г. Пусть ранг системы (1) равен г> 1.
Тогда в системе (1) имеются г линейно независимых векторов.
Без ограничения общности выводов можно предположить, что
такими векторами являются аи . . . , аг\ в противном случае
мы соответствующим образом перенумеровали бы систему
векторов (1). Возьмем произвольный вектор а системы (1). Если
а есть один из векторов av ... , ап то а линейно выражается
через аи . . . , аг. Например, если а есть аи то а=\а1 +
+ 0-а2+ . . . +0-аг. Если а отлично от аъ . . . , ап то г-\-\
векторов
аи . . . , ап а
70
будут уже линейно зависимы, так как ранг системы (1) равен г.
Таким образом, будет иметь место равенство
£j#i+ ... +crar + ca=0,
в котором по меньшей мере одно из чисел си с2, . . . , сп с
отлично от нуля. Легко видеть, что с Ф 0. Действительно, если
бы с=0, то мы имели бы равенство
схах+ . . . +сгаг=0,
свидетельствующее о линейной зависимости векторов а19 . . . , ап
что противоречит условию. Следовательно, с Ф 0, и вектор а
можно линейно выразить через векторы аи . . . , аг.
Итак, мы показали, что существует г линейно независимых
векторов аъ . . . , аг через которые линейно выражается любой
вектор системы (1).
2°. Обратно, пусть в системе (1) существует г линейно
независимых векторов, через которые линейно выражаются все
векторы системы (1). Пусть для определенности это будут
векторы аъ . . . , аг.Возьмем подсистему (т. е. часть системы (1))
из г + 1 произвольных векторов
Каждый вектор подсистемы (2) линейно выражается через
аъ а2, . . . , аг (3)
Так как число г-\- 1 векторов (2) больше числа г векторов (3),
то мы можем Применить основную теорему о линейной
зависимости предыдущего параграфа и получаем, что подсистема
векторов (2) линейно зависима. Таким образом, в системе (1)
существует г линейно независимых векторов, но всякие г+1
векторов системы (1) уже линейно зависимы. Короче говоря,
г—ранг системы (1), и теорема полностью доказана.
Только что доказанная теорема позволяет дать другое
определение ранга, а именно: рангом системы векторов (1) можно
назвать число таких линейно независимых векторов системы,
через которые линейно выражается каждый вектор системы,
Теорема 2. Если к системе n-мерных векторов
Яъ • • • , ам (1)
добавить вектор, линейно выражающийся через векторы
системы, то ранг системы не изменится. Точно так эюе ранг
системы (1) не меняется при удалении вектора, линейно
выражающегося через остальные векторы системы.
Доказательство. Г. Присоединим к системе векторов
(1) вектор а, линейно выражающийся через аи . . . , ат. Если
г—ранг системы (1), то в этой системе согласно теореме 1 суще-
71
ствует г линейно независимых векторов, например аъ . . . , ап
через которые линейно выражаются векторы (1). В свою
очередь а также линейно выражается через аи . . . , ап так как
по условию а линейно выражается через аи . . . , ат, а
а19 . . . , ат линейно выражаются через аъ . . . , аг Таким
образом, в расширенной системе
«1 Лт% а (4)
существует г линейно независимых векторов аи . . . , ап через
которые линейно выражаются все векторы этой системы. Значит,
ранг системы (4) равен г, т. е. равен рангу первоначальной
системы (1).
2°. Пусть для определенности в системе (1) вектор ат
линейно выражается через остальные векторы. Удалим его.
Получится система векторов
av ' • ' > am-V (5)
Обозначим через г ранг системы (5). Тогда ранг системы (1)
должен также равняться г, так как (1) получается путем
присоединения к (5) вектора ат9 линейно выражающегося через
векторы системы (5).
Введем еще одно важное понятие. Назовем элементарными
преобразованиями системы /г-мерных векторов аи . . . , ат
следующие преобразования.
Г. Умножение какого-нибудь вектора а, рассматриваемой
системы на кисло с Ф 0.
2°. Прибавление к какому-нибудь вектору aL системы
другого вектора dj той же системы.
Элементарные преобразования будут в дальнейшем
использованы для вычисления paHia благодаря следующей теореме.
Теорема 3. Элементарные преобразования не меняют
ранга системы векторов.
Доказательство. Обозначим через г ранг системы
векторов
о , . . . , а,, . . . , ау, . . . , ат (6)
и добавим к этой системе вектор cah где с -/. 0. Тогда мы
получим систему
аи . . . , al% cah . . . , ау, . . /, ат, (7)
которая будет по теореме 2 того же ранга г, что и система (6),
так как caL линейно выражается через aL и тем самым
линейно выражается через все векторы системы (6). Но в свою
очередь а, можно линейно выразить через са^. at= — {са-^.
с
Следовательно, удаляя из системы (7) вектор ah мы придем
к системе векторов того же ранга г. Эта система получается
72
из первоначальной системы (6) путем умножения вектора аь
на число с. Таким образом, ранг системы (6) не меняется
при первом элементарном преобразовании.
Добавим к системе векторов (6) вектор д^ + Оу. Получим
систему
аъ . . . , ab ai + aJf . . . , ah . . . , ат (8)
того же ранга г, так как at + ау линейно выражается через at
и а, и тем самым линейно выражается через все векторы
системы (6). Удалим теперь из системы (8) вектор аь. Тогда
будем иметь систему векторов, получающуюся из
первоначальной системы (6) путем прибавления к вектору а{ вектора aJt
Эта система будет того же ранга г, так как аь линейно
выражается через ах + а; и ау, а именно, al=(ai + а/)—Яу.Мы видим,
что ранг системы векторов (6) не меняется и при втором
элементарном преобразовании.
Мы уделили довольно много внимания линейной зависимости
и рангу системы векторов. Однако у нас еще нет общего
способа, при помощи которого можно было бы найти ранг данной
системы векторов и обнаружить линейную зависимость. Этот
пробел будет восполнен в следующем параграфе.
§ 14. Матрица и ее ранг
Назовем прямоугольную таблицу из'т строк и п столбцов
I aU 012 • • • 01/, II
021 022 • • • а2п
II ат\ 0т2 • • • <*>тп II
матрицей, а числа aify из которых составлена матрица,—ее
элементами. Обычно матрицу обозначают двойными
вертикальными черточками или круглыми скобками, в которые она
заключается. Мы будем придерживаться первого обозначения.
В частности, квадратную матрицу из п строк и п столбцов мы
будем называть матрицей п-го порядка. С матрицами п-го
порядка мы встречались еще в теории определителей.
Отметим еще раз, что матрица есть только таблица и
смешивать ее с определителем нельзя.
Введем теперь следующие понятия.
Пусть М—некоторая матрица. Выделим в матрице
произвольно k строк и k столбцов. Определитель k-ro порядка,
составленный из элементов, находящихся на пересечении
выделенных строк и столбцов, называется определителем или,
минором k-го порядка матрицы М. При этом как строки, так
и столбцы этого определителя должны быть относительно друг
73
друга расположены в том же порядке, что и в матрице. Каждый
элемент матрицы мы рассматриваем как ее определитель
первого порядка.
Пример. Составить всевозможные определители третьего
порядка матрицы:
111 2 3 4|
1-2 4 5
||1 6 2 з||
и какой-нибудь определитель второго порядка той же матрицы.
Для получения определителя третьего порядка надо
выделить все три строки матрицы и какие-нибудь три ее столбца.
Так как число сочетаний из четырех столбцов по три равно 4,
то должно получиться всего четыре определителя третьего
порядка. Это будут:
1 2 3
1 -2 4
1 6 2
»
1 2 4
1 -2 5
1 6 3
'
1 3 4
1 4 5
1 2 3
•
2 3 4
-2 4 5
6 2 3
Затем выделим в той же матрице первую и третью строки
и» второй и третий столбцы. Мы получим следующий
определитель второго порядка рассматриваемой матрицы:
12 31
|6 2| '
Назовем теперь рангом матрицы М наивысший порядок ее
определителей, отличных от нуля. Подробнее выражаясь, целое
число г > О цазывается рангом матрицы М9 если среди
определителей r-го порядка, порождаемых матрицей, есть хотя бы
один, отличный от нуля, а все определители более высокого
порядка равны нулю.
Кроме того, условимся считать ранг матрицы равным нулю,
если все элементы матрицы равны нулю.
Пример. Найдем ранг матрицы предыдущего примера.
Нетрудно подсчитать, что все определители третьего порядка
этой матрицы равны нулю, а определитель второго порядка
I 2 31
|б 2\=-U
отличен от нуля. Так как данная матрица не имеет
определителей выше третьего порядка, то отсюда следует, что ранг
матрицы равен двум.
Очевидно, что строки матрицы М можно рассматривать как
/г-мерные, а ее столбцы как /я-мерные векторы. Возникает во-
74
прос, какая имеется связь между рангом матрицы и рангом
системы ее строк, а также рангом системы ее столбцов. Ответ
на этот вопрос позволяет дать следующая теорема.
Теорема 1. Если какой-нибудь определитель А r-го
порядка матрицы М отличен от нуля, а все определители
(г-\- 1)-го порядка, заключающие А в качестве минора, равны
нулю, то ранг системы строк, а также ранг системы
столбцов матрицы равен г.
Доказательство. Для определенности предположим,
что определитель А находится в левом верхнем углу
матрицы М:
М
ап . . . а1г
. . . А^О . . .
агЛ ... агг
а1г+1 • • • а1
а
гг+\
а_
ar+U • • • ar+lr ar+]r+\ • • • ar+ln
*т\
. а
стг+\
Если бы определитель А находился в другом месте матрицы,
то рассуждения были бы аналогичными.
При таком расположении определителя А первые г строк
матрицы М будут линейно независимыми. В самом деле, если
бы первые г строк были линейно зависимыми, то одна из них
линейно выражалась бы через остальные. Вычитая из этой строки
соответствующую линейную комбинацию остальных, мы все ее
элементы превратили бы в нули. Но тогда одна из строк
определителя А превратилась бы в нулевой вектор, а сам
определитель по свойству 7 § 6 не изменил бы своего значения. Таким
образом, получилось бы, что А = 0, что противоречит условию.
Покажем далее, что все строки матрицы М линейно
выражаются через ее первые г строк.
По меньшей мере один элемент первой строки
определителя А отличен от нуля, в противном случае определитель А
равнялся бы нулю. Пусть а1кфО, & < г. Вычтем из второй,
третьей, . . . , т-и строк матрицы М ее первую строку,
умноженную соответственно на —, —, . . . , — . Тогда все эле-
у axk ' alk> ' alk
менты k-vo столбца матрицы, кроме alk, обратятся в нули.
Очевидно, что при этих преобразованиях все условия теоремы
сохранятся в силу свойства 7 § 6 определителя: как А, так и все
определители (г+ 1)-го порядка матрицы, содержащие А в
качестве минора, не изменят своего значения. После таких
преобразований вторая строка определителя А изменится, однако
она будет содержать но меньшей мере один элемент,
отличный от нуля; в противном случае определитель А равнялся бы
75
нулю. Пусть это будет а21г. Очевидно, что 1ф k, так как все
элементы k-то столбца, кроме аш стали равными нулю.
Вычтем из третьей, . . . , т-й строки матрицы вторую ее строку,
умноженную соответственно на -4^-, . . . , -4^. Тогда все эле-
а21 а21
менты /го столбца матрицы, кроме первых двух, обратятся
в нули. Затем обращаемся к третьей строке и т. д., пока не
дойдем до r-й строки. В результате мы добьемся того, что
в каждой из строк матрицы, лежащих под определителем А,
будут равны нулю первые г элементов2. Оказывается, что
будут равны нулю и все элементы каждой такой строки. В
самом деле, пусть Ъц—элемент с индексами /> г, у > г
преобразованной матрицы. Возьмем определитель (г+1)-го порядка
этой матрицы, содержащий А в качестве минора и имеющий
в правом нижнем углу элемент b{j\
,ЪЛ
D =
О ... О Ьи
Разлагая D по элементам последней строки, получаем:
Но по условию D=0 и А^=0. Следовательно, &^=0, что и
требовалось показать.
Таким образом, после всех указанных преобразований
элементы (r-j- 1)"й» (г + 2)-й, . . , , т-й строк матрицы М стали
равными нулю. Это означает, что (г+ 1)-я, (г + 2)-я, . . . , т-я
строки линейно выражаются через первые г строк матрицы.
Итак, первые г строк матрицы М линейно независимы и все
ее строки линейно выражаются через первые г строк. Значит,
по теореме 1 § 13 ранг системы строк матрицы М равен г.
Наконец, заменим в матрице М строки столбцами, сохраняя
порядок их следования. Получим новую матрицу М\ носящую
название транспонированной матрицы. В транспонированной
матрице М' определитель А и определители (г+ 1)-го порядка,
содержащие А в качестве минора, сохраняют свое прежнее
значение согласно свойству 1 определителей Сем. § 6). Так как
строками транспонированной матрицы являются столбцы
первоначальной, то отсюда сразу вытекает справедливость теоремы
1 Мы пишем ач вместо а21, так как вторая строка изменилась.
2 Здесь предполагается, что г < т. В случае г = т все строки матрицы
линейно независимы и ранг системы строк равен г.
76
и для столбцов: ранг системы столбцов матрицы М также
равен г.
Теперь мы можем без труда ответить на заданный выше
вопрос.
Теорема 2. Ранг матрицы равен рангу системы ее Хтрок
(столбцов).
Доказательство. Пусть ранг матрицы М равен г.
Тогда существует по меньшей мере один определитель А г-го
порядка матрицы Му отличный от нуля, а все определители
матрицы более высокого порядка (если только такие имеются)
равны нулю. Отсюда, в частности, следует, что все
определители (г+1)-го порядка матрицы Му содержащие &Ф0 в
качестве минора, равны нулю. Следовательно, по теореме 1 ранг
системы строк (столбцов) равен г, т. е. равен рангу
матрицы М.
Из теоремы 2 вытекает такое следствие.
Следствие. Определитель п-го порядка тогда и только
тогда равен нулю, когда его строки (столбцы) линейно
зависимы.
В самом деле, если строки определителя линейно зависимы,
то ранг системы его строк меньше п. Отсюда по теореме 2
и ранг матрицы А /г-го порядка, из которой составлен
определитель, также меньше /г, в силу чего определитель равен
нулю. Обратно, если определитель равен нулю, то ранг
матрицы А меньше п и потому система ее строк линейно зависима.
§ 15. Вычисление ранга матриц
Существует целый ряд методов вычисления ранга матриц.
Мы ограничимся двумя способами, имеющими наибольшее
распространение.
Первый способ основан на теореме 1 предыдущего
параграфа, а именно: в данной матрице М ищем такой
определитель А г-го порядка, отличный от нуля, чтобы все
определители (г+1)-го порядка, заключающие А в качестве минора,
были равны нулю. Тогда ранг матрицы М будет равен г, так
как по теореме 1 § 14 ранг системы строк матрицы М должен
быть равен г, а по теореме 2 того же § 14 ранг системы строк
матрицы равен рангу матрицы.
Продемонстрируем этот способ вычисления ранга на
следующем примере.
Пример. Определить ранг матрицы
М =
3 2-1—3
2-130
4 5-5-6
77
Легко заметить, что не все миноры второго порядка матрицы
равны нулю, например
13 21
|2-ir0-
Этот определитель входит минором в следующие определители
третьего порядка матрицы М;
3
2
4
2 -1
-1 3
5 -5
, А=
3
2
4
2 -3
-1 0
5 -6
Вычисляя Dx и D2, убеждаемся, что эти определители равны
нулю. Следовательно, ранг данной матрицы М равен двум.
Второй способ вычисления ранга связан с элементарными
преобразованиями системы векторов.
Еще в § 13 мы убедились, что при элементарных
преобразованиях ранг системы векторов не изменяется. Отсюда сразу
вытекает, что ранг матрицы М не изменяется при
элементарных преобразованиях ее строк и столбцов. Кроме того, ранг
матрицы М не изменяется и при перестановке ее строк и
столбцов, так как ранг системы векторов не зависит от порядка
следования векторов.
Как же всем этим воспользоваться для вычисления ранга?
Возможны только три случая: 1) все элементы матрицы М равны
нулю; 2) в матрице М имеется по меньшей мере один
ненулевой элемент, причем в матрице не существует строк и
столбцов, содержащих несколько ненулевых элементов; 3) в матрице
М имеется по меньшей мере одна строка (или столбец)
содержащая несколько ненулевых элементов.
В первом случае ранг матрицы, очевидно, равен нулю. Во
втором случае, переставляя в матрице М соответствующим
образом строки и столбцы, мы получим матрицу N, у которой
все элементы, кроме Ьп, Ь22, . . . , brn будут равны нулю.
Очевидно, что ранг такой матрицы равен г. Следовательно, и ранг
первоначальной матрицы М также равен г. В третьем случае
при помощи элементарных преобразований можно добиться
того, чтобы получилась матрица вида, указанного в случае
пункта 2.
Пример. Вычислить ранг матрицы
«12 3 4 511
2 3 1 -1 -1
1 3' 8 13 16 '
1 0-7 -14 -17
78
Превращаем в нули элементы первого столбца матрицы Af,
для чего вычитаем первую строку из третьей и четвертой, а
из второй строки вычитаем удвоенную первую. Получаем:
12 3 4 5
О -1 -5 -9 -1.1
О 1 5 9 11
О -2 -10 -18 -22
Затем из второго, третьего, четвертого и пятого столбца
вычитаем первый, умноженный соответственно на 2, 3, 4 и 5.
Будем иметь матрицу
1
0
0
0
0
-1
1
-2
0
-5
5
-10
0
-9
9
-18
0
-11
11
-22
Далее, прибавляем к третьей строке вторую, а из четвертой
строки вычитаем удвоенную вторую. Получаем:
10 0 0 01
10 -1 -5 -9 —И
0 0 0 0 01
0 0 0 0 0
(1)
Наконец, вычитаем из третьего, четвертого и пятого столбца
второй, умноженный соответственно на 5, 9 и 11. Это даст нам
матрицу
1 0 0 0 0
М=
0-1000
0 0 0 0 0
0 0 0 0 0
имеющую в каждой строке и в каждом столбце не более
одного элемента, отличного от нуля. Так как матрица N имеет
только два ненулевых элемента, то ранг матрицы TV и тем
самым ранг первоначальной матрицы М равен 2.
Впрочем, можно было бы остановиться и на матрице (1).
Сразу видно, что все определители 3-го порядка этой матрицы
равны нулю, а определитель второго порядка
1 0 I
o-ih-1^0-
Следовательно, ранг матрицы (1) равен 2, и тому же числу 2
равен ранг первоначальной матрицы М.
79
Покажем теперь, как находить линейную зависимость
системы /г-мерных векторов
(2)
аи а2
ап
Прежде всего следует составить матрицу Л, строками (или
столбцами) которой являются векторы системы (2). Пусть г—
ранг матрицы Л и А—определитель r-го порядка матрицы,
отличный от нуля. Тогда г строк матрицы Л, на которых лежат
элементы А, будут линейно независимыми, а остальные строки
будут через них линейно выражаться. В следующем примере
мы продемонстрируем способ, при помощи которого можно
находить эти линейные выражения строк.
Пример. Найти линейную зависимость между векторами
а1 = (1, 4, 1, 1), а2=(2, 3, -1, 1), а8 = (1, 9, 4, 2),
а4 = (1,-6, -5, -1).
Составляем матрицу, строками которой являются данные
векторы:
л=
1 4
1 1
2 3-11
19 4 2
1 -6 -5 -1
Определитель второго порядка
Д =
1 Х 4
= | 2 3
= -5
матрицы Л отличен от нуля. Легко убедиться, что все
определители третьего порядка матрицы Л, содержащие А в
качестве минора, равны нулю. Следовательно, ранг матрицы Л
равен 2, и тому же числу 2 равен ранг данной системы
векторов. Так как элементы определителя А расположены в первых
двух строках матрицы Л, то векторы ах и а2 линейно
независимы, а векторы а3 и a,v через них линейно выражаются.
Впрочем, здесь будет также линейно независимой и любая пара
векторов, так как не равны нулю, например, и такие
определители второго порядка матрицы Л:
1 4
1 9
У
1 4
1 -6
»
2 3
1 9
»
2 3
1 -6
У
1 9
1 -6
Найдем, как выражаются векторы а3 и а4 через ai и а2.
Для этой цели пишем равенство:
a3=k1>a1-\- &2*#2
80
или, подробнее,
(1, 9, 4, 2) = kx (1, 4, 1, 1) + k2(2, 3, -1, 1).
Производя в правой части равенства умножение секторов на
числа и сложение векторов:
(1, 9, 4, 2) = (k1 + 2k2i 4^+3^, kx-k%9 k1+k2)t
получаем для kx и k2 такую систему уравнений:
к>1 ~\- Zk2 = 1,
4^ + 3^=9,
Ограничимся первыми двумя уравнениями. Определителем
из коэффициентов этих двух уравнений будет
транспонированный определитель А. Поскольку А ф О, система двух
уравнений с двумя неизвестными
«! -(- 2*К2 = 1,
4^ + 3^=9
должна иметь решение и притом единственное. Без труда
находим, что &i = 3, &2= —1. Следовательно,
а3=3аг—а2.
Подобным же образом можно установить, что
a4t=2a2—Sa1.
Задачи. 1. Найти ранги матриц
а)
б)
I 1 0
6 7
26 21
15 14
1 8 5
4 6
3 0
15 11
| 17 10
—1
8
26
13
3
7
— 1
9
2
5
0
-10
— 15
7
9
2
13
—5
12
—9
-51
—54
1 2
11 12
7 1
19 15
6 3
2. Найти линейные зависимости, имеющие место в системе векторов:
ах = (\, 5, 1, 1, 1), а2 = (1, 5, 2, 2, 3), а3 = (\, 5, —1, -1, —3),
а4 = (1, 5, 5, 5, 5).
3. Показать, что вектор Ь единственным образом выражается через
линейно независимую систему векторов alt . . . , ат.
4. Может ли система п + 1 /г-мерных векторов быть линейно
независимой?
8v
§ 16. Система линейных уравнений
Теперь все подготовлено для более глубокого изучения
систем линейных уравнений с несколькими неизвестными.
Рассмотрим общий случай системы т линейных уравнений
с п неизвестными:
aUXl + #12-*2 + • • • + Q>lnXn = bl> )
#21-*а \ #22*^2 I • • • ~Г &2nXn== "2* \ /14
amiXi + <*m2Xi+ ... + amnxn = bm, J
где число уравнений т может даже и не равняться числу
неизвестных п. .
Как и в частном случае п уравнений с п неизвестными,
назовем решением системы (1) совокупность таких значений
неизьестных:
х1 = а1, х2 = а2, . . . , хп = ап, (2)
которые удовлетворяют всем уравнениям (1). Очевидно, что
решение (2) можно рассматривать как /г-мерный вектор
0*i, • • • , а„).
Если система (1) имеет по меньшей мере одно решение, то
она называется совместной, а если не имеет решений, то
несовместной. Совместная система линейных уравнений
называется определенной, если она имеет только одно решение, и
неопределенной, если она имеет бесконечное множество
решений.
Далее, две системы линейных уравнений с одними и теми
же неизвестными называются, как и в случае п уравнений с п
неизвестными, равносильными, если каждое решение одной
системы является решением и другой или если обе они
несовместны г.
Составим матрицу
ап а12 . . . а1п
л _ a2i аж • • • ain
II ат\ ат2 • • • атп
из коэффициентов системы (1) и матрицу
II аи ai2 ... а1п Ьх
/?_ #21 #22 • • • а2п "2
II Я/iil ат2 - • • атп Ът II
1 Число уравнений в этих двух системах может быть различным.
82
получающуюся путем присоединения к А столбца из
свободных членов, т. е. столбца из величин blf b2, . . . , bm.
Первая матрица А называется матрицей системы (1), а
вторая матрица В—расширенной или присоединенной
матрицей системы (1).
Мы подошли к теореме, играющей весьма важную роль в
теории линейных уравнений.
Основная теорема теории линейных уравнений. Система
линейных уравнений (1) совместна тогда и только тогда,
когда ранг матрицы А равен рангу расширенной матрицы В
системы, причем в случае совместности система (1)
является определенной, когда ранг матрицы А (или, кто то
же, ранг В) равен числу п неизвестных, и неопределенной,
когда этот ранг меньше п.
Доказательство. Г. Если система (1) совместна, то
она имеет решение, т. е. можно для неизвестных указать
такие значения х1 = <хи х> = а2, . . . , хп = аПУ что
^11*1 + ^12*2+ ... +am*n = bi> ]
я 2i ai + Я22 ос2 + ... + a2nan = b2f .
"m^l + ««2*2 + • • • + атп*п = Ьт. J
Равенства (3) свидетельствуют о том, что в расширенной
матрице В столбец из свободных членов линейно выражается
через предыдущие столбцы, а именно, если первый,
второй, . . . , лг-й столбцы матрицы В умножить соответственно на
аь а2, . . . , ая и сложить, то получится столбец из свободных
членов. Таким образом, по теореме 2 § 13 можно, не изменяя
ранга В, отбросить столбец из свободных членов. Но тогда
получится матрица А. Мы видим отсюда, что в случае
совместности системы (1) ранг матрицы А равен рангу матрицы В.
2°. Обратно, пусть матрицы А и В имеют одинаковый
ранг г.
Так как ранг матрицы А равен г, то в матрице А должен
существовать по меньшей мере один определитель А r-го порядка,
отличный от нуля. Этот определитель А будет, очевидно,
определителем и расширенной матрицы В. Без ограничения
общности доказательства можно допустить, что А находится в
левом верхнем углу матриц А и В\ в противном случае мы
изменили бы надлежащим образом нумерацию уравнений л
неизвестных. Тогда первые г строк матрицы А будут линейно
независимы, а остальные (если такие имеются) будут через
них линейно выражаться. То же самое будет наблюдаться и в
матрице В. Таким образом,' умножая первые г уравнений
системы на соответствующие числа и почленно складывая, мы
получим любое из остальных уравнений (если такие имеются).
83
Поэтому, ограничиваясь первыми г уравнениями, получим си
стему:
апхх + а12х2 + . . . + alnxn = blt
^rlXl + Я,2-*2 +
+ arnxn = br
(4)
равносильную первоначальной, так как всякое решение
первых г уравнений будет, в силу сказанного, удовлетворять и
остальным уравнениям.
При этом возможны два случая: г=п, или г<л.
Если г=п, то число уравнений в системе (4) будет равно
числу п неизвестных, причем определитель этой системы
будет кфО. Мы хорошо знаем, что такая система имеет
единственное решение, получаемое по правилу Крамера.
Если г < п, то число уравнений в системе (4) будет меньше
числа неизвестных. Перенесем неизвестные xr,v . . . , хп,
которые принято называть свободными, в правые части; тогда
система уравнений (4) перейдет в равносильную систему:
Я21*1 +
-ain*n>
+ а2гХГ
'^2 a2r+lXr+l~
~a2nXn>
anx{
-f- . . 4- a x =b —a
>r_l_i*r_l_r
rn n
Мы видим, что эту систему можно решить относительно
хъ х2, . . . , хп так как определитель r-го порядка из
коэффициентов при неизвестных хъ . . . , хг есть как раз А Ф 0.
Придавая свободным неизвестным произвольные числовые
значения, получим по правилу Крамера соответствующие числовые
значения для xv х2, . . . , хг% Таким образом, при г < п
получается бесконечное множество решений.
Итак, разбирая случаи г=п и г<я, мы не только
убедились, что система (1) совместна, но и указали практический
способ ее решения. При этом было установлено, что в случае
совместности система (1) при г=п является определенной, а
при г < п—неопределенной.
Примеры. 1. Рассмотрим систему уравнений:
Х1 -f- Х2 -f-. хз \ *4 = ^9
ZX\ -р Х2 ~J~ ХВ XA==^t
Нетрудно убедиться, что ранг матрицы системы
II 1 1 1 1
А= 2 1 1 -1
II 0 1 1 3 ||
84
равен двум, а ранг расширенной матрицы
„111 12
В-
2 1 1
О 1 1
-1 О
3 О
равен трем. Следовательно, данная система линейных
уравнений несовместна.
2. Рассмотрим теперь другую систему:
Х1 + Х2 Н~ Х3 = I,
xi + -*2—-^з~ О,
^i ~f~ ^2 ~Т~ оХ3== Л,
Ранг г матрицы Л системы равен трем и тому же числу
равен ранг расширенной матрицы В. Следовательно, система
уравнений совместна и имеет единственное решение, так как
ранг г равен числу неизвестных.
Определитель третьего порядка матрицы А:
1 1
1 -1
-1 -1
не равен нулю. Так как он находится в левом верхнем углу
матриц А и 5, то можно ограничиться первыми тремя
уравнениями, а последнее можно отбросить. Решая систему трех
уравнений с тремя неизвестными
хг-\- х2-{- х3 = \,
хг -\- х2 х3=О,
Х-± X 2 Хп — U
по правилу Крамера или способом, употребляемым в
элементарной алгебре, получаем:
_ 1
Х1 — ~5~ у X2Z
= 0, -*з=у
3. Рассмотрим систему
Х\ Х% -р Х3 X4=Z *• >
Х-± Х% ~\~ ^Xft ~y~ oX^==\Jy
Х-^"г— Х'£~~~~ Хъ —~ \)Х± == о.
Она совместна, так как матрицы А и В имеют одинаковый
ранг г=2. Но здесь ранг меньше числа неизвестных. Поэтому
85
данная система имеет бесконечное множество решений.
Определитель второго порядка
Д =
-1 1
-1 2
отличен от нуля, и его элементы находятся на первых двух
строках и на втором и третьем столбцах матрицы А (и В).
Следовательно, можно ограничиться первыми двумя
уравнениями, а в качестве свободных неизвестных взять хх и хА.
Переносим свободные неизвестные в правые части первых двух
уравнений:
*^2 "Г «^3 == * ^l ~Т~ ^Ь
Решая относительно х2 и х3, получаем:
х2 = — 2 + *i + 5*4, *3 = — 1—4х4.
(5)
Этим можно ограничиться, так как, давая свободным
неизвестным хг и хА произвольные значения, будем иметь
всевозможные решения системы.
Попутно заметим, что совокупность формул, выражающих г
неизвестных через /г—г свободных неизвестных, часто
называется общим решением неопределенной системы линейных
уравнений. Таким образом, формулы (5) представляют собой
общее решение системы уравнений примера 3.
4. Исследуем, наконец, буквенную систему трех линейных
уравнений с тремя неизвестными:
ахх + Ьху + схг=йъ а2х + b2y + c2z=d2i
(6)
в которой по меньшей мере один из коэффициентов отличен
от нуля.
Если ранг матрицы А системы равен трем, то система
совместна и является определенной, так как в этом случае
определитель системы
I ai Ьх сх
D= a2 Ь2 с2
I #3 ^3 ^3
отличен от нуля. Единственное решение системы можно найти
по правилу Крамера:
D
D
Z =
D
86
Если ранг матрицы А равен двум, то представляются два
случая: 1) ранг расширенной матрицы В равен трем, т. е. по
меньшей мере один из определителей Dl9 D2, DB отличен от
нуля, в то время как D=0; 2) ранг матрицы В также равен двум.
В случае 1) система несовместна, а в случае 2) она
совместна, но неопределенная, причем общее решение содержит
только одно свободное неизвестное.
Если ранг матрицы А равен единице, то опять
представляются два случая: а)ранг расширенной матрицы В равен двум;
б) ранг В также равен единице.
Очевидно, что в случае а) система несовместна, а в случае
б) система совместна, но неопределенная, причем общее
решение содержит уже два свободных неизвестных.
Все это имеет следующее геометрическое истолкование.
Уравнения системы (6) можно рассматривать как уравнения
трех плоскостей. Если определитель системы D Ф 0, то три
плоскости пересекаются в одной точке. Если ранг матрицы А
равен двум, а ранг матрицы В—трем, то две плоскости имеют
своим пересечением прямую, а третья плоскость параллельна
этой прямой. Если ранги матриц А и В равны двум, то две
плоскости пересекаются по прямой, а третья плоскость
проходит через эту прямую. Если ранг матрицы А равен единице,
а ранг матрицы В равен двум, то две плоскости параллельны,
а третья плоскость параллельна или сливается с одной из них.
Наконец, если ранги матриц А и В равны единице, то все три
плоскости сливаются в одну.
При решении систем линейных уравнений с числовыми
коэффициентами и с большим числом неизвестных
использование определителей не всегда целесообразно. Мы здесь
изложим в общих чертах один из способов, применяемых на
практике. Речь идет о так называемом способе элементарных
преобразований.
Пусть дана некоторая система т линейных уравнений с п
неизвестными:
апхх + а12х2+ . . . + alnxn = bu \
#21-*-1 + #22*^2 ~Ь • • • Н" a2nXn = Ub I /j\
amlXl + ат2Х2~\~ • . . -г атпхп — Ьт- '
Будем подвергать эту систему элементарным преобразованиям,
т. е. будем умножать то или иное уравнение системы на
число, отличное от нуля, прибавлять почленно к одному
уравнению другое уравнение системы. Легко убедиться, что
перестановка двух уравнений равносильна некоторой комбинации
элементарных преобразований (см. в § 6 доказательство
свойства 8 определителя). Очевидно, что каждому элементарному
преобразованию системы (7) будет соответствовать такое же
67
точно элементарное преобразование строк расширенной
матрицы В системы. Предоставляем читателю убедиться, что при
элементарных преобразованиях система линейных уравнений
переходит в равносильную систему и что при помощи
элементарных преобразований строк в случае совместности можно
добиться того, чтобы все элементы матрицы В, находящиеся
ниже прямой аи а22
(к—наименьшее из чисел т и /г),
стали равными нулю. Когда матрица В примет этот вид,
называемый обычно треугольным, решение системы (7) найдется
без труда, а если система несовместна, то легко
обнаружится ее несовместность.
Пример. Решить систему:
*1 +*2 + 2*3 + ^4 = 0,
х1 -\- х
г -#3 ~г *^4 — ^«
Составляем расширенную матрицу:
В=
11 ill
11 2 10
11-113
Вычитаем в матрице В первую строку из последних двух.
Получаем:
11 11 1
0 0 10-1
0 0-20 2
Затем прибавляем к третьей строке вторую, умноженную на 2.
Получаем:
1111 II
0 0 10-1
0 0 0 0 О1
Процесс закончен, так как получилась матрица треугольного
вида. Третья строка матрицы С является нулевой. Это
означает, что третье уравнение данной системы есть следствие
первых двух. Так как остальные две строки матрицы С ненулевые,
то в силу треугольного вида ранг С и тем самым ранг В
равны двум. При удалении из матрицы С последнего столбца
ранг по-прежнему равен 2, так как первые две строки остаются
ненулевыми, а третья—нулевой, и треугольный вид матрицы
сохраняется. Таким образом, данная система совместная и
неопределенная, причем число свободных неизвестных равно
двум: ранг г=2, число неизвестных /г=4 и число свободных
неизвестных /г—г=4—2 = 2.
8S
Второй строке матрицы С соответствует уравнение х3 = — 1,
т. е. неизвестное хв должно иметь значение —1. Первой строке
матрицы С соответствует уравнение
xi + х2 + **з + ха — 1 •
Подставляя значение хв = — 1, получаем:
Xi -\- ЛГ2 -\- Х^ = 2.
Решаем это уравнение относительно какого-нибудь
неизвестного, например xv Получаем: х1 = 2—х2—х±. Таким образом,
хj=== jL х2 х^у jcb== I
есть общее решение данной системы.
Задача. Исследовать и решить системы:
а) х —у + 3г + 2и =\, б) 2Xl — х2 + *4 = — 1,
х — у -\- 6z + 5ы = 0, *! + 3*2 + *з + 4*4 = 3,
л: — у — 9г — 10и = 5, jtj — 32*2 — 9*3 — 31лг4 = — 32.
х — у -\-2z — и =
3
в)* —.у + г = 1,
лг+j/ —г = 1,
л: — .у — z = — 1,
*+у + Z = 0.
§ 17. Система линейных однородных уравнений
Рассмотрим особо случай системы линейных однородных
уравнений:
апхг + а12х2 + . . . + а1пхп = 0,
#21^1 "Г #22*^2 ~Г •• • • ~Г &2nXn=V,
amiX1 + am2x2+ . . . + аянх„ = 0.)
О)
С первого взгляда видно, что решением системы (1)
является хх=0, л:2=0, . . . , хп = 0> т. е. нулевой /z-мерный
вектор (0, 0, ... , 0). Таким образом, система линейных
однородных уравнений всегда совместна.
Но помимо решения ^ = 0, х2=0, . . . , хп = 0, называемого
нулевым или тривиальным, система (1) может иметь другие
решения, в которых по меньшей мере одно неизвестное имеет
значение, отличное от нуля (так называемые ненулевые или
нетривиальные решения), а именно, имеет место следующее
утверждение:
89
Если ранг матрацы А системы линейных однородных
уравнений (1) равен числу неизвестных (г=п), то система
(1) имеет только нулевое решение. Если ранг матрицы А
меньше числа неизвестных (г < /г), то, помимо нулевого,
система (1) имеет бесконечное множество других
(ненулевых) решений.
В самом деле, если г=/г, то система (1) имеет
единственное, а именно, нулевое решение *i = 0, . . . , •*„ = (). Если же
г < л, то п—г неизвестных будут свободными и система будет
иметь, помимо нулевого, бесконечное множество других
решений.
В частности, когда число уравнений системы (1) равно
числу неизвестных, для существования ненулевых решений
необходимо и достаточно, чтобы определитель системы (1) был
равен нулю, так как в этом случае ранг системы (1) тогда и
только тогда меньше числа неизвестных /г, когда
определитель системы равен нулю.
Пусть
апх1 + а12х2 + . . . +alnxn = blt )
#21^1 Л" а22-%2 + • • • ~Г а2п^п ~ ®Ъ>
amlx1 + amix2 + ....+ amnxn = b„
(2)
—система линейных уравнений, в которой по меньшей мере
один свободный член Ь. не равен нулю. Мы назовем такую
систему неоднородной. Составим систему линейных
однородных уравнений, заменяя в системе (2) свободные члены
Ъъ Ь2, . . . , Ьт нулями:
апхг + а12х2 + . . . + Я1Л = 0,
#21«*1 ~~Г #22*^2 ~~Г • • • ~Г Л2л*^/1=^»
ат1х1 + ат2х2 + ... +атпхп=0.}
(3)
Система (3) называется приведенной для первоначальной
системы (2). Оказывается, что между решениями основной и
приведенной системы существует следующая связь, если
рассматривать решения как /г-мерные векторы.
Теорема 1. Если складывать какое-нибудь решение сие-
темы неоднородных уравнений (2) с любыми решениями
приведенной системы (3), то получатся все решения системы (2).
Доказательство. Пусть (plf ..., рл) — решение
системы (2) и (аь . . . , ал) — произвольное решение приведенной
системы (3). Тогда
(Ть • . •, T/i) = (ai> • • • , aJ + (Pi. •--.?«)
90
будет решением системы (2). В самом деле,
ап(*1 + М+ ... +а/я(ая + Ря) =
= (an*i + • • • -f ainan)'+ {a^x + . . . + ajn) = 0 + bt = bi.
Обратно, пусть (ft, . . . , тЛ)~~произвольное решение
системы (2). Тогда
(Ть • • • , Тя)-(Рь • • • > У
будет решением приведенной системы (3):
MTi-Pi)+ • • • + Я/я(Тя-Рл) =
= (^/iTi + • • • + Л/яТл)—(«/iPi + • • • + aM = bt- *i = 0.
Таким образом,
(Ть • • •, Тл)—(Рь • • • > Рл) = (аь • • • , *„),
где (аь .. . , ал)—некоторое решение приведенной системы (3)
и
(Тп • • > Тл) = (а1, • • • , *п) + (Рь • • • » Рл), Ч. Т. Д.
Легко убедиться, что если
в = (ai ал). * = (Pi Рл). . . . , т= (fxlf . . ., ^л)
— какая-нибудь совокупность решений системы линейных однородных
уравнений (1), то решением будет также и их линейная комбинация
Ка + fob + . .. + kPm.
Возникает следующий вопрос: пусть система линейных однородных
уравнений (1) имеет ненулевые решения; можно ли в этом случае получить все
решения системы (1) при помощи линейных комбинаций одного или
нескольких решений. Чтобы дать ответ, введем такое определение.
Определение. Система решений
<*i = («л, а/2, .... ciin) (*' = 1, 2 k)
уравнений (1) называется фундаментальной, если она линейно независима
и любое решение уразнений (1) является ее линейной комбинацией.
Теперь -можно ответить на заданный вопрос.
Теорема 2 (о существовании фундаментальной системы решений). Если
ранг г матрицы А из коэффициентов уравнений (1) меньше числа п
неизвестных, то уравнения (1) обладают фундаментальной системой
решений.
Доказательство. Без ограничения общности можно предположить,
что отличный от нуля определитель А г-го порядка находится в левом
верхнем углу матрицы А. Тогда хг^_х хп будут свободными неизвестными.
Перенося в первых г уравнениях свободные неизвестные в правые части и
решая эти уравнения относительно xlt . . . , хп мы каждое из неизвестных
хх хг выразим через свободные неизвестные:
x/ = c.lxr^_l+c.zxr+2+. .. + c.kxn(j=\, 2, .... г; k = n-r). (4)
91
Придавая свободным неизвестным хг_^х х произвольные числовые
значения, получим соответствующие значения для хх хг. Так действуя,
мы будем иметь бесконечное множество решений. Из этих решений возьмем
такие к решений (k = п — г)
= (air
V а1г+1>
In
).
ak = (akl V а*г+1 akn)>
чтобы определитель &-го порядка
£> =
zlr+l
Л1л
%kr+l • • • akn |
был отличен от нуля. Например, можно положить
«/г+у = 0 при * * / И а.г+. = 1.
Тогда
D =
10. . .0
0 1. . .0
о о
1
1*0.
Покажем, что эти решения образуют фундаментальную систему.
Рассмотрим матрицу
М =
11 •
221"
2г
fcl *
Pi-
кг
л1г+1
а2г+1
А1л
а2л
D
К
akn
Jn
первые k строк которой являются решениями (5), а последняя
строка—произвольным решением системы однородных уравнений (1).
Определитель D находится в правом верхнем углу матрицы М и
является ее определителем k-то порядка. Так как D не равно нулю, то
последние k столбцов матрицы М линейно независимы. В силу формул (4), каждый
из г первых столбцов матрицы М линейно выражается через ее последние
k столбцов. Из всего этого следует, что ранг матрицы М равен k.
Благодаря тому, что элементы определителя D Ф 0 находятся в первых k
строках матрицы М, будут также линейно независимыми и первые к строк
матрицы М, а так как ранг матрицы М равен к, то ее последняя строка
должна линейно выражаться через первые k строк; иными словами,
решения (5) образуют фундаментальную систему решений.
Пример. Найдем фундаментальную систему решений однородных
уравнений:
*1 — *2 + Х3 — Х^ = 0,
*, - х2 + 2*з + 3*4 - 0,
х1 — х2 — Н — 9*4 = 0-
92
Ранг матрицы А из коэффициентов равен здесь двум, причем
1 — 1 II
-1 2
: - 1 ф 0.
Таким образом, третье уравнение можно отбросить и считать свободными
неизвестными *х и *4- Переносим х1 и *4 в правые части и первые два
уравнения
— Х2 + *з = — Х1 ~Ь *4»
■ *2 + 2*3 :
' Х1 — 3*4
решаем сперва при хх = 1, *4 = 0, а затем при *х =0, *4 = 1. Получим два
решения: '
(1, 1, 0, 0) и (0, —5, -4, 1),
которые образуют фундаментальную систему, так как определитель
1 0|
0 1
составленный из значений хх = 1, *4 = 0 и хг = 0, *4 = 1 свободных
неизвестных, отличен от нуля.
Обращаем внимание на то, что если ранг матрицы А системы линейных
однородных уравнений равен числу п неизвестных, то фундаментальной
системы решений не существует, так как в этом случае получается только
нулевое решение, которое не может быть линейно независимым.
Доказательство теоремы 2 было основано на одном способе нахождения
фундаментальной системы решений. Однако нетрудно убедиться, что
независимо от способа получения число решений фундаментальной системы
всегда одно и то же.
В самом деле, пусть
<*i ak (6)
Ьг »| <7)
две произвольные фундаментальные системы решений уравнений (1).
Каждый вектор системы (7) линейно выражается через векторы
системы (6). Следовательно, согласно основной теореме о линейной
зависимости (см. § 12), k < /. Точно так же / < k, так как векторы (6) линейно
выражаются через векторы системы (7). А теперь из условий k < / и / < k
сразу получается, что к = /, а это и требовалось показать.
Задачи. 1. Решить следующие системы однородных уравнений:
а) 2*! — 3*2 + 5*з + Зл:4 = 0,
4*! — *2 + *3 + *4 = 0,
3*! — 2л:2 -+ 3*з + 4*4 = 0.
б) 11*! + 8*2 — 2*з + 3*4 = 0,
2*! + 3*2 — *з + 2*4 = 0,
4*! — 11*2 + 5*3— 12*4 = 0,
7*х — *а + *3 -" 3*4 = 0.
93
2. Найти фундаментальную систему решений следующих уравнений:
а) х — у + 2г = О,
3* — 5у— 2 = 0,
3* — Ту — 8z = 0.
б) хх + х2 + 2*3 + 2*4 + 7х5 = О,
2*х -f- 3*2 +- 4лг3 + 5л:4 = О,
3*х + 5л:2'+ 6*з + 8*4 = 0.
3. Почему понятие фундаментальной системы решений нельзя
распространить на случай неоднородной системы линейных уравнений?
4. Найти необходимое и достаточное условие пересечения четырех
прямых плоскости
Л>*+Sx_y-f Сх=0,
А2х + В2у + С2 = 0,
А*х + В3у + Сз=0,
Л4* + Я4у +С4 = 0
в одной точке.
Глава третья
ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И МАТРИЦЫ.
КОЛЬЦО И ПОЛЕ
§ 18. Линейные преобразования и матрицы
В алгебре, а также в целом ряде других дисциплин,
например в аналитической геометрии, в математическом анализе,
теории вероятностей, механике и т. п., часто приходится
вводить вместо старой системы переменных хи . . . , хп новую
систему переменных уи . . . , уп, линейно выражающуюся
через старую систему. Переход от переменных хъ . . . , хп к
переменным уъ . . . , уп, при котором новые переменные вводятся
как линейные выражения старых:
yi = anxl + a12x2 + .. . +а1яхп,
У2 = а21хх + а22х2 + . . . +а2пхп,
(S)
мы будем называть линейным преобразованием (или линейной
подстановкой) переменных х1У . . . , хп в уи . . ., уп.
Пример. При повороте прямоугольной системы координат
XOY на угол <р координаты х, у произвольной точки
плоскости изменяются по закону
A:, = A:coscp 4- У sin cp, у'= — xsincp -f- у cos ср.
Таким образом, здесь получается линейное преобразование
координат х, у в новые координаты х', у'.
Линейное преобразование,S вполне характеризуется
матрицей п-го порядка
*п
. а
In
<-п\
. а„
№
из коэффициентов преобразования: два линейных
преобразования с одинаковой матрицей А отличаются друг от друга лишь
обозначением переменных, что несущественно. Обратно,
исходя из заданной матрицы Л, мы можем составить вполне
определенное линейное преобразование. Поэтому вместо
линейного преобразования можно говорить о матрице и то или
иное свойство линейных преобразований можно будет
соответствующим образом переносить на матрицы.
Заметим еще, что определитель
А^
а
In
ьп\
принято называть определителем преобразования S
{матрицы А). Может случиться, что определитель Ал будет равен
нулю. В этом случае линейное преобразование S называется
вырожденным или особенным, а если определитель Ал отличен
от нуля, то—невырожденным или неособенным. Такая же точно
терминология употребляется и для матрицы линейного
преобразования.
- Между подстановками п чисел (см. § 5) и линейными
преобразованиями (матрицами) имеется довольно глубокая
аналогия. Если подстановка каждое число заменяет другим числом,
то линейное преобразование 5 переменные xlt . . . , хп
заменяет новыми переменными уъ . . . , уп. Но сходство простирается
еще дальше: можно определить умножение преобразований и
матриц по тому же принципу, что и умножение подстановок.
А именно, возьмем еще одно линейное преобразование Т
z матрицей
\Ьп . . . bln
5 =
ЬП1
.ъп
и посмотрим, что произойдет, если сначала применить к
переменным хи х2у . . . , хп преобразование S и затем Т.
Преобразование Т переменные у1у . .. , уп переводит в гъ . . . , zn:
^1 = &п^ + ^2+ ... +Ь1яуп,
*2 = КУх + Ь22У2 + • • • + Ь2пУп< | ,т
*п = ЬшУ1 + Ьп2У2+ ••• +ЬппУп-
96
Легко видеть, что при совместном действии преобразований
S и Т переменные хг, . . . , хп переходят в 2Ь . . ., гп\ с
другой стороны, подставляя выражения у1 из (S) в равенства (Т)
получим:
*/= [Ь 11*11 + Ь12а2Х + • • . + binanl) *l + )
+ [Ь 11*12 + *й*22 + • • • + &;A2) *2 + . . . +
+ (*л«1Я + bi2a2n + ... + binann) хп,
(/=1, 2, ..., /г). ]
Мы пришли к преобразованию U, которое производит то
же действие, что и последовательное применение
преобразований S и Т. Это линейное преобразование U мы и назовем
произведением Т и 5, а матрицу С, характеризующую
U,—произведением матриц В и Л. Произведение линейных
преобразований и матриц /г-ro порядка мы будем обозначать тем же
символом, что и обычное произведение. Таким образом:
U=TS, С^ВА.
Заметим, что здесь преобразование, выполняемое первым,
записывается первым справа; в том же порядке записываются
сомножители матричного произведения.
Посмотрим, по какому закону составлена
матрица-произведение С. Легко заметить, что элемент cik матрицы С,
лежащий на пересечении /-й строки и £-го столбца, выражается
через элементы матриц В и А следующим образом:
Cik = bnaik + bi2a2k+ ••' +
ИЛЬИНЫМИ словами, матрицы В и А перемножаются по тому же
правилу, что и определители: элементе^ равен сумме
произведений элементов /-й строки матрицы В на соответствующие
элементы £-го столбца матрицы А 1.
Отсюда, между прочим, следует, что определитель
произведения двух и нескольких матриц /г-го порядка равен про-
изведению определителей матриц-сомножителей.
1 Теперь становится понятным, почему мы условились писать TS (В А)
вместо ST {AB). Сделано это для согласования с основным правилом
умножения определителей дг-го порядка.
97
Пример.
1.5 + 2-1 + 3-(-l)
2 5 + 0-1 + Ь(-1)
3-5+(-l).l+ Ь(-1)
11 2 3 1
2 0 1
1 3 —1 1
.
5
1
—1
1-0+ 1.2 + 3-0
2-0 + 0-2+ 1-0
3-0 + (-l)-2+l.
4 4 19
9 0 16
13 —2 20
1-7 + 2-3 + 3-2
2-7 + 0-3+ 1-2
3-7 + (-l)-3+l.
Вычислим определители матриц/?, Л и получившейся матрицы С
*в =
2 3
О 1
-1 1
дс =
=-з, дд
4 4 19
9 0 16
13 -2 20
=
5 0 7
1 2 3
-10 2
-102,
= 34,
и легко видеть, что —3-34= —102.
Мы умножали матрицу В на А, в результате чего
получилась матрица С=ВА. Но если умножить А на В, то, как легко
убедиться на конкретных примерах, получается, вообще говоря,
другое произведение. Например,
но
АВ--
ВА =
10-11
1 2 3 1
1 5 1 II
| 0 7 ||'
|| 5 1 I
" || 0 7 |
II ° —1
II 2 3
1
0
ю
1 2
|14
-7 ||
23 1
-2 ||
21 1
Таким образом, порядок множителей при умножении
матриц (и тем самым линейных преобразований) существенен—
умножение матриц /z-го порядка (и линейных преобразований)
некоммутативно, т. е., вообще говоря, АВфВА.
Затем можно доказать совершенно так же, как это было
доказано для подстановок, что умножение линейных
преобразований (и матриц /г-го порядка) подчиняется ассоциативному
(сочетательному) закону: SB(S2S1) = (S3S2)Sl для произвольных
линейных преобразований 5„ S2, 53.
В самом деле, пусть преобразование Sx переводит
переменные хи . . ь , хп в у„ .. ., уп, преобразование S2
переменные у„ . . . , уп переводит в zi9 . . . , zn и, наконец,
преобразование 53 переводит zu .. . , zn в ui9 . . ., ип. Посмотрим,
как ведет себя S^iS^). Произведение S2S1 переводит хи
... , хп в zl9 . . . , zn, после чего 53 переводит zu . . ., zn в
ии . . . , ип. Следовательно, 53(525,) переменные xit .. . , хп
переводит в ии . .. , ип. Но точно также ведет себя и (5352)5j.
Действительно, 5Х переводит хи . . . , хп в у,, . . . , уп, после
чего 5352 преобразует у,, . . . , уп в ии . . . , ип. Итак, 53(525!) =
=z(S3S2)Sl и тем самым С(ВА) = (СВ)А, где Л, 5, С—матрицы
преобразований Slf 52, 53.
Среди всевозможных линейных преобразований выделяется
одно, а именно:
Мы его обозначим через / и назовем тождественным; оно
ведет себя совершенно так же, как единичная подстановка:
S1 = IS=S для любого линейного преобразования 5, потому
что переменные х19 . . . , хп преобразованием / не изменяются.
Его матрица
111 0 ... Oil
р 0 1 ... О
р
II о о ... i||
называется единичной и ведет себя при умножении, очевидно,,
аналогично тождественному преобразованию: АЕ=ЕА=А для
любой матрицы Л /г-го порядка. В этом можно убедиться и
путем непосредственного перемножения матриц Л и Е и £ и Л.
Под обратным линейным преобразованием относительно
данного линейного преобразования S мы по аналогии с
подстановками будем понимать такое преобразование 5"1, что
55~ =5" 5=/. Подобным же образом матрицу А~~ /г-го порядка
мы назовем обратной по отношению к матрице Л /г-го порядка,
если АА~~1=А~1А=Е.
Оказывается, однако, что не всякое линейное преобразование
(матрица /г-го порядка) обладает обратным линейным
преобразованием (обратной матрицей). Предварительно убедимся в
справедливости следующего утверждения: произведение двух
линейных преобразований 5i и 52 (матриц п-го порядка Л, и А2)
тогда и только тогда является выроэюденным, когда по
меньшей мере одно из преобразований Sl и 52 (матриц Ах
и А2) вырожденное.
Действительно, обозначим через Аь Д2 и Д3 соответственно
определители преобразований 5! , 52 и 5^. Тогда, как мы
знаем, А8 = Д]А2. Если, например, преобразование 5j
вырожденное, то ^ = 0 и Д,=-0-Д2 = 0. Обратно, если Д3 = 0, то ДгД2*=0,
откуда по меньшей мере одно из чисел Дй и Д2 равно нулю,
99
т. е. по меньшей мере одно из преобразований S{ и S2
вырожденное.
Имеет место следующая теорема.
Теорема 1. (О существовании обратного линейного
преобразования и обратной матрицы.) Обратное линейное
преобразование S~l (с матрицей А~х) существует в том и только
в том случае, когда преобразование S (с матрицей А)
невырожденное.
Доказательство. Рассмотрим невырожденное линейное
преобразование S:
У\ — а^ух1-\-а{2х2-\-.. ,-j-a]nxni
Vn = cinlxl+an2x2+., .+аппхп>
(S)
и покажем, что для него существует обратное
преобразование S-1. Для этой цели выразим xt через yf.
Мы имеем систему п линейных уравнений с п
неизвестными хи . . . , хп, причем определитель Д5 ф 0. Следовательно,
по правилу Крамера, мы найдем единственное решение:
*i
д,
■*1~"Л > -*2— л!» - • - у Хп— л 1
причем
\=
ап ■ • ■ аи-г Vi ап+.
&2П
а
п\
ап
ат-\ Уп ат+\
Разлагая А, по элементам /-го столбца, получим:
д/=^1/^1+^2/У2+. . -+АщУп ('=1, 2, . . . , /г),
где АН1 . . . , АпГ-алгебраические дополнения элементов /-го
столбца определителя Д5. Таким образом, находим окончательно,
что
■ All it _1_ i Ащ
(S')
*.=^yi+...+4fy..
Полученное линейное преобразование S' и есть обратное
относительно 5. В самом деле, чему равны S'S и SV? Пре-
100
образование 5 переменные хи . . . , хп переводит в уи . . . , уп,
а преобразование S' переменные уъ . . . , уп переводит в хи
. . . , хп. Следовательно, произведение S'S переводит хи .. ., хп
в хи . . . , хт т. е. хи . . . , хп остаются без изменения.
Значит S'S есть тождественное преобразование: S'S=I. Те же
рассуждения можно применить и к произведению SS', а именно:
преобразование S' переменные уи . .. , уп переводит в хи ... ,хп,
а преобразование S переменные х1у . . . , хп переводит снова
в Уъ • • • , Уп- Следовательно, произведение SS' не изменяет
переменные уъ . . . , уп\ SS' = I.
Впрочем, можно убедиться, что S'S=SS' = I и другим путем.
Обозначим через А матрицу преобразования S и через Ах
матрицу преобразования S'. Предоставляем читателю путем
перемножения матриц убедиться, что как ААЪ так и АгА равны
единичной матрице Е. При этом надо воспользоваться
известными свойствами определителя /г-го порядка: выражения
H
Alialk+A2ia2k+. . .+Aniank,
где А у— алгебраическое дополнение элемента atj определителя
А5, равны нулю при / Ф k и А5 при i—k.
Итак, мы показали, что S/=S~1J и вместе с тем мы
показали, что обратной матрицей для А является
А,,
Д5 '
Д5 *
Ап\
" Д5
А-пп
Обращаем внимание на закон составления обратной матрицы:
чтобы получить матрицу Л-1, надо в матрице Л каждый элемент
а1;- заменить его алгебраическим дополнением Л/у, деленным
на определитель Д$ матрицы, и затем получившуюся матрицу
транспонировать.
Для полного доказательства теоремы остается разобрать
случай вырожденного преобразования S. Пусть, вопреки нашему
утверждению, обратное преобразование 5-1 существует; тогда
для матрицы Л также существует обратная матрица Л"1 и
АА~1 = Е. Но единичная матрица Е является невырожденной»
а произведение АА~~Х является вырожденной матрицей, так
как Л—вырожденная матрица. Получается противоречие.
Следовательно, обратного преобразования не существует.
101
Можно пойти еще дальше и доказать следующую теорему.
Теорема 2. (О единственности обратного линейного
преобразования.) Если S (А)—невырожденное линейное
преобразование (невырожденная матрица п-го порядка), то для
него существует только одно обратное преобразование
(обратная матрица).
Доказательство. Мы уже установили, что
невырожденное линейное преобразование S имеет по меньшей мере одно
обратное преобразование S~l- Пусть S имеет еще* одно
обратное преобразование Т. Тогда по определению обратного
преобразования ST=I. Умножим обе части равенства ST=I слева
на S~l. Получим:
s-1(st)=s-1i,
ИЛИ
(S~lS) T=S~\ (l)
так как умножение линейных преобразований подчиняется
ассоциативному закону и S~1/=S^1.
В свою очередь 8~г3=1, так как S-1—обратное
преобразование. Следовательно, равенство (1) принимает вид IT=S~l>
или, наконец, T=S-1. Единственность обратного
преобразования обнаружена.
Понятие произведения нескольких линейных
преобразований (и матриц /z-го порядка) вводится индуктивно, а именно:
под произведением S3S2S! трех линейных преобразований Slf
S2, S3 n переменных подразумевается (S3S2)Sb под
произведением S^SoSi четырех линейных преобразований Sl9 S2, S3, S4
n переменных подразумевается (SASbS2)Si и т. д. Вообще,
Пользуясь ассоциативностью умножения, можно доказать,
что во всяком произведении нескольких линейных
преобразований (матриц п-то порядка) скобки можно расставлять
произвольно (сохраняя порядок следования сомножителей).
Например,
04030201 = («J4O3) (°2^1/*
Доказательство этого утверждения мы опускаем, так как
ниже будет доказано более общее утверждение.
Введем, далее, понятие целой степени линейного
преобразования S (матрицы А п-то порядка).
Под целой положительной степенью Sk (k—целое
положительное число) линейного преобразования Suh подразумеваем
произведение S*S...S, состоящее из k одинаковых
сомножителей S. При этом само S рассматривается как S1.
102
Если сверх того преобразование 5 невырожденное, то можно
ввести понятие целой отрицательной степени, а именно: подЗ""**
где Л—целое положительное число, мы будем подразумевать
(<Г1)*.
Наконец, под 5° мы подразумеваем тождественное
преобразование / независимо от того, будет ли S вырожденным или
невырожденным преобразованием.
Аналогично определяется целая степень и для матрицы А
п-го порядка, причем под Л° подразумевается единичная
матрица Е.
Нетрудно проверить, опираясь на ассоциативный закон
умножения, что для целой степени линейного преобразования
(матрицы /z-го порядка) имеют место такие правила:
SpSq=SgSp=Sp+\ ApAq=AqAp=Ap+\
(Sp)g = SPQ, (АРУ=АМ
(2)
для произвольных целых р и q.
Мы, однако, не будем заниматься проверкой правил (2),
так как аналогичная проверка будет проведена в § 20 для
элементов поля.
Отметим еще, что для произвольных линейных
преобразований Si и S2 n переменных (матриц А и В п-го порядка) правила
(SiS2)p=SpSP ((АВ)Р=АРВР) уже не является справедливым,
так как умножение линейных преобразований (матриц п-го
порядка) не подчиняется коммутативному закону.
В теории матриц важную роль играет действие умножения
матрицы на число.
Пусть
а,
. а
l/i
а>
nl
ап
некоторая матрица /z-го порядка и £—какое-нибудь число
(вообще говоря, комплексное). Под произведением Ас числа с
на матрицу А, а также под произведением сА матрицы А на
число с мы будем подразумевать матрицу того же порядка,
получаемую при умножении на с всех элементов матрицы Л:
сап
са
in
Ас = сА=\\
\\са
п\
сап
103
Пользуясь понятием умножения матрицы на число, можно,
например, выражение обратной матрицы записать в более
компактном виде:
1
^л1
Чп
Рассмотрим теперь произведение сЕ единичной матрицы Е
п-го порядка на число с. Это будет матрица, у которой все
элементы выше и ниже главной левой диагонали равны нулю,
а диагональные элементы равны одному и тому же числу с:
сЕ=
с 0 ... О
О с ... О
О 0 ... с
Такая матрица называется скалярной.
Можно непосредственно проверить, что
сА= (сЕ)А = А(сЕ),
где А—произвольная матрица /г-го порядка. Таким образом,
умножение матрицы А на число с равносильно умножению
слева и справа на скалярную матрицу сЕ.
Отметим два основных свойства умножения матрицы на
число.
Г. (cd) A = c(dA) и ЬА=Л, где с, d—произвольные числа.
- 2°. Чтобы умножить произведение АВ матриц А и В /г-го
порядка на число с, достаточно умножить на это число один
из сомножителей А или В:
с(АВ) = (сА)В=А(сВ).
Свойство Г очевидно из самого определения умножения
матрицы /г-го порядка на число. Справедливость свойства 2°
следует из того, что
с(АВ) = (сЕ)(АВ) = (сЕА)В = (сА)Ву
с(АВ) = (АВ) (сЕ) = А (ВсЕ)= А(сВ).
Правило умножения матриц /г-го порядка в известной мере
распространяется и на прямоугольные матрицы.
104
Пусть А и В—две прямоугольные матрицы, причем пусть
число столбцов матрицы А равно числу строк матрицы В:
А =
11
Ы1
ал
В=
Ьп • • • Ьи
. Ь
nl
Тогда под произведением АВ прямоугольных матриц А и В
будет подразумеваться матрица
. сг
'ml
"ml
элементы которой c.j получаются по тому же правилу, что и
для квадратных матриц:
Cij=anblj + ai2b2j+--- + ainbnj ('=1. 2> ....**;
7 = 1, 2 /). (3>
Если число столбцов матрицы А не равно числу строк
матрицы В, то произведение АВ прямоугольных матриц А и В не
определено, так как в этом случае правило умножения (3)
теряет смысл.
Пример. Найти произведения АВ и ВА матриц
А =
1 3 2
1 6 4 »
В =
113 6
2 3 4
|2 5 1
1
1
з|
Число столбцов матрицы А равно числу строк матрицы В~
Следовательно, произведение АВ существует, и мы получаем,
руководствуясь правилом (3):
113 2 1
| 1 6 4 1
1 1 3 6 1 |
2 3 4 1
2 5 13|
АВ=
Ы+3-2 + 2.2 Ь3 + 3-3 + 2-5 Ьб + 3-4 + 2.1 Ы+3-1+2-3
Ы 4-62 + 42 ЬЗ + 6-3 + 4.5 Ьб + 6.4 + 4-1 Ы + 61+4..3
11 22 20 10
21 41 34 19
Произведение ВА не существует, так как число столбцов
матрицы В не равно числу строк матрицы Л,
105>
Правило умножения квадратной матрицы на число без
всяких изменений распространяется и на случай прямоугольной
матрицы, причем основные свойства Г и 2° остаются в силе,
а именно, пусть Л—прямоугольная „ матрица, состоящая из
т строк и п стрлбцов. Обозначим через Ет единичную матрицу
/71-го порядка.и через £V—единичную матрицу /г-го порядка.
Непосредственно легко убедиться, что умножение матрицы А
на число с равносильно умножению А слева на скалярную
матрицу сЕт или умножению А справа на скалярную
матрицу сЕп:
сА=(сЕт)А=А(сЕп).
Отсюда получаем, что
с(АВ) = (сЕт)(АВ) = (сЕт^А)В= (сА)В,
с(АВ) = (АВ) (cEt)=A (B-cEt) =A (cB),
т. е. чтобы умножить произведение АВ прямоугольных матриц
А и В на число с, достаточно умножить на это число один
из сомножителей А или В.
Мы здесь молчаливо пользовались тем, что умножение
прямоугольных матриц также подчиняется ассоциативному закону.
В справедливости этого легко убедиться путем
непосредственного перемножения матриц.
Свойство (cd)A=c(dA) и 1-Л=Л, где с, d—произвольные
числа, для прямоугольной матрицы Л вполне очевидно.
Задачи. 1. Найти произведение АВ матриц
А =
1 2 3
3 1 2
5 1 6
В =
2. Найти произведение АВ матриц
а)
б)
А =\
3. Для матрицы
1 2 3
3 5 1
3 4 1
8 7 5
6 4 3
3 4
2II
5 3 4II.
7 8 1||
1 5 *
6 2
1 5
—2
3
9
найти
4.
1 0 1
3 5 6
—1 1
Л"2. -
Найти матрицу X третьего порядка, удовлетворяющую уравнению
1 2 3 II || 5 1 6
3 1 2 .Х= 1 2 1
2 3 1 4 3 5
106
§ 19. Сложение матриц
Кроме умножения, в различных разделах математики, а
также в механике, физике и в технике приходится иметь дело
с операцией сложения матриц.
Пусть
А =
ап
В-
Ьп •
две каких-нибудь матрицы /г-го порядка. Суммой А + В
матриц А и В называется матрица С /г-го порядка, каждый
элемент ctj которой есть сумма одноименных элементов матриц
А и В: с..=аи + Ьи, т. е.
С=
ап + Ьп
аП1+1>п
ain+blt
а-пп + Ьп
Операция сложения матриц /г-го порядка обладает
следующими основными свойствами.
1°. Сложение матриц п-го порядка подчиняется комму-
тативному закону: А +В=В + А для любых матриц А и В
/г-го порядка.
2°. Сложение матриц п-го порядка подчиняется
ассоциативному закону. А + (В + С) = (А + В) + С для любых
матриц Л, В, С /г-го порядка.
3°. Для любых матриц А и В /г-го порядка существует
по меньшей мере одна матрица X /г-го порядка, для которой
А\-Х=В (выполнимость обратной операции—выяитания
матриц).
4°. Имеет место распределительный закон: А (В + С) =
=АВ+АС, (В + С)А = ВА + СА для любых матриц Л, 5, С
/г-го порядка.
Проверку свойства 1° можно провести так. Согласно
определению сложения матриц /г-го порядка
А + В--
В + А =
ап + Ьп
ani+bnl .
Ьп + ап
ЬпЛап
"т + Ь,
т
апп + Ьт
• Ь1п+а.
Ьпп + С1п
107
Ho aLj + bLj =btj + ац, так как арифметическое действие
сложения чисел, очевидно, подчиняется коммутативному закону.
Следовательно, А + В=В + Л.
Аналогично проводится проверка свойства 2°.
Справедливость свойства 3° устанавливается следующим
образом. Полагаем,
Х=
Х\п
. . хп
Тогда уравнение А + Х=В запишется в виде
ап . . .а
1л
я
711
+
41
vrtl
Чл
. . Х„
Ьлл . . . Ъл
ьп1 . . . ьп
или
ап+хп . . . а1п + х1п\\ \Ьп . . . b
ani+xn
• апп+Хп
.Ьп
откуда
аи + хи = ьП С У=1. 2» •••» л).
(О
Уравнения (1) однозначно разрешимы относительно
неизвестных xtj: Хц=Ьц—аи, так как для чисел вычитание всегда
однозначно выполнимо. Следовательно,
Х=
ЬлЛ—ал
Ьпх—апх
Ъпп—ап
и справедливость свойства 3° становится очевидной, причем
попутно мы установили единственность матрицы X.
Эта матрица X обозначается через В—А и называется раз-
костью матриц В и А п-го порядка.
В частности, разность В—В двух одинаковых матриц В
п-го порядка является матрицей /г-го порядка с нулевыми эле-*
ментами:
0. . .0
В-В--
108
Такая матрица называется нулевой и обозначается через О.
Нулевая матрица /г-го порядка обладает тем характерным
свойством, что она ведет себя аналогично числу 0 при
арифметическом сложении чисел: А + 0=А для любой матрицы Л
п-то порядка. В этом легко убедиться, непосредственно
складывая матрицы Л и О.
Далее, разность О—А, где Л—некоторая матрица /г-го
порядка, обозначается через—Л и называется матрицей,
противоположной А. При помощи противоположной матрицы всегда
можно разность В—А матриц В и Л /г-го порядка представить
в виде суммы В-\-(—А).
Займемся, наконец, проверкой свойства 4°. Пусть
ап . .
•
\<*П1 • •
. а1п
•
• аЯп\
, в=\
#п •
•
&*•
• • bm
• 1
• bnn\
'. с=.
kn-
^п\ •
•
•
• ^\п
•
■ 'J
три произвольные матрицы /г-го порядка. Тогда сумма В + С
будет состоять из элементов d.. = Ь^ + cir Произведение
А (В + С) будет состоять из элементов
е.. = а.Лйл • 4- ... 4- (I- d .=а.л (Ьл .4- сл.) 4- ,4-а. (Ь .-\-с ■) =
=(а.лЬл -4- .. 4- a. b ) -\- (а-лСл. 4- ... 4- а. с .).
V l\U\j ~ • • • ~ "in nj/ ' V^l ly ~ * • * * "in RJ'*
Ho cinbxj + ... + aiTpn} есть элемент fiJ произведения АВ, a
а/Лу + • • • + aincnj~~3JieueHT &ц произведения АС. Таким
образом, из равенства ^y=//; + g"/y вытекает, что А(В + С) =
= АВ + АС. Анал >гичио провернется справедливость второго
соотношения (В + С) А = ВА + СА.
Мы не будем дела ib дальнейших выводов из свойств Г—4°,
так как они получатся сами собой при рассмотрении общего
понятия кольца в § 20.
В тесной связи со сложением матриц /г-го порядка
находится операция сложения линейных преобразований.
Рассмотрим два линейных преобразования Sh Г, заданных
матрицами /г-го порядка:
1 ап . . . а1п
|Я/11 • • • апп\
1, В=
1
|*п • • • Ьт\
Ьщ . - . Ьпп\
Пусть преобразование 5 переменные xv ..., хп переводит
в переменные yv ..., уп:
(/ = 1, 2, ..., п) \ w
109
а преобразование Т те же переменные xv .... хп переводите
переменные zv — zn:
Zi-bnXl + --- + binXn-\ „v
(/=1,2, п) I W
Назовем преобразование, переводящее переменные хъ ..., хп
в переменные и1=у1 + гъ ti2=y2 + z2, ..., un=yn + zn,
суммой преобразований S и Г и обозначим его через S + Т.
Покажем, что S+T является линейным преобразованием с
матрицей А + В.
Сложим почленно равенства (2) и (3). Получаем:
(i=h 2, ..., п)
(4)
Из равенства (4) следует, что S + Т есть линейное
преобразование с матрицей
\\an + bn . . . aln + bln\\
ani + l>ni • • • <*пп+Ъп
= А + В.
В заключение отметим, что правило сложения матриц п-го
порядка в известной степени распространяется и на
прямоугольные матрицы, а именно, если
А =
*ml
В =
Ьц . . . bln
'ml
прямоугольные матрицы, имеющие одинаковое число строк и
одинаковое число столбцов, то под суммой А + В этих
матриц мы подразумеваем матрицу
'ml
■...£*
элементы которой си=аи + btj (*=lf 2, ..., т\ у=1, 2, ...,/г).
Таким образом, сложение двух прямоугольных матриц А и В
выполнимо в том и только в том случае, когда матрицы А
и В имеют одинаковое число строк и одинаковое число
столбцов.
ПО
Задачи. 1. Найти, чему равно
2X3 + 5Ха + 6Х — 9Е,
где
15 1 111
Х =
1 2 1
3 0 1
и Е — единичная матрица 3-го порядка.
2. Показать, что матрица второго порядка
II" Ь\\
\\с d\\
удовлетворяет уравнению X2 — (a -f d) X -f (ad— 6c) £ = О, где £ —
единичная матрица второго порядка, а О — нулевая матрица второго порядка.
3. Показать, что сложение прямоугольных матриц подчиняется тем же
свойствам Г — 4°, что и сложение квадратных матриц /г-го порядка
(разумеется в том случае, когда сложение и умножение матриц выполнимо).
4. Найти общий вид матриц X второго порядка, для которых
II 2 ||
X = О (О— нулевая матрица 2-го порядка).
2 4
§ 20. Кольцо и поле
Выше мы рассматривали довольно широкий круг объектов:
помимо чисел мы изучали подстановки, векторы, линейные
преобразования переменных и матрицы. При этом нас
интересовали главным образом не сами объекты, а алгебраические
операции, совершаемые над объектами, так как основной
задачей алгебры является изучение свойств алгебраических
операций.
Но что такое алгебраическая операция? Обратимся,
например, к арифметическому умножению чисел. Мы можем эту
операцию характеризовать как некоторое правило, по которому
каждым двум числам, взятым в определенном порядке,
ставится в соответствие вполне определенное число. Совершенно
теми же словами можно охарактеризовать и умножение
линейных преобразований п переменных, умножение матриц
я-го порядка, умножение подстановок п чисел. Таким
образом, мы приходим к следующему общему определению
понятия алгебраической операции.
Пусть М—некоторое множество. Композицией, или
алгебраической операцией, определенной в этом множестве*
называется правило, по которому каждым двум элементам
а> b (одинаковым или различным) множества Ж, взятым &
определенном порядке, ставится в однозначное соответствие
элемент с того же множества.
Алгебраическую операцию часто обозначают при помощи
обычного знака умножения; в этом случае элемент с
записывается в виде ab и называется произведением элементов а и Ь.
Ill
Иногда алгебраическую операцию обозначают знаком+; в этом
случае с записывается в виде а + Ь и называется суммой
элементов а и Ь.
В определении алгебраической операции говорится о
порядке, в котором берутся элементы а, Ь. Это означает, что
алгебраическая операция может и не обладать свойством
коммутативности: если паре элементов а, Ь ставится в
соответствие элемент с, то паре элементов Ь, а может оказаться
подавленным в. соответствие другой элемент d. Обращаем
также внимание читателя на то, что в определении
алгебраической операции содержится требование однозначности и
выполнимости операции для любых двух элементов
множества М.
Примеры. 1. Очевидно, что обычное сложение целых чисел
есть алгебраическая операция, определенная во множестве
целых чисел.
То же самое можно сказать и относительно обычного
умножения целых чисел.
Вычитание целых чисел есть также алгебраическая
операция, определенная во множестве целых чисел, но эта
операция, в отличие от сложения и умножения целых чисел, не
подчиняется коммутативному и сочетательному законам, так как
равенства
а—6 = 6—а, а—(6—с) = (а—Ь) —с
возможны не для всяких целых чисел.
Что касается действия деления целых чисел, то оно уже
не будет алгебраической операцией, определенной в
множестве целых чисел, не будет по той простой причине, что
деление на 0 невозможно и частное двух целых чисел может
оказаться дробным числом.
Зато деление рациональных чисел, отличных от нуля, есть
алгебраическая операция, определенная в этом множестве
чисел.
2. Умножение подстановок /г-й степени (т. е. от п
элементов) есть алгебраическая операция, определенная во
множестве всех подстановок /г-й степени. Эта операция, как мы
знаем, подчиняется сочетательному закону, но не подчиняется
коммутативному закону.
3. Умножение линейных преобразований п переменных есть
алгебраическая операция, определенная во множестве всех
-линейных преобразований п переменных, и эта операция также
подчиняется ассоциативному закону, но не подчиняется
коммутативному закону.
4. Умножение матриц л-го порядка есть алгебраическая
операция, определенная во множестве матриц /г-го порядка,
причем эта операция подчиняется ассоциативному закону, но
«е подчиняется коммутативному закону.
па
То же самое можно сказать и относительно сложения
матриц /г-го порядка, причем операция сложения матриц /г-го
порядка подчиняется как коммутативному, так и
ассоциативному закону.
5. Если обратиться ко множеству прямоугольных матриц,
состоящих из заданного числа т строк и заданного числа п
столбцов, причем т фп% то сложение матриц будет
алгебраической операцией, определенной в этом множестве; однако
умножение матриц уже не будет алгебраической операцией,
определенной в этом множестве, так как при тфп
умножение прямоугольных матриц не выполнимо.
Введем теперь понятие кольца, играющее в алгебре
важную роль.
Пусть К— некоторое множество с двумя определенными в
нем алгебраическими операциями. Условимся одну операцию
обозначать знаком + и называть сложением, а
другую—знаком • и называть умножением. Множество К называется
кольцом по отношению к операциям сложения и умножения, если
удовлетворяются следующие'условия:
1°. Сложение подчиняется коммутативному закону:
а + b = b + а для любых элементов a, b множества К.
2°. Сложение и умножение подчиняются ассоциативному
закону: (а + Ь) + с=а + (Ь + с), (ab)c=a(bc) для любых
элементов а, ft, с из К.
3°. Имеет место обратимость сложения, т. е. для
любых двух элементов а,Ь из К уравнение а + х=Ь
разрешимо в /С
4°. Выполняется дистрибутивный (распределительный)
закон: a(b + c) = ab + ас, (Ь + с) а = Ьа + са для любых
элементов а, Ь, с из /О
Если коммутативный закон имеет место и для умножения:
ab = ba для любых а и ft из К, то кольцо К называется
коммутативным.
Отметим также, что поскольку сложение и умножение
элементов кольца К являются алгебраическими операциями,
определенными в /С, для каждых двух элементов a, ft сумма а + Ь
и произведение ab должны определяться однозначно и должны
принадлежать тому же множеству К.
Теперь укажем несколько примеров колец.
1. Простейшим примером является совокупность всех
целых чисел. Прежде всего ясно, что арифметические действия
(сложение и умножение) являются алгебраическими
операциями, определенными во множестве целых чисел. В самом
деле, складывая или перемножая два целых числа, мы снова
получаем целое число. Затем совершенно очевидно, что для
арифметических действий сложения и умножения выполняются
все условия 1°—4°. Сверх того, умножение чисел подчиняется
коммутативному закону. Таким образом, совокупность целых
ИЗ
чисел образует коммутативное кольцо (по отношению к
арифметическим действиям сложения и умножения).
2. Хотя арифметические действия (сложение и умножение)
являются алгебраическими операциями и по отношению ко
множеству целых положительных чисел, все же это
множество не образует кольца, так как не выполняется условие 3°
(обратимость сложения): уравнение а + х=Ь в области целых
положительных чисел не всегда разрешимо, например оно
заведомо неразрешимо при а=Ъ и Ь=3.
3. Множество М матриц я-го порядка образует относительно
сложения и умножения матриц кольцо. Действительно,
сложение и умножение матриц являются алгебраическими
операциями, определенными в УН. Для этих операций, как мы уже
знаем из § 18 и 19, выполнены все условия Г—4°. Однако
умножение матриц не подчиняется коммутативному закону и
потому Ж—некоммутативное кольцо.
4. Рассмотрим множество F функций действительного
переменного х, непрерывных на отрезке [а, Ь\. Сумма и
произведение двух функций из F будут также функциями,
непрерывными на отрезке [а, Ь], т. е. будут принадлежать тому же
множеству А Следовательно, сложение и умножение функций
являются алгебраическими операциями, определенными в F.
Поскольку для этих операций выполняются условия 1° —4°,
множество F образует кольцо, и притом коммутативное, так
как умножение функций подчиняется коммутативному закону.
Пример 5. Множество УН, состоящее из одного числа О,
образует по отношению к арифметическим действиям
сложения и умножения коммутативное кольцо, в чем читатель
может сам без труда убедиться. При этом число 0 является
единственным элементом кольца М. Мы здесь встретились с
характерным примером кольца, состоящего только из одного
элемента.
Вернемся к общей теории и посмотрим, какие выводы
можно сделать из определения кольца.
Обратимся прежде всего к условию 2°. Пользуясь им, мы
введем понятия суммы и произведения нескольких элементов
кольца.
Определим сумму нескольких элементов индуктивно:
^1 + #2 + Яз = (а1 + #2) + Я3,
а\ + я2 + Яз + а4= (а, + а2 + а3) + а4 и т. д.,
т. е. чтобы сложить три элемента, надо составить сумму
первых двух и к полученному результату прибавить третий
элемент; чтобы сложить четыре элемента, надо к сумме
первых трех прибавить четвертый и т. д. Вообще, если сумма
п элементов найдена, то сумма п + 1 элементов найдется по
формуле:
*1 + ■ • • + ап+ап+1 = (а1 + --'+ап) + ап+Г
114
Однако это не единственный способ сложения. Например,
в случае трех элементов можно было бы к первому прибавить
сумму двух остальных: а1 + (а2 + ав). Благодаря
ассоциативному закону отступление от принятого порядка сложения не
влияет на результат: ах + (а2 + а3) = (ах + а2) + аъ.
Оказывается, что это обстоятельство имеет место для
любого числа слагаемых, т. е. во всякой сумме скобка можно
расставлять произвольно (сохраняя, конечно, порядок
следования слагаемых):
к+. ..+*,)+ ...+к+1+... +*,)+
+ (я,+1 + . . . + ап_х +ап)=а1+а2+ . . . +ап. (1)
Доказательство. Для /z=3, как мы знаем,
утверждение справедливо; допустим, что наше утверждение верно для
всех А, меньших некоторого п9 и покажем, что тогда
утверждение верно и для п.
Согласно принятому нами определению суммы нескольких
слагаемых левая часть равенства (1) есть не что иное, как
[(«1+ • • • +%)+ ■ ■ • +К+1+ • • • +«,)] +
+ К+1+---+«„-!+<>• (2)
Внутри квадратных скобок число слагаемых меньше п\
следовательно, согласно сделанному допущению мы можем
выражение (2) переписать так:
(а1+ . . . +as) + {as+l+ . . . +«„_,+«„). (3)
Пользуясь определением суммы нескольких слагаемых,
получаем далее, что
а .,4- . . . -\-а ЛЛ-а =(а .,4- . . . А-а А Л-а
Таким образом, выражение (3) можно заменить следующим
выражением:
[ах+ . . . +as)+[(as+l+ . . . +ап_г) +ап],
а затем применить ассоциативный закон:
[(«,+ .. . +as) + (as+l+ . . . +an_i)]+an. (4)
В квадратных скобках выражения (4) снова число слагаемых
меньше /г, поэтому пишем:
(ai+ • • - +an-i)+an'>
последнее выражение есть не что иное, как ах-\- . . . 4-
+ал_1+#л. Мы получили правую часть равенства (1), и тем
115
самым наше утверждение оказалось справедливым для п.
Отсюда, поскольку утверждение верно для /г=3, оно верно для
любого числа слагаемых, большего трех.
Произведение нескольких элементов кольца К определяется
подобным же образом:
ala2as = (a1a2)aSy
а1а2аваА = (а1а2аг) а4
и вообще
аха2 • • • aA+i = (aia2 • •• an)an+v
Затем буквально также, как и в случае сложения, можно
показать, что во всяком произведении п сомножителей а{а2 ...
... ап(п>2) скобки можно расставлять произвольно (сохра-
няя порядок следования сомножителей).
Так как сложение подчиняется коммутативному закону,
порядок следования слагаемых в сумме двух и нескольких
элементов не является существенным. Что касается произведения
двух и нескольких элементов, то оно уже зависит от порядка
следования сомножителей, так как умножение, вообще говоря,
не подчиняется коммутативному закону.
Для кольца можно еще ввести понятие целой
положительной степени, а именно: п-й степенью (п—целое положительное
число) элемента а мы назовем произведение п одинаковых
сомножителей аа . . . а и будем обозначать ее через ап. Сам
элемент а мы будем рассматривать как а1.
Нетрудно проверить, что для целых положительных
степеней элементов кольца справедливы обычные правила действий
со степенями:
а а =а а = а т , (a j =a ,
а если кольцо коммутативно, то сверх того имеет место
правило
{ab)n=anbn.
В самом деле,
атап = {аа . . . а)(аа . . . а) = аа . . . а = ат^п.
т раз п раз т-\-п раз
Точно так же убеждаемся, что
апат=ат+п.
Аналогично имеем, что
{ату = атат # в и ат=аа . . . а = атп.
п раз тп раз
116
Наконец, в случае коммутативного кольца мы можем в
правой части равенства
апЬп = (аа . . . a) (bb . . . b)
п раз п раз
изменить порядок следования сомножителей и расставить скобки
так, чтобы получилось
(ab) (ab) . . . (ab) = (ab)n.
п раз
Посмотрим теперь, что дает условие 3°. Пусть
Ь—некоторый элемент кольца. Согласно условию 3° можно подобрать
такой элемент с, что
b+c=b. (5)
Покажем,что тогда для любого элемента а кольца К
а-\-с*=а,
т. е. элемент с ведет себя аналогично числу 0 при
арифметическом сложении. Для этой цели подбираем элемент d из /С,
удовлетворяющий уравнению Ь-\-х = а:
b+d=a. (6)
Прибавляя к обеим частям равенства (5) элемент dn пользуясь
коммутативным и ассоциативным законами, получаем:
(b+d)+c = b+d
или в силу (6):
а+с = а.
Назовем элемент и кольца К нулем, если а-\-и=а для
любого элемента а кольца К. Покажем, что, кроме найденного с,
другого нуля в К не существует. В самом деле, так как и
является нулем, то с+и=с. Но, с другой стороны, и с есгь
нуль, значит, с-\-и = и. Мы видим отсюда, что и = с.
Единственный нуль кольца К принято обозначать через 0.
Этого обозначения мы и будем все время придерживаться.
Далее рассмотрим уравнение
а+х=0, (7)
где а —• снова произвольный элемент кольца. Оно имеет
единственное решение. Действительно, пусть хх и х2 два корня
уравнения (7), т. е.
а+л:1=0, а+х2 = 0. (8)
117
Прибавляя к обеим частям первого равенства (8) элемент хъ
получаем:
(a-f^1)+^2=^2- (9)
Но, с другой стороны,
(а+х1)+х2=(а+х2)+х1 = 0+х1=х1. (10)
Сравнивая равенства (9) и (10), получаем х1 = х2.
Единственное решение уравнения (7) обозначается через
—а и называется элементом, противоположным а.
Между прочим, решением уравнения (—а)+х=0 является
а, откуда следует, что —(—а) = а.
После того как мы определили нуль и противоположный
элемент, нетрудно показать, как решается уравнение
а+х=Ь.
Если к обеим частям этого уравнения прибавить —а, то
в результате получится единственное решение:
x=b+(-a)t
которое принято обозначать через Ь'—а и называть разностью
элементов b и а. Таким образом, в кольце К вычитание всегда
однозначно выполнимо. Очевидно, что а—а = 0, 0—а = —а.
Если в кольце К вычитание возможно, то относительно
деления этого сказать нельзя, так как мы нигде не требовали,
чтобы уравнения ах—Ь и ха=Ь были разрешимы.
Кроме нуля, в кольце К может существовать (но может и
не существовать) элемент, известный под названием единицы.
Единицей кольца К называется такой элемент е Ф 0, для
которого ае = еа = ау каково бы ни было а из К. Нетрудно
убедиться, что кольцо К может обладать лишь единственной
единицей. Действительно, пусть ^—другая единица кольца К.
Так как е—единица, то ее1 = е1. Но, с другой стороны, ех—
также единица, откуда eeL = e. Сравнивая равенства ее1 = е1 и
ее1=е, получаем, что ех = е.
В кольце К с единицей можно, кроме целой
положительной степени элемента, ввести еще и понятие нулевой степени,
а именно: для произвольного элемента а кольца К мы
положим а° = е, в результате чего в кольце с единицей
вышеупомянутые правила действия со степенями будут справедливы для
любых целых неотрицательных показателей тип.
Примерами колец с единицей могут служить кольцо целых
чисел и кольцо матриц /г-го порядка. В качестве простейшего
примера кольца, не обладающего единицей, рассмотрим
совокупность четных чисел. Это множество образует коммутативное
кольцо относительно арифметических действий сложения и
умножения, однако оно не содержит числа 1, которое могло
бы быть для него единицей.
118
Обратимся, наконец, к условию 4° (распределительному
закону). В этом условии утверждается, что
a(b+c) = ab+ac, (b+c)a = ba-\-ca.
Легко убедиться при помощи метода метематической
индукции, что не только для двух, но и для п элементов^, .. . ,&„:
а(Ьг+Ь2+ . . . +bn) = ab1+ab2+ . . . +аЬяЛ
(bx+b2+ . . . +bn)a = b1a+b2a+ . . . +bna.j }
Действительно при /z=2 равенства (11) справедливы в силу
условия 4°. Предположим, что равенства (И) справедливы для
некоторого п. Тогда
а[Ьг+ ... +bn+bn+i) = "[(t>i+ ••• +bn)+bn+l] =
= а {Ьг+ ... +bn) +abn^= [abx+ ... +abn) + abn+l =
= abx+ . . . +abn+v
(Ьг+ . . . +ЬЯ+ЬЯ+Х) а=[(Ьх+ . . . +bn) +VM] а= [Ьх+ . . . +
+bn)a+bn+la=(bla+ ... + bna)+bn+la = bla+ ... +bn+1a,
т. е. равенства (11) оказываются справедливыми и для п-\-\.
Благодаря дистрибутивному закону многие правила
обычной алгебры остаются в силе и для колец. Ведь сам этот
закон есть не что иное, как правило умножения двучлена на
одночлен.
Из равенств (11) легко получается известное правило
перемножения двух сумм:
(а1+а2+ ... + ап) (bx+b2+ . .. +bm) =
= a1b1+a2bi+ . . . +anb1+a1b2+ .. . +anbm\
В самом* деле,
{ах+а2+ . . . +ап) (bt+b2+ . . . + bm) = (ах+а2+ ...+ап) bt+
+(ai+a2+ . . . +an)b2+ . . . + (а,+а2+ . . . +an)bm=
=a1b1+a2bl+ . . . +anb1+a1b2+ . . . +anb2+ . .. +anbm.
До сих пор речь шла о распределительном
(дистрибутивном) законе при сложении. Мы сейчас покажем, что этот
закон остается в силе и при вычитании:
a(b—c) = ab—ac, (b—c)a=ba—ca (12)
для любых элементов а, Ь, с кольца.
1 Порядок следования слагаемых afij произволен, но в случае
некоммутативного кольца мы не можем переставлять сомножители щ и bj.
119
Ограничимся выводом первого равенства; второе равенство
выводится аналогичным образом.
Пишем, пользуясь определением разности:
с+ (b—c) = b.
Умножая обе части слева на а, получаем:
a [c+(b—c)]=ab.
Затем применяем дистрибутивный закон:
ac+a(b—c) = ab.
Мы видим из последнего равенства, что а(Ь—с) есть разность
ab—ac:
a(b—c)=ab—ac.
Пользуясь равенствами (12), нетрудно убедиться, что
произведение двух элементов равно нулю, если равен нулю один
из элементов. В самом деле,
а-0=а (b—b) = ab—ab=0,
0-a=(b—b)a=ba—ba=0.
Однако обратное не всегда верно. Если произведение равно
нулю, то для некоторых колец сомножители могут и не
равняться нулю:
ab=0 при афО, ЬфО.
Такие элементы a, b кольца называются делателями нуля.
Примеры. 1. Рассмотрим кольцо матриц второго порядка.
В этом кольце матрицы
А =
1 011
о о
^0 и В--
110 0
0 1
*0.
(нулем является нулевая матрица второго порядка). Однако
при помощи непосредственного перемножения матриц А и В
убеждаемся, что
110 011
лв=
о о
=0.
2. Рассмотрим кольцо F функций действительного
переменного х, непрерывных на отрезке [а, Ь]. Обозначим через
f(x) функцию, определяемую условиями:
f(x) = 0 при x<0\ f(x) = x при л:>0,
и через g(x)—функцию, определяемую условиями:
g(x) =х при *<0; g(x) = 0 при л:>0.
120
Функции/(л:) и g (х) непрерывны и, следовательно,
принадлежат кольцу F. Кроме того, /(х)фО и g(x)=£0 (роль нуля 0
играет функция, тождественно равная нулю). Однако
произведение f(x)-g(x) при любом значении х равно нулю, т. е.
Вернемся к равенствам (12) и покажем, что для кольца
верны обычные правила знаков при умножении:
(—a)b = —ab1 a(—b) = —ab, (—a)(—b)=ab.
Проверяются эти правила для кольца очень просто:
(—a) b = (0—a) b=0-b—ab=0—ab =—ab,
a (—b) = a(0—b) = a-0—ab = 0—ab = —ab,
(-a)(-b) = -[a(-b)]=-(-ab) = ab.
Итак, мы установили, что для колец сохраняются многие
законы обычной алгебры. Но сходство с обычной алгеброй
еще более усилится, если мы обратимся к одному особому
классу колец.
Назовем полем такое коммутативное кольцо Я, в котором
существует по меньшей мере один элемент, отличный от
нуля, и в котором уравнение ах=Ь разрешимо для любых
элементов афО и ft из Р (выпоутимость деления).
Какими же дополнительными свойствами обладает поле?
Оказывается, что поле, кроме нуля и противоположных
элементов, обладает еще единицей и обратными элементами.
Пусть сфО—некоторый элемент поля. По определению поля
всегда можно подобрать такой элемент е, что
се=ес=с. (13)
Очевидно, что ефО. Если бы е=0, то с = се=0, что
противоречит условию сфО.
Покажем, что е является единицей поля, т. е. для любого
элемента а ае = еа = а. Для доказательства подберем из поля
элемент d9 удовлетворяющий равенству
cd=a, (14)
и затем умножим обе части этого равенства на е. Тогда,
пользуясь ассоциативным и коммутативным законами, получим:
(се) d=ae
или в силу равенства (13) и (14): а=ае. А так как поле есть
коммутативное кольцо, то и еа=а.
Ра ссмотрим теперь уравнение
ах=-е, (15)
121
где афО—произвольный элемент поля Я. Оно имеет
единственное решение, в чем легко убедиться следующим образом.
Допустим, что уравнение (15) имеет не одно, а два решения:
хг и х2. Тогда
ахх = е, (16)
ах» = е. (17)
Умножим обе части равенства (16) на х2: (ах1)х2 = ех2 = х2. Но,
с другой стороны, в силу равенства (17)
(axj) х2=(ах2) х1 = ех1 = х1,
откуда хг = х2.
Единственное решение уравнения (15) принято обозначать
через а~1 или — и называть элементом, обратным относи-
а
тельно а. Заметим дополнительно, что (а~1)~1 = е; это следует
из того что решением уравнения а~гх=е является а: аГ1а =
= аа~1 = е.
Перейдем к общему случаю:
ах=Ь (афО).
Если обе части этого уравнения умножить на а"1, то
получится единственное решение x=ba~1 = b- —, которое обычно
а
записывается в виде дроби —. Нетрудно убедиться, что
действия над символом — ничем не отличаются от обычных опе-
а
раций с дробями, а именно:
~а = Т тогда и только тогда, когда Ьс=ас1(аф0, сфО).
— ± — = °' (правило сложения) (афО, сфО).
— •— = — (правило умножения) (афО, сфО).
ь_
-J- = — (правило деления) (афО, сфО, ЛфО).
с
Покажем, что все эти соотношения справедливы. Начнем
с первого. Умножим обе части равенства — =— на ас.
Получим:
(— а)с= I— с\а, или bc = ad,
так как — а = (ba~1)a=b(aa~l) = be = b и аналогично — -c=d.
122
Обратно, пусть bc = ad. Умножив обе части этого равенства
на а~1с~х, получим:
(to"1) («Г»)-(*-') («Г'). Ь-а-е=±г-е, A-f
Для проверки правила сложения умножим — ± — на ас и
воспользуемся дистрибутивным законом:
[Ь . d\ Ь , d
— -\- —)ас= —ас л- —са,
\а — с] а — с у
или после очевидных сокращений:
[— + — \ac = bcJrad.
[а - с )
Наконец, умножаем обе части последнего равенства на (ас)-1*
в результате чего будем иметь:
Ь d bc±ad
а — с ас
Буквально так же доказывается и третье соотношение
(правило умножения), а именно:
(Ъ d\ Ь d ..
)ас= — -а- — c=bdt
\а с ) а с '
откуда после умножения обеих частей на (я^)"1 получаем:
Ь_ d_ = bd_
а с ~~ ас '
Остается проверить правило деления. Легко видеть, что
Действительно, -т является обратным элементом по отно-
d
шению к —, так как согласно правилу умножения
d с _ cd _
с d cd
Таким образом,
ъ_
а _ Ь с_ _ be
d ~~ a d ~~ ad '
с
что и требовалось показать.
123
Кроме целой неотрицательной степени, для элементов поля
можно ввести и отрицательную степень, а именно: если афО,
то под степенью a k (k—целое положительное число) мы
подразумеваем {a~l)k. He представляет труда убедиться, что
правила действия со степенями
а а =а а =а .
(ab)n = anbn
справедливы для всех целых тип равных и неравных нулю
как положительных, так и отрицательных. Мы ограничимся
проверкой первого соотношения, а остальные предоставляем
проверить читателю.
Прежде всего ясно, что при /t=0
атап = ата°=ате = ат = ат+° = ат+п,
и аналогично при т=0.
Если т отрицательно и п положительно, то m = —k, где
/г—положительное целое число, и
а а =а а —\а ... а Да . . . а) =
k раз п раз
= (а"1 . . .а"1) (а"1 а) (а ... а) = (а"1 . . . а"1) е{а ... а) =
= [а~1 . . . а~1) (а ... а) и т. д.
k—l раз п — \ раз
В случае k = n все а" и а сократятся и получится
а а =е=а =а =а ^ .
В случае k<n все а~ сократятся и останется /z—k
сомножителей а:
а а — а . . . а=а =а .
п—k раз
Наконец, в случае k>n сократятся все а и останется k—n
сомножителей а-1:
# а ==а ... а = ^а у =а =а .
Л—л раз
124
Аналогичным образом убеждаемся, что при положительном
т и отрицательном п имеет место то же самое соотношение
а а = а ^ .
Остается разобрать случай, когда тип оба отрицательны.
Но здесь мы можем положить m = —k, n =—l, где k и / целые
положительные числа, и тогда получим:
aman = a-ka-l= К1)* (а-*)' = (a-*)bV = a-*-i = a«+"u
Обращаем внимание на следующее важное свойство поля:
если произведение аЪ элементов a, b поля Р равно нулю,
то по меньшей мере один из сомножителей а и b равен
нулю; иными словами, поле не содержит делителей нуля.
Доказывается это очень просто; пусть а Ф О, тогда, умножив
обе части равенства ab = 0 на —, получим Ь=0.
Примеры полей. 1. Простейшим примером поля может
служить множество всех рациональных чисел, рассматриваемое
относительно арифметических действий сложения и
умножения. В самом деле, множество рациональных чисел
относительно этих действий образует коммутативное кольцо и
уравнение ах=Ь при рациональных аФО и b всегда разрешимо
в этом кольце, потому что частное двух рациональных чисел
есть снова рациональное число.
Напротив, множество всех целых чисел относительно
арифметических действий сложения и умножения образует только
коммутативное кольцо, а не поле, так как в нем уравнение
ах=Ь (афО) не всегда разрешимо, так как не всегда
частное двух целых чисел есть также целое число.
2. Другой пример—множество всех действительных чисел
образует поле относительно тех же арифметических действий,
так как это множество образует относительно
рассматриваемых операций коммутативное кольцо и в этом множестве
деление всегда выполнимо (исключая, конечно, деление на нуль).
Точно так же образует поле относительно арифметических
действий сложения и умножения множество комплексных
чисел.
3. Разобьем все целые числа на два класса: класс четных
и класс нечетных чисел. Условимся первый класс обозначать
через А0 и второй класс—через Ах. Рассмотрим множество С
из двух элементов А0 и Аг. В этом множестве мы определим
две алгебраические операции—сложение и умножение классов.
Под суммой Л. + Aj классов Л. и Aj мы будем подразумевать
тот из классов А0 и Аи который содержит совокупность целых
чисел, получающихся при сложении каждого числа класса А1
с каждым числом класса А.. Под произведением ALAj классов
125
Л. и Aj мы будем подразумевать тот из классов А0 и Av
который содержит совокупность целых чисел, получающихся при
умножении каждого числа класса А. на каждое число класса А..
Легко убедиться, что
^от^о=^о» Aq-\~A1^=Au A\ -\- A0 = Alt
А\ -\- А1 = А0
и
АоА0 = А0, А0А1 = А1А0 = А0, A^i^Ai, (19)
Справедливость равенств (18) следует из того, что сумма двух
четных чисел есть число четное, сумма четного числа с
нечетным есть число нечетное и сумма двух нечетных чисел
есть число четное. Справедливость равенств (19) видна из
аналогичных соображений.
Таким образом, мы определили во множестве С две
алгебраические операции—сложение и умножение классов. Эти
операции подчиняются коммутативному, сочетательному и
распределительному законам, в чем легко убедиться при помощи
равенств (18) и (19). Затем при помощи равенств (18) нетрудно
проверить разрешимость уравнения Л. + Х= Aj во множестве С.
Итак, множество С образует относительно операций
сложения и умножения классов кольцо, и притом коммутативное.
Из равенств (18) непосредственно видно, что класс А0.является
нулем кольца С и что каждый элемент кольца С
противоположен самому себе. Следовательно, класс Л0 можно
обозначить через 0. Само собой разумеется, что 0 является здесь
обозначением Л0, а не числом 0.
Покажем, что С является не только кольцом, но и полем.
Обратимся к равенствам (19). Они показывают, что
уравнение Atx=A. при всяких At Ф 0 и Л. разрешимо в С, а именно:
уравнение Atx=A0 имеет решение Л0, уравнение Ахх=Аг
имеет решение Аг.
Единицей поля С, как это сразу видно из равенств (19),
является класс Аг. Следовательно, мы его можем обозначить
через е.
Мы здесь имеем первый пример поля, состоящего из
конечного множества элементов, так называемого конечного
поля.
4. Обозначим через М множество матриц второго порядка
вида
II а *11
II "~^ а11
где а, Ь—всевозможные действительные числа. Покажем, что
относительно действий сложения и умножения матриц данное
множество образует поле.
(18)
126
аг Ьг II
-Ьх аг
a b
1 — b a
, в=\
, АВ-
а2 Ь2 ||
-Ь2 а2 II
с d \
—d с |
Однозначность действий сложения и умножения матриц не
вызывает сомнений. Поэтому покажем, что эти действия
выполнимы во множестве М. Складывая и перемножая две
произвольные матрицы
Л =
из Ж, получим:
А + В
где
а = ах + аъ Ь = Ьг + Ь2,
c=a1a2—b1b2, d=a1b2 + a2bx— действительные числа,
т. е. матрицы того же вида.
В свое время мы установили, что умножение и сложение
матриц /г-го порядка подчиняются ассоциативному и
дистрибутивному законам, а сложение матриц, сверх того,
подчиняется коммутативному закону. Поэтому здесь мы должны
еще выяснить, подчиняется ли умножение коммутативному
закону. Но, непосредственно перемножая матрицы В и Л,
видим, что ВА=АВ.
Далее, вычитая из матрицы А матрицу В, получаем:
fg
А-В--
-gf
где
f=a1—a2y g=b1—^—действительные числа,
т. е. разность А—В оказывается матрицей того же вида. Итак,
множество М образует коммутативное кольцо относительно
операций сложения и умножения матриц.
Остается показать, что в М разрешимо уравнение Ах=В
для любых матриц А Ф 0 и В из М. Это следует из того, что
матрица А Ф 0—невырожденная. В самом деле, если Л=£0,
то по меньшей мере один из элементов аи Ьх матрицы А
отличен от нуля и потому определитель этой матрицы D=a21 + b\
не равен нулю.
Так как матрица А Ф 0 невырожденная, то для нее
существует обратная матрица. Найдем ее:
А~х =
где
D
D
а' V
-V а!
—действительные числа.
Мы видим, что получилась матрица того же множества М.
Теперь можно написать решение нашего уравнения. Это будет
127
X=A lB и, очевидно, A lB снова принадлежит М, так как
матрицы А~1 и В принадлежат М. Итак, мы показали, что
данное множество М относительно сложения и умножения
матриц образует поле.
Все выводы §§ 1 — 19 можно распространить и на любое
поле. Теория определителей, теория линейных уравнений,
теория линейных преобразований и матриц—все эти теории,
развитые нами для поля комплексных чисел, без всяких
изменений могут быть перенесены на случай произвольного поля Я;
придется только говорить не о числах, а о элементах
рассматриваемого поля Р.
Такое распространение выводов §§ 1 — 19 на случай любого
поля характерно для современной алгебры. Дело в том, что
в современной алгебре большую роль играет изучение
некоторых алгебраических операций над элементами некоторого
множества; как операции, так и элементы множества могут
быть самой разнообразной природы, важно лишь, чтобы
операции имели много черт, сближающих их с обыкновенными
арифметическими действиями. Чаще всего приходится иметь
дело с множествами, образующими по отношению к
вышеупомянутым операциям группу или кольцо (в частности, поле).
Такое расширение кругозора позволяет решить общими
методами ряд вопросов, не имеющих на первый взгляд прямого
отношения к алгебре. Так, например, теория групп и колец
с. успехом применяется в теории дифференциальных
уравнений, в топологии, в алгебраической геометрии, теоретической
физике и т. д.
Задачи. 1. Исследовать, образуют ли кольцо относительно
арифметических действий сложения и умножения: а) множество чисел вида а-\-Ьу2
где а, Ь—произвольные целые числа, б) множество правильных дробей,
в) множество целых чисел, кратных 3.
2. Исследовать, образуют ли поле относительно арифметических
действий сложения и умножения а) множество чисел вида а-\-Ьу2, где а, Ь —
любые рациональные числа, б) множество несократимых дробей —
Ь
(а, Ь — целые числа), у которых знаменатель делится на 5.
3. Показать, что если А Ф О -вырожденная матрица дг-го порядка (0
означает нулевую матрицу дг-го порядка), то А является делителем нуля
в кольце матриц дг-го порядка.
4. Исследовать, образуют ли поле относительно сложения и умножения
матриц а) множество матриц вида
II а 2Ь II
\\ Ь а\\
где а, Ь — произвольные рациональные числа, б) множество матриц вида
II а ЗЬ II
|| Ь а\\
где a, b — произвольные действительные числа.
128
5. Показать, что множество скалярных матриц п-го порядка с
произвольным действительным диагональным элементом образует поле
относительно сложения и умножения матриц.
6. Показать, что множество матриц п-го порядка вида
II а, 0 . . .011
0 02 . . . О I
||0 0 . . .ап\\
где av a2, .... ап — произвольные действительные числа, образует
коммутативное кольцо относительно сложения и умножения матриц, но не
образует поля.
§ 21. Изоморфизм. Группа
Одной из основных задач современной алгебры является
изучение свойств алгебраических операций. С алгебраической
точки зрения между множествами, ведущими себя одинаково
относительно установленных в них операций, нет никакого
различия, их можно считать как бы тождественными.
Рассмотрим, например, множество М скалярных матриц
второго порядка
II я О II
где а—произвольное действительное число. Мы будем эти
матрицы обозначать символом (а), так как они вполне
определяются числами а.
Легко видеть, что сложение и умножение матриц являются
алгебраическими операциями, определенными в множестве М:
\\а + Ь О II
II 0 а +Ь ||'
или
(а) + (Ь) = (а + Ь). (1)
ab О II
О ab Ц'
или
(a)(b) = (ab). (2)
Вместе с тем из равенств (1) и (2) видно, что сложение и
умножение матриц (а) и (Ь) сводятся к арифметическим
действиям сложения и умножения соответствующих чисел а и Ь.
Таким образом, если отвлечься от содержания, которое мы
вкладываем в понятие действительного числа и в понятие
скалярной матрицы второго порядка, и ограничиться только
рассмотрением операций над ними, то множество М и множество
действительных чисел можно считать тождественными между
собой. Мы подходим здесь к важному понятию изоморфизма.
А +В =
а О
О а
+
b О
О Ь
АВ=
а О
О а
b О
О Ь
129
Но прежде чем перейти к определению изоморфизма,
введем понятие взаимно-однозначного соответствия, которое, хотя
и относится к области теории множеств, но тем не менее
является основным для всех отделов математики.
Пусть А и В—два множества, состоящих из элементов
какой угодно природы. Предположим, что каждому элементу
множества А приведен в соответствие один элемент
множества В таким образом, что различным элементам из А
соответствуют различные элементы из В и в В нет элемента, который
бы не был приведен в соответствие некоторому элементу из А.
Тогда мы будем говорить, что элементы множеств А и В
связаны взаимно однозначным соответствием или что между
множествами А и В установлено взаимно-однозначное
соответствие
Приведем примеры, иллюстрирующие понятие
взаимно-однозначного соответствия.
Примеры. 1. Рассмотрим множество натуральных (т. е.
целых положительных) чисел
1, 2, 3, ... (Мг)
и множество натуральных четных чисел
2, 4, 6, . . . (Ж2)
Между этими множествами можно установить следующее
взаимно-однозначное соответствие: умножая каждое число
множества Мг на 2, получаем соответствующее ему четное число
из множества М2. Очевидно, что различным числ м множества
Мг будут соответствовать различные числа множества Ж2, и
для всякого числа 2k множества М2 можно указать число k
из множества Мъ которое при умножении на 2 дает
рассматриваемое число 2k.
2. Рассмотрим множество всех натуральных нечетных чисел:
1, о, Э, • » .
и множество всех натуральных четных чисел:
2, 4, 6, . . .
Каждому нечетному числу 2k+\ (&=0, 1,...) приведем
в соответствие четное число 2k + 2. Легко видеть, что
введенное соответствие является взаимно-однозначным соответствием
между рассматриваемыми множествами.
3. Рассмотрим в качестве А множество всех рациональных
чисел и в качестве В то же самое множество. Каждому
рациональному числу а приведем в соответствие а+1. Легко
видеть, что тогда получится вз имно-однозначное соответствие
множества рациональных чисел с самим собой. Однако это
130
далеко не единственное взаимно-однозначное соответствие.
Так, каждому рациональному числу а можно было привести
в соответствие а + 2, и получилось бы другое
взаимно-однозначное соответствие множества рациональных чисел с самим
собой.
Пример 3 свидетельствует о том, что между двумя
множествами можно установить в некоторых случаях не одно,
а несколько и даже бесконечно много взаимно-однозначных
соответствий.
Приведем еще один пример, показывающий, что не всякое
соответствие является взаимно-однозначным.
4. Возьмем в качестве А множество целых чисел:
0,±1,±2,±3, ...,
а в качестве В—множество всех квадратов целых чисел:
О, 1,4, 9, ...
Если каждому целому числу а ставить в соответствие его
квадрат а2, то это соответствие уже не будет
взаимно-однозначным между рассматриваемыми множествами. Действительно,
здесь различным целым числам могут соответствовать не
различные, а одинаковые квадраты. Например, числам 2 и —2
соответствует одно и то же число 4.
Теперь можно поговорить об изоморфизме.
Пусть в множестве А определена одна или несколько
алгебраических операций и столько же алгебраических операций
определено в множестве В, причем каждой операции из А
поставлена в соответствие определенная операция из В.
Обозначим через +,-, ... алгебраические операции в Л и через
©, О, ... соответствующие алгебраические операции в В.
Мы назовем множества А и В изоморфными (относительно
установленных операций), если между А и В можно
установить взаимно-однозначнее соответствие, обладающее
следующим свойавом: если элементам а, Ъ из А соответствуют в В
элементы а' и Ь\ то а + b соответствует a'®b\ ab
соответствует а'О ft' и т. д. При этом соответствие, обладающее
указанным свойством, мы назовем изоморфизмом, или
изоморфным соответствием.
Примеры. 1. Рассмотренное выше множество М
скалярных матриц второго порядка
(а)= (а—действительное число)
II0 а ||
изоморфно множеству действительных чисел.
В самом деле, каждой матрице (а) можно поставить в
соответствие действительное число а. Легко убедиться, что это
соответствие является взаимно-однозначным соответствием
131
между множеством М и множеством действительных чисел.
Далее, из равенств (1) и (2) видно, что если (а) и (&)—две
произвольные матрицы множества Ж, то их сумме (а) + (Ь)
соответствует сумма а-\-Ь чисел а и Ь, а их произведению
(а)(Ь) соответствует произведение ab чисел а и Ь.
2. Пусть М —множество всех матриц п-то порядка и L—
множество всех линейных, преобразований п. переменных. Мы
знаем, что всякое линейное преобразование 5 п переменных
взаимно-однозначно определяется матрицей А п-то порядка,
образованной из коэффициентов преобразования. Эгу матрицу А
мы и поставим в соответствие преобразованию S. Тогда у нас
получится взаимно-однозначное соответствие между
множествами L и Л/, причем сумме S+ Т линейных преобразований S
и Г множества L будет соответствовать сумма Л+ 5 матриц
А и В множества М, а произведению ST будет
соответствовать произведение АВ. Таким образом, множества L и М
изоморфны.
Понятие изоморфизма является характерной для алгебры
формой эквивалентности, какой для арифметики является
понятие равенства чисел, для теории множеств—понятие равенства
мощностей, для проективной геометрии—понятие
перспективного соответствия. С точки зрения алгебры изоморфные кольца
или поля одинаковы. Это и понятно—ведь современная алгебра
занимается изучением природы алгебраических операций, а не
изучением природы элементов кольца или поля. А с точки
зрения свойств операций изоморфные кольца или поля ничем
друг от друга не отличаются.
Такой взгляд придает алгебре ту же общность, какую
современной геометрии придает аксиоматическая точка зрения
Гильберта, позволяющая распространить ее выводы на объекты
любой природы, лишь бы они удовлетворяли ее аксиомам.
Рассмотрим теперь следующее важное свойство
изоморфизма.
Если кольцо К и множество К' с двумя определенными
в нем алгебраическими операциями изоморфны, то
множество К' также является кольцом (относительно своих
операций). В частности, если К—поле, то и К! будет
полем.
Доказательство. Будем для простоты
соответствующие операции множества К! обозначать теми же знаками +
и •, что и операции кольца /С, и называть их также
сложением и умножением. Покажем сначала, что сложение
элементов множества К' подчиняется коммутативному и
ассоциативному законам. Для этой цели возьмем из К три
произвольных элемента а\ Ь\ с'. Пусть а' соответствует элементу а
кольца /С, б'—элементу b кольца К и с'—элементу с кольца К.
Тогда в силу изоморфизма а + b будет соответствовать а' + Ь'
и b + а будет соответствовать Ь' + а'. Но а + b = b + а, так
132
как в кольце К сложение коммутативно. Следовательно, в силу
взаимно-однозначного соответствия иа' + b' = b' -{- а\ т. е. в К'
операция сложения также подчиняется коммутативному закону.
Затем, в силу того же изоморфизма а + (Ь + с) соответствует
а' + (b' -f О» а {а + Ь) + с соответствует (а! + Ь') + с'. Но
а + (Ь + с) = (а+ Ь) + с, так как в кольце К сложение должно
подчиняться ассоциативному закону. Следовательно, и а' +
+ (£' + О = (я' + *') + с\ т. е. в /С" операция сложения также
подчиняется ассоциативному закону. Аналогично
обнаруживается, что умножение в К' подчиняется ассоциативному и
дистрибутивному закону, а также, когда /С— коммутативное
кольцо, и коммутативному закону.
Остается показать, что в Л"' уравнение а' + х = Ь'
разрешимо. Действительно, в кольце К уравнение а + х = Ь
разрешимо, пусть элемент d кольца К удовлетворяет этому
уравнению: a + d=b, и пусть d соответствует элемент d'
множества А". Тогда сумме a + d будет соответствовать сумма
a' + d't a b будет соответствовать Ь'. Но a + d=b.
Следовательно, и a' + d'=b'§ т. е. уравнение а' + х = Ь' разрешимо
в К', его решением оказалось d'.
Итак, все условия 1°—4° (см. § 20), характеризующие
кольцо, для множества К! удовлетворяются, в силу чего /С'
образует кольцо. В частности, если К— коммутативное кольцо,
то, очевидно, и К' должно быть коммутативным кольцом.
В дополнение к сказанному отметим, что нулю 0 кольца К
должен соответствовать нуль 0' изоморфного кольца К!. В
самом деле, уравнению а + х=а соответствует в К' уравнение
а' + х = а' и решением первого уравнения является 0, а
второго—О'.
Наконец, покажем, что если К—поле, -то и К9 должно быть
полем.
Прежде всего ясно, что /С' должно быть коммутативным
кольцом, так как /С—коммутативное кольцо. Затем, если
элемент а отличен от нуля 0, то соответствующий ему в К
элемент а' также должен быть отличен от нуля 0'. Действительно,
если бы а' = 0\ то получилось бы, что двум различным
элементам а и 0 поля К поставлен в соответствие один и тот же
элемент 0' кольца К\ что противоречит взаимно однозначному
соответствию между К и /С'. Обратно, если а' Ф 0, то
подобным же образом убеждаемся, что и афО. Мы видим отсюда,
что в К' должен существовать по меньшей мере один элемент
а'ФО'. Рассмотрим теперь уравнение а'х=Ь' с а'ФО'. Так
как а Ф 0, то в поле К уравнение ах=Ь разрешимо: au = b, где
и—некоторый элемент К. Пусть и соответствует в К'
элемент и'. Тогда аи будет соответствовать а'и' и b будет
соответствовать Ь'. Но аи = Ь, следовательно, а!и' — Ъ\ т. е.
уравнение а'х = Ь' оказалось разрешимым в К'. Таким образом, мы
обнаружили, что /С' образует поле.
133
Между прочим, отсюда вытекает, что единице е поля К
должна соответствовать единица е' изоморфного поля К', стоит
только сопоставить уравнения ах —а и а'х = а' (афО).
Кроме колец, весьма важными среди множеств с
алгебраической операцией оказались так называемые группы. Они нашли
широкое применение в разнообразных разделах математики и
в естествознании.
Пусть в некотором множестве G определена какая-то
алгебраическая операция. Условимся записывать эту операцию
при помощи знака умножения • и называть умножением.
Множество G называется группой относительно умножения, если
1°. Умножение подчиняется ассоциативному закону,
(ab)c = a(bc) для любых элементов а, Ь, с из О.
2°. Среди элементов О существует по крайней мере один
такой элемент е, называемый единицей, что ае=еа = а для
любого а из G.
3°. Для всякого элемента а из О существует по крайней
мере один такой элемент а~1 из G, называемый обратным
элементом, что аа~1 = а~1а = е,гдее—по-прежнему единица О.
Если, сверх того, умножение всегда коммутативно (всегда
ab = ba), то группа О называется коммутативной или абеле-
вой, по имени впервые рассматривавшего эти группы
норвежского математика Н. Г. Абеля.
Укажем несколько примеров групп.
1. Множество рациональных чисел, если из него исключить
число 0, образует абелеву группу по отношению к
арифметическому умножению. При этом роль элемента е играет число 1,
роль обратного элемента для числа а —число —.
2. Множество рациональных чисел образует группу, и
притом опять-таки абелеву, по отношению к арифметическому
сложению. Но здесь роль элемента е будет играть уже не
число 1, а число 0, обратным элементом для а будет уже
не —, а —а (т. е. противоположное число).
3. Множество всех целых положительных чисел не
образует группы по отношению к арифметическому умножению,
так как условие 3° не выполняется. Например, если 3—целое
положительное число, то — уже не будет целым.
о
4. Рассмотрим множество А всех чисел вида а^Ь ]/\ где
а и Ь — всевозможные рациональные числа, не равные
одновременно нулю. Нетрудно убедиться, что это множество А по
отношению к арифметическому умножению чисел образует
группу. Но прежде всего надо показать, что действие
умножения чисел есть алгебраическая операция, определенная
в данном множестве Л. Так как однозначность умножения
134
очевидна, то все сводится к проверке выполнимости этого
действия в данном множестве А.
Перемножим два числа нашего множества:
a = a1 + b1V2 и $ = а2 + Ь2У~2.
Получим:
а$ = (ага2 + 2b1b2) + (агЬ2 + а2Ьг) V2.
Очевидно, что a1a2 + 2blb2 и alb2-\-a2bl также рациональные
числа. Покажем, что они не могут одновременно обращаться
в нуль. В самом деле, если бы было
аха2 -f 2bxb2=0, axb2 + а2Ьх=0,
то система двух линейных однородных уравнений
ахх-\- 2Ьху=0, Ьхх + аху=0
имела бы ненулевое решение х = а2; у = Ь2. Но это розможно
лишь в том случае, когда определитель системы равен нулю
а\-2Ь\=0.
Но из последнего равенства следует, что |/2 = ± —, т.е. по-
_ ь*
лучается противоречие: 1^2, число иррациональное в то же
время является рациональным.
Итак, наше действие выполнимо в А: а{3 есть снова число
того же множества А.
Теперь обратимся к условиям 1°—3°, характеризующим
группу. Условие 1°, очевидно, выполняется, так как
арифметическое умножение чисел подчиняется ассоциативному закону.
Столь же очевидна и выполнимость условия 2°, так как роль
элемента е играет число 1=1+0 V2.
Остается проверить последнее условие 3°. Пусть
а=ах + bx\r2
какое-нибудь число рассматриваемого множества. Положим
и найдем, чему равны х и у. С одной стороны,
аа"1 = (ахх + 2Ьху) + (аху + b{x) "j/2.
С другой.стороны, произведение аа~ должно равняться еди^
нице; следовательно, должно быть
ахх + 2Ьху = \, Ьхх + аху=0,
!Я5
откуда х= fl' , у = —*—-, причем л: иу рациональ-
ные числа и не обращаются одновременно в нуль. Таким
образом, мы нашли обратное число
а\ — 2Ь\ а\ — 2Ь\
принадлежащее нашему множеству, и теперь становится
очевидным, что множество А образует группу.
5. Мы знаем, что умножение подстановок /г-й степени есть
алгебраическая операция, определенная во множестве Sn всех
подстановок /г-й степени. Мы знаем также, что умножение
подстановок подчиняется ассоциативному закону, но не
подчиняется коммутативному закону; роль элемента е играет
единичная подстановка; для всякой подстановки существует
обратная подстановка. Следовательно, множество Sn образует группу,
и притом неабелеву относительно операции умножения
подстановок.
Эту группу Sn обычно называют симметрической группой
подстановок /г-й степени.
6. Неабелеву группу образует и множество N всех
невырожденных матриц /г-го порядка по отношению к умножению
матриц.
В самом деле, произведение двух и нескольких
невырожденных матриц /г-го порядка в свою очередь является
невырожденной матрицей /г-го порядка. Таким образом, умножение
матриц есть алгебраическая операция, определенная в
множестве N. Умножение матриц, как известно, подчиняется
ассоциативному закону, но не подчиняется коммутативному закону.
Далее, роль е играет единичная матрица /г-го порядка Е. Эта
матрица Я, очевидно, невырожденная и потому принадлежит
нашему множеству N. Наконец, для всякой невырожденной
матрицы /г-го порядка существует обратная матрица, которая
также является невырожденной.
Вернемся к теории групп. Понятие произведения двух
элементов группы было введено уже в определении алгебраической
операции. Произведение нескольких элементов вводится так же,
как это было сделано для кольца, и совершенно так же
получается, что во всяком произведении /г(/г>2) элементов группы
скобки можно расставлять произвольно (сохраняя порядок
следования сомножителей). Затем так же, как и в случае кольца
и поля, обнаруживается единственность единицы е, обратного
элемента яГ1, вводится понятие целой степени и показывается
справедливость обычных правил возведения в степень:
„т„п „п„т „т4-п („т\п „тп
а а =а а =а ^ , [а ) =а
136
для любых целых т и п. Для абелевых групп, сверх того,
должно, очевидно, выполняться правило (ab)n=anbn, где /г—по-
прежнему целое число.
Относительно изоморфизма групп можно высказать
следующее: если группа О и множество G' с одной определенной
в нем операцией изоморфны, то G' также является группой.
При этом единице е группы О будет соответствовать
единица е' группы G', а если элементу а из О соответствует
элемент а' из 0\ то обратному элементу а~1 группы О
будет соответствовать обратный элемент а'~1 группы G'.
Мы опускаем доказательство, так как оно мало отличается
от доказательства аналогичного свойства для колец.
Исторически развитие теории групп шло в следующем направлении.
Понятие группы подстановок впервые было сформулировано с необходимой
отчетливостью французским ученым Эваристом Галуа (1811—1832) в связи
с проблемой решения алгебраических уравнений в радикалах. С этого
момента начинается первый этап развития теории групп, как теории групп
подстановок. В дальнейшем, однако, оказалось, что весьма большое количество
свойств, найденных в теории групп подстановок, можно перенести на
произвольную конечную группу, т. е. группу, состоящую из конечного множества
элементов. В связи с этим теория групп стала развиваться, главным образом, как
теория конечных групп. Наибольшего расцвета теория конечных групп достигла в
конце прошлого и в первые десятилетия настоящего столетия. В связи с
потребностями смежных областей математики (геометрии, топологии, теории
автоморфных функций и ряда других разделов) и естествознания примерно
в 20-х годах нашего столетия начинает интенсивно развиваться общая теория
групп, в которой теория конечных групп является лишь отдельной главой.
Основателем первой русской алгебраической школы был Д. А. Граве —
ученик гениального русского математика П. Л. Чебышева. Из этой школы
вышли такие известные алгебраисты, как Б. Н. Делоне, Н. Г. Чеботарев и
О. Ю. Шмидт.
Вышедшая в 1916 г. книга О. Ю. Шмидта „Абстрактная теория групп"
положила начало интенсивным исследованиям в области теории групп в
нашей стране. В этой книге впервые в мировой литературе излагались основы
теории групп без предположения о конечности группы.
Большую роль в дальнейшем росте исследований советских ученых в
области теории групп сыграл алгебраический семинар при Московском
государственном университете, организованный в 1930 г. О. Ю. Шмидтом. Этот
семинар оказал существенное влияние на формирование целого ряда
советских алгебраистов (А. А. Кулаков, А. Г. Курош, А. И. Мальцев, С. А. Чу-
нихин, С. п. Черников и др.), многие работы которых явились большими
достижениями в области теории групп 1.
Исследования советских алгебраистов в области теории колец по своему
размаху пока несколько уступают исследованиям по теории групп. Однако
и в этой области можно отметить много интересных работ, относящихся к
самым разнообразным разделам теории колец. К сожалению, рассматриваемые
в этих работах вопросы выходят за рамки нашей книги. Укажем только, что
теория колец нашла себе применение за пределами алгебры в вопросах
математического анализа (например, работы московского математика И. М. Гель-
фанда в области теории нормированных колец).
1 Недавно скончавшийся акад. О. Ю. Шмидт был выдающимся ученым
не только в области математики. Он возглавлял знаменитые арктические
экспедиции и был создателем одной из современных космогонических теорий.
137
Наконец, упомянем о важных исследованиях советских ученых Л. С. Пон-
трягина и А. И. Мальцева по теории топологических групп, теории уже
находящейся на грани алгебры.
Задачи. 1. Показать, что множество Мг матриц вида
II а ЗЬ II
где а, Ь—рациональные числа, изоморфно с множеством М2 чисел вида
a -h b }/~3 . При этом в качестве алгебраических операций в Мх
рассматриваются сложение и умножение матриц, а в М,—арифметические действия—
сложение и умножение. Показать, что множество чисел М2 образует поле
(относительно рассматриваемых арифметических действий). Какой отсюда
получается вывод для множества матриц Л^?
2. Показать, что множество матриц вида
II а ° II
II ° Ь II
где а, Ь—произвольные целые числа, образует коммутативное кольцо
(относительно сложения и умножения матриц). Показать, что это кольцо не может
быть изоморфно ни с одним множеством чисел, в котором в качестве
алгебраических операций определены арифметические действия—сложение и
умножение.
3. Показать, что множество чисел вида а + Ь у/*Ь, где а, Ь —
рациональные числа, не равные одновременно нулю, образует абелеву группу по
отношению к арифметическому умножению. Образует ли это множество группу
по отношению к арифметическому сложению?
4. Показать, что совокупность элементов кольца по отношению к
операции сложения образует абелеву группу и совокупность элементов поля,
если исключить нуль, образует по отношению к операции умножения
также абелеву группу.
глава четвертая
КОЛЬЦО МНОГОЧЛЕНОВ ОТ ОДНОГО НЕИЗВЕСТНОГО
§ 22. Комплексные числа
До сих пор мы ограничивались тем представлением о
комплексных числах, которое сложилось в средней школе. Но в
элементарной алгебре понятие комплексного числа вводится
так, что невольно возникают сомнения в законности и
реальности этого понятия. А между тем комплексные числа
способны описывать количественные соотношения между теми или
иными явлениями окружающего нас мира ничуть не хуже, чем
действительные числа. Например, теория функций
комплексного переменного широко применяется в гидродинамике, в
аэродинамике, в электротехнике и во многих других областях.
Исторических понятие комплексного числа возникло в связи
с извлечением корня квадратного из —1. Но комплексные
числа перестали быть „мнимыми" и приобрели право
гражданства после того, как они получили геометрическое
истолкование и стали изображаться векторами на плоскости. С этого
момента они начали широко применяться в самых
разнообразных областях математики и техники.
Таким образом, для построения поля комплексных чисел
естественно обратиться к множеству К всех двумерных
векторов z=(a%b) с действительными компонентами а и Ь. Если
сложить два каких-нибудь вектора zL— (au bL) и z3=* (Og, b2)
из множества К, то получится вектор zt+z2= {аг + аъ bx + bz),
имеющий также действительные компоненты аг + а2 и Ьх + Ьъ
т. е. вектор, принадлежащий также множеству К.
Следовательно, сложение векторов является алгебраической операцией,
определенной в К.
Мы знаем, что сложение векторов подчиняется
коммутативному и ассоциативному законам. Покажем еще, что в
множестве К уравнение z1 + u=z2i всегда разрешимо. Для этой цели
рассмотрим разность
z?—*i= (#2—аи Ьъ—Ьг).
139
Мы видим, что а2—ах и Ь2—Ьг также действительные числа.
Следовательно, уравнение z1 + tt^z2 разрешимо в К: его
решением является вектор и = (а2—аъ Ь2—Ьг), принадлежащий
тому же множ ству К.
Кроме сложения, мы довольно широко пользовались
действием умножения вектора на число. Это действие, как
известно, обладает свойством дистрибутивности, т. е. если аг и
а2—два произвольных /г-мерных вектора и а, Ь—два
произвольных числа, то
а(ах + а2) =ааг + аа2, (а + b)a1=aa1+ba1.
Операцию умножения векторов множества К введем таким
образом, чтобы К стало полем. Для этой цели представим
произвольный вектор z = (a, b) из К в следующем виде:
«=(а,0) + (0,*)=а.(1,0)+*.(0.1).
или, окончательно,
z=ae + Ы,
где e=(lf(jy. i = (0, 1). Обращаем внимание на то, что роль
коэффициентов при ей/ играют компоненты а и b вектора г.
Операцию умножения векторов определяем при помощи
трех условий:
1°. Если z1=a1s. + bxi и z2 = a2e + b2i—dea вектора из К, то
z1z2 = a1a2-z2 + агЬ^и + а2Ьг-к-\- ЬгЬ2-12
(правило умножения двучлена на двучлен).
2°. Вектор е является единицей по отношению к i и
самому себе: u = h = i, е2=е, a i2 есть вектор того же
множества К: i2 = кг + И, где k и I—некоторые действительные
числа.
3°. Произведение zxz2 векторов zx и z2 множества К,
отличных от нуля (т. е. от нулевого вектора (0, 0)), также
отличноfom нуля {отсутствие делителей нуля в К).
Мы утверждаем, что введенное нами умножение векторов
является алгебраической операцией, определенной в /С, и
подчиняется коммутативному, ассоциативному и дистрибутивному
законам, т. е. К образует коммутативное кольцо
относительно сложения и умножения векторов.
Действительно, из условий 1° и 2° получается, что
z1z2 = a1a2Q + axb2i -f a2bxi + ЬгЬ2 (ke + li).
Отсюда, пользуясь тем, что сложение векторов подчиняется
коммутативному и ассоциативному закону, а умножение век:
тора на число дистрибутивно, находим окончательное
выражение Z&:
zlz2 = (a1a2 -f bxb2k) е -f \bxa2 + (ax \ 1Ьг) b2]i.
140
Мы видим, что zxz2 имеет также действительные компоненты
tfitfj-f bxb2k и bxa2 + (ах + lbx)b2 и, тем самым, принадлежит К\
Подобным же образом
z2zx = (axa2 + bxb2k) е + [Ьха2 + (ах + lbx) b2] L
Произведения zxz2 и z2zx оказались равными, следовательно,
умножение векторов множества К подчиняется
коммутативному закону. Предоставляем читателю при помощи аналогия-
ных выкладок убедиться, что умножение подчиняется
ассоциативному и дистрибутивному законам.
Итак, относительно операций сложения и умножения
векторов множество К образует коммутативное кольцо.
Посмотрим, что дает условие 3° (отсутствие в К делителей
нуля). Пусть гхфО, а zxz2=0. Тогда, с одной стороны,
получается, что
%= (^2 + bxb2k) е -f [bxa2 + (ах + lbx) b2] i=0,
откуда компоненты вектора zxz2 должны равняться нулю:
аха2 + bxb2k=0, bxa2 + (ах + lbx) b2=0.
С другой стороны, согласно условию 3° должно быть z2=0,
откуда а2 = 0, Ь2=0.
Таким образом, система линейных однородных уравнений
ахх + kbxy=0, Ьхх + (ах + 1Ьх)у=0
(аь Ьх не равны одновременно нулю) должна иметь только
нулевое решение, в силу чего определитель системы
Л =
ах kbx
bx ax -\- lbx
— ах -f- laxbx—kb\
должен быть отличен от нуля при любых действительных аХу
Ьх, не равных одновременно нулю.
Возникает вопрос: можно ли действительные числа k и /
подобрать так, чтобы Д^-0? Легко убедиться, что такой
выбор k и I возможен. А именно, полагая &*= — 1, /=0, получаем,
что
Ь = а\ + Ъ\фО
при любых действительных ах, Ьх, не равных одновременно нулю.
Нетрудно, далее, убедиться, что при выбранных значениях
& =—1, /=0 коммутативное кольцо К образует поле1.
Обратимся к уравнению
*1«-28. (1)
1 Впрочем, К образует поле и для любых k и /, при которых Д Ф О для
всех действительных alt blt не обращающихся одновременно в нуль.
141
где по-прежнему z1 = a1e -f bxi Ф 0 и z2 = a2e + Ь21, и положим
u=xz + yi. Подставляем эти выражения ги z2, и в уравнение (1)
и перемножаем Zi и и, руководствуясь правилом 1° умножения
двучлена на двучлен и тем, что условие 2° при выбранных
значениях й = —1, /=0 превращается в ei = U = i, e2=e, j2 = —г.
Получаем:
(ахх—Ьгу) е + (Ьхх -f #iy) / = #2S + М>
откуда:
#i*—&1У = аъ Ьхх + аху = Ь2.
Определитель этой системы линейных уравнений а1-\-Ь]фО
при ггфО. Следовательно, эта система однозначно
разрешима относительно х> у и потому уравнение (1) при z1^~0
также однозначно разрешимо относительно и.
Итак, мы установили, что К является полем.
Выделим в поле К подмножество D векторов вида as, где
а—произвольное действительное число. Поставим в
соответствие каждому действительному числу а вектор ае:а^>аг(->
есть знак соответствия). Тогла получится взаимно-однозначное
соответствие между множеством D действительных чисел и
множеством D. Пусть Ь—еще какое-нибудь действительное
число. Тогда b -> Ы и ,
а + b -► (a + b) г=аг -f be, ab -► аЫ = (аг) (be). _
Таким образом, поле D действительных чисел и множество D
оказались изоморфными и потому D также является полем.
Назовем теперь некоторую часть Р' элементов
произвольного поля Р подполем Я, а само Р—расширением Р\ если Рг
в свою очередь образует поле относительно тех же самых
алгебраических операций + и • . _
Из этого определения вытекает, что D является подполем
поля К. Отметим также, что умножение произвольного вектора
г = (а, Ь) из К на вектор сг из D будет равносильно
умножению z на число с:
(се)г = (се) (ае-\- bi) = ac-z2 + bc-u = ac-e + bei = c-z.
В силу изоморфизма полей D и D мы можем считать
тождественными число а и вектор as, т. е. мы можем положить
ае=а для любого а. Благодаря этому отождествлению D
превратится в поле D действительных чисел, а поле К будет
расширением поля D. При этом умножение вектора z из К на
действительное число с совпадает с алгебраической операцией
умножения элементов поля К.
Возьмем, далее, какое-нибудь z—at-\ bi. Так как е —1-з
отождествляется с числом 1, то вектор г можно представить
в следующем двучленном виде: z = a-\-bi. Что же собой
представляет /? Возведем i в квадрат. Тогда согласно условию 2°
142.
получится, что i2 = k + li— — 1, так как /& = —1, /=0. Мы видим,
что / не что иное, как корень уравнения х2-\-\=0.
Итак, расширение К поля действительных чисел
представляет собой совокупность элементов вида а + Ы, где а, Ь—
произвольные действительные числа, a i=Y — 1.
Построенное таким образом расширение /С поля D мы будем
называть полем комплексных чисел. Вместе с тем мы будем
также называть полем комплексных чисел всякое поле,
изоморфное К.
Мы получили комплексное число z = a+bi в виде суммы
двух слагаемых а и Ы. Принято а называть действительной
частью, Ы—мнимой частью и b коэффициентом мнимой части
комплексного числа. Само i называется мнимой единицей. На
основании понятия равенства двух векторов имеем, что два
комплексных числа z1 = a1 + b1i и z2 = a2-\-b2i равны тогда и
только тогда, когда равны их действительные части и
коэффициенты мнимых частей: a1 = a2i Ьг = Ь2. В частности, число
z = a + нравно нулю лишь в том случае, когда равны нулю
действительная часть и коэффициент мнимой части.
Согласно определению сложения векторов получаем, что
*i + 22 = К + bxi) + (a2+fc2i) = (a1 + а2) + (Ьх + Ь2) /,
т. е. при сложении комплексных чисел складываются отдельно
их действительные части и отдельно коэффициенты мнимых
частей. Подобное же заключение можно вывести и
относительно вычитания:
гг—z2={ax + V) ~ (d2 + b2i) = (a1—a2) + (b1 — b2)L
Согласно условию 1° комплексные числа можно
перемножать по правилу умножения двучлена на двучлен:
z1z2=(a1 + bxi) (a2 + b2i) = a1a2 + axb2i -(- а2Ьг1 + bxb2i2.
Если теперь заменить I2 через —1 и воспользоваться
коммутативным, ассоциативным и дистрибутивным законами
сложения, то окончательно получится следующее:
г1г2=(а1а2—ЬгЬ2) + (агЬ2 + a2bx) L
Исходя из того, что /С—поле, деление комплексных чисел
можно провести в таком направлении. Назовем два
комплексных числа сопряженными, если они отличаются друг от друга
только знаком при мнимой части. Например, 2—i сопряжено
с 2 + L Обозначим через z число, сопряженное z. Легко
показать, что произведение zz есть действительное число; в
самом деле:
zi=(a + Ы) (а-Ы) = а2-ЬЧ2=а2 + ЬК
143
Теперь найдем частное —комплексных чисел г^^+^/^О
zi
и z2-a2 + b2i. Очевидно, что— не изменится при умноже-
*i
нии числителя и знаменателя на одно и то же число zly
сопряженное гг\ __
_£l = £i12, (2)
Zi Zfr
так как соблюдается условие равенства дробей: z2-z1z1=z1-zlz2
(см. свойства символов — на стр. 122). Но z±zx = а] +
^.Следовательно, заменяя в правой части равенства (2)
произведение zxzx величиной al + b\, окончательно получаем, что
О)
z2 z}z2
zj ~~ a\ + b\ '
и „ 1+2/
р и м е р. Найти частное —•—.
э формуле (3) имеем:
1 + 2/ _ (7 — 5/) (1 + 21) _ 17 + 9/
7 + 5/ 72+ 52 ~~ 74
74 74
Мы убедились выше, что в поле комплексных чисел можно
извлечь корень квадратный из —1, а именно У~—\ есть
мнимая единица /. Оказывается, что в этом поле возможно
извлечение корня квадратного не только из — 1, но также из
всякого комплексного числа.
Для доказательства напишем уравнение:
х + iy = "J/ а + Ы\
здесь х и у—неизвестные, их надо определить. Если обе части
уравнения возвести в квадрат, то получится:
(х2—у2) + 2xyi=a + Ы.
Но два комплексных числа равны, когда равны их
действительные части и коэффициенты мнимых частей. Следовательно,
х2—у2=а, 2ху = Ь.
Возведем эти равенства во вторую степень и сложим. Получим:
(л;2 + у2)2=а2 + &2,
или
х2 + у2= + уа2+Ь1\
144
Корень квадратный мы взяли со знаком плюс, так как
действительное число х2 -\- у2 не может быть отрицательным. Итак:
х2 + у2 = + Va2+b\ х2-у2 = а.
Решая эти уравнения относительно х2 и у2, без труда находим,
что
^2_ а + у^ + ь* <>2_ -а + уа2 + ь*
Х 2 ' У~ 2 '
откуда:
*=±/a+Va;+b\ y=±yr-a+/2a2+bJ. (4)
При выборе знаков для х и у следует иметь в виду, что
2ху = Ь, т. е. л: и у имеют одинаковые знаки, если £>0, и
разные, если Ь < 0.
Рассмотрим, далее, квадратное уравнение
z2 + pz + q = 0 (5)
с комплексными коэффициентами. При помощи тех же
преобразований, что и в элементарной алгебре, мы получим
обычную формулу
для вычисления корней уравнения (5). Очевидно, что
преобразования, приводящие к формуле (6), вполне законны, так
как они опираются только на основные алгебраические
свойства операций сложения и умножения элементов поля.
Из формулы (6) видно, что решение крадратного уравнения
(5) сводится к извлечению квадратного корня из комплексного
р2
числа — <7, а такое извлечение, как мы уже установили, в
поле комплексных чисел всегда выполнимо.
Итак, мы обнаружили, что в поле комплексных чисел
разрешимо любое квадратное уравнение.
Примеры. 1. Уравнение
z2 + 2z + 2=0
не имеет действительных корней, так как
-f -<7 = l-2=-l<0.
Зато оно имеет комплексные корни:
j/f^7=-l-/=T=-l-<.
145
..—f-
2. Решим квадратное уравнение
г2— (4-6/) г + (10-20/) -0.
Здесь р = — (4—6/), <7 = 10—20/; поэтому
-2l -q= (2—302—(Ю—200 =-15 + 8/.
Извлекаем корень квадратный из комплексного числа —15 + 8/
при помощи формул (4). Достаточно для х взять один знак,
например плюс:
х= /"-15 + /Т5Н^ = у^— 15 + 1/289 = yj = ^
Для у придется взять тот же знак плюс, так как 2л:у=
*=Ь=8 положительно. Следовательно:
-=|/ii±22^.9 = /T6=4,
откуда
/-15+ 8/ = 1+4/
и
z1=(2-3/) + (l+4/)=3 + /,
z2= (2-3/) - (1 + 4/) = 1 - 71.
При построении поля комплексных чисел К мы выбрали в
условии 2° /г = — 1, 1=0. Оказывается, что при любом выборе
значений k и /, при которых выполняется условие 3°
(отсутствие делителей нуля), получающееся поле с точностью
до изоморфизма есть поле комплексных чисел.
Доказательство. Обозначим через К' кольцо двумерных векторов
(at b) с действительными компонентами, которое получается при другом
выборе значений k и /, чем при построении поля комплексных чисел. Затем,
чтобы избежать нежелательного смешения с мнимой единицей, обозначим
векторы (1, 0) и (0, 1) через et и е2. Определитель А, который мы выше
рассматривали, можно преобразовать так:
4_(,+i)'_(i+t).
Отсюда видно, что А тогда и только тогда отлично от нуля при любых дей-
/2
ствительных аь Ьъ не равных одновременно нулю, когда \- k отрица-
4
/2
тельно. Следовательно, можно положить 1- k = — d2, где d — действи-
4
тельное число. Согласно условию 2° z\ = ktx + /e2. Прибавим к обеим частям
/2 /2
этого равенства — ихг2 -| е2 =.-— /е2 -f — е1в Получим:
4 * 4
•2 —/6,6,
.+-=-•!-— ms
146
или
.0 . 2s.> — /ei
у2 = — еь где у = —— -.
2d
Очевидно, что всякий вектор (а, 6) = агх + 6£2 из /С' можно выразить
2d/ + /e
через £i и у: е2 = и
2
2d/ 4 U.
агг + 6е2 = ait + 6 = а'в1 + b'j,
где а' = а 4 , Ь' = 6d.
2
Легко показать, что если a'el-f6/y==0, то действительные числа а'
и 6' также равны нулю. В самом деле, умножая обе части равенства a'tx -f
+ 6'/ = 0 на artx — b'j} получаем:
fl'2e2-6'V = 0, или (а'24-*'2)е1==0,
так как ej = elt /2 = — £,. Отсюда следует, что а'2 + б'2 = 0, а это
возможно только при а' = Ь' = 0.
Итак, каждый вектор кольца К' выражается в виде azv -f- bj, где a, b —
любые действительные числа.
Поставим теперь в соответствие каждому комплексному числу а -+- Ы
вектор aej -f bj кольца /(':
1 a + Ы -»aei + 6/. (7)
Соответствие (7) является не только однозначным, но и
взаимно-однозначным, так как если а{ 4- b{i -> a^i + bj и а, б, 4- &i/ = a£i 4- &/. то (aL — a) £j +
4- (bi — 6) у = 0, откуда по доказанному выше
a! — a = 0, 6i — b = О, или aY = a, ^ = 6.
Далее, находим, что
(а 4- Ы) + (a, 4- W) = (а + fli) + (* + *i)< -* (a + аО Ч + (Н *i)/ =
= (as1 + 6/)4-(al£i4-V):
(а 4- bi) (fli 4- V) = (aa{ — 6^) 4- (^i^ 4- abx) i -* (a^ — M>x) ej 4- (a^ 4- abL)j =
= (a£i + 6/)(aiei +bij).
Таким образом, кольцо векторов К' оказалось изоморфным полю К
комплексных чисел, что и требовалось показать.
Задачи. 1. Извлечь корень а) Yl — i, б) }Лэ 4-8/, в) ]/10 — 3/.
2. Решить квадратное уравнение
(2-0*2 4- (1+0* + (3-20 = 0.
§ 23. Геометрическое представление
комплексного числа
Возьмем на плоскости прямоугольную систему координат
XOY (черт. 1). Тогда мы можем комплексное число z=a + bt
геометрически представить вектором, оканчивающимся в точке
М с координатами (a, b). Очевидно, что нулю будет соответ-
147
ствовать начало О, действительному числу — вектор, лежащий
на оси ОХ, а числу Ы (так называемому мнимому числу) —
вектор, лежащий на оси OY. Поэтому ось абсцисс мы будем
называть действительной осью, а ось ординат — мнимой осью,
у При этом сумма и разность
PlfaQ двух комплексных чисел zx =
' ' =a + bi и z2 = a1-j-&1/
получают весьма наглядное
истолкование, а именно: пусть число
Zj изображается вектором ОМ,
а число z2 — вектором ОМх
(черт. 2). Тогда диагональ ON
параллелограмма OMNM1
будет суммой векторов ОМ и
ОМ,.
Черт. 1
ON=OM + OM,.
При этом конец N вектора ON будет иметь координаты
a + au b + Ь1ш Действительно, проектируя треугольник OMN
на ось ОХ, получаем, что
пр. ON=пр. ОМ + пр. MN.
По
Черт. 2
Но-
пр. ОМ^а, пр. MN=up. ОМ1 = аъ
откуда окончательно
пр. ON=a + ax.
Затем, проектируя треугольник OMN на ось OY, найдем
подобным же образом, что проекция ON на ось ординат равна
ь + ьг.
Итак, геометрически сложение комплексных чисел
производится по правилу параллелограмма: надо по этому правилу
148
складывать соответствующие векторы, имеющие начало в
точке О.
Обратная операция, вычитание, допускает аналогичное
истолкование, а именно: разность z1—z2 можно записать в виде
суммы zx + (—z2). Если комплексному числу z2 соответствовал
вектор ОМ1} то теперь числу —z2 соответствует вектор ОМ2,
имеющий ту же длину, что и ОМъ но направленный в
противоположную сторону (см. черт. 2). Складывая два вектора ОМ
и ОМ2у получим вектор ОР> изображающий разность гх—z2.
Чтобы дать геометрическое истолкование операции
умножения, вернемся к чертежу 1. Вектор ОМ> изображающий
число z = a-\-bi, вполне определяется расстоянием г его конца
М от начала координат и углом наклона ср к оси ОХ. В
сущности говоря, г и ср суть не что иное, как полярные
координаты точки М. Из чертежа легко усмотреть, что
г=Уа1 + b2, a = rcoscp, & = r sin ср.
Расстояние г есть величина существенно положительная;
поэтому корень квадратный следует брать со знаком плюс. Таким
образом, z = rcoscp +/rsin ср или, вынося г за скобку, z =
=r (cos ср -f- / sin ср). Мы получили так называемую
тригонометрическую форму комплексного числа. При этом г называется
модулем числа z и обозначается через \z\. Полярный угол ср
называется аргументом или амплитудой числа z; для него
принята следующая запись: cp=argz. Для положительных
действительных чисел аргумент равен нулю, а для
отрицательных—равен 1С.
Пример. Привести к тригонометрическому виду z = — \—i.
Прежде всего находим модуль и аргумент. Так как здесь
а = —1, Ь =—\, то
r=/(-l)a + (-l)a =Vr2; coscp = ^-=-^-,
ь уТ
sin cp= — =— ^—.
т г 2
Отсюда: <р = —- и
4
г= |/2 (cos — + / sin —J.
Заметим, что в силу периодичности тригонометрических
функций аргумент определяется с точностью до числа,
кратного 2ic. В нашем примере вместо ср = —- можно было взять
ср= — -f-2« и вообще ср= — + 2Атс (k—целое число).
149
Посмотрим теперь, по какому правилу перемножаются и
делятся комплексные числа, заданные в тригонометрической
форме. Пусть
г1^г1 (cos cpx + /sin cpu), z2=r2 (cos cp2 + /sin cp2).
Умножим zx на z2:
ZiZ2 = ri (cos cpi + i sin cpx) r2 (cos <p2 + / sin <?2) =
= rxr2 [(cos cp1coscp2—sin cpx sin cp2) + / (sin cpx cos cp2 + cos<PiSin<p2)].
Ho
COS ft COS cp2—Sin cpx Sin cp2 = COS (cpi + cp2),
sin cpx cos cp2 + cos cpx sin <p2=sin (<Pi + <p2).
Следовательно:
ZiZ2=>V2 [cos (cpx + cp2) -f /sin (cpi + cp2)].
Вообще:
ZiZ2 .. . гп=ггг2 ... rn [cos (cpx + cp2 + ... -u ?л) +
+ /Sin(cp1 + cp2+ . . . +cpj],
т. е. при перемножении комплексных кисел их модули
перемножаются, а аргументы складываются.
Это правило умножения допускает следующее
геометрическое истолкование: если вектор ОМ, соответствующий числу zu
повернуть против часовой стрелки на угол, равный аргументу
z2, а затем его растянуть в г2 раз, то в результате получится,
вектбр ОК, изображающий произведение zxz2.
Переходим теперь к делению. Частное двух комплексных
чисел zx = rx (coscpi + i sin cpx) и z2 = r2(cos cp2 +/sincp2) можно
записать в виде произведения:
f -*-(ir) (г^°>-
Таким образом, все сводится к отысканию обратного числа — .
Пусть
— =p(cosO + i sin 6);
Р и 6 пока неизвестные величины, их мы должны найти. По
определению обратного числа имеем:
z2— =r2 (cos cp2 + /sin cp2).p (cos 8 -f /sin 6) = 1,
или после перемножения
pr2 [cos (ср2 + 6) + / sin (ср2 + 0)] = 1.
150
Так как модуль единицы равен 1, а ее аргумент равен нулю,
то получаем:
Р^2 = Ь ?2 + 6-0,
откуда р= —, 6 = —ср2. Итак, — найдено:
1~ = 7Г [cos ("?») + lsin (—?2)]-
Теперь можно написать, чему равно частное — :
iL = n (cos ?! + i sin cpx). — [cos (—ср2) + j sin (—ср2)] =
= -£- [COS (cp!-cp2) + | sin (cp!-cp2)],
т. е. /г/7^г делении комплексных кисел их модули делятся,
а аргументы вычитаются.
Как видим, тригонометрическая форма комплексного числа
имеет некоторые преимущества перед обычной двучленной
формой а + Ы, так как позволяет с большей простотой
перемножать и делить комплексные числа. Эти преимущества
обнаруживаются также при возведении в степень.
Руководствуясь правилом умножения комплексных чисел,
заданных в тригонометрической форме, без труда находим, что
[r(coscp + /sincp)]" = r" [cos (я?) + isin(лгср)], (1)
где п—целое положительное число. Получилась так
называемая формула Муавра, которая выражает следующее простое
правило: при возведении в целую положительную степень
модуль возводится в эту степень, а аргумент умножается
на показатель степени.
Интересно отметить, что формула Муавра позволяет
выразить косинус и синус кратного угла щ через cos <р и sin ср.
Именно, если возвысить левую часть равенства (1) по биному
Ньютона и затем сравнить слева и справа действительные
части и коэффициенты при /, то получится:
cos/*cp = cosn ср—C^cos^cpsin2? -f CnCOsn~4cpsin4cp— . . . ,
sin/icp = /zcosn"1cpsincp—Сл cos""~3cp sln3cp -f- CnCOs""5cpsin:>cp— ... ,
где С*—биномиальные коэффициенты:
rk_ /i(/i —1) . . . (/i —fe+ 1)
151
Например, полагая п=2 и #=3, получаем следующие
формулы:
cos 2cp=cos2 cp—sin2 cp, sin 2cp = 2 sin о cos cp,
cos 3 ср = cos3 cp—3 cos cp sin2 cp, sin 3cp = 3 cos2 cp sin cp—sin3 cp.
Остановимся несколько подробнее на понятии модуля. Мы
ввели для модуля комплексного числа то же обозначение, что
и для абсолютной величины действительного числа, и сделали
это совершенно сознательно. Всякое действительное число а
можно рассматривать как комплексное число а-\- Ыу у
которого Ь=0. Поэтому модуль а равен
Но в свою очередь у а2 есть не что иное, как абсолютная
величина а. Следовательно, в случае действительного числа
понятия модуля и абсолютной величины совпадают.
Мало того, в поле комплексных чисел модуль обладает
всеми свойствами абсолютной величины, а именно:
I. Модуль произведения равен произведению модулей:
Это следует из правила умножения комплексных чисел,
заданных в тригонометрической форме.
II. Модуль суммы меньше или равен сумме модулей и
больше или равен разности модулей:
|*1 + *2|< 1*1 1+1**1, |*l|-|*2|<|*l + *2|.
Рассмотрим случай, когда векторы, соответствующие гх и
z2, не лежат на одной прямой. На чертеже 2 векторы ОМ,
ОМх и ON изображают соответственно числа zly z2 и Zi + z2.
Обращаясь к треугольнику OMN, видим, что длина стороны
ОМ равна | zx |, длина стороны MN равна | z21 и длина
стороны ON равна |Zi + z2|. Сумма двух сторон треугольника
больше его третьей стороны, а разность—меньше третьей
стороны. Поэтому можно написать следующие неравенства:
I гг + z21 < | гг | + | z21, | гг \ - \ z21< | гг + z2 \.
Рассмотрим теперь случай, когда аргумент zx равен
аргументу z2 или отличается на тс. Геометрически это означает,
что векторы ОМ и ОМх лежат на одной прямой (см. черт. 3
и 4). Если ОМ и ОМг направлены в одну сторону (см. черт. 3),
то Izj + Zgl = |Zi| + |z2|, \zl\ — \z2\<\z1 + z2\. Если ОМ и
ОМх направлены в разные стороны (см. черт. 4), то длина
вектора ON будет, очевидно, равна абсолютной величине разно-
152
сти длин векторов ОМ иОМ±\ иными словами, \z1 + z2\ =
= 11 zx |—| z211. Отсюда следует, что
I *i + *21 < I гх | + I z21, I Zi |-| z21 < | zx + z21.
Итак, свойство II модуля доказано для всех возможных
случаев.
Отметим еще одно свойство модуля. Обозначим разность
z1—z2 через z. Тогда zl = z2 + z и, пользуясь свойством II
модуля, получаем:
\*Л< 1*2 1 + 1*
Черт. 3
Черт. 4
Отсюда—|z | < |Zi| —| z2\ < \z\. Мы видим, что действительное
число \zx\-\z2\ содержится между —А и Л, где
Л—положительное число, равное \z\. Это значит, что \z1\—\z2\ по
абсолютной величине меньше или равно А, т. е.
||*iH*.l|<l*|,
или, принимая во внимание, что z=zx—z2, получаем:
||ziHzal|<l*r-*2|.
Задачи. 1. Привести к тригонометрическому виду 1 +/, 1 — *\ 7—2/,
12 + 11/ (для нахождения аргументов можно воспользоваться таблицами
тригонометрических функций).
2. Пользуясь правилом умножения и деления комплексных чисел,
заданных в тригонометрической форме, найти, чему равны
(_Б + КТ/з)(1-0, -5 + 5/Т3~
О-О2
3. Если аргумент числа 2 = а -\-Ы равен <р, то чему равен аргумент
сопряженного числа z = а — ЬП
4. Показать, что в случае z Ф О формула Муавра справедлива и для
целых отрицательных значений п.
5. Выразить cos 5<f и sin 5<p через cos cp и sin у.
153
§ 24. Извлечение корня я-й степени из комплексного числа
В § 22 мы установили, что из всякого комплексного числа
можно извлечь квадратный корень. Оказывается, что в поле
комплексных чисел возможно извлечение не только корня
второй, но и любой п-й степени.
Возьмем какое-нибудь комплексное число, заданное в
тригонометрической форме:
z=r (cos cp + i sin cp), (z ф 0)
и найдем, чему равен кооень п-й (п > 2—целое) степени из г.
Обозначим для этой цели через р и 0 модуль и аргумент
искомого числа. Тогда
п
у г (cos cp + i sin cp) = p(cos6 + /sin 6),
или, возвышая обе части равенства в п-ю степень:
г (cos cp + / sin cp) = [p (cos 0 -f- i sin Ь)]п.
Но по формуле Муавра
[p (cosO + is\nQ)]n=pn(cosnti + /sin/гО);
следовательно,
r (cos cp -f / sin cp) = pn (cos #Q -f i sin /гО).
Два комплексных числа равны в том случае, когда равны их
модули, а аргументы равны или отличаются на кратное 2тс
(вспомните, что аргумент определяется с точностью до числа,
кратного 2?г); поэтому рл=г, nb = cp -f 2kn (k—целое число),
откуда:
Корень п-й степени из г берется здесь в арифметическом
смысле, так как модуль р есть число положительное. Таким
образом, мы приходим к следующему результату: корень #-й
степени из z равен
uk = yr[zos -^ + *sin JJL j. (1)
Число k в формуле (1) может принимать любое целое
значение, однако достаточно ограничиться значениями &=0, 1, . . . ,
/г—1. Действительно, всякое целое число т при делении на п
должно давать в качестве остатка k=0, 1, ... ., /г—1 (остаток
154
О, очевидно, получается, когда т делится на п).
Следовательно, m = nq + k, где <7—некоторое целое число Отсюда
ср + 2*т /©4-2т:Л . п \ Ф4-2-Л
cos 2—п =cos \Л—п h 2* <7j = cos^—n ,
. ср + 2кт , / о ± 2г£ , 0 \ . ср 4- 2я£
sin^ = Sin^-^ + 27r^j = sin^ ,
в силу чего um = ukl где k = 0, 1, . . ., п—\.
Итак, корень п-й степени из комплексного числа
извлекается и имеет п различных значений. Они получаются из
формулы (1) при k=0, 1, . . ., п— 1.
6 _
Пример. НайдемY%- В данном случае <р=0, г=2.
Следовательно,
,6/о/ 2л£ , . ш 2nk\
uk=V2 /cos — + i sin —J .
Полагаем k=0, 1, 2, 3, 4, 5:
6 _ 6 _
u0= Y2 (cos 0 + i sin 0) =V%
«!-b(cos^-+isIn±l)-b(-j + ^.<).
6 __ 6 _
^3=Vr2(cos^ + /sinir) = —]/2,
«1_b(«.i+«.i.-b)-h(-i-^/).
Посмотрим, какой геометрический смысл имеет формула (1).
Все п значений и0, uv . . . , ип_х обладают одним и тем же
п
модулем Yr\ аргумент щ равен -£-, а аргументы остальных щ
получаются последовательным прибавлением-^-. Таким
образом, числа и0, uv . . . , ип_г изображаются векторами, концы
которых находятся в вершинах правильного ^-угольника, впи-
п __
санного в окружность радиуса j/г с центром в начале
координат.
155
Рассмотрим частный случай, когда извлекается корень п-й
степени из единицы. Так как модуль единицы равен 1, а ее
аргумент равен нулю, то по формуле (1) получаются следую-
п
щие значения аЛ корня |/ 1:
a* = cos^ + *sin^ (£ = о, 1, . . . , /г—1). (2)
Между корнями п-й степени из комплексного числа z и
корнями п-й степени из единицы имеет место следующая важная
зависимость: умножая один из корней п-й степени из z на
всевозможные корни той же степени из единицы, мы
получим все корни п-й степени из z (z Ф 0).
Доказательство. Будем обозначать, как и выше, корни
п-й степени из z через uki а корни п-й степени из единицы—
через Оу. Возьмем какой-нибудь корень п-й степени из 2,
например и0, и покажем прежде всего, что u0as есть также
корень п-й степени из г. Возведем u0ccs в п-ю степень. Получим:
(u0as)n = u№ = z.\=z9
т. е. u0ols действительно оказалось корнем п-й степени из z.
Теперь пусть uk—произвольный корень п-й степени из z.
Рассмотрим частное —-. Тогда получаем:
"0
/ifft.\"=-^. = —= 1
[ih uk г l>
т. е. -^- есть корень п-й степени из единицы: — =а5. Отсюда
следует, что uk = u0<xs.
Итак, все корни п-й степени из z получаются по формуле
uk=u00Ls) т. е. путем умножения корня и0 п-й степени из z на
всевозможные корни cns п-й степени из единицы.
Среди корней п-й степени из единицы важную роль играют
так называемые первообразные корни.
Корень е п-й степени из единицы называется
первообразным, если г при возведении в степени 0, 1, 2, ... , п—\ дает
все корни п-й степени из единицы.
Нетрудно убедиться, что для всякого целого
положительного числа п > 2 существует по меньшей мере один
первообразный корень п-й степени из единицы.
Чтобы убедиться в справедливости этого утверждения,
обратимся к формуле (2) извлечения корня п-й степени из
единицы. Полагая Л=1, мы получаем:
2я . . . 2*
aj-cos-— + 'sin —,
156
и по формуле Муавра
<x*=cos —+*sin —=аЛ.
Таким образом, ax есть первообразный корень.п-й степени
из единицы.
Покажем, наконец, что множество А всех корней п-й
степени из единицы образует абелеву группу относительно
умножения комплексных чисел.
Доказательство. Произведение аир двух корней п-й
степени из единицы также является корнем /г-й степени из
единицы. Действительно: (а(3)'* = а/гРл=Ы = 1.
Таким образом, умножение комплексных чисел является
алгебраической операцией, определенной в множестве А.
Так как умножение комплексных чисел подчиняется
коммутативному и ассоциативному законам, то, в частности, и
умножение корней п-й степени из единицы подчиняется тем
же законам.
Число 1 является, с одной стороны, корнем п-й степени из
единицы, так как 1Л=1. С другой стороны, 1 является
групповой единицей: a-l = l-a = a для любого корня а п-й степени
из единицы.
Если а—какой-нибудь корень п-й степени из единицы, то
— есть также корень п-й степени из единицы. В самом деле,
/±y=_L = ± = i.
V a / 0Ln 1
Итак, все три условия, характеризующие группу,
выполняются. Следовательно, А образует группу и притом в силу
коммутативности умножения абелеву.
Отметим еще одно обстоятельство. В теории групп
порядком конечной группы О называется количество ее элементов.
Например, симметрическая группа Sn подстановок п-й степени
есть конечная группа порядка п\
Далее, конечная группа О называется циклической, если
все ее элементы являются степенями одного какого-нибудь ее
элемента.
Из этих определений вытекает, что группа А корней п-й
степени из единицы является циклической группой п-го
порядка.
В дальнейшем, кроме поля комплексных чисел, мы будем
иметь дело и с другими числовыми полями. При этом под
числовым полем мы, коротко говоря, подразумеваем любое
подполе поля комплексных чисел. Например, множество
рациональных чисел образует числовое поле. Множество
действительных чисел также образует числовое поле. Другим
примером числового поля может служить множество чисел вида
157
a + b Y2 с рациональными а и Ь. Очевидно, что множество
комплексных чисел образует самое обширное числовое поле.
Легко показать, что некоторая часть Р множества К
комплексных чисел тогда и только тогда образует
числовое поле, когда в Р выполнимы все четыре арифметических
действия—сложение, умножение, вычитание и деление
(исключая, конечно, деление на нуль)1.
В самом деле, пусть в Р выполнимы все четыре
арифметических действия. Очевидно, что и в Р сложение и умножение
подчиняются коммутативному, ассоциативному и
дистрибутивному законам, так как эти действия подчиняются тем же
законам и в более обширном множестве К комплексных чисел.
Отсюда, поскольку в Р выполнимы вычитание и деление и Р
содержит по меньшей мере одно число аФОу то получается,
что Р образует подполе поля /С, т. е. Р образует числовое
поле.
Обратно, если Р образует числовое поле, то в нем,
очевидно, должны выполняться все четыре арифметических
действия.
На этом мы заканчиваем общую теорию комплексных чисел. Заметим
только, что комплексные числа получили полное признание лишь в XIX в.,
после того, как появились работы, посвященные конкретному истолкованию
комплексных чисел. А до этого во взглядах математиков на сущность
комплексных чисел было много неясного и мистического и комплексные числа
часто использовались философами-идеалистами для философских спекуляций.
В качестве характерного примера приводим следующее высказывание
знаменитого математика XVII в. Лейбница: „Из иррациональностей, — говорит
он, — возникают количества невозможные, или мнимые, удивительной
природы, но пользы которых все же невозможно отрицать. . . Это есть тонкое
и чудное пристанище человеческого духа, нечто пребывающее между
бытием и небытием".
7
Задачи. 1. Найти ]/l-f 9/.
2. Показать, что комплексные корни n-Pi степени из действительного
числа попарно сопряжены.
3. Найти все первообразные корни четвертой степени из единицы.
4. Образует ли множество всех корней /г-й степени из единицы
числовое поле?
§ 25. Кольцо многочленов от одного неизвестного
Понятие многочлена, или целой рациональной функции, от
неизвестного х возникло в связи с задачей решения
алгебраических уравнений первой и выше первой степени с одним
неизвестным, задачей, которой занимались уже в глубокой
древности. Еще за 2000 лет до нашей эры в древнем Вавилоне
умели решать задачи, сводящиеся к квадратным уравнениям,
1 Говоря о выполнимости деления, мы подразумеваем, что Р содержит
по меньшей мере одно число, отличное от нуля; в противном случае не на
что было бы делить.
158
а при помощи таблиц решали некоторые задачи, приводящие
даже к уравнениям третьей степени.
Обратимся к алгебраическому уравнению #-ой степени (п—
целое положительное число):
а0хп+а1хп-1+. . .+ап=0,
где а0, аи . . . , ап комплексные (в частности действительные)
числа. Его левая часть а0хп + аххп~х + . . .+ ап и называется
многочленом п-ой степени от неизвестного х. Возникает
естественный вопрос: что понимать под этими выражениями а0хп+
+а1хп~1 + . . ,+ап, в каком смысле следует понимать равенство,
сложение и умножение подобного рода выражений.
Мы можем многочлен а0хп-\- aiXn~x-\~. . ,+ ап рассматривать
как функцию переменного х. Эта точка зрения характерна для
математического анализа. Но современная алгебра имеет дело
с многочленами, у которых коэффициенты а0, аъ . . . , ап
являются объектами любой, а не только числовой природы и
принадлежат некоторому полю Я. Оказывается, что построение
таких многочленов возможно лишь при помощи второй, чисто
алгебраической точки зрения \
Ограничиваясь числовым полем, мы сейчас введем
алгебраически понятие многочлена от неизвестного х.
Пусть Я—некоторое числовое поле. Элементы поля Я мы
будем обозначать начальными буквами а, Ь, с, . . . латинского
алфавита. Многочленом от х над полем Я мы назовем
выражение вида:
axxkt + a2xk* + . . . -\-asxk* (s > 1), (1)
где au a2, .. ., as — числа из Я, k^ < k2 < . . . <ks—целые
неотрицательные числа, х° принимается равным 1, а также
принимается, что при любом целом неотрицательном k
Выражения х, х2, . . ., xk, . . . , а также axxk\ . . . , asx s и
знак +, соединяющий axxkl, . . . , asxks, рассматриваются здесь
как символы, которым не приписывается определенного
значения. В соответствии с этим х будет называться неизвестным.
В дальнейшем, после введения понятия равенства многочленов
и действий сложения и умножения многочленов, символы xk
совпадут со степенями х, а само выражение (1) будет
восприниматься как сумма произведений этих степеней на числа из
поля Я.
Введем еще одно дополнительное соглашение: будем числа a
из поля Я рассматривать как многочлены над Я, а именно как
многочлены вида ах°. Очевидно, выражение axk, где k — про-
1 Выяснение этого обстоятельства выходит за пределы нашего курса.
159
извольное целое неотрицательное число, и, в частности, само
неизвестное х являются также многочленами над Р.
Числа аъ аъ . . . , as, входящие в многочлен (1), обычнд
называются коэффициентами, a axxk\ a2xk\ . . ., asxks —
членами многочлена (1). В частности, asxks называется старшим
членом и as — старшим коэффициентом многочлена.
Для сокращения письма мы часто будем многочлены
обозначать через /(*), g(x), h(x) и т. п.
Теперь введем понятия равенства, суммы и произведения
многочленов от х над полем Р.
Пусть f(x) и g(x)— два произвольных многочлена над Р.
Эти многочлены мы считаем равными (тождественно равными)
только тогда, когда многочлен f(x) состоит из тех же
членов, что и многочлен g(x), кроме членов с коэффициентами,
равными нулю (если такие члены имеются). Например,
многочлены
х + х2 + хд и 0 + х + х2 + х2 + 0-хъ
равны. Напротив, многочлены
f(x)=x + х2 + хг и g(x) = x + х2 + хд + л:4
не равны, так как g(x) обладает членом xii не входящим
в состав членов f(x).
Из этого определения равенства многочленов вытекает, что
мы можем всякий многочлен f(x) над Р привести к виду:
f(x) = a0 + ахх + а2х2 + . . . + апхп
(п — целое неотрицательное число),
добавляя в случае необходимости члены с коэффициентами,
равными нулю. В таком виде мы часто будем записывать
многочлен.
Согласно определению равенства многочленов имеем, в
частности, что многочлен f(x) равен нулю (т. е. числу 0) лишь
в том случае, когда все коэффициенты f(x) равны нулю. Таким
образом, если многочлен f(x) отличен от нуля, то по меньшей
мере один из его коэффициентов должен быть также отличен
от нуля.
Обратимся к действиям сложения и умножения многочленов.
Пусть
f(x) = a0 + ахх + а2х2 + .. . + апхп,
g(*) = b0 + bxx + Ь2х2 + . . . + Ьтхт
снова два произвольных многочлена над Р. Под их суммой
f(x) + g(x) мы будем подразумевать многочлен
с0 + сгх + с2х2 + . . . + ckxk,
160
где k есть наибольшее из чисел п и т, а £/=#/ + &/; при
этом, если п> т, то следует полагать ft =. . . = ^=0, а если
п <т, то следует полагать ал+1 = . . . = ат=0.
Под произведением f(x)-g(x) мы будем подразумевать
многочлен
*А + («0*1 + аА) -« + ...+ № + *!&*-! + • • • + <*А) ** +
+ ... + апЬтя?+я,
где а~0 при />/г и Ь;=0 при у >/и.
Очевидно, что,.складывая или перемножая два каких-нибудь
многочлена от неизвестного х с коэффициентами из Я, мы
всегда получаем однозначно многочлен от х с коэффициентами
из того же поля Я. Таким образом, сложение и умножение
многочленов от х над Я являются алгебраическими операциями,
определенными во множестве многочленов от х над Я.
Обозначим теперь через Я [х] это множество многочленов.
Мы утверждаем, что введенные нами действия сложения и
умножения подчиняются основным алгебраическим законам.
Точнее, имеет место следующая теорема.
Теорема 1. Множество Р\х] образует коммутативное
кольцо относительно сложения и умноэюения многочленов
над Я.
Доказательство. Нетрудно проверить, что операции
сложения и умножения многочленов из Я [х] подчиняются
коммутативному, ассоциативному и дистрибутивному законам.
Мы ограничимся проверкой ассоциативности умножения.
Умножим
f(x)g(x) = a0b0 + (а0Ьг + а1Ь0)х+. . . + апЬтхп+т
на многочлен
fi(x) = c0 + схх+ . . . + ctxl.
Согласно определению произведения многочленов получаем:
[/(*) g(x)] h (*) = a0Vo + (aoVi + Я(А<ч> + ^iVo) x +
+ ... + anbmclxn+m+l. (2)
С другой стороны,
g (x) h (х) = Vo + (Vi + b.Co) x + ... + b^s"1*1,
откуда на основании того же определения произведения
f(x)[g(x)h(x)] =
=a0b0c0 + (a0 Vi + «oVo + «i Vo) ■* + ... +aA^-*"+m+'' (3)
161
Сравнивая коэффициенты многочленов (2) и (3) при
одинаковых х1 и вспоминая определение равенства многочленов,
видим, что
[f(x)g(x)]h(x)=f(x)[g(x)h(x)],
т. е. умножение многочленов над Р подчиняется
ассоциативному закону.
Обращаем внимание на то, что существенное значение при
проверке коммутативного, ассоциативного и дистрибутивного
законов имеет то обстоятельство, что Р— кольцо. Например,
при проверке ассоциативности умножения мы опирались на
ассоциативный, коммутативный и дистрибутивный законы
сложения и умножения чисел поля Я.
Наконец, нетрудно убедиться, что во множестве Р[х]
сложение всегда обратимо, для любых двух многочленов
f(x) = a0 + a1x + . . . + апхп,
g(x) = b0 + b1x + . . . + bmxm
из Р[х] уравнение f(x) + z = g(x) всегда разрешимо в Р[х].
В самом деле, легко проверить, пользуясь определением
сложения многочленов, что при п=-т
z=(b0 — a0) + (b1 — a1)x + ... + (bn - ап) хп,
при п > т
z= (b0 -a0) + (b1-a1)x+... + (bm - am) xm +
+ (-a„+l)xm+l+... + (-an)jf
и при п < m
z=(b0 -a0) + (b1-al)x+. .. + (bn - an) xn +
+ bn+1xn+1 + ... +bmxm.
Само собой разумеется, что при этой проверке мы должны
опираться на то, что Р — кольцо, в частности, должны
учитывать, что вычитание чисел в Р всегда выполнимо.
Только что доказанная теорема позволяет сделать ряд
заключений относительно многочленов над Р. Отметим наиболее
существенные.
1°. Благодаря выполнимости ассоциативного закона для
операции сложения мы можем теперь многочлен
f(x) = a0 + ахх+ . . . + апхп
рассматривать как сумму его членов агх1. При этом члены
многочлена f(x) можно записывать в любом порядке
следования, так как сложение подчиняется и коммутативному закону.
152
Например, мы могли бы многочлен f(x) записывать также и
в порядке убывания индексов коэффициентов:
f(x) = anxn + an_lxn~l + . .. + a09
причем нумерацию коэффициентов можно было бы изменить,
сделав ее возрастающей:
f(x) = a0xn + аххп~х + • • . +ап.
2°. Теперь мы можем символы х2у Xs, . . . рассматривать как
степени неизвестного х. В самом деле, так как x=l -xnxk = \ -xk,
то по правилу умножения одночленов axk-bxl=abxk^~l,
вытекающему из определения умножения многочленов, получается,
что
(\-xy = (\.x){\-x) = \.jc*=x2, (1-jc)8 = (1-jc)2(1-jc) =
= (l-X*)(l-X)=\-X* = X* И Т. Д.
Далее, каждый член atxl многочлена f(x) можно
рассматривать как произведение числа а1 поля Я на степень х1
неизвестного. Действительно, по тому же правилу умножения
одночленов aixi = (aix°) (1 •-*'). При этом в силу коммутативности
умножения а^—л:'^.
3°. Произведение (axk)(bxl), где #> Ь — числа поля Я, k и
/—целые неотрицательные числа, равно abx +. Так как для
операций сложения и умножения многочленов из Р[х] имеет
место дистрибутивный закон, то f(x) и g (x) можно
перемножать по обычному школьному правилу, состоящему в том,
что каждый член многочлена f(x) умножается на каждый
член многочлена g(x), в результате чего получаются
выражения вида afijX1^, затем составляется сумма всех таких
выражений и, наконец, производится приведение подобных членов.
А законность приведения подобных членов основана на том,
что операция сложения многочленов из Р [х] подчиняется
коммутативному и ассоциативному законам и что сложение и
умножение многочленов из Р [х] связаны дистрибутивным законом.
4°. Уравнение f(x) + z=g(x), rjief(x) и g (x)
—произвольные многочлены из Р[х], имеет на основании известного
свойства кольца единственное решение. Это единственное
решение z будет обозначаться через g(x) —f(x)n называться
разностью многочленов g (х) и / (х). В частности, f (x)—f (x) =0,
0 — f(x) = — f (х), где — f (x) —многочлен, противоположный
f (х), т. е. такой многочлен, сумма которого с f(x) равна нулю.
Множество многочленов Р\х\ мы будем коротко называть
кольцом многочленов от х над Я.
Пример. Даны многочлены
/(х) = ^з + 5х+1 и g(x)=x*-3xB + x — \
над полем рациональных чисел. Найти их сумму, разность и
произведение.
163
Сложение, вычитание и умножение многочленов теперь
можно провести более простым способом, основанным на том,
что Р\х\ —коммутативное кольцо.
А именно, чтобы получить сумму f (x) + g(x), достаточно
к f (х) приписать члены g(x) с теми же знаками и затем
произвести приведение подобных членов:
f(*) + g (*)=*3 + 5х + \ + х* - Зхв + х - \ =
= *4 — 2х2 + 6х.
Чтобы получить разность f (х) — g(x), достаточно к / (х)
приписать члены g(x) с противоположными знаками и затем
произвести приведение подобных членов:
/ (х) - g (х)=х* + 5х + 1 - х4 + Зх3 - х + 1 =
= —jc4 + 4jc3 + 4jc + 2.
Наконец, чтобы получить произведение f(x)g(x),
достаточно каждый член f{x) умножить на каждый член g(x),
составить сумму всех таких произведений и привести
подобные члены:
/ (*) g (*) = (*в + 5x + 1) (х4 - Зх3 + х - 1) =
= х1—3xG+xi—jc3+5jc6—15jc4+5jc2—5x+xi—3x*+x-l =
-= x1- 3^6+5x5 - 13*4 - 4x3 + 5x2 - 4x - 1.
Введем понятие степени многочлена от неизвестного х.
Возьмем из Р [х] произвольный многочлен, не равный нулю.
В таком многочлене по меньшей мере один коэффициент должен
быть отличен от нуля. Назовем степенью этого многочлена
наибольшую из степеней его членов, у которых коэффициенты
не равны нулю.
Например,
/ (*) = 1 + 2* — 7х2 + 0-х* + 5х4 + 0- хь
есть многочлен четвертой степени над полем рациональных
чисел.
Если степень многочлена f(x) равна /г, то, очевидно, мы
его всегда можем записать в виде
f(x) = a0 + аух + . . . + апхп
или в виде
f(x) = a0xn + a1xn-l + ... + an
со старшим коэффициентом, отличным от нуля, так как члены,
содержащие х в степени выше /г-й, равны нулю, и мы их можем
отбросить.
164
Всякое число афО поля Р можно рассматривать как
многочлен нулевой степени от неизвестного ху потому что а = ах°,
что касается числа 0, содержащегося в Р, то мы его будем
рассматривать как многочлен, не имеющий степени.
Понятие степени позволяет весьма просто выразить условие
равенства двух многочленов от х, а именно, если
f(x)=a0 + a1x+ . . .+ апхп (апф0),
g(x)=b0 + bxx+. . + bmxm (Ьтф0)
— два многочлена из Р[х] соответственно степени п и т, то
эти многочлены равны лишь в том и только в том случае,
когда их степени равны и равны их коэффициенты при
одинаковых степенях неизвестного: п = т, а0 = Ь$, ах = Ьи ..., ап = Ьп.
Что касается многочлена, равного нулю, то, как мы знаем,
все его коэффициенты должны быть равны нулю.
Из определения сложения многочленов от х следует, что
степень суммы f(x)+g(x) не превосходит степени каждого
из слагаемых f (х) и g(x). Например, если
f(x)=2xs + x2 + х- 1, g(x) = -2x*-x2 + 5x+6,
то
/С*)+«"(*) =6*+ 5
будет уже многочленом первой степени.
Исходя из определения произведения двух многочленов
от х, можно получить еще одно важное свойство кольца
многочленов Р\х\, а именно: легко убедиться, что Р [х] есть кольцо
без делителей нуля.
Действительно, если / (х) ф 0 и g (х) ф 0, то многочлены / (х)
и ё(х) должны иметь вполне определенную степень. Пусть
степень многочлена / (х) равна п, а степень многочлена g(x)
равна т\
f(*)=<*<> + ахх+. .. + апхп (апф0),
g(x) = b0 + b1x+... + bmx>» (Ьтф0).
Тогда
/ (•*) g (*) = я<А> + (я<>*1 + я А) Х+... + апЬтхп+т,
и произведение апЬт будет отлично от нуля, так как поле Р
не имеет делителей нуля. Следовательно,/(^-^(xj-^O, что
и требовалось показать.
Кроме того, так как апЬтфО, то степень произведения
f(x)g(x) многочленов f(x) и g(x) кольца Р[х] равна сумме
п + т их степеней пит.
В заключение введем понятие значения многочлена. Оно
будет играть немаловажную роль.
165
Пусть / (х)=а0 + ахх + . . . + апхП ~~ произвольный
многочлен из Р[х]. Замзним в нем неизвестное х каким-нибудь
числом с поля Р. Мы получим число из того же поля Р
следующего вида: d=a{) -f ахс + . . . + апсп. Это число d называется
значением многочлена f(x) при значении неизвестного х=с
и обозначается через f(c).
Очевидно, что если f(x) = g(x), то f(c)=g(c) для любого £
из Я. Справедливость обратного утверждения будет обнаружена
в конце этой главы.
Можно показать, что если
f(x)+g(x) = h(x), f(x)g(x)=k(x),
то
f(c)+g(c)=h(c), f(c)g(c)=k(c). (4)
Мы ограничимся проверкой первого равенства (4). Проверка
второго равенства проводится аналогичным образом.
Пусть, например, степень многочлена f (х) больше или
раьна степени многочлена g(x):
f (х) = а0 + агх + . . + апхп (ап Ф 0),
g(x) = b0 + Ьгх + ... + Ьтхт (Ьм ф 0)
и т < п. Тогда
h (х) = с0 + схх + . . . + спхп,
где£/ = а,+ bh причем в случае п > т надо считать Ьт+и . .. , Ьп
равными нулю. Найдем, чему равно h(c):
h(c) = c0 + clc + . .. + cncn.
Пользуясь коммутативным, ассоциативным и дистрибутивными
законами, имеющими место в Я, мы можем последнее равенство
преобразовать в следующее:
h(с) = (а0 + ахс+... + апс») + (Ь0 + Ъхс + . . . + Ьтст),
т. е. получается, что h(c)=f(c) + g (с).
§ 26. Свойства делимости многочленов
В этом параграфе мы собираемся изложить в основных
чертах теорию делимости многочленов от х над произвольным
числовым полем Р. Мы увидим, что между свойствами
делимости многочленов и свойствами делимости целых чисел
наблюдается далеко идущая аналогия.
В определении поля под делением подразумевалось
нахождение корня уравнения ах = Ь. Назовем в соответствии с этим
многочлен f(x) из кольца Р [х] делящимся на многочлен g(x)
из того же колща Р[х], если уравнение g{x)X=f(x) раз-
166
решимо в Р[х\. Иными словами, многочлен f(x) делится на
многочлен g(x), если в том же кольце существует такой
третий многочлен q(x), что f(x) = g(x)-q (x).
Однако, если даже исключить деление на нуль (оно,
очевидно, невозможно), то и в этом случае деление не всегда
будет выполнимым в кольце Р\х]. Возьмем хотя бы многочлен
f(x)=x+l и g{x) = x2 + 1. Если бы f(x) делилось на g(x)
то в Р [х] нашелся бы многочлен q(x), для которого имело бы
место равенство
х+1 = (х*+1)д(х).
Но это равенство невозможно, так как степень произведения
(x2+l)q(x) выше степени х-{-1. Следовательно, f(x) не
делится на g(x).
Таким образом, Р[х\ подобно множеству целых чисел
образует коммутативное кольцо без делителей нуля, но не поле.
Отметим прежде всего простейшие свойства делимости
многочленов.
Г. Всякий многочлен f(x) из Р[х] делится на самого
себя.
Действительно, мы можем написать очевидное равенство
/(*)=/(*). 1,
а число 1 поля Р можно рассматривать как многочлен
нулевой степени из Р[х\.
2°. Если f(x) и g (х) — многочлены из Р\х]у и f{x)
делится на g{x), a g(x) дели;пся на f{x), то многочлены
f(x) и g(x) отличаются друг от друга лишь множителем
нулевой степени: f(x) = cg(x), где с —некоторое неравное
нулю число из поля Р.
В самом деле, так как f(x) делится на g(x), a g(x)
делится на /(*), то по определению делимости можно написать?
что
f(x)=g(x)ql(x)1 g(x)=f(x)q2(x),
где qx (x) и q2 (x) — некоторые многочлены из Р[х].
Подставляя выражение g(x) из второго равенства в первое, получаем:
f(x)=f(x)qi(x)q2(x). (1)
Если f(x)=£0, то обе части равенства (1) можно сократить
на f(x): l = <7i (x) q2 (x). В левой части этого равенства
находится 1, т. е. многочлен нулевой степени. Следовательно,
произведение qi(x)-o;2(x) должно быть также многочленом
нулевой степени, что возможно только тогда, когда степени
самих сомножителей qx (x) и q2(x) равны нулю. Таким
образом, qi(x) = c, q2(x) = cu где с и сх — числа из Я, отличные
от нуля. Отсюда f(x) = cg(x).
167
Если /(jc) = 0, то g(x)=f(x)-q2(x)=0 и равенство f(x) =
= cg(x) будеть иметь место при любом с Ф 0 из Р.
Законность сокращения обеих частей равенства (1) на
/(х)фО основана на том, что Р[х] есть кольцо без
делителей нуля. В самом деле, если f(x) <p(*)=/(*H (■*)> гДе
/{х)фО, ср (л:) и ф(л:) — многочлены из Р[х], то
/(*М*)-/(*Ж*) = 0 или /(*)[<? (х)-^(х)]=0.
Так как f(x) ФО, то в силу отсутствия в Р[х] делителей нуля
должно быть у{х)—ty(x) = 0, откуда <р(.*) = Ф(*).
Два многочлена, отличающиеся друг от друга множителем
нулевой степени, называют ассоциированными или
совпадающими с точностью до множителя нулевой степени.
3°. Если ова многочлена /}(х) и f2(x) из Р[х] делятся
на третий многочлен g (х) из Р [х], то их сумма fx (x) +
+ /2(х) и разность fi{x)— f2(x) делятся на g(x).
Из определения делимости следует, что
fi(x)=g(x)ql(x)t f2(x)=g(x)q2(x)9
где qx (х) и q2 (х) — некоторые многочлены из Я[*].
Складывая или вычитая почленно оба эти равенства, получаем:
fx(x)±f2(x)=g(x)q(x),
где q(x) = ql (x)±q2(x) — многочлен из того же кольца Р[х].
Таким образом, fi(x)±f2(x) делится на g(x).
Свойство 3° можно обобщить следующим образом.
4°. Если многочлены /, (х), ...,/*(•*) из Р[х] делятся
на многочлен g(x) из Р[х], то cjx (х) + - . . + ckfk {x), где
cL — произвольные числа из Р, также делится на g (x).
Доказывается свойство 4° аналогично предыдущему
свойству 3°.
5°. Если fx(x), . . ., fk(x) (k> 2) —многочлены из Р[х]
и /г(х) делится на многочлен g(x) из Р[х], то
произведение fi(x) . . . fk(x) также делится на g(x).
В самом деле, если fx(x) делится на g(x), то Д (■*)*■
=fW?iW» гДе Я\ (х) — некоторый многочлен из Р
[^.Умножая обе части этого равенства на /2(х) . . . fk(x), получаем:
A(x)f2(x) . . . fk{x)=g(x)q{x),
где q(x) = qt (х)-/2(х) ... fk(x) — также многочлен из Р[х]
Следовательно, /г(х) /2(х) . . . fk(x) делится на g(x).
6°. Если /(*), g(x) и h (х) — многочлены из Р[х] и f{x)
делится на g(x), a g(x) делится на h(x), то f(x) делится
на h (x).
Полагая f(x)=g(x)qi(x), g(x)=h(x)-q2(x\ где qx(x) и
q2 (x) — некоторые многочлены из Р[х], и подставляя выражение
168
g (x) из второго равенства в первое, получаем: f(x) = h(x)q(x),
где q(x) = ql(x)-q2(х) — многочлен из Р[х], т. е. f(x)
делится на h{x).
7°. Многочлены нулевой степени из Р [х] являются
делителями любого многочлена из Р[х].
Действительно, если с ф О — число поля Р и
— какой-нибудь многочлен из Р[х], то, очевидно,
f(x) = cq(x)t
где q(x)= ^-хп + ^-хп~1+ . . . + —- есть снова многочлен из
Р[х].
Аналогичные свойства делимости имеют место и в кольце
целых чисел. При этом числа 1 и —1 играют роль, сходную
с ролью многочленов нулевой степени, а именно, если целое
число а делится на целое число b, a b делится на а, то числа
а и b отличаются друг от друга лишь множителем ±1.
Всякое целое число а делится на ±1.
Делимость одного многочлена на другой можно
обнаружить при помощи процесса, известного читателю из
элементарной алгебры. Мы имеем в виду так называемый алгоритм
деления с остатком. Обоснование этого процесса будет дано
при доказательстве следующей теоремы.
Теорема 1 (о делении с остатком). Для любых двух
многочленов f(x) и g(x)=£0 из Р[х] существует такая пара
многочленов q (х) и г (х) из того же кольца Р[х], что
f(x)=g(x)q(x) + r(x) (2)
и при г(х)Ф0 степень г(х) меньше степени g(x).
Замечание. Обычно многочлен q(x) называется
неполным частным или, короче, частным, а многочлен г (х) —
остатком от деления f(x) на g(x).
Доказательство. Пусть
f{x) = a0xn + axxn-~l+ ... + ая9
$ (х) ^ Ь0хт + Ьххм~1 +... + Ьт (ЬйФ0).
Если /(л;)=0 или если п < т, то равенство (2) будет
удовлетворяться при q(x)=0 и r(x)=f(x).
Если п> т, то действуем следующим образом. Вычитаем
из f(x) многочлен g(x), умноженный на ~хп~т:
169
В результате старший член а0хп многочлена /(л:) уничтожится
и получится /, (х) = а0хп~1 + а[хп~2 + . . . + ап-\. Если п—\>т,
то снова повторяем процесс понижения степени:
fl(x)-^xn-m-1g(x)=f2(x)
и т. д. Очевидно, что в конце концов мы придем к
многочлену г(х), равному нулю или имеющему степень ниже
степени g(x). Таким образом,
f(.x)-^xn-mg(x)=h(x),
h{x) ^xn-m-lg(x)=f2(x),
Л*<*)—^S(x) = r(x) (k=n-m).
Складывая эти равенства почленно, мы после некоторых
упрощений получим:
f <*> -(t хП~т+% хП~т~1+ • • •+€V(х)=г {х)'
или
f(x)=g(x)q(x) + r(x),
Коэффициенты многочленов д(х) и г(х) будут при этом
принадлежать полю Я, так как мы их получили при помощи
операций сложения, вычитания, умножения и деления, не
выводящих за пределы поля.
Процесс, при помощи которого мы получили в только что
проведенном доказательстве частное и остаток, является не чем
иным, как правилом деления расположенных многочленов,
известным еще из школьного курса алгебры. Возникает вопрос,
не будет ли при другом способе получаться другое частное
н остаток. Ответ дает следующая теорема.
Теорема 2 (о единственности деления с остатком).
Независимо от процесса их получения частное и остаток при
делении многочлена f{x) из Р[х] на многочлен g(x)4=0
из Р [х] определяются единственным образом.
Доказательство. Пусть, кроме q(x) и г(х), существует
частное qx (x) и остаток rt (x). Тогда
f(x) = g(x)q(x) + r(x)1 (3)
f(*W(*)?i(*)+ '*(*). W
170
Из равенств (3) и (4) следует, что
g(x) q(x)+r (x) = g (х) qx (x) + гх (х),
или
g (x) [q (x)-qx (x)] = гх (х)-г (х). (5)
Если q (х) ф qx(x), то q (x)—q](x) фО, вследствие чего и
г\ (х)—г(х) фО. Но тогда мы приходим к противоречию —
в правой части равенства (5) находится разность rl(x)—r(x)
со степенью меньшей, чем степень т многочлена g(x), так
как степени г{ (х) и г(х) меньше т\ в левой же части
равенства мы имеем произведение g(x) [q(x)—qx (x)] со степенью
не ниже т. Следовательно, q (x) = q1(x) и r(x) = rt(x), и
теорема доказана.
Алгоритм деления с остатком позволяет обнаружить,
делится ли данный многочлен f (х) изР\х] на многочлен g(x)ф
фО из Р[х] или не делится. Именно, f(x) делится на g(x)
тогда и только тогда, когда остаток г(х) от деления
f(x) на g(x) равен нулю.
Действительно, если остаток г(х) равен нулю, то равенство
/ (x)=g(x)q (x) + r (х) превращается в f{x) = g(x)-q(x), откуда
ясно, что f(x) делится на g(x). Обратно, если f(x) делится
на g(x), то f(x)=g(x)q (x), где q (x) — некоторый многочлен
из Р[д:]. Отсюда в силу единственности частного и остатка
следует, что остаток г (х) должен быть равен нулю.
Благодаря этой связи делимости с равенством нулю остатка
получается, что делимость многочлена f(x) на многочлен
g(x)фO не зависит от того, над каким полем рассматриваются
многочлены f(x) и g(x). В самом деле, будем ли мы
рассматривать поле Р или его расширение, мы получим при
делении f (х) на g(x) одни и те же частное и остаток.
Роль алгоритма деления с остатком этим, однако, не
исчерпывается. Мы сейчас увидим, что на основании теоремы о
делении с остатком можно провести дальнейший параллелизм
между теорией делимости целых чисел и теорией делимости
многочленов.
Пусть f (х) и g(x) —два каких-нибудь многочлена из Я[^].
Назовем третий многочлен d(x) из того же кольца Р[х]
общим делителем f(x) и g(x), если d(x) делит как f(x),
так и g(x). В частности, общий делитель D(x) называется
наибольшим, если он делится на всякий общий делитель d(x)
многочленов f(x) и g(x).
Мы покажем, что наибольший общий делитель существует
для любых многочленов f(x) и g(x) фО из Р[х]> а именно
укажем вполне определенный способ, так называемый
алгоритм Евклида. Этот способ заключается в следующем. Делим
f (х) на g(x)\ остаток и частное, полученные при делении,
обозначим соответственно через г(х) и q (x). Затем делим g(x)
171
на остаток г(х) (когда г(х)фО); в результате получатся
второй остаток г±{х) и частное дг(х) и т. д. Степени
получающихся при таком процессе остатков г (х), г1 (х), . . будут,
очевидно, все время убывать. Но целые неотрицательные числа
не могут убывать безгранично. Следовательно, наш процесс
деления не может быть бесконечным — в конце концов мы
должны прийти к остатку rk(x), на который нацело разделится
предыдущий остаток rk_^(x). Покажем, что этот последний
остаток rk (x) и будет наибольшим общим делителем
многочленов f (х) и g(x).
Запишем весь процесс деления следующим образом:
f(x)=g(x)q(x) + r(x),
g(x) = r(x)q1(x) + r1(x),
rk_2(x) = rk_x (x) qk (x) + rk (x),
(6)
Прежде всего покажем, что rk(x) есть общий делитель
многочленов f(x) и g(x). Обратимся к предпоследнему
равенству системы равенств (6):
rk_2 (х) = гк_г (х) qk (х) + rk (x).
Его правая часть делится на rk (x)t так как rk_x (x) делится
на rk(x), a rk (x) делится на самого себя. Следовательно,
левая часть, т. е. гк_2(х)9 делится на rk(x). Обращаемся, далее,
к вышележащему равенству
^_з («*) = ^-2 (•*) Чн-\ (*) + rk-i (х).
Здесь rk_2(x) и rk_x(x) делятся на rk(x), откуда ясно, что
вся правая часть делится на rk(x). Следовательно, на rk(x)
делится гк_г(х). Двигаясь, таким образом, постепенно вверх,
мы, наконец, дойдем до многочленов f(x) ng(x) и убедимся,
что f(x) и g(x) делятся на rk(x).
Теперь остается показать, что rk (x) есть наибольший
общий делитель. Для этой цели обращаемся к первому
равенству
f(*)=g(x)q(x) + r(x).
Пусть d (х)—некоторый общий делитель f(x) и g(x). Так как
f{x) и g(x) делятся на d(x), то разность /(*) — g(x)-q(x) =
= г(х) должна делиться на d(x). Точно так же, рассматривая
второе равенство системы (6)
g(x)=r(x)q1(x) + r1(x),
172
находим, что гх (х) делится на d(x) и т. д. Так, опускаясь
постепенно вниз, мы, наконец, дойдем до rk(x) и убедимся,
что rk(x) делится на d(x). Иными словами, мы обнаружим,
что rk (x) есть наибольший общий делитель многочленов f{x)
и g(x).
Нетрудно убедиться, что наибольший общий делитель
многочленов f{x) и g(x) фО является единственным с
точностью до множителя нулевой степени.
В самом деле, если DL(x) и D2(x) —два t наибольших
общих делителя многочленов f(x) и g(x), то'по определению
наибольшего общего делителя Д> (л:) должно делиться на
D1(x) и Dx (x) должно делиться на D2(x), откуда по
свойству 2° делимости Д (х) = c-D2 {x)t что и требовалось
показать.
Наибольший общий делитель f (х) и g(x) может оказаться
многочленом нулевой степени. В этом случае f(x) и g(x)
называются взаимно простыми многочленами.
Наибольший общий делитель многочленов f(x) и g(x)
условимся обозначать для сокращения письма символом (f(x),
£(*)).
Пример. Найти наибольший общий делитель многочленов
f(x) =2jc5—3jc4—5л;3 + х2 + 6х + 3,
g(x) =3х4 + 2хв—Зх2—5x-2
над полем рациональных чисел.
Чтобы избежать дробных коэффициентов, умножим
предварительно f(x) на 3:
6*5 - 9л;4 — 15л:3 + Зл:2 4 18* + 9 |3л:4 + 2л:3 — Зл:2 — Ъх — 2
"" 6л:5 + 4л:4 — 6л:3 — Юл:2 — 4х 2х
_ 13л:4 — 9л:3 + 13л:2 + 22л: + 9
Теперь, чтобы избежать дробных коэффициентов, умножим
полученную разность на 3. Этим мы, правда, исказим частное,
но остаток определится с точностью до множителя нулевой
степени. Итак, продолжаем вычисления:
— 39л:4 — 27л:3 + 39л:2 + 66л: + 27 |3л:4 -4- 2х* — Зл:2 —5л: —2
""" — 39л:4 — 26л:3 4- 39л:2 4 65л: 4 26 —13
— л:3 + х+ 1
Таким образом, мы нашли с точностью до множителя
нулевой степени остаток г(х) =х8—х— 1 от деления f(x) на
g(x). Теперь надо g(x) делить на г(х), но читатель может
сам без труда убедиться, что g(x) делится без остатка на
г(х). Следовательно, Xs—х— 1 и есть наибольший общий
делитель многочленов / (х) и g(x).
173
Так как алгоритм Евклида сводится к последовательному
применению алгоритма деления с остатком, то можно сделать
следующее важное заключение: наибольший общий делитель
D{x)многочленов f(x).ug(x)y найденный при помощи алгоритма
Евклида, не зависит от того, будем ли мы рассматривать
f(x) и g(x) над полем Р или над его расширением Р'.
Так, для многочленов f(x) ug(x) только что разобранного
примера мы нашли, что наибольший общий делитель над
полем рациональных чисел равен хг—х—1. Но эти же
многочлены и над полем действительных чисел будут иметь л:3—х—
— 1 наибольшим общим делителем.
Для нескольких многочленов fi(x), f2(x), ..., fs{x) из
Р [х] общий делитель и наибольший общий делитель
определяются аналогичным образом. Именно, многочлен d(x) из
Р\х\ называется общим делителем fi(x), f2(x), ..., fs(x)>
если каждый из многочленов fx(x), f2(x), ...,fs(x) делится
на d(x). Общий делитель D(x) называется наибольшим, если
он делится на всякий общий делитель многочленов fx (x),
Разыскание наибольшего общего делителя нескольких
многочленов можно свести к разысканию наибольшего общего
делителя двух многочленов. В самом деле, пусть Dx(x)—
наибольший общий делитель 5—1 многочленов fi(x), f2(x),
• • .i /j_i(«*)« Легко убедиться, что если D (х)— наибольший
общий делитель Di (x) и fs (x), то D (х) будет вместе с тем
и наибольшим общим делителем всех s многочленов /г (х)}
U (•*). • •., fs (■*)•
Повторяя дословно те же рассуждения, что и выше, можно
убедиться в единственности (с точностью до множителя
нулевой степени) наибольшего общего делителя нескольких
многочленов.
Исходя из алгоритма Евклида можно получить ряд
дальнейших выводов. Отметим наиболее существенные.
Теорема 3. Если D (х) — наибольший общий делитель
многочленов f(x) и g(x) ФО из Р [x]f то в том же самом
кольце Р[х] можно подобрать такую пару многочленов ср (л:)
и ф (х), что
/WfW + ?WtW=o(4 (7)
Доказательство. Возьмем предпоследнее равенство
системы равенств (6) и перенесем rk_x (x) qk (x) в левую часть.
Тогда, принимая во внимание, что rk(x)=D (х), получаем:
rk_2 W->Vi («*) Ян {x)=D (x). (8)
Затем из равенства rk_3(x) = rk_2(x) qk_x (x) + rk_x (x)
определяем гк_г (х):
rk_x (х) = гк_ъ (*)-rk_2 (x) qk_x (x)
174
и подставляем это значение rk_l(x) в (8). Получим:
rh-2(x) ъ (х) +rk_3(x)b(x)=D(x), (9)
где <fi(x) = l+<Jk(x)qk-i(x)> <W (■*) = -?*(■*)•
Далее, из равенства rk_4(x) = rk_3(x)qk_2(x) + rk_2(x)
определяем rk_2(x) и подставляем в (9). Получим:
гк^(х) ъ(*) + Ги-А(х) <h (x) = D(x)
и т. д., пока не получится равенство
f{x)Vk-i(x)+g(x)b-A*) = D(x)9
т. е. равенство (7) с ср (jc) =<pAr_1 (.х:) и ф(*) = фЛ_1(*).
В частности, когда многочлены f(x) и g(x) взаимно
просты, равенство (7) принимает вид:
f(x)<t(x) + g(x)*(x)=c9
где сфО— число из Р. Мы можем с положить равным 1, так
как обе части последнего равенства можно разделить на с
и в качестве ср (х) и ф (х) рассматривать соответственно у w
с
Таким образом, если многочлены f(x) и g(x) взаимно
просты, то в том же кольце Р [х] можно подобрать
такую пару многочленов ср (х) и ф (х), что
/(*)?(*) + £(*)♦(*) =1. (Ю)
Пример. Для многочленов
/(jc) = 2jc5-3jc4-5jc3 + х2 + 6х + 3,
g (jc)=3jc4 + 2jc3-3jc2-5jc-2
над полем рациональных чисел подобрать многочлены ср(л;) и
ф(л:) над тем же полем так, чтобы имело место равенство (7).
Здесь существенное значение имеют не только остатки, но
и частные, получаемые в процессе последовательного деления;
поэтому необходимо каждый раз учитывать производимое
сокращение или умножение на число. С данными
многочленами fix) и g (х) мы уже имели дело в предыдущем
примере. Учитывая умножение f(x) на 3, а также умножение на
3 многочлена— 13х4 —9х'г + \Ъх2-\- 22х + 9, мы можем соответ-
175
ствующие результаты вычислений, полученные в предыдущем
примере, записать коротко в виде равенств:
3/(*)-«Г (х)-2х + (—13jc4—9jc3 + 13*2 + 22* + 9), (11)
3(-13jc4-9x3+13jc2 + 22x + 9)=^(jc).(-13)-r(^), (12)
где r(x) = D(x) = x3—x— 1.
Умножим обе части равенства (11) на 3 и затем подставим
значение 3 (—13jc4—9jc3 + 13jc2 + 22* + 9) из равенства (12).
Получаем:
9f{x)=g(x)-te + g{*)-(-M)-r(x).
Отсюда:
/W'(-9)+g-(x).(6x-13)=D(x),
т. е. мы нашли, что <р(х)=—9, ty(x) = 6x—13.
Пользуясь равенством (10), можно получить ряд свойств
взаимно простых многочленов, аналогичных свойствам взаимно
простых целых чисел. Мы ограничимся следующим свойством.
Если многочлены / (х) и g (х) из Р [х] взаимно просты с
третьим многочленом к (х) из Р [х], то произведение f (x) g (х)
также взаимно просто с h (x).
Доказательство. Так как по условию f(x) и h(x)
взаимно просты, то
/(*)?(*) +А (*)ф(*) = 1
для некоторых ср (х) и <\>(х) из Р [х]. Умножим обе части этого
равенства на g(x):
f(x) g (х) ср (х) + h (х) g (x) ф (x) =g (x).
Пусть теперь d(x) —какой-нибудь общий делитель f(x)g(x)
и h(x). Тогда левая часть последнего равенства будет
делиться на d(x) и потому на d(x) будет делиться и правая
часть, т. е. g(x). Таким образом, d(x) оказалось общим
делителем g(x) и h(x). Но g(x) и h\x) взаимно просты.
Следовательно, d(x) должно быть многочленом нулевой степени,
в силу чего произведение f(x)g(x) и h(x) взаимно просты.
Это свойство можно при помощи метода математической
индукции перенести на любое число многочленов из Я[л:]:
если каждый из многочленов fx(x)y ..., fs(x) взаимно прост
с h(x), то произведение/г(х)f2(х) ... fs(x) также взаимно
просто с h(x).
§ 27. Неприводимые многочлены
В теории делимости многочленов роль простых чисел играют
так называемые неприводимые многочлены.
Определение. Многочлен f(x) из Р[х] называется
приводимым над полем Р, если он может быть разложен
176
в произведение двух многочленов меньшей степени из того
же кольца Р [х].
Многочлен р (х) выше нулевой степени из Р [х]
называется неприводимым над полем Р, если р(х) не может
быть разложен в произведение двух многочленов меньшей
степени из того же кольца Р[х].
Согласно этому определению многочлен нулевой степени
нельзя считать приводимым, а также нельзя считать
неприводимым многочленом. В этом отношении наблюдается та же
картина, что и для числа 1. Число 1, как известно, не
считается простым и в то же время не считается составным
числом.
Примеры. 1. Многочлен f(x)=x*—5x2 + 6 можно
разложить на множители: f(x) = (x2—2) (х2—3), причем х2—2 и
х2—3 имеют степень меньшую, чем f(x) и являются
многочленами над тем же полем рациональных чисел, что и f(x).
Следовательно, рассматриваемый многочлен f(x) приводим над
полем рациональных чисел.
2. Многочлен первой степени р (х) = х+ 1 неприводим над
любым числовым полем А
Действительно, если g(x) и h (x)—произвольные многочлены
выше нулевой степени, то их произведение будет иметь по
меньшей мере вторую, а не первую степень.
3. Многочлен р{х) =х2—2 неприводим над полем
рациональных чисел.
В самом деле, если бы многочлен р(х) был приводим над
полем рациональных чисел, то р(х) разлагался бы в
произведение двух множителей первой степени над полем
рациональных чисел:
р (х) = х2-2 = (ах + b) (ex + d)9
где a, Ьу с, d— некоторые рациональные числа. Полагая х =
= , получаем: 2=0, откуда 1^2= ± — . Мы пришли
а а2 а
к противоречию: число У 2 оказалось рациональным числом ±— .
а
Следовательно, многочлен р(х) = х2—2 неприводим над полем
рациональных чисел.
Однако этот же многочлен будет уже приводимым над
полем действительных чисел, так как в поле действительных
чисел мы считаем допустимым разложение и на множители
с иррациональными коэффициентами:
р(х) = (х-У1>)(х + У~2).
Для многочленов кольца Р[х] имеет место теорема,
аналогичная теореме о разложении целого числа на простые
множители.
177
Основная теорема теории делимости многочленов. Всякий
многочлен из Р [х] выше нулевой степени разлагается в
произведение неприводимых многочленов:
f(x)=p1(x)p2(x) ...pk(x),
(Pi (x) —неприводимый многочлен над полем Я), и это
разложение является единственным с точностью до порядка
следования и множителей нулевой степени.
Предварительно придется рассмотреть несколько свойств
неприводимых многочленов, сходных со свойствами простых
чисел.
I. Еслирг (х) и р2 (х)—неприводимые многочлены над полем
Р и рг (х) делится на р2 (х)у то рг (х) и р2 (х) являются
ассоциированными.
В самом деле, из равенства рг (x)=p2(x)q(x), где q(х)—
частное от деления Рг(х) на p2(x)t следует в силу
неприводимости р1 (х), что q(x) есть многочлен нулевой степени:
q(x) = c ФО. Отсюда рг(х) = ср2(х), что и требовалось
показать.
II. Многочлен f (х) из Р [х] тогда и только тогда не
делится на многочлен р(х), неприводимый над полем Р, когда
f (х) и р(х) взаимно просты.
Доказательство. Пусть f(x) не делится на/?(л;).
Обозначим через D(x) наибольший общий делитель f (х) и р(х).
Так как р (*)—неприводимый многочлен, то из условия
делимости р(х) на D (х) следует только одно из двух: либо
1) D(x) есть многочлен нулевой степени, либо 2) D(x)
ассоциирован с р(х). Вторая возможность, однако, отпадает, так
как в случае ассоциированности D(x) ср(х) многочлен f(x)
делился бы на р(х). Следовательно, остается только одно—
D (х)—многочлен нулевой степени. Но это значит, что f(x) и
р (х) взаимно просты.
Обратно, пусть f(x) и р (х) взаимно просты. Тогда f(x) не
может делиться на р(х): если бы f (х) делилось на р(х), то
наибольшим общим делителем f(x) и р (х) было бы само
р(х)у а не многочлен нулевой степени.
III. Если произведение f(x)g(x) двух многочленов f(x)
и g (х) из Р [х\ делится на многочлен р (х)> неприводимый
над Р, то на р (х) делится по меньшей мере один из
сомножителей f(x), g(x).
Доказательство. Предположим противное: пусть ни
f(x) и ни g(x) не делятся на р{х). Тогда по предыдущему
свойству II многочлены f(x) и g(x) будут взаимно просты
ср (х). Отсюда в силу известного свойства взаимно простых
многочленов (см. § 26, стр. 176) произведение f(x)g(x) будет
также взаимно просто с р (х) и потому не может делиться
на р(х), что противоречит условию.
178
Свойство Ш можно распространить на случай произведения
любого числа сомножителей, воспользовавшись методом
математической индукции.
Теперь можно приступить к доказательству теоремы.
Доказательство основной теоремы теории
делимости многочленов.
1. Покажем сначала, что всякий многочлен f(x) из Р [х]
выше нулевой степени можно разложить в произведение
неприводимых множителей.
Для неприводимого f(x) утверждение очевидно—в этом
случае получается разложение из одного неприводимого
множителя: f(x)=f(x). Поэтому пусть f(x) приводимо. Тогда
Кх)=П{х)-их), (1)
где fi(x) и /2(-*0—многочлены из Р [х] более низкой степени-
чем f(x). Если один или оба сомножителя /2 (х) и f2(x)
приводимы, то один или оба сомножителя fx(x) и f2 (•*) будут
разлагаться на дальнейшие сомножители более низкой степени,
и мы получим разложение самого многочлена f (х) на
большее число сомножителей, чем в первоначальном разложении (1),
и т. д. Этот процесс дальнейшего разложения не может быть
безграничным, так как степени сомножителей не могут
безгранично понижаться. Следовательно, мы в конце концов дойдем
до разложения многочлена f (х) на неприводимые множители.
2. Теперь докажем вторую половину
теоремы—единственность разложения на неприводимые множители.
Пусть многочлен f (х) двумя способами разлагается на
произведение неприводимых многочленов:
f(x)=pl(x)p2(x)...pk(x) (2)
и
f(x) = q1(x) q2(x) ...qt (x), (3)
где Pi(x) и qf(х)—многочлены, неприводимые над Р. Без
ограничения общности можно предположить, что k < /.
Из равенств (2) и (3) следует, что
Рг(х)р2(х).. .pk(x) = q1(x) q2(x) ... qt(x). (4)
Левая часть последнего равенства содержит рг (х) и потому
делится на рх(х)\ следовательно, на рх(х) должна делиться и
правая часть. Отсюда в силу свойства III неприводимого
многочлена должен делиться на рх(х) по меньшей мере один из
сомножителей правой части. Пусть для определенности qx (x)
делится на Р\(х). Тогда по свойству I неприводимого
многочлена qx{x) и /?!(х) должны быть ассоциированными: qi(x) =
= с1/71(л:), где сг ф 0— число из поля Р. Подставляя это значе-
179
ние q^x) в правую часть равенства (4) и производя
сокращение обеих частей равенства на Рг(х), получаем:
РМ .. .pk(x) = c1q2(x)... qt(x). (5)
Повторяем относительно равенства (5) аналогичные
рассуждения. Получим q2 (х) = С2р2(х)у где с2ф0—число из Р.
Затем после соответствующего сокращения обеих частей
равенства (5) получим:
Рг(х) '-Pk(x) = cxc2qb{x) -..9i(*)
и т. д. Мы утверждаем теперь, что k = L В самом деле, если
предположить, что k < /, то после всех таких последовательных
сокращений мы получили бы равенство
1 = сгс2.. .ckqk+l(x).. .qt(x).
Но это равенство невозможно, так как 1 не может делиться на
многочлены qk+l (x)t ..., gt(x)9 имеющие степень выше нулевой.
Итак, k = l и qi(x) = c1p1(x), ..., qk(x)==:CkPk(x)- Теорема
полностью доказана.
В разложении многочлена f(x) на неприводимые множители
могут встречаться ассоциированные множители. Например,
многочлен f(x) = 6x6— \2хд + 6 разлагается надполем
рациональных чисел в произведение четырех неприводимых
множителей:
/ (х) = (2х2 + 2х + 2) (х2 + х + 1) (jc—1) (3*—3),
и мы видим, что многочлены 2х2 + 2х + 2их2 + х-\-\
ассоциированы, а именно совпадают с точностью до множителя 2.
Многочлены л:—1 и Зх—3 также ассоциированы (совпадают
с точностью до множителя 3).
Объединяя в разложении многочлена на неприводимые
множители ассоциированные множители, мы получим так
называемое каноническое разложение:
f(x) = cp*i (x)pa22(x) ... р*г(х), (а,—целое положительное),
где с ф 0—число из Я. Неприводимые многочленырь{х) теперь
существенно различны между собой (т. е. уже не являются
ассоциированными).
Показатель at называется при этом кратностью
неприводимого множителя pt(x).
Так, например, рассмотренный выше многочлен f (х)=6х6~
— 12л:8+ 6 имеет следующее каноническое разложение:
f(x)=6(x2 + x+l)2(x-iy,
причем кратности неприводимых множителей равны двум.
Вообще мы скажем, что некоторый многочлен g (x) из Р[х]
входит в данный многочлен f(x) из Р[х\ с кратностью а, где
180
а—целое неотрицательное число, если f(x) делится на g*(x)t
но не делится на g*+l(x).
Примеры. 1. Выяснить с какой кратностью входит многочлен
g(x) = x~—4 в многочлен f (х) = х* + х4—8х* - 8х2 + \6х + 16,
если в качестве поля Я рассматривать поле рациональных чисел.
Применяя алгоритм деления с остатком, без труда
убеждаемся, что f(x) делится на g2(x), но не делится на g3(x).
Следовательно, g(x) входит в f (х) с кратностью 2.
2. С какой кратностью входит многочлен g(x) = x2—2x—2
над полем рациональных чисел в многочлен f{x)=xh—Зл:—3
над тем же полем?
Легко убедиться, что f(x) не делится на g(x). Это
означает, что g(x) входит в f(x) с нулевой кратностью.
Может случиться, что неприводимый множитель р (х)
входит в каноническое разложение многочлена f(x)c кратностью,
равной единице. Мы будем в этом случае называть р(х)
простим множителем. Если же кратность р(х) будет больше
единицы, то мы назовем р(х) кратным множителем.
§ 28. Производные и формула Тэйлора
Существует метод, при помощи которого всегда можно
узнать, разлагается ли данный многочлен / (х) из Р [х] на
простые или кратные неприводимые множители. Этот метод
тесно связан с понятием производной.
Нам потребуется особое определение производной
многочлена, совершенно независимое от понятий непрерывности и
предела, так как мы рассматриваем многочлены над
произвольным числовым полем Р.
Пусть
/ (х) = а0 + ахх + а2х2 + . . . + апхп
—некоторый многочлен из Р[х]. Производной, или, точнее,
первой производной от f(x) мы назовем многочлен
0-а0 + 1*а1 + 2а2х+ ... + папхп~1
и будем обозначать его через /' (х). Очевидно, что /' (х) есть
многочлен из того же кольца Р[х].
Примеры. 1. Найдем, чему равна производная от
/(jc)=jc5—8jc3 + 2jc—6
или, как иногда принято говорить, продифференцируем f(x).
Без труда получаем, что
Г (*) = 5jc4-3-8jc2 + 1 -2 + 0.(-6)=5;с4-24;с2 + 2.
2. Рассмотрим многочлен f(x) = axn (/г>0), состоящий
только из одного члена. Его производная, очевидно, равна
181
f'(x) = naxn-\ В частности, когда /г=0, имеем f (х)=0-ах~1 = 0.
Мы видим, что производная от числа а поля Р равна нулю —
вывод, которым мы ниже воспользуемся.
В свою очередь назовем производную от /' (х) второй
производной и обозначим через /" {х\ производную от f" (х)
назовем третьей производной и обозначим через f"(х) и т. д.;
вообще производную от fk~l) {х) мы назовем &-й производной
и обозначим через fk)(x).
Нетрудно убедиться в справедливости следующих правил
дифференцирования.
I. Если f(x) и g(x)—два каких-нибудь многочлена из Р[х],
то
V(x)±g(x)Y=f'(x)±g'(x), (1)
U(x)g(x)]' = f'(x)g(x)+f(x)g'(x). (2)
Мы ограничимся выводом правила (1). Правило (2)
выводится аналогично.
Рассуждаем так. Пусть
/ (х) = а0 + агх + ... + апхпу
g(x)=b0 + Ьгх+ ... + Ьпхп.
Здесь степени старших членов апхп и Ьпхп одинаковы.
Очевидно, что мы можем всегда этого добиться, добавляя в
случае надобности члены с нулевыми коэффициентами.
Составляем сумму и разность многочленов f(x) и g(x):
f(x)±g(x) = c0 + c1x+ ... +спхп,
где cL=aL ± ^(/=0,1, 2, . . . , п).
Отсюда
[/(«*) ± g(x)]'=Cl + 2с2х + ... + пспх«-\
или, подставляя выражения с. и совершая соответствующую
группировку членов, получим:
[/ (х) ± g (х)]' = (а, + 2а2х + ... + папхп'1) ±
± (Ь, + 2Ь2х + . . . + nbnxn-x) =/' П ± g' (x).
При помощи метода математической индукции правила
дифференцирования (1) и (2) можно распространить на любое
число многочленов:
И. [М*)±/2(х)+ ... ±fk(x)]'=f'1(x)±f2(x)±...±f'l!(x),
lh(x)f2(x) ... /*(*)]' =
= f[(x)f2(x) ...fk(x)+h(x)f2 (x) ...fk(x) +
+ ... + f1(x)f2(x) ... f'k(x),
где h(x), . .. , fk(x)—многочлены из Р[х].
182
III. Если с—число из Р, f (х)—многочлен из Р\х] то
\cf(x)\' = cf'(x).
В самом деле, применяя к cf (x) формулу (2), получаем:
\cf(x)Y = (c)'f(x) + cr(x)=cf'(x)9
так как (с)'=0.
IV. Если f(x)—некоторый многочлен из Р[х\ и &—целое
положительное число, то
\f(x)]' = kf*-l(x)f'(x).
Действительно, k-ю степень fk{x) можно рассматривать как
произведение k одинаковых сомножителей, откуда в силу II:
[/*(*)]'=№)/(*) .../(*)+/(*)/'(*) ... f(*)+ ••• +
+ f(x)f(x) ...f'{x) = kf-\x)f'{x).
Возьмем из Р\х\ какой-нибудь многочлен f(x)=a0 + a1x +
+ ... + апхп. .Запишем неизвестное х в виде х = (х—а) + а,
где а—некоторое число из Р. Тогда сам многочлен f(x)
запишется в виде
f(x) = a0 + аг [(х—а) + а\ + а2 \{х—а) +
+ а]2+ ... +ап\(х-а) + а\". (3)
Если теперь раскрыть квадратные скобки и сгруппировать
члены по возрастающим степеням л;—а, то получится:
f(x)=A0 + Al(x-a) + A2(x-a)*+ . . . + ЛДх-а)*, (4)
где Л0, Аи . . . , Лл—какие-то числа из Р. Найдем, чему равны
эти числа, окольным путем, не раскрывая скобок в
выражении (З)1.
Равенство (4) будет сохраняться при любом значении х и,
в частности, при х = а. Но при х = а все члены в правой части
(4) обращаются в нуль, кроме Л0. Таким образом, получается,
что f(a)=A0. Далее, дифференцируя обе части равенства (4),
находим, что
f (х)=Аг + 2Л2 (х-а) + ... +пАп (х-а)п~\ (5)
Полагая затем х=а, будем иметь, что f (а)~Аг. Снова
дифференцируем равенство (5) и полагаем х = а. Получаем
f"(a) = 2A2 и т. д. В конечном счете мы придем к системе
уравнений:
f(a)=A0, f'(a) = Au f (а) = 2Л2 fk\a) =
=k\Ak /(л)(а) = «!Л„,
1 Мы поступаем так для того, чтобы избежать применения бинома
Ньютона.
183
откуда
A0=f(a),A^f'(a) Ak = ^L, . . . , An= ^-,
и
+ (л_а)-^+...+(х-в).^>.
+л til
Получилось так называемое разложение f(x) по степеням х—а,
или формула Тейлора. Она позволяет находить многочлен
f(x) через значения /(я), Г (а), . . . , f{n)(a).
Формулу Тейлора иногда удобнее записывать в несколько
ином виде, а именно, обозначим х—а через А. Тогда
№+1И(«) + (^ + 1.»ь..+»А|.
Примеры.. 1. Пусть /(л;)—многочлен четвертой степени
над полем рациональных чисел, и многочлен и все его
производные при х=\ имеют значения: /(1) = 1, /'(1)=2, f"(l) = 3,
/"'(1)=4, /IV(1) = 1. Требуется найти f(x).
В нашем примере а=1; следовательно:
f(x) = \ + 2(x-l) + ±(x-\)* + ^-(x-iy + ±.(x-iy,
или, после раскрытия скобок:
f(x)=— jc4+ — jc3-— х2 + — х- —.
1 V ' 24 2 4 6 8
2. Разложить / (л:) = (х + я)"> где а—число из Р, по
степеням х.
Находим, что
f'(x)=n(x + a)n-\...y fk)(x) =
=/г(/г-1) ... (n-k + l)(x + a)n-\ ..., Г(*) = "!,
откуда
f(0) = an,f'(0)=nan-\ ..., /(/г)(0) =
=/г(/г—1) ... (n-k + \)an-k,. .., f{n)(0) = n\
и
Мы получили разложение бинома Ньютона.
184
§ 29. Отделение кратных множителей
Теперь мы укажем метод, при помощи которого можно
узнать, разлагается ли данный многочлен из Р [х\ на простые
и кратные множители. Основную роль будет играть
следующая теорема.
Теорема. Если неприводимый (над полем Р) многочлен
р(х) входит в многочлен f (х) из Р[х] с кратностью а, то
р(х) в производную f (х) войдет с кратностью а—1.
Доказательство. Так как р (х) входит в / (х) с
кратностью а, то
f(x)=p*(x)q(x), (1)
где q (x) уже не делится тр(х). Дифференцируем правую
часть (1), получаем:
/' (х) = ар -»(х) р' (х) q (х) + р" (х) q' (x) =
=р-х (х) [ср' (х) q(x)+p (x) q' (x)}.
Второе слагаемое в квадратной скобке делится на р(х), но
первое не делится, так как q(x) и р' (х) не делятся на р(х)[;
следовательно, и вся сумма в квадратных скобках не может
делиться на р(х). Тем самым обнаружено, что р(х) входит
в Г (х) с кратностью а—1.
Из этой теоремы следует, что многочлен f(x) над полем Р
тогда и только тогда не имеет кратных множителей (т. е.
имеет только простые множители), когда он взаимно прост
со своей производной f'(x).
В самом деле, пусть многочлен f(x) имеет следующее
каноническое разложение на неприводимые множители:
f(x) = cp\4x)p'*{x) ...p"/(x). (2)
По доказанной теореме неприводимые множители рх (х),
Рч {*)> • • • > Рг(х) должны входить в производную /' (х) с крат-
ностями на единицу меньшими, чем в f(x). Следовательно,
Г {*)=рУ (х)рГ1 (■*)••• Р'/'1 W f W'
где ср(х) есть произведение собственных множителей
производной, т. е. множителей, не входящих в данный многочлен
/(л:). С другой стороны, наибольший общий делитель D (х)
многочлена f(x) и его производной f' (x) состоит из тех и
только тех множителей, которые являются общими для f(x) и
f (х). Следовательно,
D(x) = clPy (x)p?-\x) . . . /Л"1 (х), (3)
1 р' (х) не делится на р (х), так как имеет степень, на единицу меньшую
степени р (х).
где сгФО — число из поля Р. Мы видим отсюда, что D (х)
в том и только в том случае является многочленом нулевой
степени, когда все аь а2, . . . , аг равны единице, т. е. когда
все множители многочлена / (л:) однократные (простые).
Обозначим теперь через Хх произведение всех простых
неприводимых множителей канонического разложения (2); через
Х2—произведение всех двукратных неприводимых
множителей, взятых по одному разу; через Хв - произведение всех
трехкратных неприводимых множителей, взятых по одному
разу, и т. д. Может случиться, что / (х) не имеет однократных
множителей; мы тогда будем считатьЛ^! Вообше мы будем
считать ^=1, если / (х) не имеет ^-кратных множителей.
п.с ли 5 — наивысшая кратность множителей многочлена / (х), то
f(x) = cXX--- К
Например, пусть f(x) следующим образом разлагается на
неприводимые множители над полем рациональных чисел:
?(х) = (х*-2У(х-\)(х+1)(х-2).
Очевидно, здесь
*i = («*-!) («*+1)С*-2), X2=h XB=x*-2,
откуда f(x)=XlX22X33.
Из канонического разложения (3) наибольшего общего
делителя D(x) получается, что
D(x) = ClXX ... К'1-
В свою очередь наибольшим общим делителем D (х) и
производной D' (х) будет
AW=*' ••• хга.
Далее, наибольшим общим делителем Dx (x) и D[ (x) будет
D,(x)=c,XX---K*
и т. д. Наконец, имеем, что наибольшим общим делителем
Ds.2(x) и D's_2(x) будет
0,-i (*) = !•
186
Теперь составляем:
Е* = 77Т\ = *i*i*.*e ■ • • *» (di = т- ~число из Я>'
U (X) \ Ч
^ х) = d2X2X3 ... Xs, (d2 = — число из Р],
Р D(x)
D 2 {х)
Es= т;—ГТ" =dsxs> (rf, = ^-i—число из Я),
после чего без труда находим, что
= tiXi> тг = е2Х2> . . ., -^ =es_xXs_v
—" — е1Л1* ~ ~е2л2> • • • > ~ГГ
£2 t3 ts
Es=esXs,
где
e\— — > e2— — > • • • > es-\ — ~~, > es~~as
d2 * d* s~l ds
Предоставляем читателю проверить, что
(е1Х1)(е2Х2Г ... (esXs)s=f(x).
Итак, мы выделили Xlf Х2, . . ., Xs. Обращаем внимание
на то, что этот процесс выделения Хъ Х2, . . ., Xs проводится
с точностью до множителей нулевой степени. Если Xk
окажется многочленом выше нулевой степени, то/(х) будет иметь
Л-кратные множители.
Пример. Выделить кратные множители многочлена
f(x) = x*--Lx+ 3
16
над полем рациональных чисел.
Составляем производную:
f(x)=4*»--±-.
Далее с помощью алгоритма Евклида находим общий
наибольший делитель f(x) и f (х). Получаем, что D(x) = 2x— 1. Затем
находим D' (х), П (х) = 2, откуда D1(x) = \.
А теперь составляем Ех и Е2:
*4 хЛ
17 2 16 1 Q , 1 о.1 3
Е1 = = — х3 Н х2 -\ х ,
1 2* —1 2^4 '8 16 '
Е2=?^=2х-1,
187
Наконец, делим Ег на Е2:
—- = — х2 ^ лН ,
Е2 4 4 16
откуда (с точностью до множителей нулевой степени):
1 4 4 '16 2
Итак, f{x) имеет простые и двукратные множители:
/(*)-(-L*. + -L* + -I.)(2*-i)».
Мы видим, что процесс отделения кратных множителей
сводится к дифференцированию многочленов, к отысканию
наибольших общих делителей при помощи алгоритма Евклида и
к применению алгоритма деления. Таким образом, если
коэффициенты многочлена f (х) принадлежат полю Р, то тому же
полю будут принадлежать и коэффициенты D (x), Dx (х), . . .,
Ds_x(x), Elt E2, . . ., Es, Xv Xr .. ., Xs, и мы приходим
к такому заключению:
Независимо от того, рассматривается ли многочлен f(x)
над полем Р или над его расширением Р', при проведении
нашего процесса будут получаться те же самые
множители Xk. В частности, если многочлен f (х) над полем Р
имел только простые множители, то он и над
расширением Рг будет иметь только простые множители.
Задача. Выделить кратные множители следующих многочленов над
полем рациональных чисел:
а) л:4 + л:3 — 3л:2 — Бх — 2, б) л* — 3л:4 + 4л* — 4л:2 + 3*— 1,
в) *?_ Зл;в + 5*5 — 7л;4 + 7л;3 — 5л:2 + 3л: — 1, г) л? — 4л:4 — 16*2 + 16.
§ 30. Корни многочлена
В § 27 было установлено, что всякий многочлен из Р [х]
со степенью п > 1 разлагается единственным образом на
произведение неприводимых (над полем Р) многочленов:
" f(x) = cp}(x)p? (х) ... р}(х),
где с ф 0 некоторое число из Я.
Может случиться, что в состав этого разложения войдет и
линейный двучлен л:—а. Возникает вопрос: когда это будет?
Иными словами, когда f (х) делится без остатка на х—а?
Разделим многочлен f (х) на х—а. Вообще при делении
должны получиться остаток г и частное q{x)\ так как дели-
188
тель есть многочлен первой степени, то остаток г будет
многочленом нулевой степени или нулем. Таким образом,
f(x) = (x-a)q(x) + r, (1)
где г—число поля Р.
Деление на х—а особенно удобно проводить при помощи
способа, известного под названием способа Горнера. Он
состоит в следующем. Пусть
f(x) = a0xn + a1xn~l+ ... +ап.
Очевидно, что частное от деления / (х) на х—а будет
многочленом п— 1-й степени:
q (х) = Ь0хп'1 + М + . . . + bn-i.
Подставляя эти выражения f(x) и q(x) в равенство (1),
получим после некоторых очевидных действий:
а0хп + аххп~х + а2хп~2 + ... + ап =
= b0xn+{bl-ab0)xn-l + {b2-ab1)xn-2+ ... +
+ (bn-i-abn-2)x + [r-abn-i)-
Два многочлена равны только в том случае, когда совпадают
их коэффициенты при одинаковых степенях х; следовательно:
a0 = b0, a1 = b1—ab0, a2 = b2—ablf . . . , ak = bk—abk-\, . . .,
ап \ = b„ л—аЬп 9, a=r—abn л,
откуда
Ь0 = а0, Ьг = аг + ab0, b2 = a2 + ablt . . . , bk = ak + abk-\, . .. ,
Вычисление коэффициентов b0, blt . . ., bn-\ частного и
остатка г рекомендуется располагать в виде следующей схемы,
называемой схемой Горнера:
а0
а0
<*i
ab0 + аг
Я2
abY + й2
а3
аЪъ + а3
. . .
• • •
ап-\
а6л-2 + ал-1
ап
аЬп-\+ап\
В нижней строке схемы Горнера стоят последовательно
искомые коэффициенты bt многочлена q (х) и остаток г.
Пример. Разделить по схеме Горнера многочлен
f(x)=xb-2xs + 3x2-5x+U тх + —.
189
Располагаем выкладки в схему Горнера, причем
арифметические подсчеты производим в стороне, а в схему
вписываем лишь окончательные результаты:
1
1
0
1
2
— 2
7
4
3
31
8
-5
111
16
11 1
463
32
Таким образом, получились следующие частное и остаток:
/ ч 4 1ч 7 о , 31 111
а(х) = х* хв х2 -\ х ,
4 V ' 2 4 8 16 '
г_ 463
32
Вернемся к равенству (1). Мы знаем, что если многочлены
равны, то и их значения при любом значении неизвестного х
также должны быть равны. Следовательно, не нарушая
равенства (1), мы можем в нем х заменить через а. В результате
будем иметь f(a) = r. Мы получили следующее предложение,
известное под названием теоремы Безу:
Остаток от деления многочлена f (x) на х—а равен
значению f(x) при х=а.
Например, при делении / (x) = xi—2хв—2 на х—1 по
теореме Безу должен получиться остаток, равный /(1) = 1— 2—2 =
= —3. И, действительно, выполняя деление, получим в
остатке —3.
Займемся теперь случаем, когда многочлен f(x) делится на
х—а без остатка. Этот случай тесно связан с понятием корня
многочлена.
Определение. Корнем многочлена f(x) из Р [х]
называется такое значение а неизвестного х, при котором
значение многочлена равно нулю: f(a)=0.
Легко убедиться, чта число а поля Р тогда и только
тогда является корнем f(x), когда f (х) делится на х—а.
Доказательство. Если f(х) делится на х—а, то
остаток г равен нулю. Но по теореме Безу r=f(a). Следовательно,
f(a)=0, т. е. а корень многочлена f(x).
Обратно, если а—корень многочлена f(x), то f(a)=0, или,
пользуясь снова теоремой Безу, г=/(а)=0, откуда многочлен
f(x) делится на х—а.
Иногда вместо того чтобы говорить о корне многочлена,
говорят о корне алгебраического уравнения д-й степени над
полем Ру т. е. уравнения ви^а
а0х^ + а1хп~1+ ... +ап = 0, (2)
190
где а0, alf . . ., ап—числа поля Р, называемые
коэффициентами уравнения. При этом под корнем уравнения (2)
подразумевается корень многочлена f(x) = a0xnjra1xn~l-\- ... + ап,
представляющего собой левую часть уравнения.
Знак равенства, употребляемый в записи уравнения (2),
нельзя смешивать с равенством многочленов: в уравнении (2)
под х следует понимать нечто другое, а именно любой из
корней многочлена f(x).
Может случиться, что многочлен f (х) из Р[х] будет
делиться не только на х—а, но и на некоторую степень (x—a)k.
В соответствии с этим условимся а называть k-кратным
корнем многочлена/(л:), если л:—а входит в f (х) с кратностью k.
Пример. Легко проверить, что число 1 является корнем
многочлена f (х)=хь—2х* + х* + х2—2х -f-1 над полем
рациональных чисел. Найдем кратность этого корня.
Если разделить f (х) на х—1, то в частном получится
q(x)=xi—х3 + х— 1, а остаток, очевидно, будет равен нулю.
В свою очередь делим q (x) на х—\. Получается снова
остаток, равный нулю, а частное будет равно qx (x) = xs + 1. Если
теперь разделить qx (x) на х—\, то остаток уже будет отличен
от нуля. Таким образом, данный многочлен f(x) делится на
(х— I)2, но не делится на (л:—I)3, в силу чего 1 является
двукратным корнем f(x).
Сколько корней может иметь многочлен (уравнение) над
полем Я? Ответ дает следующая теорема.
Теорема, Число корней многочлена f (х) из Р \х\ не
превосходит степени п многочлена, если даже считать
каждый корень столько раз, какова его кратность.
Так, многочлен f(x) = x2—2 в поле рациональных чисел не
имеет вовсе корней,_а в поле действительных чисел он будет
иметь два корня: У2 и —1^2; в том и другом случае число
корней не превосходит степени многочлена.
Доказательство. Рассмотрим сначала случай /г>1.
Предположим противное: пусть в этом случае число корней
многочена f(x) превосходит п. Тогда f(x) будет следующим
образом разлагаться в произведение множителей над полем Р:
f(x) = (x^-ai)ki(x-a2)^ .. . (*-a,)S(*)- (3)
Мы здесь через аъ аъ . . . , as обозначили корни многочлена
f(x). Так как число корней по нашему предположению должно
превосходить /г, то kx + &2 + ... +ks> п. Но в таком случае
правая часть равенства (3) должна представлять собой
многочлен степени более высокой, чем п. Мы пришли к
противоречию: многочлен f(x) п-й степени вместе с тем является
многочленом степени выше п.
Если степень п многочлена f(x) равна нулю, то f(x),
очевидно, совсем не имеет корней. Таким образом, теорема и для
этого случая верна.
191
Замечание. Для многочлена, равного нулю, теорема
неверна, так как этот многочлен имеет значения, равные нулю,
при любых значениях х. Поэтому в формулировке теоремы
говорится лишь о многочленах, имеющих степень.
Отметим одно важное следствие.
Следствие. Если степени многочленов f(х) и g(x) из
Р[х] не превосходят п и многочлены f (x) и g(x) имеют
равные значения более чем при п различных значениях х,
то f(x) = g(x).
Предположим противное: пусть f (х) не равно g(x), т. е.
пусть разность f (x)—g(x) = h(x) отлична от нуля. Степень
многочлена h(x), очевидно, не должна превосходить п. Но,
с другой стороны, h(x) обращается в нуль более чем при и
значениях неизвестного х. Получается противоречие с выше-
доказанной теоремой, и мы вынуждены признать, что h (x)
есть нуль. Но тогда / (x)=g(x).
Из этого следствия сразу вытекает, что два многочлена
f (x) и g(x) из Р[х], имеющие равные значения при любых
значениях х, должны быть равны. Таким образом, многочлен
f (х) кольца Р[х] можно рассматривать как функцию
переменного х, и эта функциональная точка зрения на многочлен
не будет находиться в противоречии с тем алгебраическим
понятием равенства многочленов, которое было введено в § 25.
Этим мы заканчиваем общую теорию многочленов над
числовым полем Р. В силу произвольности Р все выводы § 25—30
будут справедливы независимо от того, является ли Р полем
рациональных чисел, полем действительных чисел, полем
комплексных чисел или каким-нибудь другим числовым полем.
Задачи. 1. Пользуясь схемой Горнера, произвести деление следующих
многочленов над полем рациональных чисел:
а) 3** — 2*з — х2 + Ъх + 7 на х — 4,
б) х5 + 6*з — 2л:2 + 6х + 3 на х + 2,
в) х* — *5 — 2*з + х2 — 7х — 10 на *
2 '
г) хь *4 -\ х2—2х И на х-\
2 3 5 2
2. Подобрать А, В и С так, чтобы 1 было корнем многочлена /(*) =
= Ах5 + Вх2 + Сх + 1 не ниже третьей кратности.
Глава пятая
МНОГОЧЛЕНЫ НАД ПОЛЕМ КОМПЛЕКСНЫХ ЧИСЕЛ
§ 31. Основная теорема алгебры
Если рассматривать поле рациональных чисел, то окажется,
что далеко не всякий многочлен над этим полем имеет корни.
Например, многочлен f(x) = x2 — 2 не имеет рациональных
корней. Такая же картина наблюдается и в отношении поля
действительных чисел, являющегося расширением поля
рациональных чисел. В этом поле будет неразрешимым, например,
многочлен f(x)=x2 + 1, так как он не имеет действительных корней.
Самым „обширным" числовым полем является поле
комплексных чисел. В этом поле разрешимы многочлены первой и второй
степени и, более того, извлекается корень п-й степени из
любого комплексного числа. В дальнейшем мы увидим, что
поле комплексных чисел обладает следующим характерным
свойством.
Основная теорема алгебры (теорема о существовании
корня).
Всякий многочлен f (x) над полем комплексных чисел
степени п > 1 имеет по меньшей мере оОин комплексный корень.
Еще в 1629 г. французский ученый Жирар предположил,
что любое алгебраическое уравнение #-й степени имеет п
корней, действительных и мнимых. В 1746 г. французский ученый
Даламбер впервые попытался доказать основную теорему
алгебры, но его рассуждения оказались нестрогими. В 1799 г.
Гауссу удалось получить сравнительно удовлетворительное
доказательство. Впоследствии Гаусс нашел еще несколько
доказательств основной теоремы.
Так как основная теорема алгебры тесно связана с
понятием непрерывности, то все ее доказательства неизбежно
опираются на это понятие.
Обычное определение непрерывной функции,
рассматриваемое в курсах математического анализа, без особых
затруднений можно перенести и на тот случай, когда переменное х
и функция f(x) принимают комплексные значения. Приходится
лишь вместо абсолютной величины говорить о модуле, а именно:
комплексная функция f{x) комплексного переменного х назы-
193
вается непрерывной в точке х0, если для всякого наперед
заданного положительного числа е можно указать такое
положительное число о, что для всякого значения х, удовлетворяющего
неравенству
\х-х0\<Ъ9 (1)
будет иметь место неравенство
l/(*W(*o)l<« (2)
для соответствующих значений функции. Здесь две вертикальные
черточки означают уже не абсолютную величину, а модуль.
Дадим этому определению непрерывности геометрическое
истолкование.
Так как х и f(x) принимают комплексные значения, то
можно положить, что х = Ь-\-щ и w=f (х) = и + iv. Возьмем,
да!ее, для изображения значений переменного х и функции f(x)
дв^ плоскости Р и Q, причем на плоскости Р возьмем
прямоугольную систему координат Ют], а на плоскости Q
—прямоугольную систему координат uOv. Каждое значение х=\ + щ
комплексного переменного можно изобразить точкой х на
плоскости Р с координатами £, ч\ или вектором Ох (см. черт. 5).
Соответствующее значение функции w=f(x) = u + iv будет
изображаться точкой w на плоскости Q с координатами и, v,
или вектором Ow (см. черт. 6). Мы будем плоскость Р называть
плоскостью переменного х, a Q —плоскостью функции f(x).
Выясним теперь, какой геометрический смысл имеют
неравенства (1) и (2).
Пусть на плоскости х значение х0 изображается
вектором Ох0 (черт. 5). Тогда разность х — х0 будет изображаться,
вектором xtlx, соединяющим точки х0 и х. Отсюда | -х: — jc0 |
будет означать длину отрезка хх0, т. е. расстояние между
точками х0 и х. Таким образом, неравенство (1) означает, что
точка х должна лежать внутри круга Сг радиуса 8 и с центром
в точке х0.
Такое же точно истолкование можно дать неравенству (2):
если на плоскости функции f(x) значение f(x0) изображается
точкой w0y то \f(x)—f(x0)\ есть расстояние между точками w0
и w (черт. 6), а неравенство (2) означает, что точка w лежит
внутри круга С2 радиуса е и с центром в точке w0.
Таким образом, определение непрерывности функции в точке
получает следующее геометрическое истолкование:функция f (х)
непрерывна в точке х0, если для круга С2 произвольного
радиуса е с центром в точке w0 на плоскости функции можно всегда
указать такой круг С, радиуса 8 с центром в точке х0 на
плоскости независимого переменного, что всякой внутренней
точке х круга С, будет соответствовать внутренняя точка w круга С2.
Понятию непрерывности функции на отрезке,
рассматриваемому в курсах математического анализа, будет соответствовать
194
понятие непрерывности функции в замкнутой области. Под
замкнутой областью мы будем подразумевать часть плоскости
переменного х, ограниченную непрерывной замкнутой кривой,
лежащей в конечной части плоскости; при этом точки, лежащие
на кривой, причисляются к области, а самую кривую называют
контуром или границей области. Точки области, не лежащие
на контуре, называются внутренними точками области.
Примером замкнутой области может служить круг.
Функция f (х) комплексного переменного называется
непрерывной в замкнутой области С, если она непрерывна в каждой
Черт. 5 Черт. 6
точке этой области. В случае, когда функция f(x) непрерывна
в любой точке х0 плоскости переменного х, функция f(x)
называется непрерывной во всей плоскости. В этом случае мы
будем говорить, что f(x) непрерывна, для краткости опуская
слова „во всей плоскости".
Обратимся теперь к многочлену f(х) над полем
комплексных чисел, т. е. многочлену с комплексными коэффициентами.
Если его рассматривать как комплексную функцию
комплексного переменного х, то можно доказать следующее
предложение: многочлен f(x) есть непрерывная функция
комплексного переменного х 1.
Доказательство. Пусть х0 произвольная точка.
Разлагаем f(x) по степеням л: — х0 по формуле Тейлора:
f(x)=f(*o) + (*-Хо)Г (х0) + (*~"2*о)' П*о) + . . . +
+ j£^/W(*o)f
1 Здесь и ниже под словом «многочлен» мы будем подразумевать
многочлен над полем комплексных чисел.
195
откуда:
f{x)-f(x0) = (x-x0)f'(x0) + £=£&-f" (x0)
+
+ ol-^/(„)(Xo)>
n!
Известно, что модуль суммы меньше или равен сумме
модулей, а модуль произведения равен произведению модулей.
Следовательно,
|21/"(*о)
<
X — .
+
^0
X
\Г(*0
— *о
)
п
+
f(n)
X —
(*b) 1
f(x)-f(x0)
Усилим неравенство, заменяя
2!
+ . . . +
Г(х0)
»
Г (Хо)
21
» • • • »
№ (Хп)
я!
их наибольшей величиной А:
\f(x)-f(x0)\<A(\x-x0\ + \x-x0\* + ... + \x-x0\").
Выберем модуль разности х — х0 столь малым, чтобы \х — х0 | < 1.
Тогда неравенство может только усилиться, если степени
|jc — jc0 |2, . . . , | х — х0 \п заменить через | х — х01:
\f(x)—f(x0)\<A(\x — x0\ + \x — x0\ + ... + \x — x0\) =
= \х — х0\пА.
Зададим произвольное число е > 0. Выберем для этого е > 0
число 8 > 0 так, чтобы 8 < -— и 8 < 1. Тогда при | х — х0 | < 8
у нас получится, что
\f(x)-f(xo)\<*.
и теорема доказана.
Из этой теоремы легко получается, что модуль \f (х)\
многочлена f (х) есть также непрерывная функция
комплексного переменного х.
В самом деле, согласно свойству модуля (см. §23, стр. 153),
\nx)\-\f(x0)\\<\f(x)-f(x0)\.
(3)
Но по доказанной теореме о непрерывности многочлена f(x)
можно для всякого е > 0 указать такое 8 > 0, что при | х — х01 <8
будет иметь место неравенство \f(x) —-f(x0) | < е. Отсюда
благодаря неравенству (3) и подавно будет:
||/(*)Н/(*о)||<« при |*-х0|<8.
196
Для доказательства основной теоремы алгебры нам
понадобится еще несколько лемм и теорем.
Лемма 1 (о многочлене без свободного члена). Для всякого
многочлена / (х) = а0хп + аххп~х + . . . + ап-\х степени п > 1 ,
со свободным членом ап, равным нулю, можно для любого
г > О указать такое Ь > О, что для всех ху
удовлетворяющих неравенству \ х | < 8, будет иметь место неравенство
\f(x)\ <е (т. е. при достаточно малых по модулю значениях х
рассматриваемый многочлен f(x) может быть сделан по модулю
сколь угодно малым).
Доказательство. Возьмем в качестве х0 значение 0.
Многочлен / (х) есть непрерывная функция комплексного
переменного х, следовательно, для любого е > Оможно указать такое
S > 0, что при всех х, удовлетворяющих неравенству | х — 01 < 8,
будет \f{x) — /(0)| < е или при |*|<& будет |/(*)|<е, так
как, очевидно, /(0)=0.
Теорема 1 (о модуле старшего члена). Пусть f(x) = a0xn +
+ . . . + ап многочлен степени п > 1 и А — наибольшая из
величин модулей \ах\у \а2\, ..., \ап\. Тогда для любого
наперед заданного действительного положительного числа
k будет выполняться неравенство
\а0хп\>к\а,хп~1 +. . . + ап\
при l^-^ + l.
Эта теорема понадобится также в главе VI при изложении
методов численного (приближенного) решения алгебраических
уравнений.
Доказательство. Усиливаем очевидное неравенство
l^x"-1 + . . . +ап\<\а1\\х\п-1 + . . . + \ап1
заменяя в его правой части |а,|, . . . , \ап\ величиной А:
\а{хп~1 + . . . + ап\ < А (И"-1 + \х\п~2 + . .. +1),
или, суммируя геометрическую прогрессию:
\а1^-1 + ... + ая\<А^Г.
Если ззять |л:|>1, то последнее неравенство можно усилить
следующим образом:
\a1^-1 + ... + an\<A-[i^rr
Выясним, для каких значений х
kAj^<\a0x»\,
197
для чего решаем это неравенство:
kA
откуда l*l>-j^j-+l.
Ъ А
Итак, при |*|>ч—г + 1 наверное будет
|а0хп\>k\ аххп~х + . . . +ап|,
что и требовалось показать.
При помощи теоремы 1 легко получается следующая лемма.
Лемма 2 (о возрастании модуля многочлена). Модуль
всякого многочлена f(x) степени п>\ при достаточно
больших значениях \х\ будет больше любого наперед заданного
действительного положительного числа М.
Доказательство. Так как модуль суммы больше или
равен разности модулей, то
\!(х)\>\а^\-\ах*Г-1 + ... + ап\.
2А
Применив теорему 1, полагая k=2 и |-*|>-пг7+1»
аххп~1 +
а„
<i
l«ol
(4)
получим:
а,х
Таким образом, заменяя в правой части неравенства (4)
вычитаемое большей величиной-^ \а0хп\, мы его только усиливаем:
/(*)
а0хп
а0хп
апхп
Возьмем теперь х столь большим по модулю, чтобы одно"
временно!л:| > -у—-г +1 и |л*| > 1/ т—г. Тогда при этих значе-
I Uo I Г I им
ниях х
\f(x)\>
i-|a0^|>l|a0|(^]7-
2М
или после соответствующих сокращений: \f(x)\>M, что и
требовалось показать.
Мы подошли к лемме, играющей решающую роль в
доказательстве основной теоремы алгебры.
Лемма Даламбера. Если многочлен
f(x) = a0xn+alxn~1 + ...+ani а0фО,
степени п>\ не обращается в нуль при х=х0, то можно
подобрать всегда такое комплексное число h фО, чтобы
\f (x0+ h)\ <r \f(x0) | (при этом h может быть даже сколь угодно
малым по модулю).
198
Доказательство. Разлагаем f(x0-\-h) по степеням Л:
f (х0 + /г)=/ (х0) + hf (х0) + . . . + Л« ^^
или
f(*o + AW(*o)+*(*),
где
Очевидно, что g (h) ф О, так как , = а0фО. Пусть cmhm—
отличный от нуля член наименьшей степени многочлена g (h)
(1 </Ж/г). Тогда мы можем написать, что
g(h) = cmh"(l+k(h)),
где И{К)фО при т<п и k(h)=0 при т=я. Таким образом,
/(^о + А)=/Ю+^т(1+*(/г)),
или
/ (х0 + fi) = (f (х0) + cmh") + cmh*k (h).
Так как модуль суммы меньше или равен сумме модулей, а
модуль произведения равен произведению модулей, то отсюда
получаем неравенство:
|/(^о + А)1<|/(^о) + ^-| + |^/г-| |Л(Л)|. (5)
Но k (h) есть многочлен без свободного члена. Следовательно,
по лемме 1 можно для е = 1 подобрать такое 8, >0, чтобы при
| h | < Ьг выполнялось условие | k (А) | < 1. Усиливаем при | h | < Ьх
неравенство (5) следующим образом:
\f(x0 + h)\< \f(x0) + cmh™ | + | cmh™ |.
Теперь подберем аргумент h таким, чтобы аргумент cmhm
отличался на те от аргумента f(x0):
arg (cj**1 ) = ?+*,
где ср — аргумент f(x0). Так как
arg (crnhm) = 2LTgcm + m arg А,
то получаем уравнение:
arg^ + zraargA^+w,
из которого находим без труда, что
_ у + гс — argcm _^
199
arg A
ъ т
С этого момента будем предполагать, что argA = <o. При
таком предположении вектор ON, изображающий cmhm) лежит
на одной прямой с вектором ОМ, изображающим f(x0), но
направлен в противоположную сторону, в силу чего
\f(x0) + cMh«\ = \\f(x0)\-\cmh«\\
\f(x0 + h)\<\\f(x0)\^\cmh^\\ + \cmh^\. (6)
Найдем, при каких значениях h будут одновременно
выполняться неравенство (6) и неравенство
\cmh-\<\f(x0)\. (7)
Решаем неравенство (7) относительно А:
l^mH'J-|A|*<l/(*o)l.
откуда
т
i*i<VW-v
(корень m-Pi степени, очевидно, следует брать в
арифметическом смысле). Обозначим теперь через 8 наименьшее из чисел
о1 и 82. Тогда при | h | < 8 и arg й = <о будут одновременно
выполняться неравенства (6) и (7). Но из неравенства (7) следует,
что разность | / (х0) | — \cmhm | —положительное действительное
число, а потому
\\f(x0)\-\cmh"\\=\f{xQ)\-\cmh<"\.
Таким образом, предполагая |А|<8 и arg/z=<o, мы можем
неравенство (6) преобразовать в
I/ (х0 + h)\ < \f(x0) | - \cji« | + \cmh" |
или после уничтожения подобных членов:
l/(*o + A)KI/C*o)|.
Лемма Даламбера доказана.
§ 32. Доказательство основной теоремы алгебры
Кроме леммы Даламбера существенное значение в
доказательстве основной теоремы будет иметь следующая теорема,
относящаяся к действительной функции комплексного
переменного, т. е. к функции, принимающей только действительные
значения при всевозможных комплексных значениях х.
Теорема Вейерштрасса. Действительная функция у(х)
комплексного переменного х, непрерывная в некоторой замк-
20Э
нутой области С, достигает в этой области своего
наименьшего значения, т. е. существует в области С такая
точка х0, что <р (х0) < « (х) для всех точек х области С1.
Доказательство этой теоремы опускаем, так как оно
относится к теории функций комплексного переменного.
Посмотрим, что дает теорема Вейерштрасса для модуля
многочлена/(л:), являющегося, очевидно, действительной
функцией комплексного переменного.
Для большей наглядности мы прибегнем к геометрической
иллюстрации. Восставим в каждой точке плоскости
переменного х перпендикуляр с длиной, равной (при заданной единице
масштаба) модулю значения многочлена / (х) в точке х. В силу
непрерывности модуля многочлена концы перпендикуляров
должны образовать некоторую непрерывную поверхность,
расположенную над плоскостью переменного х. Возьмем теперь
в качестве замкнутой области С круг на плоскости
переменного х с центром в точке О и с произвольным радиусом R.
Этой замкнутой области С будет соответствовать кусок
поверхности.
Так как модуль |/(^)| многочлена f (х) удовлетворяет
условиям теоремы Вейерштрасса, то среди точек круга С найдется
по меньшей мере одна такая точка х0, для которой
перпендикуляр будет иметь наименьшую длину \f(x0)\y т. е.
\f(*o)\<\f(x)\ 0)
для всех точек х круга С. Эту точку х0 мы назовем точкой
минимума |/(л;)| в области С.
Мы утверждаем, что при соответствующем выборе
радиуса R неравенство (1) будет иметь место уже для точек всей
плоскости переменного ху т. е. х0 при соответствующем выборе
радиуса R будет точкой минимума \f(x)\ на всей плоскости
переменного х.
В самом деле, пусть f(x) многочлен степени п>\. Тогда
согласно лемме 2 о возрастании модуля многочлена можно
указать такое N>0, что при \x\>N будет \f(x) | > |/ (0) |.
Возьмем теперь радиус R круга С равным N. Пусть х0 — точка
минимума \f(x)\ в круге С радиуса N. Тогда для всех точек х
этой области будет иметь место неравенство (1); в частности,
будет иметь место
1/(*„)1<1/(0)|.
Но неравенство (1) будет выполняться и для точек х, лежа-
ших вне рассматриваемой области, так как если |*|>W, то
lf(*)l>|/(0)|>|/(*o)|.
1 Кроме того, функция <р (х) достигает в области С и своего
наибольшего значения, но для наших целей это обстоятельство не представляет
интереса.
201
Теперь мы можем приступить к доказательству основной
теоремы алгебры.
Доказательство. Покажем, что упомянутая выше точка
х^ минимума модуля многочлена f (х) на всей плоскости
переменного х является корнем f(x). Допустим противное: пусть
х0 не является корнем многочлена f(x). Тогда {(х0)фО, и мы
можем применить лемму Даламбера. Согласно этой лемме
можно указать такое комплексное число А, что
lf(*o + *)l<|/(*e)l
или, обозначая х0 + h через хи \f (x^ | < \f(x0) |. Но последнее
неравенство противоречит тому, что х0 есть точка минимума
|/(л:)| на всей плоскости х. Следовательно, наше допущение
неверно, и /(л;0) = 0.
Из основной теоремы алгебры вытекает ряд следствий.
Укажем самые существенные.
Пусть/?(х) — многочлен, неприводимый над полем
комплексных чисел. Он по только что доказанному должен иметь хотя бы
один комплексный корень а. Следовательно, р (х) = (х—а)-ср (х).
Но р(х) неприводим; поэтому у(х)=с, где с — многочлен
нулевой степени. Таким образом, р (х)=с(х — а), и мы пришли
к такому следствию.
Следствие 1. Неприводимыми над полем комплексных
чисел могут быть только линейные многочлены.
Возьмем теперь произвольный многочлен f (х) степени п> 1
над полем комплексных чисел и разложим его на неприводимые
множители. Как мы сейчас убедились, эти множители должны
быть линейными. Следовательно,
f(x) = c(x- ai)*t (х - о,)* . . . (х - *s)ks,
где аь а2, . . ., а5 —различные комплексные числа, есть
каноническое разложение многочлена f(x) на множители,
неприводимые над полем комплексных чисел, и аь а2, . . . , as являются
корнями / (х), причем, очевидно, kx + k2 + . . . + ks=n и число с
совпадает со старшим коэффициентом а0 многочлена / (х) =
= а0хп + . . . + ая. Таким образом, мы получили:
Следствие 2. Всякий многочлен f(x) = a0xn + ...+an п-й
степени имеет над полем комплексных чисел ровно п
корней, считая каждый корень столько раз, какова его крат-
ность, причем если п > 1 и аи а2, . . . , ^—различные
корни f(x) соответственно кратности klt k2, . . . , ks, то
f (x) = a0 (x - ах)Ь (x - а,)* ...(* — а,)**.
Обращаясь к многочленам с действительными
коэффициентами, можно вывести еще несколько свойств, связанных с
основной теоремой алгебры. Но для этого рассмотрим предварительно
сопряженные комплексные числа.
202
Условимся обозначать той же буквой, но с чертой сверху
комплексное число, сопряженное данному. Тогда нетрудно
убедиться, что
zl + Z2 = ZX + z2> Z1Z2 = Z1-Z2. (2)
В самом деле, если zl = al + bj и z2 = a2 + b2i, то
Zj + z2 = (at + a2) + (&! + b2) i,
откуда
zi + z2 = {ax + a*)—(^1 + h) i.
Ho JT04HO такой же результат получается и при сложении
z~i + ^=(^i—hi) + (a2-b2i) = (a1 + а2)—(&2 + b2)L
Аналогичным образом доказывается и второе соотношение (2).
Соотношения (2), очевидно, имеют место и для большего
числа слагаемых и множителей, а именно:
*1 + *2+ ... + zk = Zl + ?2 + ... + Z~k> Z1Z* • • • Z* = Z^. . . 2^.
В частности,
(2n) = (z)'1 (л—целое положительное число).
Наконец, пусть / (х) = а0хп + аххп"х + • • . + ап —
произвольный многочлен с комплексными коэффициентами и л:0—
какое-нибудь комплексное число. Тогда на основании
предыдущего получается, что
Д^) = ^о + ^Г1+ ... +^. (3)
Теперь рассмотрим следующие свойства многочленов с
действительными коэффициентами:
1°. Комплексные корни многочлена f(x) = a0xn + atxn'l +
+ ... + ап степени п > 1 с действительными
коэффициентами попарно сопряжены, т. е., если х0—комплексный
корень f(x), то и сопряженное число х0—также корень f(x).
Доказательство. Так как х0—корень многочлена / (х),
то f (x0) = a0xl + axxS"1 + ... + ап=0. Отсюда в силу
равенства (3) __ _
f(x0) = a0xZ + a1xo~l+ ... + ап=0.
Но a0 = a0i ax = alf ..., ап = ап, 0=0, так как действительное
число сопряжено с самим собой. Следовательно,
а^со + а[хо~1 + . . . + ап=0,
т. е. f(x0) = 0, и мы видим, что х0—также корень f(x).
203
2°. Неприводимыми над полем действительных чисел
могут быть только многочлены не выше второй степени.
В самом деле, пусть р (х) многочлен выше первой степени,
неприводимый над полем действительных чисел. Обозначим
один из его комплексных корней через а + bi. Тогда
сопряженное комплексное число а—Ы также будет его корнем
согласно предыдущему свойству 1°. Следовательно, р (х) должно
делиться на
(х—a—b'i) (х—а + bi) = x2—2ax + a2 + Ь2,
т. е. на многочлен второй степени с действительными
коэффициентами. Но многочлен р(х) неприводим, а значит с
точностью до множителя нулевой степени он должен совпадать
с квадратным многочленом х2—2ах + а2 + Ь2.
Из свойства 2° непосредственно вытекает
Свойство 3°. Всякий многочлен с действительными
коэффициентами степени п > 1 разлагается над полем
действительных чисел на линейные и квадратные
неприводимые множители, причем каждому линейному множителю
соответствует действительный корень многочлена, а
каждому квадратному множителю—пара чисто комплексных
(т. е. не действительных) сопряженных корней.
Отсюда получается, что количество действительных корней
многочлена с действительными коэффициентами равно или на
четное число меньше степени п многочлена; в частности, если
степень п нечетная, то многочлен имеет по меньшей мере один
действительный корень, причем, очевидно, каждый корень
следует считать столько раз, какова его кратность.
§ 33. Уравнения третьей и четвертой степени
В предыдущем параграфе было установлено, что всякое
алгебраическое уравнение п-й степени с комплексными
коэффициентами имеет в точности п комплексных корней. Теперь
возникает вопрос: как найти эти корни при помощи тех или
иных операций, производимых над коэффициентами уравнения?
Основными алгебраическими операциями, совершаемыми над
комплексными числами, являются четыре арифметических
действия, а также действия возвышения в степень и извлечения
корня. Поэтому является вполне естественной следующая
задача, известная под названием проблемы решения уравнения
в радикалах: выразить корни алгебраического уравнения
через его коэффициенты при помощи конечного числа действий
сложения, вычитания, умножения, деления, возвышения в
степень и извлечения корня.
Операция извлечения корня п-й степени из комплексного
числа а сводится к отысканию корней так называемого
двучленного уравнения хп—а=0 (афО). В алгебре обычно под
204
n
символом У а подразумевается один из корней двучленного
уравнения хп—а = 0, и этот символ часто называется
радикалом. Извлечение корня п-й степени из комплексного числа
было рассмотрено еще в § 24.
Уже из курса элементарной алгебры известно, что
уравнение второй степени решается в радикалах. Здесь мы увидим,
что решаются в радикалах и уравнения третьей и четвертой
степеней. Однако сделаем предварительно два замечания,
относящиеся к алгебраическому уравнению
а0хп + агхп-1 + . . . + ап=0, (а0 ф 0) (1)
любой степени, а именно, покажем, во-первых, что
соответствующей заменой неизвестного х новым неизвестным у можно
добиться некоторого упрощения уравнения (1)—можно сделать
равным нулю член с (п— 1)-й степенью неизвестного. Для этой
цели положим х = у + а, где а—пока произвольное число.
Получим:
Яо (У + «У1 + *1 (У + а)""1 + • • • +ап = 0
или, раскрывая скобки по биному Ньютона и располагая члены
в порядке убывания степеней у:
а0уп + (па0а + а,) у""1 + . . . + (а0<хп + а^'1 + . . . + ая) = 0.
Таким образом, если мы стремимся, чтобы в последнем
уравнении исчез член с у""1, то надо, пользуясь
произволом а, положить na0oL + а1=0. Отсюда получаем, что а= — —*-.
Итак, полагая Х=У~"^^ мы получим уравнение с
неизвестным у, в котором член с уп~1 равен нулю.
Во-вторых, нам придется воспользоваться так называемыми
формулами Виета. Мы их выведем для общего случая
уравнения n-Pi степени:
xn + aixn-l+ ... +ап=0 (2)
с комплексными коэффициентами и со старшим
коэффициентом, равным единице. Обозначим его корни через хъ х2,..., хпх.
Тогда можно написать следующее разложение многочлена
f(x) = xn + агхп~ + ... + ап на линейные множители:
хп + агхп'х + . . . + ап = (х—хг) (х—х2) . . . (х—хп).
1 Если уравнение имеет кратные корни, то среди хь . . ., хп будут
встречаться равные числа.
205
Перемножая линейные множители, получаем:
хп + а1хп'1+ ... +ап =
= хп-(х1 + х2 + ... +хп) хп'1 + . . . + (-1)яхгх2 ... хп.
Но если два многочлена равны, то их коэффициенты при
одинаковых степенях х должны совпадать. Следовательно,
а2= +(х1х2 + х1хг+ . . . +хп_ххп),
ап = (—\)пх1х2 ... хп.
(Л)
В правых частях соотношений (Л) стоят всевозможные
произведения корней по одному, по два, по три и т. д. Мы пришли
к формулам Виета, выражающим коэффициенты аи а2, . . . , ап
уравнения (2) через его корни.
Теперь можно обратиться к уравнению третьей степени
х* + ах2 + bx + c=0
с комплексными коэффициентами. Без ограничения общности
можно считать, что аарший коэффициент равен единице; в
противн м случае мы поделили бы обе части уравнения на
старший коэффициент. Подвергнем это уравнение уже знакомому
упрощению —- сделаем член с квадратом неизвестного равным
нулю, для чего положим х=у— —. Получим в результате
о
„неполное" кубическое уравнение
У*+РУ + Я=0, (3)
а2 . . 2аз аЬ .
где р = \- Ь, <7= \-с.
* 3 v 27 з
Чтобы найти корни уравнения (3), положим y = u + v, где
и, V—два новых вспомогательных неизвестных, и подставим
это выражение у в уравнение (3). Мы получим:
(u + vy + p(u+v) + q = 0,
или, раскрыв скобки и перегруппировав члены:
(и* + vz + q) + (3uv +p)(u + v)=0.
Воспользуемся тем, что вместо одного неизвестного у мы
ввели два: и и v, и потребуем, чтобы было
3uv + p=0t или, uv= £-.
о
206
Это требование всегда выполнимо, так как оно вместе с
условием u + v=y означает, что и и v являются корнями
квадратного уравнения:
' з
После такого требования уравнение (3) приведется к
уравнениям:
7 27 '
и мы видим, что иъ и vz согласно формулам Виета являются
корнями квадратного уравнения:
v 27
Решая последнее уравнение, находим:
откуда:
._k-j/-f-/(/J4tff-
Итак, неполное уравнение (3) нам удалось решить в
радикалах:
>-+~-K-f+/(i)'+(f)' +
+K-i-i/lf)'+(f)"- <4>
Полученная формула называется формулой Кардана.
Формула Кардана, как мы видим, состоит из суммы двух
кубических радикалов:
-K~W№'+fr)''
-l/-l-l/(i)"+lf/.
207
Каждый из таких радикалов имеет три значения. Комбинируя
любое значение и с любым значением v, мы получим девять
сумм u + v, но среди них только три будут корнями
уравнения (3). Это будут те суммы u + v, у которых иу v связаны
соотношением
«* = --§-. (5)
Обозначим через иъ vx какую-нибудь пару значений и, v,
удовлетворяющих соотношению (5), а через е—один из
первообразных корней третьей степени из единицы, хотя бы, напри-
мер, cos \-1 sin — = . Тогда остальные два
значения и будут и2 = ши и3 = е2и1. Найдем, чему равны
соответствующие значения v. Так как е3=1 и uxvx =——, то для шх
о
и е2^! находим:
(e^j) (e2v1) = e*u1v1 = u1v1 = ~ -у , откуда v2 = b2v1;
(z2u1)(ev1)=e*u1v1 = — -^, откуда vz = evL.
Таким образом, складывая каждое значение и с
соответствующим значением v, получим все три корня неполного
кубического уравнения (3):
y1 = u1 + v1, y2 = e«i + e2^b yB=z2ul + sv1.
Но
- 1 + г Уъ &0 -1_/]/з
2 2
Поэтому окончательно имеем:
1 Уз
у1 = и1 + vlt у» = — -(их + vt) + i-^- («I—«i),
1 i/Я
Уз = - у («1 + Щ) —i — («i—Oi).
(6)
Пример. Определим по формуле Кардана корни уравнения
jc3 + 15jc+ 124=0.
Здесь/7=15, #=124. Следовательно,
3/ , уг =г 3,
а-/"—62 + /б22 + 53 =l/"—62 + V 3969 = /^-62 +63 = >/Т.
В качестве и2 удобнее всего взять действительное значение
корня кубического из 1. Таким образом, полагаем иг = 1. Что
208
касается значения vl9 то v1 = — = =—5. Отсюда по
Ъих з
формулам (6) получаем все три корня уравнения:
1 ЛГъ
*! = «! + гц=1—5 = —4, x2^ = — j(u1 + v1) ± i-—(u1—v1) =
= 2 + 3/ ]Лз.
Рассмотрим подробнее тот случай, когда выражение А =
= (—) + (—) у стоящее под знаком квадратного корня в
формуле Кардана, равно нулю и рф09 цфО.
Если А=0 при р ф 0 и дфО, то и= л/ — —. Это
выражение и можно несколько упростить, а именно:
(1Г У (Г
Так как №-Y + (—)' = 0, то Ш2 = —p-Y\ Следовательно,
и=-
3
2
з / -I
откуда в качестве одного из значений и можно взять
и, <—%-.
Соответствующее значение vx будет равно
*\-(JLY\ 6(1)2
^—JL —3g! = L biJ = Ы ,.gL-gl
1 3их 9? Р^ Р<7 2/> х
Обращаясь к формулам (6), мы, таким образом, получаем:
т. е. уравнение (3) имеет при А=0 и рфО, q фО один
простой и один двукратный корень.
209
Обратно, пусть уравнение (3) имеет по меньшей мере один
двукратный корень у2=Уз> причем р (и q) может быть и
равным нулю. Тогда по формулам Виета находим, что
У1 + У2 + Уз=У1 + 2^2 = 0,
У 1У% + УгУг + У2Уз = 2>;1>;2 + yl=p,
У1У2У* = У1У2 = —д.
Следовательно, yi = — 2у2 и р = — Зуг, g = 2yl, в силу чего А =
Итак, неполное кубическое уравнение (3) тогда и только
тогда имеет кратные корни, когда А = 0. При этом, если
А = 0 и рфО, яфО, то уравнение (3) имеет один простой
корень у г и один двукратный корень yi=y2» u их можно
найти, не прибегая к извлечению корней второй и третьей
степеней, а именно:
3? 3? ,_.
yi = -f. У. = У. = -£- <J)
Пример. Решить уравнение хъ—\2х + 16 = 0.
Легко видеть, что здесь Д = 82—43 = 43—43 = 0, и мы можем
воспользоваться формулами (7):
_3'16_ A v _ _ 3»16 _0
Хл— — т-, Ло — Хо— —————" —Zt%
1 —12 '23 2 (—12)
До сих пор коэффициенты кубического уравнения
предполагались комплексными числами. Теперь займемся
исследованием наиболее часто встречающегося случая неполного
уравнения
x*+px + q = 0 (8)
с действительными коэффициентами. Мы увидим, что и здесь
выражение А будет играть важную роль.
Логически возможны три различных случая:
1) А>0, 2) А = 0 и 3) А<0.
1. А > 0. Так как в этом случае А ф0, то все три корня
уравнения (8) должны быть различными. Выясним, сколько
среди них будет действительных корней.
Рассматривая выражение
з
-у -i+vT'
видим, что под знаком кубического корня находится
действительное число, так как А > 0. Следовательно, одно из значе-
210
ний и должно быть действительным. Примем его за и1т Тогда
ч)г будет также действительным. Отсюда на основании формул
(6) заключаем, что уравнение (8) имеет только один
действительный корень, а именно: x1 = u1-[-vu а два остальных
корня будут сопряженными чисто комплексными числами:
2. A = 0. Мы знаем, что при А = 0, рфО, уфО уравнение
имеет два равных корня. Учитывая, что теперь рассматривается
уравнение с действительными коэффициентами, можно сделать
следующее заключение: при Д=0, рфО, яфО все три корня
уравнения (8) действительны, причем два из них равны;
иными словами, уравнение имеет один простой
действительный корень и один двукратный действительный корень.
Очевидно, что при А = 0, /7 = 0, # = 0 уравнение (8) имеет
трехкратный корень х = 0.
3. А < 0. Этот случай известен под названием
неприводимого случая (не смешивайте с неприводимостью многочленов)
и является в следующем отношении примечательным, а именно:
так как корень третьей степени здесь приходится извлекать из
мнимых чисел, то и и v являются мнимыми. И тем не менее
все три корня будут действительны (и различны, так как
А Ф 0). В самом деле, ввиду того, что А < 0, мы можем
положить А=—а2, где а—некоторое действительное положительное
число. Тогда
<р подкоренного выражения.
и
=j/-i+"
Найдем модуль г и аргумент <р по;
Имеем:
г =
}/{-\ЪЛ-
-|/-£|
||/ЧЧ=
, COScp= —^-, <
sin<f =
7>01-
1 Мы пишем корень квадратный внутри знака модуля потому, что
следует брать действительное положительное значение корня. Отметим попутно,
что при Д < 0 коэффициент р < 0.
211
Таким образом,
з
u = Y r (cos <? + i sin у) = ]/^|(cos'
Ф + 2&т: ... <р + 2b: U
-L-L h i sin — .
Полагая последовательно k=0, 1, 2, получаем все три
значения и:
з
и,=
и2=
Uo =
3
3
Кг
(cos|+/sin|),
(cos*±^+/slnI^)f
V з ^ з /
cos I-L h ' sin •LJ-—
3 ^ 3
Произведение комплексного числа z = a + bi на сопряженное
число z = a—bi равно квадрату модуля z:
zz = a2 + b2 = \z\2.
Руководствуясь этим, мы можем легко определить vu v2, vs,
а именно: модуль
1 , ф + 2кк . . . <р + 2ЬЛ
Я= Кг (
COS-
г sin
з /
равен
V7
13 Г / ¥\ I /
=\\/у Ц=\]/-
Отсюда квадрат модуля и будет равен ——. Следовательно,
о
ии = —. Но и и v связаны тем же соотношением uv = — —.
3 _ 3
Значит, v = u, и мы получаем, что
»! = «! =
v2 = u2 =
3
3
(cos-2- —/sin —I,
\ 3 3)'
{
(cos-
cos ^ 1 sin ^-—
3
+ 4*
3
Ф + 471
)•
3 3
1 J Yt I пишется потому, что берется арифметическое, т. е. действи-
з
тельное положительное значение >/"г.
212
Теперь все три корня уравнения (8) найдутся без труда:
х1 = и1 + vx = 2
x2 = u2 + v2=2
xs = us + vs = 2
з
3
3
COS
COS
COS
3 '
у -I- 2tc
3 '
9 + 471
(9)
Итак, в случае А < 0 уравнение (8) имеет три
действительных корня.
Корни хъ x2t xs вычисляются по формулам (9) довольно
легко, если пользоваться таблицами логарифмов значений
тригонометрических функций.
Для Кардана и его современников, ученых XVI в., случай
отрицательного Д казался парадоксальным, так как в то время комплексные числа еще
не имели конкретного истолкования и операции извлечения квадратного
корня из отрицательных чисел и извлечение кубического корня из
комплексных чисел считались невозможными. Для математиков того времени было
удивительным, что при помощи этих невозможных операций получались
действительные числа. Были предприняты многочисленные попытки освободиться
от мнимостей в формуле Кардана, но эти попытки кончались неудачей. При
помощи рассуждений, выходящих за пределы нашей книги, можно показать,
что корни уравнения (8) с действительными коэффициентами в случае Д < О
никаким способом нельзя выразить через радикалы любой степени с
действительными подкоренными выражениями. В силу этого обстоятельства
случай Д < 0 и получил наименование неприводимого случая.
Недостаток формулы Кардана состоит в том, что она часто
представляет рациональные корни в иррациональном виде.
Например, нетрудно проверить, что число 2 является
рациональным корнем уравнения хг—х—6=0. Так как для этого уравне-
242
ния А= — > 0, то 2 является единственным действительным
корнем уравнения. Посмотрим, что дает формула Кардана.
Обозначим через иг и v1 действительные значения кубических
корней:
«1=|/з + -^Уб, vt=y 3-^-1/6.
Мы видим, что их и ч)х являются иррациональными числами.
Таким образом, формула Кардана (4) дает для корня хг = 2
довольно сложное выражение:
-*i = tti + fi =
3 + —Кб
9
v
■т"*
213
которое приходится вычислять приближенно, так что на
практике получается число, весьма близкое к 2, но не 21.
Вследствие этого недостатка рекомендуется рациональные
корни кубического уравнения с рациональными
коэффициентами находить не по формуле Кардана, а при помощи общего
приема вычисления рациональных корней, с которым мы
познакомимся в § 37 главы VI.
Для уравнения четвертой степени
х* + ах3 + bx2 + cx + d=0 (10)
с комплексными коэффициентами мы изложим наиболее
ранний способ решения, принадлежащий Феррари, ученику Кардана.
Перенесем три последних члена уравнения (10) в правую
часть и прибавим к обеим частям —— . Тогда получится:
4
Затем прибавляем к обеим частям последнего уравнения сумму
(х2 + —) у + —. Уравнение примет вид:
Ит+IHt-'+^!+(iH*+(t-'<)-<п)
Подберем вспомогательное неизвестное у так, чтобы правая
часть последнего уравнения превратилась в полный квадрат. Это
будет в том и только в том случае, когда В2 = 4АС, где А =
= — ft + v, В= — —с и С=— d. Действительно, если
4 У 2 4
квадратный трехчлен Ах2 + Вх + С является полным квадратом:
Ах2 + Вх + С= {ах + $)2 = а2х2 + 2сф* + Р2,
1 Впрочем, при помощи искусственных преобразований можно
убедиться, что иг + &1 в точности равно 2, а именно:
и аналогично vL = 1 У 6. Отсюда
3
Ul + 0l=H-il/Hl-i/^2.
3 3
2U
то, сравнивая коэффициенты слева и справа при одинаковых
степенях х, получаем: Л=а2, 5 = 2ар, С = р2, откуда В2 = 4АС.
Обратно, если Б2 = 4ЛС, то
Ах2 + Вх+С= (VAx)2 + 2 [V~Ax) VC+ {V~C)2 = {VAx+Y~C)2.
Таким образом, подставляя в равенство В2=4АС выражения
А, В и С, находим, что
(?-«Г-4(т-»+')(*-')-
Если раскрыть скобки, то после некоторых преобразований
получится уравнение третьей степени относительно у:
ys-by2 + (ac—4d)у- [d(a2-4b) + с2] =0,
которое обычно называется кубической резольвентой. Пусть
у0 какой-нибудь корень этого уравнения. Подставляя у0 в
уравнение (11), мы превратим правую часть (11) в полный квадрат:
(*2+f+fj = («*+№■
Отсюда:
x2 + f + f = «* + ?' *2 + ^+ ^=-а*-(3.
Эти два квадратных уравнения и дадут нам все четыре корня
уравнения четвертой степени. Итак, решение уравнения
четвертой степени сводится к решению одного уравнения третьей
степени и двух уравнений второй степени. Мы видим, что
уравнение четвертой степени также решается в радикалах.
При нахождении корней того или иного уравнения
четвертой степени по способу Феррари мы рекомендуем проводить
последовательно соответствующие преобразования; не стоит
даже и запоминать кубическую резольвенту.
Пример. Найти при помощи способа Феррари корни
уравнения:
х4 + 2jc3 + 5x2 + 6х + 9 = 0.
Переносим в правую часть уравнения с противоположными
знаками все члены, степень которых не выше двух:
л4 + 2х*=— 5jc2-6jc-9.
Если к обеим частям последнего уравнения прибавить х2, то
в левой части получится полный квадрат:
(х2+х)2=~-4х2 -6*—9.
215
Теперь к обеим частям получившегося уравнения прибавляем
(х2-\-х)у-\ у2. От этого левая часть не перестанет быть
4
полным квадратом:
(^ + * + -i-y)2=(y-4)^ + (y-6)* + (4-y2-9). (12)
Возьмем теперь у таким, чтобы и правая часть уравнения (12)
была полным квадратом. Для этого надо потребовать, чтобы
В2=4АС. В данном случае Л = у—4, В=у— 6 и С=—у2—9.
Следовательно,
(у_6)»=4(у-4)(-^у'-9)
или после некоторых упрощений
(у-6)[(у-6)-(у-4)(у + 6)]=0.
Мы видим, что в качестве у0 можно взять 6. Возвращаемся
к уравнению (12) и заменяем в нем у значением yQ = Q:
{х2 + х + 3)2=2х2.
Это уравнение распадается на два квадратных уравнения:
х2+{\ +1/2)^ + 3 = 0,
х2 + {\—У2)х + 3 = 0.
Решая квадратные уравнения, получаем все четыре корня
данного уравнения четвертой степени:
Х^~ 2 - 2
уТ—1 . . 1Л) + 2]/2"
Хо л = L + I ! .
3-4 2 - 2
Задачи. 1. Решить кубические уравнения: а) х3 4- 9* + 26 = 0
б) дгз + 24* + 56 = 0, в) jc3 — б*2 — 15* + 100 = 0, г) *3 — З*2 — 6* + 2 = 0. '
2. Решить уравнения четвертой степени: а) *4 + 2*3 4- 2л:2 + х—7 = 0,
б) *4 _ дгз + 2*2 — 2х + 4 = 0.
§ 34. Алгебраическое расширение
В тесной связи с решением уравнений в радикалах
находится весьма важное понятие алгебраического расширения, к
изложению которого мы собираемся сейчас перейти.
Пусть Я—некоторое числовое поле, а—произвольное
комплексное число. Очевидно, что относительно а возможно только
216
одно из двух: либо а является корнем некоторого
алгебраического уравнения п-й степени с коэффициентами из поля Р,
либо а не может быть корнем никакого алгебраического
уравнения произвольной степени с коэффициентами из поля Р.
В первом случае а называется числом, алгебраическим
относительно поля Р, а во втором—числом, трансцендентным
относительно Р. Отметим, что всякое а из поля Р будет
алгебраическим относительно Я, так как оно является корнем
уравнения х—а = 0 с коэффициентами из поля Я.
Если, в частности, Р есть поле рациональных чисел, та
слова „относительно поля Ри опускают и говорят просто_об
алгебраическом или трансцендентном числе. Например, "К 2 —
алгебраическое число, так как 1^2 корень уравнения х2—2 = 0
с рациональными (а именно целыми) коэффициентами.
Впервые существование трансцендентных чисел было установлено Лиу-
виллем в 1851 г. В 1873 г. Эрмитом была обнаружена трансцендентность
числа е, основания натуральных логарифмов. Пользуясь соображениями Эр-
мита, Линдеман в 1882 г. показал, что и число тс, отношение длины
окружности к диаметру, также число трансцендентное. Дальнейший существенный
шаг вперед в развитии теории трансцендентных чисел был сделан советским
ученым А. О. Гельфондом в 1929—1936 гг., установившим трансцендентность
одного замечательного класса чисел. Из результатов Гельфонда, в частности,.
следует трансцендентность таких чисел, как 2 , 3 ^вообще т , где
т > 1 и п — целые числа и Yn иррационально), ек, 2
Что касается теории алгебраических чисел, то она представляет собой
весьма глубоко разработанную отрасль математики. В этой области ряд
результатов первостепенной важности был получен советским ученым Н. Г.
Чеботаревым.
Обозначим через Р [а] (а в квадратных скобках!) множества
чисел вида
/(а) = со + W + с&2 + . . . + Си*к>
где k—произвольное целое неотрицательное число, с0, си ... , ck—
любые числа из поля Р. Легко проверить, что в этом
множестве выполнимы первые три арифметических действия и
потому Я [а] образует коммутативное кольцо относительно
арифметических действий сложения и умножения.
Рассмотрим, кроме того, более „обширное" множество
всевозможных отношений
/ (°0 _ С0 + Сха + . . . + ckak
g(a) d0 + dxa + . . . + dp1
te(*)^o>
элементов кольца Я [а]. Это множество, как легко видеть,,
является числовым полем. Мы его будем обозначать через-
Я (a) (a в круглых скобках!) и называть полем или простым
расширением поля Р, получающимся путем присоединения
к Р числа а. При этом переход от поля Я к полю Я (а) будет
называться присоединением элемента а к Я. Очевидно, что
217
лростое расширение Я (а) поля Я есть частный случай понятия
расширения поля.
Отметим еще, что Я (а) называется простым алгебраическим
расширением поля Я, если а является алгебраическим
относительно Р, если же а трансцендентно относительно Р, то Я (а)
называется простым трансцендентным расширением Р.
Пример. Возьмем в качестве поля Р поле рациональных
чисел и в качестве а—число 1/2. Выясним, что собой
представляют Р[У~2] и Р (1/2).
Согласно общему определению Р [V 2] есть кольцо,
состоящее из элементов вида:
с0 + сг (V~2) + с2 (1/2)2 +...+ск (1/2)*, (1)
где А—произвольное целое неотрицательное число, а с0, ..., ck—
произвольные рациональные числа. Выражение (1) можно,
однако, упростить, а именно: так как (l/2)2 = 2, (l/~2)3=2l/2
и т. д., то выражение (1) можно преобразовать в двучленное
выражение ^+ft"|/2, где a, b—рациональные числа. Таким
образом, Я[}/2] состоит из всевозможных чисел вида а + &1/2 .
Теперь посмотрим, из чисел какого вида состоит Я ([/2).
По определению P[V~2) есть не что иное, как совокупность
элементов вида _
а±ьУ2 (
сл-ауГ ()
где a, ft, ct rf—рациональные числа и с + ^~|/2 ф 0. Для
упрощения умножим числитель и знаменатель дроби (2) на
£— dV%. Тогда получим:
а + Н^2 =g'+b'V2 ,
с + d V 2
где
, ас — 2bd ,, be — ad
а = , и =
-2d* с2 — 2d*
Мы видим отсюда, что поле Я(~|/2) состоит^ из элементов
того же двучленного вида, что и кольцо P[j/2]. Это значит,
что кольцо Я["[/2] совпадает с полем Я(~|/2): Я[~|/2] =
= Я(/2).
Этот пример подводит нас к следующей теореме.
Теорема 1. Если а—число, алгебраическое относительно
поля Р, то уже Я [а] является числовым полем: Я[а]=Я(а).
Доказательство. Мы всегда можем предположить,
что а является корнем многочлена р (х)=р0 + Р\* + . . . + рпхп
(рпфО)у неприводимого над полем Я. В самом деле, если бы а
218
являлось корнем многочлена F(x), приводимого над Я, то а
было бы корнем одного из неприводимых множителей F(x).
Этот неприводимый множитель мы и взяли бы в качестве р(х).
Любой элемент (3 из Я [а] должен иметь вид:
V=f(*) = c0 + c1*+ ...+ckakt (3)
где А—целое неотрицательное число и с0, . . . , ck—числа из
поля Я. Покажем прежде всего, что выражение (3) можно
преобразовать в следующее выражение:
р = я0+ <*!<*+ . . . +ая_1ал-\ (а0> • • • » ^-i—числа из Я),
имеющее относительно а степень, меньшую, чем степень п
многочлена р (х).
Обозначим через q(x) и г(х) = а0 + а1х + ... -\-о>п_ххп~х
соответственно частное и остаток, получающиеся при делении
многочлена f(x) = c0 + сгх+ ... +с^хк на /?(х). Мы можем
написать, что
f(x)=p(x)q(x) + r(x). (4)
Полагая в равенстве (4) х = а, получаем, что /(&)=г(а), так
как р (а) = 0, или
р = /(а)=г(а) = а0 + а1а+ ... + а^а""1.
Теперь обратимся к отношению
^ = а0 + v + . . . + а,.^ ^ из fi (5)
и преобразуем его в целое рациональное выражение от а.
Для этой цели рассмотрим многочлен g(x) = b0 + bxx-\- . . . +
+ bn_xxn~l. Он не равен нулю: если бы g(x) равнялось нулю,
то b0=bx= ... =bn_l=0, а следовательно, g(oc) = ft0 + bxa +
+ • • • + bn_la.n~l = 0, что противоречит условию g(a)^0.
Очевидно, что g(x) не делится на р(х)у так как степень
g(x) ниже степени р(х). В силу неприводимости р (х) отсюда
следует, что многочлены g (x) и р (х) над полем Я взаимно
просты. Но в таком случае будет иметь место равенство:
g(x)?(x)+p(x)^(x) = \f (6)
где <р(;с) и ф (л:)—многочлены над тем же полем Я (см. § 26).
Полагая в равенстве (6) х==а и принимая во внимание, что
/?(а) = 0, получаем:
£(«)<Р(«) = 1. (7)
219
Теперь, пользуясь равенством (7), мы можем отношение (5)
преобразовать следующим образом. Умножим числитель и
знаменатель на ср (а). Получим на основании равенства (7), что
fja)_ = /(g) у (а) = /(а) у (а) = /fa) ф (
*(а) *(«)*(<«) 1 '
Но /(а).ср(а) есть некоторый элемент Я [а], так как /(а) и
ср (а)—элементы Я [а]. Следовательно, '-Ю- содержится в Я [а]
£(а)
и потому поле Я (а) состоит из тех же элементов, что и кольцо
Я [а]. Теорема доказана.
В случае трансцендентного а Р [а] уже не будет полем.
В самом деле, если бы и в этом случае Р [а] являлось полем,
то отношение а , в частности, было бы равно некоторому
целому рациональному выражению от а:
—Г-=Со + сга+ . . . +^а*,
где &—целое неотрицательное число, с0У ..., ck — элементы
из Я. Отсюда мы имели бы, что
-1 + (с0-1)а + с1а2+ ... + ска*+1 = 0,
а это уже противоречит трансцендентности а, так как в
последнем равенстве не все коэффициенты равны нулю (так, —1
отлично от нуля).
До сих пор мы присоединяли к полю Я только одно число.
Возьмем теперь несколько комплексных чисел alf a2, . . . , a5
(алгебраических или трансцендентных относительно
Я—безразлично). Присоединим сначала к Я число а1# Получим простое
расширение Я(а2). Затем присоединим к Я(^) число а2.
Получится дальнейшее распгарение, которое мы обозначим через
Я(аь а2) и т. д. После всех таких последовательных
присоединений чисел аь а2> . . . , as мы придем к расширению Я(аь
а2, . . . , Оу) поля Я. Мы будем называть Я(аь а2, . . . , aj /шо
ширением, полученным путем присоединения к Я кисел <х1у
а2, . . . , Оу.
Оказывается, что числовое поле Я(аьа2, ..., as)
минимально, т. е. оно является подполем всякого числового поля А,
содержащего Я и аь а2, . . . , a5(s > 1).
Чтобы в этом убедиться, введем некоторые обозначения и
понятия, принадлежащие, строго говоря, к теории множеств.
Пусть А и 5—два каких-нибудь множества. Если
множество А содержится во множестве В, т. е. если каждый элемент
множества А является элементом множества В, то пишут
ALB или В^А.
220
Известно, что множества А и В считаются равными только
тогда, когда одно из них состоит из тех же элементов, что и
другое, и не содержит элементов, которые не входили бы в
состав элементов другого. Таким образом, А =В только тогда,
когда одновременно А£±В и В^А.
Если Л^В, но Л не равно В, то обычно знак равенства
опускается и пишется А С В.
Совокупность С всех элементов, общих обоим множествам
А и 5, и не содержащее никаких других элементов, называется
пересечением множества А и В. Может случиться, что
множества А и В не имеют общих элементов (пустое
пересечение). В этом случае множества А и В называются взаимно
простыми или непересекающимися. Аналогичным образом
вводится пересечение нескольких множеств и вообще множества
множеств.
Пример. Пусть Аг—множество корней уравнения х2—Зх +
+ 2 = 0, А2—множество корней уравнения х2—6х + 5=0 и Л3—
множество корней уравнения х2—8л:+ 7 = 0. Тогда
пересечением множеств Аъ Л2 и Аг будет множество, состоящее из
одного числа 1, так как 1 является общим корнем всех трех
уравнений и никаких других общих корней эти уравнения не
имеют.
Теперь покажем, что Р (аь а2, . . . , а5) есть пересечение всех
числовых полей А, содержащих поле Яйаьа2 a5(s>l).
Доказательство. Так как каждое из упомянутых
полей А замкнуто относительно четырех арифметических
действий (исключая, конечно, деление на нуль)1, то А вместе с а2
и Р должно содержать и всевозможные числа вида
/ы _ ao + aiai+ • • • + аА
te(«i)^o),
ё («0 bQ + Ьгаг + . . . + Ьр[
f(x) = a0 + a1x+ ... +czkxk,
g(x) = b0Jr Ьгх-\- . . . + btxl—многочлены над Р.
Это значит, что Я(а2) содержится в каждом из полей А. Но если
Я(а2) содержится в А, то отсюда получается, что и Я(аь а2)
содержится в А. Действительно, поскольку А замкнуто
относительно четырех арифметических действий, поле А должно
содержать вместе с P(a-i) и а2 всевозможные числа вида:
flo(ai) + fli(ai)g2+ ••• + Mgi)g2 (fc, /-целые неотри-
h Ы + bi Ы*2 +■-+*/ Ы 4 Ильные числа),
где a;(ai), ft/(«i) —элементы из Я(а2) и знаменатель отличен от
нуля. Иными словами, А должно содержать Р(осъ а2) и т. д.
1 Т. е. в Д выполнимы четыре арифметических действия.
221
Рассуждая так, мы, наконец, убедимся, что А содержит
Я(аь а2, . . . , а,).
Обозначим теперь через Е пересечение всех полей А,
содержащих Р и аь а2, . . . , Оу. Так как Я(аь а2, . . . , as)
содержится во всех А, то
Р(Ч,*ъ • .., «,) 4 е- (8)
С другой стороны, Я(аь а2, . . . , <xs)f очевидно, содержит Я и
аь . . . , Оу и потому является одним из полей типа А.
Следовательно,
ЕС^К«» -..,«,)• (9)
Сравнивая соотношения (8) и (9), мы видим, что
ЯК . .., а,) = Е.
Из доказанной теоремы сразу вытекает, что расширение
Я(аь . . . , <xs) не зависит от того, в каком порядке
присоединять к полю Р числа <xlf . . . , as: P(au . . . , as) = P^ai , . . . , at ),
В самом деле, Я(аь . . . , as) есть пересечение всех
числовых полей, содержащих Р и аь . . . , а5; вследствие этого
Я(аь . . . , Оу) зависит лишь от поля Я и от множества
присоединяемых чисел аь а2, . . . , as, но не от порядка
присоединения к полю Р этих чисел.
Затем легко видеть, что Р(ли . . . , as) есть не что иное,
как совокупность чисел вида:
А.а*"а:п . . . а*1* + . . . + А а*Р1а?Р2 . . . а*Р*
112 s i ' р 1 2 5
B.aWn . . . а'1* -f ... + В aWf2 . . . al«s
112 s ' '<7l2 д
(10)
где Л/, £/—элементы из поля Я, a /jv/ и /у—целые
неотрицательные числа (знаменатель, конечно, отличен от нуля).
В самом деле, благодаря замкнутости Я(аь . . . , а,)
относительно четырех арифметических действий, поле Я(аь . . . , а5)
будет содержать вместе с Я и аь . . . , as и всевозможные
числа, получающиеся из чисел аь . . . , as и чисел из Я при
помощи той или иной комбинации четырех арифметических
действий. Короче говоря, Я(аь . . . , as) должно содержать
всевозможные числа вида (10). Но совокупность чисел вида (10)
образует числовое поле. Следовательно, в силу минимальности,
числами вида (10) должны исчерпываться все элементы поля
Я(аь . . . , а,).
Отметим еще, что если ах является алгебраическим
относительно Я, а2—алгебраическим относительно Я(а2) и т. д.,
наконец, as является алгебраическим относительно Я (аь . . . , а5-1),
то Я(ар . . . , а^) будет исчерпываться числами вида
Л^офа . . . о£*+ . . . +Apa*Pla£i* . . . а*Р*,
222
получающимися в результате комбинации первых трех
арифметических действий. Это следует из того, что в случае а
алгебраического относительно поля Я, кольцо Я [а] является полем:
Я [<*]=/> (а).
Проблема решения алгебраических уравнений в радикалах
тесно связана с процессом расширения поля путем
присоединения чисел, алгебраических относительно рассматриваемого поля.
Введем предварительно весьма важное понятие нормального
поля.
Пусть а,, . . . , аЛ—все п корней уравнения
f(x) = a0xn + a1xn-l+ . ..+ая = 0 (11>
лг-й степени с комплексными коэффициентами. Присоединим
к полю R рациональных чисел коэффициенты а0, а1у . . . , aw
уравнения. Мы получим расширение R(a0faly ... , ап),
которое мы будем называть областью рациональности уравнения
(И) (многочлена f(x)) и будем обозначать через Я.
Присоединим, далее, к Р корни alf а2, . . . , ап. Полученное при этом
расширение Я(аь а2, . . . , аЛ) поля Р называется нормальным
полем или полем Галуа уравнения (11) (многочлена f(x)).
Обозначим нормальное поле Я(аь . . . , ап) через 2.
Теперь покажем, что уравнение (11) тогда и только тогда-
разрешимо в радикалах, когда его нормальное поле Q
содержится в расширении S=P(pll р2, . . . , pft), полученном путем при-
П1/ П2/
соединения к Р некоторых радикалов Pi= У Аи р2 = V А2,...,
nk/—
pk = y Ak, где Ах принадлежит Я, А2 принадлежит Я (pi), Аг;
принадлежит Я(р1? р2), . . . , Ak принадлежит Я(рр . . . , pk_x).
В самом деле, если уравнение (11) разрешимо в радикалах,,
то это значит, что корни уравнения выражаются через его
коэффициенты и некоторые радикалы рь р2, . . ., pk при помощи
конечной комбинации четырех арифметических действий. Так
как поле 5 содержит коэффициенты а09 аи . . ., ап и радикалы
Pii Р2» • • •» Pk и как всякое числовое поле замкнуто
относительно арифметических действий, то корни аь а2, . . . , ал должны
лежать в S. Следовательно, 2, будучи минимальным среди всех,
числовых полей, содержащих Р и av . . . , ал, само должно
содержаться в 5.
Обратно, если 2 содержится в 5:2^5, то все корни
ai» • • • » ал уравнения (11) лежат в S. Вследствие этого аи . . . ,.
<хп будут выражаться через радикалы рь р2, . . . , pk и
некоторые числа из Я. Но каждое число из Я в свою очередь
выражается при помощи той или иной комбинации
арифметических действий через коэффициенты уравнения (11), так как
P=R(a0, . . . , ап). Следовательно, корни уравнения (11)
должны в конечном счете выражаться через а0, аь . . . , ап и ра-
223"«
дикалы рь р2, . . . , pk при помощи некоторой конечной
комбинации арифметических действий. Другими словами, уравнение
(11) решается в радикалах.
Пример. Мы знаем, что уравнение третьей степени
х*+рх + д = 0 (рфО, Яф0)
можно решить по формулам:
*i = «i— ir> *2 = ih-{-, -*з = Из—/-, (12)
3^! Ъи2 Зы3
где и,, и2, иъ суть значения
Обозначим через Ах выражение / —J + (—) • Очевидно,
что Ах лежит в P=R(p, q). Далее, обозначим через рх какое-
нибудь из значений У^А[. Затем через А2 обозначим —+Pi.
Очевидно, что А2 лежит в P(pi). В качестве следующих
радикалов мы возьмем P2 = #i, Рз = й2» Р4 = йз- Таким образом, р2,
3 /
р3, р4 являются здесь значениями у А2. Теперь формулы (12)
примут вид:
_ Р _ Р _ Р
Х1~ Рз Г~ i -^2 —Рз 7Г~> -^3 —Р4 ~Г~ >
6о2 dp3 Ор4
т. е. корни Xj, х2, хг выразились через радикалы рь р2, р3, Р4
и потому лежат в Р(ри р2, р3, р4).
В заключение отметим следующее обстоятельство. При
помощи теории Галуа, выходящей за пределы нашего курса,
можно показать, что, например, уравнение л:6—25л:—5 = 0
неразрешимо в радикалах. Однако уравнение ахь—25ах—5а=0
при подходяще выбранном значении а может оказаться
разрешимым в радикалах, например, если дано, что а—один из
корней уравнения хь—25л:—5=0, то уравнение ахъ—25ах—5а=0
распадется на уравнение х—а=0 первой степени и уравнение
четвертой степени, и оба эти уравнения решаются в радикалах.
§ 35. Разрешимость уравнения третьей степени
в квадратных радикалах
Применим результаты предыдущего параграфа к вопросу
разрешимости геометрических задач на построение при помощи
циркуля и линейки.
Как известно, многие геометрические задачи на построение
можно свести к нахождению корней алгебраического уравнения
а0хя + агхп-1+ ... +ап=0 (1)
224
/г-й степени, коэффициенты которого, вообще говоря,
комплексные. Например, задача об удвоении куба тесно связана с
извлечением корня третьей степени из 2, задача трисекции угла
с неприводимым случаем неполного кубического уравнения.
В курсе теории геометрических построений доказывается, что
некоторое выражение а тогда и только тогда может быть
построено при помощи циркуля и линейки, когда оно получается
в результате решения уравнений не выше второй степени.
Например, выражение
можно построить при помощи циркуля и линейки, так как оно
получается в результате решения ряда уравнений не выше
второй степени, а именно: а1=}/^2 есть корень квадратного
уравнения х1—2 = 0, и мы можем построить У~2 при помощи
циркуля и линейки. Далее, а2=1 +1^2 является корнем
уравнения первой степени х— (1+а1) = 0, и мы можем 1+1/~2
также построить при помощи циркуля и линейки,—придется
складывать отрезки, соответствующие 1 и j/"2. Затем а3 = ]/а2
является корнем квадратного уравнения х2—а2 = 0, и, поскольку
а2 было уже заранее построено, мы этот корень без труда
построим при помощи циркуля и линейки. Наконец, а = ]/а3 есть
корень квадратного уравнения л;2—а3=0, а так как а3 уже
построено, то мы построим при помощи циркуля и линейки и
Возникает естественный вопрос: при каких условиях,
необходимых и достаточных, уравнение (1) степени п > 3 решается
в квадратных радикалах? Мы ограничимся тем, что дадим
исчерпывающий ответ для случая уравнения третьей степени:
f(x) = xs -f- ахх2 -\- а2х + а3 (2)
с комплексными коэффициентами.
Пусть какой-нибудь корень хх уравнения (2) выражается
через квадратные радикалы, т. е. при помощи конечной
комбинации четырех арифметических действий выражается через
коэффициенты аи а2, а3 и квадратные радикалы Pi = VAu р2 =
= ]/Л2,..., pk=YAkf где k > 1 и Аг—элемент области
рациональности Я уравнения (2), А2—элемент поля Р (pj), А3—элемент поля
P(Pi, P2) и т. д., наконец, Ak—элемент поля Р(р1у р2, . . . , р^).
Посмотрим, что можно получить относительно остальных
корней х2 и хд уравнения (2).
Так как ^—корень многочлена f(x) = xs + ахх2 + а2х + а3,
то f (х) = (х—х1)(х2 + рх + q). Пользуясь схемой Горнера, без
труда находим, что р=хх + аи q = xx + агхх + #2- Далее,
очевидно, что х2 и xs должны быть корнями уравнения
х2 +px + q=0.
225
Следовательно, по формуле решения квадратного уравнения
где pft+1—одно из значений л/ — q. Мы видим отсюда, что
х2 и х3 выражаются через р и pk+v величины р и q
выражаются через аи а2 и хх, а х{ выражается через квадратные
радикалы рь р2, . . . , pk. Значит, х2 и хг выражаются через
квадратные радикалы рь р2, . . . , рЛ+1.
Итак, гели по меньшей мере один корень уравнения (2)
выражается через квадратные радикалы, то уравнение
разрешимо в квадратных радикалах, т. е. его остальные корни
также выражаются через квадратные радикалы.
Когда же уравнение (2) разрешимо в квадратных
радикалах? Ответ дает следующая теорема.
Теорема (о разрешимости кубического уравнения в
квадратных радикалах). Уравнение третьей степени
f (x) = xs + axx2 + а2х + ав = 0 (2)
с комплексными коэффициентами тогда и только тогда
разрешимо в квадратных радикалах, когда оно имеет в своей
области рациональности Р по меньшей мере один корень.
Доказательство. Если уравнение (2) имеет в области
рациональности Р корень а, то многочлен f(x) = xs + <h*& +
+ а>2х + аъ распадается над полем Р в произведение
следующих множителей:
f(x) = (x-a)(x2+px + q).
Таким образом, уравнение (2) распадается над Р на
уравнения первой и второй степени и тем самым решается в
квадратных радикалах.
Обратно, пусть уравнение (2) разрешимо в квадратных
радикалах. Допустим, что при этом уравнение (2) не имеет
корней в области рациональности Р. Возьмем какой-нибудь корень
хг уравнения или, что то же, многочлена f{x). Пусть^
выражается через квадратные радикалы Pi=l/^7, ?г=УАг, . . . ,
РЛ="|/Л7, где Л>1, Аг—элемент поля Р, Л2—элемент поля
Р(рг) и т. д. Мы вправе предположить, что радикал р/ не
лежит в P[pv . . . , р/ — 1) (/ = 2, . . . , k) и рг не лежит в Я; в
противном случае он был бы лишним и его можно было бы
удалить; при этом все радикалы удалять не придется,—если бы
оказались лишними все рь р2, . . . , pft, то хг лежало бы в Р,
что невозможно, так как уравнение (2) не имеет корней в
области рациональности Р. Затем мы имеем право допустить,
что хг не лежит в поле P[?v р2, • • • > рЛ—1); если бы это было
226
не так, то радикал pk был бы для хг лишним. Таким образом,
можно написать, что
где ру #—элементы поля P[pv . . . , ?k_x) и q Ф 0.
Несложный подсчет обнаруживает, что x^p—qPk также
является корнем многочлена f(x), а именно, подставляя
значение хх в уравнение (2), после очевидных преобразований
получаем:
f(Xl) = P+Q9k=0,
где Р=рв + 3pq2Ak + aj>2 + axq2Ak + а^р + а3,
Q = 3p2q + Akq* + 2a,pq + a2q.
Ясно, что Р и Q являются элементами поля P[pv . . .., Pft_i).
Теперь, если допустить, что Q^O, то pft = и радикал pk
лежал бы в P(pv . . . , рЛ-1), что невозможно. Следовательно,
Q = 0 и тем самым Я=0.
Подставляя в многочлен /(л:) вместо л: число л;2=/?—qpk>
получаем после аналогичных преобразований, что / (х2) = Р— Qpk.
Но P=Q=0. Значит, f(x2)=0t т. е. лг2 также является корнем
многочлена f(x). При этом х2фхъ так как q^O.
Обозначим, далее, через xs третий корень многочлена f(x).
Тогда по формулам Виета
Х1 -f- Х2 + Х% = #lf
откуда
л^з = а± Xi x2i
или, подставляя значения хг и л;2:
л:3 = —а2—2/7.
Мы видим, что xs лежит в поле P[pv . . . , РкЛ, так как а
и /? лежат в P[pv . . . , р^).
Повторим для корня хв те же рассуждения, что и для х1л
Так как хг выражается через радикалы рь р2, . . . , pk_v то мы
получим, что хх и х2 лежат в P[pv р2, • • . , Pft_i)- Но это
невозможно, так как хх не лежит в P[pv р2> • • • , ?k-\)-
Отметим одно следствие, вытекающее из только что
доказанной теоремы.
Следствие. Уравнение третьей степени с рациональными
коэффициентами тогда и только тогда разрешимо в
квадратных радикалах, когда оно имеет по меньшей мере один
рациональный корень.
В самом деле, в этом случае область рациональности Р
будет совпадать с полем R рациональных чисел.
227
Рассмотрим теперь следующие задачи на геометрические
построения.
Задача об удвоении куба, как известно, сводится к
уравнению третьей степени
f(x)=x*—2=0 (3)
с рациональными коэффициентами. Это уравнение, однако, не
имеет рациональных корней, так как число у 2 иррационально.
Следовательно, уравнение (3) нельзя решить в квадратных
радикалах, и потому задача об удвоении куба неразрешима при
помощи циркуля и линейки.
Обратимся к знаменитой задаче о трисекции угла. Она
заключается в следующем: дан угол а, требуется его разделить
на три равные части. Обозначим искомый угол через ср. Тогда:
cos a=cos 3cp = 4cos 3<p—3 cos ср.
Поскольку угол а дан, мы можем считать его косинус также
заданным. Поэтому полагаем cosa=—, а coscp обозначаем
через —. Таким образом,
T-(f)'-3(f)'
или окончательно:
f{x)=x*-3x-b=0. 1
Возьмем, например, а=—. В этом случае &=1, и мы по-
о
лучаем уравнение х3—Зл:—1=0 с рациональными
коэффициентами. Если бы это уравнение имело рациональный корень—,
где р, q > 0 — целые числа и — несократимая дробь, то
(—) — 3— 1=0, или после некоторых преобразований ръ—
\ я 1 я
—3pq2 = q*. Левая часть последнего равенства делится на р\
следовательно, qB делится на р> откуда в силу несократимости
дроби — получается, что р=± 1. Точно так же из равенства
я
3pq2 + qB=pB усматриваем, что ps= ± 1 делится на q, откуда
q = l (случай q = — 1 отбрасываем, так как #>0). Таким
образом, уравнение л:3—Зх—1=0 может иметь в качестве
рационального корня лишь ± 1. Но, подставляя в уравнение вместо
х значение ± 1, видим, что и ± 1 не является корнем. Сле-
1 Обращаем внимание на то, что уравнение хъ — Ъх — Ь = 0 имеет три
действительных различных корня (неприводимый случай).
228
довательно, рассматриваемое уравнение не имеет рациональных
корней, и потому угол а = — нельзя разделить на три равные
о
части при помощи циркуля и линейки.
§ 36. Уравнения выше четвертой степени
Решение квадратных уравнений в радикалах было известно
еще древним индусам. Кубические уравнения были впервые
решены итальянскими учеными Тартальей и Карданом, жившими
в эпоху Возрождения. Вскоре после открытия решения
кубических уравнений одному из учеников Кардана, а именно Феррари,
удалось найти способ решения уравнений четвертой степени.
После того как было найдено решение в радикалах
уравнений третьей и четвертой степеней, было естественным шагом
вперед искать решение в радикалах общего уравнения пятой
степени. Трудно себе представить, сколько усилий было
затрачено для достижения этой цели. Это была одна из немногих
задач, которая представляла собой в полном смысле слова
камень преткновения человеческой мысли. В 1770—1771 гг.
знаменитый французский ученый Лагранж подверг
критическому пересмотру все известные до него приемы решения
уравнений в радикалах. В своем глубоком мемуаре „Reflections sur
la resolution algebrique" он показал, что корни заданного
уравнения можно выразить через корни некоторого
вспомогательного уравнения, называемого, по Лагранжу, резольвентой. И
тем не менее результаты Лагранжа оказались
неутешительными. Если взять уравнения второй, третьей и четвертой степеней,
то все обстоит благополучно: по сравнению с заданным
уравнением степень резольвенты оказывается на единицу ниже. Совсем
другое наблюдается, если обратиться к уравнению пятой
степени; его резольвента имеет уже шестую степень, вследствие
чего способ Лагранжа перестает быть пригодным.
Отметим, что Лагранж впервые стал рассматривать
подстановки корней уравнений, а это сыграло важную роль в
дальнейших исследованиях ученых.
После мемуара Лагранжа перед учеными возник вопрос,
достаточны ли алгебраические действия для решения
уравнений выше четвертой степени. В 1798 г. итальянский ученый
Руффини попытался доказать, что общее уравнение выше
четвертой степени не решается в радикалах; но его рассуждения
оказались неполными.
Строгое доказательство невозможности решения в радикалах
уравнений выше четвертой степени было впервые дано
выдающимся норвежским математиком Абелем, успевшим в течение
своей короткой жизни оставить глубокие исследования в самых
разнообразных отраслях математики.
229
Однако ни Руффини и ни Абель не дали исчерпывающего
ответа на поставленный вопрос. Они доказали, что
универсальной формулы решения в радикалах, пригодной для всех
уравнений данной степени п, при п > 5 не существует. Но отсюда
отнюдь не следует, что любое конкретное уравнение нельзя
решить при помощи радикалов, специально подобранных для
данного уравнения.
Исчерпывающий ответ был найден Эваристом Галуа,
гениальным французским математиком (1811 — 1832). Галуа показал, что
существуют такие конкретные уравнения, которые нельзя
решить в радикалах. Он показал, что разрешимость или
неразрешимость того или иного уравнения в радикалах тесно
связана с некоторыми свойствами так называемой группы
уравнения.
Личность Галуа настолько исключительна, что мы не можем
не остановиться на некоторых моментах его жизни. Дважды
провалившись на вступительных экзаменах в Политехническую
школу, Галуа поступил в Нормальную школу, откуда был вскоре
исключен (в 1830 г. после июльской революции) за выступление
против директора. Галуа активно участвовал в бурной
политической жизни Франции. Ярый республиканец и заклятый враг
короля Людовика Филиппа, он неоднократно подвергался
арестам и, наконец, погиб совсем молодым на дуэли. Глубокие
идеи Галуа не были оценены по достоинству его
современниками. Два мемуара, представленные им во Французскую
академию наук, не только остались без ответа, но даже оказались
потерянными.
В работах советских математиков (С. О. Шатуновский,
Н. Г. Чеботарев, Д. К. Фаддеев, Б. Н. Делоне, И. Р. Шафа-
ревич) теория Галуа получила дальнейшее развитие. Отметим,
кроме того, что Н. Г. Чеботарев проводил также исследования,
посвященные трудной и до сих пор еще не решенной проблеме
резольвент.
Итак, способ решения алгебраических уравнений в
радикалах оказался недостаточным. Более того, в тех случаях, когда
уравнение выше четвертой степени разрешимо в радикалах,
зачастую получаются громоздкие формулы, мало пригодные для
практического использования. Поэтому были разработаны так
называемые приближенные или, точнее выражаясь, численные
методы решения алгебраических уравнений.
Характерной особенностью численного метода является, во-
первых, то, что он применим только для уравнений с
числовыми, а не буквенными коэффициентами. Во-вторых, этот
метод сводится к некоторому неограниченному процессу
получения приближенных значений корня с любой заданной степенью
точности.
К численным методам приходится прибегать при решении
различных задач математики, механики, астрономии, физики,
230
техники и т. д. Так, например, Леверье, открывший планету
Нептун при помощи вычислений, должен был решать численно
с большой степенью точности уравнение шестой степени.
Нередко приходится встречаться с уравнениями,
коэффициенты которых являются приближенными числами. Очевидно,
что при вычислении корней таких уравнений следует принимать
во внимание погрешносгь, вносимую приближенными
значениями коэффициентов. Учет этих погрешностей проводится при
помощи методов, излагаемых в курсе приближенных вычислений.
На практике большей частью приходится иметь дело с
уравнениями, имеющими действительные коэффициенты. В своей
книге „Алгебра", изданной в 1834 г., гениальный русский
математик Н. И. Лобачевский указал один из самых
эффективных способов приближенного вычисления комплексных корней
уравнения п-и степени с действительными коэффициентами:
f(x) = xn + alXn-l+ ... +ап=0. (1)
В научной литературе этот способ неправильно называют
методом Греффе, несмотря на то, что он был предложен Греффе
на три года позднее.
Сущность способа Лобачевского, коротко говоря,
заключается в следующем. Пусть хъ хъ . . . , хп—все п корней
уравнения (1). Составляется уравнение
h («*) = *п + ai*n~l + • . . + Яя, (2)
корнями которого являются —x2u —xl, . . . , — х2п. Можно
вывести формулы, выражающие коэффициенты уравнения (2)
через коэффициенты уравнения (1), но мы этого делать не будем,
так как мы ограничиваемся изложением идеи метода. Далее,
составляется уравнение
f2(x) = xn + a1xn-l+ ... + д„ = 0,
корнями которого являются — х\, —х\, . . . , — х4п и т. д. При
достаточно большом k получается уравнение
fk (х) = хп + a[k)xn~l + . . . + а™=0,
которое можно приближенно разложить над полем
действительных чисел в произведение линейных и квадратных
множителей и, таким образом, удается с заданной степенью
точности вычислить корни первоначального уравнения (1).
Отметим, что чисто комплексные корни алгебраических
уравнений играют важную роль в различных приложениях,
например в вопросах „устойчивости движения" в механике.
Читателя, интересующегося подробным изложением метода
Лобачевского, мы отсылаем к книге А. Н. Крылова „Лекции
о приближенных вычислениях". В следующей главе мы
ознакомим читателя с некоторыми методами приближенного
вычисления действительных корней.
231
Глава шестая
МНОГОЧЛЕНЫ НАД ПОЛЕМ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ
§ 37. Вычисление рациональных корней
Частным случаем многочлена (уравнения) с
действительными коэффициентами является многочлен (уравнение) с
рациональными коэффициентами. Действительные корни такого
многочлена могут быть как рациональными, так и
иррациональными числами. Вопрос о вычислении иррациональных корней
тесно связан с методами приближенного вычисления
действительных корней многочленов с действительными
коэффициентами. Эти методы будут изложены в § 39—41, а здесь мы
рассмотрим один из простых способов нахождения рациональных
корней.
Итак, пусть
f(x) = a0xn+a1xn-l+ . . .+ап = 0 (1)
—уравнение п-й степени (п > 1) с рациональными
коэффициентами. Мы будем предполагать, что уравнение (1) имеет целые
коэффициенты; в противном случае мы умножили бы обе
части уравнения на общий знаменатель коэффициентов и
получили бы уравнение с целыми коэффициентами и с теми же
корнями, что и первоначальное уравнение.
Предлагаемый вниманию читателей метод вычисления
рациональных корней основан на следующей теореме.
Теорема 1. Если несократимая дробь — (/, т — целые
т
кисла и /я>0) является рациональным корнем
уравнения (1), то I есть делитель свободного члена ап, а т—
делитель старшего коэффициента а0.
Доказательство. Так как — есть корень уравнения
т
(1), то
а°-^+а>-^+- ■ -+«,-,- + «.-0.
232
Умножим обе части этого равенства на тп:
а0Г + а1Г~1т + . . . + an-ilmn'l+ anmn = 0.
Отсюда:
а01п= -т(а11п~1+ . . . + аптп~1) (2)
и
аптп = -1(а0Г~1+ . . .+ая-1тя-1). (3)
Правая часть равенства (2) делится, очевидно, на т.
Следовательно, на т должна делиться и левая часть равенства (2),
т. е. а01п. Но в силу несократимости дроби — число Vх вза-
т
имно просто с т. Поэтому а0 должно делиться на т.
Аналогично рассуждаем и относительно равенства (3). Его
правая часть делится на /. Следовательно, аптп должно также
делиться на /. Отсюда ап делится на /, так как тп взаимно
просто с /.
Отметим два следствия из только что доказанной теоремы.
Следствие 1. Целый корень уравнения (1) должен быть дела-
телем свободного члена ап.
В самом деле, целый корень / можно представить в виде
дроби —, откуда ясно, что / является делителем ап.
Следствие 2. Уравнение
со старшим коэффициентом, равным единице, и с целыми
коэффициентами аъ ..., ап может иметь в качестве
рациональных корней только целые корни.
Действительно, по теореме 1 знаменатель т > 0
рационального корня — должен быть делителем старшего коэффициента,
т. е. равен 1..Отсюда корень — = — =/ является целым.
т 1
Таким образом, испытывая всевозможные дроби — (/7г>0)
т
с числителем /, делящим апу и со знаменателем т, делящим
старший коэффициент а0, мы найдем рациональные корни
уравнения (1) или убедимся, что уравнение (1) не имеет
рациональных корней. Однако эти испытания можно значительно
сократить, стоит только доказать следующие теоремы.
Теорема 2. Частное от деления многочлена f(x) с
целыми коэффициентами на х—а, где а—целое число, есть
многочлен также с целыми коэффициентами.
Доказательство. По схеме Горнера первый
коэффициент частного Ь0 равен старшему коэффициенту а0
многочлена f(x). Второй коэффициент частного Ьг равен Ъ^а-\-ах.
233
Ho a, b0 и aj—целые числа; следовательно, Ьг также целое
число. Третий коэффициент частного b2 = b1a-\-a2 опять-таки
является целым, потому что а, Ьг и а2—целые и т. д.
Наконец, последний коэффициент частного Ьп_г = Ьп_2а + ап_1 есть
целое число, так как а, Ьп_2 и ал_1—целые.
Теорема 3. Если несократимая дробь — (т > 0) явля-
т
ется рациональным корнем многочлена
f (x) = a0xn + а^"-^ ... + ап
с целыми коэффициентами, то для любого целого числа k
кисло f (k) делится на l—km при условии, Ыто l—km ф 0.
Доказательство. Умножая многочлен f (х) на тпу
получаем:
mnf (х) = а0(тх)п+ таг (тх)п~1-\- . . . +тпап,
или, полагая тх = у,
mnf (х) = у (у) = а0уп + тагуп~1 + . . . + тпап.
Так как корень многочлена / (х), то целое число /
т
должно быть корнем многочлена ?(у), в силу чего
?(У) = (У-1)9(У)-
По теореме 2 ^коэффициенты многочлена q (у) должны быть
целыми.
Отсюда:
l — km l — km * v '
должно быть целым числом; иными словами, mnf (k) делится
на l—km. Но легко видеть, что т и l—km взаимно просты.
В самом деле, если бы т и l—km были не взаимно простыми,
то дробь
была бы сократимой
/-
/
ме.
/
т
- km
т
— km
т
/
т
= А
тх
ли бы, что
_ /l
4- kmx
тх
-k
У
т. е. в силу неравенства 0<^тг<Ст следовала бы
сократимость дроби —, что невозможно.
т
234
Теперь теорема становится очевидной—произведение mnf(k)
делится на l—km, a m взаимно просто с l—km\ следовательно,
/ (k) делится на l—km.
Покажем на конкретном примере, как, пользуясь всем этим,
следует вычислять рациональные корни уравнения.
Пример. Найти рациональные корни уравнения
/ (х) = 18jc4+ 9jc3-56x2-jc + 6 = 0.
Прежде всего найдем целые корни, для чего мы должны
испытать делители ±1, ±2, ±3, ±6 свободного члена 6.
Вычисляем значения /(1) и /( — 1): /(1) = —24, / ( — 1) = —40.
Следовательно, 1 и —1 можно отбросить. Далее, если /—целый
корень уравнения, то согласно теореме 3 число/ (1) должно
делиться на /—1 и /( — 1) должно делиться на / + 1. Но /(1) = — 24 не
делится на —6—1 = —7 и на 6—1=5. Значит, можно
отбросить и ±6. Затем /(—1) = —40 не делится на 2+1=3;
поэтому отбрасываем 2. Остаются, таким образом, —2 и ± 3.
При помощи схемы Горнера без труда находим, что /(—2) = 0,
/(3) = 1200 и /(—3) = 720. Мы видим, что —2—корень, а 3 и
—3 не могут быть корнями. Сокращаем теперь обе части
данного уравнения на х + 2. Мы получим уравнение:
g (х) = 18х*-27х2-2х + 3 = 0,
которое уже не имеет целых корней.
Согласно теореме 1 знаменатель дробного корня — (/я>0)
т
многочлена g(x) должен быть делителем 18, а числитель-
делителем 3. Мы считаем знаменатель т положительным,
относя знак к числителю /. Отсюда т = \, 2, 3, 6, 9, 18 и /=+1,
± 3. Так как — должно быть дробным, то получаются такие
т
I
возможные значения —:
т
+ —, +—, +—, + —, + —, +— (4)
~ 2 ~ 3 ~ 6 ~ 9 "18 ~ 2 у '
(мы еще учитываем, что / и т взаимно просты). Пользуясь
теоремой 3, исключим теперь часть значений (4), а именно
испытываем, для каких — число g(l) = — 8 делится на 1—т
т
и число g{—1) = — 40 делится на 1 + т. Без труда находим,
что этим условиям делимости удовлетворяют только числа
+ -L -L ±
~ 3 ' 9 ' 2
Подставляя эти числа в многочлен g(x) вместо х, убеждаемся,
, 1 3
что корнями являются только ±— и —.
о £
235
Итак, все четыре корня данного уравнения оказались
рациональными:
__9 __1_ 1_ _ 3
Хл — £% Хо — . Хо — . Хл — •
1 у а з 3 2
Задачи. Вычислить рациональные корни следующих
уравнений:
a) jc4 + 6jc3 + 12jc2 + 11jc + 6 = 0, б) хь- — х* + — х*+
6 б
+ —х2-—х+\=0, в) х*-3х*- — х2+—х-3 = 0.
6 3 ^ ' ; 2^2
§ 38. Неприводимость многочленов над полем
рациональных чисел
В элементарной алгебре рассматриваются простейшие
способы разложения многочлена с рациональными коэффициентами
на множители. Для многочленов f(x) второй и третьей степени
такое разложение осуществляется довольно просто благодаря
следующей теореме: многочлен f (x) второй и третьей степени
с рациональными коэффициентами тогда и только тогда
приводим над полем рациональных чисел, когда он имеет
по меньшей мере один рациональный корень.
Доказательство. Пусть / (х)—многочлен второй или
третьей степени над полем рациональных чисел. Если f(x)
имеет рациональный корень а, то f(x) делится на х—а, т. е.
f(x) = (x—a)-f1(x)y где fx(x) — многочлен над тем же самым
полем рациональных чисел. При этом степень /j (x) будет
равна 1 или 2. Таким образом, многочлен f(x) оказался
приводимым над полем рациональных чисел.
Обратно, если многочлен f(x) приводим над полем
рациональных чисел, то по меньшей мере один из множителей f(x)
должен быть линейным; в противном случае произведение
множителей имело бы степень, превосходящую 3, что
невозможно. Следовательно, f (x) = (x—a)-f1(x)i где х—а и fi(x)—
многочлены с рациональными коэффициентами, откуда а—
рациональный корень f(x).
Пример. Разложить многочлен f(x) = xs + Зх2 + 4x + 2 на
неприводимые множители над полем рациональных чисел.
Пользуясь способом нахождения рациональных корней,
изложенным в предыдущем параграфе, получаем, что данный
многочлен f (х) имеет только один рациональный корень х= — \.
Делим f(x) на х+1. Это деление можно провести при помощи
схемы Горнера. В частном получится х2-\-2х-\-2. Многочлен
второй степени х2 + 2х + 2 уже не имеет рациональных корней
и потому неприводим над полем рациональных чисел.
Следовательно,
f(x) = (x + \)(x2 + 2x + 2)
и есть искомое разложение многочлена / (х).
235
Для многочленов выше третьей степени дело обстоит уже
сложнее. Так, например, многочлен четвертой степени может
оказаться приводимым (над полем рациональных чисел) и тогда,
когда он не имеет рациональных корней, а именно он может
разложиться в произведение двух неприводимых квадратных
множителей. Тем не менее и для многочленов выше третьей
степени с рациональными коэффициентами существуют методы
разложения на множители.
Мы, однако, не будем рассматривать эти практически
громоздкие методы и ограничимся решением следующего вопроса:
существуют ли многочлены любой степени #>1,
неприводимые над полем рациональных чисел?
Если некоторые и даже все коэффициенты многочлена / (х)
над полем рациональных чисел дробные, то мы можем сделать
их целыми, умножая f (х) на соответствующее целое число.
При таком преобразовании неприводимый многочлен, очевидно,
останется неприводимым, а приводимый—приводимым. В
настоящее время известно большое количество критериев,
позволяющих быстро обнаружить неприводимость многих многочленов
с целыми коэффициентами над полем рациональных чисел.
Одним из наиболее распространенных является критерий,
предложенный в 1850 г. Эйзенштейном.
Критерий Эйзенштейна. Если
f(x) = a0 + а^ + а2х2+ ... + апхп (п>\)
—многочлен с целыми коэффициентами, причем а0, alf ...,
ап_г делятся на некоторое простое число р, старший
коэффициент ан не делится на р и свободный член а0, делясь
нар, не делится на р2, то многочлен f (x) неприводим (над
полем рациональных чисел).
Из этого критерия сразу получается решение нашего
вопроса, а именно: нетрудно теперь убедиться, что
неприводимыми над полем рациональных чисел могут быть
многочлены любой заданной степени п > 1.
В самом деле, многочлен произвольной степени п>\:
хп+рхп-1+рхп-2+...+р,
где р—некоторое простое число, удовлетворяет всем условиям
критерия Эйзенштейна и потому неприводим над полем
рациональных чисел.
Таким образом, поле рациональных чисел налагает на
неприводимость многочленов меньше ограничений, чем поле
действительных чисел и поле комплексных чисел—мы знаем
(см. § 32), что над полем действительных чисел многочлены
выше второй степени уже приводимы, а над полем
комплексных чисел приводимы многочлены и выше первой степени.
237
Доказательство критерия Эйзенштейна связано с понятием
примитивного многочлена и основано на двух леммах Гаусса.
Многочлен /г-й степени с целыми коэффициентами называется
примитивным, если наибольший общий делитель его
коэффициентов равен единице.
Например, многочлен f(x) = 2x* + 5л:3— Юх2 + 8х— 4
примитивен, а многочлен ср (х) = 4л:3 + 6л:2—Юх + 2 не является
примитивным, так как наибольший общий делитель его
коэффициентов равен 2, а не единице.
Теперь рассмотрим леммы Гаусса.
Лемма 1. Произведение двух примитивных многочленов
есть также примитивный многочлен.
Доказательство. Пусть
g(x) = b0 + b1x + b2x2+ . . . +bsx\
h (х) = с0+ сгх + с2х2+ . . . +С;Х*
— два примитивных многочлена. Перемножим их:
g (x) h (х) = Vo+ • • • + (Vi+y + V/+/-1 + -.. + */_ xcJ+l +
+ bfij + Ьшс._г + ... + bi+Jc0) xl+J+ ...+ bsctxm (m = s + t).
Допустим противное: пусть произведение g(x)-h(x)—не
примитивный многочлен; тогда его коэффициенты должны иметь
наибольший общий делитель d, отличный от единицы. Если
р—простой множитель df то на р должны делиться все
коэффициенты g(x)-h(x). Пусть b0, bv ...,ft/_1 делятся на/?, но
Ь. не делится на р (такое Ь., наверное, существует, так как
иначе g(x) не было бы примитивным многочленом). Точно
так же пусть с0, cv ...,^_1 делятся на /?, a Cj не делится
на р. Коэффициент
V/+y + *A+y-i + • • • + bi-icj+i + bfj +.-• + bi+j ^o (О
произведения g(x)-h(x) по предположению делится на/?. Кроме
того, на /? делятся, очевидно, и все члены (1), кроме Ь.с..
Следовательно, Ьр. также должно делиться на /?, потому что
иначе выражение (1) не делилось бы на р. Отсюда по
известному свойству простого числа следует, что по меньшей
мере один из сомножителей Ь{ или Cj произведения Ьр. должен
делиться на р. Мы пришли к противоречию—по условию ни bt
и ни Cj не делятся на р. Лемма доказана.
Лемма 2. Если многочлен f(x) с целыми коэффициентами
приводим над полем рациональных чисел, то его можно
разложить на произведение многочленов низшей степени
с целыми коэффициентами.
238
Доказательство. Поскольку f(x) приводим над полем
рациональных чисел, мы можем написать, что
/(«*) = ?(«*)♦(«*),
где <К-*0, ф (д:)—многочлены с рациональными
коэффициентами. Приведем коэффициенты <?(х) и ty(x) к одному
знаменателю; получим тогда, что <?(х) =—<?i (х), ф (х) = — tyi(x),
с d
причем срА (х) и ф2 (л:) —многочлены уже с целыми
коэффициентами. Затем вынесем за скобку наибольшие общие
делители коэффициентов <р2 (х) и $г (х). Получим ср (.*) = — g(x)f
ф (л:) = — h (x), где g" (x), h (x) —примитивные многочлены.
d
Таким образом,
Всегда можно положить — = —, где q и г взаимно просты.
Если ^.—какой-нибудь коэффициент произведения g(x)h(x), то
qei должно делиться на г, так как f (х)—многочлен с целыми
коэффициентами. Но q и г взаимно просты; поэтому еь должно
делиться на г. Мы видим, что г—общий делитель
коэффициентов g(x) h(x). По лемме 1 произведение g(x)h(x)
примитивно; следовательно, г=±1» откуда — равно целому чис-
cd
лу ±q.
Теперь лемма становится очевидной: f (х) разлагается на
произведение многочленов ±qg(x) и h(x) с целыми
коэффициентами.
Лемма 2 представляет и самостоятельный интерес, а именно:
разложение многочлена на множители над полем
рациональных чисел при помощи леммы 2 сводится к более простой
задаче разложения многочлена с целыми коэффициентами на
множители, имеющими также целые коэффициенты.
Теперь приступим к доказательству критерия Эйзенштейна.
Доказательство. Предположим противное: пусть
f(x) = g(x)h(x),
где
g(x) = b0 + b1x + ... + brxry h (x) = c0 + сгх+ ... + csxs
(r>0, s>0, r + s = n)
— многочлены с целыми коэффициентами (см. лемму 2).
Перемножая g(x) и h(x), получаем:
g (x) h (x) = b0c0 + (bxc0 + Vi) X+... + (Vo + bk-ici + • • ■ +
+ b0ck) xk + ... + brcsxn.
239
Отсюда следует, что
а0 = Ь0с0у а^ = Ъ^ + Vi. • • •. ak = Ькс0+ bk_xcx + ...+ b0ck9 ...,
an = brcs.
Коэффициент а0 = Ь0с0 делится на простое число р\ поэтому на
р должно делиться либо Ь0у либо с0. Пусть, например, Ь0
делится на р\ тогда с0 не может делиться на /?, так как иначе
аъ = Ь0с0 делилось бы на р2.
Далее, не все коэффициенты g(x) могут делиться на/?.
В самом деле, если бы имело место противное, то в
частности an = brcs делилось бы на р, а это противоречит условиям
критерия. Итак, пусть bk—первый коэффициент g(x), не
делящийся на р. Рассмотрим
ak = bkc0 + bk_lc1+...+b0ck.
ak> bk_v bk_2, ..., b0 делятся на р. Следовательно, на р
делятся ak, bk_xcv bk_2c2i .. ., b0ck, а потому делится на р и
bkc0. Получилось противоречие: ни bky ни с0 не делятся на /?,
а потому их произведение bkc0 не может делиться на простое
число р.
Итак, предположение о том, что f (х) приводим (над
полем рациональных чисел), неверно.
Примеры. 1. К многочлену f(x) = xb + 5л: + 9 критерий
неприводимости непосредственно применить нельзя, так как
нельзя подобрать простого числа /?, на которое одновременно
делились бы 5 и 9. Но мы можем положить х = у + 1 и тогда
получится:
/ (У + 1) = Т (У) = УЬ + 5у4 + 10у8 + Юу2 + 10у + 15.
Теперь требования критерия выполняются при р = 5.
Следовательно, ср (у) и тем самым f (х) неприводимы. *
2. Рассмотрим многочлен
f(x) = xp~l + хр~2+ . . .+1 {р—простое число).
Чтобы можно было применить критерий Эйзенштейна,
полагаем, как и выше, х=у-\-\. Получаем:
(x-l)f(x)=--(x-\)(xp-1 + xp-2+ . . . +l) = **_lf
или yf(y + \)=y<?(y) = (y+ l)p—1 =
=yp+pyp'l+^f^-yp-2+^ . .+ру,
откуда:
<?(у)=ур-1+рур-2 + ^1ур-3+. . .+р.
240
Мы видим, что все коэффициенты, кроме старшего, делятся
на простое число /?, причем последний коэффициент р не
делится на р2у значит, <?(у) и тем самым f (х) неприводимы.
Задачи. 1. Показать, что если многочлен /(х) неприводим над полем
рациональных чисел, то многочлен <р (у) = f(ay + Р), где а, р — рациональные
числа, также неприводим над полем рациональных чисел (а ф 0).
2. Показать неприводимость над полем рациональных чисел следующих
многочленов: а) / (х) = хт— рхрч . . . рп где т > 1, pt— различные
простые числа; б) / (х) = хр — рх + (2р — 1), где р — простое число; в) / (х) =
= х* — 2х + 3.
§ 39. Границы действительных корней
Теперь перейдем к многочленам с произвольными
действительными коэффициентами; мы их будем рассматривать как
действительные непрерывные функции действительного
переменного х. На протяжении этого и следующих параграфов
настоящей главы мы будем коротко говорить „многочлен"
(„уравнение"), имея в виду многочлен (уравнение) с
действительными коэффициентами.
Приближенные (численные) методы нахождения
действительных корней многочлена, излагаемые в этой главе, состоят
из трех этапов:
1. Нахождение границ действительных корней.
2. Отделение действительных корней; т. е. нахождение
таких интервалов, в каждом из которых лежит один и только
один действительный корень данного многочлена (уравнения).
Сюда можно отнести и определение числа всех
действительных корней.
3. Приближенное вычисление действительных корней,
которое заключается в том, что при помощи некоторого
процесса составляют числовую последовательность, сходящуюся
к тому или иному действительному корню.
Мы разберем здесь два способа нахождения границ корней.
Первый способ. Нетрудно убедиться, что
действительные корни многочлена / (х) =а0хп + аххп~х + ... +ап, а0ф 0,
А
следует искать в интервале (—Му М)у где М= -—- + \, А —
I ао\
наибольшая из абсолютных величин коэффициентов аи ..., ап.
В самом деле, согласно теореме о модуле старшего члена
(см. § 31, теорему 1)
\а0хя\>\а1хГ'1+.. . + ап\
А А
при |д:|> Ь 1- Таким образом, при \х\> -—- + 1
Kl KI
|/ (х) | = | а0хп + {агхп'1 + ... +ап) \ > | aQx» | -
-\aixn-l+. . .+а„|>0,
241
т. е. f(x) не обращается в нуль. Иными словами,
действительные корни могут лежать только между —М и Му где
К/
Пример. Рассмотрим уравнение
f(x)=2x* + 100jc2-5jc-40 = 0.
Здесь я0 = 2, А = \00, откуда М= 1- 1 =51. Таким
образом, действительные корни (если они имеются) следует
искать между—51 и 51.
К сожалению, этот простой способ нахождения границ
действительных корней обладает одним существенным
недостатком: обычно получается слишком большое М. Поэтому мы
сейчас укажем другой» более совершенный способ.
Второй способ (способ Ньютона). Он основан на
следующем предложении: если все производные f (x), f"(x)t
..., fn) (x) многочлена п-й степени f (х) положительны
при х=с (с>0), но f(c)<0, то существует такое число
а^>с, что при х = а будет положителен и сам многочлен
f(x) вместе со своими производными f (x), f" (x), ...,fn)(x).
Доказательство. Разложим f(х) по степеням х—с по
формуле Тейлора:
f(x)=f(c) + (x-c)f'(c)+. . .+(х-с)»-РЦЭ-. (1)
По условию f'(c), ...,.fw(c) положительны. Следовательно,
члены
(x-c)f'(c), ..., (х-с)п
п\
при х > с положительны и неограниченно возрастают при
возрастании х > с. Поэтому можно указать такое достаточно
большое число а>с, чтобы при х=а член f (с) разложения
(1) поглощался положительной суммой остальных членов и
тогда будет / (а) > 0.
Что касается производных /' (х)> ..., fn) (x), то они и
подавно будут положительны при х=а:
Г (a) = (a-c)f"(c) + ... + (a-c)'"1^L>0,
так как члены
(а-с)/"^),...,^-^)""1-^-
1 Из самого вывода очевидно, что М вместе с тем является и верхней
границей модулей всех комплексных корней многочлена.
242
положительны. Аналогично
f" (а) = (а-с) Г (€) + ... + (а-сГ2 ^М- > О
и т. д. Предложение доказано.
Легко видеть, что число а > 0, при котором многочлен
f (х) и все его производные f'(x),. . ,,fn\x) положительны,
является верхней границей положительных корней
многочлена.
В самом деле, при х >а все члены разложения
/ (х) =f (a) + (x-a) /'(а) + . . . + (х-ау f^L
будут, очевидно, положительны, в силу чего /(л;)>0 при
х > а. Следовательно, при х>а многочлен f (х) не может
обращаться в нуль и потому его действительные корни должны
быть меньше а.
Таким образом, мы приходим к следующему способу
определения границ действительных корней многочлена / (х).
Способ Ньютона. Старший коэффициент данного
многочлена п-й степени f(x)=a0xn + . . . + ап всегда можно
сделать положительным, стоит только f (х) умножить на —1.
Поэтому пусть а0 >0. Обращаемся к (лг— 1 )-й производной
f{n-1)(x) = (n-l)\(na0x+(n-l)al). Если jc>- (n~1)fll , то
/(л_1) (х) > 0. Следовательно, можно подобрать такое
положительное число с > — *п~ )ctl , чтобы производная /(л_1) (х) при
х = с была положительной. При этом п-я производная fW(x) =
= п\а0 положительна при всех значениях х, так как а0 > 0.
Отсюда по доказанному выше можно подобрать такое сх > с,
чтобы при х=сг были положительными fn~2) (x)y fn~l)(x) и
f{n\x). Поскольку f{n~2)(jc), /(л_1)(^), f{n)№ положительны при
х=сг можно подобрать такое c2i>cx, чтобы при х=с2 были
положительными /(л_3)(х), Г"2) (х)у f{n~l) (x), fW (x) и т. д.
В конечном счете мы доберемся до f(x) и найдем для него
верхнюю границу положительных корней.
Чтобы найти нижнюю границу положительных корней f(x),
заменяем х через — и рассматриваем многочлен g (у) =Уп/(у) •
Если Ъ— верхняя граница положительных корней g(y)f то --
будет нижней границей положительных корней данного
многочлена f(x).
Чтобы найти верхнюю границу отрицательных корней/(л:),
полагаем х= и рассматриваем многочлен h(z)=znfl—jU
243,
Если с—верхняя граница положительных корней h(z), то ——
будет верхней границей отрицательных корней f(x).
Наконец, чтобы найти нижнюю границу отрицательных
корней f(x), полагаем х=—и и рассматриваем многочлен
k(u)=f(—u). Если d— верхняя граница положительных корней
k(u), то—Сбудет нижней границей отрицательных корней f(x).
Таким образом, все положительные корни многочлена / (х)
следует искать в интервале (—, a J, а все отрицательные
корни—в интервале [—d, ).
Пример. Найти по способу Ньютона границы
действительных корней уравнения:
/(jc)=2jc6+ 100jc2-5jc-40=0. (2)
Составляем производные:
/'.(*) = 5 (2jc4 + 40;с-1), f" (jc) = 40 (jc3 + 5),
f'"(x) = \20x\ P(jc) = 240jc, /v(jc) = 240.
Сразу видно, что при х=\ все производные от первого до
пятого порядка положительны. Подставляем значение х=-\
в многочлен f (х) и находим, что/(1)=57 > 0. Следовательно,
1 можно принять за верхнюю границу положительных корней
данного уравнения.
Для нахождения нижней границы положительных корней
заменяем в уравнении (2) х через —. После некоторых
преобразований получится:
ее (у) = 40у5 + 5у4—ЮОу3—2=0.
Составляем производные:
<р'(уН20у200у2 + у-15), ср"(у) = 20у (40у2+ Зу—30),
ср- (у) = 120 (20у2 + у—5), <pIV(y)=120(40y + 1), ?v(y) = 4800.
При у = 1 производные <р"(у), ?'"(У)» <p,v(y) и <pv (у)
положительны. Однако производная <р' (у) отрицательна при у = 1.
Поэтому берем для у несколько большее значение, например 2,
и находим, что ср'(2)=2160 >0. Но ср (у) при у=2 также
положительно: ср(2)=558>0. Следовательно, 2—верхняя
граница положительных корней ср (у), откуда — будет нижней
границей положительных корней данного уравнения (2),
244
Для нахождения верхней границы отрицательных корней
полагаем в уравнении (2) л;=— у. Получится:
ф (z) = 40z5-5z4-100z3 + 2=0
и
У (z) = 20z2(10z2-z-15), <j/'(z) = 20z(40z2-3z-30),
']/"(z) = 120(20z2-z-5), ^lv(z) = 120(40z-l), ^v(z) = 4800.
При z = 2 многочлен ф (z) и все его производные положительны.
Значит, 2—верхняя граница положительных корней ^(z),
откуда —— будет верхней границей отрицательных корней
уравнения (2).
Наконец, для нахождения нижней границы отрицательных
корней полагаем в уравнении (2) х = —и. Получаем:
а) (и) = 2иь-100и2-5и + 40=0.
Предоставляем читателю самому убедиться, что 4—верхняя
граница положительных корней ш (и). Следовательно, —4 будет
нижней границей отрицательных корней уравнения (2).
Итак, положительные корни данного уравнения (2) следует
искать в интервале / — ,1) а отрицательные — в интервале
—-4, ). Мы видим, что способ Ньютона оказался более
выгодным, чем первый способ.
Покажем, что каким бы способом ни были найдены
верхняя граница а положительных и нижняя граница—d
отрицательных корней, всегда знак многочлена f (х)=а0хп +
+ • • • + ап> аоФ®> п > 1» будет совпадать со знаком его
старшего ялена а0хп при х>а и x<—d.
Доказательство. Пусть многочлен f(x) имеет всего
s действительных корней хи. . ,,xs (каждый корень считается
столько раз, какова его кратность). Тогда он разложится над
полем действительных чисел на произведение s линейных и
п—s квадратных множителей:
/ (х) = а0 (х-хг) . . . (х—xs) (х2 + рхх + qx) . . . (х2 + pkx + qk),
где k=n—s *. Каждый квадратный множитель х2+р?х + q<* будет
иметь пару сопряженных чисто комплексных корней а + р/
и а—р/ (р_/0), в силу чего получается, что
х2 + р.х +q. = (х-а-р/) (х-а + р/) = (х-а)2 + Р2 > Q
1 Среди квадратных множителей могут встречаться и одинаковые.
245
при любых действительных значениях х. При х > а > 0
каждый линейный множитель x—Xj будет положителен, так как
Xj<.a. Следовательно, при х>а произведение
(х-хг). . . (x-xs) (х2 + р{х + qx). . . (х2 +pkx + qk)
будет положительно и знак многочлена будет совпадать со
знаком а0, т. е. со знаком а0хп, поскольку х здесь принимает
положительные значения.
При х <—rf<0 каждый линейный множитель х- Xj уже
отрицателен, так как —d<xJt а квадратные трехчлены х2+
+ PvX+qv остаются положительными. Следовательно, знак
многочлена f(x) при х <С— d будет совпадать со знаком a0(—\)s.
Но мы знаем, что число s действительных корней имеет ту же
четность, что и степень п многочлена f(x). Следовательно,
знак многочлена f(x) будет при x<—d совпадать со знаком
ао(—О"» т- е- со знаком старшего члена а0хп, так как при
отрицательном х знак хп равен знаку (—1)".
Из только что доказанного предложения вытекает, что при
достаточно больших по абсолютной величине значениях х
знак многочлена f (х) = а0хп + . . . + ап (а0фО) совпадает со
знаком его старшего члена а0хп.
Пример. Мы уже нашли, что верхней границей
положительных корней многочлена f(x)=2xb + ЮОх2—5х—40 является
число 1, а нижней границей отрицательных корней — число
—4. Из чисел 1 и |—4| = 4 наибольшим является 4. Значит,
при |л;|>4 знак многочлена f (х)=2х5 + ЮОх2—5х—40
наверное будет совпадать со знаком его старшего члена 2л:5.
§ 40. Отделение действительных корней
Существует довольно много способов отделения
действительных корней. Наиболее простым и наглядным, а в
некоторых случаях и вполне достаточным является способ,
основанный на построении графика заданного многочлена f(x), а именно:
пусть многочлен f(x) не имеет кратных множителей; в
противном случае мы их выделили бы. Составим график функции
y=f(x). Очевидно, что абсциссы точек пересечения графика
с осью ОХ и будут действительными корнями данного
многочлена1. Эти точки пересечения с осью ОХ, вообще говоря,
будут строиться приближенно; таким образом, будет получаться
не точное значение действительного корня, а более или менее
тесный интервал, содержащий рассматриваемый корень.
Пример. Отделить при помощи графика действительные
корни многочлена
f(x) = x*-2xs + 2х2-4х + 1.
1 Если бы были кратные множители, то график мог бы касаться оси
ОХ в некоторых точках.
246
Этот многочлен не имеет отрицательных корней, так как
он положителен при отрицательных значениях х. При помощи
способа Ньютона находим, что 2—верхняя граница
положительных корней данного многочлена f(х). Таким образом, все
действительные корни f (х) лежат в интервале (0,2).
Теперь составляем табличку значений многочлена f (x)
в интервале (0,2), причем для х берем значения 0; 0,5; 1;
1,5 и 2:
X
У
0
1
0,5 | 1 | 1,5
—0,7 | -2 | —2,2
2 |
1 |
Значения /(0,5) и /(1,5) вычислены с точностью до 0,1. Однако
этой таблички еще недостаточно для построения графика,
—мы, строго говоря, не знаем,
как ведет себя функция у=f(x) в
интервалах (0;0,5), (0,5; 1),
(1;1,5) и (1,5; 2).
Обратимся к производной
второго порядка:
f"(x)=4(3x2-3x+l).
Она при всех значениях х
положительна, так как не имеет
действительных корней.
Следовательно, первая производная
/' (х)=2 (2jc3-3jc2 + 2jc-2)
монотонно возрастает. Так как
/'(0) = -4<0, /'(0,5) = -3<0,
/'(1) = -2<0 и /'(1,5)=2>0,
то в интервалах (0; 0,5) и (0,5; 1)
производная Г (х) отрицательна,
в интервале (1;1,5) производная
отрицательна до некоторой точки
х=с, где она обращается в нуль,
а потом положительна и остается положительной в
интервале (1,5; 2). Отсюда следует, что данный многочлен / (х)
в интервалах (0; 0,5) и (0,5; 1) убывает, в интервале (1; 1,5)
продолжает убывать до точки х=с, а затем начинает
возрастать и в интервале (1,5; 2) продолжает возрастать. Мы, таким
образом, получаем следующий график (см. черт. 7). Из этого
графика видно, что данный многочлен имеет всего два
действительных корня: один лежит в интервале (0; 0,5), а другой—
в интервале (1,5; 2).
При отделении действительных корней многочлена / (х)
при помощи построения графика (и даже при другом способе)
Черт. 7
247
может оказаться полезным следующее свойство: если
значения f(a) и f (b) имеют одинаковые знаки, то в интервале
(а, Ь) либо совсем нет действительных корней, либо имеется
четное число действительных корней многочлена /(x). Если же
f (а) и f(b) разных знаков, то в интервале (а, Ь) лежит
нечетное число действительных корней многочлена f(x).
При этом многочлен f(x) может иметь кратные множители,
приходится лишь каждый корень считать столько раз, какова
его кратность.
Геометрически это свойство весьма наглядно. Ось ОХ делит
плоскость XOY на две части: на верхнюю и нижнюю
полуплоскости. Если f (а) и f (b) имеют разные знаки, то точки
A [a, f(a)\ и B[b,f(b)\ находятся в разных полуплоскостях.
Если знаки у f(a) и f (b) одинаковы, то точки А и В лежат
в одной полуплоскости. С другой стороны, из одной
полуплоскости в другую можно непрерывно перейти, пересекая
ось ОХ один, три и вообще нечетное число раз. Напротив,
пересекая ось ОХ четное число раз, мы будем возвращаться
в исходную полуплоскость.
Приводим и алгебраическое доказательство. Если
многочлен f(x)=a0xn + . . . + ctn, n > 1, а0 ф 0, совсем не имеет
действительных корней, то он разлагается над полем
действительных чисел только на квадратные множители
f(x) = a0(x2+p1x + ql). . Ax2+pkx + qk),
причем каждый множитель x2 + p^x-\-q^ будет положителен
при любом значении х. Отсюда при любом значении х
многочлен / (х) будет иметь один и тот же знак, совпадающий со
знаком его старшего коэффициента а0. В частности f(a) и f(b)
будут одинакового знака.
Если многочлен f(x) имеет действительные корни xl9. . .,xs
(1 <s<#; каждый корень считается столько раз, какова его
кратность), то он разложится над полем действительных чисел
на линейные и (в случае s < п) на квадратные множители:
f(x)=a0(x—x1) . . .{x-xs){x2-\-plx + ql). . . (х2 +pkx + qk)
(k = n—s).
Если корень лгу не лежите интервале (а, Ь), то соответствующий
линейный множитель x—Xj будет сохранять постоянный знак
при изменении х от а до Ь. Совсем другое наблюдается, когда
Xj лежит в интервале {а, Ь)\ в этом случае x—Xj при
переходе х от а до b изменит свой знак на противоположный. Что
касается квадратных трехчленов х2 +р^х + q?, то они, как мы
знаем, положительны независимо от значений х. Таким
образом, f (а) и f(b) будут иметь разные знаки тогда и только
тогда, когда в интервале (а, Ь) лежит нечетное число
действительных корней.
248
Наиболее совершенным в теоретическом отношении является
способ Штурма отделения действительных корней. Но прежде
чем переходить к изложению этого способа, сделаем несколько
замечаний.
1. Пусть дана упорядоченная ненулевая система
действительных чисел аи а2, . . ., ak (k > 1) *, например
5, -8, -7, 1. (1)
Мы видим, что знаки чисел системы чередуются следующим
образом:
+ +
и меняются два раза: один раз в начале с плюса на минус
и один раз в конце с минуса на плюс, т. е. в системе чисел
(1) наблюдается две перемены знаков.
Числам, равным нулю, мы не приписываем никакого
Определенного знака, т. е., попросту говоря, выбрасываем из
системы при подсчете количества перемен знаков. Так, в системе
5, 0, —8, 1, —3, 0, 0, 2, —5, —7, 0 наблюдается пять перемен
знаков, а в системе 5, 5, 8, 0, 0, 2, 0 количество перемен
знаков равно нулю.
2. Пусть f(x)—некоторый многочлен степени п>\. Мы
можем предположить, что многочлен f(x) не имеет кратных
множителей, т. е. он взаимно прост со своей производной Г (х).
В самом деле, если бы/(л:) имел кратные множители, то мы
их заранее выделили бы.
Применим алгоритм Евклида к f0(x)=f(x) и /i (•*)=/'(•*)
с тем только отступлением, что мы будем каждый раз знак
остатка менять на обратный. Например, если г (х) — остаток
от деления f0(x) на fi(x), то мы вместо него будем
рассматривать f2 (х) = —г (х). Таким образом, получаем:
fm-2 W^m-1 (X)fm-l (*)Чт(х),
(2)
где fm (-*)—наибольший общий делитель многочлена f(x) и его
производной f (x). Очевидно, что fm (x) должен быть
многочленом нулевой степени, так как f(x) и f (х) взаимно просты.
Упорядоченная система
fo(*)=f(x), flW=fW,/2W /«W (3)
только что найденных многочленов обладает следующими
важными свойствами:
1 Т. е. система, в которой по меньшей мере одно число отлично от нуля.
24£
а) Никакие два соседних многочлена системы (3) не
имеют общих корней.
Для доказательства обратимся к равенствам (2).
Пусть два многочлена fk(x) и fk+l(x) имеют общий корень
х = а\ тогда fk(x) и fk,x (x) должны делиться на х—а.
Рассмотрим теперь равенство
/*_! (x) = 9k (x)fk (x)-fk+l (х).
Его правая часть, очевидно, делится на х—а; следовательно,
и левая часть, т. е. fk_l(x), делится на х—а. Переходя к
вышележащему равенству, точно так же получим, что fk_2(x)
делится на х—а и т. д. Поднимаясь шаг за шагом вверх, мы,
наконец, дойдем до f0(x) и fx(x) и обнаружим, что f0(x) и
fi(x) делятся на х—а. Но это невозможно, так как f0(x) и
fxlx) взаимно просты.
Назовем промежуточным многочленом системы (3) любой
многочлен системы, кроме первого и последнего. Тогда
б) Если а—действительный корень какого-нибудь
промежуточного многочлена fk (x), то два соседних многочлена fk_x (x)
и /Л+1 (х) имеют при х=а противоположные знаки.
Это свойство почти очевидно: из равенства
/*_! («*) = qk (x) fk (x) -fk+[ (х)
получаем при х=а:
так как по условию fk(a)=0. При этом в силу предыдущего
свойства а) числа fk_x (а) и fk+l (а) отличны от нуля.
в) Если ху возрастая, проходит через действительный
корень а многочлена f0 (x)=f(x), то между многочленами
/0 (х) и /, (х) теряется одна перемена знаков, т. е.
произведение fo(x)-f1(x) меняет знак с минуса на плюс.
Справедливость этого свойства обнаруживается так.
Многочлены f0(x)=f(x) и fi(x)=f (x) не имеют общих корней.
Следовательно, f (а) Ф 0. Выберем столь малый промежуток
(а—г, а-\-г), чтобы внутри и на его концах производная Г (х)
также не обращалась в нуль, т. е. сохраняла тот же знак,
что и в точке х = а. Возможны только два случая: либо /' (х)
в промежутке (а—е, а + е) положительна, либо f (х) в этом
промежутке отрицательна. Пусть, например, /' (х) > 0. Тогда
в рассматриваемом промежутке многочлен f(x) будет
возрастать; поэтому при переходе х через корень а многочлен f (х)
250
должен переходить от отрицательных значений к
положительным. Получаем следующую табличку чередования знаков:
X
a—t < х < а
а < х <а+г
/oW
+
/.W
+
+
Число |
перемен
1
1
Таким образом, между f0(x) и fx (x) сначала была перемена
знаков, а после перехода через корень она потерялась.
Подобный же результат получается и при f (х) < 0 (здесь
многочлен f (х) будет убывать).
г) Последний многочлен системы (3) не имеет
действительных корней, т. е. сохраняет один и тот же знак при
любых (действительных) значениях х.
В самом деле, fm (x) является многочленом нулевой
степени и потому не обращается в нуль.
Систему многочленов (3) мы будем называть системой
функций Штурма для f(x). Наряду с этим мы назовем
также системой функций Штурма для f (x) и любую
упорядоченную систему отличных от нуля многочленов
(с действительными коэффициентами):
g0(x) = f(x)t g^x), ...,&(•*)
обладающих теми же четырьмя свойствами а), б), в), г), что
и система (3).
Пример. Рассмотрим
/(jc) = jc4-5jc2 + 8jc-8.
Прежде всего следовало бы убедиться, не имеет ли
многочлен f(x) кратных множителей, но мы можем сразу начать
с построения системы функций Штурма; если последняя
функция системы Штурма окажется выше нулевой степени, то / (х)
имеет кратные множители и их придется отделить. Находим
производную:
П*) = 4;с3-1Си + 8
и делим f(x) на Г (х). Для сохранения свойств б) и в)
умножать и сокращать можно только на положительные числа; таким
образом, чтобы избежать дробных коэффициентов, умножаем
f (х) на положительное число 4 и делим на Г (х):
4jc4-20jc2 + 32jc-32 \4x*-Wx + 8
~4jc4—10jc2+ 8x | х
-Юх2 + 24х-32
(сокращаем на 2)
- 5х2+ 12*—16
251
Следовательно, меняя у остатка знаки на
противоположные, получаем g2(x)=5x2—\2x+l6. Делим f (х) на g2(x),
предварительно умножая /' (х) на 25:
IOOjc3 -250л-+ 200 | 5л-2-12л-+16
~ 100л-3-240л:2 + 320х 20л:+ 48
_ 240л-2 — 570л- + 200
240л-2 -576л- + 768
6л:—568,
откуда gs (х) = —Зл: + 284. Наконец, делим 9g2 (x) на g3 (х):
45л-2- 108л- +144 |- Зл: + 284
~~ 45л-2-4260л- - 15л- - 34б"
4152л-+ 144
(сокращаем на 4)
1038л-+• 36
1038л- - 98264
98300.
Остаток есть положительное число; поэтому gt(x) есть
отрицательное число и можно просто положить gi(x) = — l.
В результате получилась такая система функций Штурма:
g0 (x)=f (л-) = л-4-5л-* + 8л--8,
£1(*)=4-П*) = 2л-8-5л- + 4,
£2(*) = 5л-2-12л-+16,
£3(х) = -Зх + 284,
Впрочем, функции g3 (x) и g4 (•*) можно отбросить, а именно:
легко заметить, что g2 (x) не имеет действительных корней.
Следовательно,
g0 (л-) =/ (х) =л-4-5л-2 + 8л--8,
gi (х) = -i-V (*)=2л:3-5х + 4,
^2(л:)=5х2— 12л:+ 16
есть также система функций Штурма для f (х)
252
(4)
Положим теперь х=0. Тогда функции (4) примут
следующие значения:
*Го(0) 8, Ы0>=4, ft(0) = 16.
Если положить х=2, то получится:
*о(2)=4, ft (2) = Ю, й(2) = 12,
и мы можем составить такую табличку:
X
1 °
1 2
go(x)
—
+
8i(x)
+
+
g*(x)
+
+
число
перемен
1
0
Мы замечаем, что при переходе от х = 0 к х=2 число
перемен знаков в системе функций Штурма уменьшилось на 1;
иными словами, потерялась одна перемена. Разгадка этого
явления кроется в теореме Штурма.
Теорема Штурма. Пусть многочлен f(x) не имеет
кратных множителей и а < Ь—действительные числа, не
являющиеся корнями f{x). Тогда число действительных
корней многочлена f{x) на отрезке [а, Ь] равно числу
потерянных перемен знаков в системе его функций Штурма при
возрастании х от а до Ь.
Доказательство. В самом деле, что происходит при
возрастании х? До тех пор, пока х не проходит через
действительные корни функций
£<>(■*) = /(■*). &(*), ....&(*) (5)
системы Штурма, число перемен знаков в системе (5) не
изменяется.
Посмотрим, что происходит, когда х проходит через
действительный корень а промежуточной функции gk(*)-
Благодаря свойствам а) и б) gk_x(a) и gk+l (а) не равны
нулю и имеют противоположные знаки, Возьмем столь малый
отрезок [а—е, а + е] (е > 0), чтобы gk_x(x) и gh+l(x) на этом
отрезке не имели действительных корней, т. е. сохраняли
постоянный знак. Допустим для определенности, что для всех
значений х в промежутке [а—е,;а + £] £*_i(*)<0, gk+l (*) > 0.
Тогда получается такая табличка знаков:
х
\а — £ < х<а
\а<х <а + е
Sk-i
—
—
ч
**-И
+
+
253
Какие бы знаки в пустых клетках ни ставить, всегда будет
наблюдаться как при х < а, так и при х >а одна перемена
знаков, т. е. столько перемен, сколько их наблюдается и при
выбрасывании пустых клеток. В остальных частях системы
Штурма (5), где ни одна из функций не обращается при х = а
в нуль, число перемен знаков измениться не может, а там, где
при х = а в нуль обращается несколько промежуточных
функций (эти промежуточные функции в силу свойства а) не могут
быть соседними), число перемен знаков по только что
доказанному также не меняется. Таким образом, если ху возрастая,
проходит через действительный корень какой-нибудь
промежуточной функции gk(x), то число перемен знаков в системе
функций Штурма (5) остается без изменения, может произойти
лишь перераспределение знаков.
Если х возрастая, проходит через действительный корень
самого многочлена f (x) ( = g0 (x)), то по свойству в) между
So(x) = f(x) и Si (x)> a потому и во всей системе функций
Штурма, теряется одна перемена знаков.
Наконец, случай, когда х проходит через действительный
корень последней функции Штурма gi(x), отпадает, так как
gt (x) по свойству г) не имеет действительных корней.
Итак, при возрастании х от а до b число перемен знаков
в системе функций Штурма (5) должно уменьшиться на столько
единиц, сколько действительных корней имеется на отрезке
[а, Ь]. Теорема доказана.
Пример. Отделить, пользуясь теоремой Штурма,
действительные корни уравнения
/(jc) = 3jc4-4jc3-6jc2-12jc + 1=0.
Составляем систему функций Штурма:
g0(x) = f (х) = 3х*-4х*-6х*-\2х + 1,
g2(x) = 2x2 + 5x,
gs(x) = -3\x + 4,
Si (*) = -!.
Прежде всего найдем число действительных корней. При
достаточно большом по абсолютной величине значении х знак
каждой функции Штурма совпадает со знаком ее старшего
члена. Следовательно, обозначив достаточно большое
.положительное значение х через + со и достаточно большое по абсо-
254
лютной величине отрицательное значение х через — оо, получим
такую табличку:
X
— оо
0
~ь °°
goW
+
+
+
gi(x)
—
—
+
g*(x)
1 +
0
+
gs(x)
+
+
—
g*(x)
—
—
—
Число перемен
3
3 1 потеряны
| две
1 ) перемены
При возрастании х от — оо до 0 число перемен осталось без
изменения; стало быть, наше уравнение совсем не имеет
отрицательных корней. Затем, при возрастании х от 0 до + °°
потерялись две перемены; поэтому уравнение имеет два
положительных корня. Попробуем их отделить. При помощи
способа Ньютона нетрудно убедиться, что верхняя граница
положительных корней равна 3. Применяем теорему Штурма:
X
1 °
1
1 2
3
goW
+
—
—
+
gl(*)
—
—
+
+
g*(x)
0
+
+
+
gs(x)
1 +
—
—
-
#4 (X)
—
—
-
Число перемен ,
3 л потерялась
\ одна
2 ) перемена
2 ч потерялась
| одна
1 J перемена
Итак, корни отделены: первый корень лежит в интервале (0, 1)>
а второй—в интервале (2, 3).
Недостатком метода Штурма является его громоздкость.
Во многих случаях полезным оказывается следующее предложение.
Теорема Декарта. Число положительных корней уравнения
f(x) = а0хп + аххп~х + . . . + ап=0, а0 > О, ап Ф О, п > Ь (6)
равно или на четное число меньше числа перемен в ряду его
коэффициентов 1 (каждый корень считается столько раз, какова его кратность).
Например, в уравнении
/(*) = *4 — 6*з 4- 8х2 + 4* — 1 = О
наблюдаются три перемены; следовательно, уравнение имеет три или один
положительный корень.
Прежде чем переходить к доказательству теоремы, сделаем несколько-
замечаний.
1 Само собой разумеется, что при подсчете числа перемен
коэффициенты, равные нулю, следует отбросить.
255
1. Пусть производная /' (х) многочлена f(x) имеет s положительных
корней, считая каждый корень столько раз, какова его кратность. Тогда
многочлен/(jc) должен иметь не более s + 1 положительных корней,
которые считаются так же, как и корни производной. В самом деле, если/(*)
имел бы, например, s + 2 положительных корня, то в силу теоремы Ролля
«го производная имела бы по меньшей мере s+1, а не s положительных
корней.
2. В упорядоченной ненулевой системе действительных чисел
а0, alt . . . , ап (а0 Ф О, ап ф О, п > 1)
может быть четное число перемен лишь в том случае, когда а0 и ап одного
знака. Напротив, нечетное число перемен возможно лишь в том случае,
когда знаки у а0 и ап разные.
3. Обозначим через р число перемен между коэффициентами
уравнения (6). Мы утверждаем, что число положительных корней уравнения (считая
каждый корень столько раз, какова его кратность) может отличаться от р
только на четное число. Действительно, если р — четное число, то согласно
замечанию 2, ап должно иметь тот же знак, что и д<> При достаточно
большом положительном значении х = М знак многочлена, как известно,
совпадает со знаком его старшего члена aQxn\ следовательно, f(0) = an и /(М)
одного знака. Таким образом, мы видим, что в промежутке (О, М),
содержащем все положительные корни рассматриваемого уравнения, лежит четное
число действительных корней.
Если же р нечетно, то согласно замечанию 2 а0 и ап должны иметь
разные знаки; поэтому f(0)=an и/(М) должны иметь разные знаки,
откуда следует, что в промежутке (О, М) должно лежать нечетное число
действительных корней.
Итак, число положительных корней и р должны быть одновременно
либо четными, либо нечетными, т. е. они отличаются друг от друга на четное
число.
Доказательство теоремы Декарта. Для уравнения /(*) =
= До* 4- ах = О первой степени теорема очевидна: его единственный корень
х = — может быть положительным только тогда, когда знаки у а0 и ях
До
разные, т. е. когда коэффициенты а0, ах дают одну перемену.
Проведем доказательство методом индукции: предположим, что теорема
доказана для уравнений степени k < п\ покажем ее справедливость для
уравнений п-й степени.
Обозначим число перемен в уравнении (6) через р. Тогда в ряду
коэффициентов производной
/' (х) = па0хп-1 + (п - \)alXn-2 + . . . + ап_х
будет не более р перемен. Мы можем предположить, что ап_х Ф 0; в
противном случае мы рассмотрели бы многочлен
пахп~2 + (л - \)axxn-z + . .. + 2ап_2,
имеющий те же самые положительные корни, что и производная /' (х);
если бы равнялось нулю и ап_2, то мы рассмотрели бы
па0хп~3 + (п - \)аххп-А + . . . + Зап_3
и т. д.
Итак, пусть ап_х Ф 0. Так как/'(*) многочлен (п — 1)-й степени, то для
него теорема предполагается справедливой; следовательно, f (х) имеет не
более р положительных корней, а потому уравнение (6) в силу замечания 1
имеет не более р + 1 положительных корней. Но в силу замечания 3 число
9J>S
положительных корней уравнения (6) не может быть равно р + 1, так как р
и р + 1—числа разной четности. Таким образом, на основании того же
замечания мы можем заключить, что число положительных корней равно р
или меньше его на четное число.
Предполагая теорему Декарта справедливой для уравнений степени
ниже, чем п, мы показали, что она верна и для уравнений п-й степени. Так
как при этом теорема верна для п = 1, то она верна для любого п > 1.
При помощи теоремы Декарта можно определять не только число
положительных, но и число отрицательных корней уравнения. Рассмотрим,
например, уравнение
f(x) = x* — 2x — 1=0.
В ряду коэффициентов наблюдается только одна перемена.
Следовательно, заданное уравнение имеет всего один (и притом однократный)
положительный корень. Полагаем, далее, х = — у, получим:
<?(у)=у*-2у + \=0.
В последнем уравнении наблюдаются две перемены; поэтому заданное
уравнение имеет два или нуль (ни одного) отрицательных корней.
Задачи. 1. Отделить действительные корни уравнений:
а) ** — 2х2 + х — 5 = 0; б) х* — б*2 — х + 1 = 0.
2. Показать при помощи теоремы Штурма, что уравнение
*3 + рх + Я = 0
Р3 Q2
с действительными коэффициентами при ——\- -1— > 0 имеет один деистви-
р3 а*1
тельный корень, а при ——V-L- <0—три действительных корня.
3. Показать, что многочлен /г-й степени с действительными
коэффициентами и с положительным коэффициентом при старшем члене тогда и только
тогда имеет п действительных корней, когда система функций Штурма
состоит из п + 1 многочленов с положительными старшими членами.
4. При помощи теоремы Декарта определить число положительных и
отрицательных корней уравнений: а) хь — *3 — 1 = 0, б) *4 — 2#3 — 2х2 —
— 5л: — 1=0, в) XI + *з — 1 = 0.
§ 41. Приближенное вычисление действительных корней
Для краткости изложения под словом „корень" будем
подразумевать действительный корень, а под словом „многочлен"
(или „уравнение") мы согласились уже в § 39 подразумевать
многочлен (уравнение) с действительными коэффициентами.
Мы рассмотрим три сравнительно простых способа
приближенного вычисления корней.
Первый способ, обычно называемый способом Горнера—Руф-
фини, был известен еще в 1247 г. китайскому математику Цинь-
Цзю-шао1. Сущность этого способа заключается в следующем.
Обозначим через а0 целую часть искомого корня уравнения
f(x) = 0 (многочлен f(x) может даже иметь кратные множи-
1 См. статью Хуа Ло-кен „Современное положение математики в Китае"
в журнале „Вестник Академии наук СССРЙ, 1953, Jsfs 6.
257
тели). Тогда, полагая х=а0 + — и разлагая f {x)=f[a0-\- — Jno
формуле Тейлора по степеням —, получим уравнение;
/(«. + i)-/W + ifM+...+^^-0,
которое имеет по меньшей мере один корень между 0 и 10.
Умножив далее обе части этого уравнения на 10", получим:
h(x1)=^^^i + ... +10n-7'(«o)^i + 10n/(a0)=0, (l)
гдеМ*1) = Ю'7(до + -^).
Пусть целая часть корня уравнения (1), лежащего между 0
и 10, равна аг. Снова полагаем xi = a1+ — и применяем
к h (xi) = fi (ai + —) формулу Тейлора; получим уравнение:
h(х,) = ^^.4+. . . + 10я"1 f[ (a,) x2+\0nh (ax)=0f
которое имеет по меньшей мере один корень между 0 и 10,
причем f%{x2) = \0nf1(a1-\- — ) и т.д. Вообще на &-м шагу мы
будем иметь уравнение:
где f,K) = 10n^-i(^-i + f)-
Из равенств
/(«o+^)=io-"M*i), л(в1 + ^)=ю-"/,(^.), ....
следует, что
*<.
'l on io loo ' ю*-1 to* '
258
Если продифференцировать обе части равенства (2) по xk, то
получится после сокращения на 10"*:
' I ° 10 100
ю*-1 ю*/ '"{ k>'
(3)
Соотношения (2) и (3) впоследствии нам пригодятся.
Очевидно, что на k-м шагу получится приближенное
значение искомого корня хжа0-\- — + ... +
ля-\
с точностью
10 ю*
до 10" _1); при этом а0 будет целой частью корня, а1—числом
десятых корня, а2—числом сотых корня и т. д.
Вычисление значений многочлена и его производных удобно
проводить по схеме Горнера. Формулу Тейлора разложения
многочлена / (х) по степеням х—а можно записать в виде
f(x)=f(a) + (x-a)9l(x)y
гдеср, (Х)=г(а) + (х-а)СШ+ ... + (х-а)п~1 ^^-.
Отсюда ясно, что f(a) есть остаток от деления f (x) на х—а,
а ?i (х)—частное. В свою очередь,
?iW=/'(fl) + M)ft(4
Ъ С*)
Г" / ч Г'" / \
2!
3!
+ (х-а)
n-2f{n)(a)
и мы видим, что /' (а) есть остаток от деления <р2 (х) на х—а
и ТгС*) —частное. Далее,
<Р2 (л) = ^ + (*-а) ср3 (л),
и мы видим, что
Г (д)
2!
есть остаток отделения <р2(-*) на л:—а
и ср3 (х)—частное и т. д.
В качестве иллюстрации вычислим значение многочлена
f(x) = xA—5х2 + 6х— 8 и всех его производных f'(x),f"(x),
rlV
/ (х), / (л:) при х = 2. Вычисления проводим при помощи
схемы Горнера:
2
2
2
2
~2~
1 0
1 2
1 4
1 6
1 8
т
—5 6
-1 4
7 18
19
—8
0
259
Если читать жирные числа снизу вверх, то получаются
fU?)t /1(2) ) f (2)( /(2)>.
соответственно значения
/1V(2)
/1V(2)
4!
откуда:
Г (2)
31
=8,
4! 3!
./'(2)
2!
= 19, /'(2) = 18, Д2) = 0,
IV ,
/(2) = 0, / (2) = 18, f(2)=38, Г (2) =48f /1V(2) = 24.
Продемонстрируем теперь метод Горнера—Руффини
приближенного вычисления действительных корней на конкретном
примере.
Пример. Рассмотрим уравнение f (х) = хг—2х2—2х—2=0
и вычислим его единственный положительный корень,
лежащий в интервале (2, 3).
Целая часть этого корня равна, очевидно, 2. Таким
образом, полагаем х=2-\—- и разложение
ням -—- проводим по схеме Горнера:
(4)
'(2+т9
по степе-
2
2
2
1 —2 -2 -2
1 0—2—6
1 2 2
1 4
Отсюда получается уравнение:
или в окончательном виде
з
h {xi) =x\ + 40xi + 200^-6000=0.
(5)
Заметим, что уравнение (5) можно было сразу получить путем
умножения жирных чисел 1 ,4, 2 и —6 схемы (4)
соответственно на 1, 10, 100 и 1000.
Уравнение (5) имеет корень между 9 и 101. Следовательно,
1 В этом легко убедиться при помощи испытания: при хх > 0 многочлен
/i (*i) является функцией возрастающей и имеет при х=9 и # = 10
противоположные знаки.
260
а2 = 9. Полагаем ^ = 9 + — и снова ведем дальнейшие
вычисления по схеме Горнера:
9
9
9
~9~
1 40 200 —6000
1 49 641 —231
1 58 1163
1 67
Отсюда, умножив 1, 67, 1163 и —231 соответственно на 1, 10,
100 и 1000, получаем уравнение:
f2 (x2) =х\ + 670х22 +116 300jc2—231 000=0,
имеющее корень между 1 и 2. Следовательно, а2=1. Полагаем
х2=1 + — и продолжаем вычисления по схеме Горнера:
|1 670
1 | 1 671
1 | 1 6/2
1 | 1 673
1 |1
е:
116300
116971
117643
—231000
—114029
Получаем уравнение
/3 (*3) =4+в 730x1+11 764 300jc3—114 029 000 = 0,
корень которого лежит между 9 и 10. Следовательно, а3-9.
Итак, с точностью до 0,001 положительный корень данного
уравнения равен xQz^ 2,919.
При дальнейших вычислениях получаются уравнения с
настолько большими коэффициентами, что метод Руффини —
Горнера становится невыгодным.
Рассмотрим теперь два других способа, позволяющих с
большей быстротой приблизиться к корню. Будем при этом
предполагать, что многочлен / (л:) взаимно прост со своей производной
/' (х); в противном случае мы отделили бы кратные множители.
Способ Ньютона. Пусть уравнение /(л:)=0 имеет
корень х0, лежащий внутри отрезка [a, b], a <х0<Ь, и на этом
отрезке уравнение других корней не имеет. По
предположению многочлен f(x) и его производная Г (х) взаимно просты.
Следовательно, f (х0)ф0. Возьмем отрезок [а, Ь\ столь малым,
чтобы производная /' (х) была отлична от нуля не только
в точке х0, но и на всем отрезке [а, Ь\. Геометрически корню
х0 соответствует точка пересечения С кривой y=f(x) с осью
ОХ (см. черт. 8). Мы можем приблизиться к корню
следующим образом.
261
Проведем через точку A [a,f(a)] касательную к кривой. Она
пересечет ось ОХ в аъ причем
к корню, чем а. Через точку Аг
О
г *
Л
* \
i >
i
i,
а
\ 1 \.
\ \ч*
а* аг \.
л
i
в
Черт. 8
аг будет находиться ближе
\аъ f(ai)\ снова можно
провести касательную, которая
пересечет ось ОХ в а2, еще
ближе к корню, чем alt
и т. д. В результате
получается числовая
последовательность а, аъ а2,
сходящаяся к корню х0.
Найдем, чему равны аъ
а2, ... Угловой
коэффициент касательной в точке
A [a, f(a)) равен /' (а);
пишем уравнение касательной:
y-f(a)=f'(a)(x-a).
Чтобы найти точку пересечения аъ полагаем у=0:
Черт. 9
откуда
ал = а—
f(a)
Г (а)
(6)
Точно так же находим, что
/fa)
а2=а.
v аь = а2-
/(fli)
/' (e«)
и т. д.
Способ Ньютона следует применять, однако, с
осмотрительностью. На чертеже 8 кривая в точке А была обращена
выпуклостью к оси ОХ. Посмотрим, что произойдет в том случае,
когда кривая обращена вогнутостью к оси ОХ в точке А (см.
черт. 9). Если здесь провести касательную в точке Л, то мы
262
не приблизимся, а удалимся от корня: аг отстоит гораздо дальше
от С, чем а. Несколько ниже мы покажем, что если на отрезке
[а, Ь\ не обращается в нуль также и вторая производная Г(х),
то способ Ньютона следует применять к тому из концов а или
Ь, для которого выполняется условие f(x)-f" (x) > 0.
Избавиться от обращения в нуль второй производной можно
следующим образом. Если Г (х0) ^ 0, то отрезок [а, Ь] можно
выбрать настолько малым, чтобы на нем вторая производная
f" (x) была отлична от нуля. Большее затруднение вызывает
тот случай, когда /" (хо) = 0. В этом случае многочлен / (х) и
его вторая производная
имеют х0 общим корнем.
Следовательно, х0 будет
корнем и их наибольшего
общего делителя D(x),
причем любой корень
D(x) будет корнем
самого многочлена / (х).
Таким образом, мы можем
вместо уравнения /(л;)=0
рассматривать уравнение
более низкой степени
D(x) = 0. Если и D" (х0) =
= 0, то рассматриваем
уравнение еще более
низкой степени Д(л;)=0,
где Dx (л:)—наибольший общий делитель D(x) и D" (х),
и т. д., пока не дойдем до уравнения Dk(x)=0, для которого
Прямолинейное интерполирование1. При помощи
геометрических соображений можно вывести еще один
способ приближенного вычисления корней. Обратимся снова к
отрезку [а, Ь\, содержащему искомый корень х09 и проведем
через точки А[а, f (а)\ и В \b, f (b)\ кривой y=f(x) хорду АВ
(см. черт. 10). Она пересечет ось ОХ в Ьъ недалеко от точки
С пересечения кривой с осью ОХ. Если затем провести хорду
АВЪ где Вх—точка с координатами blt f{bx)y то получится еще
более близкое приближение Ь2 к корню и т. д.
Возникает вопрос: как определить значения Ьъ Ь2, . . .?
Тут на помощь приходит аналитическая геометрия. Составляем
уравнение прямой, проходящей через точки А и В:
у—{(а) х — а
О
У
fi
а
С\
\<?2\А
V \ 1 N.
3^
в
9
Черт. 10
f\t>) — l(a)
Ь — а
1 Этот метод называется также способом ложного положения.
263
А теперь, чтобы найти bu полагаем у—О:
— /(а) = Ьх-а
f(b)-f(a) Ь-а '
откуда
Ь^а-Ш^-^. (7)
1 f(b)-{(a) K '
Нетрудно убедиться, что равенство (7) можно также
преобразовать в
_/(6)(6-а)
f(b)-f(a) У }
Формулы (7) и (8) называются формулами прямолинейного
интерполирования. В зависимости от тех или иных обстоятельств
выгоднее пользоваться первой или второй из этих формул.
Остается выяснить, при каких условиях числовые
последовательности, получаемые по способам Ньютона и
прямолинейного интерполирования, сходятся к корню х0. Для этого
обратимся к еще более общему методу итераций. Он заключается
в следующем.
Пусть ср (л;)—действительная (однозначная) функция
действительного переменного х и пусть уравнение х=у(х) имеет на
отрезке [а, Ь\ только один корень х0, а концы отрезка а и b
не являются корнями уравнения. Покажем, что если функция
<р (х) непрерывна на отрезке [а, Ь\, члены числовой
последовательности а0, аа = ср (а0), .. . , а„ = ср (art_i), . . , лежат на том же
отрезке и сама последовательность сходится, то ее пределом
будет х0.
В самом деле,
p = lima =11тсР(ал_1) = ср(Итал_1) = ср(р), а<$<Ь.
П-+ оо П-+ о© П-* оо
Но на отрезке \а, Ь] уравнение х=у(х) имеет только один
корень х0. Следовательно, $ = х0.
Непрерывность функции ср (л:) на отрезке [а, Ь] можно
заменить более слабым условием непрерывности ср (л;) на отрезке
[а, л:0] (или [л:0, &].). Тогда, если члены последовательности а0,
аъ • • • > ап> • • • лежат на отрезке [а, х0] ([х0, Ь\) и
последовательность сходится, то ее пределом будет х0.
Таким образом, метод итераций заключается в том, что
данное уравнение приводят к виду л:=ср (л:), при котором
получается числовая последовательность, сходящаяся к искомому
корню.
Укажем теперь два признака сходимости числовой
последовательности:
1°. Если ср (х) дифференцируема в достаточно малой
окрестности [х0—е, х0 + е], г>0, корня х0 и в этой
окрестности | ср'(л;) |<с< 1, то последовательность а0, ах, .. ., а„,. ..
сходится к х0, когда \Ь—а|<е и а<а0<&.
264
Доказательстве. Применяя к правой части равенства
теорему Лагранжа о конечном приращении, получаем:
<*i—*о = (ао—■*<>) ?'(fj),
где л:0<6<а0 при *0<ао или ао<0<л:о при а0<*0. Так как
б—внутренняя точка отрезка [а,Ь], то |<р'(в)|<с<1 и
\*i—x0\<c\<*0—x0\.
Отсюда следует, что |ах—х0\ < |а0—л:0|, в силу чего ах также
лежит на отрезке [х0—е,л;0 + е] Вообще, пусть а0, аь . . . , ал_1
лежат на отрезке [^0 —e^o +е]- Тогда
\*k'-xo\<c\*b-i—*ol. (* = 1> 2, . . . , /г),
откуда
|а„—Л0|<^|а0—л:0|.
Так как с<1, то отсюда, во-первых, следует, что ал лежит на
отрезке [^0"" е> *о + е1- Во-вторых, при п^со сп-+0 и потому
| <хп—х01 <&, при /*>/V (8), где В — любое наперед заданное
положительное число. Следовательно, 11тал = л;0, что и требовалось
показать.
2°. Если а<а0<л;0 (*0 <а0<&), то последовательность
а0, аь . . ., ая, . . . сходится к корню х0 уравнения л; = ср (х),
когда 1) ср (л:) непрерывна на отрезке [а, л:0] ([л:0,6]) и имеет
положительную производную ср7 (л:) в каждой внутренней
точке этого отрезка; 2) <р (а0) > а0 (? (ао) < ао)-1
Доказательство. Пусть а<а0<л:0, функция ср (х)
непрерывна на отрезке [а, л:0] и имеет положительную производную
ср'(л;) в каждой внутренней точке этого отрезка и <р(а0)>а0,
Тогда из равенства
«i—*oHa<r-*o)<P'(e), ^<°<^o
следует, что ol^Xq, так как а0<л:0 и ср'(Ю>0. Затем из
неравенства а2 = ср (а0) > а0 следует, что *о>а1>ао> т-е- ai"~~
внутренняя точка отрезка [а, х0]. Вообще, пусть a0<«i<. . .
.. . < ал_! < х0. Тогда
ал—х0=- (an_i—х0) ср' (6), а < 6 < х0,
а.п—а^_1 = (ал_1—ал_2) ср' (yj), а<т]<л:0.
1 В условиях 1), 2) в скобках написано то, что соответствует случаю
265
Отсюда получается, что <*п<х0 иа„>аи, так как a„_i<jc0,
0Ln-2<an-i и <р'(£)>0, <р' (у\) > 0. Таким образом, мы имеем
монотонно возрастающую ограниченную сверху числом х0
последовательность а0 < ах < . . . < ссп < . . . < х0. Эта
последовательность сходится, а именно сходится к х0.
Аналогично рассуждаем и в том случае, когда х0 < а0 < Ь.
Здесь последовательность будет монотонно убывать.
Вернемся к способам Ньютона и прямолинейного
интерполирования. Мы будем предполагать, что относительно корня
многочлена f(x) имеют место те же ограничения, что и выше,
а именно: на отрезке fa, b] (a < b) содержится только один
корень х0, не совпадающий с концами а и Ь> многочлен / (л:)
взаимно прост со своей производной /' (х) и производная /' (х)
не обращается в нуль на отрезке [а, Ь].
Способ Ньютона можно рассматривать как частный случай
/ (х)
метода итераций, когда у(х) = х— ±—-. Легко видеть, что
/ \Х)
Y V ' [/'(*)]2
Пусть, кроме того, на отрезке [a, b] вторая производная отлична
от нуля. Так как на том же отрезке f (x) сохраняет один и тот же
знак, то многочлен / (л:) на отрезке [а, Ь] либо монотонно
возрастает, меняя знак с минуса на плюс при переходе х через
корень х0, либо монотонно убывает, меняя знак с плюса на
минус при переходе х через х0. Следовательно, произведение
f{*)'f"(x) B полуинтервале [а, л:0) будет сохранять один знак,
а в полуинтервале (л:0, Ь]—другой знак. Пусть для
определенности f(x)f"(x)>0 на полуинтервале [а, х0). Тогда <р'(лг)
будет положительна на том же самом полуинтервале. Если теперь
а) f (х) положительна на полуинтервале [а, л:0), то f(x) будет
убывать на отрезке [a, b] и потому производная /' (х) будет
на этом отрезке отрицательна. Отсюда получается, что
?{х)=Х+Ш)\' (a<x<xo)> (9)
в силу чего cp(a)>a. Если же б) f(x) отрицательна на
полуинтервале [а, х0), то f (x) будет возрастать на отрезке [а, &],
в силу чего производная f (x) будет на этом отрезке
положительна, и мы снова получаем равенство (9) и снова <p(a)>a.
Таким образом, в случаях а) и б) сходимость процесса
обеспечена: получается монотонно возрастающая числовая
последовательность aa=a, ab . . . , ая, . . . , сходящаяся к корню х0.
Аналогично, когда f(x)f"(x)>0 в полуинтервале (х0, Ь],
получается монотонно убывающая числовая
последовательность а0 = &, аь . . ., ал, . . . , сходящаяся к корню х0.
266
Итак, если вторая производная f"(x) не обращается в нуль
на отрезке [a, Ь]ч то для обеспечения сходимости следует
начать применять способ Ньютона с того конца а или Ь,
для которого f(x)f"(x)>0. При этом получается
монотонно возрастающая или монотонно убывающая числовая
последовательность в зависимости от того, к какому концу
а или b применяется способ Ньютона.
Впрочем, сходимость числовой последовательности,
получаемой по способу Ньютона, можно обеспечить и другими
условиями, а именно: в силу непрерывности многочлена f (х)
можно сделать абсолютную величину |/(*)| на отрезке
[х0 — е, х0 + £] сколь угодно малой при достаточно малом
е > 0. Следовательно, можно взять отрезок таким, чтобы на
нем | <p'(*) | <с<\. Тогда независимо от того, к какому концу
а или & применяется способ Ньютона, получается при b — a<s
числовая последовательность, сходящаяся к корню х0.
Предположим снова, что вторая производная f" (х) не
обращается в нуль на отрезке [а, Ь]. Тогда прямолин* иное
интерполирование можно рассматривать также как частный
случай метода итераций с функцией <р (х), равной
_ f{x) {х-а) или „__J(x\(b-x)
f(x)-f(a) /(&)-/<*)
в зависимости от того, является ли f(x)-f"(x)>0 на
полуинтервале [а, х0) или на полуинтервале (л:0, Ь].
Ограничимся случаем, когда f(x) Г (*)>0 на полуинтервале
(л:0, Ь]. Случай f(x)f"(x)>0 на полуинтервале [а, л:0)
исследуется аналогично. Прежде всего найдем производную от
rv > f(b)-f(x)
предполагая х лежащим в [а, х0). Без труда получаем, что
, / ч = / (Ь) U (6) - f (х\\ - f f 61 f (х) (6 - х)
'1/<*)-/(*)Р
Применяем теорему Лагранжа о конечном приращении:
,(JC), т\гт-гмиь-х) &<
Еще раз применяем теорему Лагранжа:
,(jc)gg 1(Ь)Г(«МЬ-Хмъ-Х) х<ь<ь<Ья
Так как по условию !(х)Г(х)>0 на полуинтервале (jc0, &],
то f(b)r(®i) > 0- Затем, очевидно,
Ь-х>0, в-*>0, [f{b)-f (*)]2>0.
Следовательно, у'(х)>0 на полуинтервале [а, х0).
267
Наконец, если f (х) отрицательно на полуинтервале [а, х0)>
то f (b) положительно. Отсюда f (b)—f (x) также положительно,,
и мы можем написать, что
А если / (х) положительно на полуинтервале [я, х0), то / (Ь) будет
отрицательно, в силу чего будет отрицательным и f(b)—f(x),
и снова получается равенство (10). Поэтому ср (а) > а. Мы видим,
что все требования признака 2° сходимости метода итераций
соблюдены. При этом получается приближение к корню с
другой стороны, чем по способу Ньютона.
Итак, если вторая производная f" {x) не обращается в нуль
на отрезке [а, Ь\ и способ Ньютона применяется к тому
из концов а или Ь, для которого удовлетворяется условие
f(x)-f"(x)>0, то приближение
a- »flXM ,
f(b)-f(a)
получаемое при помощи прямолинейного интерполирования,
лежит по другую сторону от корня, нежели приближение,
полученное по способу Ньютона.
Следовательно, комбинируя прямолинейное
интерполирование и способ Ньютона, мы при соблюдении вышеупомянутых
условий будем приближаться к корню с двух сторон. На
практике как раз и рекомендуется комбинировать оба эти способа,
причем для ускорения сходимости полезно предварительно
вычислить корень при помощи способа Горнера — Руффини с
точностью до 0,01 и даже до 0,001.
Пример. Рассмотрим снова уравнение
/ (х) = jc3—2*2-2jc-2 = 0.
Мы выше нашли, что положительный корень этого уравнения
равен 2,919 с точностью до 0,001, причем
/з (*3) = .4+6730*2+11764300*3-114029000=0.
Так как 2,919 есть приближение с недостатком, то корень
лежит в интервале (2,919; 2,920). Очевидно, что 2,919 и 2,920
не являются корнями многочлена f(x). Затем, многочлен f (х) =
= хд—2х2—2х—2 и его первая производная /' (х)=3х2—4х—2
взаимно просты, причем /' (х) не обращается в нуль на отрезке
[2,919; 2,920], так как ее единственный положительный'корень
меньше 2. Вторая производная f"(x) = 6x—4 обращается в нуль
при х=—. Следовательно, она не обращается в нуль на
отрезке [2,919; 2,920]. Далее легко заметить, что f (х) при
переходе х через корень меняет знак с минуса на плюс. Отсюда
268
Д2,919)<0 и f (2,920)>0. Так как /" (*)>0 при jc> -, то /" (х)
О
на отрезке [2,919; 2,920] положительна, и способ Ньютона
следует применять к концу 2,920.
Значения /(2,919), /(2,920) и /' (2,920) удобно находить при
помощи соотношений (2) и (3), а именно: согласно
равенствам (2) и (3)
/(2,919) = 10-9/3(9), / (2,920) = 10"9/3( 10), /' (2,920) = Ю~%( 10).
Находим /3 (9), /; (9), Ш., ll^L по схеме Горнера:
2! 3! г г
| 1 6730 11764300 -114029000
9 1 I 6739 11824951 -7604441
.9 I 1 6748 11885683
9 | 1 6757
9| 1
Отсюда получается, что
/3 (Ю) = -76044414-11885683+6757+1 =4286000,
/з(Ю)=/з(9)+/з(9) + -^-=11885683+2-6757+3-1 = 11899200
и
/(2,919) = 10~9-М9) = -0,007604441,
/(2,920) = 10-9-/з(Ю)=0,004288000,
М2,920) = 10_6-/з(Ю) = 11,899200.
Теперь применяем способ Ньютона к концу 6=2,920:
ft|=^J№L =2i920--^5^^*2,9196396.
f'(b) 11,8992
Затем применяем прямолинейное интерполирование:
_ НЬПЬ-с^ 0_ ,0,004288 ^2>9196395.
f(b)—f(a) 11,892441
Числа ах и Ьх отличаются лишь седьмым знаком после запятой.
Следовательно, лг0*2,919639 с точностью до 0,0000014
Задачи. 1. Вычислить с точностью до 0,001 положительный корень
уравнения *3 — 2х—5=0, пользуясь методом Горнера — Руффини.
2. Комбинируя способы Ньютона и прямолинейного интерполирования,
вычислить корни уравнения хъ—9#+6=0 с четырьмя верными знаками после
запятой.
1 Столь большая точность вычисления корня проведена нами для того,
чтобы читатель видел, насколько ускоряют процесс сходимости способы
Ньютона и прямолинейного интерполирования.
269
Глава седьмая
МНОГОЧЛЕНЫ ОТ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ
§ 42. Кольцо многочленов от нескольких неизвестных
Понятие многочлена от нескольких неизвестных вводится
примерно так же, как и понятие многочлена от одного
неизвестного.
Пусть Я—некоторое числовое поле. Элементы поля Р мы
будем обозначать начальными малыми или большими буквами
латинского алфавита.
Многочленом ОТ X-±f X2l • • • »
хп над полем Р мы назовем
выражение
vw ...■#+...+ а,*;><* . ■. <", (s > о, (о
в котором коэффициенты Аи Л2, . . . , As являются числами
из Я, а, р, . . . , со —целыми неотрицательными числами и
a;°(v = 1, 2, . . . , п) принимается равным единице. При этом
A xfal* . . . Xх" называется кленом выражения (1) и
предполагается, что в выражении (1) подобных членов нет1. Кроме
того, предполагается, что коэффициент, равный единице, можно
опустить в записи члена: l*****8 . . . ххпп = x]lxx2* . . . ххпп, и что
можно также опустить х°ч. В частности, если в члене
VW • • • х«а
все показатели xlf х2, . . . , хл равны нулю, то можно все
х*1, хх22, . . . , хх* опустить и сохранить лишь один
коэффициент Ak.
Например,
1 . **2 г° г3 **0 — г2 г3 9 jrG jr° r° r° = 2
v-0 v-0 v-0 v-0 _ 1
ЛГ2 3 4~ '
1 Т. е. нет членов, отличающихся друг от друга только коэффициентами.
270
Как и в случае многочлена от одного неизвестного,
выражения хы, х], . . . , а также Ахх\^ . . . х*пп, . . . , Asx"*x*2.. ,
О) .
. . . хпп и знак + рассматриваются здесь как символы с
некоторыми формальными правилами действия над ними (например,
приравнивание x°v единице, выбрасывание в члене л;°). В связи
с этим хъ . . . , хп называются неизвестными. В дальнейшем,
после введения понятий равенства, суммы и произведения
многочленов от нескольких неизвестных, символы AkxX{xx22 . . . ххпп
совпадут с произведением степеней неизвестных, взятым с
числовым коэффициентом Ak, а само выражение (1) можно будет
рассматривать как сумму различных (т. е. не подобных)
членов вида Акх\*хх£ . . . ххпл
Само число а из поля Р мы будем рассматривать как
многочлен от лгр л2, . . . , хп, а именно как многочлен axf*x% . . .
. . . х°п. Более того, выражения ах^х^2 . . . х1Хпп, где \iv (x2,
. . ., рп—-целые неотрицательные числа, и, в частности,
неизвестные хи х2, . -. . , хп можно рассматривать также как
многочлены от х1у . . . , хп над Р.
Для сокращения письма мы будем многочлен от
неизвестных хъ х2, . . . , хп обозначать через f(xu х2у . . . , хп),
g(xly х2, .. ., хп), к(хъ х2, . . . , хп), . . ., а иногда даже
через /, g, Л, ...
Может случиться, что некоторые неизвестные будут
входить в каждый член многочлена f (хъ . . . , хп) с нулевыми
показателями, и тогда / (хъ . . . , хп) можно рассматривать как
многочлен уже не от п, а от меньшего количества
неизвестных.
Например,
/ —— ZX-, Хп "| X* ЛлЛо ~\ ОХ л Х(гХп
можно рассматривать не только как многочлен от трех
неизвестных хъ х2у х3, но и как многочлен от двух неизвестных
х2 и х$;
I = 2Х<2 ~\~ ХпХ^ -\~ ЭХпХ^.
Введем теперь понятия равенства, суммы и произведения
двух многочленов от х1у . . . , хп над полем Я.
Два многочлена f(xlt . . . , хп) и g(xlt . . . , хп) над Р мы
считаем равными (тождественно равными), если f(xu ... , хп)
состоит из тех же членов, что и g(xlt . . . , хп), кроме
членов с коэффициентами, равными нулю (если только такие
члены имеются).
Например, многочлены
Х{Х% -\- ХуХ*±Х$ -(-О И O'XiX^X^ 4" 5 т" ЛГ^ЛГ^ЛГд -\- Х\Х2
271
равны, а
f=3xixl + х^х2хъ и g=3xlxl-\-2xix2x9
не ра^ны, так как / содержит х^2хв с коэффициентом, равным
единице, а не двум.
В частности, многочлен f(xu . . . , хп) считается равным
нулю, если все его коэффициенты Аи . . ., As равны нулю.
Таким образом, если многочлен не равен нулю, то по
меньшей мере один из его коэффициентов должен быть отличен
от нуля.
Из этого определения равенства многочленов от
нескольких неизвестных вытекает, что мы можем члены многочлена
писать в любом порядке следования, так как два многочлена,
отличающиеся лишь расположением членов, но не самими
членами, равны.
Под суммой f(xlf . . . , хп) + g(xu . . . , хп) двух
произвольных многочленов f(xu . . . , хп) и g(xlf . . . , х„) над Р
мы будем подразумевать такой многочлен, который получится,
если приписать к / (хи .. . , хп) со знаками + члены g{xu ...
. . . , хп) и затем произвести приведение подобных членов К
Произведение многочленов f(xu . . . , хп) и g(xu . . . , хп)
вводится следующим образом. Сначала определяем
произведение одночленных выражений Ах^х]2 . . . х* и Вх\^х\2 . . . лу*,
а именно полагаем:
(Ах\%2 . . . **)(Вх\*х\* . . . х^АВх^х^2 . . . хУ\ (2)
А теперь условимся под произведением f (хъ . . . , хп) X
Х£(*ь •••> хп) понимать такой многочлен, который
получается после умножения по правилу (2) каждого члена
многочлена / (хи . . . , хп) на каждый член многочлена g (хи .. .
... , хп) и приведения образовавшихся при этом подобных
членов.
Обозначим множество всех многочленов от лгь . . . , хп
над Р через P[xit .. . , хп]. Очевидно, что, складывая или
перемножая два многочлена из Р [хи . . . , хп], мы получаем
однозначно многочлен из того же множества Р[хи ..., хп].
Следовательно, сложение и умножение многочленов из
Р [хи . . . , хп] являются алгебраическими операциями,
определенными в Р[хи . . . , хп]. Эти операции, в частности,
совпадают с арифметическими действиями сложения и умножения
чисел, когда многочлены являются числами поля Р. Но мы
*Т. е. мы складываем коэффициенты Ли и В, подобных членов А ,^,л
к l k 1 'v2
...Xх" и В х%хх^. .. х*п и вместо этих членов пишем только один член
272
покажем и нечто большее, а именно докажем следующую
теорему.
Теорема 1. Множество Р[хи . . . , хп] образует
коммутативное кольцо относительно введенных операций
сложения и умножения многочленов.
Доказательство. Нам в сущности надо показать, что
эти алгебраические операции подчиняются коммутативному,
ассоциативному и дистрибутивному законам и что в Р [хи ... , хп]
выполнима обратная операция—вычитание многочленов.
Возьмем из Р\хи . . . , хп\ два каких-нибудь многочлена /
и g. Добавляя в случае необходимости члены с
коэффициентами, равными нулю, мы всегда можем добиться того, чтобы
каждый член одного многочлена был подобен некоторому
члену другого многочлена1. Таким образом, fug можно
записать в виде
g= v№ ...х-пп+ ... +вх;>х;>... ху.
Отсюда получается, что
f + g-(Ax + В,) jQjQ . . . ** + . . . + {As + Bs) *?*?... <*,
g + f = (B1 + A,) jQjQ . . . *% + ... + [В, + As) jQj<* ... <« =
так как сложение чисел поля Р подчиняется коммутативному
закону. Мы видим, что
f+g=g+U
т. е. сложение многочленов из Р[хи ..., хп] подчиняется
коммутативному закону.
При умножении / на g мы должны каждый член Акх\хх£ ...
, . . ххпп многочлена / умножить на каждый член В^х^ ... х£
многочлена g по правилу (2):
(VJu? . . . хЩВ^х^ . . . xtf-AJJrfbjq+b . . . ^„+4
Но тот же результат получится, если каждый член g
умножать на каждый член /:
(Brfx* . . . *J-)(V№ . . . <«) = ВД^+'и^. .. . *VK =
=AkBtx]^x2^ . . . хУ\
1 При добавлении членов с нулевыми коэффициентами в сумме и в
произведении многочленов появятся дополнительные члены с коэффициентами,
также равными нулю. Согласно определению равенства многочленов сумма
и произведение от этого измениться не может.
273
Следовательно, fg=gf, т. е. умножение многочленов из
P[*i, .. . , хп] также подчиняется коммутативному закону.
Возьмем теперь из Р \х19 . . ., хп] произвольный третий
многочлен А. Его также можно записать в виде
А-С^л? ...<"+...+ Crfx? . . . <«.
Предоставляем читателю составить суммы (f + g)+huf+(gJ{-h)
и, пользуясь ассоциативностью сложения чисел, убедиться, что
эти суммы равны, т. е. что сложение многочленов из
Р [хи . . . , хп] подчиняется ассоциативному закону.
Затем легко видеть, пользуясь правилом (2) и
ассоциативностью умножения чисел, что
[(V№ • • • К") (ад«? • • • •*;«)] («'42 • • • •<")=
= (AkxW . . . xj) \(В&% . . . К")(Ст^4> • • • <")].
в силу чего {fg)h=f (gh), т. е. и умножение многочленов из
Р [*i, . . ., хп\ подчиняется ассоциативному закону.
Пользуясь правилом (2) и дистрибутивным законом
сложения и умножения чисел, получаем:
^(А^ + А^х^х^ . . . хУ\
Мы видим, что член
получается в результате приведения подобных членов
AkBfy^ . . . ху*п и AkClx^ . . . *VH„,
которые образовались при перемножении / на g и / на Л. Тем
самым становится очевидным справедливость равенства
т. е. для многочленов из Р[хи . . ., хп] верен
дистрибутивный закон.
Наконец, покажем, что во множестве Р\хи . . . , хп\
выполнима обратная операция—вычитание, а именно: в Р [хи . . .
• • • * ХЛ уравнение f + z=g всегда разрешимо.
274
В самом деле, нетрудно проверить, что решением этого
уравнения является многочлен
*-(*i-^,)*W .••<•+ ••• +{В-А.)№ ••■<"■
Теорема доказана.
Теперь можно сделать следующие выводы:
1. Так как сложение многочленов из Р[х{, . . . , хп]
подчиняется коммутативному и ассоциативному законам, то
многочлен / над полем Р можно рассматривать как сумму его
членов, причем члены можно писать в любом порядке.
2. Так как умножение многочленов из P[xlt . . . , хп]
подчиняется ассоциативному закону, то символы х2ы, х^у ... можно
рассматривать как степени неизвестного хы, причем ха^х\ = х*^ и
Каждый член Акхх^£* . . . ххпп многочлена / можно
рассматривать как произведение степеней х\лхг2* . . . л;*" неизвестных,
взятое с числовым коэффициентом Ak из поля Р, причем Ak
можно писать не только слева, но и справа в силу коммута-
тивнести умножения.
3. Уравнение f + z=g9 где fug произвольные многочлены
из Я[^, ..., хп] имеет единственное решение. Это
решение обозначается через g—f и называется разностью
многочленов g и /. В частности,
/-/=0, 0-/=-/,
где роль нулевого элемента 0 кольца Р[хи . . . , хп\ играет
многочлен, равный нулю, а—/ означает многочлен,
противоположный /, т. е. такой многочлен, сумма которого с
многочленом / равна нулю. Очевидно, что если
f-A&jQ ...<-+...+ Arfj? . . . ху,
ТО
-/=(-л1)<^ ..-<"+...+ (-АК«? • • • <"•
В дальнейшем мы будем множество Р\хи . . . , хп]
называть кольцом многочленов от хъ . . . , хп над полем А
Введем далее понятие степени многочлена от нескольких
неизвестных.
Пусть / многочлен из Р [хи . . . , хп\> отличный от нуля.
По меньшей мере один из его коэффициентов должен быть не
равен нулю. Мы будем предполагать, что все коэффициенты /
не равны нулю; в противном случае мы опустили бы члены с
нулевыми коэффициентами. Степенью многочлена / по
отношению к неизвестному х^ называется наибольший показатель,
275
с которым х^ входит в члены многочлена. Например, степень
многочлена
Ъххх2 + Ъх\х\ + Ъххх2—1х\
над полем рациональных чисел относительно хг равна двум,
а относительно х2 равна трем.
Если в многочлен / неизвестное xs фактически не входит,
то степень / относительно этого неизвестного xs будет,
очевидно, равна нулю.
Назовем степенью члена Акхх^х^ . . . хп многочлена \ ф О
сумму показателей *i + x2 + ... + *„ неизвестных. Тогда
степенью многочлена f (по отношению ко всей совокупности
неизвестных) называется наибольшая из степеней его членов.
Так, например, степень многочлена
х\х2 + Ъххх2хъ + Ъх\х1~- Ъхх + 7
равна пяти.
Нуль будет единственным многочленом от неизвестных
xlf • • • » хт не имеющим никакой степени, а числа поля Р,
отличные от нуля, будут многочленами нулевой степени от
тех же неизвестных. В этом отношении мы имеем для
многочленов от нескольких неизвестных то же утверждение, что и
для многочленов от одного неизвестного. Однако, в отличие
от многочленов от одного неизвестного у многочленов от
нескольких неизвестных уже нельзя располагать члены по
убывающим или возрастающим степеням, нельзя говорить о
старшем члене, так как в многочлене / Ф О могут встречаться
несколько членов наибольшей степени, а в некоторых случаях
и все члены могут быть одной и той же степени. Например,
степень многочлена
ххх2хъ + 2х\х2 + Ъх\ + 7х2 + 6
равна трем и в этом многочлене имеются два члена со
степенью, равной трем. В многочлене
Х\ + Х\ + Х\ + 5*1*2 + Х2Х3
все члены имеют вторую степень.
Многочлен / Ф О из Р[хъ . . . , хп] принято называть
однородным многочленом или формой т-й степени, если все его
члены имеют одну и ту же степень т. В частости, форма
первой степени называется линейной, второй
степени—квадратичной, третьей степени—кубичной.
Тем не менее существует вполне определенный способ
расположения членов многочлена от нескольких неизвестных.
Он заключается в следующем.
276
Возьмем снова из Р [хъ . . . , хп] произвольный
многочлен /, отличный от нуля. Условимся считать из двух членов
многочлена / тот выше, у которого больше показатель при хи
а из двух членов с одинаковыми показателями при хг тот, у
которого больше показатель при хъ и т. д. Иными словами, член
Akx\*x2* ...x*nn
будет выше члена
А х*^х*^ х*п
тогда и только тогда, когда первая неисчезающая разность
*у—Vy положительна.
Так, из двух членов х\х\ и х\х\хъхА второй выше первого.
Напишем впереди высший член многочлена /, затем
следующий по высоте член и т. д. Мы получим тогда так
называемое лексикографическое расположение членов.
Пример. Расположить лексикографически члены
многочлена
Здесь высшим членом является х\хА, затем пойдут ххх2,
х\хА и х\хъх^. Таким образом,
/ == Х^Х^ -р Х^Х2 | *^2 4 ■" 2 3 4*
Обращаем внимание на то, что лексикографическое
расположение членов многочлена зависит от нумерации
неизвестных—при другой нумерации неизвестных может получиться и
другое лексикографическое расположение.
Большую помощь нам окажет следующая лемма.
Лемма. Высший член произведения fg двух многочленов
f фО и g Ф О из Р \хи . . . , хп] равен произведению высших
кленов этих многочленов.
Доказательство. Для я=1, т. е. для многочленов от
одного неизвестного, лемма очевидна. В этом случае высший
член совпадает со старшим членом, а старший член
произведения многочленов равен произведению старших членов этих
многочленов.
Таким образом, мы можем воспользоваться методом
математической индукции; предположим, что лемма верна для
многочленов от п—1 неизвестных и покажем, что тогда она верна
и для многочленов от п неизвестных.
Пусть
AjQx? . . . х*п (3)
высший член многочлена / из Р[хи . . . , хп] и
ВхУ22 • • • -# (4)
277
высший член многочлена g из Р[хи . . . , хп]. Сгруппируем
члены / и g по убывающим степеням хх\ тогда мы можем
написать, что
/ = a, [xv . . . , хп) х* + а, (х2, . . . , хп) х^1 +
+ ... +аах{х2% . .., хп)у'
g=b0 [х2% ...,хп) *?' + Ьх [х2% .. . , хп) х^-1 +
+ . . . + \ (*2, . . . , хя),
где
я0 С*2. • .. , ■*„) ^ 0, аг (х2, . . . , лгя), . . . , д., (л;2, . . . , лг„)
и
&о (*2, . . . , хп) Ф 0, Ьг (х29 . . . , .*„), . . . , &Р|(*2, . . . , лгя)
—многочлены от /г—1 неизвестных хъ . . . , хп над полем Р.
Легко видеть, что Ах\2х^ . . . лу*—высший член a^[xv ... , х-п)
а Вх\гх^ . . . л:^—высший член Ь0(х2, . . . , хя). В самом деле,
если бы, например, Сх]2х]* . . . *лл был высшим членом а0(х2,...
. . . , хп), то Сл;*^2 . . . х\п было бы членом / более высоким
чем член (3), что невозможно.
Перемножая многочлены fug, получаем:
fe=M*2' • • • ' **)M*2> • • • > хп)х?^1 +
+ [а0(х2, . . . , xn)b1(x2f ...,*„) +
+ ах (х2у . . . , хп) Ь0 (х2, . . . , хп)\ х\^1'1 + . . . +
Мы допустили, что лемма верна для многочленов от п—\
неизвестных. -Следовательно, высший член (2q {х2, . . . , хп) X
X ^о (-^2, • • • у хп) равен произведению высших членов
многочленов а0(х2, . . . , хп) и &0(^2, • • • * хп), т. е. он равен
[Ax\*j% . . . <") (В4'$ • • • *fy
Отсюда получается, что высший член fg должен равняться
(Axl*xl* . . . хлпЦв^43 ■ ■ ■ <n)41+h =
-(AjQjQ . . . *&)(В№ . . . ty
т. е. должен равняться произведению высших членов (3) и (4)
многочленов fug.
Итак, предполагая лемму справедливой для п— 1
неизвестных мы убедились, что лемма верна и для п неизвестных.
Так как лемма верна для одного неизвестного, то тем самым
лемма полностью доказана.
278
Только что доказанную лемму можно, очевидно,
распространить и на любое число сомножителей.
Теперь мы можем без труда убедиться, что кольцо
многочленов P[xv . . . , хп], есть кольцо без делителей нуля.
Действительно, пусть / и g—два произвольных многочлена
из Р[хи , , . , хп\, отличные от нуля, и Ах^х^ . . .
л:^—высший член /, а Вх\*х\2 . . . х^пп—высший член g. Тогда по
доказанной лемме высшим членом произведения fg будет
АВх^+^х^2 . . . л£я+Ч причем его коэффициент АВ будет
отличен от нуля, так как А Ф О, В ФО. Следовательно, fg Ф О,
что и требовалось показать.
Относительно степени произведения двух многочленов от
нескольких неизвестных имеет место точно такая же теорема,
что и для многочленов от одного неизвестного, а именно:
Степень произведения двух многочленов f и g из Р \хъ
..., хп\ равна сумме степеней этих многочленов.
Доказательство. Пусть т—степень многочлена / и /—
степень многочлена g. Группируя в / члены степени т и в g—
члены степени /, получаем:
где ср и ф— формы соответственно степени т и /, а fu gx —
многочлены т Р[хи ..., хп]. При этом /х может равняться
нулю; но если /2 Ф 0, то степень /2 меньше т. Аналогично,
степень gx меньше /, когда gx Ф 0. Перемножая / и g\ находим,
что
fg=<?ty + <?gi + №+figi.
Очевидно, что степени членов произведений <?glt /2ф и ftgt не
могут превосходить m + 1—l. Что касается членов
произведения срф, то их степень равна т + /, если только срф отлично
от нуля. Но ср ф 0 и ф ф 0. Следовательно, так как Р [хъ
• ••> хп]—кольцо без делителей нуля, то иу^фО. Таким
образом, мы видим, что степень fg равна т + /, что и требовалось
показать.
Эту теорему можно распространить и на произведение
нескольких многочленов: степень произведения нескольких
многочленов из Р [хъ ..., хп] равна сумме степеней
многочленов—сомножителей .
Понятие значения многочлена от нескольких неизвестных
вводится совершенно так же, как и в случае многочлена от
одного неизвестного. Именно, пусть f(xu ...,
хп)—произвольный многочлен из P[xlt ..., хп\. Заменим в нем неизвестные
xv ..., хп какими-нибудь числами си ..., сп поля Р. Мы получим
тогда некоторое число d того же поля Р. Это число d и
называется значением многочлена f (xl9 ..., хп) при значениях
неизвестных xx = cv ..., хп=сп и обозначается через f{cv ..., сп) .
279
Очевидно, что если два многочлена из P[xv ..., хп] равны,
то их значения также равны при любых значениях неизвестных.1
Оказывается, что в кольце многочленов P[xv ..., хп] над
числовым полем Р верно и обратное. Чтобы в этом убедиться,
докажем сначала следующую теорему.
Теорема 2. Если многочлен f(xv ..., хп) над полем Р
обращается в нуль при любых значениях неизвестных,
взятых из некоторого бесконечного подмножества М чисел
поля Р, то многочлен f(xv ..., хп) равен нулю.
Доказательство. Для одного неизвестного (т. е. при п = 1)
теорема очевидна: в этом случае мы имеем многочлен от одного
неизвестного, и он может обращаться в нуль при бесконечном
множестве значений неизвестного только тогда, когда он сам
равен нулю*
Воспользуемся теперь методом математической индукции:
предположим, что теорема верна для п—1 неизвестных, и
покажем, что теорема будет верна и для случая п неизвестных.
Многочлен / (х1у ..., хп) можно записать в виде
/ =а0 (xv . . . , хп_х) х*+ a, (xv . . . , хп_х) х^ +
+ • • • + ak(xv . . . , хп_г)9
где at(xu . . . , хп_х)—многочлены от п—\ неизвестных хъ
• • > хп_х над Р. Дадим неизвестным xv . . . , хп_х
произвольные значения cv . . . , сп_1 из множества N1. Тогда мы
получим многочлен уже от одного неизвестного над полем Р
+ *k(cv • • ->cn-i)- (5)
Так как f(xu . . . , xn) равен нулю при любых значениях
неизвестных из множества Л/, то многочлен (5) будет равен
нулю при любом значении хПУ взятом из М. Отсюда в силу
того, что теорема верна для многочленов от одного
неизвестного над Р, получаем, что многочлен (5) равен нулю, т. е.
что все его коэффициенты равны нулю:
0О(^ • • •> cn-i) = °> aAcv • • -.*„_i)=0, • • .,
ak(cv . . ., ^_1)=0. (6)
Равенства (6) свидетельствуют о том, что многочлены aL(xu
• • •» хп-\) от п~~~^ неизвестных xv . . . , хп_х над Р обра-
1 Можно, впрочем, говорить и о значениях многочлена/при значениях
неизвестных, взятых из расширения Р' поля Р, так как / можно рассматривать
и как многочлен над Р\
280
щаются в нуль при любых значениях неизвестных из М. Но,
по предположению, теорема верна для многочленов от /г—1
неизвестных. Следовательно,
<*o(xv • • • . *„_i)=0, (h(xv . . . , хя_г) = 09 . . .,
ak(xv . . ., хп_г)=0,
в силу чего и многочлен f (хи . . . , хп) равен нулю.
Отметим, что подмножество М может, в частности,
совпадать и со всем полем Р.
Из только что доказанной теоремы легко получается
Теорема 3. Если значения двух многочленов f(xlt ..., хп)
и g(xi> • • •> хп) на-д Р совпадают при любых значениях не-
известных, взятых из некоторого бесконечного
подмножества М чисел поля Р, то многочлены f (хи ..., хп) и g (хъ
• • • > хп) равны.
Доказательство. Рассмотрим разность f(xu ..., хп) —
—g(xi> • • • 1 хп)- Она обращается в нуль при любых
значениях неизвестных из множества М и потому на основании
предыдущей теоремы должна равняться нулю:
/0*1. • • • , Xn)—g(Xl9 • • • > Хп)=0,
откуда f(xl9 . . . , xn)=g(xu . . . , хп).
При помощи примерно тех же соображений, что и для
случая многочлена от одного неизвестного, можно показать,
что если
f(xu . . ., xa) + g(xl9 . . ., xn) = h(xlf . . .,*„),
f (xi, . . . , xn)g(xl9 . . . , xn)=k(xu . . . , xn),
TO
f(Ci, . . .,cn) + g(cu . . .,cn) = h(cu . . . , cn),
f(cl9 . . .,cn)g(cl9 . . .9cn)=*k(cl9 . . . , cn)
при 'произвольных значениях хг = си ..., хп=сп неизвестных.
Отметим в заключение, что для многочленов от
нескольких неизвестных над числовым полем Р можно развить
теорию делимости, сходную с теорией делимости многочленов
от одного неизвестного. Но это уже выходит за рамки нашей
книги.
§ 43. Симметрические многочлены
Мы рассмотрим здесь один важный класс многочленов от
нескольких неизвестных, так называемые симметрические
многочлены.
Симметрическим многочленом над числовым полей Р
принято называть такой многочлен / (хХ9 ..., хп) от п неизвестных
281
над Я, который не меняется при любой перестановке неизве-
СТНЫХ х\у Х2у . . . , Хп.
Например, многочлен
/ (Xlt Х2, Хв) = Х\Х2 ~\- Х1Х2~\- х\хг Ч~ Х1ХЪ + х2хз Ч~ Х2Х% 0)
является симметрическим; легко убедиться, что он не
меняется при любой перестановке неизвестных:
J \ХЪ х2у x2)—i(xs, хъ xi)=l \х2> хъ -^з)=/ \х2> xs> xi)=
— f\Xly Х2у Х2)=1\ХЪу ХЪ Х2)'
Возьмем хотя бы
/ (л:3, х2, х1)=ХгХ2 + хъХъ + х^хг + Х%Х\ -f- х^хх + х2Х\. (2)
Для получения выражения f (хъ хъ хг) мы в выражении (1)
многочлена / (хъ х2, л;3) неизвестное хг заменили через л:3, х2
оставили без изменения, a xs заменили через хг. Сравнивая
выражения (1) и (2), видим, что они отличаются друг от друга
лишь порядком следования членов и порядком следования
сомножителей в каждом члене. Следовательно, / (л;3, х2у хг) =
—/ (хъ х2> хз)-
Впервые приходится сталкиваться с симметрическими
многочленами при решении следующей задачи: пусть дано
уравнение /г-й степени над полем Р
хп + а1хп~1 + ...+ап=0 (3)
со старшим коэффициентом, равным единице. Выразить
коэффициенты aL уравнения через корни Еь £2> • ••> Ея.
Но мы уже знаем (см. § 33), что коэффициенты
уравнения (3) должны выражаться через корни по формулам Виета,
а именно:
ai = -(5iHH2 + ... + U, ]
Руководствуясь этими формулами, составим теперь следую
щие многочлены от п неизвестных:
(31==^1 + Х2 + • • • + Хпу |
°2==^'1^'2 ~Г Х\ХЪ I • • • "Г Xn—\Xn> I
оп — XiX2.., хп,
282
Легко видеть, что многочлены (5) являются симметрическими1.
В самом деле, равенства (4), очевидно, не зависят от
нумерации корней £ь ?2, ... , !■„. Мы могли бы, например, корню ^
приписать другой номер, хотя бы 2, а корню £2—номер,
равный единице; это изменение нумерации ни в какой мере не
нарушило бы равенств (4), так как при их выводе
совершенно безразлично, какой корень следует обозначать через £ь
какой через £2 и т, д.
Многочлены (5) называются основными или элементарными
симметрическими многочленами от неизвестных хъ ..., хп.
Из определения симметрического многочлена следует, что
если симметрический многочлен f (xv ..., хп) содержит член
Ах\*х\* . . . хх п,
то он содержит также все члены вида Ах '« xj'2 . . . \ifl' п0"
лучающиеся из данного любыми перестановками показателей
Далее нетрудно заметить, что сумма, разность и
произведение двух симметрических многочленов над полем Р в свою
очередь являются симметрическими многочленами над тем же
полем Р. Кроме того, сложение и умножение симметрических
многочленов над Р подчиняются ассоциативному,
коммутативному и дистрибутивному законам, так как этим законам
подчиняются сложение и умножение многочленов более
обширного множества Р [xv ...,xn]. Таким образом, множество
симметрических многочленов от xv ..., хп надлюлем Р
образует кольцо. Оно обычно называется кольцом
симметрических многочленов от неизвестных хъ ..., хп над Р.
Вернемся к основным симметрическим многочленам. Они
играют в теории симметрических многочленов исключительную
роль благодаря следующей теореме.
Основная теорема о симметрических многочленах.
Всякий симметрический многочлен f(xl9 ..., хп) от п
неизвестных над полем Р может быть выражен в виде много-
члена от основных симметрических многочленов аь "..., ап
над тем же полем Р: f (xv ..., xn)=g (ov ..., °п), где g(olf
..., о )—многочлен от о., . . ., о над Р.
Доказательство. Расположим члены многочлена f(хъ
.., хп) лексикографически и возьмем его высший член
А***Х% ...Х*пП. (6 )
1 Так как всякое числовое поле содержит 1, то alt a2, .... a„ —
многочлены над любым числовым полем Р.
283
Покажем, что показатели av а2, ... , ал высшего члена (6)
должны удовлетворять неравенствам
аг > а2 > . . . > ал. (7)
Действительно, симметрический многочлен /(лГр ..., л:л),
кроме члена (6), должен содержать также все члены,
получающиеся с помощью перестановок неизвестных xv — , хп ;
в частности, переставляя хг и х2, мы получим из члена (6)
член
Ах«*х% ... ху
1 i п
того же симметрического многочлена. Этот член не может
быть выше члена (6). Следовательно, показатель при х1 в этом
члене не может превосходить показателя при хг в члене (6):
olx > a2.
Точно так же, сравнивая член (6) с членом
Ах*х%.. .х«п,
получающимся из (6) путем перестановки неизвестных х2 и х3>
приходим к заключению, что а2 > а8 и т. д.
Очевидно, что
А*№-..*>, (8)
где х.—целые неотрицательные числа, есть также
симметрический многочлен от хи ..., хп над Р. Попытаемся подобрать
числа х, так, чтобы высший член симметрического многочлена
(8) совпадал с членом (6).
Основные симметрические многочлены оь о2, ..., ап имеют
высшими членами соответственно хъ х^2у ... , ххх2... хп.
Следовательно, согласно лемме о высшем члене произведения
многочленов (см. § 42, стр. 277), высшим членом
симметрического многочлена (8) будет
Ах]1 {ххх2)%\ .. (хгх2 ...хп)хп =
=Ах^%*+ • • * +Ч*2Х*+' * • +хп... х\п. (9)
Таким образом, член (9) будет совпадать с членом (6) в том
случае, если
Решая эту систему уравнений, получаем:
*i = ai-«2, ^2 = а2-а3, ..., V-i = aii-i—аи> \=*п.
В силу неравенств (7) эти значения ^ будут целыми
неотрицательными числами.
284
Итак, вычитая из многочлена f(xv ..., хп) выражение
мы уничтожим член (6) и получим симметрический многочлен
h (хи ..., хп) = / {хъ ...,*„)- АоГ* -Газ ...*>,
состоящий из более низких членов. Пусть Вх^х^..
.л:^—высший член многочлена fx (xv ..., хп). Тогда мы снова
повторим процесс понижения высоты членов—вычтем из многочлена
fx(xv ..., хп) выражение B^-^ofy-^... оРя, в результате чего
получится симметрический многочлен
/• (*1, • • •, *п) = h (*ь • • • ,ХЯ) - В^-Ъ о§-Ь . . . а?пп
и т. д. Этот процесс, однако, не бесконечен: если на k-м шагу
получается симметрический многочлен fk (xv ..., хп) с
наивысшим членом
Lx\x%...xnny (Ю)
то, с одной стороны, его показатели \ удовлетворяют
условию Х2 > Х2> ... > Хя, а с другой стороны, а2 > Хь так как
член (6) выше члена (10). Но соотношениям а1>\1 и Х2 >
> Х2 > ... > Хл может удовлетворять лишь конечное
множество систем целых неотрицательных чисел Хь Х2, ..., Хл.
Таким образом, наш процесс должен закончиться, т. е.
неизбежно должно получиться
/U (xv ..., хя)-Н^-»* of» з... в;я = 0.
Отсюда вытекает, что
/ (хх, . . . , JCJ = Ло«'-а* о«2-°з. . . а«я + . . . + Но**-** о^-^э. . . о£л ,
т. е. многочлен /(лть ..., л:л), выразился в виде многочлена от
о1У ..., ап над тем же самым полем Р. Теорема доказана.
Отметим одно довольно важное следствие из основной
теоремы о симметрических многочленах.
Следствие. Пусть
9(х)=:хп + а1хп-1+... + ап
—многочлен от неизвестного х над полем Р и со старшим
коэффициентом, равным единице, и Ъг, ..., ?„—комплексные
корни этого многочлена. Тогда любой симметрический
многочлен f(xx, ...,хп) от п неизвестных над тем же самым
285
числовым полем Р будет иметь при хх = ^ъ ..., хп = Ъп
значение, принадлежащее полю Р.
В самом деле, согласно основной теореме о
симметрических многочленах f{xv ...,хп) можно выразить в виде
многочлена g(av ..., оп) над тем же полем Р. Полагая xx=lv ...,
хп — \п, мы по формулам Виета получим для основных
симметрических многочленов значения, равные соответственно—ai9
аъ •••> {-~^Yan- Отсюда симметрический многочлен f(xlf
...ухп) примет значение g(—av a2, ..., (—\)пап), лежащее
в поле Я, так как коэффициенты многочленов g(°v ..., °п) и
ср (х) лежат в Р.
Метод выражения симметрических многочленов через
основные, использованный в доказательстве основной теоремы,
можно сделать довольно удобным в практическом отношении,
если его дополнить способом неопределенных коэффициентов.
При этом, если симметрический многочлен не является формой,
то рекомендуется его разложить на сумму форм различных
степеней. Очевидно, что эти формы будут также
симметрическими многочленами. Затем, пользуясь способом
неопределенных коэффициентов, каждую из полученных форм
выражают через основные симметрические многочлены. Рассмотрим
в качестве иллюстрации следующий пример.
Пример. Выразить симметрический многочлен
р/ \ 3 3 I 3 3 | 33,2. 2,
/ (Л^1, Х2, Х$) =Х 1ЛГ2ЛГ3 т" Х\ Х2Х$ -4- ХгХ2Х$ -\- Х\Х2 -\- Х±Х2 +
-f- X2X% -\- Х2Х$ -\- XiX% -\- ХгХз
над полем рациональных чисел через основные симметрические
многочлены.
Данный многочлен есть сумма форм
1^ 3 3 I 3 3 I о о
fl = XiX2Xs -\- Х\Х2Х% -\- Л^Л^ЛСз
И
К = Х\Х2 -\- Х^Х2 + Х2Х% -\- Х2Х$ -\- Х\Х% -\- Х^Х?,.
Выражаем форму h через основные симметрические
многочлены. Прежде всего обращаем внимание на то, что А—форма
седьмой степени. Учтем все возможные высшие члены
симметрических многочленов hkt получающихся согласно
доказательству основной теоремы. Высшим членом самой формы h
является х\х\хъ, a hk должны быть также формами седьмой
степени. Таким образом, мы получаем следующую табличку
всех возможных высших членов:
286
Система показателей
3 3 1
3 2 2
Высшие члены
3 3
Х1Х2Х 3
Axlx2xii
Соответствующая
комбинация основных
симметрических
многочленов
3-33-11 2 1
а1 а2 а3 — а2а3 [
Л„3—2 2-2 2 _ - .2
Аа\ а2 а3 — Ла1а3
Обращаем внимание читателя на то обстоятельство, что
система показателей Хь Х2, Х3 каждого высшего члена должна
удовлетворять условию Х2 > Х2 > Х3 и в то же время сумма
^i + ^2 + ^з должна равняться семи. Кроме того, каждая
следующая система показателей должна соответствовать члену
меньшей высоты.
Из приведенной таблички получается, что
A-ofr + Avg. (И)
Остается определить Л. Для этой цели даем неизвестным
произвольные числовые значения, например х1 = \, х2=\у *3=1.
Тогда основные симметрические многочлены примут значения
Oj = Xi -f- Х% "Т" -^3 = "» °2 == «^1-^2 ~Т~ «^1«^3 ~Г «^2*^3 == ^> °3 == ^1^2^Z == * »
а форма h примет значение, равное 3. Подставляя все эти
значения в равенство (11), получаем: 3 = 9 + ЗЛ, откуда А =
= —2, и
А = <^о8-2о1о|.
Теперь составляем аналогичную табличку для второй фор*
мы к:
Система показателей
2 10
111
Высшие члены
*1*2
А *!*2*3
Соответствующая
комбинация основных
симметрических
многочленов
2-1 1-0„0
а1 а2 а3 = а1а2
Отсюда
Л = °Л + Ло8. (12)
287
Полагая х1=х2=х3 = \, получаем значения ^ = 3, о2=3, о3=.-1
и k = 6. Подставляем все эти значения в равенство (12) и
находим, что 6= 9+А откуда Л = — 3. Следовательно,
^ = 0^2 — 3^3.
Таким образом, окончательно получаем, что
f(xu хъ x3)=h + k = o22ad — 20^3+ ^2—3*з-
Существует, впрочем, и много других способов выражения
симметрических многочленов через основные, но, несмотря на
большое разнообразие таких способов, имеет место следующая
теорема.
Теорема о единственности выражения симметрического
многочлена через основные симметрические многочлены.
Всякий симметрический многочлен от xlf ..., хп над
числовым полем Р независимо от способа представляется
единственным образом в виде многочлена от основных
симметрических многочленов alf ..., оп над тем же полем Р.
Доказательство. Пусть, напротив, симметрический
многочлен f(xlt ..., хп) имеет над полем Р два различных
выражения через основные симметрические многочлены:
f(*v • • •. ^HftК •••f0„)=ft(°1, •••>%)•
Тогда разность gx (аи ..., оя) — g2 (alf .. .„ оя) = h (av ..., оя)
будет равна нулю: h (ар ..., оп) =0.
Покажем, что при соответствующих значениях неизвестных
xv ..., хп из поля комплексных чисел основные
симметрические многочлены av ..., оп могут принимать любую заданную
систему значений pv pv ..., рп из поля Я.
В самом деле, уравнение /г-й степени
xn-Plxn-l+... + (-lfPn=0
в силу основной теоремы алгебры должно иметь п
комплексных корней 6lf 62, ..., 6я, и по формулам Виета мы получим,
что о а2, ..., оп имеют при xx = bv ..., хп = Ъп значения ог=р19
Обратимся теперь к многочлену h (уъ . . . , уп) над Р, по-
. лучающемуся из h (оъ . . . , оп) заменой основных
симметрических многочленов оь . . . , ап неизвестными у1у . . . , уп. Он
не равен нулю (тождественно), так как мы имеем два
различных выражения многочлена f (хъ . . . , хп) через оъ . .. , оя.
Но, с другой стороны, h (уь . . . , уп) обращается в нуль
при любых значениях неизвестных. Действительно, оъ . . . , ап
по доказанному выше могут принимать любые значенияръ ..., рп
288
из поля И\ таким образом, из равенства h(olt . . . , ал) = 0
получается h (/?ь . . ., рп)=0, т. е. получается, что h (у1у . . ., уп)
обращается в нуль при произвольной системе значений
Уг=Ръ •• • f Уп=Рп из поля А Отсюда следует по теореме 2
§ 42, что многочлен h (уъ . . . , уп) равен (тождественно) нулю.
Мы пришли к противоречию с тем, что h (уъ . . . , уп)
отличен от нуля. Следовательно, симметрический многочлен
f (xlf . . . , хп) представляется единственным образом через
аи .. . , <v
Задача. Выразить через alt oa, а3 следующие симметрические
многочлены от трех неизвестных над полем рациональных чисел:
а) / (хГ х2, х3) = х\ х2 + x*x3 + xi4 + xi4 + 4хъ + Х2ХЬ
б) / (xv х2, х3) = х\х\ + х\х\ + х\х#ъ + ^4*3 + *1*2*з + 44-
§ 44. Уничтожение иррациональности в знаменателе
При помощи теории симметрических многочленов можно
довольно просто решить задачу об уничтожении
иррациональности в знаменателе, задачу, с которой приходится
встречаться еще в элементарной алгебре.
Эта задача заключается в следующем: число 6 является
корнем неприводимого многочлена р (х) над полем Р степени
п > 2. Требуется преобразовать дробно-рациональное
выражение
ш ig(b}*0) (1)
так, чтобы оно оказалось равным целому рациональному вы-
ражению от 6 с коэффициентами из того же поля Р: ^-^ =h(b),
где А (л:)—некоторый многочлен над Я. Мы изложим два
решения поставленной задачи.
1. Обозначим через 6 = 61, 62, . . . , 6Л все п комплексных
корней многочлена р (х) = хп + агхп~1 + ... + ап. Умножим
числитель и знаменатель дроби (1) на#(62), ..., g(bn).
Получим:
f(Q) =f(Q)g(Qi)---g(Q/i)
*(0) *<0i)*(0«)..-g(0«)'
Но g(x1)g(x2) . .. g (xn) есть симметрический многочлен от
хи . . . , хп над А Значит, согласно следствию из основной
теоремы о симметрических многочленах (см. § 43, стр. 285)
произведение gftjgi^) . . . g(^n) является некоторым числом
b из Р. Таким образом,
289
Остается /(6)g*(62) • • • S (ел) выразить через, б. Для этой
цели рассмотрим произведение g (х2) g (xs) . . . g (xn). Оно,
очевидно, есть симметрический многочлен от л;2, . . . хп над Р.
Следовательно, его можно выразить через основные
симметрические многочлены av а2, . . . , ол1, где
al = X2 + Xs + • • • +*п>
а2 = -^2-^3 ~f~ • • • ~Ь Х>п—\Хпу
ап— 1 — -^2^'3 • • • Хп*
В свою очередь, аь о2, . . . , ап_х можно выразить через хх и
основные симметрические многочлены оь о2, . . . , оя, а именно:
ai==0i—*ъ
°2 = а2 — -*1а1 =02~"а1Л:1 + XU
~ ~ ,23
а3=03—•^1°2 = (3з — а2Л:1 + а1«^1 — -^1
и т. д. Отсюда при х1 = Ъ1, л:2 = б2, . . . , хп=Ьп многочлены
о1% . . . , оп примут значения—а1% . . . , (—1)п%, а аи о2, о3, ...—
значения
°i = —^i—бь о2=а2 + ахЬх + 6i,
и т. д. Таким образом,
£(».)*(»•) ... вГ(вя) = Л(вЛ) = Л(в),
где k (x)—многочлен над Р.
Итак,
LfflL_JL/(e)*(e),
g(°) ^
и мы освободились от иррациональности в знаменателе.
Пример. Освободиться от иррациональности в
знаменателе дроби , где б—корень уравнения л;3—Зл;—3=0.
1 + 0
Так как данное уравнение не имеет рациональных корней,
то многочлен р (х) = хг—Зх—3 неприводим над полем
рациональных чисел. Умножаем числитель и знаменатель дроби на
(1+02)О+в3). где ^2 и ^з—остальные два корня данного
уравнения:
1 = (1 + б,) (1 + бя) (6 =6)
1 + в U + Oi) (1 + 02) (1 + в,) *
290
Выражаем симметрический многочлен
(1 + хг) (1 + х2) (1 + *8) = *i*«.x8 + (хгх2 + хгхь + x2xz) +
+ (*i + Х2 + Хг) + 1
через аи а2, о3:
(1 + хг) (1 + х2) (l+x3) = os+a2 + o1+l.
При л:1 = 01, х2=Ъ21 х9 = Вг основные симметрические
многочлены аъ а2, о3 принимают значения о1 = — а1 = 0, а2=а2 = — Зу
а3 = —а3 = —(—3)=3, и мы получаем, что
Следовательно,
1
(1+в1)(1 + 01)(1 + 0,) = 3-3+ 0+1 = 1.
= (1 + У (1 + е3) = 1 + (е2 + е3) + е2е3.
Но
1+01
Выражаем (1 +*2)(1 + х9) = 1 + (х2 + *3) + x2xs через о19 а2:
(1 + х2)(1 + хг) = 1+~о1 + о2.
31 = а1 —*Ь б2=02_°1*1*+*Ь
Следовательно, при л:1 = 61 = б, л;2 = 82, ^з=^з получается, что
а1=о—е=—е, а2=— 3-о-е+ е2=— з + е2
и
(1 + 0Й) (1 + в8) = 1—в—3 + 82=-2-6 + б2.
Итак, окончательно,
1 =-.— 2-8+82.
1 +
2. Второе решение задачи об уничтожении
иррациональности в знаменателе основано на использовании алгоритма
Евклида и заключается в следующем.
Так как 8—корень многочлена р(х), то 8 является числом,
алгебраическим относительно Я. Но еще в § 34 при
доказательстве теоремы 1 было установлено, что в случае такого &
дробь ^-, где /(8) и g (8) ф 0—произвольные многочлены от
£(0)
6 над Я, может быть приведена к целому рациональному
выражению от 8 с коэффициентами из Я. Там же был указан и
способ нахождения этого целого рационального выражения.
Пример. Освободиться от иррациональности в
знаменателе дроби , где 8 — корень уравнения хъ — Ъх — 3 = 0
1 +6
19* 291
(многочлен р (х)=хъ—Ъх—3, как мы уже знаем, неприводим
над полем рациональных чисел).
Равенство
(х + 1) <р (х) + (jc3—3jc—3) ФИ = 1
удовлетворяется при <?(х)=х2—х—2 и ф(л;) = — 1. Полагая
в этом равенстве л: = 6, получаем: (1 + 0) <р (0) = 1. Следовательно,
ср (в)=в2_е—2= ——,
откуда
_!_=8(62—0—2) = 03—82-28.
1+0 v '
Но Ь есть корень уравнения л;3—Зл;—3=0. Следовательно,
6з_зб—3=0 или 63 = 3<* + 3. Отсюда
_1_ = 38 + 3—б2—26=3 + 6—б2.
1+0
Задача. Избавиться от иррациональности в знаменателе дроби .
1 +е«'
где 0 —корень уравнения х* — 4х —2=0.
§ 45. Результант
Мы изучали алгебраические уравнения высших степеней
с одним неизвестным. Теперь перейдем к изучению систем
алгебраических уравнений высших степеней с несколькими
неизвестными. Отдел алгебры, в котором рассматриваются такие
системы уравнений, называется теорией исключения.
Введем прежде всего существенное для теории исключения
понятие результанта.
Рассмотрим два многочлена с комплексными коэффициентами
/ (х)=а0хп + axxn~l + ... + ап п> 1,
g(x) = b0xm + b1xm~l + ... +bmm>\,
от одного неизвестного. Старший коэффициент а0 многочлена
f (х) и старший коэффициент Ь0 многочлена g(x) могут быть
и равными нулю. Посмотрим, что получается, когда f (х) и
g(x) имеют общий корень 8.
В этом случае, очевидно,
!(Ъ)=аУ + а1Ъп-1+ ... + а„=0,
g(b) = b0bm + b1*m-l+ ... +Ьт=0.
292
Умножим/(6) наЬт-\ Ьт~\ ..., 1, a g (6) на б""1, б""2,
Получим:
я0ь + 0i° + . . . + ал9
а,
пт+л-2
т-1
+ ... + ап^Ьт'1 + а^
Qm—2
..,1.
=о,
ь0ът+п-1 + ь^п+п-2 + ..
а0Ьп + ... +ап =0,
лЯ— 1
+ МЯ
о,
^9т+Я-2+ _
+ &я,_1вя-1 + &т9я"2=0,
W~ +
+ &т=о.
Мы видим, что бт+"-1, Qm+"-2( . . . } 1 является ненулевым
решением системы т -)- п линейных однородных уравнений
с т -\- п неизвестными г., .... г . ,:
«Л + aiZ2 + • • • + anZ„+l
a0z2+ ... + anzn+2
-0, \
■о,
b0z2+ . .
a0Zm+ ■■• +anZm+n = °>
= 0,
+ bjzm,,
m m-\-\
+ Vm+2 = 0.
V„ + ••' +
&тг .„ = 0.
m m-\-n
(i)
Следовательно, определитель системы (1)
айах
«0
*0
. . .
а0 . .
■ ■■ ьп
■ • ■ Ьт.
Ьо
а„
ап-
лЪт
■\dn
а„
ьт
* т строк
. п строк
(2)
(на незаполненных местах предполагаются нули) должен
равняться нулю.
293
Определитель (2) мы будем обозначать через R(f, g) и
называть результантом многочленов f (х) и g(x).
Легко убедиться, что результант R (f, g) многочленов
f(x) и g (x) представляется в виде однородного многочлена
т-й степени относительно коэффициентов f (x) и
однородного многочлена п-й степени относительно коэффициентов
g(x), причем этот однородный многочлен имеет целые
коэффициенты.
В самом деле, вспомнив определение детерминанта, мы
можем сказать, что /?(/, g) есть алгебраическая сумма членов,
составленных следующим образом: каждый член есть
произведение т-\- п элементов, взятых по одному и только по одному
из каждого столбца и каждой строки определителя (2).
Поэтому для получения члена придется брать элементы первых т
строк, вследствие чего рассматриваемый член будет иметь т-ю
степень относительно коэффициентов f(x); точно так же для
получения того же члена придется брать еще элементы из
остальных п строк определителя, вследствие чего член будет
иметь п-ю степень относительно коэффициентов g(x).
Наконец, каждый член определителя (2) имеет коэффициентом ± 1;
отсюда ясно, что результант R(f9 g) есть многочлен от at, bj
с целыми коэффициентами.
Затем можно убедиться, что для результанта R(f, g)
имеет место равенство
R(g,f)=(-i)mnR(f, g). (3)
Действительно, сравнивая определители R(g, f) и R(ft g)t
видим, что R(g, f) отличается от R(f, g) лишь порядком
следования строк: для получения R(g, f) надо в определителе
R(fy g) первые т строк сделать последними, а последние п
строк—первыми. Следовательно, R(g9f) отличается от R(f,g)
только знаком. Предоставляем читателю самому убедиться, что
R(g> f) отличается от R (/, g) знаком (—\)тп.
Из равенства (3), между прочим, получается, что если
равен нулю один из результантов R(g, /), R(f, g), то должен
равняться нулю и другой.
Итак, если многочлены f (х) и g(x) имеют общий корень,
то их результант R (f, g) должен равняться нулю.
Выясним, что -получается, когда результант R (/, g) равен
нулю. Для этой цели рассмотрим вместо многочлена f(x)
многочлен
<?(х)=-а0(х— х1)(х—х2) ... (х—хп) =
= а0хп + и1хп~1 + ... +ип,
2Э4
где хъ лг2, . . . , ^—неизвестные, причем будем уже
предполагать что а0 ф 0. Очевидно, что
= —^0(^1 + ^2 +
+ *л).
#2 = #0 (Х1Х2 + ••• + Хп-\Хп)>
un = (—\)naQx1x2 . . . хп
представляют собой многочлены от хи .
плексных чисел.
Обратимся к определителю (т-\-п)-то порядка
, хп над полем ком-
D=
т строк
п строк
и покажем, что 0 = а^(хг) g (х2) . . . g(xn).
Если неизвестным хъ . . ., хп дать произвольные
комплексные значения хг=£и . . . , хп=Ьп, то иъ u2i . . ., ип обратятся
в комплексные числа си . . . , ст вместо <f (х) получится
многочлен h(x) = a0xn + сгхп~1 + • • • +сп от х над полем
комплексных чисел и D превратится в результант R(h, g).
Рассмотрим, далее, многочлены h(x) и k(x)=g(x)—g(%i).
Они имеют общий корень Е., так как ^.—корень h (x) и &(£Л =
= 8"(^)""g,(^)==0. Следовательно, результант R (А, &) равен
нулю, т. е. определитель (/гг + #)-го порядка
F(x) =
а0с1 с2
а0сг
Ь0ЬгЬ2
а0сг
(Ьт-х)
(Ь.-х)
b0b±
(Ьт-Х)
т строк
п строк
имеет корнем £*(£;). Если степень g(x) выше нулевой, то су
ществует бесконечное множество М систем значений 5Д, ..., (■„
неизвестных хъ . .
хя, для которых g(^), . . . , #(?„) между
295
собой различны. Действительно, для произвольно выбранного £а
можно указать бесконечное множество чисел £2, для которых
g(b2)^g(%i)i так как уравнение g(x)=g(t1) имеет конечное
число корней; если мы такое £2 выбрали, то можно указать
бесконечное множество чисел £3, для которых
g&)*g(ti) и g&)*g(h) и т. д.
Итак, пусть g*(£i), . . . , g(tn) между собой различны. Тогда
g(ti), ... i g(%n) будут исчерпывать все п корней многочлена
F(x). С другой стороны, перемножая элементы, находящиеся
на главной диагонали F (х), убеждаемся, что (—\)па™ есть
старший коэффициент F(x). Таким образом, свободный член
F(x) должен равняться (—1)ла^ (—1)л g* (^) . . . g(tn) согласно
формулам Виета. Но свободный член F(x) равен F(0)\
следовательно,
(-1)паот(-1)п£(1а)4Г(У
g(tn)=F(0),
или
<#g$l)g(U) ••• g(ln)
(4)
Если^(лг)—число, то 60=^i = - • • = Ьт_х =0, g(t1)=g(l2) = .. .=
=g{^n) — bm, и определитель в правой части соотношения (4)
будет снова равен
<£&)*&) ... g(Q=<bnn,
так как элементы ниже главной диагонали будут равны нулю.
Определитель D есть многочлен от xl9 . . . , хп над полем
комплексных чисел, и из равенства (4) видно, что многочлены D
и a™ g (хг) g (х2) . . . g(xn) принимают равные значения при
любых значениях неизвестных хи . . . , хп, взятых из
бесконечного множества М. Отсюда по теореме 3 § 42 следует, что
D = a£g(x1)g(x2) . . . g(xn)f
(5)
а это и требовалось показать.
Вернемся теперь к нашей первоначальной паре
многочленов f(x) и g(x). Равенство (5) сохраняется при любых
значениях неизвестных хъ
где 6Ь .
хп. Положим лг1 = 61,
6Я—все комплексные корни многочлена f(x).
296
Тогда у(х) превратится в f(x), D—в результант R(f,g), а
равенство (5) перейдет в
R(f, g) = *Zg (6i)«r(0,) ... «Г ft.). (6)
Пользуясь равенством (6), мы сейчас без труда покажем, что
если по меньшей мере один из старших коэффициентов
многочленов f(x), g(x) отличен от нуля, а их результант R(f, g)
равен нулю, то многочлены f (х) и g(x) имеют общий корень.
В самом деле, пусть для определенности а0фО. Если бы
а0=0, то Ь0фО и вместо/?^, g) мы рассматривали бы R(g,f).
Обращаясь к равенству (6), видим, что
aZg{*i) ... g(4 ... «Г(вя)=0,
откуда g(6/) = 0, так как а™ ф 0. Таким образом, 6/ оказалось
общим корнем f(x) и g(x).
Пример. При помощи результанта выяснить, имеют ли
многочлены f(x) = x'2 — 2х-\- 2 и g(x) = xs — х2 + 2 общий
корень.
Составляем результант /?(/, g):
1
0
0
1
0
-2
1
0
-1
1
2
-2
1
0
-1
0 0
2 0
-2 2
2 0
0 2
Если из четвертой строки определителя вычесть первую, то
вторая и четвертая строки станут одинаковыми. Следовательно,
R(fy g)=0 и данные многочлены имеют общий корень.
Теперь на основании предыдущего можно высказать
следующую важную теорему.
Основная теорема о результанте. Если многочлены f (x),
g (x) имеют общий корень или оба их старших
коэффициента равны нулю, то результант R (f, g) равен нулю.
Обратно, если результант R (f, g) равен нулю, то либо
многочлены f (x), g (x) имеют общий корень, либо оба их
старших коэффициента равны нулю.
Доказательство. Если оба старших коэффициента а0
и Ь0 равны нулю, то R (f, g) = 0, так как в определителе (2)
первый столбец будет нулевым. Если многочлены f(x) и g(x)
имеют общий корень, то, как мы уже знаем, их результант
R(f, g) должен равняться нулю. Наконец, если по меньшей
мере один из старших коэффициентов а0, Ь0 не равен нулю,
но результант R(f, g) равен нулю, то многочлены f (x) и g(x)
должны иметь общий корень.
297
Если оба старших коэффициента а0, Ь0 отличны от нуля,
то, кроме (6), можно написать еще одно выражение результанта:
п т
где 0Х,. .., 0л—корни f (х), Ъ[, . . . , 6т—корни £ (*).
Равенство (7) получается следующим образом. Напишем
разложение g(x) на линейные множители:
*(*>=*„(*-е;)(*-е;)... (*-в;).
•Отсюда
^)=л(б /-»;) (»,-»;) • • • (в-«у -лд (в -е;.).
Подставляя эти значения g(fti) в правую часть равенства (6),
находим, что
п т
Я(/,£)=«дд(в-е.).
Из выражения (7) результанта R(f, g) видно, что R(ff g)
представляется как однородный многочлен степени тп
относительно корней 6f. и бу многочленов f (х) и g(x), так как
число всех множителей в правой части равенства (7) равно тп.
В заключение рассмотрим еще одно понятие, которое нам,
правда, в дальнейшем не понадобится. Это понятие играет
важную роль в случае кратных корней многочлена.
Назовем дискриминантом многочлена
f (х) = а0хп + аххп~х + . . . + ап, а0 ф 0, п > 1
над полем комплексных чисел результант f (х) и его произ-
п(п-\)
водной, умноженный на a~l( — l) 2 . Дискриминант
многочлена обычно обозначается через D(f). Таким образом,
п(п-\)
D(f) = (-\) 2 a;lR(f,f').
При помощи равенства (6) можно получить довольно
простое выражение дискриминанта через корни 6р . . . , 8л
многочлена f(x), а именно, продифференцируем
f(x) = a0(x^1)(x-b2) ... (*-ея)
298
(если имеются кратные корни, то они в разложении f (х) на
линейные множители повторяются столько раз, какова их
кратность). Получим:
f'(x) = a0(x-Q2)(x-b,) ... (х-Ьп) +
+ а0 (х-Ъг) (*-А) . . . (х-Ьп) + . . . +
+ а0 (х-Ъг) (х-Ь2) . . . (х-Ъп-х).
Если в это выражение f (х) подставить х = Ър то все
произведения, содержащие 0,., превратятся в нуль, и мы будем иметь:
/'(6/)=m6h>i)(9-92) ••• (»*-v.)(fl*-°i+i) ••• (9-°«)-
Отсюда:
Л(ЛП=«Г1 №)/'(«•) ••• №)=
=fl?-1flS(e1-6,)(e1-e.) ... (бх-ея)х
X (6,-60 (6,-6,) . . . (е,-6„) X
X (6,-6,) (03-92) . . . (6,-6,,) X
x^-ej^-e.) ... (вя-вя_,).
В правой части последнего равенства каждый сомножитель
в/—bj(i<Cj) встречается два раза, причем второй раз
встречается в виде в^.—в/ = — (в/—в.), т. е. со знаком минус. Так как
число сомножителей 6,-6. (/</) равно С2п = п (/г ~ , то мы
получаем:
я(я-1)
/?(f, n = (-D 2 <"! п (0-е/.
Следовательно,
п(п-1)
D(f) = (-\) 2 V/?(f, П = <-2П(0-0/. (8)
Из равенства (8) сразу вытекает, что многочлен f (x) тогда
и только тогда имеет кратный корень, когда его
дискриминант D(f) равен нулю.
Действительно, если f(x) имеет кратный корень, то
некоторые 0/ и 0;. должны быть равны; поэтому 0/—0у.=О и D (/) = 0.
Обратно, если D(f)=0, то какое-то (6/—0у)2 равно нулю, так
как а1п~2ф0. Значит, и 0.—0;=О, откуда 0^0;, т. е. f(x)
имеет кратный корень.
299
Пример. Найдем дискриминант D(f) кубического
трехчлена f(x)=xB+px + q.
Так как f'(x) = 3x2+p, то
Rif.f'h
Отсюда
I 0 р q О
О 1 0 р q
3 0/700
О 3 0 р О
0 0 3 0/7
=4/73 + 27?2.
3 (3-1)
Я (/) = (-!) 2 (4/?3 + 27?2) = -4/?3-27?2
Если полученное выражение разделить на 4-27, то оно будет
отличаться только знаком от выражения, находящегося под
корнем квадратным в формуле Кардана решения кубического
трехчленного уравнения.
Задачи. 1. Вычислить результант многочленов:
а) / (х) = х2 — Бх + 1, g (х) = *4 — *з + х2 — 1;
б) / (*) = jc3 — х2 + Бх — 2, g (*) = *4 — 2*2 — * + 1.
2. Вычислить дискриминант многочлена / (х) = хъ — 2х2 -\-Зх — 2.
§ 46. Исключение неизвестного
Мы вплотную подошли к главной задаче теории
исключения—к решению уравнений высших степеней со многими
неизвестными. Мы ограничимся случаем двух алгебраических
уравнений с двумя неизвестными:
F(x, У) = 0, Q(x, y) = 0f
(1)
где F(x, у) и G(x, у)—многочлены от х, у с комплексными
коэффициентами. При этом под решением системы (1) будет
подразумеваться такая пара значений неизвестных х = ск., у = $,
для которой уравнения (1) обращаются в тождества.
Чтобы решить систему (1), обозначим степень первого
уравнения относительно х, у через п, а степень
второго—через т и расположим многочлены F (х, у) и G(x, у) по
убывающим степеням какого-нибудь неизвестного, например х.
Получим:
.*-i
F(x9 y) = a0(y)x*+a1(y)x"-L + .
G(x, y) = b0(y)xl+b1(y)xl-l+
+ **(У). *о(У)#°.
■+Му). Ь0(у)ф0.
Коэффициенты а, (у) и bj(y) представляют собой некоторые
многочлены от у над полем комплексных чисел, причем сте-
300
пень а0(у) не превосходит n—k, а степень Ь0(у) не
превосходит т—1, так как F (х, у)—многочлен я-й степени, a G (х, у)—
многочлен т-й степени относительно х, у.
Составим теперь следующий определитель (k + /) -го
порядка:
«о(У) %(У)■ • • а*(У)
а0(у). . . ak{y)
Ф(у) =
МУ)
МУ)
(2)
(предполагается, что на свободных местах должны стоять
нули).
Очевидно, что этот определитель есть многочлен от одного
неизвестного у над полем комплексных чисел, и потому мы
его обозначили через Ф(у).
Пусть х = а, у=р—решение системы уравнений (1). Что это
по существу означает? Это означает, что многочлены от
одного неизвестного х
f(x) = a№)xh + a1{$)x
k-\
+«*«*)■
*(*)=А(Р)*Ч MP) ^ + ■■• +МР)
имеют общий корень а.
Легко убедиться, что если многочлены f (х) и g(x) имеют
общий корень а, то ф(р) = 0 (независимо от того, будут ли
коэффициенты а0 (р) и Ь0 (р) равны или отличны от нуля).
В самом деле, полагая в определителе (2) у = $, получим
результант R(f, g) многочленов f(x) и g(x). Таким образом,
R(f, *НФ(Р).
Отсюда, поскольку многочлены f(x) и g(x) имеют общий
корень х = а, получается согласно основной теореме о
результанте, что R(f, g) =0, т. е. Ф(р)—0, что и требовалось
показать.
Обратно, пусть |3—какой-нибудь корень ф(у)=0. Тогда
Ф(Р) =R(f, g)=0\ следовательно, обращаясь к той же самой
основной теореме о результанте, видим, что многочлены f(x)
и g(x) либо имеют общий корень, либо оба их старших
коэффициента а0 (р) и Ь0 (р) равны нулю.
301
(5)
Ф(х)-
Итак, решение системы (1) двух уравнений с двумя
неизвестными мы свели к решению уравнения
Ф(У) = 0 (3)
с одним неизвестным.
Пример. Решить систему уравнений:
F(x, у) = 2х2-3ху + у2 + 4х-4 = 0, 1
G(x, у) = -х2 + у2 -2х-3у + 5 = 0. J (4)
Исключим у, для чего расположим уравнения по убывающим
степеням у:
F(x, y) = y2-3xy+(2x2 + 4x-4) = 0, |
G (х, у) = у*-3у-(х2 + 2jc-5) =0. J
Составляем определитель
1 — Зх 2jc2 + 4jc—4 0
0 1 — Зх 2х2 + 4х—4
1 -3 -(х2 + 2х-5) О
О 1 -3 — (jc2+ 2jc—5)
Вычисляя этот определитель, получаем, что Ф (л:) = 9(л:—I)2 X
Х(* + 5). Легко видеть, что уравнение 9(х—1)2(х + 5)=0 имеет
следующие корни: х=\ и х^— 5. Уравнения (5) при х=\
превращаются в
у2-Зд/ + 2=0,
у2-Зу + 2=0.
Уравнение у2—Зу+2=0 имеет корнями 2 и 1. Получается,
таким образом, два решения системы уравнений (4): *=1, у=2
и х=\, у = \.
При х=— 5 уравнения (5) превращаются в
у2 + 15у + 26 = 0,
у2- Зу— 10=0.
Легко убедиться, что эти уравнения имеют общим корнем
только—2. Следовательно, мы получаем еще одно решение
системы уравнений (4) х = — 5, у = —2.
В заключение найдем, чему равна степень уравнения,
получающегося после исключения из системы (1) одного
неизвестного. Для этой цели введем понятие веса результанта.
Мы знаем из предыдущего параграфа, что результант
R(f, g) многочленов
.л—1
/(*) =
+ alX'— +
g(x) = b0xm+b1xm-1+
■+Ьт
302
представляется в виде однородного многочлена т-н степени,
относительно коэффициентов / (х) и однородного многочлена^
п-й степени относительно коэффициентов g(x):
^") + К/)+ . . . + W=m, v(j) + v(/)+ . . . +v(0=«,
причем Л/—целое число, отличное от нуля.
Назовем весом члена
Ацфа? . . . a^^i1 . . . #■ (6);
результанта /?(/, #) число т, равное сумме индексов
коэффициентов f (x) и g(x), входящих в член (6); при этом индексы:
р и q коэффициентов ар и bq следует брать слагаемыми
столько раз, с какими показателями входят ар и bq в член (6)..
Таким образом, получается для веса т следующее выражение::
т = 0.[х(0 + 1-|*<0 + 2(х(0 + . . . + /щЮ + O.vW + 1 -v(0 +
+ 2v(0 + . . . +mv(Of
или, так как 0-^=0, 0-^=0,
х = 1х(/) + 2^)+ . . . + пуф + v(0 + 2v^> + . . .+mvW.
Оказывается, что для веса членов результанта /? (ft g}
имеет место такая теорема.
Теорема о весе членов результанта. Вес каждого члена
(6) результанта R(f, g) равен произведению тп степеней
пит многочленов f (х) и g (x).
Доказательство. Мы уже знаем из предыдущего
параграфа, что
п т
R(f, g)=<b"0 п п(8,-в;),
где bv . .., Ьп—корни f(x) и в;, . .., Ъ'т—корни g(x). Отсюда
получилось, что результант R (f, g) может быть выражен в
виде однородного многочлена тп-й степени относительно
корней f(x) и g(x). Но степень результанта можно подсчитать
и другим способом.
305
По формулам Виета
а1 = -а0(91 + 62+. . . + О»),
а2 = а0(9Д+. . . +6„_16я),
ал=(-1)Ч«Л- • -\,
*m=(-i)mW; • • .в;
Мы видим, что а^ (/7=1, 2, ..., п) представляется в виде
однородного многочлена степени р относительно 0Ь ..., 6„, a bq
(q=\, 2, ..., т) — в виде однородного многочлена степени ^
относительно 0{, ..., Ь'т. Отсюда степень тп каждого члена
(6) результанта R(f, g) относительно 0^ ..., 0„, 6j, ..., 0m,
равна
lx(/) + 2(x(0+ . . . + Лц</> + vW + 2v(0 + . . . +rov<j>,
т. е. равна весу члена (6).
Итак, вес каждого члена (6) результанта R (/, g) равен тп,
и теорема доказана.
Теперь вернемся к уравнению (3) и подсчитаем его
степень (относительно у). Напишем развернутое выражение
определителя (2):
М° (У) <! (У) ... # (У) # (У) * * (У). ■ • bil (У). (7)
«=i
где Л/—целое число, отличное от нуля.
Поскольку степень многочлена F(x, у) относительно х, у
равна п, то степень ар(у)хк~р (р=0, 1, ..., к) не должна
превосходить /г. Отсюда, обозначая степень ар (у) относительно у
через А, получаем: h + (k—p)<n, откуда h<(n—k)+ р.
Аналогично находим, что bq{y) (<7=0, 1, ..., /)
относительно у имеет степень t, не превосходящую (m—l) + q.
Обращаясь теперь к выражению (7) многочлена Ф(у),
видим, что степень каждого его члена
Л/<° (уК! (У) ■ • ■ «I* (У) &о° (У) *? (У) • • • */' (У) (8)
304
относительно у не превосходит
рСО (n-k) + |Х(/) (Л-Л + 1 ) + . . . + ^ (n-k + k)±
+ v{/> (m-l) + v(/) (m—/ + 1) + ... + v</> (m-Z + /) =
= (*-*) (^ + if + ... + t^) + (m-l) (vjf) + ^ + ... + v(/>) +
+ ([*</> + 2^> + . . . + M° + V(1° + 2V2° + ' - - + W-
Но определитель (2) является однородным многочленом
степени I относительно а0 (у), аг (у), ..., ak (у) и однородным
многочленом степени k относительно Ь0 (у), Ьх{у), ..., bt(y)
Следовательно,
К° + ^ + . - - + rt° = /, 4° + v(/) + ... + v(/) =k.
Далее, пользуясь теоремой о весе члена результанта, мы
можем написать, что
t*p + 2(х<<> + ... + k^ + vjo + 2v(p + ... + hf =kl.
Таким образом, получается, что степень члена (8)
относительно у не должна превосходить
(n—k) I + (m—l) k + kl=mn—(n—K)(m—t) < тп.
Итак, мы доказали следующую теорему, известную под
названием теоремы Безу: степень уравнения (3) (относительно у)
не превосходит произведения тп степеней данных уравш-
ний (1) (относительно х, у).
Задача. Исключить х из уравнений:
а) х2 + Ъху — у2 + 3 = 0, За:2 — ху + Зу2 — х + у — 2 = О'
б) *а — 5уз + 2 = 0, 2*2 + у2 — 7 = 0.
ПРИЛОЖЕНИЕ
О НЕРАЗРЕШИМОСТИ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ
В РАДИКАЛАХ
§ 47. Конечные расширения
В этом приложении будет показано, что алгебраические
уравнения выше четвертой степени, вообще говоря, нельзя
решить в радикалах. Для этого нам, однако, нужно пройти
несколько длинный путь и ознакомиться предварительно с целым
рядом понятий и прежде всего с понятием конечного
расширения числового поля.
Пусть Р и А—два числовых поля, причем А является
расширением поля Р. Мы часто будем пользоваться обозначением
Я(_А, выражающим, что А—расширение Я, а Я—подполе А.
Если А не совпадает с Я, то мы будем знак равенства опускать
и писать Я С А.
Назовем систему чисел аь . . . , ат из А линейно
зависимой относительно Я, если можно подобрать такие числа
съ • • • » ст из Р> среди которых хотя бы одно отлично от
нуля, что
£А + <V*2 + . . . + Стат = 0. 0)
Если же равенство (1) возможно только тогда, когда все с1%
сг, • • • > ст т Р равны нулю, то система чисел аь . . . , ат будет
называться линейно независимой (относительно Я).
Может случиться, что для чисел р, аь . . . , ат из А будет
иметь место равенство
Р=<*Л+ • • • +dm*n,
где dl9 . . . , dm—некоторые числа из Я. Тогда мы будем
говорить, что р линейно выражается через аь . . . , ат
относительно Я или является линейной комбинацией ах, . . . , аш
относительно Я.
Линейная зависимость чисел из А относительно Я обладает
теми же основными свойствами, что и линейная зависимость
/г-мерных векторов (см. § 12), причем вывод всех этих свойств
проводится для чисел из А аналогичным образом.
306
Теперь мы можем ввести понятие конечного расширения,
а именно: назовем расширение А поля Я конечным
(относительно Я), если в А существует конечная система линейно
независимых (относительно Р) чисел о)ь . . . , шл, через которые
линейно выражается любое число а из А:
а=а1а)1 -f- а2о)2 + - . . + #А, (Д/—числа из Я).
Совокупность чисел о)ь . . . , и>л обычно называется базисом
конечного расширения А и обозначается через (и>ь . . . , о)п).
При этом число п элементов базиса (шь . . . , о)п) называется
степенью А относительно Я; мы ее будем обозначать через
(А: Я).
Нетрудно убедиться, что степень конечного расширения
обладает следующими свойствами:
I. Количество т линейно независимых (относительно Р)
чисел из А не превосходит степени (А :Р).
Доказательство. Пусть аь . . . , ат—некоторая система
чисел из А и т > п, где #*=(А :Я). Тогда система аь . . . , ат
будет линейно зависима, так как каждое из чисел этой системы
линейно выражается через базис а>19 . .. , юп (см. в § 12
основную теорему о линейной зависимости). Значит, если система
ai , • • • , ат линейно независима, то т < п.
II. Степень (А :Я) не зависит от выбора базиса конечного
расширения А.
Доказательство. Пусть ы1э . . . , о>я и о>|, . . ., и>„, —
два базиса конечного расширения А. Тогда по предыдущему
свойству I должно быть п' <п и #</z', откуда п'=п.
III. Если (А :Р) = п, то каждое число а конечного
расширения А является корнем многочлена над Р не выше п-й
степени.
Доказательство. Согласно свойству I система л+1
чисел а°=1, а, а2, . . . , а" линейно зависима (относительно Я),
т. е.
а0 + агл + а2ссг + . . . + ялая=0,
где а0, аь . . . , а„—числа из Р," не все одновременно равные
нулю. Мы видим отсюда, что а является корнем многочлена
/ (х) = а0 + агх + а2х2 + - . . + апхп (2)
над Я не выше /г-й степени.
Назовем степенью числа а, алгебраического относительно Я,
степень неприводимого над Я многочлена /?(*), корнем
которого является а. Из свойства III следует, что каждое число
конечного расширения А является алгебраическим
относительно Я со степенью, не превосходящей /г=(А:Я).
В самом деле, многочлены (2) и р (х) имеют общий корень а.
в силу чего эти многочлены не взаимно просты. Но в таком
307
случае f (x) должен делиться на неприводимый многочлен р(х),
а потому степень р (х) не должна превосходить степени / (х),
т. е. п.
Но особенно важную роль будут играть следующие две
теоремы.
Теорема 1. Если ^—конечное расширение поля Р, а А2—
конечное расширение поля Ль то А2 есть конечное
расширение Р и
(Ая:Р) = (Аа:А1)(АГ.Я>.
Доказательство. Обозначим базис Ах относительно Р
через (аь а2, . . . , ат), а базис А2 относительно А2 — через
(Ръ ?2i • • • > PJ- Любое число а поля А2 должно линейно
выражаться (относительно Aj) через (Pj, p2i • • • > PJ:
«=2*А, (3)
где 5,—числа поля А1# В свою очередь
т
st = 2 ол-,
где сл—числа поля А Подставляя эти значения s, в равенство
(3), долу чаем:
п т
а=2 2 («/?/) *//•
Таким образом, а линейно выражается (относительно Р;
через систему тп чисел а^, агр2, . . . , атр„ из А2. Покажем,
что эта система линейно независима (относительно Р).
Пусть
п т
2 2 («/?/) fy=0 (ty—числа Р).
Общий множитель р, можно, очевидно, вынести за знак
внутренней суммы, и мы получаем:
п
2«А=о, (4)
т
где st= 2 ед—числа из Дх. Но система Рь . . . , р„ линейно
независима относительно Д1в Следовательно, в сумме (4) все s,
должны равняться нулю, т. е.
т
2 <7А-=0.
7 = 1
308
В свою очередь система аь а2, . . . , ат линейно независима
относительно Р; отсюда получается, что все сп равны нулю,
т. е. система тп чисел а$и а^2, . . . , атрл линейно независима
относительно Р. Таким образом, А2 оказалось конечным
расширением Р с базисом otxpx, аД, . . . , атрл. Вместе с тем
получается, что
(А2:Р) = тп = (А1:Р)(А2:А1).
Теорема 2. Пусть А—конечное расширение поля Р. Тогда
всякое расширение Е /голя Я, содержащееся в А, будет
конечным расширением Р. Степень (Е :Р) будет при этом
делителем степени (А :Р).
Доказательство. Возьмем из поля Е максимальное
число линейно независимых (относительно Р) элементов аь
а2> • • • у ат- Такая система элементов в силу свойства I
степени конечного расширения должна обязательно существовать.
Обозначим через п степень конечного расширения А
относительно Р. В силу того же свойства I т < п (при т = п система
элементов аь а2, . . . , ат будет базисом А, в силу чего Е = Д при
т = п). Мы утверждаем, что Е—конечное расширение Р с
базисом (аь а2, . . . , ат). В самом деле если а произвольный
элемент Е, то а, otj, а2, . . . , ат будут уже линейно зависимы
(относительно Р); это следует из того, что т есть максимальное
число линейно независимых элементов поля Е. Таким образом,
с* + с1<х1+ . . . +сЛ=0,
где с и £,- — числа Р, неравные одновременно нулю. Число с не
может равняться нулю, так как в противном случае аь а2, . . ., аш
были бы линейно зависимы. Следовательно, а можно
линейно выразить через аь а2, . . . , ат, т. е. Е конечное
расширение Р с базисом (аь а2, . . . , ат).
Остается показать, что (£:Р) делит (А:Р). Рассуждаем
следующим образом. Поле А можно рассматривать как
конечное расширение Е. В самом деле, пусть (plf р2, . . . , ря) базис А
(относительно Р). Тогда всякое число а из А будет линейно
выражаться относительно Р, а значит и относительно Е, через
Рь • • • у Ря- Но система чисел рь р2, . . . , Р„ относительно Е
может оказаться линейно зависимой. Пусть рь р2, . . . , РЛ
линейно независимы относительно Е, а остальные р^, . . . , рл
линейно выражаются (относительно Е) через рь р2, . . . , Р*.
Тогда а можно линейно выразить через рь р2, . . . , рЛ
(относительно Е), т. е. А есть конечное расширение Е с базисом
(Рь . • ■ , Р.). , „
Теперь мы можем прибегнуть к теореме 1. По этой теореме
получается, что (А :Р) = (А :Е) (Е :Р), т. е. (А:Р) делится на
(Е:Р).
Приводим несколько примеров конечных расширений.
309
Примеры. 1. Пусть
р(х) = с0 + с1х + . . . +спхп
неприводимый над Р многочлен п-й степени. Обозначим через а
один из комплексных корней многочлена р (х) и рассмотрим
алгебраическое расширение Р(а), полученное путем
присоединения к полю Р корня а. Сразу видно, что Я (а)—конечное
расширение п-й степени поля Я, а именно, конечное
расширение с базисом (l, а, . . . , а""1).
2. Рассмотрим произвольный многочлен п-\\ степени (п> 1)
f (х) = а0хп + аххп~х + . . . + ал, а0 ф О,
с комплексными коэффициентами и обозначим через Р область
рациональности многочлена f(x). Очевидно, что нормальное
поле £ (см. § 34) этого многочлена в силу теоремы 1 есть
конечное расширение Р.
Из теоремы 1 легко получается такое предложение: если
А—конечное расширение поля Р, то всякое кисло,
алгебраическое относительно А, будет алгебраическим и
относительно Р.
Действительно, пусть а—число, алгебраическое
относительно А. Присоединим его к А. Тогда получится конечное
расширение А (а) поля А. Но само А есть конечное
расширение Р. Следовательно, А (а) по теореме 1 должно быть
конечным расширением Р. Отсюда все элементы А (а) и, в частности,
само а должны быть алгебраическими числами относительно Р.
Отметим попутно следующее свойство алгебраических чисел
(т. е. чисел, алгебраических относительно поля рациональных
чисел).
Множество всех алгебраических чисел образует числовое
поле.
Для доказательства обозначим через R поле рациональных
чисел и покажем, что сумма, произведение, разность и частное
двух алгебраических чисел суть также алгебраические числа.
Пусть а и р—два каких-нибудь алгебраических числа.
Присоединим а к полю рациональных чисел и обозначим
получившееся при этом алгебраическое расширение /?(а) через Ах.
Очевидно, что р будет также алгебраическим и относительно
поля Д1в Присоединим его к этому полю Ax. Мы получим
алгебраическое расширение Ь^Ь^р) поля А1# Очевидно, что А2.
будет вместе с тем конечным расширением поля Аь а
Ах—конечным расширением поля /?. Отсюда по теореме 1 получаем,
что А2 должно быть конечным расширением R. Согласно
свойству III степени конечного расширения каждое число поля А2
должно быть корнем некоторого многочлена над полем
рациональных чисел, т. е. должно быть алгебраическим числом,
310
Так как А2 есть поле, то а + р, а—р, а|3,— О -/ 0) должны ле-
Р
жать в Д2 и тем самым должны быть алгебраическими числами.
Однако множество всех алгебраических чисел уже не будет
конечным расширением поля R рациональных чисел. В самом
деле, если бы это множество было конечным расширением R
степени п, то всякое алгебраическое число было бы корнем
многочлена не выше /г-й степени и неприводимого над R.
А между тем можно указать бесконечное множество
неприводимых над R многочленов, степень которых больше /г, и
комплексные корни таких многочленов будут алгебраическими
числами.
§ 48. Группа уравнения
Основным понятием во всем нашем изложении будет
понятие группы многочлена (уравнения). Оно вводится следующим
образом.
Пусть Я—некоторое числовое поле. Рассмотрим
произвольный многочлен f (х) степени п > 1 над полем Р и назовем
поле 2, получающееся путем присоединения к Р всех корней
f(x), нормальным полем или полем Галуа многочлена f(x)
относительно Я. Если, в частности, Р является областью
рациональности f(x), то слова „относительно Ра обычно
опускаются. Всегда можно предположить, что f(x) не имеет кратных
множителей; в противном случае их можно было бы отделить.
Обозначим, далее, корни многочлена f(x) через хъ. . . ,хп и
возьмем некоторый многочлен F(xlf. . . , хп) отхь ... чхп над Я1.
Условимся называть выражение FS=F (х., . . . , х. ) результатом
подстановки
\ h h . . . ln I
произведенной над корнями хъ . . . , хп в многочлене F(xu . . . ,
хп). Мы будем также говорить, что подстановка 5 многочлен
F(xlf . . ., хп) переводит в многочлен FS=F(xi, . . ., х. ).
Отсюда непосредственно вытекает, что если F и Ф—два
каких-нибудь многочлена от хъ . . ., хп над Р и S и Т—две
произвольные подстановки, то
(F+0)S=FS + <bS, F(ST) = (FS) Г, (FO)S=(FS)(<bS).
Рассмотрим теперь множество G подстановок
s=(12-'-")
1 Очевидно, что всякий элемент ш нормального поля Q есть некоторый
многочлен F (хь .... хп) над Р,
311
корней хъ . .., хп многочлена f(x), не нарушающих ни
одного целого рационального соотношения F (хъ . . . , л:л) = 0
между хъ . . . , хп над Р, т. е. подстановка 5 соотношение
F(xu . .. , хп)=0 переводит в целое рациональное
соотношение FS = F [xi9 . . . , */ )=0 между xv . . ., хп над Я. Мы
собираемся доказать следующую теорему.
Теорема 1. Множество подстановок G образует группу
относительно операции умножения подстановок.
Доказательство Пусть F(xu . . . , хп) = 0 одно из
целых рациональных соотношений между хъ . . . , хп над Я и
s=e2•■■»), Tji!k■■■ьл
\ h h • . • tn I \ h 72 ■ • • Jn 1
две подстановки из G. Подстановка 5 соотношение
F(xly. . ., хп) = 0 переводит в F (х1{, х^ . . . , *,J = 0, а это
последнее соотношение подстановкой Т переведется в
Fix., Xj, . . . , Xj )=0. Таким образом, произведение ST
переведет F(xv . . . , хп)=0 в Z7^, . . . , л:У/г)=0> т- е- не
нарушит соотношение F(xlt . . . , хп)=0, а потому ST также
принадлежит G.
Очевидно, что единичная подстановка 1 должна
принадлежать множеству G, так как она соотношение F(xu . . . , хп) = 0
оставляет неизменным.
Далее, пусть G состоит из подстановок 52 = 1, S2> . . . , Sk.
Возьмем одну из этих подстановок 5. Тогда, с одной стороны,
SSly SS2, . . . , SSk принадлежат также G, а, с другой стороны,
они попарно различны, так как если бы SSi=SSj(i^J), то,
умножая слева обе части равенства на обратную подстановку
S""1, мы получили бы, что Si = Sj. Таким образом, SSlt SS2, . . . ,
SSk—те же самые подстановки 5Ь <Ь2, . . . , Sk) но, возможно,
расположенные в ином порядке. Отсюда SS/=1 при
некотором /, т. е. обратная подстановка S~l принадлежит G : 5"1 =
=5/. Теорема доказана.
Группа подстановок G, не нарушающих ни одного целого
рационального соотношения между хи . . . , хп над Я,
называется группой Галуа или, короче, группой многочлена f(x)
(уравнения f (х) = 0) над Р. В частности, когда Я—область
рациональности f (x), слова „над Ри обычно опускаются.
Можно дать и несколько иное определение группы
многочлена. Оно получится после того, как будет рассмотрен
автоморфизм нормального поля.
Автоморфизмом произвольного числового поля мы будем
называть изоморфизм этого поля с самим собой. Например, если
ввести взаимно-однозначное соответствие а + Ы <--> а — Ы
(/—мнимая единица), переводящее каждое комплексное число
312
в сопряженное, то, как легко проверить, это соответствие будет
изоморфизмом поля К комплексных чисел с самим собой, т. е.
будет автоморфизмом поля К.
Обращаясь к нормальному полю многочлена f(x)
относительно Я, мы можем высказать следующую важную теорему.
Теорема 2. Подстановка S группы G многочлена f(x)
над Р переводит произвольный элемент о> нормального поля 2
многочлена f (х) относительно Р в вполне определенный
элемент <*/ того же поля 2; возникающее при этом
соответствие а) -> а/ является автоморфизмом поля 2,
оставляющим элементы Р неподвижными. Обратно, всякому
автоморфизму а) -► а/ поля 2, оставляющему элементы Р
неподвижными, соответствует вполне определенная
подстановка S группы G, переводящая а> в а/.
Доказательство. Всякий элемент <о нормального поля 2
выражается в виде многочлена от хъ . . . , хп над Р: а> =
= г(хъ . . . , хп). Если •
V h h ... ln J
—подстановка группы G, то она соотношение <ь = г(хъ . . . , хп)
переведет в о>, = г(^/, ... ixi ). Легко видеть, что при любом
способе выражения о> через xit . . . , хп получается то же
самое о/. В самом деле, если v=t(xu . . . , хп), где t (хъ . . . ,
хп)—многочлен от ^, . . . , хп над Р, то подстановка 5 целое
рациональное соотношение r(xlf . . . , хп) =t(xu . . . , хп)
не нарушит, она его переведет в (л' = г(х., ..., х.\ =
=t[x., . . . , х. ) . Затем нетрудно убедиться, что если о>
пробегает все элементы поля 2, то и о/ будет также исчерпывать
все элементы 2. Действительно, если Е—произвольный элемент 2
и обратная подстановка 5"1 переводит £ в ?), то подстановка 5
переведет т\ в £.
Итак, подстановка 5 группы G вызывает однозначное
отображение 2 на самого себя1, причем, очевидно, при таком
отображении элементы Р остаются неподвижными. Это
отображение взаимно-однозначно, так как если о)^/^ (хъ . . . , хп)
и со2 = г2(л:1, ..., хп) — два элемента 2, отображающихся
подстановкой 5 группы G на один и тот же элемент, то
f*i (xix> • • • > xin) = r2{xil> • • • у xin)- Это соотношение обратной
1 Если по какому-либо правилу каждому элементу некоторого
множества А ставится в соответствие один и только один элемент множества В и
каждый элемент В соответствует по меньшей мере одному элементу Л, то
такое соответствие называется однозначным отображением множества А на
множество В. В частности, когда множества А и В связаны
взаимно-однозначным соответствием, говорят о взаимно-однозначном отображении
множества А на множество В.
313
подстановкой 5_1не нарушится и переведется в гх (хи . . . ,хп) =
= Г2(Х1) . . . , Хп), Т. е. ПОЛУЧИТСЯ, ЧТО 0)1 = а)2.
Теперь покажем, что взаимно-однозначное отображение
со -► о)/ поля 2 на самого себя является автоморфизмом 2
(очевидно оставляющим элементы Р неподвижными). Возьмем два
произвольных элемента <*1=г1(х1) . . . , хп) и ^ = г2(хи • • • >
x„) поля 2. Тогда получится, что
И
<»1 + ^2 = ^1 (*1> • • • , Хп) + Г2 (Xlf .... Хп)-+Гх (Х1г, . . . , Хы) +
+/-2К, • • • >xin) = u>[ + °V
ш1о)2 = г1 (xlt ...,хп) r2 (*lf . . . , *я) -> г, (л:,-, . . . , лг/я) X
Х^К, • • • »■*/,,) = <VV
Наконец, совершенно очевидно, что автоморфизм со -» ш'
вызываемый подстановкой 5, переводит корень л^ в xit x2 в
•*/,» • • • у хп в Xin.
Обратно, пусть s —- какой-нибудь автоморфизм 2,
оставляющий элементы Р неподвижными. Обозначим через cos элемент о/
поля 2, в который переводится со при автоморфизме s. Легко
видеть, что автоморфизм s корень xt многочлена f (х)
переводит в корень того же многочлена. В самом деле, если
f(xi)=Oi то / (X;)s=f (a:/s) = 0. Таким образом,
X1S = X^, X2S = X^ . . . , XnS=- Xifl,
где ixi2... in — некоторая перестановка чисел 1, 2, . . . , п.
Поставим теперь в соответствие автоморфизму s подстановку
HU:::"J <»
Тогда всякое целое рациональное соотношение между
хх ,. . . , хп над Р автоморфизм s нарушать не будет. Но действие
автоморфизма s на такое целое рациональное соотношение
равносильно действию подстановки (1). Следовательно,
подстановка (1) принадлежит группе G, и теорема доказана
полностью.
Введем теперь операцию умножения автоморфизмов
нормального поля. Пусть s и t — два произвольных автоморфизма
нормального поля 2. Автоморфизм s элемент со поля 2
переводит в cos, а автоморфизм t переводит cos в (cos) t=со'. Таким
образом, мы можем каждому элементу со поля 2 поставить во
взаимно-однозначное соответствие элемент со' того же поля,
и нетрудно убедиться, что соответствие ux-^-u/ является
314
автоморфизмом поля 2. Этот автоморфизм мы обозначим через
st и будем называть произведением автоморфизмов s и t.
Очевидно, что если автоморфизмы s и t оставляют элементы Р
неподвижными, то и st есть автоморфизм, оставляющий
неподвижными элементы Р.
Теперь докажем следующую теорему.
Теорема 3. Множество Н автоморфизмов нормального
поля 2 многочлена f(x) относительно Р, оставляющих
элементы Р неподвижными, изоморфно группе G
многочлена f (х) над Р.
Доказательство. Соответствие, установленное в
доказательстве теоремы 2 между множествами О и Я, является
взаимно-однозначным. Пусть теперь s и t — два каких-нибудь
автоморфизма из Н и S, Т соответствующие им подстановки
из G:
Возьмем произвольный элемент ш = г(л:ь . . . , хп) из
нормального поля 2. Получаем: w(st) = (ws)t=r (х,-, . . . , xJn) = in\ Мы
видим отсюда, что элемент о> подстановкой ST переводится
в о/. Следовательно, произведению st автоморфизмов s и t
взаимно-однозначно соответствует произведение ST
подстановок 5 и Т: st^ST. Этим теорема уже доказана.
Благодаря изоморфизму Н с G мы можем группу Н
автоморфизмов нормального поля 2, оставляющих элементы Р
неподвижными, также называть группой многочлена ^(л:)
над Р.
В заключение рассмотрим еще одно свойство группы
многочлена.
Теорема 4. Если степень многочлена f(x) над Р равна
простому числу р и нормальное поле 2 многочлена f(x)
относительно Р является конечным расширением Р
степени р: (2 :Р)=/?, то Q=--P(xi)i где хь— любой из корней f(x)
и группа G многочлена f(x) над Р состоит из степеней
5°=1, S, . . ., Sp~l циклической подстановки 5=(123 .../?).
Доказательство. По меньшей мере один корень xt
многочлена f(x) не лежит в Р, так как если бы все корни f (х)
лежали в Р, то 2=Р и (2:Я) = 1, а не р. Для корня xi9 не
лежащего в Р, степень {P{xt) :P) > 1 и в то же время является
делителем простого числа р. Следовательно, (P{xi) :P) = pt
в силу чего Р^)—2 и многочлен /7-й степени f (х)
неприводим над Р. Таким образом, ни один из корней f (х) не
лежит в Р.
Так как Q^=P(xi), то каждый элемент поля 2 выражается
в виде многочлена от х{ над Р. Покажем, что замена х{ кор-
315
нем Xj того же многочлена f(x) вызывает некоторый
автоморфизм s группы Н многочлена / (х) над Я, т. е. что соответствие
'о + 'Л + • • • + Vi*?"1 -* со + cixj + • . • + Vi<"! (2)
(^v—элементы Р)
есть автоморфизм поля Q, оставляющий неподвижными
элементы Р.
В самом деле соответствие (2) взаимно-однозначно в силу
единственности представления элементов & в виде многочленов
от Xi(xj) над Р степени <р{. Легко, далее, проверить, что
соответствие (2) сохраняется при сложении и умножении
элементов поля 2: если а, р—два каких-нибудь элемента из 2 и
а -► а', р -> [3' то а + (3 -> а' + fj', оф -> аф'. Наконец, если
а—элемент поля Р, то а -+ а, т. е. элемент а поля Я остается
неподвижным.
Возьмем теперь какой-нибудь корень f(x), например х{.
Если s и t — два автоморфизма из группы //и a;1s = .x:1£, то
s = t. Действительно, обращаясь к произвольному элементу
ю = г(х]) поля Q, получаем, что o>s = r (x1s) = r (xlt)=u>t, откуда
s = t. Таким образом, различных автоморфизмов группы И будет
столько, сколько имеется замен х{ ->- xl9 х{ ->- х2, . . ., хх -► хру
т. е. р. Следовательно, //, а, значит, и G являются конечными
группами /7-го (простого!) порядка.
Если автоморфизм s из Н отличен от 1,;то он ни одно xt
не может оставлять неподвижным, так как в противном случае
для произвольного «) из 2 получается, что u>s=r (xts) = r (.*/) =
= о) и 5 = 1. Следовательно, в каждой подстановке S ф I группы G
числа должны перемещаться. Покажем, что 5 должна
распадаться в произведение независимых циклов одинаковой длины.
Пусть, напротив, 5 разлагается в произведение независимых
циклов различных длин и k—наименьшая длина цикла. Тогда
Sk ф\ и в то же время Sk будет k чисел, т. е. k корней
многочлена f (х) оставлять неподвижными, что невозможно. Таким
образом, подстановка S^\ группы G должна разлагаться
в произведение / независимых циклов длины k. Так как
количество всех чисел, перемещаемых подстановкой S, раьно /?,
то отсюда получается, что lk=p. При этом k > 2, так как S^
ф\. Тем самым должно быть /=1, k=p, в противном случае
р было бы составным, а не простым числом. Мы видим, что
1 Если бы элемент со поля Q имел два таких представления:
со=с0 +c1*i +. .. + ср_хх?-1 = dQ + dxxt + . . . + dp_lXf~\
™ (с0 — d0) + . . . + (ср_х - dp_x) xf'1 = О, откуда с0 — d0 = О, ..., сD_ { -
— d х = 0, или с0 = dQ, .. ., ср_х = dp_lt так как xt не может быть корнем
многочлена ниже р-й степени над Р.
316
подстановка S циклическая. При соответствующей нумерации
корней f(x) можно положить 5= (123 .../?). Непосредственно
возводя 5 в степени 0, 1, . . ., р— 1, убеждаемся, что эти
степени различны и потому исчерпывают всю группу G.
§ 49. Основная теорема о радикалах
В § 50 мы обнаружим существование алгебраических
уравнений степени п > 5, неразрешимых в радикалах. Для этой
цели здесь придется изучить некоторые свойства радикалов.
Теорема 1. Если поле Р содержит первообразный корень
е р-й (простой!) степени из единицы и радикал р-й сте-
р
пени р=\^а, где а —элемент Р, не лежит в Р, то
многочлен р (х)=хр—а неприводим над Р и конечное расширение
Й=«р (р) /7-й степени является нормальным полем р (х)
относительно Р.
Доказательство. Если бы многочлен р (х) оказался
приводимым над Р: р (х)=р{ (х)р2 (х), где р{ (х) и р2
(*)—многочлены над Р выше нулевой степени, и со старшими
коэффициентами, равными единице, то одна часть корней 6,, . . ,уЬр
многочлена р (х) вошла бы в состав корней рг (х), а другая
часть—в состав корней р2(*)- Но корни р (х) имеют вид е*р
(&=0, 1, . . ., р—\), где е—первообразный, корень /?-й степени
из единицы, лежащий в Я. Следовательно, если бы рг (х)
имел бы корнями, например 6lt 02, . . ., 0^, то его свободный
член b равнялся бы ±6162. • . 8ц=±(еЛ|р) - - - (е^р) = ±plJ'ev, где
v = &i + . . . + *ц. При этом числа [х и р были бы взаимно
простыми, так как 0 <[*</?, и мы могли бы подобрать такие
целые т и а, чтобы т[х + а/? = 1. Отсюда следовало бы, что
а = а*+*р = а*а°р9
(±Ь)Р= (рг*)Р = рР*еР* = сР',
так как р№ = сР-, е^=1 и
а==ача°Р=( + Ьугар°= [(4г£)таар,
т. е. а оказалась бы точной /7-й степенью элемента (±Ь)'а°
поля Я, что невозможно, так как радикал р не лежит в поле Р.
Так как р содержится в расширении Я(р) и е содержится
в Я, то Р(р) должно содержать все корни р, ер, . . ., &р"1р
многочлена р(х), вследствие чего Я(р) является нормальным
полем р (х) относительно Р.
Теорема 2. Если поле Р содержит первообразный корень е
р-й (простой!) степени из единицы, f (х)—многочлен р-й
степени над Р и нормальное поле Q многочлена f (x)
относительно Р является конечным расширением Р р-й степени,
317
то 2 получается путем присоединения к Р радикала
р/—
Р=У а, где а — элемент Р, причем' если х{, . . ., хр— корни
f(x), то
9=х1 + *х% + ... + *{р-1)*хр
для некоторого целого v, лежащего между нулем и р—\
Доказательство. Составим всевозможные выражения
*, + ^2 + ... + *("-1)Ч 0)
для всех целых v, лежащих между 0 и р—\. Эти выражения
называются резольвентами Лагранжа и обозначаются через
(е\ х{). Существует по меньшей мере одно целое v, при
котором (е\ хг) не лежит в Р.
В самом деле, если бы все (ev, л^) (v = 0, 1, . .., р—\) лежали
в Я, то, складывая выражения (1) почленно при v = 0, 1, . . . ,р — 1,
мы получили бы:
v=0 fc=0 fc=0
Суммируя геометрические прогрессии мы затем убедились бы
в том, что
и нашли бы, что
/7-1
v=0
откуда получилось бы
1 р~1
Р v = 0
т. е. х{ лежало бы в Я, что невозможно (см. доказательство
теоремы 4 в § 48).
По теореме 4 § 48 группа G многочлена / (х) над Р должна
состоять из степеней S°=l, S, . . ., SP"X циклической
подстановки 5=(12.../?). Условимся обозначать через a>S элемент
нормального поля 2, который получается из а> под
воздействием подстановки 5. Подвергнем резольвенту Лагранжа (ev, хг),
не лежащую в Я, подстановке 5:
318
Применяем еще раз подстановку S:
(е\ Х{) &= [(е\ хг) S\ S=e" [(е\ хг) S\ -е"2' (е\ ^).
Вообще мы находим, что (z\ x{)Sk =z~k* (г\ х{) для любого
целого положительного k.
Применим теперь произвольную подстановку Sk группы G
к (з\ х{у. Получаем:
(г\ Xl)pSk=[(s\ Xl)Sk\p = r^(e\ Xiy=(*\ *,)',
так как s_/7ftv=l. Таким образом, (sv, xrf не изменяется при
любой подстановке группы G, т. е. при любом автоморфизме
из //. С другой стороны, (ev, xx)p является элементом
нормального поля Q=P(xl) и потому выражается в виде многочлена
от х{ над Я: (г\ xly=r(xi). Отсюда
r(xi)=r(x2)=. . . =r(xp)
и
является симметрическим многочленом над Я от ^ л:^
в силу чего (г\ хгу лежит в Я, т. е. (sv, x{y=a, где
а—элемент Я.
Присоединяя р = (е\ ^i) к Я, мы получим согласно теореме 1
конечное расширение /7-й степени поля Я, т. е. получим 2.
Теорема доказана.
Теорема 3 (основное свойство нормального поля). Если
Q—нормальное поле многочлена f(x) относительно Р и в Q
лежит хотя бы один корень многочлена g(x)t
неприводимого над Я, то в 2 должны лежать все корни g(x).
Доказательство. Обозначим корни f (х) через хи . . ., хп
и через а—корень g(x), лежащий в 2. Тогда а будет
выражаться в виде многочлена от хи . . . , хп над Я: а = г (хъ . . ., хп).
Производя всевозможные перестановки корней хи ...,хп
в выражении а =г (хъ . . . ,хп), получим п\ величин а2 = а,. . .,ал/,
лежащих в 2. Составим следующий вспомогательный многочлен:
п!
<р(*)=П (х-а,).
«-1
Если произвести некоторую перестановку величин хъ хъ . . ., хп,
то многочлен ср (л:) от этого не изменится, произойдет лишь
перестановка его линейных множителей. Следовательно,
коэффициенты у(х) являются симметрическими многочленами от
х19 х2, . . ., хп над Я. Отсюда в силу основной теоремы о
симметрических многочленах коэффициенты ср (л:) должны лежать
в поле Я, т. е. ср (х) — многочлен над Я. Из самого построения
319
многочлена ср (х) видно, что ср (х) имеет с g(x) общий корень а.
Таким образом, многочлены у(х) и g(x) не взаимно просты.
Благодаря неприводимости g(x) отсюда получается, 4Tog"(.x:)
должно делить <?(х). Тем самым корнями g(x) будут
некоторые из величин ah т. е. все корни g(x) лежат в й.
Мы подошли вплотную к теореме, играющей важную роль
в нашем изложении.
Основная теорема о радикалах. Если алгебраическое
уравнение f(x) = 0 степени п > 2 разрешимо в радикалах, то
ЛЧРь Рг» ...» Рт) = ®1 где Pi, Р2, • • •» рт—радикалы с простыми
показателями ръ . . . , рт, К — расширение, получающееся
путем присоединения к области рациональности Р
многочлена f (х) некоторых первообразных корней простых
степеней из единицы, и Q — нормальное поле f(x) относи-
тельно А*1.
Доказательство. Если уравнение f(x) = О разрешимо
в радикалах рь р2, . . . , рт, то всегда можно предполагать,
что показатели радикалов простые числа. Например, если мы
12/—
имеем радикал р= у а, то его можно заменить радикалами
р' = У~а, р"=Ур' и p'" = "j/ р" с простыми показателями.
Поэтому пусть показатель pj равен простому числу pi,
показатель р2—простому числу p2t . . . , показатель рт — простому
числу рт. Присоединим к области рациональности Р
многочлена f(x) первообразные корни рги, р2-и, ..., рт-й
степеней из единицы и получившееся при этом расширение
обозначим через /С. Выбросим „лишние44 радикалы, а именно
радикалы, лежащие в Л", а также радикалы рр лежащие в
К [?v • • • » P/-i)- Систему оставшихся радикалов мы обозначим
через рь р2, . . . , pk. Затем обозначим через А,- расширение
#(рь р2, . . . , pi) (/=1, 2, . . . , k). Таким образом, получается
цепочка полей
А0 = К С А, С А2 С ... (Afe,
причем каждое А/ является конечным расширением ргй
степени предыдущего поля А^. Очевидно, что 2^ Afe.
Если S=/C, т. е. если корни хъ . . . , хп многочлена f(x)
лежат в К, то можем выбросить и радикалы рь . . . , pk, а К
рассматривать как расширение, получающееся путем
присоединения к К радикала уТ=1, и теорема для этого случая
становится очевидной.
1 До сих пор мы через Р обозначали произвольное числовое поле.
Здесь Р уже не произвольно, оно, как сказано в теореме, есть область
рациональности многочлена j(x).
320
Если К С 2» то рассуждаем следующим образом. Мы
можем считать, что в поле АЛ-1 не лежат все корни многочлена
f (х); в противном случае мы имели бы, что Q^A^ и
радикал pk мы могли бы отбросить как лишний. Поэтому пусть
в \_! не лежит корень xv Тогда ДЛ-1 С Aa-i^ijJL А* и сте"
пень (Д^^): Д^) должна быть делителем степени (ДЛ : Д^),
т. е. делителем простого числа pk. Отсюда получается, что
либо а) (АЛ_1(^1):АЛ_1) = 1, либо б) (Д^ [хх) : ДЛ-1) =pk.
Возможность а), однако, отпадает, так как хх не лежит в АЛ-1.
Следовательно, остается только одно: (&k_l(xl)) • A*_i)=/>*f
в силу чего АЛ-1 (л:1) = АЛ. Отсюда л^ должно быть корнем
многочлена g(x) рк-й степени, неприводимого над ДЛ-1;
остальные корни g (х) будут какими-то корнями многочлена f(x),
так как g(x) делит f(x)', мы их обозначим через х2, . . . , xpk
Покажем, что ДЛ—нормальное поле g(x) относительно ДЛ_Ь
В самом деле, по теореме 1 Ак = Ак_х(рА есть нормальное поле
'многочлена х k—Ak относительно Д*-ь Это поле содержит
корень хг многочлена g(x), неприводимого над ДЛ_Ь
Следовательно, по теореме 3 и все остальные корни g (x) должны
содержаться в ДЛ. Отсюда bk = kk-i(x1) = kk-i(xi, . .., xPk),
т.е. Д^—нормальное поле g (х) относительно ДЛ_Х.
Из теоремы 2 следует, что поле ДЛ может быть получено
путем присоединения к ДЛ-1 радикала р£= р*/7, где а—элемент
Vi> и
pk>
где е—первообразный корень /?Л-й степени из единицы. Мы
видим, что pk лежит в 2. Заменим радикал pk радикалом ?k.
Тогда, с одной стороны, получается, что а лежит в 2, так как
oi=pk k и p'k лежит в 2. А, с другой стороны, а лежит в ДЛ_Х.
Может случиться, что а лежит и в ДЛ_2. Пусть а лежит
в Д., но не лежит в Д^ (1 <у <&—1). Элемент а является
алгебраическим относительно конечного расширения Ду_х
поля /С. Следовательно, а должно быть корнем многочлена
,f! (x), неприводимого над К, и корнем многочлена gx (х),
неприводимого над A._v причем, очевидно, gx (x) должно делить
fi (•*). Отсюда, во-первых, находим, что все корни fx (л:), а
значит, и все корни gi (x), лежат в й, так как в 2 лежит а (мы снова
воспользовались теоремой 3). Во-вторых, при пом мци
рассуждений, аналогичных тем, которые проводились дл>. хъ находим,
что Ду может быть получено путем присоединения к Ду^ ра-
321
дикала pj = у р, где р—элемент А^, и pj лежит в 2, так как
p'j по теореме 2 выражается через корни ^ (х) и
первообразный корень pj-й степени из единицы, а эти величины лежат в 2.
Заменим радикал ру. через р^.. Затем обращаемся к р, для
которого проводим аналогичные рассуждения, и т. д. В резуль-
pt/—
тате получим радикал р,= у ю, где (о—элемент /С, причем
/сс д;=/с(р;)с2,
и AJ есть конечное расширение pt-u (простой!) степени поля К.
Присоединяем последовательно остальные (замененные и не-
замененные) радикалы к AJ, получим цепочку конечных
расширений простых степеней:
/с1=д;сд;с... сд;=дг
Последнее расширение А^ должно совпадать с Ал, так как
расширение Ал не зависит от порядка присоединения к К радикалов.
Теперь роль К будет играть Кг. Снова применяем тот же
метод замены радикалов, в результате чего будем иметь:
Р г—
K=Ki(?'q) С2, где р'д= у [а, [х—элемент К^ и цепочку
расширений
к2=д;сд;с ... сд;=дй
и т. д. Так действуя, мы в конечном счете произведем замену
всех радикалов и получим, что К (р[, р'2, . . . , р'к)£-&- Так как,
с другой стороны, К(р[, Рз, . . . , p'k) =bk±®, то К{р[, Ра, • .,
р^) = 2, и теорема доказана.
§ 50. Уравнения с симметрической группой
Условимся обозначать через К любое поле, получающееся
в результате присоединения к области рациональности Р
многочлена / (л:) произвольной конечной системы первообразных
корней простых степеней из единицы. Результаты предыдущего
параграфа позволяют доказать следующую теорему.
Теорема о неразрешимости уравнений с симметрической
группой. Если степень алгебраического уравнения f(x) = 0
выше четырех и группа уравнения над любым упомянутым
выше полем К симметрическая, то уравнение неразрешимо
в радикалах.
322
Доказательство. Предположим противное. Пусть
уравнение /(л;) = 0 степени п > 5 разрешимо в радикалах. Тогда
согласно основной теореме о радикалах § 49 существует такая
система радикалов рь р2, . . . , 9k с простыми показателями
Ръ Р2у • • • > Pk> что К (Рь Рг> • • • у Pk) = Q> где К—расширение,
получающееся путем присоединения к области
рациональности Р многочлена f(x) некоторых первообразных корней
простых степеней из единицы, и 2—нормальное поле многочлена
f(x) относительно К. По условию теоремы группа G
уравнения /(л;)=0 над К должна быть симметрической, т. е. должна
состоять из всех подстановок п чисел 1, 2, . . . , /г. В
частности, 5= (12345) есть одна из подстановок G.
р
Обратимся теперь к равенству $* =АХ (Ах—элемент К). Это
равенство можно рассматривать как некоторое соотношение
над полем К между корнями хъ . . ., хп многочлена f(x), так
как р! лежит в нормальном поле Q и потому выражается через
хъ . . . , хп. Таким образом, подстановка 5=(12345) группы О
это соотношение не нарушит: (р{71)6,=Л15 или (Pi«S)Pl = Av так
как (pf1) «S= {?iS)pl и AXS=AX (Al—элемент /С, он остается
неподвижным). Мы видим отсюда, что 9lS является корнем
уравнения хп — А1 = 0, в силу чего p1S=ejp1, где £t—первообразный
корень /?!-й степени из единицы. Применяя еще раз
подстановку S, получаем:
PlS«=(p15)5=(e1'p1)S=.l(?15) = .^1.
Точно так же находим, что p153=ejvp1, p1S4=eJvp1, p155=efvp1. Но
Sb есть уже единичная подстановка 1. Следовательно, pi55 =
= eivPi = Pi» откуда ef=l.
Возьмем, далее, подстановку Г=(123). Она также
принадлежит группе G и Р=1. Применяя эту подстановку к
соотношению $1=-Аи получаем аналогично, что p17"=ei'p1 и s^=l.
Перемножая подстановки 5 и Г, без труда получаем, что
5Г=(12345)(123) = (13452),
откуда (5Г)5=1. С другой стороны, имеем, что
Pl (ST) = (9lS) T=(e\9l) r=el(9lT)=el^9l.
Отсюда следует, что
Pl(S7)5=e?^Pl==Pl,
в силу чего eiv+5|X^l или £iIX=l, так как efv = 1. Но е?|Х = 1.
Следовательно, £111 = £?1Х£^=£^=1, и ei,i = e?,,.e^ = ef=l. Таким образом,
получается, что 9lT=9l, т. е. подстановка Т радикал рА остав-
323
ляет неизменным. Подобным же образом можно показать, что
и подстановка /? = (345) оставляет pj неизменным. Но
#Г=(345) (123) = (12345) = S.
Следовательно, и 5 оставляет р1 неизменным. Отсюда вытекает,
что все элементы поля ^i=K(pl) подстановками 5, Т и R
оставляются неизменными.
Обратимся теперь к равенству $=А2, где А2 — элемент Д1в
И его можно также рассматривать как соотношение между
корнями хи . . . , хп над К, так как р2 и А2 лежат в 2. При
помощи тех же приемов (используя при этом неизменяемость
А2 при подстановках 5, Т и R) убеждаемся, что р2 остается
неизменным при подстановках Г, R и S, в силу чего элементы
^2 = ^(Pi» ?ч) при тех же подстановках остаются неизменными.
Так действуя далее, мы, наконец, дойдем до Q = Ak=K(pl, p2,
. . . , pk) и убедимся, что элементы Q не изменяются при
подстановках Г, R и 5. В частности, корень хх не изменяется при
подстановке 5, что невозможно, так как 5 переводит хг в
х2фхх. Это противоречие и обнаруживает, что рассматриваемое
уравнение неразрешимо в радикалах.
Остается показать существование алгебраических
уравнений любой степени п > 2 с симметрической группой над КУ
где К — по-прежнему расширение области рациональности Я,
получающееся путем присоединения произвольной системы
первообразных корней из единицы с простыми показателями.
Назовем систему комплексных чисел о>,, ш2-, . . . , шл
алгебраически зависимой над числовым полем Т, если имеет место
равенство /(a>lf . . . , о>л)=0, где f(zl9. . . , zk) — многочлен от
неизвестных гъ . . . , zk над Г, отличный от нуля. Если же
равенство /(<*>i, . . . , и>л)=0 имеет место только тогда, когда
многочлен f(zlt ...,zk) над Т равен нулю, т. е. когда все
коэффициенты этого многочлена равны нулю, то система
чисел о),, (о2, . . . , o)k называется алгебраически независимой
над Т. В частном случае поля R рациональных чисел слова
„над Ти сбычно опускаются.
Легко видеть в алгебраически независимой системе (оь
ш2> • • • » шл (наД полем рациональных чисел) каждое число ш/
должно быть трансцендентным. В самом леле, в силу
алгебраической независимости равенство а^Г + . . .+am=0, где a0, a2,
. . . , ат — рациональные числа, может иметь место лишь тогда,
когда все коэффициенты равны нулю.
Покажем, что для любого целого ft > 1, существует
алгебраически независимая система чисел а>ь а>2, . . . , u>k (над полем
рациональных чисел). Предполагая, что читатель знаком с
некоторыми фактами из теории множеств, мы сейчас докажем
следующие теоремы К
1 Необходимые сведения можно найти, например, в книге И. П. Натан,
сона «Теория функций вещественной переменной», гл. 1, 1950.
324
Теорема 1. Если множество элементов числового
поля Т счетное, то и множество элементов расширения
Т(ти . . . , (Dk) также счетное. При этом (оь а>2, . . . , wk
произвольная алгебраически зависимая или независимая
над Т система чисел.
Доказательство. Если ю, является алгебраическим
степени т относительно Т, то Т^) есть совокупность
многочленов вида
а = с0 + сг (Dj + ... + cm_l (of-1 , ct — числа из Т.
Таким образом, а определяется m значками c0f съ ..., cm_l t
каждый из которых независимо от других пробегает счетное
множество значений (в силу счетности Г). Отсюда по известной
теореме из теории множеств совокупность элементов а счетна.
Если &! трансцендентно относительно Г, то Т(wj есть
совокупность элементов вида
Ьр + Vi + .. . + Ь^\
*=~ТГГг—т—т—г> Gv^WA...)*
где ft/f С/ числа из Г и с0 + с^ + ... + с^ф 0. При
фиксированных [х и v элементы а определяются [х + v -j- 2 значками 60,.. ., 6v,
с0,... ,с^. Если эти значки пробегают независимо друг от
друга всевозможные значения из Г, то в силу счетности Г получится
счетное множество дробных выражений. Таким образом, при
фиксированных [х, v множество М v элементов а счетно.
Совокупность множеств М также счетна, так как М определяется
двумя значками, пробегающими независимо друг от друга целые
неотрицательные значения, т. е. счетное множество значений.
Отсюда по известной теореме из теории множеств сумма счетного
множества множеств М также счетна. Иными словами,
совокупность всех элементов а счетна.
Переходя к (о2, получаем теперь в силу счетности Tfa), что и
Д^ь^г) счетно, и т. д., пока не обнаружим счетность Г((оь ..., uk).
Теорема 2. Если Т —числовое поле со счетным
множеством элементов, то множество £ всех чисел, алгебраических
относительно Т, также счетно.
Доказательство. Для фиксированного п множество
Мп многочленов f(x) = а0 + ахх + ... + апхп над Т счетно,
так как многочлен f(x) определяется /г+1 коэффициентами
а0,аг,..., апу пробегающими независимо друг от друга счетное
множество значений из Т. Отсюда сумма счетного множества
множеств Мп также счетна, т. е. множество многочленов f(x)
произвольных степеней счетно. Каждый из таких многочленов
имеет конечное число корней. Поэтому и множество £ счетно.
325
Теорема 3. Для любого целого k > 1 существует
алгебраически независимая система кисел wb oj2, ... ,сод (т. е.
алгебраически независимая над полем рациональных чисел).
Доказательство. Пусть R — поле рациональных чисел
и^—какое-нибудь трансцендентное число. Тогда по теореме 1
расширение /?(«>i) счетно. Так как множество комплексных
чисел имеет мощность континуума, то можно указать число о)2,
трансцендентное относительно Ri^). Если бы это было не
так, то по теореме 2 множество комплексных чисел было бы
счетным, что невозможно. Тем самым о^.о^ образуют
алгебраически независимую систему. Обращаемся к расширению/?(о)ь о)2).
И оно по теореме 1 счетно. Поэтому, рассуждая аналогичным
образом, убеждаемся, что можно найти число (о3, трансцендентное
относительно /?(<*>i, ^2), и получаем алгебраически независимую
систему чисел о)ь (о2, (о3 и т. д., пока не дойдем до алгебраически
независимой системы чисел u>lt о>2,..., wk.
Алгебраически независимая система чисел шъ (о2,..., u>k
замечательна в следующем отношении.
Теорема 4. Если о)ь (о2,..., wk — алгебраически независимая
система чисел (над полем R), то она остается алгебраически
независимой и над произвольным расширением К поля R,
получающимся в результате присоединения к R
алгебраических чисел «!,..., а5.
Доказательство. Без ограничения общности можно
предполагать, что аь... , as являются корнями одного и того
же многочлена F(x) над R. В самом д,еле, если а.— корень
многочлена/;.(х) над/?(/=1, • • •, s), тоF(x) =fx (x) f2 (х)... fs(x).
Обозначим все корни F(x) через 04, a2,..., ат (s<m) и
предположим, что система wif..., &k алгебраически зависима
над K=R (a.lf... t as). Тогда:
Cp = (0/l(0/2 . . . (Л + A1Uhl<Oh* ... оЛ + ... +А оЛоЛ . . . 0/* = 0,
Tl2 k ' 1 1 2 k ' ' tf 1 2 k '
где Ai, ..., A^—числа из Л", отличные от нуля, и w^o/2 ... со^л—
высший член. Мы предположили, что коэффициент при высшем
члене равен единице. Это не ограничивает общности наших
выводов, так как в противном случае мы могли бы обе части
соотношения разделить на коэффициент высшего члена.
Производя всевозможные перестановки корней аь ..., ат
многочлена F {х) в выражениях коэффициентов <р через аг, ..., <xs,
получим:
ср. = аЛа/2 иии wlk 4- Л^аЛаЛ ... оЛ + ... 4- Л^аЛа/2 _ </*
Т* 1 2 Др ' 112 Д?1 '#12 Л»
Ti=T (/=1, 2, ..., ml).
Очевидно, что коэффициенты <!>=<pi<p2 ••• ?т\ будут
симметрическими над R многочленами от а1; ..., <хщ. Отсюда согласно
326
основной теореме о симметрических многочленах получается,
что эти коэффициенты лежат в /?. Но
0 = 0)1 о)"* ...03« -4- . . . =U
t l 2 k '
(многоточиями обозначена совокупность остальных членов) и
(o/im!o)/2r"! ... оЛт|_Высший член Ф, согласно известной лемме
1 2 £ •
о высшем члене произведения нескольких многочленов, причем
он имеет коэффициентом число 1, отличное от нуля.
Следовательно, tob(o2, ..., (о^ — алгебраически зависимая система (над/?),
что невозможно.
Теперь можно без труда убедиться в существовании
уравнений с симметрической группой.
Теорема о существовании алгебраических уравнений с
симметрической группой. Для всякого целого /г>2 существует
алгебраическое уравнение f(x)=0 степени п с симметрической
группой над К, где К—расширение области рациональности
Р многочлена f(x), получающееся путем присоединения к Р
произвольной системы алгебраических чисел (в частности,
произвольной системы первообразных корней простых степеней
из единицы).
Доказательство. Построим уравнение вида
f(x) = (x—Xi) (x — х2)... (л: — хп) =0, (1)
где xlf х2,..., хп — алгебраически независимая система чисел.
Покажем, что это уравнение имеет симметрическую группу
над К.
Рассмотрим произвольное целое рациональное соотношение
над К:
F(xlf ...,*„) = О (А)
между корнями уравнения (1). Если К=Р (а19..., as), где а.—
алгебраические числа, то коэффициенты равенства (Л1) являются
отношениями симметрических многочленов от xv ..., хп над
R (<*!,..., Оу) (/? — по-прежнему поле рациональных чисел).
Выражая эти коэффициенты через хъ ..., хп, мы после
избавления от общего знаменателя соотношение (А) преобразуем
в соотношение
Ф(х19 ...,*„)= О (В)
над R(v-i,..., a5). По теореме 4 система хи..., хп должна
быть алгебраически независимой и над R(olu ..., aj.
Следовательно, все коэффициенты соотношения (В) равны нулю.
Отсюда соотношение (В) не будет нарушаться подстановками
симметрической группы, а потому этими же подстановками
не будет нарушаться и соотношение (Л). Таким образом, группа
327
уравнения (1) над К является симметрической, что и
требовалось показать.
Тем самым мы обнаружили, что существуют алгебраические
уравнения степени п>5 с числовыми коэффициентами,
неразрешимые в радикалах.
Теперь следовало бы заняться вопросом о том, при каких
необходимых и достаточных условиях алгебраические уравнения
разрешимы в радикалах. Но этот вопрос выходит за рамки
нашей книги и требует систематического изложения теории
Галуаг.
1 Читателя, интересующегося основами теории Галуа, мы отсылаем
к книге Ван-дер-Вардена „Современная алгебра", т. 1, ГТТИ, 1947.
ОТВЕТЫ
§ 2. 1. 17 и — 12 + Ю/. 2. cos 2a и ххх2
(f+^+'}
23.
a) x = —у
57
у = —; б) х = Ь cos а — с sin а, у = с cos а + 6 sin а; в) w = 0, у = 0. 5. —18
2 и а2(а + 3). 7. а) л: = — 1, у = 2, 2=3; б) х =— За, у =Ь, г = Зс.
§ 4. 1. а) б инверсий, б) 26 инверсий, в) — '- инверсий, г) п2 ин-
10 и член имеет
версий. 2. Перестановка п, п — 1,
.., 2, 1. 3. s= 12, t--
п {п - 1)
знак плюс. 4. Член имеет знак (—1) 2
/ 1 2 3 4 \
§ 5. 1. Получится перестановка 321546. 2. a) S^z = I I,
1 11432J' х \ 5 2 3 4 6 1 / ' 1243156J
в) / 1 2 3 4 5 6 7 \ _/1234567\
SlSa"i3 1 7 6 452 j,SA — I 5 6 4 273 1 /"
3. п\ подстановок. 4. (162) (35).
/123456789Х б)/123456789
5,3) 12 1436 57 8 9/' (834265791
6. 5^2 = (561278934), S2SY = (134658279).
7. а) /г— s = 6—1=5 — перестановка нечетная, б) /г — s = S — 3 = 5 —
перестановка нечетная, в) п — s = 10 — 2 = 8 — перестановка четная.
§ 7. а) 18, б) 1875, в) sin («2 — aj sin («8 — «2) ... sin (ап - ап_х)л
\ /123456789Х
/• В) U24516897/
§ 10. 1. а)
ас + bey ad + bdr
aiC "T" ^1C1 al^ + ^1^1
6) | 10 21 26 I в) | 25 28 39 18
12 37 40 I I 24 22 36 18
12 12 14 11 21 19 9
I 48 46 52 34
§ 11. 1. a) (a + & + c + d)(a — b+c — d)[(a— c)* + (b-~d)2],
6) ax1xi...xJ± + ± + ...-L\9B) (-1)я-1(«? + ... + «£-l), r) (n +
+ 1)ял. 2.—(b+c + d — a)(a+c+d — b)(a + b+d — c)(a + b+c — d).
§ 12. 3. Линейно зависима. 4. Линейно независима.
§ 15. 1. а^ ранг равен 4, б) ранг равен 4. 2. av аг, а4 линейно
независимы и аг^=бах — 2аг. Ранг системы векторов равен 3. 4. Не может.
§ 16. а) ранг А равен 3 и ранг В равен 3; система совместна и
неопределенная. Общее решение х = 2 + у, z = ——,w = 0. б) ранг А равен
3
329
рангу В (= 2); система совместна и неопределенная. Общее решение хх =
= *з — *4. *2=1 х^ — хк. в) ранг А равен 3, а ранг В равен 4;
система несовместна.
1 9
§ 17. а) Общее решение хг = — *„ *2 = — *3. *4=0- б) Общее решение
5 5
х1 = 0,Х2 = — х1, х3 = — х4. 2. а) 11, 7, —2, б) 2, 0, -1,0, 0 и 1,1,0, -1,0.
4. Ранг матрицы А из коэффициентов системы уравнений должен равняться
двум.
§ 18. /34 34 13 \ 2. а) /20 20\
28 31 12
62 71 20
/20 20\ б) /15^
\4Ь 18/, I 50
3. /_з 1 _4\ 4. . /-14 12—17х
28 16 43
16 -6 13
§ 19. 1. /512 127 127
190 68 64
418 63 67
(-Л)-
10 + 1/109
§ 20. 1. а) образует коммутативное кольцо, б) кольца не образует,
в) образует коммутативное кольцо. 2. а) образует поле, б) поля не
образует. 4. а) образует поле, б) поля не образует.
§ 21. 2. Это коммутативное кольцо содержит делители нуля и потому
не может быть изоморфно ни с одним числовым множеством, в котором в
качестве алгебраических операций определены арифметические действия
сложение и умножение. 3. По отношению к арифметическому сложению
группы не образует.
, п. I. •> V—i - ± (/2111 _,■ у/ШЕ),
б) 1/б + 8( = ± V~2(2 + »). в) 1Ло-3/= ± 11/
.yz^),.2i=U2=.i(1+8,
§ 23. 1. У2 (cos - + i sin ^ , У1 (cos 1=. + / sin —
\ 4 4/ \ 4 4
"^53 (cos 344° 3' + i sin 344°3'), У205 (cos 42°31' + i sin 42°31').
2. 10"K2 /cos — 7i +/sin — tcV —-£.(1^3+ Л . 3. Равен — ср. 5. cos 5ф =
V 12 12 / 2 V
= cos5 cp — 10 cos3 cp sin2 cp + 5 cos cp sin4 cp, sin 5cp = 5 cos4 cp sin cp —
— 10 cos2 cp sin3 cp + sin5 cp.
§ 24. 1. uk « 1,370 [cos (11°57' + 51°26'£) + i sin (1Г57' + 51°26'jfe)].
3. /, — /. 4. He образует, так как число 0 не является корнем п-й степени
из единицы.
§ 29. а) /(*) = (*-2)(* + 1)3, б) /(*) = (*2+1)(*-1)3, в) /(*) =
= (х2 + 1)2(* — I)3, г) многочлен не имеет кратных множителей.
330
651, 6) q
1 ,
х* -
4
49
к~ ГГ» г
24
(*) = **
17 9
*2-
8
773
240
- 2*з +
1
* —
16
2. / (*) =
§ 30. 1. a) q (х) = 3*з + Ю*2 + 39* + 161, г =
+ 1С*2 — 22* + 50, г = — 97, в) ? (*) = *3 — — ^
2
, г = , г) q (х) = *4 — *3 Н *2 Н .
32 64 2 12
6 3 2
§ 33. 1. a) *х = -2, *2t3=l ±2/"Кз; б) *1 = -2, *2,3 - 1 ± 3/ Уз,
в) *! = — 4, *2 = *3 = 5, г) хх » 4,28Ь9, *2 « — 1,5848, *3 ~ 0,2943.
- 1 ± V 2V29—1 _ - 1 ± /1/ 2 /29 + 1'
2. а) *1|2 =
б) х l2= ±iV2,
1 ±/"[/"7
*з,4~ -
§ 37. а) хх = — 2, *2 = — 3, б) уравнение не имеет рациональных кор*
ней, в) хх = 3.
§ 38. 2. а) Условия критерия Эйзенштейна соблюдаются, например при
р = pv б) если положить х=у-\- 1, то условия критерия Эйзенштейна
соблюдаются при р=2, в) если положить * = у + 1, то условия критерия
Эйзенштейна соблюдаются при р = 2.
§ 40. а) Верхняя граница действительных корней равна 2, нижняя
граница действительных корней равна — 2. Система функций Штурма /0 =
= /(*) = ** — 2*2 + * — 5, fl=f(x) = 4*з_4* -И, U =4*2 —3*-f 20.
и —2 < *! < — 1, 1 < *2 < 2; б) верхняя граница действительных корней
равна 7, а нижняя граница действительных корней равна — 1. Система
многочленов Штурма /и = /(*) = *з — б*2 — х+ 1, /1=/'(*) = 3*2-1?* —1,
/2 = 26* — 1, /3 = 1. и — 1 < *! < 0, 0 < *2 < 1, б < *3 < 7. 4. а) Один
положительный и два или ни одного отрицательного корня, б) один
положительный корень и три или один отрицательный корень, в) один положительный
корень, отрицательных корней нет.
§ 41. 1. *0 « 2,094. 2. *! « —3,2900, *2 « 0к7057, *3 « 2,5842.
§ 43. а) / = g\q2 — 2q\ — а^з, б) /=а^ —а^з-
§ 44. —— = — (8з + 4G2 — 6 — 8).
1+62 17
§ 45. a) R (/, g) = - 427, в) R (/, g) = 289. 2. D (/) = - 28.
§ 46. а) 260^ + 90уЗ — 239у2 + 19у + 124 = 0, б) (10_уз + у2 — П)2=0.
ЛИТЕРАТУРА
Д. А. Граве, Элементы высшей алгебры, Киев, 1914.
А. К. Су шкевич, Основы высшей алгебры, Гостехиздат, М.—Л., 1941.
Г. М. Шапиро, Высшая алгебра, Учпедгиз, 1938.
A. Г. К у р о ш, Курс высшей алгебры, изд. 5, Гостехиздат, 1956.
Е. С. Л я п и н, Курс высшей алгебры, Учпедгиз, 1955.
B. Ф. Каган, Основания теории определителей, Гиз, 1922.
Э. Ч е з а р о, Элементарный учебник алгебраического анализа и
исчисления бесконечно малых, ГТТИ, 1936.
Н. Г. Чеботарев, Основы теории Галуа, ч. I, 1934; ч. II, 1938.
Ь. Л. Ван-дер-Варден, Современная алгебра, т. I и т. II, ГТТИ, 1947.
О. Ю. Шмидт, Абстрактная теория групп, ГТТИ, 1933.
А. Г. К у р о ш, Теория групп, Гостехиздат, 1953.
Г. Е. Шилов, Введение в теорию линейных пространств, Гостехиздат,
1956.
Ф. Р. Г а н т м а х е р, Теория матриц, Гостехиздат, 1953.
Д. К. Фаддеев и И. С. Соминский, Сборник задач по высшей алгебре,
Гостехиздат, 1956.
УКАЗ
Абелева группа 134
Автоморфизм поля 312
Алгебраическая операция 111
Алгебраическое дополнение 33
Алгебраическое уравнение 190
Алгебраическое число 217
Алгоритм деления 169
Алгоритм Евклида 171
Аргумент комплексного числа 149
Амплитуда комплексного числа 149
Базис конечного расширения
числового поля 307
Беспорядок 12
Взаимно дополнительные миноры 46
Вес члена результанта 303
Взаимно простые многочлены 173
Внутренние точки области 195
Возвратное соотношение 59
Вырожденная матрица 96
Вырожденное линейное пребразова-
ние 96
Группа 134
Группа Галуа 312
Группа уравнения (многочлена) 230,
312
Двучленное уравнение 204
Декремент подстановки 24
Детерминант 14
Дискриминант многочлена 298
Делители нуля 120
Единица кольца 118
Единица группы 134
Задача о трисекции угла 228
Замкнутая область 195
Знак члена определителя 14, 18
Изоморфизм 131
Изоморфное соответствие 131
Инверсия 12
Класс перестановок 16
ТЕЛ Ь
Кольцо 113
Кольцо многочленов 163, 275
Комплексные числа 143
Комплексные сопряженные числа 143
Композиция 111
Конечная группа 137
Контур области 195
Координаты (компоненты) вектора
62
Корень из единицы 156
Корень многочлена (уравнения) 190
Кратный множитель 181
Кратный корень 191
Критерий неприводимости
многочленов Эйзенштейна 237
Кубическая резольвента 215
к-членный цикл 22
Лексикографическое расположение
277
Лемма Даламбера 198
Леммы Гаусса 238
Линейная выражаемость 66
Линейная зависимость 64—65
Линейная комбинация 66
Линейное преобразование 95
Линейное уравнение 5
Матрица 6, 8, 14, 73
Метод итераций 264
Минор 32, 46
Минор матрицы 73
Многочлен 159, 270
Многочлен приводимый 176—177
— неприводимый 177
— однородный 276
— примитивный 238
— противоположный 163, 275
— симметрический 281—282
Модуль комплексного числа 149
Наибольший общий делитель 171, 174
п-мерный вектор 62
Неособенная (невырожденная)
матрица 96
Неособенное (невырожденное)
линейное преобразование 96
333
Неопределенная система линейных
уравнений 82
Неприводимый случай 211
Нулевая матрица 109
Нулевое решение 45, 89
Нулевой вектор 64
Нуль кольца 117
Область рациональности уравнения
(многочлена) 223
Обратная подстановка 21
Обратная матрица 99
Обратное линейное преобразование
99
Обратный элемент 122, 134
Однородная система линейных
уравнений 45
Определитель 14
Определитель Вандермонда 37
Основная теорема алгебры 193
— — о линейной
зависимости 67
— — о радикалах 320
— — о результанте 297
— — о симметрических
многочленах 283
Основная теорема теории линейных
уравнений 83
Основные симметрические
многочлены 283
Особенная матрица (линейное
преобразование) 96
Первообразный корень 156
Подполе 142
Подстановка 19
— единичная 21
— обратная 21
— четная и нечетная 25
Поле 121
— нормальное 223, 311
— Галуа 223, 311
— комплексных чисел 143
— числовое 157
Порядок конечной группы 157
Правило Крамера 44
— умножения определителей 52
— Саррюса 9
Присоединенная матрица 83
Приведенная система линейныхурав-
нений 90
Произведение матриц (линейных
преобразований) 97
Производная 181
Противоположный элемент 118
Равносильные системы линейных
уравнений 41, 82
Разность элементов 118
Ранг матрицы 74
Ранг системы векторов 69
Радикал 205
Расширенная матрица 83
Резольвента 229
Результант 294
Рекуррентное соотношение 59
Размерность вектора 62
Расширение поля 142
Решение системы линейных
уравнений 41, 82
Симметрическая группа 136
Система функций Штурма 251
Скалярная матрица 104
Совместная система линейных
уравнений 41, 82
Способ Горнера-Руффини 257
— Лобачевского 231
— Ньютона 243, 261
— прямолинейного
интерполирования 263
Степенной определитель 37
Степень элемента 116, 124
— матрицы (линейного
преобразования) 102, ЮЗ '
— многочлена 164, 276
Старший член многочлена. 160
— коэффициент многочлена 160
Сумма векторов 62
— линейных преобразований ПО
— матриц 107
— многочленов 160, 272
Схема Горнера 189
Теорема Безу 305
— Вейерштрасса 200—201
— Декарта 255
— Лапласа 47
— Штурма 253
Точка минимума 201
Транспозиция 15, 22
Транспонирование 26
Трансцендентное число 217
Тривиальное решение 45, 89
Тригонометрическая форма
комплексного числа 149
Умножение вектора на число 63
— матрицы на число 103
Форма 276
Формула Кардана 207
— Муавра 151
— Тейлора 184
Фундаментальная система
решений 91
Циклическая группа 157
Численный метод решения 230
Член определителя 14
— многочлена 160, 270
Элементарные преобразования 72
334
ОГЛАВЛЕНИЕ
Предисловие 3
Глава первая. Теория определителей
§ 1. Определители второго порядка 5
§ 2. Определители третьего порядка 8
§ 3. Определители высших порядков 12
§ 4. Транспозиции 15
§ 5. Подстановки 19
§ 6. Свойства определителей 26
§ 7. Миноры и алгебраические дополнения 32
§ 8. Разложение определителей по элементам строки и столбца.
Правило Крамера 39
§ 9. Теорема Лапласа 46
§ 10. Умножение определителей ...» • 51
§ 11. Вычисление буквенных определителей . • 57
Глава вторая. Линейные уравнения
§ 12. п-мерные векторы и линейная зависимость 62
§ 13. Ранг системы векторов 69
§ 14. Матрица и ее ранг 73
§ 15. Вычисление ранга матриц 77
§ 16. Система линейных уравнений 82
§ 17. Система линейных однородных уравнений • . . . 89
Г л а в а т р е т ь я. Линейные преобразования и матрицы. Кольцо и поле.
§ 18. Линейные преобразования и матрицы 95
§ 19. Сложение^ матриц 107
§ 20. Кольцо и поле 111
§ 21. Изоморфизм. Группа 129
Глава четвертая. Кольцо многочленов от одного неизвестного
§ 22. Комплексные числа 139
§ 23. Геометрическое представление комплексного числа 147
§ 24. Извлечение корня п-й степени из комплексного числа .... 154
§ 25. Кольцо многочленов от одного неизвестного 158
§ 26. Свойства делимости многочленов 166
§ 27. Неприводимые многочлены 176
§ 28 Производные и формула Тэйлора 181
§ 29. Отделение кратных множителей 185
§ 30. Корни многочлена . . 188
Глава пятая. Многочлены над полем комплексных чисел
§ 31. Основная теорема алгебры 193
§ 32. Доказательство основной теоремы алгебры 200
335
§ 33. Уравнения третьей и четвертой степени 204
§ 34. Алгебраическое расширение 216
§ 35. Разрешимость уравнения третьей степени в квадратных
радикалах 224
§ 36. Уравнения выше четвертой степени 229
Глава шестая. Многочлены над полем действительных чисел
§ 37. Вычисление рациональных корней 232
§ 38. Неприводимость многочленов над полем рациональных чисел . 236
§ 39. Границы действительных корней 241
§ 40. Отделение действительных корней 246
§ 41. Приближенное вычисление действительных корней 257
Глава седьмая. Многочлены от нескольких неизвестных
§ 42. Кольцо многочленов от нескольких неизвестных 270
§ 43. Симметрические многочлены 281
§ 44. Уничтожение иррациональности в знаменателе 289
§ 45. Результант 292
§ 46. Исключение неизвестного .* 300
Приложение. О неразрешимости алгебраических уравнений в радикалах
§ 47. Конечные расширения 306
§ 48. Группа уравнения 311
§ 49. Основная теорема о радикалах 317
§ 50. Уравнения с симметрической группой 322
Ответы 329
Литература 332
Указатель 333
Леопольд Яковлевич Оку нее
ВЫСШАЯ АЛГЕБРА
Редактор А. В. Игнатьева. Обложка художника //. Д. Бритвенко.
Технический редактор Г. И. Смирнов. Корректор М. В. Голубева.
Сдано в набор 5/VI 1957 г. Подписано к печати 7/1 1958 г. 60x92V1(J. Печ. л. 21.
Уч.-изд. л. 18,1. Тираж 40 тыс. экз. А 00807.
Учпедгиз. Москва, Чистые пруды, б.
Заказ № 1385. Типография № 4 УПП Ленсовнархоза
Ленинград, Социалистическая, 14.
Цена без переплета 5 р. 45 к. Переплет коленк. 1 р. 50 к.
ЗАМЕЧЕННЫЕ ОПЕЧАТКИ
Стр.
198
207
292
292
Строка
2-я снизу
1-я снизу ,
9-я снизу
8-я снизу
Напечатано
!/(*)+А) 1 1/(*о)|
а»хп + а,*"-1 + ... + апп > 1,
Ьихт + blxm-i + ... + bmm>l,
Должно быть
|/(*о + А)|<|/1*.)|
а„хл + а^"'1 + ... + ап, п>\,
bux^+blxm-1 + ...+bm,m>\,
Чья вина
типографии
редакции
редакции
редакции
Высшая алгебра.